鄧 瑩, 余元輝
(1.華僑大學(xué)廈門工學(xué)院,福建廈門361021; 2.集美大學(xué)計(jì)算機(jī)工程學(xué)院,福建廈門361021)
(2)采用1.2節(jié)的方法將其分割成一個(gè)圓和M-1個(gè)圓環(huán)、1個(gè)分割剩余部分,對(duì)這M+1個(gè)部分用0將其填充為正方形區(qū)域;
(3)將每一個(gè)正方形分成8×8個(gè)子塊,對(duì)每一子塊進(jìn)行離散余弦變換,提取其直流分量,對(duì)這64個(gè)直流分量求其均值μ和標(biāo)準(zhǔn)方差σ,做為圖像的能量矩特征;
(4)對(duì)環(huán)形能量矩采用下面的方法進(jìn)行相似性度量:
基于內(nèi)容的圖像檢索技術(shù)CBIR(Content-Based Image Retrieval)是由機(jī)器首先自動(dòng)提取包含圖像內(nèi)容的可視特征,如顏色、紋理、形狀、對(duì)象的位置和相互關(guān)系等,然后將數(shù)據(jù)庫(kù)中圖像和查詢樣本圖像在特征空間進(jìn)行相似匹配,以檢索出與樣本相似的圖像過(guò)程.
在圖像檢索中,常采用基于多種特征綜合的CBIR以提高檢索精確度.但圖像特征向量維數(shù)過(guò)多又會(huì)影響檢索效率,有時(shí)甚至還會(huì)導(dǎo)致檢索精度下降.因此,能以較少維度的特征向量表達(dá)更多的圖像信息,從而獲得更好的檢索結(jié)果成為人們追求的目標(biāo).顏色矩(color moments)是一種簡(jiǎn)單而有效的顏色特征[1-2].但顏色矩同樣側(cè)重于圖像的全局特征,沒有包含顏色間的空間關(guān)系.鑒于此,本文采用提取圓環(huán)顏色矩的局部特征來(lái)描述檢索圖像,同時(shí)為避免在實(shí)際應(yīng)用中低次矩較弱的分辨能力,提取基于離散余弦變換的能量矩統(tǒng)計(jì)特征作為圖像間匹配的重要依據(jù).實(shí)驗(yàn)表明,與傳統(tǒng)的顏色直方圖及紋理特征檢索結(jié)果的方法相比較,所提出的方法能以較少維度的特征向量表達(dá)更多的圖像信息,從而獲得更好的檢索結(jié)果.
顏色特征是圖像檢索中應(yīng)用最為廣泛的視覺特征,而選擇一個(gè)符合人眼視覺特性的顏色模型是利用顏色特征進(jìn)行圖像檢索的關(guān)鍵.L*a*b*顏色模型是國(guó)際照明委員會(huì)(CIE)于1976年定義的一種基于對(duì)立色理論和參考白點(diǎn)而建立的顏色模型.L*a*b*模型具有色域?qū)掗?、與光線及設(shè)備無(wú)關(guān)的優(yōu)點(diǎn).另外,L*a*b*模型還彌補(bǔ)了RGB模型色彩分布不均的不足,且處理速度與RGB模型同樣快.因此,本文選擇了基于CIEL*a*b*顏色模型來(lái)提取顏色矩特征.
設(shè)RGB模型的顏色分量分別為R、G、B,則由RGB顏色模型到L*a*b*顏色模型的轉(zhuǎn)換由下式給出:
其中:X、Y和Z是XYZ彩色空間分量,X0、Y0和Z0為參考白點(diǎn)的分量[3].
由Stricker和Orengo提出的顏色矩(color moments)[1-2]是一種非常簡(jiǎn)單而有效的顏色特征.這種方法的數(shù)學(xué)基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來(lái)表示.由于顏色分布信息主要集中在低階矩中,因此,僅采用顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)就足以表達(dá)圖像的顏色分布.與顏色直方圖相比,該方法的另一個(gè)好處在于無(wú)需對(duì)特征進(jìn)行向量化.顏色的3個(gè)低次矩的數(shù)學(xué)表達(dá)形式為:
其中:N代表圖像的像素總數(shù),pij是圖像中第j個(gè)像素的第i個(gè)顏色分量.因此,圖像的顏色矩一共只需要9個(gè)分量(3個(gè)顏色分量L*、a*和b*,每個(gè)分量3個(gè)低階矩).實(shí)驗(yàn)表明顏色矩的維數(shù)盡管遠(yuǎn)遠(yuǎn)低于顏色直方圖,但檢索效果卻很接近.
顏色矩反映的是圖像的整體特征,沒有表達(dá)圖像色彩的空間位置.而事實(shí)上,圖像中對(duì)象所在的位置和對(duì)象之間的空間關(guān)系同樣是圖像檢索中非常重要的特征.基于此,本文采用圓環(huán)形幾何分割法[4]來(lái)記錄顏色的空間信息,并且保證特征量具有旋轉(zhuǎn)、縮放不變性等特點(diǎn).圓環(huán)形幾何分割算法的主要思想是將一幅圖像按照中心點(diǎn)坐標(biāo)將其等間隔分割成一個(gè)圓和M-1個(gè)圓環(huán)、1個(gè)分割剩余部分.設(shè)W、H為圖像的寬和高,則圓和圓環(huán)半徑
然后分別計(jì)算這幾個(gè)分割區(qū)域的L*a*b*顏色矩特征向量[5].這樣,圖像就可以用顏色分布矩特征向量表征.在圖像相似性度量時(shí),計(jì)算兩幅圖像的顏色分布矩特征向量序列中對(duì)應(yīng)向量的加權(quán)歐氏距離Dcm,即可據(jù)此進(jìn)行圖像檢索.
離散余弦變換(discrete cosine transform,DCT)[6]的變換核為余弦函數(shù),具有將能量集中于少數(shù)低頻頻率系數(shù)、各系數(shù)互不相關(guān)、高頻能量衰減很快且能量較小等性質(zhì).二維DCT的解析式定義可由下式表示:
其中:u=0,1,…,M-1, v=0,1,…,N-1
設(shè)F(u,v)代表圖像經(jīng)過(guò)DCT變換后每一分塊的變換系數(shù),F(xiàn)(0,0)是分塊內(nèi)所有樣值的集中,相當(dāng)于直流分量,它表示了輸入矩陣全部幅度的平均值;隨著u、v值增加,相應(yīng)系數(shù)分別代表逐步增加的水平空間頻率分量和垂直空間頻率分量的大小.
DCT變換算法簡(jiǎn)單,實(shí)現(xiàn)方便,本文將其引入用于圖像檢索.通過(guò)提取各分塊DCT變換系數(shù)的直流分量,采用能量的均值和方差作為圖像間匹配的紋理統(tǒng)計(jì)特征.
對(duì)于一幅彩色RGB圖像,計(jì)算其基于離散余弦變換能量矩特征的過(guò)程為:
(1)首先把一幅彩色RGB的圖像轉(zhuǎn)換為灰度圖像,然后歸一化圖像尺寸(文中均為256× 256);
(2)采用1.2節(jié)的方法將其分割成一個(gè)圓和M-1個(gè)圓環(huán)、1個(gè)分割剩余部分,對(duì)這M+1個(gè)部分用0將其填充為正方形區(qū)域;
(3)將每一個(gè)正方形分成8×8個(gè)子塊,對(duì)每一子塊進(jìn)行離散余弦變換,提取其直流分量,對(duì)這64個(gè)直流分量求其均值μ和標(biāo)準(zhǔn)方差σ,做為圖像的能量矩特征;
(4)對(duì)環(huán)形能量矩采用下面的方法進(jìn)行相似性度量:
分別使用環(huán)形能量矩和傳統(tǒng)灰度共生矩陣[5]方法,檢索部分圖像,檢索結(jié)果的相似性度量值列于表1中.對(duì)比檢索結(jié)果可知:環(huán)形能量矩方法對(duì)旋轉(zhuǎn)、縮放和噪聲均具有較好的魯棒性.
表1 部分圖像紋理特征的相似性度量Table 1 The similarity based on textural features
單個(gè)特征和語(yǔ)義之間存在相當(dāng)?shù)恼Z(yǔ)義斷層,某些語(yǔ)義上完全不相關(guān)的圖像的特征矢量在特征空間中的位置卻可能相當(dāng)接近.為了避免低次矩較弱的分辨能力,可綜合利用顏色矩和基于DCT的能量矩特征進(jìn)行檢索.首先按上述方法分別提取顏色矩和DCT能量矩特征向量,然后將這兩個(gè)向量結(jié)合起來(lái)進(jìn)行檢索.
由于顏色矩和基于DCT的能量矩特征的物理意義不同,不具有直接可比性.因此,需要對(duì)不同的數(shù)值進(jìn)行歸一化.現(xiàn)采用高斯歸一化方法,其主要步驟為:設(shè)子特征i的距離度量為Di,相應(yīng)的距離均值和標(biāo)準(zhǔn)差分別為mi和σi.在高斯假設(shè)的前提下,歸一化距離度量為:
其中Qj、Ij是任意兩幅圖像的特征向量(對(duì)應(yīng)于子特征i).上式保證Di'的取值有99%落入[0,1]區(qū)間中.實(shí)際應(yīng)用中,將[0,1]區(qū)間外的值設(shè)為0或1,以保證所有數(shù)值均落在[0,1]區(qū)間.
圖像庫(kù)中有1 015幅JPEG格式的的彩色圖像,其中1 000幅是來(lái)自于Corel公司的專業(yè)收藏照片數(shù)據(jù)庫(kù),分為10個(gè)種類,每個(gè)種類包含100幅圖像,圖像大小為384×256或者256× 384.另外15幅圖像為從庫(kù)中任選了3幅圖像,分別對(duì)其進(jìn)行縮放1/2倍、2倍、旋轉(zhuǎn)90°和180°及加噪處理后所得.
圖1為綜合環(huán)形顏色矩和能量矩檢索的部分實(shí)驗(yàn)結(jié)果.結(jié)果中的第1幅圖像為查詢圖像兼檢索結(jié)果,后面的圖像是按照相似度由大到小排列的檢索結(jié)果.結(jié)果表明:該方法檢索出的結(jié)果更符合人們的視覺要求,且原圖經(jīng)縮放、旋轉(zhuǎn)、加噪處理后的圖像在檢索結(jié)果中位置居前,說(shuō)明該方法對(duì)旋轉(zhuǎn)、縮放和噪聲有較好的魯棒性.
圖1 綜合環(huán)形顏色矩和能量矩檢索結(jié)果Fig.1 Retrieval result of the proposed approach
圖2為文獻(xiàn)[5]、文獻(xiàn)[7]和本文提出的方法在圖像庫(kù)中平均的查全率和查準(zhǔn)率比較.從圖2中可知:提出的方法對(duì)彩色圖像的檢索有較高的查全率和查準(zhǔn)率.且本方法檢索速度快,返回100幅圖像的平均時(shí)間為5.62 s,而文獻(xiàn)[5]和文獻(xiàn)[7]的平均檢索時(shí)間分別為7.64 s和11.82 s.
圖2 平均查全率和查準(zhǔn)率比較Fig.2 The comparison of average precision-recall
在研究單一顏色矩特征和離散余弦變換進(jìn)行圖像檢索的基礎(chǔ)上,提出了一種綜合利用這兩個(gè)特征進(jìn)行檢索的方法,其中顏色特征用分塊顏色矩來(lái)表示,DCT能量矩的提取則以DCT變換系數(shù)的直流分量為基礎(chǔ),求其均值和標(biāo)準(zhǔn)方差.實(shí)驗(yàn)表明:L*a*b*空間更符合人的視覺要求,且提出的方法能以較少的特征向量表達(dá)較多的圖像信息,從而快速地獲得較好的檢索效果.下一步工作將是利用聚類技術(shù)進(jìn)一步提高檢索精度和效率.
[1] 莊越挺,潘去鶴,吳飛.網(wǎng)上多媒體信息分析與檢索[M].北京:清華大學(xué)出版社,2002:188-226.
[2] Stricker M,Orengo M.Similarity of color images.SPIE Storage and Retrieval for Image and Video DatabaseⅢ[C].San Jose CA USA:SPIE,1995:381-392.
[3] 范立南,韓曉微,張廣淵.圖像處理與模式識(shí)別[M].北京:科學(xué)出版社,2007:80-120.
[4] Rohini Aibing Rao,Srihari Rohini K,Zhang Zhong Fei.Spatial Color Histograms for Content based Image Retrieval[C].Chicago:IEEE,1999:183-186.
[5] 徐琨,李燕.基于分塊顏色矩和紋理特征的圖像檢索方法[J].西安石油大學(xué)學(xué)報(bào):自然科學(xué)版,2005,20(2):77-79.
[6] 張賜勛.離散余弦變換的設(shè)計(jì)與實(shí)現(xiàn)[D].杭州:浙江大學(xué),2006:6-8.
[7] 傾明.基于顏色和紋理特征圖像檢索技術(shù)的研究[J].科學(xué)技術(shù)與工程,2009,19(15):1301-1304.