郭麗珍
(山西工程職業(yè)學(xué)院自動(dòng)化工程系,山西 太原 030009)
隨著互聯(lián)網(wǎng)技術(shù)的普及,數(shù)字圖像數(shù)量的快速增長,如何快速、高效地從龐大的圖像數(shù)據(jù)庫中檢索出用戶所需的圖像信息技術(shù),是當(dāng)前圖像應(yīng)用領(lǐng)域的熱門發(fā)展方向?;趫D像的低層特征顏色和紋理等的檢索屬于基于內(nèi)容檢索。
物體的顏色是最感官的圖像特征。物體圖像的顏色特征描述方法對(duì)應(yīng)有多種空間顏色模型。顏色模型是一種對(duì)顏色的特性和行為的解釋方法,并沒有哪一種顏色模型能夠解釋所有的顏色問題[1]。
在RGB顏色模型中,每幅彩色圖像若只考慮色彩,忽略亮度等參數(shù),則每個(gè)像素點(diǎn)顏色都可以用笛卡爾三維坐標(biāo)(R,G,B)表示。這樣把每幅彩色圖分解到3個(gè)獨(dú)立的基色平面上[2]。RGB顏色模型不符合人對(duì)顏色的感知,HSV顏色模型可以彌補(bǔ),通過RGB模型轉(zhuǎn)化到HSV模型。
在HSV顏色模型中,H表示色調(diào),S表示飽和度和V表示亮度。
在RGB顏色模型中,任一像素點(diǎn)C顏色可以表示為:
(C)=r(R)+g(G)+b(B) .
因?yàn)閞、g、b∈[0,1],RGB顏色模型轉(zhuǎn)換到HSV顏色模型的公式為:
顏色直方圖定義了圖像中的顏色分布,計(jì)算直方圖時(shí)首先是顏色量化,即劃分顏色區(qū)間,把每個(gè)區(qū)間稱為直方條。其次是計(jì)算顏色落在每個(gè)小區(qū)間內(nèi)的像素?cái)?shù)量。
聚類顏色模型法,是把圖像的顏色聚類為主顏色,用顏色直方圖表示主顏色的信息。聚類顏色模型分析是由若干模式組成,它基于相似性,在一個(gè)聚類中模式間的相似性更高于不在同一聚類中的模式[3]。
1) K-means算法思路[4]:首先從n個(gè)像素中任意選取k個(gè)像素作為初始聚中心,而對(duì)于其它沒選的像素,則由相似度分配到與其最相似的聚類;算出新聚類的聚類中心,直到收斂為止。聚類算法的特點(diǎn):要求各聚類本身盡量緊湊,各聚類間盡量分開。
2) HSV顏色模型空間量化文獻(xiàn)[5]指出把HSV模型空間非均勻量化的方法。它把顏色大致上分9種:黑、灰、白、紅、黃、綠、青、藍(lán)、紫,假設(shè)一幅圖像中的顏色信息大致上可以用九種顏色描述,所以根據(jù)9種顏色確定主顏色數(shù)k。
3) 關(guān)于HSV模型的相似性本論文用下式計(jì)算兩個(gè)對(duì)應(yīng)點(diǎn)間的相似度[5]。設(shè)HSV空間的兩個(gè)像素點(diǎn)ci=(hi,si,vi),cj=(hj,sj,vj),則ci,cj的相似性sij定義為:
(1)
本文取sij≥0.9。
本文通過HSV非等間距量化,確定主顏色數(shù)目k和MColor[k]。把滿足MColor[i]區(qū)間,且和其他初始聚類中心的不相似的像素點(diǎn)作為初始聚類中心記作MCCi。MCCi的值為該聚類中各像素的平均顏色。利用公式(1)計(jì)算各個(gè)像素點(diǎn)與中心MCCi的距離,并將其歸類到和該像素點(diǎn)最相似的聚類中。重復(fù)計(jì)算各個(gè)聚類的中心,直到每個(gè)聚類中心不再變化為止。然后統(tǒng)計(jì)各聚類的樣品數(shù)si,得到圖像的主顏色直方圖hi以及主顏色頻率pi。圖像的主顏色集就是各個(gè)聚類中心MCCi。
在改進(jìn)的算法中,9種顏色的區(qū)間基本可以表示一幅圖的主顏色范圍,確定的k個(gè)初始聚類中心屬于主顏色范圍,并在顏色上還不相似,這樣就使得提取圖像的主顏色直方圖準(zhǔn)確性增強(qiáng)。實(shí)驗(yàn)結(jié)果顯示,采用改進(jìn)后的K-means主顏色提取法,不僅減少了顏色的特征維數(shù),而且還較準(zhǔn)確地描述了圖像顏色,達(dá)到維數(shù)和精度平衡。
紋理是能夠反映物體的質(zhì)地,如粗糙度、顆粒性、光滑性等[6]。紋理特征是計(jì)算物體圖像中若干像素點(diǎn)的灰度值,并量化灰度值的變化。在通常情況下,紋理不受物體亮度影響,而和物體的尺寸、形狀、位置等有關(guān)[7]。其中灰度共生矩陣方法屬于結(jié)構(gòu)法。
設(shè)在目標(biāo)區(qū)域R中,具有某種特定空間聯(lián)系的像素對(duì)的集合S,則共生矩陣P可定義為:
(2)
公式(2)#代表數(shù)量,分子表示滿足具有某種空間關(guān)系的像素對(duì)個(gè)數(shù),分母表示總像素對(duì)數(shù),其中像素對(duì)的灰度值對(duì)應(yīng)是g1和g2?;叶裙采仃嚪治龇ㄊ怯?jì)算紋理中像素點(diǎn)某一灰度級(jí)特征重復(fù)出現(xiàn)的變化。這個(gè)特征隨著距離在精細(xì)紋理中變化快,而在粗糙紋理中變化慢。
若定義圖像的灰度級(jí)為N級(jí),則灰度共生矩陣就是N×N階矩陣,共生矩陣元素M(Δx,Δy)(h,k)表示:兩個(gè)灰度值分別為h和k的像素,它們間距離是(Δx,Δy)的像素對(duì)出現(xiàn)的次數(shù)。
計(jì)算出灰度共生矩陣之后,可以通過CON,ASM,ENT和COR 4個(gè)特征向量來描述紋理。
1) 把彩色圖像轉(zhuǎn)為灰度圖像。
2) 把灰度圖像的灰度級(jí)粗量化,粗量化節(jié)省計(jì)算時(shí)間,盡管會(huì)失真但對(duì)紋理特征提取影響不大;
3) 求出任意4個(gè)方向的共生矩陣,并分別計(jì)算出每個(gè)共生矩陣的上述4個(gè)特征向量;
4) 求出各個(gè)特征向量的均值和標(biāo)準(zhǔn)差μCON,μASM,μENT,μCOR,σCON,σASM,σENT,σCOR。這8個(gè)分量作為紋理特征向量,因其取值范圍和物理意義不同,所以需進(jìn)行高斯歸一化。
為了更好的突出圖像的主體部分,本文運(yùn)用等面積環(huán)形分塊法檢索圖像。實(shí)驗(yàn)證明效果優(yōu)于間隔環(huán)形分塊法。分塊主顏色檢索方法的思想:將圖像分成固定的塊數(shù),統(tǒng)計(jì)出各塊的主顏色直方圖,并計(jì)算出對(duì)應(yīng)子塊間的主顏色距離,再對(duì)對(duì)應(yīng)子塊間的距離加權(quán)求和得到兩圖間的相似距離。由于兩幅圖像在空間相近的位置上,同時(shí)存在相似的顏色區(qū)域,具有較大的相似度[8]。用等面積環(huán)形分塊法劃分圖像時(shí),分塊的數(shù)目直接影響到檢索的效果和效率。在實(shí)際應(yīng)用中,通常采用折中法。在本文中,鑒于圖像大小及運(yùn)行效率,通過多次試驗(yàn)可知將一般圖像分為5、7、9塊時(shí)檢索效果較好。
在本文的檢索中,將示例圖像1分為7個(gè)子塊。各個(gè)分子塊的權(quán)值從中心圓向外分別設(shè)成:0.26,0.24,0.20,0.15,0.10,0.05。查詢后返回的圖像數(shù)目為20,檢索出來的相關(guān)圖像數(shù)為12。在劃分塊數(shù)7相同的情況下,其檢索效果優(yōu)于其它兩種主顏色檢索法的效果,如下表1所示。
表1 顏直色方圖、主顏色與分塊主顏色檢索效果對(duì)比
圖1 示例圖像1
在缺少顏色空間分布信息的圖像中,分塊主顏色檢索法通過顏色直方圖,檢索出外觀上不相同的圖像[9],但對(duì)于主顏色不明確或主要目標(biāo)太大偏離中心的圖像,該方法可能會(huì)降低檢索效果。
本文選用Corel圖像庫,分別是大象、建筑雕塑、花卉等10類,一共有1000幅。為了模仿現(xiàn)實(shí)中的實(shí)際環(huán)境,又增加了部分從網(wǎng)上下載的圖片。圖像的格式為bmp,像素為128×128。以示例圖像1檢索,顏色特征權(quán)值為1,紋理特征權(quán)值為0,相似度采用默認(rèn)的方法,檢索結(jié)果如圖2所示;若設(shè)基于灰度共生矩陣方法的紋理特征權(quán)值為1,顏色特征的權(quán)值為0,檢索結(jié)果如圖3所示。
圖2 基于顏色特征檢索結(jié)果
顏色特征選擇分塊主顏色和分塊顏色矩組合,權(quán)值設(shè)置為0.6;紋理特征提取選擇灰度共生矩陣法,權(quán)值設(shè)置為0.4,示例圖像1所示的玫瑰花,其檢索結(jié)果如圖4。
從各圖可知,綜合利用顏色和紋理多特征的檢索方法,不僅考慮了圖像顏色和紋理的整體差異,又能較真實(shí)的反映圖像的空間分布信息,檢索效果較好,所以該算法較成功。
圖3 基于紋理特征檢索結(jié)果
圖4 基于顏色和紋理特征的檢索結(jié)果