陳新武,劉 真,馬文娟,薛 靜,范春鳳
(信陽師范學院 物理電子工程學院, 河南 信陽 464000)
人類認識自然界的基本方式是通過聲音和圖像來獲取經(jīng)驗并逐步豐富自己的知識,不斷增強對未知領域和事物的細分能力.在人類的認知過程中,圖像信息占了總信息量的80%以上,圖像信息主要包括被認知對象的形狀、顏色、紋理等底層特征,其中紋理特征是信息量最為豐富的特征.
然而,由于個體生活經(jīng)歷的限制,每個人的一生所能識別和認知的領域十分有限.大量的知識和資料儲存在各種數(shù)據(jù)庫中以備查閱,來滿足人們對于某一問題的更高認知.當今的數(shù)據(jù)庫也逐漸被各種圖像數(shù)據(jù)庫豐富和擴展,但是人們查閱資料的基本方式是基于文本的查詢方式,這種查詢方式不能精確地描述被查詢對象的顏色、形狀、結構、紋理等細節(jié)特征.為了解決這個問題,研究人員提出了基于內容的檢索系統(tǒng)(Content-Based Image Retrieval System, CBIR)[1-3].該研究領域已有眾多的研究成果,主要有幾何結構方法、基于模型的方法、統(tǒng)計學方法和基于濾波器的方法等4種方法.其中,統(tǒng)計學方法采用類似于灰度共生矩陣、局部二元模式(Local Binary Patterns, LBP)[4-5]與高階自相關等方法,該類方法已經(jīng)成功應用于多種應用場合,不足之處在于刻畫圖像內容不夠有力.相比較而言,基于濾波器的方法由于具有較好的時頻分解能力而表現(xiàn)更為出色.該類方法又可以分為空間濾波器、頻率濾波器和時頻濾波器等3種類型.前面兩種方法由于尺度固定而表現(xiàn)欠佳.本文將使用時頻濾波器方法,這種方法也被稱為多尺度分析(Multi-Scale Analysis,MRA)方法.
在MRA方法中,最著名的就是基于小波的紋理檢索算法[6-7].但是,由于小波變換具有較低的方向分辨率,不能準確地抽取數(shù)字圖像中的方向信息,因而對于紋理這樣的結構數(shù)據(jù)不能更準確地刻畫.在小波變換的啟發(fā)下,許多新型的變換相繼出場,包括:Fanlet、Bandelet、Ridgelet、Curvelet、Beamlet、Contourlet等.其中Contourlet由于易于實現(xiàn)和方向信息豐富而備受關注[8],但是由于該變換存在有混疊現(xiàn)象,因而不斷有新的改進變換出現(xiàn)[9-10],Contourlet-2.3就是在冗余度和消除混疊兩個方面折衷設計的典型代表.本文將使用Contourlet和Contourlet-2.3兩種變換來構造紋理圖像檢索系統(tǒng).另一方面,CBIR系統(tǒng)在對紋理圖像進行變換之后,對于每個子帶中的數(shù)據(jù),需要進行特征抽取,形成特征向量.在過去的30多年中,典型的做法就是選取變換域子帶空間中的能量(或者系數(shù)絕對值均值)和標準偏差作為特征,進一步將它們級聯(lián)形成特征向量[11].為了進一步提高檢索率,本文將對標準偏差進行改造,提出一種新型的紋理描述算子,并將該算子與已有的能量算子和峰度算子[12]相結合,構造新型的特征向量.
基于MRA方法的紋理圖像檢索系統(tǒng)的典型結構如圖1所示.
圖1基于MRA方法的紋理圖像檢索原理
Fig.1TextureimageretrievalprinciplebasedonMRA
在圖1中,MRA有許多種,本文選取contourlet和contourlet-2.3兩種變換,并推薦使用后者.在進行紋理圖像檢索之前,需要將紋理圖像數(shù)據(jù)庫中的每一幅圖像進行contourlet或者contourlet-2.3變換,得到若干子帶,每個子帶中的數(shù)據(jù)構成一個矩陣.該矩陣可以看作一組實驗數(shù)據(jù)結果.
從統(tǒng)計學的角度看,如果要描述一組實驗結果的特征,最常用的就是均值和標準偏差.但是,對于圖像而言,由于多尺度分析方法采用濾波器的方法,而濾波器由于對稱性會使得相同的圖像內容表現(xiàn)出大小相同而符號相反的系數(shù).因此,對于變換域空間子帶中的數(shù)據(jù),經(jīng)常對其絕對值求均值,或者對于系數(shù)求平方再取均值,用來刻畫紋理的特征.在之前的文獻中,學者們大都直接采用這種方法而并沒有給出這種處理方法的原因.本文采用絕對值均值作為能量特征,這種特征的定義如式(1)所示.
(1)
式中:s表示contourlet變換的尺度索引,k表示方向子帶編號索引,M和N分別表示子帶系數(shù)的行數(shù)和列數(shù),m和n分別表示系數(shù)的行號和列號.Ws,k(m,n)表示在contourlet或者contourlet-2.3變換域上,第s尺度k方向子帶內第m行第n列的變換系數(shù).將這種特征編號為F1.
對于數(shù)字圖像而言,真正的意義不體現(xiàn)在每個像素點的亮度值的大小,而在于亮度相對值的大小.在變換域空間子帶中,子帶系數(shù)的標準偏差僅僅反映了每個子帶內系數(shù)的分散程度,而并未考慮到子帶之間的相互關系.鑒于此,本文構造一種新的特征描述算子,用于刻畫紋理變化的分散程度.在紋理檢索系統(tǒng)中,常規(guī)采用的標準偏差的定義如式(2)所示,本文構造的新算子如式(3)所示.將這兩種特征分別編號為F2和F3.其中式(2)中的μs,k表示子帶系數(shù)的均值.
F2(s,k),=σ(s,k)=
(2)
(3)
為了更準確地刻畫紋理圖像的特征,增加文獻[12]中提出的峰度算子作為特征量.該算子的定義如式(4)所示.
F4(s,k)=
(4)
本算法中特征向量的構造方法是將每個子帶的F1、F3和F4連接在一起,從而構成一個向量,這個向量就稱為特征向量,其定義式如式(5)所示.
(5)
相似度函數(shù)用于計算特征向量之間的距離.到目前為止,至少有10種以上距離測度函數(shù).已有相關學者對這些距離函數(shù)的有效性進行了比較分析,認為Canberra距離是比較有效的一種[13].本文就采用這種距離作為相似度函數(shù),該函數(shù)的定義如式(6)所示.
(6)
式(6)中:d(x,y)表示向量x,y之間的距離,D表示兩個向量的維度(兩個向量必須具有相同的維度),xi,yi分別表示向量x和y的第i個分量.
實驗對象來自Brodatz紋理圖像數(shù)據(jù)庫[14].在該數(shù)據(jù)庫中,共有109幅圖像,每幅紋理圖像的大小為640×640像素,由于紋理具有一定的重復性和相似性,將每一幅圖像分割為160×160像素的小圖像,這樣可以得到1744幅實驗圖像,從同一幅圖像分割出的圖像屬于同一類.圖2給出了來自該測試集的24幅圖像.
圖2 實驗對象中的24幅紋理圖像
本文所采用的基本算法框圖與文獻[12]基本相同,不同之處在于采用了不同的特征向量.此處僅強調值得注意的關鍵點.
在contourlet-2.3變換中,直接采用具有較好紋理刻畫能力的“pkva”濾波器.分解結構參數(shù)采用形如[l1,l2,l3,l4]的向量.在這個向量表達式中,從左至右依次表示每個尺度(從細到粗)上方向濾波器的級數(shù).在基本contourlet變換中,方向濾波器和LP濾波器都采用“pkva”濾波器.檢索率的定義如式(7)所示.
(7)
其中:p∈{16,20,30,40,50,60,70,80,90,100} ;R(p)表示當檢索出的結果圖像為p幅時,1744幅圖像的平均檢索率,q=1744.
紋理檢索系統(tǒng)檢索率結果如表1和表2所示.其中表1給出的是contourlet紋理圖像檢索算法與已有算法的比較,表2則給出了在contourlet-2.3框架下的檢索率比較結果.在表1和表2中,D1=[4 4 3 3],D2=[4 3 3 2],D3=[3 3 2 2],D4=[3 2 2],D5=[4 3 3],OLD表示目前典型算法,NEW表示本文提出的算法.
從兩張表格可以看出,無論采用哪一種分解結構參數(shù),本文提出紋理檢索系統(tǒng)的檢索率都比現(xiàn)有的紋理檢索系統(tǒng)檢索率高.隨著目標相似圖像數(shù)N值的增大,這種優(yōu)勢逐漸變小,這個結果是明顯的,對于本文所采用的數(shù)據(jù)庫,當N=1744時,任何檢索系統(tǒng)的檢索率都將達到100%.值得指出,雖然本文給出的結果是采用“pkva”濾波器給出的,我們有大量的實驗結果表明,對于其他的濾波器,該結論一樣成立.比較表1和表2還可以發(fā)現(xiàn),contourlet-2.3比contourlet有較高的檢索率.
分析表1和表2可以發(fā)現(xiàn),分解結構參數(shù)的選取對于檢索率是有一定的影響,但這種影響不是非常明顯,一般在1%以內.鑒于算法的速度問題,建議每個尺度選擇4~8個方向子帶.
表1 Contourlet檢索算法與目前典型算法的檢索率
表2 Contourlet-2.3檢索算法與目前典型算法的檢索率
本文提出了一種新型的紋理圖像特征描述算子,并在該算子的基礎上,構造出新型結構的特征向量,進而提高了紋理圖像檢索系統(tǒng)的檢索率.這種做法,不僅適用于本文給出的兩種輪廓波變換檢索系統(tǒng),對于其他多種輪廓波變換紋理檢索系統(tǒng),存在類似的結果.因此具有一定的普遍適用性.下一步將針對變換和相似度函數(shù)展開研究,希望能夠進一步提高多尺度檢索系統(tǒng)的檢索率.