蔡華杰,趙亞欣,謝光藝
(武警工程大學(xué) a.信息工程系;b.信息管理中心,陜西 西安 710086)
?
改進(jìn)的綜合BTC顏色矩和DT-CWT的圖像檢索算法
蔡華杰a,趙亞欣a,謝光藝b
(武警工程大學(xué) a.信息工程系;b.信息管理中心,陜西 西安 710086)
特征提取是基于內(nèi)容的圖像檢索中的關(guān)鍵技術(shù)。針對基于單一特征檢索效果不理想的問題,提出一種改進(jìn)的綜合顏色和紋理特征的圖像檢索算法。該算法在YIQ顏色空間中進(jìn)行特征提取,首先結(jié)合方塊編碼(BTC)的思想,提取顏色矩作為顏色特征;采用雙樹復(fù)小波變換(DT-CWT)提取紋理特征,融合兩種特征并利用相似性度量方式進(jìn)行圖像檢索。實驗結(jié)果表明算法所提取的顏色、紋理特征更利于檢索,使用綜合特征檢索的平均查準(zhǔn)率比同類算法更高。
圖像檢索;YIQ;BTC顏色矩;DT-CWT;特征融合
隨著計算機(jī)技術(shù)和多媒體技術(shù)的快速發(fā)展,基于內(nèi)容的圖像檢索技術(shù)(Content Based Image Retrieval,CBIR)[1]越來越受到眾多學(xué)者的關(guān)注,其主要利用圖像顏色或紋理等底層特征進(jìn)行檢索。顏色特征是圖像最直接、最簡單的特征,其提取方法常用顏色直方圖、顏色矩、信息熵等[2]。在采用顏色矩時,因為顏色分布信息主要集中在低階矩中[3],所以顏色矩通常只用9個特征維度,計算無須進(jìn)行預(yù)處理和后處理,特征提取方便快速,且能夠很好地與其他視覺特征相結(jié)合。紋理特征是人們識別和區(qū)分各種圖像的重要依據(jù),常用提取方法有很多,主要分為統(tǒng)計分析、建模參數(shù)估計和信號處理等[4]。由于圖像的多樣性和復(fù)雜性,僅使用單一特征來檢索圖像時,其性能和實踐效果并不理想,因此將兩種或多種特征相融合作為檢索依據(jù)成為一種可行的解決方案。龔淼等[5]利用BTC顏色矩提取顏色特征,但沒有考慮RGB顏色空間各分量之間的強(qiáng)相關(guān)性,導(dǎo)致圖像BTC編碼冗余較多。本文提出一種改進(jìn)的綜合顏色和紋理特征的圖像檢索算法,首先將圖像轉(zhuǎn)換至YIQ顏色空間,在此空間中進(jìn)行特征提取。結(jié)合方塊編碼思想分別對YIQ顏色空間中3個分量圖像進(jìn)行編碼構(gòu)成二值位圖,并計算BTC顏色矩表示圖像的顏色特征;在進(jìn)行圖像紋理特征提取時,為克服傳統(tǒng)小波變換的不足,采用雙樹復(fù)小波變換對YIQ各顏色分量圖像進(jìn)行分解,提取各子帶的統(tǒng)計特性。最后將所提取的顏色和紋理特征進(jìn)行相似度加權(quán)求和構(gòu)成圖像檢索的依據(jù)。實驗結(jié)果表明,所提取的顏色、紋理特征能更好地表示圖像信息,利于提高檢索性能;采用基于綜合特征檢索算法比基于單特征的算法檢索效果更好,同時與其他算法相比,本文算法檢索查準(zhǔn)率和查全率更高。
顏色空間是代表顏色信息的彩色模型。目前顏色空間的種類多達(dá)十余種,不同的應(yīng)用需求對應(yīng)于不同的顏色空間。在現(xiàn)實生活中應(yīng)用最廣泛的是面向硬件的RGB三原色空間,它能表示大部分顏色,通用性較強(qiáng),可以通過線性或非線性運算轉(zhuǎn)換至其他顏色空間,便于圖像編輯與顯示,但RGB各顏色分量之間相關(guān)性很強(qiáng),亮度與色度混合程度較高,顏色量化效果不好,在科學(xué)研究中需要顏色分析時一般不直接采用RGB顏色空間。
YIQ顏色空間是由美國國家電視制式委員會(National Television System Committee,NTSC)制定的一種面向硬件的三維笛卡爾坐標(biāo)空間[6]。在該空間中,Y分量描述圖像的亮度信息,可以代表紅、綠、藍(lán)三色強(qiáng)度的混合;I和Q則描述圖像的色度和飽和度屬性,即顏色信息,其中I分量包含橙色至青色的顏色信息,Q分量包含紫色到綠色的顏色信息。由于亮度信息和顏色信息能輕易地分離,YIQ顏色空間被廣泛應(yīng)用在電視廣播中(北美和日本)。在人眼視網(wǎng)膜構(gòu)造中,桿狀細(xì)胞數(shù)量是錐狀細(xì)胞的10~20倍,致使人眼對亮度變化比其他屬性變化更加敏感;在對顏色的反應(yīng)特性中,人眼對橙色至青色的變化比紫色至綠色的變化更為敏感,所以YIQ空間中,Y分量所占比重最大,I分量次之,Q分量最小。選擇YIQ顏色空間進(jìn)行特征提取的理由:
1)YIQ顏色空間中,各分量之間具有優(yōu)良的去相關(guān)性,它是圖像特征分析的一個重要屬性,便于對各分量進(jìn)行單獨處理;
2)用YIQ表示法對圖像信息進(jìn)行編碼時所得信號的冗余信息很少,這有利于后續(xù)顏色和紋理特征的提??;
3)YIQ與RGB空間具有線性關(guān)系,轉(zhuǎn)換方便,計算量相對較??;
4)各顏色分量是獨立的,可以適應(yīng)各種光照變化,便于處理不同光照強(qiáng)度的圖像;
5)Y,I,Q顏色分量在空間中的分配比重很好地匹配了人眼對不同顏色屬性的敏感程度,有利于圖像特征分析和提取。
RGB轉(zhuǎn)換至YIQ顏色空間的公式如下
(1)
方塊編碼算法(BlockTruncationCoding,BTC)是一種有效、快速的有損數(shù)字圖像的壓縮技術(shù)[7],利用模板對圖像分塊后根據(jù)設(shè)定的閾值進(jìn)行像素顏色值量化,構(gòu)成位映射矩陣代替子塊圖像達(dá)到圖像壓縮的目的。
顏色矩能描述圖像像素點的分布信息。在采用3種低階顏色矩提取圖像的顏色特征時,為提高檢索性能通常不對原圖像的像素值直接計算處理。文獻(xiàn)[8]在計算顏色矩之前對圖像進(jìn)行分塊處理。BTC顏色矩是根據(jù)設(shè)定的模板將圖像分割成互不重疊的子塊后,借鑒方塊編碼的思想,根據(jù)閾值對各個子塊內(nèi)的像素值進(jìn)行編碼(像素值大于閾值時編碼為1;像素值小于閾值時編碼為0),形成與子塊像素值映射的二值位圖,這在一定程度上也反映了圖像的紋理信息。分別計算兩類像素值的3種低階顏色矩。文獻(xiàn)[5]正是采用BTC顏色矩的方法提取顏色特征,但其是在RGB顏色空間中進(jìn)行的,沒有考慮各分量之間的強(qiáng)相關(guān)性和亮度色度信息混合的問題。本文在顏色空間選擇上作出改進(jìn),提出在YIQ各分量中計算BTC顏色矩。具體步驟如下:
1)將圖像轉(zhuǎn)換至YIQ顏色空間,并分別提取Y,I,Q各分量圖像,如圖1所示。
圖1 Lena測試圖像YIQ各分量子圖
2)設(shè)置m×m的模板,每個模板包含m×m個像素,將此模板分別遍歷3個分量圖像(M×N)將其劃分成互不重疊的子塊。
3)以Y分量圖像為例,對其中每個子塊圖像分別計算均值,設(shè)為閾值Tk
(2)
(3)
式中:BYk(i,j)表示編碼形成的二值位圖中第k個圖像塊點(i,j)的值。
4)根據(jù)兩類像素計算第k個子塊圖像的兩個一階矩(均值μ)、兩個二階矩(標(biāo)準(zhǔn)差σ)、兩個三階矩(s)。計算公式為
(4)
(5)
(7)
(9)
6)重復(fù)步驟3)~5),求出其他2個分量圖像的特征矢量I,Q。
7)構(gòu)成圖像顏色特征矢量
(10)
紋理特征是圖像檢索依據(jù)中的重要視覺特征之一,選擇合適、有效的提取方法能提高圖像檢索性能。小波變換具有良好的多分辨率特性,能分離出集中圖像紋理信息的高頻成分,便于提取紋理特征,因而被廣泛應(yīng)用在圖像檢索領(lǐng)域。但傳統(tǒng)的二維小波變換缺乏平移不變性,且圖像分解后每層的高頻子帶只有3個方向:水平、垂直以及對角線,見圖2c,其中對角子帶(±45°)高頻成分混合,紋理描述不準(zhǔn)確,不利于特征提取與分析。隨著小波理論的發(fā)展,雙樹復(fù)小波概念的提出一定程度上改善了上述不足。
雙樹復(fù)小波變換(Dual Tree Complex wavelet Transform,DT-CWT)[9]是一種方向增強(qiáng)型的小波變換。對圖像進(jìn)行DT-CWT處理時,利用可分離的雙正交濾波器構(gòu)建兩個獨立的平行小波樹,類似于傳統(tǒng)小波變換,對輸入圖像沿著列再沿著行先后處理,每一層分解得到4個低頻成分和12個高頻成分,如圖3所示。其中12個高頻成分分別對應(yīng)圖像6個不同方向(±15°,±45°,±75°)的實部和虛部,見圖2a、圖2b。相比于傳統(tǒng)小波變換,雙樹復(fù)小波變換得到的高頻子帶方向更多,提供了更豐富的紋理、邊緣資源,同時增強(qiáng)了圖像分解精度,由此所提取的特征能更好地描述圖像的紋理信息,利于提高檢索準(zhǔn)確率。
圖2 復(fù)小波和傳統(tǒng)小波分解的方向信息比較圖
圖3 DT-CWT分解示意圖
由于RGB三個分量之間存在較強(qiáng)的相關(guān)性,為避免其對分量圖像分解后的子帶系數(shù)造成影響,結(jié)合YIQ空間各顏色分量獨立性強(qiáng)的特點,本文提出在YIQ三個分量圖像上分別進(jìn)行雙樹復(fù)小波分解提取紋理特征。紋理特征由分解后各高頻子帶系數(shù)的均值(E)和方差(δ)表示
(11)
式中:n=12p,p表示DT-CWT分解級數(shù)。
特征匹配是基于內(nèi)容的圖像檢索中重要技術(shù)之一。在檢索過程中,通過特征向量之間的相似性判斷兩幅圖像的匹配程度,根據(jù)匹配程度大小給出檢索結(jié)果圖像。本文采用歐氏距離[10]進(jìn)行相似性度量。
歐氏距離為
(12)
設(shè)a為查詢圖像,b為數(shù)據(jù)庫檢索圖像。BTC顏色矩相似性度量
(13)
式中:Cia,Cib分別表示圖像a與圖像b的顏色特征矢量;nC表示顏色特征維數(shù)。
雙樹復(fù)小波變換相似性度量為
(14)
式中:Tia,Tib分別表示圖像a與圖像b的紋理特征矢量;nT表示紋理特征維數(shù)。
特征融合是將兩個或者多個特征根據(jù)規(guī)則有效組合,構(gòu)成綜合匹配特征方便檢索。本文采用加權(quán)求和的方式綜合顏色和紋理特征。為避免各特征提取方法的互異性造成匹配失準(zhǔn)、檢索失誤,本文采用Guassian模型[4]對距離進(jìn)行歸一化處理。
圖像a與圖像b之間的距離函數(shù)定義為
D(a,b)=ω1DCG(a,b)+ω2DTG(a,b)
(15)
式中:DCG(a,b),DTG(a,b)分別是DC(a,b),DT(a,b)經(jīng)過高斯歸一化后的距離;ω1,ω2是分配給顏色和紋理特征的權(quán)值,且滿足ω1+ω2=1。
實驗采用MATLAB進(jìn)行檢索測試。從Corel圖像庫和華盛頓大學(xué)的圖像數(shù)據(jù)庫(http://imagedatabase.cs.washington.edu)中選取10類圖像,每類100幅,其中每種相似圖像超過15幅,共計1 000幅作為實驗圖像數(shù)據(jù)庫。實驗采用圖像檢索領(lǐng)域常用的查準(zhǔn)率(Precision)和查全率(Recall)[11]作為評價標(biāo)準(zhǔn)。實驗時,從每類圖像中隨機(jī)抽取10幅圖像進(jìn)行檢索實驗,共計100次,并計算平均查準(zhǔn)率和平均查全率。
為檢驗本文算法的檢索性能,從3個方面進(jìn)行實驗:1)驗證本文顏色、紋理特征提取方法的優(yōu)越性;2)基于綜合特征與基于單特征算法之間檢索性能比較;3)本文算法與不同圖像檢索算法之間的比較。
5.1特征選取優(yōu)越性驗證
實驗1將不同顏色空間(YIQ和RGB)中基于BTC顏色矩的檢索算法作對比。圖4給出了3種不同種類圖像(動物、賽車、花卉)測試時一次檢索結(jié)果中返回的前12幅圖像序列對比圖,其中每個序列第一幅圖像為查詢圖像兼檢索結(jié)果圖像,隨后按照匹配程度大小順序排列檢索到的結(jié)果圖像。
圖4 不同類型圖像檢索結(jié)果對比圖
通過觀察對比,相同檢索圖像在不同顏色空間的檢索結(jié)果中,YIQ顏色空間檢測結(jié)果返回的相似圖像數(shù)目比RGB空間要多出1~3幅,檢索效果要好,更加符合人眼視覺特性。原因是YIQ空間各顏色分量之間獨立性相對較強(qiáng),能減少在對各分量BTC編碼時的冗余,提高檢索性能。
在紋理特征提取方面,將二維雙樹復(fù)小波變換與傳統(tǒng)二維離散小波變換(DWT)作檢索性能對比實驗,每種變換分別基于YIQ各分量圖像和基于RGB各分量圖像兩種情況。查詢結(jié)果返回圖像數(shù)目為12。表1給出了在不同分解級數(shù)下兩種紋理檢索算法的平均查準(zhǔn)率。
表1DT-CWT與DWT基于不同分量圖像不
同分解級數(shù)的檢索平均查準(zhǔn)率
%
分解級數(shù)pDT-CWTDWT基于YIQ分量圖像基于RGB分量圖像基于YIQ分量圖像基于RGB分量圖像169.2162.8559.8356.50278.9467.7066.6261.44374.1670.4369.0067.34
從表1可知,在相同分解級數(shù)和分量圖像下,采用DT-CWT檢索比采用DWT平均查準(zhǔn)率要高;在相同小波變換和分解級數(shù)下,基于YIQ分量圖像檢索平均查準(zhǔn)率高于基于RGB分量圖像檢索平均查準(zhǔn)率;除基于YIQ分量圖像DT-CWT檢索外,其他方式平均查準(zhǔn)率隨分解級數(shù)增加而提高;基于YIQ分量圖像DT-CWT檢索中在分解級數(shù)為2時平均查準(zhǔn)率最高。原因分析:1)DT-CWT比DWT能獲取更詳細(xì)的紋理信息,便于特征檢索;2)YIQ空間分量圖像的相關(guān)性要弱于RGB空間,且YIQ空間更符合人眼視覺生理機(jī)制;3)采用基于YIQ分量圖像DT-CWT檢索時,分解級數(shù)越高,特征維數(shù)越多,造成的冗余信息也越多,反而不利于特征分析。
5.2基于綜合特征與基于單特征檢索算法的性能比較
實驗2將綜合顏色紋理特征檢索算法與基于單特征檢索算法進(jìn)行性能比較。實驗采用等加權(quán)設(shè)計,即ω1=ω2=0.5。為保證檢索效果,根據(jù)實驗1設(shè)基于YIQ分量圖像DT-CWT檢索分解級數(shù)p=2。表2給出了對比結(jié)果。
表2本文算法與基于顏色單特征和基于紋理單特征算法的平均查準(zhǔn)率 %
采用算法顏色特征(BTC顏色矩)紋理特征(DT-CWT)本文算法(綜合特征)平均查準(zhǔn)率72.2278.9483.80
實驗結(jié)果表明,綜合特征檢索查準(zhǔn)率比依據(jù)單一的顏色或紋理特征檢索查準(zhǔn)率要高。因為綜合特征檢索算法考慮到了特征間的互補性,圖像信息的描述更加全面,所以其檢索效果更好,精度更高。
5.3不同檢索算法的性能比較
實驗3將本文算法與文獻(xiàn)[5]和文獻(xiàn)[11]中的算法作檢索性能對比。文獻(xiàn)[5]和文獻(xiàn)[11]都是綜合顏色和紋理特征進(jìn)行檢索,但提取方式有所不同,其中文獻(xiàn)[5]顏色特征是在RGB顏色空間中計算BTC顏色矩,紋理特征采用灰度共生矩陣提??;文獻(xiàn)[11]中采用顏色矩提取顏色特征,采用離散余弦變換提取紋理特征。圖5給出了3種不同算法平均查準(zhǔn)率-平均查全率的對比曲線圖。由實驗結(jié)果可知,本文算法的檢索性能要優(yōu)于其他兩種算法。
圖5 3種檢索算法平均查準(zhǔn)率-平均查全率比較
本文提出一種改進(jìn)的綜合顏色和紋理特征的圖像檢索算法。為避免RGB中各顏色分量之間強(qiáng)相關(guān)性造成的影響,提出在YIQ顏色空間中,分別利用BTC顏
色矩和DT-CWT方式提取顏色、紋理特征,特征融合后進(jìn)行圖像檢索。實驗表明,該算法在特征提取上有很好的優(yōu)越性,可以有效綜合圖像顏色和紋理特征,并具有較高的查準(zhǔn)率和查全率。但本文在特征融合時忽略了各特征權(quán)重的影響,而是采用固定相等權(quán)值,下一步將針對權(quán)重分配問題展開研究。
[1]DEB S,ZHANG Y C. An overview of content-based image retrieval techniques[C]//Proc. 18th International Conference on Advanced Informaiton Networking and Application. Fukuoka,Japan:IEEE AINA,2004:59-64.
[2]NANDGOPALAN A D. A universal model for content-based image retrieval[J].World academy of science,engineering and technology,2008,25(9):30-35.
[3]張少博,全書海,石英,等. 基于顏色矩的圖像檢索算法研究[J].計算機(jī)工程,2014,40(6):252-255.
[4]劉麗,匡綱要. 圖像紋理特征提取方法綜述[J].中國圖象圖形學(xué)報,2009,14(4):622-635.
[5]龔淼,付正,張尤賽. 綜合BTC顏色矩和灰度共生矩陣的圖像檢索算法[J].電視技術(shù),2012,36(11):30-33.
[6]GANESAN P,RAJINI V. YIQ color space based satellite image segmentation using modified FCM clustering and histogram equalization[C]//Proc. 2014 International Coference on Advances in Electrical Engineering. Vellore,India:IEEE,2014:1-5.
[7]趙珊,孫君頂,周利華. 一種新的基于關(guān)鍵子塊的圖像檢索算法[J].光子學(xué)報,2007,36(2):376-379.
[8]岳磊. 基于分塊顏色矩和灰度共生矩陣的圖像檢索[J].微計算機(jī)信息,2012,28(8):161-164.
[9]SELESNICK I W,BARANIUK R G,KINGSBURY N C. The dual-tree complex wavelet transform[J]. IEEE signal processing magazine,2005,22(6):123-151.
[10]CHEN C C,CHU H T. Similarity measurement between images[C]//Proc. 29th Annual International Computer Software and Applications Conference(COMPSAC’2005). Edinburgh,UK:IEEE,2005:41-42.
[11]梁美麗,牛之賢.改進(jìn)的綜合顏色紋理特征圖像檢索[J].計算機(jī)應(yīng)用與軟件,2014,31(6):228-231.
蔡華杰(1991— ),碩士生,主研圖像檢索、視頻處理與分析;
趙亞欣(1991— ),碩士生,主研視頻處理與分析;
謝光藝(1973— ),碩士生導(dǎo)師,主要研究方向為圖像處理與模式識別、視頻語義化研究。
責(zé)任編輯:時雯
Improved image retrieval algorithm combining BTC color moment and DT-CWT
CAI Huajiea,ZHAO Yaxina,XIE Guangyib
(a.DepartmentofInformationEngineering;b.CenterofInformationManagement,EngineeringUniversityofChineseArmedPoliceForce,Xi’an710086,China)
The feature extraction is the key technology of content-based image retrieval. In view of the problem that the image retrieval has not an ideal effect when basing on single feature,an improved image retrieval algorithm combining color feature and texture feature is proposed. In the algorithm,the image is firstly converted into YIQ color space to extract features. The color moments are calculated as the color feature applying the thought of block truncation coding(BTC), the dual-tree complex wavelet transform is proposed to extract texture feature in each YIQ color component. The extracted features are synthesized and the method of similarity measurement is taken advantage of to retrieve images. The conclusions are drawn from experimental results that the color and texture feature extracted in the algorithm is beneficial to image retrieval,and the algorithm using comprehensive features has better retrieval performance compared with other algorithms.
image retrieval;YIQ;BTC color moment;DT-CWT; fusion of feature
TN945+.7
A
10.16280/j.videoe.2016.09.005
2016-01-04
文獻(xiàn)引用格式:蔡華杰,趙亞欣,謝光藝.改進(jìn)的綜合BTC顏色矩和DT-CWT的圖像檢索算法 [J].電視技術(shù),2016,40(9):26-30.
CAI H J,ZHAO Y X,XIE G Y. Improved image retrieval algorithm combining BTC color moment and DT-CWT[J].Video engineering,2016,40(9):26-30.