雷雯 魏星
摘 要:相關(guān)反饋技術(shù)和主動(dòng)學(xué)習(xí)的提出,縮小了圖像低層特征與高層特征的語(yǔ)義鴻溝,進(jìn)一步提高了檢索準(zhǔn)確性。支持向量機(jī)應(yīng)用在圖像檢索中,以所需圖像特征作為訓(xùn)練樣本數(shù)據(jù),通過(guò)選取合適的核函數(shù)以及相關(guān)參數(shù)設(shè)置構(gòu)建分類(lèi)器,對(duì)測(cè)試樣本進(jìn)行分類(lèi),從而檢索出相似度更接近的圖像。本文融合了圖像顏色與紋理綜合特征,通過(guò)支持向量機(jī)學(xué)習(xí)機(jī)制構(gòu)造分類(lèi)器,并引入主動(dòng)學(xué)習(xí),實(shí)現(xiàn)圖像檢索。實(shí)驗(yàn)表明,引入主動(dòng)學(xué)習(xí)可提高檢索準(zhǔn)確性。
關(guān)鍵詞: 圖像檢索;反饋;支持向量機(jī);主動(dòng)學(xué)習(xí);分類(lèi)器
中圖分類(lèi)號(hào):TP391.9 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-2163(2015)06-
Abstract: Relevance feedback technology and active learning proposed reduce the image low-level features and high-level features of the semantic gap, further improve the retrieval accuracy. Support vector machine in image retrieval, image feature desired as training data, by selecting the appropriate kernel and related parameters set to build a classifier, to classify the test samples,thereby to retrieve an image closer similarity. This article combines the image color and texture synthesis features, classifier is constructed using support vector machine learning mechanism, and by the introduction of active learning, realize image retrieval. Experimental results show that the introduction of active learning can improve the retrieval accuracy.
Key words: Image Retrieval; Feedback; SVM; Active Learning ;Classifier
0 引 言
支持向量機(jī)在解決小樣本分類(lèi)問(wèn)題中存在一定技術(shù)優(yōu)勢(shì),因而被應(yīng)用在圖像檢索中。為了縮小高層特征與低層特征的語(yǔ)義鴻溝,有關(guān)反饋的算法即已應(yīng)用在圖像檢索中。涉及的研究有:郭士會(huì)提出基于FSVM的相關(guān)反饋檢索算法[1],采用語(yǔ)義相關(guān)矩陣提高查詢(xún)準(zhǔn)確度;歐陽(yáng)軍林等提出用先驗(yàn)知識(shí)的Boosting方法與SVM相結(jié)合[2],有效解決了SVM存在樣本數(shù)量少、反饋準(zhǔn)確率低的問(wèn)題;郭金旭等提出基于多類(lèi)SVM相關(guān)反饋算法,檢索準(zhǔn)確性?xún)?yōu)于傳統(tǒng)SVM算法[3];針對(duì)標(biāo)注樣本不足,魯珂提出近鄰保留回歸算法[4],解決了過(guò)適應(yīng)問(wèn)題;符保龍?zhí)岢龌诟倪M(jìn)布谷鳥(niǎo)搜索算法的相關(guān)算法,較遺傳算法、粒子群算法有較高的準(zhǔn)確度[5]。
本實(shí)驗(yàn)融合了圖像的顏色與紋理綜合特征,根據(jù)檢索結(jié)果,選擇不同數(shù)量的正負(fù)例圖像作為訓(xùn)練樣本,以支持向量機(jī)學(xué)習(xí)算法構(gòu)造分類(lèi)器,并引入主動(dòng)學(xué)習(xí)進(jìn)行再反饋。實(shí)驗(yàn)表明,主動(dòng)學(xué)習(xí)可提高檢索準(zhǔn)確性,能夠滿(mǎn)足用戶(hù)的不同需求。
1 特征提取
1.1顏色特征
顏色矩[6]于1995年由Stricker和Orengo首次提出,是一種簡(jiǎn)單且有效的圖像顏色特征描述方法。圖像的顏色分布信息主要集中在低階矩中,因此,圖像的顏色特征可采用顏色直方圖的一階矩、二階中心矩和三階中心矩來(lái)表示。相對(duì)于顏色直方圖,該提取方法的優(yōu)點(diǎn)是不需對(duì)顏色空間進(jìn)行量化,且顏色特征維數(shù)降低。式(1)就是顏色矩的三個(gè)低階矩:
1.2 紋理特征
圖像的紋理可理解為多個(gè)奇異點(diǎn)的連接組成的邊界,而小波變換能夠有效檢測(cè)圖像的邊界和奇異點(diǎn)[7]。因此,可用于提取圖像的紋理特征。小波變換是指將信號(hào)分解為一系列的子函數(shù),表達(dá)為一種子函數(shù)累加的形式。小波變換需要有二維小波函數(shù)和尺度函數(shù)才能應(yīng)用在圖像處理中,二維小波變換往往通過(guò)可分離變量的方法由一維小波函數(shù)和尺度函數(shù)構(gòu)造。尺度函數(shù)和小波函數(shù)也可以理解為一個(gè)伸縮和平移的基函數(shù),該基函數(shù)沿著圖像的水平方向和垂直方向?yàn)V波和采樣,得到一個(gè)含帶四子圖的系數(shù)矩陣,對(duì)其中的逼近子圖不斷進(jìn)行濾波與采樣,可構(gòu)成多尺度的小波分解。采用小波變換表示圖像紋理特征是由每個(gè)小波分解層上能量的分布信息予以實(shí)施和呈現(xiàn),即均值與標(biāo)準(zhǔn)方差。使用均值與標(biāo)準(zhǔn)方差的分量構(gòu)成紋理特征向量實(shí)現(xiàn)紋理特征的檢索。目前,Haar小波變換,Daubechies小波變換方法等易受到圖像尺寸的限制,Dwong等人[8]提出的一種進(jìn)行多分辨率分析的W變換克服了尺寸限制,可進(jìn)行整幅圖像的檢索,實(shí)驗(yàn)表明該方法精確、有效。為了獲得更好的檢索效果,往往采用小波變換結(jié)合其他技術(shù)的方法。為了實(shí)現(xiàn)簡(jiǎn)捷品質(zhì),本實(shí)驗(yàn)采用MATLAB軟件中自帶了小波函數(shù)。
2 相關(guān)算法
2.1 SVM
支持向量機(jī)是建立在統(tǒng)計(jì)學(xué)習(xí)理論上的分類(lèi)算法,較神經(jīng)網(wǎng)絡(luò)分類(lèi)器算法,其在求解最優(yōu)值時(shí)不易陷入局部最優(yōu)解。通過(guò)選擇合適的懲罰系數(shù)和核函數(shù),可獲得更優(yōu)分類(lèi)面。因此,在解決小樣本問(wèn)題中存在獨(dú)有優(yōu)勢(shì)。在訓(xùn)練小樣本情況下, 不需要特定問(wèn)題的先驗(yàn)知識(shí),就可以切實(shí)良好地控制學(xué)習(xí)機(jī)器的推廣能力,因此在圖像檢索中可以有效提高檢索準(zhǔn)確性[9]。SVM在解決分類(lèi)問(wèn)題上往往都是低維空間不可分,因此,需要引入核函數(shù)在高維空間實(shí)現(xiàn)可分。核函數(shù)在一定程度上影響檢索準(zhǔn)確性[10-11]。工作中多采用LIBSVM工具[12],常用的核函數(shù)有線性核、多項(xiàng)式核和RBF核,一般選擇RBF核即徑向基核函數(shù)。
2.2 SVM訓(xùn)練步驟
SVM訓(xùn)練步驟詳細(xì)如下:
(1)采用多特征融合的低層特征對(duì)待檢索圖像進(jìn)行相似度測(cè)量;
(2)對(duì)檢索結(jié)果進(jìn)行正例圖像和負(fù)例圖像的標(biāo)記,得到相關(guān)圖像集和不相關(guān)圖像集;
(3)構(gòu)造樣本訓(xùn)練集 ,其中, 代表樣本圖像的特性向量,如式(3)所示; (3)
(4)對(duì)訓(xùn)練樣本進(jìn)行學(xué)習(xí)并構(gòu)造分類(lèi)器如式(4)所示:
(5)對(duì)于正類(lèi)樣本的圖像,分別計(jì)算每幅圖像的子圖到分類(lèi)面的距離,取其中最大的距離作為該圖像到分類(lèi)面的距離。正類(lèi)圖像的特征向量 到分類(lèi)面的距離可表示為 ,即如式(5)所示:
(6)計(jì)算待檢索圖像與剩余圖像的距離,按照距離大小排序,最終返回檢索結(jié)果。
2.3 主動(dòng)學(xué)習(xí)
主動(dòng)學(xué)習(xí)的思想就是學(xué)習(xí)機(jī)在已知的測(cè)試樣本集中自動(dòng)選擇學(xué)習(xí)樣本,具體就是在反饋過(guò)程中由算法自動(dòng)選擇供用戶(hù)標(biāo)記的樣本,通過(guò)用戶(hù)的檢索結(jié)果判斷用戶(hù)的檢索意圖,為用戶(hù)提供一些歧義性較大的反饋樣本[13]。在這些樣本中,標(biāo)記出感興趣與不感興趣的樣本,經(jīng)過(guò)如此反復(fù)操作,歧義性大的圖像就排在后面,在反饋給用戶(hù)的結(jié)果中與待檢索圖像的相關(guān)圖像就越多,更加符合了用戶(hù)的查詢(xún)需求。相似度測(cè)量方法較多,常用的有歐式距離等,文獻(xiàn)[14-15]采用了EMD距離,文獻(xiàn)[16]在此基礎(chǔ)上提出了相應(yīng)的改進(jìn),使檢索率有了一定的提高。實(shí)驗(yàn)中采用EMD-CkNN距離測(cè)量方法。
3 實(shí)驗(yàn)分析
本實(shí)驗(yàn)采用微軟的Corel圖像庫(kù),包含20類(lèi)的2 000張圖片,每類(lèi)100張。實(shí)驗(yàn)分別選取標(biāo)記正負(fù)例樣本圖像數(shù)量為5、10、20、30、40、50、60、70。為了測(cè)試方便,正負(fù)例圖像數(shù)量完全一樣。同時(shí)為了測(cè)試主動(dòng)學(xué)習(xí)對(duì)檢索結(jié)果的影響,采取了同樣的測(cè)試方法。抽取同一幅待檢索圖像,隨機(jī)測(cè)試8組實(shí)驗(yàn),對(duì)比效果如表1所示。
通過(guò)表1可知,選擇反饋圖像的數(shù)量越多,檢索準(zhǔn)確率并不一定隨之增加。為了獲得更為科學(xué)的對(duì)比結(jié)果,這里采用測(cè)試100組求均值的方法,對(duì)比結(jié)果如圖1所示。
從圖1結(jié)果可以看出,在相關(guān)反饋中加入主動(dòng)學(xué)習(xí)可以提高檢索準(zhǔn)確性。通過(guò)引入主動(dòng)學(xué)習(xí),在每次檢索結(jié)果中顯示歧義較大的圖像范圍內(nèi),選擇感興趣與不感興趣的圖像作為反饋的樣本圖像集,如此即使得樣本圖像集在進(jìn)行支持向量機(jī)學(xué)習(xí)中,會(huì)獲得最優(yōu)分類(lèi)面,從而將不同類(lèi)圖像盡可能最大程度地實(shí)現(xiàn)分離。研究將獲得更加符合用戶(hù)意愿的檢索結(jié)果,因此解決了在大量圖像數(shù)據(jù)庫(kù)中快速準(zhǔn)確地檢索到用戶(hù)所需圖像重點(diǎn)內(nèi)容難題,滿(mǎn)足用戶(hù)的不同需求。研究可知,在實(shí)際的應(yīng)用中,可通過(guò)加入主動(dòng)學(xué)習(xí)來(lái)提高檢索準(zhǔn)確性。
4 結(jié)束語(yǔ)
支持向量機(jī)作為一種相關(guān)反饋算法,將分類(lèi)問(wèn)題轉(zhuǎn)換為在線性條件下的凸二次優(yōu)化問(wèn)題,找到的極值點(diǎn)都是全局最優(yōu)點(diǎn)[18]。主動(dòng)學(xué)習(xí)的引入,運(yùn)用人機(jī)協(xié)同工作縮小了語(yǔ)義鴻溝,檢索結(jié)果更加符合用戶(hù)的檢索意圖,同時(shí)提高了檢索準(zhǔn)確性。
參考文獻(xiàn):
[1] 郭士會(huì),楊明,王曉芳等.基于FSRM的相關(guān)反饋圖像檢索算法[J].計(jì)算機(jī)科學(xué),2012,39(6A):540-542.
[2] 歐陽(yáng)林軍,劉建勛,曹步清.基于LBSVM機(jī)器學(xué)習(xí)的相關(guān)反饋圖像檢索[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(2):112-115.
[3] 郭金旭,王昱.基于多類(lèi)SVM相關(guān)反饋技術(shù)的研究[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,42(2):354-357.
[4] 魯珂,趙繼東,丁正明等.一種基于近鄰保留的相關(guān)反饋圖像檢索算法[J].計(jì)算機(jī)科學(xué),2012,39(1):281-284.
[5] 符保龍,張愛(ài)科.基于改進(jìn)布谷鳥(niǎo)搜索算法的相關(guān)反饋圖像檢索[J].電視技術(shù),2014,38(3):39-42.
[6] 肖秦琨,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計(jì)算機(jī)技術(shù)與發(fā)展,2013,23(4):107.
[7] ALEXANDROV A D. Adaptive filtering and indexing for image databases[J].SPIE,1995,2420:12-23.
[8] DWONG M K.W-transform method for feature-oriented multiresolution image retrieval[J]. SPIE,1999,2941:1086-1095.
[9] Vapnik V.The Nature of Statistical Learning Theory[M].New York: Springer Verlag,1995,11-14.
[10] 奉國(guó)和.SVM分類(lèi)核函數(shù)及參數(shù)選擇比較[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(3):126-127.
[11] 汪延華,陳峻婷.核函數(shù)的選擇研究綜述[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33(3):1181-1185.
[12] 王慧勤,雷剛.基于LIBSVM 的風(fēng)速預(yù)測(cè)方法研究[J].科學(xué)技術(shù)與工程,2011,11(22):5440.
[13] 彭晏飛,尚永剛,王德建.一種新的基于SVM和主動(dòng)學(xué)習(xí)的圖像檢索方法[J].計(jì)算機(jī)工程與科學(xué),2014,36(7):1372-1376.
[14] 李展,彭進(jìn)業(yè). 溫超.基于EMD距離的多示例聚類(lèi)[J].計(jì)算機(jī)科學(xué),2011,38(7):235-238.
[15] 王宇凡,梁工謙,張淑娟.基于相似度量的模糊支持向量機(jī)算法研究[J].微電子學(xué)與計(jì)算機(jī),2014,31(4):112-115.
[16] 李大湘,彭進(jìn)業(yè),賀靜芳.基于EMD-CkNN多示例學(xué)習(xí)算法的圖像分類(lèi)[J].光電子激光,2010,21(2):301-305.
[17] 馮偉興,梁洪,王臣業(yè).Visual C++數(shù)字圖像模式識(shí)別典型案例詳解[M].北京:機(jī)械工業(yè)出版社,2012:97.