陳瑞文
(黎明職業(yè)大學(xué) 信息與電子工程學(xué)院,福建 泉州 362000)
隨著互聯(lián)網(wǎng)的高速發(fā)展,數(shù)字圖片的數(shù)量呈幾何倍增長,在海量的圖庫中,單純靠圖片名很難準(zhǔn)確地找到相應(yīng)的圖片.基于內(nèi)容的圖像檢索是一種根據(jù)圖像內(nèi)容進(jìn)行檢索的方法,同傳統(tǒng)的基于文件名進(jìn)行檢索的方法相比,它能更準(zhǔn)確地找出所需的圖片,能在更大程度上滿足人們的需求.
基于內(nèi)容的圖像檢索的關(guān)鍵是如何將圖像的主體內(nèi)容和背景分割開,以實現(xiàn)更加精確的基于內(nèi)容的圖像檢索和匹配.圖像的主體內(nèi)容就是圖像的感興趣區(qū)域,關(guān)于感興趣區(qū)域的提取一直是基于內(nèi)容的圖像檢索的研究熱點和難點.近年來,有許多學(xué)者提出了一種感興趣區(qū)域的提取方法,就是先進(jìn)行圖像特征點的提取,再根據(jù)特征點提取感興趣區(qū)域.目前經(jīng)常采用的特征點提取方法有:基于距離、角度、模板方法[1],Harris方法,基于曲率尺度空間(curvature scale space,CSS)方法等.
文獻(xiàn)[2]、[3]采用的方法是將特征點相連形成凸包,確定感興趣區(qū)域;文獻(xiàn)[4]采用基于滑動窗口的方法,通過滑動窗口,找到包含特征點最多的矩形區(qū)域,確定感興趣區(qū)域.以上方法的缺點是當(dāng)特征點比較分散時,感興趣區(qū)域?qū)^多的背景區(qū)域,影響檢索的效果.因此,本文提出了一種基于曲率尺度空間的特征點提取方式,并根據(jù)特征點的特征值來確定感興趣區(qū)域,然后基于顏色和紋理特征進(jìn)行基于內(nèi)容的圖像檢索,并通過實驗證明方法的檢索效果.
本文采用曲率尺度空間方法進(jìn)行特征點的提取.
其基本原理是首先在較高的尺度下把局部曲率最大點作為候選點,如果某個候選點處的曲率值大于所設(shè)定閾值,則把該角點作為正確特征點,然后在較低的尺度下定位這些特征點[5].
設(shè)k(u,σj)表示在尺度σj下輪廓曲線任意一點的曲率,表示方法如下:
(1)
其中Xu=x(u)?gu(u,σj),Xuu=x(u) ?guu(u,σj),Yu=y(u)?gu(u,σj),Yuu=y(u)?guu(u,σj),g(u,σj)表示高斯函數(shù)g(u)在不同尺度σj下的表示形式;
gu(u,σj)和guu(u,σj)為g(u,σj) 關(guān)于u的一階和二階導(dǎo)數(shù);?表示卷積;u為弧長參數(shù).為了克服噪聲對CSS的影響,張小洪等人提出利用多尺度曲率積來增強特征信息、抑制噪聲[6].但是,由于尺度的變大,使得某些特征點的曲率隨著變小,曲率積也隨之變小,導(dǎo)致這些特征點被作為偽特征點而被剔除掉.因此,在文獻(xiàn)[7]中又提出了一種新的方法,基于多曲率多項式的提取方法.具體方法是針對不同尺度下曲率的局部極大值點,計算曲率的加權(quán)和,而非極值點則計算曲率積.[7]采用這種方法就可以避免以上所說的特征點被剔除的問題.具體提取方法如下:
(2)
感興趣區(qū)域的確定取決于提取的特征點.在文獻(xiàn)[2]、[3]中,將邊緣特征點進(jìn)行連接,形成一個凸多邊形,將所有特征點包含進(jìn)來.文獻(xiàn)[4]則采用滑動窗口的方法,將窗口內(nèi)的特征點的特征值相加,選擇總和最大的窗口作為感興趣區(qū)域.采用文獻(xiàn)[2]、[3]的方法對于背景比較簡單的圖像來說,感興趣區(qū)域提取的效果很好,但對于背景比較復(fù)雜的圖像來說,感興趣區(qū)域提取的效果就不理想.
本文提出了一種新的基于特征點的感興趣區(qū)域的提取方法.
取特征點的邊界點(即左上,右上,左下,右下的邊界點)連接成矩形區(qū)域.若矩形區(qū)域滿足以下兩個條件,則該區(qū)域就是最終的感興趣區(qū)域.條件如下:
①矩形區(qū)域不超過整幅圖像的1/2.
②所包含的特征點超過特征點總數(shù)的1/2.
如果不滿足以上兩個條件,則對矩形框進(jìn)行變換.
首先,如果不滿足條件1,則對矩形區(qū)域進(jìn)行收縮,等比例收縮,收縮至整幅圖像的1/2.
其次,如果不滿足條件2,則對區(qū)域外的特征點進(jìn)行檢測,選取特征點最多的方向進(jìn)行移動,直至滿足條件2.
若始終無法滿足以上兩個條件,則以最初構(gòu)造的矩形區(qū)域作為感興趣區(qū)域.
根據(jù)以上方法,我們以corel1000圖庫為例,進(jìn)行了實驗.該圖庫包括了10類圖像,每類各100幅,包括花、建筑、恐龍、公共汽車等.我們首先進(jìn)行了感興趣區(qū)域的提取實驗,以下是部分實驗結(jié)果.
圖1 基于本文方法的感興趣區(qū)域提取結(jié)果
為了進(jìn)一步證明使用這種感興趣區(qū)域的提取方法對于圖像檢索的作用,我們進(jìn)行了圖像檢索的實驗.采用顏色特征和紋理特征進(jìn)行檢索實驗,以查準(zhǔn)率為評價標(biāo)準(zhǔn),比較使用感興趣區(qū)域提取方法和不使用感興趣區(qū)域提取方法的檢索效果.其中顏色特征采用HSV顏色空間,量化為36種顏色,量化方法如下[8]:
(3)
(4)
(5)
紋理特征采用區(qū)域紋理譜描述符特征[9].對于如圖2所示的8-鄰域,區(qū)域紋理譜描述符如式(5)所示:
(6)
其中
s(Pi,Pc,Pi+4)=d1⊙d2
從而可以得到16維的紋理直方圖.
實驗中,采用直方圖相交法分別計算顏色和紋理直方圖間的距離,顏色和紋理特征的比重分別取0.5和0.5.對于每類圖像,分別進(jìn)行30次查詢,每次取前20幅圖像,并計算查詢結(jié)果的平均值,統(tǒng)計其平均查準(zhǔn)率.實驗結(jié)果如表1所示.
圖2 8-鄰域
表1 實驗平均查準(zhǔn)率
圖像的特征點包含了圖像的重要信息,只有抓住了特征點才能準(zhǔn)確地把握圖像的感興趣區(qū)域.在特征點提取以后,本文的方法既考慮了邊緣特征點,又把盡可能多的特征點包含進(jìn)來,同時控制感興趣區(qū)域的大小范圍,在感興趣區(qū)域的提取實驗中,取得了比較好的結(jié)果.采用該感興趣區(qū)域提取方法,結(jié)合HSV顏色空間和紋理譜描述方法進(jìn)行檢索實驗,檢索的查準(zhǔn)率比較理想,取得了較好的檢索效果.
參考文獻(xiàn):
[1]楊海峰,侯朝楨.基于距離、角度、模板的角點檢測算法[J].激光與紅外,2005,35(7):527-530.
[2]陳素霞.圖像感興趣區(qū)域的提取及檢索技術(shù)研究[D].焦作:河南理工大學(xué),2009.
[3]孟繁杰,郭寶龍,李新偉,等.基于興趣點凸包的圖像檢索方法[J].光電子·激光,2010,21(6):936-939.
[4]染春迎,王國營,康進(jìn)峰.基于顯著區(qū)域的圖像檢索方法[J].計算機工程,2010,36(5):210-211.
[5]毋小省,孫君頂.基于感興趣區(qū)域的圖像檢索方法[J].激光與紅外,2013,43(2):221-224.
[6]張小洪,雷明,楊丹.基于多尺度曲率乘積的魯棒圖像角點檢測[J].中國圖象圖形學(xué)報,2007,7(12):1270-1275.
[7]孫君頂,郭啟強,張兆生.基于曲率尺度空間的輪廓角點檢測[J].光電工程,2009,36(7):78-82.
[8]黃元元.基于視覺特征的圖像檢索技術(shù)研究[D].南京:南京理工大學(xué),2003.
[9]毋小省.基于紋理譜特征的圖像檢索技術(shù)研究[D].焦作:河南理工大學(xué),2010.