詹洪陳+王懷登+何菁+袁杰
摘 要: 主要圍繞基于內容的圖像檢索的相關技術進行了研究。設計分析了基于內容的圖像檢索系統(tǒng)的具體結構,研究了結構中各模塊的具體內容。并且用Matlab軟件工具基本實現了基于內容的圖像檢索,以手機圖像為例,驗證了算法的正確性。
關鍵詞:圖像檢索; 特征提??; 相似性度量; Matlab軟件
中圖分類號: TN957.52?34 文獻標識碼: A 文章編號: 1004?373X(2014)07?0068?03
Content?based image retrieval
ZHAN Hong?chen1, WANG Huai?deng1, HE Jing1, YUAN Jie2
(1. Jinling College of Nanjing University, Nanjing 210089, China; 2. School of Electronic Science and Engineering, Nanjing University, Nanjing 210093, China)
Abstract: Correlative techniques of CBIR are studied. The physical structure of CBIR system is designed and analyzed, and the concrete content of the modules is researched. Matlab is used to realize the CBIR. Taking the mobile telephone images as the example, the algorithm is proved to be correct.
Keywords: image retrieval; feature extraction; similarity measurement; Matlab
0 引 言
隨著大規(guī)模數字圖像庫的出現,傳統(tǒng)的圖像檢索技術存在的問題越來越突出,為了解決這些問題,人們提出了基于內容的圖像檢索技術(Content?based Image Retrieval,CBIR)[1]。其主要方法是提取每幅圖像的視覺內容特征,如顏色、紋理、形狀及空間關系等,建立圖像的特性矢量作為其索引,按查詢圖像和目標圖像特征的相似性匹配進行圖像檢索。相對于文本方式,CBIR主要具有以下特點:直接對圖像進行分析并提取特征,使得檢索更加接近圖像對象;提取特征的方式多樣化;特征提取和索引建立可由計算機自動實現;用戶能夠參與檢索過程,具有人機交互性[2?3]。
1 基于內容的圖像檢索系統(tǒng)結構
基于內容的圖像檢索系統(tǒng)通常由兩個模塊構成:圖像庫建立模塊和圖像庫檢索模塊。本文在Matlab軟件環(huán)境下開發(fā)實現了一個基于內容的圖像檢索系統(tǒng),主要用于驗證形狀特征和顏色特征提取算法的可行性和有效性以及相似性度量的性能。其具體結構如圖1所示。
圖1 基于內容的圖像檢索系統(tǒng)結構圖
2 系統(tǒng)模塊功能
2.1 圖像庫建立模塊
圖像庫建立模塊的主要功能是圖像預處理及圖像特征提取,其核心是圖像特征提取技術。
(1) 圖像預處理
圖像預處理:讀取圖像數據,包括圖像的模式、大小等,對圖像進行色彩空間轉換、尺寸比例調整等,還包括對圖像進行直方圖均衡化、銳化濾波等,以增強圖像對比度,提升圖像亮度,突出使物體的邊緣輪廓清晰[4]。
(2) 圖像特征提取
本文設計的圖像檢索系統(tǒng)主要是提取圖像的形狀和顏色特征。在進行特征提取時,首先需對圖像進行分割,這里采用的是邊緣檢測法[5],即提取圖像的邊界,然后對各個連通域進行特征提取,包括顏色特征和一些基于區(qū)域的形狀特征。
2.2 圖像庫檢索模塊
圖像庫檢索模塊主要負責度量查詢圖像與特征數據庫中對應的各個圖像之間的相似度,其核心部分是特征匹配[6],這里在進行特征匹配時通過計算兩個特征向量之間的相關系數度量其相似性。經過匹配,系統(tǒng)最后按照相似度大小順序輸出檢索結果。
3 基于內容的圖像檢索的具體實現
本文在Matlab軟件環(huán)境下以手機圖片庫為例,實現基于內容的圖像檢索。
3.1 圖像特征提取的算法流程
如圖2所示,在算法實現的具體過程中,需注意以下幾個步驟:
圖2 圖像特征提取的算法流程圖
(1) 圖像分割
采用邊緣檢測法進行圖像分割,即利用邊緣檢測算子提取圖像邊界[7],這里采用Canny算子。用邊緣檢測法提取的圖像邊界可能會不連續(xù),丟失一部分邊界點信息,故可先用灰度閾值法將圖像二值化,這里灰度閾值[T]可以用Qtsu 法直接求得,再用邊緣檢測法進行圖像的邊界提取。
(2) 連通域標記
區(qū)分連通區(qū)域,表示連通域個數。即對屬于同一個像素連通區(qū)域的所有像素分配相同的編號,對不同的連通區(qū)域分配不同的編號。
(3) 對連通域提取形狀特征[8]
形狀特征表達用基于區(qū)域的描述方法,提取區(qū)域面積、橫縱對比度、各連通域所占比例等參數作為形狀特征向量[9]。
(4) 對連通域提取顏色特征[10]
提取顏色特征時選取的是RGB顏色空間,顏色量化采用均勻量化的方法[11]。具體過程為:將[0,255]劃分為四個均勻的小區(qū)間,令:
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實現的具體過程中,需注意以下幾個步驟:
(1) 相似計算[12]
特征匹配過程中通過計算相關系數來度量兩幅圖像之間的相似性,在提取出目標圖像的特征矩陣后,將其與特征庫中對應各圖像的特征矩陣進行相似度計算。特征矩陣由所提取的形狀特征和顏色特征構成,其每個行向量代表不同的特征描述,故計算相似度時先分別計算兩特征矩陣各對應行向量的相關系數,這里由于各個行向量描述不同的特征,需考慮它們之間應有不同的權重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結果示例
以手機圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結 語
本文實現了基于內容的圖像檢索,首先建立圖像特征庫,即通過對圖像分割找出圖像各連通域,分別進行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫;然后,提取出目標圖像的特征矩陣,并與庫中各圖像特征矩陣進行匹配,算出相似度;最后根據匹配結果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機圖像檢索為例,得到了正確的檢索結果,驗證了算法的正確性和有效性。
圖4 手機圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻
[1] 張騫.基于文本的與基于內容的圖像檢索技術比較研究[J].情報探索,2012(1):111?113.
[2] 馬玉國,武栓虎,宋宜斌.基于多特征抽取的商標圖像檢索[J].計算機工程與應用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內容的圖像檢索技術的比較研究[J].首都師范大學學報:自然科學版,2012,33(4):6?9.
[4] 霍宏濤.數字圖像處理[M].北京:北京理工大學出版社,2011.
[5] 葉青,唐鵬舉.基于內容的圖像檢索方法研究與實現[J].懷化學院學報,2011,30(8):31?35.
[6] 周明全,耿國華,韋娜.基于內容圖像檢索技術[M].北京:清華大學出版社,2007.
[7] 孫振權,肖詩賦,呂學強.基于內容圖像檢索的特征融合技術研究[J].圖像圖形技術研究與應用, 2010(1):156?161.
[8] 沈金科.基于內容的圖像檢索方法研究與實踐[D].武漢:武漢工程大學,2011.
[9] 李星.基于內容的圖像檢索技術研究與應用[D].北京:北京交通大學,2008.
[10] 姜亞莉.基于內容的圖像檢索系統(tǒng)分析[J].測繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計算機工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內容的圖像檢索技術研究[D].南京:南京航空航天大學,2010.
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實現的具體過程中,需注意以下幾個步驟:
(1) 相似計算[12]
特征匹配過程中通過計算相關系數來度量兩幅圖像之間的相似性,在提取出目標圖像的特征矩陣后,將其與特征庫中對應各圖像的特征矩陣進行相似度計算。特征矩陣由所提取的形狀特征和顏色特征構成,其每個行向量代表不同的特征描述,故計算相似度時先分別計算兩特征矩陣各對應行向量的相關系數,這里由于各個行向量描述不同的特征,需考慮它們之間應有不同的權重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結果示例
以手機圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結 語
本文實現了基于內容的圖像檢索,首先建立圖像特征庫,即通過對圖像分割找出圖像各連通域,分別進行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫;然后,提取出目標圖像的特征矩陣,并與庫中各圖像特征矩陣進行匹配,算出相似度;最后根據匹配結果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機圖像檢索為例,得到了正確的檢索結果,驗證了算法的正確性和有效性。
圖4 手機圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻
[1] 張騫.基于文本的與基于內容的圖像檢索技術比較研究[J].情報探索,2012(1):111?113.
[2] 馬玉國,武栓虎,宋宜斌.基于多特征抽取的商標圖像檢索[J].計算機工程與應用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內容的圖像檢索技術的比較研究[J].首都師范大學學報:自然科學版,2012,33(4):6?9.
[4] 霍宏濤.數字圖像處理[M].北京:北京理工大學出版社,2011.
[5] 葉青,唐鵬舉.基于內容的圖像檢索方法研究與實現[J].懷化學院學報,2011,30(8):31?35.
[6] 周明全,耿國華,韋娜.基于內容圖像檢索技術[M].北京:清華大學出版社,2007.
[7] 孫振權,肖詩賦,呂學強.基于內容圖像檢索的特征融合技術研究[J].圖像圖形技術研究與應用, 2010(1):156?161.
[8] 沈金科.基于內容的圖像檢索方法研究與實踐[D].武漢:武漢工程大學,2011.
[9] 李星.基于內容的圖像檢索技術研究與應用[D].北京:北京交通大學,2008.
[10] 姜亞莉.基于內容的圖像檢索系統(tǒng)分析[J].測繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計算機工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內容的圖像檢索技術研究[D].南京:南京航空航天大學,2010.
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實現的具體過程中,需注意以下幾個步驟:
(1) 相似計算[12]
特征匹配過程中通過計算相關系數來度量兩幅圖像之間的相似性,在提取出目標圖像的特征矩陣后,將其與特征庫中對應各圖像的特征矩陣進行相似度計算。特征矩陣由所提取的形狀特征和顏色特征構成,其每個行向量代表不同的特征描述,故計算相似度時先分別計算兩特征矩陣各對應行向量的相關系數,這里由于各個行向量描述不同的特征,需考慮它們之間應有不同的權重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結果示例
以手機圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結 語
本文實現了基于內容的圖像檢索,首先建立圖像特征庫,即通過對圖像分割找出圖像各連通域,分別進行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫;然后,提取出目標圖像的特征矩陣,并與庫中各圖像特征矩陣進行匹配,算出相似度;最后根據匹配結果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機圖像檢索為例,得到了正確的檢索結果,驗證了算法的正確性和有效性。
圖4 手機圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻
[1] 張騫.基于文本的與基于內容的圖像檢索技術比較研究[J].情報探索,2012(1):111?113.
[2] 馬玉國,武栓虎,宋宜斌.基于多特征抽取的商標圖像檢索[J].計算機工程與應用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內容的圖像檢索技術的比較研究[J].首都師范大學學報:自然科學版,2012,33(4):6?9.
[4] 霍宏濤.數字圖像處理[M].北京:北京理工大學出版社,2011.
[5] 葉青,唐鵬舉.基于內容的圖像檢索方法研究與實現[J].懷化學院學報,2011,30(8):31?35.
[6] 周明全,耿國華,韋娜.基于內容圖像檢索技術[M].北京:清華大學出版社,2007.
[7] 孫振權,肖詩賦,呂學強.基于內容圖像檢索的特征融合技術研究[J].圖像圖形技術研究與應用, 2010(1):156?161.
[8] 沈金科.基于內容的圖像檢索方法研究與實踐[D].武漢:武漢工程大學,2011.
[9] 李星.基于內容的圖像檢索技術研究與應用[D].北京:北京交通大學,2008.
[10] 姜亞莉.基于內容的圖像檢索系統(tǒng)分析[J].測繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計算機工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內容的圖像檢索技術研究[D].南京:南京航空航天大學,2010.