和文輝 李易 吳志慶 竇昊 陸冠嚴(yán)
摘要:需要一種圖像檢索方法對圖像進(jìn)行快速、有效的檢索,從而在圖像庫中找出與給定目標(biāo)圖像相似的圖像集。提出一種方法,該方法基于RGB顏色模型的統(tǒng)計(jì)直方圖和不變矩形狀特征。顏色特征和形狀特征是圖像中最重要的兩個圖形特征。顏色特征計(jì)算簡單,魯棒性強(qiáng)。形狀特征可以不受圖形的平移、旋轉(zhuǎn)和尺度變化的干擾??梢岳眉訖?quán)求和的方式結(jié)合兩者特點(diǎn)從而得出圖像間的相似度,通過大量實(shí)驗(yàn)得出效果最佳的權(quán)值比。
關(guān)鍵詞:圖像檢索;RGB顏色空間;不變矩;CIBR技術(shù)
中圖分類號:TP317.4 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)27-0173-03
Image Retrieval Based on Color Feature and Moment Invariants
HE Wen-hui, LI Yi, WU Zhi-qing, DOU Hao, LU Guan-yan
(College of Computer, North China University of Technology, Beijing 100144, China)
Abstract: An image retrieval method is needed which can perform a fast and efficient retrieval of an image. Thereby to find a series similar images in the image database similar with the target image. Proposed a method Based on the feature histogram of the RGB color model and the moment invariants shape feature. Color and shape features are the two most significant graphical features in an image. Color features are simple to calculate and robust. Shape features can be undisturbed by the translation, rotation, and scale variations of the graphics. The weighted summation can be used to combine the characteristics of the two to obtain the similarity between images. Through a large number of experiments, the best weight ratio is obtained.
Key words: image retrieval; RGB color space; moment invariants; CIBR technique
1 概述
如今信息的爆炸性增長和快速的生活節(jié)奏,使得人們更傾向于信息獲得更快,沖擊性更大的圖像信息。用戶對多媒體信息的需求量大大增加,一般的文字搜索引擎已經(jīng)不能滿足用戶需求。同時為了使管理和檢索個人的圖像信息更加方便快捷,這使得研究一種快速高效的圖像檢索系統(tǒng)迫在眉睫。
視覺是人類的高級感知,所以,圖像在人類感知中扮演著重要角色。圖像處理的重要性來自兩個主要的領(lǐng)域:改善圖像信息以便人們解釋;為儲存?zhèn)鬏敽捅硎径鴮D像信息進(jìn)行處理,以便機(jī)器自動解釋。
基于內(nèi)容的圖像檢索(CBIR)通過提取圖像本身的內(nèi)在客觀性特征如顏色、紋理、形狀、圖像中元素的空間、區(qū)域空間關(guān)系等,并比較這些視覺特征間的相似性和一致性,從而自動搜索出符合用戶要求的圖像集合。該方法根據(jù)圖像自身具有的各類型特點(diǎn),只需少量的人工干預(yù)就可以得到預(yù)期結(jié)果,也因此成了目前的主流圖像檢索技術(shù)。與圖像檢索概念提出初期的基于文本的圖像檢索相比,該方法更加便利高效能滿足用戶需求。[1]
2 RGB顏色空間
顏色空間即色彩模型(又稱為彩色空間或彩色系統(tǒng)),顏色空間通常由三獨(dú)立的屬性進(jìn)行描述,三個獨(dú)立屬性構(gòu)成三個變量,自然就形成了一個三維空間,這便是顏色空間。顏色空間的每一維代表一個顏色分量或一個顏色通道。[2]
2.1 顏色直方圖概述
顏色直方圖是重要的顏色特征,廣泛用于圖像檢索領(lǐng)域。顏色直方圖統(tǒng)計(jì)了整張圖像中的各種顏色所占的比例,描述了該圖像中關(guān)于顏色的數(shù)量特征。利用顏色直方圖能有效地進(jìn)行圖像檢索。
通過標(biāo)記幀與幀之間顯著的邊緣和顏色的統(tǒng)計(jì)變化,來檢測視頻中場景的變化。在每個興趣點(diǎn)設(shè)置一個有相近特征的直方圖所構(gòu)成“標(biāo)簽”,用以確定圖像中的興趣點(diǎn)。邊緣、色彩、角度等直方圖構(gòu)成了可以被傳遞給目標(biāo)識別分類器的一個通用特征類型。
總的來說,直方圖就是對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)的一種方法,并將統(tǒng)計(jì)值匯總起來,存儲到事先定義好的位置中。一般,我們習(xí)慣將其名稱定義為bin,這是一個經(jīng)常用到的概念。
RGB顏色指色彩中不能再分解的三種基本顏色,我們通常說的三原色。因?yàn)檫@種顏色空間對應(yīng)于人眼的三種感光細(xì)胞,因此效果很好被廣泛使用。
2.2 顏色直方圖算法
在確定顏色空間的基礎(chǔ)上,對一幅數(shù)字圖像,統(tǒng)計(jì)每一種顏色出現(xiàn)的像素點(diǎn)數(shù),然后把顏色值作為橫坐標(biāo),顏色出現(xiàn)的像素點(diǎn)數(shù)作為縱坐標(biāo)。以此繪出的圖形就是該圖像的顏色直方圖。它所描述的是不同色彩在整幅圖像中所占的比例,并不關(guān)心每種色彩所處的空間位置,即無法描述圖像中的對象或物體。直方圖計(jì)算簡單,易于實(shí)現(xiàn),使用歸一化后對縮放具有不變性。[3]
3 基于形狀的圖像檢索
3.1 形狀分析
3.1.1 形狀特征
本系統(tǒng)是采用基于輪廓的方法,現(xiàn)在常用的基于輪廓的形狀特征有周長,邊緣夾角,傅立葉變換,曲率尺度空間等。
3.1.2 特征選取
當(dāng)前對形狀特征的描述可以分為基于輪廓形狀與基于區(qū)域形狀兩類,這兩者的區(qū)別在于它們是從整個圖像輪廓中提取元素還是從圖像的區(qū)域內(nèi)提取,基于輪廓與基于區(qū)域這兩種被更多采用的是前者,因?yàn)榛谳喞芊衔覀儗ξ矬w的區(qū)分,并且基于輪廓形狀用到的元素較少,在處理一些復(fù)雜的計(jì)算機(jī)圖像時,可以減少計(jì)算?;谳喞?jì)算也會有一些缺點(diǎn),輪廓特征對于噪聲和形變比較敏感,并且有些形狀應(yīng)用中無法提取輪廓特征。
3.2 基于形狀的特征算法
3.2.1 算法概述
基于形狀的檢索,由于許多圖像比較復(fù)雜,需要考慮的因素比較多,因此基于形狀的難點(diǎn)在于檢索出與大小,形狀以及扭曲伸縮無關(guān)的東西,由于不變矩具有旋轉(zhuǎn),平移和尺度等不變的特性,在圖像處理中,幾何不變矩可以作為一個重要的特征來進(jìn)行圖像檢索,使用一維幾何矩,可以對幾何矩進(jìn)行排序,建立索引,然后選出與目標(biāo)圖的幾何矩最近圖像,雖然幾何矩不太能選出最像的,但是能快速排除不像的,以提高搜索效率。[4]
3.3 不變矩概述
幾何不變矩是基于代數(shù)不變量的矩不變量,由于其具有平移,旋轉(zhuǎn),尺度等特性的不變特征,在圖像檢索過程中,可以作為一個重要的特征來對圖像進(jìn)行區(qū)分,矩在統(tǒng)計(jì)學(xué)中常用作隨機(jī)量的分布情況,如果在力學(xué)中,常用來標(biāo)注空間物體的質(zhì)量分布,同樣,如果把圖像的灰度值看作是一個二維或者三維的密度分布函數(shù),那么矩方法便可以很好地運(yùn)用于圖像檢索中,并且做圖像特征的提取。
4 基于顏色特征和不變矩的圖像檢索
4.1 單獨(dú)使用基于RGB顏色空間的檢索方法
4.1.1 直方圖處理
直方圖是多種空間域處理技術(shù)的基礎(chǔ)。直方圖操作可用于圖像增強(qiáng),其在軟件中計(jì)算簡單方便,而且有助于商用的軟件實(shí)現(xiàn)。如今,直方圖越來越流行,是一種非常實(shí)用的實(shí)時圖像處理工具。
由于圖像庫中的圖像在不增刪的情況下是固定的。系統(tǒng)每一次運(yùn)行時,如果都對圖像庫中所有的圖像重新計(jì)算RGB顏色空間直方圖分布的值,這無疑是對計(jì)算機(jī)算力的浪費(fèi)也會造成系統(tǒng)運(yùn)行效率的降低。因此,研究者為了提高系統(tǒng)的運(yùn)行效率采取了犧牲空間換取時間的方法。提前將圖像庫中的所有圖像的RGB顏色空間直方圖數(shù)據(jù)計(jì)算出來并存儲,待系統(tǒng)運(yùn)行時將數(shù)據(jù)讀出再與待比較圖像的數(shù)據(jù)進(jìn)行顏色相似度計(jì)算。經(jīng)過比較,該方法的速度明顯快于實(shí)時計(jì)算的速度。
然而,在計(jì)算機(jī)存儲中,RGB三種顏色各占8位,共計(jì)3*8=24位。8位二進(jìn)制可以表示的數(shù)字是0~255,即理論上RGB顏色空間可以表示256*256*256=16777216種顏色。但是僅從人眼所能夠分辨的顏色的角度來看,如此之多的顏色顯然太多以至于冗余了。而且,僅一張圖像就會產(chǎn)生如此多的數(shù)據(jù),無意是給計(jì)算機(jī)存儲能力和讀取能力徒增負(fù)擔(dān)。因此,如果想要兼顧運(yùn)行速度和運(yùn)行效果,首先要解決圖像庫中的圖像的直方圖信息存儲的問題。
經(jīng)過大量實(shí)驗(yàn)對比得出,當(dāng)bin設(shè)置為12時效果就已經(jīng)十分理想,繼續(xù)增大bin的值意義不大。首先過大的bin值會影響計(jì)算速度,其次,雖然在理論上是對顏色分類得更加具體,但是卻不滿足人眼的接受能力,人眼無法分辨過于具體的顏色所以設(shè)置過大的bin值意義并不大。
4.2 單獨(dú)使用基于不變矩檢索方法
矩是描述圖像特征的算子,在圖像識別和模式匹配中具有非常重要的作用,幾何矩是最早提出并且容易實(shí)現(xiàn)的一種方法,所以說現(xiàn)在對它的研究比較透徹,幾何矩對于簡單的圖像有描述能力,但是在區(qū)分度上卻不如其它的幾種矩的效果,與幾種算子比起來,它相對于比較簡單,很容易實(shí)現(xiàn),一般只需一個數(shù)字就可以表達(dá),所以我們常用來區(qū)分相對于簡單而容易區(qū)分的圖像,用來過濾顯然看起來不像的文檔或者圖片。
物體的零階矩就可以認(rèn)為表示了圖像的“質(zhì)量”,[Moo=f(x,y )dxdy] ,在此式中,一階矩(M01,M10)確定圖像的質(zhì)心(Xc,Yc),其中[Xc=M01/M00,Yc=M10/M00].如果將圖像原點(diǎn)移至(Xc,Yc)處,就得到了圖形位移不變的中心矩, [Upq =[(x-Xc)^p]*[(y-Yc)^q]f(x,y)dxdy]。Hu包含七個幾何矩的不變量,這些不變量運(yùn)用于圖像的伸縮,平移,旋轉(zhuǎn)不變。[5]
4.3 基于顏色特征和不變矩的圖像檢索
為了結(jié)合兩種方法,研究者通過大量的實(shí)驗(yàn),對比實(shí)驗(yàn)效果決定:將圖像檢索的重點(diǎn)放在顏色直方圖中。首先利用基于RGB顏色空間的圖像檢索方法在圖像庫中檢索,利用OpenCV中的 compareHist函數(shù)。相似度由高到低排列出一個相似圖像集。再把該相似圖像集作為圖像庫,利用基于不變矩的圖像檢索方法重新將圖像集排列。由此得出的便是最后的新相似圖像集。(其中,兩個相似圖像集中的圖像元素并沒有改變,變的只是它們的排列順序)圖像排序依據(jù)于圖像的權(quán)值value,由第一次基于顏色的圖像檢索所產(chǎn)生的圖像權(quán)值value1和第二次基于不變矩的圖像檢索產(chǎn)生的圖像權(quán)值value2,value通過[value=α*value1+β*value2]進(jìn)行賦值。實(shí)驗(yàn)中,將α設(shè)置為1,β設(shè)置為0.2,即權(quán)值比α/β=5時可以得到滿意的效果。
5 總結(jié)
本文提出的圖片檢索系統(tǒng)采用C++,利用OpenCV庫進(jìn)行開發(fā)。從不同角度考慮圖像特征,系統(tǒng)的實(shí)現(xiàn)基于顏色直方圖和不變矩對圖形進(jìn)行相似度計(jì)算,可以解決一定的實(shí)際應(yīng)用的問題。
本項(xiàng)目受北京市大學(xué)生科學(xué)研究與創(chuàng)業(yè)行動計(jì)劃資助。
參考文獻(xiàn):
[1] 亢院兵.圖像檢索技術(shù)的歷史、現(xiàn)狀與研究進(jìn)展[J].內(nèi)江科技,2008(2):60,99.
[2] 竇建軍,文俊,劉重慶.基于顏色直方圖的圖像檢索技術(shù)[J].紅外與激光工程,2005(1):84-88.
[3] 葉志偉,夏彬,周欣,張彥超.一種改進(jìn)的基于顏色直方圖的圖像檢索算法[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2009,30(5):45-48.
[4] 史延新.基于形狀特征的圖像檢索算法研究[J].電子科技. 2008(12);69-71.
[5] 薛鴻民,劉志鏡,劉利,等.基于形狀的圖像檢索的關(guān)鍵技術(shù)研究[J].計(jì)算機(jī)應(yīng)用研究,2002(11);63-64.
[通聯(lián)編輯:梁書]