李新磊 河南師范大學(xué)圖書館,河南新鄉(xiāng) 453007
一種基于貼近度的圖片內(nèi)容檢索技術(shù)研究
李新磊 河南師范大學(xué)圖書館,河南新鄉(xiāng) 453007
基于內(nèi)容檢索的實質(zhì)是將圖像的底層特征進(jìn)行采集提取,而后對提取的圖像特征進(jìn)行檢索,當(dāng)然提取特征與特征檢索手段多種多樣。為了刻畫兩幅圖像相似特征集合之間的相似與接近程度問題,對若干相似性度量標(biāo)準(zhǔn)之間的關(guān)系進(jìn)行了討論,提出解決方案并最終實現(xiàn)。
貼近度;相似性度量;圖像檢索
將一幅圖片的所有像素點作為一個研究對象,將其特征提取特征集合,討論圖像內(nèi)容的相似程度,也就是考慮兩個特征集合的相似程度。一般的相似度都是基于“距離”的概念來構(gòu)建的,所以我們在使用貼近度前首先要對距離有明確的定義:
有集合P和集合Q,定義集合P和Q的距離為:
從集合的距離來定義它們之間的貼近度,在考慮P相似于Q的問題上設(shè)有集合P和集合Q,定義P和Q的集合貼近度為:
特別地,若P=Q,則P和Q的集合貼近度達(dá)到最大值1,即P和Q完全貼近。若P≠Q(mào)且P∩Q=Φ,則P和Q的集合貼近度達(dá)到最小值0,即P和Q完全不貼近。由此可見,集合貼近度反映了集合之間的相貼近的程度。并且n越大,表明集合之間越貼近;n越小,表明集合之間越不貼近。
由于貼近度是在距離的基礎(chǔ)上定義出來的,它們之間的聯(lián)系是緊密的,設(shè)S=(U,A)是一個信息系統(tǒng),P,Q 屬于A ,則,這表明,在距離定義和貼近度定義的意義下,集合距離和集合貼近度之間有著嚴(yán)格的互補關(guān)系。n越大,表明集合之間距離越??;D越大,表明集合之間距離越大。反之亦然,n越大,表明集合之間貼近度越大(即越相似);D越大,表明集合之間貼近度越小(即越不相似)。
HSI顏色空間是以人眼的視覺特征為基礎(chǔ),利用三個相對獨立、容易預(yù)測的顏色心理屬性:色度(H ue)、光強度(In tensity)和飽和度(Saturation)來表示顏色,反映了人的視覺系統(tǒng)觀察彩色的格式。色度是由物體反射光線中占優(yōu)勢的波長來決定,不同的波長產(chǎn)生不同的顏色感覺,如紅、橙、黃、綠、青、藍(lán)、紫等。它是彩色最為重要的屬性,是決定顏色本質(zhì)的基本特性。 顏色飽和度是指一個顏色的鮮明程度,飽和度越高,顏色越深,如深紅、深綠等。在物體反射光的組成中,白色光愈少,色飽和度愈大;顏色中的白色或灰色愈多,其飽和度就越小。光強度是指光波作用于感受器所發(fā)生的效應(yīng),其大小是由物體反射系數(shù)來決定,反射系數(shù)越大,物體的光強度愈大,反之愈小,如圖2-1所示。
HSI彩色模型更加容易描述人類眼睛的視覺習(xí)慣,其中H代表色調(diào),表示顏色,與波長有關(guān), 是當(dāng)人眼看一種或多種波長的光時所產(chǎn)生的彩色感覺,它反映顏色的種類,是決定顏色的基本特性,紅色、綠色等都是指色調(diào);S代表飽和度,表示顏色純度,即單色光中滲入白光的程度,對于同一色調(diào)的彩色光,飽和度越高,顏色越鮮明,說明越純。從黑到白整個紡錘體的中心軸,就表示像素的不同灰度。它從明度、色相和飽和度三個視覺心理屬性來描述圖像所反映的顏色信息,在人心理感知上更容易被接受。假設(shè)基色測量已標(biāo)準(zhǔn)化,即,根據(jù)如下公式將RGB顏色模型轉(zhuǎn)換為HSI顏色模型,從而得到了由明度、色相和飽和度所組成的彩色圖像顏色信息。
由顏色感覺空間的幾何模型圖易知,雙錐體水平面的圓周上,各點的位置表示了光譜上各種不同的色相的顏色屬性(紅黃綠青藍(lán)紫),其值分布在H[)之間,人眼能夠感知的顏色其過渡是連續(xù)的,引入粒計算機制對每個像素的色相值進(jìn)行粒度量化,對應(yīng)得到M個關(guān)于顏色的粒度區(qū)間,顏色信息特征可以描述為:H={Red,Yellow,Green,Cyan,Blue,Magenta},其中每一個顏色特征的隸屬度都由圖2-2的三角函數(shù)所示[3]。
人眼能夠感知的顏色其過渡是連續(xù)的,每個像素的顏色其過渡是連續(xù)的,引入粒計算機制對每個像素的色相H ue值進(jìn)行?;?。設(shè)圖庫中所有圖為論域U,每一幅圖像為研究對象,圖像的各屬性值為相應(yīng)知識。在對圖像進(jìn)行分類的過程中,我們沒有必要考慮所有顏色,往往只考慮一部分指定顏色即可以得到較好的分類效果。
根據(jù)圖像得到一系列屬性:a1,a2,…,an。對于圖像x,y。如果圖像x的顏色與y的顏色種類不一致(這是常常發(fā)生的),極端的情況例如x只有一種顏色,但我們已將其離散化為6種(如何表示我們在下面將詳細(xì)討論),對應(yīng)得到六個關(guān)于顏色的區(qū)間,顏色信息特征可以構(gòu)成新的粒集,描述為H ue={Red,Yellow,Green,Cyan,Blue,Magenta},繼而圖像中的像素顏色信息都可以與粒集Hue中的值對應(yīng)。其中每一個顏色特征的隸屬度都由圖3-3函數(shù)所示。
圖像的顏色直方圖反映了像素顏色在所給出圖像中出現(xiàn)的頻率,它可以由向量H表示:H={H[1], H[2],…, H[c],…, H[M],}其中i表示某一種顏色,H[i]表示圖像中顏色i的像素個數(shù),M表示顏色直方圖中顏色種類。
為了便于比較和檢索數(shù)據(jù)庫中不同尺寸的圖像數(shù)據(jù),向量H應(yīng)該進(jìn)行規(guī)格化,使其特征值在0~1之間,一種常用的規(guī)格方法如下,得到規(guī)格化的向量H#:H#={H*[1], H*[2],…, H*[i],…, H*[M] },其中 H*[i]=H[i]/P,P表示了圖像中像素總數(shù)。
按照粒計算的理論,上式中H*[i]反映了顏色i在圖像中出現(xiàn)的概率(粒計算隸屬度),那么規(guī)格化向量H#本身即為一個粒集。特別地,圖像中出現(xiàn)頻率較高的N種顏色可以視為圖像的主色,若定義N種主色在圖像中的隸屬度為1,那么得到規(guī)格化的?;念伾狈綀D向量:表示了圖像中表現(xiàn)為所有顏色的像素點總數(shù),這里=1。
所提取圖像顏色特征,其粒集顏色直方圖將由圖像的顏色信息在圖像中的出現(xiàn)頻率構(gòu)成,按照上述方法,對圖像數(shù)據(jù)庫中的所有圖像,根據(jù)上式可以得到每一幅圖像所對應(yīng)的規(guī)格化的粒的直方圖向量。
假設(shè)給定一幅圖,依據(jù)上面的方法容易構(gòu)建與圖像數(shù)據(jù)庫中圖像對應(yīng)的特征數(shù)據(jù)的粒集,可將黑、紅、黃、綠、青、藍(lán)、紫、白八種顏色的隸屬度進(jìn)行歸一化后構(gòu)成粒集S:
顏色特征集對照表
利用貼近度理論計算得出:
[1]汪培莊.模糊集合論及其應(yīng)用[M].上海:上??茖W(xué)技術(shù)出版社.1983
[2]孫超,韓捷,關(guān)惠玲.模糊集的貼近度及多維綜合貼近度[J].鄭州:河南科學(xué).2004,22(02):143- 166
[3]Y Rui, T S Huang, M Ortega et al.Relevance feedback: a power tool for interactive content-based image retrieval[J]. IEEE Trans on Circuits and Systems for Video Technology,1998
[4]章毓晉.基于內(nèi)容的視覺信息檢索[M].北京:科學(xué)出版社.2003,3-10
[5]徐久成,孫林.基于粒計算貼近度的理論研究.計算機科學(xué)[J]. 2006,33(11A):114-115
10.3969/j.issn.1001-8972.2011.10.070
本文系河南師范大學(xué)青年科學(xué)基金項目《基于貼近度的統(tǒng)計特征模型在圖像檢索中的應(yīng)用》階段性成果
李新磊(1 9 7 8—),男,工程師,碩士,畢業(yè)于鄭州大學(xué)河南省信息網(wǎng)絡(luò)重點實驗室,現(xiàn)就職于河南師范大學(xué)圖書館,研究方向:計算機網(wǎng)絡(luò)。