摘 要:本文針對目前基于單一特征檢索方法存在的不足,提出一種基于多特征融合的圖像檢索方法:首先為了融合圖像的空間信息特征對圖像進行區(qū)域的劃分,然后對各分割區(qū)域提取顏色及形狀特征?;诿褡宸椀念伾卣鞅容^重要,本文在顏色特征還采用了模糊顏色直方圖的方法提取。最后采用相似性度量公式進行檢索。通過實驗表明,采用以上這種三個特征融合的圖像檢索方法,能提高圖像檢索的效率。
關(guān)鍵詞:圖像檢索;顏色直方圖;模糊顏色直方圖;邊緣方向直方圖;少數(shù)民族服飾
DOI:10.16640/j.cnki.37-1222/t.2017.01.254
1 引言
少數(shù)民族服飾的保護與開發(fā)是民族文化傳承與弘揚的重要內(nèi)容之一。關(guān)于少數(shù)民族服飾以研究民族服飾文化和文化差異的居多,但是關(guān)于民族服飾數(shù)字化方向研究較少。
每個民族的服飾都有自己的民族特色。民族服飾有著顯著的視覺特征,很多學者從紋樣、色彩、形狀圖案等美學、文學、藝術(shù)角度對民族服飾進行了深入的研究。 民族服飾紋樣作為一種標識性的符號,反映著非常豐富的文化內(nèi)涵,是一個民族文化藝術(shù)的寶庫,具有非常豐富的審美價值和研究價值。民族服飾中色彩的不同運用,顯示出不同的民族心理、審美習慣和審美追求。不同的民族,其服飾的色彩也有不同的偏好。圖騰作為一個氏族的標志之一,可看做這個民族的獨特標志。綜上所述,紋樣、色彩、形狀圖案等特征對民族服飾辨識和認知的重要性顯而易見[1]。相比普通自然圖像的視覺特征,民族服飾的絢麗色彩、紛紜紋樣和豐富圖案的突出特點,在圖像處理方面顯得更具優(yōu)勢。其主要特征仍然表現(xiàn)在服飾顏色、面料紋理和圖騰形狀上,在此基礎(chǔ)上,將這些底層視覺特征合理映射到服飾的抽象語義,進而利用圖像特征對民族服飾圖像檢索。
2 基于內(nèi)容的圖像檢索相關(guān)技術(shù)
2.1 特征的提取技術(shù)
特征提取是提取能夠表征圖像底層內(nèi)容含義的顏色、紋理、形狀、位置等視覺特征,并抽象為特征數(shù)據(jù)的過程。首先對圖像中所有的像素點進行遍歷,然后用通過一些方法來運算、統(tǒng)計,最后確定像素所屬的特征。
(1)顏色特征:顏色特征是通過圖像或圖像區(qū)域的顏色特征來描述。顏色是人們視覺感知中基礎(chǔ)的部分,同樣也是底層視覺特征一個重要的部分。顏色特征具有對旋轉(zhuǎn)、尺度、平移等變化不敏感的優(yōu)點,具有很好的魯棒性。目前廣泛應用的顏色特征有顏色直方圖、顏色矩、顏色集、顏色聚合向量及顏色相關(guān)圖等方法[2]。本文選擇顏色直方圖和模糊顏色直方圖。
顏色直方圖:其核心思想是在顏色空間中采用一定的量化方法對顏色進行量化,然后統(tǒng)計每一個量化通道在整幅圖像中所占的比重,獲取圖像的顏色組成分布。最常用的顏色空間是RGB顏色空間。具體來說,獲取顏色直方圖的過程:首先將顏色空間RGB三個通道分別量化劃為若干個子顏色區(qū)間(假設(shè)為k個,三個通道就有k^3個),然后把三維的顏色空間轉(zhuǎn)成一維的進行累加,每個顏色區(qū)間對應直方圖中的一個bin。最后統(tǒng)計圖像中所有像素顏色落在每個bin中的個數(shù),從而獲得顏色直方圖。顏色直方圖可用如下一維離散函數(shù)表示:
,x=0,1,...,k^3-1
其中x為直方圖的子區(qū)間,f (X)為落在區(qū)間x中的像素個數(shù),N為圖像中所有像素個數(shù)。
模糊顏色直方圖:在模糊顏色直方圖中,選擇了Lab顏色空間,是因為它是一個近似于人類感知顏色方式的統(tǒng)一顏色空間。在 Lab空間,L代表亮度,a表示相對綠色到紅色的變化范圍,b表示相對的藍色到黃色的變化范圍。a和b組件應該分別分為五個區(qū)域,a代表綠色,淺綠色,中間色,淺紅色和紅色。b 代表藍色,淺藍色,中間色,淺黃色和黃色,而L應該只分為三個區(qū)域:黑暗的、暗淡和明亮的區(qū)域。輸入的模糊性是通過使用三角形狀內(nèi)置的(MF)三個輸入組件(Lab)表示區(qū)域[4]。
應用Mamdani類型的模糊推理,在輸出MFs形成模糊集決定過程是基于輸入MFs的結(jié)果,此影響因素設(shè)置最小,與、或運算分別設(shè)置最大和最小。系統(tǒng)的輸出只有10 維,見圖1所示。所以,最終的模糊直方圖組成只有10個通道[5],大致代表黑色,暗灰色,紅色,棕色,黃色,綠色,藍色,青色,洋紅色的和白色的。
模糊連接三個組件根據(jù)27個模糊規(guī)則產(chǎn)生系統(tǒng)的輸出。規(guī)則通過實證結(jié)論建立。部分規(guī)則如圖2表示。
(2)形狀特征:形狀特征是人們識別物體的關(guān)鍵特征之一,并且具有一定的穩(wěn)定性,對于背景顏色、亮度變化等比較魯棒。形狀一般與圖像中的特定物體聯(lián)系緊密,具有一定的語義信息。形狀特征的好壞一般用獨特性、幾何不變性、完備性、靈活性及抽象性來考察。目前用于圖像檢索的形狀描述方法主要有基于邊緣和基于區(qū)域兩種形狀描述方法[3],本文采用基于邊緣的形狀描述方法。
本文先將圖像的R、G、B三個分量分別與Sobel算子的兩個卷積模板作卷積,可分別獲得三個分量上的橫向梯度和縱向梯度,再根據(jù)梯度計算圖像的邊緣方向。 方便計算,把的取值映射在區(qū)間,并把均勻量化為個梯度方向。然后形狀特征直方圖表示:
是梯度方向的量化級數(shù),是圖像中梯度方向為的像素的個數(shù),是圖像像素的總數(shù)。
2.2 距離公式及檢索評價
(1)在圖像檢索中常用的距離公式: 距離函數(shù),計算的是兩個向量之間的距離,函數(shù)值越大表示兩個向量越不相似[3]。常用的距離公式有:歐式距離、曼哈頓距離、馬氏距離、直方圖相交距離、明可夫斯基距離。本文采用的是改進的曼哈頓距離作為相似性度量方法。
是檢索圖像Q特征的第i維分量,是圖像庫中圖像T特征的第i維分量,n是特征維數(shù)。
(2)檢索評價?,F(xiàn)有的圖像檢索系統(tǒng)的評價函數(shù)主要用查全率和查準率來衡量,前者反映的是系統(tǒng)檢索相關(guān)圖像的能力,后者反映的是系統(tǒng)拒絕不相關(guān)圖像的能力。查準率(precision)是圖像檢索返回的所有結(jié)果中正確的圖片數(shù)占所有返回圖片數(shù)的比重。查全率(recall)是圖像檢索返回的所有結(jié)果中正確的結(jié)果數(shù)占圖像數(shù)據(jù)庫中所有與查詢圖像同一類的圖像數(shù)目的比重。
2.3 本文特征提取的思想路線及步驟
(1)特征提取思想路線。
(2)特征提取步驟。把圖像分成N*N的塊,再計算每一個分塊的顏色直方圖、模糊顏色直方圖和彩色邊緣方向直方圖,最后把這些直方圖進行線性組合,得到最終的直方圖,作為圖像的特征。具體步驟:
①遍歷圖像的所有像素點,并判斷屬于哪個分塊;②求子塊的顏色直方圖;
③求子塊的模糊顏色直方圖;
④求子塊的彩色邊緣方向直方圖;
⑤把所有子塊的顏色直方圖模糊顏色直方圖和邊緣方向直方圖進行線性組合得到圖像的綜合特征:
3 相關(guān)實驗及分析(見表1)
結(jié)果分析:顏色直方圖量化級數(shù)、邊緣方向的量化級數(shù)、分塊的大小都對結(jié)果又影響。顏色直方圖隨著分塊的越來越細化,結(jié)果先升高后降低,說明2*2分塊顏色直方圖效果最好。而模糊直方圖、邊緣方向直方圖隨著分塊的越來越細化,結(jié)果越來越高,但是分塊越多,特征的維數(shù)越大,檢索的時間也會增加。綜上,取2*2分塊,效果最好。
4 小結(jié)
針對民族服飾顏色比較豐富的特點,本文提出了一種融合顏色和形狀特征的圖像檢索方法,先將圖像進行分塊,再提取各子塊的顏色直方圖、模糊顏色直方圖和邊緣方向直方圖進行線性組合,并使用改進的相似性度量公式進行檢索。實驗結(jié)果表明,該方法更適合少數(shù)民族服飾的特點,檢索效果比較好。因為本文中用到的少數(shù)民族服飾圖像背景復雜,并且提取的是底層圖像特征,因此以后將著重研究基于圖像分割、基于區(qū)域和基于語義的圖像檢索方法。
參考文獻:
[1]徐紅梅.民族服飾文化傳承中的圖像記錄研究—以互助土族服飾為例[J].民族藝術(shù)研究,2013(03).
[2]王志瑞,閏彩良.圖像特征提取方法的綜述[J].吉首大學學報,2011,32(05).
[3]楊杰.面向圖像檢索的海量圖像自動聚類方法研究[D].北京交通大學,2015.
[4] Y.Liang, H. Zhai,P.Chavel,Opt.Commun.212(2002)247.
[5]M.Tico,T.Haverinen,P.Kuosmanen,in:Proceedings of the Nordic Sig. Proc. Symposium (NORSIG2000), Kolmarden,Sweden, 2000,157-160.
基金項目:云南省教育廳科學研究基金研究生項目"基于LIRE的民族服飾圖像教育資源檢索研究"(2016YJS047),云南師范大學研究生科研創(chuàng)新基金項目“少數(shù)民族服飾視覺特征抽取算法研究”(YJS201662)
作者簡介:趙偉麗(1989-),女,山西呂梁人,碩士研究生,研究方向:圖像處理。