姜興瓊+楊德強(qiáng)
摘要:少數(shù)民族服飾圖像識(shí)別有助于人們了解、認(rèn)識(shí)、弘揚(yáng)和傳承民族文化。以少數(shù)民族服飾圖像為研究對(duì)象,完成了圖像增強(qiáng),閾值分割,利用PCA方法提取少數(shù)民族服飾圖像主成分特征,按照歐式距離取最小的原則得出圖像的匹配度,實(shí)現(xiàn)了民族服飾圖像的識(shí)別。實(shí)驗(yàn)結(jié)果表明,該算法平均正確識(shí)別率為64%左右。
關(guān)鍵詞:閾值分割;圖像增強(qiáng);PCA;少數(shù)民族服飾識(shí)別
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)29-0195-04
Abstract: Ethnic minoritiescostumes image recognition helps people to know andunderstand the national culture, contributes to carry forward and inherit the national culture. In this paper, Based on ethnic minoritiescostumes image, this papercompletes the image enhancement, threshold segmentation, and employs PCA method to extract minority clothing image principal component characteristics, then obtains the matching degree of the imageaccording to the principle of minimum among the Euclidean Distance, implements the national costumes image recognition.The experimental results show that the algorithm has an average correct recognition rate about 64%.
Keywords:Threshold segmentation; Image enhancement; PCA; ethnic minorities costumesrecognition
1 概述
快節(jié)奏的現(xiàn)代生活,使得傳統(tǒng)的少數(shù)民族服飾面臨消失的危機(jī),少數(shù)民族服飾文化的數(shù)字化保護(hù)和傳承已經(jīng)刻不容緩。隨著科技的發(fā)展,已有一些先進(jìn)技術(shù)手段被用于少數(shù)民族服飾文化的保護(hù)與傳承[1]。龔成清提出了一種基于圖片內(nèi)容的感知哈希算法,將圖片唯一地映射為一段數(shù)字摘要,即對(duì)每張圖片生成一個(gè)“指紋”(fingerprint)字符串,然后比較不同圖片的指紋,比對(duì)的結(jié)果越接近,就說(shuō)明圖片越相似[2];詹曙,王俊,楊福猛,方琪為了克服圖像識(shí)別中光照,姿態(tài)等變化帶來(lái)的識(shí)別困難,同時(shí)提高稀疏表示圖像識(shí)別的魯棒性,提出了一種基于Gabor特征和字典學(xué)習(xí)的高斯混合稀疏表示圖像識(shí)別算法[3];陳微微提出基于分塊的不規(guī)則圖形相似比較的圖像匹配算法[4];Szummer和Picard主要研究室內(nèi)和室外圖像的分類,在基于Ohta顏色空間中的顏色直方圖的信息的基礎(chǔ)上,利用K-近鄰分類器對(duì)圖像進(jìn)行分類[5]等。
本文針對(duì)少數(shù)民族服飾圖像,通過(guò)一系列的圖像預(yù)處理后,利用PCA獲取服飾圖像的PCA特征,按照歐式距離取最小的原則進(jìn)行圖像識(shí)別。
2 算法的整體結(jié)構(gòu)設(shè)計(jì)
整個(gè)算法主要由圖像預(yù)處理、提取特征與圖像識(shí)別等兩個(gè)模塊組成,其算法整體結(jié)構(gòu)如圖1所示。
圖像預(yù)處理部分由圖像灰度化、圖像增強(qiáng)、閾值分割三個(gè)部分組成,利用加權(quán)平均法將彩色圖像轉(zhuǎn)換為灰度圖像,運(yùn)用直方圖規(guī)定化擴(kuò)展圖像灰度值的動(dòng)態(tài)范圍,達(dá)到增強(qiáng)圖像整體對(duì)比度,使圖像的細(xì)節(jié)更清晰;使用迭代法確定閾值后,進(jìn)行圖像分割將圖片中的目標(biāo)與背景分割。
提取特征與圖像識(shí)別模塊由提取PCA特征、建立分類器、圖像識(shí)別三個(gè)部分組成,主要完成利用PCA提取閾值分割所得到的目標(biāo)的PCA特征,運(yùn)用歐式距離建立分類器,并將PCA特征作為輸入量輸入分類器,對(duì)圖像進(jìn)行識(shí)別,并輸出識(shí)別的結(jié)果。
3 圖像預(yù)處理
由于圖像容易受到圖像自身和外界因素的影響,需要進(jìn)行圖像預(yù)處理,優(yōu)化圖像,減少計(jì)算量,保留有用的信息,盡量減少無(wú)用的信息。預(yù)處理主要包括圖像增強(qiáng)、閾值分割。本文利用加權(quán)平均法把彩色圖像轉(zhuǎn)化為灰度化圖像,如圖2。
圖像增強(qiáng)部分完成了直方圖均衡化和直方圖規(guī)范化,如圖3和圖4。
圖像分割有助于圖像識(shí)別,圖像分割質(zhì)量的好壞直接影響后續(xù)圖像處理的效果。閾值分割的基本思路是圖像中前景區(qū)域即所提取的目標(biāo)和背景區(qū)域?qū)儆趦蓚€(gè)不同的灰度集合,這兩個(gè)灰度集合可以使用一個(gè)屬于灰度級(jí)的閾值T進(jìn)行分割,使圖像分割為前景區(qū)域和背景區(qū)域。
迭代法基于逼近的思想,首先選擇一個(gè)近似閾值T,將圖像分割成兩部分和,計(jì)算區(qū)域和的均值和,選擇新的分割閾值,重復(fù)上述步驟直到和不再變化為止。本文分割結(jié)果如圖5。
4 提取特征和圖像識(shí)別
提取特征是圖像識(shí)別的關(guān)鍵組成部分,提取特征的目的是為了盡可能地保留圖像信息,以達(dá)到有效識(shí)別;特征提取的好與壞直接關(guān)系著圖像識(shí)別的結(jié)果。本文采用了基于主成分分析PCA(Principal Components Analysis)來(lái)實(shí)現(xiàn)少數(shù)民族服飾圖像的識(shí)別。
4.1PCA理論基礎(chǔ)
主成分分析PCA(Principal Components Analysis)廣泛地被應(yīng)用在模式識(shí)別與數(shù)據(jù)壓縮,其主要優(yōu)點(diǎn)是對(duì)數(shù)據(jù)進(jìn)行降維和去除冗余,其方法是利用樣本的協(xié)方差矩陣進(jìn)行特征分解,將其協(xié)方差矩陣的特征向量和特征值求出來(lái),并找出其較大的幾個(gè)特征值對(duì)應(yīng)的特征向量作為所分析數(shù)據(jù)的主成分即PCA特征表示原數(shù)據(jù),從而達(dá)到降維和去冗余的目的[6][7]。endprint
如果一個(gè)數(shù)據(jù)是n維矢量向量,記作,則向量X的協(xié)方差矩陣可以表示為:
其中對(duì)稱矩陣,利用正交矩陣Q對(duì)數(shù)據(jù)做正交變換得
其中,Y的各分量之間互不相關(guān),克服了原數(shù)據(jù)向量間的相關(guān)性,去除了只帶有少量信息的數(shù)據(jù),保留了能體現(xiàn)原數(shù)據(jù)的總體趨勢(shì)的信息,以較少數(shù)量的主要特征描述原數(shù)據(jù)向量,達(dá)到降低維數(shù)的目的。具體流程如下:
假設(shè)有m個(gè)待處理的數(shù)據(jù),令矩陣X用共n個(gè)數(shù)據(jù)表示,那么表示一個(gè)待處理的數(shù)據(jù)集。其中,。
(4) 排序。降序排列特征值,將特征值按從大到小的順序排列,其對(duì)應(yīng)的特征向量也從大到小的順序排列。
(5) 計(jì)算總能量并選取其中的較大值。若為S的對(duì)角陣,那么總能量為對(duì)角線所有特征值之和S。由于在(4)里面已對(duì)V進(jìn)行了重新排序,所以當(dāng)前幾個(gè)特征值之和大于等于S的90%時(shí),可以認(rèn)為這幾個(gè)特征值可以用來(lái)"表征"當(dāng)前矩陣,假設(shè)這樣的特征值有L個(gè)。
(6) 計(jì)算基向量矩陣W。實(shí)際上,W是V矩陣的前L列,所以W的大小就是。
(7) 計(jì)算z-分?jǐn)?shù)
(8) 計(jì)算降維后的新樣本矩陣
其中,表示W(wǎng)的轉(zhuǎn)置的共軛矩陣,大小為, 而Z的大小為 , 所以Y的大小為, 即降維為n個(gè) L 維向量。
4.2 基于PCA的少數(shù)民族服飾識(shí)別
基于PCA的圖像識(shí)別方法首先是要將樣本圖像轉(zhuǎn)換成一個(gè)特征向量集,是樣本圖像的基本組件的集合,投影到特征表達(dá)空間即PCA子空間;然后把待識(shí)別圖像提取的PCA特征投影到特征表達(dá)空間,通過(guò)計(jì)算它的投影點(diǎn)在特征表達(dá)空間里與樣本圖像PCA特征的歐式距離,按照歐式距離取最小的原則來(lái)進(jìn)行識(shí)別。算法描述如下:
(1) 獲取圖像庫(kù)中被預(yù)處理優(yōu)化過(guò)的服飾圖像集合T。設(shè)圖像庫(kù)中有N幅民族服飾圖像,進(jìn)行圖像預(yù)處理后得到N個(gè)樣本圖像,每一個(gè)樣本由其像素灰度值組成一個(gè)向量,則樣本圖像的像素點(diǎn)數(shù)即為的維數(shù),由向量構(gòu)成了N維的樣本向量集,大小為。
(2) 根據(jù)公式(20)計(jì)算樣本向量集T的平均向量u,得到均值圖像.
(3) 根據(jù)公式(21)計(jì)算每一張圖像與均值圖像的差值x,即用T集合里的每一個(gè)元素減去(2)中所得的u,將樣本圖像中心化。
(4) 根據(jù)公式(22)計(jì)算協(xié)方差矩陣S。
(5) 求出協(xié)方差矩陣S的特征向量和特征值。
(6) 降序排列特征值以及與其對(duì)應(yīng)的特征向量。
(7) 根據(jù)公式(28)計(jì)算出累計(jì)貢獻(xiàn)率,然后根據(jù)累計(jì)貢獻(xiàn)率從(6)中的特征向量中選出k個(gè)特征值對(duì)應(yīng)的特征向量組成主成分
(8) 識(shí)別服飾,將得到的所有樣本的PCA特征投影到PCA子空間,把待識(shí)別的圖像進(jìn)行優(yōu)化之后提取PCA特征投影到PCA子空間,根據(jù)公式(14),找到某個(gè)樣本PCA特征投影后的向量和待識(shí)別的圖像投影后的向量距離最近的,即待識(shí)別服飾圖像屬于該樣本所屬的民族。
4.3 最近鄰法分類器歐式距離
當(dāng)PCA子空間中被投影了待識(shí)別少數(shù)民族服飾圖像的PCA特征后,一般是通過(guò)計(jì)算出其與特征表達(dá)空間中服飾圖像之間的距離,選擇距離最短的,即屬于該類。而在此選用了歐式距離:
其中,x表示待識(shí)別的服飾圖像的PCA特征,y表示樣本集內(nèi)的某一個(gè)民族的服飾圖像的PCA特征。
5 實(shí)驗(yàn)結(jié)果
本次設(shè)計(jì)是基于PCA的基礎(chǔ)上,通過(guò)識(shí)別進(jìn)行優(yōu)化過(guò)的少數(shù)民族服飾圖像,識(shí)別出民族。本實(shí)驗(yàn)MATLAB編程,圖像庫(kù)中一共有100幅圖像,共有5個(gè)民族,每一個(gè)民族的服飾圖像有20幅。測(cè)試時(shí)每一個(gè)民族選取了10幅服飾圖像進(jìn)行,該算法的實(shí)驗(yàn)結(jié)果如表1所示。
實(shí)驗(yàn)結(jié)果證明該算法的平均正確識(shí)別率為64%,該算法具有一定的可行性與正確性,其中,對(duì)布依族服飾圖像的正確識(shí)別率達(dá)到了80%,哈尼族的68%,苗族的58%,佤族的56%,最后是白族的54%。布依族的正確識(shí)別率如此高,是由于該族的服飾邊緣線條特別明顯,與其他族的服飾差異很大。下面是對(duì)每一個(gè)民族的服飾圖像錯(cuò)誤識(shí)別情況統(tǒng)計(jì)。
從表2可以看出,白族的服飾圖像有28%被錯(cuò)誤識(shí)別為哈尼族,識(shí)別為佤族和布依族的都為8%,2%識(shí)別為苗族。被識(shí)別為苗族、布依族、佤族服飾圖片是主要由于待識(shí)別的服飾圖像的背景太過(guò)復(fù)雜,閾值分割效果不佳,且本文沒(méi)有考慮光照對(duì)圖像的影響;而被錯(cuò)誤識(shí)別為哈尼族更多的原因是由于圖像庫(kù)中白族樣本圖像數(shù)量少,提取的特征不夠典型。
表3中,哈尼族的服飾圖像有22%被錯(cuò)誤識(shí)別為布依族。圖像庫(kù)中哈尼族服飾圖像有20幅,其中13幅為半身服飾圖像,只有7幅是完整的服飾圖像。
表4中,佤族的服飾圖像有16%被錯(cuò)誤識(shí)別為哈尼族,錯(cuò)誤識(shí)別為白族和布依族的都為13%。圖像庫(kù)中佤族樣本圖像有20幅,其中11幅圖像是多人的,只有9幅是單人圖像,提取的PCA特征不夠典型,不能夠?qū)⒇糇宸棃D像的特征很好的表征。
表5中,布依族的服飾圖像有12%被錯(cuò)誤識(shí)別為哈尼族。圖像庫(kù)中布依族樣本圖像有20幅,其中6幅圖像的背景很復(fù)雜,閾值分割效果不佳,且布依族服飾從外觀、線條上跟其他四個(gè)民族有很大的差別。
表6中,苗族的服飾圖像有26%被錯(cuò)誤識(shí)別為布依族,錯(cuò)誤識(shí)別哈尼族為8%,為白族和布依族的都為4%。圖像庫(kù)中苗族樣本圖像有20幅,其中7幅圖像是多人的,還有10幅是半身服飾圖像,提取的PCA特征不夠典型,不能夠?qū)⒚缱宸棃D像的特征很好的表征。
6 總結(jié)
本文通過(guò)實(shí)驗(yàn)對(duì)比分析直方圖均衡化與直方圖規(guī)定化的圖像增強(qiáng)效果,結(jié)合少數(shù)民族服飾圖像的特點(diǎn),采用直方圖規(guī)定化增強(qiáng)少數(shù)民族服飾圖像,該算法可拉伸灰度范圍,增加目標(biāo)圖像的對(duì)比度;運(yùn)用雙峰法、迭代法、OTSU法進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)現(xiàn)前景與背景分離;采用最近鄰法分類器,把通過(guò)PCA提取的PCA特征作為輸入向量,實(shí)現(xiàn)圖像識(shí)別,本文算法的平均正確識(shí)別率為64%,仍然還有很多工作需要進(jìn)一步完善。
參考文獻(xiàn):
[1] 彭生瓊,郭飛,詹炳宏,沈蓓.少數(shù)民族服飾特色資源庫(kù)構(gòu)建技術(shù)研究[J].制造業(yè)自動(dòng)化.2015,37(4):44-47.
[2] 龔成清.基于Java的相似圖片搜索[J].電腦開(kāi)發(fā)與應(yīng)用.2012,25(10):13-15.
[3] 詹曙,王俊,楊福猛,方琪.基于Gabor特征和字典學(xué)習(xí)的高斯混合稀疏表示圖像識(shí)別[J].電子學(xué)報(bào),2015,43(3):523-528.
[4] 陳微微.基于顏色特征提取的圖像搜索引擎研究[D].重慶:重慶理工大學(xué),2012.
[5] Szummer M.,Picard R.,Indoor-Outdoor Image Classification,IEEE International Workshopon Content-Based Access of Image and Video Databases CAIVD98[J],Bombay,India,1998:42-51.
[6] Weng.JJ.,1996.Crescepton and SHOSLIF:towardscompre-hensive visual learning. In:Nayar,,S.K.,Poggio.T.(Eds.)Early Visual Learning.Oxford University Press,pp. 183-214.
[7] 杜洪,夏欣,琚生根,王能.基于PCA圖像壓縮算法研究與實(shí)現(xiàn)[J].四川大學(xué)學(xué)報(bào):自然科學(xué)版.2014,51(5):910-914.endprint