陳新義
(四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)
人臉識(shí)別技術(shù)是近年來(lái)被廣泛研究的熱點(diǎn)之一?,F(xiàn)階段人臉識(shí)別算法主要分為基于全局特征的人臉識(shí)別算法和基于局部特征的人臉識(shí)別算法,基于局部的圖像特征點(diǎn)的方法對(duì)人臉圖像在形變、旋轉(zhuǎn)、一定程度放射變換等條件下具有比基于全局特征的算法更好的匹配效果,是人臉識(shí)別算法的熱門(mén)發(fā)展趨勢(shì)。David Lowe在1999年提出2004年完善的尺度不變特征轉(zhuǎn)換(Scale Invariant Feature Transform)算法[1](簡(jiǎn)稱SIFT算法)對(duì)發(fā)生旋轉(zhuǎn)、平移、和仿射變換后的圖像有很好的匹配效果。SIFT特征是一種表示物體外觀局部區(qū)域的描述子,具有很強(qiáng)的穩(wěn)定性和魯棒性,與圖像中物體的大小、位置、旋轉(zhuǎn)角度的變化無(wú)關(guān),并且對(duì)噪聲、光照以及微視角等變化的穩(wěn)定性相當(dāng)高,另外,SIFT特征對(duì)于遮擋物體的檢測(cè)和分辨率也相當(dāng)高[2-6]。
SIFT特征點(diǎn)描述子是一個(gè)128維的特征描述向量,也可以看做是一個(gè)特征直方圖。原始的SIFT特征點(diǎn)的匹配策略是使用歐氏距離計(jì)算特征直方圖的匹配程度,設(shè)置一個(gè)閾值作為匹配程度的標(biāo)準(zhǔn),當(dāng)圖像A中待匹配的特征點(diǎn)與圖像B中的最近特征點(diǎn)的比值(最近距離/次最近距離)小于這個(gè)閾值時(shí),認(rèn)為匹配成功,否則不成功。EMD距離[7]是一個(gè)具有感知魯棒性的直方圖距離度量方法,使用EMD距離計(jì)算兩個(gè)特征直方圖間的匹配程度更加準(zhǔn)確,但是EMD距離的計(jì)算時(shí)間復(fù)雜度比較高,運(yùn)行算法時(shí),勢(shì)必會(huì)消耗很多時(shí)間,因此本文引入快速EMD距離[8]對(duì)兩個(gè)特征直方圖的匹配程度進(jìn)行計(jì)算,該改進(jìn)算法在一定程度上提高了在人臉圖像在旋轉(zhuǎn)、放射變換、部分遮擋等復(fù)雜情況下的特征匹配度[9-16]。
EMD(Earth Mover's Distance)距離是由 Yossi Rubner等在2000年提出的,用來(lái)計(jì)算兩個(gè)直方圖之間匹配度的方法。在直方圖匹配度算法中,EMD距離在圖像發(fā)生形變、檢測(cè)器定位誤差等方面與歐氏距離相比,有更好的匹配效果和更強(qiáng)的魯棒性。
在Yossi Rubner的論文中提出了signature的概念,signature的定義如下:
其中,s代表一類特征,m為其中心,w為屬于該類中心的數(shù)量,對(duì)于一維的直方圖,m為直方圖bin的索引,w為該bin的數(shù)量(權(quán)重)。下面介紹EMD距離的計(jì)算方法[7]:
其中,D=[dij]是距離矩陣,dij代表類 pi和qj之間的距離(在均勻的直方圖中,距離可以簡(jiǎn)化為bin的索引的差值得絕對(duì)值)。F={fij}是類間流動(dòng)矩陣,fij代表類 pi和 qj之間流(flow)的數(shù)量。約束(3)-(6)是指,約束(3)限制了P到Q的單向流動(dòng),且流(flow)不能小于0;約束(4)限制了P類供應(yīng)量不能超過(guò)它的數(shù)量,約束(5)限制了Q類接收量不能超過(guò)它們的數(shù)量;約束(6)是指最大程度的移動(dòng)數(shù),也就是總流(flow)的數(shù)量。
經(jīng)過(guò)簡(jiǎn)化,式(6)可簡(jiǎn)化為:
由于EMD距離的計(jì)算復(fù)雜度高,運(yùn)行人臉匹配算法時(shí),勢(shì)必會(huì)消耗很多時(shí)間。因此,本文快速EMD距離來(lái)測(cè)量特征直方圖之間的匹配度。
假設(shè)有P、Q兩個(gè)特征直方圖,P={(p1,wp1),其中 pi為特征點(diǎn)wpi為其權(quán)重,qi為特征點(diǎn)wqi為其權(quán)重(這里假設(shè)n=m=4)。則EMD距離與快速EMD距離對(duì)比如圖1所示。
Ofir Pele等提出的快速EMD距離的計(jì)算方法如下[8]:
若m=n,經(jīng)過(guò)簡(jiǎn)化,式(8)可簡(jiǎn)化為:
圖1 EMD距離和快速EMD比較
EMD距離與快速EMD距離相比,在尋找最佳運(yùn)量時(shí)算法復(fù)雜度從O(n2)級(jí)降低為O(n)級(jí),運(yùn)算速度提升了一個(gè)數(shù)量級(jí)。Ofir Pele和Michacl Werman在論文中證明,在P、Q兩個(gè)直方圖的總量一致時(shí),EMD距離與快速EMD距離是等價(jià)的,在P,Q兩個(gè)直方圖的總量不相等時(shí),快速EMD距離擁有更好的區(qū)分力[8]。下面給出兩個(gè)示例來(lái)說(shuō)明:
1)令 P=(1,0),Q=(0,1),P'=(9,0),Q'=(0,9)。使用 L1范式作為地面距離(ground distance),α=1,對(duì) P、Q 計(jì)算 EMD 距離得:EMD(P,Q)=1、EMD(P',Q')=1,計(jì)算快速EMD距離的:9。顯然,當(dāng)直方圖的總量更為重要時(shí)更具有區(qū)分度。
2)令 P=(1,0),Q=(1,7)。使用 L1范式作為地面距離(ground distance),α=1時(shí),計(jì)算 EMD距離得:EMD(P,Q)=0,而快速 EMD 距離為因此,當(dāng)P、Q總量不等時(shí),快速EMD距離更有區(qū)分度。
本文使用快速EMD距離代替原SIFT算法中使用的歐氏距離來(lái)計(jì)算特征直方圖間的匹配程度。使用快速EMD距離的SIFT特征直方圖匹配策略如下:
令P和Q來(lái)代表任意空間尺度上的兩個(gè)特征點(diǎn)的特征直方圖??梢缘玫剑?/p>
YALE人臉庫(kù)由耶魯大學(xué)計(jì)算視覺(jué)與控制中心創(chuàng)建,包含15位志愿者的165張圖片,每副圖像的大小是243×320像素,包含光照,表情和姿態(tài)的變化,其中的姿態(tài)和光照變化的圖像都是在嚴(yán)格控制的條件下采集的。本文將結(jié)合快速EMD距離的SIFT人臉識(shí)別算法應(yīng)用到Y(jié)ALE人臉庫(kù)中,進(jìn)行實(shí)驗(yàn)驗(yàn)證,并與原SIFT算法進(jìn)行對(duì)比,對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,并展示改進(jìn)后算法在識(shí)別率及魯棒性上的提升。實(shí)驗(yàn)所用的機(jī)器是Intel Core i5 6400 CPU,8G內(nèi)存。仿真程序用MATLAB2012編寫(xiě)。
實(shí)驗(yàn)1本次實(shí)驗(yàn)分為訓(xùn)練組和測(cè)試組,訓(xùn)練組包含4張人臉圖像,作為算法的訓(xùn)練輸入,測(cè)試組包含剩余的7張人臉圖片,作為算法的測(cè)試輸入。對(duì)每一組訓(xùn)練組測(cè)試組測(cè)試6次,取平均值作為最后的識(shí)別率結(jié)果。如表1所示(表中第一行數(shù)據(jù)為原始SIFT算法,命名為SIFT;表中第二行數(shù)據(jù)為改進(jìn)算法命名為FEMD-SIFT)。
由表1可得FEMD-SIFT人臉識(shí)別算法比原始SIFT算法具有更好的識(shí)別效果。說(shuō)明使用快速EMD距離度量?jī)蓚€(gè)特征直方圖間的匹配度,可以有效避免歐氏距離在人臉圖像發(fā)生旋轉(zhuǎn)、放射變換、遮擋時(shí)造成的匹配度下降問(wèn)題,可以在一定程度上提升人臉識(shí)別算法的識(shí)別率。
表1 SIFT人臉識(shí)別算法和結(jié)合快速EMD距離的SIFT人臉識(shí)別算法的識(shí)別率對(duì)比
實(shí)驗(yàn)2將YALE人臉庫(kù)中每個(gè)人的一部分的人臉圖像進(jìn)行噪聲,旋轉(zhuǎn),放射變換以及部分遮擋等操作。將每一個(gè)人的沒(méi)有改變的圖像作為訓(xùn)練組,改變后的圖像作為測(cè)試組,對(duì)每一組訓(xùn)練租測(cè)試組測(cè)試5次,取匹配數(shù)的平均值作為結(jié)果。
圖2展示的是原始SIFT算法與FEMD-SIFT算法對(duì)有遮擋的人臉特征點(diǎn)匹配對(duì)比圖,其中SIFT即表示使用原始SIFT算法的特征點(diǎn)匹配個(gè)數(shù),F(xiàn)EMD-SIFT表示使用FEMD-SIFT算法的特征點(diǎn)匹配個(gè)數(shù)。
由圖2可以看到使用快速EMD距離的FEMDSIFT人臉識(shí)別算法特征點(diǎn)的匹配對(duì)數(shù)相比使用歐氏距離的原始SIFT人臉識(shí)別算法在噪聲、旋轉(zhuǎn)、仿射變換以及遮擋等方面的匹配數(shù)量都有一定的提升,可以得出FEMD-SIFT人臉識(shí)別算法相比原始SIFT人臉識(shí)別算法在人臉圖像發(fā)生仿射變換或遮擋時(shí)具有更好的魯棒性。
圖2 原始SIFT算法與FEMD-SIFT算法特征點(diǎn)匹配對(duì)比圖
本文提出了一種基于SIFT改進(jìn)的人臉識(shí)別算法,通過(guò)使用快速EMD距離而不是歐氏距離計(jì)算人臉圖像特征直方圖間的匹配度。實(shí)驗(yàn)表明,改進(jìn)的人臉識(shí)別算法比原有算法具有更高的識(shí)別率及對(duì)人臉圖像在旋轉(zhuǎn)、放射變換以及遮擋等方面有更好的魯棒性。但算法使用128維SIFT描述子,計(jì)算的復(fù)雜度仍較大,下一步可以考慮對(duì)SIFT描述子進(jìn)行降維處理。
參考文獻(xiàn):
[1]David G Lowe.Distinctive Image Features from Scale-invariant Keypoints.IEEE International Journal of Computer,vol 60:91-110,2004.
[2]Jun Luo,Yong Ma,Erina Takikawa,Shihong Lao,Masato Kawade,Bao-Liang Lu.Person-Specific SIFT Features for Face Recognition,ICASSP,2007.
[3]Ke Y,Sukthankar R.PCA-SIFT:A More Distinctive Representation for Local Image Descriptors.Proceedings of the 2004 IEEE Computer Society Conference on IEEE,vol.2,2004:506-513.
[4]Z.Zhou,S.Cheng and Z.Li,MDS-SIFT:An Improved SIFT Matching Algorithm Based on MDS Dimensionality Reduction,2016 3rd International Conference on Systems and Informatics(ICSAI),Shanghai,2016:896-900.
[5]X.Zhou,K.Wang and J.Fu.A Method of SIFT Simplifying and Matching Algorithm Improvement,2016 International Conference on Industrial Informatics-Computing Technology,Intelligent Technology,Industrial Information Integration(ICIICII),Wuhan,2016:73-77.
[6]W.Hu,W.Zhou and J.Guan.A Modified M-SIFT Algorithm for Matching Images with Different Viewing Angle,2016 IEEE International Conference on Signal and Image Processing(ICSIP),Beijing,2016:247-250.
[7]Yossi Rubner,Carlo Tomasi,Leonidas J.Guibas.The Earth Mover's Distance as a Metric for Image Retrieval,vol 40,2000:99-121.
[8]Ofir Pele,Michael Werman.Fast and Robust Earth Mover's Distances.2009 IEEE 12th International Conference on Computer Vision,2009:460-467.
[9]O.Pele,M.Werman.Robust Real Time Pattern Matching Using Bayesian Sequential Hypothesis Testing.PAMI,2008.
[10]O.Pele,M.Werman.A Linear Time Histogram Metric For Improved Sift Matching.In ECCV,2008.
[11]Shungang Hua1,Guopeng Chen,Honglei Wei,Qiuxin Jiang.Similarity Measure for Image Resizing Using SIFT Feature,EURASIP Journal on Image and Video Processing,2012:1687-5281.
[12]Dong Xu,Tat-Jen Cham,Shuicheng Yan,Shih-Fu Chang.Near Duplicate Image Identification with Spatially Aligned Pyramid Matching.IEEE Transactions on Circuits And Systems for Video Technology,Vol.20,NO.8,August 2010.
[13]Cong Geng,Xudong Jiang.Face Recognition Using Sift Features.Image Processing(ICIP),2009,10.1109/ICIP.2009.5413956.
[14]Cheng-yuan Tang,Yi-leh Wu,Maw-kae Hor,Wen-hung Wang,Modified Sift Descriptor for Image Matching Under Interference,Proceedings of the Seventh International Conference on Machine Learning and Cybernetics,Kunming,12-15 July 2008.
[15]Fan Wang and Leonidas J.Guibas,Supervised Earth Mover's Distance Learning and Its Computer Vision Applications,in ECCV 2012,Part I,LNCS 7572,2012:442-455
[16]J.Gudmundsson,O.Klein,C.Knauer,M.Smid.Small Manhattan Networks and Algorithmic Applications for the Earth Movers Distance.In EWCG,2007.
[17]http://cvc.cs.yale.edu/cvc/projects/yalefaces/yalefaces.html.