【摘 要】隨著生物識別技術(shù)的不斷發(fā)展,人臉識別技術(shù)越來越受到人們的青睞。作為模式識別領(lǐng)域里最具有挑戰(zhàn)性的課題之一,它有著非常廣泛的應(yīng)用前景。在人臉識別系統(tǒng)中,比較受關(guān)注的是特征提取和識別這兩個環(huán)節(jié)。由于實際應(yīng)用中,人臉識別總是受到光照、姿態(tài)、表情等因素的影響,為此,大量解決這些問題的方法應(yīng)運而生。本文先是對人臉識別技術(shù)做了簡要的概括,接著對比較流行的人臉識別方法進(jìn)行了研究,并歸納了常用人臉數(shù)據(jù)庫,最后對文獻(xiàn)中識別方法存在的問題進(jìn)行了總結(jié)。
【關(guān)鍵詞】人臉識別 特征提取 核方法 模型 視頻信息 三維數(shù)據(jù)
一、引言
社會的快速發(fā)展以及科學(xué)技術(shù)的飛速進(jìn)步,使得人們對于安全性的問題越來越重視,尤其是身份驗證功能的需求,因而生物識別技術(shù)作為一項具有挑戰(zhàn)性的問題獲得了較多的關(guān)注并有了極大的發(fā)展。其中人臉在區(qū)分人與人之間的差別起著重要的作用,與其他生物特征(如掌紋、虹膜和指紋等)相比,其優(yōu)勢在于交互性強(qiáng)、采集方便、無需接觸設(shè)備等,從而適合于刑偵破案、各種證件驗證、安檢和考勤等領(lǐng)域的應(yīng)用。通常一個完整的人臉識別系統(tǒng)可由以下幾個模塊構(gòu)成:人臉圖像采集、圖像預(yù)處理、人臉定位檢測、人臉特征獲取、人臉分類識別。其處理數(shù)據(jù)的過程如圖1所示[1]。在本文里,主要研究有關(guān)特征提取模塊和分類識別模塊的方法。
人臉識別是個越來越具有挑戰(zhàn)性的問題。迄今為止在所有的情況下和不同應(yīng)用中,沒有一種方法是非常魯棒的。通常地,人臉識別系統(tǒng)所使用的訓(xùn)練數(shù)據(jù)都是個人的正面圖像,在識別時,其精度要比其他角度準(zhǔn)的多。當(dāng)系統(tǒng)利用正面圖像訓(xùn)練出的數(shù)據(jù)去識別一幅旋轉(zhuǎn)的人臉圖像時就會出現(xiàn)問題。而且,如果照明條件和面部表情發(fā)生變化,人臉的顯示也將徹底的改變。因此,當(dāng)前大多數(shù)的人臉識別方法主要是針對這三大挑戰(zhàn)----光照、表情和姿勢的變化。在人臉識別系統(tǒng)中這三個中的任何一個問題的存在都會導(dǎo)致性能的嚴(yán)重下降。這三者可以徹底改變一個物體的外觀,因而加大了識別的難度。
二、人臉識別方法
人臉識別是模式識別領(lǐng)域里一個重要的應(yīng)用方向,因此模式識別領(lǐng)域里所涉及方法的發(fā)展在人臉識別方向里有著極其重要的地位。在初級階段里,線性方法是處理分類的有力工具。利用線性方法對一個樣本抽取特征時,只需將該樣本投影到訓(xùn)練階段得到的一個確定的變換矩陣(一組變換向量)上即可。但線性方法有其自身的局限性,無法解決例如像異或這樣簡單的問題,而且它不能很好的描述例如人臉圖像等數(shù)據(jù)的分布。為此,非線性方法的出現(xiàn)是勢在必得的。在識別領(lǐng)域的應(yīng)用里,神經(jīng)網(wǎng)絡(luò)研究的發(fā)展成就了非線性方法在該領(lǐng)域的地位,因為在現(xiàn)實世界里存在著大量的如人臉圖像數(shù)據(jù)分布這樣的非線性可分問題,所以利用非線性技術(shù)就可以將這些問題轉(zhuǎn)化為線性可分問題,從而令這些問題的分類變得容易。
在人臉識別研究里,影響人臉識別的因素可以劃分為內(nèi)因子(影響識別的本質(zhì)性的因素)和外因子(影響識別的外部因素,包括表情、姿勢、光照等)[2]。在對人臉圖像進(jìn)行歸類的前期,研究者們主要是考慮解決內(nèi)因子即理想狀態(tài)下的方法。然而,在現(xiàn)實生活里,人臉的外因子對特征提取和識別這兩個過程的影響來說是比較大的。為了解決這些問題,相繼出現(xiàn)了不同類型的方法,如基于核技術(shù)、模型、視頻信息和3D數(shù)據(jù)相關(guān)的方法,它們的引入使得人臉識別算法日益趨向成熟。
(一)基于核方法的人臉識別
20世紀(jì)90年代,核方法的興起是模式識別的一場技術(shù)革命[3]。核方法繼承了非線性方法優(yōu)點,其優(yōu)勢在于能夠?qū)⒃紨?shù)據(jù)映射到高維空間里,并允許使用線性方法來分析和解決問題,同時也有效地避免了\"維數(shù)災(zāi)難\"。
核方法有兩個優(yōu)勢:一是它在線性與非線性間架起了一座橋梁,即通過核空間的線性模型來解決非線性問題;二是引入核函數(shù)后借助于核技巧,可以省去復(fù)雜的高維非線性映射。其中在使用核方法降低復(fù)雜度方面,因基于線性方法的使用不能很好地提取有效的非線性人臉特征,不能準(zhǔn)確的描述人臉的非線性信息,文獻(xiàn)[4]給出了一種基于核空間鑒別矢量集的人臉識別方法。 該方法算法簡單,實現(xiàn)起來比較容易,其不僅減少了計算量,也能使數(shù)值的表現(xiàn)比較穩(wěn)定。在識別人臉的過程中,當(dāng)數(shù)據(jù)庫添加新的樣本時,系統(tǒng)能夠更新NKDA鑒別矢量集。然而盡管核技術(shù)的使用可以挖掘圖像中高階的非線性特征,但是在人臉姿態(tài)方面,算法所能識別的旋轉(zhuǎn)角度卻是有限的。
運用核方法在人臉識別上也可以解決外在因素給人臉帶來的影響。文獻(xiàn)[5]在核方法和正交基向量的引入后,使得新的UDP算法在人臉識別中,有了很好的改善,尤其是在光照、姿態(tài)和表情方面,對比原始的UDP算法有了較好的識別效果。在使用核方法的基礎(chǔ)上,引進(jìn)核正交基向量是為了能更好地提取人臉非線性結(jié)構(gòu)特征,因為它可以更好地保留度量結(jié)構(gòu)與非線性子流形空間這二者的相關(guān)信息,從而在能達(dá)到降維效果和保持拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上提高識別率。然而該文獻(xiàn)面臨的問題是如何對核函數(shù)及其對應(yīng)參數(shù)進(jìn)行選擇才能更好的提高系統(tǒng)對人臉的識別能力。同樣,文獻(xiàn)[6]里也因為核函數(shù)不能自適應(yīng)的選取而制約了算法的有效性。
盡管核方法的出現(xiàn)體現(xiàn)了其較普通非線性方法更優(yōu)越一些,但在投入到實際應(yīng)用中卻也有其無法規(guī)避的弊端,基于核方法的特征提取效率會隨著訓(xùn)練樣本集的增大而下降,因為利用其進(jìn)行特征提取時,需要計算這個樣本與其他樣本之間的核函數(shù),無疑增加了算法的復(fù)雜度,但是想要提高核技術(shù)的性能又必須依靠大量數(shù)據(jù)訓(xùn)練,這就影響了核方法的實用性。
(二)基于模型的人臉識別
基于模型的方法一直是模式識別中比較受關(guān)注且比較有效的一種,尤其是對有規(guī)律可循的變化而言。而在人臉識別中較受歡迎的是基于概率模型的使用。表情和姿態(tài)的變化對識別結(jié)果的影響是很大的,為此文獻(xiàn)[7]給出了基于SIFT特征的貝葉斯模型算法。作者在提取人臉特征時,采用了尺度不變的sift算子,并在人臉的每個子區(qū)域上進(jìn)行相似性度量,且每個子區(qū)域都有自己的識別范圍和概率權(quán)值,最后根據(jù)貝葉斯模型給出識別后的結(jié)果。針對原有的SIFT特征提取算法來說,該文獻(xiàn)給出的算法在表情和姿態(tài)的影響方面表現(xiàn)的更為魯棒。然而針對姿態(tài)和表情變化過大等極端情況時,該方法就顯得不那么有效了。
人臉特征提取在人臉識別中的地位是至關(guān)重要的,它的優(yōu)劣直接決定結(jié)果分類,且很多時候提取出來的數(shù)據(jù)維數(shù)很高,這大大限制了分類時間,同時也限制了快速投入實際應(yīng)用的腳步。文獻(xiàn)[8]給出了一個基于AAM模型和RS—SVM的識別算法,主要解決了提取特征時出現(xiàn)高維數(shù)據(jù)帶來的復(fù)雜運算(以識別率不受影響為前提)。同是針對姿態(tài)和光照變化,文獻(xiàn)[9]利用隱馬爾可夫模型在外界變化的條件下給每個人臉構(gòu)建獨立的模型,這樣在初始條件下光照和人臉姿態(tài)的信息就被納入進(jìn)去,從而將在識別時需要補償光照和校正姿態(tài)的過程轉(zhuǎn)化到了數(shù)據(jù)訓(xùn)練過程里。在提取人臉特征時,作者提出可以使用小波變換,PCA,ICA等常用的方法來產(chǎn)生虛擬樣本。該文獻(xiàn)所提出的算法能夠節(jié)省識別時間,但是卻局限于其單樣本的設(shè)置,因為在配準(zhǔn)時,人工的干涉有較大程度的影響。此外隱馬爾可夫模型所涉及到的參數(shù)較多,因此優(yōu)化HMM也是提高識別效率必須要考慮的因素,這樣才能更有效地投入到現(xiàn)實的使用。鑒于HMM的有效性,多數(shù)學(xué)者偏于在此基礎(chǔ)上創(chuàng)造和延伸算法。在追求優(yōu)越算法的同時,也有作者重視算法后處理的研究和分析。文獻(xiàn)[10]中提到因為人臉的姿態(tài)和光照的改變使得人臉識別的難度加大,所以對其有效的評估以及利用對連續(xù)的視頻序列和人臉庫的分析可以解決“數(shù)據(jù)源災(zāi)難”帶來的一些問題,從而使得識別算法更魯棒。由于訓(xùn)練HMM需要花費時間,因此該文獻(xiàn)作者為了提高算法效率,還給人臉圖像劃分了有效范圍。
在人臉特征提取中引入了模型的相關(guān)算法,使得人臉識別的效果有著明顯的改善,因此基于模型的人臉識別算法在人臉識別領(lǐng)域里有著不可忽視的地位,但是基于模型的識別算法都不可避免地會遇到模型參數(shù)的設(shè)置和如何優(yōu)化模型等相關(guān)問題,這些將直接影響識別的效率。
(三)基于視頻的人臉識別
近些年,通過視頻提供的人臉圖像來進(jìn)行人臉識別發(fā)展的比較活躍,因為視頻所提供的數(shù)據(jù)能夠包含時間和空間上這兩個方面的信息,并且還會產(chǎn)生序列,這為結(jié)合概率等模型來解決識別問題提供了有力的幫助。在諸多基于視頻解決人臉分類的參考文獻(xiàn)中,有如下幾種對人臉描述的方式[11],如圖2-圖6所示。
[12]的算法特點是將HIS顏色空間的獨特優(yōu)勢與快速離散Curvelet變換相結(jié)合,從而克服了直接使用快速離散Curvelet不能全部提取圖像特征的弊端。作者在實驗中與應(yīng)用HMM來識別人臉的算法相對比(實驗數(shù)據(jù)是較短的視頻),結(jié)果表明效果要優(yōu)于使用HMM算法,因為HMM需要大量訓(xùn)練才能得到好的結(jié)果。該文獻(xiàn)算法的優(yōu)勢在于識別速度快,正確率高,但識別系統(tǒng)所能識別的圖像是比較理想化的正面人臉圖像。
光照的影響對人臉識別來說始終是尚待良好解決的問題。文獻(xiàn)[13]主要針對光照變化提出了新的方法。在算法過程中,采用直方圖序列來重建人臉,而“積極地”利用降噪的方式來自適應(yīng)不同角度的光照影響。在識別過程中所采用的分類方式是對編碼后的直方圖進(jìn)行鄰域歸類,得到了較好的識別效果,然而作者卻并沒有將視頻序列提供的上下文信息這一特殊的優(yōu)勢利用起來,此外,算法對圖像分析的效率也較低。
除了光照之外,表情,姿態(tài)也是研究者著力解決的問題。由于視頻信息量比較豐富,即能提供時間上的同時也能提供空間上的信息,文獻(xiàn)[14]的作者設(shè)計了一個識別模塊和一個跟蹤模塊,并將二者結(jié)合在一起運用在人臉識別里,解決了出現(xiàn)側(cè)臉的人臉圖像,這在一定程度上克服了人臉姿態(tài)發(fā)生角度偏轉(zhuǎn)的情況,但該系統(tǒng)不能同時識別多張人臉圖像,這將成為該文獻(xiàn)作者進(jìn)一步研究的問題。
(四)基于三維數(shù)據(jù)的人臉識別
姿勢和照明在所有識別困難中是最主要的因素,這降低了二維人臉識別率。為了克服這兩個困難,一些研究者開始從三維的角度著手進(jìn)行探索。使用3D數(shù)據(jù)最主要的優(yōu)點是它的深度信息不是依靠姿勢和照明,因此人臉的表示不會隨著參數(shù)改變而改變,使得整個識別系統(tǒng)更加魯棒。盡管如此,大多數(shù)3D人臉識別方法主要反饋回來的是他們需要系統(tǒng)中所有的元素需要很好的校正和同步,以此來獲取精準(zhǔn)的3D數(shù)據(jù)(紋理和深度圖)。在基于3D數(shù)據(jù)人臉?biāo)惴ㄖ卸鄶?shù)是圍繞空間幾何特征展開的。
因人臉結(jié)構(gòu)是有規(guī)律可循的,文獻(xiàn)[15]的作者在算法中利用到了五官之間的測地距離,統(tǒng)計人臉幾何特征。在該文獻(xiàn)的算法中,統(tǒng)計了局部特征(不依靠坐標(biāo))的同時又兼顧了整體輪廓,然后通過一種融合方式將局部信息和全局信息結(jié)合起來,從而為輸入的人臉分類提供了可靠的依據(jù)。從文獻(xiàn)的實驗結(jié)果來看,效果比較魯棒。
表情變化對識別帶來的影響,是研究者們樂此不疲的人臉識別題材。文獻(xiàn)[16]是利用幾何特征,先找到鼻尖的那個點,據(jù)此找到人臉的有效區(qū)域并把其校正到正面。文獻(xiàn)的重要貢獻(xiàn)之一是提出了一種面部剛性區(qū)域獲取方法,能根據(jù)不同人臉的特點自適應(yīng)地獲取剛性區(qū)域,但在算法里與文獻(xiàn)[15]采用不同的融合方式是前者分別將全局匹配和局部匹配的結(jié)果加權(quán)在一起,得到的結(jié)果與單一匹配的相比較,效果有較好改善。
由于硬件和軟件帶來的雙重挑戰(zhàn),使得三維識別率不夠精準(zhǔn)[17],因為這需要更好的傳感器。為了能從軟件上彌補這種損失,文獻(xiàn)[17]結(jié)合了對應(yīng)的2D和3D圖像數(shù)據(jù)來聯(lián)合進(jìn)行匹配從而實現(xiàn)人臉識別。除此之外,文獻(xiàn)[18]給出一種新的范例,即使用混合2D-3D人臉識別系統(tǒng)。在這個系統(tǒng)當(dāng)中,3D數(shù)據(jù)被用在訓(xùn)練過程,而且輸入進(jìn)系統(tǒng)的數(shù)據(jù)不管是二維的還是三維的,都能夠依靠這個系統(tǒng)中的方案來進(jìn)行識別。此外這種識別方法還展現(xiàn)出在2D圖像從有效數(shù)據(jù)中較好地恢復(fù)人臉信息的同時,3D訓(xùn)練過程保留了人臉?biāo)锌臻g信息。通過仿真結(jié)果顯示,混合2D-3D人臉識別系統(tǒng)的識別率高于91%,且能對旋轉(zhuǎn)范圍在180度里的人臉圖像進(jìn)行分類。
作為人臉外部特征的一個重要因素,眼鏡的遮擋也為人臉識別增加了困難,使得人臉特征很不穩(wěn)定。眼鏡的遮擋會帶來兩種弊端,當(dāng)鏡片產(chǎn)生模糊和反光反應(yīng)時會對人臉識別帶來很大問題。文獻(xiàn)[19]作者通過眼鏡的細(xì)節(jié)對結(jié)果的影響分析發(fā)現(xiàn)眼鏡框的色彩和外形是阻礙算法有效性的嚴(yán)重因素。作者通過這些紋理變化將眼鏡納為人臉的一部分,并為其進(jìn)行了三維模式重建,使得該模型的參數(shù)變的容易操作,其中改善虛擬樣本是提高此識別方法效率的關(guān)鍵。
為了能更好的解決外部因素給人臉識別帶來的影響,可以嘗試著將基于視頻、3D數(shù)據(jù)和模型的方法結(jié)合起來使用,以此來獲取更好的識別效果,但這也意味著會面臨高維數(shù)據(jù)和龐大計算量帶來的困擾,與此同時對采集更精準(zhǔn)的二維和三維人臉數(shù)據(jù)的硬件要求也會更高。
三、常用人臉識別數(shù)據(jù)庫介紹
通過大量文獻(xiàn)和網(wǎng)絡(luò)資源總結(jié)了當(dāng)前研究者們在人臉識別實驗所常用的15個數(shù)據(jù)庫,分別來自美國、英國、德國和韓國,具體如表1所示。
四、總結(jié)
隨著社會的快速發(fā)展和科技日新月異的變化,我們越來越追求高效而安全的生活,因此人臉識別技術(shù)在身份驗證里也逐漸扮演著越來越重要的角色。人臉識別實質(zhì)上就是利用算法令計算機(jī)從圖像或圖像序列中檢測出人臉,并判斷其身份。在識別系統(tǒng)中,重點環(huán)節(jié)主要有兩個,一個是特征提取過程,另一個是人臉識別過程,所以多數(shù)文獻(xiàn)都是圍繞這兩個過程展開的。人臉識別的實際應(yīng)用中,會涉及到許多外部因素(如光照、表情、姿態(tài)和眼鏡的遮擋等)干擾,為了解決這些問題,研究者們提出了多種方法,包括核方法、模型、視頻信息、三維相關(guān)數(shù)據(jù)和技術(shù)的引用。經(jīng)過文獻(xiàn)給出的實驗表明,識別效果有了很大的改善,
表1常用人臉數(shù)據(jù)庫(見附表)
然而若要有效地投入實際生活中,還有一些問題需要解決,如:(1)引入核方法后,算法中能否自適應(yīng)選取核函數(shù);(2)使用模型來訓(xùn)練數(shù)據(jù)時,如何選取參數(shù)以及如何優(yōu)化模型來提高識別效率;(3)為了去除外部因子的影響,加強(qiáng)信息量,會逐步趨向于基于視頻和三維的人臉表征方式,但如何才能解決由其帶來的數(shù)據(jù)維數(shù)的增加和復(fù)雜度的提高;(4)如何能更有效地結(jié)合2D數(shù)據(jù)和3D數(shù)據(jù)來提高人臉識別效果。
參考文獻(xiàn):
[1]周麗芳,李偉生,黃穎.模式識別原理及工程應(yīng)用[M].機(jī)械工業(yè)出版社,2013.
[2]廖海斌,陳慶虎,鄢煜塵.基于因子分析的實用人臉識別研究[J].電子與信息學(xué)報,2011,33(7):1611-1617
[3]徐勇,張大鵬,楊健.模式識別中的核方法及其應(yīng)用.[M] 國防工業(yè)出版社,2010
[4]陳達(dá)遙,陳秀宏,董昌劍.基于零空間核判別分析的人臉識別[J].計算機(jī)研究與發(fā)展,2013,50(0):1924-1932
[5]王慶軍,張汝波,潘海為.核正交UDP及其在人臉識別中的應(yīng)用[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2010,22(10):1783-1787
[6]高秀梅,楊靜宇,金忠,陳才扣.基于核的Foley.Sammon鑒別分析與人臉識別[J]. 計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2004,16(7):962-967
[7]張龍媛,陳瑩.貝葉斯模型下基于SIFT特征的人臉識別[J].計算機(jī)工程,2012,38(12):125-128
[8]王李冬,王玉槐.基于AAM模型和RS—SVM的人臉識別研究[J]. 計算機(jī)工程與應(yīng)用,45(22):140-143
[9]胡峰松,張茂軍,鄒北驥,馬俊容.基于HMM的單樣本可變光照、姿態(tài)人臉識別[J].計算機(jī)學(xué)報,2009,32(7):1424-1431
[10]代毅,肖國強(qiáng),宋剛.隱馬爾可夫后處理模型在視頻人臉識別中的應(yīng)用[J].計算機(jī)應(yīng)用,2010,30(4):960-963
[11]嚴(yán)嚴(yán),章毓晉.基于視頻的人臉識別研究進(jìn)展[J].計算機(jī)學(xué)報,2009,32(5):878-885
[12]郭建華,趙懷勛,陳曉楠.基于FDCT的視頻人臉識別方法[J].計算機(jī)工程,2011,37(4):178-180
[13]王華鋒,王蘊紅,馬凱迪,張兆翔.視頻中適應(yīng)光照可變情況下的人臉識別方法[J].模式識別與人工智能,2011,24(6):856-861
[14]童林.基于視頻的人臉識別與跟蹤算法研究[J].計算機(jī)與現(xiàn)代化,2013,210(2):1-4
[15]鄒紅艷,達(dá)飛鵬,李曉莉.基于面部曲線特征融合的三維人臉識別[J].東南大學(xué)學(xué)報(自然科學(xué)版),2012,42(4):618-622
[16]朱冰蓮,王大為,李明均,朱海波,朱方方.針對表情變化的三維人臉識別系統(tǒng)[J]. 儀 器 儀 表 學(xué) 報,2014,35(2):299-304
[17]Kevin W. Bowyer, Kyong Chang, Patrick Flynn.A survey of approaches and challenges in 3D and multi-modal 3D + 2D face recognition[J]. Computer Vision and Image Understanding,2006:1-15
[18]Antonio Rama Calvo,F(xiàn)rancesc Tarres Ruiz,Jurgen Rurainsky,Peter Eiser.2D-3D Mixed Face Recognition Schemes[M].2008:125-148
[19]熊鵬飛,劉昌平,黃磊.基于三維建模的眼鏡遮擋下的人臉識別[J].模式識別與人工智能,2011,24(5):692-699