趙昆 張輝 蘇達釗 商霓
摘 要: 人臉識別是計算機技術(shù)研究領(lǐng)域比較熱門的方向之一,它融合許多跨學科知識,應(yīng)用十分廣泛。本文首先介紹了人臉識別技術(shù),并對常用的幾種人臉識別方法進行分析與比較,總結(jié)了人臉識別面臨的技術(shù)難題,最后展望了人臉識別技術(shù)發(fā)展方向。
關(guān)鍵詞: 人臉識別;特征提??;模板匹配;深度學習;神經(jīng)網(wǎng)絡(luò)
1.引言
人臉自動識別技術(shù)是指計算機對人臉圖像進行特征提取和識別的一門技術(shù)。無論是靜態(tài)圖像還是視頻圖像,該技術(shù)都可以從中找出需要檢測的人臉圖像,然后與數(shù)據(jù)庫中的人臉數(shù)據(jù)進行對比,找出最佳匹配,從而達到身份識別與鑒定的目的。
近年來,隨著科技的不斷進步,人臉識別在保險、金融、安防、教育、娛樂等行業(yè)發(fā)展迅速。與其他身份識別技術(shù)相比,人臉識別具有以下優(yōu)越性[2]:非接觸性;直觀性突出;可跟蹤性好;防偽性好;性價比高;精度高、速度快。但是人臉識別容易受到表情、背景、裝飾物、年齡跨度等諸多因素的干擾,從而加大了精準識別的難度。
2. 人臉識別的過程
一般人臉識別過程如圖1所示。
3. 人臉識別方法介紹
(1)基于幾何特征的人臉識別方法
基于幾何特征的人臉識別方法是BLEDSOE最先提出的。該方法主要是對面部特征點進行幾何運算,計算得出描述每個面部關(guān)鍵位置的特征矢量。目標人臉由這些特征矢量表示出來,再與數(shù)據(jù)庫中的人臉進行比對,找出最為匹配的人臉。該方法優(yōu)點:操作簡便,淺顯易懂;占據(jù)存儲空間小;識別速度快;受光照影響較小。但當表情或者姿態(tài)發(fā)生變化時,面部器官位置也隨之變化,導(dǎo)致無法提取穩(wěn)定的特征。而且由于忽略了整個圖像的很多細節(jié)信息,其識別率較低。
(2)基于模板匹配的人臉識別方法
基于模板匹配的方法預(yù)先給定包含了人臉特征的標準模板,但這些模板的長寬比例不同。然后在全局范圍內(nèi),通過不斷迭代來更改模板大小,根據(jù)這些模板與待測對象的相似性大小進行比對和識別,尋求最佳匹配[2]。早在1993年,Poggio 和 Brunelli就對上述兩種方法進行過比較,并得出模板匹配方法比幾何特征方法識別率高的結(jié)論。
(3)基于特征臉的人臉識別方法
在20世紀90年代初,TURK首次提出基于特征臉的人臉識別方法。首先按照從上到下、從左到右的順序,將一幅人臉圖像所有像素的灰度值組成一個高維向量,然后通過主成分分析法,將人臉圖像降維,之后采用線性判別分析,進而識別人臉。該方法具有計算簡單、使用方便、效果良好的優(yōu)點。但是它對于拍照角度、拍照環(huán)境、光照強度等外界因素要求很高,進而導(dǎo)致識別準確率較低。
(4)基于彈性圖匹配的人臉識別方法
彈性圖匹配方法是基于動態(tài)鏈接結(jié)構(gòu)的一種算法。Lades M等人在1992年首次將該方法用于人臉識別并取得了較好效果。使用該方法時,首先尋找與目標圖像最相近的模型圖,再對圖中的每個節(jié)點位置進行相似匹配,最后生成一個拓撲圖。拓撲圖中節(jié)點和模型圖中對應(yīng)點的位置相近,進而對人臉進行識別[3]。該方法受光照、表情等因素影響較小,優(yōu)于特征臉方法。但計算速度慢,占據(jù)存儲空間大。
(5)基于神經(jīng)網(wǎng)絡(luò)的人臉識別方法
基于人工神經(jīng)網(wǎng)絡(luò)的人臉識別研究方法主要采用BP神經(jīng)網(wǎng)絡(luò)學習算法。1997年,Lin.等研究了一種基于神經(jīng)網(wǎng)絡(luò)的全自動人臉檢測系統(tǒng),在當時引起了很大反響。人工神經(jīng)網(wǎng)絡(luò)優(yōu)秀的學習能力、分類能力使得對人臉進行特征提取與識別更加容易[4]。神經(jīng)網(wǎng)絡(luò)方法通過學習過程,避免了復(fù)雜的特征提取工作,使獲得人臉識別規(guī)律的隱性表達更加容易。
(6)基于深度學習的人臉識別方法
深度學習能夠模擬人類視覺感知神經(jīng)系統(tǒng)的認知學習,從而獲得更具表征力的高層特征。2012年,Lee H等率先將深度學習用于 LFW數(shù)據(jù)庫的人臉識別。他們采用無監(jiān)督的特征學習方法,取得了 87%的識別率。目前,深度學習算法的識別率已經(jīng)達到了99.47%,,甚至超過了人眼的識別率[5]。該方法通過學習得到更有意義的數(shù)據(jù),并且能建立更精確的模型。然而,訓練模型需要很長時間,并且要不斷地迭代來進行模型優(yōu)化,但不能保證得到全局最優(yōu)解。
4. 面臨的主要問題
(1)影響人臉識別的諸多問題沒有得到根本性解決。一是光照、背景問題;二是面部表情、面部姿態(tài)問題;三是裝飾物遮擋問題;四是整容、化妝問題。
(2)急需大型、公開人臉數(shù)據(jù)集。LFW數(shù)據(jù)集作為最實用的的人臉測試數(shù)據(jù)集,識別率一直被刷新?,F(xiàn)有人臉識別系統(tǒng)還不能準確識別超百萬的數(shù)據(jù)集。所以未來急需更具挑戰(zhàn)性的公開人臉數(shù)據(jù)集]。
(3)需要用戶友好的系統(tǒng),來保護我們的財產(chǎn)和隱私不被人竊取。現(xiàn)有的商業(yè)性人臉識別系統(tǒng)并不能滿足這樣的需求。
5.總結(jié)與展望
現(xiàn)在深度學習和神經(jīng)網(wǎng)絡(luò)已經(jīng)成為人臉識別領(lǐng)域的主流發(fā)展方向,但傳統(tǒng)的一些方法仍然取得了很好的效果。提高魯棒性、提高準確率、提高運行速度、減少計算量是未來識別技術(shù)研究的方向。在不久的將來,人臉識別技術(shù)將隨處可見,并且更加便利、更加安全。
參考文獻
[1]蘇祎芳.人臉識別技術(shù)應(yīng)用及前景展望[J].云南警官學院學報,2017(04):106-110.
[2]祝秀萍,吳學毅,劉文峰.人臉識別綜述與展望[J].計算機與信息技術(shù),2007(12):53-56.
[3]李武軍,王崇駿,張煒等.人臉識別研究綜述[J].模式識別與人工智能,2006(2).
[4]吳斯.基于多尺度池化的卷積神經(jīng)網(wǎng)絡(luò)人臉識別方法研究.[D] 浙江:浙江大學,2016(6).
[5]馬良慧.基于深度學習的人臉識別算法研究.[D] 山東:山東理工大學,2017(4).