張敏 張海艷 劉亭 喬夢萱
【摘要】人臉識別系統(tǒng)以是現在科學研究的熱門之一,本文對人臉識別系統(tǒng)的流程及發(fā)展前景做了簡單的回顧。對該系統(tǒng)的應用做了簡單的分析并對人臉識別的主要方法進行了相應的分類。對人臉識別系統(tǒng)的未來主要發(fā)展進行展望。
【關鍵詞】人臉識別;人臉檢測;方法
Abstract:Face recognition system is one of the most popular current scientific research,In this paper,the process and prospects of face recognition system to do a simple review.The application of the system to do a simple analysis and the main method of face recognition for the corresponding category.For the future development of face recognition systems were mainly discussed.
Key words:Face Recognition;Face Detection;Methods
一、引言
隨著科學技術的突飛猛進,計算機及網絡的高速發(fā)展,信息的安全性、隱蔽性越來越重要,如何有效、方便的進行身份驗證和識別,已經成為人們日益關心的問題。生物認證的方法,即利用人類自身的特征來進行身份認證,具有傳統(tǒng)方法沒有的有點,也解決了身份認證技術所面臨的一大難題。其具有方便、強化安全、不會丟失、遺忘或轉讓等優(yōu)點。現在人體生物識別技術的研究主要針對人臉、指紋、虹膜、手型、聲音等物理或行為特征來進行。本文主要對人臉識別技術的介紹。
人臉識別是指給定一個靜止或動態(tài)圖像,利用已有的人臉數據庫來確認圖像中的一個或多個人。如同人的指紋一樣,人臉也具有唯一性,也可用來鑒別一個人的身份?,F在己有實用的計算機自動指紋識別系統(tǒng)面世,并在安檢等部門得到應用,但還沒有通用成熟的人臉自動識別系統(tǒng)出現。人臉圖像的自動識別系統(tǒng)較之指紋識別系統(tǒng)、DNA鑒定等更具方便性,因為它取樣方便,可以不接觸目標就進行識別,從而開發(fā)研究的實際意義更大。另一方面,人臉表情的多樣性;以及外在的成像過程中的光照,圖像尺寸,旋轉,姿勢變化等給識別帶來很大難度。因此在各種干擾條件下實現人臉圖像的識別,也就更具有挑戰(zhàn)性。
二、人臉識別系統(tǒng)流程
(1)人臉圖像的獲取:圖像的獲取都是通過攝像頭攝取,但攝取的圖像可以是真人,也可以是人臉的圖片或者為了相對簡單,可以不考慮通過攝像頭來攝取頭像,而是直接給定要識別的圖像。
(2)人臉的檢測:人臉檢測的任務是判斷靜態(tài)圖像中是否存在人臉。若存在人臉,給出其在圖像中的坐標位置、人臉區(qū)域大小等信息。而人臉跟蹤則需要進一步輸出所檢測到的人臉位置、大小等狀態(tài)隨時間的連續(xù)變化情況。
圖1 人臉識別框架
(3)特征提?。和ㄟ^人臉特征點的檢測與標定可以確定人臉圖像中顯著特征點的位置(如眼睛、眉毛、鼻子、嘴巴等器官),同時還可以得到這些器官及其面部輪廓的形狀信息的描述。根據人臉特征點檢測與標定的結果,通過某些運算得到人臉特征的描述(這些特征包括:全局特征和局部特征,顯式特征和統(tǒng)計特征等)。
(4)基于人臉圖像比對的身份識別:即人臉識別問題。通過將輸入人臉圖像與人臉數據庫中的所有已知原型人臉圖像計算相似度并對其排序來給出輸入人臉的身份信息。
(5)基于人臉圖像比對的身份驗證:即人臉確認問題。系統(tǒng)在輸入人臉圖像的同時輸入一個用戶宣稱的該人臉的身份信息,系統(tǒng)要對該輸入人臉圖像的身份與宣稱的身份是否相符作出判斷。
三、人臉識別技術現狀及發(fā)展前景
自1995年以來,國外一些公司看準了人臉識別系統(tǒng)廣闊的應用前景,動用了大量人力和物力,自己獨立研發(fā)或與高校合作,開發(fā)了多個實用的人臉識別系統(tǒng),例如:加拿大Imagis公司的ID-2000面部識別軟件,美國Identix公司1的FaceIt人臉識別系統(tǒng),德國Human Scan公司的BioID身份識別系統(tǒng),德國Cognitec Systems公司的Face VACS人臉識別系統(tǒng)等;美國A4vision公司的3D人臉識別產品;等等。
國內相關領域較為出名的公司有上海銀晨智能識別科技有限公司(IS'vision),他們與中科院計算所聯合開發(fā)了會議代表身份認證/識別系統(tǒng)、嫌疑人面像比對系統(tǒng)、面像識別考勤/門禁系統(tǒng)、出人口黑名單監(jiān)控系統(tǒng)等多種自動人臉識別應用系統(tǒng)。2008年,北京奧運會開幕式正式使用了中國自主知識產權的人臉識別比對系統(tǒng);2010年4月1日起,國際民航組織(ICAO)已確定其118個成員國家和地區(qū)必須使用機讀護照,人臉識別技術是首推識別模式,該規(guī)定已經成為國際標準;2011年,Face book初次引入人臉識別技術,登陸人員可以免信息驗證而激活頁面;2012年3月6日,江蘇省公安廳與南京理工大學日前簽約共建“社會公共安全重點實驗室”,開展“人臉識別”技術相關領域項目攻關。
到目前為止,雖然有關自動人臉識別的研究已經取得了一些可喜的成果,但在實際應用環(huán)境下仍面臨著許多難以解決的問題:人臉的非剛體,表情、姿態(tài)、發(fā)型和化妝的多樣性以及環(huán)境光照的復雜性都給正確的人臉識別帶來了很大的困難。即使在大量來自模式識別、計算機視覺、生理學、心理學、神經認知科學等領域的研究人員對自動人臉識別艱苦工作40余年之后,其中不少問題至今仍然困繞著研究人員,始終找不到完善的解決辦法。
在人臉識別市場,特別是在中國的市場,正經歷著迅速的發(fā)展,而且發(fā)展的腳步也將越來越快。主要有三大原因:
1.是科技界和社會各個領域都認識到人臉識別技術的重要性,國家政策對人臉識別技術研究給予了很大支持,使得我國人臉識別技術取得了很大進展。國際上,美國國家標準技術局(NIST)舉辦的Face Recognition Vendor Test 2006(FRVT2006)通過大規(guī)模的人臉數據測試表明,當今世界上人臉識別方法的識別精度比2002年的FRVT2002至少提高了一個數量級(10倍)。其中一些方法的識別精度已經超過人類的平均水平。而對于高清晰、高質量人臉圖像識別,機器的識別精度幾乎達到100%。
2.各種應用需求不斷出現。人臉識別市場的快速發(fā)展一方面歸功于生物識別需求的多元化,另一方面則是由于人臉識別技術的進步。從需求上來說,除了傳統(tǒng)的公司考勤、門禁等應用外,視頻監(jiān)控環(huán)境下的身份識別正成為一種迫切的需求,即在一個較復雜的場景中,在較遠的距離上識別出特定人的身份,這顯然是指紋識別的方法不能滿足的,而人臉識別卻是一個極佳的選擇。
3.人口基數因素。人臉識別系統(tǒng)的市場大小,很大程度上是和人口的數量大小相關的。而我國有13億人口,這從本質上說明了我國是世界上規(guī)模最大的生物識別市場。
四、常用的人臉識別方法
人臉識別技術和方法可分為兩大類:基于幾何特征的方法和基于模板匹配的方法。基于幾何特征方法的思想是首先檢測出嘴巴,鼻子,眼睛,眉毛等臉部主要部分的位置和大小,然后利用這些部件的總體幾何分布關系以及相互之間的參數比例來識別人臉?;谀0宓姆椒ㄊ抢媚0搴驼麄€人臉圖像的像素值之間的自相關性進行識別,這種方法也叫做基于表象的方法。
本文主要分析了常用的人臉識別方法為:幾何特征的方法、模型的方法、神經網絡的方法和多分類器集成方法。
1.幾何特征的方法
最早的人臉識別方法就是Bledsoe提出的基于幾何特征的方法,這種方法以面部特征點之間的距離和比率作為特征通過最近鄰方法來識別人臉。該方法建立的人臉識別系統(tǒng)是一個半自動系統(tǒng),其面部特征點必須由人手工定位,也正是由于人工的參與,該系統(tǒng)對光照變化和姿態(tài)變化不敏感。
Kanade首先計算眼角、鼻孔、嘴巴、下巴等面部特征之間的距離和它們之間的角度以及其它幾何關系然后通過這些幾何關系進行人臉的識別工作在一個20人的數據庫上識別率為45%一75%。
Brunelli和Poggio通過計算鼻子的寬度和長度、嘴巴位置和下巴形狀等進行識別,在一個47人的人臉庫上的識別率為90%.然而,簡單模板匹配方法在同一人臉庫上的識別率為100%。
基于幾何特征的方法比較直觀,識別速度快,內存要求較少,提取的特征在一定程度上對光照變化不太敏感。但是,當人臉具有一定的表情或者姿態(tài)變化時,特征提取不精確,而且由于忽略了整個圖像的很多細節(jié)信息且識別率較低,所以近年來已經很少有新的發(fā)展。
2.模型的方法
隱馬爾可夫模型,是一種常用的模型,原HMM的方法首先被用于聲音識別等身份識別上,之后被Nefian和Hayrs引人到人臉識別領域。它是用于描述信號統(tǒng)計特性的一組統(tǒng)計模型。
在人臉識別過程中,首先抽取人臉特征,得到后觀察向量,構建HMM人臉模型,然后用EM算法訓練利用該模型就可以算出每個待識別人臉觀察向量的概率,從而完成識別,HMM方法的魯棒性較好,對表情、姿態(tài)變化不太敏感,識別率高。
3.神經網絡的方法
神經網絡在人臉識別領域有很長的應用歷史,1994年就出現了神經網絡用于人臉處理的綜述性文章。
動態(tài)鏈接結構(DLA)是用于人臉識別系統(tǒng)中最有影響的神經網絡方法。DLA試圖解決傳統(tǒng)的神經網絡中一些概念性問題,其中最突出的是網絡中語法關系的表達。DLA利用突觸的可塑性將神經元集合劃分成若干個結構,同時保留了神經網絡的優(yōu)點。
自組織映射神經網絡(SOM)與卷積神經網絡相結合的混合神經網絡方法進行人臉識別。SOM實現對圖像的采樣向量降維,且對圖像樣本的小幅度變形不敏感。卷積網絡用來實現相鄰像素間的相關性知識,在一定程度對圖象的平移、旋轉、尺度和局部變形也都不敏感。
神經網絡方法較其他人臉識別方法有著特有的優(yōu)勢,通過對神經網絡的訓練可以獲得其他方法難以實現的關于人臉圖像的規(guī)則和特征的隱性表示,避免了復雜的特征抽取工作,并有利于硬件的實現。缺點主要在于其方法的可解釋性較弱,且要求多張人臉圖像作為訓練集,所以只適合于小型人臉庫。
4.多分類器集成方法
人臉的表象會因為光照方向、姿態(tài)、表情變化而產生較大的變化,每種特定的識別器只對其中一部分變化比較敏感,因此,將可以整合互補信息的多個分類器集成能夠提高整個系統(tǒng)的分類準確率。
Gutta等人提出將集成的RBF與決策樹結合起來進行人臉識別。結合了全局的模板匹配和離散特征的優(yōu)點,在一個350人的人臉庫上測試,取得了較好的實驗結果。
五、總結及展望
隨著圖像處理、模式識別、人工智能以及生物心理學的研究進展,人臉識別技術也將會獲得更大的發(fā)展。面對這種高新技術,人臉識別技術有著不可代替的優(yōu)點。近幾年對三維模型的人臉識別研究以成為一個熱點。從二維模型到三維模型是一個階躍性的發(fā)展,中間必須克服三維模型的開銷大,所占空間大等因素。因此如何增強這類系統(tǒng)的保密性將是人臉識別系統(tǒng)要考慮的問題,它將是這種識別系統(tǒng)投入使用后人們最關心的問題,同時也是人臉識別領域需要研究的新課題。我們期待在不久的將來,人們將告別鑰匙,迎來人臉開門的新時代。
參考文獻
[1]李武軍,王崇駿,張煒,等.人臉識別研究綜述[J].模擬識別與人工智能,2006,19(1):58-65.
[2]李子青.人臉識別技術應用及市場分析[J].中國安防,2007,8:42-46.
[3]柴秀娟,山世光,卿來云,等.基于3D人臉重建的光照、姿態(tài)不變人臉識別[J] .軟件學報,2006,17(3):525-534.
[4]李波.人臉識別技術及應用研究[D].西安電子科技大學,2007.
[5]閆娟,程武山,孫鑫.人臉識別的技術研究與發(fā)展概況[J].視頻技術應用與工程,2006,296(12):81-84.