袁振洲
(東南大學成賢學院)
人臉的自動識別是生物測定學研究的內容之一,是模式識別領域中的一個前沿課題。該課題的研究已有?30多年的歷史。人臉識別正越來越成為當前模式識別和人工智能領域的一個研究熱點。目前,人臉識別現(xiàn)已成功應用到機場口岸檢查、刑偵辦案系統(tǒng)、門禁系統(tǒng)等許多領域。
與指紋識別技術相比,因為不需要直接的肢體接觸,在應用中更加受到人們的歡迎,很大的便利了人們的使用。人臉識別技術的研究雖然已有多年的歷史,但因在實際應用中,容易受到光照、姿態(tài)、年齡、表情、尺寸、背景等諸多外界因素的影響,所以對其研究及改善仍然是個熱門話題。
人臉識別過程:
1.建立人臉圖片檔案:可以先用相機或攝像頭拍取頭像或照片文件,生成頭像編碼。
2.獲得當事人的現(xiàn)成頭像,可以通過相機攝像頭現(xiàn)拍,或者通過圖像輸入,生成其編碼。
3.將剛獲得的圖像編碼與之前建立的圖庫編碼進行對比,并進行檢索,看是否符合。
圖片錄入編碼方法是通過當事人臉部的特征和開頭工作的,它可以不受光線、表情、發(fā)型、姿態(tài)以及眼鏡位置等其他外部因素變換的影響,從而可以從眾多不同的人中辨別出來。
在進行識別的過程中,這一系列的過程都是自動的、連續(xù)的、即時的進行的,并且不需要太復雜的設備,所以實際應用時還是很便利易懂的。與指紋識別技術相比,進行指紋識別時,是需要當事人肢體即手指與設備進行直接接觸的,這無疑有一定的不方便之處,也會帶來不必要的時間浪費。而人臉識別技術則不需要進行直接的肢體接觸,僅僅需要將面部對準攝像頭即可,大大的便利了使用。
在攝像頭接收到當事人的臉部圖像時,系統(tǒng)將會實時的對接收到的頭像進行一系列的圖像處理,一系列的處理后,再與之前錄入的圖庫進行匹配。
人臉識別的發(fā)展可以追溯到20世紀60年代,通過了幾十年的探索及研究,大體可以將其分為三個階段:
第一階段是主要解決了人臉識別過程中需要的面部的種種特征。在這一階段中,Bertillon、Allen和Parke等人做出了主要的貢獻。在Bertillon的系統(tǒng)中,用一個基本的語句和圖庫中的某一張圖片相結合,提供了一個較強的識別系統(tǒng)。而Allen?則設計了一種有效的摹寫手段,在這之后再交給Parke用計算機進行實現(xiàn)。然而無論是用哪種方式,這個階段的識別過程仍然全部依賴于操作人員,還是需要很多人員的干預,并不能實現(xiàn)人臉的自動識別。
第二階段是人機交互式識別階段。研究人員用數(shù)學模型描述人臉圖像的五官特征,并通過歐式距離來進行相似性度量。Harmon和Lesk利用多維特征矢量表示人臉面部特征,并設計了基于這一特征表示法的識別系統(tǒng)。在這之后,又陸續(xù)有人也采取了不同的方式,對幾何特征計算進行了研究。但是,該方法仍然依賴于操作人員的知識,仍然沒有擺脫人為的干預。
第三階段才是真正的機器自動識別階段。在這個階段人臉識別技術有了重大的突破,很多經(jīng)典算法陸續(xù)出現(xiàn),如特征法,子空間方法,彈性圖匹配法,基于統(tǒng)計外觀模型和神經(jīng)網(wǎng)絡的人臉識別等。同時也出現(xiàn)很多用于算法性能測試的公開人臉庫,比如ORL人臉庫,YaleB人臉庫,F(xiàn)ERET人臉庫等。在這個階段,人們發(fā)現(xiàn)主要的人臉識別技術對于一些外部因素比如光照強度、姿勢形態(tài)等由于收集數(shù)據(jù)的時候不是在理想情況下進行的,或者是因為當事人在被收集圖像數(shù)據(jù)的時候不配合造成的變換魯棒性比較差。所以以上這些因素成為了當時以及后來技術人員的攻克重點。也就是在這個時候,人臉識別技術的商業(yè)應用得到了迅速發(fā)展。21世紀初,美國先后兩次對人臉識別的商用價值進行了系統(tǒng)的評測。
總的來說,當前的主要問題是解決在非理想條件下,以及當事人不配合以及人臉數(shù)據(jù)庫里面的數(shù)據(jù)過于龐大而產生的一系列問題。
首先,就人臉識別技術的特點而言,人臉識別是一種精度很高、使用便利、不容易進行仿冒的一種識別技術,因此具有非常廣泛的應用前景。在海關、交通、社保、公安、國防等多個行業(yè)和部門有著非常廣泛的應用。
其實,人臉識別技術已經(jīng)深深地走入了我們的生活,我們生活的很多方面都在和人臉識別技術打交道了。比如,在一些企業(yè)中,人們不在使用指紋識別技術來完成考勤任務,因為指紋識別技術的一些技術上上的特點逐漸的顯示出其短板之處,更是有人會投機取巧從而并不能很好的完成它的使命。并且指紋識別技術需要進行直接的肢體接觸,這些無疑帶來很大的不便,效率小了很多。所以人們嘗試尋求一種新型的方式,所以人臉識別技術被很好的利用在了工作部門考勤方面,人臉識別考勤非常方便,只需要刷一下臉即可,方便高效,深受企業(yè)歡迎。
正因為人臉識別技術給人們的生活以及方方面面都帶來極大的便利,而它的應用潛力還遠遠不止于此,接下來技術人員仍然有大量的空間去發(fā)展人臉識別技術,還可以運用到更多可以便利到人們生活的方面。然而,盡管目前為止人臉識別技術方面已經(jīng)有一定的成就,還是存在許多技術上的不足,仍然會有一些不方便的地方,接下來技術人員仍然需要大力的去探索人臉識別技術的應用以及消除某些方面還不夠成熟的方面,盡量的去填好技術上的缺陷。
在應用過程中,人臉識別的速度和準確率無疑是這門技術最關鍵的點,而這也將是技術人員進行不斷優(yōu)化和不斷改進的關鍵。人臉圖像的識別會受到很多外界因素的干擾:人臉表情的多樣性;以及外在的成像過程中的光照,圖像尺寸,旋轉,姿勢變換等。使得同一個人,在不同的環(huán)境下拍攝所得到的人臉圖像不同,有時更會有很大的差別,給識別帶來很大的難度。因此在各種干擾條件下實現(xiàn)人臉圖像的識別,也就更具有挑戰(zhàn)性。
所以總的來說,人臉識別技術得到如此迅猛的發(fā)展并不是偶然的,可以說是因為其極大的滿足了人說所追求的人工智能的需求。目前,IT行業(yè)內大數(shù)據(jù),云計算以及深度學習的算法無疑是技術新貴,行業(yè)內花費大量的人力物力財力去進行這幾項技術的探索。而在這些技術取得一定的成果之后,對于人臉識別技術而言也是很好的催化劑,它們有助于人臉識別技術發(fā)展到更高的高度,這樣的話,大規(guī)模的商業(yè)運用便是自然而然的事。在接下來的很長時間里,基于計算機視覺方面的運用,以及在視頻監(jiān)控領域中,對人的行為模式的識別、跟蹤和分析,這些方面都會成為一個非常大的市場,當然了,它的成熟度還有待于進一步的檢驗。
總的來說,人臉識別技術有著非常廣廣泛的發(fā)展前景,人臉識別也僅僅是一個發(fā)展支點,更多方面的運用還有待于進一步的研究和探索。