李學(xué)龍
【摘 要】人工智能作為一門(mén)多種學(xué)科互相滲透而發(fā)展起來(lái)的交叉學(xué)科在各方面都有著應(yīng)用。人臉識(shí)別通過(guò)知識(shí)表示、知識(shí)推理、模糊邏輯、神經(jīng)網(wǎng)絡(luò)、專家控制、遺傳算法和群集智能等人工智能方法達(dá)到識(shí)別人物臉部特征的目的,進(jìn)而對(duì)其進(jìn)行判定。本文總結(jié)介紹了基于幾何特征、基于模型、基于統(tǒng)計(jì)以及基于神經(jīng)網(wǎng)絡(luò)等具體識(shí)別方法。
【關(guān)鍵詞】人工智能;人臉識(shí)別;神經(jīng)網(wǎng)絡(luò)
1 人工智能簡(jiǎn)介
人工智能(Aritificial Intelligence,AI)是一門(mén)綜合了計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)、哲學(xué)等多種學(xué)科互相滲透而發(fā)展起來(lái)的一門(mén)交叉學(xué)科[1],從誕生至今已有近60年的歷史。人工智能是研究如何制造智能機(jī)器或智能系統(tǒng),來(lái)模擬人類智能活動(dòng)的能力,以延伸人們智能的科學(xué)[2]。人工智能不在乎計(jì)算機(jī)是依靠某種算法還是真正理解人類行為,只需要其能表現(xiàn)出與人相似的行為,它是計(jì)算機(jī)科學(xué)中的—個(gè)分支,涉及智能機(jī)器的研究、設(shè)計(jì)和應(yīng)用。人工智能的研究目標(biāo)在于怎樣用計(jì)算機(jī)來(lái)模仿和執(zhí)行人腦的某些功能,并開(kāi)發(fā)相關(guān)的技術(shù)以及產(chǎn)品,建立有關(guān)的理論。人工智能可分為:基本人工智能,包括知識(shí)表示、推理;高級(jí)人工智能,如模糊邏輯、神經(jīng)網(wǎng)絡(luò)、專家控制;計(jì)算智能,如遺傳算法、群集智能。人工智能研究領(lǐng)域的三種主要觀點(diǎn)[3]:符號(hào)主義又稱為邏輯主義或計(jì)算機(jī)學(xué)派,其認(rèn)為符號(hào)是人類的認(rèn)識(shí)基元,同時(shí)人認(rèn)識(shí)的過(guò)程即是對(duì)符號(hào)的計(jì)算與推理的過(guò)程;聯(lián)結(jié)主義又被叫做仿生學(xué)派,其主要原理是人類的智能是由人腦的生理結(jié)構(gòu)和工作模式所決定;行為主義又被稱作進(jìn)化主義、控制論學(xué)派,其主要原理是智能取決于感知和行動(dòng),它不需要知識(shí)、也不需要知識(shí)的表示與推理[4]。
2 人臉識(shí)別
人臉識(shí)別是指對(duì)輸入的人臉圖像或者視頻,判斷其中是否存在人臉,如果存在人臉,則進(jìn)一步給出每張人臉的位置、大小和各個(gè)主要面部器官的位置信息,并且依據(jù)這些信息,進(jìn)一步提取每張人臉蘊(yùn)含的身份特征,并將其與已知人臉庫(kù)中的人臉進(jìn)行對(duì)比,從而識(shí)別每張人臉的身份。人臉識(shí)別的研究起源于19世紀(jì)末,其發(fā)展大致分成三個(gè)階段[5]:第一階段以面部特征為主要研究對(duì)象;第二階段稱為人機(jī)交互式識(shí)別階段,分為采用幾何特征參數(shù)來(lái)表示人臉正面圖像和統(tǒng)計(jì)識(shí)別為基礎(chǔ)的方法;第三階段才被稱為真正的自動(dòng)識(shí)別階段,人臉識(shí)別技術(shù)進(jìn)入實(shí)用階段。
3 常用的人臉識(shí)別方法
人臉識(shí)別的技術(shù)與方法一般分為:基于幾何特征的方法和基于模板匹配的方法。對(duì)于基于幾何特征方法而言,首先檢測(cè)出眼耳口鼻等臉部主要部件的位置和大小,然后分析這些部件的總體幾何分布關(guān)系以及相互之間的參數(shù)比例來(lái)識(shí)別人臉?;谀0宓姆椒ㄒ步凶龌诒硐蟮姆椒?,利用模板與整個(gè)人臉圖像的像素值之間的自相關(guān)性進(jìn)行人臉的識(shí)別[6]。通過(guò)分析常用的人臉識(shí)別方法,本文將人臉識(shí)別的方法分為基于幾何特征的方法、基于模型的方法、基于統(tǒng)計(jì)的方法、基于神經(jīng)網(wǎng)絡(luò)的方法。
3.1 基于幾何特征的方法
最早的基于幾何特征的方法由Bleclsoe提出,該方法將幾何特征定義為面部特征點(diǎn)之間的距離和比率,通過(guò)最近鄰方法來(lái)識(shí)別人臉,但必須手動(dòng)定位面部特征點(diǎn),因此屬于半自動(dòng)系統(tǒng)。側(cè)影識(shí)別是另一個(gè)基于幾何特征的人臉識(shí)別方法,其原理是通過(guò)提取人臉的側(cè)影輪廓線上特征點(diǎn),將側(cè)影轉(zhuǎn)化為輪廓曲線,提取其中的基準(zhǔn)點(diǎn),然后識(shí)別這些點(diǎn)之間的幾何特征。
基于幾何特征的方法非常直觀,能快速識(shí)別人臉,只需要較少內(nèi)存,光照對(duì)特征的提取影響不大,缺點(diǎn)是當(dāng)人臉變化時(shí),特征的提取不精確,并且由于對(duì)圖像細(xì)節(jié)信息的忽略,導(dǎo)致識(shí)別率較低,因此近年來(lái)少有發(fā)展。
3.2 基于模型的方法
隱馬爾可夫模型(Hidden Markov Model,HMM)是一種常用的模型,基于HMM的方法被Nefian和Hayes引入到人臉識(shí)別領(lǐng)域,它是一組統(tǒng)計(jì)模型,用于描述信號(hào)統(tǒng)計(jì)特性。Cootes等人提出主動(dòng)形狀模型(Active Shape Model,ASM),對(duì)形狀和局部灰度表象建模,定位新圖像中易變的物體[5]。Lanitis等用該方法解釋人臉圖像,其原理是使用ASM找出人臉的形狀,然后對(duì)人臉進(jìn)行切割并歸一到統(tǒng)一的框架,通過(guò)亮度模型解釋和識(shí)別與形狀無(wú)關(guān)的人臉。
主動(dòng)表象模型(Active Appearance Model,AAM)通常被看作是ASM的一種擴(kuò)展,一般作為通用的非線性圖像編碼模式,通用的人臉模型經(jīng)變形處理后與輸入圖像進(jìn)行匹配,并將控制參數(shù)作為分類的特征向量。
3.3 基于統(tǒng)計(jì)的方法
基于統(tǒng)計(jì)的方法將人臉圖像視為隨機(jī)向量,采用一些統(tǒng)計(jì)方法對(duì)人臉進(jìn)行特征分析,這類方法有較為完善的統(tǒng)計(jì)學(xué)理論的支持,因此發(fā)展較好,研究人員也提出了一些比較成功的統(tǒng)計(jì)算法。
特征臉?lè)椒ㄓ蒚urk和Pentland提出,該方法中人臉由各個(gè)特征臉擴(kuò)展的空間表示,雖然人臉信息可以有效地表示,但不能對(duì)其進(jìn)行有效鑒別和區(qū)分。為取得更好的人臉識(shí)別效果,研究者又提出使用其他的線性空間來(lái)代替特征臉空間[6]。Moghaddam等人提出了貝葉斯人臉識(shí)別方法,用基于概率的方法來(lái)度量圖像相似度,將人臉圖像之間的差異分為類間差異和類內(nèi)差異,其中類間差異表示不同對(duì)象之間的本質(zhì)差異,類內(nèi)差異為同一對(duì)象的不同圖像之間的差異,而實(shí)際人臉圖像之間的差異為兩者之和。如果類內(nèi)差異大于類間差異,則認(rèn)為兩人臉圖像屬于同一對(duì)象的可能性大。
奇異值分解(Singular Value Decomposition,SVD)作為一種有效的代數(shù)特征提取方法,奇異值特征具有多種重要性質(zhì),如鏡像變換不變性、位移不變性、旋轉(zhuǎn)不變性以及良好的穩(wěn)定性等,因此人臉識(shí)別領(lǐng)域也引入了奇異值分解技術(shù)。
3.4 基于神經(jīng)網(wǎng)絡(luò)的方法
神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別領(lǐng)域也有較長(zhǎng)的歷史,Kohoncn最早將自組織映射(Self-Organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)應(yīng)用于人臉識(shí)別,即使當(dāng)輸入人臉圖像有部分丟失或者具有較大噪音干擾時(shí),也能完整的恢復(fù)出人臉。人臉識(shí)別中最具影響的神經(jīng)網(wǎng)絡(luò)方法是動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture,DLA),對(duì)網(wǎng)絡(luò)中語(yǔ)法關(guān)系的表達(dá)是該方法最突出的特點(diǎn)。
用于人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)還有:時(shí)滯神經(jīng)網(wǎng)絡(luò)(Time Delay Neural Net-works,TDNN),是MLP的一種變形,徑向基函數(shù)網(wǎng)絡(luò)(Radial Basis Function Network,RBFN)以及能有效地實(shí)現(xiàn)低分辨率人臉的聯(lián)想與識(shí)別的Hopfield網(wǎng)絡(luò)等[6]。
與其他人臉識(shí)別方法相比,神經(jīng)網(wǎng)絡(luò)方法具有特有的優(yōu)勢(shì),人臉圖像的規(guī)則和特征的隱性表示可通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練獲得,避免了特征抽取的復(fù)雜性,有利于硬件的實(shí)現(xiàn),缺點(diǎn)是可解釋性較弱,要求訓(xùn)練集中有多張人臉圖像,因此只適合于小型人臉庫(kù)。人工智能應(yīng)用在人臉識(shí)別、模式識(shí)別方面能夠提高運(yùn)行效率、減小計(jì)算量小、程序的代碼編寫(xiě)更為簡(jiǎn)潔。
【參考文獻(xiàn)】
[1]武海麗.初識(shí)人工智能[J].科技創(chuàng)新導(dǎo)報(bào),2009,02:196.
[2]王甲海.創(chuàng)新型人工智能教育改革與實(shí)踐[J].計(jì)算機(jī)教育,2010(08):136.
[3]肖斌,薛麗敏,李照順.對(duì)人工智能發(fā)展新方向的思考[J].信息技術(shù),2009,12:166-168.
[4]朱祝武.人工智能發(fā)展綜述[J].中國(guó)西部科技,2011,10(17):08-10.
[5]裴佳佳.基于子空間的人臉識(shí)別技術(shù)研究[D].浙江工業(yè)大學(xué),2009.
[6]李武軍,王崇駿,張煒,陳世福.人臉識(shí)別研究綜述[J].模式識(shí)別與人工智能,2006,19(01):58-66.
[責(zé)任編輯:丁艷]