王昊
【摘 要】人臉檢測與識別技術(shù)因為其巨大的應(yīng)用價值以及市場潛力,已經(jīng)成為圖像工程領(lǐng)域研究的熱點(diǎn)。目前,國內(nèi)外的文獻(xiàn)中涉及到的人臉檢測和識別算法有很多種,本文對近些年來在期刊和會議上發(fā)表的有關(guān)人臉檢測和識別技術(shù)的文章進(jìn)行了歸納總結(jié),概括介紹了一些人臉檢測和識別的典型方法,分析了這些方法的特點(diǎn)及理論依據(jù)。
【關(guān)鍵詞】人臉檢測;人臉定位;特征提??;人臉識別
0.引言
在現(xiàn)實生活中,很多情況下都需要進(jìn)行身份驗證。人臉是人體最重要的外貌特征,由于臉部信息可以通過如攝像頭等非接觸的方式取得,所以非常適合作為身份鑒別的依據(jù)。與指紋識別、虹膜識別等諸多生物識別技術(shù)比較而言,人臉識別技術(shù)的獨(dú)特之處還表現(xiàn)這種識別技術(shù)具有直接,友好,方便的特點(diǎn),使用者無任何心理障礙,易于為用戶所接受。該技術(shù)被廣泛應(yīng)用于國家安全、軍事安全和公安、司法、民政、金融、民航、海關(guān)、邊境、口岸、保險及其他民用安全控制系統(tǒng)等領(lǐng)域當(dāng)中。此外,人臉識別技術(shù)的研究還涉及生理學(xué)、心理學(xué)、人工智能、模式識別、圖像處理等多個學(xué)科領(lǐng)域,因此它具有重要的理論研究價值。
1.人臉檢測
人臉檢測問題起源于人臉識別技術(shù)。人臉檢測從總體上可分為兩大類:基于先驗知識的人臉檢測方法和基于后驗學(xué)習(xí)和訓(xùn)練的人臉檢測方法。
1.1基于先驗知識的人臉檢測方法
基于先驗知識的人臉檢測方法自上而下,依據(jù)人臉面部器官的對稱性、灰度差異等先驗知識,將人臉面部器官之間的關(guān)系編碼并制定出一系列的準(zhǔn)則。當(dāng)待測圖像中的某些區(qū)域符合該準(zhǔn)則,該區(qū)域就被檢測為人臉。
此類方法所使用的特征可以分為灰度特征、形狀特征、結(jié)構(gòu)特征、紋理特征和顏色特征。
1.1.1灰度特征
多個人臉圖像的平均就是一個簡單的人臉模板,同時,人臉的眉、眼、嘴、前額、鼻梁、下頜、臉頰等區(qū)域的灰度值較高,因而人臉具有特定的灰度分布特征。對人臉區(qū)域進(jìn)行水平和垂直方向的灰度投影,根據(jù)極小值點(diǎn)位置即可得到眼、鼻、嘴等各自所處的區(qū)域。因此基于灰度特征建立人臉模板可以檢測人臉。
1.1.2形狀特征
從人臉子器官的形狀和相互位置關(guān)系出發(fā),提取人臉特征。人臉輪廓、眉毛輪廓、嘴唇輪廓、鼻側(cè)線等可以近似視為橢圓、弧線、線段組合等簡單的幾何單元。與灰度特征相比,形狀特征對光照變化具有一定的魯棒性。Graf等首先利用帶通濾波器選擇出一段頻率,然后根據(jù)形態(tài)學(xué)的知識設(shè)定一系列的閾值找出眼睛、嘴巴等區(qū)域,最后依照以上位置檢測出人臉。Leung等提出任意圖匹配的方法,其主要目的是用準(zhǔn)則正確表達(dá)出面部特征的幾何分布。
1.1.3結(jié)構(gòu)特征
人臉具有對稱性。正面人臉是左右對稱的,對應(yīng)的灰度特征和形狀特征基本相同。眉毛、眼睛、鼻子和嘴巴等區(qū)域是按照一定比例關(guān)系組織在一起的。各個器官自上而下排列,兩眼和嘴中心構(gòu)成一個三角形。
1.1.4紋理特征
人臉圖像具有一定的紋理特征?;叶裙采仃嚮蛘逩abor小波等頻域特征可以表征人臉圖像的紋理特性。
1.2基于后驗學(xué)習(xí)和訓(xùn)練的人臉檢測法
這一方法實際上是將人臉檢測問題轉(zhuǎn)化為統(tǒng)計模式識別的二分類問題。通過對大量的“人臉”與“非人臉”樣本進(jìn)行訓(xùn)練,得到“人臉”與“非人臉”分類器,通過判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽崿F(xiàn)人臉的檢測。此類人臉檢測方法主要有基于Adaboost級聯(lián)分類器的方法,基于概率模型的方法,基于支持向量機(jī)的方法等。
2.人臉識別
2.1特征臉(Eigenface)方法
以主成分(Principal Component Analysis ,PCA)分析理論為基礎(chǔ)的人臉識別方法稱為特征臉方法。PCA是通過K-L變換展開的網(wǎng)絡(luò)遞推實現(xiàn), K-L 變換是一種常用的特征提取方法,對消除模式特征之間的相關(guān)性、突出差異性有最顯著的效果。特征臉識別方法就是把含有人臉圖像的區(qū)域作為一種隨機(jī)向量,繼而用K-L變換得到其正交基底。這些基底中特征值較大的基底具與人臉的形狀相似,所以稱之為特征臉。而這些基底的線性組合可以表述和充分接近人臉的圖像,就可以對人臉進(jìn)行識別和合成。識別過程是首先得到由特征臉組成的子空間,將人臉圖像映射到該子空間上,進(jìn)而比較其與標(biāo)準(zhǔn)的人臉圖像在特征臉空間中位置的差異。
2.2奇異值分解方法
奇異值特征是一種代數(shù)特征,它用于反映圖像的本質(zhì)屬性。在某種程度上,奇異值特征除了具有比例不變性、旋轉(zhuǎn)不變性等重要性質(zhì),在某種程度上還具有代數(shù)和幾何的雙重穩(wěn)定性。利用這一特性,可以用奇異值分解對人臉圖像矩陣提取出圖像的代數(shù)特征后進(jìn)行匹配識別。在奇異值分解的基礎(chǔ)上利用奇異值分解方法可以產(chǎn)生多種人臉識別方法。例如基于圖像集似然度的人臉識別方法,是用人臉圖像集中每個人臉圖像的奇異值向量構(gòu)造出一個特征矩陣,再用待檢測人臉的特征矩陣與已知的各類人臉圖像的特征矩陣做似然度的對比,判斷待檢測人臉屬于人臉圖像集中的哪一類。
除了上述幾種典型的方法之外,灰度模板、可變形模板、彈性屬性圖、頻域特征表示法、光流形狀模型、光照錐模型等也是較常用的人臉表示方法。
2.3彈性圖匹配技術(shù)
彈性圖匹配技術(shù)是對幾何特征進(jìn)行分析的基礎(chǔ)上,結(jié)合對灰度分布信息進(jìn)行小波紋理分析的識別算法。早期,Lades等人提出了針對畸變不變性物體的動態(tài)鏈接模型,用稀疏圖形來描述物體,用局部能量譜的多尺度描述標(biāo)記頂點(diǎn),其拓?fù)溥B接關(guān)系用邊來表示且標(biāo)記為幾何距離,然后應(yīng)用塑性圖形匹配技術(shù)來尋找最近的已知圖形。隨后,Wiscot等人對改技術(shù)進(jìn)行了改進(jìn)。由于該方法保留了人臉圖像的空間信息,提取了描述人臉圖像的局部特征,并在一定程度上允許人臉從三維投影到二維引起變形的情況,因此這種方法具有典型代表性。
2.4人工神經(jīng)網(wǎng)絡(luò)方法
在人臉識別技術(shù)的發(fā)展過程中,神經(jīng)網(wǎng)絡(luò)的應(yīng)用研究從未停止。人工神經(jīng)網(wǎng)絡(luò)最早應(yīng)用于人臉識別技術(shù)的是一種單層的自適應(yīng)網(wǎng)絡(luò)WISARD。后期多使用多層感知器(MLP)識別人臉圖像,其方法是直接將原始的未經(jīng)任何處理的人臉灰度圖像送入MLP的輸入層,卻常常導(dǎo)致輸入節(jié)點(diǎn)的數(shù)目過多。為了解決這個問題,研究者們將圖像進(jìn)行采樣、分割或映射等處理后送到MLP中記性分類,大大提高了識別的精確度。除MLP外,研究人員還提出了許多不同的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),取得了較為理想的識別效果。
3.總結(jié)與展望
本文結(jié)合人臉檢測與識別技術(shù)的發(fā)展?fàn)顩r,對人臉檢測技術(shù)和人臉識別技術(shù)分別進(jìn)行了綜述。由于各方面對身份驗證這一人機(jī)交互技術(shù)需求的激增,作為身份驗證中最重要技術(shù)的人臉檢測與識別技術(shù)正日益受到重視。在世界范圍內(nèi)已經(jīng)成為了研究的熱點(diǎn)。人臉檢測與識別技術(shù)牽涉面十分廣泛,理論問題也非常多,目前出現(xiàn)形成一個專題的趨勢。
客觀的說,在目前條件下,實現(xiàn)100%成功的人臉檢測與識別幾乎是不可能的,由于社會各方面巨大的需求,同時也是巨大的動力,人臉檢測與識別技術(shù)這一研究熱點(diǎn)仍將不斷發(fā)展,新方法、新思路將會不斷涌現(xiàn),必將推動人臉檢測與識別技術(shù)進(jìn)一步產(chǎn)業(yè)化。