曹振軍++姜曉艷++張然++崔嵬++吳俊芹++李燕++都鑫++王貴麗
摘 要:針對人臉識別中的尺度與光照敏感問題,該文提出了一種基于Gabor濾波器的人臉自動識別算法。首先對原始人臉圖像進行Gabor小波分解,得到人臉的紋理特征圖像;然后利用流形學(xué)習(xí)的方法進行特征數(shù)據(jù)降維;最后采用LDA線性判別方法進行人臉的自動識別。實驗表明,該算法具有較強的人臉自動識別能力,能有效地解決不同姿態(tài)、不同光照條件下的人臉難以識別的問題,將該算法作為智能門禁系統(tǒng)的主程序,實現(xiàn)了智能門鎖的自動控制。
關(guān)鍵詞:人臉識別 Gabor濾波 LPP LDA
中圖分類號:TP368.1 文獻標識碼:A 文章編號:1672-3791(2014)10(c)-0001-01
在家庭安保系統(tǒng)中,有一項重要的工程—— 智能門禁系統(tǒng)。在這項工程中,關(guān)鍵技術(shù)是如何實現(xiàn)人臉的自動檢測與識別,現(xiàn)有的人臉檢測與識別基本依靠攝像機實時捕捉人臉圖像,與系統(tǒng)中的數(shù)據(jù)庫交互后實現(xiàn)門鎖的控制。然而基于傳統(tǒng)2D圖像的人臉識別的不足之處在于在復(fù)雜的環(huán)境中,比如光照隨時發(fā)生變化的場合、人臉處于不同姿態(tài)(表情)等情況,攝像機獲取的人臉圖像中人的面部外觀也會隨之發(fā)生變化,使得識別效果受到很大影響,影響到門禁系統(tǒng)的性能。
近年來,對圖像灰度進行多尺度、多方向的Gabor小波變換受到廣泛關(guān)注與研究,它的優(yōu)勢在于它可以提取出圖像特定區(qū)域內(nèi)的多尺度、多方向空間頻率特征,這樣,人臉圖像中的眼睛、鼻子、嘴等其他部位的局部特征被增強并提取。但是Gabor小波的缺陷在于多尺度、多方向分解導(dǎo)致的數(shù)據(jù)維數(shù)的大量增加,因此出現(xiàn)了以圖像特征匹配、PCA,MDS等為主的線性降維方法,以及以流形學(xué)習(xí)(LLE、LPP)為主要思想的非線性學(xué)習(xí)方法,流形學(xué)習(xí)的優(yōu)勢是在找出非線性高維數(shù)據(jù)的內(nèi)部結(jié)構(gòu)方面更為有效,且有助于數(shù)據(jù)分析和維數(shù)的降低。
該文首先利用Gabor小波變換提取圖像的局部紋理特征,然后用流形學(xué)習(xí)思想進行數(shù)據(jù)降維,進而利用LDA線性判別準則進行人臉的識別,提高人臉識別的速度與精度。
1 Gabor濾波器
Gabor變換[1]屬于加窗傅立葉變換,具有易于調(diào)諧的方向和徑向頻率帶寬以及易于調(diào)諧的中心頻率,利用Gabor函數(shù)掃描圖像可以得到頻域不同尺度、不同方向的紋理特征。另外Gabor函數(shù)與人眼的生物作用相仿,所以經(jīng)常用作紋理識別上,并取得了較好的效果。
將Gabor小波看作母小波是Gabor函數(shù)的小波變換,并對Gabor函數(shù)進行適當?shù)某叨群托D(zhuǎn)變換,就可以得到自相似的一組濾波器,稱為Gabor小波變換濾波器。將Gabor濾波器與圖像進行卷積運算,即可提取實時圖像中的紋理特征。
2 紋理特征提取
在對圖像應(yīng)用Gabor濾波時,除要確定濾波器的尺度和方向數(shù),還需要確定的參數(shù)有:各個濾波器的中心頻率,以及各個濾波器的二維標準差。
該文選取Gabor濾波器組的尺度和方向數(shù)均為4,則濾波器組中共有方向和尺度各不相同的濾波器16個,得到不同方向和尺度的16個Gabor濾波器以后,對圖像進行Gabor濾波。由于濾波后輸出的只是圖像能量信息,沒有位置信息,為解決這一問題,將圖像劃分為9個子塊,對每一個子塊分別進行Gabor濾波,計算出每個子塊的能量,這樣對每一幅圖像就會得到169個紋理特征值。既確保了圖像的能量信息,反映了紋理特征,又代表了圖像的一定空間位置信息[2]。
3 基于流形學(xué)習(xí)的人臉識別
流形學(xué)習(xí)旨在發(fā)現(xiàn)高維數(shù)據(jù)集分布的內(nèi)在規(guī)律性,其基本方法是:找到高維空間中的低維流形,并求出相應(yīng)的嵌入映射,以實現(xiàn)維數(shù)約簡或者數(shù)據(jù)可視化。LPP算法[3]作為LE的線性化是其中最早提出的算法,其主要思想是建立k近鄰域圖,使它能很好地表現(xiàn)數(shù)據(jù)流形的局部結(jié)構(gòu),然后根據(jù)建立的k鄰圖來獲得圖像的投影,最終在投影得到的子空間中進行特征識別。
該文先對Gabor濾波得到的紋理特征應(yīng)用LPP算法降低紋理特征數(shù)據(jù)的維數(shù),考慮到流形學(xué)習(xí)得到的只是從流形角度提取數(shù)據(jù)結(jié)構(gòu),沒有利用類別的先驗知識,因此本文對得到的低維數(shù)據(jù)進行線性判別分析[4],進一步提升識別率。
4 實驗
該文在表情、姿態(tài)、光照發(fā)生變化的情況下,對該文提出的算法進行實驗。采用ORL人臉數(shù)據(jù)庫,這些圖像的變化主要在于面部輪廓及表情、人臉尺度位置、少許傾斜、少許遮掩和輕微光照變化。
實驗步驟:首先,進行單次實驗,選擇每人的5副圖像組成訓(xùn)練集,剩余的構(gòu)成測試集,得到一組識別結(jié)果,然后進行不同訓(xùn)練數(shù)目的循環(huán)實驗,每個實驗獨立運行20次,每次都是隨機抽取樣本,最后結(jié)果取20次的均值;其次,隨機選取規(guī)定樣本數(shù)目的樣本圖像進行訓(xùn)練,并用其余圖像構(gòu)成測試集。通過對不同訓(xùn)練樣本的反復(fù)實驗,得到不同訓(xùn)練樣本數(shù)目下的識別性能。
實驗結(jié)果可見,文中的算法相比于Gabor濾波、LDA、NPE等傳統(tǒng)人臉識別算法,取得了更優(yōu)的識別效果,在樣本數(shù)量充足的前提下,識別率達到97.6%,充分驗證了算法對人臉特征的提取與識別能力。將該算法運用到智能門禁系統(tǒng)中,進行了300次不同的實驗,系統(tǒng)響應(yīng)平均時間(系統(tǒng)響應(yīng)時間即從系統(tǒng)接收圖像到輸出人臉識別結(jié)果經(jīng)歷的時間)為1.2 s,正確識別率97.5%??梢?,該文的算法識別率較高,且實時性好。
5 結(jié)語
該文在Gabor小波得到紋理特征的基礎(chǔ)上,結(jié)合LPP算法與LDA線性判別,在一定程度上提升了人臉識別算法的檢測與識別能力,ORL人臉數(shù)據(jù)庫上的實驗驗證了該算法的有效性。最后將該算法與智能門禁系統(tǒng)相結(jié)合驗證了算法的實時性,為基于Gabor濾波的人臉識別在智能門禁系統(tǒng)中的應(yīng)用提供了可靠的現(xiàn)實意義。
參考文獻
[1] 胡鵬,李建為.基于Gabor小波和流形的人臉識別研究[J].自動化技術(shù)與應(yīng)用, 2009,28(7):57-59.
[2] Arivazhagan S,Ganesan L,Priyal S P.Texture classification using Gabor wavelets based rotation invariant features[J].Pattern Recognition,2006,27(16)1976-1982.
[3] 張志偉,楊帆,夏克文,等.一種有監(jiān)督的LPP算法及其在人臉識別中的應(yīng)用[J].電子與信息學(xué)報,2008,30(3):539-541.
[4] 王海珍.基于LDA的人臉識別技術(shù)研究[D].西安電子科技大學(xué),2010.