任 燕,史亞貝
(河南工業(yè)職業(yè)技術(shù)學(xué)院,河南 南陽 473009)
基于Gabor小波的人臉年齡識別
任燕,史亞貝
(河南工業(yè)職業(yè)技術(shù)學(xué)院,河南 南陽 473009)
摘要:年齡識別是基于人臉的面部特征做出分析。由于人臉是塑性變形體,以及人的情感的不可捉摸,使得識別效率受到限制。通過使用Gabor小波提取人臉圖像的特征,并對這些特征進(jìn)行PCA降維。降維后的特征進(jìn)入智能單粒子神經(jīng)網(wǎng)絡(luò)分類器(Intelligence Single Particle Optimization Neural Network Classifier,ISPONNC ),對輸入的人臉圖像的年齡進(jìn)行識別和分類。年齡識別分為3類 (Baby、Young 和 Old),識別率約為85%。通過對面部年齡進(jìn)行識別,希望能對建立人性化的人機(jī)交互系統(tǒng)有所貢獻(xiàn)。
關(guān)鍵詞:Gabor小波;特征提??;年齡識別
由于年齡的不同,人們的面部特征是不斷變化的,不同年齡階段也會表現(xiàn)出不同的性格和心理特征。要想實(shí)現(xiàn)更好的人機(jī)交互,只識別面部和表情是遠(yuǎn)遠(yuǎn)不夠的,若是能夠判斷出所服務(wù)人的年齡,根據(jù)他們的普遍性格和喜好來進(jìn)行服務(wù),將會使人工智能更加人性化。
目前,年齡識別都是基于人臉的面部特征做出分析,由于人臉是塑性變形體,以及人的情感的不可捉摸,使得識別效率受到限制。本文通過試驗(yàn),對年齡進(jìn)行識別,希望能對建立人性化的人機(jī)交互系統(tǒng)有所貢獻(xiàn)。
1Gabor特征提取與PCA降維
1978年,Granlund提出了二維Gabor小波,達(dá)到了空間頻率的極限。二維Gabor小波的函數(shù)表達(dá)式[1]如下所示:
(1)
式中,f是正弦波中心頻率;θ是高斯波與平面波的逆時針旋轉(zhuǎn)角度;γ、η是頻率與尺度的比例常數(shù);α是沿長軸方向的高斯波平行于平面波的尺度;β是沿短軸方向的高斯波垂直于平面波的尺度;xr、yr是矢量位置坐標(biāo)。
圖1 待提取特征的 人臉圖像
不同方向、不同尺度組成的Gabor小波集,可以提取人臉圖像不同部位的面部特征[2]。將人臉特征應(yīng)用于年齡識別,比較關(guān)心的是人臉的額頭、眼睛和嘴巴這3個區(qū)域的特征。在年齡識別的人臉數(shù)據(jù)庫中,任選一張人臉圖像(見圖1),圖像大小為100×100。將這幅圖像轉(zhuǎn)為灰度圖像,然后使用人臉切割技術(shù)切分為額頭(80×30)、眼睛(90×30)和嘴巴(70×35),共3個部分。
以眼睛部分為例,將眼睛圖像與圖1中的40個二維Gabor小波集分別卷積,得到的人臉圖像的Gabor特征集如圖2所示。從圖2可以看出:第1列與第5列提取的人臉面部特征最為明顯;第1列的Gabor小波是0°方向的,提取的圖像特征是與0°方向垂直的,即垂直方向上的,是圖像的輪廓特征;第5列的Gabor小波是90°方向的,提取的圖像特征是與90°方向垂直的,即水平方向上的,包含了眉毛和眼睛特征。
圖2 用于年齡識別的眼睛Gabor特征集
使用Gabor小波提取的特征維數(shù)很高,以大小為100×100的用于表情識別的人臉圖像為例,切分為眼睛(80×30)、鼻子(25×50)和嘴巴(50×25),共3個部分。對于眼睛部分,經(jīng)過40個Gabor小波集進(jìn)行特征提取后,得到的特征大小為80×30×40。3部分特征合在一起,總的特征大小為(80×30+25×50+50×25)×40。這樣的特征是很大的,不利于后期對這些特征進(jìn)行神經(jīng)網(wǎng)絡(luò)架構(gòu)下的訓(xùn)練和分類,必須對這些特征進(jìn)行降維[3]。
本文采用下采樣(Down Sample)和主成分分析(Principle Component Analysis,PCA)方法,對提取的Gabor特征進(jìn)行降維。
2ISPONNC介紹
在本系統(tǒng)中,使用基于智能單粒子算法的神經(jīng)網(wǎng)絡(luò)分類器對人臉的年齡進(jìn)行識別。神經(jīng)網(wǎng)絡(luò)分類器的輸入為經(jīng)PCA降維后的人臉特征矢量,輸出為各類別對應(yīng)輸出節(jié)點(diǎn)上的響應(yīng)值。響應(yīng)值最大的節(jié)點(diǎn)對應(yīng)的類別將被判定為當(dāng)前特征的所屬的類別[4-5]。
本文提出使用智能單粒子優(yōu)化算法(Intelligence Single Particle Optimization, ISPO) 訓(xùn)練多層神經(jīng)網(wǎng)絡(luò)分類器。這種基于智能單粒子算法的神經(jīng)網(wǎng)絡(luò)分類器簡稱ISPONNC,其訓(xùn)練流程如圖3所示。試驗(yàn)證明,相比較于基于梯度下降法的BP網(wǎng)絡(luò)分類器,ISPONNC訓(xùn)練速度更快,分類誤差更小。
圖3 ISPONNC訓(xùn)練流程
3系統(tǒng)實(shí)現(xiàn)
在具體實(shí)現(xiàn)中,Gabor特征提取和PCA降維使用MATLAB實(shí)現(xiàn),ISPONNC使用Python實(shí)現(xiàn)。使用VB. NET制作年齡識系統(tǒng)界面,系統(tǒng)界面由兩部分組成:左邊的區(qū)域顯示了人臉識別的具體步驟;而右邊區(qū)域則顯示了輸入的圖像文件庫。在左邊的區(qū)域中,自左上到右下分別顯示了原始圖像、人臉切割結(jié)果、特征矢量提取結(jié)果以及特征分類結(jié)果4個部分。打開人臉數(shù)據(jù)庫,讀入任意樣本,系統(tǒng)輸出如圖4所示。
圖4 使用識別系統(tǒng)對人臉進(jìn)行年齡識別
可見系統(tǒng)成功對人臉圖像的年齡進(jìn)行了識別分類。類似的,通過修改輸入的人臉圖塊及分類器目標(biāo),可以對人臉圖像的表情做出分類識別。試驗(yàn)表明,系統(tǒng)對人臉年齡的識別準(zhǔn)確率約為85%。
4結(jié)語
本試驗(yàn)中,年齡數(shù)據(jù)中的圖片來自于網(wǎng)絡(luò),Baby、Young和Old共3個年齡段,每個年齡段30張圖片,共計(jì)90張圖片。試驗(yàn)表明,系統(tǒng)對年齡的識別準(zhǔn)確率約為85%。
雖然基于人臉圖像的年齡識別的識別率夠高,但本系統(tǒng)還存在一些問題。例如,系統(tǒng)的訓(xùn)練樣本不夠大,分類不夠細(xì)致等。如何提高系統(tǒng)的性能,將是今后的研究方向。
參考文獻(xiàn)
[1] Shen L L, Bai L. A review on Gabor wavelets for face recognition[J]. Pattern Analysis and Applications, 2006, 9(2): 273-292.
[2] Shen L L, Bai L. Information theory for Gabor feature selection for face recognition[J]. Eurasip Journal on Applied Signal Processing, 2006,2006:1-11.
[3] 張向東,李波.基于Gabor小波變換和PCA的人臉識別方法[J].電子科技,2007(4): 72-74.
[4] 聶祥飛,郭軍.利用Gabor小波變換解決人臉識別中的小樣本問題[J]. 光學(xué)精密工程, 2007(6): 973-977.
[5] 陳伏兵,楊靜宇. 分塊PCA及其在人臉識別中的應(yīng)用[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2007(8): 1889-1892,1913.
責(zé)任編輯鄭練
Age Recognition based on Gabor Wavelets
REN Yan, SHI Yabei
(Henan Polytechnic Institute, Nanyang 473009, China)
Abstract:Age recognition means making the analysis based on facial features. Since face is the plastic deformation and the unpredictable of human emotion, the recognition efficiency is limited. Use Gabor wavelet to extract the feature of the face image and to reduce the dimension of the characteristics. After the dimensionality reduction, the characteristics are put into ISPONNC (Intelligence Single Particle Optimization Neural Network Classifier) to recognize and classify the age of the face image. Age recognition is divided into three categories (Baby, Young and Old), and the recognition rate is about 85%. Through the way of experiment on face age recognition, it is done to contribute to build humanized human-computer interaction system.
Key words:Gabor wavelets, feature extraction, age recognition
收稿日期:2015-01-16
作者簡介:任燕(1983-),女,助教,碩士,主要從事模式識別、柔性制造等方面的研究。
中圖分類號:TP 273
文獻(xiàn)標(biāo)志碼:A