魏書會,劉翠響,王寶珠,史 琳
(河北工業(yè)大學(xué) 信息工程學(xué)院,天津 300401)
在計算機視覺和模式識別領(lǐng)域中,人臉識別技術(shù)是最近幾年比較流行的技術(shù)研究。人臉識別技術(shù)被廣泛應(yīng)用在公共安全系統(tǒng)和人機交互領(lǐng)域,例如人臉識別機,電子身份證,電子護照等。一般地,人臉識別算法分為兩類:基于特征匹配的算法、基于表征的算法。
人臉特征提取是指利用一種方法對原始圖像進行信息提取,這些信息能夠完全描述圖像的特征信息。傳統(tǒng)的小波變換如Gabor小波[1]在識別過程中存在缺憾,它的平移不變性過低而引起的小波本身對數(shù)據(jù)不夠敏感、方向性差、提取到的特征信息亦無空間信息[2]。雙密度雙樹復(fù)小波是Selesnick在2004年提出的一種小波變換[3],該變換綜合了雙密度小波和雙樹小波的優(yōu)點,同時具有平移不變性和抗混疊性、尺度變換不明顯、以及良好的方向性等特點。柴智在文獻[4]中提到復(fù)小波提取的特征信息缺少和兩個重要方向的信息,因此在這里加入Gabor小波提取的90°和0°方向的特征信息,從而有效的解決了特征信息提取問題。
人臉圖像特征信息的信息量過大,維數(shù)較高,需對特征數(shù)據(jù)進行降維。主流的降維方法主要分為線性降維和非線性降維。其中線性降維方法主要包括主成分分析(PCA)[5]、線性判別分析法(LDA)[6]、多維尺度變換(MDS)[7]等;人臉的數(shù)據(jù)結(jié)構(gòu)一般都是非線性的,假設(shè)這些數(shù)據(jù)都處在一個潛在的流形上,對于不同的假設(shè)方法則對應(yīng)于不同的流形性質(zhì),進而衍生出了不同的流行學(xué)習(xí)算法,比較主流的流行算法有:局部線性嵌入算法(LLE)、等距映射算法(Isomap)、局部切空間排列算法(LTSA)、拉普拉斯映射算法(LE)等。
局部切空間排列算法(LTSA)是Zhang等人于2004年提出的一種流行學(xué)習(xí)算法。此算法是對每個樣本點實施局部PCA降維,并對局部的仿射坐標(biāo)進行全局降維然后進行全局排列,得到全局的低維流行。但該算法不能處理較大的樣本集,不能有效地處理新樣本點。Zhang等人針對LTSA不能直接用于人臉識別的缺陷提出的能夠應(yīng)用于人臉識別的線性局部切空間排列算法;楊劍等提出的改進的適合增量學(xué)習(xí)的LTSA算法[8];Wang等人提出的利用鄰域收張策略的Adaptive LTSA算法。本文在LTSA的基礎(chǔ)上,其不能處理新樣本點的特點,對LTSA算法進行改進。PLTSA是將2DPCA與LTSA兩種算法相結(jié)合產(chǎn)生形成的。利用X-均值算法將樣本點劃分為小塊,劃分個數(shù)遠(yuǎn)小于樣本個數(shù)。然后利用2DPCA計算各個樣本塊的局部坐標(biāo),再利用局部樣本塊坐標(biāo)在最優(yōu)搜索策略的基礎(chǔ)上構(gòu)建全局坐標(biāo)。
雙密度雙樹復(fù)小波變換是基于多分辨率的方法處理圖像,是實小波變換實現(xiàn)的復(fù)小波變換,它兩組并行的實數(shù)濾波器組,當(dāng)原始數(shù)據(jù)通過這兩組濾波器后即可得到得兩組系數(shù),分別為小波系數(shù)的實部和虛部。與一般的復(fù)小波變換類似,雙密度雙樹復(fù)小波變換通過對低通子帶的遞歸變換完成確定層數(shù)的分解。其結(jié)構(gòu)示意如圖1所示。
圖1 雙密度雙樹結(jié)構(gòu)圖Fig.1 Dual-density dual-tree diagram
雙密度雙樹小波變換的濾波器組由兩組3對濾波器組成,當(dāng)輸入數(shù)據(jù)時兩組濾波器同時作用,得到濾波系數(shù)。該濾波器組由 2 個尺度函數(shù) φh(t),φg(t),4 個小波函數(shù) ψh,i(t),ψg,i(t)(i=1,2), 其中的兩個小波函數(shù)是由另兩個小波函數(shù)偏移半個單位構(gòu)成。
這里的4個小波函數(shù)應(yīng)構(gòu)成近似的希爾伯特變換對以便改善小波的平移不變性,即:
雙密度雙數(shù)小波變換有兩組平行的希爾伯特濾波器,每組由 3 個 Hilbert濾波器構(gòu)成,h0,g0為低通濾波器,h1,g1為一階高通濾波器,h2,g2為二階高通濾波器。在對輸入數(shù)據(jù)進行分解時有多分辨率特性,當(dāng)層數(shù)過多時低頻子帶的信息已經(jīng)丟失過多,得到的各個人臉特征信息區(qū)別度已經(jīng)不大,所以我們不對圖像進行過多太層數(shù)的分解,本文中我們選用3層信息分解。而且由于圖像的邊緣信息以及眼睛鼻子嘴巴等輪廓信息包含在高頻子帶中,所以一般選取高頻信息作為特征向量。
Gabor小波是一種在人臉識別領(lǐng)域被充分利用的小波,它可以在多尺度多方向上提取人臉圖像的特征信息。Gabor小波對空間域和頻率域有良好的分辨能力,但是它提取的特征信息有重疊和遺漏。傳統(tǒng)的Gabor小波定義為:
其中 u,v分別表示小波函數(shù)的尺度和方向,x=(x,y)表示當(dāng)前像素點的坐標(biāo),ku,v定義為:
kmax代表能夠獲得的最大頻率,f是頻域中Gabor核之間的間隔因子。通過將人臉圖像的圖像矩陣與Gabor小波卷積即可得到圖像的Gabor特征表示:
其中?表示卷積,I(x,y)表示人臉灰度圖像。文中選擇3個尺度2個方向。
局部切空間排列算法屬于流形的學(xué)習(xí)算法范疇,它通過逼近每一個樣本點所在的切空間坐標(biāo)以獲得局部的低維結(jié)構(gòu),然后利用獲得的低維幾何結(jié)構(gòu)來構(gòu)建整體的低維嵌入坐標(biāo)。但是由于LTSA算法無法對較大的樣本集進行處理,也無法對新的樣本點進行計算,所以根據(jù)文獻[8]對LTSA的改進,彌補了初始算法中的缺陷,使得LTSA能夠應(yīng)用于人臉識別的降維算法。
PLTSA是將2DPCA與LTSA兩種算法相產(chǎn)生形成的。它先是用X-均值算法,將樣本劃分為具有最優(yōu)劃分個數(shù)的小塊,這些樣本塊是會發(fā)生重疊的。然后將這些樣本塊的類聚中心找到,利用這些樣本塊的局部切空間坐標(biāo)求出整體的低維坐標(biāo)。在PLTSA中采用貝葉斯估計,對最優(yōu)聚類數(shù)實施搜索策略。利用局部樣本塊坐標(biāo)信息,在最優(yōu)搜索策略基礎(chǔ)上進行全局坐標(biāo)估計。
采用3級DD-DT-CWT對人臉圖像進行濾波,得到3*16個實子帶幅值特征;將每一個幅度特征矩陣按列方向展開,排成列向量,用 Vi,j(i=1,2,3;j=1,2,3,…,16)表示,i代表層數(shù)即尺度,j代表方向信息,圖像的特征信息X由48個子帶對應(yīng)的列向量鏈接構(gòu)成 X=(VT1,1,VT1,2,…,VT3,6)T(T 表示轉(zhuǎn)置)。
采用Gabor小波對人臉圖像進行濾波,得到0°,90°特征信息;將這些特征信息按列展開,組成列向量,用wu,v=(u=1,2,…,m;v=1,2)表示,u 代表尺度,v 代表方向,由此得到Gabor小波提取的兩個重要方向信息 Y=(wT1,1,wT1,2,…,wTm,2)T;
將得到的DD-DT-CWT特征信息與Gabor特征信息鏈接起來構(gòu)成特征向量 T=(xT,yT)T(T 表示轉(zhuǎn)置)。
利用改進的局部切空間排列算法將基于雙密度雙樹小波變換與Gabor小波變換得到的多維特征向量降維,這樣既可以在流行的高位空間進行降維又可以對新的樣本點進行處理。人臉識別算法描述如下:
1)利用基于DD-DT-CWT與優(yōu)化的Gabor的特征提取算法對測試樣本集進行特征提取,得到特征數(shù)據(jù)集T;
2)用基于劃分的局部切空間排列算法對數(shù)據(jù)集T進行降維,得到訓(xùn)練圖像的子空間變換矩陣P以及訓(xùn)練樣本進行子空間投影后的數(shù)據(jù)集XT=PTT;
3)將測試圖像進行雙密度雙樹復(fù)小波和Gabor小波變換,得測試樣本的特征向量;
4)根據(jù)訓(xùn)練樣本集求出的子空間變換矩陣P對測試圖像的特征向量進行子空間投影YT=PTT;
5)通過最近鄰分類方法,將測試圖像的特征向量與訓(xùn)練集的特征向量做比對,根據(jù)得到的比對結(jié)果計算識別率。
文中提出的識別方法分別在ORL和YALE人臉數(shù)據(jù)庫上進行驗證。YALE人臉庫:總共包括15個人,每人有11幅圖片,在光照、表情、遮擋等方面做了變化。ORL人臉庫是40個人的人臉圖像組成的人臉數(shù)據(jù)庫,每人10幅圖片,共400幅圖片。通過選取不同的訓(xùn)練樣本測試本文算法的有效性。下表為不同的算法的識別結(jié)果:
表1 YALE不同訓(xùn)練樣本時平均識別率Tab.1 Them ean recognition rate of different train sam ple of YALE
表2 ORL不同訓(xùn)練樣本時平均識別率Tab.2 Themean recognition rate of different train sample of ORL
由不同的試驗方法進行的實驗可以看出利用文中方法得到的人臉識別方法是可行的。采用雙密度雙樹復(fù)小波與Gabor小波結(jié)合的方法提取的特征信息,在細(xì)節(jié)上更加具體,通過使用改進的局部切空間排列算法亦彌補了傳統(tǒng)方法不能處理新樣本點的缺憾,既降低了人臉數(shù)據(jù)的維數(shù)又保持了人臉的拓?fù)浣Y(jié)構(gòu),使之能夠用于人臉識別。
[1]Mutelo R,Woo W,Dlay S.Discriminant analysis of the two dimensional gabor features for face recognition [J].IET Computer Vision,2008,2(2):37-49.
[2]王仕民,葉繼華,鄧濤,等.2維雙樹復(fù)小波不確定度加權(quán)融合的人臉識別[J].中國圖象圖形學(xué)報,2012,17(8):995-1001.WANG Shi-min,YE Ji-hua,DENG Tao,et al.Two-dimensional dual-tree complex wavelet transform uncertainty weighted fusion in face recognition[J].Journal of Image and Graphics,2012,17(8):995-1001.
[3]Selesnick IW.The double-density dual-tree[J].IEEE Transactions on Signal Processing,2004,52(5):1304-1314.
[4]柴智,劉正光.基于復(fù)小波和Gabor小波的人臉識別[J].計算機工程,2011,37(4):180-183.CHAI Zhi,LIU Zheng-guang.Face recognition based on complex wavelet and Gabor wavelet[J].Computer Engineering,2011,37(4):180-183.
[5]Turk M,Pentland A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[6]Belhumeur P N,Hespanha J P,Kriegman D J.Eigenface vs Fisher face:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[7]Kruska J B,Wish M.Multidimensional scaling[M].Beverly Hills and Lodon :Sage Publications,1978:133-160.
[8]楊劍,李伏欣,王玨.一種改進的局部切空間排列算法[J].軟件學(xué)報.2005,16(9):1584-1590.YANG Jian,LI Fu-xin,WANG Jue.An improved local tangent space alignment algorithm[J].Journal of Software,2005,16(9):1584-1590.