何俊 蘆明
摘要:為了改善傳統(tǒng)的人臉識別Fisherface方法的識別率和穩(wěn)定性,采用LDA + PCA組合的兩步人臉識別過程來消除小樣本問題;通過融合LDA和PCA特征空間,使類內(nèi)離散度最小而類間離散度最大,來解決統(tǒng)計(jì)相關(guān)問題。通過約束空間維數(shù)和采樣維數(shù)來提高識別率和穩(wěn)定性。最后,在ORL人臉庫上進(jìn)行實(shí)驗(yàn),結(jié)果表明該方法是有效的,識別率較高,而且識別結(jié)果比較穩(wěn)定,滿足實(shí)際應(yīng)用的要求。
關(guān)鍵詞:人臉識別;LDA特征;PCA特征;特征空間融合
中圖分類號: TP319? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)35-0184-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
An Improved Face Recognition Method Based on LDA and PCA
HE Jun, LU Ming
(School of Computer Science and Software Engineering, University of Science and Technology Liaoning, Anshan 114051,China)
Abstract: In order to improve the recognition rate and stability of Fisherface method in traditional face recognition, a two-step face recognition process combining LDA and PCA is used to eliminate the small sample problem, and the statistical related problems are solved by fusing LDA and PCA feature space to minimize the within-class scatter and maximize the between-class scatter. The recognition rate and stability are improved by constraining the spatial dimension and sampling dimension. Finally, experiments on ORL face database show that the method is effective, the recognition rate is high, and the recognition results are stable, which meets the requirements of practical application.
Key words: face recognition; LDA feature; PCA feature; feature space fusion
自從美國 “9.11”事件后,人的身份認(rèn)證問題不僅涉及銀行存款、電子商務(wù)、金融安全等方面,而且已經(jīng)提升到了國家安全的高度。人的身份認(rèn)證通常是通過生物特征識別方法來完成,而在所有的方法中,人臉識別是特征錄入比較方便的身份認(rèn)證方法之一。
人臉識別的關(guān)鍵性技術(shù)問題在于特征提取和特征識別。由于人臉特征對噪聲、光照以及表情等都十分敏感,加之傳統(tǒng)人臉識別算法的識別率、魯棒性和計(jì)算復(fù)雜度等方面都還遠(yuǎn)遠(yuǎn)達(dá)不到實(shí)際使用的要求[1]。因此,如何尋求一種準(zhǔn)確率高、魯棒性強(qiáng)、計(jì)算復(fù)雜度低的人臉識別算法成為目前亟待解決的問題。
1 國內(nèi)外相關(guān)研究工作
在最近30年,人臉識別發(fā)展迅速。人臉識別算法有:基于幾何特征的人臉識別方法[2];基于特征臉的人臉識別算法[3];基于模板匹配的人臉識別算法[4];基于人工神經(jīng)網(wǎng)絡(luò)的識別算法[5];等灰度線法[6];基于特征融合的人臉識別算法[7];隱馬爾可夫模型方法[8]等許多種。上述各人臉識別算法的識別率都還遠(yuǎn)遠(yuǎn)不能達(dá)到實(shí)際使用的要求。
為了提高識別率,Turk等[9]首次引入了主成分分析(PCA)的子空間思想,與特征臉法相結(jié)合,后來獲得了較大的成功。子空間分析分為線性和非線性空間變換兩種,由于線性子空間方法的數(shù)學(xué)理論基礎(chǔ)堅(jiān)實(shí),用到了許多矩陣?yán)碚撝邢嚓P(guān)的知識,近些年,線性子空間方法發(fā)展出線性鑒別分析(Fisherface)[10],獨(dú)立成分分析[11]和非負(fù)矩陣分解[12]等諸多研究分支。
2 傳統(tǒng)的Fisherface方法
Fisherface人臉識別方法是基于線性鑒別分析(Linear Discriminant Analysis, LDA )思想而演變過來的。LDA方法的目的是盡可能提取出較多的最具有鑒別能力的低維特征。具體過程:設(shè)有L個模式類別,X = (x1, x2, ..., xn)是N個n維的訓(xùn)練樣本,樣本類間離散度矩陣Sb滿足下式:
[wTμi-wTμ02=wTSbw]? ? ? ? ? ? ? ? ?( 1 )
其中?i是xi類的均值,?0是所有樣本類的均值,w是y=wTx的變換矩陣。
樣本類內(nèi)離散度矩陣Sw滿足下式:
[Sw2=i=1LwTxi-μi xi-μiTw]? ? ? ? ? ? ? ? ? ?( 2 )
其中?i是xi類的均值,w是y=wTx的變換矩陣。分析得出Fisher準(zhǔn)則函數(shù)的最優(yōu)變換如下:
[Jw =wTSbwwTSww]? ? ? ? ? ? ? ? ? ? ? ? ? ? ?( 3 )
由上述分析可見,對應(yīng)于矩陣較大的特征值的特征向量,該矩陣最多只有L-1個非零特征值,L是類別數(shù)目。
在人臉識別的實(shí)際應(yīng)用中,由于傳統(tǒng)的LDA方法訓(xùn)練樣本的個數(shù)通常低于實(shí)際人臉圖像的像素?cái)?shù),因此出現(xiàn)了所謂的小樣本問題。同時(shí)存在另外一個嚴(yán)重的問題:各個樣本之間的統(tǒng)計(jì)相關(guān)性的問題。這就需要探尋Fisher準(zhǔn)則函數(shù)達(dá)到最優(yōu)的那個線性變換wopt。為了提高人臉識別的準(zhǔn)確率,增強(qiáng)其魯棒性,降低計(jì)算復(fù)雜度,本文對傳統(tǒng)的人臉識別算法進(jìn)行詳細(xì)的分析,總結(jié)出其在特征提取和識別中存在的準(zhǔn)確性差,識別率低,效率低等諸多方面缺點(diǎn),這些缺點(diǎn)基本歸結(jié)為兩方面問題:一方面是訓(xùn)練集的小樣本事件,另一方面是樣本的統(tǒng)計(jì)相關(guān)性。針對上述兩方面問題,本文提出了相應(yīng)的解決方案。
(1)解決小樣本問題,采用了LDA + PCA 組合的兩步人臉識別過程,相當(dāng)于對原始的樣本數(shù)據(jù)進(jìn)行兩次投影變換。首先,對人臉圖像進(jìn)行分塊;然后采用LDA方法將人臉圖像特征降維到一個適當(dāng)?shù)目臻g,在降維的人臉特征子空間中利用行和列方向最優(yōu)鑒別矢量集進(jìn)一步降維,最后進(jìn)行特征識別。
(2)解決統(tǒng)計(jì)相關(guān)性問題,主要采用將LDA特征子空間與PCA特征子空間融合,使類內(nèi)離散度最小而類間離散度最大,即PCA分塊所用的特征向量是相互正交的。為了提高識別率、增強(qiáng)其魯棒性以及減少算法的復(fù)雜性,這里對空間維數(shù)和采樣維數(shù)給予一定的約束,改進(jìn)了其中的維數(shù)選擇算法。
3 對Fisherface方法的改進(jìn)
3.1 改進(jìn)后的Fisherface方法的算法流程
設(shè)訓(xùn)練樣本集的個數(shù)為P,有L個類;Gb 和Gw 分別代表圖像類間離散度矩陣和圖像類內(nèi)離散度矩陣,均為n×n維的非負(fù)定矩陣。改進(jìn)后的人臉識別算法,其流程如下:
(1) 把訓(xùn)練集中的人臉圖像表示為一個向量,設(shè)為A=[A1,A2,...,Ad],訓(xùn)練樣本集的平均向量表示為A,進(jìn)而求得訓(xùn)練向量與平均向量的差值A(chǔ)i –A。
(2) 計(jì)算出圖像的類間離散度矩陣Gb:
[Gb=i=1LPi Ai -AiTAi -Ai]? ? ? ? ? ? ? ? ?( 4 )
(3) 計(jì)算圖像的類內(nèi)離散度矩陣Gw:
[Gw=i=1LPi ·1Mij=1Mi A(i)j-A(i)T A(i)j-A(i) ]? ? ? ? ? ?( 5 )
其中,Pi (i =1,2,…, L) 是第i類的先驗(yàn)概率,Mi為第i類所屬空間矩陣。
(4) 由[G-1w · Gb · G-1w · GbT]中的前d個最大特征值所對應(yīng)的特征向量構(gòu)建LDA判別空間矩陣MLDA 。
(5) 由Gb?Gw中的前d個最大特征值所對應(yīng)的特征向量構(gòu)成PCA判別空間矩陣MPCA 。
(6) 融合LDA與PCA的特征判別空間矩陣,得到最佳判別空間Mopt:
Mopt = [MTLDA · MTPCA]? ? ? ? ? ? ? ? ? ? ? ( 6 )
為了提高識別率、增強(qiáng)其魯棒性以及減少算法的復(fù)雜性,需要合理地選擇n和d的值??紤]到在PCA變換中最多有n-1個非零特征值,有必要對最佳描述空間的維數(shù)n進(jìn)行約束,n值過大會導(dǎo)致Gw發(fā)生畸變,因此最佳特征判別空間的維數(shù)n必須小于Gw的秩,即滿足如下條件:n <= min(P–L, rank(Gw))。d值的選擇本文主要采用以下方法來加以改進(jìn):
(1)在特征空間中,基于投影特征矩陣 Y=[SM1,SM2,...,SMn]重新構(gòu)建類間離散度矩陣Gb和類內(nèi)離散度矩陣Gw 。
(2) 選擇矩陣[G-1w · Gb]的前d個最大特征值所對應(yīng)的d個單位正交的特征向量 m1, m2, ... , md,構(gòu)建變換矩陣[M'LDA]= [m1, m2, ... , md ]。
(3) 選擇矩陣Gb?Gw的前d個最大特征值所對應(yīng)的d個單位正交的特征向量 w1, w2, ..., wd,構(gòu)建變換矩陣[M'PCA]= [w1, w2, ... , wd]。
(4) 由(2)和(3)得到融合空間矩陣:
[M'opt]=[ M'LDAT·? M'PCAT]? ? ? ? ? ? ? ? ?( 7 )
(5)通過變換Z=Y·[M'opt],將特征矩陣Y投影到n×d維子空間。
通過上述步驟限定了d的取值,從而使得算法的復(fù)雜度有所降低。
4 實(shí)驗(yàn)結(jié)果與分析
本文實(shí)驗(yàn)樣本取自原ORL(Olivetti Research Laboratory)人臉數(shù)據(jù)庫,ORL人臉庫由40個人臉,每個人臉由10幅112×92圖像組成,圖像背景為黑色,其中有些圖像是拍攝于不同時(shí)期的,人的臉部表情和臉部細(xì)節(jié)有著不同程度的變化,其中包含了一定的光照變化、表情變化、面部細(xì)節(jié)變化及一定范圍內(nèi)的深度旋轉(zhuǎn),人臉的尺度也有多達(dá)10%的變化。圖1展示了ORL人臉庫中的人臉圖像示例。
采用最近鄰分類器進(jìn)行分類,各種特征提取方法都是直接利用ORL人臉庫中的不經(jīng)過任何預(yù)處理的原始圖像矩陣。通過與已有的傳統(tǒng)人臉識別方法PCA方法,Eigenface方法和Fisherface方法識別的有效性和穩(wěn)定性的對比,來考察本方法的性能。
圖2表示在選取相同數(shù)目的訓(xùn)練樣本條件下,PCA方法,Eigenface方法和Fisherface方法和本方法四種鑒別方法識別率的比較。這里每類分別選取 5、7...15個訓(xùn)練樣本。從圖2可以看出,本方法識別率比較準(zhǔn)確,而且性能整體上相對穩(wěn)定。
5 結(jié)論
本文對傳統(tǒng)的Fisherface人臉識別算法進(jìn)行詳細(xì)的分析,總結(jié)出造成目前人臉識別率低,效率差等方面缺點(diǎn)的原因:一方面是訓(xùn)練集的小樣本事件,另一方面是樣本的統(tǒng)計(jì)相關(guān)性。針對小樣本問題,采用了LDA+ PCA 組合的兩步人臉識別過程,相當(dāng)于對原始的樣本數(shù)據(jù)進(jìn)行兩次投影變換。針對統(tǒng)計(jì)相關(guān)性問題,主要采用將LDA特征子空間與PCA特征子空間融合,使類內(nèi)離散度最小而類間離散度最大,即PCA分塊所用的特征向量是相互正交的。為了提高識別率、增強(qiáng)其魯棒性以及減少算法的復(fù)雜性,這里對空間維數(shù)和采樣維數(shù)給予一定的約束,改進(jìn)了其中的維數(shù)選擇算法。最后,在ORL人臉庫上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明所提出的方法是有效的,識別能力較強(qiáng),且具有較好的穩(wěn)定性。
參考文獻(xiàn):
[1] 李金屏,韓延彬,楊清波,等.人臉識別新技術(shù)研究進(jìn)展[J].計(jì)算機(jī)科學(xué),2004,31(z2):293-295.
[2] Govindaraju V.Locating human faces in photographs[J].International Journal of Computer Vision,1996,19(2):129-146.
[3] 宇雪垠,曹拓荒,陳本盛.基于特征臉的人臉識別及實(shí)現(xiàn)[J].河北工業(yè)科技,2009,26(5):428-430,433.
[4] 梁路宏艾海舟何克忠.基于多模板匹配的單人臉檢測[J].中國圖象圖形學(xué)報(bào),1999,4(10):3-5.
[5] 黎奎,宋宇,鄧建奇,等.基于特征臉和BP神經(jīng)網(wǎng)絡(luò)的人臉識別[J].計(jì)算機(jī)應(yīng)用研究,2005,22(6):236-237,248.
[6] 孫小琪,高文曦,鎮(zhèn)麗華.基于SVD的人臉對稱性的兩步人臉識別算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2016,25(2):130-134.
[7] 李同宇,李衛(wèi)軍,覃鴻.基于特征融合的人臉圖像性別識別[J].智能系統(tǒng)學(xué)報(bào),2013,8(6):505-511.
[8] Rabiner L R.A tutorial on hidden Markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
[9] Turk M,Pentland A.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.
[10] Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfaces vs.Fisherfaces:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.
[11] Bartlett M S.Independent component representations for face recognition[M]//Face Image Analysis by Unsupervised Learning.Boston,MA:Springer US,2001:39-67.
[12] Lee D D, Seung H S. Algorithms for non2negative matrix factorization[C]. // In : Proceedings of Neural Information Processing Systems, USA : Denver, 2000:556-562.
【通聯(lián)編輯:唐一東】