郭磊 周文杰 高少偉
摘? 要:身處信息時代,為了保護(hù)信息安全,如何準(zhǔn)確鑒定某個人的身份,已經(jīng)成為社會各界的難點。作為生物識別技術(shù)的一個重要分支,人臉識別技術(shù)在商業(yè)、安全、身份認(rèn)證等領(lǐng)域有著廣泛的應(yīng)用。通過對傳統(tǒng)PCA、分塊PCA、MPCA以及二維PCA的人臉識別算法中的特征抽取方法以及對算法取不同參數(shù)情況下的性能和算法間性能對比,得出二維PCA性能更優(yōu)的結(jié)論,并以此為基礎(chǔ),通過軟件工具設(shè)計出了基于以上四種方法的人臉識別技術(shù)的仿真系統(tǒng)。
關(guān)鍵詞:人臉識別;特征抽取;主成分分析
中圖分類號:TP311.52? ? ? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2021)05-0108-06
Research of the Face Recognition Technology Based on PCA Algorithm
GUO Lei,ZHOU Wenjie,GAO Shaowei
(College of Electronic and Information Engineering,Guangdong Ocean University,Zhanjiang? 524088,China)
Abstract:In the information age,in order to protect information security,how to accurately identify a persons identity,has become a difficult point for all walks of life. As an important branch of bioidentification technology,face recognition technology has a wide range of applications in business,security,identity authentication and other fields. Based on the traditional PCA,block of PCA and MPCA and two-dimensional PCA face recognition algorithm of feature extraction method and the algorithm performance under different parameters and performance comparison between algorithms,two-dimensional PCA performance better conclusions,and on this basis,through the software tools to design the face recognition technique based on the above four methods of simulation system.
Keywords:face recognition;feature extraction;PCA
0? 引? 言
生物特征技術(shù)是指利用人體固有的、具有穩(wěn)定性和唯一性的生理特征,如指紋、面部、虹膜等來進(jìn)行身份鑒定的技術(shù)。作為生物特征識別的一個重要方面,人臉識別技術(shù)在嫌疑人的身份識別、互聯(lián)網(wǎng)的認(rèn)證口令以及銀行系統(tǒng)的身份驗證等各領(lǐng)域有著廣闊的應(yīng)用前景[1]。同時,人臉識別技術(shù)還和其他領(lǐng)域存在交集,如神經(jīng)網(wǎng)絡(luò)、人工智能、心理學(xué)等。
目前,人臉識別研究的主流方向已經(jīng)基本確定,有基于主成分分析方法(PCA),基于Fisher線性判別分析方法(LDA)以及局部特征分析方法(LFA)等。除了對靜態(tài)的人臉圖像進(jìn)行識別,動態(tài)人臉識別以及三維圖像研究也逐漸成為研究重點[2]。本文主要對PCA及其改進(jìn)的算法進(jìn)行研究,再通過軟件工具實現(xiàn)人臉識別的仿真系統(tǒng),并對算法性能進(jìn)行比較。
1? 基于傳統(tǒng)PCA的人臉識別算法
基于傳統(tǒng)PCA的人臉識別算法的主要思想就是在原始的人臉空間中求出一組正交向量,然后利用PCA方法保留其中包含重要人臉信息的向量,由其構(gòu)成一個新的人臉特征空間,稱其為特征臉。后續(xù)將待識別人臉與特征臉進(jìn)行比較,從而完成人臉識別的過程,其識別流程如圖1所示。
1.1? 傳統(tǒng)PCA的特征抽取
選擇一定數(shù)量的人臉圖像構(gòu)成訓(xùn)練集,剩余的圖像作為待測試的樣本。假設(shè)人臉庫中圖像尺寸均為m×n,則其可以表示為一個列向量X=[x1,x2,…,xm×n]T。如果有M幅訓(xùn)練圖像,構(gòu)成的訓(xùn)練集如式(1)所示:
TrainSamples=[X1,X2,…,XM]? ? ? ? ? ? ? ? ?(1)
將訓(xùn)練集中的每個向量減去訓(xùn)練集的均值向量mx,可得新訓(xùn)練集,如式(2)所示:
ctlSamples=[X1-Mx,…,XM-mX]? ? ? ? ? ? ? ? (2)
根據(jù)式(2)可以得到其協(xié)方差矩陣的表達(dá)式,如式(3)所示:
(3)
其中,協(xié)方差矩陣C的大小為(m×n)×(m×n)。為了降低求解矩陣C的特征值和特征向量的計算量,引入奇異值分解(SVD)方法來解決計算過程中矩陣維數(shù)過高的問題[3,4]。
設(shè)矩陣C的特征值為λi,對應(yīng)特征向量分別為ui和vi(i=0,1,…,M-1),則矩陣C的特征向量可表示為式(4):
(4)
對特征值進(jìn)行降序排列,通過選擇保留一定數(shù)量的特征值及其特征向量,以此構(gòu)成特征臉空間。特征值的選擇可以由累積貢獻(xiàn)率(或閾值)決定,其計算公式如式(5)所示:
(5)
1.2? 測試樣本和訓(xùn)練樣本的比較和分類
通過計算在N維空間中圖像間的距離,可以測量圖像之間的相似性。進(jìn)行人臉識別時,有多樣的分類器供人們選擇,本文進(jìn)行的人臉識別實驗采用K近鄰算法。其思想是計算待測樣本和所有訓(xùn)練樣本的向量距離,從中選取一定數(shù)量的最小距離,根據(jù)這些最小距離對應(yīng)的訓(xùn)練樣本中,大多數(shù)樣本所屬的類別,判斷出待測樣本屬于哪個類別[5]。算法示例如圖2所示。
1.3? 實驗結(jié)果分析
本節(jié)以O(shè)RL人臉庫作為實驗樣本庫,進(jìn)行基于PCA算法的人臉識別測試。其中,ORL人臉庫由40個人、每人10幅共400幅灰度圖像組成,部分圖像的背景為黑色,也有光照條件、臉部表情、細(xì)節(jié)等等外界條件的變化;K近鄰分類器采用三階近鄰作為判別依據(jù),實驗結(jié)果如表1所示。
從表1可以看到,隨著訓(xùn)練集的樣本數(shù)增多,系統(tǒng)的識別精度也會越高。當(dāng)樣本數(shù)一定時,隨著累積貢獻(xiàn)率的增大,識別精度也會有提升,當(dāng)高于85%時,系統(tǒng)的識別精度變化不大。因此在設(shè)置參數(shù)時,選擇合適的累積貢獻(xiàn)率值和樣本數(shù)量,不僅可以降低訓(xùn)練過程的計算量,還可以使系統(tǒng)保持較高的識別精度。
2? 基于分塊PCA的人臉識別
PCA方法抽取的是圖像的全局特征,而隨著人臉像素的增多,其會丟失一些重要的局部信息,導(dǎo)致人臉識別的效率下降。為了解決這個問題,有學(xué)者針對特征抽取方面進(jìn)行改進(jìn),提出了分塊PCA算法[6]。其流程圖如圖3所示。
2.1? 基于分塊PCA的人臉識別算法
分塊PCA的主要思想是先將一個m×n的圖像矩陣X,分解為i×j塊圖像矩陣,從而通過式(3),使用PCA和奇異值分解方法,對這i×j個協(xié)方差矩陣進(jìn)行特征提取操作,得到i×j個新的子特征臉。在子人臉圖像經(jīng)過新的特征臉投影到低維的線性空間后,將所有低維向量組合起來得到一個完整的訓(xùn)練集。后續(xù)的識別過程與傳統(tǒng)PCA人臉識別算法一致。圖像的分塊方式如圖4所示。
2.2? 基于MPCA的人臉識別算法
為了進(jìn)一步改善基于分塊PCA的人臉識別系統(tǒng)的性能,在分塊PCA方法的基礎(chǔ)上,有學(xué)者提出一種針對分類過程的改進(jìn)方法,稱為MPCA。
在訓(xùn)練樣本和測試樣本經(jīng)過子特征臉空間映射到低維空間后,均能得到i×j個子向量集。此時直接進(jìn)入分類階段:
(1)計算子訓(xùn)練集與測試樣本子塊之間的距離;
(2)將每組的所有子塊的距離相加,得到數(shù)個測試樣本與訓(xùn)練樣本的距離;
(3)通過分類器進(jìn)行分類并得出識別結(jié)果。其示意圖如圖5所示。
2.3? 實驗結(jié)果分析
本節(jié)實驗主要是與第一節(jié)中的基于分塊PCA的人臉識別進(jìn)行精度以及訓(xùn)練、識別分類時間的對比。選擇每人的前5幅人臉圖像構(gòu)成訓(xùn)練集,剩余人臉圖像作為測試樣本進(jìn)行分類識別測試。詳細(xì)對比如表2和表3所示。
從表2中可以看出,在不同的分割方式情況下,基于MPCA的人臉識別的識別精度均高于基于分塊PCA的人臉識別,大體上提升了2到3個百分點。
從表3中可以看出,基于MPCA的人臉識別在訓(xùn)練時所耗費(fèi)的時間稍低于分塊PCA,而分類識別中耗費(fèi)時間高于分塊PCA,但這種方法在統(tǒng)計上能夠盡可能地減小或消除圖像噪聲等不必要的信息對識別分類過程所造成的影響,提高了人臉識別系統(tǒng)的識別性能和工作效率。
3? 基于2DPCA的人臉識別
2DPCA(二維PCA)PCA和傳統(tǒng)PCA的區(qū)別在于,2DPCA并不需要對圖像進(jìn)行一維轉(zhuǎn)換的處理,直接將圖像堆疊來獲得協(xié)方差矩陣[7]。
3.1? 2DPCA的特征抽取
向量X表示一個n維的列向量,通過一個線性關(guān)系,將一個m×n的圖像矩陣A在向量X上進(jìn)行投影,如式(6)所示:
Y=AX? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (6)
其中,X為投影軸;Y是圖像矩陣A的投影特征向量。投影向量Y的分散程度越高,投影軸X越好,兩者的關(guān)系式如式(7)所示:
J(X)=tr(SX)? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)
其中,SX是特征向量Y的協(xié)方差矩陣;tr(SX)是這個協(xié)方差矩陣SX的跡。當(dāng)式(7)取得最大值的時候,可找出一個投影軸X,當(dāng)所有的訓(xùn)練樣本投影在它上面時,特征向量的總體散布矩陣最大。其中,協(xié)方差矩陣SX的跡如式(8)所示:
tr(SX)=XTE[(A-EA)T(A-EA)]X? ? ? ? ?(8)
假設(shè)有M個大小為m×n的圖像矩陣A,mx為這個樣本集的均值向量,則協(xié)方差矩陣可由式(9)表示:
(9)
則式(7)變?yōu)槭剑?0):
J(X)=XTGtX? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (10)
其中,X就是經(jīng)過歸一化處理的正交向量。這個準(zhǔn)則也叫作廣義總體散布準(zhǔn)則。如果存在一個向量X,能夠使這一個準(zhǔn)則最大化,那么這個向量X就是最佳投影軸。這個向量X可以通過選取一定數(shù)量協(xié)方差矩陣Gt的最大特征值對應(yīng)的特征向量組成投影矩陣獲得[8]。
3.2? 實驗結(jié)果分析
實驗主要對PCA、分塊PCA、MPCA和2DPCA進(jìn)行識別性能的對比,分別選擇每人前1至5幅人臉圖像構(gòu)成訓(xùn)練集,其余人臉圖像作為測試樣本進(jìn)行分類識別測試。識別精度和訓(xùn)練時間對比詳細(xì)結(jié)果如表4和表5所示,PCA與2DPCA的重構(gòu)圖像對比如表6所示。
對比表6中兩組重構(gòu)的人臉圖像,不難看出,2DPCA能夠以更少的主成分來重構(gòu)出效果比PCA更好的人臉圖像。當(dāng)選擇80個主成分進(jìn)行重構(gòu)時,肉眼基本看不出重構(gòu)圖像和原始圖像的區(qū)別。說明2DPCA的主成分保留了更多原始人臉圖像的重要信息,因此在基于2DPCA進(jìn)行人臉識別時,只需要選擇更少的主成分就可以達(dá)到不錯的效果。而抽取特征過程的計算量也會明顯下降,這兩點在表5中已經(jīng)體現(xiàn)出來。當(dāng)2DPCA選擇20個主成分進(jìn)行特征抽取時,中間過程耗費(fèi)時間明顯低于其他三種方法,而且識別精度與基于分塊PCA的人臉識別的精度相當(dāng)。
4? 人臉識別仿真系統(tǒng)的設(shè)計和實現(xiàn)
4.1? 仿真系統(tǒng)的開發(fā)環(huán)境
本文的人臉識別仿真系統(tǒng)是在Windows系統(tǒng)上實現(xiàn),內(nèi)存為8 GB,中央處理器為Intel(R) Core(TM) i5-3337U CPU @1.80 GHz 1.80 GHz。工具使用MATLAB R2014a中的GUI設(shè)計工具。運(yùn)行流程圖及仿真系統(tǒng)界面,如圖6和圖7所示。
4.2? 實驗結(jié)果分析
在本文設(shè)計的人臉識別仿真系統(tǒng)中,四種分析方法均選取每人前5幅人臉圖像構(gòu)成訓(xùn)練集,剩余圖像可以用于進(jìn)行分類識別測試,每種算法選取5組數(shù)據(jù)取平均值,結(jié)果對比如表7所示。
從表7中的數(shù)據(jù)可以看出,人臉識別的仿真系統(tǒng)在正常運(yùn)作時,MPCA的識別精度最高,可達(dá)到約87.5%,2DPCA雖然識別精度不如其余兩種分塊PCA方法,但抽取特征的時間遠(yuǎn)低于其他兩種方法。結(jié)論基本與前面的實驗結(jié)果相符。因此在實際應(yīng)用人臉識別時,可按照自己的需求來選擇不同的抽取特征的方法。
5? 結(jié)? 論
本文主要完成了PCA其改進(jìn)算法的分析并對它們進(jìn)行了有效性評價,最終實現(xiàn)了人臉識別的仿真系統(tǒng)。盡管人臉識別技術(shù)現(xiàn)今有一定的成熟度,但不可否認(rèn)這項技術(shù)仍然具有巨大的發(fā)展空間。追求系統(tǒng)的高識別精度和高效率無疑還是該項技術(shù)重要的研究課題。
參考文獻(xiàn):
[1] 李武軍,王崇駿,張煒,等.人臉識別研究綜述 [J].模式識別與人工智能,2006,19(1):58-66.
[2] 董琳,趙懷勛.人臉識別技術(shù)的研究現(xiàn)狀與展望 [J].安防科技,2011(10):22-26.
[3] 李穎,張培珍,李燦蘋.基于KL變換的人臉識別系統(tǒng)的設(shè)計與實現(xiàn) [J].科技資訊,2009(20):218-219.
[4] 周又紅.略談矩陣奇異值分解定理 [J].工科數(shù)學(xué),1996(3):125-126.
[5] 曾勇.廣義近鄰模式分類研究 [D].上海:上海交通大學(xué),2009.
[6] 陳伏兵,楊靜宇.分塊PCA及其在人臉識別中的應(yīng)用 [J].計算機(jī)工程與設(shè)計,2007(8):1889-1892+1913.
[7] 孫艷娜.基于2DPCA的人臉識別方法 [D].西安:西安電子科技大學(xué),2013.
[8] YANG J,ZHANG D,F(xiàn)RANGI A F,et al. Two-dimensional PCA:a new approach to appearance-based face representation and recognition [J].IEEE transactions on pattern analysis and machine intelligence,2004,26(1):131-7.
作者簡介:郭磊(1982—),男,漢族,黑龍江哈爾濱人,講師,博士,研究方向:圖像處理與機(jī)器視覺;通訊作者:周文杰(1996—),男,漢族,廣東佛山人,助理工程師,本科,研究方向:圖像處理。