王程錦 林玉娥
摘要:針對傳統(tǒng)PCA與LDA算法存在運算量大和小樣本問題的缺點,本文提出一種基于2D-PCA與2D-MMC的人臉識別算法,該算法將二維思想引入其中,并利用MMC的算法特性解決小樣本問題。在ORL人臉庫上的實驗也體現(xiàn)了算法的有效性。
關(guān)鍵詞:主成分分析;最大間距準(zhǔn)則;二維主成分分析;二維最大間距準(zhǔn)則;小樣本問題
中圖分類號:TP391? ? ? ? 文獻標(biāo)識碼:A
文章編號:1009-3044(2019)22-0195-02
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Face Recognition Algorithm Based on 2D-PCA and 2D-MMC
WANG Cheng-jin, LIN Yu-xi
(Department of Computer Science and Engineering, Anhui University of Science and Technology, Huainan 232000, China)
Abstract: Aiming at the shortcomings of traditional PCA and LDA algorithms with large computational complexity and small sample problem, this paper proposes a face recognition algorithm based on 2D-PCA and 2D-MMC, which introduces two-dimensional ideas and uses MMC algorithm. Features solve small sample problems. Experiments on the ORL face database also demonstrate the effectiveness of the algorithm.
Key words: principal component analysis; maximum spacing criterion; two-dimensional principal component analysis; two-dimensional maximum spacing criterion; small sample problem
人臉識別領(lǐng)域為模式識別領(lǐng)域十分熱門的方向,其中,PCA[1]和LDA[2]算法是其中十分常見的算法。PCA算法在處理高維樣本數(shù)據(jù)時,首先將樣本數(shù)據(jù)構(gòu)成的矩陣準(zhǔn)換為高維向量而這就會產(chǎn)生計算量大、無法利用樣本的類別信息等缺點。而LDA算法雖然有能夠充分利用樣本信息、有利于分類等優(yōu)點,但會產(chǎn)生小樣本問題。Li[3]等人提出MMC算法,該算法使用類間散布矩陣與類內(nèi)散布矩陣的跡的差作為目標(biāo)函數(shù)的構(gòu)成準(zhǔn)則,使其從理論上避免了小樣本問題。[4][5]
針對以上問題,本文在傳統(tǒng)的算法的基礎(chǔ)上提出一種基于2D-PCA與2D-MMC的人臉識別算法,該算法既可利用圖像的二維信息又可從理論上避免小樣本問題,通過在ORL人臉庫上的實驗,也驗證了該算法與原始的PCA和2D-MMC算法相比擁有更好的識別效果。
1 2D-PCA與2D-MMC的人臉識別算法
另[X={x1,x2,…xN}]為高維樣本數(shù)據(jù)的集合,且[xi∈Rn,1≤i≤N]。其中N為樣本數(shù),樣本類數(shù)為K,[1≤i≤K]。通過對樣本數(shù)據(jù)的處理轉(zhuǎn)化,最終獲得投影矩陣V,使[Y=VTX],其中Y為低維數(shù)據(jù)空間,且[Y?Rd,d< 1.1 2D-PCA算法 2D-PCA算法是在使用二維的樣本數(shù)據(jù)構(gòu)成的高維矩陣直接構(gòu)建協(xié)方差矩陣,并計算其特征值及其對應(yīng)的特征向量,然后將最大的幾個特征值所對應(yīng)的特征向量構(gòu)成的矩陣作為投影矩陣,將原始的樣本矩陣進行投影,即可得到低維的樣本空間。 1)求出所有原始樣本數(shù)據(jù)的均值[X] 2)構(gòu)建樣本數(shù)據(jù)的協(xié)方差矩陣如式(1)所示: [S=(1/N)i=1N(xi-X)T(xi-X)]? ? ? ? ? ?(1) 3)對S進行特征分解,求出最大特征值對應(yīng)的特征矩陣[V={v1,v2,…vd}]。 1.2 2D-MMC算法 MMC算法的目的是尋找兩個正交投影矩陣,將原始樣本數(shù)據(jù)投影至低維數(shù)據(jù),并能保持樣本的可分性。 1)令[xi]為i類的均值且[xi] 2)求出類內(nèi)、類間散布矩陣[Sw]和[Sb] ,如下所示: [Sw=i=1Kj∈Ci(xj-X)(xj-X)T]? ? ? ? ? ? ? ? ? ? ? ?(1) [Sb=i=1KNi(xi-X)(xi-X)T]? ? ? ? ? ? ? ? ? ? ? ? (2) 3)2D-MMC的目標(biāo)函數(shù)為[maxtr(Sb-Sw)],對其進行奇異值分解,得到該函數(shù)對應(yīng)的投影矩陣。 將需要訓(xùn)練和測試的樣本數(shù)據(jù)首先使用2D-PCA進行壓縮和降維,再使用2D-MMC進行特征提取,從而得到最佳投影矩陣,使用最近鄰分類器對其進行分類,最后輸出結(jié)果。 2 實驗結(jié)果與分析 本文采用ORL人臉庫對初始的PCA算法、MMC算法和2D-PCA+2D-MMC算法進行實驗,采用統(tǒng)一的最近鄰分類器進行分類。以訓(xùn)練樣本數(shù)作為自變量,對以上算法進行實驗。 經(jīng)過實驗可知,在樣本數(shù)為4/5/6的情況下,PCA算法、2D-MMC算法和2D-PCA+2D-MMC算法的識別率如表1所示: 由此可知,本文提出的2D-PCA+2D-MMC算法相比于其他算法,識別率有明顯的提升。其原因在于,改進后的算法解決了小樣本問題同時充分考慮了樣本的二維結(jié)構(gòu),從而獲得了較好的識別效果。 3 結(jié)語 本文對PCA和LDA進行分析和改進,提出一種2D-PCA與2D-MMC相結(jié)合的算法,該算法利用圖像的二維信息同時減少了算法的運算量,又解決了小樣本問題,總之,基于2D-PCA與2D-MMC的人臉識別算法具有較高的識別率,同時穩(wěn)定性高且運算量小,是一種高效的人臉識別方法。 參考文獻: [1] WOLD S, ESBENSEN K, GELAD P. Principal component analysis[J]. Chemometrics & Intelligent Laboratory Systems, 1987, 2(1):37-52. [2]TURK M , PENTLAND A. Eigenface for recognition[J]. Journal of Cognitive Neuros- cience,1991, 3(1) :71-86. [3] LI H, JIANGT, ZHANG K. Efficient and robust feature extraction by maximum margin criterion.[J]. IEEE Transactions on Neural Networks, 2006, 17(1):157-165. [4] 溫福喜, 劉宏偉. 基于2D-PCA和2D-LDA的人臉識別方法[J].計算機應(yīng)用研究,2007,24(8):201-203. [5] 萬鳴華, 盧桂馥. 分塊二維最大間距準(zhǔn)則的特征提取方法[J].小型微型計算機系統(tǒng),2016,37(9):2088-2092. 【通聯(lián)編輯:唐一東】