周 威,毛 力,趙鵬洋,吳 楠,程 敏,劉 梅
(西安建筑科技大學(xué)信息與控制工程學(xué)院,西安710055)
基于MB_LBP和PCA算法的人臉識(shí)別研究
周威,毛力,趙鵬洋,吳楠,程敏,劉梅
(西安建筑科技大學(xué)信息與控制工程學(xué)院,西安710055)
本文通過分析LBP算法和PCA算法各自的優(yōu)缺點(diǎn),針對(duì)人臉識(shí)別領(lǐng)域,結(jié)合了MB_LBP算法提取人臉圖像的局部特征和PCA能夠?qū)θ四樚卣鬟M(jìn)行降維的優(yōu)點(diǎn),提出了MB_LBP+PCA的人臉識(shí)別算法。人臉圖像首先經(jīng)過MB_LBP處理,然后用PCA算法對(duì)人臉特征降維,最后用SVM進(jìn)行人臉特征分類與識(shí)別。在ORL人臉庫上進(jìn)行了測(cè)試驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,MB_LBP+PCA算法與傳統(tǒng)的PCA算法相比,識(shí)別率提高了13%以上。
特征提?。籑B_LBP;PCA
當(dāng)前社會(huì)運(yùn)用最多的身份識(shí)別技術(shù)是以證件和身份密碼為主的傳統(tǒng)識(shí)別方法,然而這些識(shí)別方法存在著很大的漏洞和不安全性。人臉識(shí)別是模式識(shí)別研究領(lǐng)域的重要課題,也是一個(gè)目前非?;钴S的研究方向。它不僅具有重要的應(yīng)用價(jià)值,如在安保系統(tǒng)、犯罪識(shí)別及身份證明等方面,同時(shí)也是模式識(shí)別理論中比較典型的多類型判別問題。給定一個(gè)輸入圖像和檢測(cè)到的人臉區(qū)域,人臉識(shí)別是指從人臉數(shù)據(jù)庫中鑒定出一個(gè)和已檢測(cè)人臉最相似的圖像。人臉識(shí)別問題已經(jīng)研究了30多年,并且研究導(dǎo)致了許多成功的商業(yè)應(yīng)用。然而,仍然存在兩個(gè)主要挑戰(zhàn):人臉姿態(tài)變化和光照變化。目前人臉識(shí)別的方法大致可分為三類,第一類是整體方法,即人臉區(qū)域的每一個(gè)像素都輸入到識(shí)別系統(tǒng)中,目前常用的整體方法有Kitby和Tutk等人提出的主成分分析方法(Ptincipa1Component Ana1ysis,PCA),Be1humeut等人提出的線性判別分析(Latent Diticg1et A11ocation,LDA)和Batt1ett等人提出的獨(dú)立分量分析(Independent Components Ana1ysis,ICA)等。第二類是基于特征的方法,首先檢測(cè)臉上的特征或者標(biāo)志,如眼睛、鼻子和嘴巴,它們的位置和鄰域?qū)⒈惠斎氲椒诸惼骰蚴菙?shù)據(jù)庫,如局部二值模式(Loca1Binaty Pattetns,LBP)、局部特征分析(Loca1Featute Ana1ysis,LFA)、Gabot小波等。第三類是混合方法,結(jié)合了前兩類的融合方法。研究人員表明,在大數(shù)據(jù)方面,整體方法是有效的,能夠從整體上對(duì)人臉圖像進(jìn)行描述,抓住圖像的主要信息?;谔卣鞯姆椒▽?duì)光照、姿態(tài)和遮擋等變化具有較強(qiáng)的魯棒性,但是其識(shí)別率高度依賴于特征提取和定位方法的可靠性。
LBP算法最初是用于紋理描述中,該算法具有計(jì)算簡(jiǎn)單、特征分類能力強(qiáng)等特點(diǎn)而被Ahonen等人引入到人臉識(shí)別中。Ahonen將人臉圖像劃分為幾個(gè)互不相重疊的區(qū)域,利用LBP算子提取局部特征和直方圖統(tǒng)計(jì)特征,該方法在FERET人臉庫上取得了較高識(shí)別率。但是LBP算子本身還不夠完善。為了解決原始LBP算法易受噪聲影響以及計(jì)算復(fù)雜度高的問題,本文提出了基于MB_LBP和PCA的人臉識(shí)別算法,在ORL人臉庫上進(jìn)行實(shí)驗(yàn),并與傳統(tǒng)PCA算法相比較,證明了該方法的優(yōu)越性。
基本的LBP算子易受噪聲的影響,具有不穩(wěn)定性。MB_LBP算法能夠改善原始LBP受噪聲的影響,提高算法的穩(wěn)定性。MB_LBP算法提取圖像特征是在LBP算法的基礎(chǔ)上,把LBP算法中一個(gè)中心像素的應(yīng)用擴(kuò)展到包含多個(gè)像素的矩形區(qū)域,傳統(tǒng)LBP算子像素之間灰度值的比較背像素塊之間的平均灰度之間的比較所代替,即周圍矩形區(qū)域灰度值的平均值與中心矩形區(qū)域的灰度值平均值進(jìn)行比較。
PCA算法是一種常用的特征提取方法。它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換,其目的是在數(shù)據(jù)空間中找到一組向量以盡可能地解釋數(shù)據(jù)的方差,從而用降維后的低維向量保存原數(shù)據(jù)中的主要信息。采用如下步驟提取圖像的特征信息。
(1)人臉圖像集為[Xi|i=1,..,M],其中M為訓(xùn)練樣本總數(shù),Xi為第i個(gè)訓(xùn)練樣本的圖像向量,對(duì)各幅人臉圖像Xi(i=1,2,3,..,M)求出∑,并根據(jù)∑計(jì)算圖像的平均臉,并用每幅人臉圖像數(shù)據(jù)減去平均臉數(shù)據(jù)。
(2)計(jì)算圖像數(shù)據(jù)的協(xié)方差矩陣。
(3)對(duì)協(xié)方差矩陣進(jìn)行奇異值分解得到圖像的特征值和特征向量,并找出前N個(gè)最大特征值對(duì)應(yīng)的特征向量。
(4)將實(shí)驗(yàn)樣本投影到由這些特征向量組成的子空間上,得到M個(gè)投影向量,以此M個(gè)投影向量構(gòu)成實(shí)驗(yàn)樣本的PCA特征。
支持向量機(jī)(Suppott Vectot Machine,SVM)是一種機(jī)器學(xué)習(xí)方法,它是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展而來,能夠較好地解決小樣本、高維度、非線性等分類問題。SVM基本思想是通過非線性變換將輸入向量映射到一個(gè)高維空間,然后在這個(gè)高維空間中求得一個(gè)最優(yōu)線性分類超平面,這個(gè)超平面與各類數(shù)據(jù)的距離都最遠(yuǎn),從而能夠?qū)?shù)據(jù)盡可能的正確分類。SVM的超平面是通過判別函數(shù)求得的,判別函數(shù)如公式(1)所示。
其中k(xi,xj)稱為核函數(shù),核函數(shù)的選取應(yīng)使其為特征空間的一個(gè)點(diǎn)積,即存在函數(shù)Φ,使Φ(xi)·Φ(xj)=k(xi,xj)。在SVM中,常用的核函數(shù)主要有線性核、多項(xiàng)式核、徑向基核和二次神經(jīng)網(wǎng)絡(luò)核函數(shù)。
本文采用了MB_LBP和PCA結(jié)合的特征提取方法,對(duì)人臉圖像進(jìn)行特征提取,分類器采用SVM。實(shí)驗(yàn)證明,MB_LBP+PCA的方法與傳統(tǒng)PCA相比,識(shí)別率有明顯提高。LBP作為一種紋理特征提取算法,可以有效的提取圖像的局部紋理特征,但是原始LBP算法存在圖像噪聲多、不穩(wěn)定的特點(diǎn),分塊LBP可以有效解決LBP處理圖像的噪聲問題,但是分塊過小,圖像存在噪聲,分塊過大,會(huì)使得圖像粒度化,破壞原有的很多圖像特征,因此分塊大小的選取是MB_LBP+PCA算法有待討論的問題。
10.3969/j.issn.1673-0194.2016.13.098
TP391.41
A
1673-0194(2016)13-0181-02
2016-04-14
陜西省教育廳專項(xiàng)科研計(jì)劃(14JK1438);西安建筑科技大學(xué)基礎(chǔ)研究基金項(xiàng)目(JC1514);2015年國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201510703121);2015年陜西省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(1136)。