甘航萍,王 力,何 慶,徐同偉
(貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽 550025)
?
基于凸輪權(quán)重距離局部保持投影算法的人臉識別
甘航萍,王 力,何 慶,徐同偉
(貴州大學(xué) 大數(shù)據(jù)與信息工程學(xué)院,貴州 貴陽 550025)
結(jié)合凸輪(Cam)權(quán)重距離和局部保持投影算法,提出了一種改進(jìn)的凸輪權(quán)重距離局部保持投影法。該算法主要將局部保持投影算法在選取近鄰點(diǎn)并構(gòu)造加權(quán)圖時(shí)采用的歐式距離用凸輪權(quán)重距離代替,克服了處理高維數(shù)據(jù)中數(shù)據(jù)分布不均勻的問題。運(yùn)用該改進(jìn)的算法對人臉圖像進(jìn)行特征提取,與局部保持投影算法和正交局部保持投影算法進(jìn)行實(shí)驗(yàn)比較,結(jié)果證明,用改進(jìn)的凸輪權(quán)重局部保持投影法進(jìn)行人臉識別得到的識別率更高,算法的性能效果更好。
凸輪權(quán)重距離;人臉識別;局部保持投影算法;特征提取
人臉識別技術(shù)因其在人機(jī)交互系統(tǒng)、公安刑偵、識別驗(yàn)證系統(tǒng)等領(lǐng)域有著良好的應(yīng)用前景而受到廣泛關(guān)注。人臉識別技術(shù)是從計(jì)算機(jī)分析的人臉圖像或者視頻中提取出大量的識別信息,以此來辨別人身份的,是一種最直接、易被接受的生物特征識別技術(shù)[1]。
在人臉識別技術(shù)中,用于實(shí)驗(yàn)的人臉圖像的矢量空間的維數(shù)過高而增大識別難度,因此特征提取就成為了人臉識別中的重要課題。目前,應(yīng)用于人臉識別特征提取的方法有多種,常見的特征提取方法有:主成分分析(Principal Component Analysis,PCA)、線性判別式分析(Linear Discriminant Analysis,LDA)、獨(dú)立成分分析(Independent Component Analysis,ICA)等[2],但人臉圖像大都位于非線性子流形面上,所以一些非線性特征提取法,特別是眾多流形學(xué)習(xí)方法引起了越來越多的注意。經(jīng)過十多年的不斷研究,學(xué)者們提出了眾多流形學(xué)習(xí)理論和算法[3]。經(jīng)典常見的流形學(xué)習(xí)方法有:局部線性嵌入(Locally Linear Embedding,LLE)、局部切線空間排列(Local Tangent Space Alignment,LTSA)、等距映射(Isometric Mapping,ISOMAP)、拉普拉斯特征映射(Laplacian Eigenmaps,LE)等,這些方法的主要思想是通過局部線性近似將原始高維空間數(shù)據(jù)的內(nèi)在幾何結(jié)構(gòu)保存下來,描述了人臉圖像的非線性分布,揭示了數(shù)據(jù)的本質(zhì)特性[4]。文獻(xiàn)[5]提出了局部保持投影(Locality Preserving Projections,LPP)算法,將其運(yùn)用到人臉識別中。文獻(xiàn)[6]提出了(Orthogonal Locality Preserving Projections,OLPP)算法,該方法是在LPP算法上進(jìn)行的改進(jìn)[7]。LPP算法在前期選取近鄰點(diǎn)并構(gòu)造加權(quán)圖時(shí)采用的是歐式距離,其前提是數(shù)據(jù)為均勻正態(tài)分布的。而實(shí)際應(yīng)用中,絕大多數(shù)高維空間數(shù)據(jù)并非均勻正態(tài)分布。后來Zhou等人提出了一種Cam權(quán)重距離,其最先用于最近鄰分類器[8],后來Pan等人將該權(quán)重距離應(yīng)用于LLE算法中并獲得了良好的降維效果[9]。
基于以上啟示,為了更加合理的解決數(shù)據(jù)分布不均勻的問題,并有效的提高識別率,本文結(jié)合Cam權(quán)重距離和LPP算法,提出了Cam權(quán)重局部保持投(Cam Weighted Locality Preserving Projection,Cam-WLPP)算法,將該算法在Matlab平臺(tái)上進(jìn)行人臉識別仿真實(shí)驗(yàn),并與LPP算法和OLPP算法進(jìn)行對比,實(shí)驗(yàn)結(jié)果驗(yàn)證了該改進(jìn)算法的有效性和優(yōu)越性。
局部保持映射算法(LPP)主要思想是通過給定輸出的線性映射關(guān)系取代拉普拉斯特征映射算法(LE)中的非線性映射關(guān)系,從而實(shí)現(xiàn)從高維觀測空間到低維特征空間的線性映射[10]。事實(shí)上,LPP算法目的在于找到一組最優(yōu)投影矢量數(shù)據(jù)集使得樣本空間的局部離散度最小,即讓原始空間內(nèi)互相靠近的樣本在變換的低維空間內(nèi)依舊互相靠近[7]。
LPP算法的基本思想[11]:設(shè) 表示為一副人臉圖像的一維向量,LPP算法的主要目的就是保留數(shù)據(jù)的內(nèi)在幾何特征和局部結(jié)構(gòu),其優(yōu)化函數(shù)是
min∑i,j(yi-yj)2wij
(1)
其中,yi為xi的低維映射,即yi=WTxi,上式中的Sij為xi和xj兩個(gè)樣本的關(guān)系矩陣,其定義為
(2)式中,ε為一個(gè)非常小的正數(shù),其定義了xi的一個(gè)領(lǐng)域半徑。式(2)整體表示若xi和xj兩個(gè)樣本點(diǎn)之間的距離很近,已經(jīng)小于ε的話,則該兩個(gè)樣本的關(guān)系為e-‖xi-xj‖2/τ,否則置零。由此,所有的 可以成為樣本之間的距離相似矩陣,其用權(quán)值來表示樣本間的相似程度。
LPP算法引入映射變換yi=WTxi后,式(1)可以轉(zhuǎn)換為
XLXTW=λXDXTWT
(3)
其中,X為N維的訓(xùn)練數(shù)據(jù)集{x1,x2,…,xN},映射之后的n維數(shù)據(jù)集{y1,y2,…,yn},n?N;L=D-S是一個(gè)拉普拉斯矩陣;D是一對角矩陣,其對角元素對應(yīng)關(guān)系矩陣S相應(yīng)行或列的元素之和。由于訓(xùn)練樣本圖像的個(gè)數(shù)一般遠(yuǎn)少于一幅圖像樣本的像素個(gè)數(shù),所以XDXT通常是奇異的,為克服這個(gè)問題,首先需要利用PCA對圖像進(jìn)行初步的降維,再在降維獲后的子空間運(yùn)用LPP算法,因此,所得的變換矩陣為
W=WPCAWLPP
(4)
2006年提出的凸輪(Cam)權(quán)重距離是一種相似性度量方式,較之歐式距離,Cam權(quán)重距離能更合理的解決數(shù)據(jù)分布不均勻的問題[12-13]。
2.1 凸輪權(quán)重距離
定義1 設(shè)Y=(Y1,Y2,…,Yl)是服從l維標(biāo)準(zhǔn)正態(tài)分布N(0,1)的l維隨機(jī)向量,則其概率密度函數(shù)有
(5)
隨機(jī)向量X的定義有
(6)
定義2 若隨機(jī)向量X服從Cam分布X~Caml(a,b,τ),則對于x~Rl,X的概率密度函數(shù)有
(7)
定義3 設(shè)x0∈Rl是Cam分布Caml(a,b,τ)的中心,則從x∈Rl到中心點(diǎn)x0的Cam的權(quán)重距離為
(8)
若隨機(jī)向量X~Caml(a,b,τ),則有
(9)
(10)
2.2 局部保持映射算法
LPP算法在選取近鄰點(diǎn)并構(gòu)造加權(quán)圖時(shí),由于絕大多數(shù)高維空間數(shù)據(jù)并非均勻正態(tài)分布的,如果依然采用歐式距離判斷數(shù)據(jù)點(diǎn)之間是鄰近點(diǎn),并將相對應(yīng)的節(jié)點(diǎn)連接的話顯然不合適,針對此,本文采用Cam權(quán)重距離來改進(jìn)LPP算法原有的構(gòu)造加權(quán)圖的方法,有效解決了數(shù)據(jù)并非均勻正態(tài)分布的問題。
Cam-WLPP算法的步驟:
(1)PCA投影。利用PCA算法得到初始降維的投影矩陣,記作WPCA;
(2) 選取近鄰點(diǎn)、構(gòu)造加權(quán)圖。G為有n個(gè)節(jié)點(diǎn)的圖。第i個(gè)節(jié)點(diǎn)與人臉圖像中的xi相對應(yīng),判斷數(shù)據(jù)點(diǎn)xi和數(shù)據(jù)點(diǎn)xj是否接近;
1)計(jì)算xi到所有點(diǎn)的歐氏距離,按從小到大排列距離,得到xi的pw個(gè)鄰近點(diǎn),Xi={xi1,xi2,…,xip},Xi?D;
2)獲得Vi,其元素值為Vij=xij-xj,其中j=1,2,…,p;
4)根據(jù)公式
5)根據(jù)式(8),計(jì)算xi到任意xi∈D的Cam權(quán)重距離;
6)若滿足Camdist(xi,xj) (3) 選擇權(quán)值。若數(shù)據(jù)點(diǎn)xi和數(shù)據(jù)點(diǎn)xj是接近的,則給此邊賦予權(quán)值Sij=e-‖xi-xj‖2/τ,否則Sij=0; (4)LPP投影。若WLPP=[a1,a2,…,an],由 XLXTW=λXDXTWT (11) 求解廣義特征向量問題中的特征向量和特征值和特征向量。若將所求的特征值按升序排列λi≤λi+1,選擇前d個(gè)最小特征值對應(yīng)的特征向量w1,w2,…,wd,則該d個(gè)特征向量就構(gòu)成了LPP算法的最優(yōu)投影矩陣WLPP,故最終得到投影矩陣W=WPCAWLPP。 3.1 仿真實(shí)驗(yàn)方案 在Matalab平臺(tái)上進(jìn)行人臉識別仿真實(shí)驗(yàn),采用ORL人臉數(shù)據(jù)庫。ORL人臉數(shù)據(jù)庫包含40個(gè)人,每個(gè)人10幅不同圖像,在人臉表情、光照、姿態(tài)等細(xì)節(jié)上有一定變化的400幅人臉圖像。本文采用了兩種實(shí)驗(yàn)對比方案。 方案1 在Cam-WLPP算法中,根據(jù)反復(fù)試驗(yàn),將用于估計(jì)Cam權(quán)重距離的參數(shù)pw設(shè)置為30,鄰域值設(shè)置為35;在LPP算法中同樣將鄰域值設(shè)置為35,對比用兩種算法得到的識別率隨著維數(shù)的變化情況。 方案2 每個(gè)人的10幅圖中選擇c幅圖(c=2,3,4,5)來作為訓(xùn)練樣本,剩余(10-c)幅圖作為測試樣本。LPP、OLPP、Cam-WLPP3種算法維數(shù)選擇在30維,仿真實(shí)驗(yàn)分別對比用3種算法得到的識別率。 3.2 仿真結(jié)果分析 仿真實(shí)驗(yàn)結(jié)果比較的主要性能指標(biāo)是識別率。本文仿真實(shí)驗(yàn)均是對ORL人臉數(shù)據(jù)庫進(jìn)行人臉識別所獲得的識別率。方案1實(shí)驗(yàn)獲得的結(jié)果如圖1所示。 圖1 Cam-WLPP和LPP在不同維數(shù)下的識別率 如圖1所示,Cam-WLPP算法的識別率比LPP算法識別率在整體上有所提高,都在19維之后識別率趨于穩(wěn)定,在40維之后識別率有些許下降的趨勢,這也能估計(jì)出,ORL人臉庫的本征維數(shù)在20~40之間,當(dāng)最終降維數(shù)在這個(gè)區(qū)間段時(shí),得到的識別率較好,因此在方案2的試驗(yàn)中3種算法選擇的維數(shù)為30維。方案2實(shí)驗(yàn)獲得的結(jié)果如表1所示。 表1 3種算法在不同訓(xùn)練個(gè)數(shù)下的識別率 從表1中的結(jié)果可以看出,LPP、OLPP、Cam-WLPP3種算法在不同的訓(xùn)練樣本數(shù)下得到人臉識別識別率結(jié)果,OLPP算法優(yōu)于LPP算法,Cam-WLPP算法優(yōu)于LPP算法和OLPP算法。 本文提出了一種基于凸輪權(quán)重的局部保持投影算法,該算法在人臉識別仿真實(shí)驗(yàn)中在性能和解決數(shù)據(jù)分布不均勻的問題方面優(yōu)于已有的局部保持投影算法。但是本文改進(jìn)的算法在實(shí)驗(yàn)中得到的識別率還不是很高,下一步的工作重點(diǎn)是進(jìn)一步對算法進(jìn)行優(yōu)化,并能多采用幾個(gè)常見的人臉數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn)比較,逐步擴(kuò)大算法的適用范圍、提高算法的實(shí)際應(yīng)用能力。 [1] 金一. 基于核的正交局部保持投影的人臉識別中的[J].電子與信息學(xué)報(bào),2009,31(2):283-287. [2] 李政儀,朱益丹,趙龍.基于有監(jiān)督直接局部保持局部投影的人臉識別[J].計(jì)算機(jī)工程,2009,35(10):190-192. [3] 雷迎科.流形學(xué)習(xí)算法及其應(yīng)用研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2011. [4] 李毅英.鄰域結(jié)構(gòu)保持投影及應(yīng)用[D].西安:西安電子科技大學(xué),2011. [5] He Xiaofei,Yan Shuicheng,Hu Yuxiao, et al. Face recognition using laplacian faces[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(3):328-340. [6] Cai Deng,He Xiaofei,Han Jiawei,et al. Orthogonal laplacianfaces for face recognition[J].IEEE Transactions on Image Processing,2006,15(11):3608-3614. [7] 黃璞.基于流形學(xué)習(xí)的特征提取與人臉識別研究[D].南京:南京理工大學(xué),2014. [8] Zhou Changyin,Chen Yanqiu.Improving nearest neighbor classification with Cam weighted distance[J].Pattern Recognition, 2006,39(4):635-645. [9] 黃芮婕.基于流形學(xué)習(xí)的人臉識別算法研究[D].成都:電子科技大學(xué),2013. [10] 尹峻松.流形學(xué)習(xí)理論與方法研究及在人臉識別中的應(yīng)用[D].長沙:國防科學(xué)技術(shù)大學(xué),2007. [11] 趙芬慶.基于LPP的人臉圖像分析[D].西安:西安電子科技大學(xué),2013. [12] 劉元.度量學(xué)習(xí)及其研究應(yīng)用[D].無錫:江南大學(xué),2015. [13] 陳新忠,胡匯涓,王雪松.基于加權(quán)近鄰保持嵌入的高光譜數(shù)據(jù)降維方法[J].中國礦業(yè)大學(xué)學(xué)報(bào),2013,42(6):1066-1072. Face Recognition Based on Locality Preserving Projections Algorithm of the Cam-weighted Distance GAN Hangping,WANG Li,HE Qing,XU Tongwei (School of Big Data and Information Engineering,Guizhou University,Guiyang 550025,China) By combining the weighted distance of the cam and the locality preserving projections algorithm, this paper proposes an improved Cam weighted locality preserving projection method.In this algorithm, the Euclidean distance used to the locality preserving projection algorithm is instead of the Cam weight distance, which overcomes the problem of processing the data distribution in high dimensional data.Compared with the local preserving projection algorithm and the orthogonal locality preserving projections algorithm, the results show that the improved Cam weighted locality preserving projection method is better in face recognition and recognition rate. cam weighted distance;face recognition; LPP algorithm; feature extraction 2016- 10- 05 貴州省科技廳基金(黔科合LH字[2014]7628) 甘航萍(1990-),女,碩士研究生。研究方向:圖像處理等。王力(1971-),男,教授。研究方向:模式識別等。何慶(1982-),男,博士,副教授。研究方向:認(rèn)知無線網(wǎng)絡(luò),無線傳感網(wǎng)絡(luò)等。 10.16180/j.cnki.issn1007-7820.2017.08.002 TN911.73;TP391.41 A 1007-7820(2017)08-006-043 仿真實(shí)驗(yàn)結(jié)果及分析
4 結(jié)束語