張靜然
摘要:為解決依據(jù)圖像表現(xiàn)的人臉識(shí)別問題,對(duì)原圖像維數(shù)進(jìn)行約簡必不可免,子空間降維人臉識(shí)別技術(shù)是當(dāng)前研究的一個(gè)熱點(diǎn)。直接對(duì)測試樣本采取投影降維,簡單高效。該文對(duì)兩種有效子空間特征提取算法進(jìn)行研究,并在YALE人臉庫上進(jìn)行識(shí)別率對(duì)比實(shí)驗(yàn)。
關(guān)鍵詞:線性子空間;人臉識(shí)別;投影降維
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)22-0182-02
Abstract:In order to solve face recognition problem based on image representation, dimensionality reduction is inevitable in solving computer vision problems. As a dimensionality reduction and feature extraction technique, linear subspace is a popular research hotspot in face recognition. Directly mapping the samples to a low-dimensionality space is an easy and effective method. Two kinds of effective subspace feature extraction algorithms were researched, and comparison of face recognition rate experiment was conducted in YALE database.
Keywords: linear subspace; face recognition; dimension reduction
1 引言
早期的特征提取研究算法采用幾何特征算法,如人臉眼鼻嘴等位置和形狀來進(jìn)行簡單描述,這種算法在數(shù)據(jù)維度方面很簡單經(jīng)濟(jì)但特征不可靠,而且會(huì)丟失大量人臉紋理特征,所以早期這種算法不是很有效。另一種采用測試圖像與庫圖像進(jìn)行模型匹配。基于幾何特征的算法受限制較多,對(duì)圖像質(zhì)量和次用特征的可靠性都有較高要求;模板匹配的算法有極大發(fā)展。近年來人臉識(shí)別主要算法包括子空間分析降維算法、稀疏表示的分類算法、通過深度學(xué)習(xí)的自動(dòng)特征提取算法。
求取人臉圖像在該低維流形空間的表現(xiàn),不僅能降低特征維度減小計(jì)算復(fù)雜度而且能提取對(duì)分類有利的特征。各種子空間算法也就體現(xiàn)在如何高效地尋求該子空間。每幅人臉圖像都能用低維特征向量來高效表示,相較于原圖像中的特征向量在子空間中提取的特征向量可以提供更顯著和豐富的信息[1]。
2 線性子空間
常用子空間算法有主成分分析(Principal Component Analysis, PCA)和監(jiān)督的線性判別分析(Linear Discriminant Analysis, LDA)。PCA通過將訓(xùn)練數(shù)據(jù)集投影到數(shù)據(jù)方差變化方向最大的投影軸上,以使重構(gòu)誤差最小,實(shí)現(xiàn)算法是將重構(gòu)誤差最小函數(shù)轉(zhuǎn)化為求特征散度矩陣的前d個(gè)最大特征向量,一次構(gòu)成投影變換矩陣。常見PCA算法應(yīng)用于人臉識(shí)別通常先將圖像的矩陣表示轉(zhuǎn)化為一維向量的形式,有研究以原始圖像直接實(shí)施PCA處理,來進(jìn)行識(shí)別并取得不錯(cuò)的效果。由于PCA是非監(jiān)督的降維處理算法,所以獲取的特征通常不是對(duì)分類識(shí)別最有效的。LDA考慮應(yīng)用樣本的標(biāo)簽信息來提取特征,是一種有監(jiān)督的特征降維技術(shù)。LDA假設(shè)不同數(shù)據(jù)獨(dú)立同分布的服從高斯分布且不同類數(shù)據(jù)的協(xié)方差矩陣相似,利用將最大化類間散度分布并最小化類內(nèi)散度分布問題轉(zhuǎn)化為求瑞利商問題形式,來選擇最優(yōu)的投影向量。
以歐式距離來度量樣本點(diǎn)間的相似性不可靠,導(dǎo)致在低維空間中的樣本分布不真實(shí),當(dāng)樣本取樣于流形結(jié)構(gòu),很難通過全局線性映射來尋求這種低維嵌入,流形學(xué)習(xí)才可能揭示樣本的本質(zhì)低維分布。近年來流形學(xué)習(xí)領(lǐng)域產(chǎn)生了大量的研究成果[2-3],包括等距特征映射(Isometric Feature Mapping, ISOMAP)、局部線性嵌入(Locally Linear Embedding, LLE)、Laplacian特征映射(Laplacian Eigenmaps, LE)、Hessian特征映射(Hessian-based Locally Linear Embedding, HLLE)、局部切空間排列算法(Local Tangent Space Alignment, LTSA)。但這些流形算法對(duì)測試樣本無法像傳統(tǒng)線性降維技術(shù)(如PCA)那樣顯式的將數(shù)據(jù)投影到低維流形空間中,所以很難應(yīng)用到人臉識(shí)別上。He等基于Laplacian特征映射提出局部幾何結(jié)構(gòu)保持的局部保持投影(locality preserving projection, LPP)且成功應(yīng)用到自動(dòng)人臉識(shí)別領(lǐng)域;同樣通過流形線性擴(kuò)展的思想,He等基于局部線性嵌入提出了近鄰保持嵌入(neighborhood preserving embedding, NPE),這類算法都嘗試將原始樣本投影到一個(gè)保持低維本質(zhì)流形結(jié)構(gòu)的子空間中,LPP尋求可以讓局部樣本近鄰結(jié)構(gòu)得到保持的投影子空間;相較于PCA這一保持全局歐式結(jié)構(gòu)的線性降維技術(shù),NPE是尋求樣本K近鄰重構(gòu)關(guān)系得到保持的投影子空間。
2.1 主成分分析
3 實(shí)驗(yàn)結(jié)果與分析
Yale人臉數(shù)據(jù)庫由15個(gè)人的165張正面圖像組成,每人11張。這些圖像在不同光照、人臉表情變化、是否戴眼鏡的條件下采集。每幅圖像剪裁成[32×32]的尺寸,并將像素的灰度級(jí)歸一化。
一般子空間方法會(huì)隨維數(shù)的不同表現(xiàn)出不同的性能。為分析降維子空間維數(shù)對(duì)人臉識(shí)別率的影響,本實(shí)驗(yàn)在Yale數(shù)據(jù)庫中每人6張圖像用來訓(xùn)練,PCA和NPE算法的人臉識(shí)別率隨子空間維數(shù)的變化如圖1所示。
在不同訓(xùn)練樣本個(gè)數(shù)下,子空間方法一般會(huì)表現(xiàn)出不同的性能。本文在YALE數(shù)據(jù)庫中每人隨機(jī)選取[l(l=4,5,6)]幅圖像用于訓(xùn)練,剩余[11-l]幅圖像用于測試,在Yale數(shù)據(jù)庫上進(jìn)行不同的訓(xùn)練樣本數(shù)量對(duì)最終識(shí)別率的實(shí)驗(yàn),重復(fù)20次實(shí)驗(yàn),取實(shí)驗(yàn)的平均結(jié)果,結(jié)果如表1所示:
4 結(jié)束語
本文研究兩種基于信號(hào)重構(gòu)的子空間方法,通過實(shí)驗(yàn)可以發(fā)現(xiàn)它們?cè)谌四樧R(shí)別領(lǐng)域有有效的應(yīng)用。
參考文獻(xiàn):
[1] Lei Z, Yi D, Huang X, et al. Subspace learning with frequency regularizer: Its application to face recognition[C]//International Conference on Biometrics. IEEE, 2015:481-486.
[2] 徐金成.對(duì)稱局部保持的半監(jiān)督維數(shù)約簡算法[J].華南理工大學(xué)學(xué)報(bào),2017,45(3):89-96.
[3] 劉嘉敏,袁佳成,彭玲,等.多鄰域保持嵌入的人臉識(shí)別方法[J].重慶大學(xué)學(xué)報(bào), 2017, 40(3):88-94.
【通聯(lián)編輯:唐一東】