徐志京,葉 麗(上海海事大學(xué) 信息工程學(xué)院,上?!?01306)
基于壓縮感知的單樣本人臉識(shí)別*
徐志京,葉麗
(上海海事大學(xué)信息工程學(xué)院,上海201306)
提出一種基于壓縮感知的單樣本人臉識(shí)別方法,通過局部鄰域嵌入非線性降維和稀疏系數(shù)的方法產(chǎn)生冗余樣本,則新樣本包含了多種姿態(tài)和多種表情。將所有的新樣本作為訓(xùn)練樣本,運(yùn)用改進(jìn)后的稀疏表征分類算法進(jìn)行人臉圖像的識(shí)別。在單樣本情況下,基于ORL人臉庫(kù)和FERET人臉庫(kù)的實(shí)驗(yàn)證明,該方法比原稀疏表征方法在識(shí)別率上分別提高了15.53%和7.67%。與RSRC、SSRC、DMMA、I-DMMA等方法相比,該方法同樣具有良好的識(shí)別性能。
人臉識(shí)別;單樣本;稀疏表征分類;局部鄰域嵌入非線性降維
人臉識(shí)別技術(shù)是一種通過分析比較人臉視覺特征信息進(jìn)行身份鑒別的計(jì)算機(jī)技術(shù)[1]。人臉識(shí)別受表情、姿態(tài)等多因素影響,其仍是生物特征識(shí)別領(lǐng)域最困難的研究課題之一。同時(shí),因樣本采集成本大、存儲(chǔ)空間受限等造成了單訓(xùn)練樣本問題,這使得人臉內(nèi)在特征的提取變得更加困難[2]。在人臉訓(xùn)練數(shù)據(jù)庫(kù)中每人僅有一幅圖像的情況下,多數(shù)傳統(tǒng)方法的識(shí)別性能將嚴(yán)重下降。壓縮感知[3](Compressed Sensing,CS)是近年來新興的信號(hào)處理方法。利用壓縮感知理論,WRIGHT J等人[3]提出了一種稀疏表示人臉識(shí)別算法(Sparse Representation-based Classification,SRC)。SRC方法在局部遮擋、噪聲等問題上具有相當(dāng)?shù)聂敯粜浴a槍?duì)單樣本問題,本文提出了一種基于壓縮感知的單樣本人臉識(shí)別方法。該方法首先利用局部鄰域嵌入非線性降維和稀疏系數(shù)將一幅人臉圖像擴(kuò)展為姿態(tài)表情各不同的圖像,將所有新的樣本作為訓(xùn)練樣本,最后采用改進(jìn)的稀疏表征方法進(jìn)行識(shí)別分類。
1.1壓縮感知(CS)
CS作為一個(gè)新的理論框架,它能以遠(yuǎn)低于奈奎斯特頻率對(duì)信號(hào)進(jìn)行采樣。
壓縮感知理論主要包括三個(gè)方面的內(nèi)容:
(1)信號(hào)x∈Rn的稀疏表示問題:x=Ψα。
(2)信號(hào)低速采樣問題:y=Φx。Φ是M×N維的觀測(cè)矩陣,與稀疏基Ψ的乘積要滿足有限等距性質(zhì)。確保在降低維數(shù)的同時(shí)原始信號(hào)的信息損失也最小。
(3)信號(hào)重構(gòu)問題。從線性觀測(cè)y=Aα中無失真地恢復(fù)信號(hào)(其中A稱為CS信息算子,A=ΦΨ),它基于如下嚴(yán)格的數(shù)學(xué)最優(yōu)化(Optimization)問題:
在信號(hào)足夠稀疏下,基于L0和L1最小化等價(jià)的理論,可將L0范數(shù)轉(zhuǎn)換成L1范數(shù):
1.2SRC算法
SRC的基本思想是:將不同類別的樣本組合成一個(gè)超完備字典,測(cè)試樣本可由同一類的訓(xùn)練樣本的線性組合來表示。算法可通過測(cè)試樣本相對(duì)于超完備字典的稀疏表示系數(shù)區(qū)分出測(cè)試樣本中所屬類別。
Ψ=[A1,A2,…,Ac]
則x可線性表示為:
理想條件下α=[0,0,…,0,αiT,0,0,…,0]T,該系數(shù)向量中除了與第i類有關(guān)的系數(shù)之外,其他元素都為0。
1.3基于SRC的改進(jìn)算法
本文提出的算法采用了非常稀疏投影矩陣作為觀測(cè)矩陣Φ,降低圖像維度。參考文獻(xiàn)[4]已證明非常稀疏投影矩陣不僅滿足CS測(cè)量矩陣的必要條件,而且比高斯矩陣有更好的測(cè)量效果。在L1最小化問題上,利用對(duì)偶增廣拉格朗日乘子算法尋求最優(yōu)稀疏解。其原理是先將L1范數(shù)最小化問題式(2)轉(zhuǎn)化為對(duì)偶問題:
其中B1∞={α∈Rn∶‖α‖∞≤1},對(duì)應(yīng)的拉格朗日函數(shù)為:
其中α是拉格朗日乘子,通過交替迭代α、t、z,求(4)式的極值,即保證了重構(gòu)的精確度又降低了算法的運(yùn)算度。最后為了更加精確地分類,利用加權(quán)殘余確定類別。
算法步驟如下:
(1)輸入C類N個(gè)訓(xùn)練樣本,構(gòu)成字典矩陣Ψ∈Rn×N。
(3)給定一個(gè)測(cè)試圖像 x∈Rn。
(4)計(jì)算Yi=ΦA(chǔ)i,i=1,…,C,并計(jì)算測(cè)量矩陣Y=[Y1,Y2,…,Yc]=ΦΨ,其中Y∈Rn×N。
(5)計(jì)算新的投影樣本y=Φx,并采用對(duì)偶增廣拉格朗日乘子求得稀疏向量α?,使得Yα=y。
(7)若k=argmini(ei),則x屬于第k類。
單樣本問題的難點(diǎn)是每個(gè)對(duì)象只有一個(gè)樣本,這使得考慮類內(nèi)差異的一些成熟算法識(shí)別率低。解決單樣本問題的一個(gè)有效途徑是增加與現(xiàn)實(shí)相符合的冗余樣本。這種擴(kuò)充訓(xùn)練樣本個(gè)數(shù)的方法充分利用了一幅訓(xùn)練樣本中的有用信息,便于進(jìn)一步的識(shí)別分類。
2.1多姿態(tài)樣本的生成
生成多姿態(tài)樣本的方法是基于局部鄰域嵌入非線性降維理論[5]的。具體方案步驟是:
(1)將所有人臉圖像先進(jìn)行小波變換,再表示為列向量形式。
(2)設(shè)輸入的某姿態(tài)人臉圖像為Ii,將其視為高維空間中的一點(diǎn),而相同姿態(tài)訓(xùn)練集人臉圖像Tin(包括N個(gè)圖像)作為Io點(diǎn)的鄰近點(diǎn),再根據(jù)局部鄰域嵌入非線性降維理論求解近鄰點(diǎn)的權(quán)值。
“互聯(lián)網(wǎng)+教育”可以使具有碎片式、復(fù)雜化特點(diǎn)的教育源配置達(dá)到最大優(yōu)化和公開化,提升教育資源的共享程度,促進(jìn)教育公平?!盎ヂ?lián)網(wǎng) + 教育”可以將已有的優(yōu)質(zhì)教育資源的價(jià)值和作用發(fā)揮到最大化。通過互聯(lián)網(wǎng)技術(shù),一位優(yōu)秀教師可以教授成千上萬名學(xué)生,因此建立公辦高校與民辦高校教育資源共享平臺(tái),可以使民辦高校與其他公辦院校及優(yōu)秀教師跨地區(qū)、跨時(shí)間的合作交流,不僅可以豐富資源的內(nèi)容,減少成本,還可以縮小甚至消除民辦高校與公辦院校師資力量的差距,減小教育資源鴻溝。
(3)設(shè)目標(biāo)姿態(tài)的訓(xùn)練集人臉圖像Ton(包括N個(gè)圖像),而待合成的目標(biāo)姿態(tài)人臉圖像為Io,然后利用步驟(2)中解出的權(quán)值反算出一個(gè)高維空間的點(diǎn),即為目標(biāo)角度人臉圖像向量。
(3)將目標(biāo)姿態(tài)人臉圖像向量表示為矩陣形式,再進(jìn)行小波逆變換。
這種方法能快速地生成多姿態(tài)樣本,且克服現(xiàn)有的同類方法復(fù)雜、效果不佳的問題。圖1是原人臉圖像及其生成的多姿態(tài)樣本,其中(a)為輸入圖像,(b)分別為生成的不同姿態(tài)圖像,而(c)為真實(shí)圖像。
圖1 原人臉圖像及其生成的多姿態(tài)樣本
2.2多表情樣本的生成
生成多表情樣本的方法是基于稀疏表征的。保證所有圖像大小統(tǒng)一,圖像中眼睛、鼻子、嘴巴在各自圖像中的同一個(gè)固定位置。在訓(xùn)練集中選取與訓(xùn)練樣本具有相同表情的人臉圖像作為變換基,使該變換基能近似地線性表示測(cè)試圖像,求解出稀疏表示系數(shù)。同時(shí)選取包含目標(biāo)表情的人臉圖像組成數(shù)組。最后利用該數(shù)組和稀疏表示系數(shù)重構(gòu)出目標(biāo)表情人臉。
該方法因?yàn)闆]有復(fù)雜的提取人臉特征的步驟,從而算法的復(fù)雜度也相對(duì)降低了。圖2是同一張人臉生成的多表情的人臉圖像,其中(a)為輸入的高興的人臉測(cè)試圖像,(b)~(f)分別為生成的生氣、厭惡、害怕、傷心、驚訝的人臉圖像,而(g)為真實(shí)圖像。
圖2 原人臉圖像及其生成的新樣本
本文實(shí)驗(yàn)是基于ORL、FERET人臉數(shù)據(jù)庫(kù)的。選取每個(gè)人的一幅圖像作為訓(xùn)練樣本,剩余的人臉圖像作為測(cè)試樣本。實(shí)驗(yàn)前統(tǒng)一將圖像數(shù)據(jù)的大小修改為48×48。在單樣本情況下,本文首先分別基于姿態(tài)庫(kù)和表情庫(kù)對(duì)單幅訓(xùn)練樣本采取上文的方法擴(kuò)充樣本個(gè)數(shù),以生成多姿態(tài)多表情的新圖像,然后將原訓(xùn)練樣本和新樣本作為訓(xùn)練集,最后采用改進(jìn)的稀疏表征算法進(jìn)行識(shí)別分類。
3.1ORL人臉庫(kù)
ORL人臉庫(kù)是由40個(gè)人的灰度圖像構(gòu)成的,共有400張圖片。圖3描繪了使用不同個(gè)數(shù)冗余樣本下的識(shí)別率。
圖3 不同個(gè)數(shù)冗余樣本下的識(shí)別率
從圖3中可以看出,冗余樣本的個(gè)數(shù)不夠多時(shí),識(shí)別率也偏低。隨著冗余樣本個(gè)數(shù)的增加,識(shí)別率大幅度增高,但當(dāng)冗余樣本達(dá)到8個(gè)時(shí),識(shí)別率增長(zhǎng)緩慢,幾乎平緩。原因是訓(xùn)練樣本太少時(shí),樣本的內(nèi)蘊(yùn)特征太少,此時(shí)冗余樣本個(gè)數(shù)是影響識(shí)別效果的主要原因。但隨著冗余樣本個(gè)數(shù)的不斷增加,造成大量的冗余信息,而冗余樣本集與原始數(shù)據(jù)集的數(shù)據(jù)分布有不一致的地方,此時(shí)增加冗樣本的個(gè)數(shù)對(duì)識(shí)別率作用不大。
將本文的算法與SRC算法、參考文獻(xiàn)[6]、[7]中的方法進(jìn)行比較,表1為比較結(jié)果。從表1可以看出,本文所提出的方法識(shí)別率高于原SRC方法15.53%,也比參考文獻(xiàn)[6]、[7]中的算法具有更好的識(shí)別性能。
表1 單樣本情況下本文方法與原SRC等方法的識(shí)別率比較
3.2FERET人臉庫(kù)
FERET人臉庫(kù)的1 400幅圖像共有200個(gè)人,每人7幅人臉圖像。圖4描繪了基于FERET人臉庫(kù)使用不同個(gè)數(shù)冗余樣本下的識(shí)別率。
圖4 不同個(gè)數(shù)冗余樣本下的識(shí)別率
[7-9]就單樣本人臉識(shí)別問題也做了大量的研究。通過表2可以看出,本文方法應(yīng)用在FERET人臉庫(kù)上的單樣本人臉識(shí)別率比原SRC方法提高7.63%,也比DMMA等算法具有更好的識(shí)別性能。表2為本文方法應(yīng)用在FERET人臉庫(kù)上的單樣本人臉識(shí)別率。
表2 單樣本情況下本文方法與原SRC等方法的識(shí)別率比較
針對(duì)人臉識(shí)別研究的單樣本問題,本文提出了一種基于CS的單樣本人臉識(shí)別算法。經(jīng)對(duì)比實(shí)驗(yàn)表明,該方法不僅充分利用單個(gè)樣本的特征信息,生成新的圖像,而且很大程度上提高了單樣本情況下的識(shí)別率,為單樣本人臉識(shí)別技術(shù)提供了新的方法。
參考文獻(xiàn)
[1]王明軍.基于壓縮感知的人臉識(shí)別算法研究[D].西安:西安電子科技大學(xué),2012.
[2]Wang Jie,PLATANIOTIS K N,Lu Juwei,et al.On solv-ing the face recognition problem with one training sample per subject[J].Pattern Recognition,2006,39(9):1746-1762.
[3]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysisand Machine Intelligence,2009,31(2):210-227.
[4]方紅,章權(quán)兵,韋穗.基于非常稀疏隨機(jī)投影的圖像重建方法[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(22):25-27.
[5]馬瑞,宋亦旭.基于局部線性嵌入非線性降維的多流行學(xué)習(xí)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,48(4):583-586.
[6]Chang Xueping,Zheng Zhonglong,Duan Xiaohui,et al. Sparse representation-based face recognition for one training image per person[A].Advanced Intelligent Computing Theories and Applications[C].Berlin Heidelberg:Springer,2010:407-414.
[7]單桂軍.基于虛擬樣本擴(kuò)張法的單樣本人臉識(shí)別算法研究[J].科學(xué)技術(shù)與工程,2013,13(14):3908-3911.
[8]Lu Jiwen,Tan Yap-peng,Wang Gang.Discriminative multimanifold analysis for face recognition from a single training sample per person[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):39-51.
[9]NABIPOURM,AGHAGOLZADEHA,MOTAMENIH. Multimanifold analysis with adaptive neighborhood in DCT domain for face recognition using single sample per person[C]. 2014 22nd Iranian Conference on Electrical Engineering(ICEE),IEEE,2014:925-930.
Compressive sensing-based face recognition for single sample
Xu Zhijing,Ye Li
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306,China)
This paper proposes a kind of face recognition method with one training image per person,which is based on compressed sensing.There are two methods——nonlinear dimensionality reduction by locally linear embedding and sparse coefficients,by witch redundant samples can generate.These new samples with multi-expressive and multi-gesture can be treated as training samples.Finally,the improved SRC algorithm can be applied to face recognition.Experiments on the well-known ORL face database and FERET face database show that the proposed method is respectively about 15.53%and 7.67%,more accurate than original SRC method in the context of single sample face recognition problem.In addition,extensive experimentation reported in this paper suggests that the proposed method achieves higher recognition rate than RSRC,SSRC,DMMA,and I-DMMA.
face recognition;single sample;sparse representation-based classification(SRC);nonlinear dimensionality reduction
TP391.41
A
1674-7720(2015)12-0035-03
2015-01-26)
徐志京(1972-)男,工學(xué)博士,副教授,主要研究方向:航運(yùn)信息采集與處理、水聲信號(hào)處理與通信、壓縮感知理論及應(yīng)用。
國(guó)家自然科學(xué)基金(61404083);航空科學(xué)基金( 2013ZC15005 ) ;上海海事大學(xué)校基金( 20120108 )
葉麗(1991-)女,碩士研究生,主要研究方向:圖像分析與視頻處理。