【摘 要】人臉識(shí)別是近年來模式識(shí)別圖像處理,機(jī)器視覺,神經(jīng)網(wǎng)絡(luò)以及認(rèn)知科學(xué)等諸多領(lǐng)域的熱點(diǎn)課題之一,本文主要是基于GPCA(廣義主成分分析方法),對(duì)經(jīng)傳感器采集得到的一系列尺寸相同的人臉圖像進(jìn)行識(shí)別研究以及理論探討。針對(duì)常用人臉識(shí)別方法的弊端和不易操作性,運(yùn)用SPAMS 工具包(Sparse Modeling Software toolbox),研究圖像的降維稀疏表示。
【關(guān)鍵詞】人臉識(shí)別;廣義主成分分析;稀疏表示
1. 引言
隨著安全入口控制和金融貿(mào)易方面應(yīng)用需要的快速增長(zhǎng)以及各方面對(duì)于快速有效的自動(dòng)身份驗(yàn)證的迫切要求,生物統(tǒng)計(jì)識(shí)別技術(shù)得到了新的重視,而人臉識(shí)別是所有的生物識(shí)別方法中應(yīng)用最廣泛的技術(shù)之一,目前國(guó)內(nèi)外研究也取得了一定的進(jìn)展, 綜合有關(guān)文獻(xiàn)[1][2],目前國(guó)外人臉識(shí)別的方法主要集中在以下幾個(gè)方面:
(1) 模板匹配的方法
(2) 示例學(xué)習(xí)的方法
(3) 神經(jīng)網(wǎng)絡(luò)的方法
(4) 基于隱馬爾可夫模型的方法
除此以外,基于Ada Boost的人臉識(shí)別算法,基于彩色信息的方法,基于形狀分析的方法,以及多模態(tài)信息融合的方法,國(guó)外都進(jìn)行了大量的研究與實(shí)驗(yàn)。
國(guó)內(nèi)的研究工作主要是集中在三大類方法的研究:基于幾何特征的人臉正面自動(dòng)識(shí)別方法、基于代數(shù)特征的人臉正面自動(dòng)識(shí)別方法和基于連接機(jī)制的人臉正面自動(dòng)識(shí)別方法。
總之,采用人臉識(shí)別技術(shù),建立自動(dòng)人臉識(shí)別系統(tǒng),用計(jì)算機(jī)實(shí)現(xiàn)對(duì)人臉圖像的自動(dòng)識(shí)別有著廣闊的應(yīng)用領(lǐng)域和誘人的應(yīng)用前景。
在上述研究基礎(chǔ)上,本文主要對(duì)基于廣義主成分分析的人臉識(shí)別算法進(jìn)行研究,并結(jié)合在SPAMS工具包下對(duì)圖像進(jìn)行稀疏處理,其中稀疏表示是特色。主要內(nèi)容是信號(hào)稀疏表示以及matlab稀疏工具包SPAMS的簡(jiǎn)要介紹和應(yīng)用,包括識(shí)別過程中所需要的基本圖像處理技術(shù),并闡述在此基礎(chǔ)上和GPCA技術(shù)結(jié)合的人臉識(shí)別算法流程。
2. 基于SPAMS圖像稀疏表示
每個(gè)大小為w×h 的圖像可看作M維空間的一個(gè)點(diǎn),M=w×h,同一個(gè)面孔的不同亮度和表情被表示到M維空間中的低維線性子空間,稱為臉子空間。
我們定義ni個(gè)圖片,向量vi,1,vi,2,…,vi,ni∈Rm并假設(shè)這些向量足以包含i系列的臉子空間,任何關(guān)于相同目標(biāo)的新的訓(xùn)練圖像,即為向量y∈Rm,y可以表示如下:
(1)
其中αi,1是實(shí)標(biāo)量,將所有ni相加得n=n1+n2+…+nk,作為向量A的n列:
(2)
理想的y(關(guān)于i)可以用A表示為:
Y=Ax0 ∈Rm (3)
其中:x0=[0, …,0,αi,1, αi,2, …, αi,n,0, …,0] T∈Rn (列向量)。X0是一個(gè)系數(shù)矩陣,其元素幾乎是0,處理與i系列有關(guān)系的元素。我們得出如下簡(jiǎn)單的意見:一個(gè)有效地測(cè)試圖像可以只用有相同變量的測(cè)試圖像群充分表示出。如果變量的數(shù)目k大得合理,表示是自然稀疏的。
x0是一個(gè)系數(shù)矩陣,其元素幾乎是0,處理與i系列有關(guān)系的元素。我們得出如下簡(jiǎn)單的意見:一個(gè)有效地測(cè)試圖像可以只用有相同變量的測(cè)試圖像群充分表示出。如果變量的數(shù)目k大得合理,表示是自然稀疏的。
如果system3(under-determined)(m (P2)min subject to y=Ax (4) 這里是范數(shù)的符號(hào)。 類似的,如果system3(over-determined)(m>n),通常通過最小化找到最小二乘法解決辦法。然而,這種方法不能定位識(shí)別問題中的如下兩種重要性質(zhì)。 1)數(shù)據(jù)維數(shù)很高。 2)理想的解答是稀疏的:x0中非0元素所占比例只是。 為了解決上面的問題,我們尋找的方法能夠:(1)使維數(shù)m降低到d 且d≤m ;(2)明確計(jì)算y在低維空間中的稀疏矩陣表示。如果這兩個(gè)目標(biāo)都能完成,我們將會(huì)看到適當(dāng)?shù)募訌?qiáng)稀疏可以使結(jié)果更少地依賴于維數(shù)低的細(xì)節(jié)(過程)。 在數(shù)據(jù)庫里,大維數(shù)縮減方法常被用于映射高維人臉圖像到低維特征空間,已有一類方法能提取所有面部特征,例如特征臉方法,費(fèi)舍爾臉方法等,從圖像空間到特征空間的映射可以表示為:矩陣,d≤m。將等式(3)兩邊同乘以R可得: (5) 映射后,特征空間的維數(shù)d通常比n小。因此,等式(5)所表示的系統(tǒng)是under-determined,x的解也不是唯一的。然而,理想中的x0應(yīng)該是稀疏的,在不嚴(yán)格的條件下,系統(tǒng)的方程的最稀疏解確實(shí)是唯一的。也就是說,理想中的x0是如下最優(yōu)化問題的唯一解: (P0) min subject to (6) 解決(P0)是NP-hard ,而且很難通過多項(xiàng)式時(shí)間算法去近似求解。在通常情況下,無疑通過程序來尋找最稀疏解比費(fèi)力的找x中元素的所有子集有效。 壓縮傳感理論的最近發(fā)展揭示了如果解x0是充分稀疏的,相關(guān)的(P0)問題等價(jià)于求一下的L1最小化問題: (P1) min subject to (7) 這個(gè)問題能通過標(biāo)準(zhǔn)線性多項(xiàng)式時(shí)間程序或者二次多項(xiàng)式程序方法來解決。如果已知道解是很稀疏的,那么更有效的方法也是可考的。 3.GPCA人臉識(shí)別算法 傳統(tǒng)的廣義主成分分析法一般不包含稀疏表示部分,不適用SPAMS工具包,具體識(shí)別流程如圖2所示。 本文通過改進(jìn),采用廣義主成分分析方法,并結(jié)合圖像的稀疏表示,使用SPAMS工具包,具體的流程設(shè)計(jì)如圖3所示: 對(duì)各個(gè)部分介紹如下: (1)人臉圖像采集:基于CMOS圖像傳感器成本低、功耗低、 單一工作電壓、集成 AD 轉(zhuǎn)換器、數(shù)字形式數(shù)據(jù)輸出、圖像大可編程控制等優(yōu)點(diǎn),可以使用CMOS圖像傳感器,如MT9T001 CMOS圖像傳感器。這里由于軟硬件條件限制,直接使用yale人臉庫中的標(biāo)準(zhǔn)圖像。 (2)讀取圖像數(shù)據(jù):直接調(diào)用matlab里面imread函數(shù),將圖像以矩陣的形式體現(xiàn)出來,我們知道,通常通過傳感器采集到的圖像是彩色的,彩色有三種基色組成,red,green,blue;graycolor = (Red + Green + Blue) / 3,簡(jiǎn)稱RGB,彩色圖像是三維的,可以通過簡(jiǎn)單的行列操作得到一維(一種基色下的)圖像,再進(jìn)行相關(guān)的處理。如果圖片的尺寸過于大,可以用imresize函數(shù)進(jìn)行調(diào)整。這里將訓(xùn)練集的圖像矩陣信息降維到一個(gè)矩陣?yán)锩?,每一列代表一個(gè)圖像信息。 (3)特征臉定位:每個(gè)人臉圖像有個(gè)特征矩陣代表它的信息,同理也可以通過矩陣處理得出均值臉圖像。這里可以通過每個(gè)圖像矩陣減去特征矩陣得到特征矩陣A(但不能完整表達(dá)出一幅圖像),根據(jù)廣義主成分分析理論,求出AAT的特征向量就能表達(dá)出圖像信息,當(dāng)然這中間包括一些細(xì)節(jié)操作,如規(guī)范化等等。若想得出特征臉圖像可以通過imshow函數(shù)來畫。 (4)SPAMS工具包L1范數(shù)最小化求解:調(diào)用SPAMS中的mexOMP函數(shù)來求解L1范數(shù)最小化問題。這里調(diào)用的格式是A=mexOMP(y,S,param); y是測(cè)試圖像矩陣,S是訓(xùn)練集圖像矩陣,param對(duì)應(yīng)下面的γ,得出的矩陣A是稀疏解,這里S是已經(jīng)經(jīng)過規(guī)范化處理之后的矩陣,每一個(gè)測(cè)試圖像對(duì)應(yīng)一個(gè)稀疏解,故所有的測(cè)試圖像可以以解集{A1,A2,…,Ai}的形式代表出來,達(dá)到了降維的目的,使計(jì)算量減少了很多。 (5)重構(gòu)圖像及對(duì)比:這里可以通過y=AS來恢復(fù)測(cè)試圖像,當(dāng)然過程中會(huì)涉及矩陣的反規(guī)范化處理,以正確求解。同樣可以將原始圖像和重構(gòu)圖像在matlab中畫出,以便對(duì)比分析。這里面圖像的恢復(fù)程度依賴于γ的取值,直接調(diào)用的mexOMP函數(shù),param的取值也依賴于它的形式規(guī)定和讀者自己設(shè)定。 (6)識(shí)別率計(jì)算:文獻(xiàn)中給出傳統(tǒng)的識(shí)別判別方法是NS和NN方法,NS分類法:如果y到子空間(包括主體i的所有圖片)的距離就把測(cè)試圖片y分配給主體i: 。 NN分類法:如果y和主體i的最近測(cè)試圖片的距離滿足 ,是所有主體中最小的,就把測(cè)試圖片y分配給主體i。 4.小結(jié) 本文對(duì)于目前的熱門課題人臉識(shí)別進(jìn)行研究,采用的是廣義主成分分析方法,且對(duì)SPAMS工具包進(jìn)行了簡(jiǎn)單的介紹和應(yīng)用。 信號(hào)稀疏表示的優(yōu)點(diǎn)在于能夠利用幾個(gè)較大的稀疏系數(shù)來逼近原信號(hào),這也就是它們被稱為稀疏信號(hào)表示理論的原因,后續(xù)我們還要繼續(xù)研究基于SPAMS工具包,與傳統(tǒng)方法進(jìn)行了對(duì)比。 參考文獻(xiàn) [1] 田原.吳更石.梁德群. 計(jì)算機(jī)人臉識(shí)別的研究現(xiàn)狀與進(jìn)展 [J],無線電工程,1997年03期. [2] 鄧興波.高強(qiáng).任德學(xué). 基于TMS320DM642的CMOS圖像采集系統(tǒng)的設(shè)計(jì) [J],天津理工大學(xué)學(xué)報(bào),2008, 24(1), 35-38. [3] 李武軍. 王崇駿.張煒.陳世福. 人臉識(shí)別研究綜述 [J],萬方數(shù)據(jù) 2006年第19卷第1期. [4] 侯鯤 賈隆嘉 王赫寧. 人臉識(shí)別技術(shù)的現(xiàn)狀和發(fā)展趨勢(shì) [J],科協(xié)論壇.2010年第11期. [5] 袁燕. 人臉識(shí)別研究綜述 [J],電腦知識(shí)與技術(shù),2007(17). [6] 程文波.王華軍. 信號(hào)稀疏表示的研究及應(yīng)用 [J].西南石油大學(xué)學(xué)報(bào),2008年 第30卷 第5期. [7] 雷松澤. 基于主元分析的人臉特征提取的matlab實(shí)現(xiàn) [J],電腦開發(fā)與應(yīng)用,2006年11期. [8] 廖海斌.郝寧波.陳慶虎. 基于奇異值與稀疏表示的穩(wěn)健性人臉識(shí)別 [J],萬方數(shù)據(jù),2010,34(7).