許小媛
XU Xiao-yuan
(江蘇廣播電視大學(xué),南京 210036)
基于特征抽取和多分類(lèi)器組合的人臉識(shí)別方法
Based on feature extraction and the combination of multiple classifiers face recognition method
許小媛
XU Xiao-yuan
(江蘇廣播電視大學(xué),南京 210036)
人臉識(shí)別技術(shù)有著廣泛的應(yīng)用領(lǐng)域,多分類(lèi)器組合是提高識(shí)別效果的一條有效途徑。本文分別利用線性鑒別分析,主成分分析和獨(dú)立成分分析得到人臉圖像的有效代數(shù)特征,以支持向量機(jī)作為人臉的分類(lèi)器,有效地避開(kāi)了人臉識(shí)別的小樣本局限。由于SVM是用來(lái)解決兩類(lèi)問(wèn)題的分類(lèi)方法,采用與二叉決策樹(shù)相結(jié)合的方法解決了人臉識(shí)別的多類(lèi)問(wèn)題。最后結(jié)合多分類(lèi)器組合的方法對(duì)人臉圖像進(jìn)行識(shí)別。該方法在ORL人臉數(shù)據(jù)庫(kù)上進(jìn)行識(shí)別,取得了優(yōu)異的識(shí)別效果,并且對(duì)人臉的姿態(tài),表情有一定的不敏感性。
特征提??;人臉識(shí)別;支持向量機(jī);多分類(lèi)器組合
人臉識(shí)別是生物識(shí)別技術(shù)的重要課題,目前是一個(gè)非?;钴S的研究方向。進(jìn)入九十年代以來(lái),人臉識(shí)別的研究重新成為人們所關(guān)注的熱點(diǎn),在心理學(xué)、神經(jīng)科學(xué)、模式識(shí)別和計(jì)算機(jī)視覺(jué)等方面涌現(xiàn)出大量的成果。人臉正面圖象包含了人臉更明顯的特征,其識(shí)別研究受到人們更多的重視。將一幅人臉圖象看成一個(gè)矩陣,通過(guò)作矩陣變換,可以抽取人臉的全局識(shí)別特征。人臉識(shí)別問(wèn)題是個(gè)典型的小樣本識(shí)別問(wèn)題,基于統(tǒng)計(jì)學(xué)的模式識(shí)別方法有一個(gè)最基本的應(yīng)用前提,就是只有在學(xué)習(xí)樣本的數(shù)目趨于無(wú)窮大時(shí),其識(shí)別的性能才能有理論上的保證,這也是與統(tǒng)計(jì)學(xué)的漸進(jìn)學(xué)習(xí)理論是一致的 如何解決人臉識(shí)別上的小樣本局限就成為這一領(lǐng)域?qū)W者的研究重點(diǎn)。從20世紀(jì)60年代開(kāi)始,V.N.Vapnik等人在有限樣本的機(jī)器學(xué)習(xí)問(wèn)題上取得一系列的進(jìn)展,在這一研究領(lǐng)域建立了一套較完整的理論體系――支持向量機(jī)[1-2](Support Vector Machine, SVM)。目前,這一新的理論方法在解決模式識(shí)別中小樣本、非線性及高維識(shí)別問(wèn)題中表現(xiàn)出獨(dú)特的優(yōu)勢(shì)和良好的應(yīng)用前景。由于SVM是用來(lái)解決兩類(lèi)樣本之間的分類(lèi)問(wèn)題,對(duì)于多類(lèi)問(wèn)題,SVM采用的是一對(duì)一和一對(duì)多分步解決的策略。在本文的人臉?lè)诸?lèi)中,對(duì)于多類(lèi)的人臉?lè)诸?lèi),采用SVM的一對(duì)一方法結(jié)合二叉決策樹(shù)對(duì)單特征的人臉進(jìn)行分類(lèi),最后采用多分類(lèi)器組合方法取得了更高的識(shí)別率。
其中的W一般稱(chēng)為分離矩陣。
PCA實(shí)質(zhì)上是KL變換的網(wǎng)絡(luò)遞推實(shí)現(xiàn)。KL變換是圖象壓縮技術(shù)中的一種最優(yōu)正交變換,其生成矩陣一般為訓(xùn)練樣本的總體散布矩陣。其思想就是將包含人臉的圖象區(qū)域看作是一種隨機(jī)向量,因此可以采用KL變換獲得正交KL基。對(duì)應(yīng)其中較大特征值的基具有與人臉相似的形狀,因此又稱(chēng)作特征臉(Eigenface)。利用這些特征向量描述,表達(dá)和逼近人臉圖像,因此可以進(jìn)行人臉的識(shí)別與合成。假定在訓(xùn)練階段數(shù)據(jù)庫(kù)中有K個(gè)人,每個(gè)人有M幅人臉灰度圖像,其中每一幅圖像都用NxN的二維數(shù)組I(x,y)來(lái)表示,數(shù)組元素表示象素點(diǎn)的灰度值。同樣,每一幅圖象都可以視為一個(gè)N2x1的向量。因此,它等同于N2維的人臉象素域空間中的一個(gè)點(diǎn)。我們用fij表示。
在式(5)兩邊左乘A,然后與(4)式比較,我們可以很容易的得到:
這些特征向量構(gòu)成了人臉空間的一個(gè)子空間的正交基,這個(gè)子空間就是我們通常所說(shuō)的特征空間。特征空間由訓(xùn)練圖象的協(xié)方差矩陣的特征向量構(gòu)成。然后,我們將數(shù)據(jù)庫(kù)中的每一幅人臉f從原始人臉空間轉(zhuǎn)化到特征空間:
支持向量機(jī)算法的思想來(lái)自于統(tǒng)計(jì)學(xué)習(xí)理論。該算法基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化(structural risk minimization, SRM)原理,將原始數(shù)據(jù)集合壓縮到支持向量集合,然后用子集學(xué)習(xí)得到新知識(shí),同時(shí)也給出由這些支持向量決定的規(guī)則,并且可得到學(xué)習(xí)錯(cuò)誤的概率上界,即支持向量的期望數(shù)目和訓(xùn)練集合大小的比值。SVM用于模式識(shí)別的基本思想是構(gòu)造一個(gè)超平面作為決策平面的,使兩類(lèi)模式之間的距離最大。
使分類(lèi)間隔最大實(shí)際上就是對(duì)推廣能力的控制,這是SVM的核心思想之一。統(tǒng)計(jì)學(xué)習(xí)理論指出,在N維空間中,設(shè)樣本分布在一個(gè)半徑為R的超球范圍內(nèi),則滿足條件的正則超平面構(gòu)成的指示函數(shù)集為符號(hào)函數(shù))的VC維滿足下面的界
概括地說(shuō),支持向量機(jī)就是首先通過(guò)用內(nèi)積函數(shù)定義的非線性變換,將輸人空間變換到一個(gè)高維空間,在這個(gè)空間中求(廣義)最優(yōu)分類(lèi)面。SVM分類(lèi)函數(shù)形式上類(lèi)似于一個(gè)神經(jīng)網(wǎng)絡(luò),輸出是中間節(jié)點(diǎn)的線性組合,每個(gè)中間節(jié)點(diǎn)對(duì)應(yīng)一個(gè)支持向量。
SVM中不同的內(nèi)積核函數(shù)將形成不同的算法,目前研究最多的核函數(shù)主要有三類(lèi),一是多項(xiàng)式核函數(shù)
所得到的是q階多項(xiàng)式分類(lèi)器;
二是徑向基函數(shù)(RBF)
所得分類(lèi)器與傳統(tǒng)RBF方法的重要區(qū)別是,這里每個(gè)基函數(shù)中心對(duì)應(yīng)一個(gè)支持向量,它們及輸出權(quán)值都是由算法自動(dòng)確定的。
三是采用Sigmoid函數(shù)作為內(nèi)積,即
支持向量機(jī)是針對(duì)兩類(lèi)問(wèn)題提出來(lái)的,為實(shí)現(xiàn)對(duì)人臉的多類(lèi)問(wèn)題的識(shí)別,需要對(duì)SVM進(jìn)行推廣。在一個(gè)多類(lèi)別問(wèn)題中,如果已知任意兩類(lèi)可分,則通過(guò)一對(duì)一或者一對(duì)多的組合規(guī)則,實(shí)現(xiàn)多類(lèi)劃分。在本文采用一對(duì)一結(jié)合二叉決策樹(shù)的判決規(guī)則來(lái)實(shí)現(xiàn)對(duì)人臉數(shù)據(jù)的多類(lèi)劃分。
本文采用ORL人臉數(shù)據(jù)庫(kù)驗(yàn)證該算法,該數(shù)據(jù)庫(kù)包括從1992年4月到1994年4月劍橋大學(xué)實(shí)驗(yàn)室拍攝的一系列人臉圖像,具體為40個(gè)人,每個(gè)人有不同表情或不同視點(diǎn)的10幅圖像所構(gòu)成,傾斜角度不超過(guò)20度,這些人臉圖像的分辨率為92×112,為灰度圖像。
在實(shí)驗(yàn)中,我們采用每類(lèi)樣本的前六個(gè)數(shù)據(jù)作為訓(xùn)練樣本,即采用每個(gè)人的前六幅照片作為訓(xùn)練數(shù)據(jù),同時(shí)所有的人臉數(shù)據(jù)作為檢測(cè)數(shù)據(jù),為了數(shù)據(jù)處理的方便,試驗(yàn)中的原始數(shù)據(jù)采用46*56的形式。
在本文的實(shí)驗(yàn)中,首先采用特征提取方法得到人臉圖像的不同特征,由于PCA和ICA的特征提取方法從不同的階數(shù)上消除了數(shù)據(jù)的相關(guān)性,在這里我們分別給出了兩種特征提取方法得到的結(jié)果。
圖1 原圖(左),特征臉(中),獨(dú)立成分臉(右)
對(duì)于經(jīng)過(guò)特征提取之后的得到不同代數(shù)特征人臉圖像數(shù)據(jù),我們采用SVM作為分類(lèi)器以及組合各個(gè)分類(lèi)器得到的分類(lèi)效果圖如圖2所示。
圖2 不同分類(lèi)情況下的分類(lèi)效果圖
本文通過(guò)提取人臉數(shù)據(jù)的不同代數(shù)特征,并采用支持向量機(jī)結(jié)合多分類(lèi)器組合方法在一定程度上提高了人臉的識(shí)別率。在ORL人臉數(shù)據(jù)庫(kù)上的實(shí)驗(yàn)也驗(yàn)證了這個(gè)方法的有效性,多分類(lèi)器組合的識(shí)別率遠(yuǎn)遠(yuǎn)優(yōu)于單分類(lèi)器的識(shí)別率。提取圖像的不同特征,并在此基礎(chǔ)上進(jìn)行識(shí)別是提高圖像識(shí)別率的一個(gè)有效方法。在不同的特征集上設(shè)計(jì)最優(yōu)分類(lèi)器和采用加權(quán)的組合方法是需要我們進(jìn)一步要做的工作。
[1] VAPNIK V N,張學(xué)工譯.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].清華大學(xué)出版社,2000.
[2] 王建芬,曹元大.支持向量機(jī)在大類(lèi)別數(shù)分類(lèi)中的應(yīng)用[J].北京理工大學(xué)學(xué)報(bào),21 (2):225-228,2001.
[3] 趙海濤,金忠,楊靜宇.基于最佳鑒別變換和分類(lèi)器組合的人臉自動(dòng)識(shí)別[J].中國(guó)圖象圖形學(xué)報(bào),5A(9):769-772,2000.
TH166
B
1009-0134(2010)11(下)-0036-03
10.3969/j.issn.1009-0134.2010.11(下).14
2010-09-23
許小媛(1980 -),女 ,講師,碩士研究生,研究方向?yàn)橛?jì)算機(jī)模式識(shí)別。