郭正平 謝華 高寧化
摘 要:將人臉圖像劃分為互不相交的矩形塊,提取各分塊的LBP特征,并將各塊LBP特征按序組合表征人臉圖像。利用支持向量機(jī)(Support Vector Machine,SVM)算法對(duì)訓(xùn)練分類器,進(jìn)行人臉識(shí)別。在YALE人臉庫上進(jìn)行的實(shí)驗(yàn)表明,基于局部LBP特征的支持向量機(jī)分類器的準(zhǔn)確率能夠達(dá)到93.33%。
關(guān)鍵詞:人臉識(shí)別;支持向量機(jī);LBP特征
人臉識(shí)別技術(shù)是近年來急速發(fā)展的一個(gè)領(lǐng)域,其利用計(jì)算機(jī)技術(shù)、圖像處理技術(shù)、模式識(shí)別技術(shù)等對(duì)人臉進(jìn)行圖像定位、提取特征、識(shí)別等以完成身份識(shí)別。隨著計(jì)算機(jī)技術(shù)的發(fā)展,人臉識(shí)別技術(shù)越來越受到人們的重視,已經(jīng)成為生物識(shí)別領(lǐng)域中最為重要的研究方向之一。[ 1 ]
局部二值模式(Local Binary Pattern,LBP)由于其在描述圖片時(shí)具有的旋轉(zhuǎn)不變性和灰度不變形等優(yōu)點(diǎn),在人臉識(shí)別中已經(jīng)得到了較為廣泛的應(yīng)用[ 4,5 ]。在人臉識(shí)別過程中,提取LBP特征描述人臉圖片,能夠較好的描述人臉圖片的局部紋理信息。
本文首先介紹對(duì)LBP算子進(jìn)行簡(jiǎn)單介紹,然后分塊提取人臉圖像LBP特征,提取到的特征向量作為支持向量機(jī)的輸入數(shù)據(jù),并通過支持向量機(jī)算法訓(xùn)練分類器對(duì)人臉圖像進(jìn)行分類。
1 局部二值模式(LBP)
局部二值模式(LBP)能夠描述圖片灰度范圍內(nèi)的紋理特征。最為基本的LBP算子以局部3×3窗口為計(jì)算對(duì)象,根據(jù)窗口中心像素點(diǎn)的值,對(duì)周圍8個(gè)像素進(jìn)行標(biāo)記。如果周圍的8個(gè)像素中某個(gè)像素點(diǎn)的值大于中心點(diǎn)的值,則該像素位置用1進(jìn)行標(biāo)記,否則用0進(jìn)行標(biāo)記。經(jīng)過這樣的標(biāo)記處理,圖像3×3像素鄰域內(nèi)會(huì)產(chǎn)生一個(gè)8-bit的無符號(hào)數(shù),然后按照位置順序求和得到該窗口的LBP值,用以反映該窗口區(qū)域的紋理信息。LBP算子計(jì)算方式如圖1所示。
在人臉識(shí)別過程中,針對(duì)人臉圖像的每一個(gè)像素,計(jì)算每一個(gè)像素鄰域的LBP值,這樣就可以得到一張LBP特征值的響應(yīng)圖像,這些LBP值即為人臉圖像的LBP特征。這些LBP特征描述整個(gè)人臉圖像在不同區(qū)域的微小特點(diǎn),例如光照亮點(diǎn)、暗點(diǎn)、邊緣、平滑區(qū)域等等。但是這些LBP特征并不能較好的表現(xiàn)人臉的結(jié)構(gòu)信息,而這些人臉結(jié)構(gòu)信息才是人臉識(shí)別中最為重要的信息之一。如果針對(duì)一張人臉圖像提取整個(gè)圖像的LBP特征,并用以描述人臉圖像,就會(huì)將人臉圖像的結(jié)構(gòu)信息丟失。所以,本文采用分塊思想首先對(duì)人臉圖像進(jìn)行分塊處理,然后再提取每塊圖像的LBP特征,再將所有子塊的LBP特征按照一定的順序連接成一個(gè)復(fù)合的特征向量,用其描述整個(gè)人臉圖像的紋理特征和結(jié)構(gòu)特征。分塊LBP特征如圖2所示。
2 基于LBP特征的人臉識(shí)別
人臉識(shí)別實(shí)質(zhì)是一個(gè)多分類問題,最基本的人臉識(shí)別方式是利用最近鄰分類器對(duì)人臉進(jìn)行分類。而人臉識(shí)別的關(guān)鍵問題之一是如何提取人臉圖像的特征[ 6 ]。本節(jié)首先對(duì)對(duì)人臉圖像進(jìn)行分塊處理,然后針對(duì)每一塊提取LBP特征,用這些特征描述人臉圖像,再利用分類算法學(xué)習(xí)分類器對(duì)人臉圖像進(jìn)行分類,完成人臉識(shí)別過程。
2.1 人臉識(shí)別算法
本文提出的人臉識(shí)別算法如下:
第一步:對(duì)人臉圖像進(jìn)行分塊處理。分塊處理就是把人臉圖像分割為若干個(gè)互不相交的區(qū)域。圖像分割方法主要有:區(qū)域分割法、閾值分割法、邊緣分割方法等等。本文利用區(qū)域分割法思想,采用最為簡(jiǎn)單的方法,根據(jù)圖像的像素,平均的將圖像分割為m×n塊,在后面的實(shí)驗(yàn)過程,不同的實(shí)驗(yàn)中分別將人臉圖像分割為2×2,4×4,6×6塊。
第二步:提取人臉圖像的LBP特征。人臉圖像分割為m×n的形式后,通過LBP算法提取每一子塊人臉圖像的LBP特征。每一子塊得到的LBP特征是一個(gè)N維行向量,將各個(gè)子塊的LBP特征向量按照一定的順序合并為一個(gè)特征向量,這個(gè)特征向量就可以描述整個(gè)人臉的紋理信息。整個(gè)人臉圖像的LBP特征向量是一個(gè)m×n×N維的行向量。
第三步:將人臉圖像的LBP特征向量作為支持向量機(jī)分類算法的輸入,訓(xùn)練分類器,對(duì)人臉圖像進(jìn)行分類。
2.2 實(shí)驗(yàn)學(xué)習(xí)
為了測(cè)試本文提出算法的有效性,將YALE人臉數(shù)據(jù)庫的15名志愿者的圖像165張照片作為實(shí)驗(yàn)數(shù)據(jù)。隨機(jī)抽取每人8張人臉圖像,共120張人臉圖像作為訓(xùn)練圖像,每人所剩3張,共45張作為測(cè)試圖像。
將YALE人臉數(shù)據(jù)庫將圖像分割成2×2、4×4、6×6的形式,實(shí)驗(yàn)結(jié)果如表1所示。
從表1可以看到,圖像分塊對(duì)人臉識(shí)別準(zhǔn)確率有一定的影響,隨著分塊數(shù)據(jù)的增加,識(shí)別準(zhǔn)確率有了明顯的提高。但是,隨著分塊數(shù)目的增加,整個(gè)人臉圖像的LBP特征向量維數(shù)也急劇增加,在訓(xùn)練分類器的過程中,數(shù)據(jù)存儲(chǔ)量會(huì)大大增加。另一方面,隨著特征維數(shù)的增加,分類器的訓(xùn)練時(shí)間也有了顯著的增加。這是這種方法的劣勢(shì)之一。
3 結(jié)論
為了提高人臉識(shí)別率,更好的體現(xiàn)LBP特征的人臉表示優(yōu)勢(shì),在進(jìn)行人臉圖像LBP提取以前對(duì)人臉圖像進(jìn)行了分塊處理,然后分塊提取LBP特征,并將各塊LBP特征按序組合表征人臉圖像。在YALE人臉數(shù)據(jù)庫上,利用SVM算法的分類結(jié)果表明,分塊能大大提高人臉識(shí)別準(zhǔn)確率,但是也增加了計(jì)算量,分類器訓(xùn)練時(shí)間顯著增加。
參考文獻(xiàn):
[1] 王映輝.人臉識(shí)別——原理、方法與技術(shù).北京:科學(xué)出版社,2009.
[2] 周激流,張曄.人臉識(shí)別論研究進(jìn)展.計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),1999,11(2):180-184.
[3] 劉青山,盧漢清,馬頌德.綜述人臉識(shí)別中的子空間方法.自動(dòng)化學(xué)報(bào),2003,29(6):56-60.
[4] G.Y.Zhao,M.Pietikinen.Improving Rotation Invariance of the Volume Local Binary Pattern Operator.Conference on Machine Vision Application,2007:327-330.
[5] Ahonen T,Hadid A,Pietikainen M.Face Recognition with Local Binary Patterns.8th European Conference on Computer Vision,2004:469-481.
[6] Y. X. Li, W. G. Gong. Gabor Features Based Classification Using SVM for Face Recognition,2005,34(97):118-123.