孫君頂 周業(yè)勇
(河南理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院 河南 焦作 454000)
?
基于改進(jìn)局部五值模式的人臉識別
孫君頂周業(yè)勇
(河南理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院河南 焦作 454000)
摘要針對局部五值模式EQP(Elongated Quinary Pattern)采用全局閾值定義造成對圖像灰度變化敏感以及在人臉識別中對圖像不同分塊同等對待問題,提出基于局部五值模式增強(qiáng)方法。首先,通過自適應(yīng)方法來設(shè)置閾值,以提高其對圖像灰度變化的魯棒性;其次,通過特征塊加權(quán)處理,融入每個分塊結(jié)構(gòu)對比信息,以突出不同分塊的不同作用。采用在人臉識別領(lǐng)域廣泛應(yīng)用的ORL與YALE人臉庫進(jìn)行比較實驗,實驗結(jié)果表明,新方法明顯提高了EQP算子的識別效果。
關(guān)鍵詞人臉識別局部五值模式自適應(yīng)閾值特征塊加權(quán)
FACE RECOGNITION BASED ON IMPROVING ELONGATED QUINARY PATTERN
Sun JundingZhou Yeyong
(School of Computer Science and Technology,Henan Polytechnic University,Jiaozuo 454000,Henan,China)
AbstractElongated quinary pattern (EQP) adopts global threshold definition, which causes it being sensitive to the changes in image gray scale. On the other hand, it equally treats different sub-blocks of image in face recognition. Aiming at these problems, we proposed an EQP-based enhancement method. First, through adaptive approach we determined the threshold to improve its robustness on image gray scale changes. Then, through the treatment of feature blocks weighting we fused the structural contrast information of every sub-block in order to emphasise the different roles of different sub-blocks. We conducted the comparison experiments with the widely used ORL and YALE face database in face recognition field, and experimental results demonstrated that the proposed method greatly improved the recognition effect of EQP operator.
KeywordsFace recognitionElongated quinary patternAdaptive thresholdFeature blocks weighting
0引言
近年來,在各種人臉識別方法中,基于局部二值模式[1]LBP(Local Binary Pattern)的方法得到了廣泛關(guān)注。LBP最初應(yīng)用于紋理描述,但鑒于該算子簡單有效的特點,目前已經(jīng)在多個領(lǐng)域得到推廣應(yīng)用。Ahonen等[2]首先將LBP算子引入到人臉識別領(lǐng)域,此后,LBP算子引起了人臉識別研究者的廣泛興趣,各種針對LBP的改進(jìn)方法相繼被提了出來[3-8]。
為了提高LBP算子的抗噪性能,Tan和Triggs[9]提出了局部三值模式LTP(Local Ternary Pattern);在此基礎(chǔ)上,Nanni等[10]進(jìn)一步提出了五值模式EQP。雖然LTP與EQP算子有效增強(qiáng)了原LBP算子的抗噪性能,提高了人臉識別的準(zhǔn)確度。但是這兩種算子在選擇閾值時均采用全局閾值,因而降低了它們對于圖像灰度變化的魯棒性;另一方面,在利用這兩種算子進(jìn)行人臉識別時,往往對不同的人臉圖像分塊同等對待,沒有考慮不同分塊對人臉識別的不同貢獻(xiàn)程度。
為此,本文針對EQP算子,提出一種魯棒性方法REQP(Robust EQP)。一方面,新方法通過自適應(yīng)方法來設(shè)置閾值,以提高算子對灰度變化的魯棒性;另一方面,在對人臉分塊的基礎(chǔ)上,利用不同分塊的結(jié)構(gòu)對比信息作為權(quán)值進(jìn)行加權(quán)處理,以突出不同分塊特征對識別效果的貢獻(xiàn)程度。采用ORL與YALE兩個在人臉識別領(lǐng)域廣泛應(yīng)用的人臉庫進(jìn)行識別實驗,結(jié)果表明,改進(jìn)的方法對圖像灰度變化具有更好的魯棒性,也提高了人臉識別的準(zhǔn)確度。
1相關(guān)工作
1.1LBP
LBP最初是由Ojala等人[1]提出,其基本原理是針對圖像3×3的鄰域,以鄰域中心像素灰度值為閾值,將鄰域像素的灰度值與其作比較,不小于該閾值的像素點被標(biāo)記為1,否則標(biāo)記為0;然后通過給不同位置賦予不同權(quán)重,從而將該8位二進(jìn)制碼轉(zhuǎn)換為無符號的整數(shù),并將該整數(shù)定義為該鄰域的LBP值。
(1)
其中g(shù)c表示中心像素的灰度值,gp表示鄰域像素的灰度值?;镜倪\(yùn)算過程如圖1所示。
圖1 LBP編碼示例
1.2LTP
由于直接利用局部鄰域的中心像素的灰度值作為閾值,因此LBP對噪聲比較敏感,中心像素灰度的小的變化就可能造成LBP值的改變。如圖2所示,由于中心像素的灰度由35變?yōu)?0,其LBP編碼變得完全不同。為了提高LBP算子的抗噪性,Tan和Triggs[9]提出了局部三值模式LTP。
(2)
圖2 噪聲對LBP算子影響
其中T為閾值。顯然,LTP算子的特征維數(shù)達(dá)到38,為了降低特征維數(shù),Tan等進(jìn)一步提出將LTP編碼分解為兩個LBP編碼的形式,如圖3所示。
圖3 LTP編碼示例
1.3EQP
對LTP來說,在圖像灰度差異小的區(qū)域,噪聲對其還具有明顯的影響,為了進(jìn)一步提高算子對噪聲的魯棒性,Nanni等人[10]提出EQP算子:
(3)
其中T1、T2為閾值。為了降低特征維數(shù),借助于LTP的編碼方式,EQP編碼被分解為4個LBP編碼的形式,如圖4所示。
圖4 EQP編碼示例
2改進(jìn)的EQP方法
2.1自適應(yīng)閾值
對于LTP和EQP算子而言,所設(shè)定的閾值T、T1、T2均為全局閾值,因此局部灰度的變化可能會導(dǎo)致編碼的不同,如圖5(a)和(b)所示,兩個鄰域的灰度僅有微小差異,但卻得到不同的編碼。為此,文獻(xiàn)[11]提出通過局部鄰域灰度的方差來自適應(yīng)確定LTP的閾值T。本文首先基于該方法針對EQP來設(shè)置自適應(yīng)閾值,其定義如下:
Ti=αi×σ0<α≤1
(4)
其中,σ表示局部灰度均方差,αi為比例因子。由于σ隨著局部鄰域灰度的變化而變化,因此相對于EQP的T1與T2取固定值來說,這里的閾值隨著σ的變化而變化,具有自適應(yīng)性。圖5(c)所示,兩個鄰域的編碼沒有受到灰度微小變化的影響(取α1=0.1,α2=0.3),因此新方法具有更好的魯棒性。
圖5 LTP、EQP以及改進(jìn)方法編碼示例
2.2特征塊加權(quán)
在進(jìn)行人臉圖像分塊時,文獻(xiàn)[10]中沒有考慮不同分塊的結(jié)構(gòu)對比信息,將高對比結(jié)構(gòu)和低對比結(jié)構(gòu)分塊同等對待,沒有考慮不同分塊對于人臉識別的不同影響。如人眼睛、鼻子、嘴巴等高頻特征區(qū)域往往也是高對比結(jié)構(gòu)區(qū)域,這些區(qū)域的差異性明顯,用于人臉識別時效果突出。為此,本文在將人臉圖像進(jìn)行分塊后,為不同分塊設(shè)置了不同的權(quán)重。權(quán)重設(shè)置如下所示:
(5)
3人臉特征匹配
為實現(xiàn)人臉識別,首先采用REQP算子得到的直方圖特征作為人臉描述,其次通過式(5)計算不同分塊的權(quán)重。因而,人臉的分類識別變?yōu)橥ㄟ^匹配REQP直方圖特征的相似度來實現(xiàn)。目前常用的直方圖間距離計算方法有直方圖相交、Log概率統(tǒng)計和卡方概率統(tǒng)計等方法,但由于本文在特征塊中融入了結(jié)構(gòu)對比信息,因此采用加權(quán)卡方法[12]來計算特征相似度,其定義如下:
(6)
其中,SLH1和SLH2分別是訓(xùn)練樣本特征直方圖和測試樣本特征直方圖,i表示圖像分塊號,j表示特征維數(shù),wi為分塊權(quán)重。在此基礎(chǔ)上,文中采用最近鄰分類器實現(xiàn)人臉分類。
4實驗結(jié)果
為了測試本文方法的性能,實驗選用ORL和YALE的兩個在人臉識別領(lǐng)域廣泛應(yīng)用的人臉庫分別進(jìn)行識別實驗。實驗中,分別從兩個人臉庫中的每類隨機(jī)選擇1到7幅圖像作為訓(xùn)練樣本,其余作為測試樣本進(jìn)行分類實驗。每個實驗均包含三部分:
(1) 測試在不分塊的情況下,REQP與EQP算子的對比;
(2) 測試在選擇不同分塊數(shù)目情況下,REQP與EQP算子的對比;
(3) 測試融入結(jié)構(gòu)對比信息即特征塊加權(quán)后REQP算子的識別效果。
上述實驗分別進(jìn)行10次測試,并取10次的平均值作為最終結(jié)果。
4.1針對ORL人臉庫
ORL人臉庫包含40類、每類包含10幅在不同的光照與姿態(tài)下的人臉圖像,圖像大小為92×112。
(1) 在不分塊的情況下,REQP算子和EQP算子的對比如表1所示??梢钥闯觯?REQP的總體識別率高于EQP算子,同時也可以看出選擇不同的系數(shù)(α1與α2)以及閾值(T1與T2)對識別效果也存在一定的影響。
表1 不分塊的情況下EQP和REQP對比
(2) 將人臉圖像劃分為2×2、3×3兩種不重疊的分塊形式,REQP和EQP的識別效果分別如表2和表3所示。可以看出,分塊的數(shù)目對于識別率的影響較大,劃分為3×3分塊的識別效果明顯優(yōu)于2×2的效果,但劃分分塊越多,將導(dǎo)致特征維數(shù)的增加。
表2 分塊2×2情況下EQP和REQP對比
表3 分塊3×3情況下EQP和REQP對比
(3) 選擇3×3不重疊劃分的方式,并融入結(jié)構(gòu)對比信息后即對不同分塊進(jìn)行加權(quán)處理,REQP識別效果如表4所示。同表3對比,可以看出融入了結(jié)構(gòu)對比信息有效提高了識別率。
表4 融和結(jié)構(gòu)對比信息REQP的識別效果
4.2針對YALE人臉庫
YALE人臉庫中包含15類、每類包含11幅具有不同姿態(tài)及不同光照效果的人臉圖像,圖像的大小為100×100。
(1) 在不分塊的情況下,REQP算子和EQP算子的對比如表5所示??梢钥闯觯琑EQP的識別效果明顯優(yōu)于原EQP算子,同時也可以看出選擇不同的系數(shù)(α1與α2)以及閾值(T1與T2)對識別效果的影響。
表5 不分塊的情況下EQP和REQP對比
(2) 將人臉圖像劃分為2×2、3×3兩種不重疊的分塊形式,REQP和EQP的識別效果分別如表6和表7所示,實驗結(jié)果也同針對ORL的實驗結(jié)果一致。
表6 分塊2×2情況下EQP和REQP對比
表7 分塊3×3情況下EQP和REQP對比
(3) 選擇3×3不重疊劃分的方式,并融入結(jié)構(gòu)對比信息后即對不同分塊進(jìn)行加權(quán)處理,REQP識別效果如表8所示,可以看出,融入結(jié)構(gòu)對比信息后,有效提高了算子的識別效果。
表8 融入結(jié)構(gòu)對比信息REQP的識別效果
5結(jié)語
針對EQP算子采用全局閾值進(jìn)行定義以及在進(jìn)行人臉識別時對不同分塊同等對待的問題,提出了魯棒性更強(qiáng)的REQP算子。該算子通過設(shè)置自適應(yīng)閾值,提高其對局部灰度變化的魯棒性;通過融合局部分塊的結(jié)構(gòu)對比信息,提高對比結(jié)構(gòu)區(qū)域在人臉識別中的作用。采用ORL與YALE兩個人臉庫進(jìn)行識別實驗,實驗結(jié)果驗證了改進(jìn)的REQP算子有效提高了原EQP算子的性能。
參考文獻(xiàn)
[1] Ojala T,Pietikanten M,Hawood D.A comparative study of texture measure with classification based on featured distributions[J].Pattern Recognition,1996,29(1):51-59.
[2] Ahonen T,Hadid A,Pietikainen M.Face description with local binary patterns:Application to face recognition[J].IEEE Transactions on PAMI,2006,28(12):2037-2041.
[3] 趙懷勛,徐峰,陳家勇.基于多尺度LBP的人臉識別[J].計算機(jī)應(yīng)用與軟件,2012,29(1):257-259,279.
[4] 王憲,張炎,幕鑫,等.基于改進(jìn)的LBP人臉識別算法[J].光電工程,2012,39(7):110-114.
[5] Moore S,Bowden R.Local binary patterns for multi-view facial expression recognition[J].Computer Vision and Image Understanding,2011,115(4):541-558.
[6] Yan Ouyang,Nong Sang,Rui Huang.Robust automatic facial expression detection method based on sparse representation plus LBP map[J].International Journal for Light and Electron Optics,2013,124(24):6827-6833.
[7] Luo Yuan,Wu Caiming,Zhang Yi.Facial expression recognition based on fusion feature of PCA and LBP with SVM[J].International Journal for Light and Electron Optics,2013,124(17):2767-2770.
[8] Gao Tao,Feng X L,Lu He,et al.A novel face feature descriptor using adaptively weighted extended LBP pyramid[J].International Journal for Light and Electron Optics,2013,124(23):6286-6291.
[9] Tan X Y,Triggs B.Enhanced local texture feature sets for face recognition under difficult lighting conditions[J].IEEE Transactions on Image Processing,2010,19(6):1635-1650.
[10] Nanni L,Brahnam S,Lumini A.Local binary patterns variants as texture descriptors for medical image analysis[J].Artificial Intelligence in Medicine,2010,49(2):117-125.
[11] Liao Wenhung.Region description using extended local ternary patterns[C]//20th International Conference on Pattern Recognition,Istanbul,2010:1003-1006.
[12] 李杰,徐汀榮.基于Adaboost和LDP改進(jìn)算法的人臉檢測與識別研究[D].江蘇:蘇州大學(xué),2013.
中圖分類號TP391.41
文獻(xiàn)標(biāo)識碼A
DOI:10.3969/j.issn.1000-386x.2016.02.035
收稿日期:2014-07-23。河南省骨干教師計劃項目(2010GGJS-059);河南省國際合作項目(134300510057);河南省基礎(chǔ)與前沿基金項目(112300410281)。孫君頂,教授,主研領(lǐng)域:圖像處理與模式識別。周業(yè)勇,碩士生。