張欣,劉海,宋卓展
(河北大學(xué) 電子與信息工程學(xué)院,河北 保定 071002)
?
基于變尺度DCT和PCA的人臉識(shí)別方法
張欣,劉海,宋卓展
(河北大學(xué) 電子與信息工程學(xué)院,河北 保定071002)
針對(duì)實(shí)際應(yīng)用中要對(duì)不同尺度的人臉圖像進(jìn)行匹配和識(shí)別的需求,提出一種基于變尺度DCT(離散余弦變換)結(jié)合PCA(主成分分析法)的人臉識(shí)別方法.首先將不同尺度的人臉圖像進(jìn)行DCT變換,然后提取出相同的DCT系數(shù),再將提出的DCT系數(shù)進(jìn)行PCA降維,最后進(jìn)行匹配識(shí)別.通過(guò)對(duì)ORL人臉庫(kù)及實(shí)驗(yàn)采集的多尺度人臉圖像進(jìn)行實(shí)驗(yàn),證明了所提方法對(duì)不同尺度圖像的匹配識(shí)別有效,并測(cè)算了DCT變換后的修剪尺度及PCA特征維數(shù)對(duì)該方法識(shí)別準(zhǔn)確率的影響.
人臉識(shí)別;變尺度;DCT;PCA;匹配
科技的發(fā)展與進(jìn)步使人臉識(shí)別的需求越來(lái)越高,人臉識(shí)別在技術(shù)和實(shí)用層面受到了極大重視與發(fā)展.如模板匹配法[1],簡(jiǎn)單直接,但應(yīng)用的模板過(guò)大就會(huì)導(dǎo)致計(jì)算量大.神經(jīng)網(wǎng)絡(luò)法[2-3],有很強(qiáng)的魯棒性和容錯(cuò)性,適合并行分布處理,但神經(jīng)元數(shù)目多,訓(xùn)練時(shí)間長(zhǎng),識(shí)別速度慢.基于隱馬爾科夫模型的方法[4-5],充分考慮了人臉各器官的不同特征和它們的相互聯(lián)系,魯棒性好,但是隱馬爾科夫是一個(gè)線性模型,不能描述非線性,當(dāng)人臉庫(kù)數(shù)據(jù)較大時(shí),實(shí)時(shí)性不好.基于AdaBoost的人臉識(shí)別算法[6-8]訓(xùn)練的錯(cuò)誤率上界,隨著迭代次數(shù)的增加,會(huì)逐漸下降,但其計(jì)算復(fù)雜度較高.基于幾何特征的人臉識(shí)別方法[9],易于理解,存儲(chǔ)量小,對(duì)光照不敏感,難點(diǎn)在于如何建立模型來(lái)準(zhǔn)確地提取人臉的幾何特征.基于代數(shù)特征的人臉識(shí)別方法[10],如獨(dú)立成分分析法是建立在圖像的高階統(tǒng)計(jì)特性基礎(chǔ)之上的,從原始圖像中提取出該圖像的灰度特征,雖然灰度特征的各特征分量之間相互獨(dú)立,但是獨(dú)立成分分析法沒(méi)有考慮灰度特征的主次關(guān)系,因此獨(dú)立成分分析法很難反映從原始信號(hào)中提取出的各個(gè)分量的主次程度.以上方法對(duì)于相同尺度的人臉圖像具有較好的識(shí)別效果.
在人臉識(shí)別的實(shí)際應(yīng)用中,人臉圖像通常是尺度不同的.本文利用離散余弦變換(discrete cosine transform,DCT)與基于代數(shù)特征方法中的主成分分析法(principal component analysis,PCA)設(shè)計(jì)了一種變尺度的人臉識(shí)別方法.該方法首先對(duì)不同尺度的人臉圖像進(jìn)行DCT變換,然后提取固定數(shù)量的DCT系數(shù),再進(jìn)行主成分分析,最后利用向量模值歸一化的方法進(jìn)行匹配識(shí)別.
1.1離散余弦變換
DCT,是一種經(jīng)常使用的壓縮圖像數(shù)據(jù)的方法,在數(shù)字圖像處理技術(shù)中,它在最小均方誤差這個(gè)先提條件下的壓縮性能及誤差最接近于最佳條件下的K-L 變換.針對(duì)于一幅尺度為A×B的數(shù)字圖像,它的二維DCT公式為
(1)
a.人臉圖像;b.對(duì)圖a進(jìn)行DCT變化.圖1 DCT變換示例Fig.1 DCT transformation example
式中,u= 0 ,1 ,… ,A-1 ;v= 0 ,1,…,B-1.經(jīng)過(guò)二維離散余弦變換后的圖像,如圖1中的a、b圖所示.圖1a中的低頻分量集中在了圖1b的左上角,其高頻分量則集中在圖1b的右下角.經(jīng)過(guò)二維離散余弦變換的圖像的左上角的低頻分量包含了原始圖像的主要信息,相比之下右下角的高頻分量所包含的信息就顯得不那么重要.保留左上角的低頻信息,適當(dāng)舍去高頻信息,使不同尺度的人臉圖像具有了相同的DCT系數(shù),為后期匹配識(shí)別奠定了基礎(chǔ).
1.2主成分分析法
PCA計(jì)算出樣本的特征向量并將其在特征空間的分布作為原始數(shù)據(jù),在最小均方意義的先提條件下尋找最佳原始數(shù)據(jù)的投影,從而使原始特征空間的維數(shù)下降.
假設(shè)將人臉圖像訓(xùn)練集用向量的形式表示為
(2)
1.3匹配
構(gòu)造一個(gè)基于模板的匹配技術(shù),原理為對(duì)于大小為M×N的圖像f(x,y)和大小為A×B的子圖像模式ω(x,y),f和ω的相關(guān)性可以表示如下:
(3)
其中,x=0,1,2,…,N-B;y=0,1,2,…,M-A.
計(jì)算c(x,y)的過(guò)程是將圖像f(x,y)作為固定模板,子圖像ω(x,y)在其中逐點(diǎn)移動(dòng),使ω的原點(diǎn)和點(diǎn)(x,y)重合,然后算出被ω所覆蓋圖像區(qū)域中所對(duì)應(yīng)的各個(gè)點(diǎn)的像素乘積后再求和,其和就是c(x,y)在(x,y)點(diǎn)的響應(yīng)結(jié)果.
2個(gè)向量的點(diǎn)積為
(4)
用于計(jì)算匹配的相關(guān)公式改進(jìn)如下:
(5)
公式(5)利用向量之間夾角的余弦值從而使其響應(yīng)結(jié)果只與圖像f(x,y)、ω(x,y)的自身形狀(或紋理)有關(guān),與亮度無(wú)關(guān)且最大響應(yīng)值為1,即越接近于1越好.
2.1實(shí)驗(yàn)樣本
實(shí)驗(yàn)樣本包括國(guó)際通用的人臉數(shù)據(jù)庫(kù)ORL (olivert ti research laboratory)中的圖像和實(shí)際采集的人臉圖像.ORL人臉庫(kù)是由英國(guó)劍橋Olivetti實(shí)驗(yàn)室從1992年4月到1994年4月期間拍攝的一系列人臉圖像組成,共有40個(gè)不同年齡、不同性別和不同種族的對(duì)象.每個(gè)對(duì)象10幅圖像共計(jì)400幅灰度圖像組成,圖像尺寸是92×112,圖像背景為黑色,其中人臉部分表情和細(xì)節(jié)均有變化,例如笑與不笑、眼睛睜著或閉著,戴或不戴眼鏡等,人臉姿態(tài)也有變化,其深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)20度,人臉尺寸也有最多10%的變化.該庫(kù)是目前使用最廣泛的標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),它含有大量的比較結(jié)果,如圖2所示.
圖2 ORL人臉庫(kù)部分圖像Fig.2 ORL face database
實(shí)際采集的人臉數(shù)據(jù):在光照均勻的前提下利用蘋果手機(jī)4S的后置的800萬(wàn)攝像頭,在以白色為背景進(jìn)行拍攝的不同方位的人臉圖像,總計(jì)300人,每人10張,共計(jì)3 000張人臉圖像,并經(jīng)過(guò)剪輯,使得剪輯之后的人的面部至少占整個(gè)圖像的50%且圖像的尺度不同,如圖3所示.
2.2識(shí)別流程
1) DCT 變換.將ORL人臉庫(kù)和實(shí)際采集的樣本總計(jì)60人共600幅人臉灰度圖像隨機(jī)混合后構(gòu)成樣本集,把樣本中的每幅人臉圖像進(jìn)行二維DCT 變換,選取變換后的圖像中的前若干個(gè)分量并保留下來(lái).每人隨機(jī)選取5幅共計(jì)300幅人臉圖像組成訓(xùn)練集,所有剩余的圖像則組成測(cè)試集.假定選擇的二維DCT矩陣的系數(shù)個(gè)數(shù)為X×Y.
圖3 實(shí)際采集的部分多尺度人臉圖像Fig.3 Real part of multi-scale face images
2) PCA分析.將訓(xùn)練集的圖像做PCA變換,并將其組成特征子空間.將訓(xùn)練集和測(cè)試集的圖像投影到所求得的特征子空間里,就會(huì)求得投影系數(shù),用投影得到的系數(shù)替換原始人臉圖像,從而達(dá)到對(duì)人臉圖像的特征提取和二次降維的目的,其中對(duì)每個(gè)變換的圖像提取N個(gè)主成分.
3)匹配.將每個(gè)測(cè)試樣本分別輸入,用式(5)進(jìn)行數(shù)據(jù)匹配,計(jì)算各個(gè)匹配值,選取最大者.
2.3實(shí)驗(yàn)結(jié)果
在實(shí)驗(yàn)中,經(jīng)DCT變換后,能量集中于左上角,以圖像左上角的點(diǎn)為起始點(diǎn)提取大小為行乘以列為X×Y的圖像,將提取出的圖像進(jìn)行PCA變換,選取N個(gè)主成分,即降至N維.把完成后的圖像集作為匹配模板.選取測(cè)試集的圖像,經(jīng)以上步驟處理,作為識(shí)別樣本與模板進(jìn)行匹配,選取最大匹配值.實(shí)驗(yàn)結(jié)果表明,本文提出的方法應(yīng)用在不同尺度人臉圖像下,優(yōu)于單獨(dú)DCT和單獨(dú)PCA的方法.
為了測(cè)試DCT提取系數(shù)X×Y對(duì)本方法識(shí)別準(zhǔn)確率的影響,設(shè)定PCA提取主成分?jǐn)?shù)為20,測(cè)試不同DCT提取系數(shù)下的識(shí)別準(zhǔn)確率,結(jié)果如表1和圖4所示.
從下面表1和圖4中的數(shù)據(jù)可以看出:提取的PCA主成分?jǐn)?shù)為定值時(shí),隨著提取的DCT提取系數(shù)逐漸增加時(shí),識(shí)別準(zhǔn)確率較改進(jìn)之前也在增加,但過(guò)大的DCT提取系數(shù)會(huì)增加運(yùn)算量.
表1 固定PCA主成分?jǐn)?shù)的識(shí)別準(zhǔn)確率
a.改進(jìn)之前;b.改進(jìn)之后.圖4 固定PCA系數(shù),改變DCT系數(shù)ROC曲線變化Fig.4 Fixed PCA coefficient,the change of DCT coefficient ROC curve
為了測(cè)試PCA主成分?jǐn)?shù)對(duì)本方法識(shí)別準(zhǔn)確率的影響,設(shè)定DCT提取系數(shù)為56×46,測(cè)試不同PCA主成分?jǐn)?shù)下的識(shí)別準(zhǔn)確率,結(jié)果如表2和圖5所示.
表2 固定DCT提取系數(shù)的識(shí)別準(zhǔn)確率
由表2和圖5可知,當(dāng)DCT提取出的數(shù)目一定時(shí),隨著PCA提取數(shù)的增加,識(shí)別準(zhǔn)確率也較改進(jìn)之前隨之增加,但到達(dá)峰值時(shí)準(zhǔn)確率上升不明顯.
a.改進(jìn)之前ROC曲線; b.改進(jìn)之后ROC曲線.圖5 固定DCT系數(shù),改變PCA系數(shù)ROC曲線變化Fig.5 Fixed DCT coefficient,the change of PCA coefficient ROC curve
[1]CHAIT Y,RIZON M, WOO S S,et al.Facial features for template matching based face recognition[J].American Journal of Applied Sciences.2009,6(11):1897-1901.
[2]LU J,ZHAO J W,CAO F L.Extended feed forward neural networks with random weights for face recognition[J].Neurocomputing,2014(136):96-102.DOI:dx.doi.org/10.1016/j.neucom.20141.01.022.
[3]李康順,李凱,張文盛.一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的PCA人臉識(shí)別算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014,3(11):158-161.DOI:10.3969 /j.issn.1000-386x.2014.01.041.
LI Kangshun,LI Kai,ZAHNG Wensheng.PCA face recognition algorithm based on improved BP neural network[J].Computer Applications and Software,2014,3(11):158-161.DOI:10.3969 /j.issn.1000-386x.2014.01.041.
[4]ANSUMAN M,TUSAR K M,PANKAJ,et al.Human recognition system for outdoor videos using Hidden Markov model[J].International Journal of Electronics and Communications,2013,08(011):227-236.DOI:dx.doi.org/10.1016/j.aeue.2013.08.011.
[5]李忠建,楊宜民,梅平.基于改進(jìn)的隱馬爾科夫模型的人臉識(shí)別方法[J].工業(yè)控制計(jì)算機(jī),2014,27(11):29-31.
LI Zhongjian,YANG Yimin,MEI Ping.Approach of face recognition based on improved Hidden Markov model[J].Industrial control computer,2014,27(11):29-31.
[6]SRINIVASAN A.A Framework for face recognition using adaptive binning and adaboost techniques[J].International Journal of Multimedia & Its Applications,2014,3(1):76-88.DOI:10.5121/ijma.2011.3107.
[7]徐永紅,申鴻魁,趙艷茹,等.四元數(shù)目小波和Adaboost在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(29):196-199.DOI:10.3778/j.issn.1002-8331.2011.29.055.
XU Yonghong,SHEN Hongkui,ZHAO Yanru,et al.Application of quaternion wavelet and Adaboost in face recognition[J].Computer Engineering and Application,2011,47(29):196-199.DOI:10.3778/j.issn.1002-8331.2011.29.055.
[8]王宏漫,歐宗瑛.人面部的代數(shù)特征與幾何特征的提取及識(shí)別[D].大連:大連理工大學(xué),2003.
WANG Hongman,OU Zongying.Human facial algebraic and geometrical feature extraction and recognition[D].Dalian:Dalian University of Technology,2003.
[9]張淑軍,王高峰,石峰.基于AAM提取幾何特征的人臉識(shí)別算法[J].系統(tǒng)仿真學(xué)報(bào),2013,25(10):2374-2380.DOI:10.16182/j.cnki.joss.2013.10.029.
ZHANG Shujun,WANG Gaofeng,SHI Feng.Face recognition algorithm based on Geometric characteristics extracted by AAM [J].System Simulation,2013,25(10):2374-2380.DOI:10.16182/j.cnki.joss.2013.10.029.
[10]鄭宇杰,楊靜宇,吳小俊.基于獨(dú)立成分分析和模糊支持向量機(jī)的人臉識(shí)別方法[J].系統(tǒng)仿真學(xué)報(bào),2005,17(7):1768 -1770.DOI:10.16182/j.cnki.joss.2005.07.063.
ZHENG Yujie,YANG Jingyu,WU Xiaojun.Face recognition by independent component analysis and fuzzy support vector machine[J].System Simulation,2005,17(7):1768 -1770.DOI:10.16182/j.cnki.joss.2005.07.063.
(責(zé)任編輯:孟素蘭)
Variable scale face recognition based on DCT and PCA
ZHANG Xin,LIU Hai,SONG Zhuozhan
(Electronic Information Engineering College,Hebei University,Baoding 071002,China)
A variable scale face images recognition method is proposed, based on the DCT binding the PCA. First, different scale face images are transformed by DCT. Then, the same DCT coefficients are extracted;and the dimension of the DCT coefficients is reduced by PCA. Finally, matching and recognition of images is done. By the ORL and collected face images, it is proved that the method of recognition variable scale images is efficient. Effective values of DCT transformed coefficients and PCA feature dimension are measured.
face recognition; variable scales; discrete cosine transform; principal component analysis; match
10.3969/j.issn.1000-1565.2016.02.016
2015-10-19
國(guó)家自然科學(xué)基金資助項(xiàng)目(61203160)
張欣(1966—),男,河北承德人,河北大學(xué)教授,博士,主要從事機(jī)器視覺、圖像處理、模式識(shí)別和故障診斷方向研究.
E-mail:zhangxin@hbu.edu.cn
TP391
A
1000-1565(2016)02-0204-06