劉冉冉,馬慶功,鄭恩興
(1.常州劉國(guó)鈞高等職業(yè)技術(shù)學(xué)校 自動(dòng)化工程系,常州213025;2.江蘇大學(xué) 電氣工程學(xué)院,鎮(zhèn)江212013;3.常州大學(xué)信息中心 ,常州213164)
人臉識(shí)別是生物特性鑒別技術(shù)的一個(gè)主要方向,它涉及圖像處理,模式識(shí)別,計(jì)算機(jī)視覺等多個(gè)研究領(lǐng)域,具有十分廣泛的應(yīng)用前景,多年來(lái)一直是一個(gè)研究熱點(diǎn).相對(duì)于其它指紋識(shí)別、掌紋的識(shí)別及虹膜識(shí)別等征識(shí)別技術(shù),人臉識(shí)別技術(shù)是最直接、最自然、最容易被人接受的.與其它技術(shù)相比,它具有侵犯性小、較少需要或不需要用戶的主動(dòng)配合、樣本采集方便、應(yīng)用場(chǎng)合廣泛、潛在的數(shù)據(jù)資源豐富、設(shè)備成本低等優(yōu)點(diǎn)[1].本文重點(diǎn)研究了基于Adaboost算法的人臉檢測(cè)技術(shù),同時(shí)提出了改進(jìn)措施及算法的優(yōu)化處理.實(shí)驗(yàn)證明,改進(jìn)后的Adaboost算法在檢測(cè)率、誤識(shí)率等方面,都比原方法有了很大的提高[1].
基于Adaboost學(xué)習(xí)算法進(jìn)行人臉檢測(cè)的方法是2011年由Violaet a1I提出的,是一種利用級(jí)聯(lián)分類器、積分圖和Adaboost算法的一種人臉識(shí)別技術(shù),其核心內(nèi)容就是Adaboost算法.其基本思想就是通過一定的方法將大量弱分類器組合起來(lái),構(gòu)建一個(gè)分類能力較強(qiáng)的分類器.
目前,對(duì)Adaboost算法的研究及應(yīng)用主要體現(xiàn)在分類及回歸問題上,Adaboost算法的特點(diǎn)是利用全部的訓(xùn)練樣本集進(jìn)行訓(xùn)練,主要可以解決回歸問題、多類單標(biāo)簽問題、大類單標(biāo)簽問題、兩類問題及大類單標(biāo)簽問題等[2].
在目前所研究的檢測(cè)方法中,基于Adaboost算法的人臉識(shí)別技術(shù)不僅提高了檢測(cè)的速度而且具有較強(qiáng)的識(shí)別效果.例如僅用200個(gè)具有關(guān)鍵特征集合的樣本,其檢測(cè)率就可以達(dá)到95%以上,不到0.7s的時(shí)間就可檢測(cè)一副106400像素的圖像,較快的檢測(cè)速度及較強(qiáng)的識(shí)別效果使得Adaboost算法稱為檢測(cè)人臉的最好方法[3].
基于Adaboost算法的人臉檢測(cè)方法框架主要包括三部分:
(1)人臉用特征值表示,特征值的快速計(jì)算用積分圖實(shí)現(xiàn);
(2)弱分類器可以基于Adaboost算法進(jìn)行構(gòu)建,表示人臉的矩形特征,將弱分類器按照加權(quán)投票的方法構(gòu)建強(qiáng)分類器;
(3)為提高檢測(cè)速度,將訓(xùn)練后的強(qiáng)分類器進(jìn)行串聯(lián),構(gòu)造成一個(gè)級(jí)聯(lián)檢測(cè)器.
2.2.1 特征值和積分圖
(1)特征值
人臉圖片和非人臉圖片在相同的位置,其優(yōu)勢(shì)矩形特征的特征值大小是不一樣的,可以利用這一特點(diǎn)區(qū)分人臉與非人臉.
圖1是大部分矩形特征對(duì)人臉與非人臉樣本的特征值分布曲線,其中橫坐標(biāo)為樣本總數(shù),縱坐標(biāo)為特征值大小.大部分特征對(duì)人臉和非人臉樣本的特征值為零的點(diǎn)均集中在46.5%、51.5%的位置,即在全部特征的中間部分.此結(jié)果表明這些矩形特征對(duì)人臉與非人臉無(wú)分辨能力.
圖1 大部分矩形特征對(duì)人臉和非人臉樣本的特征值分布曲線
圖2是少數(shù)矩形特征對(duì)人臉與非人臉樣本的特征值分布曲線.對(duì)于非人臉樣本的分布,特征值為0的點(diǎn)處于所有特征的中間范圍(59.4%),但是對(duì)于人臉樣本,該特征有一致的趨向性,在0點(diǎn)一側(cè)的特征值大約為93.4%,與非人臉樣本相比相差為34%.因此該特征可以對(duì)人臉和非人臉進(jìn)行有效辨識(shí).此結(jié)果表明確實(shí)存在優(yōu)勢(shì)特征,在一定的置信區(qū)間內(nèi)可以區(qū)分人臉和非人臉[4].
圖2 少數(shù)矩形特征對(duì)人臉和非人臉樣本的特征值分布曲線
(2)積分圖
為了提高檢測(cè)速度,在AdaBoost算法中引入“積分圖”概念.其基本原理如下:坐標(biāo)(x,y)的積分圖可用式(1)表示:
坐標(biāo)(x,y)的積分圖可用ii(x,y)表示,原始圖像為i(x,y),式(2)為ii(x,y)的迭代公式.
其中s(x,y)表示行的積分和,且s(x,-1)=0,s(-1,y)=0.只需對(duì)圖像遍歷一次就可以求出一副圖像的積分和.
圖3 積分圖的計(jì)算
積分圖的計(jì)算如圖3所示.其中矩形框A、A+B、A+C、A+B+C+D、D中所有像素的像素值之和分別為點(diǎn)“1”、點(diǎn)“2”、點(diǎn)“3”、點(diǎn)“4”、4+1-(2+3)的積分圖的值.因此圖像中所有像素值之和都可以用積分圖計(jì)算.
2.2.2 訓(xùn)練過程
在Adaboost算法中通過對(duì)每個(gè)樣本集權(quán)重的調(diào)整來(lái)獲取不同的訓(xùn)練集.首先按照相同的權(quán)重對(duì)n個(gè)樣本訓(xùn)練出一組弱分類器.通過加大分類錯(cuò)誤樣本的權(quán)重、降低分類正確樣本的權(quán)重得到新的樣本分布,在此基礎(chǔ)上在此訓(xùn)練得到下一個(gè)弱分類器,經(jīng)過T次循環(huán)后將得到T個(gè)弱分類器,而最終得到的強(qiáng)分類器就是這T個(gè)弱分類器按一定的權(quán)重疊(boost)起來(lái)[5].
訓(xùn)練過程如下:
(1)給定一個(gè)訓(xùn)練樣本集:(x1,y1),(x2,y2),…,(xL,yL),gj(xi)代表第i個(gè)訓(xùn)練圖像的第j 個(gè)Haar-Like特征,xi∈X 代表訓(xùn)練樣本的輸入,yi∈Y={1,-1}當(dāng)值分別為1和-1時(shí)分別表示真樣本和假樣本.
(2)初始化權(quán)重 w1,i=1/2m,1/2n,其中 m 為真樣本的數(shù)目,n為假樣本的數(shù)目,總樣本數(shù)目為L(zhǎng)=m+n.
(3)對(duì)于T輪訓(xùn)練For t=1,2,…,T:
③在所獲取的簡(jiǎn)單分類器中,找出一個(gè)使得誤差εj最小的弱分類器hj.
(4)最終確定的強(qiáng)分類器為
在檢測(cè)圖像時(shí),強(qiáng)分類器的分類效果相當(dāng)于所有弱分類器的投票結(jié)果.結(jié)果顯示,在T=200時(shí),強(qiáng)分類器獲得最佳檢測(cè)效果.
2.2.3 構(gòu)建層疊分類器
為了更快的提高檢測(cè)速率,采用級(jí)聯(lián)結(jié)構(gòu)將強(qiáng)分類器串聯(lián)起來(lái)構(gòu)成層疊分類器.其過程示意圖如圖4所示.先為系統(tǒng)設(shè)定一個(gè)總的錯(cuò)誤報(bào)警率,當(dāng)訓(xùn)練所得的分類器沒達(dá)到錯(cuò)誤率要求時(shí),就再加入一層分類器,而每一層分類器經(jīng)Adaboost算法訓(xùn)練后必須滿足當(dāng)層所設(shè)定的檢測(cè)率及錯(cuò)誤報(bào)警率.
圖4 構(gòu)建層疊分類器的過程示意圖
構(gòu)建層疊分類器的算法:
①確定每層層疊分類器的最大誤檢概率f和每層最小檢測(cè)率d.
②確定目標(biāo)誤檢概率Ftarget.
③P:正樣本集,N:負(fù)樣本集.設(shè)置初始誤檢概率F0=1.0,檢測(cè)率D0=1.0.
④設(shè)置初始訓(xùn)練的層數(shù)i=0.
2.3.1 訓(xùn)練結(jié)果與分析
表1所示為經(jīng)Adaboost算法訓(xùn)練中所獲得的最優(yōu)弱分類器的平均誤差、迭代誤差和權(quán)重.
表1 訓(xùn)練中最優(yōu)弱分類器的參數(shù)
表中數(shù)據(jù)表明在訓(xùn)練過程中最優(yōu)弱分類器的迭代誤差是呈緩慢上升趨勢(shì),而迭代權(quán)重卻是下降的,下降的速率也逐漸變小,訓(xùn)練所得的平均誤差<0.5,訓(xùn)練所得分類器均具有一定的分類能力[6].
Adaboost算法在人臉檢測(cè)方便雖然具有識(shí)別效果好,檢測(cè)速度高等特點(diǎn),但是由在人臉有一定傾斜情況下有一定的檢測(cè)盲區(qū),為了提高算法的檢測(cè)效果,有必要對(duì)原訓(xùn)練算法進(jìn)行優(yōu)化.
對(duì)具有一定傾斜角度的人臉檢測(cè),若利用基本矩形特征訓(xùn)練所得到的強(qiáng)分類器,經(jīng)常存在漏檢情況,為提高該種情況下的檢測(cè)效果,本文將兩種新的特征矩形加入到訓(xùn)練模板中,如圖5所示.
圖5 兩種新的Haar特征模扳
本實(shí)驗(yàn)采用144個(gè)樣本進(jìn)行比較,表2所示為加入新的特征后的統(tǒng)計(jì)結(jié)果.
表2 引入新特征模板后的檢測(cè)結(jié)果
結(jié)果表明,對(duì)傾斜人臉的檢測(cè)方面,引入新模板后,不僅提高了識(shí)別效果,而且降低了誤識(shí)率,但是同時(shí)增加了訓(xùn)練過程中的時(shí)間,因此,為了提高檢測(cè)效果同時(shí)不增加耗時(shí),增加新的特征矩形只適用于傾斜角度的人臉識(shí)別[7].
本文基于Adaboost算法,重點(diǎn)研究了其檢測(cè)原理及實(shí)現(xiàn)方法,訓(xùn)練結(jié)果表明,訓(xùn)練所得的分類器具有一定的分類能力,但是在具有傾斜角度人臉識(shí)別方面的有檢測(cè)盲區(qū),針對(duì)這一問題,提出了Adaboost算法的優(yōu)化方法,通過加入兩種新的模版對(duì)分類器進(jìn)行訓(xùn)練,結(jié)果表明,優(yōu)化后的算法極大的提高了強(qiáng)分類器對(duì)傾斜角度人臉的檢測(cè)率.
[1] 祝 磊,朱善安.人臉識(shí)別的一種新的特征提取方法[J].計(jì)算機(jī)學(xué)報(bào),2007,34(6):122-1251.
[2] 何東風(fēng),凌 捷.人臉識(shí)別技術(shù)綜述[J].計(jì)算機(jī)學(xué)報(bào),2003,13(12)75-78.
[3] 陳才扣,王正群,楊靜宇,楊 健.一種用于人臉識(shí)別的非線性鑒別特征融合方法[J].電子學(xué)報(bào),2005,26(5):793-797.
[4] 何國(guó)輝,甘俊英.PCA-LDA算法在性別鑒別中的應(yīng)用[J].中國(guó)圖像圖形學(xué)報(bào),2006,32(19):208-211.
[5] 王 聃,賈云偉,林福嚴(yán).人臉識(shí)別系統(tǒng)中的特征提?。跩].自動(dòng)化學(xué)報(bào),2005,21(3-7):53-55.
[6] 張儉鴿,王世卿,盛光磊.基于小波和DFB-PCA的人臉識(shí)別算法研究[J].自動(dòng)化學(xué)報(bào),2007,23(1-2):253-255.
[7] 曹 林,王東峰,劉小軍,鄒謀炎.基于二維AdaBoost小波的人臉識(shí)別算法[J].電子學(xué)報(bào),2006,28(3)490-494.