• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于代價敏感深度決策樹的公交車環(huán)境人臉檢測

      2018-01-08 08:42:09薛彥兵徐光平王志崗
      計算機(jī)應(yīng)用 2017年11期
      關(guān)鍵詞:代價決策樹人臉

      婁 康,薛彥兵,張 樺,徐光平,高 贊,王志崗

      (1.計算機(jī)視覺與系統(tǒng)省部共建教育部重點實驗室(天津理工大學(xué)), 天津 300384;2.天津市智能計算及軟件新技術(shù)重點實驗室(天津理工大學(xué)),天津 300384)

      基于代價敏感深度決策樹的公交車環(huán)境人臉檢測

      婁 康,薛彥兵*,張 樺,徐光平,高 贊,王志崗

      (1.計算機(jī)視覺與系統(tǒng)省部共建教育部重點實驗室(天津理工大學(xué)), 天津 300384;2.天津市智能計算及軟件新技術(shù)重點實驗室(天津理工大學(xué)),天津 300384)

      針對公交車環(huán)境下的人臉檢測具有光照變化、模糊、遮擋、低分辨率和姿勢變化等問題,提出了基于代價敏感深度決策樹的人臉檢測算法。首先,基于歸一化的像素差異(NPD)特征構(gòu)建單個深度二次樹(DQT);接著,根據(jù)當(dāng)前決策樹的分類結(jié)果, 利用代價敏感Gentle Adaboost方法對樣本權(quán)重進(jìn)行更新,依次訓(xùn)練出多棵深度決策樹;最后,將所有決策樹通過Soft-Cascade級聯(lián)得到最終的檢測算法。在人臉檢測數(shù)據(jù)集(FDDB)和公交車視頻上的實驗結(jié)果表明, 所提算法與現(xiàn)有的深度決策樹算法相比,在檢測率和檢測速度上均有提升。

      歸一化的像素差異特征;代價敏感;深度二次樹;Gentle Adaboost方法;Soft-Cascade

      0 引言

      公交車是我國目前主要的公共交通工具之一,也是人群聚集的區(qū)域。對公交車的乘客進(jìn)行統(tǒng)計與分析,對于改善公交服務(wù)、保障公共安全等有重要的意義。隨著車載監(jiān)控攝像頭的普及和計算機(jī)視覺技術(shù)的發(fā)展,研究人員開始嘗試?yán)萌四槞z測技術(shù)對公交乘客進(jìn)行統(tǒng)計,但由于公交車上的攝錄視頻有光照變化、模糊、遮擋、低分辨率和姿勢變化等各種問題(公交車攝錄情況如圖1所示),這仍是一個尚未解決的難題。

      2001年Viola等[1]提取Haar特征和積分圖提出基于AdaBoost算法的檢測器,實現(xiàn)了實時運(yùn)行,其在正臉和接近正臉上有很好的效果,是人臉檢測史上的里程碑,但是它在擁擠的環(huán)境中性能較差。ViolaJones檢測器之后的人臉檢測算法,主要聚集在提取不同類型的特征[2-4]和構(gòu)建不同的級聯(lián)結(jié)構(gòu)[5]。其中各種各樣的復(fù)雜特征[6-8]一定程度上可以提升人臉檢測的性能,但產(chǎn)生的大量特征[9-10]需要花費(fèi)很長時間去訓(xùn)練。另一個發(fā)展是學(xué)習(xí)不同的級聯(lián)結(jié)構(gòu)[11-12]來適應(yīng)多角度的人臉變化,對每一個特定的人臉角度(或角度范圍)學(xué)習(xí)一個級聯(lián)分類器,然而在公交車的場景下,人臉姿態(tài)極為多變,定義所有的人臉姿態(tài)并不容易,并且隨著復(fù)雜級聯(lián)結(jié)構(gòu)中分類器數(shù)目的增長,計算花費(fèi)也會增長,此外這種方法還需要手工標(biāo)注每一張訓(xùn)練圖片中人臉的姿態(tài)。2010年Felzeswarb等[13]提出可變形部件模型(Deformable Part Model, DPM),DPM連續(xù)獲得目標(biāo)檢測類比賽(Visual Object Class,VOC)2007— 2009的檢測冠軍,但是DPM相對復(fù)雜,檢測速度很慢。DPM之后出現(xiàn)了基于深度學(xué)習(xí)的目標(biāo)檢測,深度學(xué)習(xí)可以學(xué)到較好的特征集,但是這樣的特征并不直觀。2014年Marku等[14]提出基于像素強(qiáng)度對比的目標(biāo)檢測(Pixel intensity comparison-based object detection, Pico)算法,它提取點對的特征,對兩個像素點進(jìn)行對比。這種方式提取的特征比Haar特征有效,運(yùn)算時間更短,但是Pico特征的設(shè)計過于簡單,對模糊低分辨率和受到遮擋圖像的魯棒性較差。2016年, Liao等[15]提出了歸一化的像素差異(Normalized Pixel Difference, NPD)特征, 與Pico特征同屬于像素級特征; 但是NPD特征對于低分辨率和光照等問題具有良好的魯棒性,將其與決策樹結(jié)合,不需要提前對人臉進(jìn)行標(biāo)注,就可以將不同角度的人臉自動劃分到樹分類器的葉子節(jié)點上。

      圖1 公交車內(nèi)攝錄情況Fig. 1 Video captured in a bus

      在上述檢測算法的訓(xùn)練過程中,準(zhǔn)確率是衡量分類效果的標(biāo)準(zhǔn),但有時準(zhǔn)確率并不能真正評價分類效果。因為當(dāng)錯誤分類發(fā)生時,不同誤分類帶來的損失不同,不同誤分類的權(quán)重也不同。對公交車環(huán)境下的人臉檢測而言,漏檢一個人臉窗口的代價比誤檢一個人臉窗口的代價更大。本文在文獻(xiàn)[15]的基礎(chǔ)上,引入代價敏感學(xué)習(xí)策略,構(gòu)造代價敏感深度決策樹來實現(xiàn)公交環(huán)境下的魯棒人臉檢測。

      1 研究框架

      本文提取NPD特征,用代價敏感深度決策樹處理公交車環(huán)境中任意姿態(tài)和遮擋問題的人臉集合。規(guī)定對正樣本誤分類的代價大于對負(fù)樣本的誤分類代價。利用代價敏感的 Gentle Adaboost訓(xùn)練出多棵深度決策樹,將所有樹級聯(lián),最終構(gòu)成代價敏感深度決策樹。系統(tǒng)的流程如圖2所示。

      圖2 算法流程Fig. 2 Algorithmic framework

      2 NPD特征及深度決策樹

      本章主要介紹NPD特征和深度決策樹。深度決策樹可以學(xué)習(xí)NPD特征的最優(yōu)子集,使其組合成具有較強(qiáng)區(qū)別能力的特征。樹分類器中的葉子節(jié)點可以自動劃分不同視角的人臉,而且不需要提前標(biāo)注訓(xùn)練的人臉圖片的角度。

      2.1 NPD特征

      NPD 特征表示兩個像素值之間的相對差異,NPD特征的定義為:

      f(x,y)=(x-y)/(x+y)

      (1)

      其中:x,y≥0是像素值,當(dāng)x=y=0時,x點與y點之間不存在灰度差異,所以定義x=y=0時,f(0,0)=0。

      f(x,y)的正負(fù)符號表示兩個點之間的灰度關(guān)系,f(x,y)的階數(shù)表示兩個點相對的灰度差異。同|x-y|這種表達(dá)方式相比,NPD 特征具有尺度不變性、較強(qiáng)的光照魯棒性。公交車環(huán)境下光照變化無處不在,所以這點特性非常重要。 由于NPD特征僅僅采用了圖像中的任意 2 個點作特征值計算,特征的表達(dá)更加靈活,相比 Haar-like 矩形特征和Pico特征,NPD 特征對于姿態(tài)變換、遮擋以及模糊和低分辨率等都更具魯棒性。除此之外, NPD 特征具有反對稱性,無論f(x,y)或f(y,x)都可以進(jìn)行特征表示,所以特征空間能夠相應(yīng)減小。其還擁有有界性,由式(1)可知,界限為[-1,1],有界性有助于對 NPD 特征直方圖化,并據(jù)此實現(xiàn)一個決策樹分類器。

      2.2 深度決策樹

      經(jīng)典的決策樹算法[16]主要有在1986年Quinlan提出的ID3算法和1993年提出的C4.5算法,以及在1984年Breiman等提出的分類與回歸樹算法(Classification And Regression Tree,CART)。上述決策樹算法在分裂節(jié)點時都是由單閾值決定的,忽略了樹內(nèi)部的分支流動順序信息,而且這種閾值方式不能獲取到不同特征維度之間的聯(lián)系。

      2015年Liao等[15]基于CART算法提出深度二次樹(Deep Quadratic Tree,DQT)算法,是一種新的樹節(jié)點分裂的計算方法:(ax2+bx+c)

      (2)

      (3)

      (4)

      式(2)和式(3)分別表示了x的亮度低于y和x的亮度高于y,這兩種結(jié)構(gòu)用傳統(tǒng)的單邊界比較方式就可以表達(dá),但是x

      3 基于代價敏感的深度決策樹

      深度決策樹以獲得最小錯誤率為最終目標(biāo),不考慮正確率之外的其他影響因素。深度決策樹將所有分類錯誤造成的代價都視為相同的代價,在構(gòu)建模型時,葉子節(jié)點傾向于將樣例標(biāo)記為訓(xùn)練集中樣本數(shù)量較多的類。對于本文研究的公交車環(huán)境下的人臉檢測而言,人臉相對于整個背景是一個小概率事件,對于這樣的小概率事件,可以認(rèn)為漏檢一個人臉窗口的代價比誤檢一個人臉窗口的代價更大。在公交車環(huán)境中,正樣本的分布多種多樣,而且某種情形下的正樣本可能樣本量比較少,對于這樣的難例,只有加大對正樣本的權(quán)重,才能更好地檢測出正例困難樣本?;诖吮疚囊肓舜鷥r敏感學(xué)習(xí),構(gòu)造代價敏感深度決策樹。

      代價敏感決策樹算法的研究[17]有兩種:一種是在決策樹算法中使用代價敏感的葉節(jié)點分裂準(zhǔn)則,建立單個的代價敏感決策樹模型;另一種是在決策樹算法的基礎(chǔ)上附加代價敏感集成學(xué)習(xí)元算法,建立多棵決策樹對分類結(jié)果加權(quán)求和獲得最終的分類模型。第二種方法的通用性較好,本文所做的研究主要是在深度決策樹的基礎(chǔ)上,附加Gentle Adaboost算法[18],并改進(jìn)Gentle Adaboost算法的權(quán)重因子[19],使其在正樣本錯分率大于負(fù)樣本錯分率時,加大正樣本權(quán)重。 建立多棵深度決策樹后用Soft-Cascade[20]級聯(lián),獲得最終的代價敏感深度決策樹。

      Gentle Adaboost算法進(jìn)行權(quán)重更新時,只重視對樣本的整體分類能力,以加權(quán)均方誤差最小化的準(zhǔn)則訓(xùn)練深度決策樹。其權(quán)重更新的公式為:

      wt+1,i=wt,i·exp(-yi·ht(xi))

      (5)

      其中:yi=1為人臉正樣本,yi=-1為非人臉負(fù)樣本,xi代表第i個樣本,ht(xi)代表第t棵深度決策樹的分類結(jié)果。對訓(xùn)練樣本分類正確時yi·hi(xi)>0所以wt+1,iwt,i該樣本的權(quán)重值增加。樣本權(quán)重更新的目的是加大分類錯誤的樣本占有的權(quán)重比例,使下一棵深度決策樹分類時,將重點放在被錯分的樣本上。

      根據(jù)公交車環(huán)境下正樣本的分類錯誤的代價大于負(fù)樣本的分類錯誤代價,對Gentle Adaboost算法進(jìn)行改造。 當(dāng)正樣本的錯分率大于負(fù)樣本的錯分率時,為了體現(xiàn)正樣本被錯誤分類時比負(fù)樣本付出的代價更大,可對正樣本的權(quán)重進(jìn)行如下的改變:

      wt+1,i=Ct·wt,i·exp(-yi·ht(xi))

      (6)

      其中:Ct>1稱為代價敏感因子,且Ct=exp((FPR-FNR)·k),F(xiàn)NR為正樣本的錯分率,F(xiàn)PR為負(fù)樣本的錯分率,k>0為調(diào)節(jié)因子。通常當(dāng)負(fù)樣本比正樣本的數(shù)量越多,k的取值越大,使Ct的大小可以根據(jù)正負(fù)樣本錯分率進(jìn)行調(diào)整,在本實驗過程中k取值為1。權(quán)重更新方式改變后加大了正樣本的權(quán)重,分類器更加重視對正樣本的分類。但是毫無顧慮地增加正樣本權(quán)重,會造成權(quán)重分配的過適應(yīng),為了避免在訓(xùn)練過程中因困難樣本而造成權(quán)重分布嚴(yán)重扭曲, 需要采取措施來限制樣本權(quán)重的過度增加。在實驗的過程中定義樣本最大權(quán)重為100。

      wt,i=min (exp(-yi·ht(xi)),maxWeight)

      (7)

      代價敏感深度決策樹的權(quán)重更新流程如下:

      初始化權(quán)重:

      (8)

      1)采用雙閾值訓(xùn)練一棵深度決策樹。

      2)計算本輪樣本的權(quán)重平均值ut和權(quán)重標(biāo)準(zhǔn)差σt:

      (9)

      (10)

      3)計算當(dāng)前深度決策樹對應(yīng)的FNR、FPR值。

      4)更新權(quán)重:

      如果wt,i-ut>3σt同時yi·hi(xi)<0,則wt+1,i=wt,i,否則

      wt+1,i=

      (11)

      5)深度決策樹的個數(shù)加1,權(quán)重歸一化wt,i=wt,i/∑wt,i。

      4 實驗結(jié)果

      為了驗證算法的有效性,分別在公共數(shù)據(jù)集和本文建立的公交車視頻數(shù)據(jù)集上對提出的算法進(jìn)行測試。

      4.1 基于FDDB數(shù)據(jù)集的性能評價

      學(xué)習(xí)算法模型使用帶標(biāo)注的人臉數(shù)據(jù)集(Annotated Facial Landmarks in the Wild,AFLW)[21]訓(xùn)練建立模型,使用FDDB數(shù)據(jù)集評估模型。對AFLW圖集作變換,最終訓(xùn)練過程中生成20萬正例。采用無人臉背景圖替換掉AFLW所有圖片中的人臉部分作為負(fù)例,每輪作隨機(jī)采用,最終生成20萬負(fù)例。FDDB是無約束自然場景人臉檢測數(shù)據(jù)集,該數(shù)據(jù)集包含了從各個不同自然場景下不面孔拍攝的2 845幅圖像中的5 171個人臉,每個人臉都有其規(guī)定的坐標(biāo)位置。

      圖3 部分人臉正樣本Fig. 3 Some positive samples

      圖4 部分負(fù)樣本Fig. 4 Some negative samples

      本文采用的人臉模板是24×24,設(shè)定DQT的最大深度是8,當(dāng)?shù)竭_(dá)樹的最大深度或者到達(dá)當(dāng)前葉子節(jié)點的正例與負(fù)例總量過小時,停止當(dāng)前這棵DQT的訓(xùn)練。在一棵樹內(nèi)的訓(xùn)練條件下,不會更新權(quán)重,數(shù)據(jù)會在這棵DQT內(nèi)不斷被劃分,每個分支節(jié)點都依據(jù)被劃分到的數(shù)據(jù)訓(xùn)練NPD特征。當(dāng)一棵樹訓(xùn)練完成,對正樣本敏感的Gentle Adaboost進(jìn)行權(quán)重更新,權(quán)重更新完成后進(jìn)行下一棵樹的訓(xùn)練。所有NPD節(jié)點組合成一個DQT,所有DQT組合成一個Soft-Cascade的分類器。本文訓(xùn)練得到最終的檢測器包含1 000個DQT。分類器結(jié)構(gòu)如圖5所示。

      圖5 分類器結(jié)構(gòu)Fig. 5 Classifier architecture

      本文通過評檢測率和受試者工作特征曲線(Receiver Operating Characteristic curve,ROC)來評估本文建立的決策樹模型。Jain等[22]提出了一種評價代碼, 用于不同人臉檢測算法的比較, 并且還提出了基于ROC的兩種性能評價指標(biāo):離散得分指標(biāo)(discrete score metric)和連續(xù)得分指標(biāo)(continuous score metric),分別對應(yīng)著人臉的粗匹配(coarse matching)和精確匹配(precise matching)。表1是將本文訓(xùn)練得出的基于NPD的原始分類器和改進(jìn)后具有代價敏感的分類器與FDDB數(shù)據(jù)集上提供的Pico、ViolaJones、Mikolajczyk[23]、XZJY[24]、Koestinger等[25]方法在FP等于0、10和100時檢測率比較。考慮到本文目的是研究一種訓(xùn)練簡單、不需要提前標(biāo)注人臉姿態(tài)信息、檢測速度較快的方法,不與訓(xùn)練復(fù)雜的深度學(xué)習(xí)類人臉檢測方法和檢測速度緩慢的DPM算法進(jìn)行比較。

      表1 不同方法在FDDB數(shù)據(jù)集上的檢測率比較 %Tab. 1 Comparison of detection rate on FDDB database %

      圖6和圖7是本文方法在兩種性能指標(biāo)下人臉檢測準(zhǔn)確率召回率曲線。曲線上的點越接近(0,1)表示檢測器性能越好。因Koestinger方法也是從AFLW數(shù)據(jù)集上學(xué)習(xí)模型,在ROC曲線圖上加入了Koestinger方法的比較,本文方法在兩種指標(biāo)下性能都是最好的。

      圖6 ROC曲線(連續(xù)得分指標(biāo))Fig. 6 ROC curves on FDDB database with continuous score metric

      NPD特征僅包含兩個像素點,并且可以使用查找表技術(shù),使得每個NPD特征的求值只需要訪問很少的內(nèi)存。因NPD特征本身的優(yōu)越性,訓(xùn)練得出的分類器檢測速度比較快, 并且采用代價敏感Gentle Adaboost后,在訓(xùn)練過程中加大正樣本的權(quán)重,刪除較小權(quán)重的樣本,對于同一個訓(xùn)練集,改進(jìn)后的算法使最終參與訓(xùn)練的樣本數(shù)減少,訓(xùn)練出的最終分類器體積減少。在CPU為i7-6700 3.40 GHz,內(nèi)存為8 GB的計算機(jī)上檢測出一張人臉的平均時間如表2所示,改進(jìn)后方法的檢測速度得到提升。

      圖7 ROC曲線(離散得分指標(biāo))Fig. 7 ROC curves on FDDB database with discrete score metric表2 單張人臉檢測時間比較Tab. 2 Comparison of detection time on single face image

      檢測方法耗時/ms檢測方法耗時/msNPD16本文方法14

      4.2 基于公交車環(huán)境的性能評價

      本文采集了3萬張公交車環(huán)境下的樣本,樣本來源于兩輛公交車從早上7點到下午5點的不同時間段的21個公交車視頻。其中1.5萬張為正樣本,涵蓋了不同光照條件下不同姿態(tài)的人臉。1.5萬張正樣本加入到隨機(jī)選取出的1.5萬張AFLW數(shù)據(jù)圖片中,將這3萬張樣本進(jìn)行變換生成30萬張正樣本。本文自制的部分正負(fù)樣本如圖8、9所示。

      圖8 部分正樣本Fig. 8 Some positive samples

      在訓(xùn)練時依舊采用24×24的人臉模板,設(shè)定深度決策樹的最大深度為8,訓(xùn)練過程中用代價敏感Gentle Adaboost更新時,設(shè)定每個樣本的最大權(quán)重100。最終本文方法訓(xùn)練出1 500棵深度決策樹。為方便訓(xùn)練模型的評估,本文從現(xiàn)有的公交車視頻中截取131幀圖像,包括283張人臉作為測試集。在檢測時,采用固定待檢圖像不變、等比放大檢測窗口的方法。相比以往最小檢測窗口設(shè)定為24×24,最大窗口設(shè)定為3 956×3 956的方式,本文結(jié)合公交車攝錄實際情況將最小的檢測窗口尺寸設(shè)定為41×41,以1.2倍增幅遞增,最大窗口設(shè)定為532×532,實驗表明這種設(shè)定方式有效提升了檢測速度,檢出率和檢測到每張臉?biāo)玫臅r間如表3、4所示。改進(jìn)后的模型在公交車上應(yīng)用時具有更高的檢出率,誤檢窗口有所增加,但是檢測時間有所降低。

      圖9 部分負(fù)樣本Fig. 9 Some negative samples表3 公交車視頻人臉檢出率比較

      %Tab. 3 Comparison of detection rate on bus video %

      表4 公交車視頻單幀人臉檢測時間比較Tab. 4 Comparison of single frame face detection time on bus video

      在公交車攝錄截圖的部分檢測結(jié)果如圖10所示。

      圖10 本文算法在公交車視頻上的檢測結(jié)果Fig. 10 Detected faces on bus video by the proposed algorithm

      5 結(jié)語

      本文提出了一種基于代價敏感深度決策樹的人臉檢測方法,在深度決策樹級聯(lián)的學(xué)習(xí)過程中引入代價敏感學(xué)習(xí),減小了圖像的漏檢率。與現(xiàn)有的深度決策樹的方法比較,該方法訓(xùn)練得出的分類器體積減小,檢測速度提升,更適合公交車環(huán)境下的人臉檢測。雖然該算法可以檢測出遮擋嚴(yán)重的臉部,但是公交車環(huán)境下還有一部分乘客刷卡后馬上背對攝像頭完全無法露出臉部,因此本文可能后續(xù)的工作包括:與跟蹤算法相結(jié)合,進(jìn)一步提升乘客的檢出率,達(dá)到更加精確的公交乘客流量統(tǒng)計。

      References)

      [1] VIOLA P, JONES M. Rapid object detection using a boosted cascade of simple features[C]// Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2003: 511-518.

      [2] LIENHART R, MAYDT J. An extended set of Haar-like features for rapid object detection[C]// Proceedings of the 2002 International Conference on Image Processing. Piscataway, NJ: IEEE, 2002: 900-903.

      [3] LI S, ZHU L, ZHANG Z, et al. Statistical learning of multi-view face detection[C]// Proceedings of the 7th European Conference on Computer Vision. London: Springer-Verlag, 2002:67-81.

      [4] JONES M, VIOLA P. Fast multi-view face detection[C]// Proceedings of the 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway, NJ: IEEE, 2003: 276-286

      [5] WU B, AI H, HUANG C et al. Fast rotation invariant multi-view face detection based on real AdaBoost[C]// Proceedings of the 6th IEEE International Conference on Automatic Face and Gesture Recognition. Washington, DC: IEEE Computer Society, 2004: 79-84.

      [6] FROBA B, ERNST A. Face detection with the modified census transform[C]// Proceedings of the 6th IEEE International Conference on Automatic Face and Gesture Recognition. Washington, DC: IEEE Computer Society, 2004:91-96.

      [7] JIN H, LIU Q, LU H, et al. Face detection using improved LBP under Bayesian framework[C]// Proceedings of the 2004 IEEE First Symposium on Multi-Agent Security and Survivability. Washington, DC: IEEE Computer Society, 2004:306-309.

      [8] MITA T, KANEKO T, HORI O. Joint Haar-like features for face detection[C]// Proceedings of the 10th IEEE International Conference on Computer Vision. Washington, DC: IEEE Computer Society, 2005: 1619-1626.

      [9] ZHANG H, GAO W, CHEN X, et al. Object detection using spatial histogram features[J]. Image and Vision Computing, 2006, 24(4): 327-341.

      [10] ZHANG L, CHU R, XIANG S, et al. Face detection based on multi-block LBP representation[C]// Proceedings of the 2007 International Conference on Advances in Biometrics. Berlin: Springer-Verlag, 2007:11-18.

      [11] LI S, ZHANG Z. FloatBoost learning and statistical face detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004, 26(9):11-12.

      [12] HUANG C, AI H, LI Y, et al. High-performance rotation invariant multiview face detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(4):671-686.

      [13] FELZENSZWALB P F, GIRSHICK R B, MCALLESTER D, et al. Object detection with discriminatively trained part-based models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1627-1645.

      [15] LIAO S, JAIN A K, LI S Z.A. Fast and accurate unconstrained face detector[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2016, 38(2):211.

      [16] 李航.統(tǒng)計學(xué)習(xí)方法[M].北京: 清華大學(xué)出版社, 2012:55-75.(LI H. Statistical Learning Methods[M]. Beijing: Tsinghua University Press, 2012:55-75.)

      [17] 李秋潔, 茅耀斌, 葉曙光,等.代價敏感Boosting算法研究[J].南京理工大學(xué)學(xué)報(自然科學(xué)版), 2013, 37(1):23-28.(LI Q J, MAO Y B, YE S G, et al. Cost-sensitive Boosting algorithm[J].Journal of Nanjing University of Science and Technology, 2013, 37(1):23-28.)[18] 曹二奎.基于Gentle Adaboost的人臉檢測算法研究[D]. 西安: 西安電子科技大學(xué), 2013:49-60.(CAO E K. Research on face detection algorithm based on Gentle Adaboost [D]. Xi’an: Xidian University, 2013:49-60.)

      [19] 曹瑩, 苗啟廣, 劉家辰,等. 具有Fisher一致性的代價敏感Boosting算法[J].軟件學(xué)報, 2013,24(11):2584-2596.(CAO Y, MIAO Q G, LIU J C, et al. Fisher consistent cost sensitive Boosting algorithm[J].Journal of Software, 2013,24(11):2584-2596.)

      [20] BOURDEV L, BRANDT J. Robust object detection via soft cascade[C]// Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2005:236-243.

      [21] K?STINGER M, WOHLHART P, ROTH P M, et al. Annotated facial landmarks in the wild: a large-scale, real-world database for facial landmark localization[C]// Proceedings of the 2011 IEEE International Conference on Computer Vision Workshops. Piscataway, NJ: IEEE, 2011: 2144-2151.

      [22] JAIN V, LEARNED-MILLER E. FDDB: a benchmark for face detection in unconstrained settings[EB/OL].[2016- 11- 20]. http://www.cics.umass.edu/~elm/papers/fddb.pdf.

      [23] MIKOLAJCZYK K, SCHMID C, ZISSERMAN A. Human detection based on a probabilistic assembly of robust part detectors[C]// Proceedings of the 8th European Conference on Computer Vision. Berlin: Springer-Verlag, 2004:69-82.

      [24] SHEN X, LIN Z, BRANDT J et al. Detecting and aligning faces by image retrieval[C]// Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition. Washington, DC: IEEE Computer Society, 2013:3460-3467.

      [25] K?STINGER M, WOHLHART P, ROTH P M, et al. Robust face detection by simple means[EB/OL].[2016- 11- 20]. http://dagm2012.icg.tugraz.at/cvaw12/procs/02_Koestinger_cvaw2012.pdf.

      This work is partially supported by the National Natural Foundation of China (U1509207,61325019,61472278, 61403281, 61572357).

      LOUKang, born in 1992, M. S. candidate. Her research interests include computer vision, machine learning.

      XUEYanbing, born in 1979, M. S., associate reseach fellow. His research interests include computer vision, machine learning.

      ZHANGHua, born in 1962, Ph. D., professor. Her research interests include computer vision, machine learning.

      Facedetectioninbusenvironmentbasedoncost-sensitivedeepquadratictree

      LOU Kang, XUE Yanbing*, ZHANG Hua, XU Guangping, GAO Zan, WANG Zhigang

      (1.KeyLaboratoryofComputerVisionandSystemofMinistryofEducation(TianjinUniversityofTechnology),Tianjin300384,China;2.TianjinKeyLaboratoryofIntelligenceComputingandNovelSoftwareTechnology(TianjinUniversityofTechnology),Tianjin300384,China)

      The problems of face detection in bus environment include ambient illumination changing, image distortion, human body occlusion, abnormal postures and etc. For alleviating these mentioned limitations, a face detection based on cost-sensitive Deep Quadratic Tree (DQT) was proposed. First of all, Normalized Pixel Difference (NPD) feature was utilized to construct and train a single DQT. According to the classification result of the current decision tree, the cost-sensitive Gentle Adaboost method was used to update the sample weight, and a number of deep decision trees were trained. Finally, the classifier was produced by Soft-Cascade method with multiple upgraded deep quadratic trees. The experimental results on Face Detection Data set and Benchmark (FDDB) and bus video show that compared with the existing depth decision tree algorithm, the proposed algorithm has improved the detection rate and detection speed.

      Normalized Pixel Difference (NPD) feature; cost-sensitive; Deep Quadratic Tree (DQT); Gentle Adaboost method; Soft-Cascade

      2017- 05- 16;

      2017- 06- 05。

      國家自然科學(xué)基金資助項目(U1509207, 61325019, 61472278, 61403281, 61572357)。

      婁康(1992—),女,山東聊城人,碩士研究生,CCF會員,主要研究方向:計算機(jī)視覺,機(jī)器學(xué)習(xí); 薛彥兵(1979—),男,山東沂南人,副研究員,碩士, CCF會員,主要研究方向:計算機(jī)視覺、機(jī)器學(xué)習(xí); 張樺(1962—),女,四川安丘人,教授,博士生導(dǎo)師,博士,CCF會員,主要研究方向:計算機(jī)視覺、機(jī)器學(xué)習(xí)。

      1001- 9081(2017)11- 3152- 05

      10.11772/j.issn.1001- 9081.2017.11.3152

      (*通信作者電子郵箱yanbingxue@163.com)

      TP391.41

      A

      猜你喜歡
      代價決策樹人臉
      有特點的人臉
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      三國漫——人臉解鎖
      動漫星空(2018年9期)2018-10-26 01:17:14
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      愛的代價
      海峽姐妹(2017年12期)2018-01-31 02:12:22
      代價
      基于決策樹的出租車乘客出行目的識別
      成熟的代價
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      馬面部與人臉相似度驚人
      北川| 芜湖县| 呼伦贝尔市| 凉城县| 韶山市| 安化县| 盐边县| 台南县| 疏附县| 峡江县| 星子县| 论坛| 拜泉县| 双桥区| 台前县| 庄浪县| 余庆县| 金阳县| 五河县| 六枝特区| 九江市| 平遥县| 泗洪县| 凤山市| 博野县| 辉县市| 桑日县| 游戏| 和田市| 平湖市| 绥阳县| 东海县| 嘉峪关市| 海盐县| 蚌埠市| 晋宁县| 台东市| 剑阁县| 东兰县| 会理县| 锡林浩特市|