晏 棟,孫作雷,張 倉,黃冠明
(上海海事大學 上海201306)
基于ACF算法的行人檢測研究
晏 棟,孫作雷,張 倉,黃冠明
(上海海事大學 上海201306)
近年來,關(guān)于行人檢測領(lǐng)域的研究,人們提出了各種各樣的方法。其中,多樣化的特征和高效的分類器是這些研究的關(guān)鍵,本文就是在這兩個方面找到一種更高效的方法來提高性能。我們的行人檢測方法是將3種特征關(guān)聯(lián)在一起,包括負特征(objectness features)、突出特征(salient feature)和邊緣特征(edgebox feature)。與此同時,我們改進分類器的架構(gòu)以提升性能。通過Caltech-USA和INRIA這兩個數(shù)據(jù)庫對模型進行訓練,相比于一般的檢測模型,我們的準確率提高了20%。
行人檢測;關(guān)聯(lián)特征;邊緣特征;突出特征;分類器
行人檢測如今已經(jīng)應用到生活的多個領(lǐng)域,如智能監(jiān)控、無人駕駛和智能相機等。自hog提出行人檢測這一思想,到如今已經(jīng)有約有數(shù)千種方法。現(xiàn)有的行人檢測方法大致可以分成三大類:DPM變體、深度網(wǎng)絡和決策森林。Felzenszwalb提出了dpm算法,這是一個強大的目標檢測模型,并且巧妙的利用在行人檢測領(lǐng)域。以前的神經(jīng)網(wǎng)絡更加關(guān)注與對行人的檢測。基于決策森林的算法能夠快速的確定各種合理的特征,以確保探測的質(zhì)量和速度,本文提出的方法也屬于這一類[1-4]。
在計算機識別領(lǐng)域,行人檢測一直是一個熱門研究課題,特別是2005年以后進入了一個快速發(fā)展的時期,數(shù)據(jù)庫訓練變得更大、更復雜,它要求探測器具有更高的精度和處理速度。Dalal和Triggs研究了目標檢測的特征集,然后他們發(fā)現(xiàn)HOG的優(yōu)勢在于對特征邊緣和梯度的描述,以及提出了一種新的SVM算法,用麻省理工的行人數(shù)據(jù)庫檢測有很好的效果。Dollar Petal介紹了加州理工學院的行人數(shù)據(jù)庫,并提出了一種基于VJ ICF方法的算法框架[5-6]。在之前的基礎上,他提出一種acf檢測體系,并且用Caltech-USA數(shù)據(jù)庫獲得了很好的效果[7-8]。
一般的,比較他們的性能都是在特定的數(shù)據(jù)庫上,而沒有關(guān)注探測器的泛化能力,特別是當訓練樣本和測試樣本有密切相關(guān)性的時候會有偏差。如果真的希望高質(zhì)量的算法能夠應用到實際的生活中,泛化能力應該是一個重要的評價標準[9-12]。
文中的主要結(jié)果是一個新穎的行人檢測器,這是一個ACF檢測架構(gòu)的擴展。我們將特殊的特征和邊緣特征加進ACF的架構(gòu),通過級聯(lián)的自適應閾值和分類器結(jié)構(gòu)級聯(lián)校準。
通過考慮性能、速度以及可擴展性,我們選擇ACF算法作為標準。對于一個輸入圖像,ACF架構(gòu)10頻道計算給定的圖像,包括梯度和顏色,歸一化梯度的大小,然后把在不同通道的像素整合在一起。特征在聚合的通道中是通過單個的像素查找。整個框架采用特征金字塔加快檢測過程,探測器由2018的二叉樹組成[13-14]。
良好的特征可以很好的提高對象探測器的泛化能力,特別是當探測器更多的探測不同的目標的時候。Dollar P利用邊界信息生成邊界框,用1000個測試樣本達到的準確率有96%以上,目標的重疊閾值為0.5[5]。考慮到這種優(yōu)秀的性能,在畫EdgeBox的時候思考自己的檢測體系結(jié)構(gòu),結(jié)合我們的優(yōu)化分類器,組成自己的探測器。與此同時,我們將edgebox特性和邊緣信息梯度大小進行歸一化處理。實驗表明這種新的探測器比傳統(tǒng)的ACF探測器更加準確,如圖1所示。
圖1 ACF算法edgebox邊緣檢測示意圖
盡管離散演算法取得了不錯的性能,我們?nèi)匀辉噲D用更好的方法。在這里我們選擇真正演算法[15-16]作為基礎結(jié)構(gòu),修改迭代規(guī)則的參數(shù),我們的新算法可以做如下描述:
輸入:N 個訓練樣本(xi,yi),xi是輸入向量,yi決定了輸出。
輸出:A函數(shù)H(x)可以對屬性向量x進行分類。
迭代:分類器的數(shù)量 T,t=1,2,…,T 計算 ht,gt以及更新的概率P1,…,PN:
1)選擇一個小的樣本St進行訓練,第i個樣本的概率為pi。
2)分類器的計算公式為:
4)更新概率
在訓練分類器的過程中,我們使用兩個參數(shù)來調(diào)整閾值:cascThr (constant cascade threshold) and cascCal(cascade calibration),過度的閾值和校準將嚴重影響精度和處理速度。通過實驗比較,我們發(fā)現(xiàn)行人檢測時給cascThr和cascCal分配不同的權(quán)重對結(jié)果有很大的影響如圖2所示。閾值偏大時,檢測過程中可能會漏檢;偏小時,會產(chǎn)生錯誤的檢測。
圖2 不同閾值下的準確率
一般來說,增大cascThr的權(quán)重可以增大檢測的準確率,但是速度會慢很多。因此,適當?shù)臋?quán)重分配對性能的提高可以做出很大的貢獻。與此同時,在我們的實際試驗中,兩個數(shù)據(jù)庫關(guān)聯(lián)后的最優(yōu)值和數(shù)據(jù)分開的性能有很大區(qū)別。我們進一步分析這些差異,發(fā)現(xiàn)最根本的原因是內(nèi)部參數(shù)值和圖像之間的關(guān)系特征?;诨谶@一發(fā)現(xiàn),我們使用自適應閾值的檢測結(jié)構(gòu),根據(jù)不同的條件調(diào)整閾值。
為了能夠比較合理的與其他方法的結(jié)果進行比較,我們用Caltech-USA數(shù)據(jù)庫中的樣本對SalientACF和EdgeBoxACF進行測試。為了將我們的探測器和基線探測器作比較,我們用INRIA數(shù)據(jù)庫對SalientACF和EdgeBoxACF進行測試。結(jié)果顯示探測器的泛化能力顯著提高,特別是Edge-BoxACF性能提高的更加明顯。為了更加直觀的反映模型的檢測性能,我們挑選了3種不同環(huán)境下的行人作為樣本來測試。圖3表示不同環(huán)境下的檢測效果。圖(a)所示,當行人的特征比較明顯且人與人之間沒有大面積的遮擋時,模型檢測的準確率可以達到100%;圖(b)所示,當行人樣本與樣本之間有大部分覆蓋時,我們的模型也可以通過突出的特征來進行精確的檢測,準確率可以達到90%;圖(c)所示,當行人處于比較廣闊的環(huán)境中時,由于距離相機較遠,難以獲得樣本的突出特征,這就使得檢測的速度和準確度大打折扣,但是我們的模型可以憑借其強大的泛化能力和突出的檢測效率快速作出判斷,準確率約為90%。
圖3 不同環(huán)境下的測試效果
實驗表明,基于ACF行人檢測算法用大量的樣本進行訓練,得到的模型具有極強的泛化能力,不管是在較小的環(huán)境中還是在比較大的環(huán)境中都能夠精確的檢測,而且經(jīng)過對分類器架構(gòu)的優(yōu)化,使得檢測的速度大大的增加,檢測一幀圖片的時間約為0.5秒,這就為實時的行人檢測提供了可能。
為了能夠提高探測器的泛化能力,我們用兩種方式來提取特征,用兩個數(shù)據(jù)庫INRIA和Caltech-USA的樣本對探測器進行訓練,取得了良好的實驗結(jié)果。特別是當環(huán)境中人比較多、環(huán)境比較復雜時,相比于基線探測器我們準確率要更高。在未來的研究工作中,我們會將更多的精力放在提升算法的運算速度上,在保證準確率的前提下,提高檢測速度,實現(xiàn)行人的實時檢測。
[1]Benenson,Rodrigo,et al."Pedestrian detection at 100 frames per second."Computer Vision and Pattern Recognition (CVPR) [C]//2012 IEEE Conference on.IEEE,2012.
[2]Sermanet,Pierre,et al.Pedestrian detection with unsupervised multi-stage feature learning[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2013.
[3]Ouyang,Wanli,Xiaogang Wang.Joint deep learning for pedestrian detection[C]//Proceedings of the IEEE International Conference on Computer Vision.2013.
[4] Benenson, Rodrigo.Ten years of pedestrian detection,what have we learned[C]//European Conference on Computer Vision. Springer International Publishing,2014.
[5]Dollár,Piotr,Ron Appel,and Wolf Kienzle.Crosstalk cascadesforframe-rate pedestrian detection[J].Computer Vision-ECCV 2012.Springer Berlin Heidelberg,2012:645-659.
[6]Dollar,Piotr.Pedestrian detection:An evaluation of the state of the art[J].IEEE transactions on pattern analysis and machine intelligence 34(4),2012:743-761.
[4]Benenson,Rodrigo.Ten years of pedestrian detection,what have we learned[C]//European Conference on Computer Vision.Springer International Publishing,2014.
[7]李娟,邵春福,楊勵雅.基于混合高斯模型的行人檢測方法[J].吉林大學學報:工學版,2011,41(1):41-45.
[8]種衍文,匡湖林,李清泉.一種基于多特征和機器學習的分級行人檢測方法[J].自動化學報,2012,38(3):375-381.
[9]姚雪琴,李曉華,周激流.基于邊緣對稱性和 HOG的行人檢測方法[J].計算機工程,2012,38(5):179-182.
[10]孫銳,陳軍,高雋.基于顯著性檢測與 HOG-NMF特征的快速行人檢測方法[J].電子與信息學報,2013,35(8):1921-1926.
[11]付洋,宋煥生,陳艷,等.一種基于視頻的道路行人檢測方法[J].電視技術(shù),2012,36(13):140-144.
[12]YAN,Jun-jie.Robust multi-resolution pedestrian detection in traffic scenes[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2013.
[13]Ouyang,Wanli,Xiaogang Wang.Single-pedestrian detection aided by multi-pedestrian detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2013.
[14]Luo,Ping.Switchable deep network for pedestrian detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014.
[15]Marin,Javier.Random forests of local experts for pedestrian detection[C]//Proceedings of the IEEE International Conference on Computer Vision,2013.
[16]Zhang Shan-shan,Christian Bauckhage,Armin B.Cremers.Informed haar-like features improve pedestrian detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition,2014.
Pedestrian detection based on ACF algorithm
YAN Dong,SUN Zuo-lei,ZHANG Cang,HUANG Guan-ming
(Shanghai Maritime University,Shanghai 201306,China)
In recent years,various methods in the field of pedestrian detection have been proposed.Among them,a variety of features and efficient classifier is the key to these studies,this paper is to find a more efficient way in these two areas to improve performance.Our pedestrian detection method is associated with three features,including the objectness features,salient feature and edgebox feature.At the same time,we have improved the classification architecture to improve performance.Caltech-USA and INRIA two databases train the model,compared to the general detection model,our accuracy rate increased by 20%.
pedestrian detection; correlation feature; edgebox feature;salient feature
TN99
A
1674-6236(2017)17-0172-04
2016-08-08稿件編號:201608063
晏 棟(1991—),男,湖北隨州人,碩士。研究方向:行人檢測。