郭 烈, 張明恒, 李琳輝, 趙一兵
(1.大連理工大學工業(yè)裝備結(jié)構分析國家重點實驗室,遼寧大連116024;2.大連理工大學汽車工程學院,遼寧大連116024)
作為一項汽車主動安全技術,行人檢測系統(tǒng)能及時為駕駛員提供預防碰撞行人的警示信息,保障行人和駕駛員的安全.目前,越來越多的單位和機構開始行人檢測技術的研究,如歐盟的PROTECTOR計劃和SAVE-U計劃,均采用多傳感器信息融合來保護行人或騎自行車人等弱勢交通參與者;法國的PAROTO項目融合雷達和紅外圖像來探測車輛前方的行人或車輛等障礙物,并對其進行運動分析[1、2].國外大學如Parma、CMU、MIT和國內(nèi)的西安交通大學、清華大學、吉林大學以及中國科學院自動化研究所等也在該領域開展了相關研究[3、4].
目前,行人識別主要依據(jù)行人的周期性運動特性或者行人的形狀特征.通常,人體在行走時,其步態(tài)會呈現(xiàn)周期性特性,結(jié)合圖像序列進行分析,可確定其是否為運動的行人.如Heisele等[5]用時滯神經(jīng)網(wǎng)絡的聚類算法分析行人腳部的周期性運動模式來識別行人.但是,該方法只對運動的行人有效,并需要多幀圖像序列才能得出結(jié)果,導致響應時間滯后.基于行人形狀特征的方法主要是采用統(tǒng)計學習的方法來分析候選區(qū)域,判斷其是否為行人.這種方法對車輛前方靜止和運動的行人均有效,但人形狀的多樣性,導致其對假目標比較敏感,因此,需要提取有效的特征進行訓練和分類器設計[6].
本文綜合行人的形態(tài)特征以及AdaBoost算法簡單、實時性好的特點,首先利用AdaBoost算法訓練得到的級聯(lián)分類器快速獲得圖像中可能存在行人的候選區(qū)域;然后采用支持向量機SVM對表征行人的多維特征向量進行訓練,從而得到識別行人的分類器,開展基于SVM的行人識別方法研究.
候選區(qū)域分割的目的是從圖像中提取可能存在行人的窗口區(qū)域作進一步驗證,避免窮盡搜索,以提高系統(tǒng)的速度.AdaBoost算法基本思想是學習得到一系列弱分類器,并按照一定的疊加方法構成一個強分類器,若干個強分類器再串聯(lián)組成級聯(lián)分類器.最后,利用這個級聯(lián)分類器來完成對圖像的搜索[7].
為快速分割圖像中的行人候選區(qū)域,本文選擇樣本的類Haar特征進行訓練.類Haar的每個特征由2~3個矩形組成,分別檢測邊緣和線性特征,其特征值是所組成的矩形區(qū)域的灰度積分之和[8]:
式中:w i∈R為矩形的權值,RecSum(ni)為矩形ni區(qū)域的灰度積分,k是矩形個數(shù).
強分類器訓練步驟如下:首先,給定N對訓練樣本(x1,y1),(x2,y2),…,(x N,y N),其中x i為表征樣本的特征向量,yi∈{0,1}對應于非行人和行人樣本.已知訓練樣本中有k個非行人和l個行人樣本;初始化誤差權重w1,i=D(i),當樣本為行人時,D(i)=1/2l;當樣本為非行人時,D(i)=1/2k.假設訓練輪數(shù)為t=1,2,…,T,循環(huán)執(zhí)行如下操作.
(1)權重標準化
(2)訓練得到對應每個特征j的弱分類器
式中:p j表示不等式的方向,只能取1或-1;f j(x)表示特征值;θj為閾值.
(3)選擇具有最小誤差εt的簡單分類器h t(x)并加入到強分類器中
(4)按照最佳的簡單分類器ht(x)更新每個樣本所對應的權重
其中如果第i個樣本的特征向量x i被正確分類,ei=0,反之ei=1;βt=εt/(1-εt).
最后得到的強分類器如下:
上述訓練過程表明,樣本權重的調(diào)整主要依據(jù)分類器是否能對樣本正確分類,如果分類正確,則減少這些樣本的權重;如果分類錯誤,則增加其權重并進一步訓練,強化對這些錯誤分類樣本的訓練.最終,所有的弱分類器以不同的權重組合形成一個強分類器.
樣本的特征提取和分類器的訓練是離線進行的,訓練樣本共980幅,其中行人樣本516幅,非行人樣本464幅,并將尺寸縮放成16×32,如圖1所示.訓練時,設置訓練階段數(shù)為18、每個階段的檢測率為0.995、虛警率為0.5.按照這個設置訓練得到了18個強分類器,每個強分類器包含了若干個弱分類器及其分割閾值.表1列出了訓練得到的前8個強分類器中所包含的類Haar特征及其數(shù)量.
圖1 行人分割訓練樣本Fig.1 Sample images used for pedestrians segmentation training
表1 前8個強分類器所包含的類Haar特征及其數(shù)量Tab.1 Haar-like feature and number of the first 8 strong classifiers
本文通過縮放檢測矩形框來遍歷掃描待檢圖像,以分割圖像中大小未知的行人目標.本文待檢圖像大小為320×240,最小檢測矩形框為32×64,根據(jù)試驗確定將矩形框縮放1.2倍.具體掃描過程如下:(1)從待檢圖像的左下角開始,逐行每隔一個像素向右移動矩形框,直至達到圖像邊緣為止;(2)利用訓練得到的級聯(lián)分類器對待檢矩形框進行判決:通過所有強分類器才被判定為行人窗口,否則,判定為非行人窗口;(3)將檢測矩形框放大1.2倍,并按上述步驟重新對整幅圖像進行掃描.
圖2是行人候選區(qū)域的分割結(jié)果,由于道路兩側(cè)樹木、電線桿以及其他道路設施等干擾,分割結(jié)果中可能存在一些誤判為行人的候選區(qū)域.為此,需要進一步對候選區(qū)域進行判別分類,實現(xiàn)行人的識別.
圖2 行人候選區(qū)域分割結(jié)果Fig.2 Results of the candidate pedestrians segmentation
在進行訓練之前,需要提取一系列描述待檢目標的特征.通常,待檢目標在很大程度上決定了提取什么樣的特征.本文以行人作為待檢目標,考慮到人體形狀多樣性和光照條件變化等因素的影響,將提取的行人樣本灰度圖像紋理和對稱性特征以及邊緣圖像邊界矩和梯度特征作為訓練分類器的輸入.
2.1.1 樣本灰度圖像的特征提取 通過分析樣本圖像發(fā)現(xiàn),行人在圖像中紋理特征比較豐富,尤其在行人腳與地面的接觸區(qū)域、行人頭部或肩膀與背景的分界處.而其他的一些干擾,如路面上車輛、道路兩側(cè)的樹木等,其灰度分布一般比較雜亂,導致其紋理特征不明顯.因此,本文采用紋理特征作為區(qū)分行人與非行人的特征之一.
目前,廣泛采用的紋理分析方法是基于灰度共生矩陣方法,利用灰度共生矩陣來計算表征圖像紋理粗細、慣性矩、紋理復雜度以及局部均勻性等特征[9].本文主要選用以下幾個紋理特征來表征行人.
能量:反映紋理的粗細,計算公式為
熵:表征圖像紋理的復雜程度,計算公式為
慣性矩:反映局部像素對的灰度差別,計算公式為
局部平穩(wěn)性:反映圖像局部灰度均勻性,計算公式為
式中:p(i,j)為灰度共生矩陣第i行第j列的元素,L為灰度級數(shù).
為消除光照不均對紋理特征提取結(jié)果的影響,本文將樣本圖像縮放成64×128,并進行直方圖均衡化處理[10].同時,為保證提取紋理特征的旋轉(zhuǎn)不變性,抑制方向?qū)ζ溆绊?,本文分塊處理計算圖像的紋理特征,最后取平均.分塊原則是兩像素間隔為5、塊大小為16×16,按0°、45°、90°、135° 4個方向計算灰度共生矩陣.這樣,每種特征在每個方向上都有特征值,取這4個方向的平均值作為樣本的紋理特征.圖3是提取的部分紋理特征.
圖3 訓練樣本紋理特征比較Fig.3 Comparison of the texture features of sample images
灰度圖像的另一特征就是對稱性.由于行人衣著顏色和腿部形狀通常是左右對稱的,在灰度圖像中往往表現(xiàn)出明顯的對稱性特征[11].灰度對稱性的計算基于以下思想:圖像的每行灰度值可當成水平像素坐標的一維函數(shù)g(x),該函數(shù)是偶函數(shù)ge(x)和奇函數(shù)go(x)之和,利用奇函數(shù)和偶函數(shù)的相對大小來反映函數(shù)的對稱度,偶函數(shù)占的比重越大,該行像素越對稱.對稱性測度計算公式如下[12]:
式中:xs為對稱軸位置,b為對稱寬度,Eo為奇函數(shù)的能量函數(shù),E′e為歸一化偶函數(shù)的能量函數(shù).對稱性測度s為區(qū)間[-1,1]內(nèi)的任意數(shù),s=1表示完全對稱,s=-1表示完全不對稱.本文依次以圖像中央20列中每列為對稱軸,計算該列兩側(cè)22個像素范圍的對稱性,并取平均值作為該列的對稱性測度,最后取各列中的最大值作為該樣本的灰度對稱性特征值.
2.1.2 樣本邊緣圖像的特征提取 通過對樣本邊緣圖像分析發(fā)現(xiàn),行人的外形輪廓使其具有明顯的邊緣,呈現(xiàn)豐富的邊緣特征,尤其是在行人的腿部區(qū)域,行人的垂直邊緣比較明顯,并且比水平邊緣多.而對于非行人樣本邊緣圖像,其邊緣通常是不規(guī)則的,有的具有豐富的水平邊緣,有的具有豐富的垂直邊緣.因此,為了消除光照對行人識別的影響,本文還提取了表征行人的邊緣圖像特征進行分類器的訓練.
在眾多的邊緣提取算子中,Canny算子在圖像去噪和細節(jié)保留上取得了較好的平衡,能在圖像邊緣模糊的情況下較好地提取邊緣[13].圖4(a)為原始圖像,本文采用Canny算子對樣本進行邊緣檢測,如圖4(b)所示.從圖中可以看出,該算子能較好地提取行人的邊緣輪廓,但同時也存在一些干擾噪聲,如行人頭部與背景部分邊緣較多.為去除部分不連續(xù)邊緣的干擾,減少計算的復雜度,本文對邊緣提取結(jié)果進行了邊界跟蹤,并記錄跟蹤的邊緣點數(shù),保留邊緣點數(shù)超過20個像素點的邊緣作為人體輪廓,如圖4(c)所示.
圖4 樣本的邊緣提取及邊界跟蹤結(jié)果Fig.4 The edge abstraction and tracking of sample images
從邊界跟蹤結(jié)果可知,人體特定形狀使其具有一定的輪廓和矩,可利用跟蹤的邊界像素計算各種邊界矩特征.文獻[14]介紹了只利用目標邊界信息來計算矩的方法,并推導證明了由此算得的Hu不變矩同樣具有平移、旋轉(zhuǎn)和尺度縮放不變性.本文選用前兩個Hu不變矩作為表征行人的邊界特征,部分行人和非行人樣本邊界矩如圖5所示.
圖5 樣本圖像的前兩個Hu不變矩Fig.5 The first two Hu invariable moments of samples images
利用Canny算子提取邊緣的同時,還能獲得圖像的梯度方向.梯度方向值一般在[0,π),為了形象地表示圖像的梯度方向,本文將其用0~255的灰度值來表示,值越大表示梯度方向值越大,如圖6所示.梯度方向的最大值一般出現(xiàn)在一些邊緣比較明顯的地方,而在一些紋理比較一致的區(qū)域,其值一般很小.行人的上半身,尤其是行人頭部所在的區(qū)域,由于復雜背景的干擾,其梯度方向值變化比較顯著;而行人的下半身所在的區(qū)域,由于背景是灰度比較均勻的路面圖像,而腿部占據(jù)圖像比例較大,其邊緣比較明顯,導致在某些梯度方向上存在最大值[15].
圖6 樣本圖像的梯度、梯度方向及區(qū)域劃分Fig.6 The sample images gradient,gradient orientation and the area to be considered
為降低計算的復雜度,本文只分析了存在行人腿部的下半部分的梯度方向特征,如圖6(d)所示,根據(jù)左右腿可能存在的區(qū)域,將圖像的下半部分對稱分為a、b兩個區(qū)域,將梯度方向值按20°間距等分為8個區(qū)間,統(tǒng)計圖像中每點梯度方向落在各個區(qū)間的概率.因此,對于a、b這兩個區(qū)域均能得到8個區(qū)間的概率值.這樣,每個樣本就有16個梯度方向概率值,并以此作為該樣本的梯度方向特征.
決策識別是行人檢測系統(tǒng)的核心,它對分割的候選區(qū)域進行驗證,以判斷其是否包含行人,分類性能決定了整個檢測系統(tǒng)的精度和魯棒性.在統(tǒng)計學習理論中,支持向量機能獲得比傳統(tǒng)學習方法更好的泛化和推廣能力,尤其是在解決小樣本、非線性學習問題,在高維輸入矢量或者沒有先驗知識的情況下,對于二類分類識別是一個理想的選擇.本文的識別目標為行人,是一個典型的二類模式分類問題,因此,本文選擇支持向量機學習方法,對所提取的多維特征向量進行訓練,得到識別行人的分類器.
支持向量機方法通過適當?shù)膬?nèi)積函數(shù)實現(xiàn)某一非線性變換,將不可分的樣本轉(zhuǎn)化為高維特征空間,使其在該特征空間中線性可分,得到最優(yōu)分類面[16].支持向量機的決策函數(shù)在形式上與神經(jīng)網(wǎng)絡類似,函數(shù)的輸出是各中間節(jié)點的線性組合,每個中間節(jié)點就是一個支持向量,其結(jié)構示意圖如圖7所示.
圖7 支持向量機結(jié)構示意圖Fig.7 The architecture of support vector machines
為了得到行人識別分類器,本文選取與分割訓練樣本數(shù)一致的由516個行人和464個非行人組成的另一組樣本集,共計980個樣本,樣本大小為64×128.訓練的輸入x是一個23維的特征向量,依次為4個紋理特征、1個對稱性特征、2個邊界矩特征和16個梯度方向特征.訓練的輸出為y,當樣本為行人時,其值為1;當樣本為非行人時,其值為-1.
為了避免輸入向量中一些較大的特征數(shù)值占有主導地位,而影響一些小數(shù)值范圍的特征,有必要在進行訓練之前對其進行歸一化處理,從而減小計算的復雜程度.本文將輸入向量的每個特征線性地歸一化至區(qū)間[-1,1].
為測試與評價訓練得到的分類器性能,本文選取了由260個行人和240個非行人樣本組成的測試樣本集,并采用與訓練樣本相同的預處理和特征提取方法得到測試樣本集的特征向量.
分類器性能的好壞在很大程度上取決于核函數(shù)的類型、懲罰系數(shù)C以及核函數(shù)參數(shù).常用的核函數(shù)是多項式核函數(shù)、徑向基核函數(shù)以及Sigmoid核函數(shù).本文在設置相同的懲罰函數(shù)的前提下,用對比分析的方法來確定適合的核函數(shù),并用測試樣本集進行分類器性能的測試,結(jié)果如表2所示,檢測率Rd和虛警率Rf定義為[17]
其中N為測試集中的行人樣本總數(shù),本文N=260;n為分類器正確檢測到的行人樣本數(shù);m為被分類器確定為行人的非行人樣本數(shù).
表2 不同核函數(shù)下SVM測試性能(C=1 000)Tab.2 The testing performance of SVM under different kernel functions(C=1 000)
從表2可知,要想獲得相近的檢測率,如86%左右,采用多項式核函數(shù)需要282個支持向量,而徑向基核函數(shù)則需要420個支持向量,比多項式核函數(shù)方法多138個支持向量.支持向量數(shù)越多,意味著在分類決策時內(nèi)積運算量越大.考慮實時性的要求,本文用多項式核函數(shù)方法實現(xiàn)特征向量的內(nèi)積運算.
確定訓練核函數(shù)后,下一步需要選擇懲罰系數(shù)C以及核函數(shù)的階數(shù)ξ.引入懲罰系數(shù)C是為了限制Lagrange乘子的范圍,使得0≤αi≤C.由圖7中的決策規(guī)則可知,懲罰系數(shù)越小,最優(yōu)分類面的權系數(shù)就越小,從而擴大分類面的間隔,增強支持向量機的泛化能力,但可能導致其分類準確率降低.相反,如果懲罰系數(shù)越大,兩類之間的分類面間隔就越小,從而降低了支持向量機的泛化能力,但這時的分類準確率可以得到提高.圖8為各訓練參數(shù)對分類器性能的影響,從圖中可以看出,懲罰系數(shù)C和階數(shù)ξ越大,支持向量個數(shù)越少,但分類器的檢測性能變差.
通過比較,本文的訓練參數(shù)確定為多項式階數(shù)ξ=2、懲罰系數(shù)C=100,得到的分類器中支持向量個數(shù)Ns為238,包括123個行人樣本和115個非行人樣本.用測試樣本測試該分類器,在虛警率為21.1%時,檢測率達到81.9%.
圖8 訓練參數(shù)對檢測率和支持向量個數(shù)的影響Fig.8 The influence of training parameters to the detection rate and the number of support vector
本文行人識別分類器是在離線狀態(tài)下用Matlab訓練得到的,再用VC加載分類器的支持向量、Lagrange乘子αi及分類的閾值b,進行行人的在線識別.具體過程如下:
(1)根據(jù)級聯(lián)分類器分割車輛前方可能是行人的候選區(qū)域,并將其像素尺寸縮放成64×128;
(2)提取該區(qū)域的紋理特征、對稱特征、邊界矩特征以及梯度方向特征,得到描述該候選區(qū)域的23維特征向量;
(3)利用行人識別分類函數(shù)對候選區(qū)域進行判別,如果輸出為1,則判斷該區(qū)域存在行人,否則將其剔除.
為驗證算法的有效性,本文對所研究的方法進行了試驗驗證.試驗平臺為一臺商用面包車,選用德國Basler公司生產(chǎn)的602f相機,安裝在車輛前擋風玻璃后面.CCD獲取的圖像大小為320× 240,每幅圖像處理時間為55~100 ms,處理速度為10~18幅/s,這與圖像中行人數(shù)量和背景有關.采用跟蹤算法后,算法時間還能減少.試驗采集了80幅圖像,其中有行人圖像60幅(包含單個或多個行人83個)、無行人圖像20幅(包含除行人之外的目標,如樹木、汽車等),利用本文算法從圖像中識別出89個行人,其中從有行人圖像中正確識別的行人為62個,正確檢測率約為74.7%.
在試驗中發(fā)現(xiàn)一些行人漏檢和行人誤識別的現(xiàn)象.行人漏檢主要是由于行人的重疊造成將兩個或多個行人當成一個行人目標;行人誤識別主要是由于道路兩側(cè)的復雜背景,一些類似行人目標的物體容易被誤識別成行人,尤其是道路兩側(cè)的樹木和電線桿等,其存在一定的灰度對稱性和邊緣特征等類似行人的特征.
本文提出了一種基于多特征的行人識別方法,首先利用AdaBoost訓練得到的級聯(lián)分類器按不同尺度遍歷待檢圖像,去除絕大部分的非行人目標,分割出可能是行人的候選區(qū)域,然后利用SVM訓練得到的分類器對各個候選區(qū)域進行識別確認,將不是行人的候選區(qū)域進一步排除,從而檢測出圖像中的行人目標.
本文通過試驗驗證了所提方法的有效性,同時,也發(fā)現(xiàn)了本文工作的不足,如由于行人的重疊造成的行人漏檢和由于背景復雜性造成的行人誤識別等問題,下一步工作希望提取有效表征行人的特征,研究行人跟蹤方法并結(jié)合多幅圖像檢測結(jié)果來解決行人重疊問題,結(jié)合行人的步態(tài)特征來消除非行人物體的誤判.
由于道路交通的復雜性,在行人檢測系統(tǒng)的應用方面,還有很多問題亟待解決.在性能測試方面,還沒有統(tǒng)一的測試數(shù)據(jù)和標準,需要建立一個公共的數(shù)據(jù)庫和測試方法.在傳感器方面,視覺傳感器也有其局限性,首先是受光照和天氣的影響較大,很難開發(fā)出適用于各種環(huán)境的算法;其次是視覺測距的精度很差,很難估算出行人的精確位置,這給評估行人的危險程度和開發(fā)準確的預警系統(tǒng)都帶來一定的困難.未來不但需要提高視覺識別的可靠性,還要與其他傳感信息進行信息融合,為實現(xiàn)可靠的預防碰撞行人系統(tǒng)提供準確的信息.
[1]GANDHI T,TRIVEDI M M.Pedestrian protection systems:issues,survey,and challenges[J].IEEE Transactions on Intelligent Transportation Systems,2007,8(3):413-430
[2]MEINECKE M M,OBOJSKI O M.Enhancing pedestrian safety by using the SAVE-U pre-crash system[C]//IEEE World Congress on Intelligent Transportation Systems and Services—World Congress.San Francisco:ITSWC,2005
[3]許 言,曹先彬,喬 紅.行人檢測系統(tǒng)研究新進展及關鍵技術展望[J].電子學報,2008,36(5):962-968
[4]郭 烈.基于單目視覺的車輛前方行人檢測技術研究[D].長春:吉林大學,2007
[5]HEISELE B,WHLER C.Motion-based recognition of pedestrians[C]//Proceedings of the 14th International Conference on Pattern Recognition.Washington D C:IEEE Computer Society,1998:1325-1330
[6]LOMBARDI P.A survey on pedestrian detection for autonomous driving systems[R]//Technical Report.Pavia:University of Pavia,2001
[7]LIENHART R,MAYDT J.An extended set of Haar-like features for rapid object detection[C]//Proceedings of IEEE International Conference on Image Processing.New York:IEEE,2002:900-903
[8]KRUPPA H,CASTRILLON-SANTANA M,SCHIELE B.Fast and robust face finding via local context[C]//5th IEEE International Workshop on Visual Surveillance and Performance Evaluation of Tracking and Surveillance.Piscataway:IEEE,2003:157-164
[9]HARALICK R M.Statistical and structural approaches to texture[J].Proceedings of the IEEE,
1979,67(5):786-804
[10]靳宏磊,張振華,李立源,等.基于紋理分析的表面粗糙度等級識別[J].中國圖象圖形學報,2000,5(7):612-615
[11]BROGGI A,BERTOZZI M,F(xiàn)ASCIOLI A,etal.Shape-based pedestrian detection[C]//Proceedings of the IEEE Intelligent Vehicles Symposium 2000.Piscataway:IEEE,2000:215-220
[12]李 斌.智能車輛前方車輛探測及安全車距控制方法的研究[D].長春:吉林大學,2002
[13]CANNY J.A computational approach to edge detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698
[14]CHEN Chaur-chin.Improved moment invariant for shape discrimination[J].Pattern Recognition,1993,26(5):683-686
[15]FREDRIK A.Vision-based pedestrian detection system for use in smart cars[D].Sweden:School of Mechanical Engineering,Royal Institute of Technology,2005:63-72
[16]VAPNIK V.統(tǒng)計學習理論的本質(zhì)[M].張學工,譯.北京:清華大學出版社,2000
[17]馮元戩,施鵬飛.基于支持向量機的彩色圖像人臉檢測方法[J].上海交通大學學報,2003,37(6):947-955