翟玉婷,賈世杰
(大連交通大學(xué) 電氣信息學(xué)院,遼寧 大連116028)
由于我國(guó)交通擁堵路況愈發(fā)嚴(yán)重,所以研究交通擁堵路況檢測(cè)技術(shù),實(shí)現(xiàn)交通路況優(yōu)化具有重要意義[1]。傳統(tǒng)物理檢測(cè)方法如地磁感應(yīng)[2]、微波[3]、紅外線[4]、超聲波[5]、雷達(dá)[6]等存在設(shè)備安裝復(fù)雜、對(duì)道路破壞嚴(yán)重、不易維護(hù)等弊端。由于圖像具有方便獲取、攜帶信息量大等優(yōu)勢(shì),并且支持向量機(jī)能夠有效預(yù)測(cè)分析圖像數(shù)據(jù),所以本文試圖研究基于數(shù)字圖像和支持向量的交通路況檢測(cè)方法。
已有的基于機(jī)器學(xué)習(xí)的交通路況檢測(cè)方法雖能夠減少大量的數(shù)據(jù)統(tǒng)計(jì)工作,但是這種方法需要利用物理檢測(cè)方法獲得車流量信息作為訓(xùn)練數(shù)據(jù),再與機(jī)器學(xué)習(xí)方法相結(jié)合從而達(dá)到交通路況檢測(cè)的目的,所以該方法仍然具有物理檢測(cè)方法的缺點(diǎn)。文獻(xiàn)[7]通過對(duì)交通路況圖像進(jìn)行邊緣提取、去噪、邊緣修補(bǔ)以及面積對(duì)比等操作,實(shí)現(xiàn)交通路況檢測(cè)。這種方法盡管利用了圖像方便直觀的優(yōu)勢(shì),但沒有在惡劣天氣情況下對(duì)交通擁堵路況檢測(cè)進(jìn)行測(cè)試,不夠?qū)嵱谩?/p>
因此,本文克服了普通物理檢測(cè)方法的弊端,采用了基于支持向量機(jī) (support vector machines,SVM)的方法對(duì)交通路況圖像進(jìn)行分類,力圖實(shí)現(xiàn)不同天氣條件下交通路況檢測(cè)。由于塔式邊緣方向梯度直方圖 (pyramid histogram of edge orientation gradients,PHOG)特征能根據(jù)圖像形狀對(duì)圖像進(jìn)行詳盡的表述。所以本文提取PHOG全局特征描述圖像,進(jìn)而用SVM分類器實(shí)現(xiàn)交通路況圖像的分類,圖1為分類流程圖。本文重點(diǎn)是通過改變SVM分類器中的核函數(shù)及相關(guān)參數(shù)對(duì)4類不同程度的交通路況圖像進(jìn)行分類,并討論其在各種不同天氣條件下的分類情況,經(jīng)實(shí)驗(yàn)證明能夠取得較高的分類準(zhǔn)確率。
圖1 基于SVM交通路況圖像分類流程
塔式邊緣方向梯度直方圖是在方向梯度直方圖 (histogram of edge orientations gradients,HOG)[8]基礎(chǔ)上發(fā)展起來的。主要是將圖像進(jìn)行四叉樹劃分,得到不同層級(jí)數(shù)L的圖像,把梯度方向劃分成N個(gè)區(qū)間;對(duì)每一層中所分成連接區(qū)域的HOG求和,最終形成圖像的PHOG特征向量。整個(gè)圖像PHOG向量的維數(shù)為式 (1)[9,10]。假定圖像劃分層級(jí)數(shù)L=2,這時(shí)該層可分為42個(gè)連接區(qū)域,每個(gè)區(qū)域作為一個(gè)興趣單元,將梯度方向分成N=8個(gè)區(qū)間,即在每個(gè)區(qū)域內(nèi)統(tǒng)計(jì)像素點(diǎn)歸一化梯度能得到8維的直方圖;再加上L=0,L=1這兩個(gè)層級(jí)圖像分出的40+41個(gè)區(qū)域,最終PHOG特征描述符的維數(shù)為式 (2)
PHOG特征的形成主要有以下幾個(gè)過程:
(1)提取邊緣輪廓,對(duì)邊緣圖像計(jì)算梯度模以及角度方向,并進(jìn)行鄰域標(biāo)號(hào)和角度量化;
(2)將梯度方向劃分為N個(gè)區(qū)間,并對(duì)圖像進(jìn)行金字塔L層級(jí)劃分,形成每個(gè)層級(jí)的特征向量;
(3)將低層級(jí)到高層級(jí)的特征向量結(jié)合起來,形成維數(shù)為式 (1)的向量。
圖2即為待處理原圖像以及進(jìn)行四叉樹劃分后圖像劃分層級(jí)數(shù)分別為L(zhǎng)=0,L=1以及L=2的邊緣劃分圖。圖3分別為圖2中各個(gè)劃分層級(jí)數(shù)L=0,1,2對(duì)應(yīng)的梯度方向直方圖。由兩圖可知,當(dāng)層級(jí)數(shù)L不斷增加時(shí),圖像所得到的特征向量的維數(shù)也逐漸增加,對(duì)原圖像的表述也更詳盡。
圖2 原圖像與各層級(jí)邊緣劃分
圖3 各層級(jí)梯度方向直方圖
支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法[11,12]。它由Vapnik等人提出,最初是一種二類分類模型,這種線性可分模型旨在找到一個(gè)最優(yōu)超平面能夠?qū)⒉煌悇e的實(shí)例加以完全區(qū)分,且具有最大的區(qū)分間隔。由于很多實(shí)例在線性空間不易區(qū)分,所以,可以通過空間變換,將實(shí)例變換到非線性空間,從而實(shí)現(xiàn)線性可分。此時(shí)關(guān)鍵性的問題就是核技巧,通過選擇不同的核函數(shù)來達(dá)到非線性到線性之間的轉(zhuǎn)換。
對(duì)二分類問題,如圖4所示,試用 “□”代表正實(shí)例,用 “△”代表負(fù)實(shí)例,其目的是求得能將正負(fù)實(shí)例正確分開的超平面ω·x+k=0,其中ω,k分別為超平面的法向量和截距。圖中能將正負(fù)實(shí)例正確劃分開的直線不止一條,此時(shí),利用間隔最大化求最優(yōu)劃分超平面就成為核心問題,并且解ω*·x+k*=0是唯一的。相對(duì)應(yīng)的分類決策函數(shù)即為f(x)=sign(ω*·x+k*)。
圖4 二維空間二分類問題
由于大多實(shí)例在線性空間不是線性可分的,而將它們經(jīng)映射變換到非線性空間卻能實(shí)現(xiàn)線性可分,如圖5所示,這樣就能簡(jiǎn)化在線性空間中求得最優(yōu)超曲面的計(jì)算。這時(shí)需要一個(gè)映射函數(shù)K(x,z)=Φ(x)·Φ(z)實(shí)現(xiàn)原空間到新空間的轉(zhuǎn)換,這個(gè)映射函數(shù)即為核函數(shù)。常見核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)、sigmoid核函數(shù)等[12,13]。
圖5 經(jīng)空間變換的非線性分類問題
本文試圖將PHOG特征描述符與支持向量機(jī)相結(jié)合在交通路況圖像分類上取得較高的分類準(zhǔn)確率,同時(shí)采用不同的核函數(shù)分別對(duì)理想交通路況圖像以及雨、雪、霧惡劣天氣情況下交通路況圖像進(jìn)行進(jìn)一步分類比較,提高分類準(zhǔn)確率。
實(shí)驗(yàn)在 matlab2008a環(huán)境下,主頻2.20GHz,內(nèi)存2GB,操作系統(tǒng)為windows XP的電腦上完成;所用圖像均為交通監(jiān)控圖像,分辨率為300*300,分為四類 (非常暢通、暢通、擁堵以及非常擁堵)。表1為實(shí)驗(yàn)所用交通路況示例圖像,每類圖像100幅左右。實(shí)驗(yàn)對(duì)圖像提取PHOG特征描述符,然后運(yùn)用SVM對(duì)圖像進(jìn)行分類,SVM分類器為臺(tái)灣大學(xué)林智仁所開發(fā)的libsvm3.12。實(shí)驗(yàn)每類從圖庫(kù)中隨機(jī)抽取50幅訓(xùn)練,10幅測(cè)試,分別對(duì)四組實(shí)驗(yàn) (理想訓(xùn)練理想測(cè)試、理想訓(xùn)練混合測(cè)試、混合訓(xùn)練理想測(cè)試、混合訓(xùn)練混合測(cè)試)進(jìn)行對(duì)比,同時(shí)采用交叉驗(yàn)證的方法得到平均準(zhǔn)確率。
表1 實(shí)驗(yàn)所用交通路況示例圖像
實(shí)驗(yàn)內(nèi)容包括:
(1)測(cè)試不同層級(jí)數(shù)L、不同核函數(shù)對(duì)分類性能的影響;
(2)不同核函數(shù)參數(shù)對(duì)四組實(shí)驗(yàn)準(zhǔn)確率的影響;
(3)不同程度惡劣天氣條件下本文與文獻(xiàn)[7]對(duì)比實(shí)驗(yàn)。
在改變PHOG特征層級(jí)數(shù)L實(shí)驗(yàn)中,實(shí)驗(yàn)結(jié)果如圖6、圖7所示,圖6中可以看到在L=3時(shí)采用兩種核函數(shù)得到的平均準(zhǔn)確率都達(dá)到最高,但是高斯核函數(shù)較多項(xiàng)式核準(zhǔn)確率更高;在L=3和L=4時(shí)采用高斯核函數(shù)分類平均準(zhǔn)確率均達(dá)到90%。此時(shí)對(duì)比圖7可知,L=4時(shí),分類所用的測(cè)試與訓(xùn)練時(shí)間要比其余情況長(zhǎng)很多。實(shí)驗(yàn)表明,將圖像劃分的層級(jí)數(shù)越多,獲取的特征描述符的維數(shù)越大,對(duì)圖像的表述也就越詳盡,當(dāng)然提取特征所用的時(shí)間也就越長(zhǎng)。綜合考慮上述實(shí)驗(yàn)中平均準(zhǔn)確率、分類時(shí)間以及不同核函數(shù)等方面,本文選用高斯核函數(shù),同時(shí)選取L=3作為圖像劃分層級(jí)數(shù)。
圖6 在不同層級(jí)數(shù)下分別運(yùn)用高斯核和多項(xiàng)式核得出的平均分類正確率
圖7 不同層級(jí)數(shù)下分類所用的訓(xùn)練與測(cè)試時(shí)間
在確定了圖像劃分層級(jí)數(shù)后,再對(duì)高斯核函數(shù)寬度σ加以調(diào)整,四組實(shí)驗(yàn)最終得到不同分類平均準(zhǔn)確率。為了能夠更直觀地分析高斯核函數(shù)寬度對(duì)各組實(shí)驗(yàn)的影響,將實(shí)驗(yàn)數(shù)據(jù)以折線圖形式表示,如圖8所示。在σ2=0.001時(shí),各組實(shí)驗(yàn)平均準(zhǔn)確率達(dá)到最高,均在92%以上。圖中各組實(shí)驗(yàn)平均準(zhǔn)確率均由低變高再變低,這是因?yàn)樵讦逸^小時(shí)會(huì)有更多的訓(xùn)練樣本被當(dāng)做支持向量。此時(shí)出現(xiàn)過學(xué)習(xí)現(xiàn)象,泛化能力較差。而從四組實(shí)驗(yàn)可以看出,混合訓(xùn)練理想測(cè)試一組的平均準(zhǔn)確率相對(duì)其他3組要高,原因是混合訓(xùn)練圖像中包含了理想情況下的圖像,因此用理想圖像做測(cè)試能夠取得相對(duì)較好的分類結(jié)果;然而對(duì)于理想訓(xùn)練混合測(cè)試這組實(shí)驗(yàn),由于訓(xùn)練圖像庫(kù)中不包含雨雪霧等惡劣天氣條件下的圖像,所以測(cè)試時(shí)遇到惡劣天氣的圖像容易被誤分為其他類,導(dǎo)致準(zhǔn)確率較其他3組略微偏低。
圖8 不同高斯核函數(shù)寬度在不同實(shí)驗(yàn)組中平均準(zhǔn)確率折線
在以上實(shí)驗(yàn)基礎(chǔ)上,為更好體現(xiàn)每一類圖像的分類效果,在σ2=0.001分類平均準(zhǔn)確率最高的情況下,給出四類交通路況圖像分類結(jié)果的平均混淆矩陣,如表2所示。由該混淆矩陣可知,非常暢通、暢通以及非常擁堵這3類分類效果理想;但擁堵這一類分類效果相對(duì)較差,分類結(jié)果容易與非常擁堵混淆。其原因是擁堵情況與非常擁堵情況圖像中車輛數(shù)目均較多,從而提取的特征描述符較為相近,導(dǎo)致?lián)矶屡c非常擁堵兩類混淆,這也是需要進(jìn)一步解決的問題。
表2 4類交通路況圖像分類結(jié)果的平均混淆矩陣
而對(duì)不同程度惡劣天氣情況下 (輕度惡劣、中度惡劣、重度惡劣)交通路況的檢測(cè)。分別用文獻(xiàn)[7]的方法與本文所用方法進(jìn)行對(duì)比,圖9為兩種方法平均準(zhǔn)確率柱狀圖。數(shù)據(jù)表明在重度惡劣天氣情況下本文平均準(zhǔn)確率比文獻(xiàn)的平均準(zhǔn)確率要提高5%。
圖9 本文方法與文獻(xiàn)[7]方法在不同程度惡劣天氣情況下平均準(zhǔn)確率
本文為避免傳統(tǒng)物理檢測(cè)方法在圖像獲取、設(shè)備維護(hù)、對(duì)路面造成損壞等方面的弊端,采用PHOG特征表述圖像,使用SVM對(duì)交通路況圖像進(jìn)行分類,測(cè)試了不同天氣條件下交通路況圖像的分類,提高了惡劣天氣條件下平均分類準(zhǔn)確率。當(dāng)然,仍存在一些需要解決的問題:①本文僅實(shí)現(xiàn)了4種擁堵狀態(tài)的識(shí)別,如何根據(jù)圖像內(nèi)容自動(dòng)判別更多種擁堵狀態(tài)、預(yù)測(cè)擁堵指數(shù)等都有待進(jìn)一步研究;②特征提取方面,本文選用的PHOG特征雖能對(duì)圖像進(jìn)行表述,但特征提取時(shí)間較長(zhǎng),如何減少路況檢測(cè)所用時(shí)間也是需要解決的問題之一;③分類器方面,本文采用高斯核函數(shù),屬于非線性核,較線性核復(fù)雜,如何對(duì)分類器核函數(shù)進(jìn)行改進(jìn),尋求復(fù)雜度低,分類效果顯著的核函數(shù),提高分類準(zhǔn)確率等也是需要繼續(xù)探討的問題。
[1]FAN Xiaoke.Research on the problem of urban traffic congestion[J].China Public Security (Academy Edition),2007 (1):48-51 (in Chinese).[樊曉珂.城市交通擁堵問題研究[J].中國(guó)公共安全 (學(xué)術(shù)版),2007 (1):48-51.]
[2]RONG Mei,HUANG Huixian,XU Jianmin.Vehicle detection method based on magneto resistive sensors[J].Computer and Communications ISTIC,2011,29 (3):43-46 (in Chinese).[榮梅,黃輝先,徐建閩.基于地磁傳感器的車輛檢測(cè)算法[J].交通信息與安全,2011,29 (3):43-46.]
[3]ZHANG Ning,LIN Ming.Design of microwave traffic flow detection system based on new-style signal source[J].Computer Engineering and Design,2012,33 (8):3011-3015 (in Chinese).[張寧,林明.基于新型信號(hào)源的微波車流量檢測(cè)器設(shè)計(jì)[J].計(jì)算機(jī)工程與設(shè)計(jì),2012,33 (8):3011-3015.]
[4]Iwasaki Y,Kawata S,Nakamiya T.Robust vehicle detection even in poor visibility conditions using infrared thermal images and its application to road traffic flow monitoring[J].Measurement Science and Technology,2011,22 (8):085501-085510.
[5]Yani Z,Hui G.Development of ultrasonic vehicle detection sensor[J].Computer Measurement and Control,2011,19 (10):2542-2548.
[6]Liu X,Sun Z,He H.On-road vehicle detection fusing radar and vision[C]//IEEE International Conference on Vehicular Electronics and Safety,2011:150-154.
[7]LI Jia,YAN Yusong.Design and iimplementation of dynamic image-based traffic congestion state identification system[J].Computer Engineering and Design,2011,32 (4):1366-1369(in Chinese).[李佳,嚴(yán)余松.基于圖像的交通擁堵狀態(tài)識(shí)別系統(tǒng) 的 實(shí) 現(xiàn)[J]. 計(jì) 算 機(jī) 工 程 與 設(shè) 計(jì),2011,32 (4):1366-1369.]
[8]SHU C,Ding X,F(xiàn)ang C.Histogram of the oriented gradient for face recognition[J].Tsinghua Science and Technology,2011,16 (2):216-224.
[9]YUAN Jie,WEI Baogang,WANG Lidong.An image retrieval method synthesizing PHOG shape description and wavelet pyramid energy distribution[J].Acta Electronica Sinica,2011,39(9):2114-2119 (in Chinese).[袁杰,魏寶剛,王李冬.一種綜合PHOG形狀和小波金字塔能量分布特征的圖像檢索方法[J].電子學(xué)報(bào),2011,39 (9):2114-2119.]
[10]JIA Shijie,KONG Xiangwei,F(xiàn)U Haiyan,et al.Auto classification of product images based on complementary features and class descriptor[J].Journal of Electronics and Information Technology,2010,32 (10):2294-2300 (in Chinese).[賈世杰,孔祥維,付海燕,等.基于互補(bǔ)特征和類描述的商品圖像自動(dòng) 分 類[J]. 電 子 與 信 息 學(xué) 報(bào),2010,32 (10):2294-2300.]
[11]Deng N,Tian Y,Zhang C.Support vector machines:Optimization based theory,algorithms,and extensions[M].Boca Raton,F(xiàn)L:Chapman and Hall/CRC,2012.
[12]LI Hang.Statistical learning methods[M].Beijing:Tsinghua University Press,2012 (in Chinese).[李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.]
[13]Wu X,Kumar V.The top ten algorithms in data mining[M].Boca Raton,F(xiàn)L:Chapman and Hall/CRC,2009.