李駿揚(yáng) 金立左 費(fèi)樹(shù)岷 馬軍勇
?
基于多尺度特征表示的城市道路檢測(cè)
李駿揚(yáng)①金立左*①費(fèi)樹(shù)岷①馬軍勇②
①(東南大學(xué)自動(dòng)化學(xué)院 南京 210096)②(光電控制技術(shù)重點(diǎn)實(shí)驗(yàn)室 洛陽(yáng) 471009)
基于圖像的車輛周邊場(chǎng)景分析是近來(lái)車輛主動(dòng)安全的熱門研究方向,但對(duì)于復(fù)雜路況的道路識(shí)別目前依然是一個(gè)難題。該文提出一種適用于城市復(fù)雜道路場(chǎng)景的單目視覺(jué)路面識(shí)別算法。該方法結(jié)合多尺度的稀疏編碼,在大尺度上利用道路的局部紋理信息,在較小尺度,特別是中等尺度上利用空間上下文信息,對(duì)車輛的可行駛區(qū)域進(jìn)行識(shí)別。實(shí)驗(yàn)表明,該方法提高了道路與周邊環(huán)境中相似紋理的區(qū)分能力;在鋪設(shè)良好的結(jié)構(gòu)化道路,或者車道線、路界缺失,光照復(fù)雜的道路場(chǎng)景中,該方法都取得了較好的檢測(cè)結(jié)果。
模式識(shí)別;路面識(shí)別;路面紋理;多尺度稀疏表示;K奇異值分解(K-SVD);正交匹配追蹤(OMP)
為了提高汽車駕駛的安全性,近年來(lái),研究人員對(duì)各種輔助駕駛與無(wú)人駕駛系統(tǒng)展開(kāi)了廣泛與深入的研究,車輛周邊環(huán)境的感知是該領(lǐng)域的關(guān)鍵技術(shù)難題,而基于圖像的車輛周邊環(huán)境感知,依然是目前研究的熱點(diǎn)[1]。本文基于車載單目攝像機(jī)拍攝的道路場(chǎng)景,針對(duì)城市道路的復(fù)雜環(huán)境,結(jié)合局部紋理與多尺度的特征,特別是中等尺度圖像中的上下文信息,對(duì)道路進(jìn)行識(shí)別,并在多種環(huán)境的測(cè)試中取得了較好的結(jié)果。
車輛前方的可行駛區(qū)域識(shí)別是車輛周邊環(huán)境感知的重要問(wèn)題。所謂可行駛區(qū)域,一般是指車輛周圍平坦且質(zhì)地堅(jiān)硬的區(qū)域[2]。道路可以分為結(jié)構(gòu)性道路和非結(jié)構(gòu)性道路。結(jié)構(gòu)性道路一般由車道線明顯地標(biāo)記出道路的走向,如高速公路和部分鋪設(shè)良好的城市道路。僅依靠平坦地勢(shì)或前車碾壓維持的野外道路稱為非結(jié)構(gòu)性道路[2]。而位于城市或鄉(xiāng)村的半結(jié)構(gòu)性道路則介于兩者之間,道路可能狹窄、龜裂,或崎嶇不平,鋪設(shè)材質(zhì)多樣,缺少車道線或車道線模糊不清,且路邊常有障礙物遮擋。
常用的城市場(chǎng)景中的道路識(shí)別方法包括車道線檢測(cè)、道路紋理分類和場(chǎng)景分割等。在結(jié)構(gòu)化道路場(chǎng)景中可以使用車道線的檢測(cè)來(lái)替代道路識(shí)別[3]?;谏市畔4]、紋理特征[5]、Gabor特征[6]等局部紋理信息的分類方法也經(jīng)常被使用。場(chǎng)景分割則利用像素或超像素之間的相鄰關(guān)系,將場(chǎng)景劃分為包括道路在內(nèi)的若干個(gè)區(qū)域,常用方法有分水嶺、譜聚類、條件隨機(jī)場(chǎng)、馬爾可夫隨機(jī)場(chǎng)等。另外,消失點(diǎn)[7]、地平線[4]、攝相機(jī)參數(shù)、GPS和地圖信息[8]等先驗(yàn)知識(shí)的引入也能提高道路識(shí)別的準(zhǔn)確率。
給道路場(chǎng)景識(shí)別帶來(lái)困難的一個(gè)重要因素是陽(yáng)光、陰影,以及路面水跡等帶來(lái)的劇烈亮度變化。文獻(xiàn)[9]采用光照模型來(lái)去除這種干擾,在樹(shù)蔭和潮濕路面上取得了一定的效果,但是這種方法無(wú)法克服局部曝光過(guò)度與昏暗度場(chǎng)景下噪聲的影響。文獻(xiàn)[10]采用隨機(jī)游走圖像分割在一些苛刻的環(huán)境下對(duì)道路進(jìn)行識(shí)別。文獻(xiàn)[11]將稀疏編碼和馬爾可夫隨機(jī)場(chǎng)相結(jié)合對(duì)道路進(jìn)行無(wú)監(jiān)督分割,但是該方法依然對(duì)光照敏感。道路識(shí)別的另一個(gè)困難在于路面與周邊環(huán)境可能具有相似的紋理,如建筑立面、隧道墻壁等。文獻(xiàn)[12]采用的方法注重于紋理的統(tǒng)計(jì)特征而忽略了道路的結(jié)構(gòu)信息,在城市道路的識(shí)別上效果一般。文獻(xiàn)[13]則使用了多層卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像中的超像素塊進(jìn)行分類取得了一定的效果。
單純的紋理特征容易受到周邊環(huán)境的干擾,因此圖像在空間上的上下文特征將對(duì)道路邊界的準(zhǔn)確劃分起到重要的作用。圖像的不同尺度會(huì)反映圖像的不同信息。大尺度圖像可以反映出圖像的局部紋理特征。而中等尺度的圖像在平滑了道路的細(xì)節(jié)紋理后,所展現(xiàn)出道路的上下文結(jié)構(gòu)特征,是道路劃分的重要依據(jù)。例如,當(dāng)?shù)缆泛徒ㄖ募y理相似,從圖像的中間到兩側(cè)邊緣,其場(chǎng)景的順序更有可能是道路、植被、建筑,而非道路、植被、道路。對(duì)道路局部區(qū)域稀疏表示可以反映道路的局部紋理。當(dāng)圖像尺度縮小后,對(duì)較小尺度的圖像進(jìn)行稀疏編碼則可以更好地反映道路的結(jié)構(gòu)特性,因此,本文利用稀疏編碼,從多個(gè)尺度提取圖像特征,并結(jié)合局部紋理,對(duì)場(chǎng)景中的道路進(jìn)行分割。
本文首先對(duì)圖像進(jìn)行金字塔結(jié)構(gòu)的逐層高斯濾波與亞采樣,通過(guò)多個(gè)尺度的特征識(shí)別,逐層提取道路結(jié)構(gòu)與紋理信息。在金字塔的底端,著重于路面紋理,越到金字塔的頂端,周邊信息就包含得越豐富,而在金字塔的中間層,則可以充分地利用道路的結(jié)構(gòu)信息(見(jiàn)圖1)。在每一個(gè)不同的尺度中,通過(guò)信號(hào)重建和奇異值分解(Singular Value Decomposition, SVD)提取含有路面特征信息的字典,然后使用字典對(duì)本層圖像的各個(gè)分片進(jìn)行稀疏表示,對(duì)多層特征進(jìn)行聯(lián)合。稀疏表示對(duì)于道路結(jié)構(gòu)特征的提取是有效的,但實(shí)驗(yàn)表明,在對(duì)于城市道路的局部紋理特征的提取上,稀疏表示并不一定能得到最好的效果,本文將底層局部紋理特征與多層稀疏表示相結(jié)合,通過(guò)機(jī)器學(xué)習(xí)對(duì)圖像中的分片進(jìn)行分類。最后,本文對(duì)分類結(jié)果進(jìn)行后處理以確定道路邊界的細(xì)節(jié)。
在多尺度的路面特征提取過(guò)程中,對(duì)每一個(gè)尺度的圖片進(jìn)行隨機(jī)分片,并隨機(jī)抽取其中的分片,使其均值為0,正規(guī)化后進(jìn)行K均值(K-Means)聚類,作為初始字典,然后通過(guò)K-SVD對(duì)各層字典進(jìn)行更新。
將每一個(gè)路面樣本都分解為有限個(gè)字典的線性表示,通常可以采用匹配追蹤(Matching Pursuit, MP)算法[15]和正交匹配追蹤(Orthogonal Matching Pursuit, OMP)算法[16],OMP較MP算法收斂更快。由于字典是過(guò)完備的,從數(shù)學(xué)意義上講,MP問(wèn)題實(shí)際上是一個(gè)欠定方程組求解問(wèn)題。為了滿足矩陣的0范最小(也就是矩陣盡可能地稀疏),且分解后的誤差最小,該問(wèn)題可以描述為
道路分類的整體結(jié)構(gòu)如圖1所示。
參數(shù),和是對(duì)不同空間的敏感度的調(diào)節(jié),本文實(shí)驗(yàn)中。按照雙閾值的方法,將二值化,向外擴(kuò)張2個(gè)像素,并細(xì)化,得到較為連續(xù)的邊緣響應(yīng)E,。對(duì)分類器分類的結(jié)果F()進(jìn)行高斯平滑,以模糊鋸齒狀的分類邊緣,并得到G。結(jié)合邊緣信息E對(duì)道路進(jìn)行劃分
算法實(shí)現(xiàn)步驟示于表1。
表1算法步驟
在實(shí)驗(yàn)中,本文采用了4個(gè)數(shù)據(jù)庫(kù),一個(gè)是本文作者創(chuàng)建的多場(chǎng)景道路圖像數(shù)據(jù)庫(kù)(MSRID),另外3個(gè)公開(kāi)數(shù)據(jù)庫(kù)分別是CVC[9], DIPLODOC[18]和CamVid[19]。MSRID從車載攝像機(jī)所錄制的各種場(chǎng)景的錄像中截取700張圖像,將圖片尺度縮小為480×320像素以用于道路識(shí)別,并用多邊形手動(dòng)標(biāo)記出路面和非路面區(qū)域。MSRID采集的圖片分為7個(gè)場(chǎng)景:寬幅路面、城市街巷小道、前方有車輛遮擋、日光與樹(shù)蔭、黃昏清晨低光照路面、交叉路口和城市隧道。
實(shí)驗(yàn)表明,GLCM的分類效果要好于LBP。由于LBP側(cè)重于表達(dá)紋理的變化,而城市道路往往在紋理細(xì)節(jié)上并不明顯,使得LBP得到了較多的噪聲信息,所以基于統(tǒng)計(jì)的GLCM會(huì)得到更好的效果。而在4種不同的色彩空間上,HSV色彩空間會(huì)獲得更好的效果。通過(guò)實(shí)驗(yàn),本文選擇HSV空間GLCM特征作為道路底層紋理特征。HSV色彩空間中的LBP和GLCM分類的受試者操作特征(Receiver Operating Characteristic, ROC)曲線見(jiàn)圖2(b)。ROC曲線橫軸為假陽(yáng)性率(False Positive Rate, FPR), FPR = FP/(TN + FP); ROC曲線縱軸為真陽(yáng)性率(True Positive Rate, TPR), TPR=TP/(TP +FN)。
在每個(gè)尺度,對(duì)場(chǎng)景圖片提取10萬(wàn)個(gè)隨機(jī)分片作為樣本,采用KSVD生成字典。字典僅保留灰度信息。本文采用了6個(gè)不同尺度的稀疏編碼,每個(gè)尺度都是前者的1/2,且包含150至300個(gè)原子。
圖3比較了兩個(gè)紋理相似的區(qū)域在多層稀疏編碼中的不同表現(xiàn),并體現(xiàn)出中等尺度圖像在提供上下文信息中的作用。在底層紋理中,車道線和車身編碼相似。在1/2尺度中,車身的編碼基本保持了原樣,車道線則開(kāi)始呈現(xiàn)。隨著尺度的縮小,車道線逐漸清晰,并在1/16尺度中消失,而1/16尺度的車身圖像編碼中可以看到車輛底部在地面上留下的陰影。在頂層尺度中則很難直觀地看到有用的信息。
“SSSR”表示單尺度稀疏表示(Single-Scale Sparse Representation), “MSSR”表示具有個(gè)尺度的多尺度稀疏表示(Multi-Scale Sparse Representation)。前綴“T-”表示該方法結(jié)合了局部紋理(Texture),后綴“-PP”表示后處理(Post- Processing)之后的最終結(jié)果。在不加入底層紋理時(shí),我們采用逐層遞增的方式對(duì)多層稀疏表示的分類效果進(jìn)行了10折交叉驗(yàn)證對(duì)比,圖2(a)顯示了從單層到6層稀疏表示的分類ROC曲線,表2 SSSR~ MSSR6顯示了不同層數(shù)稀疏特征的分類效果,隨著層數(shù)的增多,分類效果有明顯提升。
將HSV空間中灰度共生矩紋理特征與6層稀疏表示特征結(jié)合,并進(jìn)行10折交叉驗(yàn)證,分類效果如圖2(b)和表3的T-MSSR6。與其它文獻(xiàn)的方法相比較,SSSR在道路識(shí)別上沒(méi)有優(yōu)勢(shì),MSSR6對(duì)道路的識(shí)別率有所提升,而底層紋理的引入(T-MSSR6)明顯改善了識(shí)別率。Boosting方法具有一定的抗過(guò)擬合特性,從圖2 (d)中可以看到,隨著訓(xùn)練輪數(shù)的增加,訓(xùn)練準(zhǔn)確率接近于1,但是分類準(zhǔn)確率保持在一個(gè)穩(wěn)定值。表3中Acc高于其它指標(biāo)的原因在于圖像中擁有大量的非路面區(qū)域(TN+FP)。道路識(shí)別的命中率Rec體現(xiàn)了路面識(shí)別的完整性,而預(yù)測(cè)率Pre則體現(xiàn)對(duì)道路區(qū)域的準(zhǔn)確性,Pre越高,過(guò)檢的區(qū)域就越小。
表2 LBP與灰度共生矩在不同色彩空間的路面分類效果比較(%)
圖2 不同的路面分類器分類效果
圖3 相似區(qū)域在多層稀疏編碼中的對(duì)比(最左列圖像為原始圖像,右側(cè)6列圖像給出了不同尺度稀疏編碼中響應(yīng)最強(qiáng)烈的原子)
表3不同層數(shù)的稀疏表示分類器10折交叉驗(yàn)證(%)
方法AccFRecPre MeanStdMeanStdMeanStdMeanStd CB85.71±0.236.27±0.2457.57±1.6227.23±0.7359.18±3.6031.50±1.0065.09±1.5420.11±1.05 TB89.97±0.564.96±0.5776.90±0.6711.49±0.8879.51±2.6313.00±1.7577.35±2.2816.13±1.05 H-HBT89.62±0.844.38±0.4275.26±1.7811.70±1.6576.45±3.7212.69±1.7476.41±3.2815.05±0.80 SSSR85.13±0.145.78±0.1958.71±0.4323.08±0.9659.08±1.0128.66±0.6468.32±0.6815.77±0.30 MSSR286.09±0.114.79±0.2063.13±0.6016.54±0.7961.42±1.1322.47±0.6471.63±0.5013.61±0.62 MSSR387.70±0.183.82±0.2068.36±0.5511.92±0.6865.53±0.8516.71±0.7975.26±0.6811.79±0.73 MSSR489.61±0.192.87±0.1574.30±0.548.39±0.6072.54±0.7512.20±0.9378.31±0.7510.61±0.65 MSSR591.77±0.102.16±0.1280.09±0.326.52±0.4579.82±0.769.74±0.9681.70±0.648.84±0.77 MSSR693.50±0.071.56±0.1184.52±0.244.90±0.3985.36±0.546.77±0.7984.38±0.527.42±0.56 T-MSSR695.26±0.251.81±0.1388.58±0.585.13±0.3389.15±0.426.37±0.4088.48±1.006.78±0.74 T-MSSR6-PP97.03±0.072.18±0.2192.79±0.195.89±0.6590.80±0.388.64±0.8195.55±0.334.94±0.79
圖像的后處理過(guò)程(T-MSSR6-PP)可以對(duì)道路分割效果進(jìn)行進(jìn)一步的提升(詳見(jiàn)表3中的數(shù)據(jù))。后處理是在HSV空間下完成的,實(shí)驗(yàn)表明,周邊被植被覆蓋的道路,或空間可能提供較清晰的路界;而對(duì)于色彩差異不明顯的路邊界,空間能提供更好的劃界依據(jù)。T-MSSR6-PP較T-MSSR6和MSSR6,在其它指標(biāo)有所提高的同時(shí),Pre有明顯的提高,這說(shuō)明后處理可以有效地去除路面的過(guò)檢區(qū)域。圖2(c)比較了5種不同路面識(shí)別方法的ROC曲線,分別為MSSR6, T-MSSR6,以及CB[4], TB[5]和H-HBT[13]方法,通過(guò)在MSRID上的對(duì)比實(shí)驗(yàn),本文的方法要優(yōu)于文獻(xiàn)[4,5,13]提出的方法。
本文在MSRID的7個(gè)不同的場(chǎng)景下進(jìn)行了10折交叉驗(yàn)證,分類器是在所有場(chǎng)景下統(tǒng)一訓(xùn)練得到的,驗(yàn)證結(jié)果如圖4和表4所示。圖4第1行為陽(yáng)光下的寬幅路面,由于路面色彩偏黃色,所以單純基于色彩的方法無(wú)法準(zhǔn)確地識(shí)別路面;第2行是城市街巷,并結(jié)合了彎道;第3行圖片中有大面積的白色車身,在背光的情況下其局部特征與路面接近;在第4和第5行,樹(shù)蔭與清晨的濕滑路面造成了路面較大的亮度變化;第6行圖像中的路口左側(cè)有寬廣的路面區(qū)域,且有車輛遮擋;最后一行是在城市隧道中,隧道墻壁與頂面材質(zhì)對(duì)路面識(shí)別有較強(qiáng)的干擾。從圖4的不同的場(chǎng)景中可以看到,本文方法T-MSSR6總體上比其他方法具有更好的識(shí)別效果。
表4的數(shù)據(jù)說(shuō)明本文的方法適用于多種場(chǎng)景,并分別在這些場(chǎng)景上優(yōu)于其它文獻(xiàn)提出的方法。本文的方法在寬幅路面、車輛遮擋和交叉路口獲得了最好的識(shí)別效果,隧道場(chǎng)景的識(shí)別效果次之,而在街巷小道、陽(yáng)光樹(shù)蔭,以及昏暗環(huán)境的情況下,識(shí)別率略低。在狹窄的街巷,T-MSSR6-PP在Acc指標(biāo)上與其它場(chǎng)景的平均值相當(dāng),但是指標(biāo)F, Rec和Pre低于其它場(chǎng)景,主要原因是較小的路面面積導(dǎo)致FP和FN給這3個(gè)指標(biāo)帶來(lái)更大的影響,而該場(chǎng)景FN+FP的平均值比其它場(chǎng)景平均值低2.5%。樹(shù)蔭場(chǎng)景和昏暗場(chǎng)景中路面的亮度變化,以及隧道場(chǎng)景中的隧道壁與路面紋理的相似性,對(duì)分類效果略有影響。盡管在不同的場(chǎng)景下有所差異,本文方法在不同場(chǎng)景下各項(xiàng)指標(biāo)的標(biāo)準(zhǔn)差優(yōu)于其它文獻(xiàn)提出的方法。
表4 本文方法與其它方法在不同場(chǎng)景下的平均道路分類效果比較(%)
圖4 MSRID數(shù)據(jù)庫(kù)中7類不同場(chǎng)景下,不同路面分類器的分類效果比較(白色區(qū)域表示分類器正確的路面分類(TP),黑色區(qū)域表示分類器正確的非路面分類(TN),紅色區(qū)域?yàn)榉诸惼鬟^(guò)檢測(cè)的區(qū)域(FP),綠色為分類器的漏檢區(qū)域(FN))
在其它公開(kāi)的數(shù)據(jù)庫(kù)上,本文方法的實(shí)現(xiàn)結(jié)果與文獻(xiàn)中其它方法的實(shí)驗(yàn)結(jié)果進(jìn)行了對(duì)比。圖5為T-MSSR6-PP在不同數(shù)據(jù)庫(kù),不同場(chǎng)景中的路面識(shí)別效果。對(duì)于這些復(fù)雜道路狀況,本文提出的方法,均能得到較好的識(shí)別效果,并好于文獻(xiàn)中提出的方法(見(jiàn)表5)。
本文通過(guò)路面樣本多尺度線性稀疏表示,結(jié)合路面底層紋理的識(shí)別方法,對(duì)路面進(jìn)行識(shí)別,并對(duì)路界進(jìn)行了劃分,該方法既適用于平行的結(jié)構(gòu)化路面,也適用于路況復(fù)雜的城市道路。實(shí)驗(yàn)表明,該方法能夠克服光照、陰影、樹(shù)蔭、水跡帶來(lái)的路面紋理變化,能夠在紋理相似的情況下通過(guò)中等尺度圖像中上下文特征對(duì)道路進(jìn)行較為準(zhǔn)確的識(shí)別。
圖5 本文方法在不同數(shù)據(jù)庫(kù)中的道路檢測(cè)效果(第1行為路面原始圖像,第2行為后處理后的最終效果。白色為正確檢測(cè)的路面區(qū)域(TP),黑色為正確檢測(cè)的非路面區(qū)域(TN),紅色區(qū)域?yàn)檫^(guò)檢測(cè)的區(qū)域(FP),綠色為漏檢區(qū)域(FN))
表5本文方法與其它方法在不同數(shù)據(jù)庫(kù)中的識(shí)別效果比較(%)
數(shù)據(jù)集方法AccFQRecPre MeanStdMeanStdMeanStdMeanStdMeanStd CVC[9]I-I Based[9]N/AN/A89.510.0N/AN/AN/AN/AN/AN/A T-MSSR6-PP97.71.896.92.394.04.196.03.497.93.0 DIPLODOC[18]RWA[10]N/AN/AN/AN/A92.83.695.73.596.92.7 T-MSSR6-PP98.10.996.91.694.02.895.62.798.21.6 CamVid[19]App-SFM[20]95.3N/AN/AN/AN/AN/AN/AN/AN/AN/A CPF-CNN7[13]95.5N/AN/AN/AN/AN/AN/AN/AN/AN/A T-MSSR6-PP96.21.093.51.687.82.893.52.893.52.7
注:N/A表示文獻(xiàn)中該數(shù)據(jù)未提供
[1] Hillel A B, Lerner R, Levi D,.. Recent progress in road and lane detection: a survey[J]., 2012, DOI: 10.1007/S00138-011-0404-2.
[2] Guo C Z, Mita S, and McAllester D. Robust road detection and tracking in challenging scenarios based on Markov random fields with unsupervised learning[J]., 2012, 13(3): 1338-1354.
[3] Yenikaya S, Yenikaya G, and Duven E. Keeping the vehicle on the road - a survey on on-road lane detection systems[J]., 2013, 46(2): 1-43.
[4] Shinzato P Y, Grassi V, Osorio F S,.. Wolf. Fast visual road recognition and horizon detection using multiple artificial neural networks[C]. Proceedings of the Intelligent Vehicles Symposium, Alcalá de Henares, Spain, 2012: 1090-1095.
[5] Graovac S and Goma A. Detection of road image borders based on texture classification[J]., 2012, 9(242): 1-12.
[6] Espinoza R T and Torriti M T. Robust lane sensing and departure warning under shadows and occlusions [J]., 2013, 13(3): 3270-3298.
[7] Kong H, Sarma S E, and Tang F. Generalizing Laplacian of Gaussian filters for vanishing-point detection[J]., 2013, 14(1): 408-418.
[8] Shang E, An X J, Li J,.. Robust unstructured road detection: the importance of contextual information[J]., 2013, 10(179): 1-8.
[9] Alvarez J M and Lopez A M. Road detection based on illuminant invariance[J], 2011, 12(1): 184-193.
[10] Siogkas G K and Dermatas E S. Random-walker monocular road detection in adverse conditions using automated spatiotemporal seed selection[J]., 2013, 14(2): 527-538.
[11] Liu Y C and Chen H T. Unsupervised scene segmentation using sparse coding context[J]., 2011, DOI: 10.1007/S00138-011-0401-5.
[12] Kang Y, Yamaguchi K, Naito T,.. Road image segmentation and recognition using hierarchical bag-of- textons method[C]. Proceeding of the 5th Pacific Rim Symposium on Image and Video Technology, Gwangju, South Korea, 2011, 7087: 248-256.
[13] Alvarez J M, Gevers T, LeCun Y,.. Road scene segmentation from a single image[C].Proceeding of the 12th European Conference on Computer Vision, Florence, Italy, 2012: 376-389.
[14] Aharon M, Elad M, and Bruckstein A. The K-SVD: an algorithm for designing of overcomplete dictionaries for sparse representation[J]., 2006, 54(11): 4311-4322.
[15] Mallat S G and Zhang Z. Matching pursuits with time- frequency dictionaries[J]., 1993, 41(12): 3397-3415.
[16] Tropp J A and Gilbert A C. Signal recovery from random measurements via orthogonal matching pursuit[J]., 2007, 53(12): 4655-4666.
[17] Friedman J, Hastie T, and Tibshirani R. Additive logistic regression: a statistical view of boosting[J]., 2000, 38(2): 337-374.
[18] Zanin M, Messelodi S, and Modena C M. DIPLODOC road stereo sequence - FBK technical report Nr 164010[R]. Trento, Italy: Fondazione Bruno Kessler, 2013.
[19] Brostow G, Fauqueur J, and Cipolla R. Semantic object classes in video: a high-definition ground truth database[J]., 2009, 30(2):88-97.
[20] Sturgess P, Alahari K, Ladicky L,.. Combining appearance and structure from motion features for road scene understanding[C]. British Machine Vision Conference, London, UK, 2009.
李駿揚(yáng): 男,1980年生,講師,研究方向?yàn)槟J阶R(shí)別與智能系統(tǒng).
金立左: 男,1972年生,副教授,研究方向?yàn)槟J阶R(shí)別與智能系統(tǒng).
費(fèi)樹(shù)岷: 男,1961年生,教授,博士生導(dǎo)師,研究方向?yàn)榭刂评碚撆c控制工程.
Urban Road Detection Based on Multi-scale Feature Representation
Li Jun-yang①Jin Li-zuo①Fei Shu-min①M(fèi)a Jun-yong②
①(,,210096,)②(-,471009,)
Vision-based road detection is a popular area in research of driving security, however, detecting in complex road scenery is still a challenging topic. An approach is proposed to detect drivable road region from monocular images in urban environments. The algorithm is based on multi-scale sparse representation, with local texture in large scale, and context in medium scale. Experiments show that, distinguishing the similar texture of pavements from that of surrounding buildings and obstacles brings a well-performance in structured roads as well as the diverse road environments such as lack of lanes or clear boundaries but full of complex illuminations.
Pattern recognition; Road detection; Road texture; Multi-scale sparse representation; K-Singular Value Decomposition (K-SVD); Orthogonal Matching Pursuit (OMP)
TP391.41
A
1009-5896(2014)11-2578-08
10.3724/SP.J.1146.2014.00271
金立左 jinlizuo@gmail.com
2013-03-04收到,2014-06-13改回
航空科學(xué)基金(20115169016),國(guó)家省部級(jí)基金和江蘇省自然科學(xué)基金(BK20131296)資助課題