,*,
(1.桂林電子科技大學(xué)電子工程與自動(dòng)化學(xué)院,廣西桂林541004;2.廣西高校非線性電路與光通信重點(diǎn)實(shí)驗(yàn)室(廣西師范大學(xué)),廣西桂林541004)
交通標(biāo)志檢測(cè)是智能交通系統(tǒng)的重要組成部分之一,在減少安全事故、輔助駕駛員駕駛中有著重要的作用[1-4]。由于汽車行駛過程中對(duì)交通標(biāo)志檢測(cè)的實(shí)時(shí)性要求較高,加上光照、天氣、拍攝角度的影響,使得交通標(biāo)志的實(shí)時(shí)檢測(cè)難度較大。此外,由于圖像中交通標(biāo)志的數(shù)目較多,且目標(biāo)較小,其像素值中包含的特征很少,加大了交通標(biāo)志檢測(cè)的難度。
在現(xiàn)實(shí)環(huán)境中,交通標(biāo)志通常有著特定的顏色和形狀,現(xiàn)有的交通標(biāo)志檢測(cè)方法多基于其顏色特征[5-6]和形狀特征[7-8],或是兩種特征的結(jié)合[9-10]?;陬伾臋z測(cè)方法易受光照等因素的影響,在復(fù)雜的光照條件下魯棒性較差,色差及背景復(fù)雜等因素也會(huì)造成有效信息的丟失;基于形狀的檢測(cè)方法魯棒性較好,具有較強(qiáng)的抗噪能力,但由于計(jì)算量大,對(duì)硬件要求較高,無(wú)法滿足實(shí)時(shí)性的要求。因此,研究一種復(fù)雜環(huán)境下交通標(biāo)志多目標(biāo)實(shí)時(shí)監(jiān)測(cè)方法具有重要的理論價(jià)值和現(xiàn)實(shí)意義。
近年來(lái),深度學(xué)習(xí)[11]在圖像領(lǐng)域表現(xiàn)出巨大的優(yōu)勢(shì),文獻(xiàn)[12]利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)人臉進(jìn)行識(shí)別,取得了較好的識(shí)別效果;文獻(xiàn)[13]利用殘差網(wǎng)絡(luò)實(shí)現(xiàn)了對(duì)道路行人的檢測(cè);文獻(xiàn)[14]通過深度學(xué)習(xí)方法,實(shí)現(xiàn)了對(duì)人體行為的識(shí)別;Faster-RCNN[15]是繼R-CNN[16]和Fast-RCNN[17]后,Ren等提出的最新目標(biāo)檢測(cè)方法,其具有檢測(cè)速度快、識(shí)別率高以及泛化能力強(qiáng)的特點(diǎn);桑軍等[18]將Faster-RCNN用于車型識(shí)別,取得了較高識(shí)別率;Olmos等[19]使用Faster-RCNN對(duì)視頻中槍支進(jìn)行檢測(cè),也實(shí)現(xiàn)了較好的檢測(cè)效果。
鑒于以上研究,本文以Faster-RCNN為基礎(chǔ),提出一種復(fù)雜道路環(huán)境下交通標(biāo)志多目標(biāo)實(shí)時(shí)監(jiān)測(cè)方法,通過多組對(duì)比實(shí)驗(yàn),證明所提方法的有效性,研究解決現(xiàn)有道路交通標(biāo)志檢測(cè)所存在的問題,實(shí)現(xiàn)復(fù)雜環(huán)境下道路交通標(biāo)志的多目標(biāo)檢測(cè),為智能汽車駕駛提供理論依據(jù)和技術(shù)支持。
為了實(shí)現(xiàn)復(fù)雜環(huán)境下交通標(biāo)志多目標(biāo)的實(shí)時(shí)檢測(cè),本文采用Faster-RCNN作為目標(biāo)檢測(cè)框架,基本結(jié)構(gòu)如圖1所示。獲取圖像后,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN) 通過卷積和池化操作對(duì)圖像進(jìn)行特征提取,得到高維特征,這些特征被共享用于區(qū)域建議網(wǎng)絡(luò)(region proposal network, RPN)和檢測(cè)網(wǎng)絡(luò);RPN網(wǎng)絡(luò)利用錨點(diǎn)和共享特征,獲取圖像中交通標(biāo)志準(zhǔn)確的位置信息;檢測(cè)網(wǎng)絡(luò)對(duì)目標(biāo)位置信息進(jìn)行微調(diào),獲取交通標(biāo)志更加精確的位置信息,并輸出最終的分類和檢測(cè)結(jié)果。
圖1 Faster-RCNN結(jié)構(gòu)Fig.1 Structure of Faster-RCNN
圖像特征的提取對(duì)于后續(xù)的分類和檢測(cè)有著重要影響,傳統(tǒng)的特征提取方法多為人工設(shè)計(jì),如加速魯棒特征、尺度不變特征變換、方向梯度直方圖等,而設(shè)計(jì)一個(gè)好的特征提取方法往往需要很長(zhǎng)時(shí)間,實(shí)際效果也會(huì)因所設(shè)計(jì)特征的好壞有較大起伏。
相比于傳統(tǒng)的特征描述方法,CNN有著獨(dú)特的優(yōu)勢(shì)。交通標(biāo)志圖像輸入到CNN中后,通過卷積和池化等操作自動(dòng)提取圖像特征,加上局部感知和權(quán)值共享有效降低了訓(xùn)練參數(shù),避免了傳統(tǒng)方法中復(fù)雜的特征提取和數(shù)據(jù)重建過程,經(jīng)過多次迭代,自動(dòng)獲得圖像高層特征,取得較好的特征提取效果。
考慮到交通標(biāo)志目標(biāo)較小,在Faster-RCNN的基本結(jié)構(gòu)下,本文采用ZF[20]網(wǎng)絡(luò)進(jìn)行特征提取,其特點(diǎn)是網(wǎng)絡(luò)深度較淺,在有效提取圖像特征的同時(shí)不會(huì)破壞原圖中交通標(biāo)志的位置信息,有利于取得更好的檢測(cè)效果。
傳統(tǒng)的目標(biāo)檢測(cè)方法,一般利用滑動(dòng)窗口對(duì)圖像進(jìn)行遍歷,產(chǎn)生檢測(cè)區(qū)域,之后使用淺層分類器完成分類,得到所有可能的目標(biāo)。該方法實(shí)時(shí)性差,且因使用淺層分類器,效果不佳。
RPN是Faster-RCNN中的一個(gè)重要部分,它是一個(gè)全連接網(wǎng)絡(luò)(如圖2所示),用于生成候選區(qū)域。以ZF為例,它利用一個(gè)3×3大小的卷積核在卷積特征圖上進(jìn)行特征提取,將提取的特征映射到一個(gè)256維的區(qū)域中,再送入到兩個(gè)全連接層中,進(jìn)而得到目標(biāo)的分類信息和位置信息。
每個(gè)卷積核的中心,都對(duì)應(yīng)著9個(gè)錨點(diǎn),用于預(yù)測(cè)9個(gè)候選區(qū)域,每個(gè)候選區(qū)域的位置由4個(gè)坐標(biāo)決定,位置回歸層有4×9個(gè)輸出,分類層有2×9個(gè)輸出,用來(lái)判斷候選區(qū)域是目標(biāo)區(qū)域或者非目標(biāo)區(qū)域。
圖2 區(qū)域建議網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.2 Structural of region proposal network
對(duì)于單個(gè)圖像的損失函數(shù)定義為:
(1)
其中分類損失函數(shù)為:
(2)
回歸損失函數(shù)為:
(3)
其中R為魯棒性損失函數(shù):
(4)
ti={tx,ty,tw,th}。
(5)
在邊框回歸計(jì)算中,采用如下4個(gè)坐標(biāo):
(6)
其中:x、y為候選框的中心坐標(biāo);w、h為候選框的高度和寬度。x、xa、x*為預(yù)測(cè)候選框、錨點(diǎn)邊界框以及真實(shí)標(biāo)注框的x坐標(biāo)。同理,y、w、h也有對(duì)應(yīng)的3個(gè)框值。利用這3組數(shù)據(jù),完成對(duì)邊框回歸損失的計(jì)算。
RPN和檢測(cè)網(wǎng)絡(luò)共享CNN提取的特征圖,從而極大地提高了檢測(cè)速度。
本文使用Faster-RCNN作為檢測(cè)網(wǎng)絡(luò),它很好地解決了RCNN檢測(cè)速度慢、訓(xùn)練時(shí)間長(zhǎng)以及訓(xùn)練占用空間大的問題。
感興趣區(qū)域(region of interesting,ROI) Pooling從RPN網(wǎng)絡(luò)得到候選的ROI列表,通過卷積獲得目標(biāo)的所有特征,進(jìn)行分類和回歸,檢測(cè)網(wǎng)絡(luò)共享特征圖,通過全連接層與Softmax函數(shù)計(jì)算出每個(gè)候選區(qū)域具體屬于哪個(gè)類別;同時(shí)利用邊框回歸,獲得更加準(zhǔn)確的目標(biāo)檢測(cè)框,完成對(duì)目標(biāo)的檢測(cè)和分類。
Faster-RCNN算法的具體實(shí)現(xiàn)步驟如下:
步驟 1:輸入任意大小的圖片數(shù)據(jù);
步驟 2:利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)樣本圖像特征進(jìn)行提??;
步驟 3:RPN網(wǎng)絡(luò)共享卷積特征,生成建議區(qū)域,通過Softmax函數(shù)判斷錨點(diǎn)屬于待檢測(cè)目標(biāo)或者背景;
步驟 4:利用邊框回歸修正錨點(diǎn),并獲得準(zhǔn)確的目標(biāo)區(qū)域;
步驟 5:ROI Pooling整合輸入的卷積特征和目標(biāo)區(qū)域,獲得目標(biāo)區(qū)域的特征圖;
步驟 6:檢測(cè)網(wǎng)絡(luò)全連接層利用目標(biāo)區(qū)域的特征對(duì)目標(biāo)類別進(jìn)行判定;
步驟 7:再次使用邊框回歸獲取目標(biāo)更加精確的位置;
步驟 8:輸出檢測(cè)和分類結(jié)果。
本文以Faster-RCNN作為基本檢測(cè)模型,算法實(shí)現(xiàn)過程如圖3所示,主要分為離線訓(xùn)練和在線識(shí)別兩部分。獲取待檢測(cè)交通標(biāo)志的訓(xùn)練數(shù)據(jù)后,首先選取合適的預(yù)訓(xùn)練模型,然后優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)使其適應(yīng)小目標(biāo)檢測(cè),最后通過離線訓(xùn)練得到檢測(cè)模型。將待檢測(cè)交通標(biāo)志樣本圖片輸入到檢測(cè)模型中,可自動(dòng)得到最終的檢測(cè)結(jié)果。
圖3 基于Faster-RCNN的交通標(biāo)志檢測(cè)算法流程Fig.3 Trafficsign detection algorithmic flow based on Faster-RCNN
本文以德國(guó)交通標(biāo)志檢測(cè)數(shù)據(jù)集(German traffic sign detection dataset, GTSD)作為原始訓(xùn)練樣本數(shù)據(jù)。GTSD中共有900張PPM格式圖片,包含43類不同的交通標(biāo)志,圖片大小為1 360×800,每個(gè)圖片中包含一個(gè)或多個(gè)不同大小和形狀的交通標(biāo)志,像素大小為16×16到128×128。
為保證訓(xùn)練效果,首先將圖片轉(zhuǎn)換為JPG格式,然后對(duì)原始數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)增,通過調(diào)整圖像對(duì)比度、亮度、色調(diào)等,將數(shù)據(jù)擴(kuò)增至1 800個(gè),預(yù)留出100張圖片作測(cè)試集,剩余數(shù)據(jù)按Pascal VOC2007格式制作 (如表1所示),其中1 300張用做訓(xùn)練集,400張用作驗(yàn)證集。
表1 VOC2007數(shù)據(jù)格式
深度學(xué)習(xí)訓(xùn)練的目標(biāo)是經(jīng)過多次迭代,找到合適的權(quán)值。使用之前在大數(shù)據(jù)集上訓(xùn)練得到的模型,可以直接使用相應(yīng)的結(jié)構(gòu)和權(quán)值,可以做到對(duì)小數(shù)據(jù)訓(xùn)練樣本的充分利用以提高訓(xùn)練效果。Faster-RCNN提供了3種訓(xùn)練好的通用模型,分別是小型網(wǎng)絡(luò)ZF,中型網(wǎng)絡(luò)VGG_CNN_M_1024[21]以及大型網(wǎng)絡(luò)VGG16[22]。
由于圖像中的交通標(biāo)志目標(biāo)較小,網(wǎng)絡(luò)層數(shù)越深,最后一層卷積特征圖上的特征點(diǎn)對(duì)應(yīng)原圖的感受野就越大,會(huì)破壞小物體在特征圖上的位置信息。此外,由于VGG_CNN_M_1024和VGG16等大中型網(wǎng)絡(luò)在訓(xùn)練以及實(shí)際應(yīng)用中對(duì)硬件的要求較高,訓(xùn)練比較耗時(shí),綜合考慮檢測(cè)效果、硬件要求以及訓(xùn)練時(shí)間等因素,本文選用小型網(wǎng)絡(luò)ZF作為預(yù)訓(xùn)練模型,在有效提取和充分利用圖像特征的同時(shí),可以大量節(jié)省訓(xùn)練時(shí)間和計(jì)算資源,取得較好的訓(xùn)練效果。
在實(shí)際駕駛過程中,道路交通標(biāo)志種類眾多,環(huán)境以及拍攝角度的不同,圖片中的交通標(biāo)志數(shù)目較多,且目標(biāo)很小,使得交通標(biāo)志檢測(cè)變得非常困難。為了提高檢測(cè)效果,文本對(duì)Faster-RCNN網(wǎng)絡(luò)模型進(jìn)行了優(yōu)化。在Faster-RCNN中,原始數(shù)據(jù)集格式為VOC格式,圖片大小集中在500×375左右,而錨點(diǎn)尺度為1282、2562、5122,錨點(diǎn)寬高比例為1∶2、1∶1、2∶1,對(duì)于一般大小的目標(biāo),這樣的設(shè)計(jì)比較合適。由于交通標(biāo)志檢測(cè)中,獲取的圖像比較大,但要檢測(cè)的交通標(biāo)志目標(biāo)很小,像素值中包含的特征很少,因此需要調(diào)整錨點(diǎn)寬高比例。本文選用3種不同尺度的錨點(diǎn)比例以適應(yīng)交通標(biāo)志的多目標(biāo)檢測(cè),分別為3∶10、3∶4、1∶1。在Faster-RCNN中,對(duì)像素低于16×16的目標(biāo)不進(jìn)行檢測(cè),本文為了提高對(duì)小目標(biāo)的檢測(cè)效果,將該閾值調(diào)整為10×10。
本文采用隨機(jī)梯度下降算法(stochastic gradient descent, SGD)來(lái)更新權(quán)值和偏置。批大小是其中的一個(gè)重要參數(shù),批大小過大會(huì)使顯存溢出,造成訓(xùn)練失??;過小會(huì)使訓(xùn)練時(shí)間增長(zhǎng),不易收斂。在合理范圍內(nèi),選擇合適的批大小可以提高顯存利用率,減少訓(xùn)練時(shí)間,加快模型的收斂??紤]到顯存大小,以及最終的訓(xùn)練效果,本文將批大小設(shè)為64,基于SGD的參數(shù)更新過程如算法1所示。
算法1 基于SGD的第n個(gè)訓(xùn)練迭代參數(shù)更新過程。
輸入:n個(gè)訓(xùn)練樣本。
輸出:更新后的參數(shù)θ。
設(shè)定:學(xué)習(xí)速率α,初始化參數(shù)θ
while沒有收斂或達(dá)到訓(xùn)練次數(shù)do
從訓(xùn)練數(shù)據(jù)中隨機(jī)選取n個(gè)樣本{x(1),x(2),…,x(n)}的批大小,對(duì)應(yīng)的目標(biāo)值為y(i);
參數(shù)更新:θ←θ-αδ;
end while。
Faster-RCNN中有交替優(yōu)化與近似聯(lián)合兩種訓(xùn)練方式,訓(xùn)練效果相同。近似聯(lián)合的訓(xùn)練方式是一種端到端訓(xùn)練方式,訓(xùn)練效率更高,可以有效節(jié)省訓(xùn)練時(shí)間。因此,為了節(jié)省訓(xùn)練時(shí)間,降低硬件要求,本文采用近似聯(lián)合的訓(xùn)練方式。學(xué)習(xí)速率和動(dòng)量是影響模型好壞的關(guān)鍵因素,本文將學(xué)習(xí)速率初始化為0.01,動(dòng)量設(shè)置為0.9,每3 000次迭代改變一次學(xué)習(xí)速率,使學(xué)習(xí)過程更為平穩(wěn)快速。
本實(shí)驗(yàn)在Linux系統(tǒng)下搭建的Caffe平臺(tái)上進(jìn)行,使用ZF網(wǎng)絡(luò)作為預(yù)訓(xùn)練模型,并在此基礎(chǔ)上進(jìn)行微調(diào),采用近似聯(lián)合訓(xùn)練方式,每3 000次迭代保存一個(gè)模型,經(jīng)過9 000次迭代,得到最終的訓(xùn)練模型。
訓(xùn)練過程中的損失函數(shù)如圖4所示。在4個(gè)損失函數(shù)中,均有不同程度的震蕩,可能原因?yàn)槟承┙煌?biāo)志特征不夠明顯,且部分交通標(biāo)志目標(biāo)過小,受天氣、光照、拍攝角度等因素影響較大,使得少量數(shù)據(jù)的學(xué)習(xí)變得困難。經(jīng)過多次迭代,網(wǎng)絡(luò)的整體損失可以迅速下降并穩(wěn)定在到0.1到0.2之間,整體分類損失下降到0到0.1之間,說明訓(xùn)練模型可以在短時(shí)間內(nèi)有效收斂,并實(shí)現(xiàn)對(duì)目標(biāo)的準(zhǔn)確分類。RPN網(wǎng)絡(luò)中分類損失和邊框回歸損失下降到0.1以下,表明在RPN網(wǎng)絡(luò)的訓(xùn)練過程中,網(wǎng)絡(luò)進(jìn)行了充分學(xué)習(xí),可以有效對(duì)目標(biāo)和背景進(jìn)行區(qū)分,并通過邊框修正完成對(duì)目標(biāo)的檢測(cè)。訓(xùn)練模型在驗(yàn)證集上獲得的均值平均精度(mean average precision, MAP)達(dá)到71.27%,對(duì)單張圖片300個(gè)區(qū)域建議目標(biāo)的檢測(cè)平均時(shí)間為0.4 s左右,滿足實(shí)時(shí)檢測(cè)要求。
在交通標(biāo)志的檢測(cè)與識(shí)別中,道路情況復(fù)雜,識(shí)別場(chǎng)景眾多,會(huì)加大交通標(biāo)志檢測(cè)的難度。同時(shí),由于背景中存在較多的干擾信息,增加了交通標(biāo)志檢測(cè)的難度,對(duì)檢測(cè)結(jié)果造成較大的影響。為此,得到訓(xùn)練模型后,在測(cè)試集中隨機(jī)選取了40張圖片,測(cè)試了不同道路場(chǎng)景下,模型對(duì)交通標(biāo)志目標(biāo)的檢測(cè)效果,部分測(cè)試結(jié)果如圖5所示。
從圖5中可以看出,在不同場(chǎng)景下,本文方法可以有效地對(duì)單個(gè)交通標(biāo)志目標(biāo)或多個(gè)交通標(biāo)志目標(biāo)進(jìn)行檢測(cè),在檢測(cè)目標(biāo)很小的情況下,針對(duì)不同類型交通標(biāo)志,依然可以實(shí)現(xiàn)較好的檢測(cè)效果,說明通過近似聯(lián)合的網(wǎng)絡(luò)訓(xùn)練方式,訓(xùn)練模型有效地學(xué)習(xí)了數(shù)據(jù)集的高層特征,證明復(fù)雜場(chǎng)景下,基于Faster-RCNN的交通標(biāo)志多目標(biāo)檢測(cè)方法是有效的。
圖5 不同場(chǎng)景下檢測(cè)結(jié)果Fig.5 Detection results in different scenarios
自然環(huán)境下,光照、拍攝角度、障礙物遮擋以及汽車運(yùn)動(dòng)過程中造成的運(yùn)動(dòng)模糊等因素會(huì)對(duì)交通標(biāo)志的檢測(cè)造成較大影響,為了進(jìn)一步測(cè)試模型在不同環(huán)境下的檢測(cè)效果,在測(cè)試集中選擇4組不同自然環(huán)境下的真實(shí)圖片進(jìn)行測(cè)試,測(cè)試結(jié)果如圖6所示。
從圖6可以看出,在不同的環(huán)境影響下,圖片中交通標(biāo)志的差異性變化很大,其顏色和紋理信息變得不明顯,造成檢測(cè)困難。在目標(biāo)檢測(cè)中,通常使MAP來(lái)衡量模型的好壞,在4種不同的環(huán)境影響條件下,選用相同數(shù)量的測(cè)試數(shù)據(jù),進(jìn)行了多組測(cè)試實(shí)驗(yàn),統(tǒng)計(jì)結(jié)果如表2所示。結(jié)果表明,通過優(yōu)化Faster-RCNN網(wǎng)絡(luò)結(jié)構(gòu),調(diào)整RPN錨點(diǎn)比例,選擇合適的網(wǎng)絡(luò)超參數(shù),在光照影響、環(huán)境陰影、障礙物遮擋以及車輛高速運(yùn)動(dòng)等復(fù)雜環(huán)境條件下,本文算法依然可以實(shí)現(xiàn)對(duì)不同交通標(biāo)志多目標(biāo)的檢測(cè)與識(shí)別,表明本文所提出的基于Faster-RCNN的復(fù)雜環(huán)境下交通標(biāo)志多目標(biāo)檢測(cè)方法具有很好的魯棒性,可以實(shí)現(xiàn)不同場(chǎng)景下多目標(biāo)交通標(biāo)志的檢測(cè)與識(shí)別。
圖6 不同環(huán)境下檢測(cè)結(jié)果Fig.6 Test results in different environment
為了進(jìn)一步測(cè)試算法的有效性,在遷移數(shù)據(jù)集瑞典交通標(biāo)志檢測(cè)數(shù)據(jù)集(Sweden traffic sign detection dataset, STSD)內(nèi),隨機(jī)選取了300張不同場(chǎng)景和不同環(huán)境下的圖片進(jìn)行遷移測(cè)試,該數(shù)據(jù)集中的圖像為駕駛狀態(tài)下采集,能反映真實(shí)的行車狀態(tài)。遷移測(cè)試結(jié)果表明,在新樣本下,訓(xùn)練模型依然可以實(shí)現(xiàn)對(duì)復(fù)雜環(huán)境下多目標(biāo)交通標(biāo)志的檢測(cè)與識(shí)別,MAP為0.703。表明訓(xùn)練模型具有較好的泛化能力,證明了基于Faster-RCNN的小目標(biāo)檢測(cè)算法的有效性,部分測(cè)試結(jié)果如圖7所示。
將本文方法(即ZF+Faster-RCN)與經(jīng)典的SSD[23]目標(biāo)檢測(cè)方法以及同樣采用VOC2007數(shù)據(jù)格式的文獻(xiàn)[24]、文獻(xiàn)[25]進(jìn)行對(duì)比,結(jié)果如表3所示。
表2 不同環(huán)境下的對(duì)比實(shí)驗(yàn)結(jié)果
圖7 STSD數(shù)據(jù)集檢測(cè)結(jié)果Fig.7 Test results of STSD
方法MAPSSD[23]0.513Multi-view SSD[24]0.644VGG16+R-FCN[25]0.650本文ZF+Faster-RCNN0.713
從表3可以看出,相比于經(jīng)典的SSD小目標(biāo)檢測(cè)方法,以及同樣基于深度學(xué)習(xí)的R-FCN小目標(biāo)檢測(cè)方法,本文所提出的小目標(biāo)檢測(cè)方法具有更好的檢測(cè)效果。以上實(shí)驗(yàn)說明,通過選取合適的預(yù)訓(xùn)練網(wǎng)絡(luò)以及調(diào)整Faster-RCNN中RPN網(wǎng)絡(luò)對(duì)小目標(biāo)的檢索能力,并通過實(shí)驗(yàn)選擇合適的網(wǎng)絡(luò)超參數(shù),本文提出的交通標(biāo)志檢測(cè)方法能夠滿足實(shí)際應(yīng)用場(chǎng)景的需要,并具有較強(qiáng)的遷移應(yīng)用性。
交通標(biāo)志的檢測(cè)是智能交通系統(tǒng)重要的組成部分。真實(shí)道路環(huán)境下,交通標(biāo)志目標(biāo)較小,場(chǎng)景復(fù)雜多變,環(huán)境多有變化,使得交通標(biāo)志的檢測(cè)難度較大。本文提出了一種基于Faster-RCNN的交通標(biāo)志多目標(biāo)檢測(cè)方法,通過選取合適的預(yù)訓(xùn)練模型、網(wǎng)絡(luò)學(xué)習(xí)率、動(dòng)量系數(shù)等超參數(shù),并對(duì)RPN網(wǎng)絡(luò)進(jìn)行優(yōu)化,使其適應(yīng)小目標(biāo)檢測(cè)。通過驗(yàn)證試驗(yàn)和遷移測(cè)試,證明了所提方法的有效性,單張圖片檢測(cè)時(shí)間為0.4 s,滿足實(shí)時(shí)性要求,為智能汽車駕駛提供了理論依據(jù)和技術(shù)支持。