王弘宇,張雪芹
(華東理工大學(xué) 信息科學(xué)與工程學(xué)院,上海 200237)
傳統(tǒng)的交通標(biāo)志檢測(cè)方法大多是基于形狀特征和顏色特征的方法,易受限于光照、天氣等自然因素或交通標(biāo)志損壞、遮擋等人為因素影響,而且檢測(cè)模型的性能大多依賴于人工提取特征的好壞。近年來(lái)交通標(biāo)志的檢測(cè)任務(wù)大多使用基于深度學(xué)習(xí)的方法,如YOLO[1]、SSD[2]系列和R-CNN[3]系列的檢測(cè)網(wǎng)絡(luò)。Rajendran等[4]在YOLO V3檢測(cè)框架中使用特征金字塔網(wǎng)絡(luò)(FPN)提高針對(duì)小目標(biāo)交通標(biāo)志的檢測(cè)精度,在德國(guó)交通標(biāo)志數(shù)據(jù)集(GTSDB)上mAP可達(dá)92.2%。Dongtao等[5]通過(guò)去除原SSD算法中的高層特征圖,調(diào)整低層特征圖的長(zhǎng)寬比,在較低層分布更多的錨框來(lái)豐富交通標(biāo)志場(chǎng)景圖中的精細(xì)特征提高檢測(cè)精度,mAP為75.28%。Roubil等[6]將改進(jìn)后的Inception v3模型作為Faster R-CNN的特征提取器以提高對(duì)交通標(biāo)志小目標(biāo)的檢測(cè)效果,mAP為92.99%。周等[7]引入淺層特征提取、深層特征提取和HyperNet復(fù)雜特征融合模塊對(duì)PVANet網(wǎng)絡(luò)進(jìn)行改進(jìn),提高小目標(biāo)交通標(biāo)志的檢測(cè)精度,mAP為84.1%。Cheng等[8]針對(duì)交通標(biāo)志小目標(biāo)漏檢問(wèn)題,提出設(shè)計(jì)局部上下文層獲取交通標(biāo)志周圍區(qū)域信息,從而提高小目標(biāo)的檢測(cè)精度,mAP最高為89.1%。Cen等[9]在基于視頻的交通標(biāo)志檢測(cè)任務(wù)中,為提高對(duì)小目標(biāo)檢測(cè)的精度,改進(jìn)了特征生成器的模型,mAP為86%。上述方法驗(yàn)證,改進(jìn)檢測(cè)模型的特征提取網(wǎng)絡(luò)和錨框搜索機(jī)制可以有效提高檢測(cè)精度和分類效果。
上述檢測(cè)網(wǎng)絡(luò)均采用基于錨框檢測(cè)的方法,在離散的圖像空間中預(yù)先人工定義一組固定的長(zhǎng)寬比不同的錨框以適應(yīng)具體應(yīng)用場(chǎng)景,但無(wú)法準(zhǔn)確檢測(cè)到攝像機(jī)拍攝到的形狀畸變的數(shù)據(jù),應(yīng)用場(chǎng)景切換時(shí)需重新設(shè)計(jì)錨框。同時(shí),這些方法需生成大量且密集的錨框,增加了計(jì)算成本。針對(duì)以上問(wèn)題,本文提出基于Cascade R-CNN級(jí)聯(lián)檢測(cè)算法改進(jìn)的GA-CMF R-CNN模型,采用ResneXt101(32×4d)作為特征提取網(wǎng)絡(luò),采用GA-RPN生成自適應(yīng)且稀疏的錨框,引入級(jí)聯(lián)的mask分支對(duì)目標(biāo)所在區(qū)域進(jìn)行語(yǔ)義分割。提高了復(fù)雜環(huán)境下小目標(biāo)交通標(biāo)志的檢測(cè)精度。
Cascade R-CNN是由Z. Cai等[10]提出的一個(gè)端到端的檢測(cè)網(wǎng)絡(luò),它通過(guò)級(jí)聯(lián)幾個(gè)檢測(cè)網(wǎng)絡(luò)達(dá)到不斷優(yōu)化預(yù)測(cè)結(jié)果的目的。Cascade R-CNN由特征提取網(wǎng)絡(luò)(backbone)、區(qū)域生成網(wǎng)絡(luò)RPN(region proposal network)和級(jí)聯(lián)的檢測(cè)網(wǎng)絡(luò)構(gòu)成。其backbone采用Resnet101-FPN網(wǎng)絡(luò),用于對(duì)輸入圖像進(jìn)行特征提取,RPN基于圖像特征預(yù)測(cè)錨框(anchor)的形狀和位置,級(jí)聯(lián)的檢測(cè)網(wǎng)絡(luò)的每一級(jí)(stage)包含分類分支C和回歸分支B,通過(guò)把級(jí)聯(lián)回歸作為重采樣的機(jī)制,使每一級(jí)的輸出都能被下一級(jí)使用,從而解決兩階段檢測(cè)網(wǎng)絡(luò)預(yù)測(cè)的候選區(qū)域(region proposal)質(zhì)量低的問(wèn)題。通常,Cascade R-CNN的檢測(cè)模型在基于不同IoU閾值確定的正負(fù)樣本上訓(xùn)練得到。
1.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
為實(shí)現(xiàn)復(fù)雜場(chǎng)景下小目標(biāo)交通標(biāo)志的高精度檢測(cè)任務(wù),本文提出一個(gè)基于Cascade R-CNN的多任務(wù)的級(jí)聯(lián)網(wǎng)絡(luò)模型GA-CMF R-CNN,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 GA-CMF R-CNN多任務(wù)級(jí)聯(lián)模型
在交通標(biāo)志檢測(cè)問(wèn)題中,GA-CMF R-CNN模型的輸入數(shù)據(jù)I為自動(dòng)駕駛前置攝像頭捕捉到的交通駕駛場(chǎng)景圖像。與Cascade R-CNN不同的是,該模型采用ResneXt101(32×4d)-FPN代替Resnet101-FPN作為特征提取網(wǎng)絡(luò),采用GA-RPN代替RPN作為區(qū)域生成網(wǎng)絡(luò)。通過(guò)在級(jí)聯(lián)結(jié)構(gòu)的檢測(cè)網(wǎng)絡(luò)中加入mask分割分支,并在級(jí)聯(lián)的每一級(jí)的mask分支間引入信息流,使mask分支的特征信息得以逐層調(diào)整從而提高對(duì)小目標(biāo)交通標(biāo)志的檢測(cè)精度。
1.2.2 backbone特征提取網(wǎng)絡(luò)
backbone為特征提取網(wǎng)絡(luò),輸入為任意大小的圖像,經(jīng)卷積神經(jīng)網(wǎng)絡(luò)輸出固定比例尺寸的特征圖。Cascade R-CNN 中backbone使用Resnet101網(wǎng)絡(luò),為了進(jìn)一步提高對(duì)小目標(biāo)的特征提取能力,本文采用COCO數(shù)據(jù)集上預(yù)訓(xùn)練的ResneXt101(32×4d)殘差網(wǎng)絡(luò)模型[11],結(jié)合特征金字塔網(wǎng)絡(luò)(FPN)的結(jié)構(gòu),如圖2所示。
圖2 backbone網(wǎng)絡(luò)結(jié)構(gòu)
圖2中,自下而上的路徑即指卷積神經(jīng)網(wǎng)絡(luò)的前饋計(jì)算過(guò)程, {C2,C3,C4,C5} 是ResneXt101(32×4d)殘差網(wǎng)絡(luò)conv2、conv3、conv4和conv5這4個(gè)階段的輸出。FPN自上而下的路徑可以看作執(zhí)行次數(shù)較少的二倍上采樣過(guò)程,在像素點(diǎn)之間采用內(nèi)插值法使得各層上采樣后的特征圖尺寸相同。通過(guò)橫向連接,即對(duì)卷積神經(jīng)網(wǎng)絡(luò)中生成的對(duì)應(yīng)層的特征圖進(jìn)行1×1的卷積操作,將自下而上生成的特征圖和二倍上采樣得到的結(jié)果相融合,最后用3×3的卷積核對(duì)每個(gè)融合結(jié)果進(jìn)行卷積以消除當(dāng)前層的混疊效應(yīng),得到對(duì)應(yīng)的生成特征 {P2,P3,P4,P5}。
1.2.3 GA-RPN
Cascade R-CNN目標(biāo)檢測(cè)網(wǎng)絡(luò)依賴區(qū)域生成網(wǎng)絡(luò)RPN產(chǎn)生固定尺寸比例的錨框,通過(guò)訓(xùn)練和預(yù)測(cè)得到含有目標(biāo)信息的候選區(qū)域。RPN通常需要依靠生成密集的先驗(yàn)框來(lái)提高召回率,并且在檢測(cè)任務(wù)中需根據(jù)交通標(biāo)志的大小來(lái)人工預(yù)設(shè)錨框的尺度和長(zhǎng)寬比??紤]交通標(biāo)志具有大小不均勻且稀疏的特點(diǎn),本文提出使用GA-RPN生成稀疏且形狀任意的先驗(yàn)框從而提高模型性能。
(1)
(2)
圖3 GA-RPN網(wǎng)絡(luò)結(jié)構(gòu)
1.2.4 mask分支及其信息流
通常mask分支用于對(duì)目標(biāo)所在區(qū)域進(jìn)行語(yǔ)義分割。為了提高檢測(cè)精度,同時(shí)輸出檢測(cè)和分割結(jié)果,在Cascade R-CNN網(wǎng)絡(luò)的每一級(jí)中引入mask分支M,并在不同級(jí)的mask分支間引入信息流,使mask分支的特征信息得以逐層調(diào)整,通過(guò)將每一級(jí)的mask特征嵌入并饋送到下一級(jí)以提高mask分支的預(yù)測(cè)結(jié)果,進(jìn)而提高檢測(cè)精度。
(3)
M分支間的信息流設(shè)計(jì)如圖4所示。
圖4 Mask分支結(jié)構(gòu)
級(jí)聯(lián)mask分支間的信息流可表示為
(4)
1.2.5 GA-CMF R-CNN模型損失函數(shù)
GA-CMF R-CNN網(wǎng)絡(luò)的訓(xùn)練損失函數(shù)如下
(5)
(6)
(7)
1.2.6 GA-CMF R-CNN算法實(shí)現(xiàn)流程
設(shè)模型輸入圖像為I,GA-CMF R-CNN算法步驟如下:
步驟1 輸入任意大小的圖像I;
步驟2 圖像I通過(guò)由ResneXt101(32×4d)-FPN特征提取器輸出圖像特征FI;
步驟4 通過(guò)池化層pool的區(qū)域特征提取操作,整合GA-RPN的輸出的anchor和預(yù)測(cè)特征圖F′I及圖像特征FI,獲得目標(biāo)區(qū)域特征圖;
步驟5 級(jí)聯(lián)實(shí)例分割網(wǎng)絡(luò)對(duì)目標(biāo)區(qū)域特征圖進(jìn)行分類和邊界框的回歸以修正anchor,mask分支對(duì)交通標(biāo)志進(jìn)行分割操作;
步驟6 輸出交通標(biāo)志檢測(cè)和分割結(jié)果。
2.1.1 德國(guó)交通標(biāo)志數(shù)據(jù)集
實(shí)驗(yàn)數(shù)據(jù)集使用GTSDB Dataset。GTSDB Dataset 是一個(gè)針對(duì)交通標(biāo)志檢測(cè)的數(shù)據(jù)集,用于對(duì)計(jì)算機(jī)視覺(jué),模式識(shí)別和基于圖像的駕駛員輔助領(lǐng)域的單張圖像進(jìn)行檢測(cè)評(píng)估。該數(shù)據(jù)集由包含1206個(gè)交通標(biāo)志的900張完整圖像組成,圖像大小為1360*800,交通標(biāo)志尺寸為16×16到128×128不等。每張圖像中都包含0個(gè)或多個(gè)交通標(biāo)志。標(biāo)志分為4個(gè)大類別,即強(qiáng)制類、禁止類、危險(xiǎn)類和其它類。根據(jù)重要性,本文只檢測(cè)前三大類。數(shù)據(jù)集內(nèi)含有白天和黃昏和多種氣候條件下,不同類型道路(高速公路、農(nóng)村、城市)的交通場(chǎng)景圖片。圖5數(shù)據(jù)展示了陰天、強(qiáng)光、逆光和復(fù)雜街道背景條件下的駕駛場(chǎng)景。
圖5 GTSDB數(shù)據(jù)集圖片樣例
實(shí)驗(yàn)將數(shù)據(jù)集分成訓(xùn)練集和測(cè)試集,其中600張作為訓(xùn)練集(846個(gè)交通標(biāo)志),300張作為測(cè)試集(360個(gè)交通標(biāo)志)。訓(xùn)練集包含396個(gè)違禁類(59.5%),114個(gè)(17.1%)強(qiáng)制類和156個(gè)(23.4%)危險(xiǎn)類交通標(biāo)志樣本,測(cè)試集包含161個(gè)禁止類,49個(gè)強(qiáng)制類和63個(gè)危險(xiǎn)類交通標(biāo)志。實(shí)驗(yàn)根據(jù)交通標(biāo)志的大小將其分為大、中、小3類,尺寸小于32像素定義為小目標(biāo),大于32像素小于46像素定義為中目標(biāo),大于46像素定義為大目標(biāo)。
2.1.2 評(píng)估指標(biāo)
實(shí)驗(yàn)采用的評(píng)估指標(biāo)如下:
(1)召回率R(Recall)和平均召回率AR(Average Recall)
式中:TP為真正例(true positives),F(xiàn)N為假陰例(false negatives)。AR即計(jì)算測(cè)試N張圖片召回率的均值。
(2)平均精度AP(average precision)和平均精度均值mAP(mean average precision)根據(jù)PASCAL VOC2010標(biāo)準(zhǔn)
式中:P為檢測(cè)精度,r是檢測(cè)N張圖像的召回率,N為測(cè)試集中所有圖片的個(gè)數(shù),P(K)表示檢測(cè)k張圖片的精度值,Δr(k)表示調(diào)整IoU閾值后,檢測(cè)圖片個(gè)數(shù)從k-1變化到k時(shí)召回率r的變化情況,mAP即計(jì)算AP的均值。
以在COCO數(shù)據(jù)集上訓(xùn)練的ResneXt101(32×4d)作為預(yù)訓(xùn)練模型,基于遷移學(xué)習(xí)訓(xùn)練GA-CMF R-CNN 模型。實(shí)驗(yàn)中,GA-CMF R-CNN算法采用SGD隨機(jī)梯度下降優(yōu)化器對(duì)模型進(jìn)行訓(xùn)練。根據(jù)實(shí)驗(yàn)環(huán)境配置,默認(rèn)學(xué)習(xí)率lr=0.0025, 動(dòng)量因子momentum=0.9,權(quán)重衰減因子weightdecay=0.0001,批大小batchsize=1。學(xué)習(xí)率優(yōu)化策略采用warmup的方法,即設(shè)置起始學(xué)習(xí)率lr=1.0/3,warmupiters=500 (初始的500次迭代中學(xué)習(xí)率線性增加)。其中實(shí)驗(yàn)一、實(shí)驗(yàn)二和實(shí)驗(yàn)三訓(xùn)練epoch=24,設(shè)置在epoch為16和23時(shí)自動(dòng)調(diào)整學(xué)習(xí)率。實(shí)驗(yàn)四epoch=12,在epoch為8和11時(shí)自動(dòng)調(diào)整學(xué)習(xí)率。
實(shí)驗(yàn)運(yùn)行在裝有Intel Core i7-7700 CPU和NVIDIA GEFORCE GTX 1070 GPU的電腦上,該GPU具有1920 CUDA內(nèi)核。
2.2.1 實(shí)驗(yàn)一:消融實(shí)驗(yàn)
本實(shí)驗(yàn)的目的是為了驗(yàn)證GA-CMF R-CNN模型每個(gè)改進(jìn)部分的有效性。實(shí)驗(yàn)在GTSDB數(shù)據(jù)集上進(jìn)行,實(shí)驗(yàn)結(jié)果見(jiàn)表1。
表1中,模型1~模型4的backbone采用Resnet101-FPN(標(biāo)識(shí)為*),模型5的backbone采用ResneXt101(32×4d)-FPN(標(biāo)識(shí)為**)。APL、APM和APS分別代表大、中和小3類目標(biāo)的AP值,APP、APMA和APD分別表示對(duì)禁止類、強(qiáng)制類和危險(xiǎn)類三大類目標(biāo)的AP值。
從表1可以看出,Cascade R-CNN網(wǎng)絡(luò)加入mask分支、mask分支信息流和GA-RPN后,模型對(duì)大、中、小目標(biāo)的檢測(cè)精度,對(duì)強(qiáng)制、禁止和危險(xiǎn)類的識(shí)別精度均有所提升。其中,加入mask分支后,對(duì)大、中和小目標(biāo)的檢測(cè)精度分別提高了6.8%、1.2%和1.9%;加入GA-RPN后,對(duì)大和小目標(biāo)的檢測(cè)精度分別提高了0.7%和9.5%,采用ResneXt101(32×4d)-FPN后,對(duì)數(shù)據(jù)集中占比較少的強(qiáng)制類和危險(xiǎn)類的檢測(cè)AP值分別提高了3.64%和3.46%??梢?jiàn),改進(jìn)模型的各部分對(duì)檢測(cè)精度的提高均有效。
表1 在GTSDB數(shù)據(jù)集上的消融實(shí)驗(yàn)結(jié)果/%
2.2.2 實(shí)驗(yàn)二:參數(shù)實(shí)驗(yàn)
backbone網(wǎng)絡(luò)作為特征提取網(wǎng)絡(luò),其特征提取的優(yōu)劣對(duì)后續(xù)檢測(cè)結(jié)果影響很大。由于實(shí)驗(yàn)采用的GTSDB數(shù)據(jù)集的訓(xùn)練圖像僅有600張,為防止訓(xùn)練時(shí)產(chǎn)生過(guò)擬合問(wèn)題,采用基于共享參數(shù)的遷移學(xué)習(xí)方法對(duì)backbone為ResneXt101(32×4d)-FPN的GA-CMF R-CNN網(wǎng)絡(luò)模型進(jìn)行調(diào)參,保證模型具有較快的收斂速度。
ResneXt101(32×4d)網(wǎng)絡(luò)在COCO數(shù)據(jù)集上預(yù)訓(xùn)練,并將預(yù)訓(xùn)練過(guò)的模型參數(shù)及權(quán)重遷移至GA-CMF R-CNN 模型中。采用frozen stages方法固定ResneXt101(32×4d)網(wǎng)絡(luò)的conv層參數(shù)。frozenstages為-1代表參數(shù)完全傳遞,frozenstages為1,2,3分別代表固定ResneXt101(32×4 d)卷積神經(jīng)網(wǎng)絡(luò)的前C2,C3和C4層的參數(shù),后面的參數(shù)值隨機(jī)初始化進(jìn)行訓(xùn)練。實(shí)驗(yàn)結(jié)果見(jiàn)表2。
表2中fps和Memory分別代表檢測(cè)速率和內(nèi)存消耗。表2顯示,當(dāng)frozenstages設(shè)置為1時(shí),GA-CMF R-CNN模型的檢測(cè)效果最佳,檢測(cè)速度和模型對(duì)Memory的大小需求適中。因此,后續(xù)實(shí)驗(yàn)取frozenstages=1。
2.2.3 實(shí)驗(yàn)三:對(duì)比實(shí)驗(yàn)
本實(shí)驗(yàn)將所提GA-CMF R-CNN模型與文獻(xiàn)[13]中的R-FCN、Faster R-CNN、YOLO V2和SSD網(wǎng)絡(luò)進(jìn)行對(duì)比。其中,R-FCN和Faster R-CNN檢測(cè)框架的backbone為Resnet 101,SSD檢測(cè)框架的backbone采用Inception V2。實(shí)驗(yàn)結(jié)果見(jiàn)表3。
從表3看出,本文所提的GA-CMF R-CNN模型無(wú)論是針對(duì)大、中和小交通標(biāo)志,還是禁止類、強(qiáng)制類和危險(xiǎn)類交通標(biāo)志,其檢測(cè)精度均高于對(duì)比模型。特別是相較于一階段網(wǎng)絡(luò)YOLO V2和SSD,mAP分別提高19.3%和32%;對(duì)小目標(biāo)交通標(biāo)志,檢測(cè)精度分別提升50.7%和66.8%。相較于二階網(wǎng)絡(luò)Faster R-CNN、R-FCN,mAP有3%左右的提升;對(duì)小目標(biāo)交通標(biāo)志,檢測(cè)精度分別提升22.8%和33.3%檢測(cè)精大幅提升。在檢測(cè)速度上,SSD、Faster R-CNN和R-FCN以及本文所提算法均未達(dá)到實(shí)時(shí)檢測(cè)要求;YOLO V2盡管可以達(dá)到實(shí)時(shí)檢測(cè)效果,但其檢測(cè)精度偏低??紤]不同于無(wú)人或輔助駕駛中,行人和車輛等檢測(cè)任務(wù)是為了實(shí)現(xiàn)及時(shí)避障,對(duì)實(shí)時(shí)性有著很高的要求。小目標(biāo)交通標(biāo)志檢測(cè),通常是輔助行駛車輛在較遠(yuǎn)距離逼近目標(biāo)過(guò)程中識(shí)別出道路指示。在該任務(wù)中,高精度識(shí)別目標(biāo)相比實(shí)時(shí)檢測(cè)更為重要。因此,本文所提算法滿足小目標(biāo)交通標(biāo)志的檢測(cè)要求。綜合考慮,本文所提的GA-CMF R-CNN模型具有較好的性能,尤其對(duì)復(fù)雜駕駛環(huán)境中的小目標(biāo)檢測(cè),精度大幅提升。
表2 不同frozen stages下模型檢測(cè)結(jié)果/%及其性能參數(shù)
表3 在GTSDB測(cè)試集上的對(duì)比實(shí)驗(yàn)結(jié)果/%
2.2.4 實(shí)驗(yàn)四:CCTSDB數(shù)據(jù)集上的實(shí)驗(yàn)
GTSDB Dataset數(shù)據(jù)集樣本數(shù)量較少,為了進(jìn)一步驗(yàn)證本文所提方法的有效性,本實(shí)驗(yàn)在CCTSDB[14]數(shù)據(jù)集上驗(yàn)證并評(píng)估。CCTSDB是中國(guó)交通標(biāo)志數(shù)據(jù)集,包含圖片近15 000張、交通標(biāo)志近60 000個(gè),分為指示標(biāo)志、禁令標(biāo)志和警告標(biāo)志三大類。通過(guò)放射變換、椒鹽噪聲、平移縮放及亮度等圖像變換方法對(duì)有限的圖像進(jìn)行處理,以模擬攝像機(jī)拍攝到的真實(shí)駕駛場(chǎng)景。實(shí)驗(yàn)中,圖像經(jīng)處理大小為1360*800,采用和GTSDB數(shù)據(jù)集相同的方法將交通標(biāo)志定義為大、中、小3類,訓(xùn)練集包含15 723張圖像,測(cè)試集包含400張圖像。實(shí)驗(yàn)結(jié)果如圖6所示。
圖6給出了GA-CMF R-CNN模型在指示標(biāo)志、禁令標(biāo)志和警告標(biāo)志3種類別,以及大、中、小3種尺寸交通標(biāo)志上的檢測(cè)結(jié)果??梢钥闯?,AP值均接近98%,并測(cè)得其mAP值為98.8%。進(jìn)一步驗(yàn)證了GA-CMF R-CNN檢測(cè)模型的有效性,同時(shí)說(shuō)明該模型適用于中國(guó)交通標(biāo)志的檢測(cè)任務(wù),具有普適性。
為了進(jìn)一步展示GA-CMF R-CNN模型對(duì)小目標(biāo)交通標(biāo)志檢測(cè)的效果,下面給出部分在復(fù)雜多變駕駛場(chǎng)景下對(duì)小交通標(biāo)志檢測(cè)效果圖,如圖7所示。
圖6 CCTSDB數(shù)據(jù)集測(cè)試各大類的平均精度值
圖7中,圖7(a)~圖7(c)分別為GTSDB數(shù)據(jù)集中城市、鄉(xiāng)村、高速公路下小目標(biāo)交通標(biāo)志檢測(cè)結(jié)果。圖7(d) ~圖7(f)分別為CCTSDB數(shù)據(jù)集中城市、鄉(xiāng)村、高速公路下小目標(biāo)交通標(biāo)志檢測(cè)結(jié)果。圖7(g)~圖7(i)分別為陰暗模糊環(huán)境下的小目標(biāo)交通標(biāo)志檢測(cè)結(jié)果??梢钥吹?,GA-CMF R-CNN模型能適用于各種較復(fù)雜環(huán)境下的檢測(cè)。
圖7 小目標(biāo)交通標(biāo)志檢測(cè)效果
本文針對(duì)自動(dòng)和輔助駕駛中小目標(biāo)交通標(biāo)志高精度檢測(cè)問(wèn)題,提出一個(gè)基于Cascade R-CNN級(jí)聯(lián)檢測(cè)網(wǎng)絡(luò)的GA-CMF R-CNN多任務(wù)級(jí)聯(lián)檢測(cè)模型,該網(wǎng)絡(luò)在級(jí)聯(lián)檢測(cè)網(wǎng)絡(luò)中加入了級(jí)聯(lián)分割分支,并引入信息流,采用ResneXt101(32×4d)和GA-RPN作為網(wǎng)絡(luò)模型的特征提取網(wǎng)絡(luò)和區(qū)域生成網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)交通標(biāo)志檢測(cè)精度,尤其是小目標(biāo)交通標(biāo)志檢測(cè)精度的提高。未來(lái),可進(jìn)一步考慮優(yōu)化該模型框架以提高檢測(cè)的速度。