摘要:針對現(xiàn)有大多數(shù)基于光電傳感器的軸型識別檢測方法存在準(zhǔn)確率低、維護(hù)成本高等問題,文章提出了一種基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)高效準(zhǔn)確的貨車軸型識別方法。利用目標(biāo)檢測算法YOLOv5檢測貨車輪軸,根據(jù)檢測結(jié)果識別貨車軸型;為減輕因強(qiáng)光斑及夜間補(bǔ)光不足所帶來的影響,基于貨車圖像的像素均值和標(biāo)準(zhǔn)差對圖像數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,減輕了環(huán)境因素所帶來的影響;為減少運(yùn)動模糊帶來的影響,使用Scharr濾波器進(jìn)行邊緣預(yù)加重處理,強(qiáng)化目標(biāo)輪廓特征。所設(shè)計(jì)的軸型識別方法于防城港西收費(fèi)站進(jìn)行了試運(yùn)行應(yīng)用分析,總體的軸型識別率達(dá)到99.43%,滿足新型智慧收費(fèi)站系統(tǒng)的建設(shè)需要。
關(guān)鍵詞:智能交通系統(tǒng);深度學(xué)習(xí);軸型識別;YOLOv5;圖像處理
中圖分類號:U412.6
0 引言
據(jù)統(tǒng)計(jì),中大型貨車主要行駛于城市間高速公路上,為城市間提供貨物運(yùn)輸服務(wù),極大滿足了社會物質(zhì)生活需要。為了解決貨車超限超載的問題,常見的做法是使用地磅稱重方式,憑借計(jì)重?cái)?shù)據(jù)明細(xì)收費(fèi)。但該方法低效且計(jì)重準(zhǔn)確度較差,往往造成排隊(duì)擁堵。
自全國收費(fèi)公路統(tǒng)一執(zhí)行標(biāo)準(zhǔn)起[1],現(xiàn)行的公路貨車收費(fèi)方式從原先的計(jì)重收費(fèi)改為按車軸數(shù)收費(fèi)。新標(biāo)準(zhǔn)的執(zhí)行,也給貨車軸型的準(zhǔn)確識別帶來了新的挑戰(zhàn)——檢測系統(tǒng)需要動態(tài)識別貨車軸數(shù),給出軸型判定信息?,F(xiàn)有的公路貨車軸型識別方法中,較為常見的是通過在地面鋪設(shè)傳感器,通過信號的變化來對軸數(shù)進(jìn)行識別。但是采用這類方法通常檢測精度較低,出現(xiàn)設(shè)備異常時(shí),維護(hù)成本高,并且會破壞路面本身,該類方法已經(jīng)無法滿足智能交通系統(tǒng)的建設(shè)需要。
隨著數(shù)字圖像處理和深度學(xué)習(xí)等技術(shù)的快速發(fā)展,許多研究人員開始使用新技術(shù)對貨車軸型進(jìn)行識別?;跀?shù)字圖像處理的軸型識別系統(tǒng)方便高效,通過獲取車輛車身圖,對圖像進(jìn)行輪軸定位,進(jìn)一步做檢測得出輪軸數(shù)?;谏疃葘W(xué)習(xí)的方法需要借助深度神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,通過輸入車身圖,檢測出貨車的相關(guān)信息,從而實(shí)現(xiàn)對貨車軸型識別的目的。該類方法高效可靠,并且維護(hù)簡單,是未來交通領(lǐng)域的新著力點(diǎn)。
本文提出一種基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)的貨車軸型識別方法,該方法通過對貨車圖像進(jìn)行預(yù)處理從而強(qiáng)化特征信息,隨后通過深度神經(jīng)網(wǎng)絡(luò)對圖像進(jìn)行多級特征提取進(jìn)行目標(biāo)檢測,從而完成貨車軸型識別。
1 軸型識別方法和原理
1.1 傳統(tǒng)貨車軸型識別方法
傳統(tǒng)貨車軸型識別方法主要有地磁線圈法、激光紅外線識別以及動態(tài)壓電檢測法[2]。
1.1.1 地磁線圈與動態(tài)壓電檢測法
地磁線圈法[3]與動態(tài)壓電檢測法[4]檢測原理類似。地磁線圈和動態(tài)壓電設(shè)備都需要預(yù)先布設(shè)在路面下,當(dāng)車輛經(jīng)過時(shí),會通過對應(yīng)的傳感器。此時(shí)傳感器會根據(jù)駛?cè)胲囕v的特征產(chǎn)生不同的電感信號。不同長度、輪軸數(shù)的貨車會產(chǎn)生不同的信號類型,因此可以根據(jù)信號明細(xì)來區(qū)分對應(yīng)貨車的車型輪軸信息。該類方法識別速度較快,但該方法成本高,不易維護(hù)。此外,當(dāng)進(jìn)入識別區(qū)域的車輛車速較快時(shí),識別準(zhǔn)確性能下降顯著。
1.1.2 激光紅外檢測法
激光紅外檢測法[5]是通過紅外反射進(jìn)行軸型識別。詳細(xì)來說,該方法需要在入口布設(shè)紅外傳感器。當(dāng)駛?cè)胲囕v時(shí),設(shè)備會發(fā)射紅外激光,布設(shè)在同一側(cè)的紅外接收器通過接受反射光線來識別該車的車型輪軸,從而實(shí)現(xiàn)軸型自動識別。該類方法識別靈敏,對車型適應(yīng)性廣,但該方法受環(huán)境因素影響較大,在大霧天氣時(shí),該方法精度會顯著下降。
1.2 基于深度學(xué)習(xí)的貨車軸型識別方法
基于深度學(xué)習(xí)的方法實(shí)際上是借助深度神經(jīng)網(wǎng)絡(luò)對貨車進(jìn)行車型輪軸檢測與識別。一般而言,端到端的網(wǎng)絡(luò)需完成兩項(xiàng)任務(wù):(1)對圖像中貨車車身以及車輪進(jìn)行檢測;(2)根據(jù)車型信息以及車輪數(shù)對最終的車型輪軸明細(xì)進(jìn)行識別,即完成特征提取、對應(yīng)車型輪軸關(guān)系分類的任務(wù)。由于網(wǎng)絡(luò)需要輸入貨車車身圖像數(shù)據(jù)對深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,因此建立大量標(biāo)注好的數(shù)據(jù)集也是必不可少的一環(huán)。
2 基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)的貨車軸型識別方法
本節(jié)將介紹本文所提出的方法,所提出的方法可以分為三個部分,建立貨車圖像數(shù)據(jù)集、貨車圖像數(shù)據(jù)的預(yù)處理以及使用YOLOv5卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行目標(biāo)檢測。
建立貨車圖像數(shù)據(jù)集需要通過攝像頭設(shè)備捕捉公路貨車車身圖像并進(jìn)行車身、車輪標(biāo)注。此外,為減輕環(huán)境因素以及運(yùn)動模糊對識別所帶來的影響,需要對輸入的圖像進(jìn)行特征強(qiáng)化。將處理好的數(shù)據(jù)輸入到深度神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,獲取到對應(yīng)的軸型識別結(jié)果,實(shí)現(xiàn)公路貨車軸型識別。基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)的整體識別流程如圖1所示。
2.1 貨車圖像數(shù)據(jù)集
基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)的貨車軸型識別方法,需要包含完整車輪的車身圖作為網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練。本文抓取了道路上所拍攝的貨車車身圖像建立公路貨車車身圖數(shù)據(jù)集,所采集到的公路貨車車身圖要求清晰并能夠體現(xiàn)所有貨車側(cè)方特征和細(xì)節(jié)。數(shù)據(jù)采集完整后需要對數(shù)據(jù)集進(jìn)行標(biāo)注,本文使用標(biāo)注工具Labelimg對貨車車身車輪進(jìn)行標(biāo)注,標(biāo)簽為YOLO格式。詳細(xì)為對象的標(biāo)簽索引、目標(biāo)的中心坐標(biāo)以及目標(biāo)的寬和高。
2.2 貨車圖像預(yù)處理
一般而言,相機(jī)受太陽光直射時(shí)會產(chǎn)生光斑,出現(xiàn)光照不均的情況;與此同時(shí),在夜間環(huán)境下,相機(jī)也會因?yàn)楣饩€不足出現(xiàn)噪點(diǎn),導(dǎo)致圖像質(zhì)量下降的情況。為了減少所采集的貨車車身圖受環(huán)境光的影響,提高軸型識別的準(zhǔn)確率,需要對采集的圖像進(jìn)行預(yù)處理。本文基于原始貨車數(shù)據(jù)的均值和標(biāo)準(zhǔn)差進(jìn)行了數(shù)據(jù)的標(biāo)準(zhǔn)化,減少了因環(huán)境光所帶來的影響;本文還使用Scharr濾波器進(jìn)行邊緣預(yù)加重處理,使得目標(biāo)輪廓特征更明顯。
2.2.1 基于貨車圖像的均值和標(biāo)準(zhǔn)差進(jìn)行標(biāo)準(zhǔn)化
因時(shí)間、天氣以及光照的影響,存在曝光過高的圖像和光線特別不足的夜間圖像。這些圖像相對于正常圖像而言,特征表征與正常圖像不同,容易成為導(dǎo)致網(wǎng)絡(luò)無法穩(wěn)定收斂的離群值。為減少這類圖像對網(wǎng)絡(luò)模型訓(xùn)練的影響,對所有原始貨車圖像數(shù)據(jù)計(jì)算均值和標(biāo)準(zhǔn)差,進(jìn)行標(biāo)準(zhǔn)化處理[6]。標(biāo)準(zhǔn)化的目的在于統(tǒng)一規(guī)格,使所有貨車圖像特征都在同一個量綱上,服從于正態(tài)分布,增加模型的泛化能力,減少因?yàn)椴糠痔卣鞯牧烤V過大而導(dǎo)致整個網(wǎng)絡(luò)模型無法收斂的影響。
標(biāo)準(zhǔn)化的公式如下所示:
式中:μ——圖像的標(biāo)準(zhǔn)均值;
σ——圖像的標(biāo)準(zhǔn)方差;
Xi——該圖像第i個像素的值;
Xi*——標(biāo)準(zhǔn)化后該圖像第i個像素的值。
2.2.2 使用Scharr濾波器對圖像進(jìn)行邊緣預(yù)加重
由于進(jìn)站的每臺貨車車速、車長和車高均不相同,因此存在車速過快或者是車長過長等原因?qū)е缕唇雍蟮膱D像有運(yùn)動模糊的問題。這部分運(yùn)動模糊的圖片會使得網(wǎng)絡(luò)在定位輪軸位置上存在困難,因此需要通過Scharr濾波器對圖像進(jìn)行邊緣預(yù)加重[7]。通過微分運(yùn)算增強(qiáng)圖像高頻區(qū)域,衰減和抑制低頻區(qū)域,使圖像變得銳化,從而增強(qiáng)圖像像素值跳變劇烈部分,使模糊的細(xì)節(jié)變得清晰。
Scharr濾波器是Soble濾波器在ksize=3時(shí)的優(yōu)化。Scharr濾波器與 Sobel 濾波器的不同點(diǎn)是Scharr 濾波器權(quán)值更大,其中心元素占的權(quán)重更重,相當(dāng)于使用較小標(biāo)準(zhǔn)差的高斯函數(shù)進(jìn)行濾波,這使其對圖像中邊緣的響應(yīng)更為敏感。
式中:Gx——水平方向的濾波器;
Gy——垂直方向上的濾波器,分別提取水平梯度和垂直梯度。
將處理后的圖像以超參數(shù)為0.5的條件下與原圖進(jìn)行疊加融合(Mixup)數(shù)據(jù)增強(qiáng),以強(qiáng)化邊緣特征。
2.3 YOLOv5卷積神經(jīng)網(wǎng)絡(luò)
考慮到貨車軸型識別的實(shí)時(shí)性與準(zhǔn)確性,本文使用了YOLOv5[8]作為目標(biāo)檢測的骨干網(wǎng)絡(luò)。網(wǎng)絡(luò)結(jié)構(gòu)明細(xì)如圖2所示。
YOLOv5框架包括骨干網(wǎng)絡(luò)(特征金字塔骨干網(wǎng)絡(luò))、頸部網(wǎng)絡(luò)(通道增強(qiáng)模塊和自適應(yīng)特征池化)和檢測網(wǎng)絡(luò)(全連接層和分類層)三部分。骨干網(wǎng)絡(luò)的作用是通過多次卷積和合并從輸入圖像中提取特征圖。在骨干網(wǎng)絡(luò)中生成三層的特征圖,尺寸分別為:80 px×80 px、40 px×40 px、20 px×20 px。頸部網(wǎng)絡(luò)主要融合骨干網(wǎng)絡(luò)生成的不同尺度的特征圖,輸出新的增強(qiáng)特征圖,以獲得更多的上下文信息,減少信息損失。在檢測網(wǎng)絡(luò)中輸出物體的類別和邊界框的坐標(biāo)信息,通過在原始輸入圖像中生成和標(biāo)記這些預(yù)測邊界框和類別信息,最終實(shí)現(xiàn)車身車輪的檢測,從而得出輪軸識別結(jié)果。
3 試驗(yàn)及其結(jié)果
3.1 試驗(yàn)環(huán)境與訓(xùn)練參數(shù)設(shè)置
在訓(xùn)練階段,本文對輸入的貨車圖像使用的數(shù)據(jù)增強(qiáng)策略包括水平翻轉(zhuǎn),隨機(jī)剪裁。具體而言,本文以概率為0.5進(jìn)行水平翻轉(zhuǎn),并且為特征提取骨干提供640 px×640 px×3 px大小的隨機(jī)剪裁圖像子塊。網(wǎng)絡(luò)的訓(xùn)練以批次為8的條件下進(jìn)行,并且,網(wǎng)絡(luò)使用SGD作為優(yōu)化器的條件下,初始學(xué)習(xí)率設(shè)置為1×10-2,權(quán)重衰減為5×10-4,學(xué)習(xí)率下降因子為0.2。在Pytorch中實(shí)現(xiàn)提出的模型算法,并使用單個NVIDIA GeForce Tesla V100 GPU進(jìn)行了100個周期的訓(xùn)練。
在測試階段,對圖像進(jìn)行測試時(shí)增強(qiáng)。對每張輸入的圖像以概率為0.5做水平翻轉(zhuǎn)、以10%的調(diào)整閾值做對比度調(diào)整。從而得出多個子圖像。該輸入圖像的最終輪軸識別結(jié)果通過一定權(quán)重由各個子圖像的識別結(jié)果得到。
本文對所采集的貨車圖像,以隨機(jī)的方式分為訓(xùn)練集(80%的圖像)和測試集(20%的圖像)。在網(wǎng)絡(luò)訓(xùn)練的期間,只可見訓(xùn)練集數(shù)據(jù)。網(wǎng)絡(luò)在ImageNet預(yù)訓(xùn)練的條件下,根據(jù)訓(xùn)練情況確定最后模型加載的權(quán)重,并使用測試集來評估最終性能。
3.2 試驗(yàn)結(jié)果分析
針對該軸型識別方法,通過2個目標(biāo)衡量檢測方法的性能,其中一項(xiàng)是檢測時(shí)間;另一項(xiàng)是模型的檢測準(zhǔn)確度。檢測時(shí)間通過量化單張圖片處理的時(shí)長得出,檢測準(zhǔn)確率則需要引入平均精度的概念。在本文所提出的軸型識別方法中,所需檢測目標(biāo)類別為貨車的軸數(shù)。整體網(wǎng)絡(luò)的參數(shù)量、模型計(jì)算復(fù)雜度(GFLOPs)和檢測時(shí)間三項(xiàng)的測試結(jié)果如表1所示,滿足實(shí)時(shí)識別的要求。
針對使用了邊緣預(yù)加重以及圖像標(biāo)準(zhǔn)化的預(yù)處理方法進(jìn)行訓(xùn)練與不使用的訓(xùn)練方式,本文也做了消融實(shí)驗(yàn)對比,明細(xì)如表2所示。
在使用了邊緣預(yù)加重以及圖像標(biāo)準(zhǔn)化的預(yù)處理方法后,所消耗的訓(xùn)練時(shí)間增加了5%,計(jì)算復(fù)雜度增加了5.7%,檢測時(shí)間增加了3.5%,平均精度值提高了1.52%。預(yù)處理策略在不增加過多網(wǎng)絡(luò)負(fù)擔(dān)的情況下提升了檢測精度,滿足了貨車軸型識別的高要求。
4 生產(chǎn)環(huán)境試運(yùn)行結(jié)果
目前在羅城收費(fèi)站入口治超車道已經(jīng)布設(shè)了該輪軸識別設(shè)備2臺。試運(yùn)行日期為2023-11-01至2023-01-08。通行貨車1 771輛,共10輛貨車識別錯誤。識別錯誤項(xiàng)有掃路車專項(xiàng)二識別成貨二、水霧影響車身相機(jī),皮卡識別成客一、六軸車因光線干擾導(dǎo)致圖像拼接異常問題識別成五軸等,軸型識別整體達(dá)到了99.43%的準(zhǔn)確率。
5 結(jié)語
本文針對貨車軸型識別這一實(shí)際問題,提出了一種基于YOLOv5深度神經(jīng)網(wǎng)絡(luò)的貨車軸型識別方法。本文方法在實(shí)驗(yàn)室環(huán)境以及生產(chǎn)環(huán)境上進(jìn)行了驗(yàn)證,結(jié)果表明,該方法準(zhǔn)確率高,滿足實(shí)時(shí)檢測要求,具有良好的精度和穩(wěn)定性。
參考文獻(xiàn)
[1]GB 1589-2016,汽車、掛車及汽車列車外廓尺寸、軸荷及質(zhì)量限值[S].
[2]張 念,張 亮.基于深度學(xué)習(xí)的公路貨車車型識別[J].交通運(yùn)輸工程學(xué)報(bào),2023,23(1):267-279.
[3]李子龍,薛林軍,韓莉潔.基于激光雷達(dá)的動態(tài)汽車衡車輛軸型識別方法研究[J].衡器,2022,51(12):17-21.
[4]向 濤.基于壓電傳感器的路面移動荷載識別[D].杭州:浙江大學(xué),2021.
[5]戰(zhàn)蔭澤,張立東,秦 穎.基于激光雷達(dá)與紅外圖像融合的車輛目標(biāo)識別算法[J].激光與紅外,2021,51(9):1 238-1 242.
[6]He K,Zhang X,Ren S,et al.Deep residual learning for image recognition[C].In Proceedings of the IEEE conference on computer vision and pattern recognition,2016.
[7]李浩誼,馬春庭.基于改進(jìn)的Scharr算法的海上艦船圖像邊緣檢測[J].艦船電子工程,2019,39(3):103-106.
[8]Liu S,Qi L,Qin H,et al.Path aggregation network for instance segmentation[C].In Proceedings of the IEEE conference on computer vision and pattern recognition,2018.
收稿日期:2024-03-25
作者簡介:鄭海軍(1977—),工程師,主要從事交通機(jī)電管理工作。