張長倫 張翠文
摘? 要:隨著機(jī)動化的成熟,更多的行人、車輛甚至天氣等因素導(dǎo)致城市交通場景日趨復(fù)雜,且智能化的發(fā)展使得無人駕駛技術(shù)快速發(fā)展。更好地監(jiān)測城市道路交通和完善無人駕駛場景歸結(jié)為提高目標(biāo)檢測算法精準(zhǔn)度問題。本文為了更準(zhǔn)確地檢測真實(shí)場景下的城市道路交通圖片,首先利用非局部均值濾波(NLM)去除圖片中的噪聲,突出目標(biāo)信息和位置,然后利用YOLOv5算法對交通圖片進(jìn)行目標(biāo)檢測,得到了更加精準(zhǔn)的定位效果。
關(guān)鍵詞:目標(biāo)檢測? 交通場景? YOLOv5? 非局部均值濾波
中圖分類號:TP391.4 ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2021)03(a)-0172-03
Research on Urban Traffic Object Detection Based on YOLOv5
ZHANG Changlun? ZHANG Cuiwen
(College of Science, Beijing University of Civil Engineering and Architecture, Beijing, 102600 China)
Abstract: With the maturity of motorization, more pedestrian, vehicle and even weather factors lead to the increasingly complex city traffic scene, and the development of intelligent technology makes the rapid development of driverless technology. Better monitoring of city road traffic and improving the unmanned driving scene can be attributed to the problem of improving the accuracy of object detection algorithm. In this paper, in order to more accurately detect the city road traffic images in the real scene, we first use the non-local mean filter (NLM) to remove the noise in the image, highlight the object information and location, and then use the YOLOv5 algorithm to detect the traffic image, and get a more accurate positioning effect.
Key Word: Object detection; Traffic scene; YOLOv5; Non-local mean filtering
近年來人工智能[1]的發(fā)展推動了機(jī)動車無人駕駛技術(shù)的出現(xiàn),但無人駕駛技術(shù)需要感知周圍復(fù)雜的交通場景,如行人、車輛,信號燈等。并且智能城市化交通監(jiān)測系統(tǒng)同樣要精準(zhǔn)地識別與定位目標(biāo),這就需要成熟的目標(biāo)檢測技術(shù)作為算法支撐[2]。
為了提升目標(biāo)檢測的速度,使其能到達(dá)實(shí)時(shí)的效果,Joseph于2016年提出YOLO[3]算法,處理圖片速度為45張/s,是首個(gè)端到端的目標(biāo)檢測算法。將特征提取和分類識別融入一個(gè)網(wǎng)絡(luò),成為一階段算法。但由于沒有兩階段目標(biāo)檢測算法的提前設(shè)置錨框,所以精度遜色于FasterR-CNN,所以該作者在同年提出YOLOv2[4],又于2018年提出YOLOv3[5],將兩階段算法中預(yù)設(shè)錨框的想法融入YOLO中,使得算法在速度達(dá)到實(shí)時(shí)效果的同時(shí)精度超過兩階段算法。不管是交通視頻的監(jiān)控,還是自動駕駛需要感應(yīng)周圍的復(fù)雜路況,都需要準(zhǔn)確的目標(biāo)檢測精度與實(shí)時(shí)的速度,YOLOv5可以進(jìn)一步完善監(jiān)測系統(tǒng)與自動駕駛。
城市道路的監(jiān)測圖片容易受到天氣、亮度等因素的影響導(dǎo)致不清晰,進(jìn)而影響目標(biāo)檢測的準(zhǔn)確性。圖像去噪技術(shù)是處理圖片的重要手段[6]。本文為了更好地識別城市交通場景圖片,首先利用非局部均值去噪方法去除圖片中的噪聲,然后利用YOLOv5目標(biāo)檢測算法識別圖片中的目標(biāo)并且進(jìn)行定位。本文第一部分對目標(biāo)檢測與圖片去噪方法進(jìn)行簡述,第二部分對YOLOv5與非局部均值濾波算法進(jìn)行概述,第三部分展示實(shí)驗(yàn)效果。
1? 算法簡介
1.1 非局部均值濾波去噪
非局部均值濾波是為了去除圖片中的噪聲,使得圖片達(dá)到平滑效果,利用高斯加權(quán)平均并根據(jù)圖像中其他點(diǎn)的像素值與某點(diǎn)像素值的相似度求得權(quán)重,然后計(jì)算去噪后每個(gè)點(diǎn)新的權(quán)重值。將圖像中的像素點(diǎn)集合設(shè)置為,i表示圖像中的像素位置,表示該像素位置的像素值,v(i)表示整張圖像的位置集合。非局部均值濾波去噪公式為:
(1)
其中表示去噪后的每個(gè)像素值,j表示集合I中除了像素i外的其他像素值,v(j)為圖片位置的像素值,表示其他像素點(diǎn)對像素點(diǎn)i的權(quán)重。是以像素j為中心的7×7大小的矩形塊與以像素i為中心的7×7矩陣塊的歐式距離做高斯加權(quán)平均計(jì)算得到,公式為:
(2)
(3)
其中分別為像素i,j的7×7的矩陣塊,表示兩個(gè)矩陣塊之間的歐式距離,距離越大,代表兩個(gè)矩陣塊之間的相似度越小,表示衰減因子,h越小則代表j對的影響越小,z(i)為歸一化因子。而像素值的比較一般不在全圖進(jìn)行,而是選取一個(gè)搜索區(qū)域,大小設(shè)置為21×21。
1.2 YOLOv5
YOLOv5推出v5x、v5l、v5m、v5s四個(gè)模型,其中最小的v5s模型只有27MB,僅是245MB的YOLOv4模型的11%,速度達(dá)到140張/s,是目前目標(biāo)檢測中速度最快的算法,且精度與YOLOv4模型相當(dāng)。模型相對于原始的YOLOv3與YOLOv4框架改進(jìn)不大,在數(shù)據(jù)增強(qiáng)方面與選擇損失函數(shù)、選擇激活函數(shù)方面進(jìn)行了改進(jìn)。
數(shù)據(jù)增強(qiáng):為了提高數(shù)據(jù)量與數(shù)據(jù)多樣性,并且將現(xiàn)有數(shù)據(jù)集取得更為廣泛的應(yīng)用,目標(biāo)檢測最開始會對數(shù)據(jù)集進(jìn)行增強(qiáng)處理。與YOLOv4相同,YOLOv5也使用了馬賽克增強(qiáng)方法(Mosaic),將四張圖片按一定比例組合為一張圖片,提高了目標(biāo)檢測對于小目標(biāo)的檢測效果。
自適應(yīng)學(xué)習(xí)錨框:YOLOv3與YOLOv4相同,在進(jìn)行目標(biāo)檢測前學(xué)習(xí)數(shù)據(jù)集的真實(shí)框從而進(jìn)行K-means聚類,學(xué)得錨框大小的初始值,而對于不同的驗(yàn)證集,使用的初始錨框預(yù)設(shè)值相同。而YOLOv5在每次進(jìn)行檢測前,都自適應(yīng)的學(xué)習(xí)初始錨框大小。所以YOLOv5可以更好地適應(yīng)不同的數(shù)據(jù)集。
激活函數(shù):YOLOv5選擇Leaky ReLU與Sigmoid作為激活函數(shù),取代了YOLOv4中的Swish的函數(shù)。
損失函數(shù):YOLOv4選擇CIOU作為坐標(biāo)值損失函數(shù),而YOLOv5選擇GIOU作為坐標(biāo)值損失函數(shù)。
2? 實(shí)現(xiàn)效果與分析
2.1 實(shí)驗(yàn)平臺及參數(shù)設(shè)置
為了檢測實(shí)驗(yàn)效果,在服務(wù)器配置實(shí)驗(yàn)環(huán)境,具體配置如表1所示。
2.2 實(shí)現(xiàn)效果與分析
2.2.1 非局部均值濾波實(shí)驗(yàn)效果圖
將原始圖像經(jīng)過非局部均值濾波操作后的圖像與原始圖像對比如圖1(d)、(e)、(f)所示。
由圖1可知經(jīng)過NLM后,圖像變得更加平滑,對于雨水明顯的圖片,也將雨水很好地處理掉,使得圖片中的目標(biāo)物體更加突出。
3? 結(jié)語
本文對非局部均值濾波與YOLOv5進(jìn)行概述,提出將這兩種方法應(yīng)用于城市交通圖像的目標(biāo)檢測中。首先對原始圖片經(jīng)過非局部均值濾波去除由于天氣原因造成的噪聲,然后利用YOLOv5算法對過濾后的圖片進(jìn)行檢測,并與未經(jīng)過NLM操作的圖像進(jìn)行對比,最后得出經(jīng)過去噪后再進(jìn)行檢測可以得到更好的定位效果與精度。
參考文獻(xiàn)
[1] 崔雍浩,商聰,陳鍶奇,等.人工智能綜述:AI的發(fā)展[J].無線電通信技術(shù),2019,45(3):5-11.
[2] REN S, He K, GIRSHICK R, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6):1137-1149.
[3] REDMON J, DIVVALA S, GIRSHICK R, et al. You Only Look Once: Unified,Real-Time Object Detection [OL]. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016,arXiv: 1506.02640, 2016.
[4] REDMON J, FARHADI A. YOLO9000: Better, Faster, Stronger[C]// IEEE Conference on Computer Vision & Pattern Recognition. IEEE, 2017:6517-6525.
[5] REDMON J, FARHADI A. YOLOv3: An Incremental Improvement[J]. arXiv e-prints, 2018.
[6] 唐鑒波,趙波,陳國樑,等.基于均值濾波的霧霾圖像快速復(fù)原算法[J].電子設(shè)計(jì)工程,2020,28(1):189-193.