摘" 要:作為城市地下管網(wǎng)系統(tǒng)的關(guān)鍵防護(hù)構(gòu)件,井蓋的安全狀態(tài)直接影響市政設(shè)施運(yùn)維效率與公共安全。針對傳統(tǒng)井蓋安全隱患檢測方法存在效率低、誤報率高等問題,文章提出基于改進(jìn)YOLOv5的智能檢測方法。通過構(gòu)建多尺度特征融合機(jī)制,文章結(jié)合五折交叉驗證法對標(biāo)注數(shù)據(jù)集進(jìn)行模型訓(xùn)練,實現(xiàn)了對破損、移位、缺失等典型安全隱患的精準(zhǔn)識別。實驗結(jié)果表明,改進(jìn)模型在自建井蓋數(shù)據(jù)集上的平均精度(mAP)達(dá)95.2%,相比于YOLOv4模型,精度和檢測速度均有所提升。該算法通過優(yōu)化特征金字塔結(jié)構(gòu)與損失函數(shù),有效增強(qiáng)了復(fù)雜路面場景下的目標(biāo)表征能力,為城市基礎(chǔ)設(shè)施智能化運(yùn)維提供了可靠的技術(shù)支持。
關(guān)鍵詞:井蓋隱患;YOLOv5;目標(biāo)檢測;激活函數(shù)
中圖分類號:TP183;TP39 文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2025)03-0068-06
Research on Intelligent Recognition of Hidden Dangers of Manhole Covers Based on YOLOv5
HUANG Jian, XIANG Siyi
(Xijing University, Xi'an" 710123, China)
Abstract: As a key protective component of the urban underground pipe network system, the safety status of manhole covers directly affects the operation and maintenance efficiency and public safety of municipal facilities. To address the inefficiency and high 1 alarm rate of traditional methods for detecting hidden dangers in manhole covers, this paper proposes an intelligent detection method based on improved YOLOv5. By constructing a multi-scale feature fusion mechanism, this paper combines the 5-fold cross-validation method to train the model of the labeled dataset, and realizes the accurate identification of typical safety hazards such as breakage, displacement, loss, and so on. The experimental results show that the mean Average Precision (mAP) of the improved model on the self-constructed manhole cover dataset is 95.2%. Compared with the YOLOv4 model, the accuracy and detection speed are improved. By optimizing the Feature Pyramid Network structure and loss function, the algorithm effectively enhances the target representation ability in complex road scenarios, providing reliable technical support for intelligent operation and maintenance of urban infrastructure.
Keywords: hidden danger of manhole cover; YOLOv5; object detection; activation function
0" 引" 言
隨著基礎(chǔ)設(shè)施建設(shè)的高速發(fā)展,通信、電力、排水等各類地下管線設(shè)施日益增加,使得對各類井蓋的巡檢、養(yǎng)護(hù)、維修等工作量不斷增長?,F(xiàn)實生活中井蓋分布廣泛又碎片化,常處于室外復(fù)雜環(huán)境,風(fēng)吹雨淋,容易被損壞或移位,給車輛、行人、光纜設(shè)施等帶來很大的風(fēng)險。由于井蓋數(shù)量龐大、分布廣泛且無法主動上報其狀態(tài),對井蓋的隱患整改工作十分重要。井蓋會存在損壞、凸起、缺失、井圈問題等隱患狀態(tài),存在隱患的井蓋不僅影響了城市的整潔,還對公共安全構(gòu)成了極大的威脅,現(xiàn)有的一些研究通過井蓋內(nèi)安裝傳感器實現(xiàn)智能井蓋,施工維護(hù)成本太高,無法全面推廣。為了解決以上問題,考慮引入AI手段實現(xiàn)井蓋狀態(tài)的快速、準(zhǔn)確識別,提高審核管理人員工作效率和質(zhì)量。
孔天宇等[1]提出了一種路面井蓋病害檢測模型AT-YOLO,實現(xiàn)了街景影像中路面井蓋破損、塌陷的快速檢測。但其沒有對井蓋丟失、沒有蓋等安全隱患進(jìn)行檢測,未能很好地解決路面井蓋安全隱患。陳欣瑞等[2]提出一種利用立體深度攝像機(jī)和MGB-YOLO模型檢測道路井蓋的方法。該模型是通過使用MobileNetV3、全球注意機(jī)制(GAM)、YOLOv5s開發(fā),在檢測精度和模型效率之間取得平衡。
近年來,隨著深度學(xué)習(xí)的不斷發(fā)展,目標(biāo)檢測技術(shù)也取得了許多新進(jìn)展。例如,多尺度特征融合技術(shù)通過將不同尺度的特征進(jìn)行融合,提高了對小目標(biāo)和遮擋目標(biāo)的檢測性能。注意力機(jī)制的應(yīng)用則使得模型能夠更專注于關(guān)鍵區(qū)域,進(jìn)一步提高檢測的準(zhǔn)確性。此外,輕量級網(wǎng)絡(luò)結(jié)構(gòu)的發(fā)展也使得目標(biāo)檢測算法能夠在保持一定性能的同時,降低計算復(fù)雜度和內(nèi)存消耗,從而適用于移動設(shè)備和實時應(yīng)用場景。
基于深度學(xué)習(xí)的目標(biāo)檢測算法通??梢苑譃閮深悾簝呻A段檢測器和一階段檢測器。兩階段檢測器,如Faster R-CNN,首先生成一系列候選區(qū)域,然后對這些區(qū)域進(jìn)行分類和位置回歸。這種方法在準(zhǔn)確性和定位精度上通常較高,但速度相對較慢。而一階段檢測器,如YOLO和SSD,則直接對圖像進(jìn)行密集采樣,并在每個位置上預(yù)測目標(biāo)的類別和邊界框。這種方法速度更快,但可能在某些情況下犧牲一定的準(zhǔn)確性。
YOLO(You Only Look Once)是一種目標(biāo)檢測算法,其設(shè)計理念是只需要瀏覽一次圖像就可以識別出圖中的物體的類別和位置。近年來,隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,YOLO系列算法作為最具代表性的方法之一,以其高效、快速的特點受到了廣泛關(guān)注。YOLOv1[3]使用1×1卷積層和3×3卷積層替代Inception Module。整個檢測網(wǎng)絡(luò)包括24個卷積層和2個全連接層,其中卷積層用來提取圖像特征,全連接層用來預(yù)測圖像位置和類別概率值。YOLOv2[4]在YOLOv1的基礎(chǔ)上進(jìn)行了改進(jìn),使用了多尺度的預(yù)測,以更好地處理小物體和重疊目標(biāo)。此外,它還引入了Anchor Boxes的概念,通過預(yù)定義的一組Anchor Boxes進(jìn)行目標(biāo)的位置預(yù)測,進(jìn)一步提升了檢測的準(zhǔn)確率。YOLOv3[5]在YOLOv2的基礎(chǔ)上進(jìn)一步提升了檢測的準(zhǔn)確率和實時性,滿足了更多實際應(yīng)用的需求。YOLOv4[6]在保持高速度的同時,顯著提高了目標(biāo)檢測的準(zhǔn)確性,結(jié)合了多種先進(jìn)的目標(biāo)檢測技術(shù)和優(yōu)化策略,使得YOLOv4能夠有效地提取和利用多尺度的特征信息,從而提高檢測性能。YOLOv5是YOLO系列中另一個具有里程碑意義的版本。它在保持YOLO系列算法快速、準(zhǔn)確的特點的同時,更加注重模型的易用性和擴(kuò)展性。YOLOv5提供了多種不同大小和復(fù)雜度的模型供用戶選擇,以適應(yīng)不同場景的需求。在性能上YOLOv5通過引入自適應(yīng)錨框、自適應(yīng)圖片大小等技術(shù),進(jìn)一步提升了檢測的準(zhǔn)確性和魯棒性。
因為YOLO有出色的目標(biāo)檢測功能,該算法可以應(yīng)用到以下領(lǐng)域:
1)安防監(jiān)控領(lǐng)域。實時監(jiān)控與事件預(yù)警:YOLO算法能夠?qū)ΡO(jiān)控視頻中的目標(biāo)進(jìn)行實時檢測,包括人員、車輛、動物等各類物體。例如在城市的安防監(jiān)控系統(tǒng)中,它可以快速識別出在特定區(qū)域內(nèi)出現(xiàn)的可疑人員,或者檢測到未經(jīng)授權(quán)進(jìn)入的車輛,及時發(fā)出警報。交通監(jiān)控與管理:用于檢測交通流量,統(tǒng)計不同類型車輛的數(shù)量,識別交通違法行為,如車輛闖紅燈、逆行、超速等情況。同時,也可以用于監(jiān)測道路上行人的行為,保障交通安全。
2)自動駕駛領(lǐng)域。自動駕駛汽車需要對周圍環(huán)境進(jìn)行精確感知,YOLO可以幫助檢測道路上的各種障礙物,包括其他車輛、行人、自行車、交通標(biāo)志和信號燈等。例如,在復(fù)雜的城市道路環(huán)境中,準(zhǔn)確識別出正在過馬路的行人或者突然出現(xiàn)的非機(jī)動車輛,為車輛的決策系統(tǒng)提供關(guān)鍵信息。
3)工業(yè)檢測領(lǐng)域。產(chǎn)品質(zhì)量檢測:在工業(yè)生產(chǎn)線上,用于檢測產(chǎn)品的外觀缺陷和尺寸精度。例如,在電子元件生產(chǎn)中,檢測芯片表面是否有劃痕、引腳是否完整;在機(jī)械零件制造中,測量零件的尺寸是否符合設(shè)計要求,對不合格產(chǎn)品進(jìn)行篩選。裝配檢測:用于檢查產(chǎn)品部件的裝配是否正確。比如在汽車制造過程中,檢測零部件是否安裝到位,如輪胎是否正確安裝、座椅是否安裝牢固等,提高裝配質(zhì)量和生產(chǎn)效率。
1" YOLOv5模型
YOLOv5是一個目標(biāo)檢測模型其架構(gòu)如圖1所示,主要包括以下幾個部分:
1)Backbone。這部分主要用于特征提取。它通常是一系列卷積層、批量歸一化層和激活函數(shù)的組合,通過逐層提取圖像的特征,將原始的圖像數(shù)據(jù)轉(zhuǎn)化為高層次的特征表示。
2)Neck。在Backbone之后,通常會有一些額外的網(wǎng)絡(luò)層用于進(jìn)一步融合和增強(qiáng)特征。這部分可能包括FPN(Feature Pyramid Network)或PANet(Path Aggregation Network)等結(jié)構(gòu),用于將不同尺度的特征進(jìn)行融合,以提高模型對不同大小目標(biāo)的檢測能力。
3)Head。這部分負(fù)責(zé)根據(jù)提取的特征進(jìn)行目標(biāo)檢測。它通常包括一些卷積層,用于將特征圖轉(zhuǎn)化為目標(biāo)的邊界框和類別預(yù)測。YOLOv5采用了一種直接預(yù)測邊界框和類別概率的方式,而不是像一些其他方法那樣采用候選區(qū)域生成和分類的方式。
在YOLOv5的架構(gòu)中,除了上述提到的Backbone、Neck和Head部分,還有一些其他的組件和特性,使其成為一個高效且準(zhǔn)確的目標(biāo)檢測模型:
1)YOLOv5采用了深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為基礎(chǔ),通過堆疊多個卷積層來提取圖像中的特征。這些卷積層使用不同大小的卷積核來捕捉不同尺度的特征信息,從而能夠識別出不同大小的目標(biāo)。
2)YOLOv5引入了殘差連接(Residual Connections)的概念,通過跳過某些層來直接連接輸入和輸出,從而緩解深度神經(jīng)網(wǎng)絡(luò)中的梯度消失和表示瓶頸問題。這種連接方式有助于網(wǎng)絡(luò)更好地學(xué)習(xí)特征的表示,提高模型的性能。
3)YOLOv5還采用了多尺度預(yù)測(Multi-Scale Prediction)的方法,通過在不同尺度的特征圖上進(jìn)行目標(biāo)檢測,從而提高了模型對不同大小目標(biāo)的檢測能力。這種多尺度預(yù)測的方式可以更好地捕捉圖像中的上下文信息,提高檢測的準(zhǔn)確性。
4)YOLOv5還使用了數(shù)據(jù)增強(qiáng)(Data Augment-ation)技術(shù)來擴(kuò)展訓(xùn)練數(shù)據(jù)集,增加模型的泛化能力。通過隨機(jī)變換輸入圖像的亮度、對比度、飽和度等屬性,以及進(jìn)行裁剪、縮放等操作,可以生成更多的訓(xùn)練樣本,使得模型能夠更好地適應(yīng)不同的場景和變化。
5)YOLOv5在訓(xùn)練過程中使用了優(yōu)化算法和損失函數(shù)來指導(dǎo)模型的學(xué)習(xí)。通過不斷地迭代和優(yōu)化,模型能夠逐漸提高目標(biāo)檢測的準(zhǔn)確性和速度。
總之,YOLOv5是一個基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測模型,通過引入殘差連接、多尺度預(yù)測和數(shù)據(jù)增強(qiáng)等技術(shù),提高了模型的性能和泛化能力。這些組件和特性的結(jié)合使得YOLOv5成為一個高效且準(zhǔn)確的目標(biāo)檢測框架,適用于各種實際應(yīng)用場景。
2" 實驗及結(jié)果分析
2.1" 數(shù)據(jù)集
研究團(tuán)隊使用相機(jī)、手機(jī)等設(shè)備,在城市、鄉(xiāng)鎮(zhèn)街道或者路面等有井蓋存在的區(qū)域進(jìn)行實地拍攝。目前已收集到各類井蓋圖像2 500多張,包含有井蓋完好、缺失、破損、未蓋等各種情況,如圖2所示。
本文用Labelimg對圖片進(jìn)行標(biāo)注[7],方便用YOLOv5進(jìn)行檢測,如圖3所示。
圖3中,根據(jù)井蓋的不同情況,分別將其標(biāo)注為improperly closed manhole、lose、good、broke、uncovered,依次代表“井圈問題”“井蓋缺失”“井蓋完好”“井蓋破損”“井蓋未蓋”等情況[8-10]。對于2 500多個圖片,本文按照5折交叉法進(jìn)行劃分,將其劃分為訓(xùn)練集和測試。其中訓(xùn)練集占比為80%。劃分好的數(shù)據(jù)集放到指定文件夾中。
2.2" 訓(xùn)練及結(jié)果
訓(xùn)練時,首先修改配置文件,在models文件夾下的相應(yīng)模型配置文件(.yaml)中,可以修改一些參數(shù),如類別數(shù)量(nc = 5),使其與數(shù)據(jù)集中的目標(biāo)類別數(shù)量相匹配。還可以調(diào)整模型的一些超參數(shù),如網(wǎng)絡(luò)的深度乘數(shù)(depth_multiple)和寬度乘數(shù)(width_multiple),這些參數(shù)可以控制模型的大小和復(fù)雜度。然后啟動訓(xùn)練腳本:通過運(yùn)行train.py腳本來啟動訓(xùn)練過程。在命令行中可以指定一些訓(xùn)練參數(shù),如img_size(輸入圖像的大?。atch_size(每次迭代使用的圖像數(shù)量)、epoch(訓(xùn)練的輪數(shù))等。本次井蓋圖像訓(xùn)練中,設(shè)置img_size = 640,batch_size = 16,epoch = 100。實驗中使用的計算機(jī)配置如表1所示。
本文用YOLOv5架構(gòu)訓(xùn)練標(biāo)注好的井蓋數(shù)據(jù)集,經(jīng)過300輪訓(xùn)練,本文得到Precision-Recall、Recall、loss曲線等,如圖4至圖6所示[11]。
從以上曲線中可以看出,經(jīng)過訓(xùn)練后,能夠準(zhǔn)確識別出各種井蓋狀態(tài),精度可達(dá)0.95以上;同時cls_loss、box_loss、obj_loss等都下降到了0.01以下。
2.3" 測試及結(jié)果
首先,讀取圖像:使用OpenCV等庫讀取單張測試圖像,將其轉(zhuǎn)換為模型所需的格式。同時調(diào)整維度順序和大小以匹配模型輸入。
然后進(jìn)行推理:將處理后的圖像張量輸入到加載好的模型中,通過model(img_tensor)這樣的方式得到模型的輸出。模型輸出包含了檢測到的目標(biāo)的類別、位置(邊界框坐標(biāo))和置信度等信息。
最后解析輸出:根據(jù)模型輸出的格式(通常是一個包含邊界框坐標(biāo)、類別置信度等信息的張量),使用非極大值抑制(NMS)等方法來篩選出最有可能的目標(biāo)檢測結(jié)果。例如,NMS會根據(jù)邊界框的重疊程度和置信度,去除重疊度過高的冗余框,保留每個目標(biāo)最準(zhǔn)確的邊界框。
用上述方法對測試集的圖像進(jìn)行預(yù)測,得到的結(jié)果如圖7所示。
從圖7可以看出,當(dāng)用最優(yōu)模型對井蓋圖像進(jìn)行預(yù)測時,其目標(biāo)檢測的精度達(dá)到了0.87以上,預(yù)測單個圖像花費(fèi)大約0.2 s。
2.4" 結(jié)果分析
YOLOv5是一種先進(jìn)的目標(biāo)檢測算法,其性能評估至關(guān)重要,以了解其準(zhǔn)確性、速度和魯棒性。以下是YOLOv5的主要評價指標(biāo):
1)平均精度(mAP)。mAP是YOLOv5模型性能評估中最常用的指標(biāo)之一,它衡量模型在不同IoU(交并比)閾值下的平均精度。mAP是通過計算不同類別下的精度-召回率曲線下的面積來得到的。mAP數(shù)值越高表示模型性能越好。在COCO數(shù)據(jù)集上,YOLOv5的mAP可以達(dá)到50%左右。對于每個類別,計算每個檢測框的平均精度(AP),然后對所有類別的AP求平均得到mAP:
mAP = (AP1+AP2+AP3+AP4+AP5)/5" " " (1)
式中,mAP表示平均精度,AP1、AP2、AP3、AP4、AP5分別表示5個類別精度。
2)交并比(IoU)。IoU是衡量預(yù)測框與真實目標(biāo)框重疊程度的指標(biāo),計算公式為(檢測框與真實目標(biāo)框的交集面積)/(檢測框與真實目標(biāo)框的并集面積)。IoU閾值決定了檢測框與真實目標(biāo)框的重疊程度。較高的IoU閾值會導(dǎo)致更嚴(yán)格的匹配,從而降低mAP。計算式為:
(2)
式中,表示兩個區(qū)域的交集,表示兩個區(qū)域的并集。
3)精度(Precision)。精度(P)是指模型預(yù)測為正例的樣本中,真正為正例的樣本數(shù)量占所有預(yù)測為正例的樣本數(shù)量的比例。精度反映了模型對正例的識別能力。計算式為:
P = TP/(TP+FP) (3)
式中,TP表示真正例,F(xiàn)P表示假正例。
4)召回率(Recall)。召回率(R)是指模型正確預(yù)測為正例的樣本數(shù)量占所有真正為正例的樣本數(shù)量的比例。召回率反映了模型對正例的覆蓋能力。
R = TP/(TP+FN) (4)
另外,本文也用YOLOv4對井蓋數(shù)據(jù)集進(jìn)行了訓(xùn)練和預(yù)測。通常,YOLOv5在模型架構(gòu)上要優(yōu)于YOLOv4,更加注重實用性,通過減小模型的復(fù)雜度并提高實時性,從而實現(xiàn)更快、更有效的目標(biāo)檢測。在模型中加入新的層,例如殘差塊,以提高模型的泛化能力。YOLOv5在性能方面也優(yōu)于YOLOv4,YOLOv5比YOLOv4快很多,如YOLOv5的FPS可以達(dá)到140幀/秒,而YOLOv4只有50幀/秒左右,YOLOv5比YOLOv4快180%左右。這樣,YOLOv5相較于YOLOv4在精確率和召回率上均有顯著提升,YOLOv5表現(xiàn)更為穩(wěn)定。
完成后,本文對其性能評價指標(biāo)進(jìn)行比對。得到如表2所示結(jié)果。
通過以上的數(shù)據(jù)比較可以看出,在相同的數(shù)據(jù)集下,電腦配置和迭代次數(shù)都相同的情況下,YOLOv5模型訓(xùn)練的速度更快,精度更高。訓(xùn)練后生成的模型容量更小,預(yù)測所花費(fèi)的時間更少,能更好地進(jìn)行目標(biāo)檢測。
3" 結(jié)" 論
本文采用YOLOv5模型對井蓋數(shù)據(jù)集進(jìn)行了目標(biāo)檢測。綜合以上研究過程,可得到訓(xùn)練后得到的最優(yōu)模型能夠快速、準(zhǔn)確檢測各種類型的井蓋圖像。準(zhǔn)確識別出各種有安全隱患的井蓋。相比于YOLOv4模型具有檢測精度高、速度更快。該方法可推廣應(yīng)用到其他目標(biāo)檢測領(lǐng)域。
參考文獻(xiàn):
[1] 孔天宇,戴激光.改進(jìn)YOLOv5的路面井蓋病害檢測 [J].遙感信息,2023,38(3):40-46.
[2] 陳欣瑞,周洋,趙屹濤,等.基于改進(jìn)YOLOv5的移動端螺栓缺失檢測方法 [J].現(xiàn)代制造工程,2022(11):108-114+143.
[3] 朱久牛,李立明,柴曉冬,等.基于改進(jìn)YOLOv5算法的地鐵車輛軸箱蓋螺栓定位方法研究 [J].智能計算機(jī)與應(yīng)用,2023,13(10):29-34.
[4] 王文勝,年誠旭,張超,等.基于YOLOv5模型的非住宅區(qū)自動垃圾分類箱設(shè)計 [J].環(huán)境工程,2022,40(3):159-165.
[5] 雷俊華.基于改進(jìn)YOLOv5s的復(fù)雜背景下垃圾檢測系統(tǒng)設(shè)計與實現(xiàn) [D].武漢:中南財經(jīng)政法大學(xué),2023.
[6] 吳送英,劉林芽,江家明,等.復(fù)雜背景下鐵路扣件的改進(jìn)YOLOv5s檢測算法 [J].中國鐵道科學(xué),2023,44(3):53-63.
[7] 項融融,李博,趙橋.基于改進(jìn)YOLOv5s的口罩佩戴檢測算法 [J].國外電子測量技術(shù),2022,41(7):39-44.
[8] 惠康華,劉暢.基于YOLO5Face重分布的小尺度人臉檢測方法 [J].計算機(jī)仿真,2024,41(3):206-213.
[9] 林剛,魏欣,劉春生,等.基于區(qū)域劃分和YOLO5的日用陶瓷表面缺陷檢測方法.CN202211193767.1 [P].2023-01-06.
[10] 倪衛(wèi)國,黃曉榮,栗鑫,等.基于YOLO5的無人機(jī)智能火情巡檢系統(tǒng)研究 [J].中國寬帶,2023,19(3):193-195.
[11] 劉寅龍,王杰,曹昂,等.基于YOLOv5s的鋁型材表觀缺陷檢測方法 [J].制造業(yè)自動化,2024,46(1):169-173.
作者簡介:黃健(1973—),男,漢族,陜西富平人,副教授,碩士研究生,研究方向:嵌入式開發(fā)技術(shù)。