陳雷平,段意強,瞿宏愿
1.懷化學(xué)院物電與智能制造學(xué)院,湖南 懷化 418000 2.廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東 惠州 516000 3.國網(wǎng)湖南省電力有限公司水電分公司,湖南 長沙 410004
隨著我國國民經(jīng)濟持續(xù)發(fā)展,電力系統(tǒng)規(guī)模日益龐大,輸電線路的長度不斷增加,輸電線路的缺陷如絕緣子缺陷、R銷缺失以及鳥巢[1-2]等也越來越多,輸電線巡檢工作變得越發(fā)重要。
目前,對于輸電線路缺陷檢測的方法主要在YOLO和Faster R-CNN的基礎(chǔ)上進行改進。例如文獻[3]在YOLOv3的基礎(chǔ)上對網(wǎng)絡(luò)結(jié)構(gòu)進行改進,通過添加SPP[4]模塊和選擇新的激活函數(shù)保證模型檢測精度;文獻[5]在YOLOv4的基礎(chǔ)上,引入了注意力機制、調(diào)整預(yù)設(shè)先驗框 (anchor)值以及修改網(wǎng)絡(luò)損失函數(shù)來改進模型,試驗證明了改進方法能較好地識別絕緣子缺陷;文獻[6]對YOLOv5s金字塔結(jié)構(gòu)進行改進和添加注意力模塊并取得不錯的檢測效果。針對復(fù)雜環(huán)境中輸電線路缺陷檢測精度低,難以有效處理超高分辨率的圖片以及小目標(biāo)檢測等問題,本文提出一種基于改進YOLOv5的輸電線路缺陷檢測方法,主要改進內(nèi)容包括以下幾個方面。
1)采用帶重疊率滑動窗口切圖將超高分辨率的原始圖片分割為低分辨率的小圖片 (chip),縮小目標(biāo)在不同分辨率的圖片差異。
2)利用K-means 聚類算法對訓(xùn)練數(shù)據(jù)進行分析以獲得最佳尺寸的錨框,有效提高模型的泛化能力和定位精度以及加快模型的收斂速度。
3)改進網(wǎng)絡(luò)模型,采用雙向特征金字塔網(wǎng)絡(luò)(bidirectional feature pyramid network,BiFPN)替換原YOLOv5的特征金字塔網(wǎng)絡(luò)(FPN)和路徑聚合網(wǎng)絡(luò)(PAN)結(jié)構(gòu),以實現(xiàn)更加自由的信息交換和特征融合。
4)引入SimAM注意力模塊使網(wǎng)絡(luò)更加關(guān)注待檢測的目標(biāo),來解決復(fù)雜背景對缺陷識別精度的影響。
為了保留圖像細節(jié),無人機圖片為高分辨率圖片。本文采用帶重疊率的滑動窗口切圖方法,為了避免2張小圖之間的一些目標(biāo)正好被分割截斷,在2張小圖之間設(shè)置重疊區(qū)域。
本文利用K-means聚類算法確定先驗框。由于目標(biāo)檢測只關(guān)心先驗框與候選框(box)的交并比,使用IoU作為度量更加合適。通過K-means聚類之后可以得到關(guān)于本論文數(shù)據(jù)集的9個先驗框,部分如下:(53,54),(88,146),(176,128),(418,290)。
YOLOv5版本中YOLOv5x模型采用FPN和PAN結(jié)構(gòu),只考慮了FPN輸出的特征信息,并沒有考慮原始的特征信息,造成在特征融合階段存在特征信息丟失。采用BiFPN[7],即自下而上和自上而下的信息交換,實現(xiàn)更加自由的信息交換和特征融合。此外,BiFPN可在不同尺度上有效的聚合特征信息,從而進一步地提升目標(biāo)檢測的性能。
SimAM[8]是一個簡單、無需參數(shù)的注意力模塊,可推斷特征圖的三維注意力權(quán)重,為了能夠成功地實現(xiàn)注意力,需要估計單個神經(jīng)元的重要性。重要性越高的神經(jīng)元在視覺處理中應(yīng)被賦予更高的優(yōu)先級,通過測量1個目標(biāo)神經(jīng)元和其他神經(jīng)元之間的線性可分離性來尋找重要性高的神經(jīng)元。
本文所用的數(shù)據(jù)集來自國網(wǎng)懷化分公司,采用LabelImg目標(biāo)檢測標(biāo)注工具對圖片進行標(biāo)注,并將絕緣子自爆標(biāo)注為missinsulator,R銷缺失標(biāo)注為cotter,鳥窩標(biāo)注為nest。本文采用帶重疊率滑動窗口切圖,得到640×640分辨率的圖片。
為了說明帶重疊率滑動窗口切圖在處理高分辨率的有效性,本文分別在原始數(shù)據(jù)集(高分辨率圖片)和chip圖片數(shù)據(jù)集(低分辨率圖片)上進行訓(xùn)練。
試驗分別對高分辨率和低分辨率圖片進行對比說明。
首先在原始高分率圖片數(shù)據(jù)集上進行對比試驗。本文提出的Improved YOLOv5x方法相比于原YOLOv5x算法在單個類別下和全部類別下均取得較好的性能。在單個類別下除了絕緣子自爆其余的檢測指標(biāo)效果均有所提升,尤其是R銷丟失檢測效果提升明顯;在全部類別下,Recall提高了3.8%、mAP@0.5提高了2.8%,以及mAP@0.5:0.95提高了4.2%。絕緣子自爆(missinsulator)檢測方面,Improved YOLOv5x方法稍微落后原YOLOv5x算法,可能是引入過多參數(shù)導(dǎo)致模型復(fù)雜度增加,從而出現(xiàn)過擬合的現(xiàn)象。
在分辨率為640×640的圖片數(shù)據(jù)集上進行對比試驗,發(fā)現(xiàn)相比原YOLOv5x算法,Improved YOLOv5x算法無論在單個類別還是全部類別下均取得了較好的性能,且能夠避免一些錯誤的檢測結(jié)果,如圖1所示。
(a)原YOLOv5x檢測結(jié)果 (b)Improved YOLOv5x檢測結(jié)果圖1 不同場景下檢測效果對比
圖2展示了原始高分辨率圖片和切圖預(yù)處理圖片輸入Improved YOLOv5x目標(biāo)檢測模型后的檢測效果,可以看出直接將原始超高分辨率圖片輸入檢測模型會導(dǎo)致較多目標(biāo)無法被正確檢測出來,而采用帶重疊率的滑動窗口切圖預(yù)處理后,可較好地改善這種情況,使大部分缺陷能夠被正確檢測出來。
圖2 原始高分辨率圖片和帶重疊率滑動窗口切圖檢測效果對比
為驗證不同注意力模塊對本文方法的影響。在同一位置上加入SE、CBAM、ECA、SimAM注意力機制的試驗。試驗結(jié)果表明,原YOLOv5x其Precision為91.1%,Recall為70.9,mAP@0.5為75%,mAP@0.5:0.95達到了59.6%,其加入SimAM注意力機制后效果最好,其Precision為95.2%,Recall為75.1,mAP@0.5達到了77.5%,mAP@0.5:0.95達到了61.7%。
本文提出了一種基于改進YOLOv5的輸電線路缺陷檢測方法,旨在解決實際復(fù)雜環(huán)境導(dǎo)致絕緣子缺陷、R銷缺失已及鳥巢檢測精度低的問題。首先,采用帶滑動窗口切圖的方式將超高分辨率的原始圖片分割為低分辨率的小圖片,并利用K-means算法對數(shù)據(jù)進行分析以獲得最佳尺寸的錨框;其次,采用BiFPN替換原先YOLOv5的特征金字塔網(wǎng)絡(luò),以實現(xiàn)更加自由的信息交換和特征融合;最后,在網(wǎng)絡(luò)中添加SimAM注意力模塊,使網(wǎng)絡(luò)更加關(guān)注待檢測的目標(biāo)。經(jīng)過以上操作,改進后的YOLOv5算法mAP@0.5達到了77.5%,檢測效果明顯提升。未來應(yīng)進一步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),以提高檢測準(zhǔn)確率和召回率,并降低漏檢率。