孫 明
(上海地鐵維護(hù)保障有限公司供電分公司,上海 201106)
隨著我國城市軌道交通的飛速發(fā)展,對城市軌道交通的安全運(yùn)行也提出了更高的要求,穩(wěn)定、安全和高效的電源供應(yīng)是其中至關(guān)重要的一環(huán)。隨著城市軌道交通供電技術(shù)的不斷發(fā)展,目前城市軌道交通供電系統(tǒng)主要可以分為接觸網(wǎng)供電和接觸軌供電兩種供電方式。接觸軌供電方式因其美觀、建設(shè)成本低、供電穩(wěn)定、檢測方便、便于在隧道中使用等優(yōu)點(diǎn)在線路上得到了越來越廣泛的應(yīng)用,但是由于接觸軌長期與集電靴高速摩擦,極易出現(xiàn)磨耗、擦傷、疤痕等病害,會給軌道交通的安全供電造成極大的隱患,因此對接觸軌表面缺陷的準(zhǔn)確、快速、智能化檢測也成為當(dāng)今城市軌道交通維護(hù)保障工作的研究熱點(diǎn)問題。近年來,基于計(jì)算機(jī)視覺的故障檢測技術(shù)在軌道交通維護(hù)保障領(lǐng)域得到了越來越廣泛的研究與應(yīng)用,為了實(shí)現(xiàn)對接觸軌表面缺陷的快速、準(zhǔn)確、自動化檢測,本文針對接觸軌表面缺陷復(fù)雜、精細(xì)等特點(diǎn),在目標(biāo)檢測算法模型YOLOv5 的基礎(chǔ)上加入了CBAM(Convolutional Block Attention Module)和CA(Coordinate Attention)注意力機(jī)制,設(shè)計(jì)了基于注意力機(jī)制改進(jìn)的YOLOv5 接觸軌表面缺陷檢測模型,提升了模型的檢測速度與定位精度。
為實(shí)現(xiàn)對接觸軌表面缺陷的快速檢測,本文選擇使用YOLOv5 算法模型作為接觸軌表面缺陷檢測基準(zhǔn)模型。YOLO算法是一個單階段目標(biāo)檢測算法,可以端到端地完成對特征圖像的訓(xùn)練與預(yù)測。YOLO 系列目標(biāo)檢測算法經(jīng)過不斷的發(fā)展與創(chuàng)新,現(xiàn)已推出了更加輕量化的YOLOv5 算法模型。YOLOv5 算法模型由輸入端、骨干網(wǎng)絡(luò)、頸部網(wǎng)絡(luò)和頭部網(wǎng)絡(luò)4個部分組成。根據(jù)模型寬度、深度和參數(shù)量等不同,YOLOv5 也可以分為5 個版 本:YOLOv5x、YOLOv5l、YOLOv5m、YOLOv5s、YOLOv5n,模 型隨著寬度、深度的增加,模型的參數(shù)量、層數(shù)和每秒執(zhí)行的浮點(diǎn)運(yùn)算量(GFLOPs)也在增加,檢測精度會隨之越高,但所需訓(xùn)練時(shí)間也相應(yīng)增長。本文使用模型為了獲取更輕量化的模型,實(shí)現(xiàn)更快速、精確的檢測,選擇了YOLOv5s 作為基準(zhǔn)模型。
針對接觸軌表面缺陷精細(xì),分布范圍有限的特點(diǎn),在模型中加入了CBAM 注意力機(jī)制,提高模型收斂能力與速度。CBAM 主要由通道注意力機(jī)制和空間注意力機(jī)制兩部分組成,其結(jié)構(gòu)見圖1。
圖1 CBAM 結(jié)構(gòu)示意
在CBAM 中,特征圖像輸入后會沿著堆疊的兩個機(jī)制模塊分別進(jìn)行特征提取,依次推斷出一個一維的通道注意力特征圖和一個二維空間的空間注意力特征圖,最后將通道注意力特征圖、空間注意力特征圖與原圖三者相乘完成自適應(yīng),完成對圖像特征的精煉和對關(guān)注面積的擴(kuò)大,有效提升了卷積神經(jīng)網(wǎng)絡(luò)的表示能力。總體過程可概括為原理公式:
其中,?表示為元素方向上的乘法,F(xiàn)′是通道注意力機(jī)制進(jìn)行圖像特征精煉后的輸出,F(xiàn)′則是最終CBAM 對圖像特征精煉后的輸出。
為了使模型更好學(xué)習(xí)到接觸軌表面圖像特征的長距離依賴關(guān)系,獲取精確的接觸軌表面缺陷特征坐標(biāo)定位信息,本文在模型中加入了CA 注意力機(jī)制。CA 注意力機(jī)制針對通道注意力機(jī)制難以獲取到圖像準(zhǔn)確坐標(biāo)定位信息,通過將位置信息嵌入到通道注意力中提出的,其結(jié)構(gòu)如圖2 所示。
圖2 CA 結(jié)構(gòu)示意
整個CoordAtt 主要可概括為兩個處理步驟:坐標(biāo)信息嵌入與協(xié)調(diào)注意力生成,總體可概括為公式:
其中,yc(i,j)代表最終CoordAtt 的輸出,xc(i,j)代表坐標(biāo)信息嵌入處理后的輸出(i)和(j)分別代表兩個方向上生成的協(xié)調(diào)注意力參數(shù)。
結(jié)合CBAM 和CCA 的特點(diǎn),在YOLOv5s 基準(zhǔn)網(wǎng)絡(luò)框架的基礎(chǔ)上,在網(wǎng)絡(luò)模型第5、8、11、28 層分別加入CA 和在第21、25層加入CBAM,設(shè)計(jì)了結(jié)合CBAM 與CA 的基于注意力機(jī)制的CB-CA YOLOv5 接觸軌表面缺陷檢測模型,模型結(jié)構(gòu)如圖3 所示。
圖3 CB-CA YOLOv5 網(wǎng)絡(luò)結(jié)構(gòu)示意
本文實(shí)驗(yàn)所用的接觸軌表面數(shù)據(jù)集來源于上海軌道交通16 號線,由550 張分辨率為3088×2320 接觸軌表面圖像組成,每張圖像至少包含一個表面缺陷,最終放入模型訓(xùn)練、驗(yàn)證和檢測的圖片尺寸都為608×608。本文使用的接觸軌表面缺陷檢測模型在Linux-x86_64 系統(tǒng),NVIDIA Quadro P500 GPU 的服務(wù)器上進(jìn)行實(shí)驗(yàn),每個模型實(shí)驗(yàn)訓(xùn)練方式都為單GPU 運(yùn)算,訓(xùn)練迭代次數(shù)(Epoch)為300 次。
本文使用了多個目標(biāo)檢測模型研究中常用的評價(jià)指標(biāo)對模型進(jìn)行定性、定量的分析與比較:
TP 代表人工標(biāo)注的接觸軌表面缺陷被正確識別個數(shù),F(xiàn)P代表被錯誤識別為接觸軌表面缺陷的個數(shù),F(xiàn)N 代表未被識別出的接觸軌表面缺陷的個數(shù)。
mAP_0.5:交并比設(shè)為0.5 時(shí),計(jì)算每一類圖片的AP(Average Precision)再對所有類別求平均,因?yàn)楸疚闹挥辛鸭y一類,所以本文使用的為AP_0.5。
mAP_0.5:0.95:設(shè)置步長為0.05,取交并比在0.5~0.95 之間的平均mAP,因?yàn)楸疚闹挥辛鸭y一類,所以本文使用的為AP_0.5:0.95。
FPS(Frames Per Second):每秒檢測圖片幀數(shù)。
TS代表一張圖片的檢測時(shí)間。
將改進(jìn)后的CB-CA YOLOv5 模型對接觸軌表面進(jìn)行檢測,能有效、準(zhǔn)確對缺陷進(jìn)行識別與定位,并且對三種類型的缺陷都有著較好的檢測精度與置信度表現(xiàn)。為了進(jìn)一步對本文使用的模型進(jìn)行定性、定量的分析,使用式(4)、式(5)計(jì)算評價(jià)指標(biāo),選取了4 種目標(biāo)檢測模型與本文模型進(jìn)行進(jìn)一步的比較、分析,實(shí)驗(yàn)結(jié)果見表1。在YOLOv5s 基礎(chǔ)上進(jìn)行改進(jìn)的模型,對比YOLOv5s,模型在不損失訓(xùn)練、檢測速度的情況下,各項(xiàng)檢測指標(biāo)都實(shí)現(xiàn)了大幅提升,精度、AP_0.5:0.95 分別提高了7.3%和5.8%,同時(shí)只需要263 次迭代次數(shù)就能完成最優(yōu)模型的訓(xùn)練,模型收斂能力也獲得了大幅提高。因此,比較5 種方法,本文提出的基于注意力機(jī)制的CB-CA YOLOv5 模型最適合于進(jìn)行接觸軌表面缺陷檢測。
表1 算法框架數(shù)據(jù)對比
針對接觸軌表面缺陷類型復(fù)雜、精細(xì)、分布范圍有限等特點(diǎn),本文提出基于注意力機(jī)制的CB-CA YOLOv5 接觸軌表面缺陷檢測模型,實(shí)現(xiàn)了對接觸軌表面缺陷的準(zhǔn)確檢測與精確定位。一方面,在模型中加入了CBAM 注意力機(jī)制,提高模型的收斂速度與檢測性能。另一方面,在模型組加入CA 注意力機(jī)制,能獲取更精確的接觸軌表面缺陷特征坐標(biāo)定位信息。最終,在本文采集的接觸軌表面缺陷圖像數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),最終模型精確率為0.958,召回率為0.999,AP_0.5 為0.968,AP_0.5:0.95 為0.874,F(xiàn)PS 為167。與其余版本的YOLOv5 模型進(jìn)行試驗(yàn)對比,本文模型在維持較好的檢測速度同時(shí),大幅提高了各項(xiàng)檢測性能,并且增強(qiáng)了模型的收斂能力,有較好的實(shí)用價(jià)值。