朱久牛, 李立明,2, 柴曉冬,2, 鄭樹彬,2, 彭樂樂,2, 呂 晟
(1 上海工程技術(shù)大學(xué) 城市軌道交通學(xué)院,上海 201620;2 上海工程技術(shù)大學(xué)上海市軌道交通振動與噪聲控制技術(shù)工程研究中心,上海 201620; 3 上海地鐵維護(hù)保障有限公司, 上海 200031)
中國城市快速建設(shè),城市軌道交通飛速發(fā)展,其數(shù)量每一年都在急速增加,也帶來了諸多挑戰(zhàn)[1]。截至2021 年末,上海城軌交通數(shù)量超7 000 輛,其中9 號線車輛數(shù)量達(dá)到600 多輛,約占上海城軌交通數(shù)量的8.57%。 維修車輛是軌道交通基礎(chǔ)設(shè)施維護(hù)的重要措施,從而使列車檢測尤其重要[2]。 比如地鐵車輛軸箱螺栓的檢修和維護(hù),地鐵車輛輪與側(cè)架連接在一起的裝置是軸箱,承受車輛重量、傳遞各方作用力的作用[3]。 螺栓用來鏈接軸箱體和軸箱前蓋,螺栓預(yù)緊力過大將導(dǎo)致軸箱體螺紋孔損壞和軸箱前蓋發(fā)生塑性變形甚至斷裂,螺栓預(yù)緊力過小則導(dǎo)致車輛運(yùn)行過程中軸承竄動而損壞[4]。 在傳統(tǒng)軸蓋螺栓檢測有兩種方法:停車列檢和定期段檢。中國擁有龐大的地鐵車輛,在車輛的檢修與維護(hù)過程中,帶來了人員配置的巨大壓力和高成本。 在對螺栓檢測的方法中,李靜等[5]對轉(zhuǎn)向架心盤螺栓圖像進(jìn)行了區(qū)域分割和特征提取,然后用分類器訓(xùn)練,定位螺栓,以此來判別螺栓故障狀態(tài);陳燕等[6]利用數(shù)字圖像的檢測技術(shù)和Hough 變化檢測螺栓缺失時邊緣特征,從而判別螺栓缺失故障。 以上研究是利用傳統(tǒng)方法識別螺栓的缺失故障,精度較低,誤檢率較高。 近年來,卷積神經(jīng)網(wǎng)絡(luò)在計算機(jī)視覺領(lǐng)域的圖像處理方法中流行,王振等[7]以Yolov3 網(wǎng)絡(luò)為基礎(chǔ),檢測出圖像序列中的螺栓組件目標(biāo)位置;陳健雄等[8]利用Yolov2 網(wǎng)絡(luò)尋找連接板的位置信息,實(shí)現(xiàn)螺釘頭部與連接板邊緣的分割,從而判別螺釘狀態(tài)。 以上研究模型檢測的精度得到提升,但網(wǎng)絡(luò)模型復(fù)雜,不夠輕量化。 因此,本文在不損失精度情況下,針對網(wǎng)絡(luò)模型的輕量化,提出一種基于改進(jìn)Yolov5s 算法的車輛軸箱蓋螺栓定位模型,如圖1 所示。
圖1 基于改進(jìn)Yolov5s 算法的車輛軸箱蓋螺栓定位模型Fig.1 Vehicle axle box cover bolt localization model based on improved Yolov5s algorithm
Yolov5s 網(wǎng)絡(luò)利用CSPNet(Cross Stage Partial Network)結(jié)構(gòu)構(gòu)建兩種不同的結(jié)構(gòu),實(shí)現(xiàn)特征提取和特征融合,導(dǎo)致網(wǎng)絡(luò)深度較復(fù)雜,模型體積較大。 本文采用GhostNet 殘差結(jié)構(gòu)和擠壓激勵(Squeeze Excitation,SE)模塊構(gòu)建GGS(Ghost-Ghost-SE) 模型應(yīng)用在原Yolov5s 主干網(wǎng)絡(luò)中的8 倍、16 倍下采樣和特征提取,并在32 倍下采樣和空間池化操作(Spatial Pyramid Pooling,SPP)后增加一個SE 模塊。 在PANet(Path Aggregation Network)結(jié)構(gòu)中使用步長為1 的Ghost 瓶頸結(jié)構(gòu)、1×1 和3×3 的深度可分離卷積構(gòu)建一個自下而上的路徑多尺度融合框架;在32 倍降采樣特征進(jìn)行特征融合、降維、上采樣操作,然后與16 倍降采樣特征進(jìn)行特征拼接,得到的拼接特征進(jìn)行降采樣,再按照相同的操作與8 倍下采樣特征進(jìn)行特征拼接、降維;降維時產(chǎn)生的特征分別是p1、p2、p3,尺寸分別是13×13、26×26、52×52;p3 經(jīng)過特征融合得到P3,P3 降采樣得到的特征與p2 拼接,得到的尺寸進(jìn)行特征融合得到P2,P2降采樣得到的尺寸與p1 拼接,得到的尺寸進(jìn)行特征融合得到P1,P1、P2 和P3 卷積生成大小尺寸為13×13×30、26×26×30、52×52×30,網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。
圖2 改進(jìn)Yolov5 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Improved Yolov5 network structure
Ghost 殘差結(jié)構(gòu)是將特征經(jīng)過一次普通卷積生成部分特征,生成的部分特征再進(jìn)行廉價的線性變化,生成另一部分特征,兩部分特征疊加得到新的特征[9]。 為了充分利用特征通道中包含的重要信息,引入了SE 模塊。 先用2 個Ghost 模塊、步長為2 的深度可分離卷積和短接組成一個步長為2 的Ghost瓶頸,再用2 個Ghost 模型和短接組合一個步長是1的Ghost 瓶頸,最后與SE 模塊連接。 Ghost 模型和GGS 模型結(jié)構(gòu),如圖3 所示。
圖3 Ghost 模型和GGS 模型結(jié)構(gòu)圖Fig.3 Structure diagram of Ghost model and GGS model
在GGS 模型中,輸入特征先進(jìn)行步長為2 的Ghost 瓶頸降采樣,再進(jìn)行步長為1 的Ghost 瓶頸特征提?。唤?jīng)過全局池化得到擠壓特征,使之具有全局感受野、降維,經(jīng)過全連接(Fully Connection, FC)、全連接、通過Sigmoid 激活函數(shù)將權(quán)重歸一化;最后進(jìn)行比例操作對特征進(jìn)行權(quán)值評估,以便更加集中重要的特征表達(dá)。
利用構(gòu)建輕量高效的GGS 模型替換原Yolov5s網(wǎng)絡(luò)的主干網(wǎng)絡(luò)的部分卷積和CSPNet 結(jié)構(gòu),使其能夠更好地表達(dá)特征和聚合感受野的特征,改進(jìn)后網(wǎng)絡(luò)的主干網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示([3,2]表示卷積核尺寸大小為3,步長為2),虛框?yàn)镚GS 模型結(jié)構(gòu)。
圖4 改進(jìn)網(wǎng)絡(luò)的主干網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Backbone network structure of the improved network
本文網(wǎng)絡(luò)和原網(wǎng)絡(luò)的主干網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)對比見表1,使用GGS 模型結(jié)構(gòu)作為改進(jìn)網(wǎng)絡(luò)的主干網(wǎng)絡(luò),實(shí)現(xiàn)了參數(shù)量大幅度的降低。
表1 改進(jìn)前后主干網(wǎng)絡(luò)模型參數(shù)對比Tab.1 Comparison of backbone parameters before and after improvement
原Yolov5s 網(wǎng)絡(luò)在PANet 結(jié)構(gòu)中使用普通卷積進(jìn)行降維和降采樣,導(dǎo)致其結(jié)構(gòu)模型參數(shù)較多、計算量較大。 為了不降低網(wǎng)絡(luò)檢測精度,本文引用深度可分離卷積替代普通卷積,降低網(wǎng)絡(luò)參數(shù)量和計算量,將輸入特征先進(jìn)行深度卷積(Depthwise Convolution, DW),得到的特征在進(jìn)行逐點(diǎn)卷積,輸出最終結(jié)果。 深度可分離卷積結(jié)構(gòu)如圖5 所示。
圖5 深度可分離卷積結(jié)構(gòu)Fig.5 Depthwise separable convolution structure
深度可分離卷積的計算量,式(2):
其中,C表示輸入特征的尺寸;k表示卷積核的尺寸;N表示輸入特征的通道數(shù)量。
深度可分離卷積和普通卷積計算量之比,式(3):
一般情況下,N值很大,k值設(shè)置為3,所以深度可分離卷積和普通卷積計算量之比約為1/9。
在改進(jìn)網(wǎng)絡(luò)的PANet 中,用步長是1 的Ghost瓶頸結(jié)構(gòu)、1×1 和3×3 的深度可分離卷積進(jìn)行特征融合、通道維度變換、降采樣。 前后PANet 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)量對比見表2。 可見改進(jìn)的PANet 模型結(jié)構(gòu)每一行的參數(shù)量相對原算法的PANet 結(jié)構(gòu)都有實(shí)質(zhì)性的大幅度的降低,改進(jìn)的模型參數(shù)量的總和是原算法參數(shù)總和的1/9 左右。
表2 改進(jìn)前后PANet 結(jié)構(gòu)模型參數(shù)對比Tab.2 Comparison of model parameters in PANet before and after improvement
本文試驗(yàn)使用的數(shù)據(jù)集是利用360°動態(tài)圖像檢測系統(tǒng)采集上海9 號線地鐵車輛軸箱蓋圖像,一共采集370 張具有軸箱蓋的圖像。 按照比例8:1:1的方式,訓(xùn)練集有296 張,驗(yàn)證集有37 張,測試集有37 張。 由于螺栓樣本數(shù)據(jù)較少,因此在訓(xùn)練時采用Mosaic 數(shù)據(jù)增強(qiáng)方式,豐富數(shù)據(jù)集的同時極大的提升網(wǎng)絡(luò)的訓(xùn)練的速度,提高最終的檢測效果,降低模型的內(nèi)存需求,有效抑制模型過擬合程度。
本文模型性能評估指標(biāo)為精度(P),平均精度(Average Precision,AP), 平 均 精 度 均 值(mean Average Precision,mAP)。 精度的計算,式(4):
其中,TP表示真陽率,F(xiàn)P表示假陽率。
平均精度為不同召喚率下精確率的平均值。 平均精度均值是不同類別平均精度的平均值,用來評價某一類的檢測精度,評價網(wǎng)絡(luò)模型的整體性能,式(5):
怒吼的河水濺出白色的浪花,肆意擊打著金屬欄桿,欄桿又窄又滑。克里斯蒂娜就算有膽在上面懸掛五分鐘,也不一定能撐得住。可憐的克里斯蒂娜進(jìn)退兩難,她要么選擇淪為無派別人,要么去冒死一試。
其中,n為檢測目標(biāo)類別數(shù),AP(i) 為某一類的檢測精度。
本文使用mAP@0.5,即設(shè)置IoU閾值為0.5 得到的mAP。
分別使用Yolov5s 算法、Yolov5-ghost 算法和Yolov5-GGS-DW(本文)算法定位螺栓,各算法的模型參數(shù)和模型尺寸如圖6 所示,可見算法模型參數(shù)量和模型尺寸越來越小,以及本文網(wǎng)絡(luò)模型參數(shù)量是Yolov5s 網(wǎng)絡(luò)模型參數(shù)量的1/3 左右,模型尺寸比Yolov5s 網(wǎng)絡(luò)模型尺寸的一半還要小。 3 種算法的損失函數(shù)曲線如圖7 所示,訓(xùn)練網(wǎng)絡(luò)時設(shè)置IoU的閾值為0.5,每一種算法訓(xùn)練500 次。 由圖7 可見,在訓(xùn)練次數(shù)到達(dá)200 次,算法的損失函數(shù)值的收斂值趨于0。
圖6 3 種算法模型參數(shù)和模型尺寸的對比Fig.6 Comparison of model parameters and model size of three algorithms
圖7 3 種算法的損失函數(shù)曲線Fig.7 Loss curves of three algorithms
使用不同算法各種類螺栓的平均精度見表3,本文算法中的螺栓種類Bolt_A 的平均精度比其他兩種算法高,Bolt_B 的平均精度與Yolov5s 算法一致,螺栓種類Bolt_C 和Bolt_D 的平均精度相對較低,本文算法的平均精確度值為98.6%,相對于另外兩種算法的平均精度均值基本沒有什么損失。
表3 Yolov5s 算法、Yolov5s-ghost 算法和Yolov5s-GGS-DW 算法各種類檢測平均精度對比Tab.3 Comparison of the average accuracy of Yolov5s, Yolov5sghost and Yolov5s-GGS-DW
使用本文算法對城市軌道交通車輛的軸箱蓋螺栓定位檢測,如圖8 所示,每一種類別的螺栓的定位框的置信度大部分在80%以上,可以用來判斷螺栓是否存在。
圖8 螺栓定位Fig.8 Bolt location
本文運(yùn)用了精度(P)、 浮點(diǎn)運(yùn)算(giga floating point operations persecond,gflops)、mAP50 的數(shù)值進(jìn)行模型性能指標(biāo)對比,見表4。
表4 3 種算法的性能指標(biāo)對比Tab.4 Comparison of the performance metrics of the three algorithms
從表4 可知,本文算法的精度高達(dá)99.6%,相比Yolov5s 網(wǎng)絡(luò)提升了0.3%,而且mAP50 也高達(dá)98.6%,相比較原Yolov5s 網(wǎng)絡(luò)下降了0.5%。 從浮點(diǎn)運(yùn)算可以看出,在無損精度的狀態(tài)下,本文的網(wǎng)絡(luò)計算量是原網(wǎng)絡(luò)計算量的1/3,實(shí)現(xiàn)了壓縮模型的體積,使網(wǎng)絡(luò)模型更加輕量化。
本文將GhostNet 殘差結(jié)構(gòu)和SE 模塊的性質(zhì)組合GGS 模型代替Yolov5 的主干網(wǎng)絡(luò)中的特征提取層,在PANet 結(jié)構(gòu)中使用深度可分離卷積和步長是1 的Ghost 瓶頸結(jié)構(gòu)進(jìn)行特征降采樣,減小模型尺寸,改進(jìn)Yolov5s 輕量級網(wǎng)絡(luò)檢測效果與Yolov5s 檢測精度,模型尺寸卻只有原Yolov5s 的37.8%。