王苗 張龍信
摘? 要:鎖緊板偏移故障是貨運(yùn)列車頻發(fā)的典型故障之一,針對(duì)其平均識(shí)別精確度較低的問題,將目標(biāo)檢測YOLOv4模型應(yīng)用于改善貨運(yùn)列車部位鎖緊板圖像檢測。首先,對(duì)鎖緊板偏移、正常圖像進(jìn)行Mosaic數(shù)據(jù)增強(qiáng),以解決數(shù)據(jù)集樣本較少問題。其次,使用k-means聚類算法,得到更優(yōu)的初始anchor的位置,以提高故障檢測精確度。最后,通過非極大值抑制獲取得分最高的檢測結(jié)果。實(shí)驗(yàn)表明,通過使用目標(biāo)檢測YOLOv4能夠精確地實(shí)現(xiàn)鎖緊板故障的檢測。
關(guān)鍵詞:故障檢測;鎖緊板;YOLOv4
中圖分類號(hào):TP391.4? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2021)20-0042-03
Image Fault Detection of Train Locking Plate Based on YOLOv4
WANG Miao,? ZHANG Longxin
(Hunan University of Technology, Zhuzhou 412007, China)
Abstract: Locking plate offset fault is one of the typical faults frequently occurring in freight trains. Aiming at the problem of low
average recognition accuracy, the object detection YOLOv4 model is used to improve the image detection of part locking plate of freight trains. Firstly, Mosaic data enhancement is performed on the offset of the locking plate and the normal image to solve the problem of less samples in the data set. Secondly, K-means clustering algorithm is used to obtain a better initial anchor position, so as to improve the accuracy of fault detection. Finally, the detection result with the highest score is obtained by non-maximum suppression. Experiments show that the use of target detection YOLOv4 can accurately detect the fault of locking plate.
Keywords: fault detection; locking plate; YOLOv4
0? 引? 言
隨著經(jīng)濟(jì)的快速發(fā)展和鐵路交通領(lǐng)域的飛躍進(jìn)步,鐵路貨運(yùn)列車開始轉(zhuǎn)變?yōu)橹剌d、大密度的運(yùn)行方式,對(duì)于列車安全運(yùn)行來說,列車故障檢測的高效性和準(zhǔn)確性的意義至關(guān)重要。由于傳統(tǒng)的人工檢測方式隨著貨運(yùn)列車高速和高頻率的運(yùn)行而難以適應(yīng),為了推進(jìn)鐵路行業(yè)的現(xiàn)代化建設(shè),滿足列車故障快速、準(zhǔn)確發(fā)現(xiàn)的要求,于是鐵道部推廣了列車運(yùn)行故障動(dòng)態(tài)檢測系統(tǒng)(Trouble of moving freight car detection system, TFDS)[1]。鎖緊板是貨運(yùn)列車頻繁發(fā)生故障部位之一。一旦鎖緊板偏移,表示螺栓發(fā)生了松動(dòng)。螺栓的松動(dòng)重則導(dǎo)致脫落,從而影響到列車的安全運(yùn)行。因此對(duì)于列車安全,鎖緊板偏移故障檢測至關(guān)重要。孫國棟等人[2]針對(duì)列車擋鍵問題設(shè)計(jì)了一種基于形狀上下文的丟失圖像識(shí)別算法,該方法能夠區(qū)分列車是否存在擋鍵。雷蕾等人[3]提出了基于HCRD的列車鎖緊板偏轉(zhuǎn)自動(dòng)識(shí)別方法。該HCRD方法能檢測出鎖緊板的偏轉(zhuǎn),且具有一定的魯棒性和抗噪能力。
本文的主要貢獻(xiàn)在于使用目標(biāo)檢測YOLOv4模型[4]應(yīng)用于鎖緊板的故障檢測,另外K-means聚類算法[5]生成更合適的先驗(yàn)框的準(zhǔn)確性,采用Mosica數(shù)據(jù)增強(qiáng)的方式擴(kuò)展了數(shù)據(jù)集,以增加模型檢測的魯棒性。
1? 相關(guān)工作
1.1? YOLOv4網(wǎng)絡(luò)結(jié)構(gòu)
YOLOv4的網(wǎng)絡(luò)結(jié)構(gòu)主要有三部分:主干網(wǎng)(Cspdarknet53)、頸部(neck)、頭部(head),頸部包括了特征集成網(wǎng)絡(luò)模塊SPP(Spatial Pyramid Pooling)、多尺度特征融合模塊PAN(Path Aggregation Network),頭部主要是以YOLO-Head為主。
主干網(wǎng)Cspdarknet53包含了多個(gè)子模塊的堆疊以及一條殘差邊,主要是用于提取圖像特征。頸部用于融合特征,SPP模塊增加了感受野,用于集成最優(yōu)價(jià)值的特征信息。PAN模塊在FPN的基礎(chǔ)上額外增加了一組自上而下的特征提取路徑,主要在P3、P4、P5層使用了PAN結(jié)構(gòu),使得能夠得到更加有效的特征信息。YOLO-Head主要用于解碼和預(yù)測,利用了非極大值抑制得到得分最高的預(yù)測框。
在YOLOv4模型中使用的損失函數(shù)是CIOU-Loss,CIOU考慮了將目標(biāo)與anchor之前的距離、重疊率、尺度、以及懲罰項(xiàng)等因素,使其在計(jì)算目標(biāo)框和預(yù)測框之間的回歸損失更加小。
IOU的計(jì)算表達(dá)式如所示:
式中,prediction表示預(yù)測框,ground-truth表示預(yù)測框,Intersection表示兩個(gè)框之間的交集,Union表示兩個(gè)框之間的并集。
CIOU-Loss的計(jì)算表達(dá)式如所示:
式中,ρ2(A,B)分別表示代表A和B點(diǎn)的歐式距離,b表示預(yù)測框的位置,bgt表示真實(shí)框的位置,c表示能夠同時(shí)包含預(yù)測框和真實(shí)框的最小閉包區(qū)域的對(duì)角線距離,α表示權(quán)重參數(shù)以及υ表示衡量長寬比一致性的參數(shù)。
1.2? 聚類算法
K-means聚類算法自研發(fā)以來廣泛應(yīng)用于不同的學(xué)科領(lǐng)域,但本文主要應(yīng)用于生成最優(yōu)的anchor位置。K-means聚類算法主要是通過遞歸的思想來選取距離最近的中心。第一步,將數(shù)據(jù)集劃分為K類別,然后依次把數(shù)據(jù)放置在不同的類別中。第二步,當(dāng)確定好類別之后,計(jì)算整個(gè)類別的所有數(shù)據(jù)到該聚類中心點(diǎn)的距離。找出離該類別距離最近的一個(gè)聚類中心,計(jì)算所有類別聚類中心的平均值作為新的聚類中心。第三步,返回至上一步重新計(jì)算。直到聚類中心不再發(fā)生變化,停止計(jì)算。此時(shí),便成功獲取一個(gè)適合數(shù)據(jù)集的聚類中心。
K-means算法雖然具有思想簡單、良好的聚類效果、速度快等優(yōu)點(diǎn)。然而該算法對(duì)于初始K值敏感和容易陷入局部優(yōu)化的缺點(diǎn)。因此,算法中初始K值的選取、初始聚類中心點(diǎn)的選取對(duì)于該算法來說是至關(guān)重要的,在本論文中分類為2類,所以K值為2。原YOLOv4模型生成錨點(diǎn)聚類中心為16、89、19、43、53、50、61、88、67、93、67、88、68、85、71、72、75、87,后K-means生成的錨點(diǎn)聚類中心為15、97、18、44、22、85、54、49、62、89、67、94、68、90、68、86、72、73。
2? 實(shí)驗(yàn)
2.1? 試驗(yàn)配置與數(shù)據(jù)集
首先,使用LabelImg軟件制作貨運(yùn)列車VOC格式數(shù)據(jù)集,鎖緊板圖像總共531張。當(dāng)數(shù)據(jù)量比較小時(shí),可以使用9:1訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。訓(xùn)練集:478張;測試集:鎖緊板53。因?yàn)閷?shí)驗(yàn)的數(shù)據(jù)樣本較少,Mosaic數(shù)據(jù)增強(qiáng)會(huì)利用四張圖片進(jìn)行計(jì)算,從而增加數(shù)據(jù)樣本的多樣性。因此,在本論文中使用了Mosaic數(shù)據(jù)增強(qiáng)方式來增強(qiáng)數(shù)據(jù)集。Mosaic數(shù)據(jù)增強(qiáng)具體步驟如下。第一步,導(dǎo)入4張圖片。第二步,分別使用翻轉(zhuǎn)、縮放、色域變化等數(shù)據(jù)增強(qiáng)方法處理四張圖片,并且按照左上、左下、右上、右下等四個(gè)方向,忽略圖片原來的位置,任意擺放。第三步,組合第二步通過數(shù)據(jù)增強(qiáng)的方法得到的圖片,將組合好的圖片合成一張新的圖片。
本文的實(shí)驗(yàn)基于Pytorch實(shí)現(xiàn)。實(shí)驗(yàn)使用的操作系統(tǒng)為Ubuntu20.0.0和一塊單獨(dú)的GTX1080Ti GPU。數(shù)據(jù)處理使用了Python:3.6、OpenCV庫,Torch:1.2.0,Torchvision:0.4.0。GPU加速庫為Cuda:10.0和Cudnn:7.4.1.5。
當(dāng)使用YOLOv4模型獲取圖像特征時(shí),應(yīng)考慮影響mAP值變化的因素,例如不同學(xué)習(xí)率(learning rate)和迭代次數(shù)(iteration),通過對(duì)比實(shí)驗(yàn)表明,當(dāng)設(shè)置學(xué)習(xí)率為10-3時(shí),AP值較大。另外,迭代次數(shù)設(shè)置為100次,批大小設(shè)置為2。
2.2? 實(shí)驗(yàn)參數(shù)與性能指標(biāo)
如果鎖緊板的正常和故障圖像分別視為正樣本和負(fù)樣本。那么TP(True Positive)表示當(dāng)分類器把正常圖像分類為正常標(biāo)簽時(shí)的次數(shù);TN(True Negative)表示當(dāng)分類器把故障圖像分類為故障標(biāo)簽時(shí)的次數(shù);FP(False Positive)表示當(dāng)分類器把故障圖像分類為正常標(biāo)簽時(shí)的次數(shù);FN(False Negative)表示當(dāng)分類器把正常圖像分類為故障標(biāo)簽時(shí)的次數(shù)。召回率(Recall)、精確率(Precision)分別為:
2.3? 實(shí)驗(yàn)結(jié)果
本文主要針對(duì)典型部件的貨運(yùn)列車故障圖像的鎖緊板偏移故障以及正常圖像,識(shí)別并分類。在圖1中,鎖緊板正常如(a)所示。當(dāng)列車處于運(yùn)行條件下,列車不斷的運(yùn)動(dòng)會(huì)造成交叉端部螺栓的松動(dòng),導(dǎo)致鎖緊板偏移。鎖緊板偏移故障如(b)所示。
3? 結(jié)? 論
本文提出了一種基于YOLOv4算法貨運(yùn)列車鎖緊板圖像故障檢測方法,使用K-means聚類算法先驗(yàn)框和聚類中心的位置作為參數(shù)對(duì)貨運(yùn)列車數(shù)據(jù)進(jìn)行聚類得到先驗(yàn)框,獲取更多的細(xì)節(jié)特征信息。通過使用Mosaic數(shù)據(jù)增強(qiáng)方式來解決數(shù)據(jù)集樣本少的問題,實(shí)驗(yàn)結(jié)果表明,YOLOv4模型具有較好的檢測效果,mAP達(dá)到了84.22%。改進(jìn)后的YOLOv4網(wǎng)絡(luò)檢測準(zhǔn)確度有所提高。
參考文獻(xiàn):
[1] 黃東林.關(guān)于提高TFDS動(dòng)態(tài)檢查質(zhì)量的探討 [J].鐵道車輛,2018,56(11):37-39+6.
[2] 孫國棟,徐威,梁永強(qiáng),等.基于形狀上下文的列車擋鍵丟失圖像識(shí)別算法 [J].鐵道科學(xué)與工程學(xué)報(bào),2014,11(6):127-131.
[3] 雷蕾,宋冬利,張衛(wèi)華,等.基于HCRD的列車鎖緊板偏轉(zhuǎn)自動(dòng)識(shí)別方法 [J].鐵道科學(xué)與工程學(xué)報(bào),2021,18(7):1895-1902.
[4] BOCHKOVSKIY A,WANG C Y,LIAO H Y M. YOLOv4:Optimal Speed and Accuracy of Object Detection [J/OL].arXiv:2004.10934 [cs.CV].[2021-08-27].https://arxiv.org/abs/2004.10934.
[5] 張雨金,楊凌帆,葛雙冶,等.基于Kmeans-SVM的短期光伏發(fā)電功率預(yù)測 [J].電力系統(tǒng)保護(hù)與控制,2018,46(21):118-124.
作者簡介:王苗(1998—),女,漢族,湖南耒陽人,碩士在讀,研究方向:深度學(xué)習(xí)和故障檢測;
張龍信(1983—),男,漢族,湖南瀏陽人,博士,副教授,CCF會(huì)員(34915M),研究方向:深度學(xué)習(xí)和大數(shù)據(jù)分析。