康高強(qiáng), 高仕斌, 于 龍, 陳健雄
(西南交通大學(xué) 電氣工程學(xué)院,四川 成都 610031)
旋轉(zhuǎn)雙耳作為接觸網(wǎng)支撐裝置的重要組成部分,起到連接定位管和腕臂的作用。由于長期受到受電弓的高速沖擊,旋轉(zhuǎn)雙耳極易發(fā)生開口銷釘脫落故障,造成打弓等安全隱患[1]。因此,對旋轉(zhuǎn)雙耳進(jìn)行狀態(tài)檢測,及時排除故障,能夠有效提高牽引供電的可靠性。
目前,隨著鐵路6C系統(tǒng)的投入使用,我國鐵路供電裝置的檢測逐漸向智能化方向發(fā)展[2]。6C系統(tǒng)采用基于圖像處理的非接觸檢測方式,實(shí)現(xiàn)接觸網(wǎng)支撐裝置零部件的故障檢測。由于支撐裝置圖像中存在眾多零部件,因此需要首先實(shí)現(xiàn)目標(biāo)的精確定位,然后進(jìn)行故障檢測。目前,在接觸網(wǎng)零部件故障定位領(lǐng)域,主要采用圖像目標(biāo)的局部特征描述子來解決零部件的定位問題。文獻(xiàn)[3]利用SIFT特征點(diǎn)匹配,實(shí)現(xiàn)旋轉(zhuǎn)雙耳的定位與提取。文獻(xiàn)[4]通過匹配標(biāo)準(zhǔn)旋轉(zhuǎn)雙耳圖像與待檢圖像的局部不變SURF特征點(diǎn),實(shí)現(xiàn)旋轉(zhuǎn)雙耳的定位與識別。文獻(xiàn)[5]利用圖像的HOG特征和線性SVM分類器來確定旋轉(zhuǎn)雙耳的邊界框。這些研究取得了較好的效果,但仍存在目標(biāo)形態(tài)、光照、背景等擾動因素造成的定位準(zhǔn)確率不高的問題。文獻(xiàn)[6-7]基于深度卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)定位算法,在定位精度和可靠性方面取得了突破性的進(jìn)展。但這類方法在接觸網(wǎng)零部件定位中的研究尚未見有報道。
基于圖像的故障檢測,主要通過手工設(shè)計(jì)特征或特征學(xué)習(xí)來實(shí)現(xiàn)。文獻(xiàn)[8]進(jìn)行圖像增強(qiáng),通過提取絕緣子的邊緣來判斷絕緣子是否破損。文獻(xiàn)[9]通過形態(tài)學(xué)濾波對圖像進(jìn)行預(yù)處理,通過免疫遺傳算法得到較為完整的絕緣子串輪廓,從而判斷絕緣子是否爆裂。文獻(xiàn)[5]利用二維Gabor小波變換篩選圖像中的邊緣信息,實(shí)現(xiàn)耳片斷裂故障的識別。上述文獻(xiàn)基于手工設(shè)計(jì)特征實(shí)現(xiàn)故障檢測的方法,設(shè)計(jì)復(fù)雜、可擴(kuò)展性和魯棒性較差。文獻(xiàn)[10]利用深度網(wǎng)絡(luò)學(xué)習(xí)圖像的特征,實(shí)現(xiàn)異常巡線圖像的智能檢索。文獻(xiàn)[11]采用遷移學(xué)習(xí)策略,通過預(yù)訓(xùn)練的深度網(wǎng)絡(luò)提取圖像的深層特征,實(shí)現(xiàn)胸部疾病的智能篩查。文獻(xiàn)[12]利用深度學(xué)習(xí)自適應(yīng)提取振動信號的頻譜特征向量,通過粒子群支持向量機(jī)分類器實(shí)現(xiàn)齒輪故障診斷。這些研究利用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)圖像的特征學(xué)習(xí),其特征具有較強(qiáng)的表達(dá)能力,有效克服了手工特征的缺點(diǎn),但均未考慮故障樣本較少造成的數(shù)據(jù)不平衡性及其影響。
本文提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)的旋轉(zhuǎn)雙耳開口銷釘缺失故障檢測方法,該方法包含旋轉(zhuǎn)雙耳開口銷釘定位與開口銷釘缺失檢測兩個過程。其中開口銷釘定位分兩步完成:首先通過Faster R-CNN網(wǎng)絡(luò)對旋轉(zhuǎn)雙耳整體進(jìn)行精確定位,然后在整體定位結(jié)果的基礎(chǔ)上,再次使用Faster R-CNN算法進(jìn)一步完成對雙耳開口銷釘?shù)木_定位,突出開口銷釘特征,最大程度降低背景對狀態(tài)識別的干擾。而開口銷釘缺失檢測過程,則通過多個深度特征提取器提取開口銷釘圖像的多種特征,由多個SVM弱分類器構(gòu)成的集成分類器實(shí)現(xiàn)故障檢測。
旋轉(zhuǎn)雙耳開口銷釘定位方法包含兩個卷積神經(jīng)網(wǎng)絡(luò):區(qū)域推薦網(wǎng)絡(luò)RPN(Regional Proposal Network)和Fast RCNN目標(biāo)識別網(wǎng)絡(luò)[7],如圖1所示。RPN和Fast RCNN共享卷積層,將整幅圖像輸入深度卷積網(wǎng)絡(luò)得到圖像的特征圖譜,通過RPN產(chǎn)生一組可能存在待檢目標(biāo)的矩形推薦區(qū)域;把獲取的推薦區(qū)域饋送到Fast RCNN的ROI(Region of Interest)池化層,ROI池化層將任何有效區(qū)域內(nèi)的特征轉(zhuǎn)換為固定長度的特征向量;通過全連接層實(shí)現(xiàn)目標(biāo)識別定位。
圖1 基于Faster-RCNN的目標(biāo)定位架構(gòu)
推薦區(qū)域的質(zhì)量和數(shù)量直接影響目標(biāo)識別的精度和速度?;趫D像底層特征的區(qū)域推薦方法,如Selective Search[13]和Edge Boxes[14]等,運(yùn)算速度較慢而且推薦的區(qū)域較多。RPN使用卷積網(wǎng)絡(luò)直接產(chǎn)生推薦區(qū)域,獲得了更高的召回率,推薦了數(shù)量更少的矩形區(qū)域,有效提高了檢測的精度和速度。RPN是一個全卷積網(wǎng)絡(luò),它以圖像作為輸入,使用卷積網(wǎng)絡(luò)直接產(chǎn)生可能包含待檢目標(biāo)的推薦區(qū)域。
如圖2所示,RPN網(wǎng)絡(luò)通過一個3×3的空間窗口在共享卷積層的特征圖譜上滑動,將每個窗口內(nèi)的卷積特征映射為較低維度的特征。低維特征被饋送至兩個全連接層,分別輸出推薦區(qū)域邊界框的位置和該邊界框中包含目標(biāo)的信度。上述結(jié)構(gòu)分別通過一個3×3的卷積層和兩個1×1卷積層實(shí)現(xiàn)。為了實(shí)現(xiàn)檢測的平移不變性和多尺度性,RPN網(wǎng)絡(luò)設(shè)計(jì)了錨定機(jī)制:在每個滑動窗口的位置,產(chǎn)生尺度和長寬比不同的k個錨框,同時輸出k個錨框的坐標(biāo)和邊界框中包含目標(biāo)的信度。
圖2 RPN網(wǎng)絡(luò)結(jié)構(gòu)
為了訓(xùn)練RPN,首先標(biāo)定訓(xùn)練樣本,給出圖像中待檢目標(biāo)的邊界框坐標(biāo)(用4維向量表示)。根據(jù)每個錨框是否包含待檢目標(biāo),為其分配一個二分類標(biāo)簽。與某一個真實(shí)目標(biāo)框交叉重疊率最大的錨框或與任意一個真實(shí)目標(biāo)框交叉重疊率大于0.7的錨框,被分配正標(biāo)簽。而與任一真實(shí)目標(biāo)框交叉重疊率都小于0.3的錨框,則被分配負(fù)標(biāo)簽。根據(jù)上述標(biāo)簽和待檢目標(biāo)的真實(shí)邊界框坐標(biāo),可以定義如下多目標(biāo)損失函數(shù)。
( 1 )
Lreg的定義為
( 2 )
式中:
( 3 )
Lcls的定義為
( 4 )
以損失函數(shù)式( 1 )最小化為優(yōu)化目標(biāo),采用隨機(jī)梯度下降優(yōu)化方法,通過反向傳播即可完成RPN網(wǎng)絡(luò)的訓(xùn)練。訓(xùn)練完成后,輸入待檢圖像,RPN即可輸出可能包含待檢目標(biāo)的推薦區(qū)域。
Fast R-CNN網(wǎng)絡(luò)將整幅圖像和RPN輸出的推薦區(qū)域作為輸入,分別輸出檢測到的目標(biāo)的種類和位置[6],如圖1所示。通過共享卷積神經(jīng)網(wǎng)絡(luò)處理整個圖像,以產(chǎn)生特征圖;對于每個推薦區(qū)域,利用ROI池化層將任何有效感興趣區(qū)域內(nèi)的特征轉(zhuǎn)換為固定長度的特征向量;通過全連接層實(shí)現(xiàn)目標(biāo)識別。
由于RPN產(chǎn)生多種大小和形狀不同的推薦區(qū)域,如果用普通的卷積層在推薦區(qū)域內(nèi)直接提取特征,則特征的維度各不相同,無法設(shè)計(jì)后續(xù)網(wǎng)絡(luò)。ROI池化層使用最大池化的方法,將任何有效推薦區(qū)域內(nèi)的特征轉(zhuǎn)換為7×7的固定空間范圍的小特征圖。這樣ROI池化層為每個推薦區(qū)域提取了固定長度特征向量,這些特征向量被饋送到全連接層,然后被同時送到兩個輸出層:一個給出目標(biāo)屬于各類別的概率估計(jì),另一個給出目標(biāo)邊界框的坐標(biāo)。結(jié)合這兩個輸出,即可確定檢測所得目標(biāo)的種類和位置,完成目標(biāo)識別。
為了訓(xùn)練Fast RCNN目標(biāo)識別網(wǎng)絡(luò),根據(jù)RPN輸出的推薦區(qū)域,以及已標(biāo)定的訓(xùn)練樣本中待檢目標(biāo)的類別和邊界框坐標(biāo),生成每個推薦區(qū)域的真實(shí)類別和邊界框坐標(biāo)標(biāo)簽。結(jié)合Fast R-CNN檢測輸出目標(biāo)的種類以及邊界框坐標(biāo),可以定義如下多目標(biāo)損失函數(shù)。該目標(biāo)函數(shù)包括分類損失和回歸損失兩部分。
L(p,u,tu,v)=Lcls1(p,u)+λ[u≥1]Lloc(tu,v)
( 5 )
式中:p=(p0,…,pk)為預(yù)測的推薦區(qū)域?qū)儆诟黝悇e的離散概率分布,k為待識別目標(biāo)的類別數(shù),0表示背景類;u為推薦區(qū)域所屬的真實(shí)類別;tu為目標(biāo)坐標(biāo)向量的預(yù)測值;v為目標(biāo)坐標(biāo)向量的真實(shí)值;λ為平衡權(quán)重;Lcls1和Lloc分別為分類損失和回歸損失。Lcls1和Lloc的定義如下
Lcls1(p,u)=-lgpu
( 6 )
( 7 )
其中
( 8 )
采用隨機(jī)梯度下降優(yōu)化方法,以損失函數(shù)式( 5 )最小化為優(yōu)化目標(biāo),通過反向傳播即可完成Fast R-CNN的訓(xùn)練。訓(xùn)練完成后,輸入待檢圖像和RPN產(chǎn)生的推薦區(qū)域,F(xiàn)ast R-CNN即可完成目標(biāo)檢測任務(wù)。
為了使用Faster R-CNN進(jìn)行接觸網(wǎng)零部件定位,需要對其進(jìn)行訓(xùn)練。如圖1所示,F(xiàn)aster R-CNN采用深層卷積網(wǎng)絡(luò)提取圖像的特征,為了提高檢測速度,RPN和Fast R-CNN共享這些卷積層。RPN和Fast R-CNN可以作為兩個網(wǎng)絡(luò)分別進(jìn)行單獨(dú)訓(xùn)練,這樣他們將以不同的方式改變共享卷積層。另外,RPN和Fast R-CNN作為深層網(wǎng)絡(luò),如果隨機(jī)初始化網(wǎng)絡(luò)參數(shù),并從頭開始訓(xùn)練,將需要較大的數(shù)據(jù)集。在一個大規(guī)模的輔助數(shù)據(jù)集上進(jìn)行監(jiān)督預(yù)訓(xùn)練,在小數(shù)據(jù)集上進(jìn)行特異性微調(diào)訓(xùn)練,是數(shù)據(jù)集較小時學(xué)習(xí)大規(guī)模CNN的有效方法[7]。因此,本文利用在ImageNet預(yù)訓(xùn)練的模型參數(shù)初始化共享卷積層,利用已標(biāo)定的旋轉(zhuǎn)雙耳數(shù)據(jù)集交替訓(xùn)練RPN和Fast R-CNN,完成旋轉(zhuǎn)雙耳的Faster R-CNN定位網(wǎng)絡(luò)模型。具體步驟如下:
Step1使用在ImageNet上預(yù)訓(xùn)練的模型初始化RPN,使用旋轉(zhuǎn)雙耳數(shù)據(jù)集微調(diào)RPN網(wǎng)絡(luò)。
Step2使用在ImageNet上預(yù)訓(xùn)練的模型初始化Fast R-CNN,并使用Step1中訓(xùn)練的RPN提取旋轉(zhuǎn)雙耳的推薦區(qū)域,訓(xùn)練Fast R-CNN網(wǎng)絡(luò)。
Step3使用Step2得到的Fast R-CNN模型重新初始化RPN,并固定共享卷積層,使用旋轉(zhuǎn)雙耳數(shù)據(jù)集對RPN進(jìn)行再次微調(diào)。
Step4固定Step2中Fast R-CNN模型的共享卷積層,使用Step3得到的RPN提取旋轉(zhuǎn)雙耳的推薦區(qū)域,對Fast R-CNN進(jìn)行再次微調(diào)。
經(jīng)過以上4個步驟的訓(xùn)練,兩個網(wǎng)絡(luò)共享相同的卷積層,并形成統(tǒng)一的Faster R-CNN網(wǎng)絡(luò),即可實(shí)現(xiàn)旋轉(zhuǎn)雙耳的定位。
利用上述訓(xùn)練過程得到的旋轉(zhuǎn)雙耳定位網(wǎng)絡(luò)對旋轉(zhuǎn)雙耳進(jìn)行定位,產(chǎn)生旋轉(zhuǎn)雙耳圖像數(shù)據(jù)集,對其進(jìn)行標(biāo)定。
產(chǎn)生旋轉(zhuǎn)雙耳開口銷釘定位網(wǎng)絡(luò)的訓(xùn)練集,使用同樣的四步訓(xùn)練方法得到開口銷釘?shù)腇aster R-CNN定位網(wǎng)絡(luò)。綜合使用這兩個Faster R-CNN網(wǎng)絡(luò),即可實(shí)現(xiàn)旋轉(zhuǎn)雙耳開口銷釘定位。
完成開口銷釘?shù)木_定位后,有效去除了圖像中其他部分的干擾,使圖像的特征更加突出,為故障檢測奠定了基礎(chǔ)。由于拍攝環(huán)境復(fù)雜,拍攝角度和開口銷釘形狀、方向的多樣性,使得人工提取圖像的可靠特征較為困難,造成檢測結(jié)果的不可靠。為提高檢測結(jié)果的可靠性,本文設(shè)計(jì)了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)和線性SVM的集成分類器,用于旋轉(zhuǎn)雙耳開口銷釘?shù)臓顟B(tài)識別,如圖3所示。該分類器主要包含兩個部分:深度特征提取器和集成分類器。
圖3 集成分類器結(jié)構(gòu)
目前圖像特征提取方法主要分為基于手工設(shè)計(jì)的方法和基于特征學(xué)習(xí)的方法。常用的手工設(shè)計(jì)特征有HOG、SIFT和SURF等。近年來,深度學(xué)習(xí)得到了快速發(fā)展,尤其是深度卷積神經(jīng)網(wǎng)絡(luò)在圖像分類和目標(biāo)識別等任務(wù)上,取得了較好的成績,并且大大提高了效率。因此,本文采用這一方法,將其作為特征提取器應(yīng)用于開口銷釘缺失故障識別。
在深度卷積神經(jīng)網(wǎng)絡(luò)中,大多數(shù)神經(jīng)元只與附近的神經(jīng)元連接,而且進(jìn)行權(quán)值共享,這極大地減少了網(wǎng)絡(luò)參數(shù),提高訓(xùn)練速度。如圖4所示,深度卷積網(wǎng)絡(luò)中主要有3種結(jié)構(gòu):卷積層、池化層和全連接層。
圖4 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
在卷積層中,輸入數(shù)據(jù)與線性濾波器進(jìn)行卷積后,通過非線性激活函數(shù)獲得特征圖,每層特征圖包含一種特征并共享相同的參數(shù),而不同的特征圖使用不同的參數(shù)來提取不同的特征,卷積公式為
( 9 )
池化層對特征圖進(jìn)行下采樣,降低特征圖和網(wǎng)絡(luò)參數(shù)的維度,使特征更易于后續(xù)處理,并在一定程度上減輕過擬合現(xiàn)象。池化公式為
(10)
全連接層與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)類似,該層中每個神經(jīng)元與所有的輸入相連。
深層卷積神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的圖像特征提取能力,但訓(xùn)練深層網(wǎng)絡(luò)需要大量的數(shù)據(jù),由于接觸網(wǎng)圖像中故障樣本相對較少,不足以訓(xùn)練大型網(wǎng)絡(luò)。針對這一問題,采用遷移學(xué)習(xí)的策略[15],采用預(yù)先訓(xùn)練的深度網(wǎng)絡(luò)模型,將其作為接觸網(wǎng)數(shù)據(jù)集的特征提取器。這些模型在規(guī)模很大的數(shù)據(jù)集ImageNet上進(jìn)行了訓(xùn)練,以其強(qiáng)大的特征提取能力,近年來對圖像處理領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響[16-19]。通過不同的卷積神經(jīng)網(wǎng)絡(luò),提取接觸網(wǎng)圖像的不同特征,可以從不同的方面對圖像進(jìn)行綜合分析,進(jìn)而得到更加可靠的檢測結(jié)果。
在接觸網(wǎng)數(shù)據(jù)集中,故障樣本相對于正常樣本較少,如果直接利用這些數(shù)據(jù)進(jìn)行分類器設(shè)計(jì),將會存在嚴(yán)重的過擬合問題。集成學(xué)習(xí)作為解決這一問題的有效方法,在諸多領(lǐng)域得到了廣泛應(yīng)用[20-21]。根據(jù)不同深度卷積網(wǎng)絡(luò)提取的不同特征,分別訓(xùn)練弱分類器,然后按一定的規(guī)則將這些弱分類器的結(jié)果進(jìn)行融合,從而獲取更好的分類性能。
如圖3所示,本文設(shè)計(jì)的集成分類器由多個線性SVM弱分類器通過加權(quán)投票構(gòu)成,其中,每個弱分類器的加權(quán)投票系數(shù),是根據(jù)線性SVM弱分類器在驗(yàn)證集的表現(xiàn)計(jì)算產(chǎn)生的,為可靠性高的弱分類器賦予更高權(quán)值,從而提高集成分類器的可靠性。集成分類器的具體實(shí)現(xiàn)過程如下:
(1)集成分類器的訓(xùn)練過程
將數(shù)據(jù)集分為三部分:訓(xùn)練集TR,驗(yàn)證集V和測試集TE。TR用于訓(xùn)練弱分類器,V用于計(jì)算線性SVM弱分類器的投票系數(shù),TE用于評價分類器的性能;利用k個深度卷積網(wǎng)絡(luò),分別提取TR、V和TE的特征,并生成相應(yīng)的特征訓(xùn)練集FTR,特征驗(yàn)證集FV和特征測試集FTE;根據(jù)特征訓(xùn)練集FTR中的每類特征,分別訓(xùn)練線性SVM分類器Mj;最后,根據(jù)訓(xùn)練得到的線性SVM弱分類器Mj在特征驗(yàn)證集FV上的表現(xiàn),計(jì)算Mj的投票權(quán)重wj。
(11)
(12)
(13)
(14)
式中:P為精確率;R為召回率;TP為故障樣本被預(yù)測為故障樣本的數(shù)目;FP為正常樣本被預(yù)測為故障樣本的數(shù)目;FN為故障樣本被預(yù)測為正常樣本的數(shù)目。
(2)集成分類器的預(yù)測過程
針對每個測試樣本,根據(jù)線性SVM弱分類器Mj給出的預(yù)測結(jié)果Lj和該弱分類器的投票權(quán)重wj,進(jìn)行加權(quán)投票給出分類預(yù)測結(jié)果CLi,即
(15)
式中:k為弱分類器數(shù),等于深度特征種類數(shù)。根據(jù)集成分類器的預(yù)測結(jié)果CLi,即可判定開口銷釘是否缺失。
為了驗(yàn)證基于Faster R-CNN的定位算法的有效性,從接觸網(wǎng)圖像庫中,選取旋轉(zhuǎn)雙耳圖像4 000張,從中隨機(jī)分出2 000張作為訓(xùn)練集和2 000張作為測試集,進(jìn)行旋轉(zhuǎn)雙耳和開口銷釘定位實(shí)驗(yàn)。選擇VGG16網(wǎng)絡(luò)的卷積層作為Faster RCNN目標(biāo)識別算法的共享卷積層,算法運(yùn)行的硬件環(huán)境為Intel Core i7-7600和NVDIA GTX1070,軟件環(huán)境為Caffe和Python。旋轉(zhuǎn)雙耳和開口銷釘?shù)牟糠侄ㄎ唤Y(jié)果如圖5所示。
圖5 定位效果圖
圖5(a)為旋轉(zhuǎn)雙耳整體定位效果,在旋轉(zhuǎn)雙耳方向、傾斜角度不同,以及圖像中存在多個旋轉(zhuǎn)雙耳時,該算法均實(shí)現(xiàn)有效定位。在完成旋轉(zhuǎn)雙耳整體定位后,根據(jù)定位結(jié)果,進(jìn)一步完成開口銷釘定位,定位結(jié)果如圖5(b)所示,在開口銷釘方向、形狀不同以及開口銷釘缺失的情況下,均能實(shí)現(xiàn)開口銷釘?shù)挠行Фㄎ弧?/p>
為了進(jìn)一步驗(yàn)證基于Faster R-CNN的定位算法的性能,本文將該算法分別與線性SVM結(jié)合HOG特征和線性SVM結(jié)合SIFT特征的多尺度滑動窗口定位方法進(jìn)行了對比實(shí)驗(yàn)。實(shí)驗(yàn)中,當(dāng)定位識別框與真實(shí)目標(biāo)框的重疊率在90%以上時,則認(rèn)為定位成功,否則認(rèn)為定位失敗。3種方法的定位結(jié)果見表1。
表1 不同定位方法實(shí)驗(yàn)結(jié)果
基于Faster R-CNN的定位算法,對旋轉(zhuǎn)雙耳整體定位成功率達(dá)到了99%以上,開口銷釘?shù)亩ㄎ怀晒β蔬_(dá)到了98%以上,相比于SVM+HOG和SVM+SIFT方法,在定位成功率上有大幅度提升。因此,基于Faster RCNN的定位算法具有更強(qiáng)的適應(yīng)性和穩(wěn)定性,能夠?qū)崿F(xiàn)旋轉(zhuǎn)雙耳開口銷釘?shù)母呔榷ㄎ弧?/p>
通過開口銷釘定位實(shí)驗(yàn),獲得上、下開口銷釘圖像各2 136、2 245張(其中包含上、下開口銷釘缺失圖像各265、236張)用于開口銷釘缺失檢測實(shí)驗(yàn)。本文采用交叉驗(yàn)證的方法來驗(yàn)證故障檢測方法的有效性,分別對上、下開口銷釘各進(jìn)行3次故障檢測實(shí)驗(yàn),用3次預(yù)測結(jié)果的平均值來衡量檢測方法的性能。在3次驗(yàn)證實(shí)驗(yàn)中,訓(xùn)練集、驗(yàn)證集和測試集分別占總數(shù)據(jù)集的1/2、1/6和1/3。在實(shí)際檢測過程中,期望檢測結(jié)果同時具有較低的漏檢率和合理的誤檢率,也即要求分類器具有較高的召回率和F1得分,因此采用這兩項(xiàng)指標(biāo)來綜合評價分類器的性能。在實(shí)驗(yàn)中,提取圖像的HOG和SIFT兩種手工特征,利用VGG16[16]、CaffeNet[17]、GoogleNet[18]和ResNet50[19]提取圖像的4種深度特征,其中深度特征為深度網(wǎng)絡(luò)的第一個全連接層提取的特征向量。利用這些特征,分別訓(xùn)練單分類器和集成分類器用于故障檢測。不同檢測方法對上、下開口銷釘缺失故障的檢測結(jié)果見表2。
表2 開口銷釘缺失故障檢測實(shí)驗(yàn)結(jié)果
從實(shí)驗(yàn)結(jié)果可以看出,在上開口銷釘缺失檢測中,基于手工特征的分類器,最高召回率為0.82,最高F1得分為0.84;基于深度特征的單個分類器,最低召回率為0.90,最低F1得分為0.91;集成分類器的召回率為0.95,F(xiàn)1得分為0.96。在下開口銷釘缺失檢測中,基于手工特征的分類器,最高召回率為0.86,最高F1得分為0.87;基于深度特征的單個分類器,最低召回率為0.90,最低F1得分為0.91;集成分類器的召回率為0.97,F(xiàn)1得分為0.97。在兩種開口銷釘缺失的檢測過程中,集成分類器都取得了較高的召回率和F1得分。
綜合以上結(jié)果可知,雖然ImageNet數(shù)據(jù)集與接觸網(wǎng)數(shù)據(jù)集差別較大,預(yù)訓(xùn)練深度網(wǎng)絡(luò)模型仍能有效提取接觸網(wǎng)圖像的特征,用于開口銷釘缺失故障檢測。利用不同的深度網(wǎng)絡(luò)提取圖像的不同特征,并將多個弱分類器進(jìn)行集成,能夠有效提高分類器的召回率和F1得分。因此,本文提出的基于圖像深度特征和集成學(xué)習(xí)的識別方法,能夠有效檢測旋轉(zhuǎn)雙耳開口銷釘缺失故障。
本文對高速鐵路接觸網(wǎng)支撐裝置中旋轉(zhuǎn)雙耳開口銷釘缺失故障檢測問題,進(jìn)行深入研究,提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)的故障檢測方法。該方法利用Faster R-CNN網(wǎng)絡(luò)實(shí)現(xiàn)了對高鐵接觸網(wǎng)旋轉(zhuǎn)雙耳開口銷釘?shù)母呔榷ㄎ?,通過多個預(yù)訓(xùn)練的深度卷積神經(jīng)網(wǎng)絡(luò)提取開口銷釘圖像的多種特征,最終由多個SVM弱分類器構(gòu)成的集成分類器實(shí)現(xiàn)故障檢測。實(shí)驗(yàn)結(jié)果表明,本文方法能在復(fù)雜的接觸網(wǎng)支撐裝置圖像中實(shí)現(xiàn)旋轉(zhuǎn)雙耳開口銷釘?shù)木_定位,并能以較高的可靠性完成開口銷釘缺失故障檢測,具有較高的工程應(yīng)用價值。