楊 璟,王小敏,張文芳,鄭啟明,陳 磊
(1.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756;2.英國伯明翰大學(xué) 伯明翰鐵路研究與教育中心, 伯明翰 B15 2TT)
軌道電路是自動完成列車占用狀態(tài)檢查的鐵路信號設(shè)備,其工作質(zhì)量直接影響鐵路運輸?shù)男?,也是列車安全運行的重要保障。軌道電路故障模式復(fù)雜,現(xiàn)場處理故障時間較長,嚴(yán)重影響鐵路運輸秩序,是鐵路信號現(xiàn)場維護的難點。因此,探索各種智能診斷方法以縮短故障處理時間,提升軌道電路故障維護效率,正成為人們關(guān)注的熱點。
目前,已有部分學(xué)者對ZPW-2000軌道電路故障智能診斷展開研究,如:基于神經(jīng)網(wǎng)絡(luò)算法[1-2]構(gòu)造軌道電路相關(guān)變量與軌道電路相關(guān)故障的非線性映射關(guān)系,繼而實現(xiàn)故障的識別分類;基于粗糙集和模糊認(rèn)知圖[3]對監(jiān)測數(shù)據(jù)進行屬性約簡提取特征參數(shù),構(gòu)建分類器實現(xiàn)故障診斷;通過組合決策樹[4]建立組合網(wǎng)絡(luò)模型獲取診斷規(guī)則,逐級壓縮診斷范圍最終完成多故障識別;利用相空間重構(gòu)技術(shù)[5]對一維分路電流包絡(luò)信號序列進行重構(gòu)操作,提取補償電容的故障特征,從而實現(xiàn)補償電容故障的檢測;基于集中監(jiān)測系統(tǒng)獲取的電壓值或電流值[1,3-4]、機車或動檢車采集的感應(yīng)信號[2,5-9],通過對穩(wěn)態(tài)值進行分析處理,從而對軌道電路故障進行診斷。以上方法雖對故障機理明確或有較多歷史故障信息的顯性故障診斷精度較高,但在穩(wěn)態(tài)條件下可能忽略正常與故障狀態(tài)之間的暫歇性波動狀態(tài)[10],因其故障信息較少或無故障信息。然而如果只對正常和故障兩種狀態(tài)進行判別,很難滿足鐵路現(xiàn)場對軌道電路設(shè)備的診斷要求,因此對軌道電路暫態(tài)故障進行診斷尤為必要。
ZPW-2000軌道電路發(fā)生故障,其實質(zhì)是軌道電路參數(shù)的突變,從而引發(fā)軌道信號幅值由暫態(tài)過渡到穩(wěn)態(tài)[11]。若能基于集中監(jiān)測系統(tǒng)對采集的軌道電路電壓信號進行暫態(tài)分析,探究其暫態(tài)特性與軌道電路故障的關(guān)系,實現(xiàn)故障地面實時檢測,則可提高診斷的便利性和時效性。
本文首先通過實地測試模擬故障獲取數(shù)據(jù),并對軌道電路故障時電壓暫態(tài)波形進行分析,組合利用梅爾頻率譜系數(shù)和動態(tài)時間規(guī)整算法建立軌道電路診斷模型;然后通過該模型利用主成分分析約簡特征屬性,再融入Fisher準(zhǔn)則和K-means聚類選擇合適故障模板,最終得到的模板具有清晰明顯的特點。測試結(jié)果表明,基于集中監(jiān)測系統(tǒng)與模型的使用,能夠?qū)壍离娐吩O(shè)備的多狀態(tài)進行有效識別,提高診斷效率,為軌道電路的狀態(tài)監(jiān)測提供合理補充。
ZPW-2000軌道電路由軌面、發(fā)送端和接收端組成,其中發(fā)送端包括發(fā)送器、傳輸電纜和防雷單元,接收端包括接收器、衰耗器、傳輸電纜和防雷單元。發(fā)送端至接收端軌面等間距分布著補償電容,相鄰軌道電路區(qū)間由調(diào)諧區(qū)實現(xiàn)電氣隔離。ZPW-2000軌道電路結(jié)構(gòu)示意見圖1。
圖1 ZPW-2000軌道電路結(jié)構(gòu)示意
在集中監(jiān)測系統(tǒng)中,反映軌道電路性能狀態(tài)的主要指標(biāo)是電壓,因此本文采用軌道電路電壓數(shù)據(jù)進行故障診斷,以軌道電路的多故障系統(tǒng)作為研究對象。軌入電壓在一段時間內(nèi)的電壓狀態(tài)曲線見圖2,其按照時間的先后順序可以分成三部分:正常、波動、正常。對于ZPW-2000軌道電路,在不同時間、地點、環(huán)境下其電壓曲線波動情況會略有不同,但是總體上還是一致的。
圖2 軌入電壓曲線
為了驗證軌道電路暫態(tài)理論的合理性,通過分析故障產(chǎn)生的原因[12-13],查閱現(xiàn)場實際案例的相關(guān)資料,并結(jié)合現(xiàn)場工作人員的歷史經(jīng)驗,在西南交通大學(xué)軌道電路試驗基地進行了常見故障的測試。故障采集系統(tǒng)包括硬件和軟件兩部分。硬件部分進行通信、自動切換測試點和采集模擬量等;軟件部分進行發(fā)送指令、數(shù)據(jù)采集和存儲等。測試的核心板卡選用NI-USB 6251,采樣頻率可達10 MHz,單點定位輸出時序差分?jǐn)?shù)據(jù)。針對不同故障的暫態(tài)過程進行數(shù)據(jù)采集,輸出的數(shù)據(jù)具有噪聲較小、精確度高等特點。使用LabVIEW中的DAQmx控件做上位機,圖形化編寫簡單。測試系統(tǒng)結(jié)構(gòu)見圖3。圖3中,主機確認(rèn)采集點后,由DAQmx控件把采集命令傳給采集卡,通過采集卡與室內(nèi)設(shè)備通信,切換單元控件自動選擇采集點,并通過采集卡將采集的數(shù)據(jù)傳入計算機中存儲。軌道電路故障模式見表1。
圖3 測試系統(tǒng)結(jié)構(gòu)
表1 軌道電路故障模式
對表1中8種故障類型每種隨機各選一組提取包絡(luò),見圖4。由圖4可以看出,F1~F8故障的表現(xiàn)形式差異較為明顯:F1為發(fā)送端故障,軌入電壓短暫趨于0;F2為防雷單元故障,設(shè)備短時間內(nèi)電壓波動幅度較大;F3為電纜網(wǎng)絡(luò)模擬故障,設(shè)備短時間內(nèi)電壓波動趨于0;F4為空心線圈斷線故障,軌出1電壓瞬間幅度降低;F5為調(diào)諧單元短路故障,軌出2電壓瞬間波動幅度較大;F6為主軌故障,軌出2電壓短時間波動幅度較大;F7為小軌故障,軌出1電壓短時間波動幅度較大;F8為單個補償電容斷線故障,主軌電壓瞬間降低。
圖4 F1~F8的故障信號包絡(luò)
圖4展示了故障的發(fā)生會導(dǎo)致電壓值的瞬間波動,工作狀態(tài)發(fā)生跳變,可以較為直觀地反映故障信息。但是,實際列車運行條件下設(shè)備會受到多方面影響,如天氣、人為等因素,使故障波形不能直觀精準(zhǔn)反映故障位置,難以及時為維修人員提供有效的指導(dǎo)。因此,本文對ZPW-2000軌道電路的多種故障模式進行智能識別,組合使用PMFCC-DTW算法建立軌道電路診斷模型。
梅爾頻率倒譜(Mel-Frequency Cepstrum Coefficient, MFCC)在語音處理中表示一個語音的短時功率譜,由對數(shù)功率譜在頻率的一個非線性梅爾刻度上進行線性余弦轉(zhuǎn)換所得[14]。梅爾頻率倒譜fmel與頻率f的關(guān)系為
(1)
軌道電路在復(fù)雜的工況下,暫態(tài)故障通常是潛在的故障或早期的微弱故障,具有故障特征不明顯、易被噪聲影響的特點,使故障難以被發(fā)現(xiàn)。MFCC是按臨界帶寬由密到疏形成一組帶通濾波器,對樣本信號進行濾波,可以有效抑制非本頻帶的高頻噪聲成分。并且通過大量試驗發(fā)現(xiàn),當(dāng)軌道電路發(fā)生故障時,不同狀態(tài)下同一頻帶的信號頻率基本一致,使用MFCC提取得到的不同狀態(tài)下的特征各不相同,因此可以將MFCC用于軌道電路的故障診斷中。具體診斷過程如下:
Step1濾波輸出為
H(z)=1-αz-1
(2)
Step2輸出對數(shù)能量為
(3)
1≤m≤M
Step3提取梅爾系數(shù)為
(4)
式中:n為梅爾系數(shù)的數(shù)量;Ci(n)為第i幀的第n個MFCC系數(shù);s(m)為對數(shù)能量模塊的輸出;M為Mel濾波器的個數(shù)。
由上述過程,依次獲取8種故障的總采樣點數(shù),分別計算出每幀MFCC參數(shù)Sm和差分系數(shù)特征集Cn,約簡后得到特征矩陣Mmel為
Mmel=|SmCn|
(5)
通過MFCC提取的特征能夠精準(zhǔn)地捕捉信號變化,但是信號特征維度較高,不利于可視化分析,更會導(dǎo)致診斷時間增長。因此,本文利用主成分分析(Principal Component Analysis,PCA),對高維數(shù)據(jù)進行壓縮,把可能具有相關(guān)性的高維變量合成線性無關(guān)的低維變量,新的低維變量集會盡可能保留原始信號的特征。組合MFCC和PCA,尋找和保留最有效、最重要的信號特征,從而降低計算復(fù)雜度、減少數(shù)據(jù)存儲量,并且提高信號識別的效率。
在模式匹配中,通常選用動態(tài)時間規(guī)整(Dynamic time warping,DTW)求解衡量不同信號間似然度的測度函數(shù),也可以不要求每條故障數(shù)據(jù)長度嚴(yán)格對齊,允許在時間軸上的拉伸或壓縮[15]。本文通過計算模板庫和測試集中對應(yīng)幀之間的失真距離,得出幀匹配距離矩陣,編制DTW表格。表格中的格點是對應(yīng)的交匯點,按照距離最短原則搜索格點,反復(fù)遞推得到組最優(yōu)解,并將累積距離最小的歸為此類故障。
將實測數(shù)據(jù)分為測試故障和故障模板,分別為X=(x1,x2,…,xm)和Y=(y1,y2,…,yn),長度分別為m和n。其中xi與yj之間的距離dij采用歐式距離計算
dij=d(xi,yj)=|xi-yj|
(6)
計算得出兩序列對應(yīng)點間的距離矩陣D,并在D中確定出一條路徑W=(w1,w2,…,wk)讓X與Y匹配程度最大。為了求出有效路徑,需要符合的約束條件見表2。
表2 約束條件
計算得出多條路徑,其中最優(yōu)路徑為
(7)
綜上所述,本模型的基本原理為,首先針對MFCC算法進行優(yōu)化,然后結(jié)合PCA降維的梅爾頻率倒譜(以下簡稱為“PMFCC算法”),并組合DTW算法診斷出故障類型,簡稱為“PMFCC-DTW算法”。
本文將PMFCC特征提取過程分為兩部分:梅爾頻率系數(shù)和主成分分析。通過梅爾頻率系數(shù)獲取MFCC特征值后利用PCA進行降維處理,最終得到軌道電路特征參數(shù)。軌道電路特征提取流程見圖5。
圖5 軌道電路特征提取流程
選用圖4中8種不同故障的信號進行MFCC特征提取,得到24維的MFCC信號特征,再進行PCA降維。通過求得各主成分φk的貢獻率μk,計算出降維滿意度。假如前k個主成分的累計貢獻率δk大于閾值(通常為85%),則選取前k個主成分作為新的樣本主成分進行循環(huán)。其中,第k個主成分貢獻率為
(8)
通過計算得出符合閾值的特征維數(shù)并不唯一,為更好地選出最有效的特征維數(shù),本文利用費舍爾判別準(zhǔn)則(Fisher準(zhǔn)則)對滿足累計貢獻率δk>85%的特征參數(shù)直接進行二分類求解,其最優(yōu)參數(shù)求解公式為
(9)
式中:Sa為類內(nèi)散度矩陣;Sb為類間散度矩陣。
設(shè)d維度空間的兩類樣本為X1和X2,且樣本個數(shù)為N,當(dāng)d維度空間的樣本映射到一維Y空間時得到y(tǒng)=wtx。其中,類內(nèi)散度矩陣與類間散度矩陣分別為
(10)
(11)
圖6 Fisher準(zhǔn)則分類正確率
從圖6可以看出,8種故障的特征數(shù)據(jù)在不同維度下分類的正確性有很大不同。計算不同維數(shù)分類正確率的平均值,6維為78.54%、8維為87.39%、10維為81.19%、14維為78.22%、18維為74.09%,可以看出8維的分類正確率最高,隨著維度增加或減少,特征數(shù)據(jù)的分類效果降低,差異性變小。因此,本文以8維數(shù)據(jù)作為信號特征。
進一步對降維后PMFCC算法得到的8維條件下信號特征與MFCC算法的24維信號特征進行比較分析,利用歐氏距離計算不同故障間的相對距離,通過距離的大小分析不同故障間的差異性。選定F1故障作為參考與F2~F8故障進行比較計算,然后歸一化處理得到雷達圖,見圖7。
圖7 F1作為參考的雷達圖
從圖7中可以看出,8維條件下PMFCC算法的特征數(shù)據(jù)差異性高于24維條件下MFCC算法,并且F1與F2~F8故障的相對距離較為均勻,不易受到外界干擾。同理,將F2~F8分別作為參考,計算得到的結(jié)果與圖7類似。8維條件下的PMFCC特征數(shù)據(jù)間差別明顯,為后續(xù)的模板訓(xùn)練和故障識別,既減少了計算量又降低了模板庫的存儲量,同時還將特征值進行最優(yōu)化,不但提高了信號的識別精度也提高了信號的識別效率。
本文利用DTW計算模板信號與測試信號在每一幀的Mel倒譜距離,通過該距離尋求待檢測信號與模板信號的最佳匹配路徑,從而實現(xiàn)測試信號與模板信號間的時差失真最小、相似特征最大。診斷流程由增量式訓(xùn)練和匹配識別兩個階段組成,見圖8。通過歷史故障數(shù)據(jù)訓(xùn)練出最優(yōu)的故障模板作為匹配依據(jù),然后將實時故障數(shù)據(jù)提取特征后與故障模板進行匹配,并將結(jié)果在人工復(fù)合后作為新的歷史數(shù)據(jù)反饋給故障模式庫進行訓(xùn)練形成新的故障模板,從而實現(xiàn)自適應(yīng)效果。
圖8 診斷流程
在實際運用中,增量式的故障模板庫能夠有效更新報告設(shè)備故障情況,提高診斷精準(zhǔn)度,因此模板庫的選取意義重大。本文使用K-means聚類與最小歐式距離結(jié)合的方式找出最優(yōu)的不同故障的模板庫,并且根據(jù)實時數(shù)據(jù)與故障模板進行對比后反饋給故障模式庫進行訓(xùn)練形成新的各類故障,從而保證算法實際應(yīng)用的有效性。K-means聚類主要步驟如下:
Step1輸入故障集{X},有n個樣本和k個故障模式,分類{Gi,i=1,2,…,K}。
Step2隨機選取k個初始聚類中心{c1,c2,…,ck},依次計算故障集{X}到聚類核心的距離D(xi,cj),按照最小距離原則形成k個聚類核心,計算式為
Dij=‖xi-cj‖i=1,2,…,nj=1,2,…,k
(12)
(13)
式中:Nj為第j個聚類中心的樣本個數(shù)。
Step4利用式(14)~式(15)聚類準(zhǔn)則數(shù)值E判斷聚類結(jié)果是否合理,若合理迭代終止,否則重復(fù)Step2和Step3。
(14)
|E′-E|<ζ
(15)
從采集的故障文件中隨機抽取數(shù)據(jù)63條,其中發(fā)送端數(shù)據(jù)7條,防雷單元數(shù)據(jù)5條,電纜網(wǎng)絡(luò)模擬數(shù)據(jù)9條,空心線圈斷線數(shù)據(jù)6條,調(diào)諧單元短路數(shù)據(jù)10條,主軌出數(shù)據(jù)8條,小軌出數(shù)據(jù)7條,補償電容斷線數(shù)據(jù)11條。將隨機抽取的數(shù)據(jù)使用K-means聚類得出各故障參考模板,再利用PMFCC-DTW故障診斷把t1~t9測試數(shù)據(jù)與F1~F8模式庫中的參考樣本進行匹配,求出部分動態(tài)匹配距離,見表3。其中匹配計算得到的數(shù)值越小,則距離越近,相似度就越高,并將該測試數(shù)據(jù)歸為此類故障。例如表3中圈出的數(shù)據(jù),t1所在列中最小的值是與F6相對應(yīng),故t1是F6故障;t4所在列中最小的值是與F1相對應(yīng),故t4是F1故障。同理,按此計算也可以得到動態(tài)匹配結(jié)果。
表3 部分動態(tài)匹配距離
為了證明本文采用的PMFCC-DTW算法進行故障診斷的有效性,根據(jù)實測ZPW-2000軌道電路的數(shù)據(jù)建立數(shù)據(jù)庫,選取2 400條數(shù)據(jù),做改進效果對比實驗分析。其中發(fā)送端數(shù)據(jù)、防雷單元數(shù)據(jù)、電纜網(wǎng)絡(luò)模擬數(shù)據(jù)、空心線圈斷線數(shù)據(jù)、調(diào)諧單元短路數(shù)據(jù)、補償電容斷線數(shù)據(jù)、主軌出數(shù)據(jù)和小軌出數(shù)據(jù)各300條。PMFCC-DTW模型與MFCC-DTW模型的診斷效果對比見表4。對比結(jié)果顯示,PMFCC-DTW模型單個故障的識別率高達96.67%,而且對每一種故障的識別率都要高于MFCC-DTW模型,正確率有明顯提升。
表4 故障識別率 %
另一方面利用混淆矩陣(Confusion Matrix)計算實際樣本值和模型診斷值的正確率、精準(zhǔn)率和召回率,并統(tǒng)計模型診斷耗時。
正確率為
(16)
精準(zhǔn)率為
Precision=TP/(FP+TP)
(17)
召回率為
Recall=TP/(FN+TP)
(18)
式中:TP為樣本的真實類別是某類故障,并且模型診斷的結(jié)果是同類故障的個數(shù);FN為樣本的真實類別是某類故障,但是模型將其診斷成為其他故障的個數(shù);FP為樣本的真實類別是正常,但是模型將其診斷成為故障的個數(shù);TN為樣本的真實類別是正常,并且模型診斷的結(jié)果也是正常的個數(shù)。
基于改進效果對比實驗的2 400條數(shù)據(jù)以及1 000條正常數(shù)據(jù),仿真了HHT-DBWT算法和SVM算法,并與本文改進的PMFCC-DTW算法進行對比分析,評價結(jié)果見表5。
表5 評價結(jié)果
由表5可見,PMFCC-DTW算法的正確率較高,而且精準(zhǔn)率高達97.76%,表示本模型診斷故障的準(zhǔn)確度很高。通過召回率分析出模型診斷故障可信性強,且用時短。
在實際應(yīng)用中,通過安裝軌道電路室內(nèi)外設(shè)備信號采集裝置,結(jié)合信號集中監(jiān)測系統(tǒng)獲取室內(nèi)外監(jiān)測信息,利用本文方法對軌道電路信號實時監(jiān)控實時診斷,若能獲取較完整的監(jiān)測數(shù)據(jù)和突發(fā)故障數(shù)據(jù)以便故障模式更深入研究,對提高軌道電路故障診斷及日常維護效率具有重要意義。
(1)本文針對高速鐵路軌道電路常見的故障,通過實地測試采集到的暫態(tài)電壓數(shù)據(jù)按時域、頻域進行智能化區(qū)段劃分,利用MFCC提取出表征軌道電路狀態(tài)的特征參數(shù),并基于主成分分析進行特征降維,使用Fisher準(zhǔn)則選出最優(yōu)特征集,通過K-means聚類進行故障集訓(xùn)練,得到軌道電路暫態(tài)數(shù)據(jù)的初始模板,形成軌道電路的模板庫,最后通過DTW模型計算出測試集與每種模型的匹配距離,從而進行故障診斷。
(2)通過實驗以及與其他診斷方法進行對比可以發(fā)現(xiàn),基于PMFCC-DTW的軌道電路故障診斷的識別時間大為縮短,正確率達到90%以上,為軌道電路設(shè)備健康狀態(tài)監(jiān)測提供了一種新思路。