張鵬飛,岳建海,裴 迪,焦 靜
(北京交通大學(xué)機械與電子控制工程學(xué)院,北京 100044)
隨著我國鐵路貨車運載量和速度的不斷提高,制動系統(tǒng)作為保證貨車安全運行的核心部件,保障其正常運行至關(guān)重要。但現(xiàn)有的鐵路車輛運行安全監(jiān)控系統(tǒng)(5T)中的貨車運行故障動態(tài)圖像監(jiān)測系統(tǒng)(TFDS)只能對基礎(chǔ)制動裝置進行狀態(tài)監(jiān)測,無法實現(xiàn)對空氣制動機氣路故障的識別。目前,對于制動機故障大多采用人工檢查,效率低,勞動強度大,且容易發(fā)生漏檢。因此對貨車制動系統(tǒng)狀態(tài)監(jiān)測具有現(xiàn)實且重要的意義。
針對列車制動系統(tǒng)故障診斷,主要有基于信號處理、基于解析模型和基于知識的方法[1]。隨著制動機被設(shè)計的越來越復(fù)雜,單純依靠信號處理的方法已不能準(zhǔn)確診斷出故障?;诮馕瞿P偷姆椒ㄓ墟I合圖模型[2]、物理模型[3]等,該方法的診斷效果依賴于模型的精度?;谥R的方法有專家系統(tǒng)[4]、神經(jīng)網(wǎng)絡(luò)[5]等,專家系統(tǒng)嚴(yán)重依賴獲取知識的層次,神經(jīng)網(wǎng)絡(luò)依賴于樣本數(shù)量和質(zhì)量,而本文故障數(shù)據(jù)來源于貨車線路運行過程,受制于數(shù)量原因,導(dǎo)致其診斷效果不佳。由于空氣制動機結(jié)構(gòu)復(fù)雜,各零部件間存在復(fù)雜的耦合關(guān)系,難以進行精確的建模,并且在狀態(tài)監(jiān)測中需要測量的變量較多,且變量之間存在相關(guān)性,導(dǎo)致故障診斷存在長時間序列和診斷性能低的特點。隱馬爾可夫模型(HMM)基于時間序列建模,對小樣本數(shù)據(jù)具有較好的診斷性,可用于任意時長的時序建模問題,廣泛應(yīng)用于行為識別、齒輪箱狀態(tài)識別[6]、軸承故障診斷[7]等領(lǐng)域,這為HMM應(yīng)用于制動機故障診斷提供了理論基礎(chǔ)。初始參數(shù)影響HMM的訓(xùn)練和測試效果,K-means算法作為一種簡單、高效的聚類算法,可以對模型參數(shù)進行快速初始化。特征集對分類器的性能有較大影響,由于制動機風(fēng)壓信號具有非線性[8]特征,故采用核主成分分析(KPCA)對提取的多維特征行約減,去除冗余信息,獲得信息主要成分。
鑒于此,本文提出KPCA和優(yōu)化HMM相結(jié)合的方法,采用大秦鐵路貨車線路實測數(shù)據(jù)進行驗證,并與全特征集HMM和KPCA+HMM以及其它診斷模型進行比較,驗證所提方法的有效性。
核主成分分析法利用非線性映射將數(shù)據(jù)從原始空間映射到高維空間中,然后對其進行主成分分析。其中,核函數(shù)及參數(shù)決定了原始數(shù)據(jù)在高維空間的分布,間接決定了KPCA的輸出主元成分,故核函數(shù)及參數(shù)選擇對KPCA效果影響較大。
為簡化計算,本文選用高斯徑向基核函數(shù)(RBF)
(1)
式中,σ是寬度參數(shù)。在使用核函數(shù)進行KPCA分析時,較小的σ會引起過渡擬合,降低分類的泛化性能;而較大的σ會把核函數(shù)簡化為一個常函數(shù),導(dǎo)致其變成平凡分類器[9]。因此,本文對σ的選擇引入類內(nèi)類間距離,并定義
J=argmax(SB/SW)
(2)
式中,SB是特征集的類間距離,SW是各個特征的類內(nèi)距離。使得選取的核參數(shù)對應(yīng)的特征類間距最大且類內(nèi)距最小。
HMM為雙隨機模型,即狀態(tài)轉(zhuǎn)換和各狀態(tài)下的觀測值都服從隨機過程。根據(jù)觀測值離散或連續(xù),分為離散HMM和連續(xù)HMM。本文采用連續(xù)HMM,其描述為[10]:
1) 模型的狀態(tài)數(shù)目N。記N個狀態(tài)為S1,S2,…,S3,t時刻模型對應(yīng)的狀態(tài)為qt,qt∈{S1,S2,…,SN}。
2) 模型每個狀態(tài)對應(yīng)的觀測值數(shù)目M。將觀測值記為V1,V2,…,VM,t時刻觀測值為Ot,則ot∈{V1,V2,…,VM}。
3) 初始狀態(tài)矢量π
π={πi},πi=P(q1=Si) (1≤i≤N)
(3)
4) 狀態(tài)轉(zhuǎn)移矩陣A
A=(αi,j),αi,j=P(qt+1=Sj|qt=Si)
(4)
5) 觀測值概率密度函數(shù)
(5)
一般采用高斯混合模型來表示觀測值概率密度函數(shù)。其中Mj為Sj狀態(tài)下單高斯數(shù);ωj,m、μj,m和δj,m分別為Sj狀態(tài)下第m個單高斯的權(quán)重、均值和協(xié)方差。
HMM訓(xùn)練采用Baum_welch算法,該算法基于遞歸思想進行參數(shù)估計,尋找最優(yōu)的模型參數(shù)是一個泛函極值問題,因此模型訓(xùn)練和初始參數(shù)有一定關(guān)系。模型初始參數(shù)可以隨機化初始,但對其進行估計是有益的,其中觀測值概率分布對模型性能影響更大[11]。
本文采用K-means聚類算法對觀測值概率分布進行初始估計。K-means算法利用相似性的歐氏距離計算來對樣本進行分類,其目標(biāo)是使各類樣本到對應(yīng)聚類中心距離的總和最小,即類內(nèi)離散度之和最小。將其設(shè)為聚類測度函數(shù),計算公式如下
(6)
式中,Zk為第k個聚類的中心,Ci為第i個分類的集合,k為需要分類的類別數(shù)。E反映了樣本圍繞各聚類中心的緊密度,E越小分類樣本分類效果越好。
利用K-means聚類算法優(yōu)化模型的流程如下:
步驟2:隨機挑選個K樣本作為初始的聚類中心centeri,1≤i≤K。
步驟3:計算每個樣本與各聚類中心的歐氏距離,并按照最小歐氏距離將其劃入所對應(yīng)的類,類中樣本量記為numi,1≤i≤K。
步驟4:重新計算各個類中所有樣本的平均值,并將其作為更新后的聚類中心centeri。并根據(jù)式(6)計算聚類測度函數(shù)值Ei,1≤i≤t。
步驟5:循環(huán)步驟3和步驟4,得到更新后Ei+1,并計算Ei-Ei+1,判斷其與收斂精度Δ的關(guān)系,如果小于等于Δ,則退出循環(huán)。
則觀測值概率密度函數(shù)bj(Ot)的初始參數(shù)估計如下
μj,m=centeri(1≤i≤K)
(7)
(8)
(9)
基于KPCA和優(yōu)化HMM的制動系統(tǒng)故障診斷的過程如圖1,具體步驟如下:
步驟1:對訓(xùn)練集和測試集數(shù)據(jù)分別進行多維特征提取。
步驟2:計算高斯核函數(shù)的最優(yōu)參數(shù),并利用KPCA對訓(xùn)練集和測試集數(shù)據(jù)進行降維,得到新的訓(xùn)練集和測試集數(shù)據(jù)。
步驟3:在訓(xùn)練集數(shù)據(jù)上,利用K-means聚類算法完成HMM的初始參數(shù)優(yōu)化選擇。
步驟4:對訓(xùn)練集不同狀態(tài)下的樣本數(shù)據(jù)分別訓(xùn)練HMM,并保存到模型庫中。本文在制動系統(tǒng)5種狀態(tài)下,分別訓(xùn)練HMM模型,即λi,1≤i≤L,L=5。
步驟5:將測試集樣本送入HMM模型庫中,分別計算每個測試樣本在不同模型下的似然概率P(O|λi),其中概率最大的模型就是測試樣本對應(yīng)的狀態(tài),即
(10)
圖1 制動系統(tǒng)故障診斷流程圖
本文研究的對象為貨車空氣制動機風(fēng)壓數(shù)據(jù),通過對大秦線210輛編組的C80B(H)試驗車加裝車載監(jiān)測裝置,利用EPCOS(愛普科斯)C82系列空氣壓力傳感器采集貨車在線運行過程中多通道風(fēng)壓數(shù)據(jù),從而實現(xiàn)制動系統(tǒng)狀態(tài)監(jiān)測。如圖2所示,空氣制動機風(fēng)壓采集點包括列車管、副風(fēng)缸、制動缸上游、制動缸下游。
圖2 壓力采集實物圖
結(jié)合列車行車故障統(tǒng)計表,對試驗數(shù)據(jù)進行統(tǒng)計分析,共得到制動機5種狀態(tài)數(shù)據(jù),每種狀態(tài)各50組,包括空車正常制動、重車正常制動、緩解不良故障、自然緩解故障、制動缸漏泄故障。圖3為制動機5種狀態(tài)的一組數(shù)據(jù)展示。其中緩解不良是指列車管充氣緩解時,制動缸不緩解或緩解很慢,可能導(dǎo)致貨車抱閘運行;自然緩解是指沒有緩解操作時,制動缸自行發(fā)生緩解作用,可能會導(dǎo)致列車失去制動力而引發(fā)事故;制動缸漏泄是指車輛制動保壓時,制動缸下游壓力持續(xù)下降時間>1min,當(dāng)壓力下降到30±10kPa后停止下降。
圖3 各種制動狀態(tài)風(fēng)壓信號圖
空氣制動機風(fēng)壓信號為多通道時序數(shù)據(jù),存在周期性、隨機性等動態(tài)特性,對其時域和頻域基本特征進行提取。時域特征包括均值、方根幅值、標(biāo)準(zhǔn)差、均方根值、峰峰值、偏度、峭度、波形指標(biāo)、峰值指標(biāo)、脈沖指標(biāo)、裕度指標(biāo);頻域特征包括平均頻率、中心頻率、均方根頻率、標(biāo)準(zhǔn)差頻率、頻率峭度。
制動機在制動過程中內(nèi)部氣路管道壓力存在階躍變化的過程,而小波分析對這類邊緣信號有很好的處理效果,不僅有濾波作用,并且可以從階躍型信號中提取信號的突變點[12]。故對多通道數(shù)據(jù)進行小波分析,選取db3對信號進行3層小波包分解,計算各頻帶的能量譜尺度,選取前三作為特征。
空氣制動機是一個復(fù)雜的耦合系統(tǒng),各零部件間存在相關(guān)性關(guān)系,故對多通道風(fēng)壓數(shù)據(jù)提取相關(guān)性特征。本文計算皮爾森相關(guān)系數(shù)作為特征,其計算公式
(11)
將采集到的250組數(shù)據(jù),各狀態(tài)下隨機選取60%數(shù)據(jù)作為訓(xùn)練集,其余作為測試集。對各組數(shù)據(jù)特征提取后,采用KPCA進行特征降維,核函數(shù)參數(shù)σ的選擇如式(2)所述,以1為步長,對σ∈[1,200]內(nèi)的 200個點進行計算,選取J最大時所對應(yīng)的核參數(shù)。對訓(xùn)練集和測試集數(shù)據(jù)進行KPCA,分別選取最優(yōu)的σ1=12,σ2=11。并設(shè)置主元貢獻率≥85%,保留前三階主元進行分析。圖4(a)和(b)分別是訓(xùn)練集和測試集降維后的前三主元的分布。從圖中可以看出經(jīng)過KPCA處理后的特征可以有效分辨空氣制動機5種不同狀態(tài)的數(shù)據(jù),可用于空氣制動機的故障診斷。
圖4 KPCA后特征結(jié)果
HMM參數(shù)選擇:高斯元數(shù)目M=2,訓(xùn)練迭代次數(shù)為10。對馬爾可夫鏈和協(xié)方差矩陣的類型采用網(wǎng)格搜索法的方式,在訓(xùn)練集數(shù)據(jù)上采取5折交叉驗證,以模型平均診斷準(zhǔn)確率作為參數(shù)選擇的標(biāo)準(zhǔn)。確定馬爾可夫鏈為左右型且狀態(tài)數(shù)為5,協(xié)方差矩陣為對角型。
利用K-means算法對HMM的初始參數(shù)進行優(yōu)化選擇,然后進行模型訓(xùn)練。設(shè)置聚類中心數(shù)K=M,聚類迭代次數(shù)t=10,聚類測度函數(shù)的收斂精度Δ=1e-4。圖5給出了在迭代過程中,對KPCA后的訓(xùn)練集特征進行聚類時聚類測度函數(shù)值的變化曲線,體現(xiàn)了各類樣本中最佳個體類內(nèi)離散度之和的變化趨勢。從圖中可以看出,各類樣本中最佳個體類內(nèi)離散度下降明顯,且在迭代步數(shù)內(nèi)滿足收斂精度要求。
圖5 聚類測度函數(shù)值收斂曲線圖
在模型訓(xùn)練和測試階段,為驗證本文所提方法的有效性,將該方法與全特征HMM和KPCA+未優(yōu)化HMM進行對比。圖6為3種方法訓(xùn)練收斂曲線圖,縱坐標(biāo)為訓(xùn)練迭代過程中的各模型平均似然概率。從圖中可以看出,KPCA+優(yōu)化HMM的方法大大提高了模型的訓(xùn)練效率,在訓(xùn)練的第3步可以達到收斂精度,KPCA+HMM收斂速度次之,全特征HMM收斂速度最慢。
圖6 模型訓(xùn)練過程收斂曲線
圖7為全特征集訓(xùn)練HMM的診斷結(jié)果,圖8為KPCA+未優(yōu)化HMM診斷結(jié)果,圖9為KPCA+優(yōu)化HMM診斷結(jié)果,其中橫坐標(biāo)1-20、21-40、41-60、61-80、81-100分別表示狀態(tài)為空車正常制動、重車正常制動、緩解不良、自然緩解、制動缸漏泄的測試樣本,縱坐標(biāo)對應(yīng)的是測試樣本在不同模型中的似然概率。由圖7可知,空車正常制動的樣本全都能被正確診斷,無誤判樣本,重車正常制動樣本(編號21-40)除編號40外,其余樣本都在模型下取得最大對數(shù)似然概率,因此判斷這些樣本為重車正常制動狀態(tài),而編號40的樣本則出現(xiàn)了誤分。同理,緩解不良樣本出現(xiàn)2次誤分(編號50和55),自然緩解樣本出現(xiàn)4次誤分(編號62、67、72和73),制動缸漏泄樣本出現(xiàn)3次誤分(編號88、95和98)。由圖8可知,空車正常制動、重車正常制動的樣本全都被正確診斷,緩解不良樣本出現(xiàn)1次誤分(編號47),自然緩解樣本出現(xiàn)1次誤分(編號72),制動缸漏泄樣本出現(xiàn)2次誤分(編號88、95)。由圖9可知,除了緩解不良樣本出現(xiàn)1次誤分(編號47)和制動缸漏泄樣本出現(xiàn)1例誤分(編號88)外,其它樣本都被正確診斷。診斷結(jié)果見表1。
由表1可知,診斷空車正常制動時,三種方法診斷率相同,對其它制動狀態(tài)診斷時,KPCA+優(yōu)化HMM較KPCA+HMM及全特征HMM,獲得了更好的診斷效果。這是由于KPCA對特征集進行約減,獲得特征主要成分,提高了模型的收斂速度,并且利用K-means算法優(yōu)化初始模型參數(shù),降低了訓(xùn)練難度,提高了模型的訓(xùn)練效率,使得診斷準(zhǔn)確率有了一定的提高。
為了對比其它診斷模型的分類效果,分別設(shè)計基于支持向量機(SVM)和隨機森林(RF)的故障分類器。SVM選擇RBF核函數(shù),c=0.435,gamma=0.25。隨機森林參數(shù):分類器個數(shù)為10,決策樹的最大深度為5,葉子節(jié)點的最小樣本數(shù)為2。其診斷結(jié)果如表2所示。RF由于采用了集成弱分類器的學(xué)習(xí)策略,相比沒有經(jīng)過集成策略的單分類器模型SVM,泛化能力更強,診斷準(zhǔn)確率更高。但是相較于HMM這種可以對時間序列建模的模型,HMM更能反映出時間序列過程中的狀態(tài)指標(biāo)變化,對長時間序列比如制動數(shù)據(jù)有更好的故障識別效果。
圖7 全特征HMM診斷結(jié)果
圖8 KPCA+HMM診斷結(jié)果
圖9 KPCA+優(yōu)化HMM診斷結(jié)果
表1 診斷結(jié)果比較
表2 其它模型診斷結(jié)果
根據(jù)鐵路貨車制動系統(tǒng)故障診斷特點,提出了采用KPCA和優(yōu)化HMM相結(jié)合的方法。該方法利用KPCA對特征參數(shù)進行約減,去除其中大量的冗余信息,降低了模型的復(fù)雜程度,并利用K-means聚類算法優(yōu)化模型初始參數(shù),提高了HMM訓(xùn)練和測試的效率。結(jié)果表明,基于KPCA和優(yōu)化HMM的故障診斷方法能很好地表征空氣制動機的故障狀態(tài),具有很高的診斷精度,為鐵路貨車制動系統(tǒng)故障診斷提供了一種切實可行的方法,具有一定的參考價值。