孫 哲
(中鐵工程設(shè)計咨詢集團有限公司,北京 100055)
目前,我國鐵路列車運行控制系統(tǒng)普遍采用ZPW-2000型無絕緣軌道電路[1]。作為JTC的關(guān)鍵組成部分之一,補償電容對防止JTC“紅光帶”和機車信號“掉碼”等故障起著至關(guān)重要的作用。經(jīng)現(xiàn)場調(diào)研可知,補償電容常見故障形式為引接線銹蝕后斷線和電容容值下降兩種,且故障具有突發(fā)性。針對這些故障模式,國內(nèi)外相關(guān)學(xué)者對基于列車運行數(shù)據(jù)的補償電容故障診斷方法進行了研究。
國外方面,DEBIOLLES、OUKHELLOU等人采用偏最小二乘與神經(jīng)網(wǎng)絡(luò)、傳遞置信模型等算法,提出了一系列補償電容故障檢測方法[2-4]。
國內(nèi)方面,趙林海等人利用機車信號遠程監(jiān)測平臺的記錄數(shù)據(jù),對補償電容故障診斷方法進行了一系列的研究[5-9],其中,文獻[5-7]采用時頻分析的故障診斷方法,雖然檢測速度快,但僅能實現(xiàn)補償電容單故障的診斷,文獻[8-9]采用啟發(fā)式算法,通過將仿真模型與實際數(shù)據(jù)進行趨勢擬合,能夠?qū)崿F(xiàn)補償電容的多故障診斷,但參數(shù)尋優(yōu)速度慢,算法及時性不高。在此基礎(chǔ)上,張友鵬等基于SA算法,通過對分路態(tài)模型進行分段尋優(yōu),提出了軌道電路故障綜合監(jiān)測方法[10],但該方法仍屬于啟發(fā)式算法,及時性不高,且依賴于模型,對數(shù)據(jù)質(zhì)量的要求高。同時,以上算法均是對單條感應(yīng)電壓幅值數(shù)據(jù)進行分析,沒有充分挖掘歷史數(shù)據(jù)之間的關(guān)聯(lián)信息。
近年來,大數(shù)據(jù)技術(shù)在鐵路安全領(lǐng)域得到了越來越多的應(yīng)用,而基于聚類的故障診斷技術(shù)能夠充分利用數(shù)據(jù)之間的相關(guān)性,且具有較高的診斷速度和精確度[11]。為此,利用機車信號遠程監(jiān)測系統(tǒng)的歷史數(shù)據(jù),提出一種基于自適應(yīng)層次聚類的補償電容多故障診斷方法。
聚類是通過無監(jiān)督的方式,將數(shù)據(jù)對象以類或簇為單位進行劃分,將具有較高相似度的數(shù)據(jù)劃分為同一個類,不同類之間的相似度差別較大[12-13]。聚類分析的輸入可以用(X,d)或(X,1/s)表示,其中,X表示待聚類的樣本,s和d表示樣本相似度和相異度的度量。若分類結(jié)果C={C1,C2,…,Ck},則滿足式
(1)
其中,Ci(i=1,2,…,k)是X的子集C中的成員,C1,C2,…,Ck叫做類,樣本集中每個數(shù)據(jù)只屬于一個類。
一般地,聚類樣本間的相異度(距離)采用樣本數(shù)據(jù)中的空間距離來度量,記為:d(x,y),其中x,y是相應(yīng)的特征。常用的空間距離有歐式距離、切比雪夫距離、二次型距離、余弦距離,本文采用歐式距離,表示為
(2)
對于具有sa和sb個元素的兩個類Ca和Cb,令x∈Ca,y∈Cb,則x與y間的距離記為d(x,y),類間距離為D(Ca,Cb)。常用的類間距離計算方法有最短距離法、最長距離法、中心法、類平均法。本文采用類平均法,采用兩類中任意兩個元素間距離的平均值作為類間距離,表示為
(3)
按層次聚類的方向不同,層次聚類可以分為凝聚和分裂兩種方法[14-15]。凝聚的方法是指:首先以樣本中每個元素作為一個子類,然后根據(jù)設(shè)置的相似度量標準合并這些子類,直到所有的元素都在一個類中,或者達到某一終止條件;分裂的方法是指:首先將所有元素歸于一類中,然后逐層分解,直到每個元素各自劃分為一類,或者達到了某個終止條件。該終止條件一般為期望的類數(shù)目,或者類間距離超過了相應(yīng)門限。其處理過程如圖1所示。
圖1 凝聚和分裂層次聚類
層次聚類算法屬于無監(jiān)督的分類算法,聚類的結(jié)果要求類別之間具有良好的可分性,即:類間距離盡量大,類內(nèi)距離盡量小[16]。由于聚類之前需要人為指定聚類個數(shù)或設(shè)定相應(yīng)門限,為此,提出一種自適應(yīng)層次聚類算法,使其能夠根據(jù)自定義判別函數(shù)的取值來自適應(yīng)確定聚類的個數(shù)。
對于具有n個特征的輸入樣本x,綜合考慮類內(nèi)類間距離對樣本的可分性,定義類內(nèi)類間距離判據(jù)J(x)為
(4)
自適應(yīng)層次聚類的原則為獲取某一聚類結(jié)果C,使類間距離盡量大,類內(nèi)距離盡量小,即:獲得樣本各聚類結(jié)果中J(x)的最大值,并以該J(x)最大值對應(yīng)的聚類個數(shù)為最優(yōu)結(jié)果。因此,對于輸入樣本x,自適應(yīng)層次聚類算法流程如圖2所示。
圖2 自適應(yīng)層次聚類算法流程
其中,J_max為自定義判別函數(shù)的最大值,初始值為0,取值范圍為[0,+∞];NcIndex為得到的聚類個數(shù);M為聚類個數(shù)上限,令M=10即可;C為聚類結(jié)果,表示樣本x中每組數(shù)據(jù)分屬哪一類。
如圖3所示,JTC主要由發(fā)送器、匹配調(diào)諧區(qū)、鋼軌、補償電容、傳輸電纜以及接收器等構(gòu)成[17]。機車信號遠程監(jiān)測系統(tǒng)主要由機車信號主機(包含天線、電纜)、車載傳輸模塊、GPRS網(wǎng)絡(luò)、地面數(shù)據(jù)服務(wù)器以及維護終端構(gòu)成[18]。
從JTC發(fā)送端發(fā)送的信號經(jīng)輪軌分路后,信號被短路并形成短路電流。通過電磁感應(yīng),TCR天線中形成相應(yīng)的感應(yīng)電壓信號,機車信號主機對該感應(yīng)電壓進行接收,并將其所包含的控車信息發(fā)送給車載計算機。之后,機車信號遠程監(jiān)測系統(tǒng)的車載傳輸模塊將該感應(yīng)電壓的幅值包絡(luò)、載頻,以及列車當前所在JTC區(qū)段的里程及信號機編號、列車速度等信息,經(jīng)GPRS網(wǎng)絡(luò)傳送到地面數(shù)據(jù)服務(wù)器。地面數(shù)據(jù)服務(wù)器按信號機標號對幅值包絡(luò)進行劃分,形成感應(yīng)電壓包絡(luò)歷史數(shù)據(jù)庫,使得地面維護人員可以通過維護終端對進入該JTC區(qū)段的所有列車所采集的感應(yīng)電壓幅值歷史信息進行查看。
圖3 JTC與機車信號遠程監(jiān)測系統(tǒng)示意
圖4 補償電容正常與依次斷線時的幅度包絡(luò)仿真結(jié)果
文獻[8]利用四端網(wǎng)絡(luò)模型對機車信號感應(yīng)電壓幅值進行了建模,參考該建模方法,對補償電容依次斷線下的感應(yīng)電壓幅值變化情況進行仿真,如圖4所示。仿真條件為:軌道電路長度l=901 m;道床漏泄電阻Rd=3 Ω·km;信號載頻fz=2 600 Hz;發(fā)送器功出電壓Afs=74 V;分路電阻Rf=0.15 Ω;補償電容個數(shù)為12,容值均為25 μF。
由圖4可知,由于輪對的分路作用,補償電容斷線主要會對其后接收端方向的幅值波動情況產(chǎn)生影響,而對其前方發(fā)送端方向的幅值波動幾乎沒有影響。基于此影響規(guī)律,可以對機車信號遠程監(jiān)測系統(tǒng)獲取的歷史感應(yīng)電壓幅值數(shù)據(jù)進行聚類。
本算法的總體思路為:首先,對從機車信號遠程監(jiān)測系統(tǒng)獲取的歷史感應(yīng)電壓幅值數(shù)據(jù)的波動特征進行提取,用于構(gòu)造特征矩陣;之后,對特征矩陣進行重構(gòu),得到樣本矩陣,并采用自適應(yīng)層次聚類對樣本矩陣進行聚類,得到類別矩陣。最后,結(jié)合相應(yīng)的補償電容故障判別策略,實現(xiàn)最近一組感應(yīng)電壓幅值數(shù)據(jù)中補充電容故障位置的識別。
對于某一待診斷JTC,若其長度為l,補償電容個數(shù)為m,且當前機車信號遠程監(jiān)測系統(tǒng)歷史數(shù)據(jù)庫中存儲有k組該區(qū)段的感應(yīng)電壓幅值包絡(luò)數(shù)據(jù),則該k組數(shù)據(jù)經(jīng)歸一化后按時間的先后順序可以構(gòu)成數(shù)據(jù)矩陣Acv,且表示為
(5)
標準差能夠反映數(shù)據(jù)整體的波動情況,故取某一點至其前方發(fā)送端所有分路點位置處的感應(yīng)電壓幅值數(shù)據(jù)的標準差作為特征,構(gòu)成k×(m+1)維的特征矩陣Φ,表示為
(6)
對特征矩陣Φ進行重構(gòu),可以進一步構(gòu)造出m個k×(m-j+2)維樣本矩陣Xj(j=1,2,…,m),且表示為
(7)
由于補償電容可靠性較高,且故障組合種類比較多[19],Acv的k組數(shù)據(jù)可能無法包含所有的補償電容故障組合情況。若Acv的k組歷史數(shù)據(jù)中,第h~m(h=1,2,…,m)個連續(xù)的補償電容從未發(fā)生過故障,即Xj(j=h,…,m)的類別數(shù)為1,由于自適應(yīng)層次聚類要求輸入數(shù)據(jù)類別數(shù)大于1,則無法對其進行自適應(yīng)層次聚類。因此,根據(jù)補償電容故障的影響規(guī)律,在對樣本矩陣進行聚類之前,需要對Acv中曾經(jīng)發(fā)生過故障且離發(fā)送端最遠的第一個補償電容的位置進行確定。
為此,以Φ的任一列作為輸入,采用萊因達準則對數(shù)據(jù)中是否具有離群點進行判斷。若經(jīng)判斷Φ中的第h~m(h=1,2,…,m)列數(shù)據(jù)沒有離群點,則根據(jù)圖2所示流程,分別對樣本矩陣Xj(j=1,…,h-1)進行自適應(yīng)層次聚類,可以得到類別矩陣C,表示為
(8)
其中,c·j(j=1,…,h-1)表示為對應(yīng)樣本矩陣Xj的聚類結(jié)果,cij(i=1,2,…,k)表示Xj中第i行對應(yīng)的類別號。
由于補償電容為高可靠器件,則Acv的各組數(shù)據(jù)中,補償電容均正常的感應(yīng)電壓幅值包絡(luò)個數(shù)為最多。因此,若對應(yīng)類別矩陣C中某一行的類別在所有k行中出現(xiàn)次數(shù)最多,則該行每一個元素均為補償電容全正常下的類別,并將此類別和每一列中等于該類別的行號最大值分別記為
(9)
基于此規(guī)律,并結(jié)合補償電容故障的累加性,可以建立補償電容多故障判決策略,見圖5。
本算法首先判斷最后一組數(shù)據(jù)中離發(fā)送端最近的第一個故障補償電容的位置,之后,通過判斷后續(xù)類別矩陣中類別種類個數(shù),實現(xiàn)補償電容多故障的診斷。
為檢驗算法的正確性,選取某局管內(nèi)某一ZPW-2000A型JTC的感應(yīng)電壓幅值包絡(luò)數(shù)據(jù)對算法進行驗證。該JTC區(qū)段長度l=1 200 m,補償電容個數(shù)nCC=13,其某一時間段內(nèi)的感應(yīng)電壓幅值采樣歸一化數(shù)據(jù)如圖6所示。
圖5 補償電容多故障判別策略
圖6(a)為機車信號采集的該JTC區(qū)段于2018年3月4日及其之前77個時間點的感應(yīng)電壓采樣幅值歸一化數(shù)據(jù),由現(xiàn)場反饋可知,該JTC于2018年3月4日發(fā)生補償電容CC7斷線故障。采用本文算法對圖6(a)所示數(shù)據(jù)進行特征提取、特征聚類后,得到類別矩陣C(a),表示為
C(a)=
由補償電容故障判別策略可知,最后一組數(shù)據(jù)中補償電容CC7發(fā)生斷線故障,與實際情況一致,本算法能夠?qū)ρa償電容單故障情況進行診斷。
圖6(b)為機車信號采集的該JTC區(qū)段于2018年4月25日及其之前99個時間點的感應(yīng)電壓采樣幅值歸一化數(shù)據(jù),由現(xiàn)場反饋可知,該JTC于2018年3月4日發(fā)生補償電容CC7斷線故障后,又于2018年3月25日發(fā)生補償電容CC5斷線故障。采用本文算法對圖6(c)所示數(shù)據(jù)進行特征提取、特征聚類后,得到類別矩陣C(c),表示為
圖6 某區(qū)段歷史感應(yīng)電壓幅值歸一化數(shù)據(jù)
C(c)=
由補償電容故障判別策略可知,最后一組數(shù)據(jù)中補償電容和CC5、CC7發(fā)生斷線故障,與實際情況一致,本算法能夠?qū)ρa償電容多故障情況進行診斷。
此后,該JTC區(qū)段于2018年4月26日故障修復(fù),采用本文算法對圖6(b)所示數(shù)據(jù)進行特征提取、特征聚類后,得到類別矩陣C(b),表示為
C(b)=
由補償電容故障判別策略可知,最后一組數(shù)據(jù)中補償電容均正常,本算法能夠?qū)ρa償電容均正常的情況進行識別。
本文首先通過定義相應(yīng)的類內(nèi)類間距離判據(jù),提出了自適應(yīng)層次聚類法。之后,利用機車信號遠程監(jiān)測系統(tǒng)獲取的歷史感應(yīng)電壓幅值包絡(luò)數(shù)據(jù),根據(jù)補償電容故障對整體感應(yīng)電壓幅值包絡(luò)的波動性的影響,建立了相應(yīng)的特征矩陣與樣本矩陣,并結(jié)合自適應(yīng)層次聚類算法,提出了基于機車信號歷史監(jiān)測數(shù)據(jù)和自適應(yīng)層次聚類的機車信號補償電容多故障診斷策略。經(jīng)過實驗驗證,本算法能夠準確對補償電容多故障情況進行診斷,為數(shù)據(jù)挖掘技術(shù)在鐵路領(lǐng)域的應(yīng)用提供了一個新的思路。