劉一博,趙林海
(北京交通大學(xué) 電子信息工程學(xué)院, 北京 100044)
列車運行控制系統(tǒng)是保障行車安全和提高運輸效率的重要設(shè)備。作為列車運行控制系統(tǒng)核心設(shè)備之一的ZPW-2000系列無絕緣軌道電路(Jointless Track Circuit,JTC),主要用于實現(xiàn)列車占用檢查和地-車間相應(yīng)控制信息的連續(xù)傳輸。一旦其發(fā)生故障,將會影響行車效率,甚至危及行車安全[1]。對此,我國研發(fā)出相應(yīng)的信號集中監(jiān)測(Centralized Signal Monitoring,CSM)系統(tǒng),可以對包含JTC在內(nèi)的設(shè)備運行參數(shù)和電氣性能進行連續(xù)監(jiān)測和趨勢分析[2]。但在實際應(yīng)用中,CSM的作用并沒有得到充分發(fā)揮,同時還存在無效報警較多、故障報警后仍需現(xiàn)場維修人員逐個分析判斷具體故障點、監(jiān)測報警上下限設(shè)置無統(tǒng)一標準等不足[3]。如何充分利用好CSM系統(tǒng),克服其現(xiàn)有不足,提升其對JTC的監(jiān)測和診斷水平,已經(jīng)成為目前的研究熱點。
CSM系統(tǒng)對JTC進行智能分析的診斷理念于2008年被提出[4]。之后,文獻[5]提出了基于信息融合的JTC故障診斷方法。文獻[6]提出了將基于監(jiān)測數(shù)據(jù)的BP-LM-PSO-GA混合算法用于JTC故障診斷,以解決單獨設(shè)計神經(jīng)網(wǎng)絡(luò)帶來的運算量問題。文獻[7]提出了基于決策樹的JTC故障診斷方法。文獻[8]提出了基于最小二乘支持向量機的診斷方法。文獻[9]提出了基于模糊推理的JTC故障診斷算法,能對發(fā)送端模擬網(wǎng)絡(luò)斷路等17種故障進行診斷。文獻[10]結(jié)合決策樹算法和專家系統(tǒng),基于CSM系統(tǒng)監(jiān)測數(shù)據(jù)對JTC進行故障診斷,并對決策樹算法的連續(xù)屬性離散化過程作了優(yōu)化,提高了運算效率。文獻[11]提出了基于粒子群支持向量機的JTC故障診斷模型,將粒子群算法用于支持向量機的參數(shù)優(yōu)化,使其故障診斷率高于普通的SVM模型。文獻[12]提出了基于模糊認知圖模型的JTC故障診斷方法,隨后文獻[13]結(jié)合模糊認知圖與粗糙集,利用模糊認知圖構(gòu)建出了基于屬性約簡和模糊認知圖的故障分類器,并通過自適應(yīng)遺傳算法實現(xiàn)了模糊認知圖權(quán)重的設(shè)定。
綜合分析以上各文獻可以得出:①文獻[5,7-8,10-13]只能實現(xiàn)軌道電路10種以下故障的粗定位,即只能將故障劃定在軌道電路中一個較大的范圍內(nèi),要實現(xiàn)故障診斷,還需要相應(yīng)維修人員基于此范圍進行進一步的故障排查,故這些方法的維修效率不高;②文獻[5-13]的算法訓(xùn)練樣本均來自于鐵路現(xiàn)場,而由于現(xiàn)場不同故障的發(fā)生頻次差別很大,故會導(dǎo)致發(fā)生次數(shù)少的故障缺乏訓(xùn)練樣本,沒有發(fā)生過的故障,即未知故障,則沒有機會得到訓(xùn)練,從而無法實現(xiàn)其故障診斷。
針對以上問題,本文基于JTC和CSM系統(tǒng)的基本結(jié)構(gòu)和功能原理,首先對CSM系統(tǒng)的監(jiān)測數(shù)據(jù)進行建模,通過半實物平臺對仿真數(shù)據(jù)進行驗證;然后,針對故障粗定位和故障樣本有限的不足,采用故障注入技術(shù)[14],利用所建模型,采用人工方式有意識地主動產(chǎn)生故障,實現(xiàn)對JTC典型故障模式下CSM監(jiān)測數(shù)據(jù)的仿真,以此建立故障特征集,從而有效增加故障樣本類型和數(shù)量;最后,針對未知故障的處理難題,制定JTC故障智能診斷策略,基于隨機森林模型設(shè)計相應(yīng)的故障診斷算法。實驗表明,本文算法具有診斷范圍精準、算法泛化性高、對未知故障具有一定智能處理能力等優(yōu)點,能夠提升CSM系統(tǒng)對JTC的故障診斷性能。
JTC和CSM系統(tǒng)的基本結(jié)構(gòu)與工作原理示意見圖1。
JTC可分為發(fā)送端設(shè)備、主軌和小軌的接收端設(shè)備以及軌道線路。發(fā)送端設(shè)備主要包括發(fā)送器、發(fā)送電纜、發(fā)送端匹配變壓器和發(fā)送端調(diào)諧區(qū)等;主軌接收端設(shè)備主要包括包含衰耗器的主軌接收器、接收電纜、接收端匹配變壓器和接收端調(diào)諧區(qū)等;小軌接收端設(shè)備和主軌接收端設(shè)備結(jié)構(gòu)一致,并與發(fā)送端共用調(diào)諧區(qū);軌道線路主要包括鋼軌和鋼軌間并聯(lián)的補償電容等;調(diào)諧區(qū)由兩根鋼軌,以及并聯(lián)在鋼軌間的2個調(diào)諧單元BA1、BA2和1個空心線圈SVA構(gòu)成[15]。
JTC信號Ufb(t)由發(fā)送器產(chǎn)生,經(jīng)發(fā)送電纜、發(fā)送匹配變壓器和發(fā)送端調(diào)諧區(qū),在軌道線路無車時,一部分信號沿軌道線路向主軌接收端的接收器1傳送,另一部分信號向小軌接收端的接收器2傳送,最終主軌和小軌的接收器分別對所接收的信號進行處理。這里,Ufb(t)的數(shù)學(xué)表達式[16]為
(1)
式中:Amfb、fc、Δfp、φ0分別為Ufb(t)的振幅、載頻頻率、頻率偏移度(頻偏)、初始相位;sm(t)為占空比為1∶1、頻率為fd的方波調(diào)制信號。
在CSM系統(tǒng)中,采集機實時采集JTC的狀態(tài)信息,并由車站站機負責對其采集到的原始數(shù)據(jù)進行預(yù)處理、分析和存儲,再通過網(wǎng)絡(luò)設(shè)備將相關(guān)數(shù)據(jù)傳送至電務(wù)段;各鐵路局集團有限公司和中國國家鐵路局集團有限公司負責建立相關(guān)通信連接和數(shù)據(jù)交換,以便相關(guān)人員實時查看和分析[17]。CSM系統(tǒng)對JTC的監(jiān)測點共有6個,如圖1所示,分別是發(fā)送電纜設(shè)備側(cè)電壓Ufb(t)、發(fā)送電纜電纜側(cè)電壓Ufd(t)、主軌接收電纜電纜側(cè)電壓Ujd(t)、主軌接收電纜設(shè)備側(cè)電壓Ujb(t)、主軌接收器接收電壓Uzj(t)和小軌接收器接收電壓Uxj(t)。
基于傳輸線理論[18],對JTC調(diào)整狀態(tài)下CSM系統(tǒng)監(jiān)測數(shù)據(jù)進行建模,見圖2。
圖2 CSM系統(tǒng)監(jiān)測數(shù)據(jù)模型
發(fā)送電纜設(shè)備側(cè)電壓Ufb(t),即發(fā)送器輸出的信號。
發(fā)送電纜電纜側(cè)電壓Ufd(t)為
Ufd(t)=Ufb(t)/|Nscb11+Nscb12/Zscb|
(2)
(3)
(4)
(5)
主軌接收電纜電纜側(cè)電壓Ujd(t)可以通過發(fā)送電纜到主軌接收端匹配變壓器的等效四端網(wǎng)絡(luò)模型Njd推導(dǎo)得到,即
Ujd(t)=Ufb(t)/|Njd11+Njd12/Zrm|
(6)
(7)
(8)
(9)
主軌接收電纜設(shè)備側(cè)電壓Ujb(t)可以通過發(fā)送電纜到主軌接收電纜的等效四端網(wǎng)絡(luò)模型Njb推導(dǎo)得到,即
(10)
式中:Njb11、Njb12為Njb的特性參數(shù),即
(11)
主軌接收器接收電壓Uzj(t),由衰耗器的工作原理可知
Uzj(t)=Ujb(t)/nz
(12)
式中:nz為主軌接收端衰耗器初級線圈與對應(yīng)次級線圈的匝數(shù)比,其值為常數(shù)。
小軌接收器接收電壓Uxj(t)可以通過發(fā)送電纜到小軌接收電纜的等效四端網(wǎng)絡(luò)模型Nxj推導(dǎo)得到,即
(13)
(14)
最終,分別提取Ux(t)∈{Ufb(t),Ufd(t),Ujd(t),Ujb(t),Uzj(t),Uxj(t)}的有效值A(chǔ)x∈{Afb,Afd,Ajd,Ajb,Azj,Axj},即Ux(t)在一個周期T≈1/fc內(nèi)的方根均值為
(15)
基于JTC的半實物仿真平臺主要包括:ZPW-2000無絕緣軌道電路的發(fā)送器、接收器、衰耗器,以及發(fā)送端和接收端的匹配變壓器、調(diào)諧單元、空心線圈等實際設(shè)備;電纜采用專用模擬電纜網(wǎng)絡(luò);鋼軌線路采用專用軌道模擬盤。仿真平臺主要參數(shù):發(fā)送電平3級,載頻2 600 Hz,傳輸電纜總長度10 km,鋼軌線路長度1 229 m,補償電容數(shù)量15個,容值40 μF,道砟電阻2.0 Ω·km。
首先,利用萬用表Fluke 8842A采集并測試圖1中6個監(jiān)測點的信號電壓有效值A(chǔ)fb、Afd、Ajd、Ajb、Azj、Axj;然后,將其分別與式(1)、式(2)、式(6)、式(10)、式(12)、式(13)的仿真模型進行對比,對比結(jié)果見表1。
表1 基于半實物平臺的測量值與基于仿真模型的仿真值及其誤差
由表1可以得出,JTC半實物平臺的測量值與基于本文模型的仿真值較為接近,其最大相對誤差小于6%,最大絕對誤差小于3 V。表明本文所建立模型可以準確表征各監(jiān)測點的電壓模型。
為了達到故障定位精準以及能有效處理未知故障的目的,本文提出一種基于隨機森林的智能診斷算法,其結(jié)構(gòu)框架見圖3,主要包括特征提取和算法訓(xùn)練兩部分。
圖3 JTC故障智能診斷算法結(jié)構(gòu)框架
特征提?。焊鶕?jù)不同故障模式對CSM系統(tǒng)監(jiān)測數(shù)據(jù)的影響規(guī)律,一方面,針對現(xiàn)有研究中的故障定位精度不高和故障樣本有限等不足,采用故障注入技術(shù)[14],通過設(shè)置各元器件故障值,仿真模擬JTC典型故障模式下的CSM監(jiān)測數(shù)據(jù),并對仿真結(jié)果進行有效值特征提取,以構(gòu)建用于訓(xùn)練故障診斷初始模型的故障特征集,有效增加故障樣本類型和數(shù)量;另一方面,對于現(xiàn)場實時的CSM監(jiān)測數(shù)據(jù),基于同樣的規(guī)則提取數(shù)據(jù)的有效值特征。
算法訓(xùn)練與診斷:基于故障特征集生成隨機森林初始模型,通過訓(xùn)練確定隨機森林參數(shù)及閾值,針對未知故障的處理難題,制定包含再訓(xùn)練過程的JTC故障智能診斷策略。對實時監(jiān)測數(shù)據(jù)提取的特征,經(jīng)過JTC故障診斷模型后,輸出診斷結(jié)果及相應(yīng)指標,根據(jù)指標值是否大于閾值決定模型是否進入再訓(xùn)練過程。當指標值大于閾值時,診斷JTC狀態(tài)為典型故障并直接輸出診斷結(jié)果;否則,將診斷結(jié)果作誤判或未知故障處理,進入再訓(xùn)練過程,請求現(xiàn)場人員評判故障類型,利用現(xiàn)場評判結(jié)果及相應(yīng)的監(jiān)測數(shù)據(jù)特征,重新訓(xùn)練故障診斷模型,從而提高模型對該種故障的敏感性,使其不斷完善。
根據(jù)現(xiàn)場調(diào)研和JTC的故障致因分析[19],本文將JTC故障劃分為室內(nèi)設(shè)備故障、室外設(shè)備故障、電纜故障、鋼軌線路故障等。其中,室內(nèi)外設(shè)備故障主要易出現(xiàn)斷線、發(fā)送器發(fā)送電壓偏小或偏大、匹配變壓器參數(shù)值偏小等情況;電纜故障主要易出現(xiàn)斷線和模擬網(wǎng)絡(luò)參數(shù)值偏小等情況;鋼軌線路故障主要易出現(xiàn)補償電容值偏小或斷線以及道砟電阻偏小或偏大的情況。最終總結(jié)出31種JTC典型故障,見表2。
表2 JTC典型故障類型分布表
考慮到故障特征集的完備性,基于上述模型對31種故障各仿真40組數(shù)據(jù),提取特征,以構(gòu)建故障特征集D。令#D為集合D中元素的數(shù)目,則#D=31×40=1 240。從#D個樣本中分層隨機抽取60%作為訓(xùn)練集DT訓(xùn)練隨機森林模型,20%作為驗證集DV用于模型調(diào)參,20%作為測試集DE評估性能。
隨機森林[20]是一個由多個樹分類器構(gòu)成的現(xiàn)代機器學(xué)習(xí)算法,具有計算開銷小、泛化性能好等特點。因為數(shù)值縮放對樹模型的結(jié)構(gòu)不造成影響,所以也無需對特征集作歸一化處理。隨機森林模型示意見圖4。
圖4 隨機森林模型示意
圖4中,每棵決策樹根據(jù)輸入特征A=[AfbAfdAjdAjbAzjAxj]輸出故障結(jié)果對應(yīng)的編號e,最后通過結(jié)合策略得到隨機森林模型的輸出。本文選取的隨機森林基分類器為CART決策樹,該樹為二叉樹,使用Gini指數(shù)計算結(jié)點的純度,運算速度快。一棵決策樹包含一個根結(jié)點、若干個內(nèi)部結(jié)點和若干個葉結(jié)點;葉結(jié)點對應(yīng)于故障診斷結(jié)果的編號e,其他每個結(jié)點則對應(yīng)于一個特征測試;每個結(jié)點包含的樣本集合根據(jù)特征測試的結(jié)果被劃分到子結(jié)點中;根結(jié)點包含樣本全集[21]。
隨機森林初始模型的生成流程見圖5。其特點主要是訓(xùn)練樣本有放回隨機抽取以及待選特征集隨機組成兩個隨機特性。具體流程如下:
圖5 隨機森林初始模型的生成流程
Step1生成根結(jié)點樣本集Dt。
利用自助法隨機抽取技術(shù)[22],從訓(xùn)練集DT中有放回地隨機抽取等量m個樣本,構(gòu)建單棵決策樹的訓(xùn)練集Dt,即根結(jié)點的樣本集。
DT={(Ai,ei)|i=1,…,m}
(16)
Ai=[Afb,iAfd,iAjd,iAjb,iAzj,iAxj,i]
(17)
ei∈{1,2,…,n}
(18)
式中:Ai為第i個訓(xùn)練樣本的監(jiān)測數(shù)據(jù)特征;ei為第i個訓(xùn)練樣本的故障編號。
Step2生成待選特征集F。
若結(jié)點分裂不會使該決策樹超過其最大深度g的限制,則從d=6個電壓特征中隨機抽取k個不同的特征生成待選特征集F,即
F?{Afb,Afd,Ajd,Ajb,Azj,Axj}∧(#F=k)
(19)
通常,令k=log2d[20];否則,遍歷其他未遍歷過的結(jié)點。
Step3選擇最優(yōu)劃分特征A*和最優(yōu)劃分點r*。
A*的選擇基于結(jié)點純度最高原則,使用Gini指數(shù)來度量樣本集合的純度。分析即將進行分支的根結(jié)點,其包含的故障特征集Dt的Gini值定義為
(20)
式中:Cj為Dt中故障編號為j的子集,即
Cj={(Ai,ei)∈Dt|ei=j}
(21)
考慮到本文的電壓特征為連續(xù)特征,所以在計算不同劃分方式對應(yīng)的Gini指數(shù)時,利用二分法處理機制[23]先將特征離散化。對于故障特征集Dt和某一監(jiān)測數(shù)據(jù)特征
Ax∈{Afb,Afd,Ajd,Ajb,Azj,Axj}
(22)
假定Ax在Dt上出現(xiàn)了q個不同的取值,將這些值從小到大進行排序,記為
(23)
(24)
(25)
對連續(xù)特征Ax,在RAx中選取其最優(yōu)劃分點r*。
結(jié)合式(20),通過計算Dt基于Ax劃分的Gini指數(shù)Gini_i(Dt,Ax)來確定最優(yōu)劃分點r*,即
(26)
(27)
式中:Gini_i(Dt,Ax,r)為樣本集Dt基于劃分點r二分后的Gini指數(shù);r*為使Gini_i(Dt,Ax,r)最大化的劃分點。在樣本集Dt中,每個特征Ax都對應(yīng)一個最優(yōu)劃分點r*。
在待選特征集F中,選擇使得Gini_i(Dt,Ax)最小的特征作為最優(yōu)劃分特征A*,即
(28)
其對應(yīng)劃分后的樣本集合純度最高,從而確定了最優(yōu)劃分特征A*及對應(yīng)的最優(yōu)劃分點r*。
Step4生成子結(jié)點與葉結(jié)點。
結(jié)點根據(jù)上述過程確定的A*、t*進行分裂,若產(chǎn)生的兩個子結(jié)點包含的樣本數(shù)量均滿足設(shè)定的葉結(jié)點最小樣本數(shù)b的條件,則生成這兩個子結(jié)點;否則,不進行分裂,遍歷其他未遍歷過的結(jié)點進行分裂,即
(29)
當子結(jié)點滿足Gini(·)=0或者包含的樣本數(shù)量小于設(shè)定的拆分內(nèi)部結(jié)點所需的最小樣本數(shù)c等結(jié)點停止分裂條件時,該子結(jié)點成為葉結(jié)點,繼續(xù)遍歷其他未遍歷過的結(jié)點進行分裂;否則,該結(jié)點繼續(xù)分裂,即
(30)
Step5存儲決策樹與生成隨機森林。
當遍歷完所有的結(jié)點后,存儲該決策樹。當決策樹數(shù)目達到隨機森林所要求的規(guī)模s時,生成隨機森林初始模型;否則,繼續(xù)生成下一棵決策樹。
(31)
(32)
(33)
隨機森林最終輸出不同j對應(yīng)Hj(A)中的最大預(yù)測概率H*(A)及對應(yīng)的故障編號j*(A),即
(34)
Step6故障診斷模型的再訓(xùn)練。
從圖3可知,針對未知故障的處理難題,故障診斷模型會參與一個再訓(xùn)練過程。該過程有一個閾值θ,實時監(jiān)測數(shù)據(jù)經(jīng)過特征提取與JTC故障診斷模型后,輸出診斷結(jié)果j*及相應(yīng)指標H*。當指標H*≥θ時,直接輸出對應(yīng)的診斷結(jié)果j*;當H*<θ時,則進入再訓(xùn)練過程,結(jié)合現(xiàn)場判斷的JTC實際故障類型編號j#和對應(yīng)提取的特征A#構(gòu)建輸入樣本(A#,j#),添加到原訓(xùn)練集DT中,重新訓(xùn)練隨機森林模型。
隨機森林模型對JTC的診斷性能主要取決于森林的規(guī)模s、樹的最大深度g、葉結(jié)點最小樣本數(shù)b、拆分內(nèi)部結(jié)點所需的最小樣本數(shù)c這4個參數(shù)。在上述模型訓(xùn)練過程中,已知本文中單棵決策樹訓(xùn)練樣本數(shù)目m= #D×60%=744,故障類型數(shù)n=31。
針對驗證集DV上的模型準確率a(DV),對上述4個參數(shù)進行隨機搜索,最終a(DV)達到99.44%,對應(yīng)s=70,g=9,b=13,c=14。模型準確率a(DV)為驗證集DV中經(jīng)過模型后預(yù)測的診斷結(jié)果j*正確的樣本占比,即
(35)
(36)
在測試集DE上模型準確率a(DE)達到了98.25%,表明模型有較好的泛化性能。
基于DE,引入本文算法中的再訓(xùn)練過程,對閾值θ的取值進行確定。分別計算θ由0到1、步長為0.01的算法準確率aθ(DE)。與a(DE)稍有不同,aθ(DE)為DE中輸出指標H*達到閾值θ且預(yù)測的診斷結(jié)果j*正確的樣本占比,即
χ[j*(Ai)=ei)]
(37)
(38)
不同閾值θ下算法準確率aθ曲線見圖6??梢钥闯?,θ在[0,0.5]區(qū)間時,算法準確率保持在較高水平,均在97.14%以上,最高可達99.21%;虛警率FAθ(DE)和漏報率MAθ(DE)均為0;對于鋼軌線路的故障存在少數(shù)例拒絕識別的情況,但它們的指標對應(yīng)的診斷結(jié)果均是正確的,只是沒達到θ,所以它們并沒有被錯分到其他故障類型。
圖6 測試集DE在不同閾值θ下的算法準確率aθ曲線
FAθ(DE)和MAθ(DE)均考慮了θ的作用,即
χ(j*(Ai)≠1))
(39)
χ[j*(Ai)=1)]
(40)
由此可見,通過加入一個再訓(xùn)練過程對隨機森林模型進行改進,在DE上的算法準確率aθ已經(jīng)可以超過再訓(xùn)練之前的模型準確率a。顯然,在保證較高aθ的同時,θ越大,算法輸出結(jié)果對應(yīng)的最大預(yù)測概率越高,即可以使結(jié)果更加可信。通過本文的分析結(jié)果,閾值θ設(shè)置為0.4。針對不同的實際情況,閾值θ通過在算法準確率和輸出結(jié)果可信度之間的權(quán)衡進行調(diào)整。
4.1.1 已知故障
采用故障注入技術(shù),在半實物平臺上人工模擬JTC故障9,即使發(fā)送端調(diào)諧區(qū)BA1發(fā)生斷線。通過對CSM系統(tǒng)監(jiān)測數(shù)據(jù)進行有效值特征提取,得到數(shù)據(jù)Afb、Afd、Ajd、Ajb、Azj、Axj分別為137.71、45.39、3.67、0.47、0.24、4.71 V。
將數(shù)據(jù)A=[AfbAfdAjdAjbAzjAxj]傳入訓(xùn)練好的隨機森林模型的每棵決策樹中,根據(jù)每個結(jié)點的劃分條件逐級傳遞,直到到達葉結(jié)點。根據(jù)式(33)輸出A屬于不同故障編號j對應(yīng)狀態(tài)類型的預(yù)測概率Hj(A),對n個概率從大到小依次排序,前5位分別為H9(A)、H10(A)、H8(A)、H22(A)、H12(A),它們的值分別為0.425、0.156、0.107、0.054、0.051。
根據(jù)式(34)模型輸出最大值H*(A)=H9(A)及對應(yīng)的狀態(tài)類型j*(A)=9。通過閾值判斷,H*(A)≥θ(θ=0.4)條件成立,判斷出此時JTC故障為對應(yīng)于故障編號為9的狀態(tài)類型。這與半實物平臺實際故障狀態(tài)一致,從而證明了本文所提算法對JTC典型故障診斷的有效性。
4.1.2 未知故障
通過半實物平臺獲取了4例本文仿真訓(xùn)練集中不包含的組合故障,見表3,其相應(yīng)的編號依次延伸。
表3 部分未知的組合故障類型
同樣將4組數(shù)據(jù)傳入模型,根據(jù)式(33)輸出4組數(shù)據(jù)屬于不同故障編號j對應(yīng)狀態(tài)類型的預(yù)測概率Hj(A),對n個概率從大到小依次排序得到表4,同樣僅顯示前5位。
表4 不同未知故障n個概率Hj(A)從大到小排序后的前5位
根據(jù)式(34),4組數(shù)據(jù)的模型輸出指標H*(A)均不能滿足閾值判斷條件H*(A)≥θ,所以算法進入再訓(xùn)練過程,用實際故障編號和輸入數(shù)據(jù)構(gòu)建輸入樣本,添加到原訓(xùn)練集DT中,重新生成隨機森林模型。
在半實物平臺再次獲取上述組合故障的不同測試樣本,得到不同閾值θ下的算法準確率aθ曲線,見圖7。由圖7可以看出,θ在[0.35,0.42]區(qū)間時,算法已經(jīng)可以對該4種未知故障進行精準識別,與之前訓(xùn)練得到的閾值θ=0.4對應(yīng)。
圖7 部分未知故障數(shù)據(jù)集在不同閾值θ下的算法準確率aθ曲線
通過半實物平臺,利用故障注入技術(shù),人為設(shè)置表2中傳輸電纜、調(diào)諧區(qū)調(diào)諧單元、空心線圈、補償電容、衰耗器等13種斷線故障的243組采集數(shù)據(jù),構(gòu)建算法性能測試集。利用本文提出的故障診斷方法,對這些數(shù)據(jù)進行診斷分析。不同閾值θ下算法準確率aθ曲線見圖8。
圖8 實時監(jiān)測數(shù)據(jù)在不同閾值θ下的算法準確率aθ曲線
由圖8可以看出,θ在[0.33,0.49]區(qū)間時,算法的準確率處于較高水平,均在92.18%以上,與之前訓(xùn)練得到的閾值θ=0.4對應(yīng);根據(jù)式(39)和式(40),其虛警率和漏報率均為0;對于調(diào)諧區(qū)和鋼軌線路的故障分別存在少數(shù)例拒絕識別的情況,但由于其指標對應(yīng)的診斷結(jié)果均是正確的,只是沒有達到θ,故這些故障并沒有被錯分到其他故障類型。
進一步,利用本文表2所示的31種故障類型數(shù)據(jù),分別對文獻[5-13]所提方法的故障診斷結(jié)果進行分類統(tǒng)計,其統(tǒng)計結(jié)果見圖9。
圖9 本文方法與現(xiàn)有研究可區(qū)分的故障類型數(shù)目對比
由圖9可知,對于表2所示的這31種故障,本文方法可實現(xiàn)完全有效區(qū)分;文獻[6]和文獻[9]將其劃分為17類;文獻[12]和文獻[13]劃分為9類;文獻[10]劃分為7類;文獻[5]、文獻[7]和文獻[8]劃分為6類;文獻[11]劃分為5類??梢姡疚乃惴ǖ墓收献R別度更高,能夠更精確地實現(xiàn)設(shè)備的故障定位,提高設(shè)備維修效率。
JTC是列控系統(tǒng)的重要組成部分,CSM系統(tǒng)能夠?qū)崿F(xiàn)對JTC的自動診斷。為進一步提高CSM系統(tǒng)的診斷性能,本文基于CSM系統(tǒng)的工作原理,提出了一種基于隨機森林的JTC故障智能診斷方法。可得以下結(jié)論:
(1)通過傳輸線理論,對CSM系統(tǒng)的JTC數(shù)據(jù)采集過程進行建模,并在JTC半實物仿真平臺上進行了模型驗證。
(2)利用所建模型,采用故障注入技術(shù),對JTC典型故障模式下的CSM監(jiān)測數(shù)據(jù)進行仿真,建立了故障特征集。
(3)最后,制定包含再訓(xùn)練過程的JTC故障智能診斷策略,設(shè)計了基于隨機森林的故障智能診斷算法。
(4)實驗表明,本文算法基于CSM系統(tǒng),在不增加額外采集點的情況下,能夠準確定位JTC上31種典型故障,其故障分類識別能力優(yōu)于參考文獻中的現(xiàn)有算法,且準確率達到92.18%。此外,本文算法對未知故障具有較高的智能診斷和學(xué)習(xí)能力。
綜上所述,本文算法具有故障定位準確、識別度高和適應(yīng)性強等特點,能夠提升CSM系統(tǒng)對JTC的故障診斷性能。