初廣前,李璐,張嘉馳,錢佳瑤
山東交通學(xué)院軌道交通學(xué)院,山東濟(jì)南 250357
截至2020年底,我國高速鐵路運(yùn)營里程達(dá)3.79萬km,穩(wěn)居世界第一,在初步建成“四縱四橫”的高鐵網(wǎng)絡(luò)基礎(chǔ)上,進(jìn)一步規(guī)劃了“八縱八橫”高鐵網(wǎng)絡(luò)[1]。軌道電路是鐵路運(yùn)輸中的重要組成部分,為保證鐵路運(yùn)行的安全性,需準(zhǔn)確判斷軌道電路的狀態(tài)并進(jìn)行預(yù)測。
診斷軌道電路故障一般分為人工診斷、數(shù)學(xué)模型診斷及人工智能診斷3種方法。人工診斷是指技術(shù)人員根據(jù)儀器檢測的參數(shù)波動,依靠專業(yè)知識和經(jīng)驗(yàn)判斷故障,工作量大,效率和準(zhǔn)確率均較低,并且存在安全隱患。汪培平[2]基于3V化經(jīng)驗(yàn)準(zhǔn)則判斷軌道電路分路不良的情況,方法簡單、易操作,但判斷準(zhǔn)確率不高。也可采用計(jì)軸方式,或增加鋼軌軌面電壓及短路電流、鋼軌兩側(cè)端阻抗等方法解決軌道電路分路不良的問題[3-5]。數(shù)學(xué)模型診斷是指采用軌道電路網(wǎng)絡(luò)、電氣絕緣節(jié)、補(bǔ)償電容等設(shè)備,通過構(gòu)建電路數(shù)學(xué)模型研究軌道電路的調(diào)整狀態(tài)、分路狀態(tài)和斷軌狀態(tài)[6-7]。軌道電路故障診斷屬于動態(tài)系統(tǒng),具有復(fù)雜性兼非線性,很難建立數(shù)學(xué)模型,無法高效準(zhǔn)確地診斷故障[8]。人工智能診斷是通過人工智能技術(shù)進(jìn)行故障診斷[9]??梢圆捎萌后w智能算法診斷軌道電路故障:在軌道電路的故障診斷室,綜合運(yùn)用模擬退火算法和粒子群算法,具有較高的判斷準(zhǔn)確率,可克服傳統(tǒng)粒子群算法易陷入局部最優(yōu)解的缺點(diǎn)[10]。但群體智能算法需要海量的迭代步驟,難以達(dá)到全局最優(yōu)解。
近年來,機(jī)器學(xué)習(xí)在軌道交通行業(yè)得到了廣泛應(yīng)用。Gibert等[11]在多任務(wù)學(xué)習(xí)框架中,結(jié)合多個(gè)檢測器對鐵路軌道監(jiān)控,提高了鐵路枕木和扣件缺陷檢測的準(zhǔn)確率。Stallkamp等[12]將局部神經(jīng)網(wǎng)絡(luò)和決策樹分類器應(yīng)用到軌道電路故障檢測中,正確檢測率和定位率分別為99%、92%。鄭云水等[13]運(yùn)用模糊神經(jīng)網(wǎng)絡(luò)理論診斷軌道電路的故障,并優(yōu)化仿真模型,結(jié)果表明該模型具有較高的診斷準(zhǔn)確率。吳志鵬[14]采用決策樹C4.5算法診斷ZPW-2000A軌道電路故障。孫浩洋[15]對比分析ZPW-2000A無絕緣軌道電路設(shè)備故障的多個(gè)影響因素,均衡化處理歷史運(yùn)行數(shù)據(jù),并結(jié)合故障樹理論和隱半馬爾可夫模型預(yù)測軌道電路故障。賀帥超[16]針對25 Hz相敏軌道電路故障,分析不同區(qū)段的軌道電路狀態(tài),基于神經(jīng)網(wǎng)絡(luò)和模糊邏輯系統(tǒng)搭建故障診斷系統(tǒng)。王瑞峰等[17]分析故障類型與故障征兆的聯(lián)系并建立集合,用集對分析結(jié)合熵權(quán)法及隸屬函數(shù)描述運(yùn)行狀態(tài)對應(yīng)關(guān)系,建立模型反映軌道電路的運(yùn)行狀態(tài)及故障類型。牛行通[18]分析25 Hz相敏軌道電路的工作原理、常見故障及故障原因,用改進(jìn)的蝙蝠算法優(yōu)化模糊反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network ,BPNN)模型,提高軌道電路故障的診斷準(zhǔn)確率。朱文博[19]采用基于改進(jìn)決策樹算法診斷軌道電路故障,并開發(fā)1套采用VC++6.0平臺與MFC類庫進(jìn)行可視化界面編程的軌道電路故障診斷系統(tǒng)。田粉霞等[20]采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)診斷調(diào)諧區(qū)故障,篩選卷積層的局部最優(yōu)參數(shù),采用dropout方法避免過擬合現(xiàn)象,實(shí)現(xiàn)故障分類。謝旭旭等[21]根據(jù)四端網(wǎng)絡(luò)建立無絕緣軌道電路等效模型,繪制故障診斷總體框圖,確立合理的診斷結(jié)果層數(shù)結(jié)構(gòu),根據(jù)動態(tài)增添算法和粒子群算法優(yōu)化框架、精簡網(wǎng)絡(luò)結(jié)構(gòu),用My SQL數(shù)據(jù)庫、C#語言及混合編程技術(shù)建立故障診斷系統(tǒng)。董煜[22]構(gòu)建軌道電路四端網(wǎng)絡(luò)模型,計(jì)算得到軌道電路的臨界電壓,構(gòu)造初步故障診斷模型,用BPNN、灰色關(guān)聯(lián)分析和模糊綜合評判診斷故障,通過輸出結(jié)果構(gòu)造基本概率賦值(basic probability assignment,BPA),建立故障診斷模型。
上述研究大多采用有監(jiān)督學(xué)習(xí)模型,需要提前對樣本進(jìn)行人工分類及訓(xùn)練,增大了人力和物力成本。本文研究3種典型機(jī)器學(xué)習(xí)算法在軌道電路狀態(tài)判斷中的應(yīng)用,以期為準(zhǔn)確判斷軌道電路狀態(tài)提供參考,保障軌道通車安全。
軌道電路由鋼軌線路和鋼軌絕緣組成,主要包括鋼軌、鋼軌絕緣、軌端接續(xù)線、送電端(軌道電源和限流器)、受電端(軌道繼電器)等[23],如圖1所示。
圖1 軌道電路結(jié)構(gòu)示意圖
根據(jù)軌道上是否有列車存在,軌道電路可分為線路空閑和線路占用2種情況:線路空閑時(shí),繼電器吸起,信號燈亮綠燈;線路占用時(shí),信號燈亮紅燈,后續(xù)列車停車,禁止進(jìn)入軌道電路區(qū)間。軌道電路的工作原理為:當(dāng)線路空閑時(shí),軌道電路為通路,繼電器中有電,繼電器保持吸起狀態(tài);有列車進(jìn)入軌道電路時(shí),機(jī)車車輛輪對可導(dǎo)電,輪對也是軌道電路的組成部分,且輪對電阻較小,改變了軌道電路的電流,繼電器落下,信號燈亮紅燈。
高斯混合模型(Gaussian mixture model,GMM)屬于無監(jiān)督機(jī)器學(xué)習(xí)模型,該模型采用多個(gè)服從高斯分布的線性組合刻畫數(shù)據(jù)分布。當(dāng)高斯分布的數(shù)目足夠多時(shí),可逼近任意分布的概率分布密度函數(shù)[24]。GMM的概率分布
GMM的核心問題是求解參數(shù){αk,μk,Σk},可采用最大期望(expectation maximization,EM)算法[25]。為了加快EM算法的收斂,對輸入數(shù)據(jù)進(jìn)行預(yù)處理,將輸入數(shù)據(jù)映射至[-1,1]內(nèi),映射關(guān)系式為:
式中:ymin、ymax分別為樣本數(shù)據(jù)中的最小值、最大值。
采用EM算法,對GMM參數(shù)進(jìn)行估計(jì)的步驟為:
1)對參數(shù){αk,μk,Σk}隨機(jī)賦值,此處將其賦值為[0,1]內(nèi)的隨機(jī)數(shù);
2)計(jì)算第k個(gè)分量模型對觀測數(shù)據(jù)的響應(yīng)程度,計(jì)算公式為:
3)更新參數(shù)模型的求解參數(shù){αk,μk,Σk},公式分別為
4)判斷是否滿足迭代終止條件,若不滿足,則返回步驟2)。
當(dāng)GMM參數(shù)收斂后,模型構(gòu)建完成,可將每個(gè)樣本最大αk對應(yīng)的分模型作為判斷結(jié)果。GMM是無監(jiān)督學(xué)習(xí)算法,未知聚類后樣本的標(biāo)簽,可采用1種計(jì)算GMM分類準(zhǔn)確率的算法:
1)從原始樣本{yn}中找出包含某一標(biāo)簽l的所有樣本集合{yn};
2)將該集合{yn}作為GMM的輸入,取最大αk對應(yīng)的分模型作為判斷結(jié)果;
3)取步驟2)中數(shù)目最多的分模型作為GMM對標(biāo)簽為l的樣本的判斷結(jié)果,記數(shù)目為Sl;
BPNN為多層前饋神經(jīng)網(wǎng)絡(luò),非線性映射能力和泛化能力良好,應(yīng)用廣泛。BPNN運(yùn)行過程中的2個(gè)重要步驟是正向傳播和反向傳播:正向傳播是由輸入層,經(jīng)多層隱含層,最后至輸出層,輸入數(shù)據(jù)在每層都要經(jīng)神經(jīng)元激活函數(shù)處理;反向傳播過程則先對比預(yù)期結(jié)果與計(jì)算模型的輸出結(jié)果,再將二者之差反向傳入神經(jīng)網(wǎng)絡(luò),不斷調(diào)節(jié)鏈接強(qiáng)度和閾值,降低誤差,直至滿足收斂條件。BPNN采用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。BPNN包含1層輸入層,3層隱含層,1層輸出層。輸入層有2個(gè)神經(jīng)元,每層隱含層網(wǎng)絡(luò)均有10個(gè)神經(jīng)元,輸出層有1個(gè)神經(jīng)元。
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
在整個(gè)神經(jīng)網(wǎng)絡(luò)的組成構(gòu)架中,采用sigmod函數(shù)作為神經(jīng)元激活函數(shù),表達(dá)式為:
f(x)=1/(1+e-(WTx+b)),
(1)
訓(xùn)練樣本前先對輸入數(shù)據(jù)進(jìn)行歸一化預(yù)處理,再在模型中開始訓(xùn)練,保證輸入數(shù)據(jù)不同維度間的差異不會過大。對數(shù)據(jù)進(jìn)行歸一化處理時(shí),將輸入數(shù)據(jù)映射到[-1,1]內(nèi),映射關(guān)系式為
式中:xmin、xmax分別為輸入數(shù)據(jù)中的最小值、最大值。
采用梯度下降法更新BPNN的權(quán)值[26],公式為
式中:t為訓(xùn)練次數(shù);E(t)為總誤差函數(shù);η為步長因子,η∈(0,1)。
采用沖量項(xiàng)的方法避免損失函數(shù)收斂到局部極小值[27],沖量項(xiàng)的計(jì)算公式為:
Δwji(n)=ηδjxji+αΔwji(n-1),
Δbj(n)=ηδj+αΔbj(n-1),
式中:α為沖量系數(shù),α∈(0,1)。
若BPNN隱含層節(jié)點(diǎn)過多,網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜,復(fù)雜網(wǎng)絡(luò)的訓(xùn)練成本將成倍增加,產(chǎn)生過擬合現(xiàn)象,即在訓(xùn)練樣本上準(zhǔn)確率較高,但試驗(yàn)樣本中準(zhǔn)確率略低;若BPNN隱含層節(jié)點(diǎn)過少,網(wǎng)絡(luò)結(jié)構(gòu)過于簡單,輸入與輸出的關(guān)系未準(zhǔn)確表達(dá),產(chǎn)生欠擬合現(xiàn)象。確定隱含層節(jié)點(diǎn)數(shù)[28]
式中:n為輸入層節(jié)點(diǎn)數(shù),l為輸出層節(jié)點(diǎn)數(shù),γ為常數(shù),γ∈[1,10]。
因此,BPNN的訓(xùn)練步驟為:1)網(wǎng)絡(luò)權(quán)值初始化,對輸入層權(quán)值和輸出層權(quán)值隨機(jī)賦值,將網(wǎng)絡(luò)權(quán)值與閾值隨機(jī)賦值為[0,1]的隨機(jī)數(shù);2)計(jì)算隱含層輸出值,將隱含層輸出值作為輸出層輸入值帶入式(1),得到輸出層的輸出結(jié)果;3)根據(jù)預(yù)期結(jié)果與輸出層的輸出結(jié)果計(jì)算均方根誤差(root mean square error,RMSE),根據(jù)RMSE采用梯度下降法更新各層網(wǎng)絡(luò)權(quán)值與閾值;4)判斷是否滿足迭代終止條件,若不滿足,則返回步驟3)。
邏輯回歸(logistic regression,LR)分類模型是針對多類別分類的典型模型,本文采用多項(xiàng)LR分類模型。假設(shè)離散變量取值集合為{1,2,…,K},則多項(xiàng)LR分類模型[29]
(2)
LR分類模型的損失函數(shù)
式中:u{·}為指示函數(shù),若輸入?yún)?shù)內(nèi)容為真,返回?cái)?shù)值為1,反之則返回0。
訓(xùn)練模型參數(shù)使損失函數(shù)取得最小值。該損失函數(shù)不能采用解析解求得參數(shù)。采用梯度下降法求解模型參數(shù)的最優(yōu)解,損失函數(shù)的梯度表達(dá)式為
θk:=θk-ε▽θkJ(θ),
式中ε為步長因子。
采用梯度下降法求解LR分類模型參數(shù)的步驟為:1)初始化模型參數(shù),將模型參數(shù)θk隨機(jī)賦值為[0,1]的隨機(jī)數(shù);2)計(jì)算損失函數(shù)的梯度▽θkJ(θ);3)更新模型參數(shù)θk;4)判斷所有的模型參數(shù)θk是否收斂,若不收斂,則返回步驟2)。
對實(shí)際不同狀態(tài)下的軌道電路進(jìn)行數(shù)據(jù)讀取和采集。在軌道末端選取數(shù)據(jù)采集點(diǎn),分別測量空閑和占用狀態(tài)下軌道電路的電壓和電流,測得的數(shù)據(jù)散點(diǎn)如圖3所示。
圖3 軌道電路測量數(shù)據(jù)散點(diǎn)示意圖
由圖3可知:空閑狀態(tài)樣本分布較密集,電壓主要集中在0.20~0.25 V,電流主要集中在60~80 mA;占用狀態(tài)的樣本分布較離散,電流、電壓跨度較大,電壓為0.3~0.7 V,電流為110~200 mA。
按2.1節(jié)要求,對樣本數(shù)據(jù)進(jìn)行歸一化預(yù)處理,并將其作為GMM的輸入。軌道電路有空閑和占用2個(gè)工作狀態(tài),設(shè)定GMM中K=2,每個(gè)高斯分布有電壓和電流2個(gè)維度,設(shè)定收斂條件為相鄰2次估計(jì)的參數(shù)變動范圍小于10-10,可得EM算法估計(jì)次數(shù)與參數(shù)變化量的關(guān)系,如圖4所示。
圖4 EM算法估計(jì)次數(shù)與參數(shù)變化量示意圖
經(jīng)過EM算法處理后,待估計(jì)參數(shù)經(jīng)過7次估計(jì)后收斂,其數(shù)值穩(wěn)定,不再發(fā)生變化,計(jì)算所得參數(shù)為
按2.2節(jié)要求,對樣本數(shù)據(jù)進(jìn)行歸一化預(yù)處理并將其作為BPNN的輸入,構(gòu)建如圖2所示的BPNN模型。輸入層2個(gè)神經(jīng)元分別對應(yīng)每個(gè)樣本的電壓和電流。軌道電路態(tài)為空閑狀態(tài),神經(jīng)網(wǎng)絡(luò)模型輸出參數(shù)為0;軌道電路狀態(tài)為占用狀態(tài),神經(jīng)網(wǎng)絡(luò)模型輸出參數(shù)為1。
對樣本數(shù)據(jù)預(yù)處理后開始訓(xùn)練模型。設(shè)訓(xùn)練樣本數(shù)占總樣本數(shù)的25%。η=0.01,α=0.2,RMSE與訓(xùn)練次數(shù)的關(guān)系如圖5所示。
由圖5可知:隨訓(xùn)練次數(shù)的增加,RMSE逐漸減小。訓(xùn)練次數(shù)小于150時(shí),包含2層隱含層的神經(jīng)網(wǎng)絡(luò)的RMSE比包含3層隱含層的神經(jīng)網(wǎng)絡(luò)?。挥?xùn)練次數(shù)超過150時(shí),結(jié)果相反;訓(xùn)練次數(shù)大于200時(shí),兩者的RMSE變化均不大,且趨近于0.15,故設(shè)定訓(xùn)練次數(shù)為1000次。
圖5 RMSE與訓(xùn)練次數(shù)的關(guān)系曲線
最終識別結(jié)果為:在訓(xùn)練次數(shù)為1000的前提下,包含2層隱含層、3層隱含層的BPNN判斷準(zhǔn)確率均為100%。
不同隱含層的BPNN模型、GMM和LR分類模型的判斷準(zhǔn)確率如表1所示。
表1 不同模型判斷結(jié)果
由表1可知:有監(jiān)督學(xué)習(xí)模型的BPNN(2層隱含層、3層隱含層)模型的識別率非常準(zhǔn)確,LR分類模型的識別準(zhǔn)確率相對較低。無監(jiān)督學(xué)習(xí)模型的GMM與BPNN模型的準(zhǔn)確率相同。有監(jiān)督學(xué)習(xí)模型需提前對模型進(jìn)行分類和訓(xùn)練,GMM可在節(jié)約成本的前提下,準(zhǔn)確判斷軌道電路的不同狀態(tài)。
研究無監(jiān)督學(xué)習(xí)算法GMM、有監(jiān)督學(xué)習(xí)算法BPNN模型與LR分類模型3種典型機(jī)器學(xué)習(xí)算法在軌道電路狀態(tài)判斷中的應(yīng)用,并在實(shí)測數(shù)據(jù)集上對模型進(jìn)行訓(xùn)練與測試。結(jié)果表明:GMM無需得到先驗(yàn)知識即可準(zhǔn)確判斷軌道電路的不同狀態(tài)。試驗(yàn)數(shù)據(jù)來源于教學(xué)演示設(shè)備,可進(jìn)一步采用現(xiàn)場實(shí)測數(shù)據(jù)提高GMM的普適性和魯棒性。