張卜,劉怡伶,張文靜
(201620 上海市 上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院)
隨著人工智能蓬勃發(fā)展,利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法挖掘大量軌道交通監(jiān)測(cè)數(shù)據(jù)背后的規(guī)律,建立基于數(shù)據(jù)的預(yù)測(cè)方法成為了最近的研究熱點(diǎn)。郭超[1]等結(jié)合深度信念網(wǎng)絡(luò)(DBN)與多個(gè)支持向量機(jī)建立了EDBN—SVM 網(wǎng)絡(luò),以構(gòu)架振動(dòng)響應(yīng)為數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)空氣彈簧故障、橫向減振器故障、抗蛇行減振器故障3 種典型故障的分類;龐榮[2]等利用自動(dòng)編碼器(DAE)對(duì)原始數(shù)據(jù)進(jìn)行降噪,再利用softmax 分類器進(jìn)行特征分類,對(duì)各工況下的轉(zhuǎn)向架故障進(jìn)行了準(zhǔn)確分類;肖爽[3]根據(jù)汽車運(yùn)動(dòng)軌跡的時(shí)序特性,將深度學(xué)習(xí)技術(shù)應(yīng)用于有軌電車安全性評(píng)價(jià),驗(yàn)證了基于長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的軌跡預(yù)測(cè)方法,采取均方差函數(shù)作為損失函數(shù)優(yōu)化模型,測(cè)試了不同學(xué)習(xí)參數(shù)下網(wǎng)絡(luò)的準(zhǔn)確度和收斂速度,結(jié)合列車碰撞安全距離公式驗(yàn)證了網(wǎng)絡(luò)可靠性;金永澤[4]分別使用誤差逆?zhèn)鞑ゾW(wǎng)絡(luò)(BP)和LSTM 對(duì)列車制動(dòng)模型的參數(shù)進(jìn)行了預(yù)測(cè),發(fā)現(xiàn)BP 網(wǎng)絡(luò)在預(yù)測(cè)過程中比LSTM 更加依賴數(shù)據(jù)的輸入;DINDAR[5]建立了決策樹(DT)模型分析事故起因,利用遺傳算法對(duì)模型進(jìn)行剪枝;Yan[6]等人利用深層信念網(wǎng)絡(luò)(Deep Belief Network,DBN)對(duì)列車運(yùn)行的安全性進(jìn)行預(yù)測(cè),并且考慮了乘客舒適性。Serdar Dindar 用分層貝葉斯網(wǎng)絡(luò)預(yù)測(cè)了美國列車事故的高發(fā)地帶,并以極大似然估計(jì)加以驗(yàn)證。
為了解決單項(xiàng)深度學(xué)習(xí)預(yù)測(cè)模型的缺陷,增加準(zhǔn)確性,學(xué)者嘗試將多個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)合起來使用。SITTON[7]等建立了多個(gè)BP 網(wǎng)絡(luò)分別訓(xùn)練,網(wǎng)絡(luò)收斂后將預(yù)測(cè)結(jié)果與驗(yàn)證集進(jìn)行比較,根據(jù)網(wǎng)絡(luò)性能表現(xiàn)對(duì)它們賦予權(quán)重,將多個(gè)帶權(quán)重的BP 網(wǎng)絡(luò)組成投票系統(tǒng)以預(yù)測(cè)貨車沖擊對(duì)軌、橋帶來的破壞;KAEENI[8]通過遺傳算法(GA)對(duì)人工神經(jīng)網(wǎng)絡(luò)(ANN)、樸素貝葉斯(NB)和決策樹(DT)3種深度學(xué)習(xí)賦予權(quán)重,將三者結(jié)合起來提出了一種針對(duì)軌道交通運(yùn)輸中脫軌事故隱患預(yù)測(cè)的組合式模型,將不同模型結(jié)合起來得出最終預(yù)測(cè)。以上兩種利用組合式神經(jīng)網(wǎng)絡(luò)的研究的優(yōu)點(diǎn)在于學(xué)習(xí)規(guī)律全面、預(yù)測(cè)結(jié)果準(zhǔn)確、有較強(qiáng)的泛化性能。DINDAR[9]等人設(shè)計(jì)了一種由貝葉斯分類器(NB)組成的網(wǎng)絡(luò),該網(wǎng)絡(luò)上層NB 的分類結(jié)果會(huì)成為下一層NB 的輸入,可對(duì)因極端天氣造成的脫軌事故進(jìn)行準(zhǔn)確分類。然而,目前系統(tǒng)地利用大規(guī)模多源輪軌系統(tǒng)力學(xué)、運(yùn)動(dòng)學(xué)以及交叉的動(dòng)力學(xué)響應(yīng)作為數(shù)據(jù)集,訓(xùn)練不同的組合式深度學(xué)習(xí)模型,從而較為準(zhǔn)確地評(píng)估輪軌接觸安全的研究尚未見到。
綜上所述,可知兩點(diǎn):第一,在分析軌道交通事故方面,研究者們?cè)诶蒙疃葘W(xué)習(xí)方法,從列車安全距離、軌道橋梁系統(tǒng)安全性和事故分類等多方面展開了深入的研究,但是在根據(jù)列車工況預(yù)測(cè)脫軌方面的研究還不多;第二,學(xué)者們?cè)诶蒙疃葘W(xué)習(xí)研究車輛脫軌問題時(shí),傾向于結(jié)合多個(gè)相同或不同結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果,組成預(yù)測(cè)更準(zhǔn)確、泛化性能更強(qiáng)的組合式預(yù)測(cè)模型。
要想保證深度學(xué)習(xí)的效果,需要準(zhǔn)備大量的訓(xùn)練數(shù)據(jù),然而列車實(shí)車試驗(yàn)成本高昂,鐵路日常運(yùn)營中收集到的數(shù)據(jù)一般研究機(jī)構(gòu)也難以獲得。通過仿真方法獲取數(shù)據(jù)集是解決該難題的方法之一。近年來,仿真軟件的性能逐步提升,被學(xué)者們廣泛應(yīng)用到研究之中,其中SIMPACK 在多體動(dòng)力學(xué),尤其是輪軌接觸方面的仿真效果非常有效。陳楊[10]在SIMPACK 中建立了整車動(dòng)力學(xué)仿真模型,并對(duì)輪軌接觸面和懸掛系統(tǒng)做了處理,加入軌道不平順激勵(lì)模型,得到了較為真實(shí)的仿真場(chǎng)景,利用仿真研究了各向不平順對(duì)蛇形失穩(wěn)臨界速度的影響;王海濤[11]在SIMPACK 中建立了車-線-隧剛?cè)狁詈蟿?dòng)力學(xué)模型,利用仿真與實(shí)測(cè)數(shù)據(jù)研究了車輪抬升力、車輪踏面磨耗數(shù)與隧道壁振幅等參數(shù)對(duì)列車運(yùn)行的影響;何銀川[12]在SIMPACK 中建立了馱背運(yùn)輸車輛系統(tǒng)振動(dòng)模型,根據(jù)仿真分析了臨界速度、曲線通過能力和懸架對(duì)垂向穩(wěn)定性的影響,并且做了實(shí)際試驗(yàn),結(jié)果與仿真結(jié)果相吻合;姚常偉[13]通過Fluent、ANSYS 和SIMPACK 等仿真軟件對(duì)受側(cè)風(fēng)影響的列車模型進(jìn)行了仿真,仿真結(jié)果與通過理論計(jì)算得到的風(fēng)載荷對(duì)車輛的影響是等效的。
上述科研成果都能證明SIMPACK 在研究輪軌接觸方面的可靠性,因此借助仿真工具得到數(shù)據(jù)集,再用深度學(xué)習(xí)方法分析數(shù)據(jù)得到關(guān)鍵參數(shù)與列車輪軌狀態(tài)之關(guān)系是可行的。
本文對(duì)車輛在曲線上運(yùn)行的最大脫軌系數(shù)進(jìn)行研究,選取了線路半徑、車速、車體重心橫向偏移量和外軌超高角作為參數(shù)變量,建立仿真模型,對(duì)不同工況下車輛在曲線處的脫軌系數(shù)進(jìn)行模擬,得到列車脫軌數(shù)據(jù)集,分別對(duì)多層前饋神經(jīng)網(wǎng)絡(luò)(BP 網(wǎng)絡(luò))和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM 網(wǎng)絡(luò))進(jìn)行訓(xùn)練和優(yōu)化,使二者能夠獨(dú)立預(yù)測(cè)脫軌系數(shù),最后綜合二者建立了用于預(yù)測(cè)列車曲線脫軌系數(shù)的最優(yōu)加權(quán)系數(shù)法組合式神經(jīng)網(wǎng)絡(luò)。
誤差逆?zhèn)鞑ド窠?jīng)網(wǎng)絡(luò)即BP 神經(jīng)網(wǎng)絡(luò)(以下簡(jiǎn)稱BPNN)是目前最成熟、應(yīng)用最廣泛的一種人工神經(jīng)網(wǎng)絡(luò),BPNN 單元結(jié)構(gòu)如圖1 所示。
圖1 神經(jīng)網(wǎng)絡(luò)單元結(jié)構(gòu)Fig.1 Neural network unit structure
BPNN 訓(xùn)練時(shí)將誤差沿著原先的權(quán)重通道反向傳播,按照梯度下降的原則調(diào)整通道權(quán)重與神經(jīng)元閾值。在如圖2 的網(wǎng)絡(luò)中,輸入網(wǎng)絡(luò)的樣例由 d種屬性描述,輸出的是l 維向量,所以該網(wǎng)絡(luò)的輸入層有d 個(gè)單元,輸出層有l(wèi) 個(gè)單元,隱藏層設(shè)為q 個(gè)單元。第h 個(gè)隱藏層單元的閾值為γh,第j 個(gè)隱藏層單元的閾值為θj。輸入層第i 個(gè)單元到隱層第h 個(gè)單元之間的信息通道權(quán)重為νih,隱藏層第h個(gè)單元到輸出層第j 個(gè)單元之間的信息通道權(quán)重為ωhj。隱藏層第h 個(gè)單元的輸入為輸出為bh,輸出層第j 個(gè)單元的輸入為隱藏層和輸出層都采用Sigmoid 函數(shù),如圖3(a)所示,其表達(dá)式為
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.2 Neural network structure
圖3 激活函數(shù)圖像Fig.3 Activation function image
其導(dǎo)函數(shù)見式(2),圖像見3(b)。
LSTM 具有外部循環(huán)和本身節(jié)點(diǎn)間的自循環(huán)能力。自循環(huán)由遺忘門、輸入門和輸出門控制,這三者可根據(jù)當(dāng)前時(shí)刻的輸入從隱層中刪除、添加、提取信息,在訓(xùn)練過程中控制每個(gè)節(jié)點(diǎn)上的輸入對(duì)整體結(jié)果的影響。圖4 展示了LSTM 的單元結(jié)構(gòu)。
圖4 LSTM 的單元結(jié)構(gòu)Fig.4 LSTM unit structure
其中,遺忘門會(huì)根據(jù)當(dāng)前的輸入Xt、上一時(shí)刻的輸出ht-1,其激活函數(shù)為sigmoid 函數(shù);表示當(dāng)前時(shí)刻第i 個(gè)循環(huán)體單元的遺忘門的輸出值,可用式(3)計(jì)算:
輸入門根據(jù)x(t)、輸入門的輸入偏置b(g)和h(t-1)決定計(jì)算當(dāng)前時(shí)刻輸出的狀態(tài),可用式(4)計(jì)算。
式中:U——單元體輸入門的輸入權(quán)重;W——單元體輸入門的循環(huán)權(quán)重;sigmoid——激活函數(shù)。
組合式預(yù)測(cè)方法的核心是用各種單項(xiàng)模型針對(duì)訓(xùn)練數(shù)據(jù)展開學(xué)習(xí),在單項(xiàng)網(wǎng)絡(luò)都能從數(shù)據(jù)集中有效學(xué)習(xí)規(guī)律后,用某些準(zhǔn)則或者方法,將多個(gè)單項(xiàng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果統(tǒng)合起來解決問題[14]。本文使用的組合方案如圖5 所示,采用BP 神經(jīng)網(wǎng)絡(luò)和LSTM 神經(jīng)網(wǎng)絡(luò)兩種不同單項(xiàng)預(yù)測(cè)模型通過加權(quán)平均法組成異質(zhì)組合式預(yù)測(cè)模型,獲得該組合式預(yù)測(cè)模型有2 個(gè)步驟:(1)通過數(shù)據(jù)集訓(xùn)練單項(xiàng)神經(jīng)網(wǎng)絡(luò),使其預(yù)測(cè)得盡可能準(zhǔn)確,一般來說,單項(xiàng)網(wǎng)絡(luò)的結(jié)構(gòu)應(yīng)該盡可能不同,通過將2 個(gè)學(xué)習(xí)偏好分歧較大的預(yù)測(cè)模型組合能多角度、全面地學(xué)習(xí)數(shù)據(jù)集規(guī)律;(2)通過加權(quán)平均法組合二者的預(yù)測(cè)結(jié)果。
圖5 組合式預(yù)測(cè)模型架構(gòu)Fig.5 Construction of combined forecasting model
LSTM 和BPNN 的結(jié)構(gòu)不同,性能有區(qū)別,應(yīng)使用加權(quán)平均法進(jìn)行組合。加權(quán)平均法根據(jù)各單項(xiàng)模型的性能為其賦予不同的權(quán)值,調(diào)整各模型對(duì)最終預(yù)測(cè)的影響,ωi表示單項(xiàng)模型的權(quán)重,其組合可表示為
設(shè)模型需要通過學(xué)習(xí)掌握的真實(shí)規(guī)律為f(x),x 從分布p(x)中取樣獲得,則組合單項(xiàng)模型后的組合預(yù)測(cè)法的誤差為
要想求得最優(yōu)權(quán)重,即
需求得BPNN 和LSTM 兩種預(yù)測(cè)方法的偏差矩陣,e1x和e2x分別表示2 種網(wǎng)絡(luò)對(duì)樣例x 的預(yù)測(cè)值和真實(shí)值的誤差,有N 條預(yù)測(cè)樣例,則
根據(jù)拉格朗日乘子法可求得如下最優(yōu)解:
ω1和ω2即為BPNN 和LSTM 的最優(yōu)權(quán)重,R為單位矩陣。
本文所使用的模型中,車身、構(gòu)架和輪對(duì)考慮到了沿長度、寬度及高度方向上的平移,以及繞3 條軸線的轉(zhuǎn)動(dòng)共6 個(gè)自由度,軸箱考慮繞車架交接點(diǎn)的轉(zhuǎn)動(dòng),只有1 個(gè)自由度,搖枕與車身剛性連接,不考慮其自由度,故該模型共有50 個(gè)自由度。
該模型包含54 個(gè)力元,因只考慮單節(jié)車輛,故沒有車鉤力,其中軸套與構(gòu)架間使用43 號(hào)力元,一系懸掛中的彈簧使用85 號(hào)力元,一二系懸掛中的阻尼以及蛇形減振器選用6 號(hào)力元,二系懸掛的兩個(gè)剪切彈簧使用79 號(hào)力元,車架與搖枕之間用13 號(hào)力元作為緩沖器以防止二者碰撞,輪軌接觸力元采用78 號(hào)力元并考慮到了它的非線性特性。該模型拓?fù)浣Y(jié)構(gòu)如圖6 所示,其轉(zhuǎn)向架拓?fù)浣Y(jié)構(gòu)如圖7 所示。
圖6 主模型拓?fù)浣Y(jié)構(gòu)Fig.6 Topological structure of main model
圖7 轉(zhuǎn)向架拓?fù)浣Y(jié)構(gòu)Fig.7 Topological structure of bogie structure
車輛行駛線路包括:直線—過渡曲線—彎道—過渡曲線—直線。列車在直線的行駛狀態(tài)不是研究重點(diǎn),故設(shè)置為10 m;過渡曲線用線性過渡,長度為10 m;彎道的長度為500 m,半徑可調(diào)。引入的軌道水平不平順激勵(lì)參考美國6 級(jí)譜[19],式(12)是其譜密度分析式。
式中:Av=0.033 9 cm2·(rad/m);Ωc=0.438 0 rad/m;Ωv=0.824 5 rad/m。
列車在彎道上的脫軌系數(shù)會(huì)受到線路、車速等眾多因素影響,本文將重點(diǎn)放在車速、重心橫向偏移量、半徑和超高上,研究這3 者對(duì)脫軌系數(shù)的影響,通過不同條件下的仿真實(shí)驗(yàn),提取車速、半徑、超高、重心橫向偏移量作為屬性,對(duì)應(yīng)的脫軌系數(shù)作為標(biāo)記,得到如表1 所示的1 269 條樣例。
表1 脫軌系數(shù)數(shù)據(jù)集Tab.1 Derailment coefficient data
由于各值之間數(shù)量級(jí)相差巨大,且網(wǎng)絡(luò)采用了誤差梯度下降法,數(shù)據(jù)直接輸入網(wǎng)絡(luò)會(huì)導(dǎo)致誤差無法沿最短梯度方向下降,故采用進(jìn)行歸一化處理,將各維度的數(shù)值放縮至(0,1)范圍,x為原始數(shù)值,μ為該維數(shù)據(jù)的平均值,σ為該維數(shù)據(jù)的標(biāo)準(zhǔn)差。
根據(jù)加權(quán)平均法加權(quán)系數(shù)的求解方法求得BPNN和LSTM 的最優(yōu)加權(quán)系數(shù),2 種網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果乘以各自的加權(quán)系數(shù)之和Y=ωBPyBP+yLSTMωLSTM即為組合式預(yù)測(cè)模型的輸出結(jié)果,如圖8 所示。
圖8 組合模型的預(yù)測(cè)結(jié)果Fig.8 Prediction of BP-LSTM
其在驗(yàn)證集上的RMSE 為0.005 34,相較BPNN 減少了30.1%,較LSTM 減少了43.4%,符合加權(quán)平均法預(yù)測(cè)誤差相較單項(xiàng)模型減少的特性,BP-LSTM 網(wǎng)絡(luò)綜合了2 種網(wǎng)絡(luò)的特點(diǎn),即可體現(xiàn)出LSTM 對(duì)脫軌系數(shù)隨重心偏移量變化的敏感性,在整體走勢(shì)上,BPNN 的引入也糾正了單項(xiàng)LSTM相差實(shí)際值較小的弱點(diǎn)。在樣本號(hào)150~200 之間的一段曲線,不論是單項(xiàng)網(wǎng)絡(luò)還是BP-LSTM 都沒能給出較好的預(yù)測(cè),推測(cè)是樣本集上某些特殊規(guī)律造成的變化,但是預(yù)測(cè)值的走勢(shì)還是與實(shí)際值一致的,實(shí)際預(yù)測(cè)中也不可能使網(wǎng)絡(luò)輸出和真實(shí)值完全一致,重要的是BP-LSTM 能夠預(yù)測(cè)出脫軌系數(shù)隨工況惡化而增大的趨勢(shì),實(shí)際應(yīng)用中可為列車脫軌提供預(yù)警。
本文分析了國內(nèi)外深度學(xué)習(xí)方法在列車安全運(yùn)營上的研究現(xiàn)狀,說明誤差逆?zhèn)鞑ド窠?jīng)網(wǎng)絡(luò)和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)、功能及數(shù)學(xué)原理,對(duì)2 種網(wǎng)絡(luò)的缺點(diǎn)和改善方法進(jìn)行分析。對(duì)組合式預(yù)測(cè)方法的原理進(jìn)行描述,說明其相較單項(xiàng)神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)問題上具有的優(yōu)勢(shì)。基于Python 語言和TensorFlow 框架完成預(yù)測(cè)脫軌系數(shù)的組合式神經(jīng)網(wǎng)絡(luò)BP-LSTM。分別對(duì)多層前饋神經(jīng)網(wǎng)絡(luò)(BPNN)和長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)進(jìn)行訓(xùn)練,使二者能夠獨(dú)立預(yù)測(cè)脫軌系數(shù),最后求得二者在驗(yàn)證集上的最優(yōu)加權(quán)系數(shù),通過最優(yōu)加權(quán)系數(shù)法建立用于預(yù)測(cè)列車曲線脫軌系數(shù)的組合式神經(jīng)網(wǎng)絡(luò),結(jié)果表明,二者能采用加權(quán)平均法進(jìn)行組合后,BPLSTM 預(yù)測(cè)精度有很大提升。