陳紫薇 ,張 渝,邱春蓉
(西南交通大學(xué) 物理科學(xué)與技術(shù)學(xué)院,成都 610031)
良好的動車輪對外形尺寸不僅能保證列車在軌道上的正確位置,使列車安全運行[1],還能降低輪軌間的磨耗,延長車輪的使用壽命,從而減少制造和維修成本[2]。因此,動車輪對尺寸的預(yù)測將有助于提前預(yù)防風(fēng)險,確保運行安全并提供經(jīng)濟(jì)的維修建議。
近年來,有大量基于數(shù)據(jù)挖掘的預(yù)測算法被應(yīng)用在輪對磨耗與尺寸數(shù)據(jù)的預(yù)測中。衷路生等人[3]提出基于耦合模擬退火優(yōu)化最小二乘支持向量機的車輪踏面磨耗量預(yù)測模型,所建立的模型用于現(xiàn)場車輪踏面磨耗量的預(yù)測是有效的。何蕾[4]采用了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)預(yù)測高速列車輪對尺寸數(shù)據(jù),結(jié)果顯示BP神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果更加準(zhǔn)確。廖貴玲[5]分別采用BP神經(jīng)網(wǎng)絡(luò)和GA-SVR方法進(jìn)行了輪對尺寸預(yù)測建模和仿真,試驗結(jié)果表明,GASVR比BP算法的預(yù)測精確度更高。華莎等人[6]提出了一種結(jié)合PSO-GA-LM優(yōu)化的最小二乘支持向量機預(yù)測模型,該模型在車輪踏面磨耗預(yù)測中具有良好的性能。
盡管上述模型能夠有效地進(jìn)行輪對預(yù)測,但是仍然存在參數(shù)復(fù)雜,大數(shù)據(jù)量處理速度慢,預(yù)測精度有待進(jìn)一步提升的不足。極限學(xué)習(xí)機(ELM,Extreme Learning Machine)是近年來備受關(guān)注的神經(jīng)網(wǎng)絡(luò)模型之一,被廣泛應(yīng)用于故障診斷、圖像識別、風(fēng)速預(yù)測等工程領(lǐng)域[7]。相比于其他預(yù)測模型,它具有計算速度快,泛化性能好及預(yù)測精度高的優(yōu)點。將核函數(shù)引入極限學(xué)習(xí)機中,能夠有效地改善原始ELM模型的穩(wěn)定性[8]。核函數(shù)有多種類型,融合多種核函數(shù)的多核學(xué)習(xí)方法能夠獲得較為精準(zhǔn)的預(yù)測結(jié)果[9],由此提出了多核極限學(xué)習(xí)機(MK-ELM,Multiple Kernel Extreme Learning Machine)[10]模型。采用粒子群優(yōu)化算法(PSO,Particle Swarm Optimization)對MK-ELM模型的關(guān)鍵參數(shù)進(jìn)行尋優(yōu),將優(yōu)化模型應(yīng)于動車車輪尺寸數(shù)據(jù)預(yù)測,利用CRH2車型動車實測數(shù)據(jù)驗證該方法的合理性和可行性。
ELM[11]是一種單隱層前饋神經(jīng)網(wǎng)絡(luò),它包括3個分層,即輸入層、隱含層與輸出層。
給定N組訓(xùn)練樣本數(shù)據(jù)集(x,t),x、t分別為輸入、輸出向量。當(dāng)ELM的隱含層節(jié)點數(shù)為L,且激勵函數(shù)為g(x)時,網(wǎng)絡(luò)輸出可表示為
式中,βi為第i個隱含層節(jié)點和輸出層節(jié)點之間的權(quán)值向量;w為隱含層節(jié)點的輸入權(quán)值;b為偏置。式(1)可以簡化為Hβ=T。ELM隨機產(chǎn)生w與b,通過計算隱含層的輸出矩陣H,來計算輸出權(quán)值矩陣β=H+T。其中,T為目標(biāo)矩陣,H+為隱含層輸出矩陣H的廣義逆,當(dāng)HHT為非奇異時,H+=HT(HHT)-1。為了提高網(wǎng)絡(luò)穩(wěn)定性,引入正則化系數(shù)η,I為單位矩陣,則輸出權(quán)值的最小二乘解為:
因此,ELM的相應(yīng)輸出函數(shù)為
在特征映射函數(shù)g(x)未知的情形下,將核函數(shù)引入到ELM中,則可形成新的基于核的核極限學(xué)習(xí)機方法,定義核矩陣
結(jié)合式(4),網(wǎng)絡(luò)輸出可表示為
核矩陣是每個點之間的高維映射之后的內(nèi)積構(gòu)成的矩陣。稱為核函數(shù)的核矩陣必須是半正定的。常用的核函數(shù)有:
由于每個核函數(shù)的自身的局限性,在面對部分輪對尺寸復(fù)雜的數(shù)據(jù)結(jié)構(gòu)、較大的數(shù)據(jù)規(guī)模時,常用的核函數(shù)構(gòu)成的學(xué)習(xí)機不能很好的兼顧預(yù)測結(jié)果的泛化性能和學(xué)習(xí)性能??紤]到全局函數(shù)多項式核函數(shù)泛化性能強,學(xué)習(xí)能力弱,局部函數(shù)RBF核函數(shù)學(xué)習(xí)能力強,泛化能力弱的特點,基于核函數(shù)的Mercer性質(zhì)[12],構(gòu)造了多項式核函數(shù)Kpoly和RBF核函數(shù)Krbf加權(quán)構(gòu)成的多核函數(shù):
式中,μ∈[0,1],表示多核函數(shù)權(quán)重系數(shù),當(dāng)μ為1時,多核函數(shù)K為多項式核函數(shù),當(dāng)μ為0時,K為RBF核函數(shù)。
MK-ELM需對式(5)中正則化系數(shù)η以及式(9)中的核參數(shù)σ、p、μ進(jìn)行尋優(yōu),若隨機選擇模型關(guān)鍵參數(shù)則可能導(dǎo)致結(jié)果誤差較大,因此,在本文中,采用PSO算法優(yōu)化參量η,σ、p、μ以建立PSOMK-ELM預(yù)測模型。PSO算法[13]是一種隨機搜索和并行優(yōu)化算法,具有簡單,易于實現(xiàn)和快速收斂等優(yōu)點。模型回歸預(yù)測值相對于實際值的偏差可用均方根誤差(RMSE,Root Mean Square Error)表示,選擇RMSE作為算法的適應(yīng)度函數(shù):
式中,xi表示實際值;yi表示預(yù)測值;n表示訓(xùn)練樣本的總數(shù)。也就是說,在給定范圍內(nèi)尋找到一組η,σ、p、μ,以確保模型的RMSE值最小。待獲取到模型優(yōu)化參數(shù)后,將之代入式(5)、式(9),即可得到PSO-MK-ELM模型表達(dá)式。
PSO-MK-ELM預(yù)測模型的詳細(xì)建模過程如下:
(1)產(chǎn)生一組種群規(guī)模為40的粒子群初始值。每一個粒子的位置P(i).location=[ηi(t),σi(t),pi(t),μi(t)]T和速度P(i).velocity=[Δηi(t),Δσi(t),Δpi(t),Δμi(t)]T隨機初始化。
(2)通過等式(10)計算F得到個體適應(yīng)度作為確定單個粒子的最佳位置P(i).best,以及每個群體的最佳位置G(i).best。
(3)使用以下等式更新粒子速度和位置:
式中:ω表示慣性權(quán)重;ωmax取0.9;ωmin取0.4;c1、c2表示學(xué)習(xí)因子,c1取 2.2,c2取 1.8 ;r1、r2表示兩個隨機數(shù)。種群數(shù)為50,最大迭代次數(shù)為100。
(4)重復(fù)步驟(2)和(3),直到滿足終止條件F<1×10-3。返回最佳參數(shù)η,σ、p、μ。
輪對包括車輪和車軸,車輪與鋼軌接觸面為踏面。由于車輪傳遞輪軌間的驅(qū)動力及制動力,且經(jīng)常與軌道發(fā)生撞擊、摩擦,容易導(dǎo)致車輪踏面磨損,使車輪踏面直徑減少。日常檢修車輪,主要通過檢測輪對踏面外形尺寸來初步判斷車輪磨耗程度,包括輪徑值等。輪徑值即車輪踏面直徑,本文采用的CRH2車型動車輪對尺寸原始數(shù)據(jù)是由裝載于鐵軌上的光截圖像檢測系統(tǒng)記錄所得,其輪徑值安全運用范圍為790 mm~860 mm。
圖1表示PSO-MK-ELM輪對尺寸預(yù)測模型建模過程,包括數(shù)據(jù)處理流程圖,預(yù)測模型建立及PSO參數(shù)優(yōu)化。具體建模步驟如下:
(1)數(shù)據(jù)采集與清洗。由于動車輪對的檢測數(shù)據(jù)易受測量位置、維修人員測量習(xí)慣及載荷、鋼軌狀況等因素的影響,導(dǎo)致記錄歷史測量數(shù)據(jù)會存在測量誤差和明顯的異常點,故采用局部加權(quán)回歸散點平滑法(LOWESS ,Locally Weighted Scatterplot Smoothing)對數(shù)據(jù)進(jìn)行去噪處理。
(2)數(shù)據(jù)重構(gòu)。輪對尺寸數(shù)據(jù)整體呈現(xiàn)為隨運行時間變化的時間序列。采用滾動預(yù)測模式,假定序列中前m個歷史輪對數(shù)據(jù)對此后的第m+1個值有影響,設(shè)原始序列Xi按照xi=(Xi,Xi+1,…,Xi+(m-1))重構(gòu)出的多維矩陣即為輸入數(shù)據(jù)集,yi=Xi+m為輸出集,并將重構(gòu)的樣本劃分為訓(xùn)練集和測試集。
(3)預(yù)測模型建立。用訓(xùn)練集數(shù)據(jù)訓(xùn)練MKELM網(wǎng)絡(luò),采用PSO算法進(jìn)行關(guān)鍵參數(shù)尋優(yōu),獲取最佳模型參數(shù)。
(4)預(yù)測結(jié)果評價。獲取到模型參數(shù)后,應(yīng)用測試集數(shù)據(jù)在建立好的PSO-MK-ELM模型中進(jìn)行預(yù)測,得到模型最終預(yù)測結(jié)果。
圖1 基于PSO-MK-ELM的輪對尺寸預(yù)測模型建模過程
為了準(zhǔn)確地評價本文所建立的PSO-MK-ELM輪對尺寸預(yù)測模型的性能,采用擬合優(yōu)度R2、均方差(MSE,Mean Square Error)、平均絕對誤差(MAE ,Mean Absolute Error)和平均絕對百分比誤差(MAPE ,Mean Absolute Percent Error)作為標(biāo)準(zhǔn)來衡量預(yù)測結(jié)果精度。計算公式如下:
其中,yi為車輪尺寸數(shù)據(jù)真實值;為模型的預(yù)測值和分別為真實和預(yù)測車輪尺寸的平均值;n為預(yù)測樣本數(shù)。
一般來說,模型預(yù)測結(jié)果的R2越接近于1越好,MSE、MAE和MAPE越接近于0越好。
采用CRH2車型某動車1車廂1號輪2016年—2017年的部分歷史輪徑值作為數(shù)據(jù)樣本,如圖2所示。圖2a為原始數(shù)據(jù)記錄值的散點圖,圖2b表示輪徑預(yù)處理值,即原始數(shù)據(jù)經(jīng)LOWESS去噪后的結(jié)果。去噪后的輪徑值序列反映了車輪踏面直徑隨運行時間增加呈單調(diào)遞減的規(guī)律。
擬設(shè)定序列中前5個歷史輪徑值對此后的第6個輪徑值有影響,將輪徑值序列重構(gòu)出228組輸入輸出數(shù)據(jù)集。同時按照訓(xùn)練集與測試集數(shù)據(jù)量比值為4:1進(jìn)行學(xué)習(xí)預(yù)測,即前184組作為訓(xùn)練樣本集,后44組作為測試樣本集。
圖2 輪徑值數(shù)據(jù)樣本
基于MK-ELM算法對訓(xùn)練集進(jìn)行網(wǎng)絡(luò)訓(xùn)練,采用PSO迭代尋找模型最佳參數(shù)。圖3表示PSOMK-ELM預(yù)測模型訓(xùn)練輪徑值迭代100次的最優(yōu)適應(yīng)度函數(shù)變化圖。由圖3可知,網(wǎng)絡(luò)模型在迭代到第29次時訓(xùn)練集的RMSE達(dá)到了最低值,輸出此時的網(wǎng)絡(luò)參數(shù),即為模型最優(yōu)參數(shù)。
用測試集數(shù)據(jù)進(jìn)行模型性能檢驗。預(yù)測結(jié)果如圖4所示,采用PSO-MK-ELM模型對輪徑值進(jìn)行預(yù)測的結(jié)果與實際情況具有很好的一致性。計算得到預(yù)測值的R2為0.995 1,MSE為0.001 5,MAE為0.028 5,MAPE為0.000 3%,反映出PSO-MKELM預(yù)測模型具有較高的精度和擬合泛化能力。
圖3 PSO-MK-ELM預(yù)測模型100次迭代優(yōu)化圖
圖4 車輪直徑預(yù)測結(jié)果
為了綜合評定多核極限學(xué)習(xí)機預(yù)測車輪尺寸數(shù)據(jù)的性能,選取傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò),極限學(xué)習(xí)機(ELM),以及線性核極限學(xué)習(xí)機(L-ELM)、多項式核極限學(xué)習(xí)機(P-ELM)、RBF核極限學(xué)習(xí)機(RELM)3種常用的核極限學(xué)習(xí)機算法與粒子群優(yōu)化的多核極限學(xué)習(xí)機(PSO-MK-ELM)的預(yù)測結(jié)果作比較。同時采用R2、MSE、MAE和MAPE作為評定指標(biāo)進(jìn)行分析,預(yù)測結(jié)果,如表1所示。
由表1可知,ELM模型與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)相比,預(yù)測結(jié)果的R2較高,MSE、MAE和MAPE較低,說明針對輪徑值的預(yù)測,ELM泛化性能更好,預(yù)測精度更高。BP神經(jīng)網(wǎng)絡(luò)和ELM的預(yù)測結(jié)果具有不穩(wěn)定性,引入核函數(shù)后不僅保證了預(yù)測結(jié)果的穩(wěn)定性,還在一定程度上改善了預(yù)測模型性能。其中,引入多項式核函數(shù)后顯著提高了模型的R2,說明P-ELM的泛化性能較強,引入RBF核函數(shù)后降低了模型的MSE、MAE和MAPE,說明R-ELM的預(yù)測準(zhǔn)確性較好。MK-ELM模型由P-ELM和R-ELM加權(quán)構(gòu)成,結(jié)合了兩者的優(yōu)點。采用PSO-MK-ELM模型進(jìn)行輪徑值預(yù)測,與P-ELM相比,預(yù)測結(jié)果的R2從0.994 9提高到了0.995 1;與R-ELM相比,MSE降低了92.4%,MAE降低了74.7%,MAPE降低了40%。PSO-MK-ELM模型預(yù)測結(jié)果的MSE、MAE和MAPE均低于其他5個模型,說明該優(yōu)化模型針對輪徑值預(yù)測的精度和準(zhǔn)確性最高,且模型的R2較高,也反映出模型的擬合泛化能力較強。
從實測數(shù)據(jù)驗證可以看出,與BP神經(jīng)網(wǎng)絡(luò)、ELM、L-ELM、P-ELM及R-ELM模型相比,PSO-MK-ELM模型既避免了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)可能存在的結(jié)果不穩(wěn)健的缺點,同時保證了預(yù)測的準(zhǔn)確性,預(yù)測結(jié)果表明模型具有較高的預(yù)測精度、準(zhǔn)確度和擬合泛化能力,能夠較精準(zhǔn)地預(yù)測輪對尺寸。
表1 車輪直徑不同算法預(yù)測結(jié)果比較
(1)本文將PSO-MK-ELM算法應(yīng)用到動車車輪尺寸預(yù)測上,通過模型建立及參數(shù)優(yōu)化,對CRH2車型動車某車輪直徑數(shù)據(jù)進(jìn)行了預(yù)測,采用擬合優(yōu)度R2、均方差MSE、平均絕對誤差MAE和平均絕對百分比誤差MAPE作為標(biāo)準(zhǔn)來衡量預(yù)測結(jié)果精度,R2為 0.995 1,MSE為 0.001 5,MAE為 0.028 5,MAPE為0.000 3%。
(2)通過比較BP算法、ELM、L-ELM、P-ELM、R-ELM、PSO-MK-ELM的預(yù)測結(jié)果,針對車輪尺寸的預(yù)測,ELM模型比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的泛化性能更好,預(yù)測精度更高;引入核函數(shù)后一定程度地改善了預(yù)測模型性能,PSO-MK-ELM模型針對輪徑值預(yù)測的精度和準(zhǔn)確性更高,擬合泛化能力更強。
(3)建立的模型在動車輪對尺寸預(yù)測上具有較好的應(yīng)用價值,可為相關(guān)部門提供參考。