馬 帥,高 亮,劉秀波,蔡小培
(1.北京交通大學(xué) 土木建筑工程學(xué)院,北京 100044;2.中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 基礎(chǔ)設(shè)施檢測(cè)研究所,北京 100081)
我國(guó)客貨共線鐵路正線一般采用有砟軌道、長(zhǎng)大隧道一般采用無砟軌道。對(duì)于客貨共線無砟軌道,由于開行貨運(yùn)列車,運(yùn)營(yíng)條件和環(huán)境比客運(yùn)專線無砟軌道或有砟軌道差,而在結(jié)構(gòu)和力學(xué)性能上與客貨共線有砟軌道也存在顯著差異;即使在相同的外界環(huán)境下,4種不同條件下軌道結(jié)構(gòu)的平順狀態(tài)也將呈現(xiàn)不同的發(fā)展規(guī)律。因此,有必要針對(duì)客貨共線無砟軌道建立軌道平順狀態(tài)預(yù)測(cè)模型,為制定合理維修計(jì)劃奠定基礎(chǔ)。
國(guó)內(nèi)外學(xué)者在軌道平順狀態(tài)預(yù)測(cè)方面取得了許多研究成果。早期學(xué)者通過試驗(yàn)和軌檢車實(shí)測(cè)數(shù)據(jù)歸納分析建立了多個(gè)預(yù)測(cè)模型,如日本學(xué)者的預(yù)測(cè)公式[1-3],國(guó)際鐵路聯(lián)盟ORE的軌道不平順惡化率線性模型[4],加拿大PWMIS系統(tǒng)的線性預(yù)測(cè)模型[5]。此外,相關(guān)學(xué)者還將多種數(shù)據(jù)分析方法用于軌道平順狀態(tài)預(yù)測(cè),如基于卡爾曼濾波的軌檢車數(shù)據(jù)預(yù)測(cè)分析方法[6]、基于軌道不平順概率分布的特性矩陣法[7]、考慮軌道狀態(tài)惡化眾多影響因素的綜合因子法[8]、改進(jìn)型指數(shù)平滑預(yù)測(cè)模型[9]、基于平均劣化率的軌道質(zhì)量短期預(yù)測(cè)模型[10]、基于灰色系統(tǒng)理論的非等時(shí)距GM(1,1)預(yù)測(cè)模型[11]及其修正模型[12]、灰色GM(1,1)與AR模型的組合模型[13]、灰色模型與神經(jīng)網(wǎng)絡(luò)的組合模型[14]等。這些預(yù)測(cè)模型主要針對(duì)有砟軌道,有砟軌道平順狀態(tài)發(fā)展規(guī)律通常滿足分段線性、多項(xiàng)式或指數(shù)等具有明顯趨勢(shì)的形式。而研究發(fā)現(xiàn),客貨共線無砟軌道的軌道質(zhì)量指數(shù)TQI在相當(dāng)長(zhǎng)的時(shí)間內(nèi)并無明顯惡化趨勢(shì),通常呈長(zhǎng)期趨勢(shì)緩慢變化并伴隨平穩(wěn)波動(dòng),因此以往的預(yù)測(cè)模型難以分析這種變化特征。
基于客貨共線無砟軌道TQI的時(shí)間序列變化特征,結(jié)合小波分析和時(shí)間序列分析預(yù)測(cè)方法,本文提出將ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR模型用于無砟軌道平順狀態(tài)預(yù)測(cè)。首先對(duì)TQI原始序列進(jìn)行小波分解,將ARMA模型用于預(yù)測(cè)TQI序列平穩(wěn)波動(dòng)成分,同時(shí)利用BP神經(jīng)網(wǎng)絡(luò)和支持向量回歸SVR對(duì)TQI序列的慢變趨勢(shì)成分進(jìn)行建模與預(yù)測(cè),最后綜合2種成分的預(yù)測(cè)值獲得最終預(yù)測(cè)結(jié)果。
TQI是我國(guó)工務(wù)部門評(píng)價(jià)軌道質(zhì)量和指導(dǎo)線路養(yǎng)護(hù)維修的重要參數(shù),由200 m區(qū)段內(nèi)左右高低、左右軌向、軌距、水平和三角坑共7項(xiàng)軌道不平順的標(biāo)準(zhǔn)差求和得到,能夠有效反映軌道平順性。
本文數(shù)據(jù)來自包西線慶興隧道和太中線吳堡隧道的軌檢車檢測(cè)數(shù)據(jù),2條線路的設(shè)計(jì)速度均為160 km·h-1,隧道內(nèi)分別鋪設(shè)Ⅰ型和Ⅱ型雙塊式無砟軌道。軌道不平順動(dòng)態(tài)檢測(cè)每月1次,數(shù)據(jù)檢測(cè)時(shí)間為2014年1月至2016年12月,對(duì)每次的檢測(cè)數(shù)據(jù),每200 m區(qū)段計(jì)算1個(gè)TQI值,每個(gè)區(qū)段的連續(xù)多次TQI數(shù)據(jù)作為1個(gè)時(shí)間序列樣本。對(duì)2個(gè)隧道各隨機(jī)選取5個(gè)無砟軌道區(qū)段作為研究對(duì)象,TQI時(shí)間序列樣本如圖1所示,其中慶興隧道樣本的里程為K770+600—K770+800,吳堡隧道樣本的里程為K1 192+600—K1 192+800。
圖1 無砟軌道區(qū)段TQI時(shí)間序列樣本
由圖1可以看出:無砟軌道區(qū)段3年的TQI數(shù)值并未發(fā)生明顯的趨勢(shì)性變化,TQI值變化并不能用多項(xiàng)式或指數(shù)表示。這是因?yàn)?,相比于有砟軌道,無砟軌道結(jié)構(gòu)穩(wěn)定,具有較好的軌道質(zhì)量保持能力;處于隧道內(nèi),溫度、濕度也相對(duì)穩(wěn)定,不受雨雪等外界環(huán)境影響。此外,2個(gè)隧道自建成至今未進(jìn)行過換軌等大修,主要的扣件維護(hù)和鋼軌打磨作業(yè)對(duì)TQI影響較小,TQI值并未發(fā)生明顯變化。
為了深入分析TQI時(shí)間序列是否含有趨勢(shì)性成分,采用小波分解方法,利用bior4.4小波基將圖1中慶興隧道的TQI樣本進(jìn)行1級(jí)分解,得到低頻成分和高頻成分,如圖2所示。由圖2可以看出:低頻成分具有幅值變化相對(duì)平緩的趨勢(shì)項(xiàng),而高頻成分圍繞0值均勻波動(dòng),近似滿足平穩(wěn)性。
圖2 慶興隧道TQI樣本小波分解
經(jīng)過反復(fù)試算,db6,db8,sym6,sym8和bior4.4等小波基均適用于TQI時(shí)間序列,分解結(jié)果相近,考慮雙正交小波兼顧了線性相位和正交性,故選取bior4.4小波基。
對(duì)TQI時(shí)間序列高頻成分是否滿足平穩(wěn)性需要驗(yàn)證時(shí),ADF檢驗(yàn)[15]是常用的時(shí)間序列平穩(wěn)性檢驗(yàn)方法。它以隨機(jī)游走模型為檢驗(yàn)依據(jù),并在實(shí)際檢驗(yàn)過程中推廣為以下3個(gè)模型。
(1)
(2)
(3)
其中,
ΔXt=Xt-Xt-1
式中:Xt為時(shí)間序列;εt為白噪聲;I為差分項(xiàng)數(shù)目;γ,β和δ為常數(shù)。
式(2)和式(3)分別考慮了常數(shù)和趨勢(shì)項(xiàng),每個(gè)模型的原假設(shè)都是δ=0,即不滿足平穩(wěn)性。檢驗(yàn)過程從式(3)開始,然后式(2)、式(1),何時(shí)拒絕原假設(shè)何時(shí)停止檢驗(yàn),否則直到檢驗(yàn)完式(1)為止。表1為對(duì)圖2中高頻成分在顯著性水平為0.05時(shí)的平穩(wěn)性檢驗(yàn)結(jié)果。
當(dāng)3個(gè)公式中差分項(xiàng)數(shù)I取不同值時(shí),高頻成分均拒絕原假設(shè),這表明高頻成分滿足平穩(wěn)性;進(jìn)一步分析得知,絕大多數(shù)TQI樣本的高頻成分均滿足平穩(wěn)性??梢哉J(rèn)為,客貨共線無砟軌道TQI的時(shí)間序列包含平穩(wěn)的高頻成分。
表1 慶興隧道TQI樣本平穩(wěn)性檢驗(yàn)結(jié)果
由于客貨共線無砟軌道TQI時(shí)間序列的不同頻率成分具有不同特性,在進(jìn)行預(yù)測(cè)時(shí)應(yīng)該采用不同模型分別建模??紤]到TQI高頻成分滿足平穩(wěn)性,本文采用適用于平穩(wěn)時(shí)間序列建模的ARMA模型;TQI低頻成分是慢變的非線性趨勢(shì)項(xiàng),可以采用BP神經(jīng)網(wǎng)絡(luò)和支持向量回歸SVR建模。最后將ARMA子模型的預(yù)測(cè)結(jié)果分別和BP神經(jīng)網(wǎng)絡(luò)、SVR子模型的預(yù)測(cè)結(jié)果求和,得到2種軌道質(zhì)量指數(shù)TQI預(yù)測(cè)模型:ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR預(yù)測(cè)模型的建模流程如圖3所示。
圖3 建模流程
下文建模采用圖1中慶興隧道的TQI樣本。
ARMA模型是時(shí)間序列分析中具有代表性的一類有限參數(shù)線性模型,能描述平穩(wěn)時(shí)間序列內(nèi)部的相關(guān)關(guān)系,適合平穩(wěn)時(shí)間序列建模。ARMA模型建模過程如下。
(1)TQI時(shí)間序列高頻成分的平穩(wěn)性檢驗(yàn)。ARMA模型要求時(shí)間序列滿足平穩(wěn)性,可以利用ADF檢驗(yàn)方法進(jìn)行檢驗(yàn)。如果TQI時(shí)間序列高頻成分不滿足平穩(wěn)性,可以進(jìn)行差分處理使其滿足平穩(wěn)性,最后對(duì)預(yù)測(cè)結(jié)果進(jìn)行積分處理。
(2)模型階數(shù)選取。自回歸階數(shù)n與滑動(dòng)平均階數(shù)m一般根據(jù)貝葉斯信息準(zhǔn)則(BIC)[16]確定。BIC準(zhǔn)則在模型復(fù)雜度與模型對(duì)數(shù)據(jù)描述能力之間尋求最佳平衡,通過加入模型復(fù)雜度的懲罰項(xiàng)避免過擬合問題,是衡量模型擬合優(yōu)良性的一種標(biāo)準(zhǔn)。BIC統(tǒng)計(jì)量為
BIC=klnM-2lnL
(4)
式中:k為模型參數(shù)個(gè)數(shù);L為模型極大似然函數(shù)值;M為樣本容量。
本文分別對(duì)n和m取不同的值,當(dāng)BIC統(tǒng)計(jì)量最小時(shí)將對(duì)應(yīng)的n和m作為模型階數(shù)。圖4為n和m取不同值時(shí)慶興隧道TQI樣本的BIC統(tǒng)計(jì)量的柱狀分布圖。由圖4可知對(duì)于慶興隧道的TQI樣本應(yīng)取n=2,m=3。
圖4 不同自回歸階數(shù)、滑動(dòng)平均階數(shù)時(shí)慶興隧道TQI樣本的BIC統(tǒng)計(jì)量
(3)采用最小二乘法進(jìn)行模型參數(shù)估計(jì),得到模型參數(shù)。
BP神經(jīng)網(wǎng)絡(luò)是一種常用的前饋型神經(jīng)網(wǎng)絡(luò),具有較強(qiáng)的非線性建模能力。理論上,1個(gè)3層神經(jīng)網(wǎng)絡(luò)能夠逼近任一復(fù)雜的非線性系統(tǒng)。利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行TQI時(shí)間序列低頻成分建模過程如下。
(1)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),確定各層節(jié)點(diǎn)數(shù)目。將神經(jīng)網(wǎng)絡(luò)層數(shù)選定為3。為了保證輸入信息充足,選取輸入層節(jié)點(diǎn)數(shù)為5,輸出層節(jié)點(diǎn)數(shù)為1。對(duì)于關(guān)鍵的隱含層節(jié)點(diǎn)數(shù)目,分別選取節(jié)點(diǎn)數(shù)2~10(數(shù)目過大容易產(chǎn)生過擬合,降低模型泛化能力),然后隨機(jī)選取不同的模型初始值,對(duì)每個(gè)隱含層節(jié)點(diǎn)數(shù)目的神經(jīng)網(wǎng)絡(luò)均訓(xùn)練100次,計(jì)算模型預(yù)測(cè)均方根誤差的平均值,結(jié)果如圖5所示。選取使誤差最小的值作為隱含層節(jié)點(diǎn)數(shù),由圖5可知隱含層節(jié)點(diǎn)數(shù)應(yīng)取9。
圖5 模型誤差與隱含層節(jié)點(diǎn)數(shù)目關(guān)系曲線
輸入輸出矩陣的每一行是1組輸入輸出數(shù)據(jù)。
(3)數(shù)據(jù)規(guī)范化。采用最小—最大規(guī)范化方法,對(duì)輸入輸出矩陣的每一列進(jìn)行規(guī)范化,計(jì)算式為
(5)
(4)確定神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)。神經(jīng)網(wǎng)絡(luò)隱含層和輸出層的激活函數(shù)分別取Log-sigmoid函數(shù)和Purelin函數(shù),模型訓(xùn)練方法為自適應(yīng)學(xué)習(xí)率梯度下降算法,學(xué)習(xí)率為0.01,目標(biāo)誤差精度0.01,最大迭代次數(shù)105次。
(5)模型訓(xùn)練與預(yù)測(cè)。
支持向量回歸SVR是支持向量機(jī)SVM進(jìn)行回歸和數(shù)值預(yù)測(cè)時(shí)的變體,具有較強(qiáng)的非線性建模能力。SVR基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化策略訓(xùn)練模型,不太容易過分?jǐn)M合,因此具有較好的泛化能力;采用核函數(shù)代替復(fù)雜的高維空間內(nèi)積運(yùn)算,能夠有效克服維數(shù)災(zāi)難和局部極小問題。SVR試圖找到1個(gè)決策函數(shù)f(x)=ωTx+b, 其中ω和b為待定系數(shù),使得函數(shù)值f(x)與真實(shí)值y盡可能接近。一般認(rèn)為當(dāng)y-f(x)=0時(shí)模型的損失才為0,而支持向量回歸SVR允許y與f(x)之間存在最大偏差θ,即引進(jìn)損失函數(shù)lθ(x)。
(6)
SVR的結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù)為
(7)
式中:‖ω‖2為模型參數(shù)絕對(duì)值的平方,描述模型的復(fù)雜程度;C為懲罰系數(shù)。
i=1, 2, …,M
(8)
s.t.
ηi≥0
式中:M為數(shù)據(jù)樣本容量。
利用SVR對(duì)TQI低頻成分建模的過程如下。
1)訓(xùn)練數(shù)據(jù)集選取與整理
選定訓(xùn)練數(shù)據(jù)集{(x1,y1), (x2,y2), …, (xN-p,yN-p)}∈Rp×R, 其中xi=(xi,xi+1, …,xi+p-1),yi=xi+p, 1≤i≤N-p。并采用與神經(jīng)網(wǎng)絡(luò)同樣的方法整理輸入輸出數(shù)據(jù)的格式。
2)構(gòu)造最優(yōu)化問題
建立對(duì)偶形式SVR結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù)。
(9)
s.t.
ai≤C
式(9)的詳細(xì)推導(dǎo)參見文獻(xiàn)[17]。
基于大量分析對(duì)比,本文選擇徑向基函數(shù)作為核函數(shù),即
K(x,y)=exp(-r|x-y|2)
(10)
式中:r為徑向基核函數(shù)的參數(shù)。
3)模型參數(shù)確定
在r,C和θ這3個(gè)參數(shù)中,θ是決定模型精度的最關(guān)鍵參數(shù)。令θ在0.01~0.5范圍內(nèi)以0.01的間隔依次遞增,對(duì)于每個(gè)不同的θ值,同時(shí)允許r和C在合理范圍內(nèi)取值,并對(duì)r和C優(yōu)化使得SVR對(duì)TQI低頻序列的擬合和預(yù)測(cè)均方根誤差最小。圖6為r和C取最優(yōu)值時(shí),θ在0.10~0.30范圍內(nèi)的均方根誤差變化曲線。結(jié)果表明,當(dāng)θ取0.23時(shí)預(yù)測(cè)誤差最小,但擬合誤差略大;均衡考慮擬合和預(yù)測(cè)誤差,θ取0.20。
圖6 SVR均方根誤差與θ的關(guān)系曲線
經(jīng)過初步試算,r和C相對(duì)合理的取值范圍log2C為[5,15],log2r為[-15,-5]。當(dāng)θ=0.20時(shí),計(jì)算不同r和C情況下的SVR預(yù)測(cè)均方根誤差,如圖7所示。當(dāng)預(yù)測(cè)誤差最小時(shí),r≈0.001,C≈16 000。
圖7θ=0.20時(shí),SVR均方根誤差與懲罰系數(shù)C、核函數(shù)參數(shù)r的關(guān)系曲面
4)求解最優(yōu)化問題
(11)
式中:φ(xi)為第i個(gè)數(shù)據(jù)樣本的映射函數(shù)值。
選擇1個(gè)正值拉格朗日乘子0 (12) 5)構(gòu)造決策函數(shù) (13) 為了驗(yàn)證模型對(duì)已知數(shù)據(jù)的擬合效果和對(duì)未知數(shù)據(jù)的預(yù)測(cè)能力,利用ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR預(yù)測(cè)模型對(duì)圖1中的樣本進(jìn)行擬合和預(yù)測(cè),并與單一非線性預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,其中2014年1月—2016年7月(前31個(gè))的TQI值用于模型訓(xùn)練,2016年8月—2016年12月(后5個(gè))的值用于模型預(yù)測(cè)。此外,還分別計(jì)算了2個(gè)隧道中10個(gè)無砟軌道區(qū)段的模型的準(zhǔn)確度指標(biāo),以對(duì)比2個(gè)組合模型之間的優(yōu)劣。 圖8為本文預(yù)測(cè)模型和單一模型(BP神經(jīng)網(wǎng)絡(luò)和SVR)對(duì)慶興隧道K770+600—K770+800里程區(qū)段TQI樣本的擬合和預(yù)測(cè)結(jié)果。圖9為吳堡隧道K1 192+600—K1 192+800里程區(qū)段TQI樣本的擬合和預(yù)測(cè)結(jié)果。表2統(tǒng)計(jì)了各模型的擬合與預(yù)測(cè)的均方根誤差。由于神經(jīng)網(wǎng)絡(luò)的輸入層確定為5層,為了便于對(duì)比,SVR的輸入向量維數(shù)取5維。此時(shí),前5次數(shù)據(jù)(2014年1月—5月數(shù)據(jù))只能作為模型的輸入值,無法進(jìn)行預(yù)測(cè),故圖8與圖9中沒有對(duì)應(yīng)數(shù)據(jù)。 表2 各模型的擬合和預(yù)測(cè)均方根誤差 由圖8和圖9可以看出:相比于本文提出的預(yù)測(cè)模型(ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR),單一預(yù)測(cè)模型(BP神經(jīng)網(wǎng)絡(luò)和SVR)的擬合精度較高,但預(yù)測(cè)精度明顯降低。這是因?yàn)?,TQI時(shí)間序列不同頻率成分的特性存在差異,單一非線性模型難以對(duì)具有多種成分、不同特性的復(fù)雜時(shí)間序列進(jìn)行有效模擬,往往對(duì)訓(xùn)練數(shù)據(jù)過擬合,導(dǎo)致模型復(fù)雜度偏高,從而降低了泛化能力,預(yù)測(cè)誤差偏高。因此,單一模型不適合TQI預(yù)測(cè)。 圖8 慶興隧道TQI樣本模型預(yù)測(cè)效果對(duì)比 圖9 吳堡隧道TQI樣本模型預(yù)測(cè)效果對(duì)比 利用ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR這2個(gè)模型分別對(duì)慶興隧道和吳堡隧道共10個(gè)無砟軌道區(qū)段的TQI樣本進(jìn)行建模與預(yù)測(cè),并與文獻(xiàn)[11]中的GM(1,1)修正模型進(jìn)行對(duì)比。根據(jù)文獻(xiàn)[14]中的模型精度指標(biāo),計(jì)算3個(gè)模型的平均相對(duì)誤差、均方根誤差、模型精度及后驗(yàn)差4個(gè)指標(biāo)在10個(gè)區(qū)段的平均值,結(jié)果見表3。 表3 各模型精度指標(biāo)平均值 結(jié)果表明:本文提出的2個(gè)模型的預(yù)測(cè)精度等級(jí)均為1級(jí),均可對(duì)客貨共線無砟軌道TQI時(shí)間序列進(jìn)行有效預(yù)測(cè);ARMA-BP神經(jīng)網(wǎng)絡(luò)的擬合精度高于ARMA-SVR,但預(yù)測(cè)精度低于ARMA-SVR,可以認(rèn)為ARMA-SVR以犧牲擬合精度獲得較高的預(yù)測(cè)精度,具有更強(qiáng)的泛化能力。對(duì)于客貨共線無砟軌道得TQI時(shí)間序列,其低頻趨勢(shì)成分變化緩慢,不符合分段線性或指數(shù)等形式,具有指數(shù)函數(shù)形式的GM(1,1)模型將難以適用,而BP神經(jīng)網(wǎng)絡(luò)、SVR對(duì)此依然具有較強(qiáng)的建模和預(yù)測(cè)能力。 (1)客貨共線隧道內(nèi)無砟軌道TQI時(shí)間序列特征明顯,包含了緩慢變化的低頻成分和平穩(wěn)波動(dòng)的高頻成分。 (2)ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR模型可以對(duì)具有不同特性多種成分的復(fù)雜TQI時(shí)間序列進(jìn)行綜合建模,預(yù)測(cè)精度明顯高于BP神經(jīng)網(wǎng)絡(luò)和SVR預(yù)測(cè)模型。ARMA-BP神經(jīng)網(wǎng)絡(luò)和ARMA-SVR模型的預(yù)測(cè)精度等級(jí)均為1級(jí),能夠有效預(yù)測(cè)客貨共運(yùn)線路無砟軌道TQI時(shí)間序列發(fā)展。 (3)本文提出的預(yù)測(cè)模型沒有考慮客貨共線無砟軌道大修情況的影響。大修作業(yè)對(duì)無砟軌道TQI變化規(guī)律的影響及預(yù)測(cè)方法需要進(jìn)一步研究。3 模型預(yù)測(cè)效果
4 結(jié) 論