路志遠,潘佩芬,白雪嬌,張吉峰,張良會
(1.中國鐵道科學研究院集團有限公司 電子計算技術(shù)研究所,北京 100081;2.川藏鐵路技術(shù)創(chuàng)新中心有限公司,成都 610404)
鐵路作為我國基礎設施建設的重要內(nèi)容,在國民經(jīng)濟發(fā)展、國家安全戰(zhàn)略、構(gòu)建和諧社會等眾多方面都扮演著不可或缺的角色。自2008年,我國高速鐵路建設快速推進,更高的行車速度及更長的運營里程都對行車安全提出了更加嚴格的要求。由于鐵路跨度廣,其涉及的行車環(huán)境也更加復雜,當鐵路基礎設施穩(wěn)定性產(chǎn)生改變時,往往會嚴重影響行車安全。例如邊坡失穩(wěn)造成的崩塌、滑坡,路基沉降引起的塌方等都是直接影響行車安全的潛在問題。因此,對鐵路基礎設施進行實時位移監(jiān)測和精準預報預警是十分必要的。
針對時間序列預測算法的研究一直伴隨著機器學習算法的相關(guān)研究而發(fā)展,并成功地將一系列經(jīng)典的機器學習模型應用于電力[1]、交通[2]、氣象[3]等受固定時間周期影響的領(lǐng)域。綜合來看,對于短期內(nèi)時間相關(guān)性強的數(shù)據(jù),盡管通過簡單的機器學習模型已能達到較好的效果,但仍然有許多問題需要進一步解決,比如人工依賴性強、建立過程復雜、模型只能針對具體單一場景、泛化能力差等。
隨著深度學習技術(shù)的成熟,循環(huán)神經(jīng)網(wǎng)絡(RNN,Recurrent Neural Networks)[4]被廣泛地應用于時間序列建模分析,但其本身存在較嚴重的梯度爆炸、梯度彌散及長期依賴的問題[5-6]。為解決上述缺陷,Hochreiter在1997年提出了長短期記憶(LSTM ,Long Short-Term Memory)模型[7]。發(fā)展至今,LSTM已經(jīng)在自然語言處理[8]、機器翻譯[9]、軌跡預測、蛋白質(zhì)結(jié)構(gòu)預測[10]、音樂創(chuàng)作[11]等眾多領(lǐng)域取得了顯著成果。全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS,Global Navigation Satellite System)監(jiān)測數(shù)據(jù)可以看作一種特殊的時間序列數(shù)據(jù),本文將LSTM模型應用于基于GNSS檢測數(shù)據(jù)的鐵路基礎設施位移預測研究,對于保障線路安全,提升管理水平和治理能力具有重要意義。
基于GNSS的鐵路基礎設施形變監(jiān)測系統(tǒng)能夠有效監(jiān)測鐵路邊坡、路基、橋梁毫米級的三維形變信息,提升鐵路工程監(jiān)測能力。結(jié)合我國自主研發(fā)的北斗衛(wèi)星導航系統(tǒng)不僅能夠推動我國北斗產(chǎn)業(yè)的發(fā)展,同時,也能夠在根本層面擺脫全球定位系統(tǒng)(GPS ,Global Positioning System)的限制,有效保障數(shù)據(jù)安全可控。
該系統(tǒng)由北斗衛(wèi)星、北斗監(jiān)測網(wǎng)、應用服務平臺及基礎設施監(jiān)測系統(tǒng)組成,系統(tǒng)架構(gòu)如圖1所示。其中,北斗監(jiān)測網(wǎng)由基準站與監(jiān)測站共同組成,通過對北斗衛(wèi)星信號的連續(xù)觀測、接收、加密并傳輸至鐵路北斗應用服務平臺;應用服務平臺對信號進行解密、解算并計算位移形變信息,得到的毫米級精度位移形變信息通過專業(yè)的監(jiān)測應用算法,如卡爾曼濾波、形變預測等進行匯集應用,可提供專業(yè)的統(tǒng)計分析、預測預警信息。本文主要針對系統(tǒng)中用于形變預測分析的時間序列預測算法開展研究及對比實驗分析。
圖1 鐵路基礎設施形變監(jiān)測系統(tǒng)架構(gòu)
LSTM是RNN的一種改進變體,通過對常規(guī)RNN的循環(huán)單元做出改進,實現(xiàn)了長期依賴,解決了梯度爆炸及梯度消失的問題[6]。每一個LSTM單元通過單元狀態(tài)傳遞信息,同時,建立通過門結(jié)構(gòu)來對單元信息進行調(diào)整的數(shù)據(jù)處理模塊,每一個單元的門結(jié)構(gòu)包含遺忘門、輸入門及輸出門。目前,廣泛應用的LSTM單元結(jié)構(gòu)[12]如圖2所示。
圖2 LSTM 單元結(jié)構(gòu)
其中,f、i、o分別代表遺忘門、輸入門、輸出門;Cn(n=1, 2, ···,m) 表示第n個單元的狀態(tài),m為單元總數(shù);σ、tanh分別表示Sigmoid激活函數(shù)和雙曲線正切激活函數(shù);hn表示第n個隱含層的輸出;x表示當前單元的輸入;y表示當前單元的輸出。與RNN的循環(huán)結(jié)構(gòu)不同,LSTM單元不僅數(shù)據(jù)處理過程有所增加,而且額外多出了一條單元狀態(tài)信息Cn。在單元狀態(tài)信息鏈上,僅存在極少的線性操作,使得信息能夠一直傳遞下去,從而保證了長距離依賴關(guān)系。
(1)在LSTM單元的門結(jié)構(gòu)中,輸入信號最先通過的是遺忘門,即決定輸入信號要遺忘掉的信息;(2)經(jīng)過輸入門及一個tanh網(wǎng)絡層結(jié)構(gòu),將LSTM單元的狀態(tài)信息由Cn-1更新至Cn;(3)輸入信號經(jīng)過輸出門并與經(jīng)過tanh層的最新單元狀態(tài)信息進行乘運算,確定單元的輸出。
本文以邊坡形變數(shù)據(jù)為研究對象,在邊坡形變監(jiān)測中,監(jiān)測數(shù)據(jù)往往根據(jù)監(jiān)測點位的不同呈現(xiàn)出不同的形變曲線。因受到邊坡形變特征、環(huán)境因素及隨機誤差的影響,可將其分為3個類型:(1)發(fā)育型,該類型有形變發(fā)生,且形變量呈增長趨勢;(2)穩(wěn)定型,該類型無明顯形變,且形變曲線較穩(wěn)定;(3)波動穩(wěn)定型,該類型無明顯形變,但形變曲線波動較大。為了研究LSTM模型對這3種形變特征的應用效果,本文采集了一處鐵路隧道仰坡2021年9月14日—10月13日,12個監(jiān)測站點的GNSS三維位移監(jiān)測數(shù)據(jù),共計7832條,從中歸納選取了上述3類具有代表性的形變監(jiān)測曲線開展實驗,每類均包含垂直、東西、南北3個方向的形變數(shù)據(jù),其位移曲線如圖3所示。
圖3 3 種形變類型各維度位移曲線
數(shù)據(jù)準備包括數(shù)據(jù)標準化和數(shù)據(jù)分割。數(shù)據(jù)標準化是數(shù)據(jù)分析中較為常見的預處理方法,無量綱化是較為常見的方式之一,主要解決同一類型數(shù)據(jù)間數(shù)值相差較大,量級不同的問題。本文所選用實驗數(shù)據(jù)均為表示形變的位移數(shù)據(jù),不同監(jiān)測站的各類型數(shù)據(jù)間存在量級差異。在數(shù)據(jù)集建立之前,需對所有數(shù)據(jù)進行極值標準化,為
由于每個類型的GNSS監(jiān)測數(shù)據(jù)均為一維的位移數(shù)據(jù),為了開展時間序列預測分析,我們將一維位移數(shù)據(jù)經(jīng)過截取、組合,組建為m×(k+1)的二維矩陣Z。矩陣Z的每一行為一組時間序列。對于每組序列,規(guī)定前m-1個數(shù)據(jù),作為訓練數(shù)據(jù)用來學習形變特征,第m個數(shù)據(jù)作為標簽,供模型計算損失值,并調(diào)整模型權(quán)值。假設有GNSS監(jiān)測數(shù)據(jù)X={X1,X2,···,Xn},相鄰兩組數(shù)據(jù)間的時間步長為L,則矩陣Z為
實驗總體設計如圖4所示,整體實驗流程如下。
圖4 實驗設計
(1)數(shù)據(jù)準備:利用極值標準化法進行數(shù)據(jù)標準化,3種形變類型的3個方向維度的9組形變數(shù)據(jù)分別根據(jù)設定的時間步長(L=1)制作二維數(shù)據(jù)矩陣,并采用7:3的訓練測試比進行訓練集、測試集的劃分,制定實驗數(shù)據(jù)集。
(2)模型訓練:為了進一步研究LSTM模型隱藏層數(shù)對預測精度的影響,本文分別定義了包含8個隱藏層的LSTM8和包含12個隱藏層的LSTM12。設定學習率為0.01,迭代次數(shù)為500,按照劃分好的數(shù)據(jù)集開展多模型對比實驗,對比模型均選用常見的回歸模型。
(3)數(shù)據(jù)預測:通過對比訓練完成的模型對測試數(shù)據(jù)開展預測,并對預測結(jié)果進行反標準化,得到真實量綱的預測形變值。
(4)結(jié)果分析:將結(jié)果與真實數(shù)據(jù)對比,繪制形變預測曲線,并計算均方根誤差(RMSE ,Root Mean Square Error)、平均絕對誤差(MAE ,Mean Absolute Error)指標開展精度評價,分析各模型的預測效果。
為進一步檢驗LSTM模型的預測效果,本文采用常見的時間序列預測模型進行對比實驗,選用的模型有線性回歸(Linear)、決策樹回歸(DT ,Decision Tree)、支持向量機(SVM ,Support Vector Machine)、隨機森林(RF ,Random Forest)回歸、迭代決策樹(GBRT ,Gradient Boost Regression Tree)等。
為量化模型訓練、預測效果,本文選定訓練時間、RMSE及MAE 3個指標對模型性能進行評價,RMSE、MAE的計算分別表示為
其中,N為數(shù)據(jù)樣本數(shù);yt表示t時刻的形變位移預測值;xt表示t時刻的形變位移真實值。
對于發(fā)育型監(jiān)測曲線,其形變量隨時間變化而累計,形變數(shù)據(jù)主要受監(jiān)測區(qū)域的自身形變特性影響。對該類型數(shù)據(jù)開展多模型對比實驗,各模型精度指標如表1所示。觀察表1可知,Linear模型具有更好的指標值,擬合特性及時間效率均較好。LSTM模型用時最高,整體擬合效果略差于Linear模型。
表1 發(fā)育型監(jiān)測數(shù)據(jù)預測精度指標
針對表中各類模型的指標,重點選取了Byesian、DT、Linear、RF、LSTM8及LSTM12進行預測曲線制圖,并與實際形變曲線(“l(fā)abel”曲線)進行對比,如圖5所示。結(jié)果顯示,對于表現(xiàn)出了顯著形變趨勢的數(shù)據(jù)樣本(如該組監(jiān)測數(shù)據(jù)的東西、垂直方向監(jiān)測數(shù)據(jù)),線性模型具有較好的預測擬合效果。DT、RF等模型都僅在訓練過程中(綠線左側(cè))表現(xiàn)出了較好的擬合特性,在測試數(shù)據(jù)部分(綠線右側(cè))表現(xiàn)較差。雖然LSTM模型在兩個位移變化趨勢明顯的數(shù)據(jù)(東西、垂直方向)中預測效果略差于線性模型,但整體來看3個方向的位移預測均有較好表現(xiàn)。此外,可以發(fā)現(xiàn)針對該類型數(shù)據(jù),LSTM8預測效果略好于LSTM12。
圖5 發(fā)育型監(jiān)測數(shù)據(jù)位移預測曲線
對于穩(wěn)定型監(jiān)測曲線,其整體形變趨勢不隨時間變化而變化,且曲線波動較小,形變數(shù)據(jù)整體受無序的觀測誤差影響。對該類型的GNSS監(jiān)測數(shù)據(jù)開展多模型對比實驗,模型精度指標如表2所示??梢园l(fā)現(xiàn),雖然LSTM模型依舊花費了最高的時間成本,但其在該類監(jiān)測數(shù)據(jù)的3個方位位移預測擬合上均取得了最好的結(jié)果,而其他對比模型的預測擬合效果均較差。
表2 穩(wěn)定型監(jiān)測數(shù)據(jù)預測精度指標
對4.2中選取的6個模型的預測結(jié)果進行制圖分析,如圖6所示。結(jié)果顯示,該類型監(jiān)測數(shù)據(jù)整體呈現(xiàn)平穩(wěn)波動,如東西、南北方向。對于存在相對波動較大的垂直方向,LSTM模型在預測位移時也表現(xiàn)出了較好的魯棒性。LSTM8取得了東西方向預測指標的最佳,當隱藏層數(shù)增加到12后,南北、垂直方向預測精度得到了提升,東西方向卻有所下降,由此可見模型構(gòu)建參數(shù)對于預測精度存在較大影響。
圖6 穩(wěn)定型監(jiān)測數(shù)據(jù)位移預測曲線
對于波動穩(wěn)定型監(jiān)測曲線,其在整體的位移趨勢上保持穩(wěn)定,但在較小的時間范圍內(nèi)存在一定的形變特征,這主要是受環(huán)境如溫度、降雨等因素影響產(chǎn)生的,針對該類監(jiān)測數(shù)據(jù)開展多模型對比實驗,模型精度指標如表3所示。通過表中的精度指標對比可以發(fā)現(xiàn), LSTM模型的擬合預測結(jié)果優(yōu)于其他10個時間序列預測模型,說明在GNSS監(jiān)測數(shù)據(jù)的預測上,LSTM相較于其他模型更具有優(yōu)勢。對于時間成本問題,考慮整體時間成本仍然處于較低水平,同時,在應用過程中的計算資源要遠大于實驗環(huán)境所能提供的計算資源,因此可忽略不計。
表3 波動穩(wěn)定型監(jiān)測數(shù)據(jù)預測精度指標
同樣對前述6個模型的預測擬合結(jié)果進行制圖分析,如圖7所示。
圖7 波動穩(wěn)定型監(jiān)測數(shù)據(jù)位移預測曲線
結(jié)果顯示,實驗所采用的對比實驗模型均存在訓練數(shù)據(jù)預測效果與測試數(shù)據(jù)預測效果相差較大的問題,模型泛化性能差,難以適應復雜序列預測任務。而LSTM模型的擬合效果要優(yōu)于其他對比模型,其學習效果更好、更能夠適應復雜的任務需求。
隨著鐵路建設的快速發(fā)展,實現(xiàn)鐵路線路監(jiān)測自動預警對于線路安全保障工作具有重要意義。在本文實驗中,LSTM模型取得了最佳的預測結(jié)果,在3個常見的監(jiān)測數(shù)據(jù)類型的形變預測中都有較好的表現(xiàn),是一種魯棒性強、精度可靠的預測模型,但在時間效率層面,LSTM要略差于線性模型。考慮到LSTM的主要時間成本花費在前期訓練過程,訓練出一個泛化性強、具有遷移能力的模型將會是有效縮短時間成本的重要研究方向。