康俊鋒,胡祚晨,陳優(yōu)良
(江西理工大學土木與測繪工程學院,江西 贛州 341000)
截至2018年,中國已擁有水庫98 000多座,其中多為小型水庫[1].小型水庫建設早、管理水平低,有著很大的安全隱患,一旦發(fā)生潰壩會對周邊造成巨大的生命財產(chǎn)損失.
對大壩變形進行準確監(jiān)測和預警可保障大壩安全運行[2-3].大壩變形受到諸如氣溫、水壓和地質(zhì)條件等因素的影響[4],由于管理經(jīng)費不足及缺乏變形監(jiān)測設備,小型水庫大壩一般很難獲取到各類監(jiān)測數(shù)據(jù).將機器學習與行業(yè)數(shù)據(jù)結(jié)合已在旅游預測[5]、風力發(fā)電預測[6]、航空旅客出行指數(shù)預測[7]和PM2.5污染物濃度預測[8]等很多領(lǐng)域得到驗證.但機器學習與大壩變形預測結(jié)合相關(guān)的研究還較少,SU等[9]建立了支持向量機大壩變形預測模型;WANG等[10]提出了一種優(yōu)化的BP神經(jīng)網(wǎng)絡對大壩變形進行預測.已有大壩變形研究大都采用人工測量或半人工的自動測量機器人數(shù)據(jù)開展研究,難以實現(xiàn)實時的全自動監(jiān)測.物聯(lián)網(wǎng)和衛(wèi)星定位技術(shù)的發(fā)展為壩體變形提供了一種新的監(jiān)測手段,可實時獲取水平位移及沉降位移等變形數(shù)據(jù).另外大壩變形數(shù)據(jù)具有趨勢性、周期性、隨機性和非線性等特點[11].雖然已有研究考慮了大壩變形數(shù)據(jù)非線性特點,但都忽略了數(shù)據(jù)的趨勢性、周期性和隨機性特征.
文中提出一種STL-CS-LSTM組合模型,通過基于局部加權(quán)回歸的周期趨勢分解方法將大壩變形數(shù)據(jù)分解成趨勢分量、余項分量和周期分量,采用基于布谷鳥搜索算法優(yōu)化的LSTM模型對趨勢分量和余項分量進行預測,并通過簡單周期估計方法對周期分量進行預測,再將得到的3個分量預測值進行求和得到大壩變形預測結(jié)果.
研究區(qū)選取位于浙江省湖州市利山水庫.大壩變形監(jiān)測數(shù)據(jù)使用華測H3普適型GNSS接收機測量獲取.大壩設置6個水平位移觀測點和3個沉降觀測點,獲取的數(shù)據(jù)包括測量時間和位移長度等.
試驗數(shù)據(jù)包括2018年12月15日—2019年12月13日間的水平位移數(shù)據(jù)和2018年12月10日—2019年8月20日間的沉降數(shù)據(jù).將數(shù)據(jù)通過重采樣處理成間隔為1 h的時間序列數(shù)據(jù),剔除2組異常數(shù)據(jù),再用插值對產(chǎn)生的缺失值進行填補,其中水平位移數(shù)據(jù)有654條數(shù)據(jù),沉降數(shù)據(jù)有6 000條數(shù)據(jù).選水平位移數(shù)據(jù)的前500條數(shù)據(jù)作為訓練集,后154條數(shù)據(jù)作為測試集;而沉降數(shù)據(jù)前5 000條數(shù)據(jù)為訓練集,后1 000條數(shù)據(jù)為測試集.
STL是用來對時間序列進行分解的一種常用方法,可以任意選擇周期分量的變化率以及控制趨勢分量的平滑度,有較好的魯棒性.該方法利用局部加權(quán)回歸來分解數(shù)據(jù),有加性模型和乘性模型2種方法.文中使用加性模型,其中加性模型分解算法的計算式為
Yt=Tt+St+Rt,t∈[1,N],
(1)
式中:Yt,Tt,St和Rt分別為t時刻的時間序列數(shù)據(jù)、趨勢分量、周期分量和余項分量.
LSTM模型是一種特殊的循環(huán)神經(jīng)網(wǎng)絡RNN.LSTM每個記憶細胞中都有遺忘門、輸入門和輸出門,這使得LSTM能夠記住需要的信息和遺忘不需要的信息,解決了RNN訓練過程中經(jīng)常會出現(xiàn)梯度爆炸和梯度消失等問題.
對數(shù)據(jù)進行歸一化處理后,使用布谷鳥搜索算法對于不同分量進行預測的LSTM模型的時間步長和第一、二層隱含層神經(jīng)元個數(shù)n1,n2參數(shù)進行優(yōu)化,其參數(shù)優(yōu)化的結(jié)果如表1所示.
表1 LTSM模型參數(shù)優(yōu)化結(jié)果Tab.1 Optimization results of LSTM model parameters
參數(shù)優(yōu)化后,將LSTM模型對2組數(shù)據(jù)的趨勢分量和余項分量分別進行預測.
首先將時間序列數(shù)據(jù)采用STL方法分解為趨勢分量、周期分量和余項分量,其中趨勢分量和余項分量使用優(yōu)化的LSTM模型分別進行預測;使用簡單周期估計方法對周期分量進行預測,其中數(shù)據(jù)周期設置為24,因此t時刻的序列值等于(t+24)時刻的;最后對得到的3個分量預測值進行求和,得到大壩變形預測結(jié)果.模型構(gòu)建方法如圖1所示.
圖1 STL-CS-LSTM模型構(gòu)建方法Fig.1 STL-CS-LSTM model building method
文中選擇3種評價指標對預測模型的性能進行評價,分別為相關(guān)系數(shù)R2、平均絕對誤差MAE和均方差RMSE.選取多個指標可以克服選擇單個評價指標的局限,從而得到較為客觀的評價結(jié)果.
設置STL周期參數(shù)為24,2組數(shù)據(jù)分解結(jié)果如圖2所示,圖中ta為時隙,d1為水平位移值,d2為沉降值.
圖2 數(shù)據(jù)分解結(jié)果Fig.2 Data decomposition results
從圖2可以看出,趨勢分量平滑且波動較??;周期分量呈周期性,且周期為24;余項分量波動大且不平滑,具有非線性特征.
使用LSTM,ANN,SVR這3個單一模型,與STL-CS-LSTM模型分別預測大壩的水平位移和沉降位移.
圖3為水平位移預測結(jié)果和實測值d1m對比.其中STL-CS-LSTM模型和LSTM模型預測值基本和實測值變化趨勢保持一致,精度較高;SVR模型預測值出現(xiàn)了一定的滯后性導致預測精度較低;ANN模型的預測值趨勢和實測值相似,但誤差很大,預測效果最差.
圖3 水平位移預測結(jié)果Fig.3 Prediction results of horizontal displacement
表2為水平位移預測評價結(jié)果,STL-CS-LSTM模型和LSTM模型的R2都超過了0.900,精度較高.
表2 水平位移值預測評價結(jié)果Tab.2 Evaluation results of horizontal displacement prediction model
圖4為水平位移值的實測值d1m與預測值d1c對比散點圖,結(jié)果表明水平位移預測性能最好的是STL-CS-LSTM模型,之后分別為LSTM模型、SVR模型、ANN模型.
圖4 水平位移值的實測值與不同模型預測值對比散點圖Fig.4 Comparison between real value and predicted value of horizontal displacement value with different models
圖5為沉降值預測結(jié)果和實測值d2m對比.其中STL-CS-LSTM模型預測表現(xiàn)最好.LSTM模型和ANN模型的預測值雖然也能保持在實測值上下波動,但誤差較大,SVR模型預測值與實測值相差非常大.
圖5 沉降數(shù)據(jù)預測結(jié)果Fig.5 Settlement data prediction results
各個沉降值數(shù)據(jù)預測模型評價結(jié)果如表3所示.沉降實測值d2m與不同模型預測值d2c對比散點圖如圖6所示.
圖6 沉降實測值與不同模型預測值對比散點圖Fig.6 Scatter plot of comparison between real value of settlement value and predicted value of different models
表3 沉降值預測評價結(jié)果Tab.3 Evaluation results of settlement value prediction model
從沉降變形預測試驗結(jié)果分析可知,LSTM模型和ANN模型的性能相對較差,SVR模型的各項指標都為最差.沉降值預測性能最好的是STL-CS-LSTM模型,該模型的R2達到了0.984,之后從高到低依次為ANN模型、LSTM模型、SVR模型.
從試驗結(jié)果分析可知:ANN模型和SVR模型泛化能力不夠,ANN模型在預測水平位移值的時候和SVR模型在預測沉降值的時候出現(xiàn)了較大的誤差;LSTM相較于其他2個單一模型的預測精度和泛化能力都相對較好,在單一模型中綜合表現(xiàn)最好;STL-CS-LSTM 模型對于位移數(shù)據(jù)和沉降數(shù)據(jù)預測的精度都比單一模型要更高,且預測值一直在實測值附近上下波動.
1) 對于周期向量,利用其數(shù)據(jù)呈周期性的特點使用簡單周期估計方法對其進行預測,對不同分量分別建模預測能最大化利用數(shù)據(jù)線性和非線性特征,從而提高機器學習模型預測精度.
2) 試驗結(jié)果表明STL-CS-LSTM模型的預測精度比3個單一模型要更加優(yōu)異.