王晨輝,趙貽玖,郭 偉,孟慶佳,李 濱
1. 電子科技大學自動化工程學院,四川 成都 611731; 2. 中國地質調查局水文地質環(huán)境地質調查中心,河北 保定 071051; 3. 自然資源部地質環(huán)境監(jiān)測工程技術創(chuàng)新中心,河北 保定 071051; 4. 中國地質科學院地質力學研究所,北京 100081
滑坡是世界上地質災害最嚴重的類型之一[1-2],受限于不同的地質環(huán)境條件,諸多影響因素會導致滑坡發(fā)生,預測滑坡變形及形變演化過程是一項艱巨且富有挑戰(zhàn)的關鍵任務[3]?;碌难莼^程是一個復雜的多種影響因素疊加的非線性過程[4],因此,利用滑坡長時間位移監(jiān)測數(shù)據(jù)可以形象表示滑坡發(fā)生的非線性位移動態(tài)行為特征。對于滑坡監(jiān)測預警及預測來說,滑坡位移預測是滑坡災害監(jiān)測預警系統(tǒng)的重要組成部分之一[5-6],如何設計行之有效的滑坡變形監(jiān)測和預測方法,有助于了解滑坡災害失穩(wěn)過程及形變特征,有利于減少滑坡給人類生命財產(chǎn)安全和基礎設施帶來風險[7-8]。
滑坡發(fā)生運動最主要的外在特征體現(xiàn)在滑坡重點形變區(qū)域位移的不斷變化,對滑坡位移變形開展實時動態(tài)監(jiān)測和形變預測顯得至關重要。研究人員對滑坡位移預測開展了諸多研究,將多種數(shù)學模型用于預測滑坡位移,主要包括歷史經(jīng)驗模型、數(shù)學統(tǒng)計模型、非線性模型和綜合耦合模型。
(1) 歷史經(jīng)驗模型。通過開展現(xiàn)場滑坡實時監(jiān)測和實驗室室內模型試驗來獲取長期大量的滑坡不間斷位移形變監(jiān)測數(shù)據(jù),主要的經(jīng)驗模型包括齋藤模型、Crosta和Agliardi模型[9-10]。
(2) 數(shù)學統(tǒng)計模型。通過數(shù)學統(tǒng)計方法設計滑坡位移預測模型。典型的數(shù)學統(tǒng)計模型包括灰色系統(tǒng)模型[11]、灰色位移矢量角模型[12]、基于斜坡斜率變化的滑坡預測模型[9]。
(3) 非線性模型。通過非線性理論,包括突變理論[13]和協(xié)同理論[14],此類模型包括傳統(tǒng)方式的非線性模型[15-16]、支持向量回歸模型[17]、BP和Elman神經(jīng)網(wǎng)絡模型[15,18-21]。
(4) 綜合耦合模型。近年來,綜合多種機器學習的復雜模型被用于預測滑坡災害,這些模型主要結合雨量、位移、庫水位來進行滑坡預測。例如,基于移動平均線的自回歸綜合模型用于預測滑坡位移變形[22-23]。經(jīng)驗模態(tài)分解模型[24]和集成經(jīng)驗模態(tài)分解[19,25],通過長時間序列基于LSTM模型來預測滑坡位移形變[26]。
綜上所述,研究人員利用多種模型實現(xiàn)了對滑坡位移的形變預測,但是上述模型也存在一些不足和缺點。歷史經(jīng)驗模型需要通過大量的真實數(shù)據(jù)或蠕變試驗來驗證模型的準確性,只有合適的應用場景滑坡位移才能得到較好的預測,因此經(jīng)驗模型具有嚴格的應用適用條件限制;統(tǒng)計學模型在一定程度上解決了一些物理機制相對復雜的滑坡形變,對于單個影響因素的滑坡監(jiān)測效果較好,但是對多重影響因素的統(tǒng)計學模型并不能較好地解決問題;神經(jīng)網(wǎng)絡等非線性模型具有良好的預測性能,但是非線性模型存在收斂速度慢且容易陷入局部極小值問題。
綜合耦合模型有助于從多個模型角度出發(fā)實現(xiàn)對滑坡位移預測,在一定條件下提高了滑坡位移預測的準確率,例如采用EEMD方法可以消除長時間監(jiān)測數(shù)據(jù)存在的模態(tài)混合問題[25,27],該方法根據(jù)監(jiān)測數(shù)據(jù)本身的時間尺度特征進行數(shù)據(jù)分解,非常適用于各種數(shù)據(jù)趨勢項的提取分解。通過EEMD方法進行分解來獲取各個監(jiān)測子序列的不同頻率特征,利用EEMD方法可以探討研究誘發(fā)滑坡位移發(fā)生變形的局部特征,探索蠕變性滑坡在降雨情況下是否會對滑坡的變形發(fā)生重要的影響作用,可以有效避免采用原始位移數(shù)據(jù)所遇到的非線性和隨機性問題。支持向量回歸(SVR)對于處理非線性數(shù)據(jù)具有很大的靈活性,利用SVR模型有助于解決非線性回歸問題?;谝陨戏治觯疚难芯客ㄟ^EEMD-SVR方法來構建滑坡位移預測模型,通過EEMD方法提取滑坡位移數(shù)據(jù)的趨勢項和周期項,結合降雨誘發(fā)因素,通過SVR模型采用高斯核函數(shù)實現(xiàn)對滑坡位移監(jiān)測數(shù)據(jù)的有效預測。
該模型參數(shù)設置方便靈活、易于實現(xiàn)且運算效率高,可以有效控制滑坡位移預測中非線性局部最小值導致的預測效果不佳等問題。本文以貴州水城區(qū)發(fā)耳鎮(zhèn)尖山營滑坡為例,通過分析滑坡內部孕育發(fā)展運動過程和外部環(huán)境因素,綜合考慮滑坡位移、降雨量和預測數(shù)據(jù)在內的長時間監(jiān)測序列集來構建滑坡預測模型,通過建立預測模型性能評價指標,將預測結果與測試樣本進行對比,再與Elman神經(jīng)網(wǎng)絡、支持向量機(SVR)模型分別對比分析,從而驗證EEMD-SVR模型的有效性和準確性,實現(xiàn)對滑坡位移的精準預測,有效提高滑坡位移預測的準確率。
文獻[28]提出的本征模函數(shù)(intrinsic mode function,IMF)概念,認為任何時間序列都可以通過經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)方法分解為多個IMF和一個趨勢量。該文獻提出的基于篩分(sifting)算法的EMD得到的IMF分量存在模態(tài)混疊(mode mixing,MM)。模態(tài)混疊的出現(xiàn)不僅會導致錯假的時頻分布,也使IMF失去物理意義,還存在端點效應、篩分迭代停止標準等問題。文獻[29]提出一種噪聲輔助信號分析方法—集合經(jīng)驗模態(tài)分解(ensemble EMD,EEMD),主要目的是在原始序列中加入高斯白噪聲信號以消除模態(tài)混疊現(xiàn)象。以裂縫傳感器獲取到的監(jiān)測數(shù)據(jù)為例說明EEMD算法步驟[30]:假定傳感器節(jié)點每次采集L個監(jiān)測數(shù)據(jù)作為訓練數(shù)據(jù),設置長度為N的訓練窗口,采用先進先出結構每次更新數(shù)據(jù)為ΔL個數(shù)據(jù),xh(t)為第h個滑動窗口的數(shù)據(jù)。具體步驟如下。
(1) 在原始數(shù)據(jù)序列xh(t)中加入高斯白噪聲信號n(t)為,得到新序列
(1)
(2) 根據(jù)數(shù)據(jù)序列求解極大值點構成的上包絡線(max0(t))和極小值點構成的下包絡線(min0(t)),上、下包絡線均值為mean0(t),數(shù)據(jù)序列減去均值曲線為
(2)
(3) 判斷d0(t)是否滿足IMF要求,若滿足,則d0(t)為IMF;否則,記d0(t)為xh(t)重復步驟(1)—步驟(2)直至得到第1個IMF,記為c1(t)。
支持向量回歸(support vector regression,SVR)是支持向量機(support vector machine,SVM)對回歸問題的一種運用場景。SVM是一種基于統(tǒng)計學習VC維(Vapnik-Chervonenkis dimension)和結構風險最小化理論的監(jiān)督學習分類技術,是一種二類分類模型,主要解決特征空間上間隔最大的線性分類問題,而對于線性不可分問題,利用核函數(shù)將低維數(shù)據(jù)映射到高維空間,從而將低維空間上的線性不可分問題轉化為高維空間上的線性可分問題,通過求解再映射回到低維空間。
支持向量機可以有效解決小樣本、非線性和高維數(shù)問題,并且能克服神經(jīng)網(wǎng)絡在處理非線性問題上的缺陷[24,31],SVR通過SVM來對曲線進行擬合從而實現(xiàn)數(shù)據(jù)的回歸分析。SVR主要操作步驟為:給定訓練樣本D,希望學得一個回歸模型f(x)與y盡可能接近。其中
D={(x1,y1),(x2,y2),…,(xm,ym)}yi∈R
(3)
f(x)=wT+b
(4)
式中,w、b是待確定的參數(shù)。在這個模型中,只有當f(x)與y完全相同時,損失才為零,而支持向量回歸假設能容忍的f(x)與y之間最多有ε的偏差,當且僅當f(x)與y的差別絕對值大于ε時,才計算損失,此時相當于以f(x)為中心,構建一個寬度為2ε的間隔帶,若訓練樣本落入此間隔帶,則被認為是預測正確的。
為了對發(fā)耳尖山營發(fā)生的滑坡位移進行詳細分析,通過EEMD將位移監(jiān)測數(shù)據(jù)分解為趨勢項、周期項,考慮到滑坡位移發(fā)生的因素是多種原因導致,尤其考慮到降雨因素、人工擾動因素及地下采礦等外界因素,本文研究結合EEMD-SVR模型分別對位移的趨勢項、周期項和位移累計監(jiān)測數(shù)據(jù)分別做預測分析[32],方法流程圖如圖1所示。
圖1 EEMD-SVR模型流程Fig.1 Flowchart of EEMD-SVR model
為了分析研究位移監(jiān)測數(shù)據(jù)模型的預測能力,采用評估指數(shù)來分析位移預測性能,主要包括均方根誤差(root mean squared error,RMSE)、平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)、決定系數(shù)(coefficient of determination,R2)。
RMSE是預測值與位移監(jiān)測數(shù)據(jù)真實值偏差的平方與樣本數(shù)據(jù)n比值的平方根,計算公式為
(5)
MAE是觀測值與真實值的誤差絕對值的平均值,計算公式為
(6)
上述兩個指數(shù)可以較好地反映預測模型的精確度,主要用來描述預測值與真實值的誤差情況。
MAPE主要用來對預測方法的預測精度進行度量,通常以百分數(shù)表示準確性,計算公式為
(7)
R2主要用來判斷預測模型的好壞,其取值范圍為[0,1],R2越大,表示預測模型效果越好
(8)
尖山營滑坡位于貴州省六盤水市水城區(qū)發(fā)耳鎮(zhèn)西北部,地處貴州高原西部,地形跌宕起伏,切割強烈,屬于構造侵蝕而成的低中山至中低山地貌。該滑坡在地形上表現(xiàn)為東南側高,西北側低;滑坡邊界在平面上呈不規(guī)則的半圓形狀,包括尖山營陡崖及其下方緩平臺區(qū),不穩(wěn)定斜坡變形區(qū)前緣高程范圍為1040~1120 m,后緣高程范圍為1380~1502 m,高差約483 m,斜坡體后壁近于陡立,前緣坡度約63°。在該滑坡共部署5套監(jiān)測設備,編號分別為EI19001—EI19005,采用LoRa+4G方式采集現(xiàn)場傳感器數(shù)據(jù),EI19001作為網(wǎng)關節(jié)點負責監(jiān)測該滑坡區(qū)域內降雨量情況,此外還負責獲取現(xiàn)場其他終端節(jié)點的裂縫傳感器監(jiān)測數(shù)據(jù),EI19002—EI19005作為終端節(jié)點負責監(jiān)測該滑坡區(qū)域內4處關鍵地表裂縫的變化情況,監(jiān)測設備部署示意如圖2所示。
圖2 監(jiān)測設備部署Fig.2 Deployment diagram of monitoring equipment
4個裂縫位移監(jiān)測點分別設置在滑坡主要裂縫形變區(qū)域,通過LoRa無線自組網(wǎng)通信方式準確可靠地獲取滑坡監(jiān)測數(shù)據(jù),分別設置低功耗變頻工作模式和采集觸發(fā)工作模式,低功耗變頻工作模式時,微處理器主頻由16 MHz降至65 KHz,設備功能模塊定時上傳監(jiān)測數(shù)據(jù);采集觸發(fā)工作模式時,微處理器打開實時監(jiān)聽模式實時監(jiān)測裂縫變化情況,一旦超過預定閾值即可啟動數(shù)據(jù)通信接口上傳位移監(jiān)測數(shù)據(jù)。
本文選取2020年7月6日—2020年10月30日的監(jiān)測數(shù)據(jù)開展分析研究。初步設置系統(tǒng)的工作模式為定時回傳間隔為1 h一條,同時開啟數(shù)據(jù)采集端口觸發(fā)回傳模式,雨量觸發(fā)回傳閾值設為0.2 mm,位移觸發(fā)回傳閾值設為20 mm。雨量、裂縫位移綜合分析曲線圖如圖3所示。為了探究降雨量與滑坡裂縫位移變化的響應關系,以降雨周期內位移變化作為數(shù)據(jù)的研究樣本,通過構建訓練集和測試集來分別預測在有降雨和無降雨情況下位移的變化情況。
圖3 雨量和位移綜合分析曲線Fig.3 Comprehensive analysis curve of rainfall and displacement
在EEMD-SVR模型中,主要利用EEMD方法將滑坡累計位移分解為趨勢項和周期項[33-34],通過對滑坡裂縫位移的變形特征分析,滑坡于2020年7月6日開始出現(xiàn)位移變形,故選取2020年7月6日—2020年10月30日的117 d監(jiān)測數(shù)據(jù)開展數(shù)據(jù)分析,選取2020年7月6日—2020年10月10日的97 d監(jiān)測數(shù)據(jù)作為訓練集,選取2020年10月11日—2020年10月30日的20 d作為測試數(shù)據(jù)驗證預測模型。考慮到影響滑坡位移變形主要包括滑坡內在條件和外界因素,趨勢項代表滑坡長期內動力下的變形趨勢,周期項代表滑坡可能受到外界降雨因素作用下的動力響應[32,35]。
首先利用EEMD對滑坡累計位移進行分解,圖4代表EI19003設備累計位移分解后的趨勢項和周期項。周期項位移主要發(fā)生在7~9月,也是滑坡所在區(qū)域的降雨季節(jié),這表明周期項位移的變化可能受到了強降雨因素的影響。
圖4 位移時間序列EEMD分解結果Fig.4 EEMD decomposition results of displacement time series
通過EEMD分解結果,觀察到IMF1到IMF5波動頻率依次降低,Residue為殘余分量。由于IMF1—IMF3頻率較高,波動幅度較小,可合并為滑坡位移的周期項,IMF4、IMF5相對較低,變化幅度相對較高,可以將IMF4和IMF5兩項合并為滑坡位移的趨勢項。嚴格意義上,EEMD分解結果的所有IMF之和并不等于原始位移,考慮到預測模型的準確性,在本文中規(guī)定趨勢項=IMF4+IMF5,周期項=原始位移-趨勢項。
然后設置SVR模型的輸入變量,SVR模型輸入?yún)?shù)主要包括核函數(shù)、懲罰因子C和寬度系數(shù)γ,本文選取核函數(shù)為“rbf”,通過網(wǎng)格搜索函數(shù)(gridSearchCV)多次訓練得到最佳懲罰因子C=100、寬度系數(shù)γ=0.01。綜合考慮滑坡內在條件和外界降雨因素,SVR輸入變量的屬性設置為前t1d位移、前t2d降雨量,輸出為td的位移。t1和t2根據(jù)實際預測效果再進行天數(shù)調優(yōu)。例如,t1=2,t2=3時,表示輸入變量為t1-1、t1-2 d位移和t2-1、t2-2、t2-3 d的降雨量。為了觀察外界降雨因素對預測結果的影響,分別考慮有降雨量特征、無降雨量特征,連續(xù)預測1、10、20 d等6種情況下模型的預測情況。連續(xù)預測時采用滾動預測法,即將t時刻的預測位移作為t+1時刻的輸入特征。
圖5、圖6分別為t1=4、t2=7時EEMD-SVR模型對位移周期項的訓練和測試結果。
圖5 EEMD-SVR模型對位移周期項的訓練結果Fig.5 Training results of the periodic component using EEMD-SVR model
圖6 EEMD-SVR模型對滑坡位移周期項的預測結果Fig.6 Prediction results of the periodic component using EEMD-SVR model
圖7、圖8分別為EEMD-SVR模型對位移趨勢項的訓練和測試結果。圖9為SVR模型對滑坡位移連續(xù)1、10、20 d情況下與原始位移的對比,由于連續(xù)滾動預測20 d包括連續(xù)預測10 d的數(shù)據(jù),所以在曲線展示中連續(xù)10 d的預測曲線被隱藏在連續(xù)20 d的預測曲線中。
圖7 EEMD-SVR模型對位移趨勢項的訓練結果Fig.7 Training results of the trend component using EEMD-SVR model
圖8 EEMD-SVR模型對位移趨勢項的預測結果Fig.8 Prediction results of the trend component using EEMD-SVR model
圖9 EEMD-SVR模型對位移測試集的預測結果Fig.9 Prediction results of displacement test set based on EEMD-SVR model
通過觀察滑坡整個數(shù)據(jù)集的預測結果(圖10)可知,EEMD-SVR模型表現(xiàn)出了比較好的擬合結果,誤差相對更低,證明該機器學習模型的穩(wěn)健性比較好。結果表明,EEMD-SVR機器學習模型能夠準確預測尖山營滑坡的累積位移,具有較好的位移預測能力。
圖10 EEMD-SVR模型對整個數(shù)據(jù)集的預測結果Fig.10 Prediction results of total displacement set based on EEMD-SVR model
通過性能指標評價對比分析(表1),位移預測值與原始位移的絕對誤差均可以控制在1%之內,基本可以反映出趨勢項和周期項的變化趨勢??紤]到噪聲因素和模型訓練的差異性,連續(xù)預測1、10、20 d在無降雨條件下相比降雨條件下RMSE、MAE、MAPE和R2均低于有降雨情況條件下,可以初步認為考慮降雨量因素情況下對模型預測影響較小,說明該滑坡在降雨情況下對滑坡裂縫位移的影響較小。
表1 EEMD-SVR模型測試集模型性能評價
采用2020年尖山營滑坡在雨季汛期內的原始監(jiān)測數(shù)據(jù)通過EEMD-SVR模型進行學習預測,為了評價其預測性能,利用1.4節(jié)中的性能指標來進行評價。在考慮有無降雨作用下,許多機器學習模型(如SVR和Elman)可以提供令人滿意的預測性能[24,36]。為了驗證所提方法的有效性和科學意義,各種模型之間的準確性比較是至關重要的[37-38],各模型配置參數(shù)如下:EEMD-SVR和SVR模型中的懲罰因子C=100、寬度系數(shù)γ=0.01,Elman模型中的迭代次數(shù)maxgen=50、種群規(guī)模sizepop=40、交叉概率pcross=0.7、變異概率pmutation=0.01。圖11為2020年雨季汛期內無降雨條件下不同機器學習模型預測值與真實值的對比。
圖11 EEMD-SVR和SVR、Elman模型對原始位移與預測位移的對比分析Fig.11 Comparative analysis of EEMD-SVR, SVR and Elman models on original and predicted displacement
表2為EEMD-SVR和SVR、Elman模型的測試集預測性能的不同評價標準。本文由于涉及到的監(jiān)測數(shù)據(jù)規(guī)模相對較小,結果表明,SVR和Elman模型在滑坡位移預測中表現(xiàn)出了一定的預測性能,但是經(jīng)過EEMD分解之后的SVR模型比單一模型具有更好的預測性能,其預測結果更接近于原始位移監(jiān)測值。由表2可知,EEMD-SVR連續(xù)1 d預測測試集的RMSE是0.648 mm,MAPE是0.518%,均低于其他單一模型。說明EEMD-SVR模型在該類地形的位移預測表現(xiàn)更佳??傮w而言,基于EEMD-SVR的綜合耦合模型在該滑坡位移預測方面優(yōu)于單一模型,具有較好的預測性能,可以滿足一般的工程應用需求。
表2 各種模型測試集預測結果性能評價
本文選取貴州省巖溶山區(qū)一處典型滑坡為研究對象,通過對滑坡位移變形特征的分析,采用機器學習模型來預測滑坡位移的下一步變形趨勢,該模型基于EEMD分解和SVR模型,預先考慮滑坡位移的動態(tài)變化可能會受到降雨季節(jié)的影響,通過EEMD將滑坡累計位移分為趨勢項和周期項,然后利用SVR模型分別對趨勢項和周期項進行了預測分析,然后將兩個分量之和計為滑坡累計總的預測位移。選取前t1d位移、前t2d降雨量作為SVR模型的輸入向量,分別預測在有降雨因素和無降雨因素下周期項和趨勢項的位移變形情況。
利用尖山營滑坡2020年雨季汛期內的位移監(jiān)測數(shù)據(jù),通過滑坡后20 d位移數(shù)據(jù)對模型進行驗證分析。通過預測結果表明,EEMD-SVR模型能夠準確預測滑坡位移變形情況,通過性能評價指標可以做出初步判斷,該滑坡在長期內在條件作用下,短時間內可能受降雨因素滑坡位移發(fā)生變化,但降雨因素對于長期位移預測影響較小?;贓EMD-SVR的綜合耦合模型表現(xiàn)均優(yōu)于其他單一模型,對比其他傳統(tǒng)的機器學習算法,EEMD-SVR模型可以深入了解滑坡位移變形與降雨量之間的關聯(lián)關系,對分析滑坡位移變形提供了可靠穩(wěn)定的技術手段,說明EEMD-SVR模型在該滑坡的位移預測表現(xiàn)更佳。同時,EEMD-SVR模型有較好的適用性和穩(wěn)健性,算法穩(wěn)定、解算效率高、性能突出、誤差較小,可以滿足工程實踐需要。EEMD-SVR模型結果表明,由于滑坡的動態(tài)變形過程會受到內外因素的綜合影響,對不同影響因素采用不同的模型可以有效提高滑坡變形的預測精度。因此,在以后的工作中應將引入其他更多的影響因素加入模型研究中,以此來進一步提高滑坡位移預測的準確度和精確度。