劉青豪,張永紅,鄧 敏,吳宏安,康永輝,魏鉅杰
1. 中南大學(xué)地球科學(xué)與信息物理學(xué)院,湖南 長沙 410083; 2. 中國測繪科學(xué)研究院,北京 100830
地面沉降是指在自然和人為因素作用下,由于地殼表層土體壓縮而導(dǎo)致區(qū)域性地面標(biāo)高降低的一種環(huán)境現(xiàn)象,又稱地面下沉或地沉[1]。由于城市化的快速發(fā)展,人類對自然資源的需求不斷增加,煤、石油、天然氣、地下水等自然資源的不斷開采使得地面沉降問題變得越發(fā)嚴(yán)重,地面沉降問題已成為世界性的地質(zhì)問題。因此,開展大范圍地面沉降預(yù)測預(yù)報(bào)分析,對國土空間規(guī)劃、防災(zāi)減災(zāi)等具有重要的研究價(jià)值和現(xiàn)實(shí)意義。
在大范圍地表沉降預(yù)測方面,目前的研究并不豐富。文獻(xiàn)檢索發(fā)現(xiàn),已有的地表沉降預(yù)測方法主要可歸納為三大類:基于物理機(jī)制的方法、基于數(shù)理統(tǒng)計(jì)的方法以及基于機(jī)器學(xué)習(xí)的方法?;谖锢頇C(jī)制的方法從沉降內(nèi)部的物理演化過程出發(fā),通過實(shí)地檢測和試驗(yàn)的方式獲取包含巖性特征、水文特征在內(nèi)的一系列復(fù)雜的物理參數(shù),進(jìn)而對地面沉降進(jìn)行模擬與預(yù)測[2-5],常見的模型包括采礦沉降模型、地鐵沉降模型、地下水耦合模型等。然而,由于各種參數(shù)的存在,很多情況下需要對該類方法做出嚴(yán)格的假設(shè)才能應(yīng)用,而這些假設(shè)有時(shí)可能會失效,如,由于地表沉降現(xiàn)象存在復(fù)雜的成因而難以確定的趨勢性及周期性等。基于數(shù)理統(tǒng)計(jì)的方法通過分析大量歷史監(jiān)測數(shù)據(jù)的內(nèi)在關(guān)系及發(fā)展規(guī)律,采用包含回歸分析、灰色預(yù)測等在內(nèi)的數(shù)學(xué)模型來實(shí)現(xiàn)地面沉降的模擬。然而,由于未考慮地下巖土介質(zhì)的本構(gòu)關(guān)系,該類方法通常難以推廣。采用此類方法的研究主要有文獻(xiàn)[5—7],能否正確選擇參數(shù)模型在很大程度上決定了該類方法預(yù)測結(jié)果的準(zhǔn)確率?;跈C(jī)器學(xué)習(xí)的方法是在計(jì)算機(jī)的輔助下進(jìn)行沉降特征的學(xué)習(xí),不受研究區(qū)域地質(zhì)及水文等復(fù)雜物理參數(shù)的限制。其原理中的回歸思想與時(shí)間序列預(yù)測有著緊密的關(guān)系[8],經(jīng)典的支持向量回歸、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、小波分析等方法在時(shí)間序列預(yù)測方面均取得了不錯的效果[9-12]。該類方法依賴歷史數(shù)據(jù)的驅(qū)動?,F(xiàn)有的機(jī)器學(xué)習(xí)方法在地表沉降預(yù)測方面尚存在兩個困難:首先,高維的數(shù)據(jù)不僅影響了機(jī)器學(xué)習(xí)的速度,而且可能包含錯誤的噪聲信息,如何從高維數(shù)據(jù)中選擇關(guān)鍵的特征進(jìn)行學(xué)習(xí)直接影響著沉降預(yù)測的精度;其次,由人類活動導(dǎo)致的地下水位升降等相關(guān)數(shù)據(jù)與沉降觀測點(diǎn)的粒度難以匹配,生硬的插值必然降低訓(xùn)練樣本的質(zhì)量。以上兩個難題使得機(jī)器學(xué)習(xí)方法因特征選擇困難或樣本粒度的差異而難以得到較高的預(yù)測精度,并且模型的泛化能力較弱,難以對存在地質(zhì)條件差異的區(qū)域進(jìn)行沉降預(yù)測。因此,如何利用歷史數(shù)據(jù)建立有效的預(yù)測模型,對未來地表沉降進(jìn)行模擬,是一項(xiàng)十分重要的工作。
綜合上述分析可以發(fā)現(xiàn):在大范圍地表沉降預(yù)測中,現(xiàn)有沉降預(yù)測方法因模型參數(shù)難以獲取或相關(guān)數(shù)據(jù)的缺乏而難以得到可靠的預(yù)測結(jié)果[2-12],通過分段線性逼近來實(shí)現(xiàn)沉降時(shí)間序列的非線性擬合,在本質(zhì)上忽略了時(shí)間序列中的非線性關(guān)聯(lián)[12]。本文提出一種基于深度學(xué)習(xí)的地表沉降時(shí)序預(yù)測方法,并通過滄州地區(qū)2012—2016年地表沉降InSAR監(jiān)測數(shù)據(jù)進(jìn)行建模驗(yàn)證。結(jié)果表明,該方法具有很好的預(yù)測效果。
近年來,深度學(xué)習(xí)作為一種新的機(jī)器學(xué)習(xí)方法受到很多行業(yè)的高度關(guān)注[13-16]。其中,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)能夠使得網(wǎng)絡(luò)當(dāng)前的運(yùn)行不僅跟當(dāng)前的輸入數(shù)據(jù)有關(guān),并且可以與之前的數(shù)據(jù)建立聯(lián)系。然而,每個隱含細(xì)胞單元計(jì)算的最后都要經(jīng)過一個非線性函數(shù),使其輸出為[0,1]之間的結(jié)果,這使得十幾次運(yùn)算后數(shù)值會衰減到很小而無法記憶較遠(yuǎn)位置的數(shù)據(jù)。此外,梯度爆炸也是普通RNN模型容易面臨的困難。為解決這兩種問題,文獻(xiàn)[16—17]提出了長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)模型。該模型是一種特殊的RNN,通過在隱藏層增加門機(jī)制來控制信息的流失,再經(jīng)過反向傳播過程的動態(tài)調(diào)整,使得網(wǎng)絡(luò)可以學(xué)習(xí)長距離的時(shí)間序列數(shù)據(jù)。本文正是利用了LSTM模型的這一優(yōu)點(diǎn),提出基于LSTM模型的大范圍地表沉降時(shí)序預(yù)測方法。
隱藏層是整個LSTM網(wǎng)絡(luò)的核心,由多個LSTM細(xì)胞單元組成,細(xì)胞單元的結(jié)構(gòu)如圖1所示。
圖1 LSTM隱藏層細(xì)胞結(jié)構(gòu)Fig.1 Cell structure of LSTM hidden layer
圖1中共顯示了一層隱藏層中的3個細(xì)胞單元。xt表示樣本時(shí)間序列中第t時(shí)刻的輸入,ht表示相應(yīng)細(xì)胞單元的隱含狀態(tài)輸出。每個細(xì)胞單元中依次進(jìn)行數(shù)據(jù)輸入、信息遺忘、細(xì)胞狀態(tài)更新以及隱含狀態(tài)輸出,其前向計(jì)算方法可以表示為
it=σ(Wxixt+Whiht-1+Wcict-1+bi)
(1)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)
(2)
ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc)
(3)
ot=σ(Wxoxt+Whoht-1+Wcoct+bo)
(4)
ht=ottanh(ct)
(5)
式中,i、f、c、o分別表示輸入門、遺忘門、細(xì)胞狀態(tài)、輸出門;W和b分別為對應(yīng)的權(quán)重系數(shù)矩陣和偏置項(xiàng);σ和tanh分別為sigmoid和雙曲正切激活函數(shù)。LSTM模型訓(xùn)練過程采用的是與經(jīng)典的反向傳播算法原理類似的BPTT算法[18],主要包括4個步驟:①按照前向計(jì)算方法計(jì)算LSTM細(xì)胞的輸出值,即式(5);②反向計(jì)算每個LSTM細(xì)胞的誤差項(xiàng),包括按時(shí)間和網(wǎng)絡(luò)層級兩個反向傳播方向;③根據(jù)相應(yīng)的誤差項(xiàng),計(jì)算每個權(quán)重的梯度;④應(yīng)用基于梯度的優(yōu)化算法更新權(quán)重。
基于前述LSTM預(yù)測原理,結(jié)合地表沉降中單變量短時(shí)序的數(shù)據(jù)特征,構(gòu)建了基于LSTM的地表沉降時(shí)序預(yù)測模型。該模型的整體框架如圖2所示,包括輸入層、隱藏層、輸出層、網(wǎng)絡(luò)訓(xùn)練以及網(wǎng)絡(luò)預(yù)測5個功能模塊。輸入層負(fù)責(zé)對原始地表沉降數(shù)據(jù)進(jìn)行預(yù)處理以滿足網(wǎng)絡(luò)輸入要求,隱藏層采用圖2表示的LSTM細(xì)胞搭建循環(huán)神經(jīng)網(wǎng)絡(luò),輸出層提供預(yù)測結(jié)果,網(wǎng)絡(luò)訓(xùn)練采用ADAM優(yōu)化算法,網(wǎng)絡(luò)預(yù)測采用迭代的方法逐點(diǎn)進(jìn)行預(yù)測。
通過長短期記憶網(wǎng)絡(luò)動態(tài)的調(diào)整,模型可以充分學(xué)習(xí)不同沉降時(shí)間序列中的非線性關(guān)聯(lián),進(jìn)而可以捕獲研究區(qū)域中的復(fù)雜沉降機(jī)理。該方法不僅可以降低預(yù)測過程對歷時(shí)數(shù)據(jù)質(zhì)量的要求,而且從本質(zhì)上可以提高沉降預(yù)測精度與可解釋性。
圖2 基于LSTM的地表沉降時(shí)序預(yù)測框架Fig.2 Prediction framework of land subsidence time series based on LSTM
1.2.1 數(shù)據(jù)預(yù)處理
時(shí)間序列分析法是根據(jù)序列過去的變化趨勢來預(yù)測未來的發(fā)展變化,因此事物的發(fā)展需具備一定的持續(xù)性[19]。為確定最優(yōu)的序列長度,獲取高質(zhì)量的訓(xùn)練樣本,對累計(jì)或差分沉降量時(shí)間序列(下稱“沉降時(shí)序”)進(jìn)行預(yù)處理。首先將每個觀測點(diǎn)的沉降時(shí)序記為Dm={d1,d2,…,dm},則每個沉降時(shí)序中可提取出一個長度為可控參數(shù)L的訓(xùn)練樣本,記為Dtrain={dm-L,dm-L+1…,dm-1},其中,樣本的后Y個數(shù)值用作樣本標(biāo)簽,前(L-Y)個數(shù)值用作樣本輸入,且滿足約束條件2≤L (6) (7) 式中,m-L≤t≤m-1,t∈N。 圖3 單個沉降時(shí)序中的樣本劃分Fig.3 Sample division in single settlement time series 1.2.2 網(wǎng)絡(luò)訓(xùn)練 網(wǎng)絡(luò)訓(xùn)練主要以隱藏層為研究對象。從圖2可以看出,隱藏層包含(L-1)個依次連接的同構(gòu)LSTM細(xì)胞單元,經(jīng)過每個細(xì)胞單元的模型輸出可以表示為 Ot=LSTMforward(Xt,Ht-1,ct-1) (8) (9) 本文選用文獻(xiàn)[20]提出的適應(yīng)性動量估計(jì)(adaptive moment estimation,ADAM)算法作為優(yōu)化器。該算法融合了AdaGrad[21](adaptive gradient algorithm)和RMS Prop[22](root mean square Prop)算法的優(yōu)勢,能夠?qū)Σ煌瑓?shù)計(jì)算適應(yīng)性學(xué)習(xí)率并且占用較少的存儲資源。與其他隨機(jī)優(yōu)化方法相比,ADAM算法在實(shí)際應(yīng)用中整體表現(xiàn)更優(yōu)[20]。設(shè)定損失函數(shù)最小為優(yōu)化目標(biāo),給定樣本分割長度L、網(wǎng)絡(luò)層數(shù)K、隱藏層節(jié)點(diǎn)數(shù)S、學(xué)習(xí)率l以及訓(xùn)練次數(shù)epochs,不斷更新網(wǎng)絡(luò)權(quán)重,進(jìn)而得到訓(xùn)練好的預(yù)測模型。 在構(gòu)建上述LSTM預(yù)測模型中,涉及眾多網(wǎng)絡(luò)參數(shù),其中以樣本劃分長度L、網(wǎng)絡(luò)層數(shù)K和每層LSTM隱藏層的特征數(shù)量S最為關(guān)鍵[17]。為了達(dá)到更好的預(yù)測效果,本文采用多層網(wǎng)格搜索的方法對這3個參數(shù)進(jìn)行優(yōu)選。以平均預(yù)測精度最高作為參數(shù)優(yōu)選的依據(jù),即預(yù)測樣本的沉降量預(yù)測誤差ε(Y,Ypred)最小,目標(biāo)函數(shù)可以表示為 minε(Y,Ypred)=|Ypred-Y| (10) 式中,stepL、stepK和stepS分別為對應(yīng)參數(shù)的網(wǎng)格搜索步長;L、K和S這3個參數(shù)構(gòu)成了一個三維搜索空間,可以通過多層網(wǎng)格搜索算法獲取最優(yōu)參數(shù)組合。搜索過程主要包括3層,從內(nèi)到外分別對L、K和S進(jìn)行網(wǎng)格搜索。固定上述參數(shù)以外的其他超參數(shù)設(shè)置,包括迭代次數(shù)、批數(shù)等,根據(jù)式(10)預(yù)設(shè)3個參數(shù)的取值范圍,其中,網(wǎng)格搜索范圍i與Smax需要根據(jù)預(yù)測效果由人為經(jīng)驗(yàn)設(shè)定,m表示沉降時(shí)間序列長度。此外,學(xué)習(xí)率l也是模型訓(xùn)練過程中影響較大的參數(shù),當(dāng)學(xué)習(xí)率較高時(shí),損失函數(shù)收斂較快,反之,損失收斂較慢。研究表明,隨著損失函數(shù)收斂情況做動態(tài)調(diào)整的學(xué)習(xí)率可以使模型得到更好的預(yù)測結(jié)果,因此,本文試驗(yàn)中采用衰減學(xué)習(xí)率的方式,將學(xué)習(xí)率按照實(shí)際效果每迭代20次乘以一個0.1的衰減系數(shù)。 1.2.3 網(wǎng)絡(luò)預(yù)測 Ypred{y1,y2,…,yn} (11) 式中,Ypred表示模型對不同高相干點(diǎn)預(yù)測結(jié)果的集合。最后,通過計(jì)算網(wǎng)絡(luò)訓(xùn)練及網(wǎng)絡(luò)預(yù)測過程中輸出結(jié)果Ypred與真實(shí)樣本標(biāo)簽Y的偏差,定量地給出模型訓(xùn)練和預(yù)測的精度。具體表示為 (12) (13) (14) 式中,μ表示模型平均預(yù)測精度;MAE表示平均絕對誤差;MAP表示平均實(shí)際沉降量。 為驗(yàn)證本文方法與現(xiàn)有時(shí)間序列預(yù)測方法相比所具有的優(yōu)勢,將LSTM模型與傳統(tǒng)的時(shí)間序列預(yù)測模型、機(jī)器學(xué)習(xí)模型進(jìn)行試驗(yàn)對比,選擇模型建立時(shí)間與預(yù)測誤差作為評價(jià)指標(biāo)。為降低時(shí)間成本,試驗(yàn)數(shù)據(jù)采用統(tǒng)一的數(shù)據(jù)源(見后文)。 對于傳統(tǒng)的時(shí)間序列預(yù)測模型,選擇二次指數(shù)平滑(second exponential smoothing method,SES)、自回歸移動平均(autoregressive integrated moving average,ARIMA)、多元線性回歸(multiple linear regression,MLR)模型進(jìn)行試驗(yàn)對比。其中,二次指數(shù)平滑法是一種能夠處理含有趨勢性成分的時(shí)間序列分析方法[23],平滑指數(shù)α的取值大小決定了序列前期實(shí)際沉降值與預(yù)期值對本期預(yù)測值的影響;自回歸移動平均法是時(shí)間序列分析中應(yīng)用最廣泛的模型之一[24],模型可以表示為ARIMA(p,d,q),其中p、d、q分別為自回歸項(xiàng)數(shù)、差分次數(shù)、移動平均項(xiàng)數(shù)[25]。這3個參數(shù)通??梢酝ㄟ^觀測自相關(guān)函數(shù)和偏自相關(guān)函數(shù)確定。該方法不直接考慮其他相關(guān)隨機(jī)變量的變化。此外,多元線性回歸也是一種廣泛應(yīng)用于預(yù)測任務(wù)的多因素分析方法[26]。在實(shí)際問題中,一個因變量往往受到多個自變量的影響,因此,多元的回歸分析成了時(shí)間序列預(yù)測中受歡迎的方法。 對于機(jī)器學(xué)習(xí)模型,本文選擇經(jīng)典的支持向量回歸(support vector regression,SVR)模型作為代表。該方法的思想是通過一個非線性核函數(shù)將多維輸入映射到更高維度的特征空間后執(zhí)行回歸運(yùn)算,進(jìn)而得到與輸出指標(biāo)對應(yīng)的非線性映射關(guān)系。在回歸模型中,不同的核函數(shù)對擬合的結(jié)果會有較大的影響。本文選擇常用的高斯徑向基函數(shù)作為非線性核函數(shù),本文采用Matlab2016中的支持向量回歸工具箱完成該方法的預(yù)測試驗(yàn),模型中懲罰參數(shù)C與核函數(shù)參數(shù)g通過交叉驗(yàn)證法求取最優(yōu)設(shè)置。 選取近年來地表沉降現(xiàn)象嚴(yán)重的滄州地區(qū)[27]為研究區(qū)域。以2017年1月至2019年12月獲取的80期Sentinel-1A影像為遙感數(shù)據(jù)源,采用自主研發(fā)的多主影像相干目標(biāo)小基線(multiple master-image coherent target small-baseline interferometric SAR,MCTSB-InSAR)技術(shù)[28]開展前期數(shù)據(jù)準(zhǔn)備工作。最終反演得到430 476個高相干點(diǎn)的沉降時(shí)序,其中每個觀測點(diǎn)位擁有80個形變記錄。為驗(yàn)證InSAR測量結(jié)果的可靠性和精確性,采用滄州地區(qū)國家二等水準(zhǔn)數(shù)據(jù)進(jìn)行對比驗(yàn)證。結(jié)果表明,本文數(shù)據(jù)源的反演結(jié)果精度為7.2 mm,足以支持本項(xiàng)研究[29]。Sentinel-1A影像時(shí)空基線參數(shù)如表1所示。對時(shí)間基線序列的平穩(wěn)性檢驗(yàn)結(jié)果表明,一階差分后的時(shí)間間隔是平穩(wěn)的,因此忽略了非等時(shí)間間隔對預(yù)測誤差的影響。 表1 Sentinel-1A影像時(shí)空基線參數(shù) 采用上述形變反演結(jié)果,對每個觀測點(diǎn)的沉降時(shí)序進(jìn)行了預(yù)處理,共得到容量為430 476的訓(xùn)練樣本。根據(jù)實(shí)際訓(xùn)練情況,本文中i與Smax分別設(shè)定為7與100時(shí)足以發(fā)現(xiàn)最優(yōu)的網(wǎng)絡(luò)參數(shù)。首先通過網(wǎng)格搜索算法分析了樣本輸入、輸出長度對預(yù)測效果的影響。圖4為不同樣本劃分方式下的預(yù)測結(jié)果,其中,網(wǎng)絡(luò)層數(shù)設(shè)置為3,隱藏層神經(jīng)元數(shù)量設(shè)置為30。平均絕對誤差熱力圖表明:隨著輸出序列長度的增加,不同樣本輸入長度下的模型誤差均有所升高,其中,每個網(wǎng)格數(shù)據(jù)表示對應(yīng)樣本劃分形式下多步預(yù)測的平均預(yù)測誤差。圖5進(jìn)一步表示了對多步預(yù)測結(jié)果的誤差分析。篇幅所限,僅以輸入序列長度為60、預(yù)測序列長度為6示例。折線圖表明:隨著預(yù)測序列時(shí)間軸的推移,相應(yīng)時(shí)刻的各項(xiàng)誤差均有所降低,但對于同一時(shí)刻的預(yù)測結(jié)果,相同樣本情況下單步預(yù)測的誤差更低。在Radarset 2影像數(shù)據(jù)中發(fā)現(xiàn)了相同的規(guī)律,因此,受折線圖與熱力圖中的顯著趨勢的啟發(fā),本文在網(wǎng)絡(luò)構(gòu)建中優(yōu)先采用單步預(yù)測方式。 圖4 樣本劃分長度與平均預(yù)測誤差的網(wǎng)格搜索結(jié)果(K=30,S=3)Fig.4 Grid search results of sample parameters and mean absolute error(K=30,S=3) 圖5 單步預(yù)測與多步預(yù)測中不同時(shí)刻的各項(xiàng)誤差表現(xiàn)(L=66,Y1=6,Y2=1)Fig.5 Error performance of different time in single step prediction and multi-step prediction(L=66,Y1=6,Y2=1) 本文進(jìn)一步分析了單步預(yù)測中不同網(wǎng)絡(luò)參數(shù)下的預(yù)測效果。由于LSTM網(wǎng)絡(luò)可以學(xué)習(xí)長距離的時(shí)間序列數(shù)據(jù),因此,盡可能取較大的樣本長度以獲取更好的預(yù)測效果(L=79)。分析不同參數(shù)設(shè)置下的結(jié)果可以發(fā)現(xiàn),模型預(yù)測精度并非一直與模型復(fù)雜程度正相關(guān),而是在局部存在較優(yōu)的組合,當(dāng)網(wǎng)格搜索范圍固定時(shí),最優(yōu)參數(shù)的分布趨向于一致。為充分挖掘樣本長度對模型預(yù)測效果的影響,本文進(jìn)而用累計(jì)沉降及差分沉降兩種數(shù)據(jù)對不同樣本長度下的單步預(yù)測結(jié)果進(jìn)行了分析。從圖6可知,隨著訓(xùn)練樣本長度的增加,網(wǎng)格搜索局部最小預(yù)測誤差均逐漸降低。此外,兩種沉降數(shù)據(jù)之間的預(yù)測誤差差異反映了LSTM模型更擅長對平穩(wěn)沉降時(shí)序進(jìn)行預(yù)測。值得注意的是,差分沉降數(shù)據(jù)在輸入長度大于42以后預(yù)測誤差逐漸提高。這表明并非輸入時(shí)序長度越長效果越好,很可能較遠(yuǎn)時(shí)刻的沉降信息對當(dāng)前時(shí)刻的預(yù)測存在可忽略的關(guān)聯(lián),一味地輸入較長時(shí)序反而引入了一定的噪聲誤差。 圖6 訓(xùn)練樣本長度與平均預(yù)測誤差的關(guān)系(K=3,S=40)Fig.6 Relationship between training sample length and average prediction error (K= 3,S= 40) 基于上述試驗(yàn)分析,最終確定LSTM預(yù)測模型參數(shù)組合如表2所示。 表2 最優(yōu)模型參數(shù)組合搜索結(jié)果 在上述參數(shù)設(shè)置下,對滄州地區(qū)地表沉降的預(yù)測試驗(yàn)取得了非常好的效果。差分(累計(jì))形變量平均絕對誤差可控制在0.3 mm以內(nèi),完全滿足現(xiàn)有InSAR數(shù)據(jù)處理規(guī)范的精度要求[29]。 圖7從整幅影像的尺度展示了對滄州地區(qū)的沉降預(yù)測結(jié)果。結(jié)合真實(shí)形變的大尺度表達(dá),可以發(fā)現(xiàn)本文的預(yù)測結(jié)果與真實(shí)形變高度吻合,沉降漏斗顯示清晰且大部分高相干的預(yù)測誤差在±0.5 mm以內(nèi)。算法運(yùn)行結(jié)果顯示,430 476個觀測點(diǎn)中,最大差分(累計(jì))形變量預(yù)測誤差為8.81 mm,平均預(yù)測精度達(dá)到67.4%,相關(guān)指標(biāo)的計(jì)算方法表示為式(12)。因此,本文提出的模型預(yù)測結(jié)果與實(shí)際沉降量相比偏差較小,能夠反映地表沉降隨時(shí)間變化的基本規(guī)律,預(yù)測結(jié)果具有足夠的可信度。 圖7 滄州地區(qū)差分形變的預(yù)測結(jié)果Fig.7 Prediction results of differential deformation in cangzhou area 對于本文并列分析的其余4種預(yù)測方法,均采用網(wǎng)格搜索法尋找了最優(yōu)的參數(shù)設(shè)置,并詳細(xì)記錄了模型的運(yùn)行時(shí)間以及預(yù)測誤差,具體參數(shù)設(shè)置及預(yù)測效果見表3。 從表3可以看出,相比前3種基于數(shù)理模型的預(yù)測方法,在預(yù)測效果方面,LSTM模型的(差分)累計(jì)沉降量平均預(yù)測誤差在0.3 mm以內(nèi),預(yù)測標(biāo)準(zhǔn)差及均方誤差也一致低于傳統(tǒng)時(shí)序預(yù)測方法,表明本文基于深度學(xué)習(xí)的預(yù)測模型精度高且具有較好的穩(wěn)健性。其中,ARIMA模型需要對每一個高相干點(diǎn)的沉降時(shí)序進(jìn)行一次建模,在參數(shù)優(yōu)化時(shí)由于需要大量的時(shí)間成本(表3中該方法的建模時(shí)間為抽樣預(yù)估值),并不適合應(yīng)用到大范圍的地表沉降預(yù)測中。而相比作為機(jī)器學(xué)習(xí)代表的SVR模型,本文方法在建模時(shí)間上降低了89.6%,平均絕對誤差降低了67.4%,在各項(xiàng)評價(jià)指標(biāo)上均具有更好的表現(xiàn)。分析上述試驗(yàn)結(jié)果可知,基于LSTM的大區(qū)域地表沉降預(yù)測方法精度較高,時(shí)間成本較低,是一種更為滿足生產(chǎn)安全需求的方法。 表3 不同預(yù)測模型的試驗(yàn)結(jié)果對比 InSAR時(shí)間序列分析對于揭示宏觀的地表形變格局、分異性及其演化規(guī)律提供了重要參考,而單個高相干點(diǎn)的預(yù)測結(jié)果意義并不大[30]。為探索本文時(shí)序預(yù)測模型的有效性,利用ArcGIS等工具對預(yù)測結(jié)果及歷史沉降信息的空間統(tǒng)計(jì)特性進(jìn)行對比分析。對于時(shí)序預(yù)測結(jié)果間存在的空間自相關(guān)、分層異質(zhì)、空間格局等特性,分別采用經(jīng)典的Moran’s I、Getis-Ord Gi*、q-統(tǒng)計(jì)、最鄰近指數(shù)NNI等指標(biāo)來衡量。結(jié)果表明,本文方法的預(yù)測結(jié)果并未顯著改變歷史沉降的空間統(tǒng)計(jì)特性,即仍然保持了原始InSAR反演結(jié)果的形變格局,這從空間上確保了深度學(xué)習(xí)方法在地表沉降預(yù)測上的可行性。詳細(xì)的空間分析結(jié)果如表4所示。 表4 時(shí)序預(yù)測結(jié)果的空間特性變化分析 本文通過構(gòu)建LSTM深度循環(huán)神經(jīng)網(wǎng)絡(luò),將深度學(xué)習(xí)引入到地表沉降預(yù)測領(lǐng)域,實(shí)現(xiàn)了高精度、高時(shí)效的沉降預(yù)測。試驗(yàn)結(jié)果表明: (1) 本文提出的沉降預(yù)測模型累計(jì)沉降量預(yù)測誤差在0.3 mm以內(nèi),能夠在138 s以內(nèi)完成40余萬觀測點(diǎn)的單步預(yù)測。相比傳統(tǒng)回歸預(yù)測方法,本文方法具有精度高、用時(shí)少的顯著優(yōu)勢。 (2) 基于LSTM的沉降預(yù)測方法能夠有效保持地表形變空間格局,對空間相關(guān)性、分層異質(zhì)、空間點(diǎn)格局等方面的分析結(jié)果驗(yàn)證了本文方法的有效性與可行性。 (3) 采用單一變量預(yù)測地表沉降避免了數(shù)據(jù)源信息不充分的困難,相比其他機(jī)器學(xué)習(xí)方法,本文方法能夠在沉降驅(qū)動因素?cái)?shù)據(jù)短缺的情況下得到更高精度的預(yù)測結(jié)果。 總的來說,本文驗(yàn)證了LSTM模型在地表沉降預(yù)測領(lǐng)域中的適用性,擴(kuò)展了深度學(xué)習(xí)技術(shù)的應(yīng)用范疇。研究結(jié)果表明,基于LSTM的地表沉降預(yù)測模型得到了優(yōu)異的結(jié)果,對于生產(chǎn)安全防范具有重要意義。基于目前的工作,后續(xù)將展開進(jìn)一步研究,如考慮空間相關(guān)性對地表沉降預(yù)測的影響,得到解釋能力更強(qiáng)的預(yù)測結(jié)果。1.3 對比預(yù)測模型
2 滄州地區(qū)地表沉降預(yù)測結(jié)果與分析
2.1 數(shù)據(jù)源
2.2 試驗(yàn)結(jié)果
2.3 方法對比
2.4 空間分析
3 結(jié) 論