侯回位,鄭東健,劉永濤,黃寒冰
(河海大學(xué)水利水電學(xué)院,江蘇 南京 210098)
變形是壩體結(jié)構(gòu)受到多種環(huán)境荷載的作用以及自身材料性能的影響而不可避免發(fā)生的物理偏移,能夠最直接可靠地反映混凝土壩的工作性態(tài),是衡量壩體結(jié)構(gòu)安全的重要指標(biāo)[1-3]。因此,有必要根據(jù)混凝土壩變形監(jiān)測資料建立精準(zhǔn)、高效的預(yù)測模型,及時(shí)有效地掌握壩體結(jié)構(gòu)的變形狀態(tài),預(yù)測未來的變形趨勢,為工程長期預(yù)報(bào)和安全決策提供依據(jù)[4]。
常用于混凝土壩變形監(jiān)控的模型有統(tǒng)計(jì)模型、確定性模型和混合模型[5]等,其中統(tǒng)計(jì)模型[6]因其函數(shù)表達(dá)式簡單,模型結(jié)構(gòu)易識別的特點(diǎn)被廣泛地應(yīng)用于混凝土壩安全監(jiān)控領(lǐng)域中。然而,傳統(tǒng)的統(tǒng)計(jì)模型對復(fù)雜的非線性關(guān)系考慮不足,對多重共線性問題不敏感[7],其預(yù)測精度較差且缺乏相應(yīng)的外延預(yù)報(bào)能力。近年來,隨著人工智能算法的迅速發(fā)展,神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)[8]等機(jī)器學(xué)習(xí)算法也被運(yùn)用到混凝土壩的變形預(yù)報(bào)工作中。賈強(qiáng)強(qiáng)等[9]利用基于小生境技術(shù)改進(jìn)的思維進(jìn)化算法來加快BP神經(jīng)網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值的搜索,以避免陷入局部最優(yōu);錢秋培等[10]將支持向量機(jī)和粒子群算法相結(jié)合,建立的預(yù)測模型能很好地考慮多種環(huán)境因素的非線性相關(guān),具有不錯的預(yù)測精度。這些機(jī)器學(xué)習(xí)算法雖然在提升模型預(yù)測精度上有所提高,但由于混凝土壩變形的時(shí)間序列非平穩(wěn)、非線性特點(diǎn),也存在著不足,首先BP、SVM模型均屬于靜態(tài)的前饋非循環(huán)模型,對隨時(shí)間動態(tài)變化的混凝土壩變形監(jiān)測序列預(yù)測的能力有所欠缺,未能考慮時(shí)序信息在時(shí)間維度上的關(guān)聯(lián)性,而長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[11-13]是一種深度神經(jīng)網(wǎng)絡(luò)模型,能夠平衡數(shù)據(jù)的時(shí)序性與非線性關(guān)系,考慮時(shí)序信息重要程度的變化,適合對動態(tài)非線性的時(shí)間序列進(jìn)行擬合預(yù)測;其次混凝土壩變形序列的非平穩(wěn)性對于模型的構(gòu)建及其泛化能力的強(qiáng)弱有著較大影響,上述模型均未把變形序列的非平穩(wěn)性納入考慮,而EEMD作為一種非平穩(wěn)數(shù)據(jù)處理方法[14],能夠根據(jù)其本身的特性,將其分解成多個平穩(wěn)的數(shù)據(jù)序列。
基于此,本文利用EEMD來把非平穩(wěn)的混凝土壩變形序列分解為多個平穩(wěn)的子序列,同時(shí)考慮到各子序列之間的相關(guān)性,采用樣本熵理論[15-17]對各子序列進(jìn)行重構(gòu)處理,并選用基于記憶架構(gòu)的LSTM來保證模型的預(yù)測能力,構(gòu)建一種EEMD-SE-LSTM組合模型應(yīng)用于混凝土壩的變形預(yù)報(bào)中,并以某混凝土拱壩實(shí)測數(shù)據(jù)進(jìn)行算例分析。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是一種自適應(yīng)信號時(shí)頻處理方法,特別適合非平穩(wěn)信號的分析處理。EMD可以將原始信號分解成一系列本征模態(tài)分量IMF,但得到的IMF分量通常會出現(xiàn)尺度混合現(xiàn)象,這會造成IMF分量的不精確,而集成經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)通過往原始信號加入白噪聲很好地避開了EMD分解時(shí)的尺度混合問題[18],由于零均值噪聲的特性,噪聲經(jīng)過多次的平均計(jì)算后會相互抵消,這樣集成均值的計(jì)算結(jié)果就可以直接視作最終結(jié)果,其基本原理如下。
a.將N個等長白噪聲信號wi(t)加入原始信號X(t),即
Xi(t)=X(t)+wi(t)
(1)
b.對新信號Xi(t)進(jìn)行EMD分解,得到各階IMF分量:
(2)
c.利用白噪聲頻譜均值為零的特點(diǎn),將上述各分量求均值得到最終的分解結(jié)果如下:
(3)
(4)
式中:Xi(t)為第i次加入白噪聲后的信號;wi(t)為第i次加入的白噪聲;Cij(t)為第i次加入白噪聲后分解出的第j個IMF分量;Ri(t)為第i次加入白噪聲后分解得到的殘余分量;m為每次分解得到的IMF分量個數(shù);Cj(t)為集成平均后的第j個IMF分量;R(t)為最終殘余分量。
將原始變形序列經(jīng)EEMD分解成若干個IMF分量后,為了能減小模型的計(jì)算量,考慮各IMF分量間的相關(guān)性,挖掘出同類序列的特征,引入樣本熵的概念,對這些IMF分量采用樣本熵估值后重構(gòu)。樣本熵作為一種時(shí)間序列復(fù)雜性的度量方法,其目的是檢測時(shí)間序列中新的子序列產(chǎn)生概率?,F(xiàn)假設(shè)一長度為L的時(shí)間序列x={x1,x2,…,xL},按序號組成一組維數(shù)為m的向量序列{Xm,1,Xm,2,…,Xm,L-m+1},其中Xm,i={xi,xi+1,…,xi+m-1},這些向量表示從第i點(diǎn)開始的m個連續(xù)的x的值;定義向量Xm,i與Xm,j之間的距離d[Xm,i,Xm,j]為兩者對應(yīng)元素中最大差值的絕對值;對于給定的Xm,i,統(tǒng)計(jì)Xm,i與Xm,j之間距離小于或等于容限r(nóng)的j(1≤j≤L-m,j≠i)的數(shù)目,并記作Bi。對于1≤i≤L-m,定義
(5)
(6)
再把維數(shù)增加到m+1,重復(fù)上面的步驟得到:
(7)
式中Ai為向量Xi與Xj在m+1維時(shí)滿足容限要求的總個數(shù)。
同理,定義兩序列在匹配m+1個點(diǎn)的概率Am(r)的計(jì)算式:
(8)
因此,樣本熵定義如下:
(9)
當(dāng)L為有限值時(shí),用下式來估計(jì):
(10)
式中:m為維數(shù),常取值為1或2;r表示相似度閾值,通常取原始序列的10%~25%的標(biāo)準(zhǔn)差。本文選取的維數(shù)是m=2,以原始序列標(biāo)準(zhǔn)差的20%作為容限r(nóng)的取值。
對經(jīng)樣本熵重構(gòu)后的分量建立LSTM模型,充分考慮歷史有效信息的影響,以提高變形預(yù)測的精度。
LSTM模型是一種特殊的遞歸循環(huán)神經(jīng)網(wǎng)絡(luò)模型,通過引入“門”的機(jī)制,采用記憶單元來代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò)隱含層的神經(jīng)單元,用于解決梯度消失或爆炸問題,從而使得網(wǎng)絡(luò)可以學(xué)習(xí)長期依賴信息。其記憶單元結(jié)構(gòu)如圖1所示,核心思想是引入細(xì)胞狀態(tài)的連接,然后使用遺忘門、輸入門和輸出門等結(jié)構(gòu)來控制細(xì)胞狀態(tài),實(shí)現(xiàn)信息的添加或刪除。
圖1 LSTM記憶單元結(jié)構(gòu)
遺忘門的作用是控制細(xì)胞狀態(tài)中信息的取舍:
ft=σ(Wfxt+Ufht-1+bf)
(11)
輸入門的作用是更新細(xì)胞狀態(tài)中的信息:
it=σ(Wixt+Uiht-1+bi)
(12)
(13)
輸出門控制著哪些信息需要輸出:
ot=σ(Woxt+Uoht-1+bo)
(14)
(15)
ht=ottanhCt
(16)
式中:ft、it、ot分別為遺忘門、輸入門與輸出門;Wf、Uf為遺忘門的權(quán)重系數(shù);Wi、Wc、Ui、Uc為輸入門的權(quán)重系數(shù);Wo、Uo為輸出門的權(quán)重系數(shù);bf為遺忘門的偏置系數(shù);bi、bc為輸入門的偏置系數(shù);bo為輸出門的偏置系數(shù);Ct、ht分別為t時(shí)刻細(xì)胞狀態(tài)和隱藏單元狀態(tài),σ為sigmoid激活函數(shù),取值范圍為[0,1];tanh為雙曲正切激活函數(shù),取值范圍為[-1,1]。
結(jié)合各方法的優(yōu)勢,構(gòu)建EEMD-SE-LSTM混凝土壩變形預(yù)測模型,從更加全面的角度來提高混凝土壩的變形預(yù)測精度,其流程如下:
步驟1利用EEMD把混凝土壩的原始變形序列X(t)分解為多個平穩(wěn)的子序列。
X(t)=X1(t)+X2(t)+…+Xk(t)+R(t)
(17)
式中k為分解出的子序列個數(shù)。
步驟2計(jì)算各子序列、余量R以及原始序列X(t)的樣本熵,當(dāng)分量樣本熵大于原始序列樣本熵時(shí),對其不作處理,當(dāng)分量小于原始序列樣本熵時(shí),對其進(jìn)行合并,得到重構(gòu)后的分量。
X(t)=C1(t)+C2(t)+…+Cp(t)
(18)
步驟3確定各重構(gòu)分量的時(shí)間階數(shù),即用當(dāng)前時(shí)刻前多少期的歷史數(shù)據(jù)來作為網(wǎng)絡(luò)模型的輸入來進(jìn)行訓(xùn)練與預(yù)測。
(19)
式中p為重構(gòu)后的子序列個數(shù)。
選取均方根誤差(RMSE)和平均絕對誤差(MAE)作為模型預(yù)測效果的評判標(biāo)準(zhǔn)。
以某混凝土拱壩為例,由于該壩岸坡壩段基礎(chǔ)周圍的地質(zhì)條件比較差,有必要對該處測點(diǎn)進(jìn)行監(jiān)控以分析對壩體變形的影響,故選取岸坡壩段某正垂測點(diǎn)的壩體變形監(jiān)測資料作為樣本來進(jìn)行建模分析,分析時(shí)段取為2013年5月1日至2019年4月30日。原始數(shù)據(jù)采樣的間距為1 d,但由于實(shí)際觀測過程中會存在一些數(shù)據(jù)的缺失,無法形成連續(xù)的逐日序列,現(xiàn)將取樣的時(shí)間分辨率調(diào)整為5 d。對每個5 d的數(shù)據(jù)取平均值,第一個5 d為2013年5月1—6日,依次往下,構(gòu)成序列。
針對原始數(shù)據(jù)的非平穩(wěn)特性,用EEMD對數(shù)據(jù)進(jìn)行特征分解,分解時(shí)加入白噪聲組數(shù)為300組,噪聲誤差為0.2,分解結(jié)果如圖2所示??梢钥闯?,原始序列被分解成了7個本征模態(tài)分量和1個殘余分量,各個尺度的特征被很好地從原始序列中分解出來。
圖2 EEMD分解出的分量
計(jì)算各分量以及原始序列的樣本熵值,依照樣本熵值對各分量進(jìn)行重構(gòu),各序列樣本熵值得到X1~X7樣本熵值分別為1.790、0.976、0.566、0.304、0.065、0.035和0.031,原始序列樣本熵值為0.268。前4個分量的熵值均大于原始序列的熵值,所以不對其進(jìn)行合并;后4個分量的熵值小于原始序列熵值且復(fù)雜度差異也很小,對其進(jìn)行重構(gòu)合并,重構(gòu)后的分量見圖3。
圖3 樣本熵重構(gòu)后的分量
時(shí)間階數(shù)的選擇會直接影響到模型的預(yù)測結(jié)果,當(dāng)其過大時(shí),會增加計(jì)算量,過小又會導(dǎo)致信息重合?;诖?,利用相關(guān)研究成果[19-23],分析各分量序列的相關(guān)性,計(jì)算其自相關(guān)系數(shù),當(dāng)相關(guān)系數(shù)大于0.8時(shí),認(rèn)為具有較強(qiáng)的關(guān)聯(lián),再根據(jù)具有強(qiáng)相關(guān)性時(shí)的滯后期數(shù)來確定時(shí)間階數(shù)。經(jīng)計(jì)算,時(shí)間階數(shù)確定為2。
對每個重構(gòu)分量建立LSTM預(yù)測模型,由于時(shí)間階數(shù)確定為2,因此以第1、2組的歷史變形量作為輸入,來預(yù)測第3組的變形,然后以第2、3組的變形來預(yù)測第4組的變形,依次對后續(xù)變形值進(jìn)行預(yù)測。
為驗(yàn)證EEMD-SE-LSTM模型在混凝土壩變形預(yù)測中的有效性和優(yōu)越性,將其預(yù)測效果與EMD-LSTM、LSTM、SVM等模型進(jìn)行對比。
a.通過改變訓(xùn)練集的長度來分析各模型對時(shí)間序列的整體感知力,模型的預(yù)測結(jié)果見表1。隨著訓(xùn)練集長度的增加,EEMD-SE-LSTM與LSTM模型的預(yù)測精度越來越高,這說明模型具有良好的時(shí)間序列感知力,能夠從較長的訓(xùn)練集中提取更多的有效信息以提高預(yù)測精度,但LSTM模型有滯后效應(yīng),導(dǎo)致預(yù)測誤差都比較大。而EMD-LSTM與SVM模型的預(yù)測精度在訓(xùn)練集長度占比小于80%時(shí)都有一定程度的提高,但在長度占比達(dá)90%時(shí),精度卻有所下降,說明兩模型的時(shí)間序列感知力存在局限性。在同一訓(xùn)練集長度下,EEMD-SE-LSTM模型的預(yù)測精度最高,驗(yàn)證了其在混凝土壩變形預(yù)測中的優(yōu)越性。
b.為更直觀體現(xiàn)模型的預(yù)測效果,以訓(xùn)練集長度占比為70%的情況為例進(jìn)行分析。從圖4看出,SVM模型的預(yù)測效果較差,可能是SVM模型不能很好地挖掘時(shí)序在時(shí)間維度上的關(guān)聯(lián)性;LSTM模型的預(yù)測出現(xiàn)滯后現(xiàn)象,雖然擬合曲線貼近實(shí)測曲線,但可信度較低;EMD使得LSTM的滯后效應(yīng)減弱,但其分解時(shí)尺度混合的影響降低了模型的預(yù)測精度;EEMD作為EMD的改進(jìn),降低了尺度混合對分解的影響,提高了模型的預(yù)測精度。
圖4 各模型預(yù)測結(jié)果
圖5是各模型預(yù)測殘差對比,可以看出EEMD-SE-LSTM模型的預(yù)測殘差相較于其他模型基本在±0.5 mm范圍波動,這表明EEMD-SE-LSTM模型預(yù)測的精確性和平穩(wěn)性都更高。由表2可知,EEMD-SE-LSTM模型的RMSE與MAE相較于其他模型都有顯著地減小,其中RMSE分別降低了15.87%、44.79%與55.08%,MAE分別降低了11.32%、40.51%與54.81%,這表明EEMD-SE-LSTM模型很
圖5 各模型預(yù)測殘差對比
模型RMSE/mmMAE/mmEEMD-SE-LSTM0.530.47EMD-LSTM0.630.53LSTM0.960.79SVM1.181.04
好地提高了變形預(yù)測的精度。
a.通過橫向比較,EEMD-SE-LSTM模型能夠更好地?cái)M合混凝土壩變形監(jiān)測序列,充分考慮變形序列在時(shí)間上的關(guān)聯(lián)性,預(yù)測精度高,魯棒性強(qiáng)。
b.通過縱向比較,EEMD-SE-LSTM模型有效地減弱了LSTM模型的滯后效應(yīng),這使得模型的預(yù)測具有更高的可信度及可靠性,同時(shí)EMD分解時(shí)的尺度混合問題也得到了解決,明顯地提高了預(yù)測精度,從而在大壩管理上的應(yīng)用及可操作性更強(qiáng)。
c.通過不同訓(xùn)練集長度下模型預(yù)測效果的比較,EEMD-SE-LSTM模型能從更長的訓(xùn)練集中提取更多的有效信息以達(dá)到更好的預(yù)測效果,具備不錯的時(shí)序感知能力。
d.由于變形受多種因素共同作用,單一考慮歷史效應(yīng)量的影響有所欠缺,在后續(xù)研究中,還需考慮水位、溫度等其他環(huán)境量的影響。