摘要:為有效預(yù)測堤防沉降,利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對沉降數(shù)據(jù)進(jìn)行處理,提取不同頻率成分的特征序列;再通過循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),結(jié)合注意力機(jī)制,對重構(gòu)后的長時(shí)間序列數(shù)據(jù)進(jìn)行建模,針對不同輸入時(shí)長的數(shù)據(jù)進(jìn)行篩選和分析,以確定最佳的輸入時(shí)長,從而捕捉沉降過程中的時(shí)間依賴性和關(guān)鍵特征。以萬頃沙聯(lián)圍北界河水閘至中山界外江堤防綜合整治工程的沉降數(shù)據(jù)為例,對所提方法進(jìn)行驗(yàn)證。結(jié)果表明:該案例的最優(yōu)輸入步長為3,在此情況下,模型的均方誤差為0.60,平均絕對誤差為0.59,優(yōu)于傳統(tǒng)的SVM和BPNN方法,有效提升了堤防沉降預(yù)測的準(zhǔn)確性與可靠性。該方法可為類似城市基礎(chǔ)設(shè)施維護(hù)和管理提供參考。
關(guān)鍵詞:經(jīng)驗(yàn)?zāi)B(tài)分解(EMD); 本征模態(tài)函數(shù); 堤防; 沉降預(yù)測
中圖法分類號(hào):TV871;TV698.1
文獻(xiàn)標(biāo)志碼:A
DOI:10.15974/j.cnki.slsdkb.2024.09.015
文章編號(hào):1006-0081(2024)09-0085-05
0 引 言
水利填方工程是全球洪水控制和水資源管理系統(tǒng)中至關(guān)重要的基礎(chǔ)設(shè)施。隨著時(shí)間的推移,這些填方工程可能會(huì)發(fā)生沉降,這對其結(jié)構(gòu)完整性和功能性構(gòu)成重大挑戰(zhàn)[1-2]。沉降可能導(dǎo)致堤防的洪水防護(hù)能力減弱、維護(hù)成本增加,并對附近社區(qū)和生態(tài)系統(tǒng)造成風(fēng)險(xiǎn)[3]。為了更好地理解和預(yù)測路基沉降行為,學(xué)術(shù)界和工程領(lǐng)域一直在探索有效的方法。傳統(tǒng)的沉降預(yù)測方法主要依賴于土工試驗(yàn)和現(xiàn)場監(jiān)測等手段[4-7]。然而,這些方法由于試驗(yàn)數(shù)據(jù)的有限性和時(shí)空變化的影響,其預(yù)測精度和可靠性常常受到限制。隨著計(jì)算機(jī)科學(xué)和數(shù)學(xué)建模技術(shù)的不斷進(jìn)步,越來越多的研究開始將機(jī)器學(xué)習(xí)引入路基沉降預(yù)測中[8-9],以期提高預(yù)測的準(zhǔn)確性和普適性。
本文方法的核心在于利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)技術(shù)對沉降數(shù)據(jù)進(jìn)行分解,提取不同頻率成分的特征序列并重構(gòu)成新的序列,通過結(jié)合注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)對重構(gòu)后的長時(shí)間序列數(shù)據(jù)進(jìn)行建模。EMD技術(shù)能夠有效分離沉降數(shù)據(jù)中的噪聲和趨勢成分,而RNN結(jié)合注意力機(jī)制可以捕捉沉降過程中的時(shí)間依賴性和關(guān)鍵特征,從而提高預(yù)測的精度。
1 理論介紹
1.1 經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是一種數(shù)據(jù)分解方法,由Huang等[10]于1998年提出,適用于非線性和非平穩(wěn)信號(hào)的分析。它將信號(hào)分解成多個(gè)固有模態(tài)函數(shù)(intrinsic mode functions,IMF),每個(gè)IMF表示信號(hào)中一個(gè)特定頻率范圍內(nèi)的振蕩模式,這種自適應(yīng)性使得EMD在捕捉信號(hào)中的時(shí)頻特征方面表現(xiàn)出色[11]。EMD的基本原理是將信號(hào)x(t)分解成N個(gè)IMF和一個(gè)殘余項(xiàng),可用式(1)表示:
x(t)=∑Ni=1Ci(t)+r(t)(1)
式中:Ci(t)表示第i個(gè)IMF序列;r(t)表示殘余項(xiàng)。
EMD算法步驟如下:
(1) 尋找極值點(diǎn):在信號(hào)中找到所有極小值點(diǎn)和極大值點(diǎn),構(gòu)建上下包絡(luò)線。
(2) 計(jì)算均值:計(jì)算上下包絡(luò)線的均值。
(3) 得到第一輪分量:用信號(hào)減去均值,得到第一輪分量,即第一個(gè)IMF。
(4) 重復(fù)步驟(1)~(3):將第一輪分量作為新的信號(hào),重復(fù)上述3個(gè)步驟,直至分解出所有IMF。
(5) 得到殘余項(xiàng):在每一輪中計(jì)算殘余項(xiàng),直到得到最終的殘余項(xiàng)。
1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其獨(dú)特之處在于其隱狀態(tài)(hidden state)能夠捕捉序列數(shù)據(jù)中的時(shí)間依賴性。RNN通過在序列的每個(gè)時(shí)間步上重復(fù)使用相同的網(wǎng)絡(luò)單元,使信息可以沿時(shí)間維度傳播,從而能夠?qū)π蛄袛?shù)據(jù)進(jìn)行建模。
RNN的基本原理是利用隱藏層的狀態(tài)作為時(shí)間步之間的信息載體。給定輸入序列X={x1,x2,…,xT},RNN通過以下遞歸公式更新其隱藏狀態(tài)ht和輸出yt:
ht=σ(Whxt+Uhht-1+bh)(2)
yt=φ(Wyht+by)(3)
式中:xt是在時(shí)間步t的輸入;ht是在時(shí)間步t的隱藏狀態(tài);yt 是在時(shí)間步t的輸出;Wh和Uh是權(quán)重矩陣,分別對應(yīng)于輸入和前一個(gè)時(shí)間步的隱藏狀態(tài);Wy是輸出權(quán)重矩陣;bh和by是偏置項(xiàng);σ和φ是激活函數(shù),通常選ReLU。
1.3 自注意力機(jī)制
自注意力機(jī)制(selfattention mechanism)是一種在深度學(xué)習(xí)中廣泛使用的技術(shù),在時(shí)序數(shù)據(jù)分析中,它是通過計(jì)算輸入序列中各個(gè)元素之間的相似性來分配注意力權(quán)重,從而捕捉序列中的重要信息和長距離依賴關(guān)系。由于自注意力機(jī)制能夠靈活地關(guān)注輸入序列中的不同部分,而不受固定窗口大小的限制,可以顯著提高模型的表現(xiàn)。自注意力機(jī)制的基本過程如下。
將輸入序列映射到查詢(Query)、鍵(Key)和值(Value)3個(gè)空間,通過線性變換實(shí)現(xiàn):
Q=XWQK=XWKV=XWV(4)
式中:Q,K,V分別為X輸入矩陣通過WQ,WK,WV線性變換矩陣所得矩陣。
計(jì)算查詢和鍵之間的相似性得分,通常使用點(diǎn)積來衡量,并進(jìn)行縮放:
Attention(Q,K,V)=softmax(QKTdk)V(5)
式中:dk為鍵的維度,dk為縮放因子,用于避免點(diǎn)積值過大。對相似性得分進(jìn)行softmax歸一化,得到注意力權(quán)重,并將這些權(quán)重應(yīng)用到值上,得到最終的輸出。自注意力機(jī)制能夠并行計(jì)算序列中各位置的相似性,捕捉全局信息,適應(yīng)不同長度的序列,避免了傳統(tǒng)RNN遞歸計(jì)算的瓶頸。
1.4 自注意力機(jī)制算法流程
沉降數(shù)據(jù)具有較大的波動(dòng)性與非線性,直接運(yùn)用RNN模型對其預(yù)測效果并不理想,本文的預(yù)測模型流程具體步驟如下,具體見圖1。
(1) 使用EMD對原始沉降序列進(jìn)行自適應(yīng)分解,得到各IMF分量和殘余分量。
(2) 將序列進(jìn)行重構(gòu)得到趨勢項(xiàng)和波動(dòng)項(xiàng)序列,并進(jìn)行歸一化處理。
(3) 按比例將子序列分成訓(xùn)練集和測試集。
(4) 設(shè)定不同輸入步長,利用EMD-RNN-Selfattention模型對子序列進(jìn)行預(yù)測,得到序列的預(yù)測值。
(5) 對不同輸入步長的沉降預(yù)測值進(jìn)行誤差分析,選出最優(yōu)輸入步長。
本文采用均方誤差(Mean Squared Error,MSE)和平均絕對誤差(Mean Absolute Error,MAE)對模型預(yù)測性能進(jìn)行評(píng)價(jià)[12-13],均方誤差越小,說明預(yù)測精度越高;平均絕對誤差則用于評(píng)估模型的平均預(yù)測誤差大小。
2 應(yīng)用實(shí)例
2.1 工程概況
萬頃沙聯(lián)圍北界河水閘至中山界外江堤防綜合整治工程位于廣州市南沙區(qū)下橫瀝水道及蕉門延伸段右岸,工程位置屬橫瀝鎮(zhèn)管轄。整治長度約為4.35 km,整治標(biāo)準(zhǔn)為200 a一遇防洪(潮)標(biāo)準(zhǔn),對應(yīng)堤防工程的級(jí)別為一級(jí)。工程任務(wù)包括防洪(潮)、城市規(guī)劃發(fā)展、環(huán)境美化、宜居休閑等。
萬頃沙聯(lián)圍北界河水閘至中山界外江堤防現(xiàn)狀為土石混合堤,現(xiàn)狀防洪(潮)標(biāo)準(zhǔn)為50 a一遇。堤防普遍采用堤路結(jié)合型式,經(jīng)過多次加固,但堤身和堤基土質(zhì)復(fù)雜,部分堤段強(qiáng)度較低,存在安全隱患。此外,防洪(潮)堤線未完全封閉,部分河道岸線被碼頭、工廠使用,導(dǎo)致堤線不閉合。為了有效監(jiān)測和管理堤防的沉降狀況,在周邊堤防布置了8個(gè)沉降監(jiān)測點(diǎn)(SL1~SL8),如圖2所示,各監(jiān)測點(diǎn)的時(shí)序曲線如圖3所示。
2.2 經(jīng)驗(yàn)?zāi)B(tài)分解結(jié)果
各監(jiān)測點(diǎn)的初始監(jiān)測始于2020年4月7日,每隔一周進(jìn)行一次堤防道路沉降測量,實(shí)際監(jiān)測持續(xù)了181個(gè)周期,共計(jì)1 260 d。圖3展示了SL3監(jiān)測點(diǎn)的原始堤防道路沉降時(shí)間序列。由于原始序列中包含多種不確定信息(如噪聲、震動(dòng)等),導(dǎo)致模型復(fù)雜度過高,為降低算法復(fù)雜度,同時(shí)盡可能挖掘數(shù)據(jù)本身的信息,對原始序列進(jìn)行了經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)。EMD算法具有完全分解、高精度和強(qiáng)平穩(wěn)性等優(yōu)勢。通過EMD算法對堤防道路沉降監(jiān)測數(shù)據(jù)進(jìn)行分解,如圖4所示。在圖4中,沉降序列被分解為4個(gè)IMF分量和一個(gè)殘余項(xiàng),殘余項(xiàng)的周期最長,將其作為趨勢項(xiàng)沉降,由圖可見趨勢項(xiàng)曲線非常平滑。將累計(jì)沉降序列減去趨勢項(xiàng)序列求得波動(dòng)項(xiàng)沉降,見圖5。
2.3 實(shí)驗(yàn)條件與結(jié)果分析
實(shí)驗(yàn)使用的硬件和軟件環(huán)境如下:編程語言為Python 3.9,內(nèi)存為16 GB,顯卡為NVIDIA GeForce GTX 1660 T,配置CUDA和cuDNN以利用GPU加速深度學(xué)習(xí)計(jì)算,隱藏層單元數(shù)為32,激活函數(shù)ReLU函數(shù),學(xué)習(xí)率為0.1,訓(xùn)練輪數(shù)(epoch次數(shù))為5 000。
將重構(gòu)以后的序列數(shù)據(jù)按7∶3劃分,前126期數(shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)作為測試集,對本文模型進(jìn)行驗(yàn)證。為找到最優(yōu)輸入步長,將重構(gòu)的趨勢項(xiàng)與波動(dòng)項(xiàng)序列輸入步長設(shè)置為7到1遞減,即模型的輸入項(xiàng)為前7期的沉降監(jiān)測數(shù)據(jù),輸出項(xiàng)為本期待預(yù)測的沉降值。不同輸入步長的預(yù)測指標(biāo)如表1所示。由表1可知,隨著輸入步長的減少,MSE和MAE也相應(yīng)減小,輸入步長為3時(shí)指標(biāo)達(dá)到最小值,可以認(rèn)為在本文案例下,預(yù)測模型的最優(yōu)輸入步長為3。當(dāng)輸入步長為3時(shí),趨勢項(xiàng)與波動(dòng)項(xiàng)的預(yù)測結(jié)果如圖6所示。
由表1可知,本研究采用的EMD-RNN-Selfattention模型在測試集的MSE為0.60、MAE為0.59。為了證明本文方法的優(yōu)越性,引入在小樣本性能優(yōu)越的支持向量機(jī)(SVM)模型和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)模型。SVM采用了徑向基函數(shù)(RBF)作為核函數(shù),BPNN使用了S形函數(shù)(Sigmoid)作為激活函數(shù),隱藏層單元數(shù)與RNN一致為32。在輸入步長一致的情況下,對時(shí)序序列進(jìn)行預(yù)測,各項(xiàng)指標(biāo)如表2所示,各預(yù)測模型時(shí)序曲線如圖7所示。
由表2可見,SVM和BPNN在MSE,MAE兩項(xiàng)指標(biāo)上分別為1.65,2.32和1.10,1.20,可知對于該實(shí)例數(shù)據(jù),且在輸入條件一致的情況下,本文方法優(yōu)于SVM模型和BPNN模型。
3 結(jié) 論
本研究采用經(jīng)驗(yàn)?zāi)B(tài)分析(EMD) 結(jié)合循環(huán)神經(jīng)網(wǎng)絡(luò)算法(RNN)與自注意力機(jī)制,提出了一種針對堤防工程沉降預(yù)測的方法,并以廣州萬頃沙聯(lián)圍北界河水閘至中山界外江堤防綜合整治工程為例,通過本文方法對該項(xiàng)目 SL3堤防沉降進(jìn)行預(yù)測。
(1) 為確定最優(yōu)輸入長度,運(yùn)用均勻分布實(shí)驗(yàn),從輸入長度7至1進(jìn)行實(shí)驗(yàn),結(jié)果顯示當(dāng)輸入長度為3時(shí),模型的MSE與MAE指標(biāo)最小,分別為0.60和0.59。
(2) 對SL3號(hào)監(jiān)測點(diǎn)原始沉降數(shù)據(jù)進(jìn)行預(yù)測,并將預(yù)測結(jié)果與傳統(tǒng)的小樣本算法SVM與BPNN進(jìn)行對比。結(jié)果表明,在輸入條件一致的情況下,本文方法優(yōu)于SVM和BPNN模型。
本文為水利填方工程沉降預(yù)測提供了一種創(chuàng)新的方法和思路,也為水利基礎(chǔ)設(shè)施的維護(hù)和管理提供了科學(xué)依據(jù)和技術(shù)支持。
參考文獻(xiàn):
[1] 趙新銘,劉浩,楊濤,等.淤泥質(zhì)土堤防沉降預(yù)測方法的對比分析 [J].人民長江,2016,47 (17):93-97.
[2] 孔綱強(qiáng),張弛.填筑速率對軟基上堤防沉降影響的現(xiàn)場試驗(yàn)與數(shù)值模擬 [J].巖土力學(xué),2014,35 (增2):343-349.
[3] 賁鵬,陸美凝,陸海田,等.采砂對淮河蚌埠段河勢穩(wěn)定與防洪安全影響分析[J].人民長江,2023,54(3):16-20,27.
[4] 錢玉林,丁毅.路基沉降預(yù)測及其工程應(yīng)用[J].揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版),2001(2):75-78.
[5] 王瑞甫.高填方路基沉降計(jì)算及預(yù)測方法研究[D].長沙:湖南大學(xué),2003.
[6] 蒲興波,魏靜,錢耀峰,等.基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的路基沉降預(yù)測[J].路基工程,2012 (3):17-19.
[7] 韓旭,羅登昌.長江堤防工程大數(shù)據(jù)基本特征及應(yīng)用策略[J].人民長江,2020,51(增1):262-264.
[8] 劉紅兵,王李管,張良輝,等.基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的隧道地表沉降預(yù)測[J].礦業(yè)研究與開發(fā),2007 (2):26-28,78.
[9] 賀明俠,王連俊.動(dòng)量BP算法在路基沉降預(yù)測中的應(yīng)用[J].巖土工程技術(shù),2006(1):17-20,28.
[10]" HUANG N E,SHEN Z,LONG S R.The empirical mode decomposition and hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings of the Royal Society A,1998,454(1971):903-995.
[11] 楊春宇,任興達(dá),江匯男,等.基于小波去噪的地鐵變形組合預(yù)測模型分析[J].測繪通報(bào),2021(10):127-131.
[12] 徐海龍,喬書波,林家樂.利用長短時(shí)記憶網(wǎng)絡(luò)的日長變化預(yù)報(bào)[J].測繪科學(xué)技術(shù)學(xué)報(bào),2020,37(5):474-478.
[13] 崔東東,張恒璟,程鵬飛.一種自相關(guān)函數(shù)絕對值均值變點(diǎn)的去噪方法[J].測繪科學(xué),2019,44(12):42-49.
(編輯:高小雲(yún))
Prediction method study of embankment settlement based on EMD-RNN
GUO Bin1,LIU Zhao1,ZHU Mingang2
(1.CCCC-FHDI Engineering Co.,Ltd.,Guangzhou 510230,China; 2.PowerChina Urban Planning amp; Design Institute Co.,Ltd.,Guangzhou 511458,China)
Abstract:
In order to effectively predict the settlement of embankments,the Empirical Mode Decomposition (EMD) was used to decompose the settlement data,and the characteristic sequences of different frequency components were extracted.Then the Recurrent Neural Network (RNN) combined with attention mechanism was used to model the reconstructed long-term series data,and the data with different input durations were filtered and analyzed to determine the optimal input duration,so as to capture the time dependence and key characteristics in the settlement process.Taking the settlement data of the comprehensive improvement project from the river sluice gate in the north boundary of Wanqing Shalianwei to the river embankment outside the boundary of Zhongshan as an example,the proposed method was verified.The results showed that the optimal input step size of the case was 3,and the mean square error of the model was 0.60 and the average absolute error was 0.59,which was better than the traditional methods,such as SVM and BPNN,and effectively improved the accuracy and reliability of embankment settlement prediction.This research method can provide a reference for similar urban infrastructure maintenance and management.
Key words:
Empirical Mode Decomposition(EMD); eigenmodal functions; embankments; settlement prediction