范鵬飛,祝福源
(1.山西省水利水電工程建設監(jiān)理有限公司,太原030000;2.河海大學水利水電學院,南京210098;3.水發(fā)規(guī)劃設計有限公司,濟南250100)
混凝土壩作為一種重要的壩型,在服務經濟發(fā)展方面起著重要作用。隨著現代監(jiān)測技術的發(fā)展,混凝土壩的監(jiān)測越來越系統(tǒng)化、智能化,監(jiān)測的數據庫也越來越龐大,對于數據的科學分析特別是高壩和特高壩的處理尤為重要?;炷翂伪O(jiān)控系統(tǒng)的監(jiān)測項目一般包括位移、應力應變、滲流滲壓、裂縫發(fā)展、壩體溫度、鋼筋應力應變、環(huán)境量等。其中由于混凝土壩相較于其他材料大壩具有較高的剛體結構特性,使得位移成為混凝土壩安全運行管理研究的首要指標[1]。研究學者們已經對其進行了較為全面的研究,如位移的擬合和預測、影響位移的因素、基于位移的壩體材料參數反演、大壩位移預警指標的擬定等[2-4]。而位移預測和預判對大壩安全管理決策的作用愈加凸顯,并且對位移預測的精度和模型的適用性和可靠性的要求越來越高。因此預測混凝土壩的位移進行和提高預測精度對大壩安全就十分必要。
在大壩位移的預測方面,傳統(tǒng)的方法有統(tǒng)計學,如多元回歸法、逐步回歸法[1];模糊數學預測模型及確定性預測模型等[5]。近年來隨著計算機技術及軟件的發(fā)展,智能算法在大壩位移預測領域應用也越來越廣泛。由單一算法向串聯(lián)算法發(fā)展,而組合智能算法利用各算法的優(yōu)點并且較好地克服了單一算法的過擬合問題,提高了模型的非線性映射能力、計算效率和預測精度,如徐朗等采用改進的PSO-SVM 模型研究了大壩的變形[6];郭志揚等構建了卡爾曼濾波的GA-BP 大壩變形預測模型[7];何啟等應用PSO_GM_MC 灰色神經網絡-加權馬爾可夫鏈組合算法組建了大壩變形監(jiān)控模型[8]。而在研究混凝土壩位移預測的問題上,由于混凝土壩位移受非線性變化的水位、溫度、時效等因素影響,再加上監(jiān)測噪聲誤差的存在,使得位移信號的非平穩(wěn)性比較明顯,無疑增大了對位移的擬合和預測的難度。為解決信號的非平穩(wěn)性的難題,Huang[9]于1998年提出了經驗模態(tài)分解(empirical mode decomposition,EMD)方法,但該算法的信號包絡易發(fā)生形狀畸變并引起端點效應,從而使各個分量的分解不準確。Wu.Z等[10]在EMD 算法的基礎上提出了集合經驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)可以有效地解決上述EMD 算法的缺點。EEMD 算法應用已較為廣泛,如劉淑瓊等利用EEMD-RBF神經網絡構建了電離層TEC 預報模型[11];李華等通過EEMD 算法實現了軸承故障特征的提?。?2];譚冬梅等基于EEMD-JADE 較好地分離出橋梁撓度監(jiān)測中的溫度效應[13]。為了提高訓練擬合及預測精度,引入遞歸神經網絡(Recurrent Neural Networks,RNN)算法。RNN神經網絡是一種結構優(yōu)化的神經網絡,在隱含層中引入了循環(huán)結構并且在隱含元單元之間進行內部聯(lián)系,在訓練過程中信息可以在模型中向前或者向后傳播,這可以提高算法的訓練效率和精度。目前,應用該算法的研究成果頗多,如周暄焯通過RNN 及其融合方法研究預測了DNA 甲基化的狀況[14];蘆效峰等構建了CNN 和RNN 組合算法以探索自由文本擊鍵模式持續(xù)身份的認證[15];范竣翔等基于RNN算法研究了空氣污染時空預報模型[16]。而大壩位移在監(jiān)測過程中,監(jiān)測值中包含了測量誤差和系統(tǒng)噪聲,為了進一步提高訓練擬合的精度和算法的健壯性,本文采用和聲搜索算法(harmony search algorithm,HS)進行去噪優(yōu)化,可以有效地提高預測精度,如張磊等利用和聲搜索算法可以較好地提取近紅外光譜特征變量[17];李明等基于和聲搜索算法實現了無線傳感器網絡多重連通覆蓋[18];王志剛等通過和聲搜索算法優(yōu)化了RGV動態(tài)調度模型[19]。
綜上可知,單一算法模型在解決復雜的問題時比較困難,而對于受復雜條件影響的大壩位移具有隨機性和非線性,實現較高精度的預測則更加困難。因此,為克服單一算法容易陷入誤差函數的局部極小值、收斂速度慢、過度收斂等缺點,本文首先利用EEMD 算法進行位移監(jiān)測數據的平穩(wěn)化處理,然后利用RNN 神經網絡較強的非線性映射能力,通過訓練樣本集學習建立混凝土壩環(huán)境量、時效和大壩位移的非線性關系,采用和聲搜索算法對其去噪和優(yōu)化,綜合各算法的優(yōu)勢,提高位移預測精度和模型計算效率,構建HS-EEMD-RNN 混凝土壩位移預測模型。
EEMD算法通過在原始時間序列中加入足夠多的正態(tài)分布白噪聲,再將新的時間序列進行EMD 分解;然后利用白噪聲均值為零的特性對各分解量作算術平均,可得到EEMD 分解的IMF分量和剩余項R。分解步驟如下[13]:
(1)首先把等長度高斯白噪聲N次加入原始時間序列,則可得到若干新的時間序列:
式中:yi(t)為第i次加白噪聲后的時間序列;y(t)為原時間序列;ni(t)為正態(tài)分布白噪聲信號。
(2)然后通過EMD 算法分解添加白噪聲的新時間序列,可得到本征模態(tài)函數wi j(t)及一個剩余項ri(t):
式中:wi j(t)為第i次添加白噪聲后分解所得到的第j個本征模態(tài)函數分量;ri(t)為剩余項。。
(3)再將N組本征分量及剩余項r(t)求平均得到最終的IMF分量及剩余量R(t)。
式中:IMFj(t)為EEMD最終分解分量;R(t)為最終剩余量。
(4)最后,原始時間序列信號可分解為:
RNN 神經網絡的優(yōu)點在于一次性激活不同的神經單元,即當前時刻的隱含層節(jié)點能夠反應前一時刻隱含層節(jié)點的輸出內容,同時作為輸出層的輸入以及前一個時間點的隱含層的節(jié)點輸入,并在處理該時刻的信息之后又導向下一時間點的隱含層節(jié)點[14]。RNN 較之傳統(tǒng)的神經網絡,在訓練擬合和預測位移的過程中,可以提高收斂速度和訓練精度,其在時間維度上展開后結構如圖1。
圖1 RNN在時間維度上展開的結構Fig.1 The structure of RNN in time dimension
由圖1可知,RNN 在時間維度是一個不斷往后遞歸的過程,之前時刻的結果對下一個時刻的訓練有著直接的影響,但因為在每個時間步上的權值一樣,所以在相同時刻不同單元會共享同一組權值。對于長度為T的序列x,RNN 的輸入層大小為I,隱含層大小為H,輸出層大小為K,可得3 個權重矩陣U、V和W的維度[15]:
定義xt為序列中第t項輸入;at為第t項隱含層的輸入;bt為對at進行非線性激活,即神經網絡的輸出。因此,at是由輸入層xt與上一層隱含層的輸出bt-1共同決定:
大壩位移監(jiān)測序列由t=1 開始,所以b0= 0,然后把隱含層的信息傳導輸出層,則輸出層的輸出結果:
在t時刻,普通神經網絡的殘差為δtk=ytk-ztk,而RNN 由于前向傳導時隱含層需要接受上一個時刻隱含層的信號,而且在反向傳導時還需要接受下一個時刻隱含層的反饋,則RNN輸出層的殘差項:
當位移序列長度為T時,則殘差δT+1均為0,同時整個網絡只有一套參數U、V、W,則時刻t的倒數:
則可以寫成統(tǒng)一的形式(假定對輸入層有xti=ati=bti):
最終,對時刻t=1,2,…,T,由RNN神經網絡的遞歸性,將其求和可得RNN網絡關于權重參數的導數:
對于EEMD 分解得到的位移分量,其中高頻分量主要由監(jiān)測誤差噪聲引起的,尤其是IMF1 分量,所以對其系統(tǒng)性去噪以提高模型的精度就很有必要。和聲搜索算法的基本思想是模仿樂隊演奏的和聲調諧過程的元啟發(fā)式優(yōu)化算法[20],其優(yōu)化RNN神經網絡的實現過程如下[21]:
步驟一:初始化相關算法參數。
和聲搜索算法參數有:和聲記憶庫容量HMS、和聲記憶庫取值概率HMCR、微調擾動概率PAR、微調步長bw、迭代次數BT。HMS決定了HS 算法的全局搜索能力,但過大的HMS值會影響收斂到最優(yōu)解的速度,HMCR值大有利于算法的局部搜索,算法參數的具體數值可由仿真試驗確定[22]。
步驟二:定義目標函數并初始化和聲記憶庫。
定義目標函數:期望輸出(實測值)與網絡輸出(擬合值)的平均相對誤差F,其中F值越小表明優(yōu)化程度越好。
式中:H為訓練集樣本總數;y'(i)、y(i)分別為第i個樣本的實測值與擬合值。
構造HMS個隨機初始和聲x1、x2、…、xHMS添加和聲記憶庫,記憶庫中的和聲xi對應RNN 神經網絡的一組權值和閾值。和聲記憶庫為:
式中:xij為RNN 網絡中第i組和聲的第j個權值或閾值;(fxi)為第i組目標函數值,即第i組網絡輸出與期望輸出之間的平均相對誤差。
步驟三:新和聲的創(chuàng)作。
創(chuàng)作新和聲,即構造新的解向量。根據學習和聲記憶庫、音調微調,隨機產生新和聲的音調x'j(j=1,2,…,N):
式中:r1為[0,1]內均勻分布的隨機數;為在第j列HMS個分量中隨機選定的分量;xU、XL為第j列分量的取值上下限;式(19)為對任意新音調x'j,會以HMCR的概率從記憶庫中選取,以1-HMCR 概率從其對應的取值區(qū)間內隨機取值[23]。如果x'j是和聲記憶庫中的解分量,則對其微調為:
式中:r2、r3分別為[0,1]和[-1,1]內均勻分布的隨機數。
步驟四:更新記憶庫。
如果新和聲解向量對應的目標函數值F優(yōu)于記憶庫內的最差解,則用新的和聲解替換最差解,更新記憶庫。
步驟五:結束循環(huán)。
循環(huán)步驟三、四,直至滿足終止準則或達到最大迭代次數。
綜合以上算法的優(yōu)點,基于HS 優(yōu)化的EEMD-RNN 組合模型的詳細步驟如圖2,建模具體流程如下:
圖2 基于HS優(yōu)化的EEMD-RNN組合模型混凝土大壩預測流程圖Fig.2 Flow chart of concrete dam prediction based on HS optimized EEMD-RNN combined model
(1)確定大壩位移的研究測點,通過EEMD 對測值進行分解,得到若干組IMF分量和剩余項R。
(2)應用RNN 神經網絡算法對IMF分量和剩余項R進行訓練擬合,輸入為環(huán)境量和時效變量,輸出為大壩位移。在訓練過程中通過和聲搜索算法HS 優(yōu)化RNN 的閾值和權值,直到得到最優(yōu)解。
(3)通過訓練最優(yōu)的擬合映射關系,計算預測集所對應的IMF分量和剩余項R。
(4)將各個分量位移IMF和剩余項R的預測值等權求和即為最終的預測結果。
為了評價模型擬合及預測的精度,利用平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)進行模型的精度評定,分別為:
式中:Yt為混凝土壩位移實測值;為模型計算量;n為監(jiān)測數據總個數;t為監(jiān)測數據對應的時間。
某重力壩位于中國東南省份,壩頂高程634.40 m,最大壩高72.4 m,壩體上游面垂直。大壩共分為9 個壩段,壩頂長206 m,壩頂寬7.5 m,其中4號和5號壩段是溢流壩段,其余為非溢流壩段。非溢流壩段下游面壩坡比為1∶0.72。其中該壩采用引張線監(jiān)測壩體的水平位移,共布置1 條,固定端布置在壩右01+107.025 處,導向端布置在壩左0+93.50 處,全長200.75 m,每個壩段布置一個測點,共9 個測點,測點名稱EX1~EX9,測點布置圖如圖3。
由圖3可知,該壩引張線系統(tǒng)的EX5 測點位于大壩的中間壩段,監(jiān)測大壩的順河向水平位移,其位移變化具有典型性,所以選取測點EX5 為算例研究對象,且EX5 測點可靠,監(jiān)測頻次為1 次/d,采用自動化監(jiān)測和人工校測,監(jiān)測數據連續(xù)可靠。
圖3 引張線測點布置圖Fig.3 Layout of measuring points of tension line
通過基于HS 優(yōu)化的EEMD-RNN 混凝土壩位移預測模型對該壩EX5 測點所監(jiān)測的位移進行計算分析。位移監(jiān)測資料選取2016年6月2日-2017年8月20日,共445 組,其中2016年6月2日-2017年6月30日的前395 組作為模型訓練組,2017年7月1日-2017年8月20日后50組為模型預測組。
EEMD 分解參數有兩個,高斯白噪聲標準差Nstd一般為0.01~0.4,添加噪聲次數NE一般為50 或100,為盡可能得到較好的分解結果,綜合Nstd取0.01,NE取100。模型的訓練集EEMD分解結果如圖4,其中7組IMF分量及1組剩余量R,IMF1分量、IMF2 分量和IMF3 分量為高頻分量,其余IMF分量為低頻。對于高頻分量,主要由監(jiān)測誤差噪聲引起的,尤其是IMF1分量。所以系統(tǒng)性地去噪以提高模型精度就很必要。
圖4 大壩EX5測點位移EEMD分解結果Fig.4 EEMD decomposition results of displacement of EX5 measuring point of dam
為了降低測值中的噪聲誤差對訓練結果的干擾,通過和聲搜索算法優(yōu)化RNN 訓練過程,其中和聲記憶庫大小HMS取100,搜索范圍為[-1,1],和聲記憶庫保留概率HMCR取0.85,音調微調概率PAR取0.2,微調步長bw取0.2,最大迭代次數NT取100。在HS 優(yōu)化RNN 訓練結束后,對各分量IMF和剩余量R的擬合值進行等權求和得到位移的擬合值,擬合結果如圖5所示。并且與EEMD-RNN 模型的擬合結果進行對比,擬合的精度見表1所示。由圖5和表1可知,HS 算法可以有效提高訓練擬合精度,HS-EEMD-RNN 模型的擬合精度明顯高于EEMD-RNN模型。
表1 兩種模型的擬合精度對比Tab.1 Comparison of fitting accuracy of two models
圖5 兩種模型的擬合結果Fig.5 Fitting results of the two models
由HS-EEMD-RNN 訓練好的網絡進行各個分量位移IMF和剩余項R的預測值,等權求和即為最終的大壩位移預測結果。同時計算了EEMD-RNN 的位移預測值,位移預測結果如圖6。利用均方根誤差(MAE)、平均絕對百分比誤差(RMSE)、相對誤差和絕對誤差(MAPE),3 種指標對兩種模型的預測情況評價,具體對比結果如表2。由圖6和表2的對比結果表明,HSEEMD-RNN 模型的預測精度要優(yōu)于EEMD-RNN 模型;而且預測精度高,能夠滿足工程要求。
圖6 EEMD-RNN模型和HS-EEMD-RNN模型對總位移的預測Fig.6 Prediction of total displacement by EEMD-RNN model and HS-EEMD-RNN model
表2 EEMD-RNN和HS-EEMD-RNN模型預測值誤差對比Tab.2 Comparison of prediction error between EEMD-RNN model and HS-EEMD-RNN model
其中位移變化過程中的突跳點一般是大壩安全監(jiān)控工作關注的重點,而以往模型的過擬合及預測誤差大的情況在突跳點位置發(fā)生的較多,所以選取EX5 位移過程線突跳程度最大的10個測值與模型的預測值進行對比,以更好地評估模型的預測精度,位移突跳點預測值對比結果如表3。由表3可知,HSEEMD-RNN 的平均絕對百分比誤差為4.93%,比EEMD-RNN的14.89%明顯小得多。
表3 位移突跳點預測值對比Tab.3 Comparison of predicted values of displacement jump points
本文以提高大壩位移的預測精度為切入點,構建了以HS優(yōu)化的EEMD-RNN的位移預測模型,主要研究成果如下。
(1)EEMD 算法可以有效地處理由于非線性隨機變量導致的非平穩(wěn)位移監(jiān)測序列;RNN 神經網絡能夠較好地實現位移樣本的訓練擬合及預測;HS 算法可以有效地進行系統(tǒng)性去噪,并能明顯提高模型的健壯性及計算精度;HS-EEMD-RNN 模型綜合上述算法優(yōu)點能夠實現對混凝土壩位移的預測。
(2)通過算例可知,HS-EEMD-RNN 模型的誤差小,精度高,且對突跳值有較高的預測精度,是一種可靠的混凝土壩位移預測模型。該模型可以拓展到其他結構位移的預測及監(jiān)控,對工程管理決策提供新的途徑。
(3)HS-EEMD-RNN 的位移預測模型主要適用于訓練集為大樣本的研究,為了提高該模型的適應性可以進一步研究訓練集為小樣本的預測精度及穩(wěn)定性?!?/p>