趙 普,谷艷昌,2*,吳云星,2
(1.南京水利科學(xué)研究院大壩安全與管理研究所,江蘇 南京 210029;2.水利部大壩安全管理中心,江蘇 南京 210029)
壩體和壩基的滲流監(jiān)測是土石壩安全運行監(jiān)控不可或缺的部分,也是大壩整體穩(wěn)定性分析的重點研究對象。目前,在大壩安全監(jiān)控領(lǐng)域主要采用的數(shù)學(xué)模型分為傳統(tǒng)模型和智能模型。傳統(tǒng)模型主要為常規(guī)統(tǒng)計模型、確定性模型、混合模型3種[1];而隨著模糊理論、灰色關(guān)聯(lián)分析、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)等的發(fā)展,各種智能模型也相繼應(yīng)用到大壩監(jiān)測上來,這些智能方法有效地改善了傳統(tǒng)方法非線性泛化能力不足的缺點,成為當(dāng)下研究的熱點。
人工神經(jīng)網(wǎng)絡(luò)有著自適應(yīng)、自學(xué)習(xí)、自組織和高度容錯性的特點[2],能很好地解決傳統(tǒng)回歸分析很難建立多因素非線性分析的缺點。但人工神經(jīng)網(wǎng)絡(luò)在實際應(yīng)用時也有一定局限性,如傳統(tǒng)的反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)存在網(wǎng)絡(luò)收斂速度慢、泛化能力弱、易陷入局部極小值[3],且不能獲取數(shù)據(jù)序列中的時間信息等缺點。
NARX(Nonlinear Auto-regressive with Exogenous inputs neural network,帶外源輸入的非線性自回歸神經(jīng)網(wǎng)絡(luò))神經(jīng)網(wǎng)絡(luò)最先由Siegelmann H T在1997年提出,并說明在涉及長期時間序列問題上,NARX具有優(yōu)秀的表現(xiàn)[4]。NARX是一種動態(tài)神經(jīng)網(wǎng)絡(luò),特點是加入了延時和反饋機(jī)制,增強(qiáng)了對歷史數(shù)據(jù)的記憶能力[5],可被應(yīng)用于解決多種領(lǐng)域的非線性序列預(yù)測問題。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的輸入變量可以認(rèn)為是彼此獨立的,時序關(guān)系一般不考慮[6],而NARX不僅考慮了歷史值的影響,還將自身預(yù)測值作為反饋輸入,在時序預(yù)測中更有優(yōu)勢。
范哲南等[4]將NARX引入到大壩變形預(yù)測中,應(yīng)用結(jié)果表明,NARX在預(yù)測精度和收斂速度上都優(yōu)于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)。朱新遠(yuǎn)等[7]將NARX用于短時交通流量預(yù)測,結(jié)果表明NARX具有良好泛化能力和較高預(yù)測精度。史如新等[8]建立了一種基于NARX的神經(jīng)網(wǎng)絡(luò)—小波分解組合算法,實現(xiàn)了對光伏發(fā)電的有效預(yù)測,相較于BP網(wǎng)絡(luò)收斂速度更快、誤差更小。
在大壩安全監(jiān)控指標(biāo)中,土石壩的滲透壓力存在明顯的滯后效應(yīng)[9],基于這一特點,引入NARX神經(jīng)網(wǎng)絡(luò),利用其獨特的延時輸入機(jī)制來模擬壩體水流滲透的滯后性,分別建立多因子和單因子模型進(jìn)行滲壓預(yù)測,并與傳統(tǒng)回歸模型和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)做對比來表明其時序預(yù)測的優(yōu)勢。
NARX神經(jīng)網(wǎng)絡(luò)是一種用于描述非線性離散系統(tǒng)的模型,對時序數(shù)據(jù)有良好的擬合和預(yù)測能力。其函數(shù)關(guān)系表示為:
y(t)=f{u(t-Du),...,u(t-1),u(t),y(t-Dy),…,y(t-1)}
(1)
式中u(t),y(t)——該網(wǎng)絡(luò)在t時刻的輸入和輸出;Du——輸入時延的最大階數(shù);Dy——輸出時延的最大階數(shù);u(t-Du),…,u(t-1)——相對于t時刻的歷史輸入;y(t-Dy),…,y(t-1)——相對于t時刻的歷史輸出;f——網(wǎng)絡(luò)擬合得到的非線性函數(shù)。
標(biāo)準(zhǔn)NARX網(wǎng)絡(luò)是一個雙層前饋網(wǎng)絡(luò),分別為隱藏層和輸出層,其中在隱藏層有1個tanh-sigmoid傳遞函數(shù),在輸出層有一個線性傳遞函數(shù)[10]。
隱含層雙曲正切傳遞函數(shù):
(2)
輸出層線性鏈接函數(shù):
linear(x)=x
(3)
NARX是一種較早出現(xiàn)的遞歸神經(jīng)網(wǎng)絡(luò),遞歸算法涉及多次使用單步模型,即使用前一個時間步的預(yù)測值作為下一個時間步預(yù)測的輸入。該網(wǎng)絡(luò)使用抽頭延遲線來存儲x(t)和y(t)序列的先前值。由式(1)可知,y(t)也是y(t-1),y(t-2),…,y(t-d)的函數(shù),該網(wǎng)絡(luò)的輸出y(t)通過延遲反饋給網(wǎng)絡(luò)的輸入,可實現(xiàn)更精確的預(yù)測。
確定輸入、輸出變量后,選擇一定長度的監(jiān)測數(shù)據(jù)序列作為樣本數(shù)據(jù)。序列過長會導(dǎo)致網(wǎng)絡(luò)訓(xùn)練慢,還會出現(xiàn)過擬合,序列過短則會欠擬合,達(dá)不到預(yù)期效果。受到環(huán)境和儀器本身因素的影響,效應(yīng)量監(jiān)測數(shù)據(jù)往往由真實值和觀測誤差(噪聲)組成[13],因此需要對樣本數(shù)據(jù)進(jìn)行降噪處理,以取得穩(wěn)定的網(wǎng)絡(luò)訓(xùn)練效果。此外,為了消除水位和降雨之間的量級差,還需要用Min-Max函數(shù)對數(shù)據(jù)進(jìn)行歸一化處理:
(4)
式中x*——歸一化值;xmax、xmin——數(shù)據(jù)中最大值和最小值。
NARX網(wǎng)絡(luò)結(jié)構(gòu)可分為開環(huán)(圖1)和閉環(huán)(圖2)。在網(wǎng)絡(luò)訓(xùn)練過程中,真實輸出是可用的,因此開環(huán)訓(xùn)練將使用真實輸出而不是反饋輸出。這樣有2個優(yōu)點:第一,前饋網(wǎng)絡(luò)的輸入更準(zhǔn)確;第二,生成的網(wǎng)絡(luò)為純前饋架構(gòu),可以使用更高效的算法進(jìn)行訓(xùn)練。訓(xùn)練完成后,將網(wǎng)絡(luò)轉(zhuǎn)換成閉環(huán)連接,此時預(yù)測值將反饋到輸入層。
圖1 NARX開環(huán)網(wǎng)絡(luò)結(jié)構(gòu)
圖2 NARX閉環(huán)網(wǎng)絡(luò)結(jié)構(gòu)
同時建立NARX多因子和單因子模型、BP多因子和單因子模型以及逐步回歸模型,對同一組數(shù)據(jù)進(jìn)行擬合預(yù)測,以均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對誤差百分比(MAPE)作為精度指標(biāo),在3種模型中比較優(yōu)劣。同時,在單因子條件下與傳統(tǒng)BP網(wǎng)絡(luò)對比,分析其時序預(yù)測的能力。NARX網(wǎng)絡(luò)預(yù)測模型構(gòu)建及評價流程見圖3。
圖3 模型構(gòu)建及評價
某水庫位于江蘇省宜興市,是一座大(2)型水庫,水庫正常蓄水位35.00 m,設(shè)計洪水位38.75 m,校核洪水位40.36 m。大壩為均質(zhì)土壩,壩頂高程42.10 m,最大壩高24.10 m。大壩滲流壓力監(jiān)測采用測壓管與振弦式滲壓計組合形式,共布置8個監(jiān)測斷面、37個測點。
選取該水庫大壩樁號1+643的6號測壓管,數(shù)據(jù)采樣頻率為1組/天,從2012年1月1日到2014年8月31日共974組數(shù)據(jù)作為樣本數(shù)據(jù),進(jìn)行小波降噪后見圖4。由于遞歸算法允許誤差累積,隨著時間長度增加,預(yù)測值有可能失真,故劃分前944組數(shù)據(jù)用于網(wǎng)絡(luò)訓(xùn)練和測試,以后30組數(shù)據(jù)對訓(xùn)練完成的網(wǎng)絡(luò)進(jìn)行仿真預(yù)測,建立對照組對預(yù)測結(jié)果進(jìn)行評價。
圖4 實測數(shù)據(jù)與降噪處理數(shù)據(jù)過程線
網(wǎng)絡(luò)運行環(huán)境為Matlab-R2020b,樣本數(shù)據(jù)可分為訓(xùn)練集、驗證集和測試集,其中測試集用來反映模型訓(xùn)練結(jié)果的好壞,而驗證集在模型訓(xùn)練過程中可以防止過擬合現(xiàn)象。在測試集數(shù)量為總數(shù)據(jù)15%的條件下,通過建立多個對照組,確定驗證集數(shù)量為15%,驗證集對測試集的影響變化見圖5。同理,其他參數(shù)通過對照試驗確定最優(yōu)。對于多因子模型,延遲數(shù)d設(shè)為2,即當(dāng)前y值取決于前2個x值,隱含層節(jié)點數(shù)為10;對于單因子模型,由于輸入變量維數(shù)減少,應(yīng)當(dāng)增加延遲數(shù)、適當(dāng)減少隱含層節(jié)點,最終確定d=4、節(jié)點數(shù)為4;訓(xùn)練最大迭代次數(shù)為1 000。訓(xùn)練算法采用Levenberg-Marquardt (LM),這種算法收斂速度快,適用于大多數(shù)問題的求解。
圖5 驗證集對模型訓(xùn)練結(jié)果影響
給出多因子模型訓(xùn)練效果見圖6。從圖6中可以看出,所選數(shù)據(jù)非常契合NARX網(wǎng)絡(luò),擬合效果很好,各個數(shù)據(jù)集的相關(guān)系數(shù)R都十分接近1。
a)訓(xùn)練集:R=0.999 77
b)驗證集:R=0.999 62
c)測試集:R=0.999 53
d)總數(shù)據(jù):R=0.999 7
從表1可知,在3種評價指標(biāo)下,NARX網(wǎng)絡(luò)無論是多因子還是單因子模型,泛化能力和預(yù)測精度均優(yōu)于其他2種傳統(tǒng)方法;對比圖7、8,NARX網(wǎng)絡(luò)在單因子條件下仍有不錯的表現(xiàn),而BP網(wǎng)絡(luò)欠佳,表明NARX有效獲取了訓(xùn)練數(shù)據(jù)中的時間信息,一定程度上模擬了壩體滲透壓力的滯后性,對于大壩滲壓預(yù)測有良好應(yīng)用價值。
表1 評價指標(biāo)統(tǒng)計
圖7 多因子預(yù)測結(jié)果對比
圖8 單因子預(yù)測結(jié)果對比
針對傳統(tǒng)回歸模型和傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的不足之處,以及土石壩滲流壓力的滯后性,提出了將具有延時輸入特性的NARX神經(jīng)網(wǎng)絡(luò)引入到大壩安全監(jiān)控預(yù)測,建立了NARX多因子和單因子模型以及對照組。在3種評價指標(biāo)下,得出以下結(jié)論。
a)NARX神經(jīng)網(wǎng)絡(luò)優(yōu)于傳統(tǒng)逐步回歸方法和BP神經(jīng)網(wǎng)絡(luò),具有良好的泛化能力和預(yù)測精度。
b)NARX的延遲輸入特性,可在一定程度上模擬壩體水流滲透的滯后性,可在輸入變量較少的條件下實現(xiàn)較準(zhǔn)確的預(yù)測,能為大壩安全監(jiān)控提供更優(yōu)的措施。