劉 達(dá),羅維平
基于時(shí)間序列神經(jīng)網(wǎng)絡(luò)的河流水位預(yù)測
劉 達(dá),羅維平*
(武漢紡織大學(xué) 機(jī)械工程與自動(dòng)化學(xué)院,湖北 武漢 430200)
針對我國每年頻繁發(fā)生的洪澇災(zāi)害及河流航道通行困難等問題,構(gòu)建了一個(gè)基于時(shí)間序列神經(jīng)網(wǎng)絡(luò)的高精度的河流水位預(yù)報(bào)模型,該模型能夠有效預(yù)測河流水位值,進(jìn)而及時(shí)做出應(yīng)急處理,減少對生命財(cái)產(chǎn)造成的損失。該模型采用湖北省武漢市某水位站2019年7月29日至2020年5月28日的逐時(shí)水位時(shí)間序列作為訓(xùn)練樣本進(jìn)行訓(xùn)練, 2020年5月29日至2021年8月28日的逐時(shí)水位組成的500個(gè)數(shù)據(jù)為測試樣本進(jìn)行檢驗(yàn)。該模型的預(yù)測水位值與真實(shí)水位值之間的平均絕對誤差為0.00663,均方根誤差為0.08143,平均絕對百分比誤差為0.23785%,預(yù)測精度極高,具有較強(qiáng)實(shí)際應(yīng)用前景。
BP神經(jīng)網(wǎng)絡(luò);時(shí)間序列;水位預(yù)測
我國洪澇災(zāi)害頻發(fā),2018年至2020年年均出現(xiàn)了34次暴雨天氣過程[1-3],極易引發(fā)洪澇災(zāi)害,對社會秩序、經(jīng)濟(jì)發(fā)展、生命財(cái)產(chǎn)安全以及生態(tài)系統(tǒng)等方面造成極大的破壞,對受災(zāi)地區(qū)造成深遠(yuǎn)影響[4]。在此背景下,對經(jīng)常遭受洪澇災(zāi)害地區(qū)主要河流的水位進(jìn)行預(yù)測,在水位超過警戒值后進(jìn)行預(yù)警就顯得極為重要。河流水位數(shù)據(jù)是分析受災(zāi)流域范圍的重要數(shù)據(jù),提前進(jìn)行河流水位的預(yù)報(bào),能夠及時(shí)有效的對汛情進(jìn)行處置,做出提前進(jìn)行人員轉(zhuǎn)移、加固河堤等工作安排,保護(hù)人民的生命財(cái)產(chǎn)安全。河流水位預(yù)測也不僅僅只是用于防汛工作,對水路運(yùn)輸?shù)陌踩ê揭灿兄卮笾笇?dǎo)意義,航道尺度的大小取決于水位數(shù)值的高低,精確的水位預(yù)測可以進(jìn)一步提升航道綜合服務(wù)能力,提高航道通行能力,保障船舶安全航行等[5]。目前,航道部門通過設(shè)置水位觀測站等方式,可以獲取大量的水位數(shù)據(jù)。本文基于這些數(shù)據(jù),建立一個(gè)時(shí)間序列的神經(jīng)網(wǎng)絡(luò)模型對河流水位進(jìn)行預(yù)測研究。
BP神經(jīng)網(wǎng)絡(luò)及其改進(jìn)算法目前大量應(yīng)用于水文信息預(yù)測研究。劉光星等[6]利用粒子群算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)對地下水位進(jìn)行預(yù)測,該模型相比BP神經(jīng)網(wǎng)絡(luò)具有更好的收斂性,全局尋優(yōu)能力更強(qiáng),預(yù)測精度更高,其模型的平均絕對百分比誤差為3.89%。馬輝等[7]將灰色模型與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合對贛江外州水文站的水位進(jìn)行預(yù)測,其平均誤差為0.37%。韓卓慧等[4]將主成分分析法(Principal Component Analysis,PCA)引入基于遺傳算法(Genetic Algorithm,GA)的BP神經(jīng)網(wǎng)絡(luò)構(gòu)成PG-BP神經(jīng)網(wǎng)絡(luò)模型,將該模型對大沽河流域的汛期水位進(jìn)行預(yù)測,其擬合精度較高,具有一定適用性,但得到的均方根誤差仍為0.15。以上這些研究方法均存在精度低、誤差大等不足。
針對上述問題,本文采用湖北省武漢市某水位站的歷史數(shù)據(jù)作為數(shù)據(jù)集,采用MATLAB軟件選取不同結(jié)構(gòu)參數(shù)的神經(jīng)網(wǎng)絡(luò)模型,對其進(jìn)行分析,從而選擇最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)建立時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型。利用該模型對2020年5月29日至2021年8月28日的逐時(shí)水位進(jìn)行預(yù)測,驗(yàn)證模型的有效性和準(zhǔn)確性,達(dá)到對河流水位的精確預(yù)測。
要對河流水位進(jìn)行精確的預(yù)測,就必須找到一個(gè)最恰當(dāng)?shù)暮瘮?shù)對歷史數(shù)據(jù)進(jìn)行擬合分析,尋找這個(gè)函數(shù)的方法就是建立一個(gè)時(shí)間序列模型[8]。
BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄟM(jìn)行訓(xùn)練的多層前饋網(wǎng)絡(luò),也是目前應(yīng)用最廣泛的一種神經(jīng)網(wǎng)絡(luò)模型[9, 10],由輸入層、輸出層以及兩者之間的隱含層三部分組成[11]。其特點(diǎn)為信號前向傳播,而誤差反向傳播。信號經(jīng)過逐層處理到達(dá)輸出層時(shí),發(fā)現(xiàn)結(jié)果未達(dá)到期望值,于是原路返回進(jìn)行反向傳播,同時(shí)對各層權(quán)重等值進(jìn)行修正,調(diào)整誤差,直至輸出結(jié)果為期望值[12]。
BP算法計(jì)算流程如下:
(4)設(shè)定迭代終止條件,當(dāng)輸出誤差小于一定值或?qū)W習(xí)次數(shù)達(dá)到要求時(shí),算法終止,輸出結(jié)果。
假設(shè)神經(jīng)網(wǎng)絡(luò)隱含層的神經(jīng)元數(shù)量為任意個(gè)數(shù),其特性函數(shù)任意階可導(dǎo),則構(gòu)建的3層BP神經(jīng)網(wǎng)絡(luò)模型可任意精度逼近任意連續(xù)函數(shù)[13]。因此選取合理的結(jié)構(gòu)參數(shù)就能夠利用神經(jīng)網(wǎng)絡(luò)推導(dǎo)出最優(yōu)的非線性函數(shù)。
本文的數(shù)據(jù)來源于武漢市公共數(shù)據(jù)開放平臺(http://data.wuhan.gov.cn/page/data/data_set_details.html?cataId=4d6ac7b12a024aad83fb5e4968e1eb5b),收集采用了位于湖北省武漢市某水位站2019年7月29日至2021年8月29日的逐時(shí)水位時(shí)間序列作為數(shù)據(jù)集。
圖1 訓(xùn)練曲線圖
由于神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過擬合現(xiàn)象,因此,需要分別對訓(xùn)練集的預(yù)測值與真實(shí)值,驗(yàn)證集的預(yù)測值與真實(shí)值和測試集的預(yù)測值與真實(shí)值進(jìn)行線性擬合,擬合結(jié)果如圖2所示。訓(xùn)練集的擬合系數(shù)R=0.99998,極為接近1,說明此模型的訓(xùn)練效果極好,預(yù)測精度極高。驗(yàn)證集的擬合系數(shù)R=0.99997,測試集的擬合系數(shù)R=0.99941,同樣極為接近1,說明該模型在測試集中同樣具有極高的預(yù)測精度。對整個(gè)模型綜合驗(yàn)證回歸參數(shù)如圖2所示,所得擬合系數(shù)R=0.99993,擬合效果極好。綜上所述,該時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率高,具有良好的可行性。
圖2 訓(xùn)練集、驗(yàn)證集、測試集和綜合驗(yàn)證的回歸曲線
該時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型對500個(gè)測試樣本的檢驗(yàn)對比結(jié)果如圖3所示,預(yù)測值與真實(shí)值極為接近,離群點(diǎn)極少,預(yù)測精度極高。預(yù)測誤差如圖4所示,神經(jīng)網(wǎng)絡(luò)預(yù)測的水位值與真實(shí)水位值的誤差絕對值絕大部分小于0.2,最大相對誤差為0.3543,平均絕對誤差0.00663,均方根誤差0.081434,平均絕對百分比誤差0.23785%,在水位達(dá)到極值附近預(yù)測值的誤差波動(dòng)相對較大,其他時(shí)刻誤差極小,說明該時(shí)間序列神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度極高,對河流水位的預(yù)測有著重要參考意義。
圖3 測試集真實(shí)值和預(yù)測值的對比
圖4 測試集的預(yù)測誤差
本文采用了湖北省武漢市某水位站2019年7月29日至2021年8月29日的逐時(shí)水位時(shí)間序列作為數(shù)據(jù)集,使用MATLAB軟件建立了一個(gè)基于時(shí)間序列神經(jīng)網(wǎng)絡(luò)的水位預(yù)測模型,該模型的平均絕對誤差0.00663,均方根誤差0.08143,平均絕對百分比誤差0.23785%,精確預(yù)測了武漢某水位站2020年5月29日至2021年8月28日的逐時(shí)水位,能夠?yàn)楹恿鞣姥搭A(yù)警工作和航道綜合通行能力等方面提供參考。
[1] 周星妍,曾紅玲,王遵婭,等. 2018年中國氣候主要特征及主要天氣氣候事件[J]. 氣象,2019, 45(04): 543- 552.
[2] 李瑩,曾紅玲,王國復(fù),等. 2019年中國氣候主要特征及主要天氣氣候事件[J]. 氣象,2020, 46(04): 547-555.
[3] 代潭龍,王秋玲,王國復(fù),等. 2020年中國氣候主要特征及主要天氣氣候事件[J]. 氣象, 2021, 47(04): 478- 487.
[4] 韓卓慧,閆長青. 基于PG-BP神經(jīng)網(wǎng)絡(luò)的流域洪澇預(yù)測及仿真[J]. 軟件導(dǎo)刊,2021, 20(05): 50-55.
[5] 卞寧. 改進(jìn)型灰色系統(tǒng)在航道水位預(yù)測中的應(yīng)用[J]. 中國水運(yùn).航道科技,2018, (05): 75-80.
[6] 劉光星,李巧花. 基于粒子群算法的BP神經(jīng)網(wǎng)絡(luò)在地下水位預(yù)測中的研究[J]. 電子測試,2019, (07):51-52.
[7] 馬輝,孫潁桃,肖艷,等. 基于灰色-BP神經(jīng)網(wǎng)絡(luò)組合模型的水位預(yù)測案例[J]. 人民黃河, 2016, 38(12):89-92
[8] 田錚. 時(shí)間序列的理論與方法[M]. 北京:高等教育出版社, 200l. 355-357.
[9] 鐘穎, 汪秉文. 基于遺傳算法的BP神經(jīng)網(wǎng)絡(luò)時(shí)間序列預(yù)測模型[J]. 系統(tǒng)工程與電子技術(shù), 2002, (4): 9-11.
[10] 叢爽. 面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M].合肥: 中國科學(xué)技術(shù)大學(xué)出版社, 1998.
[11] 鄭君里,楊行峻. 人工神經(jīng)網(wǎng)絡(luò)[M]. 北京:高等教育出版社,1992. 15-30.
[12] 王小川, 史峰, 郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)43個(gè)案例分析[M]. 北京:北京航空航天大學(xué)出版社, 2013. 344-345.
[13] 黃俊,周申范,唐婉瑩. TNT生化降解時(shí)間序列的人工神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型[J]. 環(huán)境科學(xué)研究, 2000, (2): 3-5.
Based on Time Series Neural Network Prediction of River Water Level
LIU Da, LUO Wei-ping
(School of Mechanical Engineering and Automation, Wuhan Textile University, Wuhan Hubei 430200, China)
In view of the frequent flood disasters and difficulties in the passage of river waterways in China every year, a high-precision water level prediction model based on time series neural network is constructed, which can effectively predict the water level of the river, and then it makes emergency treatment in time to reduce the loss of life and property. The model uses the hourly water level time series of a water level station in Wuhan City, Hubei Province from July 29, 2019 to May 28, 2020 as training samples for training, and the hourly water level time series from May 29, 2020 to August 28, 2021. The data of 500 samples composed of the time water level are tested as the test sample. The average absolute error between the predicted water level value and the real water level value of the model is 0.00663, the root mean square error is 0.08143, and the average absolute percentage error is 0.23785%. The prediction accuracy is extremely high and has strong practical application prospects.
BP neural network; time series; water level prediction
TP275
A
2095-414X(2022)04-0043-05
通訊作者:羅維平(1967-),女,教授,研究方向:檢測技術(shù)與智能控制、信號與信息處理.