陳家輝,李 敏
(廣西西江開發(fā)投資集團有限公司,廣西 南寧 530022)
西江發(fā)源于云南省曲靖市烏蒙山余脈馬雄山東麓,全長2 214 km,集水面積約35萬km2,是我國南方最大的河流,列全國七大江河的第四位。西江素有“黃金水道”之稱,歷史悠久,源遠流長,為流域經(jīng)濟發(fā)展、社會進步和人類文明作出過重要貢獻。西江船閘運行調(diào)度中心已經(jīng)在西江流域聯(lián)合調(diào)度上深耕多年,實現(xiàn)從單級船閘應(yīng)用到現(xiàn)在的多級多線梯級船閘的調(diào)度,后續(xù)計劃實施的船舶航程精準預(yù)調(diào)度。要做到精準預(yù)調(diào)度船舶,需要有水情方面的信息,但是西江梧州下游段枯水期的水情不能得到有效的預(yù)測,無法對行業(yè)主管和裝載貨物的船舶形成有效的指導(dǎo)建議。因此,準確預(yù)測河流水位水量,對船舶航行的路線以及出港配載具有重要意義。
目前,國內(nèi)外諸多水文專家關(guān)注水位變化趨勢的預(yù)測方法,提出以下幾個主要模型,如基于單變量的ARIMA模型、基于多變量的多元線性回歸模型、支持向量回歸機模型、人工神經(jīng)網(wǎng)絡(luò)模型等。然而影響水位的因素較為復(fù)雜,包括地形、降雨、支流匯入、分流、水壩及電站儲水等,考慮這些因素對水位趨勢進行預(yù)測的多變量模型將會十分復(fù)雜。時間序列分析方法則是從時間序列數(shù)據(jù)的分析中尋找其所具有的時序性和規(guī)律性,其數(shù)據(jù)本身已經(jīng)為建模提供了足夠的信息,因而能夠進行簡單有效的預(yù)測[1]。ARIMA模型作為時間序列分析方法的線性預(yù)測方法,在水位預(yù)測方面取得了進展。Sabzi H Z等人在2017年提出一種用于預(yù)測美國新墨西哥州海洛因水庫月水流量的改進型ARIMA模型,實現(xiàn)了決定系數(shù)R2為0.97的預(yù)測效果[2]。余珍在2018年采取ARIMA模型對漢口、監(jiān)利、安慶歷史水位時間序列進行預(yù)測分析,實現(xiàn)了逐日平均水位的預(yù)測與觀測值擬合較高的擬合度,但是汛期水位頻繁劇烈的波動在一定程度上會降低預(yù)測精度[3]。
ARIMA是用于單變量時間序列數(shù)據(jù)預(yù)測的最廣泛使用方法之一,模型結(jié)構(gòu)十分簡單,只需要內(nèi)生變量而不需要借助其他外生變量,特別對取值平穩(wěn)時間序列的預(yù)報精度高,廣泛應(yīng)用于水文預(yù)測領(lǐng)域。西江梧州下游段通航水位歷史數(shù)據(jù)特別是枯水期數(shù)據(jù)較為平穩(wěn),適合采用ARIMA模型進行預(yù)測。
時間序列分析理論表明,ARIMA模型是將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列。非白噪聲時間序列{xt}通常存在周期性、長期趨勢以及隨機波動等因素,我們需要對序列進行普通差分以消除長期趨勢,以及進行季節(jié)差分以消除周期特征,從而將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,進而對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值建立線性回歸的模型,即乘積季節(jié)模型:ARIMA(p,d,q)×(P,D,Q)S,其結(jié)構(gòu)如下:
(1)
式中:S——周期;
{εt}——白噪聲。
Φp(B)=1-φ1B-φ2B2-…-φpBp
Θq(B)=1-θ1B-θ2B2-…θqBq
HP(B)=1-m1BS-m2B2S-…-mPBPS
LQ(B)=1-n1BS-n2B2S-…-nQBQS
上述模型中:d——普通差分的階數(shù);
p、q——自回歸和移動平均階數(shù);
D——季節(jié)差分階數(shù);
P、Q——季節(jié)性自回歸和移動平均階數(shù);
s——{xt}的季節(jié)周期[4]。
為掌握西江梧州下游段枯水期的水情,我們對西江梧州下游段梧州水文站從2019-01-01至2021-01-01每天24 h的整點水位數(shù)據(jù)進行了時間時序特征分析,研究中所有數(shù)據(jù)由梧州水文站提供。梧州水文站整點水位數(shù)據(jù)屬于季節(jié)性時間序列,采用乘積季節(jié)模型,即ARIMA(p,d,q)×(P,D,Q)S。
利用SPSS 20統(tǒng)計軟件,本文將2019-01-01至2020-12-31每天24 h的整點西江梧州水文站水位時間序列(以下簡稱為西江水位)作為訓(xùn)練集,建立ARIMA模型,預(yù)測2021-01-01 24 h的整點水位值,以計算預(yù)測值的相對誤差來評價模型預(yù)測能力。
1.3.1 時間序列的平穩(wěn)性檢驗與平穩(wěn)化
繪制2019-01-01至2020-12-31每天24 h的西江水位時間序列圖(見圖1)。
圖1 西江水位時間序列圖
圖2 西江水位自相關(guān)圖
由圖1可以看出,西江梧州水文站水位數(shù)據(jù)為非平穩(wěn)序列,且有較強的自相關(guān)性。通過自相關(guān)圖(見圖2)可以看出,其自相關(guān)函數(shù)都是拖尾的,也說明序列是非平穩(wěn)的,季節(jié)性不明顯,可通過差分處理使序列平穩(wěn)。從時序圖(見圖3)可以看出,進行2階差分后序列變化較為平穩(wěn)。由自相關(guān)圖(見圖4)看出,自相關(guān)函數(shù)迅速減少,由于差分序列的ACF和PACF圖(見圖5)都是拖尾的,因此可以對原始序列構(gòu)建ARIMA模型。
圖3 西江水位2階差分時間序列圖
圖4 西江水位2階差分自相關(guān)圖
圖5 西江水位2階差分偏自相關(guān)圖
1.3.2 模型建立與預(yù)測
利用SPSS 20軟件和EVIEWS 10軟件,根據(jù)前面2階差分序列自相關(guān)與偏自相關(guān)函數(shù)特征,西江梧州下游段水位整點數(shù)據(jù)適合構(gòu)建ARIMA(p,d,q)×(P,D,Q)S模型,其中d=2,D=0,S=24。由于ARIMA(p,d,q)×(P,D,Q)S模型中的參數(shù)不唯一,需要利用SPSS 20軟件和EVIEWS 10軟件,不斷調(diào)整自回歸和偏自回歸的系數(shù)p、q,以及季節(jié)自回歸和季節(jié)偏自回歸的系數(shù)P、Q,找出系數(shù)均顯著且殘差是白噪聲的模型,最終得出所有合適的模型及其主要的信息準則值如表1所示。
表1 所有合適的ARIMA模型的信息準則值表
根據(jù)優(yōu)先選取信息準則,從AIC值最小的角度出發(fā)對模型進行優(yōu)化,以及根據(jù)模型的簡潔性原則,從上面各模型的表現(xiàn)可以看出模型ARIMA(1,2,14)×(1,0,2)24和ARIMA(1,2,14)×(2,0,2)24的AIC值相對比較小且比較接近,然而后者模型的階數(shù)較高,因此確定選取ARIMA(1,2,14)×(1,0,2)24模型進行擬合原始時間序列。擬合結(jié)果如表2所示,其中R的平方達到0.988,擬合程度很好。ARIMA模型參數(shù)如表3所示,差分后AR(1)系數(shù)為0.718,MA(1)、MA(2)、MA(3)、MA(14)系數(shù)分別為1.497、-0.690、0.171、0.022,季節(jié)性序列的SAR(1)系數(shù)為0.997,SMA(1)、SMA(2)的系數(shù)分別為0.909、0.072,系數(shù)顯著性檢驗的概率P-值都近似為0,全部拒絕系數(shù)為零的原假設(shè),因此系數(shù)都顯著不為0。此外,ARIMA(1,2,14)×(1,0,2)24殘差序列的白噪聲檢驗如圖6所示。
表2 ARIMA模型擬合結(jié)果表
表3 ARIMA(1,2,14)×(1,0,2)24模型參數(shù)表
圖6 ARIMA(1,2,14)×(1,0,2)24的殘差檢驗結(jié)果示例圖
綜上分析,得原始序列{Xt}的模型結(jié)構(gòu)如下:
(1-0.718B)(1-0.997B24)(1-B)2Xt=(1+1.497B-0.690B2+0.171B3)·(1+0.909B24+0.072B48)εt
(2)
式中:εt——WN(0,σ2),且?s 1.3.3 模型預(yù)測 利用ARIMA(1,2,14)×(1,0,2)24進行擬合預(yù)測,對西江梧州段2020年12月每天每小時水位進行樣本內(nèi)預(yù)測,可以看到擬合效果很好(見圖7)。 圖7 西江2020年12月每h水位預(yù)測值圖 對2021-01-01 24 h整點水位進行樣本外預(yù)測(見表4),預(yù)測值的絕對誤差值均較小,平均相對誤差為1.48%,擬合效果好。 表4 2021-01-01 24 h整點水位樣本外預(yù)測值表 本文根據(jù)西江梧州水文站水文數(shù)據(jù)2階差分序列變化內(nèi)較為平穩(wěn)的特征,利用傳統(tǒng)的單變量時間序列ARIMA模型進行短期水位預(yù)測。該模型從時間序列數(shù)值本身的相關(guān)性出發(fā),不僅能夠充分利用時間序列數(shù)值變化信息,而且能夠?qū)⑵渌绊懸蛩丶{入模型進行考慮,把相關(guān)因素的效應(yīng)關(guān)聯(lián)到時間變量中,克服相關(guān)因素的影響。通過對西江水位從2019-01-01至2020-12-31每天24 h的整點水位作為時間序列,進行建模、預(yù)測及效果評估,建立了ARIMA(1,2,14)×(1,0,2)24最優(yōu)模型,平均相對誤差為1.48%。本研究表明,ARIMA模型能夠在短期內(nèi)、實際降雨趨勢無較大波動時,對西江梧州下游段通航水位進行了較好的擬合預(yù)測。梧州市長洲船閘聯(lián)合調(diào)度的瓶頸問題是每年的枯水期,在兩廣交界的航道處的水深不足,航行條件較差,正值枯水期的西江水位變化趨勢較為平穩(wěn),適合應(yīng)用ARIMA模型即達到根據(jù)歷史水位值較好地預(yù)測未來水位,為船閘通航主管部門進行決策提供水情信息方面的數(shù)據(jù)參考依據(jù),以及為裝載貨物的船舶確定航行路線、出港配載等提供依據(jù),達到提升西江水運行業(yè)運力的目的。 對水位特征進行精準建模,從而精準預(yù)測水位的變化趨勢和數(shù)值,能夠充分發(fā)揮西江黃金水道的活力,對于釋放西江航運運力,落實2030年碳達峰、2060年碳中和具有非常積極的意義。2 結(jié)語