賀依韜 馬騰
摘? 要:徑流量預(yù)測是水文學(xué)研究的重要方向之一,開展徑流預(yù)測,對于區(qū)域水資源的綜合開發(fā)利用、合理配置、高效管理具有重要的指導(dǎo)作用。徑流序列可以視為典型的時(shí)間序列,SARIMA模型是一種常用的時(shí)間序列模型,能夠間接考慮其他相關(guān)隨機(jī)變量的變化,建模高效、便捷。該文在某水文站30年歷史月徑流量分析的基礎(chǔ)上,建立SARIMA模型對該水文站未來18個(gè)月的徑流量進(jìn)行預(yù)測,預(yù)測結(jié)果的確定性系數(shù)為0.8594,預(yù)測精度較高,對于該區(qū)域的水文工作的開展具有重要的現(xiàn)實(shí)意義。
關(guān)鍵詞:徑流預(yù)測? 時(shí)間序列? SARIMA模型? 模型評價(jià)
中圖分類號:TV214 ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2020)02(c)-0042-03
數(shù)據(jù)驅(qū)動(dòng)模型不以水文過程作為模型建立的基礎(chǔ),而是著重于數(shù)據(jù)關(guān)系的分析,建模方便高效,預(yù)測精度高。常見的數(shù)據(jù)驅(qū)動(dòng)模型有多元回歸分析、時(shí)間序列分析、神經(jīng)網(wǎng)絡(luò)等。其中多元回歸分析預(yù)報(bào)因子選擇困難,對預(yù)測精度影響較大,神經(jīng)網(wǎng)絡(luò)需要數(shù)據(jù)量大,預(yù)測結(jié)果不穩(wěn)定。時(shí)間序列模型通過少量數(shù)據(jù)就可做出精確的短期預(yù)測,因而被廣泛應(yīng)用,其中SARIMA模型是一種考慮到序列周期變化的時(shí)間序列建模方法。某一觀測或統(tǒng)計(jì)數(shù)值按其發(fā)生的時(shí)間先后順序形成的數(shù)列稱為時(shí)間序列[1]。水文觀測值按期觀測時(shí)間形成的數(shù)列是一種典型的時(shí)間序列[2]。
該文在水文時(shí)間序列分析的基礎(chǔ)上建立SARIMA模型對某水文站歷史月徑流量進(jìn)行擬合,選擇最優(yōu)模型對未來一段時(shí)間的月徑流量進(jìn)行預(yù)測,以期為該地區(qū)水文工作提供參考。
1? 研究方法
對于平穩(wěn)時(shí)間序列[4],一般可對其建立自回歸滑動(dòng)平均ARMA(p,q)模型,它是自回歸AR(p)模型和移動(dòng)平均MA(q)模型的組合,其模型的基本形式如式(1)。
yt=c+1yt-1+2yt-2+...+pyt-p+et+θ1et-1+θ2et-2+…+θqet-p? ? (1)
式(1)中,yt為時(shí)間序列第t時(shí)刻的觀察值;yt-1,yt-2,…,yt-p為時(shí)序yt的滯后序列;et,et-1,et-2,…,et-q為模型在第t期,第t-1期,…,第t-q期的誤差;1,2,…,p,θ1,θ2,…,θq為待估計(jì)參數(shù);c為常數(shù)項(xiàng)。
ARIMA(p,d,q)模型是ARMA模型的變換形式,其中d表示原始序列經(jīng)過d次差分后轉(zhuǎn)化為平穩(wěn)時(shí)間序列。某些時(shí)間序列中,存在明顯的周期性變化,這些周期是由于季節(jié)性變化(包括季度、月度等變化)或一些外部因素引起的,這類序列稱為季節(jié)性序列。對時(shí)間序列經(jīng)過有限次差分和季節(jié)差分,將隨機(jī)誤差的長久影響變成暫時(shí)影響,將其轉(zhuǎn)化為平穩(wěn)時(shí)間序列,在此基礎(chǔ)上建立季節(jié)性差分自回歸滑動(dòng)平均SARIMA(p,d,q)×(P,D,Q)s模型。
考慮到水文站月徑流量的影響因素眾多,流域下墊面條件復(fù)雜,建立過程驅(qū)動(dòng)模型所需數(shù)據(jù)較多,因此在其徑流特性分析的基礎(chǔ)上考慮對其建立時(shí)間序列模型并對其徑流量進(jìn)行預(yù)測。
2? 實(shí)例分析
該文收集了某水文站1987年1月到2018年6月共計(jì)378個(gè)月的徑流量資料,使用1987年1月到2016年12月共30年360個(gè)月的流量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),使用2017年1月到2018年6月共18個(gè)月的流量數(shù)據(jù)作為校驗(yàn)數(shù)據(jù),通過對訓(xùn)練數(shù)據(jù)進(jìn)行分析處理并建立SARIMA模型。最終把預(yù)測值和期望值進(jìn)行比較并評定預(yù)測精度。
2.1 實(shí)驗(yàn)數(shù)據(jù)預(yù)處理
原始數(shù)據(jù)存在明顯的以12個(gè)月為周期的波動(dòng)性并且不同時(shí)刻波動(dòng)浮動(dòng)差異較明顯,不滿足時(shí)間序列建模的必要條件。所以,考慮對原始數(shù)據(jù)進(jìn)行對數(shù)一階12次差分變化,以減小原始數(shù)據(jù)的波動(dòng)性和趨勢性。繪制變換后序列的自相關(guān)和偏相關(guān)圖,從自相關(guān)圖和偏自相關(guān)圖觀察該序列近似為一個(gè)平穩(wěn)過程且為非白噪聲序列,滿足時(shí)間序列建模的要求。
2.2 模型識別和參數(shù)估計(jì)
根據(jù)自相關(guān)圖和偏相關(guān)圖的拖尾性和截尾性進(jìn)行初步的模式識別。在初步識別的基礎(chǔ)上,建立可能的模型,通過最小二乘法估計(jì)其模型參數(shù)并計(jì)算統(tǒng)計(jì)量P值如表1所示,P值越小表示模型參數(shù)越顯著,其中紅色標(biāo)出的參數(shù)的P值不顯著為零(一般當(dāng)P值小于0.05則認(rèn)為該參數(shù)顯著),其中模型6,8的所有參數(shù)都顯著。在所有參數(shù)都顯著的模型中,根據(jù)AIC值和SBC值進(jìn)行模型優(yōu)選,AIC和SBC值越小代表模型的效果越優(yōu)良。
在模型6、8中,模型8的AIC值和SBC值均最小,所以模型8為所求的最優(yōu)模型,其模型表達(dá)式為:
yt=0.5208yt-1+0.4625yt-2-0.8253yt-12-0.9994et-2-0.9155et-24 (2)
2.3 模型檢驗(yàn)
對模型擬合值殘差進(jìn)行白噪聲檢驗(yàn),殘差序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)基本都在二倍置信區(qū)間內(nèi),通過計(jì)算殘差序列的P值全部大于0.05,沒有拒絕假設(shè)性實(shí)驗(yàn),相關(guān)系數(shù)與基本與零沒有顯著差異,該序列可被看作是白噪聲序列,說明模型擬合效果較好,信息提取較充分。
2.4 模型預(yù)測
模型建立完畢后,將訓(xùn)練數(shù)據(jù)輸入模型。除個(gè)別峰值處整體擬合效果比較理想,對2017年1月到2018年6月的徑流量進(jìn)行動(dòng)態(tài)預(yù)測,預(yù)測結(jié)果見圖1。
2.5 預(yù)測精度評定
對水文預(yù)報(bào)方案的有效性評定采用下列確定性系數(shù)dy進(jìn)行。dy越大,方案的有效性越高。
(3)
(4)
(5)
式中,Se為預(yù)報(bào)的均方差;σy為預(yù)報(bào)要素值的均方差;yi為實(shí)測值;y為預(yù)報(bào)值;為實(shí)測系列的均值;n為實(shí)測系列的點(diǎn)據(jù)數(shù)。評定方案的有效性時(shí)按表4中標(biāo)準(zhǔn)進(jìn)行。預(yù)報(bào)方案有效性達(dá)到甲(dy>0.90)、乙(dy處于0.70~0.90時(shí))兩個(gè)等級時(shí),方案可被用于作業(yè)預(yù)報(bào);方案等級為丙等(dy處于0.5~0.69時(shí))時(shí),只可用作參考性預(yù)報(bào);方案有效性低于丙等時(shí)不能用于作業(yè)預(yù)報(bào),只能做參考性評估。
計(jì)算此次預(yù)測的確定性系數(shù),得dy=0.8594,預(yù)報(bào)方案的有效性為乙等,說明該次預(yù)報(bào)效果較好,可用于作業(yè)預(yù)報(bào)。
3? 結(jié)語
該文在對某水文站30年歷年逐月徑流量序列分析的基礎(chǔ)上,建立了SARIMA模型對歷史徑流量進(jìn)行擬合。利用建立的最優(yōu)模型預(yù)測了2017年1月到2018年6月共18個(gè)月的徑流量。預(yù)測結(jié)果表明SARIMA模型在該水文站的月徑流量預(yù)測上有較好的效果,預(yù)測的確定性系數(shù)為0.8594,預(yù)報(bào)方案的有效性為乙等,可以用于作業(yè)預(yù)報(bào)。
參考文獻(xiàn)
[1] 李達(dá).基于時(shí)間序列分析方法的油田產(chǎn)量預(yù)測與應(yīng)用[D].蘭州理工大學(xué),2018.
[2] 程揚(yáng),王偉,王曉青.水文時(shí)間序列預(yù)測模型研究進(jìn)展[J].人民珠江,2019,40(7):18-23.
[3] 雷昌寧.基于SARIMA和SVR混合模型的黑河徑流量預(yù)測分析[D].蘭州大學(xué),2018.
[4] 龍?zhí)飕|.平穩(wěn)水文時(shí)間序列的極小值分布[D].重慶交通大學(xué),2017.