鄭江松
(湖北工業(yè)大學電氣與電子工程學院,湖北武漢430068)
基于季節(jié)性ARIMA模型的河流觀測點流量的時序分析
鄭江松
(湖北工業(yè)大學電氣與電子工程學院,湖北武漢430068)
采用季節(jié)性ARIMA模型擬合1960~2009年某河流觀測點流量。通過比較,得到ARIMA(1,0,0)×ARIMA(0,1,1)12模型,并用這一模型預測2010年1~12月的流量,預測效果顯著。
流量;ARIMA模型;差分;時間序列
河流流量是指單位時間內(nèi)通過某一過水斷面的水量。影響河流流量的因素很多,包括雨水、融水、支流補充、流域內(nèi)植被分布、人類利用等方面,其變化趨勢既存在確定性,也存在不確定性因素影響,目前很難通過數(shù)值模擬準確預測某個觀測點的流量[1-2]。筆者以某河流觀測點1960~2009年流量數(shù)據(jù)為基礎(chǔ),對流量時間序列進行數(shù)學建模,使用R軟件[3]進行多次擬合試驗,并比較了2010年實際流量與預測流量。
研究對象為甘肅省某河流某觀測點徑流量;本文中用到的原始數(shù)據(jù)來源于當?shù)厮挠^測站1960~2009年實際觀測的數(shù)據(jù)。
2.1季節(jié)性ARIMA模型原理
ARIMA模型是由統(tǒng)計學家Box與Jenkins共同提出的,也叫Box-Jenkins模型,旨在解決含有確定趨勢的非平穩(wěn)時間序列的建模問題[4-5]?;舅枷胧牵?)通過差分,將非平穩(wěn)過程變?yōu)槠椒€(wěn)過程;2)進行模式識別,建立最優(yōu)模型能夠描述這一過程;3)預測趨勢。
ARIMA模型分為ARIMA(p,d,q)模型和ARI-MA(p,d,q)×(P,D,Q)S季節(jié)乘積模型,前者用于擬合差分后具有短期相關(guān)性的時間序列,后者為具有季節(jié)性的時間序列建模。本文中所采用的模型為后者,其具體模型結(jié)構(gòu)如下:
式中:S為步長。
2.2建模步驟
1)數(shù)據(jù)的初始操作,對序列進行處理使其滿足模型假設(shè),本文中對序列進行了對數(shù)處理。
2)進行平穩(wěn)性檢驗,檢驗序列是否平穩(wěn)。
3)由自相關(guān)和偏自相關(guān)分析得到季節(jié)性周期T。
4)對序列嘗試差分運算,消除季節(jié)性影響,得到平穩(wěn)序列,從而確定出d和D。
5)模型的識別與定階根據(jù)自相關(guān)函數(shù)與偏自相關(guān)函數(shù)的形態(tài),通過嘗試,確定p,q和P,Q,對于混合模型,很難明顯地對模型定階,因此在實際應(yīng)用中階數(shù)一般選擇0,1,2。通過不同的階數(shù)組合,根據(jù)其BIC值,選擇最為合適的p,q和P,Q值。
6)對未來趨勢進行預測。
3.1數(shù)據(jù)的平穩(wěn)性分析和初始處理
通過時序圖(圖1),可看出流量變化較大,具有明顯的季節(jié)周期性,而且年與年之間的差別也較大,因此可斷定流量為非平穩(wěn)時間序列,為了使數(shù)據(jù)波動幅度基本穩(wěn)定,對數(shù)據(jù)進行對數(shù)變換,即
圖1 河流流量時序圖
圖2 a反映出自相關(guān)系數(shù)的衰減過程,其值衰減過程緩慢,呈現(xiàn)出明顯的正余弦波動規(guī)律;圖2 b反映的是偏自相關(guān)函數(shù)的衰減過程,其值也沒有迅速衰減為0。
圖2 河流流量偏自相關(guān)圖
3.2對序列進行差分處理
由于序列本身并不存在明顯的上升或者下降趨勢,僅具有季節(jié)性的周期性趨勢,對該序列進行平穩(wěn)性處理,只需對序列進行一次1階12步的差分處理,此時d為0,D為12。
圖3 a表明其自相關(guān)系數(shù)拖尾,12階出現(xiàn)較大的自相關(guān)系數(shù),24階和36階的自相關(guān)系數(shù)也在2倍的標準差外;圖3 b表明其偏自相關(guān)系數(shù)1階迅速截尾,除了12階、24階和36階的偏自相關(guān)系數(shù)在2倍標準差外,其余大部分在2倍標準差以內(nèi)。
圖3 1階12步差分后序列的自相關(guān)和偏自相關(guān)圖
3.3定階嘗試與檢驗
根據(jù)1階12步差分后序列的自相關(guān)圖與偏自相關(guān)圖,可以嘗試根據(jù)最小BIC值找到最優(yōu)模型。
1)ARIMA(1,0,0)×ARIMA(0,1,2)12BIC統(tǒng)計量為775.69。
2)ARIMA(1,0,0)×ARIMA(0,1,3)12BIC統(tǒng)計量為775.86。
3)ARIMA(2,0,0)×ARIMA(0,1,2)12BIC統(tǒng)計量為780.56。
4)ARIMA(1,0,0)×ARIMA(0,1,1)12BIC統(tǒng)計量為770.32。
比較發(fā)現(xiàn)ARIMA(1,0,0)×ARIMA(0,1,1)12模型的BIC統(tǒng)計量最小,因此選擇這一模型。
3.4模型檢驗
一個好的模型應(yīng)該滿足如下要求:1)標準化的殘差沒有波動性聚集;2)殘差的自相關(guān)函數(shù)沒有顯著的自相關(guān)性;3)Ljung-Box統(tǒng)計量的p值都高于顯著性水平,表明殘差沒有任何模式,模型中的信息已經(jīng)完全被提取,剩余的僅僅是噪聲。
通過R軟件的tsdiag函數(shù)產(chǎn)生標準化殘差圖,殘差自相關(guān)圖和LB統(tǒng)計量圖。通過圖4可以發(fā)現(xiàn)標準化殘差沒有波動率聚集;圖5的殘差自相關(guān)函數(shù)0階截尾,說明殘差不存在自相關(guān)關(guān)系;圖6的LB統(tǒng)計量都在0.05的顯著性水平之上。從而可以斷定序列的信息被完全提取,剩余的僅僅是噪聲。
圖4 標準化殘差圖
圖5 殘差自相關(guān)函數(shù)圖
圖6 LB統(tǒng)計量圖
3.5模型預測
根據(jù)上述所選的模型,估計出參數(shù)AR1為0.253 7,SMA1為-0.735 4。因此模型可以表示為
根據(jù)上述模型,該河流觀測點預測2010年1~12月流量數(shù)據(jù)見表1。由表1可看出:對某河流觀測點月流量,使用季節(jié)乘積ARIMA模型建模,建立的ARIMA(1,0,0)×ARIMA(0,1,1)12模型預測效果顯著,因此所建立的模型具有一定的實際意義。
表1 根據(jù)模型所做的預測值、實際值和相對誤差
[1]安鴻志,陳兆國,杜金觀,等.時間序列的分析與應(yīng)用[M].北京:科學出版社,1983:124-150.
[2]楊位欽,顧嵐.時間序列分析與動態(tài)數(shù)據(jù)建模[M].北京:北京理工大學出版社,1988:163-189.
[3]J H Maindonald.Statistical Computation[M].New York: John Wiley,1984:193-215.
[4]S M Pandit,Shien Ming Wu.Time Series and System Analysis with Applications[M].New York:John Wiley,1983:142-165.
[5]Box G E P,Jenkins G M.Time Series Analysis,F(xiàn)orecasting and Control[M].San Francisco:Holden Dovy,1970:157-182.
Time Series Analysis on Flow of Observation Point for a River Based on Season ARIMA Model
Zheng Jiangsong
(School of Electrical and Electronic Engineering,Hubei University of Technology,Wuhan 430068,China)
Flow of the observation point for a river from 1960 to 2009 was simulated with season ARIMA model.As a result,ARIMA(1,0,0)×ARIMA(0,1,1)12 model was obtained.Flow of the river in 2010 was alsoforecasted with themodel.Theresultsshowtheforecastingabilityofthemodelisstrong.
flow;ARIMA model;difference;time series
C81;O212
A
1008-5483(2016)03-0069-03
10.3969/j.issn.1008-5483.2016.03.016
2016-04-07
鄭江松(1991-),男,湖北武漢人,碩士生,從事應(yīng)用經(jīng)濟學方面的研究。E-mail:2107643098@qq.com