劉德林
(河南理工大學(xué) 應(yīng)急管理學(xué)院,河南 焦作 454000)
鄭州市年降水量的ARIMA模型預(yù)測
劉德林
(河南理工大學(xué) 應(yīng)急管理學(xué)院,河南 焦作 454000)
鄭州市是我國嚴(yán)重缺水的城市之一。為掌握該市降水資源變化狀況,提供區(qū)域水資源合理開發(fā)利用的依據(jù),運(yùn)用差分自回歸滑動(dòng)平均模型(ARIMA),在對(duì)鄭州市1951-2008年降水量數(shù)據(jù)進(jìn)行預(yù)處理、模式識(shí)別、參數(shù)估計(jì)與模型檢驗(yàn)的基礎(chǔ)上,建立了鄭州市年降水量的ARIMA(2,1,2)預(yù)測模型。結(jié)果表明:該模型預(yù)測相對(duì)誤差范圍為-6.36%~0.49%,預(yù)測精度較高,可以用于該區(qū)未來降水量的短期預(yù)測。
鄭州市;年降水量;ARIMA;預(yù)測
鄭州市是中國嚴(yán)重缺水的城市之一,全市人均水資源量僅為198m3,不足河南人均的1/2及全國人均的1/10[1]。而作為自然界水循環(huán)重要環(huán)節(jié)的大氣降水是該區(qū)水資源的主要補(bǔ)給來源,其大小決定著該區(qū)水資源的豐富程度[2]。因此,研究鄭州市年降水量的變化趨勢并對(duì)未來降水量進(jìn)行合理預(yù)測,將有利于該區(qū)水資源的合理開發(fā)利用。然而,受下墊面性質(zhì)與氣象條件復(fù)雜多樣及變異性的影響,降水過程存在著大量的隨機(jī)性與不確定性,目前還難以通過物理成因來準(zhǔn)確預(yù)測未來某一時(shí)段的降水量,同時(shí)傳統(tǒng)的趨勢外推預(yù)測模型也不適合該類時(shí)間序列數(shù)據(jù)的預(yù)測[3]。統(tǒng)計(jì)學(xué)家G.E.P.Box與G.M.Jenkins于20世紀(jì)70年代提出的差分自回歸滑動(dòng)平均模型(Auto-Regressive Integrated Moving Average Model,簡稱ARIMA)可用于非平穩(wěn)時(shí)間數(shù)據(jù)序列的分析、預(yù)報(bào)與控制[4]。與平穩(wěn)時(shí)間序列、周期時(shí)間序列模型相比,該建模方法在數(shù)學(xué)上更為完善,預(yù)測精度更高[5]。因此,本文以鄭州市1951-2008年逐年降水量為基礎(chǔ),在對(duì)年降水序列進(jìn)行平穩(wěn)性和正態(tài)分布檢驗(yàn)的基礎(chǔ)上,通過模式識(shí)別、參數(shù)估計(jì)和模型檢驗(yàn)等步驟,采用數(shù)據(jù)處理軟件DPS 7.05經(jīng)過多次擬合優(yōu)選[6],建立鄭州市年降水量預(yù)測精度較高的ARIMA(2,1,2)預(yù)測模型。
ARIMA建模的基本思路是假設(shè)所研究的時(shí)間序列是由某個(gè)隨機(jī)過程產(chǎn)生的非平穩(wěn)時(shí)間序列,對(duì)該非平穩(wěn)時(shí)間序列數(shù)據(jù)進(jìn)行若干次差分處理,使其變成平穩(wěn)時(shí)間序列,然后用時(shí)間序列的觀測值去建立該隨機(jī)過程的自回歸滑動(dòng)平均模型,用所建立的最優(yōu)模型進(jìn)行預(yù)測。該模型共有3個(gè)參數(shù),分別是自回歸階數(shù)(p)、差分次數(shù)(d)和滑動(dòng)平均階數(shù)(q),通常被記作ARIMA(p,d,q)。其通用表達(dá)式為:
式中:Xt——研究的時(shí)間序列數(shù)據(jù);ψ1,ψ2,…,ψp——自回歸系數(shù);p——自回歸階數(shù);θ1,θ2,…,θq——滑動(dòng)平均系數(shù);q——滑動(dòng)平均階數(shù);εt——白噪聲序列。
該模型體現(xiàn)了對(duì)p階自回歸模型的誤差εt進(jìn)行q階修正的預(yù)測思想。由于模型以多項(xiàng)和的形式出現(xiàn),因此p,q伸縮自如,加之差分處理(d),使模型能適應(yīng)于任何類型的時(shí)間數(shù)列[8]。運(yùn)用ARIMA模型進(jìn)行建模預(yù)測一般包括數(shù)據(jù)預(yù)處理、模式識(shí)別、參數(shù)估計(jì)和模型檢驗(yàn)4個(gè)步驟。
(1)數(shù)據(jù)預(yù)處理。包括數(shù)據(jù)序列的正態(tài)性檢驗(yàn)與差分平穩(wěn)化處理,其主要目的是使時(shí)間序列數(shù)據(jù)滿足建立ARIMA模型的前提條件,提高預(yù)測的精度。當(dāng)時(shí)間序列正態(tài)檢驗(yàn)的卡方值和Daniel檢驗(yàn)的秩相關(guān)系數(shù)的p值大于0.05時(shí),表明數(shù)據(jù)正態(tài)分布且處于平穩(wěn)狀態(tài),反之亦然。
(2)模式識(shí)別。又稱模型定階,是ARIMA建模的關(guān)鍵。一般ARIMA(p,d,q)模型的定階方法主要是依據(jù)樣本自相關(guān)系數(shù)(ACF)與偏相關(guān)系數(shù)(PACF)的截尾性、拖尾性和周期性進(jìn)行[5,7]。但因該模型結(jié)構(gòu)復(fù)雜,AR部分的ACF和MA部分的ACF會(huì)相互影響,因此,本文采用從低階 ARIMA(1,1,1)模型進(jìn)行嘗試,結(jié)合最小信息量AIC準(zhǔn)則并考慮相關(guān)系數(shù)R及擬合度C的大小來確定模型的階次。如果AIC值較小且R值及擬合度C值較大,則說明模型的擬合效果越好。AIC準(zhǔn)則可定義為:
式中:L——模型的極大似然函數(shù);k——模型的獨(dú)立參數(shù)個(gè)數(shù)。
(3)參數(shù)估計(jì)。ARIMA模型的參數(shù)辨識(shí)采用麥夸特(Marquardt)非線性最小二乘法進(jìn)行。
(4)模型檢驗(yàn)。如果所建模型合適,根據(jù)定義,殘差序列εt應(yīng)為白噪聲序列。因此,模型檢驗(yàn)主要是殘差序列的白噪聲檢驗(yàn)。由殘差εt的樣本自相關(guān)函數(shù)ρk(εt)構(gòu)造box-pierce的修正統(tǒng)計(jì)量Q。
式中:ρk(εt)——?dú)埐瞀舤的樣本自相關(guān)函數(shù);Q——統(tǒng)計(jì)量;n——樣本容量;D——差分后損失的數(shù)據(jù)個(gè)數(shù);m一般取N/4,k,εt符號(hào)含義同前。在一定顯著性水平α(一般α取0.05或0.01)下,根據(jù)卡方分布表查得臨界值χ2α(m-p-q),若Q≤χ2α(m-p-q),則認(rèn)為模型是合適的,否則需要對(duì)模型的殘差作進(jìn)一步的識(shí)別或重新構(gòu)造模型。
從中國地面氣候資料國際交換站鄭州氣象站和《河南統(tǒng)計(jì)年鑒》收集并計(jì)算鄭州市1951-2008年逐年降水資料,利用1951-2005年的數(shù)據(jù)作為建模數(shù)據(jù)序列,2006-2008年數(shù)據(jù)作為模型檢驗(yàn)序列,在DPS平臺(tái)上進(jìn)行ARIMA建模分析。
由正態(tài)性檢驗(yàn)卡方值的顯著水平(p=0.01<0.05)和Daniel檢驗(yàn)結(jié)果的顯著水平(p=0.035<α=0.05)可知,該時(shí)間序列呈非正態(tài)分布且處于非平穩(wěn)狀態(tài),因此,須對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換或差分處理。對(duì)原始降水?dāng)?shù)據(jù)進(jìn)行一階差分后發(fā)現(xiàn),降水時(shí)間序列卡方值的顯著水平p=0.97>0.05且Daniel檢驗(yàn)結(jié)果的顯著水平p=0.363>0.05,表明差分后的降水時(shí)間序列已呈正態(tài)分布且處于平穩(wěn)狀態(tài),達(dá)到ARIMA模型的建模要求。
本文采用麥夸特非線性最小二乘法進(jìn)行模型的參數(shù)估計(jì)。采用從低階到高階依次嘗試的方法確定模型的階次,取d=1,即模型為 ARIMA(p,1,q)。通過從低階次到高階次對(duì)p和q的不同取值分別進(jìn)行擬合和參數(shù)估計(jì),得到時(shí)間序列不同的ARIMA模型(表1)。根據(jù)AIC值越小、相關(guān)系數(shù)R值及擬合度C值越大模型擬合效果越好的原則,可發(fā)現(xiàn)較為理想的模型是 ARIMA(2,1,2)
表1 ARIMA(p,1,q)模型判定指標(biāo)
對(duì)殘差序列εt進(jìn)行檢驗(yàn)得Q=14.88。查自由度df=15,α=0.005時(shí),χ2=32.8,可見殘差序列的Q值遠(yuǎn)遠(yuǎn)小于顯著水平0.005下的卡方值,說明殘差序列εt在極顯著水平下為白噪聲,模型有效。同時(shí),通過對(duì)鄭州市2006-2008年降水量的預(yù)測值與實(shí)際值比較發(fā)現(xiàn)(表2),預(yù)測值與實(shí)際值差異較小,說明ARIMA(2,1,2)模型具有較高的預(yù)測精度,可用于鄭州市年降水量的預(yù)測。此外,從擬合值與實(shí)測值的曲線圖(圖1)來看,模型預(yù)測值與實(shí)測值擬合較好,除在個(gè)別年份差異稍大外(如1953年和1968年),其他年份誤差都很小,這也表明了模型擬合的結(jié)果是可靠的。
表2 鄭州市降水模型ARIMA(2,1,2)預(yù)測精度分析
圖1 鄭州市年降水量模擬值和實(shí)測值比較
通過對(duì)1951-2005年鄭州市年降水量進(jìn)行時(shí)間序列分析,在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、模式識(shí)別、參數(shù)估計(jì)和模型檢驗(yàn)的基礎(chǔ)上,選擇了 ARIMA(2,1,2)模型對(duì)鄭州市年降水量進(jìn)行模擬與預(yù)測。
(1)除在個(gè)別年份模擬值與實(shí)測值差異稍大外(如1953年和1968年),其他年份誤差都很小,這說明該模型擬合效果較好、結(jié)果可靠。
(2)利用該模型對(duì)2006-2008年鄭州市年降水量進(jìn)行預(yù)測,預(yù)測值與實(shí)際值差異較小,相對(duì)誤差基本控制在10%以內(nèi),說明 ARIMA(2,1,2)模型具有較高的預(yù)測精度,可用于鄭州市年降水量的預(yù)測。
但考慮到降水是一個(gè)復(fù)雜多變的動(dòng)態(tài)系統(tǒng),受地區(qū)維度差異、氣溫變化、植被覆蓋、流域分布等多因素的綜合影響,該模型雖然對(duì)鄭州市年降水的預(yù)測較為精確,但是否適用于其他地區(qū),還有待進(jìn)一步驗(yàn)證。
[1]李春曉.鄭州市水資源極度短缺,人均占有量不足全國1/10[N].東方今報(bào),2011-03-03(A10).
[2]王友賀,谷秀杰,師麗魁,等.鄭州市降水特征分析與水資源問題初探[J].氣象與環(huán)境科學(xué),2007,30(3):61-64.
[3]張杰,劉小明,賀玉龍,等.ARIMA模型在交通事故預(yù)測中的應(yīng)用[J].北京工業(yè)大學(xué)學(xué)報(bào),2007,33(12):1295-1298.
[4]Box G E P,Jenkins G M.Time series analysis:Forecasting and control[M].San Francisco:San Francisco Press,1978.
[5]劉賢趙,邵金花.煙臺(tái)地區(qū)降水量的ARIMA隨機(jī)模型研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006,6(8):8-12.
[6]唐啟義,馮光明.DPS數(shù)據(jù)處理系統(tǒng)[M].北京:科學(xué)出版社,2007.
[7]衛(wèi)小英,霍麗驪.博克思-詹金斯預(yù)測方法簡介[J].預(yù)測,1984(Z1):35-39.
[8]趙亮,吳艷喬,雷??疲?運(yùn)用ARIMA模型對(duì)我國人均衛(wèi)生費(fèi)用的預(yù)測[J].現(xiàn)代預(yù)防醫(yī)學(xué),2010,7(3):410-412.
Annual Precipitation Forecasting of Zhengzhou City Based on ARIMA Model
LIU De-lin
(Emergency Management School,He'nan Polytechnic University,Jiaozuo,He'nan454000,China)
Zhengzhou City is one of serious water shortage cities in China.In order to realize the change state of precipitation,and to provide the basis for the rational development and utilization of water resources,we applied ARIMA model to establish the ARIMA (2,1,2)model for the annual precipitation forecasting of Zhengzhou City.Some works including the data preprocessing,pattern recognition,parameter estimation and model checking have been done before the establishment of this model.The results showed that the forecast of ARIMA(2,1,2)model is exact,the relative error ranges from -6.36%to 0.49%.The model can be used for short-term forecast of annual precipitation.
Zhengzhou City;annual precipitation;ARIMA;forecasting
P333.6
A
1005-3409(2011)06-0249-03
2011-04-24
2011-05-12
河南省教育廳自然科學(xué)基金(2009A170003);河南理工大學(xué)博士基金(B2011-033);河南省政府決策研究招標(biāo)課題(2011B231)
劉德林(1979-),男,山東濰坊人,博士,講師,主要從事水土資源高效利用與應(yīng)急管理方面的研究與工作。E-mail:liudelina@163.com