程 敏,張耀文,姜紀(jì)沂*,任 杰,趙振宏
(1.防災(zāi)科技學(xué)院,北京101601;2.中國地質(zhì)調(diào)查局西安地質(zhì)調(diào)查中心,西安710054)
降雨量的短期變化,往往會造成嚴(yán)重的干旱澇、洪災(zāi)害,并對當(dāng)?shù)亟?jīng)濟(jì)發(fā)展等造成不同程度的影響。高精度的降雨量預(yù)測方法能及早地發(fā)現(xiàn)降雨量變化情況,提高應(yīng)對此類災(zāi)害的能力[1]。降雨量是衡量干旱程度的一個重要指標(biāo),直接反映了自然界的變化,降雨量的大小直接影響農(nóng)業(yè)生產(chǎn)[2]。如能對降雨量做出科學(xué)準(zhǔn)確預(yù)測,農(nóng)業(yè)、水利等有關(guān)部門就可以及時采取防澇抗旱措施[3],降低不必要的損失,因此降雨量預(yù)測已成為當(dāng)前預(yù)測中的重要研究課題[4]。對于水資源短缺的北方來說,地下水是北方的主要用水來源,高精度的預(yù)測降雨量,能最大限度的利用水資源,將多余的水儲存起來,以緩解水資源短缺問題,降低因水資源短缺或極度缺少而帶來的經(jīng)濟(jì)損失。
基于這種情況,本文試圖運用時間序列中的ARIMA模型對該地區(qū)的降雨量進(jìn)行預(yù)測,進(jìn)而了解未來5年內(nèi)濟(jì)南市的降雨量變化情況。
濟(jì)南市坐落于魯西北沖積平原和魯中低山丘陵的接觸地帶,北部為黃河下游平原,南部為泰山山系,地勢北部低、南部高,平原稍微傾向東北,黃河沿西南—東北方向穿過濟(jì)南市所在的區(qū)域,黃河河床高出地面形成地上河,在黃兩岸發(fā)育有諸多的呈條帶狀的洼地。最高峰為南部西營鎮(zhèn)梯子山,地面標(biāo)高975.8m,如圖1。
圖1 濟(jì)南市水系分布
某種統(tǒng)計指標(biāo)的數(shù)值按時間先后順序排列所形成的數(shù)列叫做時間序列[5]。時間序列模型主要分為兩類,一是ARMA(Auto Regression Moving Average)模型,即自回歸移動平均模型[6];二是ARIMA(Auto Regressive Integrated Moving Average Model)模型,即自回歸積分滑動平均模型[7]。其實兩類模型可以看做是兩類模型的組合再加上差分運算,一類模型是AR; 一類模型是MA,ARMA模型可以看做是AR+MA;而ARIMA可以看做是AR+差分處理+MA。
在ARIMA(p,d,q)模型進(jìn)行預(yù)測時,所用序列必須是平穩(wěn)的序列,如果是非平穩(wěn)化的序列,就需將其轉(zhuǎn)化為平穩(wěn)化的序列[8]。
以濟(jì)南市1959~2010年降雨量數(shù)據(jù)作為本次分析樣本,在SPSS的預(yù)測選項中創(chuàng)建ARIMA模型,并進(jìn)行向前預(yù)測,使用2011~2015年降雨量數(shù)據(jù)檢驗ARIMA模型的預(yù)測準(zhǔn)確度,如圖2。
圖2 1959~2010年降雨量序列
在SPSS軟件平臺進(jìn)行降雨量的輸入與定義日期,然后進(jìn)行數(shù)據(jù)序列圖的繪制[9],如圖3。
從圖3可看出,該時間序列在1967,1985,2003年具有較大波動,但總體具有一定的向下趨勢,并不平穩(wěn)。需要對1959~2010年的降雨量數(shù)據(jù)進(jìn)行平穩(wěn)化處理。
圖3 降雨量平穩(wěn)化序列
在SPSS軟件中繪制的降雨量一階差分的自相關(guān)圖和偏自相關(guān)圖如圖4。可以看出,一階差分后數(shù)據(jù)序列的自相關(guān)系數(shù)在顯著不為0后趨于0,而一階差分后的偏自相關(guān)系數(shù)較接近0。判定數(shù)據(jù)序列基本平穩(wěn)。故ARIMA模型參數(shù)d取值為1。
圖4 自相關(guān)圖和偏自相關(guān)圖
根據(jù)自相關(guān)圖和偏自相關(guān)圖均表現(xiàn)為拖尾現(xiàn)象適用于ARMA模型,從偏自相關(guān)圖中可見在5%的顯著水平下,偏自相關(guān)系數(shù)顯著不為0的個數(shù)為3,之后趨于0,并呈現(xiàn)拖尾現(xiàn)象,故判斷p值取3或2(取2主要是因為最后一個顯著超過0的階數(shù)是由于偶然出現(xiàn)的,確定p值時需要剔出); 從自相關(guān)圖中可看出在5%的顯著水平下,自相關(guān)系數(shù)顯著為零的個數(shù)為6,故判斷q值取6或5(取5主要是最后一個顯著超過0的系數(shù)是由于偶然出現(xiàn)的,確定p值時需要剔出)。利用SPSS建立ARIMA模型,經(jīng)過前期的預(yù)測對比分析,根據(jù)SPSS中輸出的模型統(tǒng)計量表格中的BlC值確定最佳模型。一般來講,選取BIC達(dá)到最小的模型為最佳模型。
經(jīng)過前期數(shù)據(jù)處理與分析,模型可初定為ARIMA (3,1,6)、ARIMA (3,1,5)、ARIMA (2,1,6)ARIMA(2,1,5)。用SPSS軟件作擬合圖比較4種模型擬合(如圖5),檢驗選擇模型的準(zhǔn)確性。根據(jù)BIC定階準(zhǔn)則選出最優(yōu)模型,如表1??芍P虯RIMA(2,1,5)BIC值最小,其值為11.654。
圖5 4種模型擬合
表1 4種模型BIC比較
由于預(yù)測準(zhǔn)確度分析的年份為2011~2015年,ARIMA(2,1,5)的預(yù)測趨勢跟觀察值的走勢基本一致,而其他3個模型的預(yù)測趨勢都偏離了觀察值的走勢,所以ARIMA (2,1,5)的擬合效果最好。同時,ARIMA(2,1,5)模型的BIC值最小,可選取此模型作為最后的預(yù)測模型。
對殘差序列進(jìn)行白噪聲檢驗,根據(jù)SPSS中輸出的模型統(tǒng)計量表來看,ARIMA(2,l,5)模型的Ljung-Box統(tǒng)計量Q=7.734。p值為0.737顯著大于0.05的檢驗水平,即接受Ljung-Box的原假設(shè):所有數(shù)據(jù)之間相互獨立,可認(rèn)為殘差序列為白噪聲序列[9]。
模型殘差序列的自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的分布在以0為中心的范圍內(nèi),并且自相關(guān)系數(shù)與偏自相關(guān)系數(shù)的絕對值均小于0.3(如圖6),認(rèn)為此殘差序列之間是相互獨立的,意味著殘差序列是白噪聲的。模型涵蓋了所有的信息,說明此模型效果較好。
圖6 殘差序列自相關(guān)和偏自相關(guān)
綜上,ARIMA(2,1,5)符合BIC準(zhǔn)則,通過了擬合度檢驗與白噪聲檢驗,因此可以用ARIMA(2,1,5)對降雨量進(jìn)行預(yù)測。表明濟(jì)南市2010~2015年降雨量預(yù)測同樣適用ARIMA(2,1,5)預(yù)測。
本次選擇了ARIMA(2,1,5),利用濟(jì)南市1959~2010年的降雨量數(shù)據(jù),對該地區(qū)2011~2015年的降雨量進(jìn)行預(yù)測,如表2、表3、表4。
表2 ARIMA預(yù)測值與實際值統(tǒng)計 單位:mm
表3 ARIMA預(yù)測值與實際值統(tǒng)計 單位:mm
表4 ARIMA的預(yù)測值與實際值統(tǒng)計 單位:mm
從表2、表3和表4看出,ARIMA模型預(yù)測年限為4年。表2中2011~2015年的平均相對誤差為5.74%,預(yù)測精度控制在10%以內(nèi);2014年以后,預(yù)測精度大于10%。表3中2010~2015年平均相對誤差4.9%,預(yù)測精度控制在10%以內(nèi);2015年預(yù)測精度大于10%。表4中2010~2013年平均相對誤差為2.2%,預(yù)測精度控制在10%以內(nèi),其中2010年和2013年的預(yù)測精度為1.0%,逼近實際觀測值,預(yù)報準(zhǔn)確。由此推測,ARIMA模型對降雨量的預(yù)測在連續(xù)的4~5年內(nèi)對降雨量的預(yù)測非常準(zhǔn)確。
同樣方法,在SPSS軟件分析預(yù)測選項中對2016~2020年降雨量進(jìn)行預(yù)測,如表5。
表5 2016~2020年降雨量預(yù)測值 單位:mm
2016~2020年濟(jì)南市的降雨量較平穩(wěn),波動較小,大多分布在濟(jì)南市的平均降雨量672.8mm周圍。預(yù)測結(jié)果看出,濟(jì)南市2016~2020年不會發(fā)生較大洪水,但ARIMA模型預(yù)測降雨量不一定準(zhǔn)確,因降雨量受較多因素影響,僅憑時間序列是不能完全準(zhǔn)確的預(yù)測降雨量。
通過模型確定,綜合1959~2015年的降雨量數(shù)據(jù),時間序列,如圖7。從圖7可看出,1959~1991年30多年內(nèi),這段時期內(nèi)降雨量波動較大,而1992~2015年,這段時期內(nèi)降雨量波動較??;從大趨勢來看,濟(jì)南市降雨量逐漸減少。
2016~2020年降雨量進(jìn)行預(yù)測,結(jié)果表明,這5年濟(jì)南市降雨量波動較小,大多在650mm上下波動,預(yù)計接未來5年沒有大的旱災(zāi)和洪災(zāi)。
圖7 1959~2015年降雨量序列
從原理來看,ARIMA模型具有一定的數(shù)理統(tǒng)計意義,即ARIMA模型具有偶然性,且這種偶然性會隨著預(yù)測時間長短變化而變化,可能會隨著時限增加而這種偶然性出現(xiàn)的頻率增加,同時也有可能隨著預(yù)測時限的縮短而增長(預(yù)測時限越短,其預(yù)測準(zhǔn)確度會有一定提高)。
(1)用ARIMA模型對濟(jì)南市未來5年的年降雨量進(jìn)行預(yù)測,其結(jié)果顯示未來5年的年平均降雨量為659.2mm,這 與1959~2015年的多年平均降雨量672.8mm較為接近,說明濟(jì)南市未來5年出現(xiàn)干旱及洪澇災(zāi)害的可能性較小。
(2)濟(jì)南市降雨量的變化呈現(xiàn)出一個逐漸減小的趨勢,說明濟(jì)南市地下水的大氣降雨補(bǔ)給量將會出現(xiàn)下降趨勢,需要更加合理地利用和分配水資源。
(3)由于影響一個地區(qū)降雨量的因素很多,諸如地區(qū)緯度的差異,氣溫變化、所處地理位置、生態(tài)環(huán)境的因素(植被的覆蓋率,流域的分布狀況)[10],以及人為影響因素等,所以只用時間序列分析方法來預(yù)測降雨量的效果較差,需考慮多方面的因素,綜合現(xiàn)有的預(yù)測模型,建立適合當(dāng)?shù)氐慕涤炅款A(yù)測模型,從而使得降雨量預(yù)測更為可靠。