呂樹龍
(遼寧省水文水資源勘測(cè)局營(yíng)口分局,遼寧 營(yíng)口115003)
自然現(xiàn)象受自然界各種因素如氣候、環(huán)境及人為活動(dòng)影響,變化規(guī)律極其復(fù)雜,如水文現(xiàn)象中的雨量,用物理的方法加以分析,因影響因素未全面了解而導(dǎo)致分析模型的復(fù)雜和效果不理想。在降水量預(yù)測(cè)問題的研究中,針對(duì)準(zhǔn)確預(yù)測(cè)降水量和降水變化規(guī)律,利用時(shí)間序列預(yù)測(cè)模型(ARIMA)對(duì)降水量原始數(shù)據(jù)進(jìn)行處理,將非平穩(wěn)性數(shù)據(jù)處理成平穩(wěn)性數(shù)據(jù),采用能夠進(jìn)行時(shí)間序列分析的ARIMA模型對(duì)平穩(wěn)后的降水量進(jìn)行模擬,建立最優(yōu)降水量預(yù)測(cè)模型,并對(duì)實(shí)際降水量進(jìn)行預(yù)測(cè)對(duì)比。
ARIMA模型全稱為自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model,簡(jiǎn)記ARIMA),是由博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的時(shí)間序列預(yù)測(cè)方法,又稱為box-jenkins模型、博克思—詹金斯法。所謂ARIMA模型,是指將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量?jī)H對(duì)其滯后值及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括移動(dòng)平均過程(MA)、自回歸過程(AR)、自回歸移動(dòng)平均過程(ARMA)及ARIMA過程。
ARIMA模型的基本思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來近似描述這個(gè)序列。這個(gè)模型一旦被識(shí)別后可以從時(shí)間序列的過去值及現(xiàn)在值來預(yù)測(cè)未來值。
(1)根據(jù)時(shí)間序列的散點(diǎn)圖、自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖以ADF單位檢驗(yàn)其方差、趨勢(shì)及其季節(jié)性變化規(guī)律,對(duì)序列的平穩(wěn)性進(jìn)行識(shí)別。
(2)對(duì)非平穩(wěn)序列進(jìn)行平穩(wěn)化處理。如果數(shù)據(jù)序列是非平穩(wěn)的,并存在一定的增長(zhǎng)或下降趨勢(shì),則需要對(duì)數(shù)據(jù)進(jìn)行差分處理,如果數(shù)據(jù)存在異方差,則需對(duì)數(shù)據(jù)進(jìn)行技術(shù)處理,直到處理后的數(shù)據(jù)的自相關(guān)函數(shù)值和偏相關(guān)函數(shù)值平均值接近零。
(3)根據(jù)時(shí)間序列模型的識(shí)別規(guī)則,建立相應(yīng)的模型。若平穩(wěn)序列的偏相關(guān)函數(shù)是截尾的,而自相關(guān)函數(shù)是拖尾的,可斷定序列適合AR模型;若平穩(wěn)序列的偏相關(guān)函數(shù)是拖尾的,而自相關(guān)函數(shù)是截尾的,則可斷定序列適合MA模型;若平穩(wěn)序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)均是拖尾的,則序列適合ARMA模型。
(4)進(jìn)行參數(shù)估計(jì),檢驗(yàn)是否具有統(tǒng)計(jì)意義。
(5)進(jìn)行假設(shè)檢驗(yàn),診斷殘差序列是否為白噪聲序列。
(6)利用已通過檢驗(yàn)的模型進(jìn)行預(yù)測(cè)分析。
以營(yíng)口1960~2000年降水量數(shù)據(jù)作為分析樣本用于建立ARIMA模型,并進(jìn)行向前預(yù)測(cè),使用2001~2005年降水量數(shù)據(jù)進(jìn)行檢驗(yàn)。
首先在SPSS軟件平臺(tái)進(jìn)行降水量的錄入與定義日期,然后進(jìn)行數(shù)據(jù)序列圖的繪制,如圖1。
圖1 營(yíng)口市1960~2000年降水量序列
從圖1可以看出,該時(shí)間序列具有一定的向下趨勢(shì),并不平穩(wěn),需要進(jìn)行平穩(wěn)化處理。對(duì)數(shù)據(jù)進(jìn)行一階差分變換并繪制序列圖,可以看到差分后的序列在均值附近上下波動(dòng),序列基本平穩(wěn),如圖2所示。
圖2 降水量平穩(wěn)化序列
利用SPSS軟件繪制降水量1階差分的自相關(guān)和偏自相關(guān)圖,從圖3中可以看出一階差分后數(shù)據(jù)序列的自相關(guān)和偏自相關(guān)函數(shù)值較接近零,判定數(shù)據(jù)序列基本平穩(wěn)。由于對(duì)數(shù)據(jù)序列進(jìn)行一階差分,故ARIMA模型參數(shù)d取值為1。
圖3 降水量平穩(wěn)化序列自相關(guān)圖和偏自相關(guān)圖 單位:mm
根據(jù)自相關(guān)圖和偏自相關(guān)圖可以看出均表現(xiàn)為拖尾現(xiàn)象,適用于ARMA模型,偏自相關(guān)圖中1、2階函數(shù)超出置信區(qū)間,顯著不為0,之后趨于0,并呈現(xiàn)拖尾現(xiàn)象,故判斷p值取1或2;自相關(guān)圖中1階函數(shù)超出置信區(qū)間,顯著不為0,之后趨于0,并呈現(xiàn)拖尾現(xiàn)象,判斷q值取0或1。利用SPSS建立ARIMA模型分析判定,再運(yùn)用最佳準(zhǔn)則函數(shù)定階法,即BIC準(zhǔn)則。一般來講,在給出不同模型的BIC計(jì)算公式基礎(chǔ)上,選取BIC達(dá)到最小的那一組階數(shù)為理想階數(shù)。通過SPSS軟件的參數(shù)評(píng)估,最后選點(diǎn)ARIMA(2,1,1)模型最為合適。
圖4 殘差序列自相關(guān)圖和偏自相關(guān)圖
模型的顯著性檢驗(yàn)即為殘差序列的白噪聲檢驗(yàn),從SPSS的輸出結(jié)果來看ARIMA(2,1,1)模型的Ljung-Box 統(tǒng)計(jì)量Q=10.384,p值為0.795顯著大于0.05的檢驗(yàn)水平,因此可認(rèn)為這個(gè)序列為白噪聲序列。
從圖4分析,模型殘差服從以0為均值的平穩(wěn)隨機(jī)過程,是白噪聲的,說明模型效果較好。
利用SPSS建立ARIMA(2,1,1),使用1960~2000年降水量數(shù)據(jù)擬合分析,對(duì)2001~2005年降水量數(shù)據(jù)進(jìn)行預(yù)測(cè)檢驗(yàn),預(yù)測(cè)對(duì)比結(jié)果見表1及圖5。
表1 2001~2005年降水量預(yù)測(cè)值與實(shí)際值對(duì)比
從預(yù)測(cè)結(jié)果對(duì)比分析可以看出,利用SPSS建立的ARIMA(2,1,1)模型對(duì)2001~2005年降水量的預(yù)測(cè)值與實(shí)際值相差不大,相對(duì)誤差均在10%之內(nèi)。預(yù)測(cè)值的年度變化趨勢(shì)與實(shí)際值也相符,能夠反映出降水量的年際變化,可以作為一種手段用于早期的預(yù)測(cè)與趨勢(shì)分析。
圖5 2001~2005年降水量預(yù)測(cè)結(jié)果
ARIMA模型可以用于預(yù)測(cè)降水量的變化趨勢(shì)。由于影響降水量的因素很多,其中的自然因素錯(cuò)綜復(fù)雜,在建立預(yù)測(cè)模型時(shí),各種相關(guān)因子的考慮對(duì)預(yù)測(cè)結(jié)果至關(guān)重要,特別是當(dāng)今人類活動(dòng)已嚴(yán)重影響到天氣和氣候,過去的規(guī)律有可能被打破。本文運(yùn)用SPSS軟件針對(duì)降水量預(yù)測(cè)方面進(jìn)行探討,旨在進(jìn)一步挖掘SPSS軟件在水文、水資源等方面的運(yùn)用,為水文、水資源相關(guān)資料的統(tǒng)計(jì)與計(jì)算分析提供一種新的分析方法和手段。
[1]陳耀輝,李楚森.分?jǐn)?shù)階ARIMA模型的參數(shù)估計(jì)與預(yù)測(cè)[J].系統(tǒng)工程,2004,22(6):87-90.
[2]李紀(jì)人,劉德平.水文時(shí)間序列模型及預(yù)報(bào)方法[M].南京:河海大學(xué)出版社,1991.
[3]胡軍華,張慶波,鮑雷鳴.SPSS統(tǒng)計(jì)軟件在水文預(yù)報(bào)中的應(yīng)用[J].西北水電,2006(2):3-4.
[4]盧文岱.SPSS for windows應(yīng)用[M].北京:電子工業(yè)出版社,2002.