杜玉霞,梁 武,俞亭亭
(宿州學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 宿州 234000)
SPSS[1-2]統(tǒng)計(jì)軟件是使用最為普遍的統(tǒng)計(jì)軟件之一,它是由數(shù)據(jù)錄入、資料編輯、數(shù)據(jù)管理、統(tǒng)計(jì)分析、報(bào)表制作、圖形繪作為一個(gè)整體,具有強(qiáng)大的數(shù)據(jù)管理和分析功能,支持多種統(tǒng)計(jì)圖表的結(jié)果輸出.目前,SPSS廣泛應(yīng)用于特定區(qū)域的銷售分析、市場(chǎng)營(yíng)銷、統(tǒng)計(jì)、社會(huì)經(jīng)濟(jì)調(diào)查、企業(yè)管理、教學(xué)和行政管理等領(lǐng)域. 本文運(yùn)用SPSS軟件對(duì)西北電網(wǎng)電量需求進(jìn)行外推預(yù)測(cè),取得了較高的預(yù)測(cè)精度.
ARIMA(Autoregressive Integrated Moving Average)模型全稱差分自回歸移動(dòng)平均模型,是由博克斯(BOX)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的一種著名的時(shí)間序列預(yù)測(cè)方法,又稱為B-J模型.它的一般形式為:ARIMA(p,d,0),其中p是自回歸模型的階數(shù),d為時(shí)間序列成為平穩(wěn)時(shí)所做的差分次數(shù),q是移動(dòng)平均的階數(shù).ARIMA方法能夠在對(duì)數(shù)據(jù)模式未知的情況下找到適合數(shù)據(jù)所考察的模型,在醫(yī)學(xué)等很多方面得到了廣泛應(yīng)用[3-4].其建模思想是將預(yù)測(cè)對(duì)象隨時(shí)間推移而形成的數(shù)據(jù)序列視為一個(gè)隨機(jī)序列,用一定的數(shù)學(xué)模型來(lái)近似描述這個(gè)序列,并從時(shí)間序列的過(guò)去值及現(xiàn)在值來(lái)預(yù)測(cè)未來(lái)值.通過(guò)對(duì)模型的分析與研究,能夠從本質(zhì)上認(rèn)識(shí)時(shí)間序列的結(jié)構(gòu)與特征,達(dá)到最小方差意義下的最優(yōu)預(yù)測(cè).
以下就2005.1-2006.12西北電網(wǎng)電量需求數(shù)據(jù)(見(jiàn)表1),建立電量需求的ARIMA(p,d,q)模型. 繪制電量需求數(shù)據(jù)時(shí)序圖(見(jiàn)圖1).通過(guò)觀察圖1,可以看出數(shù)據(jù)呈現(xiàn)周期波動(dòng),并且存在明顯的遞增趨勢(shì).運(yùn)行SPSS軟件得到原始數(shù)據(jù)的自相關(guān)系數(shù)和自相關(guān)圖,見(jiàn)表2、圖2.
表1 2005.1-2006.12 西北電網(wǎng)電量需求 單位:億千瓦時(shí)
圖1 2005-2006年電力負(fù)荷時(shí)間序列數(shù)據(jù)序列圖
圖2 自相關(guān)圖
表2 自相關(guān)系數(shù)
圖3 一階差分的時(shí)序圖
圖4 一階差分后自相關(guān)圖
圖5 一階差分偏相關(guān)圖
圖6 ARIMA模型殘差的相關(guān)函數(shù)圖
由圖2和表2可以看出該序列延遲了4階后,相關(guān)系數(shù)衰減到接近0,然后又出現(xiàn)了較大的負(fù)相關(guān).這表明該序列具有顯著單調(diào)遞增的趨勢(shì).所以我們需要利用差分的方法對(duì)原序列進(jìn)行變換,剔除長(zhǎng)期趨勢(shì)使得序列變得平穩(wěn).進(jìn)行1階差分得時(shí)序圖3,自相關(guān)圖4,偏相關(guān)圖5.
觀察圖3可以看出一階差分后長(zhǎng)期趨勢(shì)基本上從序列中剔除,原序列變換成了平穩(wěn)時(shí)間序列,差分階數(shù)d=1,觀察圖4、5可以斷定p=1,q=0,確定西北電網(wǎng)電量需求的時(shí)間序列模型為ARIMA(1,1,0).
對(duì)于西北電網(wǎng)電量需求的ARIMA(1,1,0)模型,運(yùn)行SPSS軟件得模型參數(shù)見(jiàn)表3,殘差的相關(guān)函數(shù)圖見(jiàn)圖6,模型統(tǒng)計(jì)量見(jiàn)表4.
表3 ARIMA 模型參數(shù)
表4 模型統(tǒng)計(jì)量
從表3可以看出t統(tǒng)計(jì)量的值遠(yuǎn)小于0.05,表明此模型一階自回歸系數(shù)顯著.由圖6可以看出兩個(gè)圖形都沒(méi)有顯著的趨勢(shì)特征(拖尾或截尾),且殘差序列的自相關(guān)和偏自相關(guān)系數(shù)大多接近于零,這表明殘差序列已經(jīng)達(dá)到白噪聲,模型與數(shù)據(jù)擬合的較好.
由表4模型統(tǒng)計(jì)量中R方上來(lái)看,擬合優(yōu)度也達(dá)到了0.832,sig值為0.846遠(yuǎn)大于0.05,這說(shuō)明了構(gòu)建的ARIMA(1,1,0)模型的擬合效果良好,可以用來(lái)預(yù)測(cè)西北電網(wǎng)電量.
圖7 預(yù)測(cè)的擬合結(jié)果
運(yùn)行SPSS軟件,得擬合結(jié)果見(jiàn)圖7,從圖7預(yù)測(cè)的擬合曲線圖可以直觀的看出ARIMA(1,1,0)模型很好的擬合了原序列.運(yùn)用該模型進(jìn)行外推預(yù)測(cè)得2007.1-2007.3的預(yù)測(cè)結(jié)果見(jiàn)表5.
表5 預(yù)測(cè)結(jié)果
參考文獻(xiàn):
[1]郭志剛.社會(huì)統(tǒng)計(jì)分析方法—SPSS軟件應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,1999.
[2]李志輝,羅平.SPSS for Windows統(tǒng)計(jì)分析教程[M].北京:電子工業(yè)出版社,2006.
[3]周水森.ARIMA模型在瘧疾發(fā)病預(yù)測(cè)中的應(yīng)用[J].中國(guó)原生物學(xué)雜志,2007,2(4):284-286.
[4]吳家兵,葉臨湘,尤爾科.ARIMA模型在傳染病發(fā)病率預(yù)測(cè)中的應(yīng)用[J].數(shù)理醫(yī)藥學(xué)雜志,2007,20(1):90-92.