曹昱東,王 浩
(北京師范大學(xué)珠海分校,廣東珠海,519085)
隨著經(jīng)濟(jì)的不斷發(fā)展,城市生活垃圾產(chǎn)生量也越來越多,這些生活垃圾嚴(yán)重阻礙了城市的發(fā)展,帶來了一系列經(jīng)濟(jì)、社會(huì)、環(huán)境問題。全國大部分城市都面臨著垃圾快速增長而處理垃圾的設(shè)施多年不變的局面。幾乎2/3的城市已經(jīng)被垃圾所包圍,而且這種情況日益嚴(yán)峻。城市生活垃圾問題也受到政府的強(qiáng)烈關(guān)注,準(zhǔn)確的預(yù)測未來城市生活垃圾產(chǎn)生量是解決城市生活垃圾問題的第一步,也是關(guān)鍵一步。
ARIMA模型的全稱是求和自回歸移動(dòng)平均模型,ARIMA(p,d,q)模型。使用 ARIMA 模型去做預(yù)測,通俗的講,就是將需要預(yù)測的對象隨時(shí)間變化的數(shù)據(jù)作為一個(gè)隨機(jī)序列,然后分析出這個(gè)序列的特點(diǎn)與性質(zhì),從而通過時(shí)間序列過去的數(shù)值來推測未來的走勢。ARIMA(p,d,q)模型具有以下三條性質(zhì):
在獲取一個(gè)觀察值序列之后,首先是判斷它的平穩(wěn)性,通過平穩(wěn)性檢驗(yàn),可以把序列分為平穩(wěn)序列和非平穩(wěn)序列兩種,要用ARIMA模型進(jìn)行數(shù)據(jù)分析,所分析的序列必須是平穩(wěn)序列,而非平穩(wěn)的序列則不能直接通過ARIMA模型計(jì)算,需要將非平穩(wěn)序列轉(zhuǎn)化為平穩(wěn)序列。這里轉(zhuǎn)化的過程就是一種有效提取序列中蘊(yùn)含的確定性信息的過程。對序列進(jìn)行差分運(yùn)算則是一種常用的轉(zhuǎn)化過程。差分運(yùn)算的實(shí)質(zhì)是使用自回歸的方式提取確定性信息。由于差分運(yùn)算的這種強(qiáng)大提取信息的能力,許多非平穩(wěn)序列差分之后會(huì)顯示出平穩(wěn)序列的性質(zhì),對差分后平穩(wěn)序列可以使用ARIMA模型進(jìn)行擬合,從而去分析序列的特點(diǎn)。
而具體進(jìn)行ARIMA模型分析的時(shí)候,通過計(jì)算ACF,PACF可以有效的確定出ARIMA(p,d,q)中各參數(shù)p,d,q的具體數(shù)值,從而最終擬合序列并進(jìn)行預(yù)測。具體的ARIMA建模流程圖如圖1.
根據(jù)上海市綠化和市容管理局提供的數(shù)據(jù),做出1978年到2011年上海市生活垃圾產(chǎn)生量表1。
1978到2011年上海市生活垃圾產(chǎn)生量表(單位:萬噸)
在SAS軟件中,繪制出該序列的時(shí)序圖圖2
圖2:上海市生活垃圾產(chǎn)生量時(shí)序圖
由圖2可看出,隨著經(jīng)濟(jì)的發(fā)展與人口的增加,自1978年來,上海市垃圾產(chǎn)生量大體上呈遞增趨勢,除了2000年到2002年有一個(gè)短暫的回落。垃圾產(chǎn)生量從開始的100萬增長到700萬,增長的幅度比較塊,平均每年增長幅度超過20%。整個(gè)圖像具有顯著的趨勢,站在時(shí)間序列的角度來說,該序列是典型的非平穩(wěn)序列。
因?yàn)闀r(shí)序圖明顯非平穩(wěn),所以對數(shù)據(jù)進(jìn)行一階差分處理,一階差分后自相關(guān)圖和白噪聲檢驗(yàn)圖見圖3.
圖3:一階差分自相關(guān)、白噪聲檢驗(yàn)圖
由圖3可以看出,原序列進(jìn)過差分運(yùn)算后,已經(jīng)向平穩(wěn)序列方向發(fā)展,但是p=0.0341 還是大于標(biāo)準(zhǔn)值0.005,所以我們對該序列繼續(xù)做差分運(yùn)算。
進(jìn)過二階差分,序列在均值附近比較穩(wěn)定的波動(dòng),白噪聲檢驗(yàn)如圖3。
圖3:二階差分后的白噪聲檢驗(yàn)圖
圖3 顯示,差分后序列在均值附近比較穩(wěn)定的波動(dòng),p值<0.005,可以認(rèn)為序列平穩(wěn)。所以對二階差分后的數(shù)列進(jìn)行分析。
由偏自相關(guān)系數(shù)圖4可得在延遲期數(shù)大于等于4后,偏自相關(guān)系數(shù)就基本保持在兩倍標(biāo)準(zhǔn)差之內(nèi)。對序列進(jìn)行相對最優(yōu)定階,得到最小信息量結(jié)果為圖5.
圖4:二階差分后偏自相關(guān)圖
圖5:相對最優(yōu)定價(jià)圖
圖5 顯示,在自相關(guān)系數(shù)小于等于5,移動(dòng)平均延遲系數(shù)小于等于5的所有ARMA(p,q)模型中,BIC信息量相對最小的是 ARMA(2,1)模型,也就是 ARIMA(2,2,1)模型。
對2階差分后的序列進(jìn)行殘差自相關(guān)分析,殘差自相關(guān)檢驗(yàn)結(jié)果如圖6:
圖6:殘差白噪聲檢驗(yàn)圖
由于p顯然大于0.05,所以殘差序列為白噪聲序列,擬合模型顯著成立,模型檢驗(yàn)通過。
所以擬合模型為: 1 + 0.72298B + 0.65197,具體預(yù)測數(shù)值表2
表2:上海市生活垃圾產(chǎn)生量7期預(yù)測(單位:萬噸)
最終得到上海市垃圾產(chǎn)生量走勢預(yù)測圖7:
圖7:上海市生活垃圾產(chǎn)生量走勢預(yù)測圖
運(yùn)用ARIMA模型對序列進(jìn)行預(yù)測時(shí),預(yù)測的準(zhǔn)確度隨著時(shí)間的推移呈發(fā)散的趨勢,所以ARIMA模型只適合短期預(yù)測。而且由于ARIMA模型基本使用純數(shù)學(xué)方法來提取序列中的有效因素,不能從機(jī)理上來解釋生活垃圾產(chǎn)生量快速增加的原因,從而不利于對垃圾產(chǎn)生做出具體分析,從源頭上解決垃圾產(chǎn)生問題。
但是ARIMA模型在預(yù)測分析中,理論比較成熟,而且垃圾產(chǎn)生量常常是自相關(guān)非平穩(wěn)的,所以運(yùn)用ARIMA模型比較合理,且得出的結(jié)論可信度較高。
垃圾治理問題關(guān)系到城市發(fā)展的方方面面,是重要的城市建設(shè)問題之一。本文通過分析過去幾十年的數(shù)據(jù),運(yùn)用ARIMA(2,2,1)模型對上海市未來7年的生活垃圾產(chǎn)生量做了具體的預(yù)測,具有一定的應(yīng)用價(jià)值。
[1]徐禮來,崔勝輝,閆禎,等.城市生活垃圾產(chǎn)生預(yù)測的核心問題探討[J].環(huán)境科學(xué)與技術(shù),2013,36(002):184-190.
[2]芮少權(quán),匡安樂.高速公路月度交通量 ARIMA 預(yù)測模型[J].長安大學(xué)學(xué)報(bào):自然科學(xué)版,2010,30(4):82-85.
[3]王燕.應(yīng)用時(shí)間序列分析[M].中國人民大學(xué)出版社,2008.
[4]上海統(tǒng)計(jì)年鑒:2012[M].中國統(tǒng)計(jì)出版社, 2012.
[5]趙鑫,郭嘉,吳建川.ARIMA 模型和 GM (1,1)與 ARMA(p, q)組合模型在滑坡短期預(yù)報(bào)中的對比分析[J].安全與環(huán)境工程,2012,19(3):24-28.