孟毅
?
時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)組合模型在CPI預(yù)測中的應(yīng)用
孟毅
嶺南師范學(xué)院商學(xué)院, 廣東 湛江 524048
CPI是消費者在市場內(nèi)進(jìn)行消費和服務(wù)時所支付的價格隨時間變化的平均指數(shù)。由于CPI對很多經(jīng)濟指標(biāo)都有影響,它備受人們的關(guān)注。本文選取了ARIMA時間序列、BP神經(jīng)網(wǎng)絡(luò)和BP-ARIMA組合模型的三種方法對2009~2017年我國的CPI月度數(shù)據(jù)進(jìn)行建模,并以此預(yù)測2017年度各月的CPI。結(jié)果表明,BP-ARIMA組合模型預(yù)測效果最優(yōu)。
CPI; ARIMA時間序列; BP神經(jīng)網(wǎng)絡(luò); BP-ARIMA組合模型
居民消費價格指數(shù)(CPI),是指消費者在市場內(nèi)進(jìn)行消費和服務(wù)時所支付的價格隨時間變化的平均指數(shù),可綜合反映居民購買能力變動情況。它涵蓋了上百種基本消費品和服務(wù)類別,通過統(tǒng)計和計算不同類別和子類別的商品和服務(wù)計算的子指標(biāo)和分指標(biāo),結(jié)合一定的權(quán)重得到國家的居民消費價格指數(shù)總指標(biāo)。消費價格指數(shù)的空間分類也很多種,不僅有各個省份統(tǒng)計計算的消費價格指數(shù),也有城市居民農(nóng)村居民的的消費價格指數(shù)。消費物價指數(shù)可以用來判斷通貨膨脹,也是有時被視為衡量政府經(jīng)濟政策有效性的指標(biāo)。它向政府、企業(yè)和私人公民提供關(guān)于國家經(jīng)濟價格變化的信息,并以此作為制定經(jīng)濟決策的指南。此外國家會利用消費物價指數(shù)的趨勢,協(xié)助制定財政和貨幣政策。
對于消費者來說,CPI也作為判斷他們購買力的一個標(biāo)準(zhǔn),而消費者的購買力衡量了一定量的貨幣在不同日期購買商品或者服務(wù)的價值的變化。因此,居民消費價格指數(shù)是僅次于人口的普查最受關(guān)注的國民經(jīng)濟統(tǒng)計指標(biāo)。若是通過預(yù)測合理應(yīng)用CPI指標(biāo),可以幫助國家和居民度過通貨膨脹等特殊時段,制定相應(yīng)的措施促進(jìn)中國市場穩(wěn)健地發(fā)展。
ARIMA時間序列簡單易操作,它是目前最常被用于預(yù)測的方法,同樣可以拿來預(yù)測CPI。在這一方面,國內(nèi)已經(jīng)有很學(xué)者進(jìn)行了建模分析,郭曉峰[1]建立了ARIMA(12,1,20)模型,成功地預(yù)測了未來的CPI走勢,并且得到了很好的結(jié)果。BP神經(jīng)網(wǎng)絡(luò)也是另一個被用來預(yù)測CPI的常用方法,鄭艷偉,錢樂祥[2]等人使用歸一化的方法對數(shù)據(jù)進(jìn)行了預(yù)處理,選擇神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,利用神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特性對廣東省的CPI進(jìn)行了建模并預(yù)測。劉海萍,王海濤[3]等人利用MATLAB軟件建立了BP神經(jīng)網(wǎng)絡(luò),并對山東省的物價消費指數(shù)進(jìn)行了預(yù)測。
盡管使用時間序列分析和BP神經(jīng)網(wǎng)絡(luò)預(yù)測CPI的方法都很成熟,但是由于每個預(yù)測模型都有自己的特征和使用的局限性,反應(yīng)的數(shù)據(jù)信息也存在一定區(qū)別,因此只使用一個模型難免會丟失信息。本文擬采用ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)的組合模型對居民消費價格指數(shù)進(jìn)行預(yù)測,并比較三種方法預(yù)測的準(zhǔn)確性。
在大多數(shù)情況下,任何一個單一模型都會存在一定的不可避免的缺陷或不可靠性,而組合模型則可以把單個模型的缺點盡可以的縮小到最小化,建立成最優(yōu)模型。組合模型的研究重點集中于對兩個到數(shù)個模型的預(yù)測結(jié)果進(jìn)行組合,基本的思想就是充分利用每個預(yù)測方法所包含的獨立的信息,通過一些已知可靠的方法確定權(quán)重,對模型的結(jié)果進(jìn)行組合。在本文中,組合模型的建立主要包含兩個部分:權(quán)重的計算與模型可靠性的檢驗。
其中,權(quán)重的計算是建立組合模型最為關(guān)鍵的一點,也是最核心內(nèi)容。確定權(quán)重的方法有很多,目前使用率較高的權(quán)重確定方法有以下幾種:
(1)等權(quán)重法:這種方法很容易理解,顧名思義,這種方法是通過給需要組合的數(shù)個模型結(jié)果以相同的權(quán)重。這種方法最簡單,但是可靠性最低。因為除了將權(quán)重平均并沒有其他的依據(jù)。
這里選取權(quán)重是為了讓組合模型預(yù)測的方差最小,所以等式右側(cè)對求導(dǎo),并使之等于零可以得出:
這種方法比第一種更為可靠,但必須滿足兩種預(yù)測模型預(yù)測的結(jié)果都是無偏的假設(shè)才可以使用,因此這個算權(quán)重的方法有一定的局限性。
本文選取了2012年1月到2017年12月的月度中國物價消費指數(shù)作為研究對象,其中2012至2016年數(shù)據(jù)用于建立模型,由于2017年數(shù)據(jù)已知,可以用來計算誤差及檢驗?zāi)P?,?shù)據(jù)來源為國家統(tǒng)計局網(wǎng)站。
2.2.1 平穩(wěn)性檢驗 ARIMA模型估計的可靠性依賴于變量的平穩(wěn)性。若非平穩(wěn),則進(jìn)行差分,當(dāng)進(jìn)行到第次差分時序列平穩(wěn),則服從階單整。所以,首先要對變量的時間數(shù)據(jù)序列進(jìn)行ADF檢驗,以此判斷變量進(jìn)行的平穩(wěn)性。
對CPI時間序列進(jìn)行ADF單位根檢驗,其中-statistic值為-2.720681,盡管它小于0.1級別下的-statistic,但是大于0.05和0.01級別檢驗下的-statistic。表明在0.05和0.01的顯著性水平下,都接受存在一個單位根的原假設(shè),即序列非平穩(wěn)。由于CPI序列具有非平穩(wěn)性質(zhì),再對其進(jìn)行一階差分處理DCPI,由表1可知,一階差分后序列平穩(wěn)。
表 1 變量的ADF檢驗
由表2可知當(dāng)延遲6,8,12階的時候,值都小于顯著性水平0.05。也就是說,在顯著性0.05的水平下,我們可以拒絕純隨機檢驗的原假設(shè),即序列DCPI不具有純隨機性質(zhì)。
表 2DCPI序列的相關(guān)性
Table 2 Correlation ofDCPI sequences
2.2.3 模型定階對于模型ARIMA(,,),一共需要確定三個參數(shù),,,。其中為差分運算的次數(shù),由前文已知值為1。另外兩個指標(biāo),由偏自相關(guān)系數(shù)判斷,應(yīng)該由自相關(guān)系數(shù)做出判斷。由表2我們已經(jīng)得到了差分序列DCPI的相關(guān)圖,可以看到無論是自相關(guān)還是偏自相關(guān)系數(shù)都并不滿足在某個階數(shù)后,在0附近變動的性質(zhì)。也就是說它們這兩個量都是拖尾的,證明這組數(shù)據(jù)適合用ARIMA模型來建模。經(jīng)過初步判斷,認(rèn)為可取1,12,可取1,2,11,12。
通過對相關(guān)系數(shù)的判斷,已經(jīng)可以估計出幾個適用的模型。但為了選擇出最優(yōu)模型,還需要通過AIC和SBC等信息準(zhǔn)則對幾個模型進(jìn)行比較進(jìn)行篩選。判斷準(zhǔn)則是AIC值應(yīng)該相對來說最小,DW值最接近2,-squared,Adjusted R-squared最大,值小于0.05。通過幾次模型建立與比較,最終確定最優(yōu)模型為ARIMA(1,1,12)。如表3所示,構(gòu)建的ARIMA模型為:
表 3 ARIMA(1,1,12)各項指標(biāo)
2.2.4 模型檢驗判斷一個模型顯著與否的標(biāo)準(zhǔn)是看它所提取的數(shù)據(jù)信息是否充分,這里可以用白噪聲檢驗判斷殘差是否還含有有效信息。假定殘差序列為白噪聲序列時,模型已經(jīng)充分提取所需的數(shù)據(jù)信息,那么也就是說殘差序列里面不再包含有效可利用的數(shù)據(jù)信息。對殘差序列進(jìn)行白噪聲檢驗,在顯著性水平為0.05的條件下,所有滯后期的Q統(tǒng)計量的值均大于0.05,這說明殘差序列是白噪聲序列。
2.2.5 模型預(yù)測先用ARIMA(1,1,12)模型采用靜態(tài)預(yù)測的方法預(yù)測2012年到2016年的CPI值,從結(jié)果判斷模型的優(yōu)劣。由圖1,CPI與CPIF(靜態(tài)預(yù)測值)的走勢基本上是相互符合的,也就是說模型ARIMA(1,1,12)的擬合度較好。接下來,可采取動態(tài)預(yù)測未知的2017年1月到2017年12月的居民物價消費數(shù)據(jù)。由圖2,盡管所預(yù)測的CPIF與CPI2017的整體趨勢變動都很接近,但是數(shù)值之間仍有差距。也就是說盡管表明了模型的準(zhǔn)確性,但是預(yù)測的效果有待提高。
圖 1 ARIMA(1,1,12)靜態(tài)預(yù)測
圖 2 ARIMA(1,1,12)動態(tài)預(yù)測
2.3.1 數(shù)據(jù)預(yù)處理首先,先對收集的數(shù)據(jù)進(jìn)行劃分。訓(xùn)練數(shù)據(jù)為2012至2016年的CPI數(shù)據(jù),其中2016年的CPI為目標(biāo)數(shù)據(jù)。測試數(shù)據(jù)則選取2013年至2016年的CPI數(shù)據(jù),并得出預(yù)測的2017年的CPI值。
然后,需要對訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,這里采用歸一化的方法。應(yīng)用訓(xùn)練數(shù)據(jù)確定的歸一化的格式同樣處理測試數(shù)據(jù)。當(dāng)模型建立之后,采用翻轉(zhuǎn)函數(shù)用逆歸一化的方法,將預(yù)測的數(shù)據(jù)恢復(fù)成具有實際意義的數(shù)據(jù),以便更好地觀察和做下一步的檢驗。
其中,是輸入層的神經(jīng)元個數(shù),為隱層的神經(jīng)元個數(shù),為輸出層的神經(jīng)元個數(shù)。的取值從1到10,不斷改變,逐個比較模型,選擇的應(yīng)該使得模型相對來說最準(zhǔn)確。文中選取第一個經(jīng)驗公式,并且發(fā)現(xiàn)當(dāng)神經(jīng)元取8時,得到的模型MSE最小,為0.4326。因此確定隱層神經(jīng)元個數(shù)為8。
2.3.4 模型預(yù)測以及檢驗得到了合理可用的BP神經(jīng)網(wǎng)絡(luò)模型后,接下來對2017年1月至12月間的CPI進(jìn)行預(yù)測,并且計算出相對誤差(%)以便更好地判斷模型,結(jié)果如表4。這里通過相對誤差可知,預(yù)測出的2017年的CPI與真實值非常接近,模型預(yù)測效果良好。
表4 BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測值和相對誤差
2.4.3 模型檢驗為了更好的檢驗組合模型預(yù)測效果,分別計算三個模型的相對誤差。由表5比較三個模型的相對誤差,可以發(fā)現(xiàn)組合模型ARIMA-BP相對誤差比其他兩個模型相對誤差小的次數(shù)更多,并且組合模型在穩(wěn)定性方面表現(xiàn)最好。綜上,使用組合模型ARIMA-BP預(yù)測CPI結(jié)果是有效的,并且比單獨使用ARIMA或BP模型的效果更好。
圖 3 2017年三種模型CPI預(yù)測與真實值比較
表 5 三種模型相對誤差
Table 5 Relative errors of three models
當(dāng)采用動態(tài)預(yù)測時,除了第一個值是用實際值來進(jìn)行預(yù)測,其他的值都是要用到前一期的預(yù)測值,所以會存在一定的不準(zhǔn)確性。往往,動態(tài)預(yù)測只可以更好的體現(xiàn)出未來的趨勢,而不能準(zhǔn)確的預(yù)測。為了更好地預(yù)測居民物價消費指數(shù),本文又建立了BP神經(jīng)網(wǎng)絡(luò)模型,然后將兩者的結(jié)果組合建立模型,以消除此處ARIMA(1,1,12)預(yù)測的誤差。
盡管ARIMA模型的整體趨勢是與實際值最為接近,但是也是偏離程度最大的,相比較下,組合模型可以更好的預(yù)測;而與BP神經(jīng)網(wǎng)絡(luò)相比,組合模型的預(yù)測很明顯更接近于真實值。與單個的ARIMA和BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法比較,組合模型使用時的限定條件最少,使用范圍更廣泛。前兩種方法都有一定的局限性,比如第二種方法在確定權(quán)重時使用了每個方法預(yù)測結(jié)果的協(xié)方差來計算,那么假設(shè)幾種方法之間高度正相關(guān),則其中一種將被給予負(fù)權(quán)重,便會導(dǎo)致組合預(yù)測結(jié)果大于本應(yīng)有的取值范圍。綜上所述,ARIMA-BP組合模型比單獨的模型預(yù)測效果更好。
盡管ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型都可以用來預(yù)測CPI,并且被廣泛使用,這兩種做法都有自己的不足之處。由于ARIMA序列的動態(tài)預(yù)測除了第一個值是根據(jù)真實值來預(yù)測,其余都是根據(jù)得到的預(yù)測值進(jìn)一步預(yù)測,它對長時間段的預(yù)測并不精準(zhǔn)。而BP神經(jīng)網(wǎng)絡(luò)模型整體趨勢貼近真實值,但個別值不準(zhǔn)確,變化趨勢也沒有ARIMA模型相像。因此本文選擇把BP神經(jīng)網(wǎng)絡(luò)模型和ARIMA模型組合建立一個組合模型,目的是結(jié)合兩個模型優(yōu)點。經(jīng)過證明我們得出了這個組合模型比其他兩種模型更優(yōu)的結(jié)論。
[1] 郭曉峰.基于ARIMA模型的中國CPI走勢預(yù)測分析[J].統(tǒng)計與決策,2012(11):29-32
[2] 鄭艷偉,錢樂祥,張紅光,等.利用神經(jīng)網(wǎng)絡(luò)對居民消費價格指數(shù)預(yù)測的研究[J].云南地理環(huán)境研究,2006,18(6):66-70
[3] 劉海萍,王海濤,王洪利,等.基于BP神經(jīng)網(wǎng)絡(luò)的CPI預(yù)測模型[J].山東交通學(xué)院學(xué)報,2009,17(3):83-86
[4] 翟靜,曹俊.基于時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J].統(tǒng)計與決策,2016(4):29-32
[5] 易丹輝.數(shù)據(jù)分析與EVIEWS應(yīng)用[M].北京:中國統(tǒng)計出版社,2002:23
[6] 張樹京.齊立心.時間序列分析簡明教程[M].北京:清華大學(xué)出版社,2003:78
[7] 王燕.應(yīng)用時間序列分析[M].北京:中國人民大學(xué)出版社,2005:54
[8] 汪昌云.戴穩(wěn)勝.張成思.基于EVIEWS的金融計量學(xué)[M].北京:中國人民大學(xué)出版社,2010:37
[9] Box GEP, Jenkins GM, Reinsel GC,. Time Series Analysis: Forecasting and Control[M]. 5th edition. USA:Wiley,2005
[10] Andrawis RR, Atiya AF, Shishiny HE. Forecast Combinations of Computational Intelligence and Linear Models for The NN5 Time Series Forecasting Competition[J]. International Journal of Forecasting, 2011,27(3):672-688
Application of ARIMA Time Series and BP NN Combined Model in Forecast for CPI
MENG Yi
524048
The Consumer Price Index is an average that prices change with time during consumption and service in a market. Because of its influence on many economic indexes, people pay attention on it. In this paper, ARIMA time series model, BP neural network model and BP-ARIMA combined model were taken from CPI monthly data 2009-2017 in our country to forecast the monthly CPI in 2017. The result showed that forecast effect of BP-ARIMA combined model is the best in three models.
CPI; ARIMA time series; BP NN; BP-ARIMA combined model
F224.0
A
1000-2324(2018)06-1079-05
10.3969/j.issn.1000-2324.2018.06.035
2018-02-05
2018-04-06
孟毅(1982-),女,碩士研究生,主要研究方向為決策理論與應(yīng)用. E-mail:26820443@qq.com