路世昌,趙博琦,畢建武
消費(fèi)者物價(jià)指數(shù)(CPI),是以與居民生活有關(guān)的產(chǎn)品及勞務(wù)等價(jià)格統(tǒng)計(jì)出來的綜合指標(biāo),可用來衡量物價(jià)的變動情況[1]。CPI涉及經(jīng)濟(jì)發(fā)展,關(guān)乎社會和諧,維系人民生計(jì),是管理者制定宏觀經(jīng)濟(jì)政策、分析貨幣市場和債券市場及央行公開市場業(yè)務(wù)的重要參考依據(jù),歷來備受政府和民眾關(guān)注。因此對CPI的精確預(yù)測具有重要的現(xiàn)實(shí)意義[2]。然而CPI受到多種不確定因素影響,很難對其進(jìn)行非常精確的預(yù)測,這時(shí)對CPI變化范圍及走勢進(jìn)行預(yù)測顯得更為重要。模糊信息粒化能夠通過群體中個(gè)體之間的協(xié)作和信息共享來尋找最優(yōu)解,降低維數(shù),加快擬合收斂。支持向量機(jī)(SVM)有優(yōu)良的泛化能力,并且在解決小樣本、非線性及高維空間表現(xiàn)出了很多的優(yōu)勢,能夠避免災(zāi)難維數(shù),局部極值等問題。本文將模糊信息?;椒ㄅc支持向量機(jī)相結(jié)合,提出了基于模糊信息粒化SVM時(shí)序回歸CPI預(yù)測模型,該模型能夠給出CPI較精確的變化范圍及走勢,為經(jīng)濟(jì)政策以及宏觀經(jīng)濟(jì)決策提供依據(jù)。
信息?;褪菍⒁粋€(gè)整體分解為一個(gè)個(gè)的部分進(jìn)行研究,每個(gè)部分為一個(gè)信息粒。信息粒就是一些由于難以區(qū)別、或相似接近或具備某種功能而結(jié)合在一起的元素的集合。L.A.Zadeh于1979年在模糊集合論的基礎(chǔ)上首次提出并討論了模糊信息?;瘑栴},并給出了一種數(shù)據(jù)里的命題刻畫[3~5]:
gΔ=(x is G)is λ
其中,x是論域U中取值的變量,G是U的模糊子集,由隸屬函數(shù)μG來刻畫。λ表示可能性概率。一般假設(shè)U為實(shí)數(shù)集合R,G是U的凸模糊子集,λ是單位區(qū)間的模糊子集。
模糊信息粒就是以模糊集形式表示信息粒。在對時(shí)間序列進(jìn)行模糊?;瘯r(shí)主要包括劃分窗口和模糊化兩個(gè)步驟。其中模糊化是最為關(guān)鍵的部分,也就是在所給窗口上建立一個(gè)能取代原來窗口信息的模糊集。本文采用的是W.Pcdrycz?;椒╗6]。該方法基本思想:
⑴模糊粒子能夠合理代表原始數(shù)據(jù);
⑵模糊粒子要有一定的特殊性。
為找到兩者最佳平衡,可建立如下函數(shù):
QA=MA/NA
其中MA為滿足⑴,NA為滿足⑵。
本文采用三角形模糊粒子,其隸屬函數(shù)如下;
Low,R,Up為模糊粒子的三個(gè)參數(shù),對于三角型模糊數(shù)而言,分別代表a,m,b三個(gè)參數(shù)。其中Low描述原始數(shù)據(jù)變化的最小值,R反映變化的平均水平,Up則表示原始數(shù)據(jù)變化的最大值。
支持向量機(jī)是20世紀(jì)90年代由Vapnik等提出的一種研究小樣本、小概率事件的神經(jīng)網(wǎng)絡(luò)模型,能夠根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最優(yōu)解。與神經(jīng)網(wǎng)絡(luò)相比,支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)理論的小樣本學(xué)習(xí)方法,采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,具有很好的泛化性能;而神經(jīng)網(wǎng)絡(luò)是基于大樣本的學(xué)習(xí)方法,采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則。基本思想:通過非線性映射將原空間映射至高維特征空間,將搜索到的最優(yōu)線性回歸超平面問題轉(zhuǎn)化為求解凸約束下的凸規(guī)劃問題。
支持向量機(jī)的基本想是通過事先確定的非線性映射將輸入向量映射的一個(gè)高維特征空間(Hilbert空間),然后在此高維空間中再進(jìn)行回歸。
首先將輸入量x通過映射Φ:Rn→H映射到高維特征空間H中用函數(shù)
f(x)=ω·Φ(x)+b
擬合數(shù)據(jù)(xi,yi)目標(biāo)函數(shù)式為:
式中涉及到高維特征空間點(diǎn)積運(yùn)算Φ(xi)·Φ(yi),而且函數(shù)Φ是未知的,高維的。支持向量機(jī)理論只考慮高維特征空間的點(diǎn)積運(yùn)算K(xi,yi)=Φ(xi)·Φ(yi),而不直接使用函數(shù)Φ。稱K(xi,yi)為核函數(shù),核函數(shù)的選取應(yīng)使其為高維特征空間的一個(gè)點(diǎn)積,核函數(shù)的類型有多種,本文選取徑向基核函數(shù):
得可求得合函數(shù)的表示式為:
模糊信息?;С窒蛄繖C(jī)CPI預(yù)測流程如下:
(1)獲取歷年CPI數(shù)據(jù),并進(jìn)行輸入;
(2)對CPI數(shù)據(jù)進(jìn)行模糊信息?;幚?;
(3)采用交叉驗(yàn)證的方法,利用模糊?;幚砗蟮臄?shù)據(jù)對SVM進(jìn)行訓(xùn)練確定最優(yōu)參數(shù)c和g;
(4)利用最優(yōu)c和g建立模糊信息粒化SVM模型對CPI進(jìn)行預(yù)測;
(5)輸出CPI變化趨勢及變化空間。
模型流程圖如下:
圖1 模型流程圖
本文以2000年1月份到2014年1月份月度CPI為研究對象,其中2013年11月之前的數(shù)據(jù)用于建立模型,之后的數(shù)據(jù)用于模型檢驗(yàn)。數(shù)據(jù)來源于國家統(tǒng)計(jì)局官方網(wǎng)站。序列時(shí)序圖見圖2。
圖2 CPI序列時(shí)序
本文將3個(gè)月的CPI作為一個(gè)窗口大小,得窗口數(shù)目為原始數(shù)據(jù)長度除以3后取整。在Matlab 2012a環(huán)境下進(jìn)行模糊?;幚斫Y(jié)果見圖3。
圖3 模糊?;Ч?/p>
在Matlab 2012a環(huán)境下利用SVM對三個(gè)模糊粒子Low,R,Up進(jìn)行回歸預(yù)測,將原始數(shù)據(jù)歸一化到[0,1],采用交叉驗(yàn)證對SVM進(jìn)行參數(shù)尋優(yōu),結(jié)果如下:
Low:交叉驗(yàn)證 MSE=0.0116525,Best c=2,Best g=0.125;
R:交叉驗(yàn)證MSE=0.0670537,Best c=4,Best g=0.125;
Up:交叉驗(yàn)證 MSE=0.0683058,Best c=5.65685,Best g=0.125
利用最優(yōu)參數(shù)進(jìn)行擬合及預(yù)測,三個(gè)模糊粒子Low,R,Up擬合結(jié)果見圖4,預(yù)測結(jié)果見表1。
圖4 信息?;瘮M合結(jié)果
表1 預(yù)測結(jié)果及比較
由表1可知本文預(yù)測的CPI變化范圍是準(zhǔn)確的,精確度較高,而且可以看出這三個(gè)月CPI數(shù)值整體呈略微下降趨勢。表明該模型預(yù)測結(jié)果可靠,能夠?yàn)橄嚓P(guān)決策提供依據(jù),具有一定的實(shí)用性。
⑴將模糊信息粒化模型與SVM相結(jié)合,提出了提出了基于模糊信息?;疭VM回歸CPI預(yù)測模型,該模型能夠綜合利用模糊信息粒化及SVM的優(yōu)點(diǎn)。利用該模型進(jìn)行實(shí)際預(yù)測,預(yù)測結(jié)果變化范圍及變化趨勢與實(shí)際相符,證明了該模型的有效性和實(shí)用性。
⑵該模型是基于歷史CPI數(shù)據(jù)建立的,沒有考慮經(jīng)濟(jì)變化,物價(jià)水平等各種不確定性因素,模型還有待于進(jìn)一步完善。
[1] 郭曉峰.基于ARIMA模型的中國CPI走勢預(yù)測分析[J].統(tǒng)計(jì)與決策,2012,(11).
[2] 韓春蕾,高婉君.我國月度CPI的組合預(yù)測及分析[J].統(tǒng)計(jì)與決策,2014,(1).
[3] 張鈴,張鈸.模糊商空間理論(模糊粒度計(jì)算方法)[J].軟件學(xué)報(bào),2003,14(4).
[4] 張蕾,周洲.基于小波和信息?;腂P神經(jīng)網(wǎng)絡(luò)的軸承故障診斷[J].機(jī)械科學(xué)與技術(shù),2012,31(1).
[5] Bargiela A,Pedrycz W.Granular Computing:An Introduction[M].Dodrecht:Kluwer Academic Publishers,2003.
[6] MATLAB中文論壇.MTALAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010.
[7] Nello Cristianini John Shawe-Talor.支持向量機(jī)導(dǎo)論[M].(李國正,王猛,曾華軍譯).北京:電子工業(yè)出版社,2004.
[8] Cao L J.Support Vector Machines Experts for Forecasting[J].Neuro?computing,2003,(51).
[9] Chen L.Hourly Water Demand Forecast Model Based on Support Vec?tor Machine[J].Journal of Basic Science and Engineering,2009,17(4).
[10] 劉希亮,趙學(xué)勝,陸鋒.基于GA-SVM的露天礦拋擲爆破拋擲率預(yù)測[J].煤炭學(xué)報(bào),2012,37(12).