曹 霜,何玉成
(華中農(nóng)業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,武漢 430070)
農(nóng)產(chǎn)品價(jià)格下降會(huì)增加農(nóng)產(chǎn)品生產(chǎn)者的風(fēng)險(xiǎn),而價(jià)格上漲會(huì)提高消費(fèi)者的消費(fèi)水平,價(jià)格穩(wěn)定與否關(guān)系到國民經(jīng)濟(jì)與人們生活的各個(gè)方面,穩(wěn)定農(nóng)產(chǎn)品價(jià)格已經(jīng)成為宏觀經(jīng)濟(jì)調(diào)控的重要目標(biāo)。由于農(nóng)產(chǎn)品市場(chǎng)受到氣候、突發(fā)事件以及調(diào)控政策等多種因素錯(cuò)綜復(fù)雜地影響,其價(jià)格呈現(xiàn)波動(dòng)大、非線性、非平穩(wěn)等特征。因此,對(duì)農(nóng)產(chǎn)品價(jià)格進(jìn)行分析與預(yù)測(cè),對(duì)農(nóng)產(chǎn)品未來波動(dòng)進(jìn)行監(jiān)測(cè)與預(yù)警,將為農(nóng)產(chǎn)品價(jià)格的調(diào)整提供系統(tǒng)指導(dǎo),對(duì)抑制農(nóng)產(chǎn)品價(jià)格波動(dòng)與控制物價(jià)水平具有重要的實(shí)踐意義。
本文將采用小波分析對(duì)農(nóng)產(chǎn)品價(jià)格時(shí)間序列進(jìn)行分解,并分別采用SVM與ARIMA建立預(yù)測(cè)模型,重構(gòu)農(nóng)產(chǎn)品價(jià)格組合預(yù)測(cè)模型。
這時(shí),我們稱φ(t)為一個(gè)基本小波或母小波,對(duì)其進(jìn)行伸縮和平移操作后就可以得到一個(gè)小波序列。
支持向量機(jī)(SVM)是由Vapnik首先提出來,是建立在VC維理論與結(jié)構(gòu)風(fēng)險(xiǎn)最小原理的基礎(chǔ)之上,將低維空間的非線性問題通過非線性映射為高維空間的線性問題。由于支持向量機(jī)具有理論完善、通用性強(qiáng)、魯棒性高、計(jì)算復(fù)雜度低等優(yōu)勢(shì),因此廣泛地應(yīng)用到農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)的研究中。
設(shè)訓(xùn)練數(shù)據(jù)集為{(xi,yi),i∈l},則回歸模型的如公式(2)所示。
其中?為權(quán)重向量,b為偏差,而φ(x)為非線性核函數(shù)。上式的目的是將非線性的輸入數(shù)據(jù)以非線性的函數(shù)轉(zhuǎn)換到高維特征空間中的線性形式。其對(duì)應(yīng)的優(yōu)化問題如公式(3)所示:
其中ξi為誤差?約束下訓(xùn)練絕對(duì)誤差的上限,而c為懲罰參數(shù),其目的是用來對(duì)超出誤差范圍的樣本進(jìn)行懲罰。
增高cAMP水平藥物主要包括腺苷酸環(huán)化酶抑制劑和選擇性血小板磷酸二酯酶抑制劑兩種。腺苷酸環(huán)化酶抑制劑常見藥物如貝前列腺素、伊洛前列腺素等,但因其半衰期短,穩(wěn)定性差等原因,不適合應(yīng)用于ACS長期治療,因此臨床上應(yīng)用較少。選擇性血小板磷酸二酯酶抑制劑中常見藥物包括西洛他唑、雙嘧達(dá)莫等。兩種藥物作用機(jī)制相似,均以抑制磷酸二酯酶活性,提高血小板內(nèi)cAMP濃度,使血小板聚集受到抑制。其中西洛他唑可通過抑制血管內(nèi)膜基質(zhì)中金屬蛋白酶的表達(dá),進(jìn)而抑制血管內(nèi)膜的過度增生。西洛他唑常用無法耐受阿司匹林同時(shí)需進(jìn)行ACS雙抗治療的患者中,替代阿司匹林抗血小板治療[2]。
在構(gòu)建SVM預(yù)測(cè)模型時(shí),需要選取懲罰參數(shù)c和核函數(shù)g,并且這兩個(gè)參數(shù)選取將直接影響模型的預(yù)測(cè)準(zhǔn)確率。所以,本文將采用交叉驗(yàn)證來優(yōu)化參數(shù)的選取,提高模型的預(yù)測(cè)準(zhǔn)確率。
ARMA模型是目前最常用的擬合平穩(wěn)序列的模型,ARMA(p,q)其數(shù)學(xué)公式如(4)與(5)所示:
由于ARMA建模的首要條件是序列具有平穩(wěn)性,因此在采用ARMA建模之前需要對(duì)序列進(jìn)行平穩(wěn)性檢驗(yàn)。通??梢愿鶕?jù)時(shí)序圖與自相關(guān)圖檢驗(yàn)序列的平穩(wěn)性:從時(shí)序圖觀察序列是否在一個(gè)常數(shù)值周圍隨機(jī)波動(dòng),而波動(dòng)的范圍有界、無明顯趨勢(shì)及周期性;在自相關(guān)圖觀察隨著延遲階數(shù)的增加,系列的自相關(guān)圖是否很快地向零衰減。若序列通過了平穩(wěn)性檢驗(yàn),則需要進(jìn)行模型識(shí)別與參數(shù)評(píng)估來完成ARMA建模。若序列沒有通過平穩(wěn)性檢驗(yàn),則需要選用ARIMA來建模,即對(duì)序列進(jìn)行差分操作消除其趨勢(shì)性與周期性特征,得到平穩(wěn)序列,然后再進(jìn)行分析與建模。由于采用ARIMA建模的過程中對(duì)序列進(jìn)行了差分操作,提出了其趨勢(shì)性與周期性特征,會(huì)降低模型的預(yù)測(cè)精度。因此,通常是將ARIMA模型與其他模型結(jié)合使用,構(gòu)成組合預(yù)測(cè)模型。
本文建立組合預(yù)測(cè)模型的基本思路是:首先,采用小波對(duì)農(nóng)產(chǎn)品價(jià)格序列進(jìn)行分解;然后,分別采用ARIMA模型與SVM模型對(duì)小波分解序列進(jìn)行建模與預(yù)測(cè);最后,將上述小波分解序列的預(yù)測(cè)模型進(jìn)行整合,形成對(duì)農(nóng)產(chǎn)品價(jià)格的組合預(yù)測(cè)模型。具體流程圖如圖1所示:
圖1 組合預(yù)測(cè)流程圖
本文將選取大白菜作為研究對(duì)象,數(shù)據(jù)來源于國泰安數(shù)據(jù)庫中的《農(nóng)產(chǎn)品價(jià)格調(diào)查年鑒》。由于目前《農(nóng)產(chǎn)品價(jià)格調(diào)查年鑒2013》中只有2002~2012年的數(shù)據(jù),所以本文對(duì)大白菜2002~2011年的價(jià)格進(jìn)行分析與建模,選擇對(duì)其2012年的價(jià)格進(jìn)行預(yù)測(cè),以對(duì)組合預(yù)測(cè)模型的有效性進(jìn)行驗(yàn)證。其中,2002~2011年的價(jià)格時(shí)間序列如圖2所示。從圖2中我們可以發(fā)現(xiàn),大白菜價(jià)格不僅有上漲的趨勢(shì),還有周期性波動(dòng)和隨機(jī)波動(dòng)的特征。
圖2 2002~2011年大白菜價(jià)格曲線
考慮到大白菜價(jià)格序列的波動(dòng)性較大,故選用db3小波基函數(shù),而分解階數(shù)選為3,其具體流程如圖3所示。
圖3 小波多分辨分析流程圖
本文將采用Matlab 2012a編程實(shí)現(xiàn)小波分解過程,其分解序列如圖4所示。
圖4 大白菜價(jià)格分解序列圖
從圖4可以看出,隨著不斷地往下分解,小波分解序列的細(xì)節(jié)部分越平滑,規(guī)律性越凸顯,其中ca3揭示了大白菜價(jià)格的上升趨勢(shì),cd3揭示了其季節(jié)性趨勢(shì),cd2揭示了循環(huán)波動(dòng)趨勢(shì),而cd1則揭示了其隨機(jī)波動(dòng)性。
考慮到分解序列ca3具有非常明顯的非線性上升趨勢(shì),因此本文將采用擅長非線性分析的SVM來對(duì)其進(jìn)行建模與預(yù)測(cè)。
在建模SVM模型時(shí),采用高斯徑向基(RBF)核函數(shù),設(shè)定懲罰參數(shù)c和核函數(shù)g的取值范圍都為[2-4,24],并采用K-CV(K組交叉驗(yàn)證法)進(jìn)行參數(shù)尋優(yōu)。該方法的參數(shù)尋優(yōu)原理如下:將懲罰參數(shù)c和核函數(shù)g在既定范圍內(nèi)取值,用K-CV法計(jì)算不同c與g組合下訓(xùn)練集的均方根誤差(MSE),并選取使得MSE最小的c與g作為最優(yōu)參數(shù)。此外,本文考慮樣本數(shù)據(jù)量偏小,故選取K為3。
本文基于Matlab 2012a與LIBSVM 3.12進(jìn)行參數(shù)尋優(yōu)與建模,其結(jié)果如圖5所示。
即最優(yōu)參數(shù)為c=5.67,g=0.125,而MES=0.0021593。
考慮cd3與cd2表現(xiàn)出周期波動(dòng),而cd1則是隨機(jī)波動(dòng),故選用ARIMA模型對(duì)這三個(gè)分解序列進(jìn)行建模與預(yù)測(cè)。
觀察cd3分解序列圖與自相關(guān)-偏相關(guān)分析圖,發(fā)現(xiàn)cd3具有明顯的季節(jié)性趨勢(shì),故選用ARIMA(p,d,q)x(P,D,Q)S模型。而觀察cd1與cd2的自相關(guān)-偏相關(guān)分析圖,發(fā)現(xiàn)具有平穩(wěn)性,故選用ARMA(p,q)建模。
依據(jù)姜啟源介紹的模型識(shí)別方法,我們對(duì)cd1、cd2、cd3構(gòu)建的預(yù)測(cè)模型如表1所示。
圖5 SVM參數(shù)尋優(yōu)結(jié)果
表1 cd1、cd2、cd3的預(yù)測(cè)模型
前面分別對(duì)cd1、cd2、cd3以及ca3分別建立了預(yù)測(cè)模型,則對(duì)于大白菜價(jià)格的預(yù)測(cè)公式為:
為了分析和比較組合預(yù)測(cè)模型的預(yù)測(cè)效果,本文將采用平均百分誤差(MAPE)與均方根誤差(RMSE)來度量預(yù)測(cè)結(jié)果的精度。
其中,各個(gè)分解序列的預(yù)測(cè)結(jié)果如表2所示。
表2 大白菜價(jià)格組合預(yù)測(cè)結(jié)果
為了進(jìn)一步驗(yàn)證組合預(yù)測(cè)模型的有效性,本文將分別采用ARIMA模型與SVM模型對(duì)大白菜價(jià)格進(jìn)行預(yù)測(cè),將其與組合預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析。其具體結(jié)果如表3與表4所示。
從表4的對(duì)比結(jié)果,可以發(fā)現(xiàn)ARIMA模型與SVM模型的預(yù)測(cè)精度相當(dāng),并且均劣于組合預(yù)測(cè)模型。深入分析其原因,不難發(fā)現(xiàn)ARIMA模型與SVM模型均難以提取價(jià)格序列的全部變化趨勢(shì),而基于小波分解的SVM-ARIMA模型能夠?qū)r(jià)格序列的四個(gè)變化特征進(jìn)行細(xì)致地分析,并針對(duì)性地建立預(yù)測(cè)模型,所以組合預(yù)測(cè)模型的準(zhǔn)確性更高。
表3 三種模型預(yù)測(cè)結(jié)果
表4 三種模型預(yù)測(cè)精度
農(nóng)產(chǎn)品由于其產(chǎn)品特性,從生產(chǎn)、儲(chǔ)存到出售有其特殊性,其價(jià)格也受到多方面因素錯(cuò)綜復(fù)雜地影響,致使其價(jià)格波動(dòng)呈現(xiàn)多種趨勢(shì)的混合交錯(cuò),對(duì)其預(yù)測(cè)難度較大。而傳統(tǒng)預(yù)測(cè)方法難以充分地分析農(nóng)產(chǎn)品價(jià)格所有變化趨勢(shì),大多數(shù)情況下都是抓住某方面的變化趨勢(shì)而忽視了其他方面,導(dǎo)致預(yù)測(cè)結(jié)果不理想。針對(duì)這種情況,本文提出了基于小波分解的SVM-ARIMA預(yù)測(cè)模型,充分利用SVM模型與ARIMA模型對(duì)農(nóng)產(chǎn)品價(jià)格的四種變化趨勢(shì)進(jìn)行分析與建模,并重構(gòu)為農(nóng)產(chǎn)品價(jià)格的組合預(yù)測(cè)模型。實(shí)例分析表明,這種建立在小波分解基礎(chǔ)上的組合預(yù)測(cè)比傳統(tǒng)預(yù)測(cè)模型具有更高的精度,可以作為農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)的有效工具。
[1]陳燦煌.我國農(nóng)產(chǎn)品價(jià)格指數(shù)短期預(yù)測(cè)——基于時(shí)間序列分解的分析[J].價(jià)格理論與實(shí)踐,2011,(7).
[2]陳兆榮,雷勛平,王亮.基于ARIMA—SVM組合模型的我國農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)研究[J].財(cái)經(jīng)理論研究,2013,(2).
[3]平平,劉大有,楊博.組合預(yù)測(cè)模型在豬肉價(jià)格預(yù)測(cè)中的應(yīng)用研究[J].計(jì)算機(jī)工程與科學(xué),2010,32(5).
[4]李干瓊,許世衛(wèi),李哲敏.農(nóng)產(chǎn)品市場(chǎng)價(jià)格短期預(yù)測(cè)方法與模型研究——基于時(shí)間序列模型的預(yù)測(cè)[J].中國農(nóng)業(yè)大學(xué)學(xué)報(bào),2011,16(2).
[5]姜啟源.數(shù)學(xué)實(shí)驗(yàn)與數(shù)學(xué)建模[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2001,31(5).