李燕飛, 吳 濤,2**, 郭海艷
(1.安徽大學 數(shù)學科學學院,合肥230601;2.安徽大學 計算機智能與信號處理教育部重點實驗室,合肥230039)
盡管目前中國經(jīng)濟下行壓力有所加大,部分企業(yè)經(jīng)營困難較多,長期積累的風險隱患有所暴露,但習近平主席明確表示,對中國經(jīng)濟發(fā)展前景,大家完全可以抱著樂觀態(tài)度。安徽省作為中部大省,對安徽未來幾年人均GDP合理預測可窺得中國經(jīng)濟發(fā)展一斑。單一的預測方法得到的結(jié)果不夠準確,而將預測結(jié)果加權(quán)組合則會得到更好的預測結(jié)果。Bates J M和Granger C W J[1]在1969年首次提出了組合的概念,而后國內(nèi)外許多學者開始研究組合預測模型。唐小我[2]用組合預測誤差平方和極小化來確定最優(yōu)加權(quán)系數(shù),并導出了簡單平均預測是最優(yōu)組合預測的條件。陳華友[3]基于預測方法有效度的概念,建立了改進的組合預測模型,并給出其線性規(guī)劃的解法。謝開貴等[4]給出了基于最小二乘和最小一乘準則的線性回歸組合預測模型, 然后應用最小二乘原理得到權(quán)系數(shù)最小二乘估計值。
介紹了組合預測鄰近度的概念并證明了鄰近度的相關性質(zhì),隨后引入了一種新的組合權(quán)系數(shù)求解方法MEM算法[5-6]建立了基于鄰近度的組合預測模型。組合預測的關鍵問題是求出各單項預測加權(quán)平均系數(shù),普通的組合預測模型是以誤差平方和離差絕對值最小為準則建立起來的,然而這些組合預測模型對于不遵循大多數(shù)樣本所顯示的相同關系的離群值不具有魯棒性,且在不對稱分布情況下,由于限制了權(quán)系數(shù)和為1,因此在各單項預測的結(jié)果一致偏大或偏小時,難以得到精確的預測結(jié)果。而提出的組合預測鄰近度概念和引入的眾數(shù)極大期望解法有效地克服了這些缺點。由最后的實例分析可以看出方法的可行性和有效性。
設某一預測問題的指標序列是xt,t=1,2,…,N。對于這個預測問題,有m種單項預測方法對其進行預測,設xit為第i種單項預測模型在第t時刻的預測值,i=1,2,…,m。設li為第i種單項預測方法的加權(quán)系數(shù),li≥0,i=1,2,…,m。加權(quán)幾何平均組合預測是常用的組合預測方法之一,它通常比加權(quán)算術平均組合預測方法有更小的相對誤差。根據(jù)加權(quán)幾何平均計算公式,令
設組合預測誤差為εt,則有
定義1 (鄰近度)令
性質(zhì)1Q隨|εt|減小而增大,隨εt增大而減小。
證明|εt1|≤|εt2|?(εt1)2≤(εt2)2,所以φ(εt1)≤φ(εt2),其他時刻誤差不變,有Q1≤Q2,因此性質(zhì)1成立。
性質(zhì)2 ?t∈{1,2,…,N},εt=0時,即各時刻組合預測值都等于實際值時,鄰近度Q最大,且鄰近度等于1。
性質(zhì)3 基于鄰近度組合預測模型對于存在不遵循大多數(shù)樣本所顯示的相同關系的離群值較基于誤差平方和最小或離差絕對值最小模型更具有魯棒性。
基于鄰近度組合預測鄰近度越大,表示預測越精確。模型的關鍵是求最大化Q值時的組合權(quán)系數(shù)。令αt=(lnx1t,lnx2t,…,lnxmt)T,γt=lnxt,t=1,2,…,N.問題則轉(zhuǎn)化為了一個回歸問題
γt=βTαt+εt
其中β是一個m維列向量,β=(l1,l2,…,lm),使用文獻[6]給出的眾數(shù)極大化期望MEM算法以在最大化Q的情況下求出各單項預測方法組合權(quán)重向量β。先給一個初始的β(0),則它的k+1步公式為
E步:
M步:
(αTWkα)-1αTWkγ,其中α=(α1,α2,…,αN)T,Wk是一個n×n對角矩陣,Wk=diag{π(1|β(k)),π(2|β(k)),…,π(N|β(k))},γ=(γ1,γ2,…,γN)T.多次迭代以后MEM 算法使得參數(shù)β收斂到一個局部最優(yōu)解,因此需要多次對起始點進行選擇,以期望得出全局最優(yōu)解,這時迭代出的參數(shù)β就是要求的各單項預測組合權(quán)重向量。
使用以下4個模型常用的評價準則對各模型效果進行評價。
誤差平方和:
(1)
平均絕對誤差:
(2)
平均絕對百分比誤差:
(3)
均方百分比誤差:
(4)
選取2000—2017年安徽省人均GDP為研究訓練樣本,數(shù)據(jù)自國家統(tǒng)計局網(wǎng)站,分別使用指數(shù)預測、拋物線預測和移動平均預測等3種單項預測方法對安徽省人均GDP進行預測。
2.1.1 指數(shù)預測模型
從圖1(a)的趨勢圖可以看出,安徽省人均GDP有明顯的隨時序增長的趨勢,并大致隨時間呈指數(shù)增長,因此可選用指數(shù)預測模型,擬合方程為
lnx1t=8.278 1+0.142 2×t
利用模型對安徽省人均GDP進行預測,預測值及精度如表1所示。
2.1.2 拋物線預測模型
從圖1(b)可以看出,由拋物線預測得到的人均GDP隨年份增長曲線與真實增長曲線相和度也很高,其擬合方程為
x2t=3.317 0+0.410 5×t+0.105 4×t2
t代表年份,從1開始對應著2000年。運用模型對安徽省人均GDP進行預測預測值及精度如表1所示。
2.1.3 移動平均預測模型
移動平均預測是由移動平均法根據(jù)時間序列,逐項推移,依次計算包含一定項數(shù)時序的平均數(shù),并以此進行預測的方法。這里取移動平均項數(shù)等于2,移動平均序列預測趨勢與真實值曲線對比如圖1(c),其擬合方程為
(a) 指數(shù)預測 (b) 拋物線預測 (c) 移動平均預測
預測方程為x3t+T=at+bt×T,其中at,bt為待估參數(shù),T為步長。使用模型對安徽省人均GDP進行預測預測值及精度如表1所示。
分析表1可知:3種單項預測均能正確反應人均GDP變化趨勢,拋物線預測模型與移動平均預測模型在各時刻預測精度趨于平穩(wěn),而指數(shù)預測則在后期精度越來越低,總的來講3個單項預測精度都不夠高。不能達到準確預測的要求,因此需要對其進行組合以得到精度更高的預測數(shù)值。
由表1種各單項預測值為基礎,建立基于鄰近度的組合預測模型,用matlab求解得最優(yōu)權(quán)系數(shù)向量βT=(-0.171 5,0.238 9,0.938 4),以該權(quán)重代回加權(quán)組合預測模型得到計算結(jié)果如表2所示。從預測值精度可以看出,組合預測精度大部分達到99%以上,最低的也超過了96%,預測結(jié)果明顯優(yōu)于3項單項預測值精度。且基于鄰近度的組合預測在各個時刻預測精度不僅高而且穩(wěn)定,因此在預測未來時序中人均GDP數(shù)值時預測結(jié)果更為可靠。
由于各種單項預測方法都是基于往期數(shù)據(jù)進行建模預測,故建模時所利用數(shù)據(jù)在長期預測時不具有時效性,所以預測方法對于短期預測更加精準。
表 1 各單項預測模型預測值與預測精度
表 2 基于鄰近度的組合預測預測值及預測精度
選擇誤差平方和(SSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)和均方百分比誤差(MSPE)這4項評價準則,結(jié)合式(1)、式(2)、式(3)、式(4)對3種單項預測模型及提出的組合預測模型和文獻[9]提出的組合預測模型預測效果進行比較,5種模型預測誤差如表3所示。
表 3 模型誤差評價
從表3可以看出基于鄰近度的組合預測模型在4個評價準則上效果均顯著優(yōu)于單項預測模型及文獻[9]提出的組合預測模型。說明模型的合理性。
在訓練集上擁有很好的預測效果并不足以說明模型預測效果的穩(wěn)定性和在未來時間上預測結(jié)果的有效性,因此需要引入測試集來觀察模型在未來時間上預測效果。各模型在測試集上預測效果見表4。
由表1、表2、表3、表4對比發(fā)現(xiàn),相較于單項預測方法,基于鄰近度的組合預測顯著提高了預測精度,因此利用基于鄰近度的組合預測模型對2019—2021年安徽省人均GDP進行預測,預測結(jié)果見表5。
表 4 2018年安徽省人均GDP真實值與各方法預測值及精度
表 5 2019—2021年安徽省人均GDP預測值
從組合預測結(jié)果來看2019、2020、2021年較前一年安徽省人均GDP增長率分別為7.31%、6.64%、6.06%,人均GDP呈逐漸增長趨勢,但增速逐漸放緩,符合目前我國對GDP增速的預期。由于我國在未來幾年內(nèi)處于深化供給側(cè)改革時期,國內(nèi)經(jīng)濟面臨去產(chǎn)能、去庫存、去杠桿、降成本、補短板五大任務。所以各地都在進行新舊動能接續(xù)轉(zhuǎn)換,減少低端和無效供給的經(jīng)濟轉(zhuǎn)型,更加注重新增長點、新動能和新供給,所以此時人均GDP增速稍有放緩,同時中國已是GDP排名第二的經(jīng)濟大國,各地巨大的GDP基數(shù)也會導致GDP增速放緩。因此,所建立的組合預測結(jié)果具有實際意義,與我國國情及安徽實際情況相符,對于研究未來安徽省人均GDP具有參考價值。