陳厚積,胡曉兵,鄧 希
(1.明尼蘇達大學雙城分校文理學院,明尼阿波利斯 55455; 2.四川大學機械工程學院,成都 610065)
宏觀經濟預測是一門研究宏觀經濟系統(tǒng)的發(fā)展過程和變動發(fā)展趨勢的科學.近年來,隨著我國的經濟體制逐步向社會主義市場經濟新體制發(fā)展,對宏觀經濟預測的應用已經十分普遍[1].計量經濟學法、時間序列分析法、投入產出分析方法、SAS預測法和人工神經網絡模型[2]預測法等已經廣泛應用于國民經濟分析預測[3-4].
GMDH自回歸模型是自組織數據挖掘(Self-Organization Data Mining)中的一種模型方法,是基于計算機科學和神經網絡的迅速發(fā)展而產生和發(fā)展的[5].在信息爆炸和信息不完全的求解條件下,自組織方法能夠有效避免個人主觀因素的干擾[6],在數據挖掘、知識發(fā)現、預測、系統(tǒng)建模和模式識別等領域是十分有效的.中國正處于經濟結構轉型升級的時期,這個經濟系統(tǒng)比其他國家更顯復雜性,經濟指標數據常顯示樣本量小且受干擾的特點.自組織數據挖掘方法在小樣本、受到噪聲干擾的經濟系統(tǒng)建模預警時比計量經濟學方法[7]和人工神經網絡[8]方法更優(yōu)越[9].
宏觀經濟短期預測主要是對GDP、規(guī)模以上工業(yè)增加值、財政收入、居民消費價格指數等指數進行短期預測[10].本文將傳統(tǒng)GMDH 模型和二次自回歸模型進行組合,建立適合經濟運行特點的基于 GMDH 的組合模型,應用相關的統(tǒng)計數據做實證分析,能夠較為準確地實現對宏觀經濟的短期預測.
GMDH自回歸模型是自組織數據挖掘(Self-Organization Data Mining)中的一種模型方法,它是一種基于遺傳進化原理的演化方法,依據給定的準則,從一系列候選模型的集合中挑選出較優(yōu)的模型[11].GMDH算法通過遺傳、變異和選擇,從一個簡單的初始模型生成很多具有不斷增長復雜度的候選模型,直至模型在觀測樣本數據上產生過擬合,即最優(yōu)復雜度為止[12].
在建立GMDH模型[13]時,將樣本數據劃分為訓練集A和檢測集B兩部分,將待預測的數據作為預測集C.將訓練集A、檢測集B、預測集C的數據點個數分別記為N1、N2、N3.設共集為W=A∪B.
Yt=a0+a1×Yt-1+a2×Yt-2+…+am×Yt-m
(1)
模型實現步驟如下.
步驟2在訓練集A和共集W上分別使用最小二乘法擬合這些局部函數的系數,從而得到中間模型;
步驟3利用這些中間模型,計算其對應的訓練集A、共集W和預測集C上的估計值分別為Y1t、Y2t、Y3t;
步驟4以每個中間模型的絕對抗干擾準則值作為目標函數,函數計算公式為
圖1 GMDH自回歸模型流程圖Fig.1 Flow chart of GMDH
(2)
步驟5根據當前層的最小外準則值進行判斷,如果最小外準則值不再減小且當前層數不是第一層,則停止循環(huán),跳轉到步驟7,否則繼續(xù)步驟6;
步驟6淘汰當前層中外準則值較大的M-m個中間模型,將剩下m個中間模型的估計值Y2t、Y3t保留進入下一層;重新兩兩組合,產生M個新的局部函數,跳轉到步驟2;
步驟7最小外準則值所對應的中間模型就是最優(yōu)復雜度模型,估計值Y3t為需預測的樣本值.
GMDH自回歸模型流程圖如圖1所示.
使用二次回歸模型進行預測的步驟如下:
步驟2根據滯后項個數n,建立不同的模型結構,曲線公式為
yt=α+βt-1(yt-1)k1+βt-2(yt-2)k2+…+
βt-n(yt-n)kn,kn=1,2
(3)
式中,α、β為待估參數,t從1取到預測期z,根據公式計算出一系列的預測值點,構成曲線.如果滯后項n大于t,則舍去相應t值對應的數據項.
步驟3估計參數α和β的值,采用最小二乘估計,根據式(4).
∑(Yt-α-βt-1yt-1-βt-2yt-2-…-
βt-nyt-n)
(4)
求解目標是使Q值極小.(Yt為實際值)求Q對α和β的偏導,令其為零,即
(5)
根據公式(5)求出符合要求的待估參數α和β.
步驟4檢驗模型,計算絕對誤差平方和,即殘差,如式(6),
…-βt-nyt-n)
(6)
殘差的值越接近于零,模型越好.二次自回歸模型流程如圖2所示.
圖2 二次自回歸模型流程圖Fig.2 Flow chart of quadratic autoregressive model
應用GMDH模型與二次自回歸模型模型進行宏觀經濟短期預測,以市GDP值為例,表1是某市2006年1月到2008年4月的市GDP值.
表1 2006年1月~2008年4月某市GDP值Tab.1 The city GDP from 2006.1 to 2008.4
將2006年1月到2007年12月的數據作為樣本數據,預測2008年1月到2008年4月的值,并將它們與實際值進行比較.GMDH模型預測值如表2所示,二次自回歸模型預測值如表3所示.
表2 實際值與GMDH模型預測值對比Tab.2 Actual value vs. estimates of GMDH
表3 實際值與二次自回歸模型預測值對比Tab.3 Actual value vs. estimates of quadratic autoregressive model
由表2和表3可知,GMDH模型預測結果與實際值絕對誤差與相對誤差控制在1.6%以內,計算得均方差為1 095.9,二次自回歸模型預測結果與實際值絕對誤差與相對誤差控制在1.4%左右,計算得均方差為1 025.7,具有較好的預測效果,但不同預測結果之間相對誤差偏大,將GMDH模型預測值y1和二次自回歸模型預測值y2以y=(y1+y2)/2計算后得到新的組合預測值如表4所示.
表4 實際值與組合模型預測值對比Tab.4 Actual value vs. estimates of Hybrid model
由表4可知GMDH模型與二次自回歸模型的組合模型相對誤差控制在1.35%以內,計算均方差為867.9,有效的減少了均方差,不同模型預測和實際值數據對比如圖3所示,可以看出組合預測模型曲線整體擬合度更高,預測效果較好.證明本文研究的基于GMDH的混合模型預測是有效的且精度較高.
圖3 不同模型預測和實際值數據對比圖Fig.3 Actual value vs. estimates of different model
實驗證明GMDH 模型和二次自回歸模型能有效預測短期經濟的發(fā)展趨勢,本文將GMDH 模型和二次自回歸模型進行組合,得到的基于 GMDH 的組合模型能夠得到精度較高的預測值,能實現科學地進行宏觀經濟短期預測,輔助宏觀經濟決策部門及時、準確地把握區(qū)域經濟運行態(tài)勢.