馮 韻,何 躍
(四川大學(xué) 工商管理學(xué)院,成都 610064)
結(jié)合景氣指數(shù)的GDP組合預(yù)測(cè)模型研究
馮 韻,何 躍
(四川大學(xué) 工商管理學(xué)院,成都 610064)
文章首先對(duì)中國(guó)季度GDP序列建立了AR-GMDH預(yù)測(cè)模型;然后加入對(duì)GDP相關(guān)性較大的景氣指數(shù),建立了ARCH模型;最后利用GMDH自組織建模方法提出新的組合預(yù)測(cè)模型。對(duì)比分析各模型預(yù)測(cè)結(jié)果表明:兩種單一模型預(yù)測(cè)誤差均在可接受范圍之內(nèi),基于GMDH組合的GDP預(yù)測(cè)模型的擬合和預(yù)測(cè)效果比單一模型更優(yōu)。
GDP;GMDH;ARCH;景氣指數(shù);組合預(yù)測(cè)
GDP是衡量一個(gè)國(guó)家和地區(qū)經(jīng)濟(jì)發(fā)展?fàn)顩r的核心指標(biāo),它的重要性使其一直為研究的熱點(diǎn)。圍繞GDP的預(yù)測(cè),學(xué)者們也從不同角度采用各種方法進(jìn)行了許多研究。近年來,將自組織數(shù)據(jù)挖掘(SODM)思想運(yùn)用到實(shí)際預(yù)測(cè)工作中的研究越來越多,因?yàn)閺?fù)雜性科學(xué)的觀點(diǎn)認(rèn)為,宏觀經(jīng)濟(jì)系統(tǒng)是一個(gè)復(fù)雜系統(tǒng),眾多因素相互關(guān)系十分復(fù)雜,很難斷定其比較固定的變化規(guī)律。但宏觀經(jīng)濟(jì)數(shù)據(jù)中往往也具有一些特征,其時(shí)序模式可能代表著存在的某種周期性、某種趨勢(shì)和相關(guān)關(guān)聯(lián),我們可以利用這些相對(duì)豐富的時(shí)序模式來描述宏觀經(jīng)濟(jì)指標(biāo)的動(dòng)態(tài)變化。
在現(xiàn)代經(jīng)濟(jì)數(shù)據(jù)調(diào)查與統(tǒng)計(jì)中,景氣指數(shù)是重要組成部分,它定性地反映了企業(yè)生產(chǎn)經(jīng)營(yíng)和宏觀經(jīng)濟(jì)發(fā)展的變動(dòng)趨勢(shì)。景氣分析能夠較為科學(xué)地確定和預(yù)測(cè)經(jīng)濟(jì)運(yùn)行中的轉(zhuǎn)折點(diǎn),對(duì)宏觀決策部門及時(shí)、準(zhǔn)確的把握國(guó)民經(jīng)濟(jì)運(yùn)行態(tài)勢(shì)起到了很好的作用。
本文擬首先對(duì)中國(guó)GDP季度數(shù)據(jù)序列建立GMDH自回歸(AR-GMDH)預(yù)測(cè)模型;然后用同樣能模擬時(shí)間序列變量波動(dòng)性變化的自回歸條件異方差模型加入與GDP相關(guān)性較大的景氣數(shù)據(jù)建立預(yù)測(cè)模型;最后運(yùn)用參數(shù)型輸入輸出GMDH模型進(jìn)行組合預(yù)測(cè)。組合預(yù)測(cè)是一個(gè)能聚集各單個(gè)預(yù)測(cè)模型包含的有用信息,從而可提高預(yù)測(cè)精度的有效方法。
數(shù)據(jù)分組處理方法(Group Method of Data Handling,簡(jiǎn)稱GMDH)是由烏克蘭科學(xué)院A.G.Ivakhnenko院士在1967年提出的,是一種基于遺傳與進(jìn)化的演化方法,它依據(jù)給定的準(zhǔn)則從一系列候選模型集合中挑選較優(yōu)模型[1]。該方法的特點(diǎn)是數(shù)據(jù)分組和貫穿于整個(gè)建模過程中的內(nèi)、外準(zhǔn)則的運(yùn)用。它將觀測(cè)樣本數(shù)據(jù)分為訓(xùn)練集 (training set)和檢測(cè)集(testing set)。用GMDH方法建模時(shí),從參考函數(shù)構(gòu)成的初始模型(函數(shù))集合出發(fā),在訓(xùn)練集上利用內(nèi)準(zhǔn)則(最小二乘法)進(jìn)行參數(shù)估計(jì)得到中間待選模型(遺傳、變異),在檢測(cè)集上利用外準(zhǔn)則進(jìn)行中間候選模型的選留(選擇)。重復(fù)這樣一個(gè)遺傳、變異、選擇和進(jìn)化的過程,使中間候選模型的復(fù)雜度不斷增加,直至得到最優(yōu)復(fù)雜度模型。
GMDH算法的基本步驟由以下四階段組成:
(1)將樣本集 W 分為學(xué)習(xí)集 A(training set)、檢測(cè)集 B(testing set)(W=A+B)。
(2)建立輸入變量和輸出變量之間的一般函數(shù)關(guān)系。一般使用Kolmogorov-Gabor多項(xiàng)式參考函數(shù)。
(3)選擇一個(gè)外準(zhǔn)則作為一個(gè)目標(biāo)函數(shù)。GMDH算法允許眾多選擇準(zhǔn)則,為不同系統(tǒng)確定各自的復(fù)雜性,如最小偏差準(zhǔn)則。
(4)計(jì)算選擇準(zhǔn)則(外準(zhǔn)則)值,選擇滿足外準(zhǔn)則的傳遞函數(shù)作為最優(yōu)模型繼續(xù)構(gòu)建網(wǎng)絡(luò),直到最后模型結(jié)構(gòu)不能再改善,得到最優(yōu)復(fù)雜度模型。
ARCH模型又稱為自回歸條件異方差模型(Autoregressive conditional heteroskedasticity model,ARCH),1982 年由恩格爾(Engle,R.)提出。ARCH模型通常用于對(duì)主體模型的隨機(jī)擾動(dòng)進(jìn)行建模,它能夠有效地提取殘差中的信息,被廣泛的應(yīng)用于經(jīng)濟(jì)學(xué)的各個(gè)領(lǐng)域,尤其是在金融時(shí)間序列分析中。因此ARCH模型在經(jīng)濟(jì)預(yù)測(cè)中也取得了良好的效果。
ARCH模型建立步驟如下:
(1)建立時(shí)間序列數(shù)據(jù)。
(2)對(duì)序列做ARCH效應(yīng)的LM檢驗(yàn),只有存在ARCH效應(yīng)時(shí)才能繼續(xù)建立相應(yīng)的ARCH模型;如果序列存在高階ARCH效應(yīng),即存在GARCH效應(yīng),則可以建立GARCH模型。
(3)通過試驗(yàn)進(jìn)行ARCH模型定階和參數(shù)估計(jì)。
(4)根據(jù)AIC及SC準(zhǔn)則,配合方差表達(dá)式參數(shù)是否滿足平穩(wěn)性條件及殘差獨(dú)立性檢驗(yàn),通過比較選擇適宜的模型。
為全面貫徹國(guó)家大力發(fā)展特色小鎮(zhèn)建設(shè)精神,《廣西培育特色小鎮(zhèn)意見》提出,到2020年,要培育30個(gè)左右全國(guó)特色小鎮(zhèn)、100個(gè)左右自治區(qū)級(jí)特色小鎮(zhèn)、建設(shè)200個(gè)左右市級(jí)特色小鎮(zhèn)。該意見的出臺(tái)為廣西貫徹國(guó)家特色小鎮(zhèn)發(fā)展戰(zhàn)略、發(fā)展廣西區(qū)域經(jīng)濟(jì)明確了方向。
由于經(jīng)濟(jì)系統(tǒng)復(fù)雜多變,在實(shí)際應(yīng)用中,單一模型往往受隨機(jī)因素影響較大而影響預(yù)測(cè)效果。組合預(yù)測(cè)則是對(duì)所建立的多個(gè)單一預(yù)測(cè)模型進(jìn)行綜合處理,它能夠綜合并最大效用地利用各個(gè)模型的有用信息,減少單個(gè)模型受隨機(jī)因素的影響?;贕MDH輸入輸出模型方法的組合預(yù)測(cè)模型就是利用自組織數(shù)據(jù)挖掘算法在盡可能多的模型結(jié)構(gòu)形式中進(jìn)行擇優(yōu)選擇,而不僅僅在線性形式中進(jìn)行計(jì)算選擇,體現(xiàn)了復(fù)雜性科學(xué)研究思想[2]。
本文從國(guó)家統(tǒng)計(jì)局網(wǎng)站得來2003年1季度至2009年3季度的中國(guó)GDP(現(xiàn)價(jià))累計(jì)值與當(dāng)季度的企業(yè)景氣指數(shù)共27組數(shù)據(jù),并對(duì)GDP累計(jì)值作換算季度值處理后作為實(shí)驗(yàn)原始數(shù)據(jù)。將其中2003年1季度至2008年4季度共24個(gè)季度的數(shù)據(jù)用作建模,2009年1至3季度的數(shù)據(jù)作為預(yù)測(cè)檢驗(yàn)數(shù)據(jù)。首先利用GDP數(shù)據(jù)用GMDH模型進(jìn)行預(yù)測(cè),得到Y(jié)GMDH值;然后運(yùn)用GDP值與相關(guān)景氣數(shù)據(jù)用ARCH模型進(jìn)行預(yù)測(cè),得到Y(jié)ARCH值;再將各單項(xiàng)模型預(yù)測(cè)結(jié)果使用GMDH輸入輸出模型方法進(jìn)行組合預(yù)測(cè)。
(1)將真實(shí)GDP值環(huán)比指數(shù)化,即用環(huán)比預(yù)測(cè)消除量綱影響:
(2)用自組織建模軟件(KnowledgeMiner)計(jì)算機(jī)篩選出最優(yōu)復(fù)雜度模型:
(3)預(yù)測(cè)結(jié)果指標(biāo)分析
在模型擬合與預(yù)測(cè)中,R2(R-squared)越接近 1,效果越好。此模型中R2=0.9859,十分接近1,擬合效果好;平均絕對(duì)百分比誤差(Mean Absolute Percentage Error)越小越好,控制在5%以內(nèi)均是可接受水平,此模型中MAPE=1.41% ,誤差??;預(yù)測(cè)誤差平方和(PESS)越小越好,此模型中PESS=0.0194,預(yù)測(cè)誤差較小。
進(jìn)行景氣預(yù)測(cè)。首先通過相關(guān)性分析從眾多的景氣指數(shù)中挑選出與被預(yù)測(cè)指標(biāo)相關(guān)程度較高的特定景氣指數(shù)i然后將被選定的景氣指數(shù)連同原先模型中的輸入變量組成新的輸入變量開始模型計(jì)算,從而得到模型結(jié)果進(jìn)行預(yù)測(cè)[3]。
(1)將 2003年 1季度至2008年 4季度 GDP真實(shí)值和2003年1季度至2009年3季度景氣指數(shù)作為建模數(shù)據(jù),根據(jù)前面介紹的步驟建立模型,模型定階為ARCH(1)。
(2)用Eviews軟件[4]建立最終模型為:
(3)預(yù)測(cè)結(jié)果指標(biāo)分析:
此模型中R2=0.9982,充分接近1,擬合效果很好;平均絕對(duì)百分比誤差 (Mean Absolute Percentage Error)=1.56%,誤差較小。
上述兩個(gè)模型從不同角度建立。第一個(gè)模型運(yùn)用單序列自回歸,ARCH模型屬于多變量建模,因此組合上述兩個(gè)模型可以結(jié)合各種模型優(yōu)點(diǎn)、綜合利用各方面有用信息。
分析預(yù)測(cè)值與實(shí)際值發(fā)現(xiàn),二者之間存在著非線性關(guān)系,使用非線性組合預(yù)測(cè)法更適用于GDP預(yù)測(cè)[5]。GMDH輸入輸出模型是根據(jù)自組織數(shù)據(jù)挖掘原理,并允許以非線性模式建模的方法。本文以 YGMDH、YARCH作為模型輸入,使用GMDH輸入輸出模型將各個(gè)單模型預(yù)測(cè)結(jié)果組合起來,得到最終的組合模型為:
此模型中R2=0.9951,充分接近1,擬合效果很好;平均絕對(duì)百分比誤差 (Mean Absolute Percentage Error)=1.19%,預(yù)測(cè)誤差平方和(PESS)=0.0075,誤差均非常小,預(yù)測(cè)效果好。
從各模型的實(shí)驗(yàn)結(jié)果參數(shù)(R2值與平均絕對(duì)百分比誤差值等)可以看出,各模型預(yù)測(cè)效果不錯(cuò),相對(duì)誤差均能控制在4%以內(nèi)。表1為各模型預(yù)測(cè)效果對(duì)比,其中AR-GMDH模型預(yù)測(cè)結(jié)果是季度GDP環(huán)比預(yù)測(cè)值換算成為真實(shí)值。
表1 2009年前3季度預(yù)測(cè)結(jié)果對(duì)比
從表1可以看出,基于GMDH組合模型在GDP預(yù)測(cè)中取得了良好的效果:組合模型的平均絕對(duì)百分比誤差最小,相對(duì)誤差均在1%左右,效果比較滿意。雖然在某些年份的預(yù)測(cè)中,單模型可能會(huì)好于組合預(yù)測(cè)(如2009年1季度ARCH模型預(yù)測(cè)值好于組合模型,2季度GMDH模型預(yù)測(cè)好于組合模型),但是標(biāo)準(zhǔn)誤差卻遠(yuǎn)大于組合預(yù)測(cè)的標(biāo)準(zhǔn)誤差,并且相對(duì)誤差的波動(dòng)性較大。這均說明了組合預(yù)測(cè)是能夠提高整個(gè)模型的預(yù)測(cè)精度的。
本文首先以2003年1季度至2008第4季度中國(guó)GDP值建立了AR-GMDH預(yù)測(cè)模型,然后加入相關(guān)景氣數(shù)據(jù)建立了ARCH預(yù)測(cè)模型,對(duì)2009年第1季度至第3季度的GDP進(jìn)行預(yù)測(cè)。在此基礎(chǔ)上為了提高模型預(yù)測(cè)精度,利用GMDH組合預(yù)測(cè)方法對(duì)兩個(gè)單一模型預(yù)測(cè)結(jié)果進(jìn)行了組合。通過將組合預(yù)測(cè)值與2009年1至3季度的GDP實(shí)際值以及各模型預(yù)測(cè)值進(jìn)行比較,得出以下結(jié)論:
(1)雖然單個(gè)模型預(yù)測(cè)效果也令人滿意,但組合模型能夠集合單個(gè)模型的優(yōu)點(diǎn),提高預(yù)測(cè)精度。
(2)加入相關(guān)景氣數(shù)據(jù)能增加建模的有用信息,提高模型預(yù)測(cè)能力。每個(gè)單模型的擬合預(yù)測(cè)效果好,更能提高組合模型的精度。
[1]Ivakhnenko A.G.,Mueller J.A.Problems of an Objective Computer Clustering of a Sample of Observations[J].Soviet Journal of Automation and Information Sciences c/c of Avtomatike,1991,24(1).
[2]賀昌政.自組織數(shù)據(jù)挖掘與經(jīng)濟(jì)預(yù)測(cè)[M].北京:科學(xué)出版社,2005.
[3]何躍等.運(yùn)用統(tǒng)計(jì)指標(biāo)與景氣指數(shù)對(duì)工業(yè)經(jīng)濟(jì)的組合預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2007,(9).
[4]易丹輝.?dāng)?shù)據(jù)分析與EVIEWS應(yīng)用[M].北京:中國(guó)統(tǒng)計(jì)出版社.
[5]魏仕強(qiáng)等.基于ARMA-ARCH的GDP組合預(yù)測(cè)[J].統(tǒng)計(jì)與決策,2007,(5).
(責(zé)任編輯/亦 民)
F201
A
1002-6487(2010)20-0019-03
國(guó)家自然科學(xué)基金資助項(xiàng)目(70771067)
馮 韻(1988-),女,四川巴中人,碩士研究生,研究方向:數(shù)據(jù)挖掘、管理信息系統(tǒng)。
何 躍(1961-),男,重慶人,博士,副教授,研究方向:數(shù)據(jù)挖掘、決策支持系統(tǒng)。