唐家琳,陳 靜,薛 君
(西安郵電大學(xué) 經(jīng)濟(jì)與管理學(xué)院,西安 710061)
自從計(jì)量經(jīng)濟(jì)理被引入我國以來,基于時(shí)間序列歷史數(shù)據(jù)的經(jīng)濟(jì)預(yù)測方法不僅在種類上日益增多,并且所運(yùn)用的范圍也越來越廣闊。最為常見的是經(jīng)典計(jì)量學(xué)中的簡單最小二乘法(OLS)、結(jié)構(gòu)向量自回歸模型(ARIMA)、脈沖響應(yīng)及方差貢獻(xiàn)及結(jié)構(gòu)方程理論(SEM)的引用;而專門的預(yù)測方法也逐漸被引入,如指數(shù)平滑法、移動(dòng)平均法、趨勢外推(皮爾曲線和龔伯茲曲線)及滾動(dòng)天窗法;同時(shí)隨著數(shù)學(xué)與經(jīng)濟(jì)學(xué)學(xué)科交叉引起的純數(shù)學(xué)理論方法的運(yùn)用趨勢也不斷擴(kuò)大,如機(jī)械工程領(lǐng)域的小波理論運(yùn)用(王正歡,2011)、計(jì)算機(jī)領(lǐng)域的BP混合算法(尹新,2010)等;還有一些是基于傳統(tǒng)時(shí)間序列模型加以的改進(jìn)方法,如顧晨陽(2010)引入組合規(guī)劃思想,形成了權(quán)重變化組合方法對(duì)交通流量進(jìn)行預(yù)測。何其慧(2011)采用了一個(gè)權(quán)重半徑的概念,形成優(yōu)化模型,根據(jù)預(yù)測區(qū)間誤差計(jì)算權(quán)重,最終形成預(yù)測依據(jù)。但學(xué)術(shù)界普遍認(rèn)為,無論采取何種預(yù)測方法,也僅僅只能說是“預(yù)計(jì)的數(shù)值”,沒有一種能夠在較長時(shí)間段對(duì)所有研究序列實(shí)現(xiàn)精確預(yù)測的“最佳方法”,對(duì)于采取方法的好壞最終還是取決于相對(duì)誤差程度,這里認(rèn)為預(yù)測誤差的根源在于:一是經(jīng)濟(jì)環(huán)境內(nèi)在機(jī)理的轉(zhuǎn)變,我們經(jīng)常通過實(shí)證研究可以發(fā)現(xiàn)某一種預(yù)測方法在特定時(shí)間段內(nèi)針對(duì)某一特殊指標(biāo)進(jìn)行預(yù)測的效度很高,但換一個(gè)對(duì)象或時(shí)期研究的模擬精度非常低;二是數(shù)理工具本身內(nèi)在的缺陷,幾乎所有方法都是基于一定的假設(shè)前提和理論基礎(chǔ),但實(shí)際上這些基礎(chǔ)條件在現(xiàn)實(shí)經(jīng)濟(jì)活動(dòng)中可以說一直不具備,故必然存在缺陷。本文的目的并非在于重新設(shè)計(jì)一種預(yù)測模型,而是在現(xiàn)有模型基礎(chǔ)上考慮如何將模型進(jìn)行改進(jìn),那么提高精度的唯一途徑是準(zhǔn)確認(rèn)識(shí)誤差變動(dòng)規(guī)律,采用誤差修正的措施對(duì)所有預(yù)測方法根據(jù)實(shí)際數(shù)據(jù)情況進(jìn)行“精度提升”。
對(duì)于兩個(gè)相鄰的平均滾動(dòng)誤差 AFE[i,i+n-1]和AFE[i+1,i+n](i≤n-1)來說,兩者之差可以表述為:?i+1=AFE[i,i+n-1]-AFE[i+1,i+n],值越大表明研究區(qū)間向后滾動(dòng)一個(gè)天窗后帶來的波動(dòng)性越大,更進(jìn)一步說是第i+n與i數(shù)據(jù)之間發(fā)生了機(jī)理性突變,其實(shí)在時(shí)間序列發(fā)生過程中,兩個(gè)相鄰的數(shù)據(jù)之間都或多或少發(fā)生的突變現(xiàn)象,但由于單個(gè)數(shù)據(jù)之間關(guān)系無法準(zhǔn)確用方法來刻畫其突變過程。上述兩個(gè)滾動(dòng)誤差之間共同存在的區(qū)間是[i+1,i+n-1],使兩個(gè)AFE產(chǎn)生差別的根本原因是xi+n與 xi發(fā)生數(shù)據(jù)規(guī)律變動(dòng),故 ?i+1又可以表示為AFE[i?i+n],所以在2n個(gè)數(shù)時(shí)間序列下存在n個(gè)突變測算點(diǎn),如圖1。
根據(jù)上述,得到了以區(qū)間長度為n的數(shù)據(jù)突變規(guī)律,記為函數(shù)?(n+t)(t=1,2,......n),具體的函數(shù)形式可以根據(jù)情況進(jìn)行擬合。但這樣同樣會(huì)遇到時(shí)間序列模型的老問題:這種誤差規(guī)律的預(yù)測同樣存在誤差,所以如何尋找出科學(xué)合理的函數(shù)形式或規(guī)律軌跡至關(guān)重要。一般而言,人們通常根據(jù)已知的數(shù)據(jù)區(qū)間[1,2n]根據(jù)預(yù)測模型想得到2n+1期的實(shí)際值,如果AFE[i?i+n]數(shù)據(jù)突變軌跡仍然回重演,則表示由n+1點(diǎn)向2n+1點(diǎn)轉(zhuǎn)變過程中的規(guī)律和[1?1+n,n?2n]運(yùn)動(dòng)區(qū)間類似。
通過加權(quán)權(quán)重得到了AFE[n+1?1+2n],而這個(gè)值的原始意思是[n+1,2n+1]與[n,2n]的平均誤差值之差,而由于[n,2n]之間的原始數(shù)據(jù)和預(yù)測數(shù)據(jù)俱全,故AFE[n,2n]是已知的,同時(shí)AFE[n+1?1+2n]已知,所以在未預(yù)測之處便可由這樣的結(jié)論:[n+1,2n+1]之間的預(yù)測誤差為:
對(duì)于幾乎所有時(shí)間預(yù)測方法而言,其本身都是數(shù)據(jù)規(guī)律挖掘的一種方法,雖然它們用不同的機(jī)理和方式進(jìn)行表達(dá),但本質(zhì)上都具有共性。但歷史數(shù)據(jù)序列由于這樣或者那樣的原因規(guī)律軌跡并不服從一定的連續(xù)性規(guī)律,或多或少產(chǎn)生突變性現(xiàn)象,而預(yù)測方法也只能挖掘到部分信息規(guī)律,而對(duì)突變規(guī)律無法掌握。這種基于誤差滾動(dòng)規(guī)律挖掘的方法,正是基于單個(gè)預(yù)測方法挖掘信息相對(duì)固定的潛在特性,對(duì)其進(jìn)行突變誤差修正,采用一種倒推的思想理念對(duì)由原方法產(chǎn)生的預(yù)測值進(jìn)行修正的處理過程,可以說具有一定的創(chuàng)新性。并且即使是原方法的預(yù)測值,也是依靠n個(gè)數(shù)據(jù)區(qū)間進(jìn)行滾動(dòng)預(yù)測的,并非將2n個(gè)數(shù)據(jù)一起采用某預(yù)測方法對(duì)2n+1期進(jìn)行預(yù)測得到,這樣做的目的還是在于要體現(xiàn)誤差統(tǒng)計(jì)的規(guī)律變動(dòng)。
本文選取1991~2010年間我國農(nóng)林牧副漁產(chǎn)業(yè)總產(chǎn)值作為預(yù)測序列,數(shù)據(jù)來源于《中國統(tǒng)計(jì)年鑒》。將1991年作為時(shí)間1,其余時(shí)間年份以此類推,構(gòu)建簡單最小二乘法利用EVIEWS5.0軟件進(jìn)行回歸,有模型:
圖2 原始序列和預(yù)測序
表1 平均誤差及運(yùn)算結(jié)果
首先對(duì)20年的數(shù)據(jù)進(jìn)行回歸處理,得到C=2053 ,a=2760,同時(shí)得到預(yù)測序列XF,具體如圖2所示。可以發(fā)現(xiàn)1991~1998、2007~2010年間實(shí)際值高于預(yù)測值,而在1998~2006年間相反。相關(guān)性檢驗(yàn)系數(shù)為0.95,說明從序列角度看效果較好,但仍然存在5%的誤差,并且誤差也具有一定的規(guī)律性。
(1)滾動(dòng)區(qū)間預(yù)測誤差計(jì)算
分別對(duì)1991~2000、1992~2001、1993~2002、……2001~2010共10個(gè)區(qū)間段分別采用OLS模型進(jìn)行回歸,得到平均預(yù)測誤差。從表1可以看出10個(gè)滾動(dòng)區(qū)間內(nèi)的預(yù)測平均誤差在0.058至0.119之間,說明同樣一個(gè)回歸模型在不同區(qū)間中的預(yù)測效果不同,在1992~2001中的預(yù)測效力最低。
(2)突變點(diǎn)運(yùn)算結(jié)果
用表1中的第二列數(shù)據(jù)進(jìn)行相鄰區(qū)間計(jì)算數(shù)值進(jìn)行遞級(jí)相減,得到第三列,其中正號(hào)數(shù)值表示后區(qū)間的末端點(diǎn)較前區(qū)間的前端點(diǎn)發(fā)生了負(fù)向結(jié)構(gòu)突變,負(fù)號(hào)數(shù)值意義則相反。其中正號(hào)個(gè)數(shù)為4,負(fù)號(hào)個(gè)數(shù)為6,說明整體上我國農(nóng)林牧副漁產(chǎn)值序列有負(fù)向結(jié)構(gòu)變化趨勢。
(3)賦權(quán)運(yùn)算
距離2011年越遠(yuǎn)的區(qū)間其賦予的權(quán)重越低,根據(jù)第二部分的權(quán)重計(jì)算公式可以的到表2。
表2 區(qū)間突變權(quán)重
(4)預(yù)測值的修正
而用2002~2010間9年的數(shù)據(jù)進(jìn)行回歸,有:
圖3 三序列比較分析圖
則可以得到修正值為72280.5億元或71565.6億元,表明修正系數(shù)為1±0.009。而從本案例實(shí)際看,在2010預(yù)測上實(shí)際值要高于預(yù)測值,按照就近參照原則,對(duì)預(yù)測值進(jìn)行正向修正的可行性要大些,即72280.5億元是2011年的最佳預(yù)測值。
進(jìn)一步計(jì)算討論。本文在求得突變點(diǎn)規(guī)律系數(shù)的過程中,分別對(duì)10個(gè)時(shí)間段進(jìn)行了OLS回歸,這樣就可以求得區(qū)間末端加1期的預(yù)測值,如1991~2000數(shù)據(jù)預(yù)測2001的數(shù)值,共有10個(gè)。圖3為區(qū)間點(diǎn)預(yù)測、實(shí)際值和用20年數(shù)據(jù)OLS回歸得到的相應(yīng)預(yù)測值,很明顯區(qū)間點(diǎn)預(yù)測值一直圍繞著實(shí)際值在波動(dòng),比全時(shí)間段預(yù)測結(jié)果更能貼近實(shí)際,這是因?yàn)殚L期數(shù)據(jù)回歸過程包含了太多了的歷史信息,對(duì)最新信息賦予權(quán)重不夠,造成預(yù)測偏差。
通過對(duì)傳統(tǒng)預(yù)測方法的經(jīng)驗(yàn)總結(jié),認(rèn)為應(yīng)繞開到底種預(yù)測方法更好的傳統(tǒng)認(rèn)識(shí)誤區(qū),應(yīng)當(dāng)從預(yù)測誤差變動(dòng)規(guī)律入手,在已有的預(yù)測方法基礎(chǔ)上提出一種修正指數(shù)概念,總體來說有以下結(jié)論。
(1)所有預(yù)測方法都只能算作一種事前估計(jì)的方法而已,所以當(dāng)前很多學(xué)者盲目去做基于某特定方法的改進(jìn)意義有待商榷,應(yīng)當(dāng)建立一種具有普遍意義和共性的誤差修正方法,能夠?qū)λ蓄A(yù)測方法進(jìn)行精度改進(jìn)。當(dāng)然本文對(duì)滾動(dòng)誤差規(guī)律的論述還不深刻,特別是在實(shí)例計(jì)算中也僅僅涉及到10個(gè)區(qū)間樣本,一般而言數(shù)據(jù)區(qū)間個(gè)數(shù)越多能夠挖掘出的突變信息就越多,但如果就人工進(jìn)行計(jì)算那么計(jì)算量非常繁重,故應(yīng)當(dāng)設(shè)計(jì)相應(yīng)的計(jì)算程序能夠?qū)崿F(xiàn)高頻數(shù)據(jù)的直接計(jì)算。
(2)正確認(rèn)識(shí)到誤差產(chǎn)生的原因才能夠降低預(yù)測偏差,從而提高精度。到底是信息長度越長越好、還是越短越好,這個(gè)問題似乎纏繞了所有理論學(xué)者,因?yàn)闀r(shí)間序列越長,能夠提煉出的信息容量也越大,但各種方法都不約而同的存在一個(gè)缺陷:時(shí)間越長,一些無用信息或者負(fù)面信息也被容納的越多,盡管當(dāng)前采用了時(shí)期權(quán)重的方法進(jìn)行了修正,但誰也無法保證自身的賦權(quán)方法是正確合理的。針對(duì)于這個(gè)現(xiàn)狀,本文提出了滾動(dòng)區(qū)間中的“平均滾動(dòng)誤差”和結(jié)構(gòu)突變規(guī)律概念,主要是為了表現(xiàn)區(qū)間吞吐數(shù)值之間的結(jié)構(gòu)性變化,從而得到對(duì)傳統(tǒng)預(yù)測模型預(yù)測結(jié)果的進(jìn)一步無偏估計(jì)修正。
(3)案例分析說明,使用滾動(dòng)天窗式的分別模型運(yùn)用帶來的預(yù)測效果從整體上高于全數(shù)據(jù)預(yù)測結(jié)果。李運(yùn)蒙(2004)提出了一種從長短期經(jīng)濟(jì)規(guī)律變化角度考慮的支持向量機(jī)預(yù)測精度提高方法,先采用兩種模型對(duì)經(jīng)濟(jì)現(xiàn)象進(jìn)行模擬,最后將兩個(gè)預(yù)測結(jié)果進(jìn)行集成。本文的想法在某種程度上與該文類似,基本思想是可以通過可觀測數(shù)據(jù)的利用方式整合,盡可能挖掘出有用的信息;不同點(diǎn)在于本文認(rèn)為,如果經(jīng)濟(jì)規(guī)律比較穩(wěn)定,那么就很容易通過精度分析評(píng)測出一種最為有效的預(yù)測模型,得到了的誤差也比較穩(wěn)定。但在現(xiàn)實(shí)中正是因?yàn)榻?jīng)濟(jì)規(guī)律變化(短期規(guī)律可能穩(wěn)定、但長期發(fā)生變化)產(chǎn)生了誤差波動(dòng)現(xiàn)象,讓預(yù)測者無所適從,只能依靠一區(qū)間內(nèi)的平均相對(duì)誤差進(jìn)行相對(duì)評(píng)判。針對(duì)于新的預(yù)測點(diǎn)來說,前面若干年的平均誤差程度并不具有很強(qiáng)的參考意義,因?yàn)樽罱K考察一種預(yù)測模型有效性的標(biāo)準(zhǔn)還是預(yù)測點(diǎn)上的誤差,所以探尋誤差規(guī)律和挖掘滾動(dòng)區(qū)間的規(guī)律波動(dòng)非常重要。
[1]王正歡,劉琦,羅朝輝,楊枉元.基于小波分析的全國社會(huì)消費(fèi)品零售總額時(shí)間序列預(yù)測[J].云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,(3).
[2]尹新,周野,何怡剛.基于混合算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的混沌時(shí)間序列預(yù)測[J].湖南大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,(6).
[3]顧晨陽,羅熹,程文龍.變權(quán)重組合預(yù)測模型在短時(shí)交通流預(yù)測中的應(yīng)用[J].統(tǒng)計(jì)與決策,2010,(6).
[4]何其慧,黃德舜,張小霞,毛軍軍.一種新的區(qū)間權(quán)重組合預(yù)測方法[J].合肥師范學(xué)院學(xué)報(bào),2011,(6).
[5]李運(yùn)蒙.一種基于支持向量機(jī)預(yù)測模型的精度提高方法與運(yùn)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2004,(8).