肖爭艷 劉玲君 趙廷蓉 陳彥斌
內(nèi)容提要:目前國內(nèi)外復(fù)雜的經(jīng)濟(jì)形勢加大了預(yù)測GDP的難度,因此,如何有效地預(yù)測GDP是值得研究的重要理論與現(xiàn)實問題。有鑒于此,本文構(gòu)建了既具有宏觀經(jīng)濟(jì)理論基礎(chǔ)又符合中國宏觀經(jīng)濟(jì)特征的指標(biāo)體系,并構(gòu)造了一個用于GDP預(yù)測分析的LSTM模型,將之與BVAR模型進(jìn)行對比研究,以科學(xué)地判斷LSTM模型是否能夠提升GDP預(yù)測的精確度。研究結(jié)果表明:第一,本文選擇的擴(kuò)展指標(biāo)能夠提升BVAR模型與LSTM模型的GDP預(yù)測能力;第二,相比于BVAR模型,LSTM模型能夠更好地挖掘擴(kuò)展指標(biāo)對GDP的非線性影響,從而提升短期GDP預(yù)測能力。鑒于LSTM模型強大的自我學(xué)習(xí)能力、良好的泛化能力以及較好的模型可調(diào)節(jié)性,LSTM模型在GDP預(yù)測領(lǐng)域具有廣闊前景。
GDP增速是國家進(jìn)行宏觀調(diào)控和企業(yè)進(jìn)行投融資決策的關(guān)鍵參考變量之一,預(yù)測GDP增速一直是宏觀經(jīng)濟(jì)學(xué)的重要研究領(lǐng)域。然而,目前國內(nèi)外復(fù)雜的經(jīng)濟(jì)形勢加大了預(yù)測GDP的難度,給經(jīng)濟(jì)增長目標(biāo)和宏觀政策的制定提出了新的挑戰(zhàn)。一方面,隨著供給側(cè)結(jié)構(gòu)性改革的不斷推進(jìn),許多新產(chǎn)業(yè)的出現(xiàn)使得中國產(chǎn)業(yè)結(jié)構(gòu)發(fā)生了較大的變化,經(jīng)濟(jì)的結(jié)構(gòu)性特征對經(jīng)濟(jì)增長的影響越來越重要。另一方面,近年來貿(mào)易保護(hù)主義抬頭,國際貿(mào)易摩擦加劇,為中國經(jīng)濟(jì)增長帶來了極大的不確定性。在此背景下,如何有效地預(yù)測GDP是值得研究的重要問題。更重要的是,國內(nèi)經(jīng)濟(jì)結(jié)構(gòu)與國際經(jīng)濟(jì)環(huán)境的變化要求選擇合適的預(yù)測方法,以確保預(yù)測精確度。
預(yù)測GDP的已有研究主要使用兩類模型。一類是線性模型,該類模型以貝葉斯向量自回歸(BVAR)模型為代表。王飛(2011)以青海省為例建立了一個BVAR模型,樣本內(nèi)和樣本外的預(yù)測誤差都表明BVAR 模型的GDP預(yù)測效果優(yōu)于向量自回歸(vector autoregression,VAR)、差分整合移動平均自回歸(autoregressive integrated moving average,ARIMA)等線性模型[1]。周建和況明(2015)構(gòu)建BVAR模型對中國GDP預(yù)測誤差進(jìn)行分析,發(fā)現(xiàn)BVAR模型優(yōu)于現(xiàn)有文獻(xiàn)中傳統(tǒng)的VAR方法[2]。
另一類GDP預(yù)測模型是非線性模型,該類模型以人工神經(jīng)網(wǎng)絡(luò)(artificial neural Network,ANN)為代表。ANN作為人工智能領(lǐng)域的非線性方法,能夠處理非線性、不連續(xù)和高頻多維的數(shù)據(jù),因而該模型在GDP預(yù)測領(lǐng)域得到越來越多的關(guān)注。特卡茨(Tkacz,2001)構(gòu)建神經(jīng)網(wǎng)絡(luò)對加拿大年度GDP增速進(jìn)行預(yù)測分析,發(fā)現(xiàn)用該模型訓(xùn)練得到的預(yù)測誤差比線性模型降低約25%[3]。歐邦才(2004)采用BP神經(jīng)網(wǎng)絡(luò)對中國年度GDP進(jìn)行預(yù)測,發(fā)現(xiàn)預(yù)測效果較好[4]。郭慶春和何振芳(2014)使用改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)建立GDP預(yù)測模型,研究表明該模型具有較高的預(yù)測精度,并且還具有泛化能力強、訓(xùn)練速度快、穩(wěn)定性好等優(yōu)點[5]。傳統(tǒng)的ANN模型雖然能保證網(wǎng)絡(luò)學(xué)習(xí)過程的最終收斂,但不能反映樣本之間的時序關(guān)系,而在經(jīng)濟(jì)領(lǐng)域普遍存在的這種時序關(guān)系及其背后的邏輯關(guān)系與理論關(guān)系對于預(yù)測分析是大有裨益的。相比之下,深度學(xué)習(xí)模型中的長短期記憶神經(jīng)網(wǎng)絡(luò)模型(long short term memory,LSTM)由于其出色的時序數(shù)據(jù)處理能力,在經(jīng)濟(jì)與金融預(yù)測領(lǐng)域得到了較為廣泛的應(yīng)用與推廣。崔和李(Choi & Lee,2018)使用LSTM模型來預(yù)測實時時間序列數(shù)據(jù),結(jié)果表明LSTM模型取得了已知各類模型中的最好預(yù)測效果[6]。趙軍豪等(2018)等使用融合微博情感分析和LSTM模型進(jìn)行預(yù)測,發(fā)現(xiàn)該方法對數(shù)據(jù)抖動有良好的適應(yīng)性,并具有很好的穩(wěn)健性[7]。
使用神經(jīng)網(wǎng)絡(luò)方法預(yù)測GDP的已有文獻(xiàn)較豐富,也取得了顯著的學(xué)術(shù)進(jìn)展,但仍有可進(jìn)一步改進(jìn)的地方。首先,雖然以往研究對短期GDP預(yù)測算法做了改進(jìn),但鮮有文獻(xiàn)對線性與非線性兩類模型的預(yù)測效果進(jìn)行比較。宏觀經(jīng)濟(jì)指標(biāo)體系是一組時間序列數(shù)據(jù),在這組數(shù)據(jù)中部分指標(biāo)會對核心變量GDP產(chǎn)生非線性的影響。但是,非線性模型是否能夠抓住這種非線性影響?非線性模型與線性模型相比預(yù)測效果是否會有顯著提高?對于這兩個問題已有文獻(xiàn)尚未給出明確答案。其次,已有研究的宏觀指標(biāo)選擇往往沒有以經(jīng)濟(jì)學(xué)理論為依據(jù),可能會增加模型預(yù)測誤差。已有GDP預(yù)測方面的文獻(xiàn)在進(jìn)行預(yù)測指標(biāo)選擇時,大多存在預(yù)測指標(biāo)與宏觀經(jīng)濟(jì)理論分離的現(xiàn)象,這可能會導(dǎo)致遺漏重要指標(biāo)的問題出現(xiàn),從而增大了GDP預(yù)測的誤差。最后,對于如何選擇影響模型短期預(yù)測能力的指標(biāo),現(xiàn)有文獻(xiàn)往往依據(jù)國際相關(guān)經(jīng)驗,而對于是否符合國情考慮較少。由于中國經(jīng)濟(jì)增長具有明確的國情特征尤其是結(jié)構(gòu)性特征,與歐美等其他國家差異較大,所以有必要依據(jù)中國經(jīng)濟(jì)特點來選擇預(yù)測指標(biāo)。以房地產(chǎn)市場為例,陳小亮(2017)測算發(fā)現(xiàn),2016年中國房地產(chǎn)對GDP增長的總貢獻(xiàn)率高達(dá)18.3%[8]。因此,在選擇中國GDP預(yù)測影響因素時,不能忽略房地產(chǎn)等切實反映中國國情的宏觀指標(biāo)。
為了有效解決以上問題,本文在已有研究文獻(xiàn)的基礎(chǔ)上進(jìn)行改進(jìn),主要包括兩個方面。第一,本文選擇線性模型的代表BVAR模型和非線性模型的代表LSTM模型進(jìn)行預(yù)測,并且采用常用的經(jīng)濟(jì)預(yù)測誤差指標(biāo)對兩種模型的預(yù)測能力進(jìn)行度量。BVAR模型在預(yù)測效果和穩(wěn)健性方面均有較好表現(xiàn)[1],是在經(jīng)濟(jì)預(yù)測領(lǐng)域得到廣泛應(yīng)用的線性模型。LSTM模型基于當(dāng)前熱門的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù),并且具有較為優(yōu)異的時序數(shù)據(jù)處理能力,是GDP預(yù)測領(lǐng)域較為值得推廣的非線性模型。因此,本文選擇BVAR模型作為參照,比較分析LSTM模型的預(yù)測能力。此外,為對兩模型的預(yù)測能力進(jìn)行充分的對比,本文分別在動態(tài)滾動預(yù)測與固定估計窗口預(yù)測兩種方式下,采用BVAR模型與LSTM模型預(yù)測GDP,從而充分比較兩個模型的預(yù)測誤差以判斷二者的差異及優(yōu)劣。第二,本文構(gòu)建了既具有宏觀經(jīng)濟(jì)理論基礎(chǔ)又符合中國國情的宏觀經(jīng)濟(jì)指標(biāo)體系,本文首先以主流宏觀理論中的IS-LM模型為理論基礎(chǔ)構(gòu)建了基準(zhǔn)指標(biāo)體系,然后在此基礎(chǔ)上納入商品房本年新開工面積同比增速、宏觀經(jīng)濟(jì)景氣先行指數(shù)、滬市成交額同比增速等多個可以反映中國宏觀經(jīng)濟(jì)特征的擴(kuò)展指標(biāo)。
本文的發(fā)現(xiàn)主要有兩點:第一,本文選擇的擴(kuò)展指標(biāo)能夠提升BVAR模型與LSTM模型的GDP預(yù)測能力。一方面,BVAR模型和LSTM模型的樣本外預(yù)測結(jié)果在擴(kuò)展指標(biāo)體系下對GDP實際值的擬合度更高。另一方面,加入擴(kuò)展指標(biāo)后,BVAR模型和LSTM模型的預(yù)測誤差值呈現(xiàn)下降的趨勢。因此,本文選擇的擴(kuò)展指標(biāo)能夠提升BVAR模型與LSTM模型的GDP預(yù)測能力。第二,相比于BVAR模型,LSTM模型能夠更好地挖掘擴(kuò)展指標(biāo)對GDP的非線性影響,從而提升短期GDP預(yù)測能力。在動態(tài)滾動預(yù)測與固定估計窗口預(yù)測情形下,LSTM模型的預(yù)測效果均優(yōu)于BVAR模型。并且,當(dāng)預(yù)測步距增大時,LSTM模型預(yù)測效果要優(yōu)于BVAR模型。具體而言,在各個預(yù)測步距下,LSTM模型的預(yù)測效果優(yōu)于BVAR模型,并且隨著向前步距的增加,預(yù)測優(yōu)勢顯著提升。
為了分析LSTM模型是否能夠提升GDP的預(yù)測能力,本文首先選取了在經(jīng)濟(jì)預(yù)測中得到廣泛應(yīng)用的BVAR模型,對GDP進(jìn)行預(yù)測。同時,本文選取了深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)中的LSTM模型進(jìn)行了相同的預(yù)測,旨在對兩模型的GDP預(yù)測能力進(jìn)行對比分析。LSTM模型由于其網(wǎng)絡(luò)結(jié)構(gòu)能夠反映樣本之間的時序關(guān)系,是眾多神經(jīng)網(wǎng)絡(luò)算法中較為適合于經(jīng)濟(jì)學(xué)研究的模型。
1.BVAR模型介紹
比較常見的GDP預(yù)測方法主要有單變量ARIMA模型和多變量VAR類模型等線性模型。ARIMA模型作為一種經(jīng)典的非平穩(wěn)時間序列分析方法,擅長發(fā)現(xiàn)時間序列自身的影響規(guī)律,在GDP預(yù)測領(lǐng)域有較為廣泛的應(yīng)用。然而,由于ARIMA模型僅包含了GDP單個變量,并沒有考慮與其他經(jīng)濟(jì)變量之間的聯(lián)系,顯然會損失大量有價值的信息。為此,西姆斯(Sims,1980)將之進(jìn)一步擴(kuò)展到多變量模型,提出了VAR模型[9]。VAR模型目前已成為各國中央銀行廣泛使用的宏觀預(yù)測模型。然而,高維VAR模型面臨參數(shù)過多的問題,對模型中參數(shù)進(jìn)行準(zhǔn)確估計存在著明顯困難。為了有效解決這一問題,越來越多的文獻(xiàn)采用貝葉斯方法來估計VAR模型。BVAR由多恩等(Doan et al.,1984)[10]提出,模型的優(yōu)勢在于利用具有信息含量的先驗分布來彌補樣本中信息缺乏的問題,從而降低參數(shù)估計的不確定性。
BVAR模型用貝葉斯方法對動態(tài)面板的VAR系統(tǒng)進(jìn)行分析。建立一個由m個變量組成、滯后階數(shù)為p、含有常數(shù)項的VAR(p)模型,即:
yt=A1yt-1+A2yt-2+...+Apyt-p+Ac+ut
(1)
其中,Ac是常數(shù)矩陣;yt=(y1,t,y2,t,...,ym,t)T,包含GDP、CPI、M2等宏觀變量;殘差ut~i.i.d.Nm(0,Σ),Σ為m×m正定矩陣;Aj為m×m階系數(shù)矩陣,αi,j,τ為方程i中變量j滯后τ期的系數(shù)。
2.先驗分布與后驗分布
BVAR模型利用了來源于經(jīng)驗和歷史資料的先驗信息,減少了需要賦值的參數(shù)的數(shù)量,因此,在估計BVAR模型的過程中,需要對式(1)中Σ與Aj的參數(shù)分布做出先驗假設(shè),本文采用實際應(yīng)用中最為廣泛使用的明尼蘇達(dá)(Minnesota)先驗分布。明尼蘇達(dá)先驗分布假定協(xié)方差陣Σ的先驗分布取為擴(kuò)散先驗分布。同時,假設(shè)αi,j,τ和Σ相互獨立,且滿足:
αi,j,τ~i.i.d.N(δi,j,τ,Vi,j,τ)
(2)
由于宏觀經(jīng)濟(jì)變量具有較強的持續(xù)性,因此模型設(shè)定:當(dāng)i=j,τ=1時,δi,j,τ=0.9[11],其他情況下等于0,即方程中變量自身的一階滯后變量系數(shù)的先驗期望為0.9,其他系數(shù)的先驗期望為0。明尼蘇達(dá)先驗分布假設(shè)方程i中各系數(shù)的方差矩陣Vi,j,τ為對角矩陣,Vi,jj表示Vi中的對角線元素,則:
(3)
由此得到α的后驗分布服從正態(tài)分布:
(4)
3.超參數(shù)的選擇與設(shè)定
BVAR模型將眾多參數(shù)的估計問題轉(zhuǎn)化為對a1和a2這兩個超參數(shù)的估計。超參數(shù)(a1,a2)有兩種取值方法。第一,參照多恩等(1984)的做法,給定超參數(shù)的可能性取值,通過比較所有超參數(shù)組合的均方根誤差(RMSE)來選擇最優(yōu)的參數(shù)組合[10]。第二,使用貝葉斯方法,在最大似然函數(shù)的基礎(chǔ)上計算出超參數(shù)的取值。由于第二種方法在使用軟件計算時較為困難,因此并沒有得到廣泛的實際應(yīng)用。而且,由于本文BVAR模型采用的明尼蘇達(dá)先驗分布設(shè)定和多恩等(1984)的方法十分接近,因此本文采用第一種處理方法。給定超參數(shù)的可能性取值(具體取值參照多恩等(1984)的做法),其中,a1={0.000 5,0.000 8,0.001,0.05,0.1,0.2,0.3,0.4},a2={0.000 25,0.000 4,0.000 5,0.025,0.05,0.1,0.15,0.2}。
在給定可能性取值的基礎(chǔ)上,本文參照肖爭艷等(2009)[12]的做法,最終所使用的最優(yōu)參數(shù)的具體選擇過程如下。首先,確定BVAR模型的最優(yōu)滯后階數(shù)。本文采用與VAR模型一致的標(biāo)準(zhǔn),即根據(jù)LR、FPE、AIC、HQ和SC等準(zhǔn)則,選取最優(yōu)滯后階數(shù)為2階。然后,在超參數(shù)的可能性取值中選取a1與a2的組合,并使用泰爾混合估計方法對BVAR模型參數(shù)進(jìn)行估計。最后,比較所有超參數(shù)組合的均方根誤差(RMSE)選擇最優(yōu)的參數(shù)組合為{0.05,0.025}。
1.LSTM模型介紹
目前,ANN各類模型是非線性模型的代表模型。ANN作為人工智能領(lǐng)域的非線性方法,能夠處理非線性、不連續(xù)和高頻多維的數(shù)據(jù),因而該模型在GDP預(yù)測領(lǐng)域得到越來越多的關(guān)注。傳統(tǒng)的ANN模型雖然能保證網(wǎng)絡(luò)學(xué)習(xí)過程的最終收斂,但是也存在兩點顯著的局限性:其一,容易陷入局部最小值;其二,不能反映樣本之間的時序關(guān)系,而在經(jīng)濟(jì)領(lǐng)域普遍存在的這種時序關(guān)系及其背后的邏輯關(guān)系與理論關(guān)系,對于預(yù)測分析是大有裨益的。因此,本文選用深度學(xué)習(xí)模型中的LSTM模型進(jìn)行GDP預(yù)測。
LSTM模型最早由霍克賴特和施米德胡貝(Hochreiter & Schmidhuber,1996)[13]提出,由于其能更好地發(fā)現(xiàn)長期依賴關(guān)系而被廣泛用于處理序列信息,如語音識別、機(jī)器翻譯等。后來由于其出色的時序數(shù)據(jù)處理能力,在經(jīng)濟(jì)與金融預(yù)測領(lǐng)域得到了較為廣泛的應(yīng)用與推廣。LSTM模型的具體預(yù)測過程通過其基本單元模型的激活函數(shù)及神經(jīng)元之間數(shù)據(jù)結(jié)果的傳遞來實現(xiàn)。換言之,可以將LSTM模型視為若干的線性和非線性函數(shù)相互嵌套的模型。
對于GDP預(yù)測而言,由于近期和遠(yuǎn)期歷史數(shù)據(jù)都會對GDP產(chǎn)生影響,但近期歷史數(shù)據(jù)影響會更強,故而本文選擇設(shè)有三個門控(gates)的LSTM模型來實現(xiàn)對信息傳遞的控制,篩選出對預(yù)測有用的部分。每個神經(jīng)元結(jié)構(gòu)如圖1所示。
圖1 LSTM神經(jīng)元結(jié)構(gòu)
其中,xt是指t時刻的輸入向量,包含GDP、CPI、M2等宏觀變量的歷史數(shù)據(jù)。ht-1表示上一時刻的輸出,ct-1表示上一時刻的記憶。遺忘門(forget gate)決定了要遺忘多少舊記憶,更新門(update gate)決定要更新多少新記憶,并由新記憶和舊信息相加形成最終的記憶,最后由輸出門(output gate)從最終記憶中篩選出對預(yù)測有用的部分。
2.訓(xùn)練方法及優(yōu)化器選擇
LSTM模型通過數(shù)據(jù)訓(xùn)練幫助模型更新權(quán)重,在訓(xùn)練LSTM模型的過程中,選擇合適的訓(xùn)練方法和優(yōu)化器能夠提升模型的訓(xùn)練效率。第一,選擇小批量(Mini-Batch)方法作為本文的訓(xùn)練方法。具體而言,對LSTM模型訓(xùn)練時,根據(jù)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的常用做法,每一次訓(xùn)練均基于隨機(jī)抽取的30個樣本點,避免了用全部樣本點訓(xùn)練導(dǎo)致的訓(xùn)練過程慢以及過擬合問題。第二,為使LSTM模型快速收斂,本文采用作為自適應(yīng)學(xué)習(xí)率優(yōu)化算法的適應(yīng)性矩估計(adaptive moment estimation,Adam)優(yōu)化器進(jìn)行優(yōu)化訓(xùn)練。與傳統(tǒng)的優(yōu)化算法將學(xué)習(xí)率設(shè)為一個常數(shù)不同,Adam優(yōu)化算法會采取一些措施來更新學(xué)習(xí)率,并且較為容易實現(xiàn),有較高的計算效率和較低的內(nèi)存需求。
3.超參數(shù)的設(shè)定和網(wǎng)絡(luò)結(jié)構(gòu)的選擇
圖2 模型網(wǎng)絡(luò)結(jié)構(gòu)
由于訓(xùn)練LSTM模型需要對數(shù)據(jù)進(jìn)行訓(xùn)練集與驗證集的劃分,本文參照已有研究的常用劃分方式,在初始訓(xùn)練中采用1997—2004年共32個季度的數(shù)據(jù)作為訓(xùn)練集,2005—2006年共8個季度數(shù)據(jù)作為驗證集。訓(xùn)練集數(shù)據(jù)用來幫助模型更新權(quán)重,而驗證集的數(shù)據(jù)則主要用來評估模型。并且,在后續(xù)預(yù)測過程中,模型會隨樣本量增加而不斷擴(kuò)充訓(xùn)練集。模型需要調(diào)試的目標(biāo)包括LSTM層的神經(jīng)元個數(shù)、訓(xùn)練周期的期數(shù)等。訓(xùn)練時,采用Mini-Batch Adam算法進(jìn)行更新,再根據(jù)模型在驗證集上的均方誤差(MSE)來衡量模型的精度,選擇精度最高的模型結(jié)果。本文對于基準(zhǔn)指標(biāo)體系和擴(kuò)展指標(biāo)體系選用的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
參照張勁帆等(2018)[14]的做法,本文的預(yù)測方式包括動態(tài)滾動預(yù)測與固定估計窗口預(yù)測兩種。當(dāng)進(jìn)行動態(tài)滾動預(yù)測時,具體的預(yù)測步驟為:(1)把1997Q1—2006Q4作為樣本來預(yù)測滯后一期的數(shù)值,即2007Q1時y的數(shù)值。(2)擴(kuò)充樣本區(qū)間為1997Q1—2007Q1,將真實觀測值作為樣本來預(yù)測2007Q2時y的數(shù)值,預(yù)測步驟同(1)。(3)進(jìn)一步擴(kuò)充樣本區(qū)間為1997Q1—2007Q2,將真實觀測值作為樣本來預(yù)測2007Q3時y的數(shù)值。重復(fù)以上擴(kuò)充樣本滾動預(yù)測過程,直至全部樣本結(jié)束。當(dāng)進(jìn)行固定窗口預(yù)測時,具體的預(yù)測步驟為:(1)把1997Q1—2006Q4作為樣本來預(yù)測滯后一期的數(shù)值,即2007Q1時y的數(shù)值。(2)擴(kuò)充樣本區(qū)間為1997Q2—2007Q1,將真實觀測值作為樣本來預(yù)測2007Q2時y的數(shù)值,預(yù)測步驟同(1)。(3)進(jìn)一步擴(kuò)充樣本區(qū)間為1997Q3—2007Q2,將真實觀測值作為樣本來預(yù)測2007Q3時y的數(shù)值。重復(fù)以上擴(kuò)充樣本滾動預(yù)測過程,直至全部樣本結(jié)束,即可得到從2007Q1開始的GDP的預(yù)測值序列。
為對模型預(yù)測能力進(jìn)行更為嚴(yán)謹(jǐn)?shù)姆治?,本文參照已有文獻(xiàn)使用均方誤差(MSE)、平均絕對百分比誤差(MAPE)、對稱平均絕對百分比誤差(SMAPE)作為模型樣本外預(yù)測能力的測度指標(biāo)。以上三個指標(biāo)具體計算方法如下:
(5)
(6)
(7)
混凝土路面作為我國公路運輸?shù)闹匾M成部分,在進(jìn)行分析后,需要經(jīng)過一段時間的實施后進(jìn)行再次評價并進(jìn)行修改,對一些具體的案例進(jìn)行分析,總結(jié)經(jīng)驗教訓(xùn)。應(yīng)該以該地區(qū)的實際情況為依據(jù),對于鐵路工程中存在的問題進(jìn)行分析,不斷改進(jìn)。近些年來,我國公路運輸發(fā)展迅速,混凝土施工作為道路工程項目中最為常見項目施工,其施工工藝的控制對整個道路使用性能的影響作用巨大,優(yōu)良的施工工藝,可以有效延長道路工程使用壽命。
除此之外,MSE的提高雖然在絕對數(shù)量上能夠體現(xiàn)不同模型的預(yù)測效果的改善程度,但并不能在統(tǒng)計分布上檢驗改善的效果是否顯著。因此本文在強調(diào)MSE的基礎(chǔ)上引入D-M檢驗來檢驗預(yù)測效果。D-M檢驗由戴博和馬里亞諾(Diebold & Mariano,1995)提出[15],該統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布,具體表達(dá)式如下:
(8)
在模型的預(yù)測指標(biāo)選擇方面,已有文獻(xiàn)大多存在指標(biāo)選擇與宏觀經(jīng)濟(jì)理論分離的現(xiàn)象,這可能導(dǎo)致遺漏重要指標(biāo)的問題出現(xiàn)。同時,由于中國經(jīng)濟(jì)增長具有明確的國情特征尤其是結(jié)構(gòu)性特征,與歐美等其他國家差異較大,如果在指標(biāo)選擇過程中忽略中國經(jīng)濟(jì)特點,極易導(dǎo)致GDP預(yù)測誤差增加。有鑒于此,本文在已有研究基礎(chǔ)上做出兩方面改進(jìn):一,以IS-LM模型為基礎(chǔ)構(gòu)建了基準(zhǔn)指標(biāo)體系;二,納入反映中國國情的擴(kuò)展指標(biāo),以建立科學(xué)合理的宏觀經(jīng)濟(jì)指標(biāo)體系,從而更加準(zhǔn)確地對GDP進(jìn)行預(yù)測。
本文首先基于凱恩斯的理論,構(gòu)建短期GDP預(yù)測的基準(zhǔn)指標(biāo)體系。具體來說,凱恩斯四部門IS-LM模型的表達(dá)式為:
IS曲線:Y=C+I(r)+G+NE
LM曲線:M/P=L(r,Y)
其中,Y代表總產(chǎn)出,C代表消費,I代表投資,G代表政府購買,NE代表凈出口,M代表貨幣供給,P代表價格水平。模型中經(jīng)濟(jì)體的均衡是IS曲線和LM曲線的交點,該均衡點給出了同時滿足產(chǎn)品市場與貨幣市場均衡條件的利率r與總產(chǎn)出Y的組合[16]。
本文參照陳彥斌(2019)[17]的做法,選擇如下具體指標(biāo):(1)季度實際GDP增長率(GDP),該指標(biāo)用來衡量總產(chǎn)出(Y)的增速,是宏觀經(jīng)濟(jì)預(yù)測的核心指標(biāo);(2)季度工業(yè)增加值同比增速(IVA),該指標(biāo)體現(xiàn)了工業(yè)企業(yè)在一定時期內(nèi)工業(yè)生產(chǎn)活動創(chuàng)造的價值,反映了生產(chǎn)單位或部門對國內(nèi)生產(chǎn)總值的貢獻(xiàn),是國內(nèi)生產(chǎn)總值常用的補充指標(biāo);(3)季度實際社會消費品零售總額增長率(C),該指標(biāo)能夠反映國內(nèi)消費情況,對判斷當(dāng)前宏觀經(jīng)濟(jì)發(fā)展?fàn)顩r和未來經(jīng)濟(jì)走勢具有重要的指導(dǎo)作用;(4)季度實際固定資產(chǎn)投資增長率(I),本文選擇該指標(biāo)作為投資的指標(biāo),原因在于固定資產(chǎn)投資是投資中最重要的組成部分,是監(jiān)測宏觀經(jīng)濟(jì)走勢、進(jìn)行宏觀調(diào)控的重要依據(jù);(5)貸款實際利率(r),實際利率反映了企業(yè)實際面臨的間接融資成本,同時,基于數(shù)據(jù)可得性,本文以該指標(biāo)為模型的利率指標(biāo);(6)季度一般公共預(yù)算支出當(dāng)期同比增速(G),該指標(biāo)是較為常用的政府購買指標(biāo);(7)季度非金融部門杠桿率(DEBT),該指標(biāo)體現(xiàn)了一定時期內(nèi)的債務(wù)負(fù)擔(dān),會對經(jīng)濟(jì)產(chǎn)出水平產(chǎn)生重要影響[17-18],本文以該指標(biāo)作為季度一般公共預(yù)算支出當(dāng)期同比增速(G)的補充指標(biāo);(8)季度出口額同比增長率(EXPORT),該指標(biāo)能夠較好地衡量市場開放程度,當(dāng)該指標(biāo)提高時,出口增速加快,表明經(jīng)濟(jì)運行情況良好,反之若該指標(biāo)下降,出口增速下降,表明宏觀經(jīng)濟(jì)不景氣,增長速度放緩;(9)消費者物價指數(shù)(CPI),本文以該指標(biāo)衡量通貨膨脹水平[2,19];(10)季度M2同比增長率(M2)。該指標(biāo)是常用的貨幣供給變化指標(biāo)。
為完整刻畫中國宏觀經(jīng)濟(jì)特征,除基準(zhǔn)指標(biāo)體系中的指標(biāo)外,本文在擴(kuò)展指標(biāo)體系中加入了房地產(chǎn)市場、第三產(chǎn)業(yè)增加值、宏觀經(jīng)濟(jì)景氣先行指數(shù)、發(fā)電量、金融市場等影響因素。擴(kuò)展指標(biāo)體系中包括了反映中國宏觀經(jīng)濟(jì)結(jié)構(gòu)性特征的結(jié)構(gòu)性指標(biāo)和常用的經(jīng)濟(jì)先行指標(biāo):(1)商品房本年新開工面積同比增速(HSTARTS),該指標(biāo)能夠反映建筑業(yè)對國民經(jīng)濟(jì)的影響,而建筑業(yè)的發(fā)展可以帶動近30多個上下游相關(guān)產(chǎn)業(yè)發(fā)展,是第二產(chǎn)業(yè)的重要組成部分;(2)第三產(chǎn)業(yè)增加值當(dāng)期同比實際增速(THIRDI),第三產(chǎn)業(yè)增加值在國內(nèi)生產(chǎn)總值中占據(jù)著較大的比例,與國內(nèi)生產(chǎn)總值具有較一致的變化趨勢[14];(3)季度的宏觀經(jīng)濟(jì)景氣先行指數(shù)(LI),該指標(biāo)由國家統(tǒng)計局發(fā)布,是當(dāng)前較為權(quán)威的經(jīng)濟(jì)先行指標(biāo),在GDP預(yù)測領(lǐng)域得到了廣泛應(yīng)用;(4)發(fā)電量同比增速(ELEC),該指標(biāo)為克強指數(shù)[注]克強指數(shù)是以李克強總理命名的衡量經(jīng)濟(jì)發(fā)展?fàn)顩r的指標(biāo),包括耗電量、鐵路貨運量和銀行貸款發(fā)放量三個指標(biāo)組成,分別占比重40%、25%及35%。的重要組成部分,是反映地區(qū)工業(yè)生產(chǎn)活躍度以及工廠開工率的重要指標(biāo);(5)滬市成交額同比增速(STOCK),該指標(biāo)是衡量股票市場流動性的重要指標(biāo),同時金融指標(biāo)對宏觀經(jīng)濟(jì)變量有顯著的預(yù)測能力[12]。
以上指標(biāo)的數(shù)據(jù)均來自于中經(jīng)網(wǎng)統(tǒng)計數(shù)據(jù)庫,其中5個為季度頻次指標(biāo),余下10個為月度頻次指標(biāo)。由于核心指標(biāo)GDP為季度數(shù)據(jù),為保持?jǐn)?shù)據(jù)頻率的一致性,本文參考周建和況明(2015)[2]的做法,將指標(biāo)均處理為季度數(shù)據(jù)。各指標(biāo)的統(tǒng)計頻率及本文對指標(biāo)的具體處理方法如表1的第4列、第5列所示。基于數(shù)據(jù)的可獲得性,所有指標(biāo)時間跨度為1997年第一季度(1997Q1)至2018年第四季度(2018Q4),各指標(biāo)定義及描述性統(tǒng)計詳見表1和表2。
表1 指標(biāo)的含義與處理方式
表2 主要指標(biāo)的描述性統(tǒng)計
表2(續(xù))
基于上一部分所構(gòu)建的模型,本文試圖回答如下問題:第一,在預(yù)測GDP的過程中,是否有必要在指標(biāo)體系中納入更適宜中國國情的擴(kuò)展指標(biāo)?第二,作為線性模型代表的BVAR模型與作為非線性模型代表的LSTM模型,預(yù)測GDP的能力究竟孰強孰弱?第三,各個擴(kuò)展指標(biāo)的加入對于模型預(yù)測效果的影響程度如何?為了回答這些問題,本文從多個角度對比各模型的預(yù)測誤差:通過比較BVAR模型、LSTM模型在納入擴(kuò)展指標(biāo)前后預(yù)測誤差的變化,即可分析在指標(biāo)體系中納入擴(kuò)展指標(biāo)的必要性;通過比較BVAR模型與LSTM模型的預(yù)測精確度,即可判斷BVAR模型與LSTM模型預(yù)測能力強弱;通過比較剔除各個擴(kuò)展指標(biāo)后模型的預(yù)測誤差,即可定量分析LSTM模型下各個擴(kuò)展指標(biāo)的預(yù)測效果。
結(jié)合圖3、圖4與表3可以看出,加入反映中國國情的擴(kuò)展指標(biāo)能夠提升BVAR模型與LSTM模型的GDP預(yù)測能力。本部分分別將BVAR模型的基準(zhǔn)指標(biāo)體系與擴(kuò)展指標(biāo)體系、LSTM模型的基準(zhǔn)指標(biāo)體系與擴(kuò)展指標(biāo)體系的預(yù)測效果進(jìn)行了對比,發(fā)現(xiàn)本文選取的擴(kuò)展指標(biāo)能夠提升模型的短期GDP預(yù)測能力。
圖3 BVAR模型的GDP樣本外預(yù)測結(jié)果
圖4 LSTM模型的GDP樣本外預(yù)測結(jié)果
首先,對BVAR模型和LSTM模型的樣本外預(yù)測圖進(jìn)行定性分析。一方面,從圖3和圖4可以較為直觀地對比分析不同指標(biāo)體系下兩類模型的預(yù)測結(jié)果。從圖3可以看出,納入擴(kuò)展指標(biāo)后,BVAR模型在2007Q1—2009Q1時間區(qū)間內(nèi)的預(yù)測值與納入擴(kuò)展指標(biāo)前沒有明顯差異,在2009Q2—2013Q4時間區(qū)間內(nèi)預(yù)測穩(wěn)定性顯著提高,在2014Q1—2018Q4的時間區(qū)間內(nèi)預(yù)測值對GDP實際值的擬合度更強。因此,從總體上看,納入擴(kuò)展指標(biāo)能夠提升BVAR模型的預(yù)測能力。同時,由圖4可以看出,納入擴(kuò)展指標(biāo)后,LSTM模型擬合的時效性有了顯著提升,具體體現(xiàn)在擴(kuò)展指標(biāo)體系下LSTM模型對2007Q1—2012Q1時間區(qū)間的預(yù)測滯后性問題得到了較大程度的解決,同時模型對于2012Q2—2018Q4的預(yù)測結(jié)果與基準(zhǔn)指標(biāo)體系下的預(yù)測結(jié)果沒有明顯差異,均與實際值擬合程度較高。
其次,采用預(yù)測誤差更加嚴(yán)謹(jǐn)?shù)貙Σ煌笜?biāo)體系下兩類模型的預(yù)測效果進(jìn)行對比分析。分別對比表3列(1)、列(3)和列(2)、列(4),可以看出,加入擴(kuò)展指標(biāo)之后,BVAR模型的MSE、SMAPE下降,MAPE略有上升,由于更多的指標(biāo)表示BVAR模型的預(yù)測誤差下降,所以從總體上看BVAR模型的預(yù)測能力得到了提升。對于LSTM模型,MSE、MAPE、SMAPE均下降,因此可以認(rèn)為加入擴(kuò)展指標(biāo)提升了LSTM模型的預(yù)測能力。同時,可以初步判斷,加入擴(kuò)展指標(biāo)對于BVAR模型和LSTM模型預(yù)測精確度的提升程度不同,本文將在后面對BVAR模型和LSTM模型的預(yù)測能力進(jìn)行更為細(xì)致的比較分析。
表3 模型預(yù)測效果對比(動態(tài)滾動預(yù)測)
綜合上述兩方面的分析,可以發(fā)現(xiàn):如果預(yù)測指標(biāo)體系僅基于凱恩斯IS-LM理論來設(shè)置,將難以與中國的現(xiàn)實情況相擬合,從而導(dǎo)致GDP預(yù)測的誤差較大。這也進(jìn)一步說明,本文選取的商品房本年新開工面積同比增速、宏觀經(jīng)濟(jì)景氣先行指數(shù)、發(fā)電量同比增速等擴(kuò)展指標(biāo)能夠使模型本身更符合中國宏觀經(jīng)濟(jì)的運行規(guī)律,從而提高模型預(yù)測的精確度。
為了更充分地對BVAR模型與LSTM模型的預(yù)測能力進(jìn)行比較,本部分基于擴(kuò)展指標(biāo)體系展開分析。參照張勁帆等(2018)[14]的常用做法,本文首先在動態(tài)滾動情形下進(jìn)行預(yù)測。然后在固定估計窗口情形下進(jìn)行預(yù)測,從而比較BVAR模型與LSTM模型的預(yù)測精確度。需要說明的是,以上操作是在向前預(yù)測步距設(shè)置為1(即h=1)時進(jìn)行的GDP預(yù)測,為了確保研究結(jié)論穩(wěn)健可靠,本文增加預(yù)測步距作為穩(wěn)健性檢驗,從而更加全面地比較BVAR模型與LSTM模型的遠(yuǎn)期預(yù)測能力。
圖5 擴(kuò)展指標(biāo)體系下GDP樣本外預(yù)測結(jié)果
第一,動態(tài)滾動預(yù)測時,與BVAR模型相比,LSTM模型能夠進(jìn)行更精確的擬合和預(yù)測。通過分析圖5可知,相比BVAR模型,LSTM模型預(yù)測曲線的預(yù)測表現(xiàn)更為穩(wěn)定。具體來說,在2007Q1—2012Q2預(yù)測中,LSTM模型總體上看與GDP實際值的擬合度更高,與之相比,BVAR模型預(yù)測曲線對局部極值點的預(yù)測較為粗糙,較大程度上存在放大短期趨勢的現(xiàn)象。同時,在2012Q3—2018Q4預(yù)測中,LSTM模型的預(yù)測結(jié)果表現(xiàn)出更加平穩(wěn)的特征,并且預(yù)測值與GDP的實際值非常接近,沒有出現(xiàn)顯著異常的預(yù)測值。將BVAR模型與LSTM模型的預(yù)測誤差相比,可以得到相同的結(jié)論。GDP動態(tài)滾動預(yù)測中,LSTM模型的MSE、MAPE、SMAPE均小于BVAR模型的相關(guān)指標(biāo)。這意味著,用LSTM模型預(yù)測GDP的效果優(yōu)于BVAR模型,并且D-M檢驗表明該差異在10%的顯著性水平上顯著。
這表明,相對于BVAR模型,LSTM模型能夠更大程度地改善預(yù)測結(jié)果。究其原因,LSTM模型能夠識別與挖掘非線性因素對短期GDP預(yù)測的影響,因此,選取LSTM模型構(gòu)建方式能夠更加準(zhǔn)確地刻畫中國宏觀經(jīng)濟(jì)特征,從而提升GDP預(yù)測模型的預(yù)測能力。
第二,在固定估計窗口情形下,LSTM模型的預(yù)測效果依然優(yōu)于BVAR模型。為了更充分地比較BVAR模型與LSTM模型的預(yù)測效果,本文參考張勁帆等(2018)[14]的做法,首先選取1997Q1至2006Q4這個區(qū)間的時間序列,并將預(yù)測窗口固定為40個季度,進(jìn)行固定估計窗口的短期GDP預(yù)測。通過對比表4的列(1)與列(2),可以發(fā)現(xiàn),固定預(yù)測時間窗口后,LSTM模型樣本外預(yù)測的誤差同樣小于BVAR模型,與上文所得結(jié)論保持一致。
從模型自身特性角度看,BVAR模型利用的歷史信息會受到滯后階數(shù)的限制,與之相比,LSTM模型具有更為優(yōu)越的學(xué)習(xí)能力,會按照需要自行決定保留更久遠(yuǎn)的記憶或者遺忘過去的信息,從而能夠利用更長的時間序列的相關(guān)信息進(jìn)行預(yù)測。本文通過固定估計時間窗口,控制了LSTM模型能夠利用的樣本量,由此得到的結(jié)論再度證明了,LSTM模型樣本外預(yù)測能力的提升是因為LSTM模型能夠更精準(zhǔn)地刻畫宏觀指標(biāo)對于GDP的非線性影響。
表4 模型預(yù)測效果對比(固定估計窗口)
第三,穩(wěn)健性檢驗結(jié)果顯示,增加預(yù)測步距情形下,LSTM模型的遠(yuǎn)期預(yù)測能力依然優(yōu)于BVAR模型。以上兩種情形下進(jìn)行的是相鄰一步預(yù)測,即h設(shè)置為1(滯后一季度)。作為穩(wěn)健性檢驗,當(dāng)進(jìn)行遠(yuǎn)期預(yù)測時,本文將h設(shè)置為2、3、4(滯后二、三、四季度)。參數(shù)設(shè)定參照前文,預(yù)測過程分別采用動態(tài)滾動預(yù)測方式、固定估計窗口方式進(jìn)行。BVAR模型與LSTM模型各步距預(yù)測的實證結(jié)果對比見圖6、圖7。圖6顯示,在動態(tài)滾動預(yù)測GDP時,LSTM模型不同步距的MSE均小于BVAR模型,且平均預(yù)測效果改善39.4%。從圖7中可以看出,在固定估計窗口預(yù)測GDP時,當(dāng)h為1、2時,BVAR模型與LSTM模型預(yù)測能力較為接近;然而,隨著預(yù)測步距的增加,當(dāng)h增加為3、4時,BVAR模型的MSE大幅度增加,預(yù)測能力出現(xiàn)較大程度的折損,而LSTM模型的MSE變化較為平穩(wěn),預(yù)測能力更為穩(wěn)定,平均預(yù)測效果改善26.42%。這一結(jié)果表明,LSTM模型具有較強的泛化能力,對GDP不同期限的預(yù)測效果均較為穩(wěn)定。
圖6 GDP遠(yuǎn)期預(yù)測結(jié)果對比(動態(tài)滾動預(yù)測)
圖7 GDP遠(yuǎn)期預(yù)測結(jié)果對比(固定估計窗口)
此外,BVAR模型與LSTM模型在正常(非危機(jī))狀態(tài)下的預(yù)測效果更優(yōu)。考慮到2008—2011年正好跨越了一個經(jīng)濟(jì)周期,為了考察經(jīng)濟(jì)周期波動對模型預(yù)測能力的影響,首先計算2007—2018年全樣本的預(yù)測誤差,然后以2011年為起點[注]2010年10月中國宣布退出全面擴(kuò)張、全面刺激經(jīng)濟(jì)的反危機(jī)政策,因此,以2011年為起點可以衡量正常(非危機(jī))狀態(tài)下GDP預(yù)測的準(zhǔn)確度。計算2011—2018部分樣本的預(yù)測誤差,最后對二者進(jìn)行比較分析。通過對比表5的相鄰兩列(如表5的列(1)與列(2))可以看出,固定時間窗口后,2011—2018年部分樣本的預(yù)測效果較2007—2018年全樣本的預(yù)測效果有大幅度提升。由此可以得出結(jié)論,排除2007—2011年周期性影響能夠顯著提升模型樣本外預(yù)測能力,即模型在正常(非危機(jī))狀態(tài)下的預(yù)測效果更優(yōu)。
表5 模型預(yù)測效果對比(全樣本與部分樣本)
基于本文構(gòu)造的擴(kuò)展指標(biāo)體系,可進(jìn)一步探討房地產(chǎn)部門、第三產(chǎn)業(yè)、宏觀經(jīng)濟(jì)景氣先行指數(shù)、發(fā)電量、金融市場對模型GDP預(yù)測效果的影響。本部分采用預(yù)測效果更優(yōu)越的LSTM模型,逐個剔除模型中的擴(kuò)展指標(biāo),通過分析剔除各個擴(kuò)展指標(biāo)后的模型與原模型的MSE變化,比較各擴(kuò)展指標(biāo)的預(yù)測能力。
為保持與上文中原模型預(yù)測效果的可比性,仍選取相同區(qū)間的時間序列。具體預(yù)測步驟如下:首先,從擴(kuò)展指標(biāo)體系中剔除商品房本年新開工面積同比增速;隨后,通過對比MSE的大小,綜合比較剔除該指標(biāo)后的模型相較于原模型預(yù)測精度的變化,由此即可得到剔除該指標(biāo)對于GDP預(yù)測精確度的影響。重復(fù)上述兩個步驟,依次在模型中剔除第三產(chǎn)業(yè)增加值當(dāng)期同比實際增速、宏觀經(jīng)濟(jì)景氣先行指數(shù)、發(fā)電量同比增速、滬市成交額同比增速,即可得到各擴(kuò)展指標(biāo)的預(yù)測效果。
表6給出的是剔除各擴(kuò)展指標(biāo)后,LSTM模型對實際GDP增長率進(jìn)行樣本外預(yù)測的MSE。從表中可以看出,在相同的參數(shù)設(shè)定和網(wǎng)絡(luò)結(jié)構(gòu)下,樣本外預(yù)測精確度下降最大的是滬市成交額同比增速,其次是第三產(chǎn)業(yè)增加值當(dāng)期同比實際增速,排名第三位的是宏觀經(jīng)濟(jì)景氣先行指數(shù)。這說明,不同指標(biāo)對模型預(yù)測準(zhǔn)確度的影響是明顯不同的。其中,滬市成交額同比增速對近十余年GDP增速的非線性變化具有最強的解釋能力。需要強調(diào)的是,2008年國際金融危機(jī)前,資本市場流動性顯著下滑,顯示了股市流動性對宏觀經(jīng)濟(jì)的先導(dǎo)性,引發(fā)了有關(guān)股市流動性和宏觀經(jīng)濟(jì)相互關(guān)系的研究。奈斯等(Naes et al.,2011)運用美國數(shù)據(jù)發(fā)現(xiàn),股票市場流動性顯著領(lǐng)先于實體經(jīng)濟(jì)指標(biāo)[20]。王東旋等(2014)基于回歸分析和格蘭杰因果檢驗的樣本內(nèi)擬合,發(fā)現(xiàn)中國股市流動性領(lǐng)先于宏觀經(jīng)濟(jì)[21]。本文的這一實證結(jié)果從樣本外預(yù)測的角度提供了關(guān)于股市流動性與宏觀經(jīng)濟(jì)聯(lián)動的證據(jù)。
表6 剔除各個擴(kuò)展指標(biāo)后模型的均方誤差
考慮中國宏觀現(xiàn)實對于提升GDP預(yù)測的精確度具有重要意義。在宏觀經(jīng)濟(jì)預(yù)測中,如果忽略中國實際問題,則極易導(dǎo)致預(yù)測值相比實際值的結(jié)構(gòu)性偏離,從而增大GDP預(yù)測的誤差。有鑒于此,本文認(rèn)為要想切實提升宏觀經(jīng)濟(jì)預(yù)測的準(zhǔn)確性,除了探索、改進(jìn)預(yù)測方法外,還需要科學(xué)合理地確定宏觀經(jīng)濟(jì)預(yù)測指標(biāo),構(gòu)建既基于經(jīng)濟(jì)學(xué)理論又符合中國國情的宏觀經(jīng)濟(jì)預(yù)測指標(biāo)體系。
本文旨在探討深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)能否改進(jìn)GDP的預(yù)測能力。為此,本文首先基于宏觀經(jīng)濟(jì)學(xué)經(jīng)典理論與中國宏觀經(jīng)濟(jì)現(xiàn)實,構(gòu)建了宏觀經(jīng)濟(jì)預(yù)測指標(biāo)體系。并結(jié)合目前最前沿的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)優(yōu)化技術(shù)構(gòu)造了一個LSTM模型,將其應(yīng)用于中國GDP的預(yù)測分析,并與BVAR模型預(yù)測結(jié)果進(jìn)行了基準(zhǔn)指標(biāo)體系和擴(kuò)展指標(biāo)體系的對比。
本文研究結(jié)果表明,第一,本文選擇的擴(kuò)展指標(biāo)能夠提升BVAR模型與LSTM模型的GDP預(yù)測能力。一方面,BVAR模型和LSTM模型的樣本外預(yù)測圖在擴(kuò)展指標(biāo)體系下對GDP實際值的擬合度更強。另一方面,加入擴(kuò)展指標(biāo)后,BVAR模型和LSTM模型的預(yù)測誤差值呈現(xiàn)下降的趨勢。第二,相比于BVAR模型,LSTM模型能夠更好地挖掘擴(kuò)展指標(biāo)對GDP的非線性影響,從而提升短期GDP預(yù)測能力。在動態(tài)滾動預(yù)測與固定估計窗口預(yù)測情形下,LSTM模型的預(yù)測效果均優(yōu)于BVAR模型。此外,當(dāng)預(yù)測步距增大時,LSTM模型預(yù)測效果要優(yōu)于BVAR模型,具體而言,在各種步距條件的設(shè)定下,LSTM模型的預(yù)測效果均優(yōu)于BVAR模型,并且隨著向前步距的增加,預(yù)測優(yōu)勢發(fā)生顯著提升,在動態(tài)滾動預(yù)測與固定估計窗口方式下預(yù)測效果分別平均改善39.4%、26.42%。因此,本文認(rèn)為鑒于LSTM模型具有深度學(xué)習(xí)能力、良好的泛化能力及高度可調(diào)節(jié)性,其在GDP預(yù)測領(lǐng)域具有廣闊的應(yīng)用前景。
本文在宏觀經(jīng)濟(jì)預(yù)測領(lǐng)域利用深度學(xué)習(xí)前沿技術(shù)進(jìn)行積極探索,并以中國GDP預(yù)測為實例,驗證了LSTM模型的預(yù)測優(yōu)越性,為將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于宏觀經(jīng)濟(jì)預(yù)測、形成新的研究范式提供了實踐經(jīng)驗。鑒于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的高度可調(diào)節(jié)性,后續(xù)還可以在兩大主題上繼續(xù)探索:一是將深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)應(yīng)用于其他宏觀經(jīng)濟(jì)數(shù)據(jù)的預(yù)測,利用大數(shù)據(jù)的優(yōu)勢更有效地進(jìn)行風(fēng)險預(yù)警與經(jīng)濟(jì)分析;二是改進(jìn)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù),例如添加多種非同質(zhì)信息作為神經(jīng)網(wǎng)絡(luò)輸入,附加小波分解或主成分分析等數(shù)據(jù)預(yù)處理技術(shù)進(jìn)行模型優(yōu)化,或從神經(jīng)網(wǎng)絡(luò)本身進(jìn)行結(jié)構(gòu)優(yōu)化等。