張 梓
(貴州大學 經(jīng)濟學院,貴州 貴陽550025)
GDP 是國民經(jīng)濟核算的核心指標,也是衡量一個國家或地區(qū)經(jīng)濟狀況和發(fā)展水平的重要指標。改革開放四十多年來,貴州牢牢抓住機遇,全力開展經(jīng)濟建設,地區(qū)生產(chǎn)總值保持平穩(wěn)快速發(fā)展。黨的十八大以來,貴州發(fā)展進入“黃金十年”,經(jīng)濟增速連續(xù)十年位居全國前列,經(jīng)濟總量全國排名由第26 位提升至20位,取得了舉世矚目的巨大成就?!笆奈濉睍r期是我國社會主義現(xiàn)代化建設的重要階段,貴州將如何保持現(xiàn)有經(jīng)濟增速,推動貴州高質量發(fā)展,同時在復雜多變的宏觀經(jīng)濟環(huán)境下,對政府決策機構把握未來的經(jīng)濟發(fā)展趨勢做出正確決策和規(guī)劃具有重要現(xiàn)實意義。
當下對GDP 的預測主要通過計量經(jīng)濟學模型、機器學習模型和灰色系統(tǒng)理論來實現(xiàn)。例如,張延群等[1]利用柯布- 道格拉斯生產(chǎn)函數(shù)和Solow 增長模型分階段預測了中國未來的經(jīng)濟增長;張自敏等[2]就廣西GDP數(shù)據(jù)采用改進的BP 算法有效證明了該模型預測精準性的提高。其中ARIMA 模型自1970 年提出以后,在時間序列分析領域得到了廣泛的應用,是預測GDP的常見方法。眾多學者運用ARIMA 模型在上海(冉德欣[3])、云南(鄭偉等[4])、浙江(鄭夢琪等[5])、陜西(王芳芳等[6])、重慶(高炎[7])、湖南(王鄂等[8])等省域層面開展了針對其GDP 的分析和預測,均具有較高的精度,預測效果良好。高炎[7]利用eviews 9 建立ARIMA(0,1,1)模型在一定誤差范圍內準確預測了重慶市未來三年GDP;魏寧[9]和王芳芳等[6]利用SPSS 軟件分別對陜西省1952—2007 年和2000—2018 年的GDP 分析建立ARIMA 模型,預測陜西省GDP 將保持較高增長趨勢,預測結果比較理想;王鄂等[8]采用不同的預測方法對湖南省GDP 進行預測,得出ARIMA(1,1,2)的預測相對誤差比Holter-Winter 模型預測誤差小,從而建立最優(yōu)ARIMA(1,1,2)來預測湖南省GDP。但是,針對貴州省的GDP 預測則較為鮮見。在貴州省經(jīng)濟增長“黃金十年”的發(fā)展話語下,本文將利用Python 軟件,選取貴州省1978 年至2020 年的GDP 年度數(shù)據(jù)建立ARIMA 模型,對其短期GDP 展開高精度預測,在宏觀經(jīng)濟規(guī)劃層面具有重要意義。
ARIMA 模型是由自回歸模型(AR)、移動平均模型(MA)和差分法結合而來的時間序列預測模型。若序列是一個平穩(wěn)時間序列,則該模型是一個具有p 階自回歸和q 階移動平均的混合模型,用ARIMA (p,q)表示,實際中的許多經(jīng)濟序列是非平穩(wěn)時間序列,要進行差分d 為差分次數(shù)。將其變?yōu)槠椒€(wěn)后,它的行為并不會隨著時間的推移而變化,那么我們就可以通過該序列過去的行為來預測未來。對于這樣的模型我們稱為整合的ARIMA模型,記為ARIMA(p,d,q)。
為保證數(shù)據(jù)的可靠性,所選取的貴州省GDP 數(shù)據(jù)全部來源于《貴州省統(tǒng)計年鑒》。分析貴州省GDP 數(shù)據(jù)可以得出,自1978 年我國實行改革開放以來,貴州省經(jīng)濟實現(xiàn)巨變。2020 年,貴州省地區(qū)生產(chǎn)總值達到17 826.56 億元,與1978 年的46.63 億元相比增長了近382 倍,經(jīng)濟總量實現(xiàn)了歷史性的飛躍。同時觀察貴州省地區(qū)生產(chǎn)總值數(shù)據(jù)的時間序列圖(圖1)可以看出改革開放四十多年來,貴州省GDP 總體上呈現(xiàn)指數(shù)式的增長,經(jīng)濟實現(xiàn)了波瀾壯闊的大發(fā)展,地區(qū)生產(chǎn)總值占全國比重不斷提高。
圖1 貴州省1978—2020 年GDP 折線圖
平穩(wěn)性檢驗通常采用觀察自相關圖的方式來初步判斷序列的平穩(wěn)性,或者直接對序列進行單位根檢驗。畫出GDP 數(shù)據(jù)的自相關圖后通過圖形可以初步判斷原序列為非平穩(wěn)序列,然后利用Python 軟件進行adf_test 得到GDP 序列的p_value=0.994 接受原假設,說明原序列不是一個平穩(wěn)序列。
通過上一步驟的平穩(wěn)性檢驗可知貴州省GDP 時間序列不是一個平穩(wěn)序列,并且觀察數(shù)據(jù)序列圖發(fā)現(xiàn)GDP 呈現(xiàn)指數(shù)增長,因此首先利用Python 軟件中numpy 函數(shù)對數(shù)據(jù)進行對數(shù)處理,隨后進行一階差分,差分后的時間序列基本符合平穩(wěn)時間序列特征,圍繞固定值上下波動。對處理后的平穩(wěn)序列進行單位根檢驗,得到p_value=0.006 6,有充分理由拒絕原假設。因此貴州省GDP 進行對數(shù)一階差分后的序列為平穩(wěn)序列,可以進行下一步驟的操作。
模型的識別主要依靠分析自相關圖和偏自相關圖將原序列數(shù)據(jù)通過取對數(shù)和一階差分處理變?yōu)槠椒€(wěn)序列之后,利用Python 軟件分別畫出自相關圖與偏自相關圖,觀察圖形的自相關系數(shù)的變化趨勢可以初步判斷p、q 的取值。從圖2 可以觀察到序列的自相關圖在第1 階之后急速衰減,自相關圖呈現(xiàn)一階截尾的狀態(tài),因此q=1。而圖3 偏自相關圖在滯后十幾階相關系數(shù)仍顯著不為零,呈現(xiàn)拖尾衰減特征,因此p=0。
圖2 自相關圖
圖3 偏自相關圖
為了保證p、q 值的選擇更加準確合適,利用Python 軟件中pmdarima 庫中auto_arima 函數(shù)進行模型擬合,得到ARIMA (0,1,1)、ARIMA(1,1,1)、ARIMA(0,1,2)、ARIMA(2,1,2)等不同參數(shù)下AIC 得分,分別為-138.820、-136.847、-136.847、-132.869。其 中 模 型ARIMA(0,1,1)對應的AIC 值是最小的,為-138.820。因此擬合最好的模型為ARIMA(0,1,1)。
得到估計的模型之后,為了確定該模型是否完全反映了序列中有價值的信息,是否是有效的,需要對模型的殘差序列進行白噪聲檢驗。本文利用Python 軟件畫出殘差序列的分布圖,Q-Q 圖,以及自相關圖,觀察Q-Q 圖中點可以看到近似的落在一條直線,即紅線??梢猿醪脚袛鄽埐钚蛄惺请S機的正態(tài)分布,得出結果是不存在自相關性。
為了得出更準確的結論,利用Python 軟件中acorr_ljungbox 對殘差序列進行白噪聲檢驗,并畫出白噪聲結果(圖4),分析圖4 可得p-value 值大于0.05,即使在滯后多期時在95%的顯著性水平下的接受原假設,即ARIMA(0,1,1)模型的殘差序列為白噪聲序列。說明序列中幾乎所有有用信息都被此模型提取反映出來,擬合的ARIMA(0,1,1)模型可以作為理想的預測模型。
圖4 白噪聲檢驗結果
利用Python 軟件對模型的參數(shù)進行顯著性檢驗,結果顯示,在模型ARIMA(0,1,1)下得到模型參數(shù)系數(shù)分別為Ma1: 0.431 3、const:0.141 4。顯著性分別為Ma1:0.002、const:0.000。參數(shù)統(tǒng)計量在95%的置信區(qū)間內p_value 值都小于0.05,即所有系數(shù)都通過顯著性檢驗。
利用上述建模步驟建立的ARIMA(0,1,1)模型對貴州省的GDP 進行預測,將預測結果和貴州省GDP 的實際值對比并利用作圖軟件畫出趨勢圖(圖5)。可以清楚地觀察到貴州省GDP 的預測值與實際值基本處于同一位置上,誤差較小,在可以接受的范圍內,證明所構建的模型ARIMA(0,1,1)是有效的,可信的。
圖5 真實值與預測值比較
將利用ARIMA(0,1,1)模型預測的貴州省2016—2020 年地區(qū)生產(chǎn)總值與實際值進行詳細的對比,對比結果如表1 所示。經(jīng)過詳細計算得到貴州省2016—2019 年的GDP 預測值與實際值之間的相對誤差值,結果精確到小數(shù)點后三位,通過結果可以得出模型預測的誤差控制在較低的范圍內,均不超過0.05。但是2020 年的相對誤差超過了0.05,經(jīng)過分析可能是因為2020 年新冠疫情的爆發(fā)使得2020 年年初的經(jīng)濟處于較低的增長水平,甚至負增長。但總體來看相對誤差還是處于低水平,可以有理由相信使用建立的模型來預測貴州省未來的GDP 是可靠的。
表1 貴州省2016—2020 年GDP 真實值與預測值數(shù)據(jù)比較
由此可以利用此模型對貴州省未來五年的GDP做出預測,預測值如表2 所示??梢钥闯觥笆奈濉睍r期貴州省GDP 仍然保持較高的增長速度,到2025 年地區(qū)生產(chǎn)總值將達到一個新的臺階。
表2 貴州省2021—2025 年GDP 預測值
本文采用貴州省1978—2020 年的地區(qū)生產(chǎn)總值數(shù)據(jù)進行時間序列分析,利用Python 軟件畫出自相關圖并進行單位根檢驗,可以判斷該GDP 數(shù)據(jù)為非平穩(wěn)序列,因此對原序列進行對數(shù)和一階差分處理,處理后的時間序列通過ADF 檢驗達到平穩(wěn)。并進一步分析序列的ACF 和PACF 圖的拖尾和截尾情況,初步判斷模型的p、q 取值,根據(jù)AIC 準則判斷最佳模型為ARIMA(0,1,1)。然后對模型的殘差序列進行白噪聲檢驗,結果顯示殘差序列為白噪聲序列,說明模型充分解釋了數(shù)據(jù)中的信息,具備有效性。因此,本文利用該模型對貴州省2016—2020 年的GDP 進行預測,預測值與實際值在2020 年誤差為0.064,一個可能的解釋是重大突發(fā)疫情的蔓延給經(jīng)濟發(fā)展帶來了較大的不確定性。其余年份預測值和實際值誤差都控制在0.05的范圍內,預測結果與實際較為符合,模型的可信度較高,較為準確地預測了貴州省未來五年(2021—2015)的GDP,依次為19 989.63 億元、23 025.79 億元、265 233.10 億元、30 551.60 億元、35 191.97 億元,從數(shù)據(jù)上看繼續(xù)保持著較高的增長趨勢,可以為政府經(jīng)濟決策提供一定的參考依據(jù)。