夏偉宇,朱家明
(安徽財經(jīng)大學(xué) 統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
全面“二胎”新政策下我國人口增長率及經(jīng)濟(jì)發(fā)展關(guān)聯(lián)性研究
夏偉宇,朱家明
(安徽財經(jīng)大學(xué) 統(tǒng)計與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
本文以中國的人口為研究對象,預(yù)測未來2016-2020年的人口數(shù).本文首先對數(shù)據(jù)進(jìn)行預(yù)處理,其次對模型進(jìn)行識別和定階,然后再對模型作參數(shù)估計并進(jìn)行診斷和檢驗,最后做出預(yù)測并基于預(yù)測結(jié)果對人口政策提出相應(yīng)的建議.
EVIEWS;預(yù)測模型;經(jīng)濟(jì)發(fā)展;時間序列
多年來計劃生育這一基本國策的實施對我國的人口問題及發(fā)展問題產(chǎn)生的積極作用不可忽視.然而隨著社會和經(jīng)濟(jì)的發(fā)展,我國人口面臨著新的問題,如勞動力短缺、養(yǎng)老金困局、人口老齡化、男女性別比失調(diào)等等,一方面,這要求我們需要放開計劃生育的約束;而另一方面,人口增長過快,會造成交通堵塞、就業(yè)困難、饑餓貧困、資源缺乏、環(huán)境擁擠等問題.本文以我國人口為研究對象,通過對2016-2020年人口數(shù)量的預(yù)測來分析上述問題.本文研究的目標(biāo)是建立一個比較系統(tǒng)、有一定創(chuàng)新性和借鑒性的人口預(yù)測方法及其模式,提供一個人口預(yù)測的參考案例.
2.1 模型簡介
ARIMA模型,全稱為自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,簡記ARIMA),其中ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR是自回歸,p為自回歸項;MA為移動平均,q為移動平均項數(shù),d為時間序列成為平穩(wěn)時所做的差分次數(shù).所謂ARIMA模型,是指將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機(jī)誤差項的現(xiàn)值和滯后值進(jìn)行回歸所建立的模型.ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程.
2.2 建模步驟
ARIMA模型預(yù)測的基本程序:
2.2.1 數(shù)據(jù)預(yù)處理
根據(jù)時間序列的散點圖、自相關(guān)函數(shù)和偏自相關(guān)函數(shù)圖以ADF單位根檢驗其方差、趨勢及其季節(jié)性變化規(guī)律,對序列的平穩(wěn)性進(jìn)行識別.一般情況下,如果一個時間序列是平穩(wěn)的,則自相關(guān)函數(shù)成指數(shù)衰減或正弦衰減,且衰減的很快,如果是非平穩(wěn)的,則衰減很慢.也可以用單位根檢驗,判斷其平穩(wěn)性,對非平穩(wěn)序列可以采用差分變換和對數(shù)變換對數(shù)據(jù)進(jìn)行平穩(wěn)化和均質(zhì)化處理.
2.2.2 模型的識別與定階
根據(jù)時間序列模型的識別規(guī)則,建立相應(yīng)的模型.若平穩(wěn)序列的偏相關(guān)函數(shù)是截尾的,而自相關(guān)函數(shù)是拖尾的,可斷定序列適合AR模型;若平穩(wěn)序列的偏相關(guān)函數(shù)是拖尾的,而自相關(guān)函數(shù)是截尾的,則可斷定序列適合MA模型;若平穩(wěn)序列的偏相關(guān)函數(shù)和自相關(guān)函數(shù)均是拖尾的,則序列適合ARMA模型.(截尾是指時間序列的自相關(guān)函數(shù)(ACF)或偏自相關(guān)函數(shù)(PACF)在某階后均為0的性質(zhì)(比如AR的PACF);拖尾是ACF或PACF并不在某階后均為0的性質(zhì)(比如AR的ACF).
2.2.3 參數(shù)估計
進(jìn)行參數(shù)估計,檢驗是否具有統(tǒng)計意義.對AR模型的參數(shù)采用最小二乘法估計,MA和ARMA模型采用迭代式的非線性最小二乘法進(jìn)行估計.
2.2.4 假設(shè)檢驗
進(jìn)行假設(shè)檢驗,診斷殘差序列是否為白噪聲,如果殘差序列不能近似為一個白噪聲序列,則需要再次對模型進(jìn)行識別.
2.2.5 預(yù)測分析
利用已通過檢驗的模型進(jìn)行預(yù)測分析,并與預(yù)留的實際值進(jìn)行比較,得到相對誤差,從而進(jìn)一步判斷所擬合的模型的精度.
2.3 實證分析
2.3.1 數(shù)據(jù)的收集
本文選取了1986-2015年三十年間中國人口數(shù)據(jù)[1].如表1所示.
表1 1986-2015年間中國人口數(shù)
2.3.2 數(shù)據(jù)的預(yù)處理
本文使用1986-2013年的人口數(shù)據(jù)為樣本,利用ARIMA模型預(yù)測未來十年的人口數(shù),其中,2014與2015年的人口數(shù)是模型檢驗數(shù)據(jù),用于和預(yù)測值進(jìn)行比較,評價預(yù)測的精度.首先做出1986-2013年的中國人口時序圖,將該序列命名為X,如圖1所示.
圖1 1986-2013年中國人口數(shù)時序圖
由時序圖可以明顯看出,1986-2013年中國人口呈上升趨勢,因此可以初步判斷該序列不平穩(wěn)、方差也不平穩(wěn),因此,對該組序列作對數(shù)變換,并用Eviews做出時序圖和單位根檢驗,如圖2、3所示.
圖2 1986-2013年中國人口對數(shù)的時序圖
圖3 單位根檢驗
由圖2可知,中國人口的對數(shù)序列也具有明顯的上升趨勢,因此,該序列依舊不平穩(wěn),對該序列進(jìn)行單位根檢驗可以發(fā)現(xiàn),序列在1%、5%、10%的顯著性水平下,ADF檢驗值為0.452356,均大于在1%、5%、10%的顯著性水平下的臨界值,且P值遠(yuǎn)遠(yuǎn)大于0.05并接近于1,同樣也說明了序列不平穩(wěn).因此,在建立模型前,需要對模型進(jìn)行平穩(wěn)化處理,由于一階差分可以消除線性趨勢,二階差分可以消除二次曲線趨勢,因此,我們對序列進(jìn)行二次差分,得到時序圖如圖4.
圖4 二階差分時序圖
由圖4可知,經(jīng)過對原始序列的取對數(shù)、二階差分,原始序列的趨勢性已基本消除,序列呈現(xiàn)出較小的波動性并趨于平穩(wěn),為了進(jìn)一步確定序列的平穩(wěn)性,需要對其進(jìn)行單位根(ADF)檢驗,如圖5所示.
圖5 單位根檢驗
由圖5可知,序列在1%、5%、10%的顯著性水平下,ADF檢驗值為-4.264874,均小于各顯著性水平下的臨界值,因此序列為平穩(wěn)時間序列,能夠用序列來擬合模型.
2.3.3 模型的識別與定階
序列滯后18階的自相關(guān)與偏自相關(guān)圖如圖6所示.
圖6 自相關(guān)與偏自相關(guān)圖
由圖6可知,二階差分后的序列自相關(guān)函數(shù)和偏自相關(guān)函數(shù)均呈現(xiàn)拖尾性,因此可以建立ARMA模型,二階差分后的自相關(guān)函數(shù)從第2階開始下降很大,數(shù)值不太顯著,因此我們設(shè)定滑動平均系數(shù)q=2.二階差分后的偏自相關(guān)函數(shù)也從第2階開始下降很大,因此確定自回歸系數(shù)p=2,初步建立ARIMA(2,2,2)模型.
2.3.4 模型的估計與檢驗
運用最小二乘估計,對序列進(jìn)行ARIMA(2,2,2)擬合估計.結(jié)果如圖7所示.
圖7 ARIMA(2,2,2)擬合估計
由圖7可知,擬合出的模型為疏系數(shù)模型.疏系數(shù)ARIMA(2,2,2)模型中的P值為0,因此,模型顯著,認(rèn)為疏系數(shù)ARIMA(2,2,2)能較好地擬合該序列.
緊接著對殘差序列進(jìn)行白噪聲檢驗,根據(jù)模型ARIMA(2,2,2)對序列進(jìn)行回歸擬合,如圖8所示.
圖8 模型擬合折線圖
從圖8可以得到,途中的實際值和擬合值基本一致,殘差序列類似于白噪聲,較平穩(wěn),沒有明顯的趨勢性,模型擬合效果較好.對殘差作自相關(guān)和偏自相關(guān)圖分析,如圖9所示.
圖9 殘差序列的自相關(guān)和偏自相關(guān)圖
由圖9可知,模型的殘差不存在相關(guān)序列,為進(jìn)一步對模型進(jìn)行檢驗,做出殘差的單位根檢驗圖.如圖10所示.
圖10 殘差的單位根檢驗圖
由圖10可知,序列在1%、5%、10%的顯著性水平下,ADF檢驗值為-12.44579,均小于各顯著性水平下的臨界值,因此序列為平穩(wěn)時間序列.
因此,最終選定ARIMA(2,2,2)模型對序列進(jìn)行描述.
2.3.5 模型的預(yù)測
運用EVIEWS對擬合模型后的序列進(jìn)行預(yù)測,預(yù)測從1985-2020年中國人口數(shù),動態(tài)預(yù)測圖如圖11所示,靜態(tài)預(yù)測圖如圖12所示[2].
圖中實線代表的是XF的預(yù)測值,兩條虛線則提供了2倍標(biāo)準(zhǔn)差的置信區(qū)間[3].實際值處于2倍標(biāo)準(zhǔn)差之內(nèi),圖的右側(cè)給的是評價預(yù)測的一些標(biāo)準(zhǔn).由圖12的預(yù)測評價標(biāo)準(zhǔn)中,可以看到,Theil不相等系數(shù)為0.002232,非常小,綜合其他標(biāo)準(zhǔn),可以得出,靜態(tài)預(yù)測較動態(tài)預(yù)測效果良好[4].通過靜態(tài)預(yù)測,將2014-2015年的中國人口數(shù)真實值與預(yù)測值進(jìn)行比較,求出預(yù)測誤差,如表2所示[5].
圖11 模型的動態(tài)預(yù)測圖
圖12 模型的靜態(tài)預(yù)測圖
表2 真實值與預(yù)測值比較
由表2可知,殘差小于0.05,預(yù)測值和實際值非常接近,模型用于短期預(yù)測效果是好的.通過動態(tài)預(yù)測對2016-2020年年底中國人口數(shù)預(yù)測,可得到圖13[6].
圖13 2016-2020年年底中國人口數(shù)預(yù)測(億)
將預(yù)測值列入表中,見表3.
從預(yù)測結(jié)果可以看出,未來五年內(nèi)中國人口仍將呈上升趨勢.因此,實行二胎政策將促進(jìn)我國經(jīng)濟(jì)的發(fā)展.
表3 2016-2020年年底中國人口預(yù)測值
通過對中國人口這一組真實數(shù)據(jù)進(jìn)行時間序列分析,可得出以下結(jié)論:
3.1 運用ARIMA模型進(jìn)行建模和預(yù)測,分析結(jié)果說明,用ARIMA模型對中國總?cè)丝谶M(jìn)行建模預(yù)測是可行且可靠的,預(yù)測結(jié)果表明中國人口數(shù)在短期內(nèi)仍將呈上升趨勢,因此有必要采取必要的政治及經(jīng)濟(jì)措施來進(jìn)行調(diào)控,對人口的控制起到指導(dǎo)作用.
3.2 在運用ARIMA模型對中國總?cè)丝陬A(yù)測分析的過程中,我們發(fā)現(xiàn)該模型對于短期預(yù)測較合理,但對于長期預(yù)測存在一定缺陷.該模型的短期預(yù)測準(zhǔn)確度很高,預(yù)測結(jié)果的穩(wěn)定性好,對數(shù)據(jù)的預(yù)測有一定的價值,是一種很好的預(yù)測短期總?cè)丝诹康姆椒?
3.3 對中國總?cè)丝跀M合的ARIMA(2,2,2)模型本身比較簡單,對原始數(shù)據(jù)的要求較少,易于分析和應(yīng)用.
3.4 通過對中國人口的預(yù)測可以得到對未來中國人口結(jié)構(gòu)和經(jīng)濟(jì)發(fā)展改善的有益啟示,為改善人口結(jié)構(gòu)提出新的思路,并為我國將來的人口控制提供新的手段[7].
〔1〕中華人民共和國統(tǒng)計局.http://www.stats.gov. cn/.
〔2〕夏偉宇,朱家明,閆業(yè)鈴,張海珍,陳益楊.基于新政策對蕪湖人口發(fā)展的計量分析[J].貴陽學(xué)院學(xué)報(自然科學(xué)版),2017(01):72-76+85.
〔3〕李浩,楊輝.農(nóng)業(yè)循環(huán)經(jīng)濟(jì)效率評價問題研究——基于黑龍江省2005—2012年農(nóng)業(yè)經(jīng)濟(jì)發(fā)展數(shù)據(jù)的解析[J].黑龍江畜牧獸醫(yī),2016,(08):29-32.
〔4〕陳盼,陸衛(wèi)群.ARIMA模型在區(qū)域人口預(yù)測的應(yīng)用分析[J].當(dāng)代經(jīng)濟(jì),2016(06):111-113.
〔5〕李寶洪.循環(huán)農(nóng)業(yè)經(jīng)濟(jì)體系的含義和建立[J].中國農(nóng)業(yè)信息,2015(18):24-25.
〔6〕韓紹庭,周雨欣.多元線性回歸與ARIMA在中國人口預(yù)測中的比較研究[J].中國管理信息化, 2014(22):100-103.
〔7〕人口和計劃生育工作情況的總結(jié).http://www. 5ykj.com/Article/zjbgnzzj/36942.htm.2016-12-26.
C921;O224
A
1673-260X(2017)08-0003-04
2017-06-04
國家自然科學(xué)基金(11601001);安徽財經(jīng)大學(xué)國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃(201610378056)