趙子銘
摘要:以我國(guó)1949—2017年人口總數(shù)為研究對(duì)象,利用時(shí)間序列方法及不同檢驗(yàn)、最優(yōu)化方法建立ARIMA模型,并用于預(yù)測(cè)2019年我國(guó)人口總數(shù).通過(guò)AIC系數(shù)比較、白噪聲檢驗(yàn),可以認(rèn)為ARIMA(1,2,1)模型能夠較好擬合我國(guó)成立至今的人口趨勢(shì).結(jié)果顯示:我國(guó)人口數(shù)在1949年起不斷攀升,并仍將在未來(lái)保持穩(wěn)定的增速擴(kuò)張;預(yù)測(cè)我國(guó)2019年及2020年的人口總數(shù)分別為140453.6048、141162.1572萬(wàn)人.
關(guān)鍵詞:人口預(yù)測(cè);ARIMA模型;純隨機(jī)序列檢驗(yàn)
中圖分類號(hào):O212? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):1673-260X(2019)09-0010-03
1 引言
人口總量指一國(guó)在某一時(shí)間點(diǎn)上的人口總數(shù).利用數(shù)據(jù)探究一國(guó)人口總數(shù)的變化趨勢(shì)、預(yù)測(cè)人口總量的變化對(duì)于民生政策、經(jīng)濟(jì)政策具有重要意義.本文選擇使用中國(guó)自成立至2017年的年人口總數(shù)作為研究對(duì)象,旨在建立特定模型對(duì)我國(guó)人口增長(zhǎng)趨勢(shì)進(jìn)行模型解釋,并對(duì)我國(guó)未來(lái)人口數(shù)量進(jìn)行合理的預(yù)測(cè).由于人口數(shù)是存量的時(shí)間序列指標(biāo),因此嘗試使用ARIMA模型對(duì)人口序列進(jìn)行擬合.
ARIMA模型全稱為求和自回歸移動(dòng)平均模型,是擬合、預(yù)測(cè)時(shí)間序列數(shù)據(jù)的重要模型之一.由于差分能夠較好地提取確定性趨勢(shì),因此ARIMA模型經(jīng)常被用于擬合非平穩(wěn)時(shí)間序列.ARIMA(p,d,q)模型共有3個(gè)參數(shù),其中p代表模型的AR(自回歸)階數(shù),q代表模型的MA(移動(dòng)平均)階數(shù),而d代表序列的差分階數(shù).其數(shù)學(xué)表達(dá)式如下:
其中1-iLi代表ARIMA模型中自回歸項(xiàng)系數(shù),1+?茲iLi代表ARIMA模型中移動(dòng)平均項(xiàng)系數(shù),(1-L)d代表差分階數(shù),其中L代表延遲算子.根據(jù)上述理論,使用中國(guó)1949—2017年人口總數(shù)序列進(jìn)行ARIMA(p,d,q)模型的構(gòu)建.
2 基于ARIMA模型的中國(guó)人口序列預(yù)測(cè)
由于人口數(shù)量是典型的存量指標(biāo),所以一般是二階單整的,即在經(jīng)過(guò)二次差分之后,該序列會(huì)由非平穩(wěn)序列轉(zhuǎn)換為平穩(wěn)序列.因此引入ARIMA模型,初定差分的階數(shù)為二階.[1]
構(gòu)建ARIMA模型是一個(gè)比較繁瑣的過(guò)程,建模步驟可以分為以下幾步:
通過(guò)ADF檢驗(yàn)判斷該序列的單整階數(shù)d;
確定序列的準(zhǔn)確差分階數(shù)d后,通過(guò)Q統(tǒng)計(jì)量檢驗(yàn)判斷差分序列是否是純隨機(jī)序列.
(1)如果該序列通過(guò)Q統(tǒng)計(jì)量檢驗(yàn),則意味著該序列是純隨機(jī)序列,每一期的值是完全獨(dú)立不相關(guān)的,則不存在繼續(xù)建模和預(yù)測(cè)的意義;
(2)如果該序列不是純隨機(jī)序列,則我們可以繼續(xù)ARIMA模型的構(gòu)建;
若差分后序列不是純隨機(jī)序列,則判斷差分后的序列自相關(guān)系數(shù)是否拖尾或在q階截尾.
(1)如果該序列在q階截尾,則可以確定其ARIMA模型中MA(也即移動(dòng)平均項(xiàng))的階數(shù)為q;
(2)若其拖尾,則階數(shù)為0;
觀察其偏自相關(guān)系數(shù)是否拖尾或存在p階截尾.
(1)如果該序列在p階截尾,則可以確定ARIMA模型中AR(也即自回歸項(xiàng))的階數(shù)為p;
(2)若其拖尾,則階數(shù)為0;
通過(guò)上述分析得出ARIMA模型的三個(gè)系數(shù):p,d,q,并以此為依據(jù)建立ARIMA(p,d,q)模型;
對(duì)模型進(jìn)行AIC系數(shù)比較、純隨機(jī)序列檢驗(yàn)及顯著性檢驗(yàn),判斷模型對(duì)原序列的擬合是否良好;
利用模型對(duì)我國(guó)人口進(jìn)行預(yù)測(cè).[2]
2.1 確定單整階數(shù)
本文使用Eviews軟件對(duì)人口時(shí)間序列進(jìn)行ADF檢驗(yàn)及后續(xù)建模、檢驗(yàn).這里使用ADF檢驗(yàn)判斷人口序列的單整階數(shù).ADF檢驗(yàn)的3個(gè)模型如下:
ΔXt=δXt-1+∑βiΔXt-i+εt(None)
ΔXt=α+δXt-1+∑βiΔXt-i+εt(Intercept)
ΔXt=α+βt+δXt-1+∑βiΔXt-i+εt(Trend and Intercept)
其中∑βiΔXt-i代表高階項(xiàng),α代表常數(shù)項(xiàng)隨機(jī)性趨勢(shì),時(shí)間項(xiàng)t代表確定性趨勢(shì).在實(shí)際檢驗(yàn)中,只要時(shí)間序列在上述3種模型中的任意一種中檢驗(yàn)被認(rèn)為不存在單位根,則可證明序列是平穩(wěn)過(guò)程.由于時(shí)間序列平穩(wěn)的性質(zhì)各不相同,故ADF檢驗(yàn)和DF檢驗(yàn)的原假設(shè)均為:H0:時(shí)間序列存在單位根.
先前討論指出,人口序列為典型的存量序列,故應(yīng)為2階單證序列.實(shí)驗(yàn)證明:在0階、1階差分下,人口序列均不能通過(guò)ADF檢驗(yàn),即至少含有1個(gè)單位根.因此對(duì)其進(jìn)行2階差分,并再次進(jìn)行ADF檢驗(yàn).結(jié)果如下表所示:
從ADF檢驗(yàn)的伴隨概率可以看出,在二階差分情況下,人口序列可以被認(rèn)為是平穩(wěn)序列,即ARIMA模型中的差分項(xiàng)d=2.
2.2 純隨機(jī)序列檢驗(yàn)
利用Q統(tǒng)計(jì)量檢驗(yàn)對(duì)人口二階差分序列進(jìn)行純隨機(jī)序列的檢驗(yàn).Q統(tǒng)計(jì)量檢驗(yàn)也即序列自相關(guān)檢驗(yàn),自相關(guān)檢驗(yàn)的原理是通過(guò)檢驗(yàn)時(shí)間序列及其k階滯后序列的相關(guān)程度,判斷時(shí)間序列的歷史數(shù)據(jù)是否存在某種相關(guān)聯(lián)系.隨機(jī)時(shí)間序列的自相關(guān)函數(shù)為:[4]
其中:γk=cov(Xt,Xt+k),γ0=cov(Xt,Xt).分子代表滯后k期的時(shí)間序列協(xié)方差,分母代表時(shí)間序列的方差.如果ρk=0對(duì)任意k>0都成立,那么可以認(rèn)為時(shí)間序列不存在自相關(guān)性.(此為原假設(shè)).通過(guò)構(gòu)造QLB統(tǒng)計(jì)量對(duì)時(shí)間序列自相關(guān)性進(jìn)行檢驗(yàn),具體統(tǒng)計(jì)量的建立如下:
rk為樣本自相關(guān)函數(shù).統(tǒng)計(jì)量近似服從自由度為m的χ2分布(其中m為滯后期數(shù)).若Q值大于顯著性水平的臨界值,則拒絕所有rk同時(shí)為零的假設(shè),即時(shí)間序列具有自相關(guān)性.
對(duì)二階差分后的人口序列進(jìn)行上述檢驗(yàn),結(jié)果如下圖所示:
由于任意滯后階數(shù)下,人口二階差分序列Q統(tǒng)計(jì)量檢驗(yàn)的伴隨概率均顯著為0,因此拒絕其是純隨機(jī)序列的假設(shè),可以認(rèn)為該序列不是純隨機(jī)序列,后續(xù)ARIMA模型建模具有了理論支撐及現(xiàn)實(shí)意義.
2.3 判斷序列p、q階數(shù)
通過(guò)觀察二階差分序列的自相關(guān)系數(shù)、偏相關(guān)系數(shù)的截尾性選擇合適的ARMA模型p、q階數(shù).利用Python生成二階差分后的人口序列進(jìn)行自相關(guān)系數(shù)、偏自相關(guān)系數(shù)的可視化圖,如下所示:[5]
從圖中可以看出,該序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)均在1階滯后后迅速降至0附近,因此可以認(rèn)為該模型的p、q值均為1,也即:該序列的AR項(xiàng)滯后系數(shù)為1,MA項(xiàng)滯后系數(shù)也為1.
2.4 構(gòu)建人口序列ARIMA(1,2,1)模型
通過(guò)上述4節(jié)分析,可以確定人口序列模型的自回歸項(xiàng)、差分項(xiàng)、移動(dòng)平均項(xiàng)的項(xiàng)數(shù)分別為:1,2,1.據(jù)此,通過(guò)Eviews建立人口序列的ARIMA(1,2,1)模型.
注意到人口序列的ARIMA(1,2,1)模型等價(jià)于二階差分后的人口序列的ARMA(1,1)模型,所以可以直接對(duì)二階差分后的人口序列進(jìn)行ARMA模型的構(gòu)建.構(gòu)建出的模型結(jié)果如下:
結(jié)果顯示,使用極大似然估計(jì)擬合ARMA模型的參數(shù)結(jié)果中:
C、AR(1)、MA(1)的t值均小于0.05,通過(guò)了顯著性檢驗(yàn);殘差序列在經(jīng)過(guò)短暫的震蕩后進(jìn)入二倍標(biāo)準(zhǔn)差范圍中,顯示出良好的擬合效果;
模型的AIC函數(shù)為14.9475;
模型的最終形式為:
X=-4.4849+0.5084X+ε-0.61960ε
2.5 基于ARIMA(1,2,1)模型的人口預(yù)測(cè)
根據(jù)上節(jié)構(gòu)建的模型對(duì)我國(guó)2018年—2020年人口總數(shù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如下:
圖中三角標(biāo)志表示人口數(shù)的原始值,×號(hào)代表模型計(jì)算得出的預(yù)測(cè)值.結(jié)果認(rèn)為:模型預(yù)測(cè)值與原始值相近,模型擬合效果良好;模型對(duì)于2018年、2019年及2020年的人口總數(shù)預(yù)測(cè)為:(單位:萬(wàn)人)139735.5451、140453.6048、141162.1572萬(wàn)人.
3 結(jié)論
本文通過(guò)建立ARIMA(1,2,1)模型對(duì)我國(guó)1949 —2017年人口總數(shù)進(jìn)行了擬合、預(yù)測(cè).ARIMA(1,2,1)模型通過(guò)了系數(shù)、模型顯著性檢驗(yàn),且殘差項(xiàng)均處于2倍標(biāo)準(zhǔn)差內(nèi),對(duì)我國(guó)人口總數(shù)序列的擬合程度較好.預(yù)測(cè)認(rèn)為我國(guó)2019年及2020年的人口總數(shù)分別為140453.6048、141162.1572萬(wàn)人.
——————————
參考文獻(xiàn):
〔1〕陳艷玫,劉子鋒,李賢德,黃奕祥.2015—2050年中國(guó)人口老齡化趨勢(shì)與老年人口預(yù)測(cè)[J].中國(guó)社會(huì)醫(yī)學(xué)雜志,2018,35(05):480-483.
〔2〕趙華,薛紅艷.基于ARIMA模型的河北省人口預(yù)測(cè)[J].時(shí)代金融,2013(24):125-126.
〔3〕唐宇,余嬌嬌.重慶市人口預(yù)測(cè)與發(fā)展趨勢(shì)分析[J].現(xiàn)代商貿(mào)工業(yè),2019,40(23):4-8.
〔4〕陳艷玫,劉子鋒,李賢德,黃奕祥.2015—2050年中國(guó)人口老齡化趨勢(shì)與老年人口預(yù)測(cè)[J].中國(guó)社會(huì)醫(yī)學(xué)雜志,2018,35(05):480-483.
〔5〕韓紹庭,周雨欣.多元線性回歸與ARIMA在中國(guó)人口預(yù)測(cè)中的比較研究[J].中國(guó)管理信息化,2014,17(22):100-103.
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2019年9期