王燕飛,吳 珊
(1.吉林化工學(xué)院 理學(xué)院,吉林 吉林 132022;2.河北師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,河北 石家莊 050024)
人口預(yù)測(cè)是制定正確人口政策的科學(xué)依據(jù),對(duì)經(jīng)濟(jì)社會(huì)的發(fā)展有著重要的作用。隨著改革開放的不斷深入,經(jīng)濟(jì)結(jié)構(gòu)不斷發(fā)生變化,對(duì)人口的研究也逐漸成為熱門課題。王婷婷[1]在關(guān)注人口數(shù)量的基礎(chǔ)上,將著重點(diǎn)放在人口質(zhì)量、人口結(jié)構(gòu)、人口的幸福指數(shù)等方面,用“以人為本”全新視角解讀當(dāng)代中國人口問題的關(guān)鍵。高巖峰[2]通過收集1995—2005年我國人口統(tǒng)計(jì)數(shù)據(jù),建立了多元線性回歸模型對(duì)影響人口數(shù)量變化的原因進(jìn)行分析,并制定相應(yīng)人口政策。米紅[3]采用定量和定性相結(jié)合的研究方法,利用SPSS軟件將全國各省份的人口安全程度作聚類分析,以確定人口文化素質(zhì)對(duì)人口數(shù)量和結(jié)構(gòu)的影響程度。張耀軍[4]基于中國人口發(fā)展趨勢(shì)、人口與經(jīng)濟(jì)的協(xié)調(diào)以及人口與資源環(huán)境的關(guān)系,通過深度挖掘人口素質(zhì)紅利、推進(jìn)老齡化社會(huì)的保障體系建設(shè)、促進(jìn)人口性別均衡、提升人口城市化質(zhì)量等方式應(yīng)對(duì)人口問題。Raftery Adrian E[5]使用貝葉斯分層模型,計(jì)算總和生育率和出生時(shí)的預(yù)期壽命。
本文以國家統(tǒng)計(jì)局中我國人口數(shù)量的相關(guān)指標(biāo)數(shù)據(jù),諸如:人口數(shù)量、人口出生率、人口死亡率進(jìn)行描述性統(tǒng)計(jì)分析,利用時(shí)間序列分析法分別建立ARIMA模型,并利用其對(duì)2017—2021共5年的人口數(shù)量及其相關(guān)指標(biāo)結(jié)果進(jìn)行預(yù)測(cè),與真實(shí)值對(duì)比體現(xiàn)模型的效果和精度。最后針對(duì)統(tǒng)計(jì)分析及預(yù)測(cè)結(jié)果,提出應(yīng)對(duì)人口問題的建議。
根據(jù)國家統(tǒng)計(jì)局中1949—2021年73年間的我國人口數(shù)量數(shù)據(jù),利用Excel畫出趨勢(shì)圖,如圖1所示。
由圖1可以看出我國1949—2021年人口數(shù)量總體呈增長趨勢(shì)。1959—1961年三年間人口數(shù)量呈下降趨勢(shì),之后人口增長速度逐漸放緩,照此趨勢(shì)我國未來幾年可能會(huì)出現(xiàn)零增長。
根據(jù)國家統(tǒng)計(jì)局中1949—2021年的我國人口出生率數(shù)據(jù),利用Excel畫出趨勢(shì)圖,如圖2所示。
年份
由圖2可以將出生率劃分為三個(gè)層次:高、中、低。1949—1959年,新中國成立以后,人民生活逐漸安定,1962—1974年,經(jīng)歷了三年困難時(shí)期之后,社會(huì)經(jīng)濟(jì)生活慢慢恢復(fù),這兩個(gè)階段我國處于高人口出生率階段;1959—1961年,1974—1999年我國出生率適中;1999—2021年我國進(jìn)入低人口出生率。由此可見,我國近幾年人口出生率不斷下降,初步判斷未來幾年我國人口出生率仍會(huì)降低。自1968年開始我國的人口出生率呈大趨勢(shì)降低,于1980—1990年間人口出生率在一定范圍內(nèi)波動(dòng),自1990年起開始了波動(dòng)遞減,尤其是自2014年至今,人口出生率一直處于遞減狀態(tài)。
根據(jù)國家統(tǒng)計(jì)局中1949—2021年我國人口死亡率數(shù)據(jù),利用Excel畫出趨勢(shì)圖,如圖3所示。
年份
由圖3可知,1949—1958年間,新中國剛成立,國家局勢(shì)逐漸穩(wěn)定,生產(chǎn)力慢慢恢復(fù),人口死亡率逐漸下降。1959—1961年,我國經(jīng)歷三年困難時(shí)期,人口死亡率逐漸上升,其中1960年人口死亡率達(dá)到最高值25.43‰;從1961年開始人口死亡率迅速下降,到1965年人口死亡率降低至9.5‰;1966—2021年我國人口死亡率逐漸降低并于1978年后趨于平穩(wěn),期間一直處于低值的人口死亡率??梢钥闯鑫覈丝谒劳雎驶緵]有大幅度的波動(dòng),平穩(wěn)在7‰附近。
根據(jù)國家統(tǒng)計(jì)局中1959年至2021年的我國總和生育率數(shù)據(jù),利用Excel畫出趨勢(shì)圖,如圖4所示。
年份
由圖4可知,五六十年代我國人口總和生育率處于較高水平,平均每個(gè)適齡婦女會(huì)孕育五六個(gè)孩子;進(jìn)入七八十年代我國總和生育率水平適中,平均每個(gè)適齡婦女孕育兩到三個(gè)孩子;自從進(jìn)入九十年代,我國總和生育率已經(jīng)低于2.1的國際水平,平均每個(gè)婦女會(huì)孕育不到兩個(gè)孩子;從2018年開始我國總和生育率開始進(jìn)一步下降,直到2021年我國總和生育率1.15。這個(gè)數(shù)據(jù)已經(jīng)遠(yuǎn)低于許多發(fā)達(dá)國家。綜合前面對(duì)我國歷年人口數(shù)量、人口出生率、人口死亡率以及總和生育率的分析,初步判斷我國人口數(shù)量逐漸趨于平緩。
利用時(shí)間序列分析方法對(duì)人口數(shù)量及影響人口數(shù)量的主要指標(biāo)(人口出生率、人口死亡率)數(shù)據(jù)建立數(shù)學(xué)模型,通過模型結(jié)果進(jìn)行統(tǒng)計(jì)分析及預(yù)測(cè),并將預(yù)測(cè)結(jié)果與真實(shí)結(jié)果相比較,體現(xiàn)模型的有效性。其中,總和生育率與人口出生率結(jié)果密切相關(guān),因此,只針對(duì)人口出生率數(shù)據(jù)建立時(shí)間序列分析模型,而不考察總和生育率的數(shù)據(jù)結(jié)果。
利用從1949—2016年共68年的我國人口數(shù)量數(shù)據(jù)建立時(shí)間序列模型。根據(jù)R軟件中adf.test語句對(duì)序列進(jìn)行ADF檢驗(yàn)[6]以考察其平穩(wěn)性,得到p=0.9543>0.05,說明該序列是非平穩(wěn)序列。但觀察序列沒有季節(jié)性差異,為此對(duì)序列進(jìn)行一階差分,并畫出時(shí)序圖,如圖5所示。
年份
對(duì)一階差分后的人口數(shù)量序列進(jìn)行ADF檢驗(yàn),得到p=0.369 3>0.05,故該序列仍然是不平穩(wěn)的,需要繼續(xù)進(jìn)行二階差分。得到人口數(shù)量的二階差分時(shí)序圖如圖6所示。
年份
再對(duì)二階差分后的人口數(shù)量序列進(jìn)行ADF檢驗(yàn),得到p=0.01<0.05,即二階差分后的人口數(shù)量是平穩(wěn)序列。由二階差分后人口數(shù)量平穩(wěn)序列的自相關(guān)圖(圖7)可見,除了延遲1、2階外,其他相關(guān)系數(shù)均在兩倍標(biāo)準(zhǔn)差內(nèi),且迅速衰減,初步判斷自相關(guān)系數(shù)屬于截尾狀態(tài)。從二階差分后人口數(shù)量平穩(wěn)序列的偏自相關(guān)圖(圖8)可見,滯后一階后偏自相關(guān)值均在邊界值范圍內(nèi)。偏自相關(guān)系數(shù)緩慢衰減,呈現(xiàn)拖尾狀態(tài)。因此,初步判斷ARIMA(m,d,q)模型中參數(shù)可能選取m=0;q=1,2,3。由于進(jìn)行了二次差分,故d=2。為了確保模型更加準(zhǔn)確,再利用R軟件中auto.arima語句自動(dòng)選取最優(yōu)模型,得到ARIMA(m,2,q)模型中各個(gè)m,q為不同取值的AIC值。具體結(jié)果見表1。根據(jù)AIC準(zhǔn)則[7],AIC值越小模型越優(yōu)。故ARIMA(0,2,2)為最優(yōu)模型。
表1 不同m,q對(duì)應(yīng)的AIC值
Lag
Lag
通過Ljung-Box統(tǒng)計(jì)量對(duì)ARIMA(0,2,2)模型進(jìn)行殘差檢驗(yàn),p=0.11>0.05,說明該模型的殘差序列通過了白噪聲檢驗(yàn),模型擬合效果較好。故人口數(shù)量的時(shí)間序列最優(yōu)模型為ARIMA(0,2,2)模型。利用該模型對(duì)2017—2021年我國人口數(shù)量進(jìn)行預(yù)測(cè),將預(yù)測(cè)值和真實(shí)值作比較,并利用誤差占真實(shí)值的百分比體現(xiàn)模型的預(yù)測(cè)精度。具體結(jié)果見表2。
表2 2017—2021年人口數(shù)量預(yù)測(cè)情況統(tǒng)計(jì)表
由預(yù)測(cè)值與真實(shí)值的誤差百分比數(shù)值可以看出,模型誤差比較小,說明模型預(yù)測(cè)效果較好。對(duì)未來5年(2022—2026年)我國人口數(shù)量進(jìn)行預(yù)測(cè),得到預(yù)測(cè)值及95%的置信下限和置信上限。具體結(jié)果見表3。
表3 2022—2026年我國人口數(shù)量預(yù)測(cè)情況統(tǒng)計(jì)表
由于我國在1970年以后推行“晚、稀、少”的人口政策,甚至在1980年全面推行“一胎化”政策。因此考察1970年以后的人口出生率數(shù)據(jù)更有價(jià)值。為此,根據(jù)1971—2016年共46年的我國人口出生率數(shù)據(jù)建立時(shí)間序列模型。根據(jù)ADF檢驗(yàn)結(jié)果,p=0.371 7>0.05,說明該序列是非平穩(wěn)序列。利用R軟件對(duì)序列進(jìn)行一階差分。對(duì)一階差分后的出生率序列進(jìn)行ADF檢驗(yàn),得p=0.02<0.05,說明該序列為平穩(wěn)序列。得到一階差分后的人口出生率自相關(guān)系數(shù)圖和偏自相關(guān)系數(shù)圖,分別如圖9和圖10所示。
Lag
Lag
由于對(duì)序列進(jìn)行了一階差分,故d=1。利用R軟件中auto.arima語句自動(dòng)選取最優(yōu)模型,ARIMA(1,1,0)的AIC值更小,模型最優(yōu)。利用Ljung-Box統(tǒng)計(jì)量對(duì)ARIMA(1,1,0)模型進(jìn)行殘差檢驗(yàn),p=0.96>0.05,說明擬合模型的殘差序列是白噪聲序列,擬合模型顯著有效。故選取ARIMA(1,1,0)模型作為我國人口出生率的最優(yōu)時(shí)間序列模型。利用該模型對(duì)2017—2021年我國人口出生率進(jìn)行預(yù)測(cè),得到預(yù)測(cè)值和95%的置信上限值和置信下限值,把它們與真實(shí)值作對(duì)比,具體結(jié)果見表4。
表4 2017—2021年人口出生率預(yù)測(cè)情況統(tǒng)計(jì)表
從表4可以看出,人口出生率的預(yù)測(cè)值與真實(shí)值隨著年份的增長誤差逐漸變大,但5年的真實(shí)值均在95%的置信區(qū)間之內(nèi),并且都比較接近置信下限值,說明模型預(yù)測(cè)精度較好。導(dǎo)致人口出生率預(yù)測(cè)值偏離真實(shí)值較大的情況,考慮是人口結(jié)構(gòu)、人口政策、生育壓力等原因,這些有待今后進(jìn)一步研究。進(jìn)一步預(yù)測(cè)未來5年的人口出生率及95%的置信下限和置信上限,具體結(jié)果見表5。這些可以為我國相關(guān)人口問題提供一定的數(shù)據(jù)依據(jù)和參考價(jià)值。
表5 2022—2026年人口出生率預(yù)測(cè)情況統(tǒng)計(jì)表
根據(jù)1949—2016年共68年的我國人口死亡率數(shù)據(jù)建立時(shí)間序列模型。根據(jù)ADF檢驗(yàn)結(jié)果,p=0.432 1>0.05,說明該序列是非平穩(wěn)序列。為此利用R軟件對(duì)序列進(jìn)行一階差分。對(duì)一階差分后的死亡率序列進(jìn)行ADF檢驗(yàn),得p=0.01<0.05,說明該序列為平穩(wěn)序列。畫出一階差分死亡率的自相關(guān)圖(圖11)和偏自相關(guān)系數(shù)圖(圖12)。由于對(duì)序列進(jìn)行了一階差分,故d=1。利用R軟件中auto.arima語句自動(dòng)選取最優(yōu)模型,ARIMA(0,1,2)為AIC值最小的最優(yōu)模型。
Lag
Lag
利用Ljung-Box統(tǒng)計(jì)量對(duì)ARIMA(0,1,2)模型進(jìn)行殘差檢驗(yàn),p=0.83>0.05,說明擬合模型的殘差序列是白噪聲序列,擬合模型顯著有效。故選取ARIMA(0,1,2)模型作為我國人口死亡率的最優(yōu)時(shí)間序列模型。
利用該模型對(duì)2017—2021年我國人口死亡率進(jìn)行預(yù)測(cè),將預(yù)測(cè)值和真實(shí)值作比較,并利用誤差占真實(shí)值的百分比體現(xiàn)模型的預(yù)測(cè)精度。具體結(jié)果如表6所示。
表6 2017—2021年人口死亡率的預(yù)測(cè)情況統(tǒng)計(jì)表
由預(yù)測(cè)值與真實(shí)值的誤差百分比數(shù)值可以看出,模型誤差比較小,說明模型預(yù)測(cè)效果較好。進(jìn)而得到未來5年(2022—2026年)我國人口死亡率的預(yù)測(cè)值及95%的置信下限和置信上限。具體結(jié)果見下表7。
另外,比較人口出生率與人口死亡率2017—2021年的真實(shí)值。我國人口死亡率呈上下微小波動(dòng)狀態(tài),但幅度不大,基本平穩(wěn)在7‰附近,稍低于人口出生率,人口仍處于增長狀態(tài)。而隨著年份的增加,人口死亡率與人口出生率越來越接近,這說明人口數(shù)量將逐漸穩(wěn)定。人口數(shù)量是否會(huì)下降,起到?jīng)Q定作用的是變化較大的人口出生率數(shù)值。這些對(duì)未來的預(yù)測(cè)數(shù)據(jù)可以為解決我國相關(guān)人口問題提供一定的數(shù)據(jù)依據(jù)和參考價(jià)值。
本文通過描述統(tǒng)計(jì)法和時(shí)間序列分析法對(duì)我國人口數(shù)量及相關(guān)指標(biāo)進(jìn)行了統(tǒng)計(jì)分析。得出如下結(jié)論:
(1)人口數(shù)量的最優(yōu)時(shí)間序列模型為ARIMA(0,2,2)模型,模型預(yù)測(cè)效果較好,人口數(shù)量在短期內(nèi)緩慢增長;
(2)人口出生率的最優(yōu)時(shí)間序列模型為ARIMA(1,1,0)模型,模型預(yù)測(cè)精度較好,但預(yù)測(cè)值與真實(shí)值的偏離程度隨著年份的增加逐漸增大。人口出生率下降速度較快;
(3)人口死亡率的最優(yōu)時(shí)間序列模型為ARIMA(0,1,2)模型,模型預(yù)測(cè)效果較好。人口死亡率在短期內(nèi)基本沒有變化,對(duì)人口數(shù)量影響不大。
綜上可知,對(duì)人口數(shù)量整體影響的主要指標(biāo)是人口出生率和總和生育率,國家可以通過一些鼓勵(lì)政策和切實(shí)可行的有效措施激勵(lì)育齡婦女的積極性,提高總和生育率和人口出生率,進(jìn)而增加我國人口數(shù)量。