孫麗蘋, 袁宏俊, 胡凌云
( 1.安徽財經大學 統(tǒng)計與應用數學學院; 2.安徽財經大學 管理科學與工程學院: 安徽 蚌埠 233030 )
統(tǒng)計顯示,2020年我國人口(14.11億人)中65歲及以上人口總數為1.90億人(占比為13.5%)[1],這表明我國已經進入老齡化社會.人口老齡化不僅會加大社會保障和公共服務壓力,而且會持續(xù)影響社會活力、創(chuàng)新動力和經濟潛在增長率,因此研究老齡人口變化具有重要意義.傳統(tǒng)預測人口的方法主要有GM(1,1)模型[2]、Logistic模型[3]、BP神經網絡模型[4]、隊列要素法[5]等,這些單一模型雖然具有自我學習能力強和使用數據少等優(yōu)點,但由于它們難以同時捕獲數據序列的線性及非線性特征,因此在預測波動性強的數據序列時存在精度較低的問題.為此,一些學者提出了基于不同準則的定權組合模型和變權組合模型,如徐翔燕等構建的GM(1,1)-SVM組合預測模型[6]、龍會典等構建的GM(1,1)-Markov鏈組合預測模型[7]、袁宏俊等構建的COWG-WPA算子區(qū)間型組合預測模型等[8-10],研究表明這些組合模型的預測效果均優(yōu)于單項預測模型.基于上述研究,本文以灰色-BP神經網絡模型、殘差修正GM(1,1)模型和Logistic模型作為單項預測模型,構建了一種基于相關系數的誘導有序加權平均(IOWA)算子組合預測模型,并利用該模型預測了2021—2030年我國東部、中部、西部和東北部地區(qū)及全國的老齡人口發(fā)展趨勢.
灰色理論[11]由鄧聚龍教授首次提出,其中GM系列模型因具有使用數據少和計算簡單等優(yōu)點被廣泛應用于經濟、農業(yè)及交通運輸等多個領域.由于修正的灰色預測模型優(yōu)于GM(1,1)預測模型[12],因此本文選用修正的灰色預測模型對老齡人進行預測.構建修正的灰色預測模型的步驟如下:
(1)
(2)
(3)
(4)
(5)
其中k∈[k0,n].
(6)
其中k0指未參加殘差修正的個數.
BP神經網絡模型[13]是一種能夠模仿人腦結構及其功能的信息處理系統(tǒng),其運算方式主要為信息前向傳播和誤差反向傳播.由于該模型具有超強的自學習與自組織能力以及具有良好的非線性映射、容錯和泛化等能力,因此被廣泛應用于經濟、環(huán)境科學及自動化技術等領域.研究顯示,將灰色預測模型和BP神經網絡模型相結合可有效提高預測的準確性[14],因此本文利用GM(1,1)和BP神經網絡模型構建灰色-BP神經網絡模型,構建步驟為:
步驟2 構建BP神經網絡模型的輸入矩陣P和輸出向量y.將灰色預測值的前3年數據作為第1組樣本的輸入向量,再用第4年數據替換第1年數據后的數據作為第2組樣本的輸入向量,如此迭代即可得輸入矩陣P.將實際值的第4年數據作為第1組樣本的輸出值,將實際值的第5年數據作為第2組樣本的輸出值,以此類推即可得到輸出向量y.
步驟3 利用輸入矩陣和輸出向量構建BP神經網絡模型.
步驟4 利用灰色-BP神經網絡模型計算預測值,并對該模型的外推性進行驗證.若誤差函數值滿足模型的外推性條件,則對未來數據進行預測;否則返回步驟3,調整部分參數后重新構建BP神經網絡模型.
步驟1 計算第i種單項預測方法的預測精度ait,其計算公式為:
其中:i= 1,2,…,n;t= 1,2,…,N;xt為老齡人口實際值;xit為第i種單項預測方法的預測值.
步驟3 構建以相關系數最大化為準則的最優(yōu)組合預測模型,權重向量L的計算公式為:
步驟5 計算未來k期的組合預測值,其計算公式為:
本文選取2000—2020年《中國人口和就業(yè)統(tǒng)計年鑒》中31個省、自治區(qū)、直轄市的65歲及以上人口數作為研究數據(見表1),運用灰色-BP神經網絡模型、殘差修正GM(1,1)模型和Logistic模型進行組合預測.
表1 各地區(qū)及全國65歲及以上老齡人口的實際數量 萬人
3.2.1殘差修正GM(1,1)模型的預測結果
運用所得的修正模型對各地區(qū)及全國老齡人口數進行預測的結果見表2.
表2 利用殘差修正GM(1,1)模型預測各地區(qū)及全國老齡人口的結果 萬人
3.2.2灰色-BP神經網絡模型的預測結果
以2003—2018年數據為訓練集,以2019—2020年數據為測試集構建灰色-BP神經網絡模型.其中:輸入層神經元數為3,輸出層為1,隱含層的取值范圍為3~12;輸入層和隱含層之間的激活函數為tansig函數,隱含層與輸出層之間的激活函數為logsig函數,訓練函數為trainlm函數.利用Matlab軟件計算得到的各區(qū)域及全國老齡人口數的預測結果見表3.
表3 利用灰色-BP神經網絡模型預測各地區(qū)及全國老齡人口的結果 萬人
3.2.3Logistic模型的構建及其預測
以預測西部地區(qū)老齡人口為例建立的基于相關系數和IOWA算子的組合預測模型為:
(7)
表4 利用Logistic模型預測各地區(qū)及全國老齡人口的結果 萬人
表5 利用組合預測模型預測各地區(qū)及全國老齡人口的結果 萬人
為了對各預測模型的有效性進行比較評價,利用SSE、MAE、MSE、MAPE、MSPE對各預測模型的預測結果進行了檢驗,結果見表6.由表6可以看出:組合預測模型的各評價指標值均顯著優(yōu)于各單項預測模型;在3個單項預測模型中,預測精度高低的順序依次是灰色-BP神經網絡模型、殘差修正GM(1,1)模型、Logistic模型.這表明,本文提出的組合模型可以有效地提高老齡人口預測的準確性.
利用本文提出的組合模型對我國東部、中部、西部和東北部地區(qū)及全國的2021—2030年老齡人口進行了預測,其結果見表7.由表7可以看出,未來10年內我國老齡人口數將保持增長的態(tài)勢,其中:東部地區(qū)的老齡人口數呈持續(xù)高增長的態(tài)勢,2030年將達到9860.6萬人;中部地區(qū)在2021—2026年呈緩慢增長趨勢,在2027—2030年則呈先下降后不斷增長的趨勢,其中在2029年達到峰值(7893.2萬人);西部地區(qū)在2021—2023年呈緩慢增長趨勢,在2023—2030年則出現先大幅增長后緩慢增長的趨勢,其中在2030年達到峰值(8039.1萬人);東北部地區(qū)在2021—2030年始終保持平穩(wěn)增長,在2030年達到峰值(2114.4萬人).這表明,我國區(qū)域間的老齡化進程差異不斷增大,其中東部地區(qū)的老齡人口在未來10年的增長速度達到51.9%,而中部地區(qū)僅為24.4%.
表6 各模型預測的評價結果
表7 2021—2030年不同地區(qū)和全國老齡人口的組合預測結果 萬人
研究表明,本文提出的基于相關系數的IOWA算子組合預測模型的預測效果顯著優(yōu)于殘差修正GM(1,1)模型、灰色-BP神經網絡模型和Logistic模型,因此可利用本文模型對老齡人口進行預測.對我國東部、中部、西部和東北部地區(qū)及全國未來10年老齡人口數進行預測顯示:我國老齡人口整體呈持續(xù)增長趨勢,同時區(qū)域間的老齡化進程差異不斷增大,其中東部地區(qū)老齡人口增長速度相對較快,中部地區(qū)則相對較慢.該研究結果可為各區(qū)域的老齡人口政策的制定提供參考.由于老齡人口數會受到經濟發(fā)展、人口政策及醫(yī)療技術等各種因素的影響,因此為了達到更好的預測效果,在今后研究中我們擬將更多的因素加入到預測模型中,如人口出生率、人均地區(qū)生產總值等.