張 穎
(南京郵電大學(xué) 通達學(xué)院,江蘇 南京210003)
隨著社會經(jīng)濟的發(fā)展和醫(yī)學(xué)技術(shù)的進步,死亡率的持續(xù)降低與預(yù)期壽命的不斷提高已經(jīng)是一種全球性趨勢.長壽固然是人類社會進步的表現(xiàn),但長壽卻給國家的養(yǎng)老保險、企業(yè)的養(yǎng)老金計劃等帶來嚴峻的財務(wù)風(fēng)險和挑戰(zhàn).對死亡率下降趨勢的估計與預(yù)測是評估和管理長壽風(fēng)險的基礎(chǔ),所以死亡率建模一直都是理論與實務(wù)研究的熱點問題.其中,隨機死亡率模型在近一二十年得到了快速的發(fā)展.1992年,Lee-Carter[1]在考慮到死亡率隨時間變化的因素后提出了一種死亡率預(yù)測模型.該模型簡潔方便,對死亡率歷史數(shù)據(jù)擬合較好,因而成為應(yīng)用最廣泛的模型之一.其后的很多研究都是在Lee-Carter模型基礎(chǔ)上的改進.
在我國,對死亡率進行估計與預(yù)測的研究相對較少,如盧仿先等[2]利用Lee-Carter模型對中國人口死亡率進行了估計與預(yù)測,祝偉等[3]利用Lee-Carter模型對中國城市人口死亡率進行了預(yù)測,黃順林等[4]利用加入出生年效應(yīng)的模型對男性人口的死亡率進行了預(yù)測.這些研究在使用樣本數(shù)據(jù)進行模型參數(shù)估計時,大多沒有對中國死亡率經(jīng)驗數(shù)據(jù)時間跨度短、來源不統(tǒng)一等特點進行具體分析,而是對所有數(shù)據(jù)統(tǒng)一對待.本文將在Lee-Carter模型的參數(shù)估計中納入數(shù)據(jù)質(zhì)量因子,對不同數(shù)據(jù)質(zhì)量的數(shù)據(jù)分配不同的權(quán)重,然后再根據(jù)Brouhans等[5]提出的死亡人數(shù)服從泊松分布的極大似然法,利用牛頓迭代算法得到各參數(shù)的估計值.最后根據(jù)參數(shù)估計值,利用ARIMA時間序列建立死亡率預(yù)測模型.在這種估計框架下得到的參數(shù)值與實際更相符,從而使得死亡率的預(yù)測更可靠、準確.最后,應(yīng)用這種估計方法對中國男性人口死亡率的Lee-Carter模型各參數(shù)進行了估計,并對未來的死亡率和預(yù)期壽命進行了預(yù)測.
在考慮到死亡率變動除與年齡相關(guān)外,還隨時間變化,Lee和Carter在文[1]中年提出了模型
其中,mxt表示 x歲的人在第 t年的中心死亡率;參數(shù) αx反映了年齡對死亡率變化的影響;參數(shù) κt反映了時間變動對死亡率變化的影響;βx是與年齡相關(guān)的參數(shù);εxt為誤差項,其期望為0,標準差為 σε.Lee和Carter在對 βx和 κt進行標準化后,利用矩陣奇異值分解得到參數(shù)的唯一估計值和,并為了提高擬合精度而對 κt進行了二次估計.
Brouhans等[5]在假定死亡人數(shù)服從泊松分布的基礎(chǔ)上,使用極大似然法對Lee-Carter模型的參數(shù)進行了估計,即假定
其中,D(x,t)表示第 t年死亡的 x歲的人數(shù),E(x,t)為第 t年 x歲人的死亡風(fēng)險暴露數(shù)(本文用年中人數(shù)近似).
模型的似然函數(shù)為:
相應(yīng)的對數(shù)似然函數(shù)為:
其中,φ為需要估計的參數(shù)向量.
在中國的實際應(yīng)用中,由于死亡率數(shù)據(jù)分別來源于人口普查數(shù)據(jù)、1%人口抽樣數(shù)據(jù),1‰變動人口抽樣數(shù)據(jù),所以數(shù)據(jù)的質(zhì)量并不一致.其中,普查數(shù)據(jù)質(zhì)量最好,1%人口抽樣數(shù)據(jù)、1‰變動人口抽樣數(shù)據(jù)則可能存在一定的誤差.如果1%人口抽樣與1‰變動人口抽樣具有良好的隨機抽樣特征,則對估計造成的偏差可以忽略,否則就要考慮抽樣方式可能對模型估計帶來的影響.
在各日歷年數(shù)據(jù)來源一致的條件下,對隨機死亡率模型的各參數(shù)進行估計,各年的數(shù)據(jù)在似然函數(shù)極大化過程中具有相同的地位,但當各日歷年數(shù)據(jù)來源不一致時,我們可以通過對各年數(shù)據(jù)在似然函數(shù)極大化過程中加權(quán)來反映各日歷年數(shù)據(jù)的區(qū)別.為了將數(shù)據(jù)來源的不一致性納入估計框架,參考文獻[6]在利率模型估計中的做法,定義各日歷年數(shù)據(jù)的權(quán)重向量為:
其中,x表示年齡,t為日歷年,rt表示第 t年的抽樣比例.
此時,模型相應(yīng)的對數(shù)似然函數(shù)為:
然后利用牛頓迭代算法得到各參數(shù)的估計,迭代公式為:
其中,φ(h)表示經(jīng)過 h次迭代后得到的參數(shù)向量估計值,l(h)=l(φ(h)),表示第 h次迭代時的似然函數(shù)值.
如果抽樣的差別有影響,則在這一框架下估計的模型參數(shù)可以較真實地反映這種差別,而較少受抽樣的影響.因為在估計過程中,更多的利用了數(shù)據(jù)抽樣的信息.
我國歷年的《中國人口統(tǒng)計年鑒》提供了1986年、1989-1990年、1994-1999年和2001-2008年的中國男女性人口粗死亡率數(shù)據(jù),《中國2000年人口普查資料》提供了2000年的中國男女性人口粗死亡率數(shù)據(jù).由于1994年之前的數(shù)據(jù)缺失較多且不連貫,所以一般只采用1994-2008年中國男女性人口按每5歲進行年齡分組的粗死亡率數(shù)據(jù)作為樣本數(shù)據(jù).對于1995年、2000年和2005年數(shù)據(jù)中的90-100+數(shù)據(jù)進行合并,而對1996年85+的數(shù)據(jù)進行了拆分.
在這些數(shù)據(jù)中,2000年的數(shù)據(jù)是人口普查數(shù)據(jù),1995年和2005年數(shù)據(jù)為1%人口抽樣數(shù)據(jù),其余各年為1‰變動人口抽樣數(shù)據(jù).結(jié)合這些數(shù)據(jù)來源差異,利用前文介紹的加權(quán)極大似然估計方法對中國男性人口死亡率的Lee-Carter模型的各參數(shù)進行估計.
模型的參數(shù) αx、βx和 κt的估計值如圖1所示(本文中所有計算均通過R軟件得到).圖1中的α^x反映了年齡變化對死亡率的影響,容易看出在新生兒出生后死亡率一直下降,但在10歲附近死亡率達到最小,其后死亡率除在20歲左右有波動外,基本隨年齡增加而增大.圖1中的κ^t反映了時間變化對死亡率的影響,從κ^t近似的線性下降可以看出死亡率隨時間進展不斷下降的趨勢.
圖1 中國男性人口Lee-Carter模型的各參數(shù)估計值
對于參數(shù)估計值κ^t序列,運用ARIMA模型擬合,根據(jù)擬合殘差的Q統(tǒng)計量和序列相關(guān)的LM檢驗結(jié)果,得出ARIMA(0,1,0)模型的擬合效果最好.模型的估計結(jié)果為:
(8)式下面括號內(nèi)的數(shù)為漸進標準誤差.從漸進標準誤差和模型的回歸誤差(0.715)來看,將數(shù)據(jù)來源差異納入估計框架中的方法在預(yù)測中的誤差更小(未考慮數(shù)據(jù)差異下的漸進標準誤差和模型的回歸誤差分別為0.278、1.042),從而預(yù)測的結(jié)果更可靠、更符合實際.
在各參數(shù)的估計結(jié)果和κ^t的預(yù)測模型基礎(chǔ)上,就可以根據(jù)公式
預(yù)測未來各年的分年齡動態(tài)死亡率,并進一步制定出生命表,得到各年在不同年齡上的預(yù)期壽命.
表1給出2010年、2015年和2020年新生兒、25、45與60歲男性人口的預(yù)期壽命.不難看出各年齡的中國男性人口的未來預(yù)期壽命逐漸提高,例如,在2010年的60歲男性的預(yù)期壽命為20.82歲,到2015年為21.89歲,2020年則增加到22.89歲.0歲男性的預(yù)期壽命則從2010年的74.82歲,增加到2015年的76.26歲,在2020年則達到77.45歲.雖然這些數(shù)字也許只是理論上的預(yù)期,但它反映了人的壽命不斷提高的趨勢,這種高齡化的趨勢必須引起重視,否則將給國家的養(yǎng)老保障帶來很大的支付壓力.
表1 不同年份中國男性人口不同年齡的預(yù)期壽命
考慮到我國人口分年齡死亡率數(shù)據(jù)的來源差異,本文在Lee-Carter模型的參數(shù)估計中納入數(shù)據(jù)質(zhì)量因子,對不同數(shù)據(jù)質(zhì)量的數(shù)據(jù)分配不同的權(quán)重,然后利用極大似然法得到各參數(shù)的估計值.并應(yīng)用這種估計方法對中國男性人口死亡率的Lee-Carter模型各參數(shù)進行了估計,并對未來的死亡率和預(yù)期壽命進行了預(yù)測.結(jié)果表明,依據(jù)這種框架得到的參數(shù)估計值建立的預(yù)測模型的總體誤差更小,從而使得未來死亡率和預(yù)期壽命的預(yù)測更可靠、更準確.預(yù)測結(jié)果表明,我國男性人口未來各年齡上的預(yù)期壽命不斷提高,長壽風(fēng)險不容忽視.
[1]LEE R D,CARTER L R.Modeling and forecasting US mortality[J].Journal of the American Statistical Association,1992,419:659-671.
[2]盧仿先,尹莎.Lee-Carter方法在預(yù)測中國人口死亡率中的應(yīng)用[J].保險職業(yè)學(xué)院學(xué)報,2005(6):9-11.
[3]祝偉,陳秉正.中國城市人口死亡率的預(yù)測[J].數(shù)理統(tǒng)計與管理,2009(4):736-744.
[4]黃順林,王曉軍.加入出生年效應(yīng)的死亡率預(yù)測及其在年金系數(shù)估計中的應(yīng)用[J].統(tǒng)計與信息論壇,2010(5):81-85.
[5]BROUHANS N,DENUIT M,VERMUNT J K.A Poisson log-linear regression approach to the construction of projected life tables[J].Insurance:Mathematics and Economics,2002,31:373-393.
[6]陳暉,謝赤.利率期限結(jié)構(gòu)最優(yōu)估計及其應(yīng)用[M].長沙:湖南教育出版社,2008.