濰坊醫(yī)學(xué)院預(yù)防醫(yī)學(xué)系(261053) 劉 松 李曉妹 劉 健 劉曉冬 李向云
嬰兒死亡率〔1〕(infant mortality rate,IMR)是反映居民健康水平、社會(huì)經(jīng)濟(jì)及衛(wèi)生服務(wù)水平和婦幼衛(wèi)生服務(wù)質(zhì)量的敏感性指標(biāo)。據(jù)衛(wèi)生部統(tǒng)計(jì),我國(guó)的嬰幼兒死亡率由 1991年的 50.2‰下降到2007年的15.3‰〔2〕,總體上呈下降趨勢(shì)。但與世界上其他國(guó)家相比,我國(guó)的嬰兒死亡率仍然較高〔3〕。本文利用Autoregressive模型擬合我國(guó)嬰兒死亡率的變化趨勢(shì),在評(píng)價(jià)其效果的基礎(chǔ)上探討殘差自回歸模型在其他非平穩(wěn)時(shí)間序列數(shù)據(jù)擬合中的適用性。
1.資料來(lái)源 本文所利用的數(shù)據(jù)為我國(guó)1991~2007年的嬰兒死亡率,來(lái)源于國(guó)家衛(wèi)生部《2008中國(guó)衛(wèi)生統(tǒng)計(jì)年鑒》,數(shù)據(jù)真實(shí)可靠。
2.統(tǒng)計(jì)方法 運(yùn)用Auto-regressive模型對(duì)我國(guó)1991~2007年嬰兒死亡率數(shù)據(jù)序列進(jìn)行擬合;應(yīng)用SAS 8.2統(tǒng)計(jì)軟件對(duì)資料進(jìn)行統(tǒng)計(jì)學(xué)分析〔4〕。
3.Auto-regressive模型建模步驟
(1)確定性因素分解〔5〕
在自然界中,由確定性因素導(dǎo)致的非平穩(wěn),通常顯示出非常明顯的規(guī)律性,比如有明顯的趨勢(shì)或者有固定的變化周期,這種規(guī)律性信息通常比較容易提取,而由隨機(jī)因素導(dǎo)致的波動(dòng)則非常難以確定和分析。根據(jù)這種性質(zhì),人們經(jīng)過(guò)長(zhǎng)期的觀察和實(shí)踐,通常把序列分解為三大因素的影響:
①長(zhǎng)期趨勢(shì)波動(dòng),包括長(zhǎng)期趨勢(shì)和無(wú)固定周期的循環(huán)波動(dòng)。
②季節(jié)性變化,包括所有具有穩(wěn)定周期的循環(huán)波動(dòng)。
③隨機(jī)波動(dòng),除了長(zhǎng)期趨勢(shì)波動(dòng)和季節(jié)性變化之外,其他因素的綜合影響歸為隨機(jī)波動(dòng)。
(2)殘差自相關(guān)檢驗(yàn)
①檢驗(yàn)原理
確定性模型擬合好之后,我們要對(duì)該模型的擬合效果進(jìn)行檢驗(yàn)。
如果殘差序列顯示出純隨機(jī)的性質(zhì),即
就說(shuō)明確定性模型擬合非常好,已經(jīng)能夠充分提取序列中的相關(guān)信息,我們不需要再對(duì)序列進(jìn)行二次信息提取,分析結(jié)束。
反之,如果殘差序列顯示出自相關(guān)性,即
那就說(shuō)明確定性模型擬合得不夠精確,序列中的相關(guān)信息沒(méi)有得到充分提取,我們應(yīng)該對(duì)殘差序列再次擬合,提取其中殘存的相關(guān)信息,以提高模型擬合的精度。
②殘差自相關(guān)檢驗(yàn):Durbin-Waston檢驗(yàn)(簡(jiǎn)稱(chēng)DW檢驗(yàn))
下面以殘差1階自相關(guān)性檢驗(yàn)為例介紹DW檢驗(yàn)的原理。
原假設(shè):殘差序列不存在1階自相關(guān)性,即
備擇假設(shè):殘差序列存在1階自相關(guān)性,即
構(gòu)造DW檢驗(yàn)統(tǒng)計(jì)量:
所以DW檢驗(yàn)統(tǒng)計(jì)量近似等于:
即DW?2(1-ρ),因?yàn)?-1≤ρ≤1,所以0≤DW≤4。當(dāng)0<ρ≤1時(shí),序列正相關(guān);當(dāng) -1<ρ≤0時(shí),序列負(fù)相關(guān)。
(3)Auto-regressive模型的建立
①確定自回歸模型的階數(shù)
根據(jù)模型的自相關(guān)圖和偏自相關(guān)圖,確定模型殘差序列的自相關(guān)階數(shù)。
②參數(shù)估計(jì)
根據(jù)原序列回歸模型的口徑,可以確定殘差序列的值。單純根據(jù)殘差序列的值可以非常容易地確定殘差自回歸模型的口徑。但是由于殘差序列與序列回歸值之間具有相關(guān)性,所以在將他們分開(kāi)時(shí)不要忽略相關(guān)性的影響,否則會(huì)降低模型擬合的精度。所以,參數(shù)最優(yōu)估計(jì)是在上述分析的基礎(chǔ)上,確定回歸模型的結(jié)構(gòu)和殘差自回歸模型的階數(shù),將所有參數(shù)聯(lián)合求解。
4.評(píng)價(jià)模型
根據(jù)確定系數(shù)R2對(duì)模型的擬合效果進(jìn)行評(píng)價(jià),以此判斷該模型在對(duì)我國(guó)嬰兒死亡率進(jìn)行擬合的適用性和有效性。
1.平穩(wěn)性檢驗(yàn)
圖1 我國(guó)1991~2007年嬰兒死亡率序列時(shí)序圖
時(shí)序圖顯示該時(shí)間序列有一個(gè)明顯的隨時(shí)間線性遞減的長(zhǎng)期趨勢(shì),同時(shí)又包含一定的隨機(jī)信息,因此考慮使用殘差自回歸模型擬合該序列的發(fā)展。
2.純隨機(jī)性檢驗(yàn)
純隨機(jī)性檢驗(yàn)也稱(chēng)為白噪聲檢驗(yàn),是專(zhuān)門(mén)用來(lái)檢驗(yàn)序列是否為純隨機(jī)序列的一種方法。本文采用LB(Ljung-Box)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。檢驗(yàn)結(jié)果顯示,在6階延遲下LB檢驗(yàn)統(tǒng)計(jì)量為3.74(P<0.05),所以我們可以認(rèn)為1991~2007年我國(guó)嬰兒死亡率數(shù)據(jù)序列屬于非白噪聲序列。
3.Auto-regressive模型的建立
(1)確定性模型的建立
表1 普通最小二乘估計(jì)結(jié)果
從表1得出,輸出的確定性模型為:Xt=108.0373-0.005345t+ μt
輸出結(jié)果顯示DW統(tǒng)計(jì)量的值等于0.5077,輸出概率顯示殘差序列正相關(guān)(P<0.0001),所以應(yīng)該考慮對(duì)殘差序列擬合自相關(guān)模型。
(2)回歸誤差分析
進(jìn)行回歸誤差分析時(shí),采用逐步回歸向后消除法。逐步回歸向后消除報(bào)告顯示除了延遲1階和4階的序列顯著自相關(guān)外,延遲其他階數(shù)的序列值均不具有顯著的自相關(guān)性,因此延遲2階、3階和5階的自相關(guān)項(xiàng)被消除。初步均方誤差為1.2485,1階殘差自回歸模型的參數(shù)φ1=-0.608073,φ2=0.438357。輸出的自回歸模型結(jié)果為:ut=0.608073ut-1-0.438357 ut-4+εt,具體結(jié)果詳見(jiàn)表2。
表2 逐步回歸向后消除法誤差分析輸出結(jié)果
(3)Auto-regressive擬合模型
該部分輸出三方面的匯總信息:收斂情況、極大似然估計(jì)結(jié)果和回歸系數(shù)估計(jì),輸出結(jié)果見(jiàn)表3:
表3 最終擬合模型輸出結(jié)果
由表3可得出,最終擬合我國(guó)嬰兒死亡率得到的模型為:
確定系數(shù)R2為0.9857,表明該模型所能解釋的變異占全部變異的98.57%,比確定模型的決定系數(shù)R2=0.9627要大,證明模型擬合較好。
為了得到直觀的擬合效果,利用SAS程序輸出擬合效果圖(圖2)。
圖2 Auto-regressive模型擬合效果圖
擬合效果圖中,星號(hào)表示實(shí)測(cè)值,實(shí)線表示Xt=104.75-0.005103t+μt的直線擬合,虛線表示整體模型 μt=0.6013μt-1-0.5673μt-4+ εt的曲線擬合。
以往的研究多利用線性模型、指數(shù)模型等來(lái)探討影響嬰兒死亡率的相關(guān)因素〔6,7〕,如殷菲等采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型對(duì)嬰兒死亡率進(jìn)行預(yù)測(cè);喬曉東等利用重復(fù)測(cè)量的多水平模型分析衛(wèi)生Ⅷ項(xiàng)目縣8年監(jiān)測(cè)資料等。因?yàn)榫€性模型、指數(shù)模型、logistic回歸模型等對(duì)資料的要求都比較嚴(yán)格,這些方法只能提取確定性信息,對(duì)隨機(jī)性信息浪費(fèi)嚴(yán)重。而Auto-regressive模型是一種擬合非平穩(wěn)時(shí)間序列的方法,兼具了時(shí)間序列確定性分析和隨機(jī)性分析的優(yōu)點(diǎn),它既能提取序列的確定性信息,又能提取其隨機(jī)性信息。本文利用我國(guó)1991~2007年間嬰兒死亡率的數(shù)據(jù),時(shí)序圖顯示其具有長(zhǎng)期變化和隨機(jī)波動(dòng)的非平穩(wěn)特征,若僅用一般線性回歸進(jìn)行擬合,殘差序列會(huì)存在自相關(guān)性,提示對(duì)序列信息的提取不充分。因此考慮選用Auto-regressive模型來(lái)擬合,效果較為理想。
由于醫(yī)學(xué)、農(nóng)業(yè)、工業(yè)、氣象、經(jīng)濟(jì)等領(lǐng)域中的諸多現(xiàn)象都具有時(shí)間序列的特征,殘差自回歸模型的應(yīng)用也日趨廣泛。尤其在生物醫(yī)學(xué)領(lǐng)域,如我國(guó)婦幼衛(wèi)生監(jiān)測(cè)網(wǎng)監(jiān)測(cè)的出生缺陷率、孕產(chǎn)婦死亡率以及多種傳染病的發(fā)病率等都具有非平穩(wěn)時(shí)間序列的特征,可利用殘差自回歸模型對(duì)其進(jìn)行擬合和預(yù)測(cè)。因此,Autoregressive模型具有良好的應(yīng)用和發(fā)展前景。
同時(shí),本研究也存在一定的局限性。嬰兒死亡率受到多方面的影響,如衛(wèi)生資源的配置、衛(wèi)生服務(wù)的利用、經(jīng)濟(jì)發(fā)展?fàn)顩r和居民收入等,并且各種因素對(duì)嬰兒死亡率影響的程度、方式、途徑等都有各自的特點(diǎn)。所以在Auto-regressive模型的推廣應(yīng)用中要慎重加以考慮,否則會(huì)致使結(jié)果可能出現(xiàn)一定的偏差。
1.黃書(shū)香.認(rèn)真貫徹落實(shí)《兩綱》指標(biāo),提高婦女兒童健康水平.中國(guó)婦幼保健,2007,22(19):2609-2610.
2.衛(wèi)生統(tǒng)計(jì)年鑒,中華人民共和國(guó)衛(wèi)生部.2009.
3.劉婭,葉運(yùn)莉,袁萍.中國(guó)嬰兒1991~2004年死亡率趨勢(shì)及預(yù)測(cè)分析.現(xiàn)代預(yù)防醫(yī)學(xué),2007,34(16):3101-3105.
4.劉曉冬,景睿,孟祥臻,等.殘差自回歸模型及SAS程序?qū)崿F(xiàn).中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(5):550-551.
5.王燕.應(yīng)用時(shí)間序列分析.北京:中國(guó)人民大學(xué)出版社,2005.
6.殷菲,潘曉平.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的嬰兒死亡率預(yù)測(cè)模型.現(xiàn)代預(yù)防醫(yī)學(xué),2006,33(4):486-487.
7.喬曉東,吳擢春,高艷,等.衛(wèi)生Ⅷ項(xiàng)目地區(qū)嬰兒死亡率影響因素的多水平分析.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,26(1):49-51.
附錄:SAS程序