秘玉清 張繼萍 殷延玲 劉一鋆 于慧慧 王莎莎 王 祥 李?lèi)?ài)嬌 羅 盛 李 偉△
【提 要】 目的 分析肺結(jié)核流行病學(xué)特點(diǎn),探討肺結(jié)核發(fā)病的預(yù)測(cè)方法并進(jìn)行預(yù)測(cè),為進(jìn)一步預(yù)防控制肺結(jié)核工作提供科學(xué)參考依據(jù)。方法 利用山東省2009-2017年法定報(bào)告乙類(lèi)傳染病歷史疫情資料,揭示山東省肺結(jié)核的時(shí)間流行趨勢(shì)。運(yùn)用SAS 9.3軟件對(duì)數(shù)據(jù)進(jìn)行分析,選擇ARIMA模型對(duì)山東省肺結(jié)核疫情的流行趨勢(shì)進(jìn)行預(yù)測(cè)。結(jié)果 擬合的最優(yōu)模型為:▽▽4Xt=εt+0.61664εt-1+0.43298εt-2+0.40011εt-3+0.32939εt-4+3.61461。對(duì)2017年1月-8月肺結(jié)核月發(fā)病率進(jìn)行預(yù)測(cè)并與實(shí)際值進(jìn)行比較,結(jié)果顯示預(yù)測(cè)效果較好。山東省肺結(jié)核2017年9月-2018年8月的部分月發(fā)病率仍然有上升的趨勢(shì)。結(jié)論 山東省肺結(jié)核月發(fā)病率呈現(xiàn)周期性上升趨勢(shì),相關(guān)部門(mén)應(yīng)高度重視,進(jìn)一步加強(qiáng)居民,特別是未患肺結(jié)核居民的健康教育,從而降低肺結(jié)核發(fā)病率,提高居民健康水平和生活質(zhì)量。
肺結(jié)核是由結(jié)核分枝桿菌引起的嚴(yán)重呼吸道傳染病,可侵及許多臟器,以肺部結(jié)核感染最為常見(jiàn),是嚴(yán)重威脅人類(lèi)健康的疾病。世界衛(wèi)生組織指出,我國(guó)是全球22個(gè)結(jié)核病高負(fù)擔(dān)國(guó)家之一,結(jié)核病人數(shù)量占全球12%,居世界第2位[1-2]。由山東省疾控中心公布的2017年8月山東省傳染病疫情報(bào)告顯示,肺結(jié)核發(fā)病數(shù)居第二位[3]。因此,及時(shí)準(zhǔn)確地預(yù)測(cè)肺結(jié)核發(fā)病率,對(duì)制定未來(lái)肺結(jié)核防控重點(diǎn)和措施有著重要的意義[4]。本研究擬用山東省2009-2017年法定傳染病報(bào)告中肺結(jié)核歷史疫情資料,應(yīng)用ARIMA模型描述山東省肺結(jié)核的流行病學(xué)特點(diǎn),選擇最優(yōu)模型對(duì)疫情的發(fā)生進(jìn)行預(yù)測(cè),為提高居民的健康水平和生活質(zhì)量提供科學(xué)的參考依據(jù)。
2009-2015年山東省肺結(jié)核月發(fā)病率是通過(guò)中國(guó)統(tǒng)計(jì)年鑒和山東省衛(wèi)生和計(jì)劃生育委員會(huì)發(fā)布的數(shù)據(jù)獲取;2015-2017年的肺結(jié)核月發(fā)病人數(shù)來(lái)源于山東省衛(wèi)生和計(jì)劃生育委員會(huì)和山東省疾病預(yù)防控制中心網(wǎng)站,利用山東省人口計(jì)算肺結(jié)核月發(fā)病率數(shù)據(jù)。
(1)描述性流行病學(xué)方法
根據(jù)收集到的數(shù)據(jù)繪制逐月發(fā)病率時(shí)序圖,應(yīng)用描述性流行病學(xué)方法描述山東省人群中肺結(jié)核的發(fā)病情況,揭示山東省2009-2017年間山東省肺結(jié)核月發(fā)病率的未來(lái)發(fā)展走勢(shì)。
(2)統(tǒng)計(jì)方法
運(yùn)用SAS 9.3軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,通過(guò)2009-2016年肺結(jié)核月發(fā)病率建立模型;應(yīng)用ARIMA模型對(duì)山東省2009-2017年肺結(jié)核的月發(fā)病率進(jìn)行定量分析擬合;用2017年1月-2017年8月的數(shù)據(jù)評(píng)價(jià)模型的預(yù)測(cè)效果。模型建立的三個(gè)步驟為:模型的識(shí)別、參數(shù)估計(jì)和模型檢驗(yàn)、模型優(yōu)化和預(yù)測(cè)[5]。
數(shù)據(jù)分析結(jié)果顯示,肺結(jié)核的月發(fā)病率在2009-2016年存在明顯下降和周期性趨勢(shì),并且可以看出該序列屬于非平穩(wěn)序列,見(jiàn)圖1。為了消除線性趨勢(shì)影響,對(duì)時(shí)間序列做1階差分;同時(shí)為了消除季節(jié)趨勢(shì)影響,對(duì)時(shí)間序列進(jìn)行4步差分。差分后的平穩(wěn)時(shí)間序列穩(wěn)定的在均值上下波動(dòng),見(jiàn)圖2;同時(shí)對(duì)1階4步差分后得出序列進(jìn)行白噪聲檢驗(yàn),結(jié)果見(jiàn)表1。
為進(jìn)一步確定該序列是平穩(wěn)序列,還需要再觀察該序列的自相關(guān)圖。自相關(guān)圖可以觀察到,自相關(guān)系數(shù)1~4階在兩倍標(biāo)準(zhǔn)差范圍外,其他階數(shù)的系數(shù)都在范圍內(nèi)穩(wěn)定。此外,自相關(guān)系數(shù)是逐漸向零呈正弦軌跡衰減的,說(shuō)明差分后的序列在短期有很強(qiáng)的相關(guān)性,見(jiàn)圖3??梢猿醪秸J(rèn)為經(jīng)過(guò)差分后的該序列平穩(wěn)。
結(jié)合圖2、圖3、表1,進(jìn)行χ2檢驗(yàn),得出P值都小于0.05,有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為差分后的該序列為平穩(wěn)非白噪聲序列。該序列的自相關(guān)圖可以看出自相關(guān)系數(shù)是4階截尾的,可以使用MA(4)模型對(duì)該序列進(jìn)行擬合。
對(duì)殘差進(jìn)行白噪聲檢驗(yàn),結(jié)果顯示,在檢驗(yàn)水平0.05的情況下,延遲6階、12階、18階、24階的P值都大于0.05,說(shuō)明該MA(4)模型的擬合有效,詳情見(jiàn)表2。通過(guò)2009-2016年肺結(jié)核月發(fā)病率效果擬合圖,可以看出該模型的2009-2016年實(shí)際月發(fā)病率(D線)和擬合月發(fā)病率(B線)均落在95%的置信區(qū)間(A線和C線)內(nèi),同樣也說(shuō)明該模型的擬合效果很理想,詳情見(jiàn)圖4。
條件最小二乘估計(jì)法參數(shù)顯著性檢驗(yàn)圖結(jié)果顯示MA模型四參數(shù)t統(tǒng)計(jì)量的P值都小于0.05,即四參數(shù)在統(tǒng)計(jì)學(xué)上都有意義,詳情見(jiàn)表3。根據(jù)擬合結(jié)果,同時(shí)應(yīng)用ARIMA模型進(jìn)行參數(shù)估計(jì),經(jīng)過(guò)多次擬合,最優(yōu)模型選擇殘差檢驗(yàn)有意義且AIC最小的模型。最優(yōu)模型為:
▽▽4Xt=εt+0.61664εt-1+0.43298εt-2+0.40011εt-3+0.32939εt-4+3.61461
圖1 山東省2009-2016年肺結(jié)核月發(fā)病率時(shí)序圖
圖2 1階4步差分后肺結(jié)核月發(fā)病率的時(shí)序圖
延遲階數(shù)卡方自由度P值636.466<0.00011260.6212<0.00011869.2918<0.0001
圖3 差分后肺結(jié)核月發(fā)病率的自相關(guān)圖
延遲階數(shù)χ2自由度P值61.3620.50631224.3680.62001825.78140.82762447.73200.9005
圖4 肺結(jié)核月發(fā)病率擬合效果圖
參數(shù)估計(jì)值標(biāo)準(zhǔn)誤差t值P值延遲階數(shù)MU3.614610.1080333.46<0.00010MA(1,1)-0.616640.09961-6.19<0.00011MA(1,2)-0.432980.11128-3.890.00022MA(1,3)-0.400110.11226-3.560.00063MA(1,4)-0.329390.10054-3.280.00154
由圖5診斷模型結(jié)果可知,經(jīng)過(guò)優(yōu)化的殘差自相關(guān)函數(shù)和偏自相關(guān)函數(shù)都落在95%可信區(qū)間內(nèi)。所擬合的模型為最優(yōu)模型,可用于預(yù)測(cè)。
圖5 殘差自相關(guān)函數(shù)和偏自相關(guān)函數(shù)
應(yīng)用擬合的ARIMA模型預(yù)測(cè)山東省2017年1月-8月的肺結(jié)核發(fā)病率,并用預(yù)測(cè)值與實(shí)際值相比較,計(jì)算相對(duì)誤差。根據(jù)相對(duì)誤差和發(fā)病率效果擬合圖,該模型預(yù)測(cè)效果較好,詳情見(jiàn)表4。利用該模型預(yù)測(cè)山東省2017年9月-2018年8月肺結(jié)核月發(fā)病率,總體呈下降趨勢(shì),從預(yù)測(cè)結(jié)果可以看出山東省肺結(jié)核部分月發(fā)病率仍然有上升的趨勢(shì),見(jiàn)表5。
表4 2017年1月-8月實(shí)際發(fā)病率與預(yù)測(cè)值比較(1/10萬(wàn))
表5 2017年9月-2018年8月預(yù)測(cè)值
根據(jù)擬合及預(yù)測(cè)效果發(fā)現(xiàn),ARIMA模型效果較好,通過(guò)2009-2017年肺結(jié)核月發(fā)病率的時(shí)序圖觀察到此時(shí)間序列存在周期趨勢(shì)和長(zhǎng)期趨勢(shì),可以判斷為非穩(wěn)定的時(shí)間序列。ARIMA模型可以通過(guò)對(duì)原始序列進(jìn)行1階4步差分后消除其周期和長(zhǎng)期趨勢(shì),把非平穩(wěn)時(shí)間序列轉(zhuǎn)換為平穩(wěn)的時(shí)間序列,然后再通過(guò)殘差白噪聲檢驗(yàn)后得出差分后序列為平穩(wěn)非白噪聲序列,進(jìn)而證明該序列有進(jìn)一步建模價(jià)值[6]。
從長(zhǎng)期趨勢(shì)看,2009-2017年山東省肺結(jié)核月發(fā)病率隨著年份的推移逐漸下降,呈緩慢下降的長(zhǎng)期趨勢(shì),顯然山東省全面落實(shí)“十二五”結(jié)核病防治規(guī)劃有顯著效果,同時(shí)這也與WHO發(fā)布的全球肺結(jié)核控制報(bào)告以及我國(guó)衛(wèi)生部門(mén)公布的全國(guó)肺結(jié)核流行病學(xué)抽樣調(diào)查結(jié)論一致[7-8];分析結(jié)果顯示,肺結(jié)核月發(fā)病率具有周期性,2017年9月-12月肺結(jié)核月發(fā)病率又出現(xiàn)上升趨勢(shì),這符合經(jīng)呼吸道傳染病的基本特征,也與我國(guó)肺結(jié)核發(fā)病具有年周期、氣候較寒冷的季節(jié)多發(fā)的特點(diǎn)一致[9]。
肺結(jié)核發(fā)病預(yù)測(cè)研究可以早發(fā)現(xiàn)肺結(jié)核發(fā)展趨勢(shì),達(dá)到早發(fā)現(xiàn)的效果,及時(shí)預(yù)警群眾做好肺結(jié)核預(yù)防。預(yù)測(cè)模型分析結(jié)果顯示山東省肺結(jié)核月發(fā)病率長(zhǎng)期呈現(xiàn)下降的趨勢(shì),部分月份還是有上升趨勢(shì),這與近年來(lái)山東省肺結(jié)核疫情流行特征基本是相吻合的。由于時(shí)間序列模型屬于短期預(yù)測(cè)模型,因此在實(shí)際應(yīng)用中,應(yīng)該不斷添加新的實(shí)際值,不斷更新修正模型并進(jìn)行重新擬合預(yù)測(cè)值。