昆山市第一人民醫(yī)院婦產(chǎn)科(215300) 毛圓圓 周麗紅 劉 麗 劉 琴
人工流產(chǎn)率在發(fā)達(dá)國家已經(jīng)出現(xiàn)下降趨勢,但是發(fā)展中國家依舊呈現(xiàn)上升趨勢[1]。具有醫(yī)學(xué)終止妊娠(人工流產(chǎn))的經(jīng)歷,在中國育齡婦女中是比較普遍的現(xiàn)象,基于人群的調(diào)查顯示育齡婦女中具有人工流產(chǎn)史者占22.0%~50%[2-3],其原因主要是無保護(hù)措施的性交和避孕失敗[4]。合理的人工流產(chǎn)可減小不必要的妊娠結(jié)局,頻繁的人工流產(chǎn)可增加后來習(xí)慣性流產(chǎn)風(fēng)險(xiǎn)[5],乃至女性惡性腫瘤患病風(fēng)險(xiǎn)[6]。本研究基于醫(yī)院人工流產(chǎn)登記來探究2013-2016年人工流產(chǎn)病例數(shù),為臨床決策及指導(dǎo)計(jì)劃生育工作實(shí)踐提供依據(jù)。
1.對(duì)象來源
醫(yī)院人工流產(chǎn)(簡稱“流產(chǎn)”)病例來源于2013年1月至2016年12月份昆山市第一人民醫(yī)院計(jì)劃生育門診登記。
2.X-12過程
X-12過程是由美國國情調(diào)查局于1965年編制的時(shí)間序列季節(jié)調(diào)整方案[7]。其基本思想是時(shí)間序列的確定性因素分解法?;谶@樣的假設(shè):任何時(shí)間序列Xt都可以拆分為長期趨勢Tt、季節(jié)波動(dòng)St、不規(guī)則波動(dòng)It的影響。經(jīng)濟(jì)學(xué)家也發(fā)現(xiàn)經(jīng)濟(jì)時(shí)間序列中周期波動(dòng)Dt也是一個(gè)很重要的影響因素,因此任何一個(gè)時(shí)間序列可以分解為:
乘法模型:Xt=Tt×St×Dt×It
加法模型:Xt=Tt+St+Dt+It
X-12模型見文獻(xiàn)[8-9]。SAS統(tǒng)計(jì)學(xué)軟件中,X-12過程可自動(dòng)選擇最優(yōu)ARIMA模型[7,10]。
3.ARIMA模型
ARIMA模型全稱為差分自回歸移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA),其中ARIMA(p,d,q)可拆分自回歸平均移動(dòng)模型,AR是自回歸,p是自回歸階數(shù);MA是移動(dòng)平均,q是移動(dòng)平均階數(shù),d為時(shí)間序列成為平穩(wěn)所作出的差分階數(shù)。標(biāo)準(zhǔn)具有季節(jié)性的ARIMA模型為ARIMA(p,d,q)×(P,D,Q)S,其中p、d、q分別表示非季節(jié)性自回歸階數(shù)、差分階數(shù)和移動(dòng)平均階數(shù),P、D、Q分別表示季節(jié)性自回歸階數(shù)、差分階數(shù)和移動(dòng)平均階數(shù),S表示季節(jié)性周期。
ARIMA建模包括:①序列的平穩(wěn)化處理;②模型的識(shí)別:通過差分確定d和D的階數(shù),再依據(jù)差分后的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)的圖形來初步確定模型中的p、q、P、Q的階數(shù);③模型參數(shù)估計(jì)和檢驗(yàn);④模型診斷檢驗(yàn);⑤模型擬合效果驗(yàn)證和預(yù)測[11]。
4.數(shù)據(jù)分析
(1)平均絕對(duì)誤差(MAE)
(2)平均絕對(duì)百分比誤差(MAPE)
(3)決定系數(shù)(R2)
最后用建立的模型對(duì)2017年1月至2017年12月醫(yī)院流產(chǎn)數(shù)進(jìn)行預(yù)測。
1.原始序列趨勢成分分解與季節(jié)性分析
2013年1月至2016年12月流產(chǎn)病例數(shù)X-12過程分析顯示(圖1),4年期間分月份流產(chǎn)病例隨時(shí)間變化趨勢每年大致相同,不同年份之間均存在高峰和低谷現(xiàn)象。季節(jié)指數(shù)圖提示每年3月份和5月份是流產(chǎn)高峰,而9月份是低谷,10~12月份呈現(xiàn)回升現(xiàn)象。在假定穩(wěn)定性的前提下確定是否存在季節(jié)性,檢驗(yàn)結(jié)果提示在0.01水平上具有季節(jié)性(F=9.58,P<0.01),可見醫(yī)院流產(chǎn)數(shù)具有周期性和季節(jié)性。
從趨勢擬合來看,2013年1月至2015年7月份,流產(chǎn)數(shù)呈現(xiàn)上升趨勢,但是2015年8月至2016年12月份,流產(chǎn)數(shù)呈現(xiàn)明顯下降趨勢。見圖1。
圖1 2013-2016年流產(chǎn)數(shù)時(shí)間序列
2.序列平穩(wěn)化及適應(yīng)性檢驗(yàn)
由圖1中原始序列可以看出,2013年1月至2016年12月醫(yī)院月度流產(chǎn)例數(shù)波動(dòng)較大,說明該序列是具有周期性的不平穩(wěn)序列,不適合建模和預(yù)測。為了使序列平穩(wěn)化,對(duì)人流例數(shù)進(jìn)行一階差分來消除趨勢性,12步差分來消除季節(jié)性因素,差分后的序列圖見圖2。
圖2 醫(yī)院人流數(shù)時(shí)間序列診斷圖
模型的適應(yīng)性檢驗(yàn)中,檢驗(yàn)統(tǒng)計(jì)量LB(6)、LB(12)、LB(18)、LB(24)對(duì)應(yīng)的P值均大于0.05,拒絕了殘差序列為白噪聲的假設(shè),時(shí)間序列為非白噪聲平穩(wěn)序列。結(jié)合差分后的序列圖和模型適應(yīng)性檢驗(yàn),可以認(rèn)為現(xiàn)有序列符合ARIMA乘積季節(jié)模型對(duì)平穩(wěn)性的要求。
3.X-12過程自動(dòng)選擇最優(yōu)ARIMA模型
在X-12模型中,按照BIC最小原則、擬合效果及殘差分析等進(jìn)行綜合判斷,篩選出備選模型,共進(jìn)行16次試驗(yàn),經(jīng)過初步篩選優(yōu)選出5個(gè)最佳模型,分別為(0,1,1)×(1,0,1)12、(1,1,1)×(1,0,1)12、(0,1,2)×(1,0,1)12、(1,1,0)×(1,0,1)12和(0,1,1)×(1,0,0)12,其BIC值分別為564.07、564.08、565.01、565.27和566.48。以BIC值最小為原則,發(fā)現(xiàn)ARIMA (0,1,1)×(1,0,1)12最優(yōu)模型,季節(jié)性自回歸參數(shù)、非季節(jié)性移動(dòng)平均參數(shù)及季節(jié)性移動(dòng)平均參數(shù)均有統(tǒng)計(jì)學(xué)意義(P<0.0001)。見表1。
表1 ARIMA(0,1,1)×(1,0,1)12模型參數(shù)估計(jì)
4.精度評(píng)價(jià)及預(yù)測
用X-12選擇的ARIMA (0,1,1)×(1,0,1)12模型中2014年2月至2016年12月實(shí)際值與預(yù)測值進(jìn)行模型精度評(píng)價(jià)。結(jié)果顯示月度流產(chǎn)數(shù)平均絕對(duì)誤差為36.7例,平均絕對(duì)百分比誤差為3.60%,決定系數(shù)為0.751。提示預(yù)測模型精度較高,模型較為穩(wěn)健。其他候選模型精度評(píng)價(jià)見表2。
表2 X-12自動(dòng)選擇的5個(gè)最佳模型及其對(duì)應(yīng)的精度估計(jì)值
進(jìn)一步外推預(yù)測2017年1月至12月流產(chǎn)數(shù)。圖3顯示了模型對(duì)2017年1月至2017年12月流產(chǎn)數(shù)的預(yù)測值及其95%CI,可見模型對(duì)實(shí)際值進(jìn)行了較好的擬合,預(yù)測數(shù)與實(shí)際值的動(dòng)態(tài)趨勢基本吻合,2017年1月至12月的預(yù)測流產(chǎn)數(shù)總體上保持了歷史月份的波動(dòng)特征。
圖3 X-12-ARIMA模型預(yù)測流產(chǎn)數(shù)時(shí)間趨勢
本研究采用X-12過程進(jìn)行時(shí)間序列成分分解,以2013-2016年四年分月份流產(chǎn)數(shù)建模并預(yù)測2017年1至12月份流產(chǎn)數(shù),結(jié)果提示ARIMA (0,1,1)×(1,0,1)12模型具有較好的擬合優(yōu)度,預(yù)測精度較高,可用于流產(chǎn)數(shù)時(shí)間序列預(yù)測。
本研究中采用X-12-ARIMA模型,對(duì)原始數(shù)據(jù)進(jìn)行了成分分解,以準(zhǔn)確判斷流產(chǎn)數(shù)時(shí)間序列特征。在剔除季節(jié)波動(dòng)和不規(guī)則項(xiàng)等因素之后,流產(chǎn)數(shù)長期趨勢曲線顯得更為平滑,且明確呈現(xiàn)了觀察時(shí)間內(nèi)的變化趨勢。總體上看,2013年1月至2015年7月流產(chǎn)數(shù)呈現(xiàn)平穩(wěn)上升趨勢,但是2015年8月至2016年12月份呈現(xiàn)平穩(wěn)下降趨勢。
本研究顯示ARIMA (0,1,1)×(1,0,1)12模型對(duì)基層醫(yī)院流產(chǎn)數(shù)建模具有較好的擬合優(yōu)度,可以用于基層醫(yī)院流產(chǎn)數(shù)預(yù)測及相關(guān)干預(yù)效果的評(píng)價(jià)。但是我們也注意到,2016年2月份具有較高的絕對(duì)誤差(129例),明顯與春節(jié)相關(guān)。本次ARIMA時(shí)間序列模型構(gòu)建和預(yù)測中,2016年以及2017年流產(chǎn)數(shù)下降的原因,一方面與國家宏觀計(jì)劃生育政策息息相關(guān)。黨的十八屆五中全會(huì)明確提出“堅(jiān)持計(jì)劃生育的基本國策,完善人口發(fā)展戰(zhàn)略,全面實(shí)施一對(duì)夫婦可生育兩個(gè)孩子的政策”。但是有研究顯示,有關(guān)人口政策對(duì)流產(chǎn)的影響有限[1,12]。另一方面也與昆山市人口流動(dòng)密切相關(guān)。研究顯示流動(dòng)人口中流產(chǎn)率高于其他群體[13]。昆山作為外向型經(jīng)濟(jì)的長三角樣本,隨著國家產(chǎn)業(yè)轉(zhuǎn)移與經(jīng)濟(jì)結(jié)構(gòu)優(yōu)化升級(jí),勞動(dòng)力密集型企業(yè)逐漸淡出昆山,流動(dòng)人口數(shù)量逐漸減少,可能是流產(chǎn)數(shù)下降的原因之一,但尚缺乏確切的權(quán)威數(shù)據(jù)。
我們采用X-12-ARIMA季節(jié)調(diào)整方法呈現(xiàn)了流產(chǎn)數(shù)時(shí)間序列特點(diǎn)[9,14-15],特別是經(jīng)過季節(jié)調(diào)整后,更加直觀的看到基層醫(yī)院分月份的流產(chǎn)數(shù)發(fā)展趨勢。X-12-ARIMA季節(jié)調(diào)整方法也存在不足,一是經(jīng)過調(diào)整的分析數(shù)據(jù)相比原始數(shù)據(jù)更難理解;目前相關(guān)的分析方法源自于美國,調(diào)整方法也根據(jù)國外的假日規(guī)則來計(jì)算,而我國的春節(jié)、國慶長假等假期因素并未進(jìn)行調(diào)整。因此,該方法分析國內(nèi)數(shù)據(jù)尚顯不足,需要結(jié)合我國社會(huì)數(shù)據(jù)特點(diǎn)進(jìn)行調(diào)整,更好的為相關(guān)序列分析服務(wù)。
總之,本研究采用的ARIMA (0,1,1)×(1,0,1)12模型在前瞻性預(yù)測昆山市第一人民醫(yī)院流產(chǎn)數(shù)中具有一定的把握度,可評(píng)價(jià)已經(jīng)采取的計(jì)劃生育措施的效果,同時(shí)也為計(jì)劃生育相關(guān)部門前瞻性決策提供依據(jù)。但是我們也看到,雖然2016年流產(chǎn)數(shù)呈現(xiàn)下降趨勢,但是實(shí)施流產(chǎn)的例數(shù)依舊很大,進(jìn)一步加強(qiáng)計(jì)劃生育相關(guān)措施來促進(jìn)這種下降趨勢依舊必要。
[1] Sedgh G,Bearak J,Singh S,et al.Abortion incidence between 1990 and 2014:global,regional,and subregional levels and trends.Lancet,2016,388(10041):258-267.
[2] Gao GP,Zhang RJ,Zhang XJ,et al.Prevalence and associated factors of induced abortion among rural married women:a cross-sectional survey in Anhui,China.J Obstet Gynaecol Res,2015,41(3):383-391.
[3] 郭沛沛,劉玉玲,湯福想,等.2956例人工流產(chǎn)女性現(xiàn)狀分析及人工流產(chǎn)后關(guān)愛服務(wù)在生殖健康中的作用評(píng)價(jià).中國全科醫(yī)學(xué),2016,19(24):2982-2985.
[4] Wu S,Tian L,Xu F.Induced abortion and relevant factors among women seeking abortion in Nanjing,China.Gynecol Obstet Invest,2011,71(2):87-92.
[5] Sun Y,Che Y,Gao E,et al.Induced abortion and risk of subsequent miscarriage.Int J Epidemiol,2003,32(3):449-454.
[6] Huang Y,Zhang X,Li W,et al.A meta-analysis of the association between induced abortion and breast cancer risk among Chinese females.Cancer Causes Control,2014,25(2):227-236.
[7] US Bureau of the Census (2010).X-12-ARIMA Seasonal Adjustment Program,Version 0.3//US BUREAU OF THE CENSUS.Washington,DC.http://www.census.gov/srd/www/x12a/.2010.
[8] 俞艷,胡興幫,任蘇蕊,等.基于X-12-ARIMA方法的武漢市空氣污染指數(shù)波動(dòng)分析.環(huán)境污染與防治,2016,38(2):19-22+28.
[9] 申銅倩,劉文東,胡建利,等.x-11-ARIMA過程在痢疾疫情預(yù)測中的應(yīng)用研究.中國衛(wèi)生統(tǒng)計(jì),2014,31(3):395-398.
[10] 孫玉環(huán).X-12-ARIMA方法的SAS程序?qū)崿F(xiàn)及應(yīng)用.統(tǒng)計(jì)與決策,2006,(4):139-141.
[11] 黎健,吳寰宇,李燕婷,等.上海市痢疾發(fā)病率預(yù)測自回歸求和移動(dòng)平均模型的構(gòu)建與應(yīng)用.中華預(yù)防醫(yī)學(xué)雜志,2010,44(1):48-53.
[12] Sedgh G,Singh S,Shah IH,et al.Induced abortion:incidence and trends worldwide from 1995 to 2008.Lancet,2012,379(9816):625-632.
[13] 郭超,劉鴻雁,裴曉東,等.中國五城市流動(dòng)育齡婦女人工流產(chǎn)風(fēng)險(xiǎn)因素研究.中華流行病學(xué)雜志,2012,33(12):1238-1242.
[14] 高明,唐順,徐福文.醫(yī)院數(shù)據(jù)挖掘平臺(tái)中X-11-ARIMA預(yù)測模型的應(yīng)用研究.中國衛(wèi)生統(tǒng)計(jì),2016,33(1):139-141.
[15] 郭志武,蒲繼紅,滕國召.基于ARIMA模型的春節(jié)因素調(diào)整方法研究.中國衛(wèi)生統(tǒng)計(jì),2009,26(6):573-579.