張 麗 相曉妹 張水平△ 宋 暉 董 敏 米白冰 黨少農(nóng)△
【提 要】 目的 探討ARIMA乘積季節(jié)模型、Holt-Winters季節(jié)模型、多層感知器模型在出生缺陷發(fā)生趨勢預(yù)測中的可行性。方法 本文采用2009年10月至2016年9月西安市婦幼保健院出生缺陷監(jiān)測及圍產(chǎn)兒數(shù)據(jù)進行研究。選擇2009年10月至2015年8月出生缺陷月發(fā)生率時間序列進行模型擬合,應(yīng)用2015年9月至2016年9月出生缺陷月發(fā)生率對模型進行評價。 結(jié)果 三種模型均通過了檢驗。ARIMA(0,0,1)(0,1,1)12模型預(yù)測平均絕對誤差和相對誤差分別為11.64和0.11。Holt-Winters加法模型預(yù)測平均絕對誤差和相對誤差分別為14.21和0.14。Holt-Winters乘法模型預(yù)測平均絕對誤差和相對誤差分別為16.64和0.16。多層感知器模型預(yù)測平均絕對誤差和相對誤差分別為20.58和0.20,通過比較模型預(yù)測能力,最優(yōu)模型為ARIMA(0,0,1)(0,1,1)12。結(jié)論 ARIMA乘積季節(jié)模型更加靈活,結(jié)果可能較優(yōu)。同時,隨著預(yù)測時間的延長,模型預(yù)測的準(zhǔn)確性降低。
出生缺陷是胚胎或胎兒發(fā)育過程中結(jié)構(gòu)、功能或代謝異常,是嬰幼兒死亡及致殘的主要原因[1]。隨著兒童傳染病的顯著控制,出生缺陷已成為影響兒童健康的重要因素,其流行狀況受到遺傳、社會環(huán)境和生活方式等多種因素的影響[2],在預(yù)測中難以綜合考慮。目前,疾病預(yù)測方法眾多,如灰色模型、神經(jīng)網(wǎng)絡(luò)模型、時間序列模型等。其中,時間序列預(yù)測是基于對象歷史數(shù)據(jù)變化規(guī)律,用該變量以往資料建立模型并外推的方法,時間是替代了各種影響因素的綜合效應(yīng)[3]。目前ARIMA模型主要用于傳染病預(yù)測,在婦幼衛(wèi)生中主要用于孕產(chǎn)婦及嬰幼兒死亡預(yù)測[4],出生缺陷預(yù)測較少見[5],可能由于出生缺陷病因復(fù)雜等原因,模型適用性值得考慮。本研究選取ARIMA乘積季節(jié)模型、Holt-Winters季節(jié)模型和多層感知器模型,對出生缺陷發(fā)生趨勢展開動態(tài)預(yù)測,探討三種模型在出生缺陷發(fā)生趨勢預(yù)測中的可行性,并比較其擬合能力。
出生缺陷及圍產(chǎn)兒數(shù)據(jù)來源于西安市婦幼保健院,以2009年10月至2016年9月西安市所有產(chǎn)科醫(yī)院住院分娩的孕滿28周至產(chǎn)后7天內(nèi)的圍產(chǎn)兒(包括活產(chǎn)、死胎、死產(chǎn)、治療性引產(chǎn)及7天內(nèi)死亡的新生兒)為監(jiān)測對象。
按《中國出生缺陷監(jiān)測方案》要求,采用以醫(yī)院為基礎(chǔ)的監(jiān)測方案。監(jiān)測年度按“3+1” 模式(當(dāng)年前3季度數(shù)據(jù)加前一年第4季度數(shù)據(jù)作為該年全年數(shù)據(jù))進行統(tǒng)計,采用全國統(tǒng)一的《出生缺陷兒登記卡》和《圍產(chǎn)兒數(shù)季報表》收集數(shù)據(jù),監(jiān)測缺陷類型以體表先天畸形和先天性心臟病為主,分類標(biāo)準(zhǔn)參考國際疾病分類(ICD-10)。
本研究應(yīng)用ARIMA乘積季節(jié)模型、Holt-Winters季節(jié)模型和多層感知器模型對西安市出生缺陷月發(fā)生率趨勢開展動態(tài)預(yù)測,探討三種模型在出生缺陷發(fā)生趨勢預(yù)測中的可行性。
(1)ARIMA乘積季節(jié)模型
ARIMA乘積季節(jié)模型,即ARIMA(p,d,q)(P,D,Q)s模型,能綜合考慮季節(jié)、趨勢、隨機干擾等成分,各參數(shù)意義如下:非季節(jié)回歸階數(shù)p、非季節(jié)差分階數(shù)d、非季節(jié)移動平均階數(shù)q、季節(jié)自回歸階數(shù)P、季節(jié)差分階數(shù)D、季節(jié)移動平均階數(shù)Q、季節(jié)長度s[6]。建立該模型可歸納為4個步驟。①數(shù)據(jù)平穩(wěn)化:對序列平穩(wěn)性判斷及非平穩(wěn)序列平穩(wěn)化。若序列不平穩(wěn),選擇合適的差分提取原序列中周期性和趨勢變動等信息,以此確定d和D。②模型識別:考察差分后序列的自相關(guān)和偏自相關(guān)圖,確定模型階數(shù)p和q,參數(shù)P和Q超過2階的情況少見,可從低到高逐個嘗試。季節(jié)長度s可由疾病背景分析得到。③參數(shù)估計與模型檢驗:采用Box-Ljung統(tǒng)計量檢驗殘差是否為白噪聲序列,若差異有統(tǒng)計學(xué)意義,則殘差非白噪聲序列,說明殘差中還存在有用信息未被提取,需對原模型進行改進,轉(zhuǎn)向步驟②,重新選擇模型擬合。白噪聲檢驗P<0.05差異有統(tǒng)計學(xué)意義。若兩個或兩個以上模型通過檢驗,通過BIC等擬合優(yōu)度指標(biāo)選擇最優(yōu)模型,BIC越小模型擬合程度越好。④模型評價:利用最優(yōu)模型預(yù)測,并用實際數(shù)據(jù)進行驗證,評價模型是否恰當(dāng)。
(2)Holt-Winters季節(jié)模型
Holt-Winters季節(jié)模型是較高級的指數(shù)平滑方法,可同時修正時間序列的季節(jié)性和傾向性,并能將隨機波動的影響適當(dāng)過濾掉,特別適于含趨勢和季節(jié)變化的時間序列。Holt-Winters季節(jié)模型在每個周期中采用一個水平分量、一個趨勢分量及一個季節(jié)分量三個權(quán)重來更新分量。水平和趨勢分量初始值通過對時間進行線性回歸得到。季節(jié)分量初始值使用去除趨勢后數(shù)據(jù)的虛擬變量回歸得到。當(dāng)水平分量和季節(jié)分量相乘時,為乘法模型,當(dāng)二者相加時,為加法模型[7]。
(3)多層感知器人工神經(jīng)網(wǎng)絡(luò)模型
多層感知器模型(MLP)是應(yīng)用最多的人工神經(jīng)網(wǎng)絡(luò),由輸入層、隱含層和輸出層構(gòu)成,即信號從輸入層輸入,經(jīng)隱含層傳給輸出層,由輸出層得到輸出信號[8]。MLP最常用誤差反向傳播算法,其過程由信號正向傳播與誤差反向傳播組成。正向傳播時,輸入樣本從輸入層傳入,經(jīng)各隱含層處理后,傳向輸出層。若輸出層實際輸出與期望輸出不符,則轉(zhuǎn)入誤差反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳,并將誤差分?jǐn)偨o所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權(quán)重值的依據(jù)。這種信號正向傳播與誤差反向傳播的各層權(quán)值調(diào)整過程,周而復(fù)始,對權(quán)值不斷修正,使模型實際輸出更接近期望輸出。
(1)數(shù)據(jù)平穩(wěn)化
對2009年10月至2015年8月出生缺陷發(fā)生率做時序圖,呈上漲趨勢,提示為非平穩(wěn)序列。對原始序列進行1階12步季節(jié)差分提取其季節(jié)和趨勢影響,得到一個近似平穩(wěn)的序列,基本符合ARIMA模型對平穩(wěn)性的要求。對差分后序列進行ADF單根性檢驗,結(jié)果顯示P<0.05,說明差分后為平穩(wěn)時間序列。
(2)模型識別
根據(jù)差分變換次數(shù)及出生缺陷季節(jié)等因素,初步確定以12個月為周期的ARIMA(p,0,q)(P,1,Q)12模型。四個待定參數(shù)p、q和Q、P的確定,采用從低階至高階逐個嘗試,比較模型擬合優(yōu)度等參數(shù)確定。本研究在確定d=0,D=1后,測試了待定參數(shù)p、q和Q、P分別取0,1,2的所有模型,共81個。
(3)參數(shù)估計及模型診斷
在嘗試的81個模型中,共39個模型通過了白噪聲檢驗。參考模型擬合優(yōu)度指標(biāo)BIC等,得到最優(yōu)模型為ARIMA(0,0,1)(0,1,1)12,其參數(shù)估計結(jié)果見表1。對其殘差值進行驗證,自相關(guān)和偏自相關(guān)系數(shù)基本在可信區(qū)間范圍內(nèi)(圖1)。
表1 最優(yōu)模型ARIMA(0,0,1)(0,1,1)12 參數(shù)估計結(jié)果
注:ACF為自相關(guān),PACF為偏自相關(guān)
利用時間序列預(yù)測功能中的指數(shù)平滑法,以2009年10月至2015年8月出生缺陷月發(fā)生率數(shù)據(jù)為基礎(chǔ),分別擬合Holt-Winters季節(jié)加法和乘法模型,對兩個模型殘差分別作ACF和PACF圖(圖2),結(jié)果顯示殘差自相關(guān)和偏自相關(guān)系數(shù)基本在可信限內(nèi),同時Ljing-box統(tǒng)計量差異無統(tǒng)計學(xué)意義,可認(rèn)為殘差序列為白噪聲序列,兩模型成立。Holt-Winters季節(jié)加法和乘法模型R2分別為0.504和0.377。
注:ACF為自相關(guān),PACF為偏自相關(guān)
本研究MLP參數(shù)中以雙曲正切函數(shù)為連接函數(shù),其余為默認(rèn)選項,模型結(jié)構(gòu)見圖3。模型殘差圖顯示殘差在0兩側(cè)分布均勻,認(rèn)為模型擬合成功。將構(gòu)建的模型導(dǎo)出,運用該模型預(yù)測2015年9月至2016年9月出生缺陷發(fā)生水平。
注:隱藏層激活函數(shù):雙曲正切;輸出層激活函數(shù):恒等式
圖3MLP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
利用3種模型對西安市2015年9月至2016年9月出生缺陷發(fā)生率進行預(yù)測(表2)。ARIMA(0,0,1)
(0,1,1)12乘積季節(jié)模型絕對誤差和相對誤差范圍分別是1.89~27.26和0.02~0.29,平均絕對和相對誤差為11.64和0.11。Holt-Winters加法模型絕對誤差和相對誤差范圍分別是2.02~31.30和0.02~0.35,平均絕對誤差和相對誤差分別為14.21和0.14。Holt-Winters乘法模型絕對誤差和相對誤差范圍分別是4.75~32.95和0.04~0.34,平均絕對誤差和相對誤差分別為16.64和0.16。MLP模型絕對誤差和相對誤差范圍分別是4.77~42.87和0.04~0.48,平均絕對誤差和相對誤差為分別20.58和0.20。通過比較絕對、相對誤差范圍,平均絕對、相對誤差,最優(yōu)模型為ARIMA(0,0,1)(0,1,1)12模型。該模型2015年9月至2016年2月預(yù)測的相對誤差在15%內(nèi),且波動較小,提示預(yù)測相對準(zhǔn)確;2016年3月至2016年9月預(yù)測波動較大,提示預(yù)測結(jié)果準(zhǔn)確性相對降低。
表2 2015年9月至2016年9月西安市出生缺陷發(fā)生率預(yù)測結(jié)果(1/萬)
本研究選取ARIMA模型、Holt-Winters模型及MLP模型建模,通過比較ARIMA(0,0,1)(0,1,1)12模型、Holt-Winters加法模型、Holt-Winters乘法模型和MLP模型平均相對誤差,對模型預(yù)測結(jié)果進行評價,三個模型的優(yōu)劣順序是:ARIMA(0,0,1)(0,1,1)12模型> Holt-Winters加法模型> Holt-Winters乘法模型>MLP模型。
時間序列預(yù)測模型是基于對象歷史數(shù)據(jù)變化規(guī)律,用變量以往統(tǒng)計資料建立模型并外推的預(yù)測方法,時間是替代了各種影響因素的綜合效應(yīng),其中,ARIMA模型主要用于傳染病預(yù)測,用于出生缺陷較少見。本研究應(yīng)用西安市出生缺陷數(shù)據(jù)擬合的ARIMA模型通過了檢驗,說明在出生缺陷時間趨勢預(yù)測中ARIMA模型值得考慮[5]。ARIMA模型預(yù)測準(zhǔn)確性較Holt-Winters模型略高,其原因可能是ARIMA模型可調(diào)整參數(shù),能充分提取序列長期趨勢、周期性、隨機波動等信息,且能判斷這些因素間確切作用關(guān)系[9]。而Holt-Winters模型僅能提取序列確定性信息,對隨機波動信息浪費嚴(yán)重[10]。在本研究中,ARIMA季節(jié)模型預(yù)測近期結(jié)果較準(zhǔn)確,而遠(yuǎn)期預(yù)測結(jié)果準(zhǔn)確性降低,提示隨著時間推移,預(yù)測準(zhǔn)確性降低。因此,在實際應(yīng)用中,應(yīng)及時掌握和更新出生缺陷發(fā)病數(shù)據(jù)庫,隨著數(shù)據(jù)動態(tài)變化,及時補充更新數(shù)據(jù)進行模型再次擬合,才能對出生缺陷防控提供一定指導(dǎo)。
相比ARIMA模型,Holt-Winters模型也有其優(yōu)點。Holt-Winters模型操作較簡便,重要參數(shù)經(jīng)系統(tǒng)多次比較,自動產(chǎn)出最優(yōu)參數(shù),故當(dāng)序列中確定性信息比較強勁時,選擇Holt-Winters模型預(yù)測也會得到不錯的預(yù)測結(jié)果。因出生缺陷發(fā)生率受多種因素影響,有時利用傳統(tǒng)線性數(shù)學(xué)模型難以進行理想擬合。近年作為非線性建模方法的人工神經(jīng)網(wǎng)絡(luò),具自組織、自學(xué)習(xí)、非線性逼近能力和容錯能力強的優(yōu)點,可嘗試用于出生缺陷的預(yù)測[11]。本研究中MLP在近期預(yù)測誤差均在15%以內(nèi),遠(yuǎn)期預(yù)測誤差均大于15%,提示在出生缺陷發(fā)生的近期預(yù)測中多層感知器模型值得考慮。
出生缺陷預(yù)測以往多使用灰色模型,因其所需數(shù)據(jù)量少,不受數(shù)據(jù)分布影響,且預(yù)測精度較高。李玲等應(yīng)用灰色模型預(yù)測山東省圍產(chǎn)兒出生缺陷發(fā)生率,平均相對誤差為7.2%[12]。劉曉東等應(yīng)用灰色模型預(yù)測中國出生缺陷發(fā)生率平均誤差率為1.8%[13]。孫金杰等應(yīng)用灰色模型模擬預(yù)測某省出生缺陷發(fā)生率平均誤差為6.98%[14]。當(dāng)序列數(shù)據(jù)變化較急劇時,灰色模型構(gòu)造的參數(shù)值可能會產(chǎn)生較大的滯后誤差,模型偏差較大,灰色模型對出生缺陷的預(yù)測誤差似有較大的地域或人群波動,可能與之有關(guān),后續(xù)我們也將進一步評估灰色模型在西安出生缺陷預(yù)測中的應(yīng)用價值。ARIMA模型預(yù)測西安市出生缺陷發(fā)生率的平均誤差率為11%,較灰色模型略高,可能與本研究預(yù)測周期較長有一定關(guān)系,但在可接受范圍內(nèi)。WANG JF等應(yīng)用支持向量機預(yù)測陜西省神經(jīng)管畸形發(fā)生水平,預(yù)測對象是神經(jīng)管畸形在抽樣村的發(fā)生等級,訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集預(yù)測精確度分別為71.50%和68.57%[15]。另外基于危險因素,使用神經(jīng)網(wǎng)絡(luò)模型預(yù)測個體水平上出生缺陷是否發(fā)生也是值得考慮的問題[16]。
本研究從實踐出發(fā),尋找預(yù)測誤差在可接受范圍內(nèi)且實際操作更為簡便的出生缺陷預(yù)測模型,通過比較預(yù)測誤差和建模過程,Holt-Winters模型及MLP模型預(yù)測誤差較大,預(yù)測精度相對較低,而ARIMA模型在出生缺陷的應(yīng)用中有一定的預(yù)測價值。