彭榮榮,劉蕓男,楊冬燕,王含柔,趙明烽,楊小麗
(1.重慶醫(yī)科大學公共衛(wèi)生與管理學院,醫(yī)學與社會發(fā)展研究中心,健康領域社會風險預測治理協(xié)同創(chuàng)新中心,重慶 400016;2.重慶市血液中心,重慶 400015)
近年來,隨著地市級醫(yī)療機構服務能力的提高,醫(yī)院規(guī)模不斷擴大,患者更多選擇到中心血站覆蓋的地市級醫(yī)療機構接受治療,使地市級醫(yī)療機構血液用量迅速增長,中心血站血液供需矛盾突出,區(qū)域性、季節(jié)性和結構性缺血常常發(fā)生[1]。目前,重慶市對臨床血液需求預測主要依據相關人員既往經驗粗略估算,存在較多局限,本研究擬采用差分整合移動平均自回歸(autoregrescive integrated moving average,ARIMA)模型建立臨床血液需求預測模型,以實現(xiàn)血液資源的科學采集和儲備。
獲取2006年至2016年重慶市萬州中心血站每月向醫(yī)院提供的懸浮紅細胞ABO各血型用量以及懸浮紅細胞總用量的數(shù)據;運用Excel軟件建立數(shù)據庫,按月統(tǒng)計懸浮紅細胞ABO各血型用量以及總用量;然后運用SPSS 19.0軟件進行統(tǒng)計分析。臨床用量以單位 (U) 計算,1 U懸浮紅細胞由200 mL全血分離制備。
ARIMA模型建立的基本步驟: (1) 時間序列分析及平穩(wěn)處理。對于存在趨勢性和季節(jié)周期性的序列分別進行差分和季節(jié)差分處理使其平穩(wěn)。(2) 模型識別與參數(shù)估計。觀察經過差分后平穩(wěn)序列的自相關函數(shù) (autocorrelation function,ACF) 圖和偏自相關函數(shù) (partial autocorrelation function,PACF) 圖,確定模型的階數(shù);然后對模型進行參數(shù)估計與假設檢驗,根據t檢驗結果中的P值進行判定,若P> 0.05則檢驗未通過,則需重新選定模型;最后依據貝葉斯信息準則 (Bayesian information criterion,BIC) 確定最佳模型。(3) 模型檢驗。對模型的殘差序列進行白噪聲檢驗,可通過觀察殘差序列ACF和PACF是否落在95%可信區(qū)間 (confidence intervals,CI) 內或根據Ljung-Box Q檢驗結果中的P值判定。(4) 模型預測。運用最優(yōu)模型預測2016年7月至12月每月懸浮紅細胞臨床用量,計算95%CI及相對誤差,并與同期懸浮紅細胞臨床實際用量比較,驗證模型的擬合效果。
以A型懸浮紅細胞為例,繪制2006年1月至2016年6月每月用量原始序列圖 (圖1A),可見2006年至2012年用量逐年上升,2013年至2016年上升趨勢逐漸變緩。同時該序列還存在明顯的季節(jié)周期性,以12個月為1個周期,每年1、2月用量較低,8、9月用量較高。上升趨勢及季節(jié)周期性表明該序列呈現(xiàn)不平穩(wěn)的特征,為了消除原序列趨勢性和季節(jié)周期性的影響,對其進行差分和季節(jié)差分處理,處理后序列中每個值都圍繞在固定值附近波動,為平穩(wěn)序列,見圖1B。因B型、O型、AB型和總量原始序列也呈現(xiàn)相同特征,故進行了類似處理。
圖1 A型原始序列圖和差分、季節(jié)差分后的序列圖Fig.1 Original sequence diagram of type A and the sequence diagram after the difference and seasonal differences
懸浮紅細胞A型血用量的原始序列存在季節(jié)周期性,故選用季節(jié)乘積模型ARIMA (p,d,q) (P,D,Q) s。A型血原始序列以12個月為1個周期,故s=12;且對其進行了一階差分和一階季節(jié)差分,因此d=1、D=1。繪制A型經過一階差分和一階季節(jié)差分的ACF和PACF圖 (圖2)。根據圖2,初步判斷PACF呈3階截尾特征,p=3;ACF拖尾或截尾特征不明顯,q=0。同時,ACF和PACF在滯后12階均顯著不等于0,故Q=1、P=1。綜上可知,A型識別模型為ARIMA (3,1,0) (1,1,1)12。
A型識別模型的參數(shù)估計與假設檢驗見表1。A型識別模型ARIMA (3,1,0) (1,1,1)12的參數(shù)顯著性檢驗未通過 (P> 0.05)[2],故需重新選定模型。A型ACF在滯后1、5、10、11、12、13階顯著不為0,考慮q取1、5、10、11、12、13;PACF在 滯 后1~3、5、9、10、11、12階顯著不為0,故考慮p取3、5、9、10、11、12;為了將模型考慮得更加全面,嘗試p和q取0的情況。相關學者認為P、D、Q三者取值一般不大于2[3-4],即取0、1或2,并考慮p、q、P、D、Q取不同值的各種模型。將殘差不是白噪聲 (Ljung-Box Q檢驗,P< 0.05) 和參數(shù)顯著性檢驗未通過的模型除去,再根據貝葉斯判定準則[5],最終選定A型的最優(yōu)模型為ARIMA (0,1,1) (0,1,1)12。
與懸浮紅細胞A型識別過程類似,B型、O型、AB型和總用量的最優(yōu)模型分別為ARIMA (0,1,1) (1,0,0)12、ARIMA (0,1,1) (0,1,1)12、ARIMA (0,1,1)(0,1,1)12和ARIMA (3,1,0) (0,1,1)12。各最優(yōu)模型的參數(shù)估計與假設檢驗見表2。
圖2 A型差分、季節(jié)差分后的ACF和PACF圖Fig.2 Autocorrelation function and partial autocorrelation function diagram of type A after the difference and seasonal differences
表1 A型識別模型和最優(yōu)模型參數(shù)估計及假設檢驗Tab.1 Parameter estimation and hypothesis test of the model identified by type A and the optimal model
表2 B、O、AB型和總用量最優(yōu)模型的參數(shù)估計與假設檢驗Tab.2 Parameter estimation and hypothesis test of type B,O,AB and the total optimal model
對懸浮紅細胞ABO各血型用量以及總用量的最優(yōu)模型進行白噪聲檢驗。以A型為例 (圖3),A型殘差序列ACF和PACF均落在95%CI內;且模型殘差序列Ljung-Box Q檢驗結果顯示無統(tǒng)計學意義(統(tǒng)計量為21.736,P> 0.05),說明殘差序列呈白噪聲過程,殘差為隨機性誤差,適用于臨床懸浮紅細胞需求量的預測。B型、O型、AB型和總用量的模型檢驗過程類似,結果顯示均通過白噪聲檢驗。
圖3 A型模型殘差序列ACF圖和PACF圖Fig.3 Autocorrelation function and partial autocorrelation function diagram of the residual sequence of the type A model
應用各最優(yōu)模型對2016年7月至12月每月懸浮紅細胞A型、B型、O型、AB型用量及總用量進行預測,預測值均在95%CI內,并將預測值與同期實際值進行比較,平均相對誤差分別為9.2%、7.5%、4.9%、10.8%、4.3%。以A型為例,模型擬合圖中實際值與預測值變化趨勢吻合度較高 (圖4),B型、O型、AB型和總用量的模型擬合圖特征類似。平均相對誤差在10%左右,說明模型預測結果精度較高,預測擬合效果好。
表3 2016年7月至12月份預測結果Tab.3 The predicted values from July to December 2016
圖4 A型模型擬合效果圖Fig.4 Fitting effect diagram of the type A model
時間序列是一組按照某種時間間隔 (年、月、日、季節(jié)等) 順序排列的實測值。時間序列分析是探究這一組數(shù)據中所反映出來的發(fā)展過程、方向和趨勢,進行類推或延伸,并根據這組數(shù)據資料對未來情況進行預測[6]。ARIMA模型是時間序列分析中最重要的方法之一,該模型能綜合提取時間序列中的趨勢信息以及季節(jié)周期性信息,預測其未來走勢[7],適用于與季節(jié)周期性相關的臨床懸浮紅細胞需求預測。
本研究以重慶市采供血量最大的萬州中心血站為研究對象,運用ARIMA季節(jié)乘積模型方法對該中心血站2006年1月至2016年6月每月懸浮紅細胞ABO各血型用量以及總用量的時間序列數(shù)據進行統(tǒng)計分析并建立模型,然后運用最優(yōu)模型對2016年7月至12月每月懸浮紅細胞ABO各血型用量以及總用量進行預測,預測結果顯示平均相對誤差較小,說明各模型預測精度較高,具有良好的擬合效果,與以往研究結果一致[8-10]。
懸浮紅細胞是一種紅細胞成分血,它能夠提高機體血液運氧能力,改善組織缺氧狀態(tài),但保存期限短 (<35 d)。建立懸浮紅細胞臨床用量ARIMA模型,利于血站科學地制定招募采血計劃,提高血液供需間的契合度,避免區(qū)域性血液資源短缺現(xiàn)象發(fā)生。然而,ARIMA模型是依據歷史數(shù)據進行統(tǒng)計分析并建立的數(shù)學模型,未考慮到其他因素 (國家重大政策出臺、突發(fā)自然災害事件等) 的影響,故ARIMA模型僅適用于短期 (以1年較為恰當[11]) 結果預測。因此,每年應及時補充臨床懸浮紅細胞用量信息,并根據最新數(shù)據重新識別、診斷以選出最優(yōu)模型,從而提高預測精度以及保證擬合效果,及時準確地為臨床用血提供科學依據。