趙欽康 李越
住院患者量是評價一個醫(yī)院或?qū)I(yè)科室醫(yī)療工作的重要指標,直接或間接地反映出一個醫(yī)院或?qū)I(yè)科室的規(guī)模、醫(yī)療質(zhì)量及醫(yī)療水平[1]。因此,了解一個醫(yī)院或?qū)I(yè)科室住院患者量的變化情況并進行有效預(yù)測,對于合理安排資源、提高醫(yī)療工作效率意義重大。季節(jié)性自回歸移動平均(seasonal autoregressive integrated moving average, SARIMA)模型廣泛應(yīng)用于疾病發(fā)病率及醫(yī)院患者量的預(yù)測[2],且可針對患者量數(shù)據(jù)的特殊性進行分析[3]。國內(nèi)目前已有關(guān)于將SARIMA模型用于醫(yī)院住院患者量的研究,且具有良好的預(yù)測效果,能夠幫助捕捉住院患者數(shù)量月份變化的低谷和高峰[1]。本研究將SARIMA模型運用于骨折住院患者量的短期預(yù)測,探索山西省汾陽醫(yī)院骨折住院患者量的季節(jié)變動規(guī)律及未來趨勢,并將其與實際患者量比較,以評估SARIMA模型能否預(yù)測“未來”骨折住院患者量,為合理安排醫(yī)療資源和提高工作效率提供參考,同時也可為骨折防治措施的制定提供依據(jù)。
選擇2017年6月至2022年3月山西省汾陽醫(yī)院收治的骨折住院患者。納入標準:以骨折為主要診斷或多發(fā)性損傷包括骨折的患者。排除標準:①臨床資料不完整的患者;②復(fù)診患者。
收集研究對象的人口學資料和臨床資料,對研究對象的人口學資料和臨床資料進行統(tǒng)計描述。分類變量用例數(shù)(百分比,%)表示,組間比較用卡方檢驗;年齡作為連續(xù)型變量,用均數(shù)±標準差表示,采用t檢驗比較多組間差異。
根據(jù)時間繪制住院患者量的時間序列圖,通過tseries包的stl()函數(shù)將原時間序列分解為長期趨勢(trend)、季節(jié)變動(seasonal fluctuation)、不規(guī)則波動(irregular variations)并繪圖展示。使用單位根檢驗進行時間序列的平穩(wěn)性分析,非平穩(wěn)序列時進行轉(zhuǎn)換后分析。根據(jù)平穩(wěn)時間序列,識別繪制新序列自相關(guān)函數(shù)(auto-correlation function, ACF)圖和偏自相關(guān)函數(shù)(partial auto-correlation function, PACF)圖,判斷模型類型。
將2018年1月至2021年7月的數(shù)據(jù)作為訓(xùn)練集,建立SARIMA (p,d,q)(P,D,Q)s模型,對2021年8月至2022年3月收治的患者量進行短期定量預(yù)測,生成預(yù)測集,并將其與實際收治量比較以驗證SARIMA模型預(yù)測效果。首先,通過forecast包的auto.arima()函數(shù)自動擬合SARIMA模型,生成相應(yīng)的赤池信息準則(Akaike information criterion,AIC)值和貝葉斯信息準則(Bayesian information criterion,BIC)值,以確定參數(shù)p、q、P、Q值的最佳組合。其次,對模型擬合結(jié)果進行白噪聲檢驗,并計算均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE),檢查模型的性能,并用預(yù)測集的預(yù)測值和實際值來驗證預(yù)測準確度。
采用Excel 2010對數(shù)據(jù)進行收集整理,R 3.5.2軟件的tseries、forecast軟件包對數(shù)據(jù)進行統(tǒng)計分析。
如表1所示,共納入2 563例患者,其中男性1 556例,女性1 007例,男女比值為1.55;平均年齡53.43歲,男性患者平均年齡(47.61歲)比女性患者(62.42歲)更低,相差14.81歲,差異有統(tǒng)計學意義(t= -17.798,P< 0.001)。根據(jù)骨骼生長發(fā)育的年齡情況分組:≤20歲組226例(8.82%),21 ~ 40歲組444例(17.32%),> 40歲組1 893例(73.86%)。根據(jù)男女退休年齡分組:未退休組(男≤60歲,女≤55歲)1 440例(56.18%),退休組(男 > 60歲,女 > 55歲)1 123例(43.82%)。兩種年齡分組患者性別比的差異有統(tǒng)計學意義(P< 0.001),且男性年輕患者和女性年老患者更多。
表1 不同性別研究對象特征比較
2 563例患者中因下肢、足部骨折而住院的數(shù)量最多,占53.06%,骨折部位的比例依次為股骨(59.85%)、足踝部(22.50%)和脛腓骨(15.00%),其他占比均較小。其次為因上肢、手部骨折住院的患者(18.37%),其中尺橈骨和肱骨骨折最為多見,各占42.25%和50.53%。因頸、胸、腰椎骨折住院的患者(12.41%)排第3。不同原因住院患者性別比的差異有統(tǒng)計學意義(P<0.001),女性因下肢、足部住院的患者占比(57.49%)高于男性患者的比例(50.19%),尤其是股骨骨折的患者居多(78.58%),而男性患者股骨骨折僅占因下肢、足部住院的45.97%。足踝部骨折的男女比值最大,為5.24,可見男性更容易因足踝部受傷而住院;相反,股骨骨折的男女比值最小,為0.79,可見女性更容易因股骨受傷而住院。
選取2018年1月至2021年12月山西省汾陽醫(yī)院骨折住院患者共2 216例,繪制住院患者量情況的時間序列圖,見圖1??梢钥吹交颊吡靠傮w呈上升趨勢,且存在較為明顯的季節(jié)周期,月住院患者數(shù)季節(jié)波動幅度較大,且單位根檢驗提示該序列為非平穩(wěn)時間序列(P=0.337)。
圖1 骨折住院患者量情況的時間序列
為更直觀地觀察原序列特征,通過stl()函數(shù)將原時間序列分解為長期趨勢、季節(jié)變動、不規(guī)則波動,結(jié)果見圖2。住院患者量的時間序列的季節(jié)變動明顯,每年有2個高峰期,即5月和8月;時間序列顯示有明顯上升趨勢;不規(guī)則波動提示存在除趨勢、季節(jié)性外的偶然性波動。
圖2 原時間序列的分解(長期趨勢、季節(jié)變動、不規(guī)則波動)
根據(jù)以上分析,原序列為非平穩(wěn)序列,故首先進行l(wèi)og10對數(shù)轉(zhuǎn)換;由圖1和圖2可知,該序列住院患者量的季節(jié)性明顯,故再進行一階差分。差分后單位根檢驗提示該序列為平穩(wěn)時間序列(P=0.049),可認為該時間序列通過一階差分后達到平穩(wěn)序列,且該序列的ACF圖、PACF圖是拖尾的,見圖3,則序列適合自回歸移動平均(auto-regressive moving average, ARMA)模型。通過auto.arima()函數(shù)對訓(xùn)練集自動擬合SARIMA (p,d,q)(P,D,Q)s模型,得到SARIMA (0, 0, 1)(1, 0, 0)12,模型參數(shù)AIC=11.94,BIC=18.89。通過Box.test()函數(shù)對擬合模型進行白噪聲檢驗,結(jié)果為P=0.806,殘差為白噪聲,可認為模型中的隨機誤差項序列無異方差,不用考慮其異方差性對于預(yù)測精度的影響。
圖3 轉(zhuǎn)換后時間序列的ACF圖和PACF圖
將原序列分為訓(xùn)練集(2018年1月至2021年7月)和預(yù)測集(2021年8月至2022年3月),采用SARIMA(0, 0, 1)(1, 0, 0)12模型對未來骨折住院患者量情況進行短期定量預(yù)測,結(jié)果RMSE=0.24,MAPE=149.61。如表2所示,平穩(wěn)序列中各月的實際值與預(yù)測值不完全一樣,但各月實際值都落入了預(yù)測值的80%可信區(qū)間內(nèi),相對誤差范圍在1.81% ~8.60%之間。根據(jù)平穩(wěn)序列的預(yù)測值換算后,原始序列中各月的實際住院患者量與預(yù)測值接近,且相對誤差范圍在1.52% ~ 3.39%之間,可以看出模型預(yù)測值的動態(tài)趨勢與實際情況基本一致,模型對未來的情況進行了很好的跟蹤和預(yù)測。
表2 SARIMA (0, 0, 1)(1, 0, 0)12模型預(yù)測2021年8月至2022年3月骨折住院患者量
在醫(yī)院或?qū)I(yè)科室的科學管理中,要有效提高管理水平,就要制定具有科學性和實踐性的計劃,而用統(tǒng)計預(yù)測數(shù)據(jù)制定工作計劃,可避免主觀盲目性,且具有較強的可操作性[4-5]。住院患者量是醫(yī)院或?qū)I(yè)科室醫(yī)療工作的重要評價指標,醫(yī)院或?qū)I(yè)科室管理者可根據(jù)科學準確的住院患者量預(yù)測值,提前安排有關(guān)工作,合理配置人力、物力資源,實現(xiàn)醫(yī)院或科室效益最優(yōu)化[6]。時間序列方法考慮對象本身的歷史數(shù)據(jù)隨時間發(fā)展變化的規(guī)律,并用該變量以往的資料建立統(tǒng)計模型做預(yù)測,在醫(yī)療衛(wèi)生領(lǐng)域有廣闊的應(yīng)用前景。由于該法用于門診、住院等醫(yī)院管理相關(guān)指標預(yù)測的突出優(yōu)點,已有很多衛(wèi)生工作者將該法應(yīng)用于醫(yī)院管理、疾病控制等領(lǐng)域[3,7-8],其在前瞻性預(yù)測方面有可靠的應(yīng)用價值。SARIMA (p,d,q)(P,D,Q)s模型作為一種應(yīng)用廣泛的時間序列模型,其預(yù)測精確度較高,用于中短期預(yù)測效果較好,可以同時處理有周期性、季節(jié)性波動的資料[9],與傳統(tǒng)的時間序列模型相比更具優(yōu)勢[10]。通過構(gòu)建SARIMA(0, 0, 1)(1, 0, 0)12模型,對山西省汾陽醫(yī)院2021年8月至2022年3月骨折住院患者量進行預(yù)測分析和建模擬合。結(jié)果顯示,骨折住院患者量存在季節(jié)變動和長期增長趨勢,且模型預(yù)測值的動態(tài)趨勢與實際情況基本一致,平均相對誤差小于10%,表明利用SARIMA模型預(yù)測山西省某三級醫(yī)院骨折住院患者量變動水平的可行性,具有良好的應(yīng)用價值,有助于研究醫(yī)院住院患者量的時間特點,有助于合理安排醫(yī)院的醫(yī)療資源和提高工作效率,同時可根據(jù)季節(jié)變動特點和長期增長趨勢為骨折防治措施的制定提供參考和依據(jù)。
此外,觀察原始時間序列可以發(fā)現(xiàn)2020年2月出現(xiàn)骨折住院患者量的急劇下降,也是整個住院患者量的最低值所在時間點,考慮是新冠疫情的影響。該突發(fā)公共衛(wèi)生事件的發(fā)生導(dǎo)致醫(yī)院的管理重心轉(zhuǎn)移至傳染病的診斷治療,同時也由于疫情影響,居民外出活動大幅減少,因此骨折住院患者量明顯下降,導(dǎo)致模型分析出現(xiàn)一定的混雜偏倚。但是,除了2020年2月,其他年份的12月至次年2月(冬春季)仍然存在一個住院患者量下降的情況,因此,預(yù)測分析也符合季節(jié)性的基本特征,說明使用SARIMA模型預(yù)測具有一定的可行性。
通過對山西省某三級醫(yī)院骨折住院患者量的預(yù)測,在一定程度上可以幫助醫(yī)院或科室對成本進行有效的控制,充分利用現(xiàn)有的配置,不斷優(yōu)化醫(yī)療資源的使用結(jié)構(gòu)。本研究通過SARIMA模型的時間序列分析,發(fā)現(xiàn)山西省某三級醫(yī)院骨折住院患者量有不斷上升的趨勢,呈現(xiàn)出季節(jié)波動的特征,每年有2個高峰期,即5月和8月。建議醫(yī)院及骨科科室應(yīng)根據(jù)變化波動的規(guī)律特點,合理調(diào)整現(xiàn)有床位分布結(jié)構(gòu),科學分配醫(yī)護資源,制定合適的值班制度,并按照季節(jié)不同,進行相應(yīng)的調(diào)整,改變科室永久不變的現(xiàn)狀。
既往研究顯示,每月的骨折住院病例數(shù)會隨日照時間增加而升高[11],且目前大多數(shù)研究通過減少戶外運動場所的暴露機會進行骨折預(yù)防[12-14],然而針對骨折季節(jié)性因素的研究較為有限,對骨折高發(fā)期的預(yù)防措施可能存在不足。本研究顯示,山西省某三級醫(yī)院骨折住院患者量每年有5月和8月2個高峰期,這可能與當?shù)氐臍夂驐l件有關(guān),因5月和8月氣溫適宜、陽光充足,戶外活動時間較長,因此,發(fā)生骨折的風險也更高。為預(yù)防骨折,減少骨折隱患,應(yīng)該加強看護并學習相關(guān)急救知識,在戶外活動前確認安全性和可能帶來的傷害,實現(xiàn)一級預(yù)防;及時采取二級預(yù)防措施,在意外發(fā)生時有效處理,及時送醫(yī)院救治,通過三級預(yù)防減少骨折帶來的傷害。
骨折目前已成為全球公共衛(wèi)生問題,2019年全球疾病、傷害和風險因素負擔研究(the Global Burden of Diseases, Injuries, and Risk Factors Study,GBD)結(jié)果顯示,2019年全球骨折新發(fā)病例數(shù)為1.78億,累積病例數(shù)為4.45億[15]。有研究發(fā)現(xiàn),骨折的發(fā)病率有逐年增加的趨勢[16],在各年齡階段,男性骨折發(fā)生率均比女性更高[17-18],這與本研究結(jié)果相符,考慮主要與男性的工作性質(zhì)和社會特性有關(guān)。骨折患者中大于40歲的患者占73.86%,與國內(nèi)研究結(jié)果基本符合[19-21]。隨著年齡增長,骨鈣不斷丟失,骨量逐漸減少,骨骼出現(xiàn)骨質(zhì)疏松而容易發(fā)生骨折[22],因此,可通過減少年長者獨自戶外活動,在骨折發(fā)生的高峰期加強年長者的監(jiān)護,減少暴露于骨折危險因素的機會。
一是雖然SARIMA模型對于中、短期預(yù)測精度和準確度較高,且運用廣泛,但在進行更長期預(yù)測時會有較大誤差。本研究僅對2017年6月至2022年3月山西省某三級醫(yī)院骨折住院患者量進行了分析,樣本量和時間長度有限,在一定程度上會影響模型的預(yù)測效果。為保證預(yù)測準確度,發(fā)揮遠期預(yù)測作用,未來模型需要不斷納入更新的數(shù)據(jù)。二是在建模方法上,本研究采用自動擬合的方式,但在實際運用中可能出現(xiàn)自動擬合結(jié)果與傳統(tǒng)建模最優(yōu)結(jié)果存在差異的情況,若自動擬合的模型預(yù)測效果不佳,可以改用傳統(tǒng)建模步驟,檢驗?zāi)P偷南鄬?yōu)勢,分析出現(xiàn)差異的原因,再進行模型優(yōu)化。三是本研究分析預(yù)測住院患者數(shù)量時只考慮了時間序列本身的特性,未考慮諸如個體因素、心理行為因素、既往骨折史等因素的影響,為更好地發(fā)揮模型的實際應(yīng)用價值,在今后的研究中需要納入影響患者骨折的各項因素進行綜合分析。四是本研究預(yù)測分析只涉及地處我國北方的山西省汾陽醫(yī)院,骨折住院患者量的季節(jié)性變動受到地域的影響會產(chǎn)生偏倚,后期需要收集各地域醫(yī)院骨科住院患者量再進行地域分析,使模型的預(yù)測結(jié)果可適用于不同地域的醫(yī)院管理中。
志謝 感謝山西省汾陽醫(yī)院骨科提供的住院患者病案首頁數(shù)據(jù)支持。