徐彥杰 辛 亮 劉俊卿 李 巖 李世云 王若臻 董恒磊
天津醫(yī)科大學(xué)腫瘤醫(yī)院//國(guó)家腫瘤臨床醫(yī)學(xué)研究中心//天津市“腫瘤防治”重點(diǎn)實(shí)驗(yàn)室//天津市惡性腫瘤臨床醫(yī)學(xué)研究中心 天津 300060
近年來(lái),隨著“互聯(lián)網(wǎng)+醫(yī)療健康”的深入推進(jìn),互聯(lián)網(wǎng)醫(yī)院得到了蓬勃發(fā)展,不僅打破了傳統(tǒng)醫(yī)療服務(wù)的時(shí)間和空間限制,而且對(duì)構(gòu)建以患者為中心的醫(yī)療模式具有重要意義。然而,我國(guó)互聯(lián)網(wǎng)醫(yī)院的建設(shè)仍然面臨著多重挑戰(zhàn)和困境,部分互聯(lián)網(wǎng)醫(yī)院建設(shè)運(yùn)營(yíng)難以持久,國(guó)內(nèi)的互聯(lián)網(wǎng)醫(yī)院研究也主要關(guān)注互聯(lián)網(wǎng)醫(yī)院的推廣,而對(duì)互聯(lián)網(wǎng)運(yùn)行現(xiàn)狀研究尚未有詳盡報(bào)道。為更有效地推動(dòng)互聯(lián)網(wǎng)醫(yī)院高質(zhì)量發(fā)展,本研究將以某腫瘤專(zhuān)科醫(yī)院互聯(lián)網(wǎng)門(mén)診接診現(xiàn)狀數(shù)據(jù)為基礎(chǔ),建立ARIMA模型和GM(1,1)模型,旨在準(zhǔn)確預(yù)測(cè)互聯(lián)網(wǎng)門(mén)診接診的變化趨勢(shì),以便更好地配置醫(yī)療資源,精準(zhǔn)優(yōu)化管理措施,為人民群眾帶來(lái)更多便利。
研究數(shù)據(jù)來(lái)源于某腫瘤專(zhuān)科醫(yī)院2021年1月—2023年6月互聯(lián)網(wǎng)門(mén)診接診數(shù)據(jù)報(bào)表。
1.2.1 ARIMA模型
自回歸移動(dòng)平均模型(autoregressive integrated moving average)簡(jiǎn)稱(chēng)ARIMA(p,d,q) 模型,其中AR是表示自回歸,MA表示滑動(dòng)平均,p為自回歸項(xiàng)數(shù),q為滑動(dòng)平均項(xiàng)數(shù),d代表差分次數(shù)。建模過(guò)程包含以下幾個(gè)步驟:首先,驗(yàn)證序列的平穩(wěn)性,并對(duì)不平穩(wěn)序列進(jìn)行對(duì)數(shù)變換和差分處理使其平穩(wěn);其次,進(jìn)行模型識(shí)別,繪制自相關(guān)圖和偏自相關(guān)圖來(lái)確定階數(shù),提供初步的模型;然后,進(jìn)行參數(shù)估計(jì)和模型診斷,檢驗(yàn)各參數(shù)的統(tǒng)計(jì)學(xué)意義,檢查殘差是否為白噪聲序列;最后,進(jìn)行預(yù)測(cè),將確定的最優(yōu)模型應(yīng)用于實(shí)際預(yù)測(cè)[1-2]。
1.2.2 GM(1,1)模型
GM(1,1)模型是建立在原始數(shù)據(jù)序列基礎(chǔ)上的微分方程模型。該模型通過(guò)后驗(yàn)差比值C和小誤差概率P來(lái)評(píng)估預(yù)測(cè)的準(zhǔn)確性。建模過(guò)程包括以下步驟:首先,計(jì)算原始數(shù)據(jù)序列x(0)的一次累加序列x(1);其次,建立矩陣B和向量y;然后,求逆矩陣(BTB)-1;接下來(lái),根據(jù)μ=(BTB)-1BTy計(jì)算估計(jì)值α和μ,使用時(shí)間響應(yīng)方程計(jì)算擬合值α(-1)(i),進(jìn)行后退運(yùn)算還原;最后,進(jìn)行精度檢驗(yàn)和預(yù)測(cè)[3-4]。
本研究采用平均絕對(duì)誤差(mean absolute error, MAE)和均方根誤差(root mean square error, RMSE)作為評(píng)價(jià)指標(biāo),用于比較ARIMA模型和GM(1,1)模型的預(yù)測(cè)結(jié)果。
(1) 平均絕對(duì)誤差(MAE):
(2) 均方根誤差(RMSE):
本研究使用OFFICE 2022對(duì)2021年1月—2023年6月互聯(lián)網(wǎng)門(mén)診接診比例與互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例進(jìn)行統(tǒng)計(jì);使用R軟件建立ARIMA與GM(1,1)模型;使用統(tǒng)計(jì)學(xué)方法進(jìn)行檢驗(yàn)和評(píng)估,檢驗(yàn)水準(zhǔn)α=0.05。
2021年1月—2023年6月,互聯(lián)網(wǎng)門(mén)診接診比例與互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例呈波動(dòng)上升趨勢(shì),相較于2021年1月,2023年6月互聯(lián)網(wǎng)門(mén)診接診比例增加了14.25%,年均增長(zhǎng)率5.70%;互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例增加了13.72%,年均增長(zhǎng)率5.49%。見(jiàn)圖1和圖2。
圖2 2021年1月—2023年6月互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例變化趨勢(shì)
2.2.1 原始數(shù)據(jù)處理和平穩(wěn)性檢驗(yàn)
通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行處理和平穩(wěn)性檢驗(yàn),發(fā)現(xiàn)門(mén)互聯(lián)網(wǎng)診接診比例X和互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例Y均為非穩(wěn)定序列,進(jìn)行差分平穩(wěn)化。D(X)序列一階差分、D(Y)序列一階差分后ADF檢驗(yàn)P值小于0.05,表明序列已平穩(wěn)。見(jiàn)表1和表2。
表1 互聯(lián)網(wǎng)門(mén)診接診比例(X)序列平穩(wěn)性檢驗(yàn)結(jié)果
表2 互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例(Y)序列平穩(wěn)性檢驗(yàn)結(jié)果
2.2.2 模型參數(shù)確定
對(duì)于序列D(X),經(jīng)過(guò)差分運(yùn)算后已成為平穩(wěn)序列,為確定最優(yōu)模型,使用赤池信息準(zhǔn)則(AIC)和貝葉斯信息準(zhǔn)則(BIC),綜合比較均方根誤差(RMSE)、AIC和BIC,從中選取參數(shù)值,最終得到最優(yōu)模型ARIMA(1,1,2)。通過(guò)最小二乘法對(duì)D(X)序列進(jìn)行參數(shù)估計(jì),得到如下模型:Δyt=0.7292Δyt-1+εt-1.7639εt-1+εt-2。見(jiàn)表3。
表3 互聯(lián)網(wǎng)門(mén)診接診比例ARIMA模型檢驗(yàn)
同理D(Y)序列的原始序列經(jīng)過(guò)差分運(yùn)算后已成平穩(wěn)序列,根據(jù)赤池信息準(zhǔn)則(AIC)和貝葉斯信息準(zhǔn)則(BIC)選取最優(yōu)參數(shù)值,通過(guò)綜合比較均方根誤差(RMSE)、BIC和AIC最小者,獲得最優(yōu)模型ARIMA(0,1,1)。通過(guò)最小二乘法對(duì)模型D(Y)序列進(jìn)行參數(shù)估計(jì),模型為Δyt=0.0047+εt-0.3719εt-1。見(jiàn)表4。
表4 互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例ARIMA模型檢驗(yàn)
2.2.3 模型的白噪聲檢驗(yàn)
對(duì)擬合模型殘差序列進(jìn)行白噪聲檢驗(yàn)就是檢驗(yàn)其適應(yīng)性,若序列不是白噪聲則表明仍有信息未提取。通過(guò)畫(huà)QQ與其加線(xiàn)圖的擬合度來(lái)判斷殘差是否服從正態(tài)分布,然后再對(duì)擬合模型的殘差白噪聲檢驗(yàn)進(jìn)一步判斷殘差之間是否相關(guān)。
互聯(lián)網(wǎng)門(mén)診接診比例采用擬合模型ARIMA(1,1,2)生成殘差序列的QQ與其加線(xiàn)圖。見(jiàn)圖3。模型的殘差服從正態(tài)分布且Ljung-Box檢驗(yàn)P值為0.72,大于0.05,殘差序列不存在自相關(guān),為白噪音,因此,該模型是適合的模型。
圖3 互聯(lián)網(wǎng)門(mén)診接診比例ARIMA模型的QQ與其加線(xiàn)圖
2.2.4 模型預(yù)測(cè)
根據(jù)以上檢驗(yàn)結(jié)果,可以得出結(jié)論:ARIMA模型能夠準(zhǔn)確地?cái)M合原始數(shù)據(jù)。分別采用ARIMA(1,1,2)和ARIMA(0,1,1)模型對(duì)2021年1月—2023年6月互聯(lián)網(wǎng)門(mén)診接診比例與互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例進(jìn)行預(yù)測(cè),殘差在0上下浮動(dòng),這表明擬合值與實(shí)際值相近。預(yù)測(cè)結(jié)果見(jiàn)表5。
互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例采用擬合模型ARIMA(0,1,1)生成殘差序列的QQ與其加線(xiàn)圖,見(jiàn)圖4。模型的殘差服從正態(tài)分布且Ljung-Box檢驗(yàn)P值為0.23,大于0.05,殘差序列不存在自相關(guān),該序列為白噪音序列,該模型是適合的模型。
圖4 互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例ARIMA模型的QQ與其加線(xiàn)圖
通過(guò)灰色GM(1,1)預(yù)測(cè)模型的建模步驟,得到互聯(lián)網(wǎng)門(mén)診接診比例的灰色預(yù)測(cè)模型表達(dá)式如下:
對(duì)預(yù)測(cè)模型進(jìn)行精度檢驗(yàn),方差比C檢驗(yàn)為0.300 2,小概率誤差P為0.966 7,表明預(yù)測(cè)精度等級(jí)為好,因此該模型可用于預(yù)測(cè)某腫瘤專(zhuān)科醫(yī)院互聯(lián)網(wǎng)門(mén)診接診比例。
同樣地,建立互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例的灰色預(yù)測(cè)模型表達(dá)式如下:
對(duì)預(yù)測(cè)模型進(jìn)行精度檢驗(yàn),方差比C檢驗(yàn)為0.181 8,小概率誤差P為0.999 9,表明預(yù)測(cè)精度等級(jí)為好,因此該模型可用于預(yù)測(cè)某腫瘤專(zhuān)科醫(yī)院互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例。
采用上述GM(1,1)模型對(duì)2021年1月—2023年6月互聯(lián)網(wǎng)門(mén)診接診比例與互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見(jiàn)表6。從表可知,互聯(lián)網(wǎng)門(mén)診接診比例實(shí)際值與預(yù)測(cè)值結(jié)果的殘差多大于0,說(shuō)明擬合值總體小于實(shí)際值;互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例實(shí)際值與預(yù)測(cè)值結(jié)果的殘差多小于0,說(shuō)明擬合值總體大于實(shí)際值。
通過(guò)比較模型的平均絕對(duì)誤差MAE、均方根誤差RMSE兩個(gè)誤差指標(biāo)可見(jiàn),ARIMA模型比GM(1,1)模型誤差值小,因此ARIMA模型更適用于互聯(lián)網(wǎng)接診現(xiàn)狀的預(yù)測(cè)。見(jiàn)表7。
表7 模型預(yù)測(cè)效果比較
互聯(lián)網(wǎng)門(mén)診接診比例指醫(yī)生接診人次占患者掛號(hào)人次的比例,此項(xiàng)指標(biāo)受多種因素的影響,一方面是患者掛號(hào)后經(jīng)醫(yī)生評(píng)估不適宜在互聯(lián)網(wǎng)就診,醫(yī)生給與主動(dòng)退號(hào)處理;另一方面是在規(guī)定的接診時(shí)間內(nèi),醫(yī)生沒(méi)有及時(shí)接診系統(tǒng)自動(dòng)退號(hào)處理。通過(guò)監(jiān)測(cè)此項(xiàng)指標(biāo),①有助于醫(yī)院加強(qiáng)智能導(dǎo)診功能建設(shè),引導(dǎo)患者準(zhǔn)確找到相應(yīng)學(xué)科醫(yī)生及時(shí)就醫(yī);②有助于醫(yī)院制定相應(yīng)政策并加強(qiáng)互聯(lián)網(wǎng)門(mén)診管理,提升醫(yī)生接診的積極性,降低退號(hào)比例。互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例主要反映線(xiàn)上線(xiàn)下醫(yī)療服務(wù)融合程度及互聯(lián)網(wǎng)門(mén)診應(yīng)用的規(guī)模,用于評(píng)估互聯(lián)網(wǎng)醫(yī)療服務(wù)推廣應(yīng)用情況,通過(guò)監(jiān)測(cè)此項(xiàng)指標(biāo),有助于醫(yī)院及時(shí)調(diào)整互聯(lián)網(wǎng)醫(yī)療服務(wù)策略和優(yōu)化醫(yī)院資源配置。同時(shí),互聯(lián)網(wǎng)門(mén)診接診比例和互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例會(huì)隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及而發(fā)生變化,因此,醫(yī)院需要建立持續(xù)的監(jiān)測(cè)機(jī)制,全面地掌握互聯(lián)網(wǎng)門(mén)診接診現(xiàn)狀,助力醫(yī)院制定更具針對(duì)性的戰(zhàn)略和政策,以滿(mǎn)足患者和醫(yī)生的需求,推動(dòng)互聯(lián)網(wǎng)醫(yī)院高質(zhì)量發(fā)展。
在醫(yī)學(xué)領(lǐng)域,時(shí)間序列分析模型扮演著重要角色,其中ARIMA模型和GM(1,1)模型在疫情預(yù)測(cè)、疾病發(fā)展預(yù)測(cè)、藥物銷(xiāo)售預(yù)測(cè)以及醫(yī)療資源優(yōu)化等領(lǐng)域的預(yù)測(cè)廣受歡迎[5-6]。針對(duì)這兩個(gè)模型,本研究以某腫瘤專(zhuān)科醫(yī)院2021年1月—2023年6月的數(shù)據(jù)為基礎(chǔ),分別運(yùn)用ARIMA和GM(1,1)模型,預(yù)測(cè)了互聯(lián)網(wǎng)門(mén)診接診比例以及互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診的比例,并對(duì)預(yù)測(cè)結(jié)果進(jìn)行深入比較與分析。實(shí)證研究顯示,在互聯(lián)網(wǎng)門(mén)診接診比例預(yù)測(cè)中,ARIMA模型和GM(1,1)模型表現(xiàn)相近,平均絕對(duì)誤差分別為2.06%和2.41%,均方根誤差則分別為3.01%和3.17%。在互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例的預(yù)測(cè)中,ARIMA模型顯著優(yōu)于GM(1,1)模型,平均絕對(duì)誤差為0.58%,后者為1.08%,對(duì)應(yīng)的均方根誤差分別為0.75%和1.31%。這一結(jié)論與過(guò)去的研究一致,再次證實(shí)了ARIMA模型在預(yù)測(cè)精度上的優(yōu)勢(shì)[7-10]。
在對(duì)比兩個(gè)模型的預(yù)測(cè)結(jié)果時(shí),可以明顯地觀察到ARIMA模型具有更高準(zhǔn)確性。這一優(yōu)越性源于ARIMA模型精妙地結(jié)合了自回歸和移動(dòng)平均的方法,從而更好地捕捉數(shù)據(jù)的趨勢(shì)和季節(jié)性變化。相反,盡管GM(1,1)模型運(yùn)用了灰色理論,考慮了數(shù)據(jù)的發(fā)展趨勢(shì),但對(duì)于較為復(fù)雜的時(shí)間序列數(shù)據(jù),其預(yù)測(cè)精度顯然不及ARIMA模型[11-20]。
本研究采用ARIMA模型對(duì)互聯(lián)網(wǎng)接診現(xiàn)狀進(jìn)行預(yù)測(cè),2023年12月,互聯(lián)網(wǎng)門(mén)診接診比例為90.35%,互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診的比例將達(dá)16.46%。從整體趨勢(shì)來(lái)看,2021—2023年某腫瘤專(zhuān)科醫(yī)院互聯(lián)網(wǎng)接診比例呈現(xiàn)持續(xù)穩(wěn)定趨勢(shì),互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例呈現(xiàn)持續(xù)上升的趨勢(shì)。這一結(jié)果受多種因素影響,包括互聯(lián)網(wǎng)醫(yī)療服務(wù)的逐步完善和普及、信息技術(shù)快速發(fā)展、患者行為和態(tài)度的變化、新冠疫情爆發(fā)的影響、法規(guī)政策和醫(yī)療體系的支持等。互聯(lián)網(wǎng)門(mén)診接診比例通過(guò)前期管理,已經(jīng)達(dá)到相對(duì)穩(wěn)定趨勢(shì)。未來(lái),隨著互聯(lián)網(wǎng)醫(yī)院的建設(shè)逐漸完善,互聯(lián)網(wǎng)醫(yī)療服務(wù)將更好地滿(mǎn)足了患者需求,互聯(lián)網(wǎng)門(mén)診人次占線(xiàn)下門(mén)診比例將呈現(xiàn)逐步上升趨勢(shì)。