河南省人民醫(yī)院(450000) 和 融
基于Joinpoint回歸模型的住院量實證分析
河南省人民醫(yī)院(450000) 和 融
目的對醫(yī)院住院量進行Joinpoint回歸分析的實證研究。方法應用SAS 9.3軟件確定數(shù)據(jù)分析方法,應用Joinpoint回歸分析軟件建立Joinpoint回歸預測模型。結果該院住院患者人次數(shù)據(jù)為非正態(tài)分布W=0.69,P<0.01,呈現(xiàn)指數(shù)趨勢,應用非線性回歸模型;Joinpoint回歸分段點為1989年、1995年、2001年、2007年和2013年,5個分段點的假設檢驗(P<0.05)具有統(tǒng)計學意義;根據(jù)Joinpoint回歸方程預測2016-2020年住院量為189119,201119,213881,227452,241885。結論Joinpoint回歸分析可用于醫(yī)院管理數(shù)據(jù)的分析與預測,且擬合效果較好;醫(yī)院需進一步優(yōu)化服務流程,應對住院患者人數(shù)的變化。
Joinpoint 回歸分析 入院人次 醫(yī)院管理
醫(yī)院住院量是醫(yī)院重要的工作量指標,也是醫(yī)院發(fā)展決策中的重要輔助信息。有必要通過科學的統(tǒng)計模型,擬合住院患者人次數(shù)的歷史演變規(guī)律來推測未來情況。
本文所用數(shù)據(jù)來源于某院統(tǒng)計臺賬及HIS系統(tǒng),獲得該院1979-2015年的住院量,所選數(shù)據(jù)的質(zhì)量真實可靠,具體數(shù)據(jù)見表1。
表1 某院1979-2015年住院量
(1)模型介紹
Joinpoint(以下簡稱JP)回歸模型是由Kim等于2000年提出[1],其基本思想是將一個長期趨勢線分成若干段,每段用連續(xù)性的線性進行描述。JP可用于對數(shù)據(jù)的分段線性回歸來總結分析腫瘤的趨勢變化,并被美國國立癌癥研究所推薦使用,應用JP分析軟件JoinpointVersion 4.2進行JP回歸分析。
(2)模型表達式
JP回歸模型又稱片段回歸(piecew ise regression),線段回歸(broken-line regression)或多階段回歸(multi-phase regression),對數(shù)據(jù)序列本身是否存在明顯趨勢等并沒有要求,越來越多地應用于確定時間序列數(shù)據(jù)的變化程度分析[2]。JP回歸模型分為線性數(shù)據(jù)模型與非線性數(shù)據(jù)模型[3],見公式(1)和(2)。
線性數(shù)據(jù)模型:
非線性數(shù)據(jù)模型:
xi(i=1,2,…,n)為自變量;yi(i=1,2,…,n)為因變量;β0表示不變參數(shù),β1表示斜率參數(shù)(回歸系數(shù));δn=βn+1,1-βn,1表示分段函數(shù)的回歸系數(shù);τ是未知的線段分段點,如果(xi-τn)>0,那么(xi-τn)+=(xi-τn);否則(xi-τn)+=0。
(3)分段點與模型檢驗
應用網(wǎng)格檢索法[4](the grid search method,GS)進行數(shù)據(jù)分段點數(shù)量的選擇和檢驗時,JP分析軟件默認數(shù)據(jù)量與分段點數(shù)量的對照選擇見表2[5]。
表2 數(shù)據(jù)與默認分段點間對應表
JP分析軟件采用Z檢驗進行分段點的假設檢驗,以確定數(shù)據(jù)是否有足夠的證據(jù)來添加多少個分段點[6]。假定無任何分段點,即H0:0個分段點,則原數(shù)據(jù)可以用簡單線性回歸進行描述為 E[y|x]=β0+β1x;備擇假設為有n個分段點,即H1:有n個分段點,則原數(shù)據(jù)描述為 E[yi|xi]=β0+β1xi+δ1(xi-τ1)++…+δn(xi-τn)+。如果拒絕 H0,再檢驗有1個分段點與n個分段點差異是否有統(tǒng)計學意義,以此類推。非線性數(shù)據(jù)回歸模型檢驗類似。
37個歷史數(shù)據(jù)的散點圖可發(fā)現(xiàn)數(shù)據(jù)呈現(xiàn)指數(shù)發(fā)展趨勢。見圖1。
圖1 散點圖
應用SAS 9.3軟件對數(shù)據(jù)進行正態(tài)性檢驗,其自身分布(W=0.69,P<0.01)以及殘差(W=0.85,P<0.01)的檢驗表明,數(shù)據(jù)并不滿足正態(tài)分布,不適用于線性數(shù)據(jù)回歸模型。故在JP回歸分析中采用非線性數(shù)據(jù)回歸模型。
JP分析將原數(shù)據(jù)序列分為5個分段點(1989年、1995年、2001年、2007年和2013年)和6個不同的階段(1978-1988年、1989-1994年、1995-2000年、2001-2006年、2007-2012年和2013-2015年)。
JP分析軟件計算出數(shù)據(jù)進行JP回歸的各項參數(shù),根據(jù)JP回歸模型的公式與參數(shù)解釋,可得該數(shù)據(jù)的JP回歸表達式為:
分段點分別為 1989年(P=0.0002)、1995年(P=0.0002)、2001年(P=0.0002)、2007年(P=0.0002)、2013年(P=0.004)。故拒絕原假設,5個分段點具有統(tǒng)計學意義。
由回歸公式得到該院1979-2015年住院量的擬合值,見表3。
表3 住院量實際值與JP擬合值比較
根據(jù)預測的精度要求:長期預測(5~10年的預測期)相對誤差在30%~40%,中期預測(1~5年的預測期)相對誤差在10%~20%,屬正常范圍[7]。表2中的平均相對誤差為1.94%,符合相關要求。JP回歸預測醫(yī)院住院量模型可信,可用于外推預測。JP回歸預測2016-2020年住院量依次為:189119、201119、213881、227452、241885。
傳統(tǒng)的模型如線性模型或曲線模型只能預測一種趨勢,時間序列方法也存在種種局限。JP模型除應用于分析癌癥死亡率和發(fā)病率的連續(xù)變化趨勢[8],同樣可以應用于任何時間序列數(shù)據(jù)的分析,也可以適用于醫(yī)院管理與決策,根據(jù)醫(yī)院數(shù)據(jù)的趨勢分析對發(fā)展做出決策。本文實證分析了JP回歸可被應用于醫(yī)院管理數(shù)據(jù)的分析與預測,且擬合度較好,分析結果和角度較新穎、深入,結果可被醫(yī)院管理者采用以及作為輔助決策信息。JP回歸應用專業(yè)分析軟件,降低了其計算和分析難度;JP分析軟件操作簡單,便于醫(yī)院管理者在數(shù)據(jù)分析中進行應用。
只有在深入分析分段點產(chǎn)生的背景和原因后,才能更明晰影響醫(yī)院發(fā)展的因素,保證醫(yī)院平穩(wěn)、健康的發(fā)展。國務院于1992年9月下發(fā)了《關于深化衛(wèi)生改革的幾點意見》,提出要進行醫(yī)院的市場化,該院1993年開辦了分院開展醫(yī)療服務;2001年,該院當年開放床位數(shù)較前一年度增長了23.6%,達到1341張,有能力收治更多的患者;2007年1月原衛(wèi)生部披露醫(yī)改的新方案;2013年該院所在省份開始執(zhí)行新農(nóng)合醫(yī)保政策,規(guī)定省級醫(yī)院新農(nóng)合起付線為3000元,報銷補償比例為45%和65%,遠低于縣級醫(yī)院起付線500元,報銷補償比例80%[9]。
根據(jù)JP回歸分析結果,該院自2007年起開始進入快速發(fā)展階段,但2013年后發(fā)展速度放緩。2015年9月11日國務院辦公廳發(fā)布《關于推進分級診療制度建設的指導意見》,明確指出到2017年實現(xiàn)分級診療體系[10],可以預見的是,住院量的增長速度放緩,甚至會出現(xiàn)下降。醫(yī)院在現(xiàn)有的規(guī)模和社會環(huán)境下,需要做好準備,以應對這種變化,如適時調(diào)整床位,優(yōu)化病房結構[11];主動參與區(qū)域分級診療的構建,特別是實行高血壓、糖尿病、腫瘤等診斷明確、病情穩(wěn)定的慢性病患者在基層醫(yī)療機構實施治療,必要時成立縱向相聯(lián)的醫(yī)療集團,以確保區(qū)域影響力的持續(xù)與病源市場的穩(wěn)定。
附:SAS9.3程序
data t1;input x y@@;cards;
1979 9739 1980 9893 1981 10393 1982 10789 1983 10685 1984 10732 1985 10638 1986 10999 1987 12088 1988 12664 1989 12749 1990 12331 1991 12151 1992 12214 1993 11356 1994 12051 1995 12770 1996 13633 1997 15440 1998 18177 1999 21420 2000 24264 2001 28486 2002 31038 2003 34393 2004 39625 2005 41910 2006 46153 2007 52826 2008 63144 2009 79106 2010 93184 2011 108643 2012 129163 2013 155214 2014 168442 2015 176929;
procgplot data=t1;plot y*x;run;
proc univariate normal plot data=t1;var y;run;
[1]Kim HJ,F(xiàn)ay MP,F(xiàn)euer EJ,et al.Permutation Tests for Joinpoint Regression with Applications to Cancer Rates.Statistics in Medicine,2000,19(3):335-351.
[2]Goovaerts P,Xiao H.Geographical,Temporal and Racial Disparities in Late-Stage Prostate Cancer Incidence across Florida:A Multiscale-Joinpoint Regression Analysis.International Journal of Health Geographics,2011,10(1):63.
[3]Huriye T,Sinan S.Joinpoint Regression Analysis and An Application On Istanbul Stock-Exchange.Alphanumeric Journal,2014,2(1):44-49.
[4]Lerman PM.Fitting Segmented Regression Models by Grid Search.Applied Statistics,1980,29(1):77-84.
[5]Joinpoint User′s Guide 4.2.http://surveillance.cancer.gov/joinpoint/Joinpoint_Help_4.2.0.0.pdf.
[6]Zhu L,Pickle LW,Ghosh K,et al.Predicting US-and state-level cancer counts for the current calender year:PartⅡ:evaluation of spatiotemporal projection methods for incidence.Cancer,2012,118(4):1100-1109.
[7]董承章.經(jīng)濟預測原理與方法.大連:東北財經(jīng)大學出版社,1993:6-10.
[8]馬臣,姜永曉,劉曙正,等.河南省居民2010年至2019年肺癌死亡率預測.鄭州大學學報(醫(yī)學版),2013,48(2):220-225.
[9]河南省衛(wèi)生廳.河南省新型農(nóng)村合作醫(yī)療統(tǒng)籌補償方案指導意見(豫衛(wèi)農(nóng)衛(wèi)[2012]20號),2012-12-11.
[10]國務院辦公廳.《關于推進分級診療制度建設的指導意見》(國辦發(fā)[2015]70號),2015-9-11.
[11]馬春柳,劉海霞,李小升,等.SARIMA模型在醫(yī)院住院人次預測中的應用.中國衛(wèi)生統(tǒng)計,2013,30(3):432:433.
(責任編輯:鄧 妍)