摘要:本文以寧波地區(qū)某三甲及某骨科??漆t(yī)院2010年1月1日~2011年12月30日費(fèi)用及病案信息數(shù)據(jù)為基礎(chǔ),利用SPSS18.0對數(shù)據(jù)進(jìn)行分析腰椎間盤脫出疾病的費(fèi)用影響因素進(jìn)行分析,并以費(fèi)用為目標(biāo)變量,運(yùn)用決策樹CHAID算法對此疾病進(jìn)行病例組合費(fèi)用測算。結(jié)果表明,基于CHAID的病例組合費(fèi)用合理有效,6個(gè)組合病例組費(fèi)用組合內(nèi)有同質(zhì)性,而組間有異質(zhì)性。測算的標(biāo)準(zhǔn)費(fèi)用為用實(shí)際費(fèi)用的90.2%。為進(jìn)一步完善病例組合,必須與臨床路徑相配套,進(jìn)一步原始數(shù)據(jù)的采集與質(zhì)量,從而為醫(yī)療機(jī)構(gòu)以及政府部門開展按病種醫(yī)療費(fèi)用支付方式提供參考。
關(guān)鍵詞:CHAID;病例組合
隨著社會(huì)經(jīng)濟(jì)和醫(yī)學(xué)技術(shù)的發(fā)展,人口老齡化問題的加劇,以及疾病譜和死因譜的改變,人民對醫(yī)療衛(wèi)生服務(wù)需求在不斷提高,醫(yī)療費(fèi)用的過快增長已經(jīng)成為政府面臨的嚴(yán)重問題。近年來我國GDP一直保持9.8%的年平均增長率,但衛(wèi)生總費(fèi)用卻以17.1%的年平均增長率持續(xù)增長。人均醫(yī)療費(fèi)用的增長幅度遠(yuǎn)遠(yuǎn)大于人均收入增長幅度,國民醫(yī)療負(fù)擔(dān)沉重。合理控制醫(yī)療費(fèi)用己成為我國醫(yī)療衛(wèi)生體制改革面臨的重點(diǎn)和難點(diǎn)問題。國外社會(huì)醫(yī)療保險(xiǎn)的實(shí)踐經(jīng)驗(yàn)已經(jīng)充分證明,按病例組合醫(yī)療費(fèi)用支付方式對于醫(yī)療服務(wù)供方的醫(yī)療行為以及醫(yī)療費(fèi)用的控制會(huì)產(chǎn)生明顯的導(dǎo)向作用。相對于其他方式,它既能保證醫(yī)學(xué)高新技術(shù)的發(fā)展,持續(xù)促進(jìn)醫(yī)療服務(wù)質(zhì)量、提高醫(yī)療工作效率,又能控制醫(yī)療成本、降低醫(yī)療費(fèi)用。本次研究試圖對在寧波地區(qū)較有代表性的某三甲醫(yī)院及骨科??漆t(yī)院腰椎間盤脫出疾病的費(fèi)用影響因素進(jìn)行分析,并以費(fèi)用為目標(biāo)變量,運(yùn)用決策樹CHAID算法對此疾病進(jìn)行病例組合分類,并確定分組結(jié)果合理性,探討方法適用性,為醫(yī)療機(jī)構(gòu)以及政府部門開展按病種醫(yī)療費(fèi)用支付方式提供參考。
1資料與方法
1.1一般資料 以浙江省寧波市某三甲醫(yī)院及骨科專科作為調(diào)查對象,兩家醫(yī)院骨骼系統(tǒng)疾病技術(shù)力量較強(qiáng),具有一定的區(qū)域代表性。在具體研究對象的選擇上,主要選取2010~2011年間2院代表性較強(qiáng)、住院人次較多、診斷明確、治療有效、易于分析且具有一定費(fèi)用下降空間的腰椎間盤突出(ICD-10編碼)疾病出院病例。在內(nèi)容上則以病案首頁信息為依據(jù),摘錄每例病例的住院總費(fèi)用、實(shí)際住院天數(shù)、是否手術(shù)、醫(yī)療保險(xiǎn)支付方式以及相關(guān)人口學(xué)信息。
1.2方法
1.2.1決策樹CHAID算法基本概念 決策樹算法是通過一系列if-then的邏輯分支關(guān)系,形成一套分層規(guī)則,將所有可能發(fā)生的結(jié)局概率分布用樹形表達(dá)。其包括決策節(jié)點(diǎn)、機(jī)會(huì)結(jié)點(diǎn)和結(jié)局結(jié)點(diǎn)。從決策結(jié)點(diǎn)引出一些射線,表示不同的備選方案。從機(jī)會(huì)結(jié)點(diǎn)引出的射線表示該結(jié)點(diǎn)可能發(fā)生的各種隨機(jī)事件。CHAID算法核心思想是更具給定的反應(yīng)變量以及經(jīng)過篩選的解釋變量對樣本進(jìn)行最優(yōu)分割,按照方差檢驗(yàn)的顯著性進(jìn)行多元列聯(lián)表的自動(dòng)判斷分組。由于醫(yī)療費(fèi)用為典型的偏態(tài)分布資料,運(yùn)用CHAID可以很好的解決分析方法的適用性問題。
1.2.2 CHAID決策樹分裂生長過程
1.2.2.1定義1 設(shè)信息源X的符號(hào)取值集合為A={a1,a2,…,an},其中ai∈A出現(xiàn)的概率為pi=P[X=ai],稱I(ai)=-logPi為ai的信息量。信息量的數(shù)學(xué)期望值為信息熵,記為H(X),有H(X)=-■PilogPi決策樹分類利用信息量增加作為特征選擇的指標(biāo)。信息增益衡量每個(gè)屬性對分裂后子集的信息量貢獻(xiàn)。
1.2.2.2定義2 設(shè)集T包含n個(gè)樣本,這些樣本又分別屬于m個(gè)類,其中第i個(gè)類在T中出現(xiàn)的比例為Pi,那么信息熵為I(T)=-■-PilogPi
假設(shè)屬性A把集合T劃分成V個(gè)子集{T1,T2,…,Tv},其中Ti所包含的樣本數(shù)為ni,那么劃分后的熵就是E(A)=■■I(Ti),分裂后的信息熵為Gain(A)=I(T)-E(A)。
逐一計(jì)算每種屬性變量的信息熵,選擇信息量最大的屬性為分裂屬性變量,完成決策樹分類過程。當(dāng)分裂屬性為分類變量時(shí),直接生成相關(guān)子結(jié)點(diǎn)。當(dāng)為連續(xù)變量時(shí),首先根據(jù)該分裂屬性對此結(jié)點(diǎn)數(shù)據(jù)集進(jìn)行聚類分析,分成幾個(gè)不同的類,劃分成幾個(gè)相連的區(qū)間。
為了使模型達(dá)到簡約而精準(zhǔn)的效果,根據(jù)樹的生成層數(shù)、分裂聚合閾值、結(jié)點(diǎn)占樣本比例設(shè)定父結(jié)點(diǎn)最少為100條,子結(jié)點(diǎn)為50條。
1.3研究步驟與統(tǒng)計(jì)分析 利用多重線性回歸模型對影響出院病例住院費(fèi)用的顯著性因素進(jìn)行篩選,確定分類結(jié)點(diǎn)。以住院費(fèi)用為組合核心,利用CHAID算法確定病例組合方案。計(jì)算個(gè)組合的住院費(fèi)用的均數(shù)、中位數(shù)以及CV(變異系數(shù))值,并計(jì)算各層中的方差統(tǒng)計(jì)量。
1.4統(tǒng)計(jì)學(xué)分析 在統(tǒng)計(jì)時(shí)用采用Excel2007進(jìn)行前期數(shù)據(jù)清理與洗脫,用帶有決策樹模塊的SPSS18.0對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。
2費(fèi)用影響因素的篩選及病例組合費(fèi)用測算
2.1住院費(fèi)用的影響因素篩選 醫(yī)療費(fèi)用以2011年費(fèi)用為基年,前年限費(fèi)用均為經(jīng)CPI調(diào)整后的費(fèi)用。由于費(fèi)用并未服從正態(tài)分布,故對其進(jìn)行 轉(zhuǎn)換。以費(fèi)用對數(shù)值作為因變量(Y),將性別(回歸方程中簡寫為S)、年齡(A)、醫(yī)療保險(xiǎn)方式(S)、是否手術(shù)(O)、住院天數(shù)(D)作為自變量,按α=0.05的水平,對住院費(fèi)用的影響因素進(jìn)行整體(ENTER)多重逐步回歸,其中年齡、住院天數(shù)為連續(xù)型變量,性別為兩分類變量,醫(yī)療保險(xiǎn)方式以啞變量形式形式納入。模型總體F=378.56, R2=0.77,擬合程度較高,且可以解釋總體上77.0%的變異情況。各自變量的方差膨脹因子(VIF)均<10,并未存在共線性問題從標(biāo)準(zhǔn)化回歸結(jié)果可以看到納入模型的變量有年齡、是否手術(shù)、住院天數(shù)共3個(gè)變量。在控制其他因素的條件下,住院天數(shù)長、年齡大、手術(shù)治療患者住院費(fèi)用越高。其回歸標(biāo)準(zhǔn)方程為Y=0.03+0.59O+0.35D+0.16A,見表1。
2.2基于CHAID的病例組合費(fèi)用測算 有研究顯示,高額醫(yī)療費(fèi)用會(huì)加大費(fèi)用的離散程度,從而影響到病例組合費(fèi)用的中位數(shù),故本次研究選取去除上四分位數(shù)+四分位數(shù)間距(P75與P25之差的1.5倍)高額費(fèi)用后的總費(fèi)用共2286條作為目標(biāo)變量。根據(jù)住院費(fèi)用影響因素分析結(jié)果選取分組變量,本研究選取了是否手術(shù)、住院天數(shù)、年齡3個(gè)變量作為分類變量,最后得到6個(gè)組合病例。病例分布比較均勻,構(gòu)成在9.5%~24.5%。各分組費(fèi)用CV<1.0,且組間經(jīng)Kruskal Wallis檢驗(yàn)表明組合之間費(fèi)用差異有統(tǒng)計(jì)學(xué)意義,說明本研究病例組合內(nèi)有同質(zhì)性,而組間有異質(zhì)性。病例組合有效合理,見表2。
病例組合的標(biāo)準(zhǔn)費(fèi)用為各組中位數(shù)乘以組內(nèi)人數(shù)。經(jīng)過病例組合后的標(biāo)準(zhǔn)費(fèi)用占總費(fèi)用用的比例在57.3%~98.4%,合計(jì)標(biāo)準(zhǔn)費(fèi)用為用實(shí)際費(fèi)用的90.2%。如果實(shí)行基于CHAID的病例組合收費(fèi),2010~2011年2年間2家醫(yī)院僅需消耗實(shí)際費(fèi)用的90.2%。按病種收費(fèi)有助于醫(yī)療費(fèi)用的控制,見表3。
3討論與建議
3.1基于CHAID的病例組合費(fèi)用合理有效,與臨床路徑相配套有助于控制日益上漲的醫(yī)療費(fèi)用影響病例組合分類的因素較多,且之間存在著復(fù)雜的交互作用,影響因素之間的關(guān)系亦可能是非線性的。而決策樹CHDIA算法的優(yōu)勢就在于處理非線性、變量間具有交互作用以及存在缺失值等數(shù)據(jù)。它能夠較為直觀的顯示分析的過程與結(jié)果,且易于解釋。在去除線外費(fèi)用后,對寧波兩家醫(yī)院腰椎間盤脫出疾病的病例組合結(jié)果顯示,6個(gè)組中變異系數(shù)均較小,且組間費(fèi)用具有統(tǒng)計(jì)學(xué)差異,組內(nèi)同質(zhì)性與組間異質(zhì)性都得到了體現(xiàn)。分類效果較好。通過對標(biāo)準(zhǔn)費(fèi)用的測算,6組的標(biāo)準(zhǔn)費(fèi)用均不同程度低于實(shí)際發(fā)生費(fèi)用,病例組合收費(fèi)對費(fèi)用的控制效果得到了一定程度上的實(shí)證。實(shí)際中這種打包付費(fèi)方式可能導(dǎo)致醫(yī)院減少必要的服務(wù),導(dǎo)致醫(yī)療服務(wù)質(zhì)量下降。國外實(shí)行DRGs管理的操作經(jīng)驗(yàn)來看,實(shí)行這項(xiàng)制度需要配套實(shí)施臨床路徑管理體系。因此,實(shí)行病例組合付費(fèi)制度需配套實(shí)施臨床路徑管理體系,在保證醫(yī)療質(zhì)量的同時(shí)控制日益上漲的醫(yī)療費(fèi)用。
3.2病例組合需要進(jìn)一步提高病案質(zhì)量,加強(qiáng)編碼員培訓(xùn),保證原始數(shù)據(jù)的采集與質(zhì)量。事實(shí)上,美國的DRGs主要采用了主要診斷、次要診斷、主要手術(shù)、伴隨病、年齡、新生兒體重、昏迷時(shí)間及是否死亡作為分類結(jié)點(diǎn)。本次研究我們發(fā)現(xiàn)部分出院病歷首頁信息存在邏輯錯(cuò)誤及關(guān)鍵字段缺失等問題,損失了寶貴的樣本信息。由于疾病、手術(shù)編目的不準(zhǔn)確以及針刺診斷的混亂,我們僅選取診斷簡單明確的疾病且僅納入了手術(shù)情況、住院天數(shù)以及年齡因素作為費(fèi)用的分組變量,病例組合的分組較為粗糙。為了進(jìn)一步的完善病例組合分組,我們需要進(jìn)一步完善住院病例首頁信息,持續(xù)提高病案書寫質(zhì)量,保證資料的完整性、真實(shí)性及客觀性。同時(shí),編碼員的素質(zhì)亦是保證疾病分類準(zhǔn)確的關(guān)鍵。我們還需要加強(qiáng)編碼員的培訓(xùn),保證疾病診斷ICD-10及手術(shù)ICD-9-CM編目的準(zhǔn)確性。
3.3病例組合有助于醫(yī)院醫(yī)療產(chǎn)出的測量改進(jìn) 目前醫(yī)院依舊以傳統(tǒng)醫(yī)療指標(biāo)作為計(jì)算醫(yī)療產(chǎn)出量的核算基礎(chǔ),對床日及門診人次的醫(yī)療成本進(jìn)行核算。這種核算方式具有較大的缺陷,無法區(qū)分不同機(jī)構(gòu)及科室收治患者構(gòu)成不同所導(dǎo)致的差異。醫(yī)療成本與醫(yī)生的醫(yī)療決策具有很大的相關(guān)性??茖W(xué)的核算需要先計(jì)算病例組合分類后個(gè)組別的病例數(shù)量,然后再計(jì)算不同組合里的醫(yī)療消耗。本次研究發(fā)現(xiàn),經(jīng)過病例組合調(diào)整后,不同組別的費(fèi)用是可以區(qū)分的,即患者產(chǎn)生的醫(yī)療消耗與患者的病情及相關(guān)狀況密切相關(guān)。這位消除給機(jī)構(gòu)治患者病情不同等因素所導(dǎo)致的差異,統(tǒng)一醫(yī)療產(chǎn)出的測量提供了可能。
參考文獻(xiàn):
[1]關(guān)志強(qiáng),董朝暉.病例組合方法確定乙肝患者住院費(fèi)用的研究[J].中國衛(wèi)生濟(jì),2004,12:432.
[2]馬鳴,劉運(yùn)國,陳塤吹.新型農(nóng)村合作醫(yī)療中單病種定額付費(fèi)的病種選擇[J].中國衛(wèi)生經(jīng)濟(jì),2007,26(7):31.
[3]何凡,沈毅,葉眾.CHAID方法在居民衛(wèi)生服務(wù)需求研究中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管,2006,25(4):484-490.
[4]陳波.CHAID和貝葉斯網(wǎng)絡(luò)模型在肝膽系統(tǒng)和胰腺疾病DGRs歸組及線外病例預(yù)測中的應(yīng)用研究[D].四川大學(xué)博士論文,2011.
編輯/肖慧