新疆大學(xué)數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院(830046) 張 智 劉澤萌 楊 堤 吳黎軍
醫(yī)療費(fèi)用一直是民生問題的焦點(diǎn),我國大部分地區(qū)逐步建立以單病種限額付費(fèi)為主體的總額預(yù)付制并取得一定成效[1]。為進(jìn)一步促進(jìn)醫(yī)療資源合理利用,研究單病種住院費(fèi)用及其影響因素具有重大意義。
本文應(yīng)用數(shù)據(jù)挖掘領(lǐng)域的降維方法——基于BIC準(zhǔn)則的切片逆回歸[2],即MSIR,該方法在尋求降維方向時(shí),同時(shí)考慮自變量和因變量的信息,實(shí)現(xiàn)高維數(shù)據(jù)的綜合降維。將住院費(fèi)用多因素分析問題轉(zhuǎn)化為一個(gè)降維問題,為研究住院費(fèi)用的結(jié)構(gòu)特征和影響因素提供了新的思路。
1.充分降維
回歸模型通常是將(X,Y)的聯(lián)合密度函數(shù)分解為f(y|x)g(x),充分降維(sufficient dimension reduction)的主要思想是尋找一個(gè)P×K(K≤P)維的矩陣β=(β1,…,βK),其中βi(i=1,2,…,K)為p維列向量,使得p維向量X可以被低維的線性組合βTX取代,且不損失Y|X的任何信息。換言之,若條件分布Y|X和Y|βTX是相同的,就達(dá)到了降維目的??杀硎緸橐韵露嘀笜?biāo)模型[3]:
(1)
2.MSIR的運(yùn)算步驟[2,5]:
(2)
(3)
1.數(shù)據(jù)來源及預(yù)處理
數(shù)據(jù)來自烏魯木齊市社保局,為烏市2014年11月至2015年7月的13家定點(diǎn)三級醫(yī)院醫(yī)保數(shù)據(jù),主要包括病人的年齡、性別、疾病類型、入出院科室,各單項(xiàng)費(fèi)用及總費(fèi)用等。本文選取常見多發(fā)的膽囊炎伴膽囊結(jié)石(ICD10:K80.1)和急性闌尾炎(ICD10:K35)兩個(gè)單病種進(jìn)行分析,以下簡稱為膽囊炎和闌尾炎,總樣本量分別為263和117。預(yù)處理:使用excel軟件剔除異常值:分別刪除兩病種項(xiàng)目信息不全的樣本量7和2、刪除住院天數(shù)大于100天的樣本量2和0、刪除各項(xiàng)費(fèi)用其分位數(shù)在99%以上或1%以下的樣本量19和7,最終膽囊炎取235個(gè)樣本數(shù)據(jù),闌尾炎取108個(gè)樣本數(shù)據(jù)。住院天數(shù)、總費(fèi)用及各單項(xiàng)費(fèi)用呈正偏態(tài)分布,采用對數(shù)轉(zhuǎn)換使其成正態(tài)分布。
2.降維結(jié)果及分析
考慮到住院費(fèi)用的復(fù)雜性和多因素性,鑒于充分降維是尋找變量的若干線性組合,而不同于變量選擇方法挑選某些變量[7],本文綜合費(fèi)用構(gòu)成因素和社會(huì)經(jīng)濟(jì)因素,參考現(xiàn)有研究成果[8-10],選取住院天數(shù)、年齡、性別、手術(shù)費(fèi)、藥費(fèi)、床位費(fèi)、檢查費(fèi)、治療費(fèi)、化驗(yàn)費(fèi)、材料費(fèi)作為10個(gè)協(xié)變量。根據(jù)以上MSIR計(jì)算步驟, 使用軟件 R3.2.2 及“msir”軟件包可得兩病種的降維結(jié)果及分析如下:
(1)膽囊炎的降維結(jié)果
圖1 特征值與維數(shù)估計(jì)(膽囊炎)
表1 基方向β1與β2的估計(jì)值(膽囊炎)
表2 回歸方程及檢驗(yàn)結(jié)果(膽囊炎)
①ln(藥費(fèi))在降維方向上的系數(shù)為0.7106,是影響膽囊炎住院費(fèi)用的最重要因素。
②ln(材料費(fèi))的系數(shù)為0.3149,是影響住院費(fèi)用的次重要因素。
③ln(檢查費(fèi))的系數(shù)為0.3119,ln(住院天數(shù))的系數(shù)為0.2521,也是影響膽囊炎住院費(fèi)用的主要因素。
(2)闌尾炎的降維結(jié)果
圖2 特征值與維數(shù)估計(jì)(闌尾炎)
表3 基方向β1的估計(jì)值(闌尾炎)
表4 回歸方程及檢驗(yàn)結(jié)果(闌尾炎)
①ln(藥費(fèi))在Dir1上的系數(shù)為0.8679,是影響闌尾炎住院費(fèi)用的最重要因素。
②ln(治療費(fèi))的系數(shù)為0.3226,是影響闌尾炎住院費(fèi)用的次重要因素。
③ln(檢查費(fèi))和ln(住院天數(shù))的系數(shù)分別為0.2094和-0.2073,也是影響闌尾炎住院費(fèi)用的主要因素。
3.主要影響因素分析
本文研究中,影響膽囊炎住院費(fèi)用的主要因素為藥費(fèi)、材料費(fèi)、檢查費(fèi)和住院天數(shù);影響闌尾炎住院費(fèi)用的主要因素為藥費(fèi)、治療費(fèi)、檢查費(fèi)和住院天數(shù)。結(jié)合現(xiàn)有研究結(jié)果,我們發(fā)現(xiàn)實(shí)施單病種限額結(jié)算的付費(fèi)方式后,本文所選的兩種病的費(fèi)用結(jié)構(gòu)和影響因素有了一定變化。
(1)藥費(fèi):藥費(fèi)是影響兩病種住院費(fèi)用的最大因素。我國“以藥養(yǎng)醫(yī)”長期存在,藥品利潤已成為維持醫(yī)院運(yùn)作的重要因素,患者缺乏醫(yī)藥知識(shí),藥品監(jiān)管不力都是造成高藥價(jià)和高藥費(fèi)的客觀基礎(chǔ)??梢?,從用藥環(huán)節(jié)控制住院費(fèi)用的合理增長是切實(shí)可行的[8]。
(2)檢查費(fèi)和材料費(fèi):檢查費(fèi)對兩病種的影響都很顯著,材料費(fèi)對膽囊炎的影響更顯著一些。近年來,越來越多的醫(yī)院通過引進(jìn)高端設(shè)備和昂貴的一次性材料作為輔助醫(yī)療的技術(shù)手段,加上醫(yī)療機(jī)構(gòu)之間的檢查結(jié)果互相不認(rèn)可,患者的檢查費(fèi)和材料費(fèi)自然也隨之上升。
(3)治療費(fèi):以往研究中治療費(fèi)的占比都比較小,本文結(jié)果中治療費(fèi)對闌尾炎有較大影響。可以看出,實(shí)施按病種限額付費(fèi)方式以后,闌尾炎住院費(fèi)用結(jié)構(gòu)有了一定變化,三甲醫(yī)院的技術(shù)優(yōu)勢和醫(yī)務(wù)人員的勞動(dòng)價(jià)值有一定體現(xiàn)[9]。
(4)住院天數(shù):作為一個(gè)重要的醫(yī)療資源消耗指標(biāo),較長的住院時(shí)間將產(chǎn)生更多的醫(yī)療費(fèi)用。本文結(jié)果中,住院天數(shù)不是影響住院費(fèi)用的最重要的因素,這與烏魯木齊市三甲醫(yī)院病床使用率較高、周轉(zhuǎn)次數(shù)多,診斷與治愈效率高的實(shí)際情況是一致的。就住院天數(shù)來看,病種限額結(jié)算方式下三甲醫(yī)院的醫(yī)療資源利用率有所提高。
以膽囊炎為例,該病種多采用腹腔鏡手術(shù),手術(shù)創(chuàng)傷小,康復(fù)快,病人住院天數(shù)短,但所需設(shè)備和材料費(fèi)用較高[11],這也進(jìn)一步解釋其檢查費(fèi)和材料費(fèi)較高的情況。同時(shí),病人住院天數(shù)變短,為保證同樣的治療質(zhì)量下,病人出院帶藥將增加,藥費(fèi)也會(huì)相應(yīng)增高。
本文將數(shù)據(jù)挖掘技術(shù)中的降維思想結(jié)合傳統(tǒng)的回歸分析,提高了傳統(tǒng)回歸的靈活性和包容性,也為數(shù)據(jù)挖掘在醫(yī)療信息化建設(shè)中的應(yīng)用作了有益的嘗試??傮w分為兩步,先用MSIR對高維協(xié)變量進(jìn)行降維,得到中心降維子空間的有效降維方向和維數(shù),再用回歸分析得到低維協(xié)變量下的回歸方程。本文建立的回歸模型為線性模型,其他實(shí)際應(yīng)用中根據(jù)不同的樣本特征,還可以建立非線性等回歸模型[1,12]。
與早期研究結(jié)果相比,影響膽囊炎和闌尾炎住院費(fèi)用的主要因素和費(fèi)用結(jié)構(gòu)有一定變化,反映出按病種限額結(jié)算方式確實(shí)對醫(yī)療費(fèi)用控制有一定作用。為切實(shí)降低患者的醫(yī)療費(fèi)用負(fù)擔(dān),探索更合理的付費(fèi)方式,進(jìn)一步深化我國醫(yī)療體制改革,我們建議完善醫(yī)療服務(wù)補(bǔ)償機(jī)制,弱化藥品收益對醫(yī)院的補(bǔ)償作用;控制不必要的檢查和化驗(yàn),以平價(jià)材料代替昂貴材料,醫(yī)療機(jī)構(gòu)之間檢查結(jié)果共享;保證治療效果的前提下,建立常見病種的合理參考住院日;增加衛(wèi)生投入,增強(qiáng)政府的宏觀調(diào)控作用。
[1] 徐長妍,于雙成,遲寶榮.單病種限額付費(fèi)挑戰(zhàn)醫(yī)院管理模式.中國醫(yī)院管理,2007,27(7):5-7.
[2] Zhu LX,Miao BQ,Peng H.On Sliced Inverse Regression with High-DimensionalCovariates.Journal of the American Statistical Association,2006,101(474):630-643.
[3] Li K.CSliced Inverse Regression for Dimension Reduction.Journal of the American Statistical Association,1991,86(414):316-327.
[4] Cook RD.Regression graphics:Ideas for Studying Regressions through Graphics.Technometrics,1999,94(4):368-369.
[5] 李巖巖,康新梅.基于SIR方法分析重慶市糧食產(chǎn)量.西南師范大學(xué)學(xué)報(bào)(自 然 科 學(xué) 版),2016,41(5):194-198.
[6] Schwarz G.Estimating the dimension of a model.Statist.Annals of Statistics,1978,6(2):15-18.
[7] 趙曉兵,王偉偉.高維附加信息下的商業(yè)醫(yī)療保險(xiǎn)費(fèi)用評估模型和方法.財(cái)經(jīng)論叢,2013,173(4):58-65.
[8] 張文娟.大連市某三甲醫(yī)院闌尾炎職工醫(yī)?;颊咦≡嘿M(fèi)用及償付分析.大連醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,2015,5.
[9] 邵亞楠,邱杰,蔡明明.膽囊炎患者住院費(fèi)用的多因素分析及模型選擇.中國衛(wèi)生信息管理雜志,2012,9(3):89-93.
[10] 張紅麗,譚鵬.10296例急性闌尾炎患者的住院費(fèi)用及影響因素分析.中國衛(wèi)生經(jīng)濟(jì),2004,253(23):66.
[11] 張鷺鷺,陳潔,張曉玉,等.單病種成本核算和補(bǔ)償方式的探討.中華醫(yī)院管理雜志,1993,9(9):546.
[12] 謝力,魏汝祥,蔣國萍,等.基于分片逆回歸的小樣本組合預(yù)測建模方法.統(tǒng)計(jì)與決策,2013 (2):73-76.