肖 靜 許瓊瓊 高月霞 仲亞琴 吳徐明 強(qiáng)福林 沈 康△
基于回歸樹模型的乳腺癌住院費用病例組合研究*
肖 靜1許瓊瓊1高月霞1仲亞琴1吳徐明2強(qiáng)福林2沈 康2△
目的探索南通市乳腺癌病例的DRGs分組方案及費用標(biāo)準(zhǔn),為相關(guān)部門決策提供科學(xué)依據(jù)。方法數(shù)據(jù)來源于2006-2013年南通市腫瘤醫(yī)院以乳腺癌為主要診斷的10672例住院患者的病案首頁,多重線性回歸分析篩選分類節(jié)點變量,運用回歸樹模型進(jìn)行病例分組,采用絕對值法和相對權(quán)重法對住院費用的標(biāo)準(zhǔn)進(jìn)行測算。結(jié)果治療方法、首次入院、年齡、入院危急、轉(zhuǎn)歸等作為乳腺癌病例分類節(jié)點的關(guān)鍵變量,建立了14個DRGs組及住院費用標(biāo)準(zhǔn)。結(jié)論病例分組結(jié)果合理,住院費用標(biāo)準(zhǔn)和病種權(quán)重可以作為相關(guān)部門參考。
乳腺癌 住院費用 疾病診斷相關(guān)組 回歸樹
據(jù)國際癌癥研究中心(International Agency for Research on Cancer,IARC)統(tǒng)計[1],2012年全球女性乳腺癌新發(fā)病例達(dá)170萬,占全部女性惡性腫瘤發(fā)病的25%;52萬女性因乳腺癌死亡,占所有女性惡性腫瘤死亡的15%。2008年中國女性乳腺癌新發(fā)病例數(shù)16.9萬,占所有惡性腫瘤發(fā)病例數(shù)的14.2%,位于女性癌癥第2位;2008年女性乳腺癌死亡病例約4.5萬,居于全部惡性腫瘤的第6位[2]。隨著乳腺癌發(fā)病率的增加,治療疾病的經(jīng)濟(jì)負(fù)擔(dān)也日趨增加。盡管在臨床上倡導(dǎo)乳腺癌臨床路徑的規(guī)范化治療,但是乳腺癌患者住院費用變異較大,手術(shù)患者的平均住院費用從11383元[3]到17864元[4]?;诩膊≡\斷相關(guān)的病例組合支付制度(diagnosis-related-groups,DRGs),有助于規(guī)范化乳腺癌的治療,降低住院天數(shù)和住院費用[5-6]。但是,國內(nèi)的相關(guān)研究較少,乳腺癌相關(guān)診斷病例分組的研究僅見趙婷等[7]報道,分組節(jié)點僅引入3788例患者手術(shù)、化療、放療等治療方案變量,缺少疾病特征和患者年齡等影響資源消耗的變量。本研究對南通市腫瘤醫(yī)院2006-2013年乳腺癌患者的住院費用進(jìn)行分析,建立DRGs分組,測算乳腺癌住院費用相關(guān)支付標(biāo)準(zhǔn),為醫(yī)保付費制度改革提供參考。
1.?dāng)?shù)據(jù)來源
數(shù)據(jù)來源于南通市腫瘤醫(yī)院2006-2013年出院主要診斷為乳腺癌(ICD-10編碼為C50)的住院病人病案首頁。數(shù)據(jù)預(yù)處理的排除標(biāo)準(zhǔn)如下:(1)將有缺項、漏項、不符合邏輯的病案剔除;(2)將住院天數(shù)小于1或大于100天的病案剔除;(3)將住院費用小于1%或大于99%的病案剔除。經(jīng)篩選有效病例10672例,年齡最小15歲,最大99歲,中位年齡53歲,均值±標(biāo)準(zhǔn)差為(53.98±9.73)歲。
2.研究變量及賦值
本研究以住院費用為分組關(guān)鍵變量,住院費用最小值1872元,最大值52899元,均值±標(biāo)準(zhǔn)差(11267 ±7750)元。為消除物價上漲對住院費用的影響,以2006年作為基期,用當(dāng)年的居民消費價格指數(shù)(CPI)調(diào)整。
住院總費用不服從正態(tài)分布(Z=15.598,P<0.001),經(jīng)對數(shù)變換后進(jìn)行多重線性回歸分析,以年齡(連續(xù)型變量)、性別、婚姻狀況(喪偶1例,合并到已婚組)、入院途徑、伴隨病、并發(fā)癥、治療方法、首次入院、轉(zhuǎn)歸等為自變量,用方差膨脹因子(VIF)進(jìn)行共線性診斷,篩選分類節(jié)點變量。變量分布及賦值見表1,樣本中有41.0%的病人醫(yī)療保險狀況為自費,主要是異地就醫(yī)的病人。
表1 10672例乳腺癌患者基本特征及賦值
3.病例組合方法
所有數(shù)據(jù)用STATA 12.0軟件進(jìn)行篩選整理分析,病例組合用SPSS 20.0軟件中的回歸樹模型(regression tree)構(gòu)建與修剪[8]。運用卡方自動交互檢測(CHAID)算法構(gòu)建決策樹,采用交叉驗證方法(cross validation)對樹模型自動修剪,樣本群數(shù)為10。以住院費用為因變量,以年齡、伴隨疾病、并發(fā)癥等作為分類節(jié)點。本研究參數(shù)設(shè)置使用:決策樹最大深度為3,父節(jié)點的最小樣本數(shù)為100,子節(jié)點的最小樣本數(shù)為50,拆分節(jié)點的檢驗水準(zhǔn)α=0.05。分組合理性評價:非參數(shù)Kruskal-Wallis檢驗和方差減少量[9](reduction in variance,RIV)來檢驗分組的組間變異,用變異系數(shù)(CV)來檢驗分組的組內(nèi)變異。
1.分類節(jié)點變量篩選
住院費用多重線性回歸結(jié)果見表2,從標(biāo)準(zhǔn)化偏回歸系數(shù)可知,手術(shù)、放療及化療對住院費用的影響最大,其次是首次入院、醫(yī)保方式和入院途徑,疾病轉(zhuǎn)歸、并發(fā)癥也是住院費用的影響因素。模型的共線性診斷表明,平均VIF為1.58,所有VIF<5,可以認(rèn)為不存在共線性問題。經(jīng)專家咨詢和相關(guān)文獻(xiàn)分析,年齡是影響住院費用的重要變量,也作為分類節(jié)點變量納入回歸樹模型。
表2 乳腺癌住院費用多重線性回歸分析
2.分組結(jié)果
本研究10672例乳腺癌病例共形成14個DRGs組合,各分組的均數(shù)、中位數(shù)、標(biāo)準(zhǔn)差及變異系數(shù)見表3。分組的合理性評價,各病例組合住院費用的非參數(shù)Kruskal-Wallis檢驗結(jié)果均是P<0.001;方差減少量RIV值為20.64%,RIV值越大組間的異質(zhì)性越好。各病例組合變異系數(shù)CV值見表3,變異系數(shù)均小于1,最小值0.30,最大值0.77,說明組內(nèi)同質(zhì)性較好,分組較為合理。
3.病例組合住院費用的相關(guān)標(biāo)準(zhǔn)制定
基于以上方法病例分組后,可以用住院費用中位數(shù)制定費用參考值的標(biāo)準(zhǔn)[10],計算住院費用上限時,采用各組合住院預(yù)測費用的75%加1.5倍四分位數(shù)間距[11]。本研究中,乳腺癌患者住院費用超過費用上限定義為超標(biāo)費用,超標(biāo)總例數(shù)為1346,占本次研究總例數(shù)的12.61%。計算各DRG組的病種權(quán)重[12],是指該種DRG組合的例均住院費用與所有病例平均費用的比值,權(quán)重越高,說明病人消耗的資源越多,具體見表4。
表3 乳腺癌DRGs分組結(jié)果
表4 乳腺癌DRGs分組的住院費用標(biāo)準(zhǔn)及病種權(quán)重
本研究基于決策樹中的回歸樹模型,將10672例乳腺癌病例根據(jù)不同的治療方案分成14個組。分組變量沒有選擇住院天數(shù),主要是考慮到國內(nèi)還沒有實施規(guī)范化的臨床路徑管理,住院天數(shù)的變異較大,這與國內(nèi)現(xiàn)有的研究一致[7,11]。與傳統(tǒng)的多重線性回歸相比,回歸樹模型不要求變量具有特定的分布,對數(shù)據(jù)的離群值存在和有偏分布不太敏感,通過交叉驗證等方法對模型進(jìn)行合理剪枝,可達(dá)到穩(wěn)定可重復(fù)的效果[13]。
本研究將年齡、治療方案、疾病嚴(yán)重程度等納入到乳腺癌的病例分組,與歐洲乳腺癌的分類組合指標(biāo)相似[14]。首次入院是影響腫瘤住院費用的重要變量,在化療和放療病例中首次入院組的住院費用中位數(shù)較高,這在醫(yī)療保險相關(guān)部門決策中參考價值較大。急診病人的費用高于非急診病人的費用,急診可作為病情嚴(yán)重的代理變量,病情越重消耗醫(yī)療資源越多。英國乳腺癌病例組合實證研究發(fā)現(xiàn)[15],年齡是影響手術(shù)病人及對癥治療組住院費用的重要變量,病例分組應(yīng)基于更多的循證證據(jù)。沒有將醫(yī)保方式納入到分類回歸模型,主要是考慮疾病資源消耗的社會學(xué)特征與疾病特征。另外,疾病嚴(yán)重程度未能納入回歸樹模型,主要與病案質(zhì)量有關(guān),應(yīng)在以后的研究中進(jìn)一步完善。
本研究中病例組合費用制定的相關(guān)標(biāo)準(zhǔn),具有很強(qiáng)的參考價值。在醫(yī)保部門實際應(yīng)用中,主要有住院費用絕對值法和病種相對權(quán)重系數(shù)法[12]。相對權(quán)重系數(shù)法是指先根據(jù)一定的原則確定一個基準(zhǔn)組合,用各組合的平均費用與基準(zhǔn)組合平均費用的比值表示相關(guān)權(quán)重系數(shù)。通過計算各病種相對權(quán)重系數(shù),可以連接所有的病種,進(jìn)行按病種分值結(jié)算,體現(xiàn)醫(yī)保支付的科學(xué)性。因此,在醫(yī)保管理實踐中,可根據(jù)這些分組費用之間的比例關(guān)系,醫(yī)?;鸬膶嶋H支付能力,確定一個合適的參考值。病例組合醫(yī)療費用的參考價值在于分類標(biāo)準(zhǔn)的確定,而不是具體費用絕對值的大小。
[1]Torre LA,Bray F,Siegel RL,et al.Global Cancer Statistics,2012.CA Cancer JClin,2015,65(2):87-108.
[2]張敏璐,黃哲宙,鄭瑩.中國2008年女性乳腺癌發(fā)病、死亡和患病情況的估計及預(yù)測.中華流行病學(xué)雜志,2013,33(10):1049-1051.
[3]肖靜,楊梅,魏珊,等.南通市2020例乳腺癌患者住院費用影響因素的通徑分析.中國婦幼保健,2012,27(11):1617-1620.
[4]趙忻怡,張曉,唐洋,等.乳腺癌手術(shù)病人住院費用及影響因素分析.中國衛(wèi)生經(jīng)濟(jì),2009,28(1):41-43.
[5]Lotter O,Stahl S,Schiefer JL,etal.A European comparison of reimbursement in breast reconstruction.Eur JSurg Oncol,2013,39(3):273-278.[6]Kuwabara H,F(xiàn)ushim i K.The impact of a new payment system with case-m ix measurement on hospital practices for breast cancer patients in Japan.Health Policy,2009,92(1):65-72.
[7]趙婷,韓芳,阿布都沙拉木·依米提,等.乳腺癌患者住院費用的診斷相關(guān)分組研究.中國病案,2013,14(11):56-58.
[8]Breiman L,F(xiàn)riedman J,Olshen R,et al.Classification and Regression Trees.Belmont:Wadsworth,1984.
[9]閻玉霞,徐勇勇.病例組合分類結(jié)果的評價.中國衛(wèi)生統(tǒng)計,2007,24(4):163-165.
[10]董軍,胡德奎,陳劍偉,等.病種費用控制標(biāo)準(zhǔn)實驗研究.中華醫(yī)院管理雜志,2001,17(9):529-531.
[11]高子厚,萬崇華,蔡樂,等.按DRGs組合方式制定消化系統(tǒng)疾病患者住院費用的研究.中國衛(wèi)生統(tǒng)計,2006,23(4):323-325.
[12]高建民,鄭古崢玥,詹梅,等.基于疾病診斷相關(guān)組合的住院費用標(biāo)準(zhǔn)合理化探討.中國衛(wèi)生經(jīng)濟(jì),2013,3(1):22-24.
[13]趙一鳴.對回歸樹的建模與應(yīng)用一文的幾點補(bǔ)充.中華預(yù)防醫(yī)學(xué)雜志,2003,27(3):141-145.
[14]Scheller-Kreinsen D,Quentin W,Geissler A,et al.Breast cancer surgery and diagnosis-related groups(DRGs):patient classification and hospital reimbursement in 11 European countries.Breast,2013,22(5):723-32.
[15]Morgan J,Richards P,Ward S,et al.Case-m ix analysis and variation in rates of non-surgical treatment of older women with operable breast cancer.Br JSurg,2015,102(9):1056-63.
(責(zé)任編輯:劉 壯)
Case-M ix Study of Patients with Breast Cancer Based on Regression Tree
Xiao Jing,Xu Qiongqiong,Gao Yuexia,et al.
(Department of Health Statistic,School of Public Health,Nantong University(226004),Nantong)
ObjectiveThe study explored the case-m ix diagnosis-related-groups of patients with breast cancer in Nantong and developed related health expense standards,so as to provide scientific evidence for related departments′decisions.MethodsAccording to 10 672 inpatients with the principal diagnosis breast cancer from 2006 to 2013 in Nantong tumor hospital,multiple regression model was employed to screening the classification node variables,and the regression tree model was applied to set up the case-m ix diagnosis related groups.The absolute value method and relative weights were used to calculate the standard.ResultsThe main classification node variables were therapies,first hospitalization,age,admission from emergency setting,and prognosis.14 diagnosis-related-groups and related health expense standards were established.ConclusionCase-m ix diagnosis related groups are reasonable,and the health expense standards and related case weight could make references for related departments.
Breast cancer;Hospitalization expense;Diagnosis related groups;Regression tree
南通市科技局社會發(fā)展項目資助(HS2013004);南通大學(xué)博士科研啟動基金(14B16)
1.南通大學(xué)公共衛(wèi)生學(xué)院流行病衛(wèi)生統(tǒng)計系(226004)
2.南通市腫瘤醫(yī)院科教科
△通信作者:沈康,E-mail:sk9181@163.com