周立業(yè),夏鑫婧,郭志飛,孫夢姣,余紅梅
·綜合研究·
山西省某醫(yī)院腦卒中病人住院費用的影響因素
周立業(yè),夏鑫婧,郭志飛,孫夢姣,余紅梅*
山西醫(yī)科大學,山西 030600
:分析腦卒中住院費用的分布情況及影響因素,探尋高效的分析方法,為合理控制腦卒中住院費用提供理論依據(jù)。:收集山西省某三級甲等醫(yī)院2017年—2019年腦卒中病人的住院信息,基于隨機森林、支持向量機、Logistic回歸3種機器學習算法建立預測模型,分析住院費用影響因素及其重要程度。:腦卒中病人藥品費在住院費用中占比較大,住院天數(shù)、腦卒中分型、科室為腦卒中病人住院費用的主要影響因素?;谥С窒蛄繖C算法構(gòu)建的腦卒中病人住院費用預測模型性能較優(yōu)。:應通過綜合措施控制腦卒中病人住院費用,以減少住院天數(shù)為重點,強化對可控因素的管理,針對關鍵人群采取預防和控制措施,降低腦卒中病人的經(jīng)濟負擔。
腦卒中;住院費用;疾病負擔;影響因素;機器學習
腦卒中是一種高患病率、高死亡率、高致殘率、高復發(fā)率和高經(jīng)濟負擔五大特點的慢性病[1?2],是我國成年人死亡和殘疾的首位病因,嚴重影響病人的生存質(zhì)量[3]。據(jù)推算,我國心血管病現(xiàn)患人數(shù)3.3億例,其中腦卒中病人1 300萬例[4]。全球疾病負擔(global burden of disease,GBD)結(jié)果顯示,2016年我國因腦卒中死亡179.0萬人,造成的傷殘調(diào)整壽命年(disability adjusted life year,DALY)達3 862.3萬人年[5]。我國每年的腦卒中社會經(jīng)濟負擔達400億元人民幣,直接經(jīng)濟負擔為每年243億元人民幣[6],給社會及家庭帶來沉重的疾病負擔。了解腦卒中的流行病學分布可以為腦卒中的防治工作提供重要的理論支撐。近年來,隨著機器學習算法的發(fā)展,越來越多的學者開始將機器學習算法應用于醫(yī)療費用分析中[7?8],決策樹、隨機森林(RF)、支持向量機(SVM)等是使用較為廣泛的機器學習算法,但其中較少應用多種機器學習算法進行對比檢驗。目前,由于沒有具體標準劃分住院費用的高低,許多研究人員根據(jù)主觀看法劃分住院費用,還有研究人員使用中位數(shù)方法將總住院費用分為兩類。而聚類法對住院費用的分類比中位數(shù)法更好,而且不同數(shù)據(jù)類別之間的分界點完全不受中位數(shù)大小的影響[9]。因此,選擇K?Means聚類法對住院費用進行分類,盡可能地避免人為因素的干擾。本研究以山西省運城市某三級甲等醫(yī)院2017年—2019年腦卒中住院病人為研究對象,對腦卒中入院特征和住院費用進行針對性的分析,對腦卒中住院費用的影響因素進行探究,對于不同模型中篩選出的影響因素進行重要性排序,從而找出最重要的影響因素,旨在為腦卒中防治和減少疾病負擔提供實證分析依據(jù)。
1.1資料來源數(shù)據(jù)來源于山西省某三級甲等醫(yī)院2017年1月—2019年12月全年住院病人中疾病診斷編碼為I60~I64開頭的病人2 042例,收集腦卒中住院檔案首頁的關鍵信息,包括社會人口學特征(住院號、性別、年齡、婚姻狀況、職業(yè)等)、臨床特征(門診診斷名稱、住院天數(shù)、藥物過敏等)、醫(yī)療付費方式、總費用以及各項醫(yī)療服務費用(藥品費、治療費、護理費、檢查費、衛(wèi)生材料費等)等。為保證研究數(shù)據(jù)的準確性,使分析結(jié)果更真實、可靠,對數(shù)據(jù)進行了預處理,剔除存在重要變量缺項、漏項以及有邏輯錯誤的病例,剔除極端值,如住院總費用低于100元或超過均數(shù)±3個標準差范圍的病例,剔除病案質(zhì)量為乙、丙或空缺的病例。
1.2研究方法
1.2.1統(tǒng)計分析方法運用SPSS 24.0軟件進行統(tǒng)計學分析。對住院費用進行正態(tài)性分析,發(fā)現(xiàn)其呈偏態(tài)分布,因此對連續(xù)型變量采用Spearman秩相關分析進行單因素分析,對分類變量采用非參數(shù)檢驗(Mann?Whitney檢驗、Kruskal?Wallis檢驗)。運用R軟件建立隨機森林、支持向量機、Logistic回歸模型。
1.2.2模型的構(gòu)建與評價指標選用3種應用較為廣泛的機器學習算法,即隨機森林、支持向量機和Logistic回歸,比較3種分類算法基于已有變量信息對腦卒中住院費用高低的分類。為了比較3種分類算法的分類效果,采用分層抽樣,選擇低費用組和高費用組70%的樣本作為訓練集建立模型,其余30%樣本作為測試集評估模型性能。將3種方法在同一訓練集上構(gòu)建分類預測模型,并利用測試集數(shù)據(jù)進行預測,探究不同模型中住院費用影響因素排序的差異。通過靈敏度、特異度、準確度、受試者工作特征曲線下面積(AUC)和G?means對模型性能進行評價。
1.2.3變量離散化處理采用K?means聚類法將因變量(冠心病住院費用)分為低費用組和高費用組(低費用組=0,高費用組=1),將年齡、住院次數(shù)和住院天數(shù)進行離散化處理,見表1。
表1 腦卒中住院費用影響因素的變量賦值情況
2.1腦卒中病人住院費用的基本構(gòu)成本研究涵蓋2017年—2019年數(shù)據(jù),為了減少居民消費價格指數(shù)(consumer price index,CPI)帶來的影響,根據(jù)中國國家統(tǒng)計局發(fā)布的CPI指數(shù)對費用進行調(diào)整,3年的CPI指數(shù)分別是101.6,102.1和102.9。腦卒中病人次均住院費用中位數(shù)為20 430.55元,其中藥品費和衛(wèi)生材料費所占比例排在前2位,分別占總費用的47.15%和14.75%,詳見表2。
表2 2017年—2019年腦卒中病人次均住院費用情況(M)
2.2腦卒中病人住院費用影響因素的單因素分析(見表3)
表3 腦卒中病人住院費用影響因素的單因素分析(n=2 042)
2.3K?Means聚類過程及結(jié)果(見表4)
表4 腦卒中病人總住院費用K?means聚類結(jié)果 單位:元
2.4腦卒中病人住院費用影響因素的統(tǒng)計模型擬合結(jié)果在K?means聚類的基礎上,將單因素分析中篩選的13個自變量納入Logistic回歸模型、隨機森林和支持向量機模型。變量中包括4個二分類變量、9個多分類變量,處理時將9個多分類變量轉(zhuǎn)化成啞變量,采用二元Logistic回歸模型進行分析預測。隨機森林模型的建立主要取決于兩個重要參數(shù):mtry(隨機選擇特征的數(shù)目)和ntree(樹的數(shù)目)[8]。經(jīng)驗證,本研究中參數(shù)mtry設置為4,ntree設置為1 000時,隨機森林模型表現(xiàn)最佳。在解決樣本量較少,同時又是非線性的高維數(shù)據(jù)的分類問題時,支持向量機模型較其他模型更有優(yōu)勢,表現(xiàn)出預測精度較高的優(yōu)點。針對不同特征的數(shù)據(jù)集選擇適宜的核函數(shù),適當?shù)臄?shù)據(jù)預處理以及選擇最優(yōu)的參數(shù),都可以極大地改善支持向量機的性能。經(jīng)驗證,在本研究選擇sigmoid核函數(shù),將gamma的值設為0.01,cost的值設為100,此時模型分類效果更優(yōu)秀。比較3個模型的輸出結(jié)果,發(fā)現(xiàn)腦卒中住院費用影響因素的重要性排序在不同模型中存在差異:住院天數(shù)在3個模型中次序一致,腦卒中分型、是否手術、科室、職業(yè)、年份、付費方式、藥品零加成政策前后在3個模型中次序基本一致,而科室是否一致、年齡、性別、入院途徑、住院次數(shù)在3個模型中次序不一致。詳見表5。
表5 腦卒中病人住院費用影響因素的統(tǒng)計模型擬合排序結(jié)果
2.53種模型性能比較采用同一訓練集構(gòu)建隨機森林、支持向量機、Logistic回歸的腦卒中住院費用預測模型,應用于同一測試集數(shù)據(jù),比較各模型的預測效果,詳見表6。
3.1支持向量機模型的綜合性能優(yōu)于其他2種模型本研究結(jié)果表明,隨機森林模型和支持向量機模型比傳統(tǒng)Logistic回歸模型性能更優(yōu),隨機森林模型的特異度最高(93.81%),支持向量機模型靈敏度、G?means及AUC表現(xiàn)最好。在以往的大多醫(yī)療費用研究中,學者們較多選擇多元回歸分析等傳統(tǒng)統(tǒng)計方法,但這類統(tǒng)計方法都有著嚴格的應用條件,如線性、獨立、正態(tài)、方差一致性。醫(yī)療數(shù)據(jù)的復雜性和高維性等特點,使其很難達到正態(tài)性、方差一致性等要求,在多元線性回歸等傳統(tǒng)方法中引入偏態(tài)數(shù)據(jù),較大可能得出錯誤結(jié)論。支持向量機是近年來基于統(tǒng)計理論和結(jié)構(gòu)風險最小化原則而開發(fā)的一種機器學習算法,對數(shù)據(jù)要求較少,可以很好地處理高維和復雜的資料,如醫(yī)療數(shù)據(jù),同時還具備較好的泛化能力,其模型的建立是一個核函數(shù)和最佳參數(shù)選擇的過程,適宜的核函數(shù)選擇和參數(shù)的優(yōu)化能夠顯著提高預測精度[10]。本研究結(jié)果證實,支持向量機對住院費用的建模分類和預測具有有效性和適用性,且分類效率高,模型穩(wěn)定性強,在醫(yī)療領域有較好的推廣前景和發(fā)展空間。
3.2藥品零加成政策小有成效,但結(jié)構(gòu)合理性仍需加強本研究結(jié)果顯示,藥品費呈現(xiàn)逐年小幅下降趨勢,這與國家的藥品政策密不可分。2017年7月山西省公立醫(yī)院實行藥品零加成政策,降低藥品費用得到有力的政策支持。但藥品費在腦卒中住院費用中占比仍然最高,與其他學者研究結(jié)果[11]相似,高于國外水平[12]。另外,治療費3年年均占比約12%,護理費年均占比約5%,遠低于藥品費占比,且治療費和護理費呈逐年下降趨勢,這與公立醫(yī)院的改革方向不一致,可從側(cè)面反映出技術服務的價值認可度不高,醫(yī)務人員勞動價值未能充分體現(xiàn),費用結(jié)構(gòu)不合理,急需探索降低藥費比重、合理用藥的措施,應在控制住院總費用和藥品費的基礎上繼續(xù)降低藥占比,避免增加醫(yī)療經(jīng)濟負擔。同時,需要進一步完善補償機制,提高技術勞務收費的比重,保障醫(yī)務人員的合理收入,使其在醫(yī)療行為中的貢獻真正得到體現(xiàn)。本研究結(jié)果還發(fā)現(xiàn),3年間檢查費在占比與數(shù)值均有所上升,與陳積標等[13]研究結(jié)果類似。提示醫(yī)院管理者應當在運營管理上實現(xiàn)透明化、信息化,做好醫(yī)院內(nèi)部的成本管控,從粗放管理轉(zhuǎn)為精細化管理[14],制定措施規(guī)范檢查和診療方案,避免出現(xiàn)由“以藥養(yǎng)醫(yī)”轉(zhuǎn)換為“以檢驗、衛(wèi)生材料養(yǎng)醫(yī)”的現(xiàn)象,進一步保障參保利益,提高老百姓的獲得感[15]。
3.3腦卒中病人住院費用的影響因素本研究選用單因素分析篩選出的變量建立隨機森林、支持向量機、Logistic回歸模型,對影響因素進行重要程度排序,共13個變量被引入模型,可大致分為3類不同特征因素:客觀因素(年份、藥品零加成政策前后)、個體因素(性別、年齡、職業(yè)、付費方式、入院途徑、腦卒中分型)以及臨床因素(住院天數(shù)、住院次數(shù)、科室、科室是否一致、是否手術)。個體因素大多取決于自身情況及主觀意愿,其中對于住院費用影響較大的為腦卒中分型。出血性腦卒中病情兇險且常伴有意識障礙,出血量大于30 mL時需采取手術治療[16],術后長期康復治療以及可能發(fā)生并發(fā)癥(腦室出血伴腦積水、靜脈血栓形成等),同時還伴隨住院天數(shù)的增加,都是造成費用增高的原因,加重了個人及家庭的經(jīng)濟負擔。職業(yè)在影響因素中的排名也較為靠前,本研究數(shù)據(jù)來源于運城市三級甲等綜合型醫(yī)院,數(shù)量較多且全面,數(shù)據(jù)分析也具有較好的代表性。根據(jù)職業(yè)分布來看,農(nóng)民和工人占75.6%,且這類人群的次均住院費用高于其他職業(yè)。這類人群的工作生活環(huán)境存在較多的危險因素,如忽視自身保健、長期體力勞動等,他們普遍缺乏健康意識,對于基層衛(wèi)生服務的利用率不高,部分社區(qū)或鄉(xiāng)鎮(zhèn)衛(wèi)生院的衛(wèi)生服務可及性也有所缺乏[17],長期積累導致病情加重,一定程度上增加了醫(yī)療支出。提示醫(yī)療機構(gòu)可以依據(jù)本院就診人群的分布特征采取針對性的措施,加強與社區(qū)服務中心、鄉(xiāng)鎮(zhèn)衛(wèi)生院的聯(lián)動合作,依據(jù)早診早治的方針,深入鄉(xiāng)鎮(zhèn),安排專家開展專題講座,定期組織巡診義診等。同時,當?shù)匦l(wèi)生部門也要因地制宜,統(tǒng)籌規(guī)劃好各級醫(yī)療機構(gòu)的職責,對于腦卒中這類慢性病,需要充分發(fā)揮社區(qū)衛(wèi)生中心在腦卒中防治中的作用,加強慢性病的一級、二級預防工作,立足社區(qū),做好重點人群的健康管理、健康教育工作,加大對基層護理人員的培訓力度,更好地指導重點人群熟悉日常保健措施以及掌握疾病的應急處理措施,盡可能地減少出血性腦卒中這類危急病情的發(fā)生,最大限度地保護群眾生命健康。
醫(yī)療因素中各因素排名均較靠前,其中住院天數(shù)排第1位,與王婷婷等[18?19]研究結(jié)果一致。有研究表明,將三級醫(yī)院的平均住院日從20 d減少到7 d,可以降低49%的住院費用[20]。住院天數(shù)的不必要延長,例如等待檢查或手術的住院天數(shù),都會伴隨著護理、診查、床位等費用的增加,可能導致住院總費用上升。醫(yī)療機構(gòu)應當采取綜合性的措施提高臨床科室和檢查科室之間的有效配合,合理減少住院天數(shù),長期住院會增加醫(yī)院感染和并發(fā)癥的風險,病情反復,遷延不愈。另外,腦卒中這類慢性病的特征決定了大部分病人出院后都要進行一段時間的康復治療,康復治療可以在一級、二級醫(yī)院或社區(qū)、鄉(xiāng)鎮(zhèn)衛(wèi)生服務中心完成,體現(xiàn)出分級診療的重要性,需要上級醫(yī)院與下級醫(yī)療機構(gòu)保持良好的配合和溝通,上級醫(yī)院把控好出院指標,下級醫(yī)院做好護理、康復的配套工作,不僅可以減輕病人的經(jīng)濟負擔,同時也加快了三級醫(yī)院的病床周轉(zhuǎn)率,緩解病床緊張現(xiàn)象,提高資源利用效率。
[1] 趙慶,吳茜,孫曉,等.腦卒中患者延續(xù)性護理質(zhì)量評價指標體系的構(gòu)建[J].中華護理雜志,2020,55(2):171-176.
[2] 費囡.腦卒中再住院患者病恥感對健康促進生活方式的影響研究[J].中國醫(yī)院統(tǒng)計,2020,27(1):55-58;63.
[3] 王隴德,劉建民,楊弋,等.我國腦卒中防治仍面臨巨大挑戰(zhàn)——《中國腦卒中防治報告2018》概要[J].中國循環(huán)雜志,2019,34(2):105-119.
[4] 中國心血管健康與疾病報告編寫組.中國心血管健康與疾病報告2020概要[J].中國循環(huán)雜志,2021,36(6):521-545.
[5] GBD Causes of Death Collaborators.Global,regional,and national age-sex specific mortality for 264 causes of death,1980-2016:a systematic analysis for the Global Burden of Disease Study 2016[J].Lancet,2017,390(10100):1151-1210.
[6] 吳亞哲,陳偉偉.中國腦卒中流行概況[J].心腦血管病防治,2016,16(6):410-414.
[7] 高峰,鄭二維,張清芝,等.基于決策樹模型腦卒中患者住院費用DRG分組實證研究[J].中國衛(wèi)生經(jīng)濟,2020,39(4):33-35.
[8] 于大海,李金,羅艷虹,等.隨機森林模型和決策樹模型在肝硬化上消化道出血預后中的應用[J].中國衛(wèi)生統(tǒng)計,2019,36(2):162-166.
[9] YAN X,CHOWDHURY N A.Mid-term electricity market clearing price forecasting:a multiple SVM approach[J].International Journal of Electrical Power & Energy Systems,2014,58:206-214.
[10] 王婭玲,張鐸齡,張譯丹,等.多種統(tǒng)計模型在冠心病醫(yī)療費用影響因素中的應用與比較[J].中國衛(wèi)生事業(yè)管理,2017,34(3):198-200;204.
[11] 錢治軍,趙艷芳,何倩,等.上海市6所三級甲等醫(yī)院腦卒中住院患者費用分析[J].解放軍醫(yī)院管理雜志,2014,21(10):978-980.
[12] YONEDA Y,UEHARA T,YAMASAKI H,.Hospital-based study of the care and cost of acute ischemic stroke in Japan[J].Stroke,2003,34(3):718-724.
[13] 陳積標,況杰,易應萍,等.2015—2019年江西省缺血性腦卒中患者特征及住院費用分析[J].現(xiàn)代預防醫(yī)學,2021,48(8):1515-1519.
[14] 王俊嬌,夏敬軒.公立醫(yī)院管理信息化探索與研究[J].中國管理信息化,2020,23(18):97-98.
[15] 王予,徐沛瑤,朱敏.高血壓患者住院費用及其影響因素研究[J].中國衛(wèi)生統(tǒng)計,2019,36(4):574-577.
[16] 陳若青,馬再鴻,王漫云.腦卒中首發(fā)病人住院費用分析[J].中國衛(wèi)生經(jīng)濟,2008,27(11):52-54.
[17] 馬婧,徐愛軍.四種基本醫(yī)療保險制度下高血壓患者衛(wèi)生服務利用狀況研究[J].中國全科醫(yī)學,2018,21(28):3518-3522.
[18] 王婷婷,于麗華,郎婧婧,等.基于結(jié)構(gòu)方程模型的肺癌手術患者住院費用影響因素分析[J].中國衛(wèi)生經(jīng)濟,2019,38(6):61-63.
[19] 譚禮萍,吳曉云,鄭銀雄,等.腦卒中患者住院費用影響因素的通徑分析[J].中國衛(wèi)生統(tǒng)計,2012,29(4):574-575.
[20] WEI J W,HEELEY E L,JAN S,.Variations and determinants of hospital costs for acute stroke in China[J].PLoS One,2010,5(9):e13041.
Influencing factors of hospitalization costs of stroke patients in a hospital in Shanxi province
ZHOULiye, XIAXinjing, GUOZhifei, SUNMengjiao, YUHongmei
Shanxi Medical University, Shanxi 030600 China
stroke; hospitalization costs; disease burden; influencing factors; machine learning
YU Hongmei, E?mail: yu@sxmu.edu.cn
10.12102/j.issn.1009-6493.2023.03.025
國家自然科學基金項目,編號:81973154
周立業(yè),副教授,博士
余紅梅,E?mail:yu@sxmu.edu.cn
周立業(yè),夏鑫婧,郭志飛,等.山西省某醫(yī)院腦卒中病人住院費用的影響因素[J].護理研究,2023,37(3):517?521.
(收稿日期:2022-04-02;修回日期:2023-01-18)
(本文編輯 蘇琳)