韓江霞
(河南廣播電視大學(xué) 工商管理學(xué)院,河南 鄭州 450008)
城市住院患者醫(yī)療費用支付的影響因素研究
韓江霞
(河南廣播電視大學(xué) 工商管理學(xué)院,河南 鄭州 450008)
通過收集某地區(qū)城市住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù),采用SPSS Clementine軟件中的特征選擇算法篩選出對醫(yī)療費用支付有重要影響的屬性,采用支持向量機(jī)方法研究住院天數(shù)、疾病類型等對醫(yī)療費用支付的影響指數(shù)。從而更好地了解影響城市住院患者醫(yī)療費用支付的主要因素。并提出從有效縮短住院時間,完善醫(yī)療保障制度、實行單病種限額付費方式等方面來合理控制醫(yī)療費用支付的保障策略。
住院患者;醫(yī)療費用;影響因素
近年來,我國經(jīng)濟(jì)發(fā)展速度驚人,與此同時,卻面臨著人口老齡化加劇、重特大疾病患者增加等問題。這使得我國居民對醫(yī)療的需求不斷增加,造成醫(yī)療需求大于醫(yī)療供給,從而導(dǎo)致很多居民不得不面臨“看病難,看病貴”[1]問題。醫(yī)療費用支付的日益增加,成為國家和人民共同關(guān)注的焦點,也成為眾多學(xué)者關(guān)注的研究領(lǐng)域。本文收集2015年某地區(qū)城市住院患者相關(guān)數(shù)據(jù),運用電子商務(wù)中數(shù)據(jù)挖掘相關(guān)理論知識和方法,找出影響城市住院患者醫(yī)療費用支出的主要因素,探討有效抑制醫(yī)療費用上漲的策略,為醫(yī)療費用的研究提供參考依據(jù)。
(一)研究對象
本文收集到2015年某地區(qū)城市居民住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù)。[2]收集的數(shù)據(jù)來自5224個家庭16113個人。未達(dá)到研究的合理性和科學(xué)性,應(yīng)剔除兒童、因生育孩子住院的婦女研究對象,并剔除家庭地址、住院編號等無關(guān)屬性。最終研究范圍包括374例城市住院患者的13個屬性:家庭人均收入、性別、年齡、就業(yè)狀況、醫(yī)院類型、文化程度、疾病類型、住院天數(shù)、鍛煉身體情況、出院原因、住院醫(yī)療費用合計、付款方式和住院醫(yī)療費用支付。[3]
(二)研究方法
用于影響因素分析的方法有很多,除了傳統(tǒng)的Logistic回歸法,數(shù)據(jù)挖掘中的人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法也都可以用于影響因素的篩選和排序。本文收集的2015年某地區(qū)城市住院患者數(shù)據(jù)包含了13個屬性,具有多維性的特點,分析變量和目標(biāo)值不具備正態(tài)性和方差齊的特征。相比于Logistic回歸法、人工神經(jīng)網(wǎng)絡(luò)法,數(shù)據(jù)挖掘中的支持向量機(jī)法模型和原理,與研究數(shù)據(jù)的方差齊、正態(tài)性等特點不相關(guān),只與研究對象的數(shù)量相關(guān)。因此,本文通過SPSS Clementine軟件,采用特征選擇算法篩選出對醫(yī)療費用支付有重要影響的因素;采用支持向量機(jī)方法對關(guān)鍵影響因素進(jìn)行重要性排序。[4]
本文通過特征選擇、K-means聚類分析、支持向量機(jī)、精確度評價四個步驟進(jìn)行2015年某地區(qū)城市住院患者醫(yī)療費用支付影響因素的分析。
(一)特征選擇
本文收集的2015年某地區(qū)城市住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù),在數(shù)據(jù)屬性上,雖然人為剔除了部分不相關(guān)屬性,但仍存在屬性重復(fù)、屬性不相關(guān)的情況。本文通過SPSS Clementine軟件[5],運用特征選擇算法,針對研究數(shù)據(jù),從13個屬性中剔除冗余和不相關(guān)的屬性,降低研究數(shù)據(jù)的維度。
特征選擇算法經(jīng)過篩選、分級、選擇三個過程。篩選過程,即剔除存在空缺值、不合理值的相關(guān)研究對象和屬性;分級過程,即用important值標(biāo)記每個分析變量相較于目標(biāo)值的重要指數(shù);選擇過程,即根據(jù)用戶要求,選擇參與建模的分析變量。其中,在分級過程中,研究對象的所有分析變量的重要性指數(shù)可以分為三類:important(重要)、marginal(一般重要)和unimportant(不重要)。根據(jù)數(shù)據(jù)挖掘和特征選擇相關(guān)理論知識,我們將小于0.9的分析變量定義為unimportant,大于0.9小于等于0.95的分析變量定義為marginal,而大于0.95小于等于1.0的分析變量定義為important。我們針對374例城市住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù),通過特征選擇算法建模,特征選擇的結(jié)果如下圖1所示。
圖1中,有7個分析變量的重要性指數(shù)被定義為了important,分別是住院醫(yī)療費用合計、住院天數(shù)、付款方式、疾病類型、醫(yī)院類型、出院原因、就業(yè)狀況;有5個分析變量的重要性指數(shù)被定義為了unimportant,分別是年齡、家庭人均收入、性別、文化程度、鍛煉身體次數(shù)。根據(jù)研究對象特征,本文選取重要性指數(shù)被定義為了important的7個分析變量作為特征選擇算法的結(jié)果,用于后續(xù)進(jìn)一步建模研究。
(二)K-means聚類分析
特征選擇建模能夠?qū)⒂绊戓t(yī)療費用支付的重要因素篩選出來,但不能夠全面考慮數(shù)據(jù)本身對研究結(jié)果的可靠性和實際性影響,這在一定程度上,會使研究結(jié)果精確度降低。因此,本文在特征選擇的基礎(chǔ)上,采用K-means聚類分析對2015年某地區(qū)城市住院患者醫(yī)療費用支付數(shù)據(jù)進(jìn)行科學(xué)分類,以降低數(shù)據(jù)支付維數(shù),提高精確度。
本研究采用K-means聚類算法對研究對象的目標(biāo)值分別聚為2類、3類、4類和5類,進(jìn)行結(jié)果分析。聚為2類時,分別有353、21個數(shù)據(jù),數(shù)據(jù)差異較大,分布合理。聚為3、4、5類時,出現(xiàn)了在一個或兩個類別中僅有極少個數(shù)據(jù)的情況,這被稱為“孤立點”,不具備客觀代表性,會降低支持向量機(jī)建模的精確性。因此,本研究選取將2015年某地區(qū)城市住院患者醫(yī)療費用支付聚為2類。
(三)支持向量機(jī)
圖1 特征選擇算法建模結(jié)果[6]
數(shù)據(jù)挖掘方法中的支持向量機(jī)主要用于對數(shù)據(jù)集的分類和預(yù)測,相比于傳統(tǒng)的Logistic回歸法、人工神經(jīng)網(wǎng)絡(luò)法,不要求數(shù)據(jù)的方差齊和正態(tài)性條件,具有解決多維數(shù)據(jù)、非線性數(shù)據(jù)的特有優(yōu)勢。支持向量機(jī)用于影響因素分析和影響因子排序的基本原理是,將研究數(shù)據(jù)作為建模對象,從特征空間中能夠有效分開兩類樣本的超平面。根據(jù)數(shù)據(jù)挖掘和支持向量機(jī)相關(guān)理論知識,將超平面看作一個分類器,超平面兩端的變量值分別定義為+1和-1,而分析變量在超平面的位置決定了其對目標(biāo)值的影響程度。支持向量機(jī)建模的最終解,旨在找到能將不同分析變量間隔距離最大的平面,即最大間隔分類器。另外,核函數(shù)的設(shè)置是支持向量機(jī)建模的關(guān)鍵問題。SPSSClementine軟件中包含了線性、二層神經(jīng)網(wǎng)絡(luò)、多項式和RBF四種核函數(shù)。本研究選擇RBF核函數(shù)對2015年某地區(qū)城市住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù)進(jìn)行支持向量機(jī)建模。將特征選擇算法選擇的7個分析變量:住院醫(yī)療費用合計、住院天數(shù)、付款方式、疾病類型、醫(yī)院類型、出院原因、就業(yè)狀況,作為自變量;醫(yī)療費用支付作為因變量。支持向量機(jī)建模結(jié)果如下圖2所示。
圖2 支持向量機(jī)建模結(jié)果[7]
支持向量機(jī)建模結(jié)果顯示,對于2015年某地區(qū)城市住院患者,醫(yī)療費用支付的的影響因子從大到小排序是:出院原因 0.1554,就業(yè)狀況0.1471,醫(yī)院類型0.1462,住院醫(yī)療費用合計0.1455,住院天數(shù)0.1409,疾病類型0.138,付款方式0.1269。
(四)精確度評價
對于支持向量機(jī)建模結(jié)果的精確度,本文采用損失矩陣,即模型分類或者預(yù)測的正確數(shù)量和錯誤數(shù)量來評價。如下表1是對于二分類問題的損失矩陣表格。其中,P11表示對于類別1正確預(yù)測為類別1的數(shù)量,P01表示對于類別0錯誤的預(yù)測為類別1的數(shù)量,P10表示對于類別1錯誤的預(yù)測為類別0的數(shù)量,P00表示對于類別0正確預(yù)測為類別的數(shù)量。即:二分類問題中,預(yù)測正確的數(shù)量為P11+P00,預(yù)測錯誤的數(shù)量為P10+P01。支持向量機(jī)預(yù)測和分類的精確度可以表示為:
表1 二分類問題的損失矩陣
對于2015年某地區(qū)城市住院患者醫(yī)療費用支付相關(guān)數(shù)據(jù)建立支持向量機(jī)模型時,P11、P01、P10、P00的取值分別是346、3、7、18,經(jīng)計算,模型精確度為97.33%。因此,支持向量機(jī)模型用于城市住院患者醫(yī)療費用支付影響因素的分析具有較高的精確度。
通過支持向量機(jī)建模結(jié)果可知,2015年某地區(qū)城市住院患者醫(yī)療費用支付的最重要的影響因素是患者的出院原因,這是因為在同等條件下,久病未愈的患者支付的住院醫(yī)療費用一般高于病愈后醫(yī)生要求出院的患者;就業(yè)狀況對醫(yī)療費用支付也有較大的影響,就業(yè)穩(wěn)定的患者一般情況下比就業(yè)不穩(wěn)定的患者更樂于選擇較好的醫(yī)院、病房、醫(yī)師,因此產(chǎn)生的支付費用也相對較高;醫(yī)院類型對醫(yī)療費用支付的影響非常直接,一般三甲醫(yī)院要比普通醫(yī)院的環(huán)境、服務(wù)更好,收費也相應(yīng)較高;醫(yī)療費用合計越多,在扣除相關(guān)醫(yī)療報銷的基礎(chǔ)上,患者支付費用也相對較多;患者住院天數(shù)越多,接受醫(yī)療服務(wù)和治療越多,支付費用也相對較多[9];重特大疾病或者罕見復(fù)雜的疾病類型,患者支付費用也相對較高;付款方式對支付費用的影響也是顯而易見的,自費醫(yī)療患者支付費用相比采用商業(yè)保險、城市職工基本醫(yī)療保險等方式付款的費用較高。基于此,為合理控制醫(yī)療費用支付,政府和醫(yī)療機(jī)構(gòu)可以從以下兩方面做出改善。[10]
(一)減少無效住院天數(shù)
住院時間直接影響患者診斷治療費用、藥費、護(hù)理費、床位費等,進(jìn)而影響患者的醫(yī)療服務(wù)總費用?;颊咦≡簳r間長,主要有以下情形:患者住院前期檢查周期長、患者出現(xiàn)并發(fā)癥、患者手術(shù)后康復(fù)時間長、患者為了獲得較高的醫(yī)療保險賠償額度等。
醫(yī)療服務(wù)機(jī)構(gòu)應(yīng)該盡量減少患者無效住院時間。例如,將省、市級醫(yī)院的常見病種住院診斷和服務(wù)下放到社區(qū)醫(yī)院,規(guī)范醫(yī)生診斷行為,禁止醫(yī)生將患者的小病當(dāng)作大病醫(yī)治,杜絕患者及醫(yī)生在醫(yī)療保險中的道德風(fēng)險,從而在一定程度上減少患者無效住院時間,控制醫(yī)療服務(wù)費用支付的不斷上漲。
(二)完善醫(yī)療保障制度,實施單病種限額付費制度
支付方式對醫(yī)療費用的高低有較大影響。一方面,自建立城市職工醫(yī)療保險和城市居民醫(yī)療保險以來,我國醫(yī)療費用支付有所降低。另一方面,自費醫(yī)療患者支付費用相比采用商業(yè)保險、城市職工基本醫(yī)療保險等方式付款的費用高。基于這兩方面,很多醫(yī)療機(jī)構(gòu)和醫(yī)護(hù)人員會針對自費醫(yī)療的患者給予過度服務(wù)、過度檢查。
為有效避免上述趨勢的加劇,我國政府應(yīng)繼續(xù)不斷修改和完善我國醫(yī)療保障制度。我們不僅要對現(xiàn)有醫(yī)療保險制度進(jìn)行有效全面監(jiān)督實施,還要努力做好城市職工醫(yī)保與城市居民醫(yī)保的銜接,探索異地就醫(yī)、異地結(jié)算制度。除此之外,我國政府應(yīng)出臺相關(guān)政策,對常見病種實施單病種醫(yī)療限額付費,限定常見病種的最高支付標(biāo)準(zhǔn),從而達(dá)到控制醫(yī)療支付的過度增長。
[1]杜修立,俞喬.住院醫(yī)療費用的影響因素研究:基于醫(yī)院樣本的實證分析[J].中國衛(wèi)生經(jīng)濟(jì),2011,30(2):59-61.
[2]李矛,郝艷華,吳紅宇.醫(yī)保與非醫(yī)保梗死患者費用比較與影響因素分析[J].中國衛(wèi)生經(jīng)濟(jì),2013,32(11):27-29.
[3]辛一琪,胡正路.急性心肌梗死患者住院費用構(gòu)成及影響因素分析[J].中國衛(wèi)生經(jīng)濟(jì),2011,30(8):66-69.
[4]沈培.基于數(shù)據(jù)挖掘的甲肝醫(yī)療費用影響因素與控制策略研究[D].武漢:華中科技大學(xué)管理學(xué)院研究所,2012.
[5]熊平.數(shù)據(jù)挖掘算法與Clementine實踐[M].北京:清華大學(xué)出版社,2011:15-68.
[6]薛薇,陳歡歌.基于 Clementine的數(shù)據(jù)挖掘[M].北京:中國人民大學(xué)出版社,2012.
[7]沈培,張吉凱,張子剛.基于支持向量機(jī)的單病種醫(yī)療費用控制研究[J].中國衛(wèi)生經(jīng)濟(jì),2012,31(3):89-91.
[8]韓江霞.醫(yī)療費用支付影響因素差異性研究[D].長春:吉林大學(xué)商學(xué)院研究所,2014.
[9]江鴻,梅文華,夏蘇建.再生障礙性貧血患者住院費用及影響因素分析[J].中國衛(wèi)生經(jīng)濟(jì),2013,32(3):40-42.
[10]呂淼,柯曼綦.關(guān)于影響我國農(nóng)村居民醫(yī)療費用支付因素的探討[J].北方經(jīng)濟(jì),2008,(2):18-24.
F201
A
1671-2862(2017)03-0022-04
2016-11-25
韓江霞,女,河南鄭州人,碩士研究生,河南廣播電視大學(xué)助教,研究方向:電子商務(wù)、數(shù)據(jù)挖掘等。