石義全 錢振華 成 剛
1.山東省煙臺市疾病預(yù)防控制中心 山東煙臺 264003
2.北京科技大學(xué) 北京 100083
3.北京大學(xué)中國衛(wèi)生發(fā)展研究中心 北京 100191
效率評價是衛(wèi)生體系研究的重要內(nèi)容,醫(yī)療服務(wù)效率是衛(wèi)生體系效率評價的一個重要環(huán)節(jié)。醫(yī)院是醫(yī)療服務(wù)提供的主要場所,根據(jù)2011年《中國衛(wèi)生統(tǒng)計年鑒》的數(shù)據(jù),醫(yī)院提供的門診服務(wù)數(shù)量約占所有醫(yī)療機構(gòu)(不包括村衛(wèi)生室)門診服務(wù)數(shù)量的1/2,醫(yī)院提供的住院服務(wù)數(shù)量占所有醫(yī)療機構(gòu)住院服務(wù)數(shù)量的60%以上。在衛(wèi)生效率評價的國內(nèi)外文獻中,數(shù)量最多的是對醫(yī)院效率的評價。由于醫(yī)院是多投入、多產(chǎn)出的生產(chǎn)單位,因此,醫(yī)院效率評價最常用的方法是能夠處理多指標(biāo)的兩類評價方法:數(shù)據(jù)包絡(luò)分析(Data envelopment analysis,DEA)和隨機前沿分析(Stochastic frontier analysis,SFA)[1-2]。
DEA是非參數(shù)技術(shù)效率評價方法,對于分析多投入、多產(chǎn)出的問題具有明顯優(yōu)勢,自1978年Charnes等人創(chuàng)立該方法以來[3],DEA在各領(lǐng)域得到了廣泛的應(yīng)用[4-5]。1981年Sherman首先將DEA應(yīng)用于醫(yī)院效率評價[6],此后在衛(wèi)生領(lǐng)域的應(yīng)用越來越多[7-12]。DEA雖然具有特殊的優(yōu)勢,但也有明顯的弱點[1-2]。首先,投入產(chǎn)出指標(biāo)數(shù)量和樣本數(shù)量嚴(yán)重影響DEA分析結(jié)果[13-14]:對于同一樣本,投入產(chǎn)出指標(biāo)數(shù)量增加會使有效單元比例和平均效率值增加;對于相同的投入產(chǎn)出投標(biāo),在樣本數(shù)量較少時,減少樣本數(shù)量也會使有效單元比例和平均效率值增加。其次,在可變規(guī)模報酬(Variable returns to scale,VRS)模型中,當(dāng)樣本數(shù)量與指標(biāo)數(shù)量的比值較小時,默認有效會成為影響分析結(jié)果的突出問題。默認有效是指被評價的決策單元由于沒有相似的參比對象而自動被判定為有效。在DEA模型中,選擇恰當(dāng)?shù)耐度氘a(chǎn)出指標(biāo)是得出正確結(jié)論的前提。
近年來,DEA方法在國內(nèi)衛(wèi)生領(lǐng)域中的應(yīng)用越來越多,但是在應(yīng)用中往往忽略了DEA的上述特點,從而得出不恰當(dāng)?shù)慕Y(jié)論。常見問題包括:(1)指標(biāo)選擇不當(dāng),例如在健康指標(biāo)中用總?cè)丝谒劳雎蚀鎷雰核劳雎剩?5-17];(2)投入產(chǎn)出指標(biāo)數(shù)量過多,在DEA效率區(qū)分度很低的情況下,得出總體效率較高的結(jié)論[18];(3)忽略了對默認有效問題的分析,這是一個普遍存在的問題。另外,在效率結(jié)果的分析中,往往習(xí)慣性地劃分為東、中、西部[16,19,20],而效率高低的真實分布未必如此,這樣就會影響對潛在影響因素的發(fā)現(xiàn)。本文的目的是針對上述問題,通過實證分析探討在應(yīng)用DEA方法評價醫(yī)院效率時,投入產(chǎn)出指標(biāo)數(shù)量對分析結(jié)果的影響,并通過實例說明專題地圖在分析效率地域分布特征中的作用。
分析數(shù)據(jù)來自2011年《中國衛(wèi)生統(tǒng)計年鑒》,包括:2010年各地區(qū)衛(wèi)生人員數(shù)、2010年各地區(qū)醫(yī)療機構(gòu)床位數(shù)、2010年各地區(qū)醫(yī)療機構(gòu)門診服務(wù)情況以及2010年各地區(qū)醫(yī)療機構(gòu)住院服務(wù)情況。
分析數(shù)據(jù)包含了31個決策單元(省、直轄市、自治區(qū)),依據(jù)文獻中關(guān)于樣本數(shù)量與指標(biāo)數(shù)量關(guān)系的規(guī)則[13-14,21],投入和產(chǎn)出的指標(biāo)數(shù)量最多可以達到10個。為了比較指標(biāo)數(shù)量對效率分析結(jié)果的影響,本文采用不同的指標(biāo)組合,共形成8個模型,指標(biāo)數(shù)量分別為3~10個(表1)。
表1 不同投入和產(chǎn)出指標(biāo)組合
指標(biāo)之間的高度相關(guān)(共線性)并不會影響DEA模型的結(jié)果,但為了觀察指標(biāo)間相關(guān)程度在指標(biāo)數(shù)量與分析結(jié)果關(guān)系中的作用,表2列出了投入指標(biāo)之間的相關(guān)系數(shù),表3列出了產(chǎn)出指標(biāo)之間的相關(guān)系數(shù)。
表2 投入指標(biāo)之間的相關(guān)系數(shù)矩陣
表3 產(chǎn)出指標(biāo)之間的相關(guān)系數(shù)矩陣
根據(jù)健康生產(chǎn)理論與實證分析,衛(wèi)生體系的生產(chǎn)技術(shù)是規(guī)模報酬可變的,因此選擇VRS模型,即BCC模型。[22-23]對于有效的決策單元采用超效率值、被參比的次數(shù)和總權(quán)重進行綜合評價(詳見本期《衛(wèi)生體系效率評價的概念框架與測量方法——兼論應(yīng)用數(shù)據(jù)包絡(luò)分析的方法學(xué)問題》)。模型方向選擇產(chǎn)出導(dǎo)向。DEA分析工具為MaxDEA軟件。采用專題地圖展示效率的地區(qū)分布特征,制圖軟件采用ArcGIS。
從模型1到模型8投入產(chǎn)出指標(biāo)的數(shù)量由3個逐步增加到10個,效率評價結(jié)果的區(qū)分度逐漸降低:有效單元數(shù)量由5個增加到17個;默認有效單元的數(shù)量由3個增加到5個;最小效率值由0.520上升到0.621,均值由0.867 上升到 1.056(表 4)。
效率整體情況可通過效率均值來體現(xiàn),由模型1得出的效率均值最小,為0.867,但模型1的投入指標(biāo)僅包含了衛(wèi)生人力一個方面,不夠全面。模型2的投入指標(biāo)包含人力和床位數(shù)兩個方面,產(chǎn)出指標(biāo)包含門診和住院兩個方面,這是醫(yī)院效率評價文獻中最常用的指標(biāo)組合。模型3在模型2的基礎(chǔ)上增加了住院手術(shù)數(shù)量,在一定程度上反映了病例的嚴(yán)重程度。模型4—8的結(jié)果中有效單元數(shù)量過多,區(qū)分度較低。因此,用模型2和模型3的結(jié)果判斷整體效率情況更為合適。從模型2和模型3的效率均值(分別為0.944和0.948)看,各省醫(yī)院效率的整體差異不大。兩個模型得出的效率最低的五個省份完全相同,其效率值也幾乎完全相同(除1個省份相差0.002以外,其它4個省份相同),五個省份是山西、黑龍江、吉林、內(nèi)蒙古和遼寧,其效率值分別為0.61、0.69、0.69、0.71、0.73,提示這 5 個省份存在較大的效率提升空間。
表5是被評價為有效的省份被參比的次數(shù)和總權(quán)重。限于篇幅,僅列出了模型1—3的結(jié)果,數(shù)據(jù)和完整的分析結(jié)果可從網(wǎng)上下載(http://www.maxdea.cn/Sharing/DEA_China2010.rar)。
被評價為有效的決策單元(包括默認有效的決策單元)作為標(biāo)桿的重要性可通過被其它決策單元參比的次數(shù)和總權(quán)重來體現(xiàn),被參比次數(shù)越多、總權(quán)重越大,其標(biāo)桿意義越大。廣東、山東和西藏是3個默認有效的省份,其中西藏在所有模型中的超效率值均為1,不存在“超效率”,說明西藏被評價為有效完全是因為其投入指標(biāo)數(shù)值太小,沒有相似的省份進行參比,所以雖然西藏處于生產(chǎn)前沿,但是對其它省份沒有參比的意義。在3個模型中,超效率值最大的均為廣東。在模型1中,被參比次數(shù)最多、總權(quán)重最大的為云南。在模型2和模型3中,被參比次數(shù)最多、總權(quán)重最大的省份是福建省。綜合分析提示,廣東、福建、云南3省的標(biāo)桿意義相對比較突出。
表4 各地區(qū)不同模型的效率值(超效率模型)
表5 有效的省份被其它省份參比的次數(shù)和總權(quán)重
相對而言,模型2和模型3最適宜分析整體效率情況。圖1以模型2和模型3的分析結(jié)果為例,演示了專題地圖在顯示效率分布特征中的作用(由于兩個模型得出效率值差異很小,所以在專題地圖上的分布完全相同)。從專題地圖可以發(fā)現(xiàn),各地區(qū)醫(yī)院效率大致呈現(xiàn)南、中、北的分布特征,效率相對最高的地區(qū)是西南、南部、東南及東部沿海,效率相對最低的地區(qū)是東北、北部,效率中等的地區(qū)是西北和中西部(圖1)。
圖1 醫(yī)院效率的區(qū)域分布(模型2和模型3數(shù)據(jù))
與參數(shù)方法相比,DEA模型對樣本數(shù)量的要求較低。[1]一般遵循的原則是樣本數(shù)量不應(yīng)少于投入和產(chǎn)出指標(biāo)數(shù)量的 3 倍。[13-14,21]在實證研究中,一般情況下研究對象(即樣本)是確定的,投入和產(chǎn)出指標(biāo)的選擇具有一定的彈性。依據(jù)上面的規(guī)則,投入和產(chǎn)出指標(biāo)的數(shù)量要求不超過樣本數(shù)量的1/3,但這一原則是根據(jù)數(shù)據(jù)模擬結(jié)果和效率區(qū)分度的最低要求確定的。在實證研究中,在滿足上述要求的情況下,實際區(qū)分度未必能夠達到分析的需要。
DEA模型中包含的投入和產(chǎn)出指標(biāo),應(yīng)該存在以下關(guān)系:由投入指標(biāo)可以生產(chǎn)出產(chǎn)出指標(biāo),產(chǎn)出指標(biāo)是由投入指標(biāo)生產(chǎn)出來的。但在衛(wèi)生領(lǐng)域,投入和產(chǎn)出之間的關(guān)系并不像工廠的生產(chǎn)車間那樣簡單。以醫(yī)院為例,投入方面主要是衛(wèi)生人員和醫(yī)療設(shè)備,但除此以外,醫(yī)院的基礎(chǔ)設(shè)施建設(shè)、科研投入等也是投入指標(biāo);產(chǎn)出方面主要是門診和住院服務(wù),但除此以外,不同級別的醫(yī)院還可能承擔(dān)著醫(yī)學(xué)教育、健康教育、傳染病防治、對口支援貧困地區(qū)、搶險救災(zāi)等任務(wù)。另外,上述指標(biāo)還需要根據(jù)研究目的進行分解,例如衛(wèi)生人員分解為醫(yī)生、護士、其它技術(shù)人員等,設(shè)備分解為床位、大型設(shè)備等。因此,建立包含100%全要素的DEA模型是不可能的,在實際應(yīng)用中根據(jù)研究目的包含主要的投入產(chǎn)出即可。除模型1的投入指標(biāo)僅包含衛(wèi)生人員一個要素之外,其它7個模型均包含了醫(yī)院生產(chǎn)的主要投入和產(chǎn)出要素。
DEA模型中,投入產(chǎn)出指標(biāo)數(shù)量越多,分析結(jié)果的區(qū)分度越低。投入或產(chǎn)出指標(biāo)之間的相關(guān)度越低,指標(biāo)數(shù)量對區(qū)分度的影響越大。模型6—8的產(chǎn)出指標(biāo)完全相同,區(qū)別在于投入指標(biāo)的衛(wèi)生人力部分不同。在衛(wèi)生人力指標(biāo)中,衛(wèi)生人員數(shù)和其它3個指標(biāo)的相關(guān)系數(shù)均超過了0.99,因此模型6—8的分析結(jié)果差別很小。
對模型區(qū)分度的要求沒有統(tǒng)一的標(biāo)準(zhǔn),不同分析目的對效率區(qū)分度的要求是不同的,如果分析目的是發(fā)現(xiàn)樣本中少數(shù)效率最低的單元,則在區(qū)分度較低的情況下即可滿足分析目的;如果目的是發(fā)現(xiàn)樣本中效率最優(yōu)的少數(shù)單元,則要求更高的區(qū)分度。在一般情況下,被評價為有效的單元數(shù)量不宜超過總數(shù)的1/3。根據(jù)這一標(biāo)準(zhǔn),模型1—3是合適的。但模型1的投入僅包括了衛(wèi)生人力,不符合DEA模型應(yīng)包含主要投入和產(chǎn)出指標(biāo)的規(guī)則。綜合判斷,以省為單位評價醫(yī)院效率時,在8個模型中,模型2和模型3的指標(biāo)選擇是最合理的。
DEA模型指標(biāo)選擇的一個特點是,指標(biāo)之間的共線性(高度相關(guān))的存在不會對模型的穩(wěn)定性和可靠性產(chǎn)生影響。[1]如果在投入(產(chǎn)出)指標(biāo)中增加一個與已有投入(產(chǎn)出)指標(biāo)完全線性相關(guān)的新指標(biāo),分析結(jié)果保持不變。因此,在選擇投入或產(chǎn)出指標(biāo)時無需考慮共線性的問題。
本文用醫(yī)院效率的實際數(shù)據(jù)證明,投入產(chǎn)出指標(biāo)的數(shù)量嚴(yán)重影響DEA模型的分析結(jié)果。在效率區(qū)分度不高的情況下(例如模型6—8和文獻[18]中的結(jié)果),對整體效率和效率前沿的判斷是不可靠的。特別是對于判定為有效的決策單元,即效率前沿,由于存在默認有效的問題,需要結(jié)合超效率值、被參比次數(shù)和總權(quán)重等信息進行綜合的判斷。在數(shù)據(jù)支持的情況下,應(yīng)該通過比較多種投入產(chǎn)出指標(biāo)的組合以檢驗DEA分析結(jié)論的可靠性。
在分析某個指標(biāo)的區(qū)域分布特征時,最常用的方式是將全國31個省份劃分為東、中、西部,這是主要基于經(jīng)濟發(fā)展水平的區(qū)域劃分方式。衛(wèi)生領(lǐng)域的許多研究指標(biāo)會受到社會、經(jīng)濟、地理、文化等因素的共同影響,東、中、西部的區(qū)域劃分方式未必與研究指標(biāo)的真實分布狀況一致。在沒有專門的衛(wèi)生指標(biāo)區(qū)域劃分方法的情況下,應(yīng)首先采用描述性的方式探索指標(biāo)的區(qū)域分布特征。
專題地圖是一種基于地理信息系統(tǒng)的以地圖形式直觀展示分析指標(biāo)地理分布特征的方法,它可以為進一步探索效率區(qū)域分布特征的內(nèi)在因素和進行實證研究提供基礎(chǔ)。通過專題地圖可以明顯地發(fā)現(xiàn),我國醫(yī)院效率的地區(qū)分布并沒有呈現(xiàn)東、中、西的特征,而是南、中、北的特征。這說明既往研究中在分析效率區(qū)域分布特征時先入為主地采用東、中、西的劃分方法是不合適的,而是應(yīng)該先觀察實際分布特征,再探索特征背后的相關(guān)因素。
[1]Jacobs R,Smith P C,Street A.Measuring efficiency in health care:analytic techniques and health policy[M].Cambridge University Press,2006.
[2] Hollingsworth B,Peacock S.Efficiency measurement in health and health care[M].Routledge,2008.
[3]Charnes A,Cooper W W,Rhodes E.Measuring the efficiency of decision making units[J].European Journal of Operational Research,1978,2(4):429-444.
[4]Emrouznejad A,Parker B R,Tavares G.Evaluation of research in efficiency and productivity:A survey and analysis of the first 30 years of scholarly literature in DEA[J].Socio-Economic Planning Sciences,2008,42(3):151-157.
[5]Cook W D,Seiford L M.Data envelopment analysis(DEA)-Thirty years on[J].European Journal of Operational Research,2009,192(1):1-17.
[6]Sherman H D.Measurement of hospital technical efficiency:A comparative evaluation of data envelopment analysis and other efficiency measurement techniques for measuring and locating inefficiency in health care organizations[D].U-nited States Massachusetts:Harvard University,1981.
[7]Hollingsworth B.Non-parametric and parametric applications measuring efficiency in health care[J].Health Care Management Science,2003,6(4):203-218.
[8]Ozcan Y A.Health care benchmarking and performance evaluation:An assessment using data envelopment analysis(DEA)[M].Springer,2007.
[9]Hollingsworth B.The Measurement of Efficiency and Productivity of Health Care Delivery[J].Health Economics,2008,17(10):1107-1128.
[10]莊寧.?dāng)?shù)據(jù)包絡(luò)分析在國外醫(yī)院效率評價中的應(yīng)用[J].國外醫(yī)學(xué)(醫(yī)院管理分冊),2001(3):101-105.
[11]史健,魏權(quán)齡.DEA方法在衛(wèi)生經(jīng)濟學(xué)中的應(yīng)用[J].?dāng)?shù)學(xué)的實踐與認識,2004,34(4):59-66.
[12]鐘若冰,張靖,廖菁.醫(yī)院效率評價方法的研究[J].實用醫(yī)院臨床雜志,2010,7(1):127-130.
[13]Cooper W W,Seiford L M,Tone K.Introduction to data envelopment analysis and its uses:with DEA-solver software and references[M].Springer,2006.
[14]Ruggiero J.Impact assessment of input omission on DEA[J].International Journal of Information Technology and Decision Making,2005,4(3):359-368.
[15]張純洪,劉海英.我國區(qū)域衛(wèi)生經(jīng)濟系統(tǒng)的投入產(chǎn)出技術(shù)效率測度研究[J].中國衛(wèi)生經(jīng)濟,2009,28(7):11-13.
[16]羅良清,胡美玲.中國各地區(qū)醫(yī)療衛(wèi)生服務(wù)的生產(chǎn)效率分析[J].統(tǒng)計與信息論壇,2008,23(2):47-51.
[17]劉軍,錢力.我國區(qū)域經(jīng)濟運行效率研究——以醫(yī)療衛(wèi)生系統(tǒng)為例[J].經(jīng)濟問題,2011(6):114-118.
[18]張瑞華,劉莉,李維華,等.基于數(shù)據(jù)包絡(luò)分析的我國31個省市醫(yī)療衛(wèi)生服務(wù)效率評價[J].中國衛(wèi)生經(jīng)濟,2011(2):69-72.
[19]張寧,胡鞍鋼,鄭京海.應(yīng)用DEA方法評測中國各地區(qū)健康生產(chǎn)效率[J].經(jīng)濟研究,2006(7):92-105.
[20]楊文芳.我國衛(wèi)生資源的省際分布與利用效率研究[J].中國衛(wèi)生資源,2010(1):8-10.
[21]Emrouznejad A,Amin G R.DEA models for ratio data:Convexity consideration[J].Applied Mathematical Modelling,2009,33(1):486-498.
[22]Gravelle H,Wildman J,Sutton M.Income,income inequality and health:What can we earn from aggregate data?[J] .Social Science & Medicine,2001,54(4):577-589.
[23]Hollingsworth B,Wildman J.The efficiency of health production:re-estimating the WHO panel data using parametric and non-parametric approaches to provide additional information[J].Health Economics,2003,12(6):493-504.