卓 琳,王國(guó)威,葉靜陶,貢佳慧,劉 毅,徐 玲,汪秀英
1)新鄉(xiāng)醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院 河南新鄉(xiāng) 453003 2)徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院 江蘇徐州 221004 3)中國(guó)衛(wèi)生與計(jì)劃生育委員會(huì)統(tǒng)計(jì)信息中心 北京 100044 4)徐州市中心醫(yī)院腎內(nèi)科 江蘇徐州 221009
隨著社會(huì)經(jīng)濟(jì)的發(fā)展、醫(yī)學(xué)模式的轉(zhuǎn)變,人們對(duì)自身生命健康狀況越來越重視,生命質(zhì)量的研究[1-3]正受到越來越多的關(guān)注。歐洲生命質(zhì)量量表(EQ-5D)是一種多維健康相關(guān)生存質(zhì)量測(cè)量方法[4],運(yùn)用EQ-5D構(gòu)建模型的方法主要有視覺標(biāo)尺法、時(shí)間權(quán)衡法(TTO)、標(biāo)準(zhǔn)賭博法(SG)。SG是以馮·諾伊曼·摩根斯坦的效用理論為基礎(chǔ)的[5],為給定健康狀況下的個(gè)體提供個(gè)人的偏好“效用權(quán)重”,是用于效用評(píng)估的最好方法[6]。目前已有荷蘭、日本、英國(guó)、西班牙等多個(gè)國(guó)家建立了本國(guó)綜合指數(shù)模型,而我國(guó)尚沒有建立公認(rèn)的適合國(guó)人人群偏好的EQ-5D生命質(zhì)量評(píng)分模型。本研究旨在采用SG測(cè)評(píng)典型狀態(tài),并將其結(jié)果與荷蘭、英國(guó)、日本等國(guó)家進(jìn)行比較分析,探討采用何種方法更為合理,從而提高我國(guó)生命質(zhì)量研究水平,為構(gòu)建適合中國(guó)人群的EQ-5D評(píng)估模型提供參考。
1.1研究對(duì)象本研究選取了理解力強(qiáng)、依從性高的醫(yī)學(xué)院校大學(xué)生作為測(cè)評(píng)對(duì)象,以分層整群隨機(jī)抽樣的方法按年級(jí)、專業(yè)分層抽取250名醫(yī)學(xué)生作為應(yīng)答者,經(jīng)過統(tǒng)一培訓(xùn)詢問其對(duì)18個(gè)假設(shè)狀態(tài)進(jìn)行評(píng)定,在計(jì)算機(jī)輔助下及時(shí)反饋信度指標(biāo),信度合格視為一個(gè)合格樣本,共進(jìn)行了250份問卷調(diào)查,最終回收有效問卷248份。
1.2標(biāo)準(zhǔn)健康狀態(tài)的設(shè)計(jì)本研究采用EQ-5D量表五因素三水平問卷,選取L18(2*3^7)正交設(shè)計(jì)表,得到18個(gè)假設(shè)狀態(tài),見表1。
1.3SG評(píng)估生命質(zhì)量SG是指應(yīng)答者假設(shè)處于某種特定的健康狀態(tài),接受治療不考慮成本但存在一定風(fēng)險(xiǎn),治愈概率為P,治療失敗死亡概率為1-P,生命質(zhì)量是應(yīng)答者愿意接受治療換取完全健康狀態(tài)(11111)時(shí)所能接受的最小治愈概率值Pmin,見圖1。
應(yīng)答者選擇治療時(shí),獲得完全健康狀態(tài)(11111)的概率為P,同時(shí)面對(duì)死亡的概率為1-P;當(dāng)概率P→Pmin時(shí)應(yīng)答者放棄治療,維持現(xiàn)狀。此時(shí)生命質(zhì)量=Pmin。
表1 正交法設(shè)計(jì)的18個(gè)生命狀態(tài)
1:沒有障礙;2:中等障礙;3:嚴(yán)重障礙
圖1 SG評(píng)估生命質(zhì)量
1.4模型啞變量的設(shè)計(jì)本研究共設(shè)計(jì)了11個(gè)啞變量,其中M2、S2、U2、P2及A2分別表示行動(dòng)能力、自我照顧能力、日?;顒?dòng)能力、疼痛/不舒服、焦慮/抑郁處于水平2時(shí)為1,否則為0;M3、S3、U3、P3及A3分別表示以上5個(gè)維度處于水平3時(shí)為1,否則為0。交互作用變量N3表示任意1個(gè)維度處于水平3時(shí)為1,否則為0。
1.5回歸模型的選擇為了控制測(cè)量值殘差潛在的相關(guān)性,本研究采用加權(quán)最小二乘回歸法(WLS),以殘差e2的倒數(shù)為權(quán)重,分別在個(gè)體水平上和總體水平上構(gòu)建模型,其中總體水平上又分別以均值和中位數(shù)為基礎(chǔ)構(gòu)建模型。
模型按照擬合優(yōu)度指標(biāo)進(jìn)行比較,包括決定系數(shù)(R2)、預(yù)測(cè)值與均值相關(guān)系數(shù)(r)、平均絕對(duì)誤差(MAE)、邏輯錯(cuò)誤數(shù)等。R2和r越高、MAE和邏輯錯(cuò)誤數(shù)越低則模型越好。
1.6問卷的信度控制信度的控制主要有3個(gè)指標(biāo):首先,在計(jì)算機(jī)輔助下,使用18個(gè)標(biāo)準(zhǔn)狀態(tài)評(píng)分構(gòu)建回歸模型并對(duì)應(yīng)答者自身健康狀態(tài)進(jìn)行預(yù)測(cè),應(yīng)答者對(duì)自身健康狀態(tài)的預(yù)測(cè)值認(rèn)為合理可以接受,否則需重新測(cè)評(píng);其次,個(gè)體構(gòu)建的模型中邏輯錯(cuò)誤不得超過20%,即水平1(沒有障礙)的效用值應(yīng)大于水平2(中等障礙),水平2(中等障礙)的效用值應(yīng)大于水平3(嚴(yán)重障礙),反之記為1個(gè)邏輯錯(cuò)誤;最后,數(shù)據(jù)的分布標(biāo)準(zhǔn)差在0.25左右,離差偏移不超過20%。測(cè)評(píng)在計(jì)算機(jī)輔助下完成,3個(gè)信度指標(biāo)即時(shí)完成,即時(shí)反饋。
1.7數(shù)據(jù)清洗與建模分狀態(tài)繪制箱式圖,識(shí)別并清理離群值,最終清理離群值1個(gè),占0.02%。采用STATA/SE 12.0進(jìn)行WLS多元線性回歸。
2.1模型系數(shù)本研究采用WLS方法構(gòu)建了9個(gè)模型,見表2。
模型名稱及其含義:In(individual level)表示個(gè)體水平上的模型;Am(aggregate level based on mean)表示以均值為基礎(chǔ)構(gòu)建的總體水平上的模型;AM(aggregate level based on median)表示以中位數(shù)為基礎(chǔ)構(gòu)建的總體水平上的模型;第一個(gè)數(shù)字1或0分別表示有或無常數(shù)項(xiàng);第二個(gè)數(shù)字1或0分別表示有或無N3變量。建模的順序依次為11、10、00。例如:In10表示個(gè)體水平上有常數(shù)項(xiàng)無N3變量的模型,AM00表示總體水平上以中位數(shù)為基礎(chǔ)構(gòu)建的無常數(shù)項(xiàng)無N3變量的模型。
由表2可知,在個(gè)體水平上,InWls11和InWls00的R2較高,InWls10和InWls00的r較高,又InWls00無常數(shù)項(xiàng)和N3變量, MAE最小且邏輯錯(cuò)誤數(shù)為0,更為方便簡(jiǎn)潔,故在個(gè)體水平InWls00模型較優(yōu)。同樣,在整體水平上,模型AmWls00和AMWls00較優(yōu)。模型InWls00、AmWls00和AMWls00三者相比,AmWls00和AMWls00具有較高的R2、r和較低的MAE,兩模型優(yōu)度相似。但當(dāng)數(shù)據(jù)不滿足正態(tài)分布時(shí),以中位數(shù)為基礎(chǔ)建模比均值更為合理,因此模型AMWls00是本研究的最優(yōu)模型。
表2 以WLS為基礎(chǔ)構(gòu)建的模型系數(shù)估計(jì)表
*:較優(yōu)的狀態(tài)預(yù)測(cè)效用值低于較差的狀態(tài),記為1個(gè)邏輯錯(cuò)誤
2.2參照體系見表3。
表3 本研究SG模型與其他國(guó)家的TTO模型系數(shù)
*:對(duì)生命質(zhì)量影響較大的因素
2.3各模型對(duì)健康狀態(tài)的評(píng)分圖本研究構(gòu)建的模型InWls00、AmWls00、AMWls00評(píng)分曲線見圖2,3條曲線十分接近,根據(jù)模型的優(yōu)度,本研究選擇AMWls00與其他國(guó)家進(jìn)行比較。本研究選擇的最優(yōu)模型AMWls00與荷蘭、英國(guó)、日本的模型對(duì)健康狀態(tài)的評(píng)分圖見圖3。圖3顯示,模型AMWls00對(duì)健康狀態(tài)的評(píng)分曲線明顯高于英國(guó)、荷蘭的曲線,尤其是曲線的后半段。模型AMWls00和日本的積分曲線較為相似。
圖2 模型InWls00、 AmWls00、AMWls00對(duì)健康狀態(tài)的評(píng)分圖
圖3 模型AMWls00與 荷蘭、英國(guó)、日本的模型對(duì)健康狀態(tài)的評(píng)分圖
3.1中國(guó)人群缺少自己的評(píng)分模型EQ-5D量表在成本效用評(píng)價(jià)、衛(wèi)生決策分析、臨床藥學(xué)等很多領(lǐng)域中發(fā)揮著重要作用。自Dolan[7]于1997年構(gòu)建出英國(guó)生命質(zhì)量綜合評(píng)分模型以來,已有多個(gè)國(guó)家如丹麥、日本、荷蘭、美國(guó)等構(gòu)建了適合本國(guó)人群偏好的EQ-5D生命質(zhì)量評(píng)分模型。中國(guó)國(guó)家衛(wèi)生服務(wù)調(diào)查已經(jīng)連續(xù)2次應(yīng)用EQ-5D,但仍沒有建立適合中國(guó)人群偏好的EQ-5D生命質(zhì)量評(píng)分模型,常用英國(guó)或日本的模型[8]。有研究[9-10]證明,不同國(guó)家的模型之間存在著差異性。因此,建立適合中國(guó)人群的EQ-5D生命質(zhì)量評(píng)分模型很有必要。本研究采用SG構(gòu)建模型,旨在探索建模的最優(yōu)方法,從而為建立中國(guó)人群生命質(zhì)量評(píng)分模型提供依據(jù)。
3.2本模型曲線具有東方文化特征本研究結(jié)果顯示,各國(guó)模型表現(xiàn)出較大的差異。本研究構(gòu)建的模型曲線明顯高于英國(guó)、荷蘭這些發(fā)達(dá)國(guó)家。這種差異可能來源于:①荷蘭和英國(guó)的模型含有常數(shù)項(xiàng),分別為-0.081、-0.152,這個(gè)參數(shù)會(huì)造成評(píng)分曲線的下降。②發(fā)展中國(guó)家和發(fā)達(dá)國(guó)家經(jīng)濟(jì)狀況、文化背景不同,人們對(duì)苦難的理解也會(huì)不盡相同[11],發(fā)達(dá)國(guó)家對(duì)生命質(zhì)量的期望會(huì)高于發(fā)展中國(guó)家。③使用EQ-5D量表具有一定的局限性,通常需要考慮翻譯的質(zhì)量等方面的影響[12]。而模型AMWls00的評(píng)分曲線與日本的較為接近,因?yàn)橹袊?guó)與日本在地域、文化、對(duì)健康的偏好等方面有些共同的東方文化特征。
3.3WLS有效最常用的回歸模型主要有普通最小二乘回歸法(OLS)、WLS、廣義最小二乘回歸法(GLS)3種。OLS要求樣本數(shù)據(jù)具有獨(dú)立性,即各數(shù)據(jù)間不相關(guān),但本例數(shù)據(jù)不能滿足此要求,同一受調(diào)查者完成18個(gè)測(cè)量存在一定的相關(guān)性;而WLS總體上優(yōu)于OLS[13],作為一種特殊的GLS方法,WLS常用于存在非獨(dú)立、異方差問題的線性回歸模型的參數(shù)估計(jì)[14]。本研究WLS方法指定了殘差的倒數(shù)為權(quán)重,即對(duì)殘差量較大的測(cè)量降低其權(quán)重,進(jìn)而得到比OLS方法更有效的估計(jì)。
3.4最優(yōu)模型的選擇本研究構(gòu)建的模型AMWls00,無常數(shù)項(xiàng)和N3變量,簡(jiǎn)潔最優(yōu)。當(dāng)模型性能近似時(shí),首選最簡(jiǎn)約的模型[7,15]。如果增加常數(shù)項(xiàng),可造成曲線下降和邏輯錯(cuò)誤。啞變量N3沒有增加模型的優(yōu)度,卻一方面增加了變量間的相關(guān)性,另一方面增加了模型應(yīng)用的復(fù)雜性。因此無常數(shù)項(xiàng)無N3變量的模型更為高效簡(jiǎn)潔。美國(guó)的模型也沒有常數(shù)項(xiàng)。本研究構(gòu)建的3個(gè)既有常數(shù)項(xiàng)又有N3的模型,均出現(xiàn)預(yù)測(cè)值邏輯錯(cuò)誤,而其他模型則無邏輯錯(cuò)誤。
理論上,個(gè)體水平上的模型優(yōu)于總體水平上的模型,但個(gè)體水平上的回歸模型過分依賴于個(gè)體對(duì)健康狀態(tài)的理解。此外,Lee等[16]指出總體水平上的模型產(chǎn)生更好的結(jié)果,總體水平上的回歸模型能夠消除個(gè)體水平上數(shù)據(jù)的差異性??紤]到數(shù)據(jù)存在個(gè)體內(nèi)部評(píng)分相關(guān)性,可能影響模型的結(jié)果,作者分別以均值和中位數(shù)為基礎(chǔ)構(gòu)建總體水平上的回歸模型,并且研究結(jié)果顯示在總體水平上,基于中位數(shù)的模型AMWls00和基于均值的模型AmWls00優(yōu)度相似,都優(yōu)于個(gè)體水平模型。理論上,當(dāng)數(shù)據(jù)不是正態(tài)分布時(shí),中位數(shù)更能代表總體的集中趨勢(shì),更能符合意愿支付法[17]。因此,基于整體水平建模時(shí)應(yīng)考慮中位數(shù)。
3.5本研究方法的有效性與不足SG是在不確定條件下測(cè)量個(gè)人喜好的經(jīng)典方法,可以測(cè)量馮·諾伊曼·摩根斯坦效用函數(shù)的生命年、健康狀態(tài)以及用于計(jì)算生命質(zhì)量調(diào)整壽命年的偏好權(quán)重。1994年,Gafni[18]應(yīng)用SG研究公共事業(yè)的經(jīng)濟(jì)評(píng)估,并證實(shí)了它的有效性。
然而,SG方法只提供在一個(gè)特定健康狀態(tài)的個(gè)人偏好分?jǐn)?shù),不能很好地考慮時(shí)間維度的影響,即忽略了應(yīng)答者假設(shè)處于某種健康狀態(tài)的時(shí)間長(zhǎng)短。個(gè)體健康不像其他決策理論或經(jīng)濟(jì)學(xué)的研究結(jié)果,它與時(shí)間維度密切相關(guān)。因此,在不同健康狀態(tài)下評(píng)估個(gè)體的生命質(zhì)量時(shí)不能忽略其處于各健康狀態(tài)的時(shí)間長(zhǎng)短。在這個(gè)意義上,健康是一種二維現(xiàn)象。1982年,Sutherland等[19]研究不同時(shí)間段中在相同健康狀態(tài)下的個(gè)人喜好效用值時(shí)發(fā)現(xiàn),生存時(shí)間在短期內(nèi)(3個(gè)月)的受試者大部分接受現(xiàn)有健康狀態(tài)而不是選擇死亡;而大多數(shù)生存時(shí)間更長(zhǎng)(8 a)的受試者,他們?cè)谳^低健康狀態(tài)下更偏好地選擇死亡。因此將健康狀態(tài)評(píng)分作為一個(gè)“固定”的值可能難以覆蓋個(gè)體的時(shí)間維度偏好。另外,因?yàn)楦怕嗜≈祪H限于1~0,所以SG對(duì)可能比死亡更差的狀態(tài)評(píng)估具有局限性。
此外,本研究選取醫(yī)學(xué)院校的學(xué)生為對(duì)象,提高了理解力和依從性等表面效度,證明了SG方法可行,用于衡量青年大學(xué)生群體有效,但推廣應(yīng)用于一般人群應(yīng)謹(jǐn)慎。
[1] 吉珂,周王艷.歐洲生命質(zhì)量量表EQ-5D的應(yīng)用研究進(jìn)展[J].國(guó)外醫(yī)學(xué):衛(wèi)生經(jīng)濟(jì)分冊(cè),2010,27(4):168
[2] 李娜,趙芝煥,萬崇華.慢性肺心病患者生命質(zhì)量與臨床客觀指標(biāo)的關(guān)系[J].吉林大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2012,38(3):580
[3] 張升超,吳江,陳輝清,等.基于EQ-5D量表的深圳市居民健康相關(guān)生命質(zhì)量研究[J].中國(guó)社會(huì)醫(yī)學(xué)雜志,2017,34(2):135
[4] 李明暉,羅南.歐洲五維健康量表(EQ-5D)中文版應(yīng)用介紹[J].中國(guó)藥物經(jīng)濟(jì)學(xué),2009(1):49
[5] VON NEUMANN JM.Theory of games and behavior[M].New York:John Wiley,1953.
[6] BALA MV,WOOD LL,ZARKIN GA,et al.Are health states "timeless":the case of the standard gamble method[J].J Clin Epidemiol,1999,52(11):1047
[7] DOLAN P.Modeling valuations for EuroQol health states[J].Med Care,1997,35(11):1095
[8] 岳明,趙緋麗,吳久鴻,等.地區(qū)因素對(duì)生活質(zhì)量總體評(píng)分和效用的影響:北京昆明兩地慢性前列腺炎患者生命質(zhì)量比較調(diào)查[J].中國(guó)衛(wèi)生經(jīng)濟(jì),2010,29(11):89
[9] JO MW,YUN SC,LEE SI.Estimating quality weights for EQ-5D health states with the time trade-off method in South Korea[J].Value Health,2008,11(7):1186
[10]JOHNSON JA,LUO N,SHAW JW,et al.Valuations of EQ-5D health states: are the United States and United Kingdom different?[J].Med Care,2005,43(3):221
[11]BAILEY H,KIND P.Preliminary findings of an investigation into the relationship between national culture and EQ-5D value sets[J].Qual Life Res,2010,19(8):1145
[12]張潔,黃泰康.亞洲健康相關(guān)生命質(zhì)量工具概況及其發(fā)展建議[J].中國(guó)藥物經(jīng)濟(jì)學(xué),2008(5):53
[13]楊劍,呂乃光,董明利.加權(quán)最小二乘算法在機(jī)器視覺系統(tǒng)中的應(yīng)用[J].光學(xué)精密工程,2009,17(8):1870
[14]劉明.基于一元線性回歸模型異方差對(duì)加權(quán)最小二乘法的考察[J].統(tǒng)計(jì)與決策,2012(19):11
[15]YANG Y,BRAZIER J,TSUCHIYA A,et al.Estimating a preference-based single index from the overactive bladder questionnaire[J].Value Health,2009,12(1):159
[16]LEE YK,NAM HS,CHUANG LH,et al.South Korean time trade-off values for EQ-5D health states: modeling with observed values for 101 health states[J].Value Health,2009,12(8):1187
[17]BEIKERT FC,LANGENBRUCH AK,RADTKE MA,et al.Willingness to pay and quality of life in patients with atopic dermatitis[J].Arch Dermatol Res,2014,306(3):279
[18]GAFNI A.The standard gamble method: what is being measured and how it is interpreted[J].Health Serv Res,1994,29(2):207
[19]SUTHERLAND HJ,LLEWELLYN-THOMAS H,BOYD NF,et al.Attitudes toward quality of survival:the concept of "maximal endurable time"[J].Med Decis Making,1982,2(3):299
鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2018年1期