盧鈺瓊,代展菁,路 云,常 峰(中國藥科大學(xué)國際醫(yī)藥商學(xué)院,南京 211198)
成本-效用分析是藥物經(jīng)濟(jì)學(xué)常用的分析方法之一,常以質(zhì)量調(diào)整生命年(quality-adjusted life years,QALYs)作為產(chǎn)出指標(biāo)。健康狀態(tài)效用值(health state utility values,HSUVs)表示人們對特定健康狀態(tài)的偏好程度,是計算QALYs 的關(guān)鍵參數(shù)[1]。負(fù)效用(disutility)是HSUVs 的一種,英國約克健康經(jīng)濟(jì)聯(lián)合會將其定義為某種特定癥狀或并發(fā)癥導(dǎo)致的效用下降(通常表示為負(fù)值),也常作為關(guān)鍵參數(shù)被納入經(jīng)濟(jì)學(xué)評價模型[2-3]。例如,在估計2型糖尿病患者的疾病負(fù)擔(dān)時,常需將糖尿病相關(guān)并發(fā)癥(失明、截肢、中風(fēng)、心肌梗死、腎衰竭等)導(dǎo)致的健康效用值降低考慮在內(nèi)[4]。又如Freeman 等[5]對免疫比濁法在指導(dǎo)化療患者氟尿嘧啶劑量調(diào)整中的經(jīng)濟(jì)性進(jìn)行評價時,考慮了腹瀉、惡心、黏膜炎等不良反應(yīng)的負(fù)效用值。
目前,國際上已開展了大量有關(guān)負(fù)效用的測量實踐:Hall 等[6]基于時間權(quán)衡法(time trade-off,TTO)調(diào)研了200名18歲以上的英國普通公眾,應(yīng)用廣義估計方程模型估算得到了高風(fēng)險轉(zhuǎn)移性激素敏感性前列腺癌治療相關(guān)不良事件(疲勞、惡心嘔吐等)的負(fù)效用值;Pan等[7]基于歐洲五維五水平健康量表(European quality of life five dimensions five level,EQ-5D-5L)調(diào)研了289名2型糖尿病患者,采用普通最小二乘法估算得到了患者神經(jīng)病變、心臟病變、腦血管疾病等并發(fā)癥的負(fù)效用值。但關(guān)于如何進(jìn)行負(fù)效用測量,國內(nèi)外并未形成統(tǒng)一標(biāo)準(zhǔn)規(guī)范??紤]到惡性腫瘤是我國乃至全球的主要致死疾病,且相關(guān)不良事件的負(fù)效用研究相對較多,因此本研究以惡性腫瘤藥物治療相關(guān)不良事件的負(fù)效用為例,對國內(nèi)外相關(guān)文獻(xiàn)進(jìn)行系統(tǒng)評價,以了解健康狀態(tài)負(fù)效用測量的實踐情況和存在的問題,為我國開展健康狀態(tài)負(fù)效用測量研究、計算藥物經(jīng)濟(jì)學(xué)評價中的健康產(chǎn)出提供方法學(xué)參考。
計算機檢索中國知網(wǎng)、萬方數(shù)據(jù)、維普網(wǎng)3個中文數(shù)據(jù)庫和PubMed、Web of Science、the Cochrane Library 3個英文數(shù)據(jù)庫,檢索時限均為各數(shù)據(jù)庫建庫起至2021年7 月。同時,手工檢索納入文獻(xiàn)及相關(guān)系統(tǒng)評價和經(jīng)濟(jì)性評價研究的參考文獻(xiàn)。
納入標(biāo)準(zhǔn)包括:(1)國內(nèi)外學(xué)術(shù)期刊上公開發(fā)表的研究文獻(xiàn);(2)測量了惡性腫瘤藥物治療相關(guān)不良事件的效用值;(3)結(jié)局報告了效用值原始數(shù)據(jù)。
排除標(biāo)準(zhǔn)包括:(1)與效用測量無關(guān)的文獻(xiàn);(2)文獻(xiàn)綜述或理論研究;(3)會議摘要、學(xué)位論文、新聞報道、資訊、采訪、評論等文獻(xiàn);(4)重復(fù)發(fā)表的文獻(xiàn);(5)無法獲得全文的文獻(xiàn);(6)非中文或英文文獻(xiàn)。
應(yīng)用EndNote 20 軟件進(jìn)行文獻(xiàn)管理,Excel 2201 軟件進(jìn)行數(shù)據(jù)提取。由2名研究者獨立篩選文獻(xiàn)、提取信息并交叉核對,如遇分歧則與第三方討論決定。提取的文獻(xiàn)信息包括文獻(xiàn)基本特征(文章標(biāo)題、第一作者、發(fā)表年份、文獻(xiàn)類型、調(diào)查國家/地區(qū)、惡性腫瘤類型、不良事件類型等)和效用值測量實踐情況(研究設(shè)計類型、健康狀態(tài)開發(fā)、健康狀態(tài)驗證、基礎(chǔ)狀態(tài)設(shè)定、健康狀態(tài)排名、效用測量工具、樣本人群類型、樣本人群規(guī)模、樣本代表性檢驗、效用報告類型、效用統(tǒng)計方法等)。
英國國家衛(wèi)生與臨床優(yōu)化研究所(National Institute for Health and Clinical Excellence,NICE)決策技術(shù)支持文件曾制定過檢查清單以評價效用測量研究的質(zhì)量,但該清單內(nèi)容表達(dá)不夠清晰,難以被研究者準(zhǔn)確理解,在實踐中多經(jīng)改良后再應(yīng)用[8]。本研究采用Mok等[9]改良后的檢查清單,該檢查清單內(nèi)容簡單易懂,包含樣本人群規(guī)模、受訪者選擇和招募、納入與排除標(biāo)準(zhǔn)、工具應(yīng)答率、數(shù)據(jù)完整性、工具適當(dāng)性、其他研究問題、不確定性估計、積分體系適當(dāng)性9項條目。同時,本研究設(shè)定,若條目評價結(jié)果為“是”計1分,“否”則計0分;質(zhì)量評價總分為實際得分與理想得分(各條目都得分)之比。
根據(jù)預(yù)先設(shè)定的檢索詞和納入、排除標(biāo)準(zhǔn)對文獻(xiàn)進(jìn)行檢索和篩選,最終納入77篇文獻(xiàn),具體流程見圖1。
圖1 文獻(xiàn)篩選流程圖
2.2.1 發(fā)表年份 納入文獻(xiàn)最早發(fā)表于1991 年。隨年份增長,相關(guān)文獻(xiàn)數(shù)量呈波動式上升的趨勢,其中2010和2013年文獻(xiàn)數(shù)目最多,均為7篇。結(jié)果見圖2。
圖2 納入文獻(xiàn)的發(fā)表年份分布
2.2.2 文獻(xiàn)類型 納入文獻(xiàn)主要為效用研究(49 篇,63.64%),即研究效用或負(fù)效用的測量;其次為藥物經(jīng)濟(jì)學(xué)評價(28 篇,36.36%),即研究目的為藥物經(jīng)濟(jì)性評價,研究過程中對患者的健康效用進(jìn)行了測量以獲取效果指標(biāo)。
2.2.3 調(diào)查國家/地區(qū) 納入文獻(xiàn)中,有4篇未說明調(diào)查國家/地區(qū),故本文假設(shè)作者所在地為調(diào)查國家/地區(qū)。經(jīng)統(tǒng)計,納入文獻(xiàn)涉及英國的最多(24 篇,31.17%),其次是美國(17篇,22.08%)。調(diào)查國家/地區(qū)為中國的僅3篇(3.90%)。結(jié)果見圖3(圖中,因同一文獻(xiàn)可能涉及多個國家/地區(qū),故圖中文獻(xiàn)數(shù)量合計值>77篇)。
圖3 納入文獻(xiàn)的調(diào)查國家/地區(qū)分布
2.2.4 惡性腫瘤類型 除部分文獻(xiàn)描述為“惡性腫瘤”(4 篇)和“婦科惡性腫瘤”(1 篇)外,其余文獻(xiàn)共涉及18種惡性腫瘤,其中以乳腺癌相關(guān)文獻(xiàn)最多(17 篇,22.08%),其次是非小細(xì)胞肺癌和黑色素瘤(均為8 篇,各占10.39%)。結(jié)果見圖4。
圖4 納入文獻(xiàn)涉及的惡性腫瘤類型分布
2.2.5 不良事件類型 納入文獻(xiàn)共涉及120 種不良事件,其中報告文獻(xiàn)數(shù)量≥3篇的不良事件有25種。有36篇文獻(xiàn)(46.75%)未描述不良事件的具體情況,僅描述為“不良事件”。具體不良事件以腹瀉(24 篇,31.17%)和疲勞(21 篇,27.27%)居多。結(jié)果見圖5(圖中只展示了報告文獻(xiàn)數(shù)量≥3篇的不良事件)。
圖5 納入文獻(xiàn)涉及的不良事件類型分布
2.3.1 研究設(shè)計類型 近半數(shù)文獻(xiàn)未說明研究設(shè)計類型(35 篇,45.45%)。說明了研究設(shè)計類型的文獻(xiàn)(42篇,54.54%)根據(jù)是否對樣本人群進(jìn)行主動干預(yù),分為觀察性研究和臨床試驗;根據(jù)是否應(yīng)用TTO、視覺模擬標(biāo)尺(visual analogue scale,VAS)和標(biāo)準(zhǔn)博弈(standard gamble,SG)等小插圖測量工具,又可分為小插圖研究和非小插圖研究。
2.3.2 健康狀態(tài)開發(fā)與驗證 多數(shù)納入文獻(xiàn)未說明健康狀態(tài)開發(fā)方法(48 篇,62.34%)和健康狀態(tài)驗證方法(52 篇,67.53%);說明了開發(fā)方法(29 篇,37.66%)和驗證方法(25 篇,32.47%)的文獻(xiàn)均為基于直接測量工具的效用研究文獻(xiàn),主要通過文獻(xiàn)回顧、專家訪談、患者訪談、患者論壇、以往效用研究、測量工具評估、藥物標(biāo)簽信息等方法獲取基礎(chǔ)信息以進(jìn)行健康狀態(tài)描述,再通過專家審查、預(yù)調(diào)研、患者訪談、以往效用研究、公眾訪談等方法判斷健康狀態(tài)描述能否有效獲得效用值。
2.3.3 基礎(chǔ)狀態(tài)設(shè)定 基礎(chǔ)健康狀態(tài)的設(shè)定是指以基礎(chǔ)狀態(tài)為錨點,測量樣本人群處于基礎(chǔ)健康狀態(tài)時發(fā)生不良事件(如疾病無進(jìn)展?fàn)顟B(tài)時發(fā)生腹瀉)的效用,后續(xù)通過數(shù)據(jù)處理、統(tǒng)計估算得不良事件的負(fù)效用值。納入文獻(xiàn)大多設(shè)定并說明了基礎(chǔ)健康狀態(tài)(46篇,59.74%);部分文獻(xiàn)未說明是否設(shè)定了基礎(chǔ)健康狀態(tài)(31 篇,40.26%),可能是以無不良事件為基礎(chǔ)健康狀態(tài),也可能未設(shè)定基礎(chǔ)健康狀態(tài)直接測量了不良事件的效用值。
2.3.4 健康狀態(tài)排名 僅有20篇文獻(xiàn)(25.97%)明確要求對樣本人群健康狀態(tài)的效用值高低進(jìn)行排序,以幫助樣本人群理解健康狀態(tài)描述進(jìn)而反饋有效的測量結(jié)果。這20 篇文獻(xiàn)均為基于直接測量工具的效用研究文獻(xiàn),健康狀態(tài)排名主要應(yīng)用了VAS、等級評定(rating scale,RS)等效用測量工具(17 篇),少部分文獻(xiàn)應(yīng)用了Likert量表(1篇)或未說明排名工具(2篇)。
2.3.5 效用測量工具 納入文獻(xiàn)多應(yīng)用SG(23 篇,29.87%)和歐洲五維健康量表(European quality of five dimensions questionnaire,EQ-5D)(23 篇,29.87%),其次是TTO(21 篇,27.27%)和VAS(13 篇,16.88%)??梢姡】禒顟B(tài)負(fù)效用測量多應(yīng)用直接測量工具,這與Matza等[10]小插圖研究推薦的不良事件負(fù)效用測量工具是一致的。此外,12 篇文獻(xiàn)(15.58%)同時應(yīng)用了多種效用測量工具,1篇文獻(xiàn)(1.30%)未說明效用測量工具。
2.3.6 樣本人群類型及規(guī)模 納入文獻(xiàn)的調(diào)研對象多為患者人群(45 篇,58.44%),其次是一般人群(27 篇,35.06%)、醫(yī)護(hù)人群(10篇,12.99%)、醫(yī)學(xué)腫瘤學(xué)家(2篇,2.60%)、風(fēng)險人群(1篇,1.30%)等;有7篇文獻(xiàn)(9.09%)同時調(diào)研了多類樣本人群,1 篇文獻(xiàn)(1.30%)未說明樣本人群類型。有58篇文獻(xiàn)(75.32%)說明了樣本人群規(guī)模,樣本人群區(qū)間跨度較大(10~1 582人),但分布較為集中(集中在10~200 人);58 項研究共納入11 185 人,平均每項研究192.84人。
2.3.7 樣本代表性檢驗 63 篇文獻(xiàn)未說明人群代表性檢驗情況(81.82%),其中54 篇文獻(xiàn)(85.71%)的樣本人群類型為非一般人群,13篇文獻(xiàn)(20.63%)為一般人群,其中部分文獻(xiàn)同時涉及非一般人群和一般人群。14 篇文獻(xiàn)(18.18%)進(jìn)行了人群代表性檢驗,其樣本人群類型均為一般人群,均根據(jù)該國家/地區(qū)的人口普查數(shù)據(jù)進(jìn)行了代表性檢驗。
2.3.8 效用報告類型 有31篇文獻(xiàn)(40.26%)以負(fù)值形式報告了不良事件對效用的影響,如Shingler 等[11]測量得到腹瀉(3~4 級)的負(fù)效用值為-0.327;26 篇文獻(xiàn)(33.77%)以合并基礎(chǔ)狀態(tài)的非負(fù)值形式報告了負(fù)效用值,如Swinburn等[12]測量得到疾病穩(wěn)定狀態(tài)合并腹瀉(3級)的效用值為0.534;另有20 篇(25.97%)文獻(xiàn)以非負(fù)值形式報告了負(fù)效用,如Chou 等[13]測量得到腹瀉(3~4級)的負(fù)效用值為0.34。
2.3.9 效用統(tǒng)計方法 半數(shù)以上的文獻(xiàn)(45 篇,58.44%)未說明效用統(tǒng)計方法,其中42篇文獻(xiàn)(93.33%)的效用報告形式為非負(fù)值或合并基礎(chǔ)狀態(tài)的非負(fù)值,其效用值可根據(jù)效用測量工具基礎(chǔ)算法算得;還有3篇文獻(xiàn)(6.67%)的效用報告形式為負(fù)值,均為藥物經(jīng)濟(jì)學(xué)評價研究。在說明了效用統(tǒng)計方法的文獻(xiàn)(32 篇,41.56%)中,有10篇(31.25%)采用了基礎(chǔ)狀態(tài)合并不良事件效用與基礎(chǔ)狀態(tài)效用的差值來計算不良事件的負(fù)效用值,有3篇(9.38%)采用了廣義估計方程的方法,其余文獻(xiàn)采用的方法較為分散,限于篇幅,本文不一一羅列。
質(zhì)量評價結(jié)果顯示,77篇納入文獻(xiàn)的質(zhì)量總評分為0.683(表1)。由于評價質(zhì)量劃分尚無統(tǒng)一標(biāo)準(zhǔn),因此本系統(tǒng)評價參考Degeling等[14]的判斷標(biāo)準(zhǔn),設(shè)定>0.800~1.000 分為高質(zhì)量、>0.600~0.800 分為較高質(zhì)量、0.000~0.600 分為低質(zhì)量。根據(jù)上述標(biāo)準(zhǔn),本研究納入文獻(xiàn)的整體質(zhì)量較高。
表1 納入文獻(xiàn)的質(zhì)量評價
同時結(jié)果顯示,未報告受訪者選擇和招募的文獻(xiàn)最多(63 篇),其次是未報告工具應(yīng)答率、不確定性估計、納入與排除標(biāo)準(zhǔn),分別有51、33、30 篇文獻(xiàn);另外,納入文獻(xiàn)存在樣本人群國家/地區(qū)與效用積分體系不一致、未報告樣本人群規(guī)模、未報告調(diào)查國家/地區(qū)等問題(表1)。
本研究對國內(nèi)外公開發(fā)表的惡性腫瘤藥物治療相關(guān)不良事件負(fù)效用測量文獻(xiàn)進(jìn)行了描述性系統(tǒng)評價,初步探索了該領(lǐng)域相關(guān)研究的健康狀態(tài)負(fù)效用值測量實踐情況。系統(tǒng)評價結(jié)果顯示,不良事件負(fù)效用值測量研究文獻(xiàn)發(fā)表數(shù)量近年來呈波動式增長的趨勢,可見負(fù)效用的測量研究越來越受到醫(yī)藥相關(guān)決策者和研究者的重視,但目前我國少見有相關(guān)研究發(fā)表??偨Y(jié)負(fù)效用的測量實踐情況發(fā)現(xiàn),負(fù)效用測量的基本實施路徑至少包括基礎(chǔ)研究設(shè)計、健康狀態(tài)確定、效用測量調(diào)研和調(diào)研數(shù)據(jù)統(tǒng)計4個關(guān)鍵環(huán)節(jié)。在基礎(chǔ)研究設(shè)計環(huán)節(jié),需要確定研究的基本目標(biāo),即確定測量何種疾病或何種干預(yù)措施的何種癥狀或并發(fā)癥的負(fù)效用;需要確定研究設(shè)計類型,即數(shù)據(jù)收集的方式和時間;需要確定效用測量工具,即根據(jù)研究的基本目標(biāo)選擇合適的效用測量工具;需要確定樣本人群,即需要確定樣本人群的國家/地區(qū)、人群類型及人群規(guī)模。在健康狀態(tài)確定環(huán)節(jié),需要進(jìn)行健康狀態(tài)開發(fā)和驗證,尤其是基于直接測量工具的效用研究;需要進(jìn)行基礎(chǔ)狀態(tài)設(shè)定,即設(shè)定樣本人群發(fā)生目標(biāo)癥狀或并發(fā)癥時所處的基礎(chǔ)健康狀態(tài)。在效用測量調(diào)研環(huán)節(jié),需要進(jìn)行健康狀態(tài)排名,尤其是基于直接測量工具的效用研究;需要基于健康狀態(tài)腳本及效用測量工具對目標(biāo)樣本人群進(jìn)行調(diào)研以獲取基礎(chǔ)數(shù)據(jù)。在調(diào)研數(shù)據(jù)統(tǒng)計環(huán)節(jié),需要檢驗樣本人群的代表性,尤其是基于一般人群的效用研究;需要基于合適的效用統(tǒng)計方法計算獲得負(fù)效用測量結(jié)果。
本研究還發(fā)現(xiàn),目前的健康狀態(tài)負(fù)效用測量研究尚存在如下問題:一是我國負(fù)效用測量研究實踐較少,可能導(dǎo)致基于我國人群開展的藥物經(jīng)濟(jì)學(xué)評價缺乏負(fù)效用相關(guān)數(shù)據(jù)。本研究納入的77 篇惡性腫瘤藥物治療相關(guān)不良事件負(fù)效用測量文獻(xiàn)中,僅3篇文獻(xiàn)的調(diào)查國家/地區(qū)涉及中國。二是負(fù)效用的報告類型和結(jié)果多樣,導(dǎo)致不良事件負(fù)效用結(jié)果合并存在困難。納入文獻(xiàn)的效用報告類型包括負(fù)值、合并基礎(chǔ)狀態(tài)非負(fù)值及非負(fù)值3種,三者數(shù)據(jù)關(guān)系較為復(fù)雜,如何進(jìn)行數(shù)據(jù)合并來為藥物經(jīng)濟(jì)學(xué)評價提供效用數(shù)據(jù)仍有待研究。三是負(fù)效用測量研究的部分重點事項未予報告,嚴(yán)重影響了文獻(xiàn)質(zhì)量。例如調(diào)查國家/地區(qū)、樣本人群類型、樣本人群規(guī)模、效用測量工具、效用積分體系等關(guān)鍵內(nèi)容報告不完整。
為規(guī)范負(fù)效用的測量研究,本研究提出如下建議:(1)建議規(guī)范負(fù)效用測量研究實踐路徑以指導(dǎo)相關(guān)研究的開展。我國藥物經(jīng)濟(jì)學(xué)評價正面臨缺乏負(fù)效用數(shù)據(jù)的問題,雖然學(xué)者可通過引用非目標(biāo)人群和非目標(biāo)國家的負(fù)效用值,或基于臨床經(jīng)驗和專家意見進(jìn)行數(shù)據(jù)假設(shè),或不考慮負(fù)效用來完成研究[15],但終究不能從根本上解決數(shù)據(jù)缺乏的問題。今后可在本研究總結(jié)歸納的健康狀態(tài)負(fù)效用測量路徑的基礎(chǔ)上,結(jié)合本團(tuán)隊已經(jīng)發(fā)表的有關(guān)健康狀態(tài)負(fù)效用的合并方法和影響因素分析結(jié)果[16],明晰測量路徑中各個環(huán)節(jié)最優(yōu)的實踐方法和需考慮的注意事項,以促進(jìn)健康狀態(tài)負(fù)效用研究高速度增長和高質(zhì)量發(fā)展。(2)建議制訂健康狀態(tài)效用測量指南以規(guī)范研究過程和報告內(nèi)容。目前,我國僅有《藥物經(jīng)濟(jì)學(xué)評價指南(2020)》對HSUVs 的測量提出了較為簡單的要求[17]。然而,國際上已有多個HSUVs 測量指南,如NICE發(fā)布的多個決策技術(shù)支持文件[8,18]、國際藥物經(jīng)濟(jì)學(xué)與結(jié)果研究會(International Society for Pharmacoeconomics and Outcomes Research,ISPOR)發(fā)布的多個良好實踐報告[19],以及小插圖研究建議[10]等。我國可借鑒上述國際指南的開發(fā)思路,開發(fā)基于特定HSUVs 的測量工具及普適性的HSUVs 測量指南,為我國HSUVs測量研究提供方法指導(dǎo)和報告規(guī)范。(3)建議加強多學(xué)科合作以提高研究水平和結(jié)果質(zhì)量。健康狀態(tài)效用值測量研究涉及臨床醫(yī)學(xué)、心理測量學(xué)、衛(wèi)生經(jīng)濟(jì)學(xué)、數(shù)理統(tǒng)計學(xué)等多個學(xué)科,效用測量過程涉及基礎(chǔ)研究設(shè)計、健康狀態(tài)確定、效用測量調(diào)研和調(diào)研數(shù)據(jù)統(tǒng)計等多個環(huán)節(jié),需要具有扎實基礎(chǔ)理論知識的學(xué)術(shù)研究者和具有豐富效用測量研究資源的臨床實踐者合作開展HSUVs測量研究,從而提高HSUVs測量的研究質(zhì)量,為臨床治療和醫(yī)藥衛(wèi)生決策提供更可靠的證據(jù)。
綜上所述,本研究以惡性腫瘤藥物治療相關(guān)不良事件的負(fù)效用為例,對國內(nèi)外相關(guān)文獻(xiàn)進(jìn)行了系統(tǒng)評價。結(jié)果表明,現(xiàn)有負(fù)效用測量包括基礎(chǔ)研究設(shè)計、健康狀態(tài)確定、效用測量調(diào)研和調(diào)研數(shù)據(jù)統(tǒng)計4個關(guān)鍵環(huán)節(jié),相關(guān)研究存在中國人群數(shù)據(jù)缺乏、結(jié)果報告類型不一致、測量重點事項報告不完整等問題。建議今后應(yīng)進(jìn)一步規(guī)范負(fù)效用測量基本實施路徑,制訂健康狀態(tài)效用值測量指南,加強多學(xué)科合作,以提高健康狀態(tài)效用測量的研究質(zhì)量。
(利益相關(guān)聲明:本研究設(shè)計、實施和結(jié)果未受資助方的影響,無利益沖突)