連 代,夏 宇,魏 艷,陳英耀
復(fù)旦大學(xué)公共衛(wèi)生學(xué)院,國家衛(wèi)生健康委員會衛(wèi)生技術(shù)評估重點實驗室(復(fù)旦大學(xué)),上海,200032
癌癥是威脅人們健康的主要因素之一[1]。數(shù)據(jù)顯示,我國2022年中國癌癥新發(fā)482余萬例,死亡321余萬例[2];2010年-2030年癌癥疾病負擔(dān)預(yù)測值高達33280億美元[3]。為提高癌癥患者的生存率,降低癌癥患者的疾病負擔(dān),我國開展了大量癌癥篩查項目,為居民提供診斷、治療等服務(wù)。為了有效分配有限的衛(wèi)生資源,我國研究者開展了針對癌癥篩查的衛(wèi)生經(jīng)濟學(xué)評價,以此來比較不同篩查技術(shù)、篩查頻率、篩查人群的經(jīng)濟成本和綜合收益,進而形成決策所需的優(yōu)選方案, 提高衛(wèi)生系統(tǒng)資源利用的總體效率[4]。
當(dāng)前關(guān)于我國衛(wèi)生經(jīng)濟學(xué)評價文獻質(zhì)量的研究較少,主要關(guān)注各類藥物經(jīng)濟學(xué)研究的文獻質(zhì)量。馮莎等依照《中國藥物經(jīng)濟學(xué)評價指南》評價了2009-2013年間國內(nèi)發(fā)表的藥物經(jīng)濟學(xué)評價文獻質(zhì)量[5];Ma等用CHEERS量表探索了2014年前在英文期刊發(fā)表的我國藥物經(jīng)濟學(xué)評價文獻質(zhì)量[6];高海亮等使用中華中醫(yī)藥學(xué)會的《藥物經(jīng)濟學(xué)評價報告質(zhì)量評估指南》評價了2017年1月-2018年5月發(fā)表的藥物經(jīng)濟學(xué)研究[7];徐藹琳等采用兒童藥物經(jīng)濟學(xué)評價問卷分析了2009年1月-2018年12月間發(fā)表的中文兒童藥物經(jīng)濟學(xué)研究質(zhì)量[8];Yan等用CHEERS量表評價了發(fā)表于2001年-2021年的中英文中醫(yī)藥經(jīng)濟學(xué)研究[9]。現(xiàn)有的文獻質(zhì)量評價集中在藥物經(jīng)濟學(xué)評價方面,且研究使用的評價工具并非國際通用標(biāo)準(zhǔn),評價出版物的時間范圍較短或未覆蓋近年文獻[10]。而篩查對腫瘤的早診早治具有不可估量的意義,高質(zhì)量衛(wèi)生經(jīng)濟學(xué)評價能夠為篩查相關(guān)的資源分配決策提供支撐[11],然而針對數(shù)量一直在增長的我國癌癥篩查類衛(wèi)生經(jīng)濟學(xué)研究,尚未有研究探索該主題衛(wèi)生經(jīng)濟學(xué)評價的文獻質(zhì)量,也未研究探索文獻質(zhì)量的影響因素。
本研究旨在使用CHEERS量表評價我國癌癥篩查類衛(wèi)生經(jīng)濟學(xué)評價的文獻質(zhì)量,并探究質(zhì)量得分的影響因素,為規(guī)范相關(guān)衛(wèi)生經(jīng)濟學(xué)研究提供借鑒和參考。
基于PubMed、Embase、中國知網(wǎng)、萬方數(shù)據(jù)庫等數(shù)據(jù)庫進行文獻檢索。檢索時限為2000年1月1日-2021年2月28日。檢索關(guān)鍵詞包括“成本效果分析”“成本效益分析”“成本效用分析”“經(jīng)濟學(xué)評價”“癌癥”“篩查”等。檢索所得題錄導(dǎo)入EndNote X9.3.3進行去重和篩選。兩位研究者依照下列排除標(biāo)準(zhǔn)背對背完成篩選:①研究對象是動物;②非原始研究;③研究類型非經(jīng)濟學(xué)評價;④研究人群非中國人群;⑤沒有對照措施(包括空白對照)的研究;⑥干預(yù)措施非癌癥篩查的研究。如遇分歧,與第三位研究者共同討論決定。最終共檢索到658篇文獻,經(jīng)過篩查后納入78篇文獻。隨后提取納入研究的基本信息,包括語言、發(fā)表年份、經(jīng)濟學(xué)評價類型、第一作者單位、是否使用決策模型等。具體排除納入過程見圖1。
圖1 PRISMA 流程
1.2.1 質(zhì)量評價。CHEERS量表是由國際藥物經(jīng)濟學(xué)與結(jié)果研究協(xié)會良好文獻質(zhì)量工作組(Health Economic Evaluation Publication Guidelines Good Reporting Practices Task Force)開發(fā)的指南性文件,是目前衛(wèi)生經(jīng)濟學(xué)質(zhì)量評價最常用的評價工具之一[12]。為了保證質(zhì)量評價的準(zhǔn)確性,選取兩位接受過衛(wèi)生經(jīng)濟學(xué)系統(tǒng)訓(xùn)練,有相關(guān)論文發(fā)表經(jīng)歷的博士生背對背開展質(zhì)量評價。事先對兩位評價者進行培訓(xùn),促使其了解CHEERS報告的條目含義,形成統(tǒng)一、規(guī)范的評判標(biāo)準(zhǔn)。隨后兩人背對背使用24個條目的CHEERS量表對納入文獻進行評價。根據(jù)文獻滿足條目的情況進行賦值:完全滿足條目要求為1(是);部分滿足條目要求為0.5(部分);不滿足條目要求為0(否);條目不適用的情況為NA(not applicable)。如遇分歧,與第三位在衛(wèi)生經(jīng)濟學(xué)領(lǐng)域具有豐富研究經(jīng)驗的研究者共同討論決定。
1.2.2 數(shù)據(jù)處理。對提取到的基本信息進行描述性分析。為了排除不適用的選項影響文獻間質(zhì)量的可比性,將每篇文獻質(zhì)量評分的結(jié)果使用如下公式進行標(biāo)化:
本研究使用廣義線性回歸模型來確定影響文獻質(zhì)量標(biāo)化得分的因素,分析文章語言、發(fā)表年份、第一作者單位、經(jīng)濟學(xué)評價類型等特征與文獻質(zhì)量標(biāo)化得分間的關(guān)系,顯著性水平α=0.05,使用R 4.1.1進行統(tǒng)計分析。
隨著時間變化,經(jīng)濟學(xué)評價的發(fā)文量呈現(xiàn)逐年增長的趨勢。其中, 48篇(61.5%)文獻基于Markov、決策樹等分析模型模擬人群隊列來獲得研究結(jié)果,30篇(38.5%)文獻基于單個實證研究開展;開展最多的研究類型為成本效果分析(53.8%),其次是以健康效用值為效果指標(biāo)的成本效用分析(35.9%)。見表1。
表1 納入文獻特征
所有納入文獻的平均標(biāo)化質(zhì)量得分為0.57(s=0.13),單篇文獻得分最小值為0.33,最大值為0.83,CHEERS量表各條目的具體得分情況見表2。觀察到得分較低的條目(標(biāo)化得分小于0.5)包括研究視角(條目6)、貼現(xiàn)率(條目9)、效果的測量(條目11)、貨幣及價格日期和換算(條目14)、分析方法(條目17)、不確定性描述(條目20)、異質(zhì)性描述(條目21)、利益沖突(條目24)。
表2 CHEERS量表的條目得分情況
表3 納入文獻特征的多因素分析
參考Spiegel等人的分類標(biāo)準(zhǔn),經(jīng)過討論,本研究選取文章總質(zhì)量得分將文章進行分類,0.75分以上為高文獻質(zhì)量,0.5分-0.75分為中等文獻質(zhì)量,0-0.5分為低文獻質(zhì)量[13]。本文納入的文獻有7篇為高文獻質(zhì)量研究,45篇中等文獻質(zhì)量研究,26篇為低文獻質(zhì)量研究。由此可見我國相關(guān)研究的質(zhì)量還有待提升。
通過廣義線性回歸分析,確定報告評估質(zhì)量的預(yù)測因素。文章語言、第一作者單位、評價類型對質(zhì)量得分產(chǎn)生了顯著影響,使用英語發(fā)表的文獻得分較高(β=0.080,P=0.002);來自醫(yī)院的研究者發(fā)表的經(jīng)濟學(xué)評價文獻的文獻質(zhì)量偏低(β=-0.072,P=0.004);在經(jīng)濟學(xué)評價類型方面,相較于成本效果分析(β=-0.104,P<0.001)和成本效益分析(β=-0.116,P=0.014),使用成本效用分析法的研究有更高的質(zhì)量。見表4。
本研究梳理了國內(nèi)癌癥篩查主題的衛(wèi)生經(jīng)濟學(xué)評價研究。研究納入文獻平均得分為0.57,范圍為0.33-0.83,也即當(dāng)前我國癌癥篩查類經(jīng)濟學(xué)評價研究只能滿足約一半的CHEERS量表要求,這表明現(xiàn)有研究的透明度和可解讀性不足。納入文獻中高質(zhì)量文獻占比僅為8.9%,低質(zhì)量文獻占比(33.3%)遠高于高質(zhì)量文獻,這也提示國內(nèi)癌癥篩查類衛(wèi)生經(jīng)濟學(xué)評價文獻質(zhì)量有待提升。與其他亞洲背景下使用CHEERS量表的質(zhì)量評價研究結(jié)果相比,Ma等的研究平均得分為0.77,Karekar等的研究平均得分為 0.74,國內(nèi)癌癥篩查類經(jīng)濟學(xué)評價研究得分相對較低,同時高質(zhì)量文獻占比也較低(Ma等的研究為68.8%)[6, 14]。需要注意的是,在Ma的研究中,量表中應(yīng)為“不適用(NA)”的條目被賦分為1,在Karekar的研究中,條目滿足程度僅被評為“是”(1)或“否”(0),而在本研究中,NA的條目從總分中剔除,因此前人研究存在高估文獻質(zhì)量評分的可能性[6, 14]。
針對CHEERS條目得分較低可能的原因,本文提出如下改進建議供研究者參考。首先,研究者應(yīng)主動報告研究采用的視角,如社會視角、衛(wèi)生系統(tǒng)視角、患者視角、醫(yī)保支付方視角等,以提高針對性[15-16]。其次,作者應(yīng)詳細報告數(shù)據(jù)外推、人口異質(zhì)性和不確定性分析的方法,以及偏態(tài)、缺失或刪減數(shù)據(jù)的處理方式,并對開展的敏感性分析加以說明;只有報告以上所有的分析方法,讀者才能判斷方法的適當(dāng)性和結(jié)果的可靠性。第三,基于單一研究和反應(yīng)模型的經(jīng)濟學(xué)評估都應(yīng)該采用敏感性分析反映所有輸入?yún)?shù)的不確定性影響。第四,研究者也應(yīng)考慮亞組間基線特征的差異,其在基線特征上的異質(zhì)性可能會導(dǎo)致患者從干預(yù)措施中的獲益不同,從而使得衛(wèi)生經(jīng)濟學(xué)結(jié)果存在偏倚。最后,研究人員應(yīng)主動報告利益沖突情況。與其他質(zhì)量評估研究相比[13, 17],本研究納入的文獻很少聲明(26.9%)其利益沖突。90.7%的中文文章不符合該標(biāo)準(zhǔn),這可能是由于國內(nèi)期刊沒有做相關(guān)要求,但CHEERS要求作者主動報告利益沖突以避免對文獻質(zhì)量的質(zhì)疑?,F(xiàn)有研究表明,作者在經(jīng)濟方面的利益沖突很可能影響研究結(jié)果的客觀性[18-21]。
研究確定了經(jīng)濟學(xué)評價類型、第一作者單位、文章語言等三個顯著影響文獻質(zhì)量得分的因素。與大學(xué)等研究機構(gòu)的第一作者相比,來自醫(yī)院的作者發(fā)表的文章質(zhì)量相對偏低。類似的德國研究也表明,由檢驗實驗室人員發(fā)表的經(jīng)濟學(xué)研究質(zhì)量較低[22]。這可能因為醫(yī)院研究者接受的衛(wèi)生經(jīng)濟學(xué)培訓(xùn)更少,大部分醫(yī)院研究者受到的教育以臨床醫(yī)學(xué)為主,對于經(jīng)濟學(xué)領(lǐng)域知識的了解可能存在欠缺。例如,干預(yù)措施的時間范圍和成本是經(jīng)濟學(xué)評價的重要構(gòu)成[23-24],但對于醫(yī)院臨床背景的研究人員而言,掌握選擇時間范圍和調(diào)整估算單位成本的方法存在一定挑戰(zhàn),相較于大學(xué)、研究院等專業(yè)的衛(wèi)生經(jīng)濟學(xué)研究機構(gòu)研究者,對衛(wèi)生經(jīng)濟學(xué)的理解、模型方法的應(yīng)用能力存在差異[25]。因此,建議在醫(yī)院進行有關(guān)衛(wèi)生經(jīng)濟報告指南的培訓(xùn),讓有志于開展衛(wèi)生經(jīng)濟學(xué)評價的醫(yī)院研究者了解其原理,規(guī)范掌握相關(guān)的方法學(xué)。同時鼓勵醫(yī)院研究者和研究機構(gòu)之間加強合作,共同提高文章的文獻質(zhì)量。
成本效用分析的文獻質(zhì)量明顯優(yōu)于成本效果分析和成本效益分析。由于成本效用分析對每獲得一個質(zhì)量調(diào)整生命年(quality-adjusted life year,QALY)的成本都進行報告,使得將標(biāo)準(zhǔn)化的干預(yù)效果與對照措施進行比較成為可能[26],成本效用分析由此獲得眾多高水平研究者的青睞,許多權(quán)威指南也建議或提倡使用QALY作為效果單位[27-28]。同時,CHEERS清單也強調(diào)報告干預(yù)措施對預(yù)期壽命和生活質(zhì)量的影響[29],QALY可以很好地滿足上述要求。這些因素都可能使得成本效用研究的質(zhì)量相對較高。盡管如此,研究者也應(yīng)根據(jù)研究目的和需要合理選擇經(jīng)濟學(xué)評價類型。此外,效用值的研究通常是一項復(fù)雜而繁瑣的工作[30],對不從事衛(wèi)生經(jīng)濟或衛(wèi)生服務(wù)研究的作者可能存在一定的難度,因此非上述背景的研究者可能更傾向于選擇成本效果分析或者成本效益分析。最后,本研究納入的成本效益分析和成本效果分析中利用篩查項目現(xiàn)場數(shù)據(jù)開展的經(jīng)濟學(xué)評價占比較大,這類項目開展時可能并未針對衛(wèi)生經(jīng)濟評價收集所需的成本數(shù)據(jù)和效果數(shù)據(jù),也包括可能所需的效用數(shù)據(jù),因此研究者在項目結(jié)束后開展研究時可能出現(xiàn)因信息缺失而降低文獻質(zhì)量的問題。
英文文獻往往具有更高的文獻質(zhì)量得分,原因可能來自中文雜志對于文章字符數(shù)嚴格的限制,使得研究者精簡了報告內(nèi)容導(dǎo)致較低的質(zhì)量得分,另一個原因可能是部分高水平機構(gòu)和研究者對國際交流的偏好使得他們更多在英文期刊上發(fā)表文章,這提示未來發(fā)表中文的衛(wèi)生經(jīng)濟學(xué)研究者應(yīng)注重參考權(quán)威指南來規(guī)范研究。
為了提高我國癌癥篩查類經(jīng)濟學(xué)評價文獻質(zhì)量,首先應(yīng)推動建立符合我國背景的類似CHEERS聲明的經(jīng)濟學(xué)報告指南。發(fā)布CHEERS聲明的項目組由研究人員、政府雇員、雜志編輯構(gòu)成,通過德爾菲法綜合了當(dāng)前經(jīng)濟學(xué)評價的各類準(zhǔn)則,篩選出的對文獻質(zhì)量最重要的條目清單,供衛(wèi)生經(jīng)濟學(xué)領(lǐng)域的研究者、編輯和審稿人參考[12]?,F(xiàn)階段,良好的指南在我國醫(yī)藥衛(wèi)生事業(yè)發(fā)展進程中發(fā)揮著積極作用[31],我國衛(wèi)生經(jīng)濟領(lǐng)域的研究機構(gòu)和期刊雜志及相關(guān)政府部門也可以推動建立符合我國國情,具有中國特色的本土化篩查技術(shù)的經(jīng)濟學(xué)評價報告指南,向研究者進行宣傳和推廣,以提升中文篩查類經(jīng)濟學(xué)評價的文獻質(zhì)量。其次應(yīng)加強衛(wèi)生經(jīng)濟學(xué)研究機構(gòu)與癌癥篩查工作承擔(dān)主體,包括體檢機構(gòu)、基層衛(wèi)生機構(gòu)等各類醫(yī)院和疾控部門間的合作,前者對經(jīng)濟學(xué)評價規(guī)范和原理的了解與后者對疾病進展、篩查技術(shù)的認識和實踐經(jīng)驗?zāi)軌蚴沟秒p方開展的經(jīng)濟學(xué)評價更加準(zhǔn)確、深入、透明,有助于產(chǎn)出更高價值的研究。除此之外,衛(wèi)生經(jīng)濟學(xué)研究機構(gòu)也可以開設(shè)相關(guān)的繼續(xù)教育培訓(xùn)課程供感興趣的其他部門研究者了解和學(xué)習(xí),共同促進國內(nèi)衛(wèi)生經(jīng)濟學(xué)評價的發(fā)展。