文/Anil Kumar Meghana Taggarsi 翻譯/王瑞 張崇凡 夏君
GRADE 方法是批判性評(píng)價(jià)對(duì)照研究和為系統(tǒng)評(píng)價(jià)提供建議的主流工具之一。
循證實(shí)踐是現(xiàn)代醫(yī)學(xué)實(shí)踐中不可或缺的一部分,忽視證據(jù)和證據(jù)質(zhì)量的現(xiàn)代醫(yī)療是無法想象的1。然而,循證醫(yī)學(xué)并不像人們認(rèn)為的那樣完美。在當(dāng)代研究中,學(xué)者們總是會(huì)對(duì)證據(jù)質(zhì)量提出質(zhì)疑?!读~刀》雜志總編理查德·霍頓(Richard Horton)曾在《柳葉刀》上發(fā)文指出,由于納入研究樣本量較小、研究差異無統(tǒng)計(jì)學(xué)意義、分析方法不恰當(dāng)、利益沖突明顯、或?qū)α餍汹厔?shì)的盲從等因素,近50%的科學(xué)文獻(xiàn)可能存在錯(cuò)誤或造假2。
循證醫(yī)學(xué)的不恰當(dāng)應(yīng)用會(huì)對(duì)患者帶來負(fù)面影響,不利于實(shí)現(xiàn)循證醫(yī)學(xué)促進(jìn)社會(huì)健康的理念3。英國國家健康與臨床優(yōu)選研究所(National Institute for Clinical Excellence)指出,用于制定指南和推薦意見的文獻(xiàn)中,約有62%的研究是不可靠的,且無法確定這些研究與患者之間的相關(guān)性4。
最近,英國《衛(wèi)報(bào)》的一則報(bào)道引起了全世界對(duì)證據(jù)質(zhì)量和篡改證據(jù)的關(guān)注。報(bào)道稱,影響力排名最高的兩本國際醫(yī)學(xué)期刊《新英格蘭醫(yī)學(xué)雜志》和《柳葉刀》分別撤回了一篇有關(guān)新冠肺炎疫情的文章。柳葉刀撤回的文章為A multinational registry analysis of hydroxychloroquine on COVID 19。受該研究影響,擔(dān)心羥氯喹會(huì)增加死亡率,使用羥氯喹治療新冠肺炎的臨床試驗(yàn)在全球范圍內(nèi)被叫停,包括世界衛(wèi)生組織和世界各國當(dāng)時(shí)正在進(jìn)行的隨機(jī)對(duì)照試驗(yàn)5。后來的詳細(xì)審查結(jié)果表明,該研究的數(shù)據(jù)來源和分析存在不一性。這項(xiàng)存在缺陷的試驗(yàn)會(huì)導(dǎo)致患者在這場(chǎng)全球疫情中面臨風(fēng)險(xiǎn),未來的試驗(yàn)可能會(huì)對(duì)受影響的患者數(shù)量進(jìn)行說明。良好的研究質(zhì)量是為醫(yī)學(xué)實(shí)踐提供證據(jù)的關(guān)鍵,因此,應(yīng)努力確保產(chǎn)出最高質(zhì)量的證據(jù)。
循證實(shí)踐是現(xiàn)代醫(yī)學(xué)實(shí)踐中不可或缺的一部分,忽視證據(jù)和證據(jù)質(zhì)量的現(xiàn)代醫(yī)療是無法想象的1。然而,循證醫(yī)學(xué)并不像人們認(rèn)為的那樣完美。
推薦意見分級(jí)評(píng)估、制定和評(píng)價(jià)工作組(Grading of Recommendations Assessment, Development and Evaluation Working Group,GRADE)將證據(jù)質(zhì)量定義為,報(bào)告的效應(yīng)值真實(shí)可靠,以及其為具體推薦意見提供支持的可信度6。GRADE方法是批判性評(píng)價(jià)對(duì)照研究和為系統(tǒng)評(píng)價(jià)提供建議的主流工具之一。對(duì)系統(tǒng)評(píng)價(jià)和指南進(jìn)行批判性評(píng)價(jià)是一項(xiàng)復(fù)雜的工作,需要熟練掌握GRADE工具或其他重要評(píng)價(jià)工具的相關(guān)知識(shí)7。
證據(jù)質(zhì)量取決于研究的方法學(xué)和報(bào)告質(zhì)量8。高質(zhì)量的研究需要有嚴(yán)密的研究設(shè)計(jì),并高度重視研究結(jié)局的可信度?;谠\斷、預(yù)后、篩查和治療的相關(guān)研究,牛津大學(xué)循證醫(yī)學(xué)中心推出了證據(jù)金字塔,金字塔頂端為系統(tǒng)評(píng)價(jià),其后依次為隨機(jī)對(duì)照試驗(yàn)、隊(duì)列研究、病例對(duì)照、病例系列和專家意見9。因此,在可行的情況下,應(yīng)該使用實(shí)施良好的系統(tǒng)評(píng)價(jià)、薈萃分析和隨機(jī)對(duì)照試驗(yàn)指導(dǎo)臨床決策。
方法學(xué)質(zhì)量決定研究的整體質(zhì)量,研究的整體質(zhì)量決定證據(jù)質(zhì)量。GRADE方法提出了8個(gè)影響證據(jù)質(zhì)量的要素,其中包括5個(gè)降級(jí)因素和3個(gè)升級(jí)因素。降級(jí)因素分別為偏倚風(fēng)險(xiǎn)、不一致性、不精確性、間接性和發(fā)表偏倚。研究設(shè)計(jì)是決定證據(jù)質(zhì)量的關(guān)鍵10。
未進(jìn)行分配隱藏、未施盲、失訪偏倚大、未遵守意向性分析的原則、對(duì)結(jié)局進(jìn)行選擇性或傾向《英國醫(yī)學(xué)雜志》中文版2021年2月第24卷第2期循證醫(yī)學(xué)性報(bào)告等偏倚風(fēng)險(xiǎn)因素會(huì)降低療效估計(jì)值的可信度。這些偏倚導(dǎo)致研究存在局限性,對(duì)證據(jù)質(zhì)量產(chǎn)生不利影響。不同的研究人群、干預(yù)措施和結(jié)局會(huì)導(dǎo)致異質(zhì)性或多變性,進(jìn)而造成研究結(jié)果的不一致性。如果研究人員無法對(duì)異質(zhì)性作出合理解釋,則須對(duì)證據(jù)質(zhì)量進(jìn)行降級(jí)。
如果針對(duì)某一問題存在兩項(xiàng)有效的干預(yù)措施,相較于直接對(duì)比兩項(xiàng)干預(yù)措施的研究而言,將每一項(xiàng)干預(yù)措施分別與安慰劑組對(duì)比的研究則顯然為間接證據(jù),證據(jù)質(zhì)量因間接性而被降級(jí)。如果研究的樣本量非常小,變量極少,導(dǎo)致置信區(qū)間很大,就會(huì)出現(xiàn)不精確的問題。制藥行業(yè)贊助的臨床試驗(yàn)可能會(huì)受到商業(yè)利益的影響。行業(yè)贊助的試驗(yàn),尤其是小型研究或與新療法相關(guān)的隨機(jī)對(duì)照試驗(yàn),可能會(huì)在方法學(xué)、結(jié)果報(bào)告和發(fā)表方面存在偏倚。這類研究經(jīng)常會(huì)刻意隱瞞不良結(jié)果,這可能會(huì)導(dǎo)致嚴(yán)重的問題,尤其是在新療法或藥物獲批上市時(shí),沒有考慮到贊助商可能未公開該藥物或療法的所有潛在獲益或風(fēng)險(xiǎn)。因此,在高水平同行評(píng)議期刊上發(fā)表這類行業(yè)贊助的試驗(yàn)可能會(huì)引發(fā)偏倚,影響效應(yīng)估計(jì)值的可信度,從而導(dǎo)致證據(jù)質(zhì)量被降級(jí)11-12。這種局限性會(huì)影響證據(jù)的主體質(zhì)量,局限性越大,證據(jù)質(zhì)量越低6。此外,數(shù)據(jù)不準(zhǔn)確或太少以及較高的報(bào)告偏倚也會(huì)降低證據(jù)質(zhì)量13。
升級(jí)因素包括大效應(yīng)量、可能存在的混雜因素調(diào)整和劑量-反應(yīng)關(guān)系6。當(dāng)效應(yīng)在所有受試者中趨于一致或效應(yīng)完全不同于過往相關(guān)試驗(yàn)結(jié)果時(shí),可以因?yàn)樾?yīng)意義重大而對(duì)證據(jù)質(zhì)量進(jìn)行升級(jí)。值得注意的是,如果結(jié)局具有主觀性,研究者因觀察到的大效應(yīng)量,而考慮對(duì)證據(jù)質(zhì)量進(jìn)行升級(jí)時(shí)則需要保持警惕,尤其是在未對(duì)結(jié)局評(píng)估者實(shí)施盲法和分配隱藏的情況下10。劑量-反應(yīng)關(guān)系可以反映出重要的因果關(guān)系,會(huì)增加我們對(duì)研究結(jié)果的信心,從而提高證據(jù)質(zhì)量。如果觀察性研究中所有可能存在的偏倚都會(huì)導(dǎo)致真實(shí)療效被低估,則可以對(duì)證據(jù)質(zhì)量進(jìn)行升級(jí)。
證據(jù)質(zhì)量不僅取決于研究設(shè)計(jì)、質(zhì)量、一致性和直接性,還會(huì)受到研究局限性、結(jié)果的不一致性、偏倚風(fēng)險(xiǎn)和證據(jù)不確定性的影響。GRADE方法對(duì)這些因素進(jìn)行了分析,并將證據(jù)質(zhì)量分為高、中、低和極低四個(gè)等級(jí)。
若進(jìn)一步的研究不可能改變效應(yīng)估計(jì)值,則為高質(zhì)量證據(jù);若仍有進(jìn)一步的研究空間,且后續(xù)研究可能會(huì)改變效應(yīng)估計(jì)值,則為中等質(zhì)量證據(jù);若后續(xù)研究會(huì)改變效應(yīng)估計(jì)值,則為低質(zhì)量證據(jù);若無法確定任何效應(yīng)估計(jì)值,則為極低質(zhì)量證據(jù)。在撰寫推薦意見和制定指南時(shí),應(yīng)對(duì)證據(jù)質(zhì)量進(jìn)行分級(jí)。證據(jù)質(zhì)量級(jí)別會(huì)影響醫(yī)護(hù)人員向患者提供循證實(shí)踐時(shí)的選擇10。
高質(zhì)量證據(jù)不一定產(chǎn)生強(qiáng)推薦。除證據(jù)質(zhì)量外,推薦意見的撰寫和指南制定還需要考慮其他因素,例如干預(yù)的利與弊、患者的價(jià)值觀念和偏好以及成本問題7。因此,總體證據(jù)質(zhì)量指的是對(duì)回答醫(yī)療保健問題、決定或制定推薦意見和指南有重要意義的所有證據(jù)質(zhì)量的總和。
流程圖描述了制定指南或推薦意見之前,使用GRADE框架來評(píng)估證據(jù)的簡單易懂的方法(圖1)。
圖1 描述推薦意見分級(jí)的評(píng)估、制定和評(píng)價(jià)方法的流程圖
每一個(gè)臨床醫(yī)生都應(yīng)該具備理解、評(píng)價(jià)和判斷證據(jù)質(zhì)量的能力。從研究或證據(jù)素材、方法和報(bào)告方面對(duì)證據(jù)質(zhì)量進(jìn)行批判性評(píng)價(jià)的工具有很多。對(duì)證據(jù)質(zhì)量進(jìn)行充分評(píng)價(jià)是很困難的。對(duì)證據(jù)的構(gòu)成要素進(jìn)行考察是評(píng)價(jià)證據(jù)質(zhì)量的最合理方法,而不是盲目地將證據(jù)分為高質(zhì)量或低質(zhì)量。掌握批判性評(píng)價(jià)的本領(lǐng)需要保有謹(jǐn)慎的態(tài)度、接受培訓(xùn)和不斷實(shí)踐。近年來,在對(duì)Cochrane新發(fā)表的系統(tǒng)評(píng)價(jià)進(jìn)行評(píng)估時(shí),GRADE方法已成為不可或缺的一部分。GRADE是清晰、詳細(xì)、有效的證據(jù)質(zhì)量評(píng)級(jí)方法,為推薦意見的撰寫提供了支持,確保了證據(jù)呈現(xiàn)和指南制定的透明性。