王浩,唐曉宇,王和平,吳昊森,周奇,王子君,肖淑君,劉練,王東珂,楊楠,王琪,王小琴
隨機對照試驗(RCT)被公認(rèn)為評價醫(yī)療干預(yù)措施效果的金標(biāo)準(zhǔn)[1,2]。但在研究罕見病、慢性疾病及涉及倫理學(xué)或長期療效觀察等問題上,隨機對照試驗的可行性較低,而隊列研究、病例對照研究等非隨機對照研究(NRSI)更易達(dá)到研究目標(biāo),并且也是評估干預(yù)療效的重要方法[3-6]。且一些學(xué)者在對RCT和觀察性研究進(jìn)行對比后,認(rèn)為一個大樣本的試驗設(shè)計完善的非隨機研究比一個小樣本的設(shè)計不佳的RCT更加可取[7,8]。目前,許多評價觀察性研究方法學(xué)質(zhì)量的工具已被系統(tǒng)評價采用[9,10],而Newcastle-Ottawa[11]和Downs-Black[12]工具是其中應(yīng)用最廣泛的兩種。雖然兩者都具有完善的方法學(xué)的條目清單,但是每一個條目同時涉及內(nèi)部有效性和外部有效性,并且缺乏綜合性的手冊。
英國布里斯托爾大學(xué)(University of Bristol)社會醫(yī)學(xué)部在推出評估系統(tǒng)評價偏倚風(fēng)險—ROBIS工具后[13],于2016年又制定了一種全新的非隨機干預(yù)研究評價工具—ROBINS-I(Risk Of Bias In Non-randomised Studies-of Interventions)工具[14],其針對偏倚風(fēng)險的考慮參照隨機對照試驗的Cochrane偏倚風(fēng)險工具[15],診斷準(zhǔn)確性研究的QUADAS-2工具[16]以及系統(tǒng)評價的ROBIS工具[17,18],通過更加規(guī)范的手冊評價多個偏倚領(lǐng)域以判斷研究的總風(fēng)險。而本文旨在介紹和解讀ROBINS-I工具,幫助國內(nèi)系統(tǒng)評價制作者理解和應(yīng)用該工具,以更好地判斷非隨機對照研究偏倚風(fēng)險。
ROBINS-I工具的制定歷經(jīng)三年,分以下五個階段。①收集信息:在項目啟動會議上調(diào)查Cochrane評價小組,收集評價非隨機對照干預(yù)研究偏倚風(fēng)險方法的信息。②確定領(lǐng)域和問題:確定相關(guān)的偏倚領(lǐng)域及建立各偏倚領(lǐng)域的工作組。參照之前QUADAS-2工具形成的過程,通過回答標(biāo)志性問題以幫助評價者判斷各領(lǐng)域的偏倚,由各工作組具體考慮如何制定標(biāo)志性問題及如何通過這些標(biāo)志性問題的回答判斷偏倚風(fēng)險。③共識會議:所有制定者召開面對面會議,討論并確定各領(lǐng)域偏倚的標(biāo)志性問題,對工具的主要特征達(dá)成一致。④預(yù)試驗:工具的初始版本在工作組內(nèi)進(jìn)行預(yù)試驗,基于預(yù)試驗的結(jié)果進(jìn)行修訂,形成ROBINS-I工具的1.0.0版[19]。⑤進(jìn)一步完善:召開研討會解釋此工具,組建一個小組運用工具評價6篇非隨機對照研究,基于此次會議及隨后使用的反饋進(jìn)行修改,最終形成新的2.0版本[20]。
針對單個研究使用該工具進(jìn)行評價包括六個步驟,為使讀者更好地理解和使用該工具,以中國循證兒科雜志期刊于2013年發(fā)表的《經(jīng)胎盤轉(zhuǎn)運地高辛治療胎兒心力衰竭的非隨機對照研究》 (以下簡稱“地高辛研究”)[21]為例,采用 ROBINS-I工具對其偏倚風(fēng)險進(jìn)行評價。
2.1 指定目標(biāo)隨機試驗假定一個采用隨機方法的目標(biāo)試驗,受試者相同,不存在偏倚風(fēng)險,無需考慮試驗可行性和倫理因素。根據(jù)目標(biāo)試驗與所評價研究結(jié)果的系統(tǒng)性差異定位偏倚。目標(biāo)試驗見表1。選擇評價結(jié)果的類型分兩種:①意向性分析的結(jié)果:干預(yù)措施由分配確定,無論最終是否接受該組的治療措施或依從性如何,在分析時仍作為該組分配干預(yù)的結(jié)果。②符合方案集分析的結(jié)果:只納入完全按照方案完成試驗全過程受試者的分析結(jié)果[22]。后者相比前者需要考慮干預(yù)的依從性和“干擾”(指除意向干預(yù)外的干預(yù))引起的誤差。地高辛研究將對照組轉(zhuǎn)組的受試者的結(jié)果納入實驗干預(yù)組分析,退出和失訪病例未行分析,因此研究結(jié)果屬于符合方案分析的結(jié)果。
表1 假定的目標(biāo)試驗
2.2 指定待評價結(jié)果和結(jié)局指定需要評價偏倚風(fēng)險的結(jié)局指標(biāo),選擇可以標(biāo)化的結(jié)果進(jìn)行評價。地高辛研究以妊娠結(jié)局、患胎的心律轉(zhuǎn)復(fù)情況、分娩情況、出生后心律及心功能和生長發(fā)育情況等作為結(jié)局指標(biāo),以心血管整體評分(CVPS)及心室作功指數(shù)胎齡、產(chǎn)時Apgar評分、超聲心動圖評價等作為標(biāo)化結(jié)果。
2.3 初步考慮混雜因素和干擾通過評價人員的專業(yè)知識和初步的文獻(xiàn)瀏覽,識別出重要混雜域和干擾(表2~3)?;祀s域是指受試者接受何種干預(yù)的預(yù)測因素,干擾是指與接受的干預(yù)措施以及結(jié)果的預(yù)測因素均相關(guān)的額外干預(yù),兩者均可引起偏倚。經(jīng)判斷,地高辛研究[21]存在一項重要“混雜域”,即“心功能情況”,其可能影響孕婦選擇是否服用地高辛治療。地高辛研究除進(jìn)行地高辛干預(yù)外,未采用其他干預(yù),因此不存在重要“干擾”。
2.4 回答標(biāo)志性問題ROBINS-I工具將偏倚分為7個領(lǐng)域:①混雜偏倚;②選擇受試者偏倚;③干預(yù)分類偏倚;④意向干預(yù)偏離偏倚;⑤丟失數(shù)據(jù)偏倚;⑥結(jié)局測量偏倚;⑦選擇性報告偏倚。以干預(yù)狀態(tài)將7個偏倚領(lǐng)域劃分成3部分。即:干預(yù)前、干預(yù)時和干預(yù)后。非隨機對照干預(yù)研究主要在前3個偏倚風(fēng)險評估中區(qū)別于隨機對照試驗,主要是隨機化方面的差異。其他4個偏倚領(lǐng)域與隨機試驗的偏倚風(fēng)險評估有許多重疊(表4)。
表2 重要混雜域(以“地高辛研究” [21] 為例)
表3 重要干擾(以“地高辛研究” [21]為例)
表4 ROBINS-I工具包含的偏倚領(lǐng)域
此階段需要針對7個偏倚領(lǐng)域的33個標(biāo)志性問題,按順序作出:是(Y)、可能是(PY)、否(N)、可能否(PN)、無信息(NI)的回答,通過回答標(biāo)志性問題,判斷偏倚風(fēng)險。具體標(biāo)志性問題,問題選擇以及地高辛研究針對問題的回答(表5)。
2.5 判斷各領(lǐng)域偏倚風(fēng)險根據(jù)7個偏倚領(lǐng)域的標(biāo)志性問題的回答,判斷偏倚風(fēng)險。如果回答每個偏倚領(lǐng)域標(biāo)志性問題后無任何潛在性的偏倚,該研究可評為低偏倚風(fēng)險。一旦潛在性偏倚存在時,評價者必須依據(jù)表6判斷偏倚風(fēng)險的程度,判斷結(jié)果分5個級別:低偏倚風(fēng)險、中等偏倚風(fēng)險、高偏倚風(fēng)險、極高偏倚風(fēng)險、無信息,每個級別含義見表6。并對存在的偏倚判斷偏倚方向(利于實驗組或?qū)φ战M)。
通過對標(biāo)志性問題的回答,判斷出在“混雜偏倚”領(lǐng)域,地高辛研究因為存在“心功能狀態(tài)”這一重要混雜域,部分對照組可能因心功能惡化,轉(zhuǎn)為地高辛組,引起基線混雜和時變混雜,而作者未采用恰當(dāng)分析方法處理,該領(lǐng)域存在極高偏倚風(fēng)險。對轉(zhuǎn)組的受試者作為地高辛組進(jìn)行分析,治療時間減少,此偏倚有利于對照組?!斑x擇受試者偏倚”和“干預(yù)分類偏倚”領(lǐng)域為低風(fēng)險?!耙庀蚋深A(yù)偏離”領(lǐng)域,地高辛研究為符合方案集分析結(jié)果,干預(yù)實施良好,未出現(xiàn)偏離?!皝G失數(shù)據(jù)偏倚”和“結(jié)果測量偏倚”領(lǐng)域偏倚風(fēng)險較低。對于“選擇性報告偏倚”領(lǐng)域,雖無選擇性報告的指征,但缺乏預(yù)先的注冊信息或數(shù)據(jù)分析計劃等證據(jù)支持,因此為中等偏倚風(fēng)險,此偏倚的方向的判斷缺乏信息支持。
2.6 判斷研究整體偏倚風(fēng)險根據(jù)各偏倚領(lǐng)域的偏倚風(fēng)險程度,確定研究的偏倚風(fēng)險,分5個級別:低偏倚風(fēng)險、中等偏倚風(fēng)險、高偏倚風(fēng)險、極高偏倚風(fēng)險、無信息。地高辛研究各有一個領(lǐng)域為極高和中等偏倚風(fēng)險,因此研究整體的偏倚風(fēng)險為極高。判斷依據(jù)和各級別代表含義(表7)。
本文選取的非隨機對照試驗,偏倚風(fēng)險為極高,主要存在混雜因素的影響并且未合理分析,此外還未注冊和計劃書等信息。應(yīng)注意的是,其存在的混雜偏倚有利于對照組,而研究結(jié)果有利于地高辛組,反而進(jìn)一步提高了結(jié)果可信度,在用此工具評價系統(tǒng)評價納入的NRSI,應(yīng)結(jié)合具體研究問題分析。本文僅評估一篇非隨機同期對照試驗,需進(jìn)一步探討評估自身前后對照研究、歷史對照研究等。
ROBINS-I工具的研發(fā)主要是解決系統(tǒng)評價中非隨機干預(yù)研究偏倚風(fēng)險的評估問題;更廣泛潛在的用途是資助申請的評價和期刊稿件的同行評審;此外,當(dāng)設(shè)計原始研究去評估一種干預(yù)效果時,可指導(dǎo)研究者如何去考慮該問題。它與以往評價非隨機干預(yù)研究的工具所不同的特點:①該工具基于7個偏倚領(lǐng)域的風(fēng)險程度判斷總的風(fēng)險,而每一個偏倚領(lǐng)域風(fēng)險則是通過回答標(biāo)志性問題判斷的。工
具針對非隨機干預(yù)研究的“偏倚風(fēng)險”,將非隨機干預(yù)研究設(shè)計、制作和結(jié)果解釋中可能出現(xiàn)的偏倚以標(biāo)志性問題一一提出,相較于以往“方法學(xué)質(zhì)量”這一概念更為詳細(xì)具體,并且最終的結(jié)果是以總偏倚風(fēng)險相關(guān)性的“低”、“中等”、“高”、“極高”、“無信息”來表示,相比較工具以條目的答案數(shù)量或通過最終分值來表示的方法學(xué)質(zhì)量更加明確。②該工具的形成約3年,收集、遴選和專家共識最能反映非隨機干預(yù)研究中偏倚風(fēng)險的標(biāo)志性問題,于2014年9月Cochrane學(xué)術(shù)年會發(fā)布初始的1.0.0版,此后進(jìn)行過多次的預(yù)試驗及培訓(xùn),基于預(yù)試驗、培訓(xùn)和用戶的反饋對該工具進(jìn)行重大修訂形成目前的2.0版本。③該工具相對于之前,適用范圍更廣。ROBINS-I工具不僅用于觀察性的非隨機干預(yù)研究,還用于實驗性的非隨機干預(yù)研究,如:非隨機同期對照試驗、自身前后對照研究、歷史對照研究等。④評價非隨機干預(yù)研究時先假設(shè)為隨機對照試驗,因而其低風(fēng)險偏倚就和高質(zhì)量的隨機對照試驗的偏倚風(fēng)險對應(yīng)起來,使非隨機干預(yù)研究使用GRADE[23-25]證據(jù)分級時,不是因為隨機化缺乏而降級[26,27],而是因為隨機化不好才降級。當(dāng)非隨機干預(yù)研究和隨機對照試驗有相似偏倚時,兩種類型的研究可以合并,使得GRADE從只能對相同類型研究的證據(jù)體分級轉(zhuǎn)向不同類型研究的證據(jù)體分級。
表5 判斷各個領(lǐng)域偏倚需要回答的標(biāo)志性問題
表6 ROBINS-I工具中偏倚領(lǐng)域的解讀和總偏倚風(fēng)險的判斷
工具的局限性:①該工具注重具體的偏倚判斷,并沒有處理結(jié)果不準(zhǔn)確性問題,如:統(tǒng)計分析位考慮到群集或參與者的匹配問題。②使用工具評價時,每個領(lǐng)域需回答3~7個標(biāo)志性問題(表5),得出每個偏倚領(lǐng)域風(fēng)險程度時還需對7個領(lǐng)域進(jìn)行總體判斷,使得工具操作過于復(fù)雜和耗時。③雖然該工具在1.0.0版本的基礎(chǔ)上進(jìn)行了重大修訂,但其信度、效度和實用性及其推廣情況仍有待時間的檢驗。
表7 ROBINS-I工具中偏倚領(lǐng)域的偏倚風(fēng)險的判斷