李 戈 楊智榮 王巍巍 劉鳳琪 李 沛 孫 鳳
本指南項目組隸屬于GRADE工作組,認為從不精確性角度對網(wǎng)狀Meta分析(NMA)證據(jù)體的確定性進行評估與傳統(tǒng)Meta分析證據(jù)分級遵循相同的基本邏輯,但是NMAs估計值的有效樣本量估算方法不同,且可根據(jù)效應(yīng)量大小決定是否有必要計算最佳信息樣本量(OIS),并首次提供了NMAs的OIS實用算法,系統(tǒng)評價制作者應(yīng)根據(jù)本指南評估網(wǎng)狀Meta分析證據(jù)體的不精確性。
系統(tǒng)評價制作者在評估NMAs估計量的不精確性時需要兼顧具體場景、可信度評級的目標、預(yù)設(shè)閾值、95% CI與閾值的關(guān)系、效應(yīng)量大小以及OIS。當95%CI包含預(yù)設(shè)閾值,可考慮降級;當95%CI不包含閾值且效應(yīng)量大小適中時,無需考察OIS,不因不精確性而降級;當95%CI不包含閾值且效應(yīng)量大時,需考察OIS,如滿足OIS, 則不因不精確性而降級,反之因不精確性降級。
若不精確性是由另一個降級因素導(dǎo)致,應(yīng)避免重復(fù)降級。
項目組提供了一份excel文檔,系統(tǒng)評價制作者可采用其中的工作表計算NMA估計值的OIS和有效樣本量。
系統(tǒng)評價制作者和指南制定者處理不精確性的通用步驟:
(1)明確關(guān)鍵信息,即根據(jù)系統(tǒng)評價目的及決策情境進行效應(yīng)量閾值判斷:零效應(yīng)量(0)、小效應(yīng)量(a)、中等效應(yīng)量(b)及大效應(yīng)量(c)。
(2)考慮效應(yīng)量CI界值與情境閾值關(guān)系:當CI完全位于某個閾值的一側(cè)或兩個閾值之間,則更有信心確定療效價值[1];而當CI包含特定閾值時,證據(jù)可信度降低。圖1所示,根據(jù)最低情境法,即存在任何效應(yīng)(CI未包括0閾值)進行評估:CI1-3均不因不精確性而降級;根據(jù)存在至少小效應(yīng)量評估:則CI1降級,而CI2-3不降級;根據(jù)分步情境法,如果評級目標是小效應(yīng),則CI1或CI3因不精確性降級,而CI2不降級。但是,當CI包含閾值時是否對不精確性進行降級,取決于研究場景、可信度評估目標和所選閾值[1],如在等效試驗中當評估目的為是否存在雙側(cè)輕微效應(yīng),抑或無差異,那么當CI4完全處于微小獲益和微小傷害閾值之內(nèi)時,則不因包含零閾值而降級。同理,系統(tǒng)評價制作者和指南制定者對相同估計值很可能會選擇不同的閾值進行證據(jù)分級,最終導(dǎo)致對不精確性的判斷不同。
圖1 效應(yīng)量CI與閾值的關(guān)系
(3)考察研究樣本量是否滿足OIS。OIS是針對某具體問題而根據(jù)樣本量的經(jīng)典算法估算的所需研究對象人數(shù),用于評估研究結(jié)果是否穩(wěn)健。對于某一特定結(jié)局,當Meta分析納入的樣本量過小或結(jié)局事件數(shù)量少,即不滿足OIS時, CIs將極不穩(wěn)健,其位置會因增加少量數(shù)據(jù)而明顯變動,故因不精確性降級。反之,意味著大量新證據(jù)不太可能使結(jié)果發(fā)生重大改變,不因不精確性而降級。
2.1 NMA不精確性的處理 對NMA證據(jù)分級遵從上述步驟和邏輯,但在考察OIS時有其特殊性,不同點在于:首先,以下兩種情況無需考察OIS:①CI包含閾值,證據(jù)可信度因不精確性降低;②點估計值中等(如RR降低30%),且CI未包含閾值,則可推斷樣本量已經(jīng)足夠大,新證據(jù)不太可能推翻統(tǒng)計推斷結(jié)論。其次,NMA效應(yīng)量同時使用了直接證據(jù)和間接證據(jù),因此不宜根據(jù)納入的總樣本量判斷是否滿足OIS,而通常需要估算NMA有效樣本量(n),見表1。有效樣本量是指忽略網(wǎng)狀結(jié)構(gòu),也忽略直接證據(jù)和間接證據(jù),將NMA估計量和CI看做單個研究的結(jié)果時,生成該效應(yīng)量的等效樣本量。第三,有時需要查看OR和RR的CI上、下界比值。
表1 考察OIS所用樣本量信息
2.1.1 CI包含閾值時,根據(jù)不精確性降級 無論何種場景,當CI包含一個或多個閾值時,證據(jù)的可信度降級[2]。 當不精確性是唯一的降級考量時,考察CI的邊界位置、包含多少個閾值,并按照GRADE指南[3]解釋和評估降級后臨床結(jié)論的恰當性。如果CI包含多個閾值,并且上、下界值分別代表了完全沖突對立的處理效應(yīng),如:下邊界代表巨大獲益,而上邊界代表巨大的危害,則該結(jié)局所提供的信息量非常少。即便假定該證據(jù)體不存在其他嚴重問題,“可能獲益”的結(jié)論也會存在誤導(dǎo),因此降3級,即證據(jù)可信度非常低[4],如此寬的CI常見于稀疏網(wǎng)狀估計量[3]。
2.1.2 CI不包含閾值時,需查看NMA效應(yīng)量大小 當相對效應(yīng)大小適中(例如,相對風(fēng)險降低或增加小于30%)時,并且CI較窄,不包含相關(guān)閾值,表明NMA估計值有足夠的有效樣本量,不需要因不精確而降級。
當CI過寬,不可能滿足OIS,對于RR值,CI寬度可以用上、下界之比表示,比值>3時(OR值CI上、下界之比>2.5),則無論效應(yīng)量大小、理論差異大小以及基線風(fēng)險如何,均不可能滿足OIS,則根據(jù)不精確性降2級。當CI特別寬,應(yīng)考慮降3級[4]。
當CI很寬且不包含閾值,而點估計值很大且不太可信時,通常RR值95%CI上、下界比值<3,或在3左右(如:比值為2.7~3.3);對于OR值來講該比值<2.5,或在2.5左右,無法直接降級,有必要評估NMA估計的有效樣本量,并判斷是否滿足OIS,若不滿足,只需因不精確性降1級。
對于連續(xù)變量結(jié)局指標,如均數(shù)差,無需根據(jù)CI界值給出降級結(jié)論,計算有效樣本量并與OIS比較更為直觀。
2.2 如何估算有效樣本量和OIS 本文重要貢獻在于給出了不同結(jié)局指標有效樣本量的估算方法,并結(jié)合案例進行了實踐模擬驗證。
圖2 根據(jù)RR值和OR值置信區(qū)間評估NMA不精確性降級決策路徑
2.2.1 估計 NMA有效樣本量 如前所述,若NMA估計量包含了直接證據(jù)和間接證據(jù),只有當估計量與直接證據(jù)近似時,可以用納入研究的總樣本量估計NMA的有效樣本量,否則要么低估了,要么高估了該估計量的有效樣本量。作者根據(jù)結(jié)局指標不同(RR、OR或均值差)給出有效樣本量的不同計算方法,本文將以RR值為例進行解讀。有效樣本量估算公式的推導(dǎo)基于3個基本假定和步驟:
(1)根據(jù)NMA估計量的CI上、下邊界估算該指標的標準誤:
SENMA=(ln(CIupper)-ln(CIlower ))3.92(1)
(2)假定開展真實的兩臂等樣本研究,根據(jù)點估計值(RR、OR)、每組樣本量、對照組結(jié)局發(fā)生率(Pc)、試驗/觀察組結(jié)局發(fā)生率(Pt)或合并標準差SD可以計算標準誤(SEtrial),需注意計算過程中對RR值和OR值取以e為底的對數(shù)(ln):
SEtrial=SE(ln[RR])=1n(1pc+1RR×pc-2)(2)
(3)假定NMA估計量來自于一個兩臂等樣本試驗研究,另(1)和(2)中標準誤對應(yīng)相等,則可得到有效樣本量公式:
n=(1pc+1RR×pc-2)(SENMA)2(3)
2.2.2 估計OIS 雖然可信區(qū)間決定了研究的精度,但仍需考慮研究情境和相關(guān)預(yù)定閾值,根據(jù)估算有足夠檢驗效能(如80%)的單個試驗所需樣本量OIS[5],基于不同場景和最小效應(yīng)估算的OIS不同,導(dǎo)致相同的估計值不確定是否滿足OIS[6]。因此,系統(tǒng)評價制作者選擇生物學(xué)上合理的效應(yīng)或最小重要差異,指南制定者基于全情境下的特定效應(yīng),將基于不同的OIS對不精確性做出不同的判斷。
案例,關(guān)于預(yù)防齲齒療效比較的NMA[7],1.23%的酸性磷酸鹽氟化物(APF)凝膠與5%的氟化鈉(NaF)清漆相比的RR值為0.67(95%CI:0.45-0.99),對照組齲齒合并風(fēng)險(即基線風(fēng)險)為77%。如果系統(tǒng)評價制定者認為RR降低33%這一效應(yīng)量較大,則需要進一步評估NMA估計值有效樣本量是否滿足OIS,結(jié)果為:NMA估計的有效樣本量(62)不滿足OIS(184),因此根據(jù)不精確性而降級(表2)。
表2 有效樣本量n和
2.3 其他考慮因素 當不精確性是由直接證據(jù)和間接證據(jù)之間嚴重不一致而產(chǎn)生的,只需對其中一個領(lǐng)域(不一致性或不精確性)降低評級[8],避免在不精確性方面重復(fù)降級??傊琋MA估計值的不精確處理須遵循與傳統(tǒng)Meta分析相同的邏輯,也有其獨特的考量角度,表3對文中案例降級判斷給予了詳細梳理。
NMA在干預(yù)性證據(jù)評價中有著重要價值,對其結(jié)果客觀解讀非常重要,GRADE證據(jù)評價可以推動我國臨床研究者對NMA結(jié)論的整體認識,提高我國NMA研究的質(zhì)量。
表3 案例梳理:NMA估計值不精確性處理相關(guān)因素1)
本次解讀盡量結(jié)構(gòu)化了關(guān)于NMA估計值不精確性評價的邏輯和方法,并對案例進行了全面梳理,但在實際制作系統(tǒng)評價和制定指南時,需要構(gòu)建專業(yè)團隊共同完成,以期為相關(guān)循證決策方提供有價值的決策依據(jù)。