明 黎,童 可,余更生
(重慶醫(yī)科大學附屬兒童醫(yī)院心血管內(nèi)科,重慶 400014)
川崎病(KD)是一種以全身血管炎癥為主要病變的兒童急性自限性疾病,病變易累及冠狀動脈[1]。未經(jīng)治療的患兒中發(fā)生冠狀動脈病變(CAL),包括冠狀動脈瘤(CAA)或冠狀動脈擴張(CAD),從而引起缺血性心臟病、心肌梗死,甚至導致患兒猝死的概率高達25%,KD已成為發(fā)達國家或地區(qū)嬰幼兒獲得性心臟病的首要病因之一[2-3]。及時接受靜脈注射免疫球蛋白(IVIG)聯(lián)合口服阿司匹林治療,CAL發(fā)生率可降至3%~5%[4]。但仍有10%~20%的KD患兒可發(fā)生IVIG無反應,并且此類患兒出現(xiàn)CAL的風險更高[5]。因此,越來越多的研究將目光轉(zhuǎn)向了除IVIG之外的其他治療方案,如糖皮質(zhì)激素(GCs)、腫瘤壞死因子α(TNF-α)阻斷劑、蛋白酶抑制劑、小劑量甲氨蝶呤和血漿置換等。
系統(tǒng)評價(SR)再評價是全面收集同一疾病或同一健康問題治療或病因、診斷、預后等方面的相關(guān)SR并進行綜合研究的一種方法,其可為證據(jù)使用者提供更為集中的高質(zhì)量證據(jù)[6]。目前為止,針對KD或IVIG無反應型KD患兒的治療,國內(nèi)外已經(jīng)公開發(fā)表了多篇SR,但其研究方法的質(zhì)量和證據(jù)的可靠性尚不明確。因此,本研究應用SR再評價的方法對KD治療相關(guān)SR存在的方法學偏倚及其結(jié)局指標證據(jù)質(zhì)量高低進行評價,為臨床工作者提供更為集中的高質(zhì)量證據(jù)。以期為臨床更好地向KD患兒提供治療和開展規(guī)范化的臨床試驗研究提供參考。
1.1納入與排除標準
1.1.1研究類型 基于隨機對照試驗的SR,文獻語種限中、英文。
1.1.2研究對象及資料 臨床診斷為KD的患兒,包括初治KD和IVIG無反應型KD,以及年齡、性別和種族不限資料。
1.1.3干預措施 干預措施不限,試驗組和(或)對照組包括KD治療的任一措施,如IVIG、GCs、阿司匹林、TNF-α阻斷劑等。
1.1.4結(jié)局指標 (1)主要結(jié)局指標:CAL發(fā)生率;(2)次要結(jié)局指標:體溫恢復狀況及不良事件發(fā)生率。
1.1.5排除標準 (1)會議摘要、無法獲取全文和重復發(fā)表的文獻;(2)尚處于計劃階段的SR;(3)未對納入的原始研究進行定量分析;(4)網(wǎng)狀meta分析。
1.2文獻檢索策略 數(shù)據(jù)庫包括Cochrane圖書館、Pubmed、EMbase、CBM、CNKI及Wanfang,搜集KD治療相關(guān)的SR,檢索時限均為建庫起至2020年2月。英文檢索詞為mucocutaneous lymph node syndrome、Kawasaki、meta-analysis、systematic review等;中文檢索詞為川崎病、皮膚黏膜淋巴結(jié)綜合征、meta分析、系統(tǒng)評價、薈萃分析、系統(tǒng)綜述、匯總分析等。
1.3文獻篩選與資料提取 2位研究者按照預先制定的納入與排除標準獨立篩選文獻后進行數(shù)據(jù)提取。數(shù)據(jù)提取內(nèi)容包括題目、第一作者、發(fā)表(或更新)年份、干預/對照措施、結(jié)局指標和結(jié)論、AMSTAR2質(zhì)量評價的關(guān)鍵要素和證據(jù)質(zhì)量情況等。過程中若遇分歧,通過討論或咨詢第三者協(xié)助解決。
1.4方法學質(zhì)量評價和證據(jù)質(zhì)量評價 采用AMSTAR2工具[7]評價納入SR的方法學質(zhì)量。AMSTAR2工具在AMSTAR工具的基礎上進行了更新,確定了16個領域,其中領域2、4、7、9、11、13、15被推薦為可能影響SR結(jié)果有效性的重要領域,并基于重要領域存在缺陷的程度評定SR的可信度:沒有或者1個非重要領域存在缺陷評為“高”;超過1個非重要存在缺陷評為“中”;1個重要領域加或不加非重要領域存在缺陷評為“低”;超過1個重要領域加或不加非重要領域存在缺陷評為“極低”[8]。采用GRADE評價系統(tǒng)[9-10]對結(jié)局指標進行證據(jù)質(zhì)量評價,主要涉及局限性、不直接性、不一致性、不精確性和發(fā)表偏倚5個降級因素。隨機對照試驗被預設為“高級”證據(jù),降1級為“中級”,降2級為“低級”,降3級為“極低級”。以上評價過程由2名研究者分別獨立進行,完成后進行交叉核對,如有分歧通過討論解決或通過第三者裁定。
2.1文獻篩選流程及結(jié)果 初步檢索共獲得相關(guān)文獻660篇,經(jīng)逐層篩選,最終納入16篇符合要求的SR文獻[11-26]。文獻篩選過程及結(jié)果見圖1。
圖1 文獻篩選流程及結(jié)果
2.2納入文獻的基本特征 納入的16篇SR文獻中,中文文獻10篇[11-20],英文文獻6篇[21-26],4篇為Cochrane SR[22,24-26];研究發(fā)表年份在2004—2019年。8篇SR文獻[11-16,23-24]涉及單用或在常規(guī)方案中聯(lián)合應用GCs,6篇SR文獻[17-22]涉及劑量不同、給藥方式不同的IVIG間的比較,其余TNF-α阻斷劑[26]和水楊酸鹽[25]治療的SR各1篇。13篇SR文獻描述了對原始研究風險偏倚評估工具,其中7篇使用Cochrane手冊推薦的風險偏倚評估工具,5篇使用Jadad量表,1篇使用Juni量表。納入SR文獻的基本特征見表1。
表1 納入SR文獻的基本特征
續(xù)表1 納入SR文獻的基本特征
2.3納入文獻的方法學質(zhì)量評價 4篇為低質(zhì)量研究,12篇為極低質(zhì)量研究,見表2。針對關(guān)鍵條目中的符合情況:條目2的符合率為25.0%,條目4為31.3%,條目7為37.5%,條目9、15為43.8%,條目11為87.5%,條目13為62.5%。非關(guān)鍵條目中,條目1的符合率達100.0%,但所有SR均未符合條目10的要求,其余條目的符合情況表現(xiàn)不一,見圖2。條目1:研究問題和納入標準是否包括PICO各要素;條目2:是否報告SR研究方法在實施前就已確定,是否報告與計劃書不一致的情況;條目3:作者是否解釋了選擇SR納入研究設計類型的原因;條目4:作者是否使用了全面的文獻檢索策略;條目5:是否由兩人獨立完成文獻篩選;條目6:是否由兩人獨立完成數(shù)據(jù)提?。粭l目7:是否提供了排除文獻的清單及排除理由;條目8:作者是否足夠詳細地描述了納入研究的基本特征;條目9:作者是否使用合理工具評估納入研究文獻的偏倚風險;條目10:作者是否報告了該SR納入研究的資金來源;條目11:如進行了 meta 分析,作者是否使用適當?shù)慕y(tǒng)計方法進行結(jié)果合并分析;條目12:如果進行了 meta 分析,作者是否考慮了納入研究的偏倚風險對 meta 分析或其他證據(jù)整合的潛在影響;條目13:在解釋/討論SR結(jié)果時,作者是否考慮了納入研究的偏倚風險;條目14:作者對SR結(jié)果中異質(zhì)性是否給予滿意的解釋或討論;條目15:如果進行定量合成,作者是否充分調(diào)查了發(fā)表偏倚,并討論了其對研究結(jié)果的可能影響;條目16:作者是否報告了任何潛在的利益沖突,包括開展SR所接受的任何資助。
2.4納入文獻的GRADE證據(jù)質(zhì)量分級 運用GRADE系統(tǒng)對納入SR的105個結(jié)局指標進行證據(jù)質(zhì)量評級。結(jié)果顯示,無高級的證據(jù)質(zhì)量;49個為低級,占46.7%;40個為極低級,占38.1%;中級證據(jù)質(zhì)量為16個,占15.2%。見表3。
圖2 方法學質(zhì)量評價結(jié)果符合情況
表2 納入研究的方法學質(zhì)量評價結(jié)果
表3 納入研究不同結(jié)局指標的證據(jù)質(zhì)量評估
續(xù)表3 納入研究不同結(jié)局指標的證據(jù)質(zhì)量評估
續(xù)表3 納入研究不同結(jié)局指標的證據(jù)質(zhì)量評估
續(xù)表3 納入研究不同結(jié)局指標的證據(jù)質(zhì)量評估
作者對納入SR的結(jié)論進行了總結(jié):不同劑量IVIG在改善CAL發(fā)生方面,2 g/kg單次給藥的效果最為肯定,1 g/(kg·d)連用1~2 d與2 g/kg單次給藥的效果相似,但其與400 mg/(kg·d)連用4~5 d的療效存在爭議,400 mg/(kg·d)連用4~5 d則不被推薦;在退熱方面,2 g/kg單次給藥與1 g/(kg·d)連用1~2 d的療效無差異,均優(yōu)于400 mg/(kg·d)連用4~5 d。針對GCs治療KD的研究顯示,對于初治KD患兒,不主張單獨應用GCs,而在IVIG聯(lián)合阿司匹林標準治療中加用GCs可降低治療失敗率和縮短發(fā)熱時間,但對CAL的發(fā)生沒有統(tǒng)一的結(jié)論;對于IVIG無反應型KD患兒,GCs治療亦未明確對降低CAL風險的益處。TNF-α抑制劑不能改善CAL的發(fā)生,但可降低治療失敗率和不良事件的影響。但作者對KD治療相關(guān)的SR進行再評價發(fā)現(xiàn)其方法學質(zhì)量和結(jié)論的證據(jù)質(zhì)量整體較低。
本研究應用AMSTAR2工具對納入SR進行了方法學質(zhì)量評價。令人遺憾的是,納入的SR均存在不同程度的方法學偏倚,主要體現(xiàn)在以下幾方面:(1)SR作為一種觀察性研究,為降低偏倚風險,研究者應該預先制定好方案,并以PROSPERO或Cochrane協(xié)作網(wǎng)注冊、期刊發(fā)表等形式展現(xiàn),同時在研究過程中嚴格遵循,但除Cocharne SR外的所有SR均未提供前期方案;(2)絕大部分SR均未對其原始研究類型的選擇進行相應解釋,在一定程度上影響了SR作為最高證據(jù)來源的嚴謹性;(3)研究證明將灰色文獻排除在SR之外可能會引起發(fā)表偏倚并破壞結(jié)果的可靠性,對干預措施的效果將高估12%[27],而66.7%的納入SR并未對相關(guān)的灰色文獻進行檢索;(4)因期刊論文有字數(shù)格式的限制,大部分SR僅描述了排除理由,而未列出排除文獻的清單,使讀者無法驗證SR的實施過程是否存在文獻納入偏倚;(5)原始研究的偏倚可影響SR結(jié)果的穩(wěn)定性,在研究存在不同程度的偏倚風險時,應該僅納入低偏倚風險的研究或?qū)Y(jié)果進行敏感性分析,深入、清晰地討論偏倚風險對結(jié)果的影響,但半數(shù)以上的SR并未做到;(6)盡管大部分SR應用散點圖對發(fā)表偏倚進行了判斷,受納入研究數(shù)量偏少的影響,仍有部分SR未進行發(fā)表偏倚評估,可能對其研究結(jié)果的真實性造成影響,對讀者產(chǎn)生誤導;(7)所有SR均未交待納入原始研究的經(jīng)費來源,且多數(shù)SR尤其是以中文發(fā)表的SR未進行聲明有無利益沖突,這些都可能會對研究結(jié)果產(chǎn)生一定影響。綜上所述,KD治療相關(guān)的SR在方法學質(zhì)量方面仍待改善,建議研究者在進行SR研究時應注意遵守AMSTAR2量表相關(guān)條目的要求,嚴格把控文章的方法學質(zhì)量。
GRADE作為一項關(guān)于循證醫(yī)學證據(jù)質(zhì)量評價的系統(tǒng)被全球50多個組織、機構(gòu)認可[28],SR中的證據(jù)質(zhì)量分級反映的是研究者認為的效應估計值正確的把握尺度,GRADE證據(jù)等級的高低對指導臨床實踐具有重要的參考價值。而本研究納入的SR中僅有2篇[24,26]運用GRADE系統(tǒng)對其結(jié)論進行證據(jù)質(zhì)量分級。本研究對納入SR進行GRADE證據(jù)質(zhì)量分級,發(fā)現(xiàn)低級與極低級證據(jù)質(zhì)量占比最高,無高質(zhì)量證據(jù),表明各結(jié)局指標的可信程度不高。導致質(zhì)量降級的原因包括局限性、不一致性、不精確性及發(fā)表偏倚。其中所有結(jié)局指標均在局限性方面進行了降級,大多數(shù)原始研究尤其是國內(nèi)進行的,存在隨機方法不明確、未描述是否采用盲法、分配隱藏等問題。而KD患兒CAL的診斷主要依靠超聲心動圖測量冠狀動脈內(nèi)徑和體表面積校正的標準值(Z值)[29],超聲測量者對結(jié)果具有主觀影響,有研究表明對主觀結(jié)果進行估計時,不適當?shù)碾[藏方案和未采用盲法分析對干預效果估計值的夸大效果明顯[30]。為了給臨床醫(yī)生提供最佳的證據(jù)來源,在未來的臨床研究中,原始研究應在設計和實施過程中做到真正隨機化和隱藏分組,施盲評價療效,并加強多中心間的溝通合作提高樣本量,在報道結(jié)果時應遵照國際通用的報告規(guī)范。SR的研究者則應注重制定前期方案,盡量排除質(zhì)量等級低的原始研究,研究方法實施全面,并且對結(jié)局指標進行證據(jù)質(zhì)量分級。
本研究的局限性:(1)僅納入了中英文發(fā)表的文獻,且未對灰色文獻進行檢索,可能存在發(fā)表偏倚;(2)方法學質(zhì)量和證據(jù)質(zhì)量評價是一個主觀過程,不同研究者對每個因素都有自己的獨立判斷,可能造成評價結(jié)果的偏倚;(3)僅評估了部分對干預措施的評價指標。
綜上所述,目前針對KD治療的SR方法學質(zhì)量整體較低,并且其證據(jù)質(zhì)量不高。因此,臨床實踐中應用這些證據(jù)進行決策時應當慎重,尚需結(jié)合患兒實際情況討論后應用,期待高質(zhì)量的原始研究和SR發(fā)表,為臨床實踐提供最佳的證據(jù)。