北京大學深圳醫(yī)院影像科(廣東 深圳 518036)
馬武毅 黃 嶸 鄧靈波張 凱 張重明 言偉強成官迅
肝纖維化磁共振擴散加權成像Meta分析*
北京大學深圳醫(yī)院影像科(廣東 深圳 518036)
馬武毅 黃 嶸 鄧靈波張 凱 張重明 言偉強成官迅
目的通過Meta分析研究方法對彌散加權成像磁共振檢查方法評價肝纖維化分級診斷的準確性做出分析。方法通過檢索國內外公開發(fā)表的DWI評價肝纖維化分級診斷準確性的文章,并且采用Metavir、Scheuer、Batts-Ludwig計分系統(tǒng)標準進行分級。兩名研究人員按照納入與排除標準獨立選擇文獻并根據(jù)QUADAS評價條目標準進行質量評價。使用Meta-Disc軟件進行Meta分析,并繪制SROC曲線。結果 檢索到247篇相關文獻,最終納入了10項1.5 T場強研究和3項3.0 T場強研究,受試者總數(shù)為809例。Meta分析結果示各組間存在統(tǒng)計學異質性,采用隨機效應模型合并分析。DWI磁共振檢查方法對輕度肝纖維化(G1)組、明顯肝纖維化(G2)組、嚴重肝纖維化(G3)組、早期肝硬化(G4)組的合并靈敏度和特異度分別為:0.74和0.74、0.83和0.76、0.78和0.79、0.83和0.79;SROC曲線下面積分別為:0.8363、0.8820、0.8663和0.8719。結論 DWI對肝纖維化分級具有較高的診斷效能。
肝纖維化;Meta分析;磁共振;功能成像;彌散加權
肝臟纖維化是膠原蛋白,蛋白多糖和其他大分子在細胞外基質內的過量沉積,是慢性肝病向肝硬化發(fā)展的必經(jīng)階段。關于DWI評價肝纖維化分期的臨床研究結論仍存在爭議。本研究通過Meta分析對DWI評價肝纖維化分期的現(xiàn)有研究進行合并分析,以組織病理學作為一個金標準,從循證醫(yī)學的角度系統(tǒng)評估其準確性。
1.1 文獻檢索兩名研究人員獨立使用計算機檢索PubMed、Medline、萬方數(shù)據(jù)庫、中國知網(wǎng)(CNKI)、Cochrane圖書館數(shù)據(jù)庫、中國生物醫(yī)學文獻數(shù)據(jù)庫、中國期刊全文數(shù)據(jù)庫、中國數(shù)字化期刊數(shù)據(jù)庫。檢索時間范圍從2006年1月至2016年1月。英文檢索詞包括:MR imaging,functional magnetic resonance imaging,DWI,diffusion-weighted imaging,liver cirrhosis,liver fibrosis,non-invasive detection。中文檢索詞包括:肝纖維化、肝硬化、無創(chuàng)檢查、磁共振、磁共振功能成像、彌散加權成像等。
1.2 納入與排除標準兩個評價員獨立以以下納入與排除標準篩選文獻,決定符合標準的納入文獻。兩個人通過面對面討論解決不一致的文獻。納入標準:(1)研究方法:用DWI評估人類肝纖維化分級的診斷性試驗。(2)研究對象:肝纖維化、肝硬化患者。(3)研究的診斷金標準:病理結果,并且采用現(xiàn)在廣泛使用的Metavir、Scheuer、Batts-Ludwig計分系統(tǒng)標準。(4)能夠提供原始數(shù)據(jù),直接或間接計出算真陽性值(TP)、假陽性值(FP)、真陰性值(TN)、假陰性值(FN)。排除標準:(1)文獻類型為:病例報道、綜述、系統(tǒng)分析、講座及文摘類文章。(2)重復發(fā)表的文獻。(3)研究數(shù)據(jù)不完整。
1.3 數(shù)據(jù)提取文獻數(shù)據(jù)提取主要包括:(1)研究背景和設計信息:包括第一作者、發(fā)表時間、樣本量、試驗類型、MR品牌及場強;(2)參考試驗:活檢或者手術;(3)肝纖維化的病理評分標準;(4)受試者的病因;(5)最佳b值的臨界值。
計算準確性的數(shù)據(jù)主要有:真陽性值(TP)、假陽性值(FP)、真陰性值(TN)、假陰性值(FN)。納入研究肝纖維化的病理評分系統(tǒng)不同,根據(jù)各標準具體要求(如表1所示)將評分標準更精確的劃分為以下五個級別,即S0級-無纖維化、S1級-輕度肝纖維化、S2級-中度肝纖維化、S3級-重度肝纖維化、S4級-早期肝硬化。四格表參照下面的分類提取,S0級VS 1-4級(即≥S1級)記為G1、S0-1級 VS 2-4級(即≥S2級)記為G2、S0-2級VS 3-4級(即≥S3級)記為G3、S0-3級VS 4級(即≥S4級)記為G4。
1.4 文獻質量評價使用QUADAS[4](見表2)對入選文獻的各條目按“YES”、“NO”、“UNCLEAR”進行評價。文獻如各項條目評價均為“YES”,則為A級文獻,即出現(xiàn)偏倚的可能性極低;若其中任何一條或多條評價結果為“UNCLEAR”或“NO”,則分別為B級、C級文獻,即出現(xiàn)偏倚的可能性較高。兩個評價員獨立評價,出現(xiàn)爭議時協(xié)商解決。
1.5 診斷效能評價與統(tǒng)計分析通過四格表萃取靈敏度、特異度、診斷比值比(diagnostic odds ratio, DOR)來估算每個研究方法對各期肝纖維化評定。使用Meta-Disc軟件(Version 1.4)合并靈敏度、特異度、診斷比值比、陰性似然比、陽性似然比、SROC曲線并計算曲線下面積。采用χ檢驗對四個分級組所納入研究進行異質性分析,如P<0.05,表示差異有統(tǒng)計學意義。當I2≥50%時各研究間存在異質性,采用隨機效應模型對準確度指標進行匯總分析;當I2<50%時各研究間不存在異質性,則采用固定效應模型對準確度指標進行匯總分析。所得數(shù)據(jù)的都均以95%可信區(qū)間(confidence interval,CI)表示。合并診斷比值比越大,表明診斷試驗判別有無疾病的能力越強。
若存在明顯異質性,則根據(jù)文獻質量等級、樣本量、試驗類型、MR場強、b值進行Meta分析,探討異質性來源。若因不同研究的方法學質量差距過大造成,則進行敏感性分析。通過計算靈敏度對數(shù)與(1-特異度)對數(shù)的Spearman相關系數(shù),若四個分級組的P值<0.05,表明存在閾值效應,靈敏度和特異度呈陰性關聯(lián),反之不存在閾值效應。
2.1 文獻篩選按照上述檢索策略,共檢索出文獻259篇。將文獻的引文格式導人Noteexpress2.0軟件去重,經(jīng)過2位研究者獨立閱讀摘要、全文后逐篇排除,最終有9篇英文和4篇中文文獻共13篇文獻[5-16]納入研究,受試者總數(shù)目為809例(年齡范圍為18~74歲,病因有乙型肝炎、丙型肝炎、酒精性肝炎、非酒精性肝炎等),13篇文獻基本特征詳見表3、4、5。其中有兩個作者均有兩篇文獻納入研究,經(jīng)過兩名研究員討論之后認為是不重復的,因為他們的所用的機器及參數(shù)不同,所采納的b值也不同。文獻篩選流程圖見圖1。
所納入的13項研究均可以萃取出真陽性值(TP)、假陽性值(FP)、真陰性值(TN)、假陰性值(FN),金標準均為病理診斷分級。其中有5篇報道了G1分級組的診斷價值,13篇報道了G2分級組的診斷價值,13篇報道了G3分級組的診斷價值,7篇報道了G4分級組的診斷價值。
2.2 質量評價13篇文獻中,8篇為回顧性研究,5篇為前瞻性研究,在META回歸分析異質性來源時,回顧性記為0,前瞻性記為1。質量評價結果在META回歸分析異質性來源時A級記為3,B級記為2,C級記為1,詳見表6。
評價文獻變異來源的項目1、2中,項目1(疾病譜組成)中評價“YES”的文獻占90%。項目2(選擇標準)中評價“YES”的文獻為100%。
評價偏倚的項目4、5、6、7、10、11、12、14中,項目5、6、7、10、11中評價為“YES”的文獻均為100%,而項目4(疾病發(fā)展偏倚)、14(退出病例)中評價為“YES”的文獻分別為60%、70%,評價為“UNCLEAR”的分別為40%、30%。
評價試驗實施質量的項目8、9、13中,項目8(待評價的試驗實施)中評價為“YES”的文獻為100%。項目9(金標準的實施)評價為“YES”的文獻為40%,評價為“UNCLEAR”的為60%。項目13(無法解釋的試驗結果)評價為“YES”的文獻為50%,評價為“UNCLEAR”的為50%。
2.3 Meta分析結果
2.3.1 輕度肝纖維化(G1)組:五項研究之間診斷優(yōu)勢比(P=0.0000,I2=85.7%)、靈敏度(P=0.0020,I2=76.3%)、特異度(P=0.0007,I2=79.3%),5項研究間存在異質性。采用隨機效應模型加權定量合并各診斷指標,結果顯示:合并靈敏度為0.74(95%CI:0.67~0.79),合并特異度為0.74(95%CI:0.64~0.82),合并陽性似然比為3.39(95%CI: 1.17~9.83),合并陰性似然比為0.36(95%CI: 0.16~0.81),合并診斷比值比為11.01(95%CI: 2.11~57.84),SROC曲線下面積為0.8363,Q指數(shù)為0.7684,見圖2。
2.3.2 中度肝纖維化(G2)組:十三項研究之間靈敏度(P=0.4591,I2=0.0%)、診斷優(yōu)勢比(P=0.0973,I2=35.7%)不存在異質性,特異度(P=0.0001,I2=70.4%)存在異質性,13項研究之間存在低度異質性。采用隨機效應模型加權定量合并各診斷指標,結果顯示:合并靈敏度為0.83(95%CI: 0.79~0.86),合并特異度為0.76(95%CI: 0.71~0.80),合并陽性似然比為3.33(95%CI: 2.44~4.55),合并陰性似然比為0.23(95%CI: 0.18~0.28),合并診斷比值比為15.72(95%CI: 11.08~22.32),SROC曲線下面積為0.8820,Q指數(shù)為0.8125,見圖3。
2.3.3 重度肝纖維化(G3)組:十三項研究之間診斷優(yōu)勢比(P=0.0278,I2=47.8%)不存在異質性,靈敏度(P=0.0014, I2=66.7%)、特異度(P=0.0037, I2=63.1%)存在異質性,13項研究之間存在異質性。采用隨機效應模型加權定量合并各診斷指標,結果顯示:合并靈敏度為0.78(95%CI: 0.72~0.83),合并特異度為0.79(95%CI: 0.76~0.83),合并陽性似然比為3.63(95%CI: 3.03~4.34),合并陰性似然比為0.27(95%CI:0.18~0.40),合并診斷比值比為15.38(95%CI:8.76~27.00),SROC曲線下面積為0.8663,Q指數(shù)為0.7968,見圖4。
2.3.4 早期肝硬化(G4)組:七項研究之間診斷優(yōu)勢比(P=0.8111,I2=0.0%)、靈敏度(P=0.2729,I2=20.5%)不存在異質性,特異度(p=0.0180, I2=70.2%)存在異質性,7項研究之間存在低度異質性。采用隨機效應模型加權定量合并各診斷指標,結果顯示:合并靈敏度為0.83(95%CI: 0.74~0.89),合并特異度為0.79(95%CI: 0.74~0.83),合并陽性似然比為3.50(95%CI: 2.79~4.38),合并陰性似然比為0.23(95%CI:0.15~0.36),合并診斷比值比為16.49(95%CI: 9.25~29.38),SROC曲線下面積為0.8719,Q指數(shù)為0.8024,見圖5。
2.4 Meta回歸分析與亞組分析計算靈敏度對數(shù)與(1-特異度)對數(shù)的Spearman相關系數(shù),四種分級的p值均大于0.05,表明不存在閾值效應。因為所納入的13篇文獻的b值不一,在亞組分析時我們將其進行區(qū)間分組,分為以下三組:b值≤500 s/mm2、b值為600-800 s/mm2、b=1000 s/mm2。
2.4.1 輕度肝纖維化(G1)組:回歸分析顯示研究間異質性來源可能與場強(RDOR=1.03, P=0.56)、研究質量有關(RDOR=1.35,P=0.45)。將納入評價為C級、場強為3.0T的研究排除,匯總分析結果未見明顯差異。
2.4.2 中度肝纖維化(G2)組:回歸分析顯示研究間異質性來源可能與樣本量(RDOR=1.35, P=0.59)、b值有關(RDOR=1.49, P=0.24)。將納入樣本量按<30、40、50逐一排除分析顯示,合并分析結果未見明顯改變。將b值≤500s/mm2、b值為600~800s/ mm2、b=1000s/mm2的文獻分組分析SROC曲線分別為0.8089、0.9011、0.8935;合并靈敏度分別為0.78(95%CI: 0.68~0.85)、0.84(95%CI: 0.80~0.88)、0.83(95%CI: 0.73~0.89);合并特異度分別為0.69(95%CI: 0.58~0.79)、0.82(95%CI: 0.75~0.87)、0.71(95%CI: 0.62~0.79)。
表1 三種病理評分標準
表2 QUADAS條目
2.4.3 重度肝纖維化(G3)組:回歸分析顯示研究間異質性來源可能與樣本量(RDOR=1.21, P=0.92)、b值有關(RDOR=2.12, P=0.07)。將納入樣本量按<30、40、50逐一排除分析顯示,合并分析結果未見明顯改變。將b值≤500s/mm2、b值為600-800s/ mm2、b=1000s/mm2的文獻分組分析SROC曲線分別為0.8023、0.9033、0.8784;合并靈敏度分別為0.67(95%CI: 0.56~0.77)、0.87(95%CI: 0.77~0.94)、0.80(95%CI: 0.76~0.86);合并特異度分別為0.73(95%CI: 0.63~0.82)、0.83(95%CI: 0.78~0.87)、0.81(95%CI: 0.77~0.84)。
2.4.4 早期肝硬化(G4)組:回歸分析顯示研究間異質性來源可能與研究質量(RDOR=1.16, P=0.69)、b值有關(RDOR=1.04, P=0.96)。將納入評價為C級的文獻剔除,匯總分析結果未見明顯變化。b值≤500s/mm2的文獻量不足,無法分析。b值為600~800s/mm2、b=1000s/mm2的文獻分組分析SROC曲線分別為0.9051、0.8491、合并靈敏度分別為0.84(95%CI:0.68~0.94)、0.76(95%CI:0.60~0.87);合并特異度分別為0.83(95%CI: 0.76~0.89)、0.77(95%CI: 0.70~0.83)。
表3 納入研究的基本特征
表4 納入研究基本特征(續(xù))
表5 場強3.0 T研究基本特征
表6 納入文獻質量
Meta分析是應用統(tǒng)計學方法對研究目的相同多個研究資料進行分析和概括,以提供量化的平均效果來回答研究的問題。其優(yōu)點是通過增大樣本含量來增加結論的可信度,解決研究結果的不一致性,通過繪制SROC曲線和曲線下面積(AUC)判斷診斷效能[17]。
本項研究就DWI評估肝纖維化分級的文獻進行合并分析,結果表明DWI對輕度肝纖維化(G1)組、明顯肝纖維化(G2)組、嚴重肝纖維化(G3)組、早期肝硬化(G4)組的合并靈敏度和特異度較高。
部分學者的研究表明[18]DWI對≥F2、≥F3、≥F4期肝纖維化具有較高診斷效能,曲線下面積(AUC)均大于0.90。本研究中4個分級組的SROC曲線下面積分別為:0.8363、0.8820、0.8663和0.8719。說明DWI對肝纖維化分期較高的診斷效能,與他們提出的結論相一致。很多學者的研究結果并不支持上述結論,Boulanger等[19]認為ADC值的降低與纖維化分期無相關性,Koinuma等[20]也認為ADC值不是肝纖維化有意義的量化指標。研究結論的分歧可能與b值和樣本量有關。b值選取較小(最大b值為250s/mm2),結果受微循環(huán)灌注影響較大。本文探討異質性來源的時候發(fā)現(xiàn),G2、G3、G4組的異質性來源與b值有關,且進行分組比較的結果顯示當b值的范圍在600-800s/mm2時,SROC曲線下面積均>0.90,DWI能夠較好的評價肝纖維化分期,國內外多位學者[21-23]認為選取較大的b值可以減少灌注的影響。Boulanger等[19]的研究樣本量只有18例,結果會產(chǎn)生偏移。
本研究中納入文獻的異質性還與所納入研究的質量、所用機器場強、樣本量有關,在亞組分析是,將逐個因素剔除,發(fā)現(xiàn)結果變化不大,說明納入文獻數(shù)據(jù)穩(wěn)定性較好,但還是建議研究者嚴格根據(jù)STARD[24]的標準展開診斷性試驗,臨床提供高質量的研究結果。
由于Meta分析是對文獻的二次研究,本研究結果受納入文獻的影響,沒有ROC分析的文獻未被納入研究。對于b值,本文在異質性來源分析進行了區(qū)間分析,并沒有對其進行確切值的分析,故沒有判定最佳b值。
[1]Scheuer PJ,Standish RA, Dhillon AP. Scoring of chronic hepatitis[J].Clin Liver Dis, 2002,6(2):335-347.
[2] Batts KP,Ludwig J.Chronic hepatitis.An update on terminology and reporting[J]. American Journal of Surgical Pathology,1995,19(12):1409-1417.
[3]Bedossa P,Poynard T.An algorithm for the grading of activity in chronic hepatitis C.The Metavir Cooperative Study Group[J]. Hepatology,1996,24(2):289-293.
[4] Whiting P,Rutjes AWS,Reitsma JB,et al.The development of QUADAS:a tool for the quality assessment of studies of diagnostic accuracy included in systematic reviews[J].BMC Med Res Methodol,2003,3(3):25.
[5]Taouli B,Tolia AJ,Losada M,et al. Diffusion-weighted MRI for quantification of liver fibrosis:preliminary experience[J].American Journal of Roentgenology,2007,189(4): 799-806.
[6] Sandrasegaran K,Akisik FM,Lin C,et al.Value of diffusion-weighted MRI for assessing liver fibrosis and cirrhosis. American Journal of Roentgenology,2009,193(6): 1556-1560.
[7] Do RKG,Chandanara H,Felker E, Hajdu CH,Babb JS.Diagnosis of Liver Fibrosis and Cirrhosis With Diffusion-Weighted Imaging:Value of Normalized Apparent Diffusion CoefficientUsing the Spleen as Reference Organ[J].American Journal of Roentgenology,2010,195(3): 671-676.
[8] Taouli B,Chouli M,Martin AJ, et al.Chronic hepatitis: Role of diffusion-weighted imaging and diffusion tensor imaging for the diagnosis of liver fibrosis and inflammation[J].Journal of Magnetic Resonance Imaging, 2008,28(1):89-95.
[9] Fujimoto K,Tonan T,Azuma S,et al.Evaluation of the Mean and Entropy of Apparent Diffusion Coefficient Values in Chronic Hepatitis C:Correlation with Pathologic Fibrosis Stage and Inflammatory Activity Grade[J]. Radiology,2011,258(3):739-748.
[10]Wang Y,Ganger DR,Levitsky J, et al.Assessment of Chronic Hepatitis and Fibrosis: Comparison of MR Elastography and Diffusion-Weighted Imaging[J].American Journal of Roentgenology,2011,196(3): 553.
[11]Shi Y GQY,Liao W MY,Qi WX. MR diffusion weighted imaging for quantification of liver fibrosis in patients with chronic viral hepatitis[J].Chin J Radiol,2010,44(1):65-69.
[12]周梅玲,徐鵬舉,沈繼章,紀元.磁共振彌散加權成像評價肝纖維化的臨床病理對照研究[J].中華醫(yī)學雜志,2009,89(25):1757-1761.
[13]Cece H, Ercan A, Yildiz,et al.The use of DWI to assess spleen and liver quantitative ADC changes in the detection of liver fibrosis stages in chronic viral hepatitis[J]. European Journal of Radiology, 2013,82(8):307-312.
[14]崔恩銘,龍晚生,蘭勇,等.多b值彌散加權成像評估肝纖維化程度[J].中國醫(yī)學影像技術,2013,29(10): 1674-1678.
[15]石喻,張?zhí)m.3.0T MR彌散加權成像及張量成像評價肝纖維化的臨床研究[J].中國醫(yī)科大學學報,2012, 41(4):343-345.
[16]李新瑜,張雪林,熊偉.3.0T MR彌散加權成像評價肝纖維化的臨床應用[J].實用放射學雜志,2010, 26(10):1465-1468.
[17]Hong Y,Shi Y,Liao W,et al. Relative ADC measurement for liver fibrosis diagnosis in chronic hepatitis B using spleen/renal cortex as the reference organs at 3T[J]. Clinical Radiology,2014,69(6): 581-588.
[18]楊克虎.系統(tǒng)評價指導手冊.北京:人民衛(wèi)生出版社,2010,179-213.
[19]Boulanger Y,Amara M,Lepanto L,et al.Diffusion-weighted MR imaging of the liver of hepatitis C patients[J].NMR Biomed,2003,16(3):132-136.
[20]Koinuma M,Ohashi I,Hanafusa K,et al.Apparent diffusion coefficient measurements with diffusion-weighted magnetic resonance imaging for evaluation of hepatic fibrosis [J].J Magn Reson Imaging,2005, 22(l):80-85.
[21]孫駿,施裕新,張志勇,等.肝纖維化磁共振ADC值與病理學分期的相關性研究[J].實用放射學雜志,2010, 26(11):1609-1612.
[22]Hsu FO,Chiou YY,Chen CY,et a1.Diffusion-weighted magnetic resonance imaging of the liver in hepatitis B patients with Child-Pugh a cirrhosis[J]. Kaohsiung J Med Sci,2007, 23(9):442-446.
[23]王秋實,郭啟勇,梁長虹,等.MR彌散加權成像評價肝纖維化的初步實驗研究[J].解剖學研究,2007,29(3): 212-216.
[24]Bossuyt PM,Reitsma JB,Bruns DE,et al.The STARD statement for reporting studies of diagnostic accuracy: explanation and laboration[J]. Clin Chem,2003,49(1):7-18.
圖1 文獻納入流程圖。圖2 輕度肝纖維化(G1)組SROC曲線。圖3 中度肝纖維化(G2)組SROC曲線。圖4 重度肝纖維化(G3)組SROC曲線。圖5 早期肝硬化(G4)組SROC曲線。
(本文編輯: 劉龍平)
Meta-analysis of Hepatic Fibrotic Magnetic Resonance Diffusion Weighted Imaging*
MA Wuyi, HUANG Rong, DENG Linbo, et al., Department of Radiology, Peking University Shenzhen Hospital, Shenzhen 518036, Guangdong Province, China
ObjectiveA meta-analysis was performed to assess the diagnostic efficiency of DWI (diffusion-weighted imaging) for hepatic fibrosis stage assessment with MR imaging.MethodsOnline journal databases had been searched. Diagnostic tests of DWI for hepatic fibrosis stage assessment were included. Liver fibrosis was categorized by redistribution into five stages according to the histopathological description by Metavir, Scheuer and Batts-Ludwig score system. The quality of these studies were evaluated according to the QUADAS (Quality assessment of diagnostic accuracy studies) items. The Meta-analysis and the SROC (Summary receiver operating characteristic) curve were performed by Meta-Disc. Results Thirteen studies were identified which met the criteria could perform a meta-analysis. There were 809 cases involved in this study. Meta-analysis showed high heterogeneities among these studies. The pooled sensitivity of G1, G2, G3, G4 hepatic fibrosis stages were 0.74, 0.83, 0.78 and 0.83 respectively. The pooled specificity were 0.74, 0.76, 0.79and 0.79 respectively. The AUCs of SROC were 0.8363, 0.8820, 0.8663 and 0.8719 respectively.ConclusionDWI has a high diagnostic efficiency for staging hepatic fibrosis.
Liver Cirrhosis; Meta-analysis; MR Imaging; Functional Magnetic Resonance Imaging; DWI; Diffusion-weighted Imaging
R322.4+7
A
深圳市戰(zhàn)略新興產(chǎn)業(yè)發(fā)展專項資金資助(JCYJ201208311 43255567和JCYJ2015040309 1443279)
10.3969/j.issn.1672-5131.2017.09.025
2017-08-17
黃 嶸