高楊,席曉旭,李夢(mèng)露,邢寧,程流泉*
作者單位:
1. 解放軍總醫(yī)院第一醫(yī)學(xué)中心,北京 100853
2. 南華大學(xué)附屬長(zhǎng)沙中心醫(yī)院,長(zhǎng)沙410005
數(shù)字乳腺X線攝影(digital X-ray mammography,DMG)是乳腺疾病的首選篩查措施,在歐美國(guó)家的循證醫(yī)學(xué)數(shù)據(jù)表明[1-4],DMG篩查可以顯著降低乳腺癌的致死率。篩查的統(tǒng)計(jì)學(xué)指標(biāo)主要是經(jīng)病理證實(shí)后的真陽(yáng)性率(敏感性)和假陽(yáng)性率,由于大量的DMG上“陰性”病例并未能得到病理證實(shí),由此計(jì)算的特異性和假陰性率都存在統(tǒng)計(jì)的偏差。使用MRI檢查可以為這些高估或低估的病變提供了可靠的證實(shí)途徑。有鑒于此,本研究將DMG進(jìn)行獨(dú)立前瞻性評(píng)估(the prospective BI-RADS categorization of DMG,pDMG)和結(jié)合MRI的回顧性評(píng)估(the retrospective BI-RADS categorization of DMG,rDMG),比較DMG判讀的一致性,比較DMG和MRI在乳腺病灶檢出能力。
回顧性檢索2015年1月至2018年3月解放軍總醫(yī)院PACS數(shù)據(jù)庫(kù)內(nèi)同時(shí)具有乳腺M(fèi)RI和DMG檢查的患者,兩者檢查時(shí)間相差不超過3個(gè)月且期間無手術(shù)或藥物等治療干擾,共計(jì)獲得連續(xù)316例患者,年齡19~85歲,平均(46.98±9.86)歲。
DMG采用西門子全視野數(shù)字化乳腺X線攝影機(jī),標(biāo)準(zhǔn)四投照位,全自動(dòng)數(shù)字曝光。MRI掃描采用通用電氣(GE) 3.0 T磁共振儀,8通道乳腺專用線圈。檢查序列包括:(1) FSE T2WI,STIR或IDEAL脂肪抑制,TR 4600~5000 ms,TE 68~85 ms,矩陣320×256。(2)平面回波擴(kuò)散加權(quán)成像(echo-planar imaging diffusionweighted imaging,EPI-DWI):STIR脂肪抑制,TR 5000~8000 ms,TE 60~85 ms,b=0、1000 s/mm2,矩陣:128×128。FSE T2WI和EPI-DWI均為橫軸位匹配定位,F(xiàn)OV 32 cm×32 cm,掃描層厚4 mm,層間距1 mm,層數(shù):36。(3) VIBRANT-T1WI序列,用動(dòng)態(tài)增強(qiáng)乳腺容積成像(volume imaging for breast assessment,VIBRANT)序列去除脂肪抑制選項(xiàng),掃描參數(shù)與下述的動(dòng)態(tài)增強(qiáng)一致。(4)動(dòng)態(tài)增強(qiáng)VIBRANT序列:TR 4.5~4.8 ms,TE 2.2~2.4 ms,F(xiàn)OV 32 cm×32 cm,矩陣320×320,層厚1 mm;連續(xù)采集6個(gè)時(shí)相,每個(gè)時(shí)相掃描時(shí)間為120 s,從第二個(gè)時(shí)相掃描開始以0.2 mmol/kg劑量用高壓注射器經(jīng)手背靜脈注入釓對(duì)比劑,注射速度為2 ml/s,之后以同樣的注射速度注入等量生理鹽水沖洗導(dǎo)管內(nèi)殘留對(duì)比劑。
DMG的評(píng)估分成前瞻性和回顧性兩個(gè)部分,前瞻性評(píng)估(prospective,簡(jiǎn)稱pDMG)由多名合格的放射科診斷醫(yī)師獨(dú)立完成醫(yī)療報(bào)告,不受MRI的影響;回顧性評(píng)估(retrospective,簡(jiǎn)稱rDMG)由2名研究者在參照pDMG分類和MRI圖像的條件下重新進(jìn)行評(píng)價(jià)并達(dá)成一致意見。MRI的評(píng)估由多名合格的放射科醫(yī)師獨(dú)立完成乳腺成像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)分類。DMG和MRI分類評(píng)估均按照美國(guó)放射學(xué)會(huì)(American College of Radiology,ACR)第五版的BI-RADS[5]要求進(jìn)行。數(shù)據(jù)清洗處理時(shí),在pDMG報(bào)告中如果報(bào)告“未見異常”而缺乏分類的補(bǔ)充為“Ⅰ類”,無病灶描述且未報(bào)告分類的作為“Ⅰ類”,有病灶描述而無分類的作為“0類”;rDMG評(píng)估時(shí)強(qiáng)制要求進(jìn)行Ⅰ~Ⅴ的分類評(píng)估而不得缺失。DMG的影像表現(xiàn)劃分為“鈣化、腫塊、不對(duì)稱密度”3個(gè)類別,結(jié)構(gòu)扭曲納入不對(duì)稱密度計(jì)算,由回顧性分析的2名醫(yī)師達(dá)成一致意見。MRI的影像表現(xiàn)劃分為乳腺實(shí)質(zhì)背景強(qiáng)化(background parenchymal enhancement,BPE)、點(diǎn)狀強(qiáng)化、腫塊和非腫塊強(qiáng)化。中等程度以及以下的對(duì)稱分布的BPE劃分為Ⅰ類,重度BPE劃分為Ⅱ類,不典型非對(duì)稱分布的重度BPE劃分為Ⅲ類或納入非腫塊強(qiáng)化;單發(fā)或者多發(fā)點(diǎn)狀強(qiáng)化、腫塊和非腫塊強(qiáng)化依據(jù)BI-RADS推薦標(biāo)準(zhǔn)進(jìn)行分類。同樣,F(xiàn)GT的分型也根據(jù)BI-RADS分為以下四種類型:致密型、多量腺體型、少量腺體型、疏松脂肪型。
由于MRI和DMG在空間位置上未能完全匹配,本研究以單側(cè)乳腺作為計(jì)數(shù)單位,單側(cè)乳腺的多發(fā)病灶計(jì)數(shù)為1個(gè)病灶以最高分類納入統(tǒng)計(jì)。用Microsoft Excel表格收集整理數(shù)據(jù),用IBM SPSS Statistics 19對(duì)BI-RADS分類的有序變量進(jìn)行Spearman相關(guān)性分析,計(jì)數(shù)率的計(jì)算和比較使用卡方檢驗(yàn)。
pDMG和rDMG分類一致性的比較見表1。pDMG共報(bào)告了33個(gè)0類和236個(gè)Ⅱ~Ⅴ類病灶,rDMG共報(bào)告334個(gè)Ⅱ~Ⅴ類病灶。pDMG和rDMG對(duì)病灶的BIRADS 分類(Ⅱ~Ⅳ)的一致性為69.66% (163/234),使用定序變量分析的Spearman相關(guān)系數(shù)r=0.813,P<0.05;摒除0類和共同劃分為Ⅰ類的數(shù)據(jù),良性(Ⅱ+Ⅲ)、惡性(Ⅳ+Ⅴ)分類的一致性為82.90% (257/310),Kappa=0.63,P<0.05。
表1 前瞻性與回顧性DMG評(píng)價(jià)的一致性比較Tab. 1 Comparison of the prospective and retrospective DMG reading
表2 pDMG與MRI評(píng)價(jià)的一致性比較(病灶個(gè)數(shù))Tab. 2 Comparison between the prospective DMG and MRI reading (lesion count)
表3 rDMG與MRI評(píng)價(jià)的一致性比較(病灶個(gè)數(shù))Tab. 3 Comparison between the retrospective DMG and MRI reading (lesion count)
表4 rDMG BI-RADS分類的主要影像特征依據(jù)(病灶個(gè)數(shù))Tab. 4 Summery of DMG features and their BI-RADS catrgory (lesion count)
在病灶檢出率方面,pDMG、rDMG與MRI之間的比較分別見表2、3。以MRI檢出的405個(gè)Ⅱ~Ⅴ類病灶為參照,pDMG有122個(gè)病灶未檢出,19例pDMG報(bào)告的病灶MRI未見異常(未報(bào)告或報(bào)告為Ⅰ類)。rDMG有68個(gè)病灶未檢出,rDMG報(bào)告的病灶中,有10例rDMG報(bào)告的病灶MRI未見對(duì)應(yīng)的報(bào)告。如果以MRI報(bào)告的病灶數(shù)量為參照,pDMG的檢出率66.42% (269/405),rDMG檢出率74.81% (303/405)。
在BI-RADS分類一致性方面,pDMG和MRI對(duì)病灶Ⅱ~Ⅴ分類評(píng)價(jià)的一致性為36.41% (79/217),使用定序變量的Spearman相關(guān)系數(shù)r=0.435,P<0.05;摒除0類、未報(bào)告的病灶、共同劃分為Ⅰ類的數(shù)據(jù),良性(Ⅱ+Ⅲ)、惡性(Ⅳ+Ⅴ)分類的一致性為66.30% (179/270),Kappa=0.316,P<0.05。rDMG和MRI對(duì)病灶Ⅰ~Ⅴ分類評(píng)價(jià)的一致性為44.22% (134/303),使用定序變量的Spearman相關(guān)系數(shù)r=0.546,t=11.316,P<0.05;摒除未報(bào)告的病灶、共同劃分為Ⅰ類的數(shù)據(jù),良性(Ⅱ+Ⅲ)、惡性(Ⅳ+Ⅴ)分類的一致性為80.39% (287/357),Kappa=0.56,P<0.05。使用定序變量的Spearman相關(guān)系數(shù)r=0.546,t=11.316,P<0.05。
表5 MRI BI-RADS分類的主要影像特征依據(jù)(病灶個(gè)數(shù))Tab. 5 MR imaging findings and their BI-RADS catrgory(lesion count)
表6 DMG和MRI影像特征的交叉表現(xiàn)表現(xiàn)(病灶個(gè)數(shù))Tab. 6 The relationship between DMG features and MR imaging findings (lesion count)
表4、5分別列舉rDMG和MRI不同BI-RADS分類病灶的影像表現(xiàn)。在DMG影像特征中,鈣化(單純鈣化、不對(duì)稱密度+鈣化、腫塊+鈣化)占57.49% (192/334);腫塊(伴有或不伴有鈣化)占37.43 (125/334),不對(duì)稱密度(伴有或不伴有鈣化) 22.75% (76、334)。以Ⅳ+Ⅴ類為惡性,Ⅰ+Ⅱ+Ⅲ為良性,鈣化的存在并未對(duì)腫塊或不對(duì)稱密度的定性判斷產(chǎn)生影響,使用Pearson卡方檢驗(yàn)結(jié)構(gòu)扭曲和腫塊的卡方值分別為χ2=0.487,P=0.485和χ2=1.599,P<0.206。在MR圖像上,67個(gè)BPE和66個(gè)點(diǎn)狀強(qiáng)化病灶被評(píng)價(jià)為Ⅱ或Ⅲ類,兩者占報(bào)告病灶的32.84% (133/405)。
表6列舉了rDMG和MRI影像特征的交叉表現(xiàn)。有93個(gè)MRI顯示的點(diǎn)狀強(qiáng)化、腫塊和非腫塊強(qiáng)化DMG未給出明確描述,有32個(gè)DMG描述的病灶MRI未給出明確描述,MRI上73個(gè)BPE在DMG上的表現(xiàn)包括有或者沒有鈣化的不對(duì)稱密度或腫塊。DMG的腫塊與MRI的腫塊相對(duì)于其他的非腫塊描述之間沒有一一對(duì)應(yīng)的關(guān)系(圖1~10),兩個(gè)定性變量之間的Kappa值為0.251,P<0.05。
纖維腺體類型按照病例數(shù)量計(jì)算。在DMG上,致密型105例(33.2%),多量腺體型147例(46.5%),少量腺體型41例(13%),疏松脂肪型23例(7.3%);其中致密型與多量型占79.7%。在MRI上:致密型145例(45.9%),多量腺體型118例(37.3%),少量腺體型27例(8.5%),疏松脂肪型26例(8.2%);其中致密型與多量型占83.2%。統(tǒng)計(jì)分析列聯(lián)相依系數(shù)(contingency coefficient) 0.817,P<0.05,DMG與MRI分類比較一致。
很多研究比較了乳腺X線攝影、MRI及超聲對(duì)乳腺疾病的診斷效能,雖然不同的研究者之間得出的結(jié)論不盡相同,但一致認(rèn)為DMG應(yīng)作為乳腺疾病的首選篩查手段[6-9]。但是,近年來大量的循證醫(yī)學(xué)數(shù)據(jù)也證明,DMG的假陽(yáng)性率帶來不必要的過度處理和引發(fā)焦慮。本研究利用MRI為參照,對(duì)DMG檢出病灶的能力進(jìn)行了前瞻性和回顧性的比較評(píng)估。在常見的乳腺疾病檢查程序中,只有DMG篩查有陽(yáng)性發(fā)現(xiàn)的會(huì)進(jìn)入后續(xù)的診斷程序,推薦MRI或者超聲檢查,并在后續(xù)的檢查或活檢得到確認(rèn)或排除;而對(duì)于DMG篩查陰性的患者缺乏進(jìn)一步的證實(shí),尤其對(duì)于被致密型和多量型腺體遮蔽的病灶,很容易成為漏診的對(duì)象。MRI的推廣使用為DMG提供了驗(yàn)證措施。
本研究在檢出病灶方面,pDMG和rDMG分別檢出269 (包含不能分類的0類)和334個(gè)病灶,以MRI檢出的405個(gè)病灶為參照,兩者的檢出率分別為66.42%和82.90%。rDMG的檢出率明顯高于Skaane等[10]認(rèn)為的54.1%和Warner等[11]認(rèn)為的25%~59%,可能是由于rDMG有MRI的協(xié)同,有助于發(fā)現(xiàn)病變,且強(qiáng)制取消了0類的判斷。需要說明的是,由于DMG和MRI的差別導(dǎo)致無法在病灶的具體數(shù)量和位置之間形成完全一一對(duì)應(yīng)的關(guān)系,本研究實(shí)際是以單側(cè)乳腺水平而不是以病灶的數(shù)量為計(jì)算單位,在MRI上單側(cè)乳腺多發(fā)病灶是很常見的,因此這個(gè)數(shù)據(jù)并不能準(zhǔn)確代表病灶數(shù)量上的檢出率。在BI-RADS分類一致性上,pDMG和rDMG的分類診斷69.66%是一致的,兩者之間的相關(guān)系數(shù)為0.813;在良惡性分類上,兩者的一致性為82.90%,Kappa=0.63,不同閱讀者之間的一致性比較接近。而Marino等[12]的研究認(rèn)為,DMG不同的評(píng)價(jià)者之間一致性中等,Kappa=0.554;差別在于本研究中rDMG并非完全獨(dú)立判斷,而是受到pDMG和MR圖像的雙重影響,使得本研究的一致性偏高。
大多數(shù)的診斷試驗(yàn)研究都是以病理結(jié)果作為參照標(biāo)準(zhǔn)來計(jì)算DMG和MRI獨(dú)立或聯(lián)合其他方法診斷乳腺病變的敏感性、特異性、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值[13-15]。Raikhlin等[15]認(rèn)為MRI的敏感性(92.0%)在統(tǒng)計(jì)學(xué)上高于DMG (30.8%),而特異性較低(MRI 85.9%,DMG 96.8%)。
一致性研究主要是DMG或MRI與病理結(jié)果的一致性,如Santamaria等[16]的研究指出DMG導(dǎo)管內(nèi)乳頭狀瘤范圍的判斷與病理結(jié)果的一致性較差(k=0.220),而MRI (k=0.452)或MRI聯(lián)合DMG (k=0.439)與病理的一致性較好;Shin等[17]研究了DMG、MRI及超聲對(duì)晚期或炎性乳癌新輔助化療后殘存腫瘤的大小和反應(yīng)方面的相對(duì)準(zhǔn)確性,認(rèn)為MRI與病理的一致較其他兩種檢查好。這些研究給予臨床一定的指導(dǎo)意義,然而會(huì)遺漏因未能獲得病理證實(shí)而未能納入統(tǒng)計(jì)的相關(guān)病例/病灶,導(dǎo)致特異性和假陰性率存在統(tǒng)計(jì)上的偏差,這也是本研究所關(guān)注的“未納入統(tǒng)計(jì)”的病灶。因此本研究著重于分析DMG與MRI之間的一致性。無論是BI-RADS的多階分類還是良惡性二階分類,DMG和MRI之間的相關(guān)性或一致性都不是很高,即使是rDMG與MRI進(jìn)行了交叉確認(rèn),對(duì)良惡性判斷的Kappa值僅為0.56。如果納入MRI檢出、DMG未能顯示的病灶,一致性的數(shù)據(jù)將會(huì)更低。pDMG和rDMG各有39個(gè)和25個(gè)病灶在MRI上被評(píng)價(jià)為Ⅳ或Ⅴ類,而DMG僅有1例Ⅳ類MRI未能報(bào)告。雖然MRI報(bào)告的Ⅳ和Ⅴ類并非經(jīng)過病理證實(shí),但是DMG對(duì)這些病灶的遺漏確實(shí)更值得關(guān)注。當(dāng)然,與DMG相比,MRI報(bào)告了更多的Ⅱ類和Ⅲ類病灶——比pDMG多報(bào)111個(gè),比rDMG多報(bào)70個(gè)。這些病灶有些是非特異性的BPE,也有些是比較明確的良性病灶如囊腫、比較明確的纖維腺瘤,由于對(duì)這些病灶缺乏病理的“金標(biāo)準(zhǔn)”核實(shí),尚不能簡(jiǎn)單地將這些病灶計(jì)算為MRI的“假陽(yáng)性”。
在DMG上,鈣化、腫塊和結(jié)構(gòu)扭曲是檢出病灶的主要依據(jù),單純鈣化和結(jié)構(gòu)扭曲的分類主要集中在Ⅱ和Ⅲ類,結(jié)構(gòu)扭曲合并鈣化、腫塊合并/不合并鈣化時(shí)分類數(shù)據(jù)集中在Ⅲ~Ⅳ類,評(píng)估為Ⅴ類的比率并不高。Kuhl等[18]認(rèn)為致密型腺體會(huì)降低DMG的敏感性及特異性,Roganovic等[19]也認(rèn)為小的腫塊會(huì)被致密腺體遮擋導(dǎo)致假陰性和敏感性降低。Wanders等[7]發(fā)現(xiàn)DMG對(duì)致密型腺體的敏感度為61%,而對(duì)脂肪型腺體的敏感度達(dá)85.7%。隨著腺體的致密程度的增加,會(huì)降低評(píng)價(jià)者對(duì)病灶形態(tài)判斷的準(zhǔn)確性,結(jié)合本研究評(píng)估過程,由于國(guó)人腺體大多數(shù)為致密型,除非典型的惡性或良性征象,DMG很難有充分的信心判斷Ⅴ類或Ⅱ類,多數(shù)被發(fā)現(xiàn)的病灶均被評(píng)估為Ⅲ或Ⅳ類。這個(gè)結(jié)論與Berg等[20]的一項(xiàng)研究結(jié)果基本符合,他們發(fā)現(xiàn)在DMG檢查為陰性的致密型腺體的乳腺中,使用其他的檢查方法提高了乳腺癌的檢出率。在MRI上,相當(dāng)一部分病變是BPE和點(diǎn)狀強(qiáng)化被劃分為Ⅱ類或Ⅲ類,這些是非特異性的良性改變;與DMG不同,MRI的分類判斷指標(biāo)并不依賴形態(tài)學(xué)指標(biāo),強(qiáng)化幅度、動(dòng)態(tài)增強(qiáng)曲線、ADC值和T2與T1特征才是定性診斷的依據(jù),這種形態(tài)學(xué)的一致性分析對(duì)MRI沒有實(shí)際意義。
從影像特征的回顧性分析看,DMG和MRI報(bào)告的病灶的影像表現(xiàn)并沒有形成任何一一對(duì)應(yīng)的關(guān)系。除外BPE和點(diǎn)狀強(qiáng)化征象,MRI報(bào)告的50例腫塊和17例非腫塊在DMG未檢出——非腫塊并不形成明確的邊界[21],沒有密度對(duì)比差異,因此DMG不能識(shí)別,Korhonen等[22]認(rèn)為FGT的類型、腫瘤性病變的不典型表現(xiàn),以及缺乏惡性腫瘤的繼發(fā)征象,都有可能導(dǎo)致病變?cè)贒MG上被遺漏;而MRI對(duì)病變的發(fā)現(xiàn)是基于其血供和形態(tài)等生理特征,且具備更高的軟組織對(duì)比度[23-24],因此較DMG更為敏感。26例DMG報(bào)告的影像征象在MRI無對(duì)應(yīng)的表現(xiàn),其中50%為單純鈣化——有研究表明[25]隨著場(chǎng)強(qiáng)的提高,MRI對(duì)早期出現(xiàn)微鈣化的病灶靈敏度大有提高,但其本身對(duì)于“鈣化”這種影像學(xué)特征依然沒有DMG敏感,而DMG相較于MRI而言,由于腺體的堆疊,更容易形成假陽(yáng)性的判斷[6,19]。Lee等[23]認(rèn)為鈣化及新生血管的發(fā)展可能代表惡性腫瘤進(jìn)展的不同方面,將DMG和MRI互補(bǔ)使用,能更好地提升高危人群的病變檢出率。當(dāng)病變表現(xiàn)為“腫塊”時(shí)DMG和MRI有共同的特征描述,但是MRI報(bào)告的185個(gè)腫塊中,DMG僅報(bào)告了79例,不足50%;而DMG報(bào)告的腫塊中,33例在MRI上并未能檢出對(duì)應(yīng)的腫塊征象,僅僅報(bào)告點(diǎn)狀強(qiáng)化、BPE或者未見異常描述。MRI影像表現(xiàn)為 “腫塊”和“非腫塊強(qiáng)化”的病灶,幾乎散在分布在DMG的各個(gè)征象中,無對(duì)應(yīng)關(guān)系。從影像表現(xiàn)的交叉分析看,DMG和MRI并沒有提供太多的互相支持的征象。
不可否認(rèn)的是,本研究存在一些設(shè)計(jì)上的不足。其一是抽樣可能存在偏倚,病人的年齡平均(46.98±9.86)歲,致密型和多量型腺體占80%或以上,很大程度上降低了DMG的檢出和判斷效率,因此在研究中特意統(tǒng)計(jì)FGT類型以供參考和校正。另一方面,研究是以單側(cè)乳腺為計(jì)量單位,并非以病灶數(shù)量計(jì)算,尤其是MRI的多發(fā)病灶很難在DMG上找到一一對(duì)應(yīng)的空間關(guān)系,即使獲得了病理證實(shí)也很難排除由此帶來的偏倚,雖然研究對(duì)象中有78例病人獲得了病理證實(shí),但是并沒有納入病理證實(shí)做為參照。
本研究通過以MRI圖像為參照,比較MRI和DMG的前瞻性和回顧性判讀,發(fā)現(xiàn)DMG判讀存在個(gè)體差異,無論是病灶的檢出數(shù)量還是分類診斷,MRI和DMG都缺乏很好的一致性,其影像表現(xiàn)也缺乏一一對(duì)應(yīng)的關(guān)系。
利益沖突:無。