劉思騰,于 湛*,李哲人,劉譯陽(yáng),翁思遠(yuǎn),王潔潔
(1.鄭州大學(xué)第一附屬醫(yī)院放射科,3.放射介入科,河南 鄭州 450052;2.上海聯(lián)影智能醫(yī)療科技有限公司,上海 200030)
乳腺癌是女性常見(jiàn)的具有多種分型及治療反應(yīng)的異質(zhì)性惡性腫瘤[1]。人表皮生長(zhǎng)因子受體2(human epidermal growth factor receptor-2, HER-2)陽(yáng)性乳腺癌侵襲性和轉(zhuǎn)移概率更高,預(yù)后不佳[2];未接受抗HER-2治療的HER-2陽(yáng)性乳腺癌復(fù)發(fā)風(fēng)險(xiǎn)較高[3]。目前以免疫組織化學(xué)(immunohistochemistry, IHC)方法檢測(cè)乳腺癌HER-2表達(dá)狀態(tài),將HER-2(+++)判定為HER-2陽(yáng)性、(-)或(+)判定為HER-2陰性[4];遇HER-2(++)時(shí)需進(jìn)一步行熒光原位雜交(fluorescence in situ hybridization, FISH)檢測(cè),將基因擴(kuò)增者判定為HER-2陽(yáng)性,否則為HER-2陰性,但需要專門(mén)的設(shè)備和技術(shù)[5]。計(jì)算機(jī)輔助診斷(computer aided diagnosis, CAD)可利用深度學(xué)習(xí)(deep learning, DL)對(duì)乳房X線片(mammogram, MG)進(jìn)行自主學(xué)習(xí)并提取相關(guān)特征,結(jié)果客觀、準(zhǔn)確[6-7];卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)為經(jīng)典DL網(wǎng)絡(luò),對(duì)于醫(yī)學(xué)圖像的分類性能良好。本研究觀察基于術(shù)前MG DL聯(lián)合臨床特征列線圖預(yù)測(cè)乳腺癌表達(dá)HER-2狀態(tài)的價(jià)值。
1.1 研究對(duì)象 回顧性納入2020年2月—2023年1月于鄭州大學(xué)第一附屬醫(yī)院就診的265例女性單發(fā)乳腺癌患者,其中93例HER-2陽(yáng)性(陽(yáng)性組)、172例HER-2陰性(陰性組);均于術(shù)前1個(gè)月內(nèi)攝MG,術(shù)后病理確診為浸潤(rùn)性乳腺癌,IHC結(jié)果均為HER-2(++),且FISH檢測(cè)資料完整;按8∶2比例將其分為訓(xùn)練集(n=211,含74例HER-2陽(yáng)性和137例HER-2陰性)和驗(yàn)證集(n=54,含19例HER-2陽(yáng)性和35例HER-2陰性)。排除檢查前接受放射、化學(xué)治療或手術(shù)等治療及圖像質(zhì)量不佳者。檢查前患者均簽署知情同意書(shū)。
1.2 儀器與方法 采用Hologic Selenia或GE Senographe Essentia數(shù)字化乳腺攝影機(jī)、自動(dòng)曝光模式攝雙側(cè)乳房頭足位(cranio-caudul position, CC)和內(nèi)外斜位(mediolateral oblique position, MLO)片。
1.3 分析圖像 由2名具有5年以上乳腺影像學(xué)診斷經(jīng)驗(yàn)的主治醫(yī)師以盲法共同閱片,根據(jù)乳腺影像報(bào)告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system, BI-RADS)對(duì)MG所示乳腺腺體進(jìn)行分類,將BI-RADS 1或2類歸為非致密型、BI-RADS 3或4類歸為致密型乳腺。
1.4 構(gòu)建DL模型 將CC和MLO MG輸入孿生DL網(wǎng)絡(luò),先對(duì)MG數(shù)據(jù)與ROI掩模數(shù)據(jù)行矩陣乘法,刪除全0層面后獲得腫瘤圖像。選取腫瘤ROI并調(diào)整為224×224×3像素,輸入ResNet50網(wǎng)絡(luò)。利用遷移學(xué)習(xí)將ImagNet數(shù)據(jù)集參數(shù)作為網(wǎng)絡(luò)權(quán)重,并凍結(jié)梯度更新。通過(guò)末層卷積層提取7×7×512維張量,利用自適應(yīng)平均池化分別基于CC和MLO圖像得到2 048個(gè)DL特征;經(jīng)過(guò)全連接層進(jìn)行特征融合,共獲得2 048個(gè)特征,再經(jīng)Softmax分類器輸出二分類結(jié)果,得到DL評(píng)分(Deep-score),并基于此構(gòu)建DL模型。見(jiàn)圖1。
圖1 DL工作流程圖
1.5 統(tǒng)計(jì)學(xué)分析 采用SPSS 26.0統(tǒng)計(jì)分析軟件及R 4.1.0軟件。以±s描述符合正態(tài)分布的計(jì)量資料,以中位數(shù)(上下四分位數(shù))描述不符合者,分別行獨(dú)立樣本t檢驗(yàn)或Mann-WhitneyU檢驗(yàn)。以χ2檢驗(yàn)或Fisher精確概率法比較計(jì)數(shù)資料。以多因素logistic回歸分析基于訓(xùn)練集內(nèi)亞組間差異有統(tǒng)計(jì)學(xué)意義的臨床指標(biāo)構(gòu)建臨床模型,之后以DL模型聯(lián)合臨床指標(biāo)構(gòu)建聯(lián)合模型并繪制其列線圖。繪制受試者工作特征(receiver operating characteristic, ROC)曲線,計(jì)算曲線下面積(area under the curve, AUC),評(píng)估各模型預(yù)測(cè)乳腺癌表達(dá) HER-2狀態(tài)的效能,并以DeLong檢驗(yàn)進(jìn)行比較。采用校準(zhǔn)曲線和Hosmer-Lemeshow 檢驗(yàn)評(píng)估聯(lián)合模型的校準(zhǔn)度;以決策曲線分析(decision curve analysis, DCA)評(píng)估各模型的臨床獲益。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 構(gòu)建臨床模型 訓(xùn)練集HER-2陽(yáng)性與陰性患者雌激素受體(estrogen receptor, ER)狀態(tài)、孕激素受體(progesterone receptor, PR)狀態(tài)及Ki-67表達(dá)水平差異均有統(tǒng)計(jì)學(xué)意義(P均<0.05),驗(yàn)證集HER-2陽(yáng)性與陰性癌患者年齡、是否絕經(jīng)及Ki-67表達(dá)水平差異均有統(tǒng)計(jì)學(xué)意義(P均<0.05);組間其余參數(shù)差異均無(wú)統(tǒng)計(jì)學(xué)意義(P均<0.05)。見(jiàn)圖2、3及表1。多因素logistic回歸分析顯示,訓(xùn)練集患者ER 狀態(tài)[OR=3.63,95%CI(1.66,7.93)]及Ki-67表達(dá)水平[OR=2.84,95%CI(1.75,4.63)]均為HER-2陽(yáng)性的獨(dú)立預(yù)測(cè)因子(P均<0.05),故以之構(gòu)建臨床模型。
表1 訓(xùn)練集和驗(yàn)證集乳腺癌患者一般資料及病灶病理特征比較
圖2 患者女,43歲,左乳浸潤(rùn)性癌,HER-2陰性 A、B.左乳CC(A)及MLO(B)圖示左乳外上象限19 mm×16 mm高密度影(綠色框內(nèi)); C.病理圖(HE,×10); D.FISH檢測(cè)圖示HER-2基因無(wú)擴(kuò)增 圖3 患者女,71歲,左乳浸潤(rùn)性癌,HER-2陽(yáng)性 A、B.左乳CC(A)及MLO(B)圖示左乳內(nèi)下象限18 mm×15 mm高密度影(綠色框內(nèi)); C.病理圖(HE,×10); D.FISH檢測(cè)圖示HER-2基因擴(kuò)增
2.2 構(gòu)建DL模型 訓(xùn)練集陽(yáng)性亞組與陰性亞組的Deep-score分別為0.65(0.52,0.79)、0.19(0.12,0.26),差異有統(tǒng)計(jì)學(xué)意義(Z=-11.01,P<0.01);驗(yàn)證集陽(yáng)性亞組和陰性亞組的Deep-score分別為0.43(0.33,0.53)和0.26(0.23,0.31),差異亦有統(tǒng)計(jì)學(xué)意義(Z=-4.28,P<0.01)。見(jiàn)圖4。
圖4 訓(xùn)練集和驗(yàn)證集Deep-score分布 A.訓(xùn)練集; B.驗(yàn)證集
2.3 構(gòu)建聯(lián)合模型 基于臨床獨(dú)立預(yù)測(cè)因素及Deep-score構(gòu)建的聯(lián)合模型的列線圖見(jiàn)圖5。Hosmer-Lemeshow檢驗(yàn)顯示模型擬合較好(χ2=13.10,P=0.11)。校準(zhǔn)曲線(圖6)顯示聯(lián)合模型列線圖在訓(xùn)練集和驗(yàn)證集的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果的一致性均良好。
圖5 聯(lián)合模型列線圖 圖6 聯(lián)合模型列線圖預(yù)測(cè)乳腺癌表達(dá)HER-2狀態(tài)的校準(zhǔn)曲線 A.訓(xùn)練集; B.驗(yàn)證集 圖7 各模型預(yù)測(cè)乳腺癌表達(dá)HER-2 狀態(tài)的ROC曲線 A.訓(xùn)練集; B.驗(yàn)證集
2.4 評(píng)估模型效能 臨床模型、DL模型及聯(lián)合模型在訓(xùn)練集的AUC分別為0.75、0.96及0.97,在驗(yàn)證集分別為0.70、0.86及0.88(圖7及表2)。聯(lián)合模型在訓(xùn)練集的AUC高于臨床模型及DL模型(Z=7.15、2.03,P<0.01、P=0.03),在驗(yàn)證集的AUC高于臨床模型(Z=5.76,P<0.01)而與DL模型差異無(wú)統(tǒng)計(jì)學(xué)意義(Z=1.50,P=0.33)。DCA(圖8)顯示,聯(lián)合模型在訓(xùn)練集的臨床凈收益高于臨床模型及DL模型,在驗(yàn)證集的臨床凈收益高于臨床模型而與DL模型相當(dāng)。
表2 各模型預(yù)測(cè)乳腺癌表達(dá)HER-2狀態(tài)的效能
圖8 各模型預(yù)測(cè)乳腺癌表達(dá)HER-2狀態(tài)的DCA圖 A.訓(xùn)練集; B.驗(yàn)證集
對(duì)于HER-2(++)乳腺癌,準(zhǔn)確評(píng)估其為HER-2陽(yáng)性或陰性有助于為臨床制定治療決策。傳統(tǒng)影像組學(xué)需分割腫瘤邊界和人為定義特征。既往研究[8]表明,DL可準(zhǔn)確、自動(dòng)檢測(cè)腫瘤并分割其邊界和獲取腫瘤特征。CNN用于識(shí)別圖像適應(yīng)性強(qiáng),性能優(yōu)異,擅長(zhǎng)挖掘數(shù)據(jù)局部特征、提取全局特征并進(jìn)行分類[9]。SUN等[10]報(bào)道,DL模型預(yù)測(cè)早期乳腺癌淋巴結(jié)轉(zhuǎn)移的效能良好。本研究基于MG DL提取特征,構(gòu)建CNN模型,以預(yù)測(cè)乳腺癌HER-2表達(dá)狀態(tài),其在驗(yàn)證集中的AUC達(dá)0.86,預(yù)測(cè)效能較佳。
乳腺癌HER-2狀態(tài)與ER呈負(fù)相關(guān)[11]。Ki-67為定量評(píng)估腫瘤增殖的標(biāo)志物,其表達(dá)增加與細(xì)胞生長(zhǎng)相關(guān)[12]。Ki-67指數(shù)與HER-2狀態(tài)呈正相關(guān), HER-2過(guò)表達(dá)可能使Ki-67表達(dá)上調(diào)[13]。本研究將乳腺癌分為Ki-67低表達(dá)(≤15%)、中表達(dá)(16%~30%)和高表達(dá)(>30%)[14],發(fā)現(xiàn)ER狀態(tài)及Ki-67表達(dá)水平均為乳腺癌表達(dá)HER-2狀態(tài)的獨(dú)立預(yù)測(cè)因素;進(jìn)一步將DL特征與臨床獨(dú)立預(yù)測(cè)因素特征相結(jié)合建立聯(lián)合模型,繪制其列線圖以可視化HER-2(++)擴(kuò)增結(jié)果,結(jié)果顯示聯(lián)合模型的預(yù)測(cè)結(jié)果與實(shí)際結(jié)果具有良好一致性,其在訓(xùn)練集的AUC(0.97)及臨床凈獲益均高于DL模型,表明以Deep-score聯(lián)合臨床因素可提高DL模型的預(yù)測(cè)效能,與既往文獻(xiàn)[15]報(bào)道相符。本研究所獲聯(lián)合模型在驗(yàn)證集的AUC與DL模型差異無(wú)統(tǒng)計(jì)學(xué)意義,二者臨床凈獲益相當(dāng),可能與本研究納入臨床特征較少有關(guān),有待進(jìn)一步觀察。
綜上,MG DL聯(lián)合臨床特征列線圖可有效預(yù)測(cè)乳腺癌表達(dá)HER-2狀態(tài)。但本研究為單中心回顧性觀察,樣本量有限,且缺乏外部驗(yàn)證,有待進(jìn)一步完善。