伍文麗,李杰文,徐勝生*
(1.重慶醫(yī)科大學附屬第一醫(yī)院放射科,重慶 400016;2.重慶大學光電技術(shù)與系統(tǒng)教育部重點實驗室,重慶 400044)
腦膠質(zhì)瘤起源于神經(jīng)膠質(zhì)細胞,是最常見的原發(fā)性中樞神經(jīng)系統(tǒng)腫瘤,約占成人原發(fā)性惡性腦腫瘤的75%。2016 年世界衛(wèi)生組織(WHO)將腦膠質(zhì)瘤分為低級別膠質(zhì)瘤(lowgrade glioma, LGG,包 括WHO Ⅰ- Ⅱ級) 及 高 級 別 膠 質(zhì)瘤(high-grade glioma, HGG,包 括WHO Ⅲ- Ⅳ級)[1]。MRI是一種非侵入性的醫(yī)學成像技術(shù),因其具有良好軟組織對比度,能為腦膠質(zhì)瘤的診斷和治療提供豐富的信息,是腦膠質(zhì)瘤的評估的首選成像技術(shù)[2]。然而,隨著醫(yī)學影像技術(shù)及成像設(shè)備的發(fā)展,逐漸增多的影像圖像給放射科醫(yī)生的工作帶來了巨大的挑戰(zhàn)。且隨著精準醫(yī)療的提出,傳統(tǒng)的人工閱片等主觀的醫(yī)學圖像分析方法已無法滿足需求。深度學習(deep learning, DL)是機器學習的一個重要分支,可從大量的原始數(shù)據(jù)中自動提取圖像中抽象、復雜的深度特征,而非手工制作的淺層特征,具有快速高效,準確率高的優(yōu)勢[3],使其迅速成為醫(yī)學圖像分析領(lǐng)域研究的熱點。近年來,DL 廣泛應(yīng)用于腦膠質(zhì)瘤的MRI 圖像分析處理中,其在腫瘤分割、分類、基因預測及生存期預測等方面發(fā)揮著重要作用。本文就DL 在腦膠質(zhì)瘤中的應(yīng)用中的進展予以綜述。
DL 是傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)技術(shù)的擴展,是通過多層非線性網(wǎng)絡(luò)結(jié)構(gòu)從原始數(shù)據(jù)中自動提取并組合低級特征,再轉(zhuǎn)換成更高級、更抽象特征,以完成復雜任務(wù)學習的一種深度網(wǎng)絡(luò)[3,4]。DL 方法包含多種深度模型,其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)模型是應(yīng)用最廣泛的深度學習模型,在識別、處理和分析圖像特征過程與人類神經(jīng)系統(tǒng)處理視覺信息過程類似[3,4]。CNN 一般由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成,如圖1 所示。各層之間相互聯(lián)系,共同構(gòu)成復雜而精密的網(wǎng)絡(luò)。卷積層自動提取輸入信息的特征,且通過權(quán)值共享減低模型復雜度;池化層緊跟在卷積層之后,其通過降低特征面的分辨率獲得具有空間不變性的特征,起到二次提取特征的作用;全連接層中每個神經(jīng)元與前一層所有神經(jīng)元進行全連接,通過整合前期所提取的各種局部特征,達到訓練分類器及學習目標全局特征的目的。因此CNN 具有局部連接、權(quán)值共享、池化操作及多層結(jié)構(gòu)等特點,使其減少訓練參數(shù)的數(shù)量,有效降低了網(wǎng)絡(luò)計算復雜度,同時使得網(wǎng)絡(luò)對輸入的局部變換具有一定不變性,如平移不變形,從而提升了網(wǎng)絡(luò)泛化能力[3]。
圖1 一個基本的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
腦膠質(zhì)瘤的準確分割對疾病診斷、預后和患者治療計劃具有重要作用[5]。目前,基于DL 的分割算法已實現(xiàn)了從多模態(tài)MRI 數(shù)據(jù)中將腦膠質(zhì)瘤自動分割為壞死區(qū)、水腫區(qū)、腫瘤非增強區(qū)及腫瘤增強區(qū)等不同亞區(qū)。Pereira 等[6]提出一種基于3×3 卷積核的二維卷積神經(jīng)網(wǎng)絡(luò)(2D CNN)自動分割算法,該方法使用的小卷積核可通過減少參數(shù)量而防止過擬合的發(fā)生。霍智勇等[7]提出了一種基于雙通道三維密集連接網(wǎng)絡(luò)的腦膠質(zhì)瘤MRI 數(shù)據(jù)自動分割算法,該算法利用三維密集連接網(wǎng)絡(luò)加強特征傳播,減少了低級特征向高級特征傳遞過程中的損失,然后采用雙通道特征提取網(wǎng)絡(luò),選取不同尺度卷積核,獲取了多尺度特征,解決了腫瘤區(qū)域大小不一致的問題。Cui 等[8]結(jié)合兩個子網(wǎng)絡(luò)構(gòu)建了一種級聯(lián)深度卷積神經(jīng)網(wǎng)絡(luò),結(jié)果表明該方法分割腫瘤整體、腫瘤核心及腫瘤增強區(qū)的骰子相似系數(shù)(dice similarity coefficient, DSC)分別為0.89,0.77 及0.80,且平均在1.54 秒內(nèi)快速完成了分割任務(wù)。為進一步提高腦膠質(zhì)瘤分割精度,Prasanna 等[5]采用基于影像組學的CNN 分割技術(shù),即先識別出分割腫瘤不同亞區(qū)的影像組學紋理特征,然后將這些特征輸入到三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)模型中,用于腦膠質(zhì)瘤不同亞區(qū)的分割,結(jié)果表明相比3D CNN 分割模型,提高了腫瘤增強區(qū)和腫瘤整體的分割精度。Mlynarski 等[9]采用2D-3D CNN 分割方法對腦膠質(zhì)瘤多模態(tài)MRI 數(shù)據(jù)進行分割,該方法結(jié)合了2D 和3D 卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點,捕獲了空間上下文特征,結(jié)果顯示分割腫瘤整體、腫瘤核心及腫瘤增強區(qū)的DSC 分別為0.918,0.883 及0.854,優(yōu)于以上分割算法的精度。
此外,AlBadawy 等[10]研究了CNN 對來自兩個機構(gòu)的膠質(zhì)母細胞瘤MRI 數(shù)據(jù)的分割性能,結(jié)果顯示使用不同機構(gòu)的數(shù)據(jù)的分割精度(DSC 為0.68±0.19)顯著低于使用同一機構(gòu)數(shù)據(jù)的分割精度(DSC 為0.72±0.17)。由此可見,來自不同的機構(gòu)的數(shù)據(jù)在成像設(shè)備、圖像采集參數(shù)和對比劑使用方面有所不同,這可能會影響圖像質(zhì)量,從而影響分割精度。
腦腫瘤的病理類型及腦膠質(zhì)瘤分級很大程度上決定了治療方案及整體預后[11,12],因此準確進行腦腫瘤分類及分級具有重要臨床意義。近年來,一些研究者基于CNN 方法充分挖掘?qū)Ρ仍鰪奣1WI (contrast enhanced T1-weighted imaging, CE-T1WI)數(shù)據(jù)集的深度特征實現(xiàn)了腦膠質(zhì)瘤、腦膜瘤及垂體瘤分類診斷,如Abiwinanda 等[13]和Paul 等[14]的分類準確率分別為84.19%,90.26%。隨后Swati 等[15]使用預訓練卷積神經(jīng)網(wǎng)絡(luò)模型,提出了一種基于遷移學習的分塊微調(diào)策略進行分類,準確率高達94.82%。Deepak 等[11]使用遷移學習訓練深度卷積神經(jīng)網(wǎng)絡(luò)模型,分類準確率為92.3%,當進一步聯(lián)合CNN 及支持向量機(support vector machine, SVM),準確率提高到97.8%。
除了腦腫瘤定性診斷,DL 還實現(xiàn)了腦膠質(zhì)瘤的分級診斷。Yang 等[16]使 用GoogLeNet 和AlexNet 模 型 進 行LGG和HGG 分類,兩種模型的分類準確率分別為94.5%、93.8%,表明GoogLeNet 具有更佳分類性能。Zhang 等[17]基于CNN模型,從擴散張量成像(diffusion tensor imaging, DTI)數(shù)據(jù)集中提取深度特征,用于腦膠質(zhì)瘤分級,結(jié)果顯示區(qū)分LGG 與HGG 準確率為94%;區(qū)分WHO Ⅲ級與WHO Ⅳ級腦膠質(zhì)瘤準確率高達98%,表明在腦DTI 圖像上提取的深度特征有助于區(qū)分不同級別的腦膠質(zhì)瘤。為廣泛挖掘不同級別膠質(zhì)瘤間的差異性,Ge 等[18]將多模態(tài)MRI 納入多流2D CNN 模型中,實現(xiàn)了LGG 和HGG 的分類,其中CE-T1WI 具有最高效能,其準確率為83.87%,融合多模態(tài)特征分類性能提高了約7%。Mzoughi 等[12]提出一種多尺度3D CNN 架構(gòu),基于多模態(tài)MRI 數(shù)據(jù)集進行LGG 及HGG 的分類,并采用數(shù)據(jù)增強技術(shù)對圖像進行預處理,其分類準確率從82.5%提高到96.4%,優(yōu)于2D CNN 模型。上述研究結(jié)果均表明DL 有助于腦膠質(zhì)瘤鑒別及分級,然而目前主要進行的是單中心研究,存在樣本量較小的問題,有待進一步進行多中心,大樣本的研究以驗證其可行性。
了解腦膠質(zhì)瘤異檸檬酸脫氫酶(isocitrate dehydrogenase, IDH),O6-甲基鳥嘌呤-DNA 甲基轉(zhuǎn)移(O6-methylguanine-DNA methyltrans-ferase,MGMT)和1p19q 等腫瘤基因狀態(tài)有益于治療方案的制定和預后的評估[19]。近年來,越來越多的研究探討了DL 預測腦膠質(zhì)瘤基因狀態(tài)的價值。Li 等[20]通過增加網(wǎng)絡(luò)深度和全連接層中的神經(jīng)元數(shù)量構(gòu)建CNN 模型,用于預測LGG 患者IDH1 突變狀態(tài),其工作曲線下面積(the area under the operating characteristic curve, AUC) 為0.92。Korfiatis 等[21]采用三種殘差深度神經(jīng)網(wǎng)絡(luò)(residual deep neural network, ResNet)模型用于預測MGMT 啟動子甲基化狀態(tài),結(jié)果顯示ResNet50 模型優(yōu)于ResNet34 和ResNet18 模型,其準確率分別為94.90%,80.72%和75.75%。Akkus 等[22]等基于多尺度CNN 模型實現(xiàn)了LGG 患者1p19q 共缺失狀態(tài)的預測,準確率為87.70%。此外,Chang 等[23]訓練的CNN 模型實現(xiàn)了腦膠質(zhì)瘤的多基因預測,包括IDH1 突變、MGMT 甲基化和1p/19q 共缺失狀態(tài),準確率分別為94%,83%及92%,提示利用CNN 可以同時預測多個基因的狀態(tài)。
為了證明基于不同MRI 模態(tài)的預測性能,有研究利用多模態(tài)MRI 數(shù)據(jù)集構(gòu)建CNN 模型用于預測腦膠質(zhì)瘤IDH 狀態(tài),如Chang 等[24]基于殘差卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建預測模型,結(jié)果顯示FALIR、T2WI、T1WI 及CE-T1WI 數(shù)據(jù)集的AUC 值分別為0.69,0.73,0.86 及0.92,融合多模態(tài)MRI 后AUC 為0.94。另一項研究[25]構(gòu)建的3D-DenseNet 模型中T2WI 預測能力最好,AUC 為0.82,而基于CE-T1WI 的AUC 為0.75,融合多模態(tài)MRI 的AUC 達0.86。這些數(shù)據(jù)表明融合多模態(tài)MRI 數(shù)據(jù)集可以提供預測腦膠質(zhì)瘤基因狀態(tài)的補充信息,其預測性能顯著優(yōu)于單模態(tài)模型。然而,Yogananda 等[26]采用3D-Dense-UNets 方法分別構(gòu)建基于T2WI 及多模態(tài)MRI 數(shù)據(jù)集預測腦膠質(zhì)瘤IDH 狀態(tài)模型,準確率分別為97.14%±0.04、97.12%±0.09,AUC 分別為0.98±0.01、0.99±0.01,這表明僅使用T2WI 模態(tài)的信息就可以提供較高的預測性能??梢?,不同的研究基于不同MRI 模態(tài)預測基因狀態(tài),其結(jié)果并不一致,仍需在更大樣本中進一步研究。
既往研究將患者年齡、性別、腫瘤部位、大小等作為預后因素[27],然而這些指標無法反映腫瘤內(nèi)異質(zhì)性,存在一定局限。DL 能挖掘肉眼無法識別整個腫瘤的的深層、抽象的特征,更有助于預測患者生存期。Liu 等[28]采用預訓練的卷積神經(jīng)網(wǎng)絡(luò)對圖像深度特征進行篩選,再將篩選后的特征納入隨機森林算法分類模型,其預測生存期準確率達到95.45%。Nie的團隊[29]采用深度學習,從多模態(tài)、多通道的MRI 數(shù)據(jù)集中自動提取深度特征,用于預測HGG 患者的總生存期。隨后將這些深度特征以及臨床特征(如年齡、腫瘤大小和組織學類型)輸入SVM 以預測總生存期,其準確率高達90.66%,并進行了一系列比較分析,結(jié)果表明融合多模態(tài)模型較單一模態(tài)模型具有更高性能,在單模態(tài)分類性能中靜息狀態(tài)功能磁共振成像具有最佳性能,且使用3D CNN 構(gòu)建的預測模型較2D CNN 具有更高性能,準確率提高了約10%;另外他們將CNN全連接層中提取的深度特征輸入SVM,從而構(gòu)建CNN+SVM的聯(lián)合模型,發(fā)現(xiàn)其性能較單獨的CNN 模型提高了2.5%,且單獨的CNN 模型的性能優(yōu)于SVM 模型。
盡管上述研究均表明DL 方法預測腦膠質(zhì)瘤生存期方面具有重要價值,但大多數(shù)研究并未考慮使用與預后相關(guān)的腫瘤基因型,如IDH、MGMT 及1p19q 等。Tang 等[30]提出了一種多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)模型共同完成腫瘤基因型(IDH,MGMT,1p19q)和總生存期預測任務(wù),具體來說從基因型預測任務(wù)中獲得的深度特征,用于指導總生存期的預測,反之從總生存期預測任務(wù)中學習到的特征也用于腫瘤基因型的預測。結(jié)果顯示與腫瘤基因型相關(guān)特征顯著提高了預測總生存期的準確性,反之與總生存期相關(guān)的特征也改善了預測基因型的準確性,表明深度特征、基因型和患者生存期之間具有密切關(guān)系。
目前,基于DL 已采用多模態(tài)、多方法對腦膠質(zhì)瘤MRI 圖像進行分割、分類、基因預測及生存期預測的橫向及縱向研究,并獲得初步進展。相信隨著人工智能蓬勃發(fā)展的趨勢,借助醫(yī)學影像大數(shù)據(jù)的發(fā)展,不斷改進的深度學習方法將有助于更精確地了解腦膠質(zhì)瘤的特征,在緩解放射科醫(yī)生的壓力同時提高了診斷的速率及準確率,無疑能為精準醫(yī)療的實現(xiàn)提供更多的解決方案。