張杉杉 張楊潔 李彤
摘要:直接通過膠質(zhì)母細(xì)胞瘤患者腦部MRI圖像預(yù)測MGMT啟動子甲基化基因序列狀態(tài),可以有效減少醫(yī)生手動勾畫病灶所花費的時間并可能最大限度地減少手術(shù)次數(shù)和改進所需的治療類型。本文使用深度學(xué)習(xí)方法,在RSNA-MICCAI 腦腫瘤放射基因組學(xué)分類數(shù)據(jù)集上對膠質(zhì)母細(xì)胞瘤MGMT啟動子甲基化基因序列狀態(tài)進行預(yù)測。
關(guān)鍵詞:MRI;膠質(zhì)母細(xì)胞瘤;基因預(yù)測;深度學(xué)習(xí)
1????????? 引言
膠質(zhì)母細(xì)胞瘤是最常見和最惡性的人類腦腫瘤,占腦瘤的15%。即使采用積極治療,患者的中位生存期也只有12至14個月。最近,深度學(xué)習(xí)的性能在計算機視覺領(lǐng)域得到了集中展示,它能夠提取圖像中大量的深度特征,與傳統(tǒng)放射組學(xué)提取手工特征相比,這些深度特征包含更多的醫(yī)學(xué)圖像抽象信息。O6 -甲基鳥嘌呤-DNA 甲基轉(zhuǎn)移酶( MGMT ) 啟動子甲基化可改善膠質(zhì)母細(xì)胞瘤的預(yù)后和治療反應(yīng)。到目前為止,膠質(zhì)母細(xì)胞瘤基因序列狀態(tài)預(yù)測的研究中,仍然要依賴醫(yī)生手工勾畫腫瘤區(qū)域,這一任務(wù)十分浪費醫(yī)生的時間和精力。因此本研究提出了一個深度學(xué)習(xí)模型,從未經(jīng)醫(yī)生勾畫的膠質(zhì)母細(xì)胞瘤患者的MRI腦部圖像來預(yù)測膠質(zhì)母瘤患者的MGMT啟動子甲基化狀態(tài)。
2????????? 方法
研究根據(jù)患者腦部MR圖像使用均值投影,得到患者二維圖像。對于每個患者的二維圖像,使用裁剪方法裁減掉圖像周圍的黑色區(qū)域,減少其對于網(wǎng)絡(luò)的干擾。最后將得到的圖像重采樣到256×256,并進行歸一化操作。經(jīng)過預(yù)處理的二維圖像作為本研究網(wǎng)絡(luò)的輸入。研究所采用的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。網(wǎng)絡(luò)由卷積、池化和全連接層組成。10個卷積層(Conv)分別由32,32,64,64,64,64,128,128,128,128個濾波器組成,核大小均為3×3。每個卷積層之后是批處理歸一化(Batch Normalization,BN)層,使網(wǎng)絡(luò)訓(xùn)練更快、更穩(wěn)定。最大池化層(Max-pool)用在BN層之后來降低特征圖的維數(shù),步長為2。在最大池化層之后,使用密集塊(Denseblock)加強特征的傳遞,更有效地利用各層信息。最后經(jīng)過全局平均池化層(AVG-pool)和全連接層得到最后的分類結(jié)果。為了防止網(wǎng)絡(luò)過擬合,我們在深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練過程中,對于神經(jīng)網(wǎng)絡(luò)單元,按照一定的概率抑制神經(jīng)元的輸出,即進行dropout操作。
3????????? 實驗與結(jié)果
3.1 實驗數(shù)據(jù)
本次實驗采用的數(shù)據(jù)集為RSNA-MICCAI 腦腫瘤放射基因組學(xué)分類數(shù)據(jù)集,該數(shù)據(jù)集由585位膠質(zhì)母細(xì)胞瘤患者的腦部MR圖像組成,編號為109,123,709的三位患者因為缺少序列被排除,剩余的582個病人的MR圖像均包含流體衰減反轉(zhuǎn)恢復(fù) (FLAIR)、T1 加權(quán)預(yù)對比 (T1w)、T1 加權(quán)后對比 (T1Gd)和T2 加權(quán) (T2)四個模態(tài)。本次實驗將582位患者數(shù)據(jù)中的524個數(shù)據(jù)作為訓(xùn)練集,58個病人作為測試集,使用十折交叉驗證得到預(yù)測結(jié)果。
3.2? 評價指標(biāo)
根據(jù)受試者工作特征曲線(ROC)下的面積(AUC)、準(zhǔn)確率、精確率和召回率進行對模型分類性能的評估。各評價指標(biāo)的意義及計算公式如表1所示:
其中,TP(True Positives)表示將正類正確預(yù)測為正類數(shù);FP(False Positives)表示將負(fù)類錯誤預(yù)測為正類數(shù);FN(False Negatives)表示將正類錯誤預(yù)測為負(fù)類數(shù);TN(True? Negatives)指將負(fù)類正確預(yù)測為負(fù)類數(shù)。
3.3 實驗結(jié)果
表2展示了研究構(gòu)建的深度學(xué)習(xí)模型在膠質(zhì)母細(xì)胞瘤MGMT啟動子甲基化基因序列狀態(tài)預(yù)測中的性能。研究從準(zhǔn)確率,精確率,召回率以及AUC值四個方面對模型進行評估,并分別比較了四個模態(tài)的預(yù)測性能??梢钥吹?,單序列中,F(xiàn)LAIR模態(tài)在模型中表現(xiàn)出相對較好的預(yù)測性能。其中,召回率為0.791,即模型對于MGMT啟動子甲基化存在有較好的預(yù)測性能。
4????????? 結(jié)束語
直接通過醫(yī)學(xué)影像對膠質(zhì)母細(xì)胞瘤MGMT啟動子甲基化存在與否進行預(yù)測是可行的。實驗表明,在膠質(zhì)母細(xì)胞瘤患者MR圖像中,F(xiàn)LAIR序列能夠取得優(yōu)于T1W、T1WCE和T2W三者的預(yù)測性能。同時,這一工作能夠有效節(jié)省醫(yī)生勾畫腫瘤所花費的精力。
參考文獻:
[1]Dolecek,T. A.,Propp,J. M.,Stroup,N. E. & Kruchko,C. Cbtrus statistical report: primary brain and central nervous system tumors diagnosed in the united states in 2005–2009. Neuro-oncology 14,v1–v49 (2012).
[2]Lao,J.,Chen,Y.,Li,ZC. et al. A Deep Learning-Based Radiomics Model for Prediction of Survival in Glioblastoma Multiforme. Sci Rep 7,10353 (2017). https://doi.org/10.1038/s41598-017-10649-8.
[3]Yogananda CGB,Shah BR,Nalawade SS,Murugesan GK,Yu FF,Pinho MC,Wagner BC,Mickey B,Patel TR,F(xiàn)ei B,Madhuranthakam AJ,Maldjian JA. MRI-Based Deep-Learning Method for Determining Glioma MGMT Promoter Methylation Status. AJNR Am J Neuroradiol. 2021 May;42(5):845-852. doi: 10.3174/ajnr.A7029. Epub 2021 Mar 4. PMID: 33664111;PMCID: PMC8115363..
[4]U.Baid,et al.,“The RSNA-ASNR-MICCAI BraTS 2021 Benchmark on Brain Tumor Segmentation and Radiogenomic Classification”,arXiv:2107.02314,2021.
第一作者簡介:張杉杉(1997),女,漢族,河南省新鄉(xiāng)縣,碩士研究生,圖像分析與圖像處理,蘭州財經(jīng)大學(xué),730010。
作者簡介:李彤(1997-),女,漢族,甘肅白銀,碩士研究生在讀,圖像處理。蘭州財經(jīng)大學(xué),730010。
作者簡介:張楊潔(2000-),男,漢,浙江臺州,本科在讀,研究方向醫(yī)學(xué)圖像處理,蘭州財經(jīng)大學(xué),730010。