周曉婭,尚圣捷,王穎妮,董越,劉冠宇,羅婭紅,蔣西然
1. 濟(jì)寧醫(yī)學(xué)院 基礎(chǔ)醫(yī)學(xué)院,山東 濟(jì)寧 272067;2. 中國醫(yī)科大學(xué) 智能醫(yī)學(xué)學(xué)院,遼寧 沈陽 110122;3. 遼寧省腫瘤醫(yī)院(中國醫(yī)科大學(xué)腫瘤醫(yī)院)醫(yī)學(xué)影像科,遼寧 沈陽 110042
軟組織腫瘤起源于人體結(jié)締和滑膜等軟組織,在人體內(nèi)分布廣泛,其中四肢部位發(fā)病最為常見。惡性軟組織腫瘤的發(fā)病率較低,僅占成人惡性腫瘤的1%[1],但患者死亡率卻高達(dá)20%~30%,2019年美國新增軟組織腫瘤患者中,死亡率約40%[2]。因此,對(duì)軟組織腫瘤進(jìn)行早期臨床診斷和制定精準(zhǔn)治療方案對(duì)患者的康復(fù)和預(yù)后至關(guān)重要[3]。
磁共振成像(Magnetic Resonance Imaging,MRI)技術(shù)利用靜磁場和射頻磁場獲得人體組織影像,具有軟組織分辨率高及多方位成像的優(yōu)點(diǎn),是當(dāng)前軟組織腫瘤檢測的主要方法之一[4],已成為臨床上對(duì)軟組織瘤進(jìn)行術(shù)前評(píng)估的重要影像學(xué)工具[5]。然而,由于軟組織瘤具有明顯異質(zhì)性并存在多種亞型,在臨床診斷中容易發(fā)生誤診或漏診,影響治療時(shí)機(jī)[6]。因此,當(dāng)前亟需一種針對(duì)MRI影像的軟組織腫瘤精準(zhǔn)輔助分析方法。近年來,影像組學(xué)技術(shù)發(fā)展迅速,通過從臨床影像中高通量獲取高維度影像特征信息,篩選有診斷價(jià)值的定量化特征建立相應(yīng)計(jì)算機(jī)預(yù)測模型[7],能夠?qū)Χ喾N腫瘤疾病進(jìn)行有效評(píng)估和輔助診斷[8-11]。然而,當(dāng)前針對(duì)軟組織腫瘤的計(jì)算機(jī)影像組學(xué)分析研究較少,可能是由于軟組織瘤發(fā)病率較低,因此數(shù)據(jù)收集存在困難。前期Corino等[12]針對(duì)軟組織腫瘤PET/CT影像初步建立了計(jì)算機(jī)分析模型,雖然該研究只納入了19例患者,缺乏臨床可靠性,但該研究提示我們計(jì)算機(jī)輔助分析方法對(duì)軟組織腫瘤具有一定的輔助診斷潛力。Wang等[13]則進(jìn)一步通過影像組學(xué)分析提取出了軟組織腫瘤MRI影像中有價(jià)值的特征信息建立預(yù)測模型,表明影像組學(xué)特征對(duì)腫瘤的術(shù)前分級(jí)有一定的預(yù)測價(jià)值。然而,由于軟組織腫瘤本身存在明顯的腫瘤異質(zhì)性,腫瘤細(xì)胞在瘤內(nèi)聚集分布不均勻,對(duì)影像組學(xué)模型的建立和效果產(chǎn)生較大影響[14]。因此,本研究中,我們針對(duì)軟組織瘤內(nèi)異質(zhì)性的問題進(jìn)行了有針對(duì)性的探索,分析了不同瘤內(nèi)亞區(qū)及腫瘤完整區(qū)域的影像組學(xué)預(yù)測價(jià)值,并建立雙序列MRI融合輔助診斷模型。
本研究經(jīng)中國醫(yī)科大學(xué)遼寧省腫瘤醫(yī)院倫理委員會(huì)批準(zhǔn),收集了2017年6月至2019年4月在醫(yī)院就診的75例軟組織腫瘤患者的MRI影像數(shù)據(jù)。患者信息如表1所示。數(shù)據(jù)研究標(biāo)準(zhǔn)為:① 患者術(shù)前進(jìn)行CE-T1和T1WI MRI掃描;② 經(jīng)病理學(xué)確診為軟組織腫瘤。排除標(biāo)準(zhǔn)為:① 患者除軟組織腫瘤以外還患有其他腫瘤疾??;② MRI數(shù)據(jù)采集前有過放化療史;③ MRI數(shù)據(jù)不全或影像模糊。全部患者按照2:1隨機(jī)分為訓(xùn)練集和測試集。
表1 本研究納入患者的臨床信息
軟組織腫瘤患者M(jìn)RI影像通過Verio 3.0 Tesla 掃描儀(Siemens,德國)掃描獲得。MRI掃描參數(shù)為Tra T1WI(TR/TE=514.0 ms/14.0 ms),Tra enhanced T1WI(TR/TE=514.0 ms/14.0 ms);層厚:5.0 mm;視野:350.0 mm×250.0 mm;矩陣:360×448。以3.0 mL/s速度靜脈注射劑量0.1 mmol/kg造影劑釓噴酸葡胺。掃描所得MRI影像數(shù)據(jù)采用DICOM圖片格式儲(chǔ)存于遼寧腫瘤醫(yī)院PACS。
由具有10年工作經(jīng)驗(yàn)的影像科醫(yī)生使用ITK-SNAP v3.6將收集的MRI影像數(shù)據(jù)勾畫出軟組織腫瘤病灶區(qū)域(Region of Interest,ROI),包括腫瘤及其邊緣區(qū)域,并輸出保存為NII格式。在手工分割軟組織腫瘤病灶過程中,如遇腫瘤邊緣不清晰等難以確定的病例時(shí),會(huì)協(xié)同骨軟科及影像科專家共同會(huì)診后決定分割區(qū)域。醫(yī)生分割腫瘤病灶區(qū)域時(shí)不知曉患者的病理診斷結(jié)果。在每個(gè)MRI序列影像ROI區(qū)域內(nèi),采用無監(jiān)督k-means聚類算法,依據(jù)輪廓系數(shù)參數(shù)來選取最優(yōu)k值,從而將ROI分割為兩個(gè)子區(qū)域(高亮度亞區(qū)和低亮度亞區(qū)),采用歐氏距離作為距離度量,兩個(gè)對(duì)象的距離越近,其相似度就越大,從而聚類具有相似成像模式的腫瘤體素。
通過Python v3.6軟件編程,使用開源Pyradiomics包( 網(wǎng) 址 :https://pyradiomics.readthedocs.io) 對(duì) MRI影像組學(xué)特征進(jìn)行提取,包括一階統(tǒng)計(jì)量特征、形態(tài)學(xué)特征、紋理特征和濾波特征。提取得到的特征通過R語言glmnet包運(yùn)行最大相關(guān)最小冗余(Max-Relevance and Min-Redundancy,mRMR)算法對(duì)特征進(jìn)行相關(guān)性排序篩選[15],通過Wilcoxon秩和檢驗(yàn)方法計(jì)算特征P值。
通過Matlab(2016a版本)編程建立k-最近鄰(K-Nearest Neighbor,KNN)機(jī)器學(xué)習(xí)分類器模型,為評(píng)估所構(gòu)建計(jì)算機(jī)模型鑒別軟組織腫瘤良惡性的能力,通過Matlab編程繪制工作特性曲線(Receiver Operating Characteristic,ROC),由最大約登指數(shù)計(jì)算得到ROC曲線的最佳閾值[16],計(jì)算ROC曲線下面積(Area Under Curve,AUC)、準(zhǔn)確率(Accuracy,ACC)、特異性(Specificity,SPE)和敏感性(Sensitivity,SEN)作為模型衡量指標(biāo)。使用R語言v3.6 RMS軟件包繪制諾莫圖模型。全部算法運(yùn)行的計(jì)算機(jī)平臺(tái)硬件配置為:3.7 GHz Intel i7-8700K CPU 和 64 GB 3000 MHz DDR4 RAM。
圖1所示為本研究采集的軟組織腫瘤患者雙序列MRI影像及醫(yī)生手工勾畫的ROI,圖中黃色線條表示影像科醫(yī)生沿著軟組織腫瘤區(qū)域的邊緣進(jìn)行手工勾畫的痕跡。
圖1 本研究使用的軟組織瘤MRI影像及腫瘤ROI勾畫
為了探討軟組織腫瘤內(nèi)部異質(zhì)性區(qū)域的預(yù)測價(jià)值,本文采用k-means無監(jiān)督聚類方法進(jìn)行瘤內(nèi)分割,通過枚舉,令k從2到9,為避免局部最優(yōu)解,在每個(gè)k值上重復(fù)運(yùn)行數(shù)次k-means,并同時(shí)計(jì)算k的平均輪廓系數(shù),最后選取輪廓系數(shù)最大的值對(duì)應(yīng)的k為2作為最終的集群數(shù)目(圖2)。
圖2 對(duì)75例軟組織腫瘤患者的進(jìn)行k-means瘤內(nèi)分割時(shí),不同的k取值對(duì)應(yīng)的輪廓系數(shù)的值
研究對(duì)T1WI和CE-T1序列的整體ROI、低亮度亞區(qū)和高亮度亞區(qū)分別進(jìn)行了影像特征提取和分析。圖3所示為對(duì)軟組織瘤 T1-CE MRI(圖 3a~b)和 T1WI MRI(圖3c~d)進(jìn)行瘤內(nèi)分割的結(jié)果。表2列出了針對(duì)軟組織腫瘤完整腫瘤區(qū)域以及腫瘤內(nèi)亞區(qū)分別建立的KNN模型預(yù)測結(jié)果,并相應(yīng)地繪制出如圖4所示的基于訓(xùn)練集和測試集的ROC曲線??梢姡琓1WI序列和CE-T1序列的高亮度亞區(qū)的預(yù)測效果都比較好,AUC分別達(dá)到0.753(SEN=0.533,SPE=0.800)和 0.818(SEN=0.667,SPE=0.867)。
圖3 瘤內(nèi)亞區(qū)分割的結(jié)果示例
圖4 KNN分類器對(duì)CE-T1和T1WI MRI影像繪制的ROC曲線
表2 腫瘤完整區(qū)域及瘤內(nèi)分割亞區(qū)預(yù)測結(jié)果
本研究通過對(duì)CE-T1序列和T1WI序列中腫瘤區(qū)域及瘤內(nèi)高亮度亞區(qū)分別提取影像組學(xué)特征并篩選后,最終獲得5個(gè)診斷價(jià)值最高的特征,其中2個(gè)屬于Exponential特征,3個(gè)屬于Log特征。表3列出了各特征的單獨(dú)預(yù)測AUC值及P值。
表3 CE-T1和T1WI MRI序列中高亮度亞區(qū)內(nèi)篩選獲得的影像組學(xué)特征
圖5a所示為本研究使用篩選得到的5個(gè)影像組學(xué)特征繪制的諾模圖風(fēng)險(xiǎn)預(yù)測模型。軟組織腫瘤患者的惡性風(fēng)險(xiǎn)的計(jì)算方法為:由患者T1增強(qiáng)和T1平掃M(jìn)RI序列影像計(jì)算得到的分?jǐn)?shù)在模型總分?jǐn)?shù)軸上的對(duì)應(yīng)位置豎直向下做一條直線并與總風(fēng)險(xiǎn)軸相交,從而獲得總風(fēng)險(xiǎn)值。圖5b和圖5c表明,模型的校正曲線在訓(xùn)練集和測試集上均貼近經(jīng)過原點(diǎn)的45°斜線,表明本研究建立的模型預(yù)測結(jié)果與真實(shí)結(jié)果具有良好的一致性。圖5d和圖5e為模型在訓(xùn)練集和測試集上的ROC曲線,預(yù)測AUC值分別為 0.865(SPE=0.763,SEN=0.763) 和 0.856(SPE=0.867,SEN=0.800),表明模型具有較低的誤診率和漏診率。
圖5 用于軟組織瘤良惡性鑒別的諾模圖模型的建立及驗(yàn)證
圖6所示為本研究建立模型的決策曲線分析結(jié)果,橫軸和縱軸分別為模型的閾值概率和凈獲益率,圖中黑色直線為假定軟組織腫瘤患者均患有良性瘤,藍(lán)色曲線為假定全部患者均患有惡性瘤,本研究所構(gòu)建模型對(duì)應(yīng)為紅色曲線。當(dāng)閾值概率在0.10~0.86時(shí),本研究建立的模型對(duì)軟組織腫瘤患者有良好獲益。
圖6 本研究建立影像組學(xué)模型的DCA結(jié)果
隨著醫(yī)學(xué)影像人工智能技術(shù)的快速發(fā)展,對(duì)腫瘤疾病影像建立計(jì)算機(jī)分析方法以輔助醫(yī)生進(jìn)行臨床決策已經(jīng)成為智能醫(yī)學(xué)領(lǐng)域新的發(fā)展趨勢(shì)[17]。本研究針對(duì)軟組織腫瘤異質(zhì)性問題,進(jìn)行了基于瘤內(nèi)亞區(qū)分割的影像組學(xué)分析。本研究從T1CE 和T1WI MRI的整體ROI以及瘤內(nèi)高亮度和低亮度亞區(qū)分別提取影像組學(xué)特征建立預(yù)測模型,結(jié)果表明在兩種MRI序列影像中,瘤內(nèi)高亮度亞區(qū)均具有最高的診斷效果(表2)。最終篩選得到的5個(gè)影像組學(xué)特征中,有3個(gè)來自CE-T1序列,2個(gè)來自T1WI序列。本研究篩選出的特征都屬于濾波后的高維特征,這可以部分解釋臨床醫(yī)生通過肉眼觀察CE-T1和T1W TMRI影像對(duì)軟組織腫瘤進(jìn)行診斷中存在較高的惡性瘤漏診率[6],這是因?yàn)槟P秃Y選到的診斷能力強(qiáng)的特征均存在于高維度空間,人眼難以對(duì)其進(jìn)行識(shí)別和洞察。本研究獲得的5個(gè)特征中,有3個(gè)屬于紋理特征類,這與前期發(fā)表的軟組織腫瘤影像學(xué)分析報(bào)道具有一致性。Xu等[18]和Vallières等[19]分別在軟組織腫瘤FDG-PET影像中發(fā)現(xiàn)紋理特征具有較高的診斷價(jià)值。由于紋理特征往往體現(xiàn)腫瘤細(xì)胞的異質(zhì)性分布特性,因此本研究結(jié)果提示我們腫瘤異質(zhì)性是反應(yīng)軟組織腫瘤自身特性的重要指標(biāo),表明軟組織腫瘤MRI影像中的瘤內(nèi)高亮度區(qū)域內(nèi)包含更多的潛在診斷信息,值得引起相關(guān)研究者的關(guān)注。本研究獲得的融合模型對(duì)軟組織瘤良惡性的鑒別效果明顯優(yōu)于近年發(fā)表的兩篇前期報(bào)道,可能的原因是本研究采用T1增強(qiáng)和T1平掃序列進(jìn)行特征級(jí)融合建模,能夠獲得來自增強(qiáng)和平掃兩個(gè)序列的互補(bǔ)信息。此外,本研究納入的患者數(shù)量相對(duì)較多,提高了影像組學(xué)模型的可靠性。而前期研究報(bào)道僅使用了單一MRI序列,且患者數(shù)量太少,分別僅納入了19例[12]和35例[7]患者。
為了進(jìn)一步建立有臨床應(yīng)用價(jià)值的輔助診斷模型,本研究建立了近年使用較為廣泛的可視化諾模圖模型[20]?;贑E-T1和T1WI序列MRI影像特征構(gòu)建的融合諾模圖模型對(duì)軟組織腫瘤進(jìn)行預(yù)測,測試集AUC=0.856,可表明該模型具有較高的診斷能力。校正曲線結(jié)果表明諾模圖模型的預(yù)測結(jié)果與真實(shí)值接近(圖4),模型的可靠性較好。決策曲線分析表明,對(duì)于醫(yī)生或患者,使用本研究構(gòu)建的諾模圖模型方法來鑒別惡性軟組織瘤在概率閾值為0.10~0.86時(shí)會(huì)顯著獲益,這說明諾模圖模型具有良好的潛在臨床應(yīng)用價(jià)值。
本研究存在一定的局限性:① 由于軟組織腫瘤屬于罕見病,發(fā)病率較低,因此本研究納入的患者數(shù)量相對(duì)較少,我們?cè)诮窈蟮难芯恐袝?huì)通過與多家醫(yī)療機(jī)構(gòu)共同合作,擴(kuò)大數(shù)據(jù)量,納入更多MRI序列并對(duì)比不同序列的診斷價(jià)值,驗(yàn)證模型的魯棒性;② 本研究納入的軟組織瘤患者樣本中,良性和惡性瘤患者比例不均衡,可能存在一定的偏倚性,雖然已使用smote方法進(jìn)行均衡,數(shù)據(jù)分布的不平衡性仍不能完全消除,可能會(huì)影響所構(gòu)建模型的靈敏度和特異性;③ 由于本院軟組織瘤患者臨床指標(biāo)特別是血清學(xué)標(biāo)志物檢測不全面,因此本研究沒有納入臨床指標(biāo);④ 本研究對(duì)腫瘤ROI的勾畫為醫(yī)生手工操作,較為費(fèi)時(shí)耗力,今后應(yīng)引入深度學(xué)習(xí)自動(dòng)分割技術(shù),以減少勾畫工作量;⑤ 由于目前條件有限,本研究后期會(huì)根據(jù)影像常規(guī)檢查與病理診斷結(jié)果計(jì)算醫(yī)生的漏診率和誤診率,更好地與影像組學(xué)模型進(jìn)行對(duì)比說明。
綜上,本研究對(duì)軟組織瘤患者的T1增強(qiáng)和T1平掃M(jìn)RI序列中的腫瘤區(qū)域及瘤內(nèi)高亮度和低亮度亞區(qū)的影像組學(xué)預(yù)測價(jià)值進(jìn)行了對(duì)比分析,并建立了融合諾莫圖模型。結(jié)果表明基于瘤內(nèi)區(qū)域分割的影像組學(xué)融合分析方法適合于輔助醫(yī)師對(duì)軟組織腫瘤進(jìn)行良惡性鑒別,具有良好的潛在臨床應(yīng)用價(jià)值。