朱雪超,何玉麟,鄔鶯鶯,黎斌,萬(wàn)天意,唐辛,余秋月
作者單位:南昌大學(xué)第一附屬醫(yī)院放射科,南昌 330006
膠質(zhì)瘤是大腦神經(jīng)系統(tǒng)最常見(jiàn)的神經(jīng)上皮腫瘤,其中以膠質(zhì)母細(xì)胞瘤(glioblastoma,GBM)WHOⅣ級(jí)惡性程度最高[1]。在眾多已報(bào)道的生物標(biāo)志物中,組織學(xué)分級(jí)和Ki-67增殖指數(shù)是兩個(gè)重要的生物學(xué)行為標(biāo)志物。Ki-67核抗原與細(xì)胞增殖密切相關(guān),它存在于細(xì)胞周期的所有活躍期(細(xì)胞周期的Gap1期、合成期和Gap2期)和有絲分裂,但在靜止(Gap0)細(xì)胞中不存在[2]。Ki-67增殖指數(shù)由Ki-67免疫組織化學(xué)(immunohistochemistry,IHC)測(cè)定,與膠質(zhì)瘤的組織學(xué)惡性程度密切相關(guān)[3],分化差的腫瘤其Ki-67表達(dá)水平也相應(yīng)較高。臨床上,Ki-67增殖指數(shù)對(duì)腫瘤的診斷、治療及預(yù)后具有指導(dǎo)作用[4]。因此,高精度地術(shù)前預(yù)測(cè)腫瘤Ki-67表達(dá)水平有利于準(zhǔn)確評(píng)估腫瘤生物學(xué)行為,為膠質(zhì)瘤患者的精確治療提供幫助[5]。影像組學(xué)是指從醫(yī)學(xué)圖像中提取和分析大量的人眼無(wú)法識(shí)別的定量成像特征,既往的研究證明了定量成像特征與醫(yī)學(xué)結(jié)果之間的預(yù)測(cè)或預(yù)后關(guān)系[6-7]。目前通過(guò)影像組學(xué)模型術(shù)前預(yù)測(cè)膠質(zhì)母細(xì)胞瘤Ki-67表達(dá)水平的研究較少,因此本研究擬通過(guò)T2WI建立預(yù)測(cè)膠質(zhì)母細(xì)胞瘤Ki-67表達(dá)水平的影像組學(xué)模型。
本回顧性研究經(jīng)南昌大學(xué)第一附屬醫(yī)院倫理委員會(huì)批準(zhǔn),免除受試者知情同意。收集我院2016年1月至2020年7月確診為膠質(zhì)母細(xì)胞瘤的患者。納入標(biāo)準(zhǔn):(1)經(jīng)手術(shù)病理證實(shí)的GBM;(2)術(shù)前均在我院行常規(guī)MRI檢查,其中包括軸位T2WI;(3)術(shù)后病理學(xué)檢查包括Ki-67增殖指數(shù);(4)磁共振圖像無(wú)明顯干擾分析的偽影;(5)患者術(shù)前無(wú)放化療史。
最終納入GBM患者96例,參考Beesley等[8]的研究將Ki-67表達(dá)水平根據(jù)陽(yáng)性率分為4級(jí):0~4%為0級(jí),5%~24%為1級(jí),25%~49%為2級(jí),50%以上為3級(jí)。本研究根據(jù)Ki-67表達(dá)水平分為低表達(dá)組(0~2級(jí),Ki-67表達(dá)水平<50)和高表達(dá)組(3級(jí),Ki-67表達(dá)水平≥50),其中低表達(dá)組中0~4% 0例;5%~24% 25例;25%~49% 32例,具體分組見(jiàn)表1。
表1 患者臨床信息
所有患者軸位T2WI均在我院采集,具體設(shè)備及參數(shù):德國(guó)Siemens Avanto 1.5 T磁共振掃描儀,掃描參數(shù):TR 4200 ms,TE 109 ms,層厚5 mm,層間距1.5 mm,矩陣384×241,F(xiàn)OV 23 cm×23 cm;德國(guó)Siemens Trio Tim 3.0 T磁共振掃描儀,掃描參數(shù):TR 4000 ms,TE 113 ms,層厚5 mm,層間距1.5 mm,矩陣256×256,F(xiàn)OV 22 cm×22 cm;德國(guó)Siemens Skyra(DE)3.0 T磁共振掃描儀,掃描參數(shù):TR 4000 ms,TE 120 ms,層厚5 mm,層間距1.5 mm,矩陣384×384,F(xiàn)OV 24 cm×24 cm;美國(guó)GE Optima MR360 1.5 T磁共振掃描儀,掃描參數(shù):TR 3800 ms,TE 100 ms,層厚5 mm,層間距1.5 mm,矩陣256×256,F(xiàn)OV 24 cm×24 cm。
1.3.1 圖像分割和特征提取
本研究選取T2WI軸位圖像進(jìn)行感興趣區(qū)(region of interest,ROI)勾畫,由1名經(jīng)驗(yàn)豐富的放射科醫(yī)生使用開源的ITK-SNAP 3.8.0 (www.itksnap.org)軟件對(duì)圖像進(jìn)行處理,在每個(gè)層面沿病灶邊緣人工勾畫二維ROI,得到感興趣體積(volume of interest,VOI)(圖1),另一名高年資影像醫(yī)師檢查勾畫結(jié)果,遇到意見(jiàn)不一致的情況需經(jīng)二者協(xié)商,直到他們就每個(gè)軸向T2WI上瘤體區(qū)域達(dá)成一致,最后將得到的VOI圖像以nii.gz格式保存,以進(jìn)行后續(xù)處理。
圖1 ITK-SNAP軟件對(duì)瘤體進(jìn)行圖像分割圖2 63個(gè)特征的最小絕對(duì)收縮與選擇算子系數(shù)曲線,在最佳lambda時(shí)選定的7個(gè)系數(shù)不為0的特征圖3 基于T2WI篩選出的不同特征及其權(quán)重 圖4 基于T2WI的三種機(jī)器學(xué)習(xí)模型ROC曲線
在提取特征前,對(duì)所有圖像進(jìn)行預(yù)處理,預(yù)處理包括圖像歸一化、重采樣和偏置場(chǎng)校正:灰度歸一化使所有MRI圖像像素的灰度值分布在0~255,避免因圖像對(duì)比度不足或像素亮度分布不平衡而對(duì)后續(xù)圖像處理的影響,將不同的掃描設(shè)備和參數(shù)造成的差異最小化,此外將所有患者的MRI圖像重新采樣為1 mm×1 mm×1 mm的均勻體素大小,以進(jìn)行后續(xù)圖像處理;由于掃描儀本身以及掃描過(guò)程中的偏差等因素可導(dǎo)致MRI上的亮度存在差異,因此通過(guò)偏置場(chǎng)校正盡量減少由于不同掃描機(jī)器磁場(chǎng)的變化導(dǎo)致的強(qiáng)度不均勻性。
影像組學(xué)特征的提取通過(guò)Python的pyradiomics模塊實(shí)現(xiàn),提取出的特征包括形態(tài)學(xué)特征、紋理參數(shù)和小波變換特征,紋理參數(shù)包括:一階特征、灰度共生矩陣參數(shù)、灰度游程長(zhǎng)度矩陣參數(shù)、灰度尺寸區(qū)域矩陣、灰度依賴性矩陣參數(shù)。共計(jì)提取出806個(gè)影像組學(xué)參數(shù),包括4個(gè)特征組:14個(gè)形態(tài)學(xué)特征、18個(gè)一階特征、70個(gè)高階特征和704個(gè)小波特征,小波變換特征為原始圖像進(jìn)行8個(gè)方向的小波變換后(在三個(gè)維度中的每一個(gè)中應(yīng)用高通或低通濾波器的所有可能組合),對(duì)除形態(tài)學(xué)特征以外(形態(tài)特征只能在原始圖像提取)的特征重新提取,對(duì)腫瘤進(jìn)行多維全面的量化,重新提取的特征參數(shù)與原始圖像提取的特征類別相同。
特征定義和計(jì)算算法可在PyRadiomics官網(wǎng)中找到(https://pyradiomics.readthedocs.io/en/latest/features.html)。
1.3.2 影像組學(xué)特征的篩選
所有數(shù)據(jù)按照70%∶30%的比例分為訓(xùn)練組和測(cè)試組,訓(xùn)練組用來(lái)進(jìn)行特征篩選和建立影像組學(xué)模型,測(cè)試組的數(shù)據(jù)用來(lái)對(duì)建立的模型進(jìn)行驗(yàn)證。
特征篩選過(guò)程:將獲得自T2WI的所有影像組學(xué)特征導(dǎo)入Python 3.8軟件中,首先對(duì)數(shù)據(jù)組進(jìn)行標(biāo)記,Ki-67低表達(dá)組標(biāo)記為“0”,高表達(dá)組標(biāo)記為“1”,并對(duì)數(shù)據(jù)集中所有的特征變量進(jìn)行標(biāo)準(zhǔn)化處理,然后通過(guò)t檢驗(yàn)剔除兩組參數(shù)間差異無(wú)統(tǒng)計(jì)學(xué)意義的參數(shù),最后通過(guò)最小絕對(duì)收縮與選擇算子(least absolute shrinkage and selection operator,LASSO)進(jìn)行進(jìn)一步的篩選。
1.3.3 影像組學(xué)模型訓(xùn)練及驗(yàn)證
影像組學(xué)模型的建立通過(guò)Python(3.8.0)和機(jī)器學(xué)習(xí)庫(kù)scikit-learn(23.0)實(shí)現(xiàn),通過(guò)特征篩選后訓(xùn)練組的數(shù)據(jù)分別對(duì)隨機(jī)森林(random forest,RF)、Logistic回歸和支持向量機(jī)(support vector machine,SVM)三種常用的機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練并建立相應(yīng)的影像組學(xué)模型,測(cè)試組的數(shù)據(jù)用于對(duì)訓(xùn)練好的模型進(jìn)行驗(yàn)證,最后的結(jié)果以準(zhǔn)確度、敏感度、特異度、AUC表示。
1.3.4 統(tǒng)計(jì)學(xué)方法
臨床資料的統(tǒng)計(jì)學(xué)分析采用SPSS 24.0軟件,計(jì)量資料以(±s)表示,通過(guò)Kolmogorov-Smirnov test檢驗(yàn)數(shù)據(jù)是否符合正態(tài)分布,組間比較采用t檢驗(yàn)或Mann-Whitney檢驗(yàn),分類資料采用χ2檢驗(yàn)。在所有統(tǒng)計(jì)結(jié)果中,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
ROC曲線分析評(píng)估影像組學(xué)模型的診斷效能,以準(zhǔn)確度、敏感度、特異度和AUC值表示。0.5≤AUC值<0.7時(shí)模型診斷價(jià)值較低,0.7≤AUC值<0.9時(shí)模型診斷價(jià)值中等,AUC值≥0.9時(shí)模型診斷價(jià)值較高。
Ki-67低表達(dá)組和高表達(dá)組的年齡、性別差異均無(wú)統(tǒng)計(jì)學(xué)意義。
通過(guò)t檢驗(yàn)共篩選出63個(gè)特征,進(jìn)一步通過(guò)LASSO回歸篩選出7個(gè)特征(圖2),經(jīng)過(guò)特征篩選后得到的7個(gè)特征包括一階特征2個(gè),灰度共生矩陣(gray-level co-occurrence matrix,GLCM)特征1個(gè),灰度相關(guān)矩陣(gray level dependence matrix,GLDM)特征3個(gè),灰度區(qū)域大小矩陣(gray-level size zone matrix,GLSZM)特征1個(gè),具體特征名、特征權(quán)重見(jiàn)圖3。wavelet-LHL_firstorder_InterquartileRange代表原始圖像經(jīng)過(guò)小波變換提取的一階特征中的InterquartileRange特征。
三種影像組學(xué)模型的準(zhǔn)確度、敏感度、特異度與AUC,具體數(shù)值見(jiàn)表2,繪制的ROC曲線見(jiàn)圖4。
表2 機(jī)器學(xué)習(xí)ROC分析結(jié)果Tab.2 ROC analysis of machine learning methods
Ki-67是一種細(xì)胞增殖的生物標(biāo)志物,在中樞神經(jīng)系統(tǒng)腫瘤的常規(guī)分級(jí)和預(yù)后分析中應(yīng)用廣泛[9],隨著膠質(zhì)瘤分級(jí)的增高,Ki-67表達(dá)水平也明顯升高[10],多項(xiàng)研究證實(shí),不同Ki-67增殖指數(shù)表達(dá)水平的腫瘤在細(xì)胞增殖、細(xì)胞分化、亞克隆區(qū)組成等方面存在顯著差異[11-13],這些差異隱含在醫(yī)學(xué)圖像中人眼無(wú)法識(shí)別的圖像紋理特征(如像素值、灰度和復(fù)雜性等)中。
自2012年影像組學(xué)的概念提出以來(lái),高通量紋理分析作為一種新技術(shù)被應(yīng)用到腫瘤診斷的研究中,既往的研究顯示了影像組學(xué)在預(yù)測(cè)不同類型腫瘤Ki-67表達(dá)水平的良好應(yīng)用前景,Liang等[14]分別通過(guò)T2WI和增強(qiáng)掃描圖像建立預(yù)測(cè)乳腺癌Ki-67表達(dá)水平的影像組學(xué)模型,結(jié)果T2WI影像組學(xué)模型對(duì)Ki-67表達(dá)水平顯示出良好的識(shí)別力,AUC為0.74;Gu等[15]通過(guò)CT圖像建立了6種影像組學(xué)模型對(duì)非小細(xì)胞肺癌Ki-67表達(dá)水平進(jìn)行預(yù)測(cè),其中RF模型效能最高,AUC為0.78;Wu等[16]研究了CT圖像影像組學(xué)特征評(píng)估肝細(xì)胞癌Ki-67表達(dá)水平的能力,AUC為0.78~0.84。
本研究基于T2WI建立了三種影像組學(xué)模型對(duì)膠質(zhì)母細(xì)胞瘤Ki-67表達(dá)水平進(jìn)行預(yù)測(cè),最后結(jié)果顯示RF模型的診斷能力最好,準(zhǔn)確度、敏感度和AUC均最高,但整體診斷效能仍屬于中等;Logistic回歸模型的診斷效能在三種模型中最低,SVM模型的診斷效能介于RF和Logistic回歸之間;在本研究建立的不同類型的機(jī)器學(xué)習(xí)分類器中,不同的分類器表現(xiàn)出不同的預(yù)測(cè)性能,AUC在0.63~0.72之間,說(shuō)明分類器模型類型的選擇對(duì)結(jié)果有影響。其中,RF分類器在準(zhǔn)確度、特異度和AUC方面優(yōu)于其他類型的分類器。從方法論的角度看,RF是一組決策樹,決策樹的機(jī)制可以利用不同的特征進(jìn)行補(bǔ)償,多個(gè)弱樹分類器可以組合成強(qiáng)分類器。因此,一組決策樹即使基于弱特征集也能產(chǎn)生很好的分類結(jié)果[15]。其他的一些研究[15,17-18]也表明,RF模型的性能優(yōu)于其他分類器,這與我們的結(jié)果是一致的。Logistic回歸是機(jī)器學(xué)習(xí)中常用的經(jīng)典分類方法之一,主要用于解決分類問(wèn)題,結(jié)果容易受數(shù)據(jù)質(zhì)量的影響[19],在本項(xiàng)研究中,診斷效能不及另外兩種模型,但其結(jié)果的可解釋性較好,因此也有一定的臨床應(yīng)用價(jià)值。SVM是一種強(qiáng)大和有效的機(jī)器學(xué)習(xí)分類器,主要應(yīng)用于神經(jīng)成像和分子生物學(xué)領(lǐng)域,在小樣本情況的機(jī)器學(xué)習(xí)問(wèn)題中應(yīng)用較廣泛,在劉哲等[19]鑒別膠質(zhì)瘤和腦轉(zhuǎn)移瘤的研究中,SVM模型的效果優(yōu)于Logistic回歸和樸素貝葉斯,但Ma等[20]在乳腺癌預(yù)測(cè)Ki-67表達(dá)水平的研究中,樸素貝葉斯模型優(yōu)于SVM模型,這可能與不同腫瘤的生物學(xué)行為及數(shù)據(jù)的選取有關(guān)。
3.3.1 無(wú)創(chuàng)性手段避免了臨床活檢
Ki-67表達(dá)水平對(duì)腫瘤的診斷、治療及預(yù)后具有重要指導(dǎo)作用,目前Ki-67指標(biāo)的獲取依賴組織病理活檢,反復(fù)活檢不僅有創(chuàng)而且容易產(chǎn)生抽樣誤差,通過(guò)組學(xué)模型預(yù)測(cè)Ki-67表達(dá)水平彌補(bǔ)了傳統(tǒng)病理活檢有創(chuàng)性、存在抽樣誤差和臨床難以獲得滿意數(shù)據(jù)等局限性,同時(shí)可以作為腫瘤的長(zhǎng)期隨訪手段為腫瘤的診治提供指導(dǎo),雖然本研究中基于T2WI建立的影像組學(xué)模型的診斷效能中等,但提示了該方法的可行性,同時(shí)本研究也顯示了通過(guò)不同的機(jī)器學(xué)習(xí)模型構(gòu)建的影像組學(xué)模型診斷效能的差異,之后通過(guò)其他機(jī)器學(xué)習(xí)方法,如神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)方法結(jié)合大樣本有可能得到更加有價(jià)值的結(jié)果,為無(wú)創(chuàng)性評(píng)估膠質(zhì)母細(xì)胞瘤患者Ki-67表達(dá)水平提供一種穩(wěn)定、可行的方法。
3.3.2 符合臨床實(shí)際需求
(1)本研究選擇了T2WI進(jìn)行特征提取,T2WI作為常規(guī)MRI掃描序列廣泛應(yīng)用中樞神經(jīng)系統(tǒng)腫瘤的診斷中,避免了部分腎功能不全和過(guò)敏體質(zhì)患者使用增強(qiáng)掃描的限制,同時(shí)也方便部分缺少功能MRI掃描序列的醫(yī)療機(jī)構(gòu)的應(yīng)用。(2)T2WI對(duì)腫瘤內(nèi)部的壞死、囊變等更為敏感,有研究顯示T2WI可在一定程度上反映腫瘤的惡性程度,Schieda等[21]發(fā)現(xiàn)T2WI信號(hào)增強(qiáng)提示前列腺癌級(jí)別較高,此外,Jha等[22]的一項(xiàng)研究發(fā)現(xiàn)T2WI上信號(hào)強(qiáng)度的增強(qiáng)與肝細(xì)胞癌生長(zhǎng)的增加有關(guān),這可能預(yù)示著更具侵襲性的腫瘤生物學(xué)行為。(3)實(shí)際工作中,患者的檢查圖像大多由不同機(jī)器采集,因此本研究收集了不同掃描機(jī)器的MR圖像,通過(guò)偏置場(chǎng)校正、重采樣等預(yù)處理,提高了結(jié)果的泛化性。
除回顧性研究的局限性以外,還有以下幾點(diǎn)不足:(1)目前多中心合作的驗(yàn)證發(fā)展尚不完善,因此本研究缺少多中心對(duì)照試驗(yàn)。(2)未對(duì)ROI的勾畫進(jìn)行一致性檢驗(yàn),但勾畫結(jié)果由另一名高年資醫(yī)生進(jìn)行了復(fù)核。(3)本次研究?jī)H包含膠質(zhì)母細(xì)胞瘤,未對(duì)其他病理類型的膠質(zhì)瘤進(jìn)行研究。未來(lái)研究方向:探究對(duì)不同級(jí)別的膠質(zhì)瘤Ki-67表達(dá)水平預(yù)測(cè)的可行性,以及對(duì)其他生物標(biāo)志物的預(yù)測(cè);此外,增加樣本量和外部驗(yàn)證以提高結(jié)果的可信度也是未來(lái)研究的方向。
綜上所述,本次研究中雖然基于T2WI的影像組學(xué)模型對(duì)Ki-67表達(dá)水平預(yù)測(cè)效率中等,但與其他常規(guī)或功能性MRI序列相結(jié)合,可能會(huì)為評(píng)估腫瘤的增殖行為提供有價(jià)值的幫助。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。