廖天雙,陳東,李操,何如,劉思耘,陳光祥
腦膜瘤起源于蛛網(wǎng)膜粒帽細胞,是最常見的顱內(nèi)腦外腫瘤。在成年人中約占中樞神經(jīng)系統(tǒng)腫瘤的30%,而在兒童和青少年中則很少見(0.4%~4.6%)[1]。根據(jù)2016年WHO中樞神經(jīng)系統(tǒng)腫瘤分類,將腦膜瘤分為Ⅰ-Ⅲ級,以反映其組織學(xué)特征以及復(fù)發(fā)率和臨床預(yù)后情況[2]。腦膜瘤的病理級別越高,越容易復(fù)發(fā),不同級別腦膜瘤的治療方式也存在差異。
MRI是術(shù)前診斷腦膜瘤的重要手段,對腦膜瘤病理分級的判斷有一定價值,但當腦膜瘤缺乏典型影像特征時,對其病理分級的預(yù)測非常困難。影像組學(xué)利用自動化高通量的特征提取算法,可從影像圖中獲取肉眼無法辨別的腫瘤內(nèi)部特征,量化評估腫瘤整體的異質(zhì)性,能更全面地反映腫瘤的病理特征。本研究旨在探討基于多序列MRI的影像組學(xué)模型預(yù)測腦膜瘤病理分級的價值。
搜集2015年1月-2019年9月在西南醫(yī)科大學(xué)附屬醫(yī)院行頭顱MRI檢查并符合本研究要求的215例腦膜瘤患者的臨床和影像資料。其中,低級別(Ⅰ級)腦膜瘤174例,高級別(Ⅱ級34例+Ⅲ級7例)腦膜瘤41例。按照7∶3的比例,采用隨機分層抽樣方法將215例患者分為訓(xùn)練組(149例)和驗證組(66例)。
納入標準:病理證實為腦膜瘤且有腦膜瘤病理分級結(jié)果;在同一磁共振機上行T2WI、DWI和對比增強T1WI掃描;MRI圖像質(zhì)量好,無偽影干擾;所有序列的圖像在患者接受手術(shù)治療前10天內(nèi)采集。
使用Philips 1.5T磁共振機和標準頭部正交線圈。所有患者術(shù)前行T2WI、DWI和對比增強T1WI檢查。掃描序列和參數(shù)如下。①橫軸面SE T1WI:TR 490~1000 ms,TE 13~20 ms,層厚5.0 mm,層間距1.0 mm,視野240 mm×240 mm,矩陣256×256;②橫軸面TSE T2WI:TR 3000~4400 ms,TE 80~110 ms,層厚5.0 mm,層間距1.0 mm,視野240 mm×240 mm,矩陣256×256;③橫軸面SE-EPI DWI:TR 2300~2900 ms,TE 74~87 ms,b=0、1000 s/mm2,層厚5.0 mm,層間距1.0 mm,視野240 mm×240 mm,矩陣128×128;④對比增強T1WI:對比劑使用Gd-DTPA,經(jīng)肘靜脈注射,劑量0.1 mmol/kg, 注射流率1.0 mL/s,其它掃描參數(shù)同T1WI。
從PACS系統(tǒng)中導(dǎo)出所有患者的圖像并以DICOM格式導(dǎo)入ITP-SNAP軟件。分別在T2WI、DWI和對比增強T1WI圖像上逐層手動勾畫腫瘤的邊界,提取出整個腫瘤的體積作為感興趣區(qū)。在勾畫的過程中,沿腫瘤邊緣內(nèi)側(cè)1~2 mm處劃線,盡可能包括腫瘤內(nèi)的所有成份,包括囊變、出血等,注意避開病灶周圍的水腫區(qū)及血管,如腫瘤境界不清晰,則參考其它能清晰顯示腫瘤邊界的序列進行勾畫(圖1)。采用AK軟件V3.1.0.R提取病灶的六大類共396個影像組學(xué)特征,包括直方圖(histogram)、形態(tài)學(xué)(form factor)、紋理(texture)、灰度共生矩陣(gray level co-occur-rence matrix,GLCM)特征、Haralick、灰度游程矩陣(gray run length matrix,GLRLM)及灰度區(qū)域大小矩陣(gray-level size zone matrix,GLSZM)特征。
圖1 腫瘤三維ROI提取過程示意圖。
訓(xùn)練組數(shù)據(jù)用于影像組學(xué)特征的選擇及模型的建立,驗證組數(shù)據(jù)用于評估模型的預(yù)測效能。在特征選擇前,首先采用中位數(shù)填補缺失數(shù)據(jù),并對特征數(shù)據(jù)進行標準化。然后使用Spearman相關(guān)分析,計算影像組學(xué)特征間的相關(guān)系數(shù)r,設(shè)置閾值為0.9,去除|r|>0.9的高相關(guān)特征。最后采用多元logistic回歸算法對特征進行降維并構(gòu)建影像組學(xué)標簽。最后再采用logistic回歸分析對前述步驟獲得的3個單獨序列的影像組學(xué)標簽進行綜合分析,構(gòu)建綜合3個序列的多序列影像組學(xué)標簽。
采用受試者操作特征(ROC)曲線來評價影像組學(xué)模型的預(yù)測性能,計算曲線下面積(area under the curve,AUC)及相應(yīng)的診斷符合率、敏感度及特異度。
使用SPSS 25.0軟件進行統(tǒng)計學(xué)分析。對兩組間患者性別的比較采用χ2檢驗;對患者的年齡進行正態(tài)性和方差齊性檢驗后,采用獨立樣本t檢驗進行組間比較。使用R軟件進行Spearman相關(guān)分析和多因素logistic回歸分析,對AK軟件提取的各個序列的特征參數(shù)分別進行降維,獲得鑒別診斷效能最佳的特征參數(shù),然后進行多因素logistic回歸分析,建立預(yù)測模型,最后通過R軟件繪制其ROC曲線。所有統(tǒng)計學(xué)結(jié)果以P<0.05為差異具有統(tǒng)計學(xué)意義。
本研究中,低級別腦膜瘤組共174例,男45例、女129例,平均年齡(54.0±10.2)歲;高級別組共41例,男14例、女27例,平均年齡(55.3±14.0)歲。兩組之間年齡和性別構(gòu)成的差異均無統(tǒng)計學(xué)意義(t=-0.529,P=0.559;χ2=1.144,P=0.285)。
訓(xùn)練組和驗證組中腦膜瘤病理分級情況見表1。
表1 訓(xùn)練組和驗證組病例數(shù)分布
分別基于T2WI、DWI和對比增強T1WI單序列圖像上提取的影像組學(xué)特征建立的3個腦膜瘤病理分級預(yù)測模型中,基于對比增強T1WI的影像組學(xué)模型的診斷效能最高?;?個序列構(gòu)建的聯(lián)合模型,其診斷效能較基于增強T1WI的預(yù)測模型略有提高,詳見表2、圖2。
圖2 各預(yù)測模型的 ROC 曲線。a)為各預(yù)測模型在訓(xùn)練組的ROC曲線;b)為各預(yù)測模型在驗證組的ROC曲線。黑線為基于3個序列聯(lián)合影像組學(xué)模型的ROC曲線;藍線為基于增強T1WI的影像組學(xué)模型的ROC曲線;黃線為基于T2WI影像組學(xué)模型的ROC曲線;綠線代表基于DWI影像組學(xué)模型的ROC曲線。
表2 基于單序列及聯(lián)合預(yù)測模型的診斷效能
腦膜瘤是常見的顱內(nèi)間葉組織起源腫瘤,通過影像學(xué)方法評估腦膜瘤病理級別對臨床決策有著積極的意義。目前,CT和MRI是腦膜瘤診斷和監(jiān)測最常用的影像診斷方法,但高、低級別腦膜瘤有時會表現(xiàn)出相似的影像學(xué)特征,常導(dǎo)致常規(guī)MRI不能準確判斷腦膜瘤的高、低級別。影像組學(xué)利用自動化高通量的特征提取算法,可客觀量化評估腫瘤整體異質(zhì)性,近年來引起了廣泛關(guān)注。因此本研究采用基于多序列MR圖像的影像組學(xué)模型預(yù)測腦膜瘤的病理級別。
近年來,有國內(nèi)外學(xué)者嘗試通過提取MR圖像上腦膜瘤的紋理特征,用影像組學(xué)方法來量化醫(yī)學(xué)圖像上潛在的信息,從而鑒別腦膜瘤高低級別。在虞芯儀等[3]的研究中,基于常規(guī)MRI圖像進行紋理分析,結(jié)果顯示T2WI、FLAIR和ADC圖像上提取的標準差、ADC和FLAIR圖像上的偏度、對比增強T1WI、T2WI、FLAIR和ADC圖像上的熵,在高低級別腦膜瘤組間的差異具有統(tǒng)計學(xué)意義(P<0.05),而且聯(lián)合4個序列的熵值對預(yù)測腦膜瘤分級的效能最佳,AUC可達0.799。類似地,張媛等[4]對多參數(shù)MR圖像進行紋理分析,結(jié)果顯示ADC圖像上的偏度值、T2WI和ADC圖像上的熵值對腦膜瘤病理分級有較強的預(yù)測能力,而且三者聯(lián)合時的AUC值可高達0.84 。國外學(xué)者Park等[5]通過分析基于增強T1WI的影像組學(xué)特征,發(fā)現(xiàn)腦膜瘤級別不同,其影像組學(xué)特征值不同,高級別腦膜瘤有較高的熵、相異度和粗糙度,而游程長度均勻性較低。類似地,Laukamp等[6]分析了多個序列MR圖像上腦膜瘤的影像組學(xué)特征,發(fā)現(xiàn)FLAIR圖像上病灶的形態(tài)學(xué)特征中的圓度、FLAIR和增強T1WI圖像上灰度集簇陰影、DWI和ADC圖像上的灰度不均勻性、FLAIR和增強T1WI圖像上的灰度能量,這4個影像組學(xué)特征預(yù)測腦膜瘤病理級別的診斷效能最高,這些特征的聯(lián)合診斷模型區(qū)分Ⅰ級與Ⅱ級腦膜瘤的AUC可高達0.91。由此可見,影像組學(xué)特征可用于預(yù)測腦膜瘤的病理分級,且影像組學(xué)特征聯(lián)合模型預(yù)測效能更佳。需要指出的是,上述這些學(xué)者的研究結(jié)果均顯示出基于MR各序列的影像組學(xué)模型及多參數(shù)聯(lián)合模型對腦膜瘤病理分級具有一定的預(yù)測價值,但這些研究中均未設(shè)立驗證組對模型的診斷效能進行驗證,也缺少對模型的客觀評價。
本研究基于多序列MR圖像建立的腦膜瘤病理分級預(yù)測模型在訓(xùn)練組和驗證組均表現(xiàn)良好。由于各序列圖像上所提取的影像組學(xué)特征有一定差異,建立的預(yù)測模型的診斷效能也不同。在本研究中的單序列模型中,基于增強T1WI建立的影像組學(xué)預(yù)測模型的預(yù)測性能最高,其在訓(xùn)練組的AUC值為0.942,明顯高于基于T2WI及DWI 預(yù)測模型的AUC值(分別為0.746和0.714);而基于增強T1WI的影像組學(xué)預(yù)測模型在驗證組中的AUC值也明顯高于T2WI和DWI(分別為0.913、0.714、0.705)。本研究結(jié)果與既往的研究結(jié)果基本一致[7]?;贒WI的影像組學(xué)模型的符合率相對較差,這可能與DWI序列的失真效應(yīng)有關(guān),因腦膜瘤多位于大腦凸面和顱底,鄰近骨質(zhì)和鼻竇造成的異質(zhì)磁場可能導(dǎo)致DWI圖像上局部結(jié)構(gòu)變形,從而影響對腫瘤的顯示和識別。
本研究結(jié)果顯示,對于預(yù)測腦膜瘤的病理級別,基于多序列MRI的聯(lián)合模型在訓(xùn)練組及驗證組中的AUC值分別為0.950和0.923,AUC值高于基于單序列的預(yù)測模型,此結(jié)果與既往的研究結(jié)果相似[8]。這可能是因為與單序列模型相比,多序列MRI聯(lián)合模型是由來自三個序列的數(shù)據(jù)所構(gòu)建,包含的信息更多,能更充分、準確地反映腫瘤內(nèi)部的特征。但在本研究中,基于多序列MRI聯(lián)合預(yù)測模型的預(yù)測性能較基于增強T1WI的影像組學(xué)模型差別不大,可能是由于在三個序列圖像上所選擇的影像組學(xué)特征中,T1WI增強圖像上保留的特征占了絕大部分,對模型預(yù)測性能起主要作用。在Hamerla等[9]利用影像組學(xué)預(yù)測腦膜瘤病理級別的研究中,嘗試了隨機森林(random forest,RF)、極端梯度增強(extreme gradient boosting,XGBoost)、支持向量機(support vector machine,SVM)和多層感知器(multilayer perceptron,MLP)四種分類器,并對所構(gòu)建的不同分類器進行比較,構(gòu)建出預(yù)測效能最佳的多參數(shù)MRI影像組學(xué)模型,其AUC高達0.97 ,高于筆者研究中的多參數(shù)MRI聯(lián)合模型,這可能與該研究組合了更多MR序列的影像組學(xué)特征以及分類器選擇不同有關(guān)。Yan等[10]基于增強T1WI提取了形態(tài)學(xué)特征和紋理特征參數(shù),并分別基于形態(tài)學(xué)特征、紋理特征、形態(tài)學(xué)特征聯(lián)合紋理特征,并分別采用邏輯回歸(logistic regression,LR)、樸素貝葉斯(naive Bayes,NB)和SVM方法來構(gòu)建腦膜瘤分級預(yù)測模型,并對這3個模型的預(yù)測效能進行比較,發(fā)現(xiàn)形態(tài)學(xué)特征聯(lián)合紋理特征的SVM分類器具有最佳的預(yù)測性能。這項研究為以后分類模型的選擇提供了依據(jù)。鄭茜等[11]比較了常規(guī)影像特征模型與影像組學(xué)特征模型對腦膜瘤病理分級的預(yù)測性能,也證實了影像組學(xué)分析在腦膜瘤病理分級中具有較高的應(yīng)用價值。
本研究存在一定的局限性:第一,由于高級別腦膜瘤的發(fā)病率相對較低,因此腦膜瘤分級中的數(shù)據(jù)不均衡,高級別腦膜瘤的病例數(shù)較少;第二,本研究中采用手動方法來分割腫瘤,雖然手動分割可能比自動方法更準確,但由于部分病灶邊界判定困難,分割不準確的問題仍然不能完全避免;第三,本研究僅使用邏輯回歸分類算法建立影像組學(xué)預(yù)測模型,并沒有嘗試構(gòu)建其它常用的分類模型,如支持向量機、隨機森林和卷積神經(jīng)網(wǎng)絡(luò)等。但是,本研究的目的在于驗證影像組學(xué)模型可以用于準確鑒別腦膜瘤的病理級別,以及如何選擇合適的MRI序列來建立影像組學(xué)模型使得預(yù)測性能更佳,而不是為了比較各種分類算法的優(yōu)劣。
綜上所述,基于多參數(shù)MRI數(shù)據(jù)的影像組學(xué)模型可用于術(shù)前預(yù)測腦膜瘤的病理級別,為臨床制訂個性化的治療策略提供客觀依據(jù)。