楊洪安,張景潤(rùn),王家興,黃繼藍(lán),譚永明,吳主強(qiáng)
垂體腺瘤(pituitary adenoma,PA)是具有侵襲性和復(fù)發(fā)傾向的神經(jīng)內(nèi)分泌腫瘤,也是最常見的顱內(nèi)腫瘤,約占所有顱內(nèi)腫瘤的15%~20%[1-3]。其復(fù)發(fā)被定義為瘤體切除術(shù)后已消失的癥狀體征再次出現(xiàn),內(nèi)分泌指標(biāo)達(dá)到緩解標(biāo)準(zhǔn)后再次升高,影像學(xué)檢查再次出現(xiàn)腫瘤生長(zhǎng)[4]。大多數(shù)患者手術(shù)預(yù)后良好,但部分PA侵襲周圍結(jié)構(gòu),造成不易全切、術(shù)后易復(fù)發(fā),稱為侵襲性垂體腺瘤(invasive PA,IPA)[5,6]。據(jù)報(bào)道,鞍外殘留組織患者中有53%在5年內(nèi)出現(xiàn)術(shù)后復(fù)發(fā),80%在10年內(nèi)出現(xiàn)術(shù)后復(fù)發(fā)[7-9]。然而,即使在完全手術(shù)切除的情況下,10年后的長(zhǎng)期復(fù)發(fā)率也很高,約為7%~12%[7,9]。
有研究分析經(jīng)鼻蝶骨手術(shù)治療后腫瘤復(fù)發(fā)或進(jìn)展的相關(guān)臨床與影像因素,并建立預(yù)測(cè)腫瘤預(yù)后的Nomogram[10,11],但是結(jié)果或與影像科醫(yī)生的診斷水平密切相關(guān)[12],并不能高效指導(dǎo)術(shù)前治療決策。因此為降低PA復(fù)發(fā),迫切需要建立術(shù)前精準(zhǔn)治療決策和預(yù)測(cè)的客觀評(píng)價(jià)體系來幫助臨床制定術(shù)前個(gè)性化決策和規(guī)劃術(shù)后輔助治療。
影像組學(xué)能從復(fù)雜的臨床資料陣列中提煉大量定量特征,然后將其轉(zhuǎn)換為高維數(shù)據(jù),隨后可對(duì)其進(jìn)行挖掘,以發(fā)現(xiàn)其與腫瘤組織學(xué)特征的相關(guān)性[13,14],為精準(zhǔn)醫(yī)學(xué)提供信息、促進(jìn)個(gè)性化醫(yī)療和輔助臨床決策[15,16]。影像組學(xué)已被應(yīng)用于預(yù)測(cè)Ki-67增殖指數(shù)、術(shù)前預(yù)測(cè)PA海綿竇侵襲、預(yù)測(cè)PA亞型[17-23]。同時(shí)也有少量研究應(yīng)用放射組學(xué)的方法從MRI序列中提取特征進(jìn)行相關(guān)處理,并結(jié)合臨床、生化指標(biāo)及影像學(xué)表現(xiàn)等相關(guān)風(fēng)險(xiǎn)因素建立機(jī)器學(xué)習(xí)模型,預(yù)測(cè)PA術(shù)后的復(fù)發(fā)或進(jìn)展[20,24,25]。然而,少有人利用多序列MRI中提取的特征建立影像組學(xué)評(píng)分(R-score),并將其與臨床-病理-影像相關(guān)的獨(dú)立危險(xiǎn)因素結(jié)合構(gòu)建可視化的邏輯回歸模型——Nomogram。與此同時(shí),以往預(yù)測(cè)PA復(fù)發(fā)的機(jī)器學(xué)習(xí)模型研究很少納入增殖或轉(zhuǎn)錄因子、超微結(jié)構(gòu)亞型以及某些基因的表達(dá)譜[10,11,26]。本研究首次將相關(guān)病理特征(如Ki-67、p53等)納入研究范圍,擬聯(lián)合多序列MRI的R-score,并結(jié)合能夠獨(dú)立預(yù)測(cè)PA復(fù)發(fā)風(fēng)險(xiǎn)的臨床病理學(xué)和影像特征,旨在建立高效準(zhǔn)確的預(yù)后預(yù)測(cè)模型,為指導(dǎo)臨床術(shù)前治療決策和預(yù)測(cè)預(yù)后提供有效的工具。
侵襲性PA的術(shù)前診斷依據(jù)主要是頭顱MRI,診斷標(biāo)準(zhǔn)為Knosp分級(jí)[27]和Hardy-Wilson分級(jí)、分期[28]。而最近有研究發(fā)現(xiàn)Knosp分級(jí)能為手術(shù)治愈的預(yù)測(cè)提供了更大的診斷準(zhǔn)確性而入侵Hardy-Wilson分類對(duì)此缺乏實(shí)用性[12]。因此本研究主要選擇Knosp分級(jí)來判斷PA的侵襲。在某些情況下,CT也可以提供有關(guān)鞍基或鞍旁病變的有用的額外信息,如判斷腫瘤是否存在骨質(zhì)破壞的行為[10,29,30]。因此根據(jù)研究需求確定了患者的納入標(biāo)準(zhǔn)如下:①首次接受手術(shù)治療;②術(shù)前有完整的臨床及影像學(xué)資料;③術(shù)后接受病理檢查或免疫組化檢測(cè);④術(shù)后再次接受MRI及CT檢查;⑤術(shù)后有長(zhǎng)期隨訪資料。
根據(jù)上述標(biāo)準(zhǔn),本研究納入2012年6月-2017年6月共128名PA患者的病例資料。男57例,女71例,年齡15~75歲,中位年齡57歲。PA復(fù)發(fā)的患者的中位時(shí)間為12.5月(7~63月)。并根據(jù)復(fù)發(fā)情況和隨訪時(shí)間(5~10年)將患者分為PA復(fù)發(fā)組(RPA,58例)和PA未復(fù)發(fā)組(NRPA,70例)。
所有患者在MRI和CT掃描及常規(guī)實(shí)驗(yàn)室檢查后1個(gè)月內(nèi)接受PA切除術(shù)。結(jié)合實(shí)際診療過程中患者的醫(yī)療記錄,最終收集的術(shù)前實(shí)驗(yàn)室常規(guī)的的臨床病理數(shù)據(jù)包括:患者的年齡、性別、是否存在頭痛的癥狀、有無內(nèi)分泌功能、Ki-67指數(shù)、p53、CD117、CK(表1)。
表1 RPA組和NRPA組患者臨床病理特征的風(fēng)險(xiǎn)分析
MRI圖像由兩名放射科主治醫(yī)師(工作經(jīng)歷7年)評(píng)估,并在有分歧的情況下與第三名副主任醫(yī)師(工作經(jīng)歷15年)討論,并獲得最終結(jié)果。評(píng)估的特征包括:腫瘤體積、腫瘤直徑、術(shù)后檢查中是否發(fā)現(xiàn)殘余腫瘤、Knosp分級(jí)、PA是否具有侵襲性、是否存在骨質(zhì)破壞、視交叉是否受壓移位(表2)。
表2 RPA組和NRPA組患者影像學(xué)特征的風(fēng)險(xiǎn)分析
術(shù)前采用Siemens MAGNETOM Avanto1.5T(n=52)和Siemens Magnetom Trio Tim System 3.0T(n=56)MR儀掃描垂體,八通道頭部線圈。掃描序列包括冠狀面和矢狀面T1WI、冠狀面T2WI,然后靜脈注射0.1 mmol/kg的釓噴酸葡胺(馬根維顯,Gd-DTPA),進(jìn)行垂體小視野的冠狀面和矢狀面T1WI動(dòng)態(tài)對(duì)比增強(qiáng)(contrast enhanced,CE)成像。
首先,對(duì)腫瘤的原始圖像進(jìn)行重采樣、歸一化和離散化處理,使同一序列中的所有圖像都轉(zhuǎn)換為層數(shù)相同、分辨率相同的標(biāo)準(zhǔn)化圖像格式,灰度值限制在μ±SD(μ是感興趣區(qū)中的平均灰度值,SD是灰度值的標(biāo)準(zhǔn)差)。原始圖像數(shù)據(jù)在提取特征前經(jīng)過上述一系列預(yù)處理步驟后,確保了不同掃描儀、掃描方案和患者之間的結(jié)果具有更好的可比性,使結(jié)果具有較高的再現(xiàn)性和廣泛性[31-33]。上述圖像處理是基于Python 3.7.6進(jìn)行的(https://www.python.org)。
對(duì)于腦腫瘤,臨床常規(guī)都是手工對(duì)MR或CT圖像進(jìn)行分割,以便于放療計(jì)劃或治療反應(yīng)的體積評(píng)估[34,35]。因此本研究采用3Dslicer4.11(https://www.slicer.org)軟件對(duì)腫瘤進(jìn)行手工分割,在所有序列圖像的橫截面中勾畫出腫瘤邊界,并利用勾畫出的層重建腫瘤的感興趣區(qū)體積(volume of interest,VOI),旨在建立PA術(shù)前圖像的組學(xué)特征與復(fù)發(fā)之間的精確關(guān)系。病變的圖像分割由兩名接受過標(biāo)準(zhǔn)培訓(xùn)的放射科醫(yī)師進(jìn)行,他們完全不知道患者的臨床病理信息(腫瘤位置除外)。
使用Python 3.7.6中的 pyradiomics包(http://www.radiomics.io/pyradiomics.html)進(jìn)行特征提取。Pyradiomics能自動(dòng)計(jì)算從每個(gè)VOI中提取的放射性特征。而提取出來的放射組學(xué)特征可分為以下幾個(gè)亞組:①形狀特征(n=14);②一階特征(n=18);③灰度共生矩陣特征(n=23);④灰度游程矩陣特征 (n=16);⑤灰度級(jí)大小區(qū)域矩陣特征 (n=16);⑥相鄰灰度差矩陣特征(n=5);⑦灰度依賴矩陣特征(n=14);⑧高階統(tǒng)計(jì)特性:包括經(jīng)小波變換后提取的特征(n=736)和高斯濾波器的拉普拉斯算子變換后提取的特征(n=184)。最終,從每位患者的多序列MRI原始圖像、經(jīng)三維小波濾波器和高斯濾波器變換后的圖像中提取出共3078個(gè)放射組學(xué)特征,包括腫瘤形狀、大小、強(qiáng)度和紋理特征(https://pyradiomics.readthedocs.io/en/latest/index.html)。
首先通過R(版本4.1.2,https://www.r-project.org/)中的irr包計(jì)算組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)來判斷可靠性。在隨后的研究中保留觀察者間 ICC 值大于0.75的放射學(xué)特征。 然后,對(duì)剩下的特征值進(jìn)行歸一化,使不同的特征之間具有可比性。其次,采用獨(dú)立樣本t檢驗(yàn)篩選出兩組間差異有統(tǒng)計(jì)學(xué)意義(P<0.05)的特征,再采用最小冗余最大相關(guān)性(max-relevance and min-redundancy,mRMR)的濾波式的算法進(jìn)行特征篩選,通過最大化所選特征之間的相關(guān)性消除特征之間的冗余。接下來,采用最小絕對(duì)收縮和選擇算法(least absolute shrinkage and selection operator,LASSO)在設(shè)置的10萬迭代次數(shù)內(nèi)找到最優(yōu)的alpha以及其對(duì)應(yīng)最優(yōu)模型與系數(shù),對(duì)特征進(jìn)行進(jìn)一步的篩選。最終篩選出28個(gè)特征(圖1),為這28個(gè)特征建立特征系數(shù)圖來評(píng)估不同特征的權(quán)重及其貢獻(xiàn)度(圖2)。特征系數(shù)圖中部分特征權(quán)重過低,對(duì)于整體的影響小。為了進(jìn)一步提高模型的泛化性能,避免由于特征過多造成擬合的模型過于復(fù)雜而出現(xiàn)過擬合,本研究采用多變量分析從28個(gè)特征中篩選出6個(gè)預(yù)測(cè)PA復(fù)發(fā)的獨(dú)立危險(xiǎn)因素(P<0.05,圖3)。與此同時(shí),臨床病理特征和影像學(xué)特征也需要通過組間差異檢驗(yàn)、單變量和多變量分析進(jìn)行篩選,選擇的特征(P<0.05)將參與建模。
圖1 放射組學(xué)分析流程圖。
圖2 28個(gè)特征的權(quán)重圖。28個(gè)特征從左到右依次為:log.sigma.1.0.mm.3D_firstorder_Skewness;wavelet.HHH_glcm_InverseVariance.1;wavelet.LHL_firstorder_Mean.1;wavelet.LLL_glcm_MaximumProbability.2;wavelet.HHL_glszm_ZoneEntropy.2;wavelet.HLH_firstorder_Mean.1;original_gldm_LargeDependenceHighGrayLevelEmphasis;wavelet.LHH_glcm_JointAverage.1;wavelet.LLL_glszm_SmallAreaLowGrayLevelEmphasis.1;wavelet.LLH_firstorder_Median.2;log.sigma.3.0.mm.3D_glszm_SizeZoneNonUniformityNormalized.1;wavelet.LLH_firstorder_10Percentile.1;log.sigma.3.0.mm.3D_firstorder_Maximum.1;wavelet.HHH_glszm_LargeAreaEmphasis.2;wavelet.LHL_glszm_SmallAreaLowGrayLevelEmphasis.2;wavelet.LLH_firstorder_Median.1;wavelet.LHH_firstorder_Skewness;wavelet.HHL_firstorder_Median;log.sigma.1.0.mm.3D_glcm_ClusterShade;wavelet.LLL_glcm_Correlation.1;log.sigma.1.0.mm.3D_gldm_SmallDependenceLowGrayLevelEmphasis.1;wavelet.LLL_glszm_SmallAreaLowGrayLevelEmphasis.2;wavelet.LLH_glcm_InverseVariance.1;log.sigma.1.0.mm.3D_glcm_Imc1.1;wavelet.HLH_glszm_SizeZoneNonUniformityNormalized.2;log.sigma.1.0.mm.3D_firstorder_Maximum.1;wavelet.HLL_glcm_Imc2.1;original_shape_Sphericity.1。 圖3 最終篩選后的6個(gè)特征Logistic回歸系數(shù)。 圖4 不同模型預(yù)測(cè)PA復(fù)發(fā)的ROC曲線。a)訓(xùn)練/驗(yàn)證組;b)測(cè)試組。
在訓(xùn)練/驗(yàn)證隊(duì)列中,本研究使用線性支持向量機(jī)模型(linear support vector machine,linear-SVM)、帶rbf核函數(shù)的支持向量機(jī)模型(support vector machine with rbf kernel function,rbf-SVM)、k近鄰模型(k-nearest neighbor,KNN)、邏輯回歸模型(logistic regression,LR)、隨機(jī)森林模型(random forest,RF)和XGBoost(XGBoost,XGB)模型進(jìn)行放射組學(xué)建模。采用五重交叉驗(yàn)證結(jié)合網(wǎng)格搜索技術(shù)來確定每個(gè)機(jī)器學(xué)習(xí)模型的最佳超參數(shù),并利用受試者操作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)來評(píng)判各個(gè)模型的預(yù)測(cè)性能(圖4)。最終在建立的6個(gè)機(jī)器學(xué)習(xí)模型中,結(jié)果顯示linear-SVM的預(yù)測(cè)性能最佳(表3)。為了量化PA患者的復(fù)發(fā)風(fēng)險(xiǎn),將線性SVM模型的輸出轉(zhuǎn)換為概率評(píng)分,并定義為R-score,范圍從0到1。
表3 訓(xùn)練/驗(yàn)證組和測(cè)試組中各個(gè)機(jī)器學(xué)習(xí)模型的預(yù)測(cè)性能
為了給臨床醫(yī)生提供一種定量工具,以預(yù)測(cè)PA術(shù)后的復(fù)發(fā),本研究基于多元邏輯回歸的算法構(gòu)建了聯(lián)合R-score、病理特征及影像學(xué)特征的Nomogram模型(圖5)。對(duì)Nomogram的判別性能進(jìn)行量化。除了AUC計(jì)算外,還進(jìn)行了校準(zhǔn)和Hosmer-Lemeshow試驗(yàn)。通過決策曲線分析(decision curve analysis,DCA)量化不同閾值概率下患者的凈獲益,確定了列線圖的臨床應(yīng)用價(jià)值。
圖5 預(yù)測(cè)PA復(fù)發(fā)的Nomogram聯(lián)合模型。
所有統(tǒng)計(jì)分析均基于Python 3.7.6 (https://www.python.org)、IBM SPSS Statistics 25.0和R(4.1.2,https://www.r-project.org/)。 檢驗(yàn)組間差異時(shí),如果特征為連續(xù)變量,正態(tài)分布采用獨(dú)立樣本t檢驗(yàn),非正態(tài)分布采用Mann-WhitneyU檢驗(yàn); 如果特征是非連續(xù)變量,則采用卡方檢驗(yàn)(每組樣本數(shù)充足)或Fisher精確檢驗(yàn)(任何組樣本數(shù)都不充足)進(jìn)行分析,以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義。每個(gè)模型的性能在一個(gè)獨(dú)立的測(cè)試隊(duì)列中得到驗(yàn)證和評(píng)估,并通過ROC曲線的AUC進(jìn)行量化。 此外,進(jìn)行了校準(zhǔn)和Hosmer-Lemeshow試驗(yàn)。采用“ggplot”軟件包(版本4.1.2)可視化數(shù)據(jù)。
對(duì)臨床病理及影像學(xué)因素分別進(jìn)行單變量分析,以確定與術(shù)后復(fù)發(fā)顯著相關(guān)的因素,發(fā)現(xiàn)年齡≥48歲(P=0.049)、Ki-67≥3%(P=0.033)、腫瘤體積≥10.5 cm3(P=0.005)、腫瘤最大直徑≥4 cm(P=0.0002)和Knosp分級(jí)≥3級(jí)(P=0.011)是腫瘤復(fù)發(fā)的重要危險(xiǎn)因素。再對(duì)臨床病理和影像學(xué)重要危險(xiǎn)因素分別進(jìn)行多變量分析,Ki-67≥3%(P=0.005)和腫瘤最大直徑≥4 cm(P=0.049)被確定為獨(dú)立危險(xiǎn)因素。
MRI多序列的訓(xùn)練和測(cè)試隊(duì)列的PA術(shù)后復(fù)發(fā)預(yù)測(cè)性能評(píng)估見表3。利用篩選后的6個(gè)放射組學(xué)特征構(gòu)建linear-SVM、rbf-SVM、KNN、LR、RF和XGBoost這六個(gè)機(jī)器學(xué)習(xí)模型。根據(jù)在訓(xùn)練集和測(cè)試集中的表現(xiàn),發(fā)現(xiàn)在六個(gè)機(jī)器學(xué)習(xí)模型中,XGBoost和KNN出現(xiàn)了過擬合的現(xiàn)象,因此不予以考慮。在剩下的四個(gè)機(jī)器學(xué)習(xí)模型中,linear-SVM的AUC在訓(xùn)練集(0.887,95%CI:0.817~0.958)和測(cè)試集中(0.863,95%CI:0.728~0.999)均高于rbf-SVM、RF和LR這三個(gè)機(jī)器學(xué)習(xí)模型,提示linear-SVM模型的魯棒性和泛化能力最強(qiáng),預(yù)測(cè)性能最佳。因此,利用放射組學(xué)特征訓(xùn)練linear-SVM時(shí),在Scikit-Learn中設(shè)置probability=True。訓(xùn)練完成后,算法將使用邏輯回歸對(duì)SVM分?jǐn)?shù)進(jìn)行校準(zhǔn)(對(duì)訓(xùn)練數(shù)據(jù)額外進(jìn)行5折交叉驗(yàn)證),從而得到概率值。將每個(gè)患者的預(yù)測(cè)概率值轉(zhuǎn)換為概率得分,并將其作為R-score參與最終的模型構(gòu)建。
通過以上步驟的篩選,以R-score、Ki-67和腫瘤最大直徑作為預(yù)測(cè)因子構(gòu)建最終模型。根據(jù)選定的放射組學(xué)評(píng)分、臨床病理特征和影像學(xué)特征建立了基于多因素Logistic回歸的Nomogram聯(lián)合模型,并分別建立單獨(dú)的放射組學(xué)評(píng)分模型、臨床病理模型和影像學(xué)模型。校準(zhǔn)曲線表明,聯(lián)合模型Nomogram的預(yù)測(cè)輸出與實(shí)際觀察值擬合良好(圖6)。分析各個(gè)模型的預(yù)測(cè)性能,發(fā)現(xiàn)聯(lián)合模型Nomogram在訓(xùn)練集(AUC:0.907,95%CI:0.843~0.972)和測(cè)試集中(AUC:0.883,95%CI:0.769~0.996)都具有最高的AUC,并且敏感度和特異度也最高(圖7,表4)。此外,Hosmer-Lemeshow測(cè)試顯示,訓(xùn)練和測(cè)試子集之間差異沒有統(tǒng)計(jì)學(xué)意義(P>0.05)。DCA通過量化測(cè)試數(shù)據(jù)集中不同閾值概率下的凈獲益來確定單一模型和聯(lián)合模型的臨床實(shí)用性,發(fā)現(xiàn)聯(lián)合Nomogram模型展現(xiàn)出更高的臨床價(jià)值(圖8)。
圖6 預(yù)測(cè)PA復(fù)發(fā)的三種獨(dú)立模型和聯(lián)合Nomogram模型。a)訓(xùn)練/驗(yàn)證組;b)測(cè)試組。 圖7 最終聯(lián)合預(yù)測(cè)模型的校準(zhǔn)曲線。a)訓(xùn)練/驗(yàn)證組;b)測(cè)試組。
圖8 四種模型的臨床決策曲線 。
表4 臨床病理模型、影像學(xué)模型、R-score模型及聯(lián)合模型(Nomogram)預(yù)測(cè)性能的比較
本研究基于多序列MRI構(gòu)建的放射組學(xué)評(píng)分和大量臨床病理資料和影像學(xué)資料建立聯(lián)合Nomogram模型預(yù)測(cè)PA患者術(shù)后復(fù)發(fā),旨在為臨床決策提供有效的工具。
近年來,臨床上多采用術(shù)后病理及免疫組化Ki-67及p53等指標(biāo)來評(píng)價(jià)PA的增殖能力及侵襲性。在有關(guān)PA廣泛的研究中,發(fā)現(xiàn)Ki-67與各種臨床病理學(xué)參數(shù)相關(guān),包括腫瘤亞型、大小、侵襲性和復(fù)發(fā)。在2004版世界衛(wèi)生組織(WHO)分類中,垂體腫瘤被劃分為典型性PA、不典型PA和垂體癌。其中“不典型PA”被定義為侵襲性生長(zhǎng)、有絲分裂指數(shù)升高、Ki-67標(biāo)記指數(shù)>3%且有廣泛的P53表達(dá)[36]。在此之后, 2017版世界衛(wèi)生組織(WHO)關(guān)于垂體腫瘤的分類同樣保留Ki-67和p53作為評(píng)估腫瘤增殖的分子標(biāo)記物,并指出侵襲性行為是影響腫瘤預(yù)后的重要因素[2,37,38]。
研究結(jié)果顯示Ki-67和腫瘤最大直徑是預(yù)測(cè)PA復(fù)發(fā)的獨(dú)立預(yù)測(cè)因素,這與以往研究相仿[4,35,39]。通過多因素邏輯回歸分析建立了基于放射組學(xué)評(píng)分、臨床病理特征、影像學(xué)特征的3個(gè)單獨(dú)模型和一個(gè)聯(lián)合Nomogram模型。在建立的聯(lián)合Nomogram模型中,R-score的影響最大,聯(lián)合Nomogram模型具有最佳的預(yù)測(cè)能力,并與其他單個(gè)因素建立的模型相比具有更高的臨床實(shí)用性。
近來研究發(fā)現(xiàn)DWI在PA術(shù)前診斷和預(yù)測(cè)復(fù)發(fā)也有額外的益處[40-42]。然而,在臨床實(shí)踐中,DWI圖像偽影大、局部解剖復(fù)雜,在描繪病變方面并不可靠。因此本研究仍然選擇常規(guī)使用的序列作為研究序列進(jìn)行后續(xù)分析處理。
本研究中用于構(gòu)建R-score的特征來源于T2WI、T1WI和CE-T1WI三個(gè)序列的MRI圖像。Dai等[43]的研究指出,利用紋理特征和二維分割的單序列MR圖像中提取的特征并不全面,更多的機(jī)器學(xué)習(xí)模型和特征選擇算法以及包括對(duì)比增強(qiáng)MRI掃描在內(nèi)的更全面的數(shù)據(jù)可能具有開發(fā)更好的機(jī)器學(xué)習(xí)模型的潛力。因此在研究中,將原始的MR圖像進(jìn)行小波變換和拉普拉斯變換。這樣的圖像變換能分離出高頻和低頻的空間信息。然后在原始圖像和經(jīng)變換的圖像中提取經(jīng)過二維和三維分割的直方圖特征和紋理特征。與此同時(shí),使用t-test、mRMR和LASSO這三種特征篩選與降維的方法選擇出28個(gè)特征。但在后續(xù)利用篩選出來的28個(gè)特征進(jìn)行建模時(shí),發(fā)現(xiàn)在建立的六個(gè)機(jī)器學(xué)習(xí)模型中均存在過擬合的現(xiàn)象,即模型在訓(xùn)練集上表現(xiàn)優(yōu)秀,但在測(cè)試集上進(jìn)行評(píng)估時(shí)表現(xiàn)惡化,泛化性能差。腫瘤的放射組學(xué)實(shí)用指南指出,在過度擬合的情況下,模型約束不充分且易生成受噪聲過度影響的復(fù)雜決策邊界。在移除噪聲后能夠降低模型的復(fù)雜性,使模型更高效[44]。因此,在本研究中參與訓(xùn)練模型的數(shù)據(jù)中或許仍然存在著噪聲或者部分冗余的特征,即某個(gè)本身有用的特征與另外一個(gè)有用的特征相關(guān)性強(qiáng),或它包含的信息能從其他特征中推演出來。對(duì)于該問題的處理流程如下:對(duì)所有特征標(biāo)準(zhǔn)化;對(duì)標(biāo)準(zhǔn)化后的特征建邏輯回歸模型,取各特征回歸系數(shù)的絕對(duì)值;計(jì)算各變量回歸系數(shù)并計(jì)算相應(yīng)系數(shù)的P值,并依此選擇出差異具有統(tǒng)計(jì)意義的6個(gè)特征(P<0.05)。經(jīng)處理后的特征中既包括了一階特征,也包括了其他更高階的特征。這些高階特征通過一系列統(tǒng)計(jì)度量來檢查像素的空間關(guān)系,可以更有效地反映腫瘤的空間異質(zhì)性。與此同時(shí),在過往的許多研究的結(jié)果中也證明高階特征能夠表現(xiàn)出更高的魯棒性,基于高階特征的模型性能也相當(dāng)出色[45-47]。
為了找到最適合構(gòu)建 R-score的機(jī)器學(xué)習(xí)模型,采用ROC曲線下的AUC評(píng)估每個(gè)模型的預(yù)測(cè)性能。事實(shí)證明,在多個(gè)機(jī)器學(xué)習(xí)模型中,測(cè)試集的線性 SVM的AUC(0.863,95%CI:0.728~0.999)最高,該模型的預(yù)測(cè)性能最佳。因此本研究基于所篩選的特征建立線性 SVM模型計(jì)算每個(gè)患者的SVM得分作為R-score。在后續(xù)的處理中,聯(lián)合所有相關(guān)的預(yù)測(cè)因素建立基于多因素邏輯回歸的Nomogram模型,并將其與三個(gè)單一的模型進(jìn)行比較。相比單獨(dú)的臨床病理模型、影像學(xué)模型和放射組學(xué)模型,聯(lián)合Nomogram模型具有更好的預(yù)測(cè)性能,訓(xùn)練組和測(cè)試組的AUC值分別為0.907(95%CI:0.843~0.972)和0.883(95%CI:0.769~0.996)。類似的聯(lián)合模型具有更好性能的報(bào)道已經(jīng)在既往的研究結(jié)果中得到過驗(yàn)證[20,24,25]。
近年來,Nomogram模型已應(yīng)用于PA復(fù)發(fā)或進(jìn)展的預(yù)測(cè)中[10]。Lu等[48]基于臨床、病理和影像學(xué)的因素開發(fā)的Nomogram在預(yù)測(cè)PA的長(zhǎng)期復(fù)發(fā)中就已表現(xiàn)出良好的預(yù)測(cè)性能,其AUC在訓(xùn)練隊(duì)列和測(cè)試隊(duì)列中分別為0.818和0.740。而本研究研究首次將放射組學(xué)評(píng)分加入Nomogram模型的構(gòu)建中,發(fā)現(xiàn)最終建立的Nomogram在訓(xùn)練集和測(cè)試集中對(duì)于PA術(shù)后復(fù)發(fā)預(yù)測(cè)性能均優(yōu)于Lu等[48]。說明放射組學(xué)能基于醫(yī)學(xué)圖像特征進(jìn)行精確預(yù)測(cè),為臨床決策提供極大的幫助[49]。
本研究存在一些局限性。首先,本研究中的測(cè)試隊(duì)列與訓(xùn)練隊(duì)列來自同一中心,后續(xù)研究加入多中心數(shù)據(jù)來驗(yàn)證模型的可靠性和普遍性。 其次,本研究為回顧性研究,實(shí)驗(yàn)對(duì)象可能存在潛在的選擇偏倚。最后,雖然目前已有研究證實(shí)ADC值對(duì)于預(yù)測(cè)PA的復(fù)發(fā)有一定的價(jià)值,但是基于上述原因并沒有將DWI圖像納入分析中,這或許是本研究中存在不足的一點(diǎn)。隨著PET分子成像功能與 MRI新序列產(chǎn)生,筆者將深入研究融合PET對(duì)病灶功能成像和MRI多序列的優(yōu)點(diǎn)。
本研究基于多序列MRI的放射組學(xué)評(píng)分和與復(fù)發(fā)相關(guān)的臨床病理和影像學(xué)參數(shù),構(gòu)建了聯(lián)合Nomogram模型用于預(yù)測(cè)PA復(fù)發(fā)。在后續(xù)的分析研究中,相較于其他單一模型,筆者發(fā)現(xiàn)納入放射組學(xué)評(píng)分的聯(lián)合Nomogram模型展現(xiàn)出極佳的預(yù)測(cè)性能并且具有相當(dāng)重要的應(yīng)用價(jià)值,提示定量和無創(chuàng)的放射分析對(duì)幫助臨床醫(yī)生判斷垂體瘤術(shù)后復(fù)發(fā)并提前規(guī)劃個(gè)性化輔助治療有重大幫助。