鄭文霞 王莉莉 陳杏彪 鄭小霞 崔雅瓊 黃 剛
結(jié)直腸癌為常見的消化道腫瘤,發(fā)病率居高不下且逐漸年輕化[1]。結(jié)直腸癌的發(fā)展過程中存在腫瘤微環(huán)境的變化,腫瘤微環(huán)境中包含的腫瘤脈管系統(tǒng)及成纖維細胞等各類腫瘤細胞,在腫瘤發(fā)展過程中腫瘤細胞及其細胞外基質(zhì)相互作用[2],促進腫瘤血管的生成[3]及腫瘤基質(zhì)的纖維化[4]。 細胞外容積(extracellular volume,ECV)為細胞微環(huán)境中細胞外基質(zhì)的占據(jù)空間,代表細胞外基質(zhì)的體積分數(shù),在一定程度上能夠反映腫瘤微環(huán)境的變化。研究顯示,經(jīng)影像檢查測定的ECV 分數(shù)與病理活檢組織學(xué)定量的細胞外間質(zhì)變化密切相關(guān)[5],表明細胞外間質(zhì)的變化可通過影像學(xué)檢查所測的ECV 值定量表示。在影像學(xué)檢查中,利用細胞外間質(zhì)量達到平衡狀態(tài)時測量病變的ECV 來評估其狀態(tài)[6]?;贑T 圖像碘密度值[7]可以計算得到ECV 值=(1-Hct)×(IDROI/IDBlood),其中Hct 為紅細胞壓積,IDROI和IDBlood分別為感興趣區(qū)和同層面血池的碘密度。
結(jié)直腸癌的血管淋巴管及神經(jīng)浸潤提示著不良預(yù)后[8],通常在病理組織活檢或術(shù)后所得,活檢有創(chuàng)且術(shù)后診斷存在滯后性。因此,探索非侵入性的方法早期評估血管淋巴管及神經(jīng)浸潤對指導(dǎo)結(jié)直腸癌患者的治療和預(yù)后具有重要意義。作為非侵入的方法,傳統(tǒng)影像學(xué)檢查對腫瘤的這些異質(zhì)性評估價值有限[9]。影像組學(xué)通過整合影像特征對腫瘤整體進行分析,將圖像信息轉(zhuǎn)換為數(shù)據(jù)特征,在預(yù)測病變微觀病理結(jié)構(gòu)方面[10],以及腫瘤異質(zhì)性的評估方面表現(xiàn)出獨特的優(yōu)勢[11]。既往研究中,基于MR/CT 的多模態(tài)影像組學(xué)模型對直腸癌的淋巴血管浸潤表現(xiàn)出了較高的預(yù)測能力[12],被認為是具有潛力的可視化工具,但結(jié)直腸癌的血管及淋巴管、神經(jīng)侵犯的影像評估仍缺乏有效的量化指標。在一項關(guān)于結(jié)腸癌的研究中發(fā)現(xiàn)ECV可用于預(yù)測結(jié)腸癌的肝轉(zhuǎn)移及淋巴結(jié)轉(zhuǎn)移[13],表明ECV 在結(jié)直腸癌的診斷方面存在潛能。Song 等[14]發(fā)現(xiàn)血管、淋巴管內(nèi)癌栓的形成與免疫異質(zhì)性腫瘤微環(huán)境密切相關(guān),因此ECV 可間接反映腫瘤細胞微環(huán)境改變帶來的結(jié)直腸癌組織神經(jīng)、血管及淋巴管浸潤狀態(tài)。我們嘗試利用ECV 影像組學(xué)的方法以期在結(jié)直腸癌血管、淋巴管以及神經(jīng)侵犯的診斷方面獲得更多價值。本文旨在探討基于光譜CT 的ECV 影像組學(xué)特征聯(lián)合臨床危險因素對結(jié)直腸癌神經(jīng)及血管淋巴管浸潤進行術(shù)前無創(chuàng)評估。
回顧性收集甘肅省人民醫(yī)院2020年7月至2022年3月收治的155 例結(jié)直腸癌患者資料。納入標準:(1)首次診斷結(jié)直腸癌,經(jīng)術(shù)后病理證實;(2)無化療及手術(shù)病史;(3)常規(guī)術(shù)前行光譜CT 增強檢查,包含完整的圖像信息。排除標準:(1)病理免疫組化資料不全;(2)腺瘤等其他良性腫瘤;(3)圖像偽影重,不滿足圖像分割要求。血管、淋巴管及神經(jīng)侵犯由病理免疫組化檢查獲得。
本研究經(jīng)甘肅省人民醫(yī)院倫理委員會批準(編號:2021-196)。
納入患者行IQon spectral CT (荷蘭,Philips Healthcare)增強掃描,采用雙筒高壓注射器,于肘正中靜脈注入1.5 mL/kg碘克沙醇(320 mgI/mL),速率3.5 mL/s,隨后以相同速率注入50 mL 生理鹽水。分別于注藥25~30 s、60~70 s、2 min 后進行動脈期、靜脈期及延遲期掃描。主要參數(shù):層厚5 mm,管電壓120 kV,自動毫安秒,螺距0.953,轉(zhuǎn)速0.5 s/r。采集后圖像利用IntelliSpacePortal (ISP) Version 10.1后處理工作站進行處理。
3.1 ECV參數(shù)圖的生成
選擇延遲期圖像納入研究,重建后光譜基數(shù)據(jù)(spectral base images,SBI)導(dǎo)入后處理工作站,測量病變所在平面腹主動脈或髂血管的碘密度(iodine denisty,ID),感興趣區(qū)(region of interest,ROI)范圍為血管最大直徑,避開鈣化區(qū),于3 個不同層面測量后取ID 平均值,由血管ID 和SBI 數(shù)據(jù)利用公式ECV=(1-Hct)×IDROI/IDBlood(其中Hct 為紅細胞壓積,IDROI和IDBlood分別為感興趣區(qū)和同層面血池的碘密度)計算后生成ECV圖。
3.2 圖像分割及特征提取
首先將所有受試者的圖像保存為DICOM 格式,采用ITK-SNAP 軟件進行圖像分割,由2 名具有5年及10年工作經(jīng)驗的醫(yī)師在40 keV 圖像進行病灶確認并用半自動方式勾畫感興趣容積(volume of interest,VOI),然后匹配至ECV 圖,如圖1①~④所示。其次采用 FeAtureExplorer (FAE,V0.3.6)軟件進行特征提取及建模分析。提取的特征包括直方圖特征、形狀特征及灰度共生矩陣 (gray level co-occurrence matrix,GLCM)特征。在3 個月后隨機選擇30 例按同種方式重新勾畫,計算組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)進行可重復(fù)性及一致性檢驗。
圖1 影像組學(xué)流程圖及最終模型評價
3.3 特征篩選及建模
3.3.1 影像組學(xué)特征選擇及建模
將特征以7∶3 比例隨機分為訓(xùn)練集與測試集,其中選取109例作為訓(xùn)練數(shù)據(jù)集(40/69=陽性/陰性),選擇另外46 例作為測試數(shù)據(jù)集(17/29=陽性/陰性)。首先,采用合成少數(shù)類過采樣技術(shù)(SMOTE)進行正/負樣本的平衡。其次,對特征矩陣進行 Z-score 歸一化處理。同時用皮爾遜相關(guān)系數(shù)(PCC)對特征空間進行降維。最后,特征篩選利用方差分析(ANOVA)、Relief 算法和遞歸特征消除(RFE)進行,特征數(shù)的范圍為1 到20。分類器選擇見圖1⑥。模型驗證采用5折交叉驗證。
3.3.2 臨床特征選擇及建模
臨床候選變量選擇年齡、性別、腫瘤位置、癌胚抗原(CEA)、糖類抗原(CA)19-9、CA72-4、T 分期、分化程度。行單因素方差分析選擇P<0.05 的特征為危險因子,將篩選的危險因子行l(wèi)ogistic 回歸分析建立臨床模型。
3.3.3 聯(lián)合特征選擇及建模
將篩選的影像組學(xué)特征及臨床指標行l(wèi)ogistic 回歸分析建立聯(lián)合模型。
采用SPSS 25.0統(tǒng)計學(xué)軟件對臨床資料進行分析,符合正態(tài)分布的計量資料用±s表示,年齡、腫瘤分期、分化程度的組間比較采用獨立樣本t檢驗。分類變量如性別、腫瘤位置、腫瘤標志物兩組間的比較采用卡方檢驗。采用logistic 回歸方法對結(jié)直腸癌患者臨床相關(guān)因素進行篩選。P<0.05 表示差異有統(tǒng)計學(xué)意義。
計算準確度、約登指數(shù)、靈敏度,特異度、陽性預(yù)測值、陰性預(yù)測值,根據(jù)受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under the curve,AUC) 評估模型效能,用DeLong 檢驗進行模型間AUC 比較。一致性檢驗采用ICC,ICC大于0.75表示一致性良好。
共納入155 例患者,其中結(jié)腸癌38 例,直腸癌117 例 ,男性98 例,女性57 例,年齡31~88 歲,平均(60.4±10.6)歲。腫瘤分期與是否存在血管侵犯、淋巴管侵犯、神經(jīng)侵犯三者之間差異均有統(tǒng)計學(xué)意義(P<0.05);CA72-4 與腫瘤是否淋巴管侵犯之間有統(tǒng)計學(xué)意義,(P=0.003);CEA 與腫瘤是否存在神經(jīng)侵犯有統(tǒng)計學(xué)意義(P=0.041);其余臨床指標與三者之間對比均無統(tǒng)計學(xué)意義(P>0.05)。詳見表1。
表1 人口統(tǒng)計學(xué)及臨床病理資料
2.1 影像組學(xué)特征篩選及一致性評價
由2名醫(yī)師勾畫的VOI共提取出56個特征。血管侵犯組顯示利用ANOVA 進行特征選擇后,由AE 作為分類器建立模型,最后發(fā)現(xiàn)基于_original_firstorder_Mean ,original_shape_SurfaceVolumeRatio這 2 個特征的模型Zscore-PCC-ANOVA-2-AE 在訓(xùn)練集和驗證數(shù)據(jù)集上的AUC 最高,分別為0.797、0.852。淋巴管侵犯組使用RFE 選擇特征,用LDA 作為分類器建立模型,發(fā)現(xiàn)基于original_firstorder_Mean,original_shape_SurfaceVolumeRatio 這2個特征的模型Zscore-PCC-RFE-2-LDA 在訓(xùn)練集和驗證數(shù)據(jù)集上的AUC最高,分別為0.768、0.806。神經(jīng)侵犯組使用ANOVA 選擇特征后,用LR 作為分類器建立模型,最后基于特征original_firstorder_Mean 的模型Zscore-PCC-ANOVA-1-LR 在訓(xùn)練集和驗證數(shù)據(jù)集上的AUC最高,分別為0.800、0.819。
經(jīng)2 名醫(yī)師勾畫的VOI特征組內(nèi)及組間ICC 值大于0.75,一致性良好。
2.2 臨床特征篩選
選擇P<0.05 的特征作為臨床預(yù)測因子。血管侵犯組顯示腫瘤分期(P=0.006)為獨立預(yù)測因子,淋巴管侵犯組顯示腫瘤分期(P=0.01)及CA72-4(P=0.003)為預(yù)測因子,神經(jīng)侵犯組顯示腫瘤分期(P<0.001)及CEA(P=0.041)為預(yù)測因子。
2.3 聯(lián)合特征
將組學(xué)特征及有統(tǒng)計學(xué)意義的臨床特征進行l(wèi)ogistic 回歸分析獲得聯(lián)合特征。血管侵犯組聯(lián)合特征由組學(xué)特征和腫瘤分期構(gòu)成,淋巴管侵犯組聯(lián)合特征由組學(xué)特征和腫瘤分期、CA72-4 構(gòu)成,神經(jīng)侵犯組聯(lián)合特征由組學(xué)特征和腫瘤分期、CEA 構(gòu)成。特征分布如圖2所示。
圖2 聯(lián)合特征在血管、淋巴管、神經(jīng)侵犯陽性和陰性患者中分布的小提琴圖
3.1 血管侵犯組模型
通過比較臨床模型、組學(xué)模型、聯(lián)合模型的準確度、靈敏度、特異度、陽性預(yù)測值、陰性預(yù)測值,發(fā)現(xiàn)聯(lián)合模型的整體效能最高,見表2。臨床模型訓(xùn)練集與測試集的AUC 分別為0.613、0.521,組學(xué)模型訓(xùn)練集與測試集的AUC 分別為0.797、0.852,聯(lián)合模型訓(xùn)練集與測試集的AUC分別為0.809、0.862,見圖3。
圖3 血管侵犯組的3種模型在訓(xùn)練集和測試集中ROC曲線及曲線下面積
表2 血管侵犯組3種模型效能的比較
3.2 淋巴管侵犯組模型
同樣,在淋巴管侵犯組中聯(lián)合模型的整體效能也最高,見表3。臨床模型訓(xùn)練集與測試集的AUC分別為0.636、0.601,組學(xué)模型訓(xùn)練集與測試集的AUC分別為0.768、0.806,聯(lián)合模型訓(xùn)練集與測試集的AUC分別為0.785、0.823,見圖4。
圖4 淋巴管侵犯組的3種模型在訓(xùn)練集和測試集中ROC曲線及曲線下面積
表3 淋巴管侵犯組3種模型效能的比較
3.3 神經(jīng)侵犯組模型
神經(jīng)侵犯組中聯(lián)合模型的整體效能也表現(xiàn)為最高,見表4。臨床模型訓(xùn)練集與測試集的AUC分別為0.712、0.771,組學(xué)模型訓(xùn)練集與測試集的AUC 分別為0.800、0.819,聯(lián)合模型訓(xùn)練集與測試集的AUC分別為0.835、0.892,見圖5。
圖5 神經(jīng)侵犯組的3種模型在訓(xùn)練集和測試集中ROC曲線及曲線下面積
表4 神經(jīng)侵犯組3種模型效能的比較
血管淋巴管侵犯在組織學(xué)上被定義為管腔內(nèi)存在腫瘤細胞或腫瘤細胞破壞管壁,神經(jīng)侵犯指腫瘤侵犯神經(jīng)并沿神經(jīng)鞘擴散,誘發(fā)神經(jīng)重塑和神經(jīng)環(huán)境的改變。3 種病理改變是早期轉(zhuǎn)移的關(guān)鍵步驟,也是影響預(yù)后的主要因素。在癌細胞與腫瘤微環(huán)境之間各種復(fù)雜的相互作用下,腫瘤相關(guān)的基質(zhì)細胞刺激腫瘤血管生成、重塑細胞外基質(zhì),占據(jù)更大空間的細胞外間隙,最終引起ECV 發(fā)生變化。此外,惡性腫瘤新生血管網(wǎng)豐富,但欠成熟,血管脆性大,血流量、血容量、血管通透性明顯增加[15],導(dǎo)致ECV也發(fā)生變化。因此,ECV 可作為新的影像學(xué)指標來評估腫瘤的微環(huán)境變化的病理改變。ECV 在腹部的研究較多應(yīng)用于評估肝臟纖維化[16],對腫瘤性疾病如胰腺癌的預(yù)后評估[17]、腎癌的病理分級等都有涉及[18],而在結(jié)直腸方面的研究尚少,但初步研究發(fā)現(xiàn)在預(yù)測結(jié)直腸癌肝轉(zhuǎn)移及淋巴結(jié)轉(zhuǎn)移方面可作為一項預(yù)測指標[13],也為本研究提供了思路支持。影像組學(xué)作為一種決策工具,通過捕獲人眼難以識別的組織和病變特征,如形狀和異質(zhì)性等來表征腫瘤的內(nèi)部生物學(xué)信息[19],輔助解決相關(guān)臨床問題。在結(jié)直腸癌的研究中發(fā)現(xiàn)可預(yù)測腫瘤的預(yù)后情況[20],也可進行淋巴血管間隙侵犯的預(yù)測[21],不同的是既往此類研究多集中于常規(guī)參數(shù)圖像,我們嘗試利用光譜CT 細胞外容積參數(shù),對腫瘤引起的微環(huán)境改變進行定量評估。
本研究構(gòu)建影像組學(xué)模型的特征來源于細胞外容積參數(shù)圖。最終發(fā)現(xiàn)ECV 影像組學(xué)特征聯(lián)合臨床有意義特征建立的聯(lián)合模型較純臨床及純組學(xué)模型在血管侵犯、淋巴管侵犯及神經(jīng)侵犯中表現(xiàn)出了更高的診斷效能。在既往研究中,由多參數(shù)建立的模型在預(yù)測脈管侵犯中訓(xùn)練集及驗證集的AUC 達0.884~0.91、0.876~0.88[12,22],我們使用ECV 單一參數(shù)建立的模型效能略低,可能由于我們僅使用了單個參數(shù),下一步研究中我們也將考慮聯(lián)合多參數(shù)來探索能夠進一步提高診斷效能的方法。盡管如此,通過我們的初步探索,發(fā)現(xiàn)ECV 作為一個定量評估參數(shù)對結(jié)直腸癌的微環(huán)境變化仍可提供診斷參考價值。此外,考慮到血管及淋巴管的浸潤盡管是早期轉(zhuǎn)移的表現(xiàn),依然代表腫瘤發(fā)展過程中的兩種轉(zhuǎn)移途徑,因此本研究使用病理免疫組化的精準指標將兩者分開討論,以達到更精確的評價。
本研究在特征提取中選擇了直方圖、形狀特征、灰度共生矩陣特征,不同的特征維度可能反映腫瘤不同的生物學(xué)信息。選擇相關(guān)特征作為預(yù)測因子構(gòu)建組學(xué)模型是一個具有挑戰(zhàn)性的過程[11],尤其在樣本量較小、數(shù)據(jù)分布不均衡的情況下,易出現(xiàn)過擬合等現(xiàn)象。本研究采用SMOTE 進行正/負樣本的平衡,以消除訓(xùn)練數(shù)據(jù)集的不平衡性,并對特征矩陣進行了 Zscore 歸一化處理來避免過擬合,通過PCC 降維,使用5 折交叉驗證進行檢測。在建模過程中使用不同的模型篩選方式及多種分類器方法,血管侵犯組表現(xiàn)為經(jīng)ANOVA 選擇特征,基于AE 分類器的模型效能最佳。淋巴管侵犯組表現(xiàn)為經(jīng)RFE 篩選,用LDA 作為分類器建立的模型效能最佳。神經(jīng)侵犯組表現(xiàn)為經(jīng)ANOVA 選擇特征后,用LR 建立的模型效能最佳。3種不同病理狀態(tài)最優(yōu)模型的特征數(shù)目及類型、模型篩選方式、分類器各不相同,也有學(xué)者提出在建模過程中選擇多種機器學(xué)習(xí)的方法,以確定最佳模型[23],但最佳模型的穩(wěn)定性仍需通過外部驗證加強。
在構(gòu)建臨床模型過程中,經(jīng)單因素方差分析3 組的腫瘤分期均表現(xiàn)出統(tǒng)計學(xué)意義,提示腫瘤的血管、淋巴管、神經(jīng)侵犯與侵襲性行為相關(guān),與Wang等[21]之前的研究結(jié)果一致,需在臨床診療中密切關(guān)注。此外,腫瘤標志物CA72-4 在淋巴管侵犯組表現(xiàn)出統(tǒng)計學(xué)差異(P=0.003),提示與淋巴管侵犯有關(guān),以往也有研究提出該指標升高更易發(fā)生淋巴管侵犯[24]。腫瘤標志物CEA 在神經(jīng)侵犯組表現(xiàn)出統(tǒng)計學(xué)差異(P=0.041),提示可預(yù)測神經(jīng)侵犯,與已發(fā)表的研究中血清CEA 水平升高與PNI 陽性相關(guān)[25]的結(jié)果一致。然而單一的臨床血清學(xué)指標在預(yù)測腫瘤的風(fēng)險方面可靠性不足。從AUC 結(jié)果來看,單純的臨床模型表現(xiàn)出的效能也較低,血管侵犯組臨床模型訓(xùn)練集與測試集的AUC分別為0.613、0.521,淋巴管侵犯組中臨床模型訓(xùn)練集與測試集的AUC分別為0.636、0.601,神經(jīng)侵犯組中臨床模型訓(xùn)練集與測試集的AUC 分別為0.712、0.771,可見單獨評估腫瘤病理狀態(tài)的能力有限。
最終,通過臨床指標與影像組學(xué)特征建立的聯(lián)合模型在3 組不同病理狀態(tài)下均較單純的組學(xué)模型及臨床模型表現(xiàn)出更高的效能,然而血管侵犯組在訓(xùn)練集表現(xiàn)出的靈敏度(0.60)較低,推測與樣本量少、分布不均衡有關(guān)。在本研究中盡管對數(shù)據(jù)集進行了內(nèi)部交叉驗證,模型仍需要大規(guī)模外部驗證來提高穩(wěn)定性。
本研究也存在一些不足。首先,本研究為單中心研究,尚需多中心外部驗證。在對3 種病理狀態(tài)的模型評估中,訓(xùn)練數(shù)據(jù)集的AUC 整體上略低于驗證集,可能與樣本量相對偏低,數(shù)據(jù)的分布不平衡有關(guān),后期將增大樣本量進行多中心評估及驗證,以提高模型的魯棒性。其次,研究中計算ECV 時使用的是延遲期圖像,掃描過程中延遲時間的把握尚未見統(tǒng)一標準,是否延遲更長時間可能更有意義有待探索。最后,無法保證所有受檢者在當(dāng)天內(nèi)完成紅細胞壓積采集,本研究將紅細胞壓積范圍設(shè)置為檢查前3 天內(nèi),且此期間未使用任何藥物,以盡可能降低對結(jié)果的影響。
綜上所述,ECV 影像組學(xué)特征可用來評估結(jié)直腸癌的神經(jīng)、血管及淋巴管侵犯情況,結(jié)合臨床病理因素建立的聯(lián)合模型提高了決策支持中診斷和預(yù)后的可靠性,對患者的早期治療及預(yù)后有積極的意義。該研究也初步表明在評估結(jié)直腸癌的腫瘤微環(huán)境變化帶來的病理改變方面,ECV 體現(xiàn)了良好的無創(chuàng)診斷價值。