彭永佳,劉曉雯,唐雪,羅燕,江長思,龔靜山*
子宮內(nèi)膜癌(endometrial cancer, EC)作為女性生殖系統(tǒng)最常見的惡性腫瘤之一,近年來仍嚴(yán)重影響著女性的身心健康,其發(fā)病和死亡率一直居高不下[1]。影響EC預(yù)后的因素很多,如淋巴血管侵犯(lymph vascular space invasion, LVSI)、年齡、病理學(xué)分級(jí)、宮頸基質(zhì)侵犯(cervical stromal invasion, CSI)等,其中LVSI是影響EC預(yù)后的重要獨(dú)立危險(xiǎn)因素[2-3]。術(shù)前對(duì)LVSI的診斷、治療及預(yù)后密切相關(guān),因?yàn)椴煌腖VSI 侵犯程度影響著EC 患者治療手段的選擇。LVSI 陽性(+)患者腫瘤的異質(zhì)性更高,淋巴結(jié)轉(zhuǎn)移風(fēng)險(xiǎn)更高,預(yù)后較差,早期切除陽性淋巴結(jié)利于患者預(yù)后;而LVSI陰性(-)患者淋巴結(jié)轉(zhuǎn)移的概率相對(duì)較小,可以在術(shù)中減少淋巴結(jié)的清掃,對(duì)于高齡或者身體狀況不佳的患者可以避免不必要的手術(shù),從而有利于患者的康復(fù)。所以早期準(zhǔn)確預(yù)測LVSI存在與否可有助于選擇正確有效的治療方法,也可避免一些過度化治療對(duì)患者帶來的傷害。另外,由于LVSI 的組織病理學(xué)只有經(jīng)過術(shù)后病理才可以獲知,而目前臨床仍缺乏術(shù)前準(zhǔn)確診斷或預(yù)測LVSI以指導(dǎo)術(shù)前手術(shù)方式的選擇和治療方案制訂的有效的生物學(xué)標(biāo)記。
MRI無創(chuàng)無輻射,具有較高的空間分辨力,并且可以多方位多參數(shù)成像,因此被廣泛應(yīng)用于婦科腫瘤的診斷、分期和療效評(píng)估,在患者治療方案決策中起著重要作用[4-7]。近年來隨著人工智能的飛速發(fā)展,影像組學(xué)進(jìn)入了一個(gè)新時(shí)代,它將常規(guī)醫(yī)學(xué)影像圖像轉(zhuǎn)變?yōu)榭赏诰虻拇髷?shù)據(jù),為臨床患者的個(gè)性化治療提供決策支持,已成為影像醫(yī)學(xué)與精準(zhǔn)醫(yī)學(xué)間的橋梁[8-9]。因此,本研究擬利用多參數(shù)MRI(multiparametric MRI, mpMRI)提取EC的影像組學(xué)特征,建立機(jī)器學(xué)習(xí)模型在體預(yù)測LVSI狀態(tài),并通過列線圖使模型可視化以便于臨床推廣,為EC患者個(gè)性化治療方案的選擇提供決策支持。
本研究已獲深圳市人民醫(yī)院道德倫理委員會(huì)批準(zhǔn),免除患者的知情同意,批準(zhǔn)文號(hào):LLKY-2021909?;仡櫺苑治?015年6月至2021年6月就診于深圳市人民醫(yī)院經(jīng)過手術(shù)病理證實(shí)為EC患者病例285例。納入標(biāo)準(zhǔn):(1)經(jīng)病理診斷為EC;(2)行子宮及雙側(cè)輸卵管、卵巢全切術(shù)且有完整術(shù)后病理報(bào)告,將患者分為LVSI(+)組和LVSI(-)組;(3)術(shù)前兩周內(nèi)經(jīng)過MRI平掃加增強(qiáng)檢查且可以從PACS(picture archive and communication system)系統(tǒng)中完整獲取;(4)MRI 檢查前未經(jīng)相關(guān)治療。排除標(biāo)準(zhǔn):(1)MRI圖像上病灶最大徑小于1 cm 或大量出血等使病灶顯示不清;(2)圖像質(zhì)量差或影像組學(xué)特征提取失敗。最終202例納入本研究,收集患者的相關(guān)資料,并按照7∶3的比例隨機(jī)分入訓(xùn)練集(n=141)和驗(yàn)證集(n=61)(如圖1)。
圖1 子宮內(nèi)膜癌MRI特征提取及構(gòu)建預(yù)測淋巴血管侵犯預(yù)測模型流程圖。Fig. 1 Endometrial cancer MRI features extraction and construction of lymphatic vascular space invasion prediction model flow chart.
采用Simens Magnetom Skyra 3.0 T MRI掃描系統(tǒng)和18通道相控陣體部線圈。檢查前囑咐患者排空腸道并喝適量的水適當(dāng)將膀胱充盈。患者取仰臥位,頭先進(jìn),采集MRI軸位序列。掃描序列包括:T2WI快速自旋回波(turbo spin echo, TSE)序列、T1WI TSE序列、擴(kuò)散加權(quán)成像(diffusion weighted imaging, DWI)序列(b 值為0 和1000 s/mm2)、T1WI 對(duì)比增強(qiáng)(contrast enhanced T1WI, CE-T1WI)序列。根據(jù)DWI自動(dòng)生成表觀擴(kuò)散系數(shù)(apparent diffusion coefficient, ADC)mapping,各序列參數(shù)見表1。
表1 MRI 掃描參數(shù)Tab.1 MRI scan parameters
依據(jù)術(shù)前診刮術(shù)后病理診斷將EC分為以下三級(jí):1級(jí)(G1)腫瘤的實(shí)性成分5%以下;2 級(jí)(G2)腫瘤實(shí)性成分在6%~50%之間;3 級(jí)(G3)腫瘤的實(shí)性成分大于50%。非子宮內(nèi)膜樣腺癌包括漿液性乳頭狀癌、癌肉瘤和透明細(xì)胞癌等,病理上診斷為高級(jí)別EC。本研究將G1 和G2 分為低級(jí)別EC(G-low),G3 和非子宮內(nèi)膜樣腺癌分為高級(jí)別EC(G-high)。
每位患者M(jìn)RI 圖像的獲取由2 名高年資(分別為12 年、15 年以上工作經(jīng)驗(yàn))的放射科醫(yī)生從PACS 系統(tǒng)采用雙盲法共同閱片,對(duì)于有異議的協(xié)商解決。每個(gè)患者獲得T2WI、DWI、ADC、CE-T1WI四個(gè)MRI序列圖像,以DICOM(digital imaging and communication in medicine)格式導(dǎo)出進(jìn)行圖像后處理。由兩名3年以上MRI 讀片經(jīng)驗(yàn)的醫(yī)生各自分別在T2WI、ADC(參考DWI,b 值為1000 s/mm2)、CE-T1WI 圖像上采用開源的ITK-SNAP(v.3.6.0, www.itksnap.org)軟件手工逐層勾畫感興趣區(qū)(region of interest, ROI),考慮到腫瘤異質(zhì)性分析的重要性,ROI應(yīng)包括出血、壞死、囊變等區(qū)域,但應(yīng)避免腫瘤周邊正常的組織區(qū)域,最終獲取腫瘤的3D分割圖。采用開源Pyradiomics軟件包(http://pyradiomics.readthedocs.io/)自動(dòng)提取影像組學(xué)特征。每個(gè)序列圖像共獲取107個(gè)紋理特征,包括14個(gè)形態(tài)(shape)特 征、14 個(gè) 灰 度 相 關(guān) 矩 陣(gray level dependence matrix, GLDM)特征、24 個(gè)灰度共生矩陣(gray level co-occurrence matrix, GLCM)特征、18個(gè)一階統(tǒng)計(jì)(first order statistics)特征、16個(gè)灰度運(yùn)行長度矩陣(gray level run length matrix, GLRLM)特征、16 個(gè)灰度區(qū)域大小矩陣(gray level size zone matrix, GLSZM)特征,5個(gè)鄰域灰度差矩陣(neighborhood gray-tone difference matrix, NGTDM)特征。
統(tǒng)計(jì)分析采用SPSS 23.0 及R 語言4.2.2 版本(http://www.rproject.org)統(tǒng)計(jì)軟件。采用t檢驗(yàn)及χ2檢驗(yàn)或Mann-Whitney秩和檢驗(yàn)分析臨床基本資料及影像組學(xué)特征。定量資料進(jìn)行正態(tài)分布檢驗(yàn),以均數(shù)±標(biāo)準(zhǔn)差(±s)或中位數(shù)表示,定性資料通過頻數(shù)和百分比(%)進(jìn)行統(tǒng)計(jì)描述。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。采用組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient, ICC)評(píng)價(jià)2名醫(yī)師提取影像組學(xué)特征參數(shù)的一致性,以評(píng)估數(shù)據(jù)抽取結(jié)果的一致性,大于0.75認(rèn)為一致性良好。影像組學(xué)特征采用最小值-最大值歸一化,消除不同特征間的尺度不同。運(yùn)用R語言“glmnet”包在訓(xùn)練集中進(jìn)行最小絕對(duì)收縮和選擇算法(least absolute shrinkage and selection operator, LASSO)回歸分析和5折疊交叉驗(yàn)證法篩選與LVSI強(qiáng)相關(guān)的特征并計(jì)算影像組學(xué)分?jǐn)?shù)(radiomics score, Rad-score)。
以單因素和多因素logistic回歸篩選LVSI的獨(dú)立危險(xiǎn)因素,在訓(xùn)練集中建立回歸模型(R語言”lrm”軟件包),并采用列線圖使模型可視化,預(yù)測效能采用C指數(shù)(C-index)評(píng)價(jià),并采用bootstrap法(1000次)確定95%置信區(qū)間(95%CI)。建立校準(zhǔn)曲線評(píng)估模型擬合優(yōu)度,在驗(yàn)證集對(duì)模型進(jìn)行驗(yàn)證,采用DeLong檢驗(yàn)進(jìn)行比較。列線圖臨床凈收益率通過決策曲線分析(decision curve analysis, DCA)來評(píng)價(jià)。
202 例EC 患者中有46例(22.8%)患者發(fā)生LVSI,在有無LVSI之間年齡、腫瘤病理學(xué)分級(jí)差異均具有統(tǒng)計(jì)學(xué)意義(P<0.05),并且LVSI(+)組年齡高于LVSI(-)組[(59.24±8.19)歲vs.(54.15±9.41)歲,P<0.001];EC高級(jí)別腫瘤的患病率在LVSI(+)患者中更高[46%(21/46)vs. 15%(23/156)],且在有無LVSI組間差異有統(tǒng)計(jì)學(xué)意義(P<0.001)。LVSI和MRI-CSI之間的相關(guān)性無統(tǒng)計(jì)學(xué)意義(P=0.267)(表2)。
2位醫(yī)師分別勾畫ROI后提取的影像組學(xué)特征進(jìn)行組間一致性檢驗(yàn)后發(fā)現(xiàn)有36個(gè)影像組學(xué)特征穩(wěn)定性較差(ICC≤0.75)。在剩余285 個(gè)影像組學(xué)特征進(jìn)行單因素分析后,有23個(gè)組學(xué)特征有統(tǒng)計(jì)學(xué)意義(P<0.05)。LASSO 回歸篩選出13 個(gè)影像組學(xué)特征與LVSI 存在與否具有較強(qiáng)的相關(guān)性(包含3 個(gè)ADC、6 個(gè)CE-T1WI和4個(gè)T2WI圖的特征),詳見表3。通過公式計(jì)算Rad-score=-1.47771068+特征×系數(shù),兩組間Rad-score 分布差異有統(tǒng)計(jì)學(xué)意義(P<0.05,表2 和圖2)。典型病例見圖3和圖4。
圖2 訓(xùn)練集中影像組學(xué)分?jǐn)?shù)柱形圖,紅色代表淋巴血管侵犯陽性,藍(lán)色代表淋巴血管侵犯陰性。Fig. 2 Bar graph of radimics score in the training set, where red represents lymphatic vascular space invasion positive and blue represents negative.
表2 患者基本資料比較以及LVSI高危因素多因素回歸分析Tab.2 Comparison of basic patient data and multivariate regression analysis of high-risk factors for lymphatic vascular space invasion
表3 LASSO分析篩選13個(gè)影像組學(xué)特征統(tǒng)計(jì)Tab.3 Statistical analysis of 13 radiomics features screened by LASSO
單因素和多因素logistic回歸分析顯示年齡、病理學(xué)分級(jí)和Rad-score為LVSI的獨(dú)立危險(xiǎn)因素(表2)。聯(lián)合LVSI危險(xiǎn)因素構(gòu)建的列線圖在訓(xùn)練集和驗(yàn)證集中C-index 分 別 為[0.871(95%CI:0.803~0.940)vs. 0.810(95%CI:0.698~0.917),P=0.333](圖5A),影像組學(xué)模型在訓(xùn)練集和驗(yàn)證集中C-index 分別為[0.854(95%CI:0.784~0.925)vs. 0.756(95%CI:0.619~0.892),P=0.211](圖5B)。列線圖和影像組學(xué)模型對(duì)LVSI均具有較高的預(yù)測效能,并且列線圖高于影像組學(xué)模型(P=0.012),如圖5C。模型的列線圖如圖6;校準(zhǔn)曲線發(fā)現(xiàn)預(yù)測概率與觀察概率基本一致,平均絕對(duì)誤差為0.027,表明模型具有良好的擬合優(yōu)度(在Hosmer-Lemeshow test,P=0.680)(圖7)。列線圖的臨床應(yīng)用效能,使用DCA進(jìn)行評(píng)價(jià)(圖8)。
圖5 預(yù)測淋巴血管侵犯(LVSI)受試者工作特征(ROC)曲線圖。5A:列線圖模型在訓(xùn)練集與驗(yàn)證集中預(yù)測LVSI的ROC曲線圖;5B:影像組學(xué)模型在訓(xùn)練集與驗(yàn)證集中預(yù)測LVSI的ROC曲線圖;5C:列線圖和影像組學(xué)預(yù)測LVSI效能的比較。Fig. 5 Receiver operating characteristic (ROC) curve for predicting lymphatic vascular space invasion (LVSI). 5A and 5B show the ROC curves of the nomogram and radimics models in the training and validation sets,respectively;5C shows the comparison of the nomogram and radimics in predicting LVSI efficacy.
圖6 預(yù)測淋巴血管侵犯的列線圖模型。Fig.6 The normogram model to predict lymphatic vascular space invasion.
圖7 列線圖模型的校正曲線。Fig.7 The correction curve of the normogram model.
圖8 在訓(xùn)練集中預(yù)測淋巴血管侵犯列線圖的決策曲線分析。Fig. 8 The decision curve analysis of predicting lymphatic vascular space invasion nomogram in the training set.
本研究提取EC的mpMRI影像組學(xué)特征并采用LASSO篩選出13個(gè)與LVSI相關(guān)的特征并計(jì)算Rad-score,其模型對(duì)LVSI具有較高的預(yù)測能力,在訓(xùn)練集和驗(yàn)證集中C-index 分 別 為0.854 (95%CI:0.784~0.925)和0.756(95%CI:0.619~0.892);結(jié)合臨床病理特征建立列線圖后,其預(yù)測效能更優(yōu),在訓(xùn)練集和驗(yàn)證集的C-index 分別達(dá)到0.871(95%CI:0.803~0.940)和0.810(95%CI:0.698~0.917)。研究結(jié)果表明影像組學(xué)具備在體評(píng)估EC 腫瘤微環(huán)境的潛能,有望成為在體預(yù)測LVSI 的影像學(xué)生物標(biāo)記,為臨床患者個(gè)性化醫(yī)療方案的制訂提供決策支持。
影響EC 的預(yù)后和臨床治療方案選擇因素較多,而且大多數(shù)可以依賴活檢和常規(guī)影像學(xué)評(píng)估獲得,而LVSI 為組織病理學(xué)表現(xiàn),只有術(shù)后才能明確。通過結(jié)合Rad-score 和臨床病理特征建立的模型有利于為臨床術(shù)前決策提供更有力的定量支持,特別是在無法及時(shí)得到經(jīng)驗(yàn)豐富的放射科醫(yī)生閱片的情況下,因?yàn)榉派淇漆t(yī)生閱片對(duì)疾病進(jìn)行視覺上的分析和診斷在一定程度上依賴工作經(jīng)驗(yàn),而且每個(gè)醫(yī)生的判斷都存在一定的差異性[10]。影像組學(xué)采用數(shù)學(xué)算法可以更客觀地評(píng)估病變,從而獲得視覺上無法得到的定量信息[11-13]。目前,將影像組學(xué)與臨床指標(biāo)聯(lián)合建立預(yù)測模型,提高病變的診斷或預(yù)測能力是影像組學(xué)研究的熱點(diǎn)之一[14-15]。Ueno等[16]利用mpMRI影像組學(xué)特征建立模型對(duì)EC的LVSI進(jìn)行預(yù)測,其AUC值為0.80,對(duì)腫瘤危險(xiǎn)因素的預(yù)測效能較本研究低,其原因可能是他們的研究未對(duì)臨床指標(biāo)進(jìn)行綜合,且樣本量較少,另外僅提取和分析了一階統(tǒng)計(jì)特征。惡性腫瘤最重要的特征之一是異質(zhì)性,而mpMRI紋理特征分析可以包含更全面的腫瘤內(nèi)部信息,從而發(fā)現(xiàn)不同腫瘤生物行為的差異,更能代表腫瘤內(nèi)部的真實(shí)情況。腫瘤異質(zhì)性越高,其生物學(xué)行為越活躍,轉(zhuǎn)移惡化的風(fēng)險(xiǎn)越高[17-18]。有研究[19]表明mpMRI 影像組學(xué)特征模型預(yù)測腫瘤的效能優(yōu)于單參數(shù)模型。Luo等[20]基于多參數(shù)影像組學(xué)列線圖模型預(yù)測子宮內(nèi)膜癌LVSI的研究,得到了較高的預(yù)測效能,其AUC為0.82,結(jié)果相較本研究低,可能是由于該研究樣本量相對(duì)較少,還有可能是列線圖引入了不同的臨床指標(biāo)。
特征選擇是機(jī)器學(xué)習(xí)模型開發(fā)中非常重要的過程,如果將所有特征數(shù)據(jù)都輸入到機(jī)器學(xué)習(xí)算法或模型中,則可能會(huì)發(fā)生過擬合[21]。最近的一項(xiàng)研究發(fā)現(xiàn),利用強(qiáng)相關(guān)特征建立的模型較不篩選的模型更加穩(wěn)定,并且能夠獲得更好的預(yù)測效果[22]。本研究通過LASSO回歸降維篩選出13個(gè)與LVSI具有較強(qiáng)相關(guān)的特征并構(gòu)建Rad-score,建立的預(yù)測模型具有較高的效能。在這13個(gè)特征中形狀和GLRLM特征最多,可能與EC的LVSI更具相關(guān)性。形狀特征是腫瘤重要的形態(tài)學(xué)特征之一,其反映了腫瘤在形狀方面的物理特性,其值越大代表腫瘤的形態(tài)越不規(guī)則,邊界越不清晰,從而反映腫瘤邊緣的微環(huán)境特征越具有較高的惡性度。本研究發(fā)現(xiàn),篩選出來的13個(gè)特征對(duì)LVSI預(yù)測貢獻(xiàn)較大的前2 名均為形態(tài)特征,分別為T2WI 平面度和ADC球度,λ系數(shù)為0.652和0.349。平面度越大代表腫瘤越大,球度值越大說明腫瘤區(qū)域表面積越大,說明LVSI(+)腫瘤形態(tài)越不規(guī)則,對(duì)周圍正常組織的侵犯性越強(qiáng)。GLRLM 代表圖像信號(hào)灰度強(qiáng)度值或行程長度差異,其值越大說明腫瘤越容易出血、壞死、囊變等因而引起圖像信號(hào)越不均勻,惡性程度也越高。另外,本研究還有一個(gè)發(fā)現(xiàn),在篩選出的13 個(gè)組學(xué)特征中CE-T1WI序列提取的組學(xué)特征相較其他兩個(gè)序列居多,這說明腫瘤的特異性行為與CE-T1WI中的影像組學(xué)信息密切相關(guān)。CE-T1WI通過對(duì)比劑進(jìn)入腫瘤內(nèi)部的微循環(huán),從而定量分析腫瘤組織內(nèi)部的生存供血情況來判斷腫瘤的生物學(xué)行為[23-24]。因此,本研究得到的結(jié)果與CE-T1WI對(duì)評(píng)估腫瘤異質(zhì)性的貢獻(xiàn)是相對(duì)應(yīng)的。
本研究有幾方面局限性,首先,這是一個(gè)單中心的回顧性研究,只選入接受手術(shù)的患者,這可能會(huì)引入選擇偏差;其次,本研究樣本量較小,僅有202例患者,因此,在整個(gè)隊(duì)列中隨機(jī)分為訓(xùn)練集和驗(yàn)證集,可能會(huì)導(dǎo)致過擬合,而且缺少外部數(shù)據(jù)驗(yàn)證;另外,影像組學(xué)依賴于專家定義的有限特征,本研究對(duì)每個(gè)序列只提取了107個(gè)影像組學(xué)特征,可能還有一些與LVSI相關(guān)性較強(qiáng)的未知特征沒有被包含在內(nèi)。
綜上所述,本研究提取mpMRI影像組學(xué)特征建立的列線圖能對(duì)EC 的LVSI 達(dá)到較高的預(yù)測效能,有望成為一種在體術(shù)前預(yù)測LVSI 的影像學(xué)生物標(biāo)記,為臨床個(gè)性化的治療方案和預(yù)后判斷提供決策支持。
作者利益沖突聲明:全體作者均聲明無利益沖突。