崔達(dá)華,劉愛連*,郭 妍,田士峰,牛雅欣,李 昕,宋清偉,莊麗娜
(1.大連醫(yī)科大學(xué)附屬第一醫(yī)院放射科,遼寧 大連 116011;2.通用電氣藥業(yè)(上海)有限公司,上海 201203;3.通用電氣(中國)有限公司,上海 200000)
子宮內(nèi)膜癌(endometrial cancer, EC)占女性生殖系統(tǒng)惡性腫瘤的20%~30%[1],其中80%為子宮內(nèi)膜樣腺癌(endometrioid adenocarcinoma, EA)[2-3]。相比低分化(病理分級(jí)G3)EA和透明細(xì)胞癌、漿細(xì)胞癌等其他類型內(nèi)膜癌,中、高分化(病理分級(jí)G2、G1)EA侵襲性更弱,較少發(fā)生淋巴管間隙浸潤(rùn),患者預(yù)后更好[2,4]。最新美國國立綜合癌癥網(wǎng)絡(luò)(national comprehensive cancer network, NCCN)指南[5]提出,對(duì)國際婦產(chǎn)科聯(lián)盟(Federation International of Gynecology and Obstetrics, FIGO)ⅠA期且病理G1、G2級(jí)EA患者不建議行系統(tǒng)淋巴結(jié)清掃。目前MRI是評(píng)估腫瘤分級(jí)、淋巴結(jié)轉(zhuǎn)移和患者生存期的最有效的方法,其中彌散加權(quán)成像(diffusion weighted imaging, DWI)逐漸用于診斷婦科惡性腫瘤[6]。影像組學(xué)可定量提取圖像的高通量特征,以獲取反映腫瘤異質(zhì)性的信息[7]。腫瘤全域表觀彌散系數(shù)(apparent diffusion coefficient, ADC)定量參數(shù)有助于判斷EA病理分級(jí),但部分參數(shù)的診斷效能較低[4]。本研究觀察基于ADC圖的影像組學(xué)評(píng)價(jià)EA病理分級(jí)的價(jià)值。
1.1 研究對(duì)象 回顧性收集2012年1月—2019年12月97例于大連醫(yī)科大學(xué)附屬第一醫(yī)院經(jīng)術(shù)后病理診斷EA的女性患者,年齡34~84歲,中位年齡58歲;其中65例為中、高分化EA,32例為低分化EA。納入標(biāo)準(zhǔn):①無MR檢查禁忌證;②術(shù)前2周內(nèi)接受MR檢查(包括DWI);③術(shù)前未接受放射、化學(xué)或其他治療。排除標(biāo)準(zhǔn):①M(fèi)RI偽影嚴(yán)重;②子宮病灶最大直徑<1.0 cm。檢查前患者均簽署知情同意書。
1.2 儀器與方法 采用GE Signa HDxt 1.5T MR掃描儀,體部8通道相控陣線圈。囑患者檢查前禁食4~6 h,檢查前1 h飲水約500 ml。囑患者仰臥,頭先進(jìn),行盆腔CT掃描,范圍為髂前上棘至恥骨聯(lián)合水平,重點(diǎn)觀察子宮內(nèi)膜和子宮結(jié)合帶、宮腔內(nèi)病變大小、范圍、是否累及宮頸或?qū)m旁及有無淋巴結(jié)轉(zhuǎn)移。參數(shù):軸位T1W,采用快速擾相梯度回波序列,TR 400 ms,TE 8.0 ms,矩陣 320×192,NEX 2.0,掃描時(shí)間100 s;軸位 T2W,采用快速自旋回波序列,TR 4 000 ms,TE 125 ms,矩陣 320×192,NEX 4.0,掃描時(shí)間143 s;軸位DWI,采用單次激發(fā)自旋平面回波序列,TR 4 000 ms,TE 71.1 ms,矩陣 128×128,NEX 6.0,b值0、600 s/mm2,掃描時(shí)間88 s;層厚均為5.0 mm,層間隔均為1.0 mm,F(xiàn)OV均為32 cm×32 cm。
1.3 提取影像組學(xué)特征 于GE ADW 4.6工作站重建ADC圖,并以DICOM格式導(dǎo)出。由具有2年MRI診斷經(jīng)驗(yàn)的醫(yī)師1采用ITK-SNAP軟件在ADC圖像上逐層手動(dòng)勾畫腫瘤邊緣,合成三維ROI(three-dimensional ROI, 3D-ROI),見圖1;由具有10年MRI診斷經(jīng)驗(yàn)的醫(yī)師2復(fù)核并導(dǎo)入A.K.分析軟件,提取402個(gè)高維影像組學(xué)特征,包括一階特征、形狀特征、灰度共生矩陣特征、灰度大小區(qū)域矩陣特征和游程矩陣特征。
圖1 患者女,52歲,中-低分化EA(FIGO ⅠA期) A.軸位ADC圖示子宮內(nèi)膜腫塊樣增厚,呈低信號(hào);B.軸位ADC圖示ROI(紅色區(qū)域);C、D.腫塊于軸位(C)和矢狀位FS T2WI(D)呈稍高信號(hào)
1.4 構(gòu)建影像組學(xué)模型 采用合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique, SMOTE)使低分化樣本量達(dá)65,以與中、高分化病例數(shù)相同。按7∶3比例將患者分為訓(xùn)練集(n=90,中、高分化45例,低分化45例)和驗(yàn)證集(n=40,中、高分化20例,低分化20例)。對(duì)自訓(xùn)練集樣本中提取的402個(gè)影像組學(xué)特征進(jìn)行降維(圖2):首先采用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法,基于十折交叉驗(yàn)證方法篩選得到最優(yōu)懲罰因子,并在該條件下篩選得到系數(shù)非零的特征;再以方差分析剔除變異度方差小于1的特征;通過Spearman相關(guān)性分析進(jìn)行特征降維,剔除與其他特征相關(guān)性高于0.9的冗余特征;最后基于上述篩選得到有意義的組學(xué)特征,在訓(xùn)練集內(nèi)構(gòu)建多變量Logistic回歸模型,通過對(duì)上述特征進(jìn)行不同權(quán)重的線性加和計(jì)算得到影像組學(xué)評(píng)分:影像組學(xué)評(píng)分=-0.322×特征2-1.687×特征3+0.331×特征4+0.055×特征5+1.889×特征6-0.873×特征7-0.952×特征8-0.908×特征1+0.0918(表1),用于判斷EA病理分級(jí)及驗(yàn)證驗(yàn)證集數(shù)據(jù)。
表1 提取并降維后得到的訓(xùn)練集的8個(gè)影像組學(xué)特征
圖2 提取訓(xùn)練集影像組學(xué)特征 A.經(jīng)LASSO篩選得到30個(gè)系數(shù)非零的特征,最優(yōu)懲罰因子alpha為0.03;B.剔除與其他特征相關(guān)性高于0.9的冗余特征,剩余8個(gè)影像組學(xué)特征,相關(guān)性熱圖顯示去冗余后特征之間無強(qiáng)相關(guān)性
1.5 統(tǒng)計(jì)學(xué)分析 采用R studio(Version 1.0.143)軟件包進(jìn)行處理。繪制受試者工作特征(receiver operating characteristic, ROC)曲線、校準(zhǔn)曲線和臨床決策曲線,以Delong檢驗(yàn)比較Logistic回歸模型在訓(xùn)練集和驗(yàn)證集中的診斷效能。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
影像組學(xué)模型在訓(xùn)練集與驗(yàn)證集中評(píng)價(jià)EA病理分級(jí)的準(zhǔn)確率、曲線下面積(area under the curve, AUC)、敏感度、特異度、陽性預(yù)測(cè)值(positive prediction value, PPV)及陰性預(yù)測(cè)值(negative prediction value, NPV)分別為77.78%、0.87、73.33%、82.22%、80.49%及75.51%和77.50%、0.84、80.00%、75.00%、76.19%及78.95%;其ROC曲線、校準(zhǔn)曲線和決策曲線見圖3、4。Delong檢驗(yàn)結(jié)果顯示該模型在訓(xùn)練集與驗(yàn)證集的診斷效能差異無統(tǒng)計(jì)學(xué)意義(Z=-0.44,P=0.66)。
圖3 影像組學(xué)模型預(yù)測(cè)訓(xùn)練集EA病理分級(jí) A.ROC曲線;B.校準(zhǔn)曲線(y軸表示低分化EA所占真實(shí)比例,x軸表示影像組學(xué)模型預(yù)測(cè)低分化EA的概率,灰色虛線表示理想預(yù)測(cè)結(jié)果,藍(lán)色實(shí)線表示實(shí)際預(yù)測(cè)結(jié)果);C.決策曲線(黑色實(shí)線表示所有EA均被識(shí)別為低分化時(shí)的凈收益,黑色虛線表示所有EA均被識(shí)別為中高分化時(shí)的凈收益,紅線代表影像組學(xué)模型帶來的凈收益)
圖4 影像組學(xué)模型預(yù)測(cè)驗(yàn)證集EA病理分級(jí) A.ROC曲線;B.校準(zhǔn)曲線(y軸表示低分化EA所占真實(shí)比例,x軸表示影像組學(xué)模型預(yù)測(cè)低分化EA的概率,灰色虛線表示理想預(yù)測(cè)結(jié)果,藍(lán)色實(shí)線表示實(shí)際預(yù)測(cè)結(jié)果);C.決策曲線(黑色實(shí)線表示所有EA均被識(shí)別為低分化時(shí)的凈收益,黑色虛線表示所有EA均被識(shí)別為中高分化時(shí)的凈收益,紅線代表影像組學(xué)模型帶來的凈收益)
EA組織學(xué)表現(xiàn)為類正常的內(nèi)膜腺體,但正常子宮內(nèi)膜間質(zhì)消失,伴癌旁內(nèi)膜腺體增生。中、高分化EA腺管排列擁擠、紊亂,結(jié)構(gòu)類似增生的內(nèi)膜腺體;而低分化EA較少形成腺樣結(jié)構(gòu),多呈實(shí)性板狀分布,核異型性明顯,核分裂象多見。不同病理分級(jí)腫瘤的微環(huán)境(包括細(xì)胞增殖狀態(tài)、細(xì)胞計(jì)數(shù)和微血管密度)各異,侵襲性亦不同[5],圖像灰度強(qiáng)度、像素位置、體素強(qiáng)度的排列和相互關(guān)系隨之發(fā)生變化。
對(duì)于常規(guī)ADC定量參數(shù)與EC病理分級(jí)的關(guān)系存在爭(zhēng)議[2]。NOUGARET等[8]以ADC預(yù)測(cè)EC病理分級(jí)和淋巴管及血管浸潤(rùn)中的腫瘤全域,發(fā)現(xiàn)分化程度高(G1、G2)的EC的ADC明顯高于分化程度較低(G3)者。KISHIMOTO等[9]選取腫瘤病灶的3個(gè)代表區(qū)域測(cè)量其ADC,發(fā)現(xiàn)ADC與EA病理分級(jí)無明顯關(guān)聯(lián)。上述研究結(jié)論之所以相悖,可能與腫瘤壞死程度不同有關(guān)[10]。也有研究[4,11]認(rèn)為僅于病灶某一層面設(shè)置ROI不能真實(shí)地反映腫瘤的異質(zhì)性。
本研究采用SMOTE對(duì)少數(shù)類樣本進(jìn)行擴(kuò)增,首先對(duì)少數(shù)類樣本進(jìn)行分析,然后根據(jù)其分布在鄰近樣本中人工合成新樣本,并添加到數(shù)據(jù)集中,以避免樣本過擬合而影響建模結(jié)果。該方法是隨機(jī)過采樣算法的改進(jìn)方案,可在一定程度上解決生成樣本重疊所致模型過擬合的問題,已廣泛用于處理醫(yī)學(xué)影像數(shù)據(jù)[12-13]。一般多因素Logistic回歸對(duì)樣本和特征數(shù)量的要求為10∶1,而本研究樣本量為97,剩余影像組學(xué)特征數(shù)量為8,基本符合要求,且模型針對(duì)訓(xùn)練集與驗(yàn)證集表現(xiàn)出的診斷效能差異無統(tǒng)計(jì)學(xué)意義,提示過擬合風(fēng)險(xiǎn)偏低。
本研究最終納入預(yù)測(cè)模型的8個(gè)影像組學(xué)特征包括灰度共生矩陣特征、游程矩陣特征和形狀特征?;叶裙采仃囂卣?熵和Haralick特征)反映病灶的復(fù)雜性和紋理的粗細(xì)程度[14],病灶越復(fù)雜,圖像紋理越混亂,腫瘤異質(zhì)性越大。游程矩陣(短游程突出、長(zhǎng)游程高灰度級(jí)突出、長(zhǎng)游程低灰度級(jí)突出)主要描述病灶的復(fù)雜性、層級(jí)變化及紋理粗細(xì)程度等,該值越大則病灶越復(fù)雜,腫瘤異質(zhì)性越大[15]。形狀特征則可定量反映圖像中的病灶形狀。決策曲線分析結(jié)果表明,本研究構(gòu)建的模型無論在何種診斷閾值下均可為患者帶來較高的凈收益;其在驗(yàn)證集中鑒別低分化與中、高分化EA的準(zhǔn)確率為77.50%,AUC為0.84,敏感度為80.00%,特異度為75.00%,PPV和NPV分別為76.19%和78.95%。
本研究的局限性:①低分化EA樣本量少,未來將擴(kuò)大樣本量以檢測(cè)模型的魯棒性和普適性;②回顧性單中心研究,今后將進(jìn)一步開展多中心、大樣本量影像組學(xué)研究加以完善;③未檢測(cè)觀察者間一致性。
綜上所述,基于ADC圖的影像組學(xué)模型對(duì)評(píng)價(jià)EA病理分級(jí)有一定價(jià)值,可輔助臨床制定治療方案。