田士峰,劉愛連*,郭妍,趙瑩,陳安良,李昕
1.大連醫(yī)科大學附屬第一醫(yī)院放射科,遼寧 大連 116011;2.通用電氣醫(yī)療,上海 200000;*通信作者 劉愛連cjr.liuailian@vip.163.com
宮頸癌的發(fā)病率和死亡率居女性惡性腫瘤第四位[1]。病理類型是與宮頸癌預后密切相關的一個重要因素,與宮頸鱗狀細胞癌(cervix squamous cell carcinoma ,CSCC)相比,宮頸腺癌(cervix adenocarcinoma,CA)發(fā)生宮頸間質和淋巴血管間隙浸潤的概率提高,淋巴結和遠處轉移的發(fā)生率高,其五年生存率較CSCC降低約10%~20%[2],且對放射治療的敏感性不及CSCC[3],治療上需考慮個體化。因此,治療前鑒別宮頸癌的病理類型具有重要意義。MRI具有良好的軟組織分辨率和多平面成像特點,能夠較好地對宮頸癌進行定性、鑒別、分期評估及療效評價[4]。影像組學方法通過高通量的定量特征提取,實現(xiàn)了腫瘤異質性的無創(chuàng)分析[5],提升了影像學檢查在輔助臨床決策時對腫瘤篩查、診斷、預后預測的準確性[6]。擴散峰度成像(diffusion kurtosis imaging,DKI)是一種基于水分子非高斯分布模型的MRI功能成像技術,其優(yōu)勢在于反映組織內微環(huán)境的變化情況更為精準[7],經(jīng)后處理可獲得多種參數(shù)圖,以平均擴散峰度(mean kurtosis,MK)圖為特征性參數(shù)圖像。本研究擬探討基于DKI序列MK圖的影像組學方法鑒別CSCC與CA的價值,為宮頸癌患者個體化精準治療方案的制定提供影像學依據(jù)。
1.1 研究對象 回顧性分析2017年1月—2019年12月于大連醫(yī)科大學附屬第一醫(yī)院接受MRI檢查的原發(fā)性宮頸癌患者,納入標準:①經(jīng)手術病理證實為CSCC或CA(排除腺鱗癌等少見類型);②無MRI掃描禁忌證,術前2周內完成MRI掃描,掃描序列包括DKI;③患者檢查前未接受放化療及其他處置(如活檢等)。排除標準:①MRI圖像質量不佳,存在影響病變觀察和數(shù)據(jù)測量的偽影;②病灶顯示不清,直徑<1.0 cm,或所在層面少于3個。納入219例宮頸癌患者,其中CA 21例,年齡37~78歲,平均(58.3±10.3)歲;CSCC 198例,隨機抽取42例,與CA組按照2∶1進行匹配[8],年齡26~72歲,平均(52.3±11.1)歲。最終納入63例,按照7∶3隨機分為訓練組43例和測試組20例。入組病例的臨床表現(xiàn)主要包括接觸性出血、不規(guī)則陰道流血、下腹部不適等。本研究經(jīng)本院倫理委員會審核批準(批準號:PJ-KS-KY-2019-49),所有患者均簽署知情同意書。
1.2 MRI檢查 采用GE Signa HDxt 1.5T超導型MR掃描儀,體部8通道相控陣線圈?;颊邫z查前禁食,并飲水適度充盈膀胱,放置節(jié)育環(huán)者于檢查前1天取環(huán)。患者取仰臥位,掃描序列均為軸位,主要掃描參數(shù)見表1。DKI序列在15個正交方向施加擴散梯度,b值取0、1000 s/mm2和2000 s/mm2。
表1 宮頸癌患者MRI掃描序列及掃描參數(shù)設定
1.3 圖像分割、特征提取與模型構建 掃描完成后將DKI序列原始圖像傳輸至GE ADW 4.6工作站,經(jīng)Function軟件處理后獲得MK圖,然后將所有患者MK圖像以DICOM格式儲存。將所有圖像導入ITK-SNAP軟件(http://www.itksnap.org),由1名具有6年盆腔MRI診斷經(jīng)驗的主治醫(yī)師,以常規(guī)MRI圖像為參考,在MK圖像上沿腫瘤邊緣逐層勾畫感興趣區(qū)(ROI),不要避開出血、壞死、囊變區(qū),后經(jīng)融合獲得腫瘤全域感興趣容積(volume of interest,VOI)(圖1、2),同時由另1名具有10年診斷經(jīng)驗的主治醫(yī)師協(xié)助進行VOI勾畫的復核。
圖1 女,56歲,宮頸黏液腺癌。T2WI示癌灶呈等低信號(箭,A);經(jīng)后處理生成對應層面DKI序列MK偽彩圖(B);紅色區(qū)域為腫瘤實質覆蓋區(qū)(C)
利用人工智能A.K.軟件進行影像組學特征提取,包括一階統(tǒng)計(first order statistics)、形狀(shape)、灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度相關矩陣(gray level dependence matrix,GLDM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度區(qū)域大小矩陣(gray level sizezone matrix,GLSZM)、鄰域灰度差分矩陣(neighbourhood gray-tone difference matrix,NGTDM)等7類組學特征。
1.4 統(tǒng)計學方法 采用R Studio 3.3.2 軟件(http://www.Rproject.org)進行特征篩選。首先使用Spearman相關分析對提取得到的全部特征進行第一次降維,選擇與病理結果相關性>0.1的特征,同時剔除特征之間相關性>0.9的特征;然后使用梯度提升決策樹(gradient boosting decision tree,GBDT)進行第二次降維,基于最小損失函數(shù)的原則選擇最優(yōu)特征。將篩選得到的相關度最高的組學特征構建多元Logistic回歸模型,并將驗證組數(shù)據(jù)代入該模型中進行驗證。繪制受試者工作特征(ROC)曲線,評價模型在訓練組和驗證組中對CSCC和CA的診斷效能,并計算曲線下面積(AUC)、準確度、敏感度、特異度。
圖2 女,55歲,宮頸中分化鱗狀細胞癌。T2WI示癌灶呈等低信號(箭,A);經(jīng)后處理生成對應層面DKI序列MK偽彩圖(B);紅色區(qū)域為腫瘤實質覆蓋區(qū)(C)
2.1 特征篩選與模型建立結果 在MK圖像上勾畫的VOI區(qū)域中,提取組學特征共386個,經(jīng)過Spearman分析選擇得到與病理結果相關性>0.1的特征剩余306個,經(jīng)過剔除特征之間具有高度自相關性(|r|>0.9)的特征后,剩余特征79個,最后經(jīng)過GBDT降維得到符合最小損失函數(shù)原則的7個組學特征(表2)。基于上述篩選得到的7個特征,構建多元Logistic回歸模型,并得到影像組學評分,計算見公式(1)。
表2 最終篩選的7個特征參數(shù)及權重值、誤差、P值
2.2 模型的效能評估 構建的Logistic回歸模型在訓練組、驗證組中鑒別不同病理類型宮頸癌的AUC分別為0.867(95%CI0.773~0.947)、0.846(95%CI0.680~0.976),準確度分別為74.4%、80.0%,敏感度分別為85.7%、85.7%,特異度分別為69.0%、76.9%。模型在訓練組和驗證組的ROC曲線見圖3。
圖3 模型在測試組(A)和驗證組(B)的ROC曲線
3.1 MK圖定量鑒別宮頸癌病理亞型的價值與局限性 MK圖是水分子在空間內各方向上擴散峰度平均值的定量體現(xiàn),可以真實地反映組織微觀結構的復雜程度[9]。既往有多項利用MK值鑒別宮頸癌病理亞型的常規(guī)定量研究,孟楠等[10]測定了宮頸癌腫瘤實質的MK值,發(fā)現(xiàn)CSCC的MK值大于CA,AUC為0.810,該研究的局限性是放置ROI時人為避開了壞死、囊變區(qū)域,未能全面包含腫瘤組織的異質性信息。Wang等[11]的研究勾畫了腫瘤組織的VOI,結果表明CSCC與CA的MK值無差異,提示不同病理類型宮頸癌的常規(guī)VOI定量分析有中和腫瘤異質性信息的可能性。
3.2 影像組學在宮頸癌中的應用現(xiàn)狀 影像組學是一個快速發(fā)展的研究領域,其實質是對各類影像學圖像進行高維度影像特征數(shù)據(jù)的轉化,并可與組織學、基因組學、蛋白組學等相結合,將更深層次的微觀層面信息定量體現(xiàn)在宏觀層面的影像特征上,對腫瘤組織異質性進行更為全面的描述,揭示圖像數(shù)據(jù)與生化、病理等多種臨床信息之間的潛在關聯(lián)等[12-13]。目前影像組學方法在宮頸癌方面的應用主要基于MRI相關圖像,包括T1WI、T2WI、表觀擴散系數(shù)(ADC)、動態(tài)增強(dynamic contrast enhancement,DCE)等,研究內容主要涉及病理特征(如病理分型、分級、脈管侵犯、淋巴結轉移等)的評估以及療效和預后預測等[14-16]。既往的組學相關研究發(fā)現(xiàn):T2WI、ADC等MR圖像中,平均值、偏度、熵等多個一階紋理參數(shù)在CSCC和CA之間存在差異[17-18];謝元亮等[19]分析了DCE的最大強化值、最大強化率兩種灰度圖像上共計64個紋理參數(shù)(包括一階和二階)在CSCC和CA之間的差異,結果提示14個紋理特征參數(shù)在兩種病理類型的宮頸癌之間存在差異,但AUC均小于0.800,多參數(shù)聯(lián)合預測時AUC達到0.830。上述研究未涉及高階影像組學特征的提取。
3.3 基于MK圖的影像組學方法鑒別宮頸癌病理類型的價值 本研究進行了不同病理類型宮頸癌的全域多類影像組學特征提取,提取了7類共計386個組學特征,深度挖掘MK圖所包含的組學信息。通過Spearman相關性分析和GBDT等方法進行降維,合理降低冗余特征可能對模型造成的過擬合效應,最終篩選出7個具有較大鑒別價值的組學預測特征,并建立預測模型。CA的細胞結構較為松散,所含腺體及分泌物量較多,微血管的密度較高、生成能力較強[20];與CA相比,CSCC的細胞密度更大,細胞排列更為緊密,細胞間距及細胞外間隙更小,因此理論上兩者水分子擴散的速度、方向、受限程度均不相同。這種微環(huán)境層面的差異,會體現(xiàn)在MK圖像的均勻度、粗糙度、平滑度等方面,不能依靠肉眼察覺,需要使用組學方法進行提取、量化。本研究最終用于建模的7個特征參數(shù),包含一階統(tǒng)計、GLRLM、GLSZM、NGTDM共4類,上述參數(shù)全面、有效地反映了CSCC與CA之間的MK 圖在灰度分布均勻程度(如Skewness、24Percentile),圖像紋理的基元走向、深淺粗細度、非均勻與復雜程度(如RunVariance、ZoneEntropy),以及圖像體素灰度之間的空間排列關系(如Busyness)等多元化差異信息[21-22]。結果表明,該模型在訓練組與對照組中均有較高的診斷效能。
本研究存在一定的局限性:首先,納入樣本量相對偏小,且為單中心研究,需要今后擴大樣本量并進行多中心外部驗證,提高模型的魯棒性;其次,由于病例數(shù)有限,未對腺癌病理分型做進一步細化(如黏液腺癌、子宮內膜樣腺癌等);再次,VOI的獲得依賴人工勾畫,對于各層面腫瘤邊緣的界定可能受到觀察者主觀經(jīng)驗的影響。
總之,基于DKI序列MK圖的影像組學模型可有效鑒別不同病理類型的宮頸癌,有助于臨床個體化治療方案的制定。