丁聰,魏明翔,賈建業(yè),周圍,柏根基*
卵巢腫瘤是婦科最常見的腫瘤之一,其可定性分為良性、惡性及交界性,卵巢上皮源性惡性腫瘤(malignant epithelial ovarian tumors, MEOTs)約占卵巢惡性腫瘤的95%,為婦科惡性腫瘤的首要致死疾病[1-2]。卵巢交界性上皮源性腫瘤(boderline epithelial ovarian tumors, BEOTs)好發(fā)于育齡期女性[3],約占卵巢上皮性腫瘤的10%~15%[4],與MEOTs相比具有較低的BRCA 突變率[5],不侵犯卵巢組織,但是可以擴散至卵巢外的腹膜組織[6]。雖然約2%的BEOTs具有惡變可能,但大部分的BEOTs可完全治愈,若診斷準確,可對患者行保留生育的術(shù)式,這將大大改善患者治療后的生活質(zhì)量[7-8]。因BEOTs 發(fā)病隱匿且無典型及明顯的臨床癥狀,目前對于BEOTs準確診斷仍具有難度,即便是冷凍切片病理對BEOTs的診斷準確率也僅有69.2%[9],這可能導致患者選擇了錯誤的手術(shù)方式,因此在術(shù)前對其進行準確診斷是很有必要的。
MRI 在診斷卵巢腫瘤方面具有多種優(yōu)勢,并且在臨床中已廣泛應(yīng)用,常規(guī)MRI 可以顯示BEOTs 和MEOTs 的形態(tài)特征,有助于二者的鑒別[10-12]。但是影像表觀特征并非固定的,依靠影像表觀特征的診斷在一定程度上依賴于影像醫(yī)師的主觀評估,忽略了腫瘤內(nèi)部的潛在特征及患者的臨床表現(xiàn)。因此需要一種更加客觀且結(jié)合患者臨床表現(xiàn)的手段來對BEOTs及MEOTs在術(shù)前進行準確、安全的鑒別及診斷。
影像組學目前已被廣泛應(yīng)用于腫瘤研究方面,其可以高通量地提取人眼無法識別的定量特征,對腫瘤性疾病的進行術(shù)前診斷及預(yù)后分析方面展現(xiàn)了極大的應(yīng)用價值[10]。而列線圖則可簡單直觀地展示研究結(jié)果。MRI 對卵巢良性腫瘤和惡性腫瘤的鑒別診斷具有較高的價值[13-14]。因T2WI 較其他序列更能清晰地反映疾病的病理情況,且具有更好的可重復(fù)性[15],同時T2WI在臨床廣泛使用,故本研究基于T2WI來勾畫病灶。本研究通過影像組學列線圖方法,基于T2WI提取影像組學特征并結(jié)合臨床危險因素構(gòu)建列線圖,探討其在術(shù)前鑒別BEOTs 及MEOTs 方面的效果及臨床應(yīng)用價值。
本研究為回顧性研究,依據(jù)納入標準連續(xù)地收集2016 年1 月至2021 年5 月在南京醫(yī)科大學附淮安第一醫(yī)院就診的上皮源性卵巢腫瘤患者。納入標準為:(1)術(shù)后經(jīng)組織病理證實的卵巢上皮腫瘤的患者;(2)術(shù)前2 周內(nèi)完成MRI 掃描。排除標準為:(1)與研究目的不一致的其他卵巢腫瘤,如:生殖細胞腫瘤、性索間質(zhì)腫瘤以及轉(zhuǎn)移瘤等;(2)既往有盆腔手術(shù)史及放化療病史;(3)MRI 序列缺失或圖像質(zhì)量較差;(4)MRI 圖像未能完整展示腫瘤。最終,192 例卵巢上皮腫瘤患者被納入本次研究,包括BEOTs 患者72 人及MEOTs 患者120 人。本研究經(jīng)南京醫(yī)科大學附屬淮安第一醫(yī)院倫理委員會批準,免除受試者知情同意,批準文號:YX-2021-001-01。
使用1.5 T 磁共振成像儀(Siemens,Avanto or Aera,德國)和3.0 T 磁共振掃描儀(Siemens,Verio or Spectra,德國)及相控陣線圈進行圖像采集?;颊哂诓杉靶杞持辽? h,并且適度飲水以充盈膀胱。設(shè)定的T2WI掃描參數(shù)如下所示。(1)Avanto SE掃描參數(shù):TR 1100 ms,TE 120 ms,層厚7.4 mm,F(xiàn)OV 384 mm×512 mm;(2)Verio SE 掃描參數(shù):TR 1700 ms,TE 98 ms,層 厚6.1 mm,F(xiàn)OV 240 mm×320 mm;(3)Spectra SE 掃 描 參 數(shù):TR 4500 ms,TE 96 ms,層 厚 5.4 mm,F(xiàn)OV 240 mm×320 mm;(4)Aera SE 掃描參數(shù):TR 4410 ms,TE 87 ms,層厚5 mm,F(xiàn)OV 640 mm×640 mm。
將T2WI圖像導入至ITK-SNAP軟件(v.3.8.0,http://www.itksnap.org)進行圖像手動分割。圖像感興趣區(qū)域(region of interest,ROI)的分割由兩位具有六年工作經(jīng)驗的且不知道患者臨床及病理資料的影像科住院醫(yī)師獨立完成。ROI 范圍包括了腫瘤的囊性成分和實性成分,且其他MRI 序列作為ROI 勾畫的參考,以盡可能區(qū)分腫瘤與正常組織的邊界。如果患者腫瘤是多灶性的,只選擇最大的腫塊來勾畫ROI(圖1)。通過計算每個特征的組內(nèi)及組間相關(guān)系數(shù)(intra-/interclass correlation coefficient,ICC)來評估ROI的一致性。具體勾畫流程如下:首先由醫(yī)師A 在軸位T2WI 像上逐層手工勾畫;同時,從訓練樣本中隨機選取30 名患者的影像圖像,由另一位影像科醫(yī)師B進行分割,以評估觀察者間的一致性。醫(yī)師A 間隔一個月再對所有病例重新進行ROI 的勾畫,以評估觀察者內(nèi)一致性。
圖1 感興趣區(qū)勾畫流程圖。1A:卵巢腫瘤患者軸位T2加權(quán)圖像;1B~1C:勾畫感興趣區(qū);1D:通過軟件對感興趣區(qū)進行三維呈現(xiàn)。Fig. 1 Delineation flow chart of area of interest. 1A:Axial T2-weighted images of patients with ovarian tumors; 1B and 1C: Sketching the region of interest; 1D:Rendering of the region of interest through software.
在特征提取前對圖像進行標準化并重采樣到3 mm×3 mm×3 mm體素。隨后使用基于Python(v3.7,http:/pyradiomics.readthedocs.io/)的PyRadiomics庫提取共1130 個影像組學特征,其提取特征可分為五組:一階特征18 個,形態(tài)學特征14 個,二階特征75 個,經(jīng)過拉普拉斯-高斯濾波器濾波后的特征279個及小波變換后的特征744個。
當特征的ICC>0.80時,可認為該特征具有穩(wěn)定性及可重復(fù)性,故保留醫(yī)生A 第一次勾畫所提取的ICC>0.80 的特征用以后續(xù)分析。首先,對訓練集和測試集數(shù)據(jù)進行Z值標準化。隨后,對訓練集特征進行Mann-WhitneyU檢驗,保留P<0.05 的特征。用隨機森林算法計算剩余特征的重要性權(quán)重,并進行相關(guān)性檢驗,刪除相關(guān)系數(shù)大于0.9且特征重要性權(quán)重低的特征。最后,采用最小絕對收縮選擇算子(least absolute shrinkage and selection operator, LASSO)算法從剩余的特征中篩選出具有鑒別價值的特征用以計算Radscore及建模。
其中Xi為LASSO 所選擇的影像組學特征,βi為其相應(yīng)的系數(shù)。
通過多因素logistic回歸分析對候選預(yù)測因子包括患者年齡、月經(jīng)狀況、生育情況、腹痛、腹脹、腫瘤標記物指標(包括HE4、CA125、CA199、CA724、CEA、AFP)進行篩選,得出獨立預(yù)測因子并結(jié)合Radscore構(gòu)建影像組學列線圖,并且使用ROC曲線及決策曲線分析(decision curve analysis, DCA)評估模型的臨床應(yīng)用價值。
采用R語言(Version.3.5.3, www.R-project.org)、SPSS(Version.25.0,IBM, Armonk, NY, USA)軟件進行分析及繪圖。P<0.05 為差異具有統(tǒng)計學意義。人口學和臨床資料中,連續(xù)變量采用獨立樣本t檢驗(正態(tài)分布)或Mann-WhitneyU檢驗(非正態(tài)分布)分析,分類變量采用卡方檢驗或Fisher 精確概率檢驗進行分析。采用mRMRe 程序包對提取出的影像組學特征進行篩選。應(yīng)用glmnet程序包對一下組學特征進行LASSO 降維處理。使用pROC 程序包繪制ROC 曲線,采用ROC 曲線下面積(area under the curve,AUC)、敏感度、特異度及準確度以評估預(yù)測效能。采用rms 程序包繪制列線圖。同時通過rmda 程序包繪制決策曲線分析(decision curve analysis, DCA)模型的應(yīng)用價值。采用Delong檢驗比較影像組學模型及聯(lián)合模型之間的差異。
共納入192名患者,包括BEOTs患者72人(37.5%)及MEOTs 患者120 人(62.5%),圖2 為兩組卵巢腫瘤的影像及病理圖像。數(shù)據(jù)集經(jīng)過8∶2 的比例隨機分為訓練集(n=153)和測試集(n=39)。兩組患者的年齡、生育情況、月經(jīng)情況、腹痛、腹脹及腫瘤標志物(包括HE4、CA125、CA199、CA72-4、CEA 及AFP)差異無統(tǒng)計學意義(P>0.05)(表1)。患者的具體組織下亞型如表2所示。
表1 訓練集與測試集患者臨床資料Tab.1 Clinical data of patients in training set and test set
表2 各組腫瘤病理構(gòu)成情況(例)Tab.2 Pathological composition of tumors in each group(case)
圖2 兩組卵巢腫瘤示例及相對應(yīng)的病理圖片。2A~2B:女,79 歲,T2 脂肪抑制序列顯示左側(cè)卵巢腫瘤,病理證實為交界性漿液性囊腺瘤;2C~2D:女,49歲,T2脂肪抑制序列顯示左側(cè)卵巢腫瘤,病理證實為子宮內(nèi)膜樣癌。Fig. 2 Two groups of ovarian tumors and pathological confirmation pictures corresponding to them. 2A-2B:A 79-year-old woman with a left ovarian tumor, the corresponding pathological picture confirmed borderline serous epithelial ovarian tumors.2C-2D:A 49-year-old woman with a left ovarian tumor,the corresponding pathological picture confirmed malignant serous epithelial ovarian tumors.
T2WI 提取的1130 個影像組學特征中,1064 個影像組學特征表現(xiàn)出了較好的一致性(ICC>0.80),其分布熱圖如圖3 所示。經(jīng)過Mann-WhitneyU檢驗及相關(guān)性分析篩選后,剩余117個特征。經(jīng)十折交叉驗證的LASSO 回歸分析后(圖4A,4B),最后篩選出10 個影像組學特征,其對應(yīng)系數(shù)絕對值如圖4C所示。隨后建立影像組學模型,得到Radscore公式,擬合篩選得到的特征來建立影像組學模型,Radscore公式如下:
圖3 1064個具有較高穩(wěn)定性和差異性的影像組學特征分布熱圖。Fig. 3 Heat map of the distribution of 1064 image omics features with high stability and difference.
圖4 影像組學模型建立流程圖。4A:通過LASSO 回歸選擇參數(shù),最優(yōu)超參數(shù)λ值即為第一個虛線所對應(yīng)的模型最低點的橫坐標;圖4B:根據(jù)λ確定具有非零系數(shù)的影像組學特征繪制的系數(shù)曲線;圖4C:篩選出13個影像組學特征及其對應(yīng)系數(shù)的絕對值;圖4D:結(jié)合HE4和Radscore構(gòu)建的列線圖模型。Fig. 4 Flow chart of image omics model building. 4A: Selecting parameters by LASSO regression, the optimal hyperparameter λ value is the abscess graph of the lowest point of the model corresponding to the first dotted line; 4B: Coefficient curves based on image omics features with non-zero coefficients determined by λ;4C:Screening the absolute values of 13 radiomics features and their corresponding coefficients;4D:The nomogram constructed by combining HE4 and Radscore.
計算后得出基于T2WI的影像組學特征的模型在訓練集及測試集的AUC值分為是0.925(0.883~0.965)及0.819(0.670~0.969)。
對患者候選預(yù)測因子計算后得出高性能預(yù)測因子HE4 [OR=1.018(1.010~1.027),P<0.01],故聯(lián)合HE4 及Radscore 構(gòu)建列線圖(圖4D)。通過校準曲線(圖5A、5B)可見訓練集和測試集中,影像組學列線圖預(yù)測結(jié)果與病理結(jié)果具有更高的一致性?;谟跋窠M學特征及臨床特征的聯(lián)合模型在訓練集及測試集的AUC值分別為0.947 (0.912~0.982)及0.914 (0.821~1)(圖6)。Delong檢驗顯示,基于T2WI的影像組學模型與聯(lián)合模型之間的差異不具有統(tǒng)計學意義(P=0.1738)。決策曲線(圖7)顯示危險閾值在0.01~1.00 范圍內(nèi),聯(lián)合模型的凈收益最大,故影像組學列線圖對于BEOTs及MEOTs鑒別方面的臨床應(yīng)用價值高于單獨的影像組學模型。
圖5 列線圖模型預(yù)測交界性及惡性卵巢上皮源性卵巢癌結(jié)果與病理結(jié)果一致性的校準曲線,刻畫的實線與45°虛線的吻合程度反映了列線圖的預(yù)測性能。5A:訓練集;5B:測試集。 圖6 測試集中影像組學模型及聯(lián)合模型的ROC曲線。 圖7 影像組學模型及聯(lián)合模型的臨床決策曲線。Fig. 5 Calibration curves of the nomogram for predicting borderline and malignant epithelial ovarian cancer with the consistency of pathological results. The degree of coincidence between the delineated solid line and the 45°-dotted line reflects the prediction performance of the line graph. Fig. 6 ROC curves of the radiomics model and the combined model in the test set.Fig.7 The clinical decision curve of the radiomics model and the combined mode.
本研究開發(fā)并驗證了一組用于術(shù)前鑒別BEOTs及MEOTs的影像組學列線圖。結(jié)果初步表明,聯(lián)合臨床特征的影像組學列線圖比單獨的影像組學模型具有更高的預(yù)測效能,其在訓練集及測試集中均展示了良好的效能,AUC值分別為0.947及0.914。
影像組學作為一種新興的非侵入性技術(shù),通過提取和分析圖像中像素的灰度強度和位置來提供腫瘤異質(zhì)性數(shù)據(jù),可以挖掘人眼無法識別的高維特征[16]。同時有研究發(fā)現(xiàn),放射組學特征與潛在的病理改變之間存在顯著的相關(guān)性[17-19]。此前有數(shù)個基于CT 的研究展示了影像組學在卵巢腫瘤鑒別方面的價值[20-21]。Giuliano 等[22]的Meta 分析指出在鑒別BEOTs 及MEOTs方面,MRI展現(xiàn)了比CT更為優(yōu)異的診斷效能。這可能是由于MRI 較CT 具有更高的對比度及分辨率。同時多項研究發(fā)現(xiàn),基于磁共振的影像組學模型可以在術(shù)前識別上皮性卵巢癌的腹膜轉(zhuǎn)移及預(yù)測術(shù)后復(fù)發(fā)風險,改善患者的預(yù)后[23-25],故本研究采用MRI圖像提取影像特征。Ye 等[26]、Li 等[27]的研究分別基于T2、DWI及T1增強序列的圖像進行特征提取,構(gòu)建的模型均展現(xiàn)出優(yōu)秀價值。但上述研究均基于增強MRI,增強MRI需要注射對比劑,因此在腎功能不全及有對比劑不良反應(yīng)病史的患者中禁止使用。簡俊明等[28]的研究發(fā)現(xiàn),基于增強MRI 及平掃MRI 圖像所構(gòu)建的影像組學模型在鑒別Ⅰ、Ⅱ型卵巢癌方面的能力沒有顯著性差異。因此本研究使用MRI 平掃圖像提取影像組學特征,最終篩選出十個影像組學特征來建立影像組學模型,包括兩個一階特征,兩個經(jīng)拉普拉斯-高斯濾波器濾波后的特征以及六個小波變換后的特征,十個特征合并成Rad-Score。該影像組學模型在訓練集(AUC=0.925)及測試集(AUC=0.819)中均展現(xiàn)了優(yōu)秀的診斷效能。
在臨床診斷中,年齡、月經(jīng)情況、腹水情況及腫瘤標志物等均是不可忽略的因素,同時Rad-Score可作為獨立的生物學標志物,故本研究聯(lián)合Rad-Score及臨床因素構(gòu)建聯(lián)合模型。本研究經(jīng)過篩選出臨床特征的為腫瘤標志物HE4。HE4主要在生殖道和呼吸道表達,在上皮性卵巢癌中高表達,被認為是最有前途的卵巢癌輔助標志物[29-31]。對于影像上不確定的卵巢腫塊,上皮性卵巢癌患者指南(2018版)建議測定血清HE4。多項研究指出HE4是鑒別卵巢上皮腫瘤的最佳標志物,同時也與卵巢癌患者的不良預(yù)后有關(guān)[32-33]。羅玉婷[30]的研究發(fā)現(xiàn)MRI 聯(lián)合HE4 比單一MRI 在鑒別卵巢腫瘤方面更有價值,這與我們的研究結(jié)果相類似。本研究結(jié)合Rad-Score及HE4開發(fā)了影像組學列線圖,結(jié)果表明,無論在訓練集(AUC=0.947)還是測試集(AUC=0.914)中,影像組學列線圖較影像組學模型具有更高的AUC 值。但Delong 檢驗顯示影像組學列線圖模型與影像組學模型之間ROC差異無統(tǒng)計學意義(P值=0.174),這可能是由于我們納入的樣本較少,且MEOTs 患者與BEOTs 患者數(shù)目有懸殊,同時我們的研究是單中心研究,可能會對結(jié)果產(chǎn)生偏差。決策曲線結(jié)果顯示聯(lián)合模型的凈收益較影像組學模型更大,故我們可以認為影像組學列線圖對于BEOTs及MEOTs鑒別方面的臨床應(yīng)用價值高于單獨的影像組學模型,可幫助臨床醫(yī)生在術(shù)前無創(chuàng)、準確地鑒別BEOTs 及MEOTs,并幫助臨床選擇合適的治療方案。
本研究仍存在一些局限性:(1)本研究樣本量較少,且缺乏外部驗證,回顧性研究存在可能的偏倚,今后當擴大樣本量并且進行多中心研究;(2)本研究ROI為手工勾畫,部分病例的病灶與周圍組織分界欠清,因此勾畫時會將部分ROI 漏畫或者將正常組織勾畫入ROI;(3)卵巢上皮腫瘤亞型眾多,本研究未更細化地進行分析研究,日后當對于組織學亞型分類進行分析探索;(4)本研究所構(gòu)建的模型僅在于區(qū)分BEOTs 及MEOTs,但是卵巢腫瘤種類多樣,因此在日后研究中,應(yīng)當納入更多類型的卵巢腫瘤,以更好地應(yīng)用于臨床。
綜上所述,本研究構(gòu)建基于MRI-T2WI 及腫瘤標志物HE4 的影像組學列線圖,為BEOTs 及MEOTs 的術(shù)前鑒別診斷提供了新的精確、客觀、無創(chuàng)、直觀的評估方法。
作者利益沖突聲明:全部作者均聲明無利益沖突。