鮑遠照,葛亞瓊,程琦,劉欣,嚴立,韋煒
腎嫌色細胞癌(chromophobe renal cell carcinoma,CRCC)和腎嗜酸細胞腺瘤(renal oncocytoma,RO)是腎臟少見的局限性腫瘤,CRCC約占所有腎腫瘤的6%~8%,RO約占所有腎臟病變的3%~7%[1-2]。雖然CRCC為惡性腫瘤,RO為良性腫瘤,但兩者在形態(tài)學、組織學、電鏡和免疫組化特征上存在許多共性,在影像特征上也存在較多重疊[3-4]。腫瘤的臨床治療及預后評估往往與其分型密切相關,具有侵襲性的類型可能會選擇消融或手術切除,而表現(xiàn)為惰性的類型則可能會選擇隨訪觀察[5-6]。因此,術前準確鑒別CRCC與RO具有重要意義。影像組學是一種通過提取、分析和解釋定量成像參數(shù),反映腫瘤異質(zhì)性,為腫瘤分型分級、基因定位、早期治療及預后評估提供有用信息的新工具[7]。本研究旨在探討基于增強CT影像組學在鑒別CRCC與RO中的應用價值。
1.病例資料
回顧性搜集2013年3月-2020年1月間我院經(jīng)病理證實的CRCC和RO患者。病例納入標準:①嚴格按照固定掃描包獲得完整CT三期增強圖像;②此前未接受介入治療。病例排除標準:①圖像存在顯著噪聲或其他質(zhì)量問題;②病理診斷不明確或單個病灶同時含有多種腫瘤成分。
2.圖像采集
CT檢查采用GE Discovery CT 750或GE Optima CT 680。掃描參數(shù):管電壓120 kV,管電流200~300 mA,層厚5 mm,層間距5 mm,掃描范圍為肺基底到髂嵴。CT增強掃描采用非離子型碘對比劑碘海醇(320 mg I/mL),劑量60~80 mL,高壓注射,依次于皮髓期(延遲30 s)、實質(zhì)期(延遲70 s)和排泄期(延遲180~300 s)進行圖像采集。由于平掃圖像上難以區(qū)分病灶與周圍正常腎組織,故本研究只選取了對比增強三期圖像。
3.數(shù)據(jù)擴增
數(shù)據(jù)擴增被證明是避免數(shù)據(jù)量小時過擬合的有效方法,已經(jīng)成功應用于多種不同的基于機器學習分類任務中[8-12]。如Hodgdon等[11]通過獲取病灶正中央及正中至上下兩極中間的軸面圖像,將每個腎臟病變擴增至三張精選的軸向圖像,基于這些圖像的紋理特征建立支持向量機模型鑒別乏脂性血管平滑肌脂肪瘤與腎細胞癌,并獲得了較為理想的結(jié)果??紤]到本研究的病例數(shù)較少可能會導致潛在的過擬合,本研究采用了類似的方法,通過獲取每期病灶最大層面的軸面圖像及其單側(cè)(CRCC)或雙側(cè)(RO)較大層面的軸面圖像(依據(jù)病灶大小,間隔1~3個層間距),擴大研究的樣本數(shù)據(jù),盡量保證兩種類型腎腫瘤樣本量的一致性。數(shù)據(jù)擴增后的結(jié)果是從35個CRCC病灶中獲得70副軸面圖像,從23個RO病灶中獲取69副軸面圖像。
4.圖像分割和特征提取
由兩位分別有5年及10年以上工作經(jīng)驗的放射科醫(yī)師在不知病理結(jié)果的情況下協(xié)商后共同選出病灶邊界最清晰的時相,并在此期相中選取病灶樣本圖像,沿輪廓勾畫ROI,然后將ROI復制粘貼于其他時相,適當調(diào)整ROI的位置、大小及形狀,盡可能使ROI的選取在不同時相中保持一致。導入的樣本圖像格式為DICOM,導出的ROI格式為NII。為降低圖像窗寬、窗位不同造成視覺上的誤差,在ROI勾畫之前對圖像窗寬窗位進行歸一化處理(設置窗寬280 HU,窗位40 HU)。將皮髓期、實質(zhì)期、排泄期的病灶樣本圖像及勾畫的相應ROI圖像分別導入A.K(Analyze kit,GE healthcare,Shanghai)軟件進行特征提取。為降低不同設備對影像組學特征穩(wěn)定性的影響,在特征提取之前對圖像進行了預處理,即對每個樣本圖像進行z-score轉(zhuǎn)化,將圖像強度轉(zhuǎn)化到標準正態(tài)分布之內(nèi)(均值為0,標準差為1)。每期提取的特征以7:3的比例分割為訓練集與驗證集,特征篩選與模型構(gòu)建采用訓練集的數(shù)據(jù),驗證集數(shù)據(jù)用于驗證模型的泛化性。
5.特征篩選與模型建立
首先使用最大相關最小冗余(Maximal relevance and minimal redundancy,mRMR)算法去除冗余和無關的特征,保留20個特征;然后使用LASSO十折交叉驗證進一步篩選特征,建立影像組學標簽,計算每一例患者的組學評分Radscore,并分別對訓練組和試驗組CRCC和RO的Radscore進行比較。
6.統(tǒng)計學分析
采用R軟件(Version:3.5.1)對影像組學數(shù)據(jù)進行統(tǒng)計學分析。采用受試者工作特征(receiver operating characteristic,ROC)曲線評價Radscore的分類性能,并根據(jù)約登指數(shù)計算敏感度、特異度和模型準確率、陰性預測值、陽性預測值。采用Delong檢驗比較各模型間的診斷效能。
采用SPSS 24.0軟件對CRCC與RO患者的臨床特征及各病灶的影像學特征進行分析。計量資料的組間比較采用獨立樣本t檢驗,計數(shù)資料的組間比較采用成組設計χ2檢驗。以P<0.05為差異有統(tǒng)計學意義。
1.CRCC與RO的臨床及影像學特征
35例CRCC與21例RO患者的臨床特征比較中,兩組患者性別差異無統(tǒng)計學意義(P>0.05),平均發(fā)病年齡差異有統(tǒng)計學意義(P=0.032)。35個CRCC病灶與23個RO病灶的影像學特征比較中,長徑、鈣化、假包膜、中央瘢痕、節(jié)段性增強反轉(zhuǎn)及平掃均勻度情況差異均無統(tǒng)計學意義(P>0.05,表1);在強化方式上兩組均主要表現(xiàn)為皮髓期及實質(zhì)期持續(xù)強化,延遲期減退。
2.特征篩選結(jié)果
每期每個軸面圖像提取出396個特征,包括直方圖特征、灰度聯(lián)通區(qū)域矩陣特征、灰度共生矩陣特征、Haralick特征、游程矩陣特征、形態(tài)學特征等6大類,共計396個特征。使用mRMR去除冗余和無關的特征后剩余20個特征;然后使用LASSO和十折交叉驗證進一步篩選特征,保留最優(yōu)特征子集。結(jié)果顯示,皮髓質(zhì)期的最佳特征有6個,其中來自直方圖特征中的Kurtosis表現(xiàn)出較好的預測價值;實質(zhì)期的最優(yōu)特征有13個,其中來自區(qū)域大小矩陣中的Intensity Variability及灰度共生矩陣中的Inverse Difference Moment_AllDirection_offset4_SD表現(xiàn)出較好的預測價值;排泄期的最優(yōu)特征有7個,其中來自灰度共生矩陣中的GLCMEntropy_angle45_offset7表現(xiàn)出較好的預測價值;而三期整合組篩選出的最優(yōu)特征子集同樣有7個,其中來自排泄期灰度游程矩陣中的ShortRunEmphasis_angle0_offset4表現(xiàn)出了較好的預測價值。皮髓質(zhì)期組、實質(zhì)期組、排泄期組和三期整合組經(jīng)mRMR 和LASSO篩選出特征及相應評估系數(shù)(圖1),特征越重要,其相對評估系數(shù)的絕對值也越大。
3.模型的診斷效能
皮髓質(zhì)期模型、實質(zhì)期模型、排泄期模型及整合模型在鑒別CRCC與RO時均表現(xiàn)出較好的預測能力(表2、圖2)。Delong結(jié)果顯示各模型間的AUC差異無統(tǒng)計學意義(P>0.05),表明幾個模型的性能相當。
采用決策曲線分析(Decision curve,DCA)評價模型的臨床實用性,得出在0.2~1.0閾值范圍內(nèi)皮髓質(zhì)期模型、實質(zhì)期模型、排泄期模型及整合模型均表現(xiàn)出較高的凈效益,說明各模型在鑒別CRCC與RO上均具有較高的臨床應用價值。
目前,組織病理學是腫瘤良惡性鑒別診斷的金標準。在形態(tài)學及組織學上,CRCC的嗜酸亞型與RO常因重疊而造成診斷上的困難,前者因為明顯的嗜酸性顆粒狀胞質(zhì)、不明顯的核周空暈以及不明顯的植物性胞膜而容易誤診為RO,而后者出現(xiàn)細胞核異型性或有侵襲性表現(xiàn)時往往被誤診為CRCC;在免疫組織化學上,雖然相關文獻報道一系列標記物嘗試鑒別這兩種病變,但是還沒有哪一種標記物能夠準確鑒別[13]。影像學方法雖然不能對其進行最終的定性診斷,但在一定程度上可以反映腫瘤的異質(zhì)性,為兩者之間的鑒別診斷提供有用信息。
圖1 經(jīng)mRMR和LASSO篩選后的皮髓期組、實質(zhì)期組、排泄期組和三期整合組的最優(yōu)特征及相應評估系數(shù),Y軸代表特征名稱,X軸代表特征的相應系數(shù)。a)皮髓質(zhì)期組;b)實質(zhì)期組;c)排泄期組;d)三期整合組。
圖2 皮髓質(zhì)期模型、實質(zhì)期模型、排泄期模型及整合模型鑒別CRCC與RO的ROC曲線。淺綠色曲線表示皮髓質(zhì)期,紅色曲線表示實質(zhì)期,藍色曲線表示排泄期,深綠色曲線表示整合期。a)訓練組;b)驗證組。圖3 皮髓質(zhì)期模型、實質(zhì)期模型、排泄期模型及整合組模型鑒別CRCC與RO的DCA曲線。橫坐標為閾概率,縱坐標為凈獲益率。紫色曲線表示所有樣本均為陽性,黑色水平線表示所有樣本均為陰性;黃色曲線、藍色曲線、綠色曲線及紅色曲線分別表示皮髓質(zhì)期組、實質(zhì)期組、排泄期組及三期整合組模型在0.2~1.0的閾值范圍內(nèi)具有較高的凈效益。
傳統(tǒng)CT圖像是通過對兩者影像學特征的視覺觀察來定性評估,如病灶大小、鈣化、假包膜、中央瘢痕、節(jié)段性增強反轉(zhuǎn)、平掃均勻度及強化方式等[14-16]。其中節(jié)段性增強反轉(zhuǎn)定義為病灶某些節(jié)段強化方式的不同,皮髓質(zhì)期明顯強化的節(jié)段在排泄期強化不明顯,而皮髓質(zhì)期強化不明顯的節(jié)段在排泄期明顯強化[17]。強化方式中的流入型、平臺型、流出型是按照時間-密度曲線來區(qū)分的。流入型是指病灶皮髓質(zhì)期呈輕中度強化,實質(zhì)期進一步強化,排泄期明顯強化;平臺型是指病灶在皮髓質(zhì)期、實質(zhì)期呈輕中度強化,排泄期仍持續(xù)強化;流出型是指病灶在皮髓質(zhì)期呈明顯強化,實質(zhì)期及排泄期強化明顯減退[18]。Rozenkrantz等[19]研究了這兩種類型腫瘤的影像學特征,認為CRCC與RO具有相似的定性特征,本研究得出了相似的結(jié)論,兩者常規(guī)CT影像學特征間存在較多的重疊,可見傳統(tǒng)的CT檢查在鑒別CRCC與RO時存在困難。
影像組學主要是從腫瘤中定量提取與病理生理學相關的特征,以顯示腫瘤的異質(zhì)性,從而進行預后評估[20-21]。目前,利用影像組學對CRCC與RO進行鑒別診斷的研究還不多[22-24]。已有的這些研究不僅存在樣本量過小導致的過擬合問題,還存在發(fā)病率不同導致的數(shù)據(jù)不平衡問題。如Yu等[22]提取了腎透明細胞癌、腎乳頭狀細胞癌、CRCC、RO四種類型腎腫瘤的紋理特征,使用SVM分類器對腫瘤進行分類,區(qū)分CRCC和RO的AUC為0.882。Li等[23]通過提取44例CRCC及17例RO的紋理特征,使用5種分類器對腫瘤進行鑒別,使用支持向量機結(jié)果最好,得出的AUC為0.945 。Baghdadi等[24]利用192例腎占位圖像設計半自動分割法及卷積神經(jīng)網(wǎng)絡,并用20例CD117(+)的CRCC與RO進行驗證,得出的AUC為0.95。本研究嘗試應用一種經(jīng)過驗證的數(shù)據(jù)擴增方法,將這些問題最小化;同時增加驗證組對模型進行驗證,增加模型的可泛化性。結(jié)果表明,皮髓質(zhì)期、實質(zhì)期及排泄期模型在鑒別兩者時均表現(xiàn)出較好的預測價值;整合模型雖然也有著較好的預測價值,但整合模型單獨與三期模型相比較,預測性能差異無統(tǒng)計學意義,未增加模型的預測價值。
本研究存在以下局限性:①本研究為單中心回顧性研究,未來需要進行前瞻性多中心研究對模型進行驗證;②本研究雖然對數(shù)據(jù)進行了擴增,但依舊是對較少病例的軸面圖像進行重復培訓和測試,未來需要對大樣本病灶進行多層面三維容積測量;③本研究采用多臺CT掃描設備,一定程度上影響了影像組學特征的穩(wěn)定性;④本研究未對影像組學特征的可重復性進行分析。
綜上所述,本研究結(jié)果初步表明基于增強CT影像組學鑒別診斷CRCC與RO具有相對較高的臨床應用價值,值得進一步探索改進,以期獲得更加成熟的鑒別診斷體系,從而提高腎占位性病變的診斷符合率。