劉震昊,白旭,葉慧義,郭愛(ài)桃,林明權(quán),左盼莉,王海屹*
腎血管平滑肌脂肪瘤(angiomyolipoma,AML)是最常見(jiàn)的腎臟良性腫瘤[1],治療僅推薦在經(jīng)過(guò)慎重選擇的患者中進(jìn)行[2]。腎細(xì)胞癌是最常見(jiàn)的腎臟惡性腫瘤[3],常用的治療方法有手術(shù)干預(yù)和消融療法等[2]。對(duì)AML 的正確診斷至關(guān)重要的是識(shí)別腫瘤內(nèi)脂肪[4]。然而,3%~4%的AML在斷面圖像上檢測(cè)不到脂肪[5],被稱為乏脂血管平滑肌脂肪瘤(angiomyolipoma without visible fat,AMLwvf),其影像表現(xiàn)類似腎癌,常導(dǎo)致不必要的切除[6]。因此,術(shù)前正確區(qū)分AMLwvf 和腎癌十分重要。
然而,穿刺活檢結(jié)果可能不準(zhǔn)確[7]。CT 在診斷AMLwvf 中僅具有中等敏感性(67%)[8];磁共振化學(xué)位移成像的鑒別價(jià)值存在爭(zhēng)議[9];其他磁共振序列也很難實(shí)現(xiàn)區(qū)分,包括擴(kuò)散加權(quán)成像[10]、T2 加權(quán)成像[11]和增強(qiáng)模式[12]。目前,基于磁共振圖像的紋理分析或機(jī)器學(xué)習(xí)鑒別AMLwvf 和腎癌的研究很少,本研究旨在通過(guò)磁共振T2WI來(lái)探索是否存在能鑒別二者的影像組學(xué)特征獨(dú)立預(yù)測(cè)因子,同時(shí)使用多特征建立機(jī)器學(xué)習(xí)模型,并評(píng)價(jià)其預(yù)測(cè)效能。
回顧性收集中國(guó)人民解放軍總醫(yī)院2012 年12 月至2017 年12 月經(jīng)病理證實(shí)的腎血管平滑肌脂肪瘤、腎透明細(xì)胞癌、乳頭狀腎細(xì)胞癌和腎嫌色細(xì)胞癌。本研究經(jīng)解放軍總醫(yī)院第一醫(yī)學(xué)中心倫理委員會(huì)批準(zhǔn),因?qū)倩仡櫺匝芯?,免除簽署知情同意?shū)。
納入標(biāo)準(zhǔn):(1)術(shù)前在本院接受腎臟磁共振檢查;(2)均在3.0 T 磁共振設(shè)備下進(jìn)行檢查。排除標(biāo)準(zhǔn):(1)術(shù)前接受過(guò)干預(yù)治療的患者,如介入治療等;(2)既往有腎臟腫瘤手術(shù)史,本次為同側(cè)或?qū)?cè)復(fù)發(fā)的患者;(3)囊性腫塊(強(qiáng)化的組織成分小于25%)[13];(4)MRI圖像存在呼吸運(yùn)動(dòng)等偽影;(5)病灶直徑小于兩倍層厚(1.2 cm)的腫瘤;(6)磁共振化學(xué)位移圖像(同反相位圖像)顯示存在脂肪的血管平滑肌脂肪瘤。
患者入組:共納入腎乏脂血管平滑肌脂肪瘤20 例、腎透明細(xì)胞癌1869 例、乳頭狀腎細(xì)胞癌156 例和腎嫌色細(xì)胞癌105 例。為匹配4 種腫瘤的樣本量[14-15],隨機(jī)選擇了腎透明細(xì)胞癌20 例、乳頭狀腎細(xì)胞癌20 例、腎嫌色細(xì)胞癌20 例,共納入研究對(duì)象80 例。AMLwvf 組:男6 例,女14 例,發(fā)病年齡26~70 歲,平均年齡(44.9±12.2)歲,病灶大小13.3~84.1 mm,平均大小(35.3±22.5) mm;腎癌組:男37 例,女23 例,發(fā) 病 年 齡25~78 歲,平 均 年 齡(52.7±12.4)歲,病灶大小18.7~92.0 mm,平均大小(42.7±19.8) mm。
所有患者均行腎臟磁共振平掃或平掃及增強(qiáng)掃描。掃描儀為GE Discovery MR750 3.0 T 和GE Signa HDx 3.0 T。檢查前需禁食6~8 h。兩臺(tái)掃描儀掃描序列和參數(shù)一致,掃描范圍覆蓋全腎臟。本研究使用序列包括:(1)軸位呼吸觸發(fā)脂肪抑制快速自旋回波T2WI序列,掃描參數(shù)TR:2000~6000 ms,TE:80~130 ms,回波鏈長(zhǎng)度:8~16,矩陣:320×224,層厚:6 mm,層 間距:0.6 mm,F(xiàn)OV:360 mm×360 mm 至400 mm×400 mm;(2)橫軸位T1WI 同反相位序列,TR 4.1 ms,TE 1.2 ms、2.4 ms,矩陣256×192,加速因子2,層厚、層間距、FOV 同上;(3)軸位增強(qiáng)T1WI:TR 2.8 ms,TE 1.3 ms,矩陣288×180,層厚6 mm,層間距,F(xiàn)OV 340 mm×340 mm至400 mm×400 mm。
所有入組的腎臟腫瘤標(biāo)本均由一位專門(mén)從事泌尿系統(tǒng)疾病病理研究的病理科醫(yī)生在不知道影像和病理診斷結(jié)果的前提下,根據(jù)2016 版WHO 腎臟腫瘤分類系統(tǒng)[16]進(jìn)行回顧性分析,對(duì)腫瘤的病理診斷進(jìn)行再次確認(rèn)。
將所有軸位DICOM 格式的T2WI 匿名導(dǎo)入放射組學(xué)云平臺(tái)V2.1[匯醫(yī)慧影科技(北京)有限公司]。由兩名放射科醫(yī)生(觀察者1 和觀察者2,分別擁有5 年和9 年腹部影像診斷經(jīng)驗(yàn))將圖像進(jìn)行逐層勾畫(huà)以分割腫瘤。腫瘤分割遵循的共同原則(圖1):(1)勾畫(huà)腫瘤所有層面ROI,以便云平臺(tái)生成感興趣容積(volume of interest,VOI),對(duì)病灶最上和最下的兩個(gè)層面不做勾畫(huà),以盡可能減小部分容積效應(yīng)的影響;(2)ROI 邊緣距離病灶邊緣2 mm,以保證ROI 內(nèi)全部是腫瘤組織。逐層勾畫(huà)完成后,云平臺(tái)自動(dòng)整合多層ROI信息,生成腫瘤的VOI信息,通過(guò)VOI信息進(jìn)行特征提取。每個(gè)VOI 均提取出93 個(gè)原始特征,包括5大類:(1)一階統(tǒng)計(jì)量(first order statistics,n=19);(2)基于形狀的特征(shape features,n=15);(3)灰度共生矩陣(gray-level co-occurrence matrix,GLCM,n=27);(4)灰度游程矩陣(gray-level run-length matrix,GLRLM,n=16);(5)灰度區(qū)域大小矩陣(gray-level size zone matrix,GLSZM,n=16)。
1.5.1 單特征分析
通過(guò)非參數(shù)檢驗(yàn)在93 個(gè)特征中尋找AMLwvf 和腎癌間存在差異的特征。通過(guò)比較ROC曲線下面積,選擇差異性最大的特征作為最佳特征,并進(jìn)行診斷效果評(píng)價(jià)。
1.5.2 多特征建模
使用IBM SPSS Modeler 18.0 版本。采用決策樹(shù)C5.0 算法建模,過(guò)程如下:(1)特征初篩:運(yùn)行軟件特征選擇節(jié)點(diǎn),分界值設(shè)為0.99,分類基礎(chǔ)為皮爾遜;(2)特征排序:用初篩的特征運(yùn)行決策樹(shù)C5.0 節(jié)點(diǎn),計(jì)算這些特征相對(duì)重要性并排序;(3)確定子集:使用最重要的前2、3、4和5個(gè)特征分別組成4個(gè)特征子集;(4)模型建立:利用這4 個(gè)特征子集分別建立決策樹(shù)C5.0 模型。建模參數(shù)如下:輸出類型為“決策樹(shù)”;使用“組符號(hào)”;使用和不使用增強(qiáng)分別建模;使用交叉驗(yàn)證,設(shè)定為80 折(留一交叉驗(yàn)證);修剪純度為75,并同時(shí)使用全局修剪;每個(gè)子分支的最小記錄數(shù)為2;(5)模型評(píng)價(jià):比較各模型留一(80 折)交叉驗(yàn)證的準(zhǔn)確性,準(zhǔn)確度最高模型為最終模型,并通過(guò)最終模型的ROC曲線來(lái)評(píng)估模型。
圖1 手工分割ROI 示例。A:乏脂血管平滑肌脂肪瘤(AMLwvf);B:腎透明細(xì)胞癌(clear cell RCC);C:乳頭狀腎細(xì)胞癌(papillary RCC);D:腎嫌色細(xì)胞癌(chromophobe RCC)Fig.1 Examples of ROI drawn manually.A:Angiomyolipoma without visible fat;B:Clear cell RCC;C:Papillary RCC;D:Chromophobe RCC.
圖2 AMLwvf 組和腎癌組間有統(tǒng)計(jì)差異特征的ROC 曲線 圖3 區(qū)分AMLwvf組和腎癌組的最佳決策樹(shù)C5.0最終模型的ROC曲線Fig. 2 ROC curves of features with statistical difference between AMLwvf group and renal cell carcinoma group Fig.3 ROC curves of optimum decision tree C5.0 model for distinguishing AMLwvf group and renal cell carcinoma group
表1 AMLwvf組和腎癌組間有統(tǒng)計(jì)學(xué)差異的特征[M(IQR)]Tab.1 Features with statistical difference between AMLwvf group and renal cell carcinoma group[M(IQR)]
使用SPSS 24.0 軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。采用Kruskal-Wallis 檢驗(yàn)評(píng)估腎癌亞型(腎透明細(xì)胞癌、乳頭狀腎細(xì)胞癌和腎嫌色細(xì)胞癌)之間的潛在差異。Mann-Whitney U檢驗(yàn)比較AMLwvf和腎癌各影像組學(xué)特征值的差異。本研究采用P<0.05(雙側(cè)檢驗(yàn))作為有顯著統(tǒng)計(jì)差異的標(biāo)準(zhǔn),采用逐步的霍爾姆-班費(fèi)羅尼過(guò)程[12]來(lái)抵消由多次比較引起的I 型統(tǒng)計(jì)錯(cuò)誤的可能性。組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)來(lái)評(píng)價(jià)觀察者間(觀察者1 和觀察者2)的信度,ICC>0.75時(shí),認(rèn)為兩個(gè)觀察者分割腫瘤得到的特征值有較好的一致性,再將兩位觀察者測(cè)得的數(shù)據(jù)取平均值作為最終分析數(shù)據(jù)。使用MedCalc 19.0.7版本繪制ROC曲線,通過(guò)最大約登指數(shù)確定最佳界值,并進(jìn)行診斷效能評(píng)價(jià)。
兩位觀察者間的ICC值介于0.823~0.975,一致性較好。克魯斯卡爾-沃利斯檢驗(yàn)顯示所有特征在腎癌各亞型之間沒(méi)有區(qū)別(P>0.05),因此將3 種腎癌亞型合并成為一個(gè)腎癌組[12]進(jìn)行后續(xù)紋理分析和建模。將曼惠特尼-U 檢驗(yàn)生成的所有P<0.05 的特征運(yùn)用逐步的霍爾姆-班費(fèi)羅尼過(guò)程后,得到4 個(gè)有顯著統(tǒng)計(jì)差異的特征,分別是最小灰度、第10百分位數(shù)、差方差、對(duì)比度,詳見(jiàn)表1 和圖2。其中最小灰度的AUC 最大(0.888),確定為最佳特征。最小灰度的最大約登指數(shù)為0.683,最佳界值為192.50,以此界值診斷腎血管平滑肌脂肪瘤的敏感度為80.00%,特異度為88.33%,陽(yáng)性預(yù)測(cè)值為69.57%,陰性預(yù)測(cè)值為92.98%,準(zhǔn)確性為86.25%。其他特征的診斷效能見(jiàn)表2。
表2 AMLwvf組和腎癌組間有統(tǒng)計(jì)學(xué)差異特征的ROC曲線分析結(jié)果Tab.2 The results of ROC curve analysis of features with statistical difference between AMLwvf group and renal cell carcinoma group
表3 基于T2WI特征鑒別AMLwvf和腎癌的決策樹(shù)C5.0模型及其效能評(píng)價(jià)Tab.3 Decision tree C5.0 model based on T2WI features for distinguishing AMLwvf and renal cell carcinoma and its effectiveness evaluation
運(yùn)行“特征選擇”節(jié)點(diǎn)后,篩選出29 個(gè)特征。用這些特征運(yùn)行決策樹(shù)C5.0 節(jié)點(diǎn),獲得了特征的相對(duì)重要性排序,重要性前5 位的特征排序依次為:差平均、第10百分位數(shù)、平面度、平均灰度和表面積-體積比。分別使用最重要的前2、3、4 和5 個(gè)特征組成的特征子集建模(使用或不使用增強(qiáng)),共生成8 個(gè)模型。留一交叉驗(yàn)證結(jié)果顯示前2 個(gè)特征組成的子集在使用增強(qiáng)算法時(shí)所建立的決策樹(shù)C5.0模型預(yù)測(cè)準(zhǔn)確性最高,達(dá)95.0%,確定為最終模型,該模型AUC 為0.950,診斷血管平滑肌脂肪瘤的敏感度為90.00%,特異度為100%,陽(yáng)性預(yù)測(cè)值為100%,陰性預(yù)測(cè)值為96.77%,準(zhǔn)確度為97.5%。其他7 個(gè)模型的診斷效能和交叉驗(yàn)證結(jié)果詳見(jiàn)表3,評(píng)估最終模型的ROC 曲線見(jiàn)圖3。
術(shù)前準(zhǔn)確區(qū)分AMLwvf和腎癌常常是具有挑戰(zhàn)性的,這導(dǎo)致了2%~6%的被手術(shù)切除的腎臟實(shí)性腫塊是AML[17]。AMLwvf缺乏具有特征性的脂肪組織,使其CT 和磁共振圖像表現(xiàn)類似腎癌,因此主觀判讀斷層圖像很難實(shí)現(xiàn)準(zhǔn)確鑒別。本研究以T2WI 為基礎(chǔ),分析了影像組學(xué)特征和決策樹(shù)C5.0 模型對(duì)于區(qū)分AMLwvf和腎癌的效能。
在單因素分析篩選的4 個(gè)特征中,特征“最小灰度”的AUC 最大(0.888),區(qū)分AMLwvf 和腎癌的準(zhǔn)確性達(dá)到86.25%,但診斷AMLwvf 陽(yáng)性預(yù)測(cè)值偏低(69.57%),這可能與AMLwvf 組和腎癌組之間樣本量差異有關(guān)。
在多特征建模分析中,本研究采用的模型為決策樹(shù),算法為C5.0,目前該算法已應(yīng)用于醫(yī)學(xué)領(lǐng)域的研究[18]。相比其他決策樹(shù)算法(如ID3算法和C4.5算法),決策樹(shù)C5.0 算法具有更高的執(zhí)行效率、在缺少數(shù)據(jù)及輸入字段多時(shí)表現(xiàn)穩(wěn)健、強(qiáng)大的增強(qiáng)方法來(lái)提高分類準(zhǔn)確性以及模型規(guī)則簡(jiǎn)明易懂等優(yōu)勢(shì)。因此,決策樹(shù)C5.0 算法特別適用于樣本量較少和(或)特征較多的情況。
本研究通過(guò)決策樹(shù)C5.0 算法共產(chǎn)生8 個(gè)模型,其中特征差平均和第10百分位數(shù)組成的子集在使用增強(qiáng)方法生成模型時(shí),準(zhǔn)確度達(dá)到97.5%。留一交叉驗(yàn)證顯示準(zhǔn)確性僅略有下降,為95.0%。有研究指出將交叉驗(yàn)證過(guò)程應(yīng)用于紋理分析可以對(duì)實(shí)際錯(cuò)誤率提供充分的評(píng)估[12]。交叉驗(yàn)證用于機(jī)器學(xué)習(xí)中泛化誤差的估計(jì)和算法性能的比較[19]。故交叉驗(yàn)證結(jié)果可能說(shuō)明本研究建立的決策樹(shù)C5.0模型具有很好的泛化能力。
過(guò)去已有基于CT和磁共振圖像進(jìn)行的紋理分析和機(jī)器學(xué)習(xí)的研究來(lái)解決同樣的臨床問(wèn)題。本研究建立的決策樹(shù)模型在敏感度、特異度和準(zhǔn)確度上較You 等[20]的研究結(jié)果(分別為82%、76%和85%)有明顯提高。Li 等[21]通對(duì)ADC 圖紋理分析來(lái)區(qū)分AMLwvf 和腎癌,獲得的AUC、敏感度和特異度分別為0.854、78.8%和81.5%,本研究結(jié)果較之具有較大優(yōu)勢(shì)。
本研究結(jié)果較好,原因之一可能是研究采用的圖像為T(mén)2WI,因?yàn)門(mén)2WI 上AMLwvf 的信號(hào)強(qiáng)度顯著低于非AMLwvf 的信號(hào)強(qiáng)度[22],這可能與AMLwvf 中平滑肌成分有關(guān)[23]。T2WI 的影像組學(xué)特征,尤其是一階統(tǒng)計(jì)量特征,很可能顯示出這種腫瘤間的信號(hào)差異,從而有助于AMLwvf與腎癌的鑒別。如本研究單因素和多因素分析過(guò)程中篩選出的特征“最小灰度”及“平均灰度”代表VOI內(nèi)最低和平均灰度水平,或可反映腫瘤間T2WI信號(hào)強(qiáng)度差異。本研究全部采用脂肪抑制的T2WI。Semelka等[24]指出,脂肪抑制技術(shù)可能改善腹部磁共振圖像,并在評(píng)估疾病方面提供更大的信心。抑制腹部脂肪信號(hào)強(qiáng)度是必要的,因?yàn)椋?1)脂肪會(huì)產(chǎn)生相位偽影,從而降低圖像質(zhì)量[25];(2)脂肪會(huì)引起化學(xué)位移偽影[26],這對(duì)于評(píng)估外生腎腫瘤的邊緣會(huì)造成困擾。因此脂肪抑制的T2WI 較普通T2WI 更適合腎臟腫瘤的紋理分析,從而可能進(jìn)一步提高了鑒別準(zhǔn)確性。
(1)由于AMLwvf 發(fā)病率低,導(dǎo)致本文樣本量偏少,今后會(huì)嘗試多中心研究以進(jìn)一步擴(kuò)充樣本量;(2)雖然所有病例圖像均來(lái)自相同廠商(GE)和場(chǎng)強(qiáng)(3.0 T)的設(shè)備,并且全部采用相同的參數(shù)掃描,但不確定同一廠商不同型號(hào)的設(shè)備是否會(huì)影響影像組學(xué)特征;(3)病灶分割時(shí),每層ROI 從病灶邊緣向內(nèi)收2 mm,且病灶最上和最下層面不勾畫(huà),導(dǎo)致邊緣部分腫瘤信息丟失;(4)本研究?jī)H使用T2WI 建立預(yù)測(cè)模型,但預(yù)測(cè)能力較好(交叉驗(yàn)證準(zhǔn)確率已達(dá)95%),以后會(huì)探索多序列建模是否會(huì)進(jìn)一步提升診斷效能。
綜上,本研究基于T2WI 探索了單特征和決策樹(shù)C5.0模型對(duì)于區(qū)分和預(yù)測(cè)AMLwvf和腎癌的效能。單特征分析診斷AMLwvf的準(zhǔn)確性較好。特征差平均和第10百分位數(shù)建立的決策樹(shù)C5.0模型獲得了很好的診斷效能,尤其是診斷AMLwvf的特異性和陽(yáng)性預(yù)測(cè)值達(dá)100%,因此該預(yù)測(cè)模型有較高的臨床應(yīng)用推廣價(jià)值。
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。