尹勝男 計(jì)一丁 丁 寧 李夢娟 遲 婧 劉 利 張亦弛 金 龍
蘇州大學(xué)附屬蘇州九院影像科(江蘇 蘇州 215200)
膽囊息肉樣病變(PLG)是一種常見的超聲發(fā)現(xiàn),在東方國家的發(fā)病率約為7.4%–9.9%[1],可大致分為腫瘤性病變和非腫瘤性病變[2]。腫瘤性病變中最常見的腺瘤性息肉存在惡變傾向,與息肉樣膽囊癌合并稱為真性息肉[3]。而非腫瘤性病變中最多見的膽固醇性息肉,以及炎性息肉、膽囊腺肌增生癥等,沒有明顯的惡變傾向[4]。惡性PLG在所有膽囊癌中占15%-20%,其早期表現(xiàn)與良性PLG類似,難以鑒別[5]。而膽囊癌預(yù)后極差,5年總體生存率低于5%。由于不同類型的膽囊息肉樣病變預(yù)后差異顯著,因而準(zhǔn)確鑒別息肉的性質(zhì)對于患者選擇合適的治療方式至關(guān)重要。
近年來,CT掃描已越來越廣泛地應(yīng)用于臨床及科研工作。影像組學(xué)(Radiomics)是一個(gè)新興和快速發(fā)展的學(xué)科,其主要目標(biāo)是挖掘現(xiàn)有的醫(yī)學(xué)圖像背后潛在的高維信息幫助臨床決策。Radiomics已廣泛應(yīng)用于研究肺癌[6],肝癌[7],結(jié)直腸癌[8]等。然而,目前為止,鮮少有CT掃描聯(lián)合影像組學(xué)區(qū)分PLG性質(zhì)的報(bào)道。在本研究中,我們嘗試使用三期增強(qiáng)CT掃描及影像組學(xué)的方法為腺瘤性膽囊息肉和膽固醇性膽囊息肉的術(shù)前定性診斷提供更加可靠的依據(jù)。
1.1 一般資料回顧性分析2015年9月至2022年9月于我院行腹部增強(qiáng)CT及膽囊切除術(shù)且病理證實(shí)為膽固醇性膽囊息肉或腺瘤性膽囊息肉的150例患者的臨床資料。
納入標(biāo)準(zhǔn):病灶直徑8-20mm的PLG患者;術(shù)前2周內(nèi)行上中腹部CT平掃及增強(qiáng)掃描;術(shù)后病理證實(shí)為膽固醇性膽囊息肉或腺瘤性膽囊息肉。排除標(biāo)準(zhǔn):因偽影干擾較大(包括金屬偽影、運(yùn)動偽影、呼吸偽影等)或增強(qiáng)時(shí)相不準(zhǔn)確等原因?qū)е碌膱D像質(zhì)量欠佳;病灶直徑大于20mm;病灶較小或與鄰近組織分界欠清導(dǎo)致病灶顯示不夠清晰,難以勾畫。最終150例患者中有100例納入研究,分為膽固醇性息肉組58例和腺瘤性息肉組42例。
1.2 儀器與方法
1.2.1 儀器 CT掃描采用第二代雙源多探測器計(jì)算機(jī)斷層(MDCT)掃描儀(SOMATOM Defnition Flash;Siemens,Erlangen,Germany)。掃描參數(shù)如下:管電壓120kVp;參考管電流300mAs;掃描厚度和層間距5mm;圖像重建厚度和間隔1mm;螺距0.8;球管旋轉(zhuǎn)時(shí)間0.5s/周;探測器寬度128mm×0.6mm。
1.2.2 方法 CT掃描前患者至少禁食4小時(shí),行吸氣訓(xùn)練,掃描時(shí)采用仰臥位,雙手抱頭。先做定位像與CT平掃,然后使用高壓注射器(ulrich GmbH&Co.KG)以3.5mL/s的速率經(jīng)肘前靜脈注射80mL非離子型對比劑碘佛醇(恒瑞醫(yī)療;中國;67.8g/100mL),注射完畢后再以相同速度注射20mL生理鹽水沖洗注射器。分別在注射對比劑后28-32s/55-65s/3-4min后行包括動脈期、門靜脈期和延遲期在內(nèi)的三期增強(qiáng)CT掃描。掃描范圍自膈頂至肝臟下緣1cm左右。在增強(qiáng)掃描過程中,采用對比劑跟蹤技術(shù)計(jì)時(shí)觸發(fā)動脈期,依次獲得動脈期、門靜脈期和延遲期圖像。
1.3 病灶分割及提取1.3.1 圖像導(dǎo)出 增強(qiáng)CT薄層圖像中病灶紋理特征及圖像細(xì)節(jié)顯示清晰,且在門靜脈期顯示病灶輪廓較好。因此,將增強(qiáng)CT門靜脈期薄層圖像從影像歸檔和通信系統(tǒng)(picture archiving and communication systems,PACS)以DICOM格式導(dǎo)入移動硬盤。1.3.2 感興趣區(qū)勾畫 將數(shù)據(jù)導(dǎo)入3D Slicer軟件(https://www.slicer.org),由主治醫(yī)師1在主治醫(yī)師2的指導(dǎo)下沿腫瘤最大層面瘤體邊緣內(nèi)側(cè)1mm處勾畫感興趣區(qū)(region of interest,ROI),對于多發(fā)性病灶,通過討論雙方達(dá)成一致意見后再勾畫ROI(圖1),然后沿腫瘤邊緣勾畫感興趣體積(volume of interest,VOI)(圖2)。經(jīng)過3D Slicer的PyRadiomics插件(https://www.radiomics.io/pyradiomics.html)提取影像組學(xué)特征,總共提取了851個(gè)影像組學(xué)特征,包括18個(gè)一階直方圖特征,14個(gè)形狀特征,75個(gè)紋理特征及744個(gè)小波特征,75個(gè)紋理特征中包括16個(gè)灰度游程矩陣、16個(gè)灰度尺寸區(qū)域矩陣、5個(gè)鄰域灰度差矩陣、14個(gè)灰度相關(guān)矩陣、24個(gè)灰度共生矩陣。數(shù)據(jù)導(dǎo)出為csv格式,經(jīng)過轉(zhuǎn)置,將兩組病例的特征分別合并匯總。
圖1-圖2 膽囊息肉(PLG)ROI勾畫示意圖?;颊撸?,45歲,腺瘤性膽囊息肉。在增強(qiáng)CT門靜脈期圖像上逐層勾畫息肉病灶ROI(圖1),經(jīng)分隔后得到3D模型圖(圖2)。
1.4 CT影像組學(xué)特征篩選與機(jī)器學(xué)習(xí)模型建立使用anaconda軟件(https://www.anaconda.com)中Notebook工具進(jìn)行進(jìn)一步數(shù)據(jù)分析。首先對導(dǎo)入的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、加標(biāo)簽、合并、混序處理;采用T檢驗(yàn)和最小絕對收縮選擇算子(least absolute shrinkage and selection operator,LASSO)對組學(xué)特征進(jìn)行篩選、降維,最終選取最有鑒別意義的組學(xué)特征進(jìn)行建模。然后將樣本按照7:3的比例分為訓(xùn)練集,測試集;采用3種不同機(jī)器學(xué)習(xí)算法[人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(jī)(support vector machine,SVM)、邏輯回歸(logistic regression,LR)]對上述篩選的影像組學(xué)特征構(gòu)建模型。人工神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí)分別使用了2/3/4個(gè)隱藏層,神經(jīng)元個(gè)數(shù)分別取5/2,5/5/2,10/5/5/2,5/5/2/2,對應(yīng)著4個(gè)不同準(zhǔn)確率的模型,在模型應(yīng)用4個(gè)隱藏層,神經(jīng)元個(gè)數(shù)為10/5/5/2時(shí),獲得的準(zhǔn)確率最好,所以應(yīng)用此模型進(jìn)行后續(xù)數(shù)據(jù)分析。同時(shí)將支持向量機(jī)、邏輯回歸模型分析結(jié)果同人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對比,包括準(zhǔn)確率,精準(zhǔn)率、敏感度、特異度,F(xiàn)1度量值,AUC值。最后,通過5次4折交叉驗(yàn)證評估模型,得到20個(gè)模型得分,取平均值進(jìn)行評價(jià)。特征提取及模型構(gòu)建流程圖見圖3。
圖3 基于門靜脈期CT影像組學(xué)機(jī)器學(xué)習(xí)模型構(gòu)建流程圖
1.5 統(tǒng)計(jì)學(xué)分析所有統(tǒng)計(jì)學(xué)檢驗(yàn)均采用python3.9(https://www.python.org)進(jìn)行數(shù)據(jù)分析。預(yù)測效能采用受試者操作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)表示。LASSO算法、ROC曲線采用“sklearn”包。T檢驗(yàn)采用“scipy”包。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 臨床資料的組間比較本研究共有100例患者納入分組。其中腺瘤性息肉組42例:女30例(71.4%),男12例(28.6%),年齡29-79(54±6)歲;膽固醇性息肉組58例:女38例(65.5%),男20例(34.5%),年齡22-68(50±5)歲?;颊唠S機(jī)分為訓(xùn)練集和測試集,訓(xùn)練集有70例,測試集有30例,訓(xùn)練集、測試集兩組間患者性別和年齡不存在顯著性差異(P>0.05)。
2.2 影像組學(xué)分析在7 0 例患者組成的訓(xùn)練集中,采用t檢驗(yàn)和LASSO 算法進(jìn)行篩選(圖4),得到1 0 個(gè)對鑒別膽固醇性息肉和腺瘤性息肉最具價(jià)值的特征,基本特征1 個(gè)、小波特征9 個(gè),組成最優(yōu)特征子集(圖5),包括Original GlszmGray Level NonUniformity,Wavelet-LHLGldm DependenceEntropy,Wavelet-LHLGlszmGray Level NonUniformity Normalized,Wavelet-LHLG lszm Gray Level Variance,Wavelet-LHHGlcmImc1,Wavelet-HLLGlcm Maximum Probability,Wavelet-HLH Firstorder Mean,Wavelet-HHL Glszm SmallAreaLow GrayLevel Emphasis,Wavelet- LLLG lrlmShort Run Emphasis,Wavelet-LLLG lszm GrayLevel Variance。10個(gè)最優(yōu)特征子集在不同層次上的分布見圖6,其相關(guān)性熱度圖(圖7)示10個(gè)最優(yōu)特征的相關(guān)性不強(qiáng),相對獨(dú)立,可全部納入機(jī)器學(xué)習(xí)。
圖7 最優(yōu)特征子集的相關(guān)性熱度圖。圖中所示10個(gè)最優(yōu)特征的相關(guān)性不強(qiáng);圖8 影像組學(xué)訓(xùn)練模型和測試模型鑒別腺瘤性膽囊息肉和膽固醇性膽囊息肉的ROC曲線。人工神經(jīng)網(wǎng)絡(luò)模型的曲線下面積最大,為0.81;
2.3 模型建立利用最優(yōu)特征子集構(gòu)建3種機(jī)器學(xué)習(xí)模型。人工神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí)分別使用了2/3/4個(gè)隱藏層,取不同神經(jīng)元個(gè)數(shù),從而獲得4個(gè)模型。
在訓(xùn)練集的表現(xiàn)為:hidden_layer_sizes=(5,2),準(zhǔn)確率0.59;hidden_layer_sizes=(5,5,2),準(zhǔn)確率0.97;hidden_layer_sizes=(10,5,5,2),準(zhǔn)確率為1;hidden_layer_sizes=(5,5,2,2),準(zhǔn)確率0.97。
在測試集的表現(xiàn)為:hidden_layer_sizes=(5,2),準(zhǔn)確率0.6;hidden_layer_sizes=(5,5,2),準(zhǔn)確率0.73;hidden_layer_sizes=(10,5,5,2),準(zhǔn)確率0.83;hidden_layer_sizes=(5,5,2,2),準(zhǔn)確率0.77。支持向量機(jī)模型,訓(xùn)練集準(zhǔn)確率為0.79,測試集準(zhǔn)確率為0.77;邏輯回歸模型,訓(xùn)練集的準(zhǔn)確率為0.83,測試集準(zhǔn)確率為0.77。在人工神經(jīng)網(wǎng)絡(luò)模型應(yīng)用4個(gè)隱藏層hidden_layer_sizes=(10,5,5,2)時(shí)獲得的準(zhǔn)確率最高。人工神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)及邏輯回歸模型預(yù)測兩組PLG病變性質(zhì)的AUC分別為0.81,0.72,0.74(圖8),測試集AUC值,準(zhǔn)確率,精準(zhǔn)率,靈敏度,特異度及F-1得分等各項(xiàng)數(shù)值人工神經(jīng)網(wǎng)絡(luò)模型均高于支持向量機(jī)及邏輯回歸模型,在預(yù)測中效果最佳(表1、圖9)。
表1 基于門靜脈期CT影像組學(xué)的機(jī)器學(xué)習(xí)模型預(yù)測膽固醇性膽囊息肉和腺瘤性膽囊息肉的效能
圖9 基于門靜脈期CT影像組學(xué)的機(jī)器學(xué)習(xí)模型預(yù)測膽固醇性膽囊息肉和腺瘤性膽囊息肉的效能
以上各個(gè)模型分別經(jīng)過5次4折交叉驗(yàn)證評估所得人工神經(jīng)網(wǎng)絡(luò)模型得分平均值0.72,支持向量機(jī)模型得分平均值為0.76,邏輯回歸模型得分平均值為0.72。
膽囊息肉樣病變多無癥狀,85%為偶然發(fā)現(xiàn)。雖然大多數(shù)為非腫瘤性良性病變,但仍有部分為惡性或有惡性轉(zhuǎn)化的可能,應(yīng)引起重視[9]。楊等[10]報(bào)道了約13.4%的膽囊息肉經(jīng)病理證實(shí)為腫瘤性息肉,腺瘤性息肉作為腫瘤性息肉中最常見的類型,可表現(xiàn)為不典型增生,有些病變逐漸變大,甚至癌變,即腺瘤-癌癥途徑[11-12];而息肉樣膽囊癌雖發(fā)病率較低,但預(yù)后極差[13]。
依據(jù)2022歐洲胃腸道和腹部放射學(xué)會(ESGAR)/歐洲內(nèi)鏡外科協(xié)會(EAES)聯(lián)合指南,對于PLG大小在10mm或以上的患者,推薦進(jìn)行膽囊切除術(shù)[14]。而2022年超聲放射醫(yī)師學(xué)會(SUR)發(fā)布的偶發(fā)膽囊息肉的管理共識建議指出大多數(shù)手術(shù)切除的膽囊息肉是良性的,以10mm作為手術(shù)切除的閾值導(dǎo)致無癥狀非腫瘤性息肉過度治療?;谝陨蠣幾h,目前的治療指南正受到質(zhì)疑[15]。對良性PLG的積極干預(yù)可能會對患者造成傷害,包括不必要的手術(shù)切除、頻繁且長時(shí)間的影像學(xué)隨訪以及患者的焦慮和不便;而對直徑小于10mm的惡性PLG未及時(shí)切除將錯(cuò)過膽囊癌早期治療的機(jī)會。因而如何在術(shù)前有效鑒別膽囊息肉樣病變的性質(zhì)尤為重要。
對PLG的檢查,腹部超聲可明確診斷,但進(jìn)一步定性存在困難。隨著計(jì)算機(jī)斷層掃描(CT)、核磁共振(MRI)、超聲內(nèi)鏡檢查(EUS)、高分辨率超聲檢查(HRUS)等越來越多的影像學(xué)方法逐步應(yīng)用于臨床和科研工作[16],PLG的術(shù)前診斷被提供了越來越多的信息,盡管許多研究結(jié)果出色,意義重大,但對于PLG的定性診斷仍存在很大的不確定性。影像組學(xué)作為不斷深入發(fā)展的新興學(xué)科,在有效規(guī)避觀察者對影像特征解讀主觀偏向的同時(shí),能深度挖掘醫(yī)學(xué)圖像背后潛在的高維信息幫助臨床決策[17-18]。
本研究回顧性選取腫瘤性膽囊息肉和非腫瘤性膽囊息肉中最常見的腺瘤性息肉和膽固醇性息肉作為研究對象,使用雙源CT掃描患者,利用影像組學(xué)的方法對門脈期圖像進(jìn)行病灶的提取與分析,篩選出10個(gè)對鑒別兩組最具價(jià)值的特征。然后采用三種機(jī)器學(xué)習(xí)(ANN、SVM、LR)算法構(gòu)建預(yù)測模型,與其他算法相比,ANN算法表現(xiàn)出更高的穩(wěn)定性和預(yù)測效能。ANN作為數(shù)據(jù)挖掘方式的一種,可以對醫(yī)學(xué)信息進(jìn)行較為精準(zhǔn)的識別與分類。其中最重要的部分是“學(xué)習(xí)法則”,即通過訓(xùn)練過程來調(diào)整網(wǎng)絡(luò)中運(yùn)算單元間連接的權(quán)重。隨著訓(xùn)練次數(shù)的增加,ANN的連接權(quán)重被不斷調(diào)整,其輸出由訓(xùn)練前的凌亂狀態(tài)轉(zhuǎn)化為目標(biāo)值與ANN輸出值的誤差逐漸減小直至為零,此時(shí)稱ANN已收斂,訓(xùn)練完成。本研究中分別使用了2/3/4 個(gè)隱藏層,在應(yīng)用4個(gè)隱藏層時(shí)獲得的準(zhǔn)確率最高,然后將ANN應(yīng)用于輔助腺瘤性膽囊息肉與膽固醇性膽囊息肉的鑒別診斷,預(yù)測疾病發(fā)展,為患者提供個(gè)體化決策。
本研究結(jié)果顯示基于機(jī)器學(xué)習(xí)的影像組學(xué)模型可以對腺瘤性膽囊息肉和膽固醇性膽囊息肉的病變性質(zhì)進(jìn)行預(yù)測。訓(xùn)練組和驗(yàn)證組的AUC可高達(dá)1和0.81。機(jī)器學(xué)習(xí)獲取的影像組學(xué)模型,可更為方便、有效地預(yù)測PLG的性質(zhì),為PLG的術(shù)前定性診斷提供更加可靠的依據(jù)。
本研究的局限性:(1)本研究為單中心研究,樣本量偏少,研究結(jié)果可能存在一定的偏倚。(2)僅研究了門脈期圖像的影像組學(xué)特征,未與其他期相如平掃、動脈期等圖像聯(lián)合應(yīng)用。
綜上所述,基于增強(qiáng)CT門脈期圖像的影像組學(xué)特征構(gòu)建的機(jī)器學(xué)習(xí)模型可用于腺瘤性膽囊息肉和膽固醇性膽囊息肉術(shù)前病變性質(zhì)的預(yù)測,其中ANN具有較高的預(yù)測效能和穩(wěn)定性。