林子淮 李欣明 全顯躍
南方醫(yī)科大學珠江醫(yī)院影像診斷科 (廣東 廣州 510220)
胃食管靜脈曲張破裂出血(gastroesophageal varices bleeding,GEVB)是肝硬化門靜脈高壓癥最嚴重的并發(fā)癥[1-3]。發(fā)生率約占門脈高壓患者的50%,6周病死率約為15-25%[4-6],具有病情兇險、死亡率高、再次出血風險大的特點。其中,食管靜脈曲張破裂出血為其最常見的類型。早發(fā)現(xiàn)、早處理急性出血、早預防再次出血,至關重要。
目前,國際指南Baveno VII推薦將電子胃鏡(esophagogastroduodenoscopy,EGD)檢查作為食管靜脈曲張破裂出血的首選篩查方法和診斷金標準[7],對降低出血風險起重要作用。但仍存在高血壓、心肺功能不全、出血傾向患者無法接受電子胃鏡檢查,而錯失了食管靜脈曲張最佳的干預時機。如何通過無創(chuàng)性檢查手段預測食管靜脈曲張破裂出血,特別是預測高出血風險食管靜脈曲張(high-risk varices,HRV),為臨床需求。
近年來,中國門靜脈高壓聯(lián)盟(CHESS)團隊[8]采用基于CT平掃影像組學模型預測食管靜脈曲張破裂出血,結果顯示CT影像組學模型具有較大的預測潛能??偰懠t素、血清白蛋白、凝血酶原時間等實驗室檢查對評估肝功能、預測食管靜脈曲張具有一定提示作用。故本研究通過構建影像組學特征和血清學特征聯(lián)合模型,并用臨床病例驗證模型的預測性能,現(xiàn)報道如下。
1.1 一般資料本研究由院醫(yī)學倫理委員會批準,患者均簽署知情同意書。本研究為單中心回顧性研究,回顧性收集2015年1月至2019年9月于南方醫(yī)科大學珠江醫(yī)院接受電子胃鏡的所有代償期肝硬化門靜脈高壓患者。
納入標準:臨床診斷為代償期肝硬化;有電子胃鏡、血清學檢查、腹部CT掃描檢查的患者,且三類檢查的時間間隔不超過14天;年齡在18~75歲之間,且知情同意。排除標準為:CT圖像存在偽影導致感興趣區(qū)無法勾畫;既往曾接受過下列手術之一的患者:經(jīng)頸靜脈肝內門體分流術、脾切除術、部分脾栓塞、逆行球囊阻塞術、經(jīng)靜脈閉塞術或肝移植;患者合并肝臟腫瘤、脾臟腫瘤、嚴重腹水或肝性腦病。
1.2 方法
1.2.1 胃鏡檢查 根據(jù)本院內鏡室檢查前要求做好腸道準備,電子胃鏡檢查由10年以上內鏡檢查經(jīng)驗的臨床醫(yī)師使用配備的標準機器進行,所有鏡下發(fā)現(xiàn)都記錄在數(shù)碼照片上,最后由兩名10年以上工作經(jīng)驗的臨床醫(yī)師根據(jù)內鏡照片復核并最終確認是否存在高出血風險食管靜脈曲張,內鏡下高出血風險食管靜脈曲張的判斷標準(滿足以下任一條件):(1)小靜脈曲張伴有紅色征(2)小靜脈曲張伴Child-Pugh評分C級(3)中-大靜脈曲張(直徑>5mm)(參考國際指南Baveno VII)[7]。
1.2.2 實驗室檢查 收集離內鏡檢查最近一次的實驗室血清學檢查數(shù)據(jù),檢驗項目均為臨床常規(guī)檢查,包括包括紅細胞計數(shù)(RBC)、白細胞計數(shù)(WBC)、血紅蛋白計數(shù)(Hb)、血小板計數(shù)(PLT)、血肌酐(Cr)、丙氨酸氨基轉移酶(ALT)、天門冬氨酸氨基轉移酶(AST)、γ-谷氨酰轉肽酶(GGT)、白蛋白(ALB)、總膽紅素(TBIL)、凝血酶原時間(PT)、活化凝血酶時間(APTT)、國際標準化比值(INR)。
1.2.3 CT影像采集及感興趣區(qū)域勾畫 所有患者均采用Philips Brilliance 64 排螺旋CT采集圖像,參數(shù):管電壓120kVp;管電流150 -600mAs;層厚5mm;螺距0.984。所有入組患者的腹部平掃CT圖像由我院兩名影像科醫(yī)師進行感興趣區(qū)(Region of interest,ROI)勾畫及影像組學特征提取。ROI勾畫使用ITKSNAP 3.8.0軟件完成。選擇肝臟第一肝門層面、脾臟脾門平面分別作為該層面全肝及全脾ROI進行勾畫。先由一名5年腹部診斷經(jīng)驗的影像科醫(yī)師沿臟器輪廓進行勾畫,經(jīng)另一名8年腹部診斷經(jīng)驗的影像科醫(yī)師檢查、修改并確認后作為最終ROI(圖1)。
圖1 圖1A:第一肝門區(qū)層面肝臟輪廓,圖1B:脾門區(qū)層面脾臟輪廓,圖1C:第一肝門區(qū)輪廓勾畫圖,圖1D:脾門區(qū)輪廓勾畫圖。圖2 LASSO算法交叉驗證的參數(shù)(Lambda)調優(yōu)路徑圖。圖3 LASSO 算法在各組學特征系數(shù)路徑圖。圖4 HRV_Sig驗證集的ROC曲線圖。圖5 PLT_Sig驗證集的ROC曲線。圖6 諾莫圖。圖7 三種模型訓練集預測效能的ROC曲線對比圖。圖8 三種模型驗證集預測效能的ROC曲線對比圖。
1.2.4 影像組學特征提取及分析 對勾畫好的ROI數(shù)據(jù),使用pyradiomics 1.2.0 進行特征提取,共得到214維特征。這些手工特征可以分為3組,分別是:幾何形狀、強度和紋理,幾何特征描述了第一肝門層面肝臟以及脾門層面脾臟的形狀特征,強度特征描述了肝臟以及脾臟的體素強度的一階統(tǒng)計分布,紋理特征描述體素的二階以及高階空間分布。在這里,我們使用了幾種不同的方法提取紋理特征,包括灰度共生矩陣(GLCM)、灰度游程矩陣(GLRLM)、灰度尺寸區(qū)域矩陣(GLSZM)和鄰域灰度差矩陣(NGTDM)。每一個患者,將提取所有特征使用z-score正則化,使用Spearman相關系數(shù)計算特征之間的相關性,對于任意兩兩特征之間相關系數(shù)大于0.9的特征保留其一。為了最大程度上保留特征的刻畫能力,特征篩選我們使用貪心遞歸刪除策略(greedy algorithm),即每次刪除在當前集合中冗余度最大的特征。使用Lasso對數(shù)據(jù)進行10折交叉驗證,選用最好的懲罰系數(shù)λ,篩選出系數(shù)不為0的特征(圖2)。對影像組學特征進行最終的篩選,最后篩選出13個與高出血風險食管靜脈曲張密切相關的特征,其中有4個影像組學特征來自肝臟第一肝門區(qū)和9個影像組學特征來自脾臟脾門區(qū)(圖3)。
將入組患者按4:1比例分為訓練集和驗證集。使用多種機器學習算法模型(LR、SVM、DT、RF、ExtraTree、XGBoost等)進行訓練,最后對模型進行驗證,得到常見指標驗證以及結果可視化。為了尋找到最佳的模型超參,在訓練模型的過程中,我們使用了網(wǎng)格搜索的算法,對每個模型的常見超參進行最佳超參。本研究將影像組學特征和血清學特征結合構建Nomogram模型。為了能使Nomogram模型更具有臨床實用性,采用年齡、性別、有無靜脈曲張、影像組學特征、血清學特征一起繪制諾莫圖。建立三個預測模型,分別為影像組學特征模型(高出血風險食管靜脈曲張_Sig,HRV_Sig)、血清學特征模型(PLT_Sig)、影像組學聯(lián)合血清學的影像組學模型(Nomogram)用于預測高出血風險食管靜脈曲張。以高出血風險為學習目標,對比3個不同模型的預測效能。
1.3 統(tǒng)計學方法應用SPSS 25.0軟件,連續(xù)變量以(均數(shù)±標準差)表述,分類變量以中位數(shù)和四分位數(shù)間距表述。以電子胃鏡結果為金標準,以受試者工作特征曲線下面積(the area under the receiver operating characteristic curves,AUC)、靈敏度(sensitive,SE)、特異度(specificity,SP)以及閾值(threshold,TH)來評估模型的預測效能。P值<0.05為差異有統(tǒng)計學意義。
2.1 入組患者基線特征本研究共納入129例代償期肝硬化門靜脈高壓患者數(shù)據(jù)。采用年齡、性別、胃鏡結果是否有靜脈曲張及高出血風險靜脈曲張、肝硬化病因、Child-Pugh分級、PLT、ALT、AST、GGT、ALB、TBIL、INR數(shù)據(jù)繪制入組患者基線表(表1)。訓練集與驗證集的各項基線數(shù)據(jù)P值均大于0.05,訓練集與測試集之間無明顯差異。
表1 入組患者的基線特征
2.2 HRV_Sig及PLT_Sig模型在各種機器學習方法下預測高出血風險食管靜脈曲張的效能
2.2.1 HRV_Sig預測高出血風險食管靜脈曲張的效能(表2) 表2示影像組學特征模型的AUC在0.550-0.887之間,敏感度、特異性分別在0.600-1.000、0.625-1.000之間,閾值在0.412-1.000之間。預測效能最高為LightGBM機器學習方法,AUC值為0.887。
表2 HRV_Sig預測HRV的效能
2.2.2 PLT_Sig預測高出血風險食管靜脈曲張的效能(表3) 表3顯示血清學模型的AUC在0.561-0.845之間,敏感度、特異性分別在0.454-1.000、0.400-1.00之間,閾值在0.300-1.000之間。預測效能最高為LightGBM和RandomForest機器學習方法,AUC值為0.845。
表3 PLT_Sig預測HRV的效能
2.2.3 HRV_Sig及PLT_Sig模型驗證集中不同機器學習方法的ROC曲線圖(圖4-圖5) 圖4-圖5顯示HRV_Sig及PLT_Sig各自在驗證集中表現(xiàn)不同機器學習方法預測效能的ROC曲線圖。
2.3 采用年齡、性別、有無靜脈曲張、HRV_Sig、PLT_Sig繪制Nomogram(圖6)從圖6我們可以看出評估一個患者靜脈曲張破裂出血的風險有多高,可以由表中幾個因素所對應的的分數(shù)相加,最后得出風險數(shù)值,風險數(shù)值越高提示出血風險越高,從而提示臨床及早干預。
2.3.1 Nomogram模型HRV效能(表4) 從表4可以看出Nomogram模型在驗證集中AUC值達到0.988,相對于表2中HRV_Sig模型的AUC值0.887以及表3中PLT_Sig模型的AUC值0.845,Nomogram模型表現(xiàn)更加優(yōu)異。
表4 Nomogram預測HRV的效能
2.3.2 Nomogram模型預測HRV效能訓練集及驗證集的ROC曲線圖 從表2可知LightGBM機器學習方法表現(xiàn)最好,從表3中可知LightGBM、RandomForest機器學習方法表現(xiàn)不相上下,為了保證可比性后續(xù)選用了LightGBM機器學習方法對比三種模型的預測效能,最后得出Nomogram模型預測高出血風險食管靜脈曲張效能訓練集及驗證集的ROC曲線圖(圖7-圖8)。從圖7-圖8可以看出融合后的Nomogram模型無論是在訓練集還是驗證集,對于預測高出血風險食管靜脈曲張效能均高于兩種單獨模型。
肝硬化門靜脈高壓是指各種原因的肝硬化導致門靜脈系統(tǒng)壓力升高,門靜脈系統(tǒng)血流受阻或血流量增加,從而引起相關的一系列臨床癥狀,常見并發(fā)癥為靜脈曲張破裂出血,病情兇險,病死率高。為了降低病死率,早期發(fā)現(xiàn)、早期干預食管精確曲張至關重要。現(xiàn)臨床上常規(guī)采用電子胃鏡對肝硬化門靜脈高壓患者進行食管胃底靜脈曲張的早期篩查,但電子胃鏡屬于侵入性檢查、患者的依從性較差,導致部分患者錯過高出血風險食管靜脈曲張一級預防的最佳時機。
采用非侵入性方法預測食管靜脈曲張破裂出血是近年來的研究熱點、難點[9]。影像組學從放射影像圖像中提取大量的影像學特征,采用自動或半自動分析方法將影像學數(shù)據(jù)轉化為具有高分辨率的、可挖掘的數(shù)據(jù),進而用于疾病診斷、預后預測及療效評價,以指導治療方式的選擇、實現(xiàn)個性化和精準化治療[10-12]。本研究是在國內CHESS團隊提出的基于CT平掃影像組學評估高出血風險食管靜脈曲張的基礎上,建立一個聯(lián)合血清特征的CT影像組學模型用于預測高出血風險食管靜脈曲張,為高出血風險食管靜脈曲張患者的臨床診治給予及時指導,從而提高生存率和改善預后。為了尋找更優(yōu)化的預測效能,我們用目前多種主流的機器學習方式對建立的模型進行訓練。在本研究中我們所建立的影像組學模型是由13個影像組學特征組成,其中有4個影像組學特征來自肝臟第一肝門區(qū)和9個影像組學特征來自脾臟脾門區(qū)。CHESS團隊提出的高出血風險食管靜脈曲張影像組學預測模型的AUC值為0.831(95% CI:0.685-0.978),本研究中HRV_Sig預測模型的AUC值為0.887(95%CI:0.759-1.000),兩者結果相差不多。根據(jù)以往文獻報道,影像組學特征與血清學特征結合能進一步優(yōu)化影像組學模型的預測效能[13],根據(jù)國際權威指南Baveno VI,肝臟硬度<20 kPa且血小板計數(shù)>150,000的患者發(fā)生靜脈曲張需要治療的風險非常低,因此我們建立一個血小板特征的特征模型并驗證它的診斷效能,最后結果是PLT_Sig驗證集的預測效能可以達到0.845(95%CI:0.691-1.000),與CHESS團隊提出的高出血風險食管靜脈曲張影像組學預測模型效能以及本研究中HRV_Sig在驗證集的預測效能相比較,血清學特征模型一定程度上可以與影像組學特模征型的結果相近,證明血清學特征模型在一定程度上可以起到預測高出血風險食管靜脈曲張的作用。本研究中將影像組學特征與血清學特征相結合構建Nomogram模型預測高出血風險食管靜脈曲張的AUC值為0.988(95%CI:0.959-1.000),由此可見Nomogram對于預測高出血風險食管靜脈曲張的效能有比較大的提升。
本研究中的不足:本研究為回顧性、單中心、小樣本研究,開展前瞻性、多中心、擴大樣本量的研究為下一步計劃。
綜上所述,基于機器學習CT影像組學特征聯(lián)合血清學特征預測高出血風險食管靜脈曲張的Nomogram模型,相對于HRV_Sig及PLT_Sig有著更高的預測效能,有潛力作為評估高出血風險食管靜脈曲張的補充性輔助預測工具。