翟義胲, 林 雪, 蒲圓金, 韋巧玲, 龐永慧
肝動(dòng)脈化療栓塞術(shù)(transcatheter arterial chemoembolization,TACE) 是目前治療中晚期肝癌最常采用的手段。 栓塞后綜合征(post-embolization syndrome,PES)是TACE 后常見并發(fā)癥,臨床表現(xiàn)包括發(fā)熱、疼痛、惡心、嘔吐等[1-2]。PES 不僅影響患者的生活質(zhì)量,也延長(zhǎng)住院時(shí)間,增加經(jīng)濟(jì)負(fù)擔(dān)[3]。因此,有效識(shí)別和早期干預(yù)TACE 后發(fā)生PES 的危險(xiǎn)因素具有重要的臨床意義。
目前常采用邏輯回歸模型分析危險(xiǎn)因素,但易受到固有線性統(tǒng)計(jì)假設(shè)的限制,而忽略對(duì)其他有價(jià)值變量的分析[4-6]。 近年來(lái),機(jī)器學(xué)習(xí)(machine learning)技術(shù)因其具有高效處理復(fù)雜、耗時(shí)任務(wù)的能力而被廣泛地用于醫(yī)學(xué)領(lǐng)域,主要包括疾病診斷、藥物制作、醫(yī)療數(shù)據(jù)分析等[7]。 其具有傳統(tǒng)統(tǒng)計(jì)學(xué)不具備的獨(dú)特優(yōu)勢(shì)。 本研究通過(guò)機(jī)器學(xué)習(xí)技術(shù)對(duì)TACE 后PES的發(fā)生進(jìn)行預(yù)測(cè),找到相關(guān)的危險(xiǎn)因素,以期為臨床診治提供參考依據(jù)。
收集2020 年1 月至2021 年12 月在廣西醫(yī)科大學(xué)附屬腫瘤醫(yī)院接受TACE 治療的453 例患者的臨床信息。 納入標(biāo)準(zhǔn):①經(jīng)過(guò)臨床或病理診斷為原發(fā)性肝癌;②年齡>18 歲;③ECOG 評(píng)分0~2 分;④醫(yī)療記錄完整且可用。 排除標(biāo)準(zhǔn):①入院時(shí)劇烈疼痛或者合并感染癥狀;②因意識(shí)喪失或者其他原因不能進(jìn)行癥狀評(píng)估;③術(shù)后出現(xiàn)感染或者大出血等嚴(yán)重并發(fā)癥;④合并其他癌癥。本研究經(jīng)廣西醫(yī)科大學(xué)附屬腫瘤醫(yī)院倫理委員會(huì)批準(zhǔn)(KY2022302)。
收集患者23 個(gè)指標(biāo),包括性別、年齡、體質(zhì)量指數(shù)、病史(是否經(jīng)過(guò)外科手術(shù)切除,是否為首次TACE 以及既往TACE 次數(shù))、影像學(xué)資料(大血管侵犯,腫瘤最大直徑和數(shù)量)、血常規(guī)、凝血功能、肝功能、甲胎蛋白、手術(shù)方式、手術(shù)時(shí)間、碘化油乳劑用量、微球最大直徑;計(jì)算每例患者的腫瘤負(fù)荷分級(jí)[8]、Child-pugh 肝功能分級(jí)、ALBI 分級(jí)。 觀察患者術(shù)后PES 的發(fā)生情況以及術(shù)后住院時(shí)間,記錄肝區(qū)NRS 疼痛評(píng)分≥4 分、排除感染的發(fā)熱、惡心、嘔吐WHO 分度在Ⅱ度以上的患者。
對(duì)收集的分類特征進(jìn)行編碼。 對(duì)二分類特征,樣本具有該特征則編碼為1,否則為0。 而多分類特征如腫瘤負(fù)荷分級(jí),按從小到大進(jìn)行1~3 編碼。
使用Seldinger 技術(shù)穿刺股動(dòng)脈并放置血管鞘。通過(guò)血管造影確定腫瘤的供血?jiǎng)用}。 然后將微導(dǎo)管超選擇性插管至腫瘤供血?jiǎng)用},緩慢注入微球或適量碘油+化療乳劑栓塞, 再次造影確定腫瘤供血?jiǎng)用}中的血流停滯。
使用邏輯回歸(logistic regression,LR)、支持向量機(jī)(support vector mac,SVM)、隨機(jī)森林(random forest,RF)、梯度提升決策樹(gradient boosting decision tree,GBDT)、極端梯度森林(eXtreme Gradient Boosting,XGBoost)和Lightgbm 共6 種算法預(yù)測(cè)術(shù)后PES 的發(fā)生。
在最優(yōu)模型中使用沙普利可加性特征解釋方法(shapley additive explanation,SHAP)。 SHAP 法是將所有的特征都視為“貢獻(xiàn)者”。 對(duì)于每個(gè)預(yù)測(cè)樣本模型都產(chǎn)生一個(gè)預(yù)測(cè)值,SHAP 值是該樣本中每個(gè)特征所分配到的數(shù)值[9]。通過(guò)SHAP 工具包,了解各特征如何影響預(yù)測(cè)結(jié)果。
使用python 3.10。 計(jì)數(shù)資料采用頻數(shù)表示,比較采用卡方檢驗(yàn); 正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差表示,組間比較采用t 檢驗(yàn);不符合正態(tài)分布的計(jì)量資料以中位數(shù)(四分位數(shù)間距)表示,比較采用非參數(shù)檢驗(yàn)。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。采用準(zhǔn)確率(分類器正確分類的樣本數(shù)與總樣本數(shù)之比)、精確率(正確被檢索占實(shí)際被檢索到的比例)、召回率(正確被檢索的占所有應(yīng)該檢索到的比例)、F1 分?jǐn)?shù)(精確率和召回率的調(diào)和均值)、曲線下面積(AUC)對(duì)模型結(jié)果進(jìn)行評(píng)估。 各項(xiàng)指標(biāo)采用五折交叉驗(yàn)證的方式計(jì)算:將數(shù)據(jù)隨機(jī)分成5 等份,輪流將其中4 份用于訓(xùn)練模型,1 份用于測(cè)試模型,得到5 次預(yù)測(cè)結(jié)果, 最后將其平均值作為對(duì)模型準(zhǔn)確性的估計(jì),同時(shí)繪制五折ROC 曲線。
453 例患者中,PES 組283 例,非PES 組170 例,兩組患者一般資料比較見表1。
表1 兩組患者一般資料比較
分別構(gòu)建6 個(gè)機(jī)器學(xué)習(xí)模型,各模型參數(shù)采用默認(rèn)值訓(xùn)練。 通過(guò)五折交叉驗(yàn)證分別求其各項(xiàng)評(píng)估指標(biāo), 見表2。 其中以隨機(jī)森林算法預(yù)測(cè)術(shù)后出現(xiàn)PES 的召回率、F1 分?jǐn)?shù)、AUC 最高,在所有模型中綜合性能最好,值得進(jìn)一步研究。 而準(zhǔn)確率和精確率最高的是SVM。 五折交叉驗(yàn)證的隨機(jī)森林ROC 曲線見圖1。
圖1 五折交叉驗(yàn)證的隨機(jī)森林模型ROC 曲線
表2 機(jī)器學(xué)習(xí)各模型預(yù)測(cè)效能比較
因隨機(jī)森林模型在所有模型中綜合性能較好,故使用基于隨機(jī)森林模型分析原發(fā)性肝癌患者TACE 后PES 的危險(xiǎn)因素,可視化如圖2。 其展示了在整體水平上前20 個(gè)特征的貢獻(xiàn)情況。 對(duì)PES 發(fā)生影響較大的因素包括腫瘤負(fù)荷分級(jí)、 手術(shù)方式、手術(shù)時(shí)間、白細(xì)胞計(jì)數(shù)等。 排名靠前的變量在單因素分析中也是差異有統(tǒng)計(jì)學(xué)意義的變量。 SHAP 值的大小表示了對(duì)預(yù)測(cè)結(jié)果的影響程度,SHAP 的絕對(duì)值越大, 說(shuō)明該特征對(duì)術(shù)后發(fā)生PES 的影響越大。 圖2 右中每個(gè)點(diǎn)代表一個(gè)樣本,點(diǎn)的顏色代表了特征值的相對(duì)大小,紅色表示特征值高,藍(lán)色表示特征值低。 如腫瘤負(fù)荷分級(jí)為低,此時(shí)大量的紅色樣本聚集在SHAP 負(fù)值區(qū)域,說(shuō)明負(fù)荷分級(jí)低可以降低術(shù)后發(fā)生PES 的風(fēng)險(xiǎn)。 而如手術(shù)時(shí)間,大量的紅色樣本聚集在SHAP 正值區(qū)域,代表手術(shù)時(shí)間越長(zhǎng)術(shù)后越可能發(fā)生PES。 根據(jù)SHAP 相關(guān)匯總圖(圖2 左), 絕大部分特征和PES 的發(fā)生呈正相關(guān)(危險(xiǎn)因素), 而少部分如前白蛋白、 年齡、 既往TACE 次數(shù)、腫瘤外科切除后、總膽紅素和白蛋白水平與PES 的發(fā)生呈負(fù)相關(guān)(保護(hù)因素)。
圖2 基于SHAP 方法的隨機(jī)森林模型整體可解釋性分析
如圖3, 在單個(gè)實(shí)例對(duì)PES 的發(fā)生預(yù)測(cè)解釋圖上。 在基線概率為64.41%的情況下,該患者白細(xì)胞計(jì)數(shù)正常、 手術(shù)方式為C-TACE 減少了術(shù)后PES發(fā)生概率,而腫瘤負(fù)荷低(0)、手術(shù)時(shí)間(75 min)、年齡(46 歲)、既往TACE 次數(shù)少(1 次)以及部分血液指標(biāo)增加了術(shù)后PES 發(fā)生概率,這使得患者術(shù)后發(fā)生PES 的概率有79%。
圖3 基于SHAP 方法的單個(gè)實(shí)例可解釋性分析
機(jī)器學(xué)習(xí)技術(shù)具有限制少、 預(yù)測(cè)準(zhǔn)確的優(yōu)點(diǎn)。目前機(jī)器學(xué)習(xí)已在醫(yī)學(xué)領(lǐng)域建立數(shù)種模型[10-11]。 研究認(rèn)為,PES 發(fā)生的病理基礎(chǔ)與栓塞區(qū)域組織成片壞死水腫和化療藥物引起的不良反應(yīng)有關(guān), 且PES的發(fā)生會(huì)增加患者的死亡風(fēng)險(xiǎn)[12-13]。因此,建立精準(zhǔn)的預(yù)測(cè)模型并運(yùn)用到臨床護(hù)理工作中極有價(jià)值。
發(fā)生PES 的影響因素包括腫瘤負(fù)荷、 手術(shù)方式、手術(shù)時(shí)間、年齡等[14-15]。本研究發(fā)現(xiàn),外科切除術(shù)后以及總膽紅素高是PES 的保護(hù)因素,可能的原因是總膽紅素高代表肝臟整體情況較差,迷走神經(jīng)退化等導(dǎo)致內(nèi)臟的敏感性降低從而對(duì)疼痛閾感提升[16]。
在既往的研究中, 通過(guò)邏輯回歸可確定哪些變量是危險(xiǎn)因素。 部分研究對(duì)于連續(xù)性自變量采取基于中位數(shù)或者多分類等級(jí)進(jìn)行劃分。 然而這種方法忽略了患者個(gè)體化的情況。 如本研究發(fā)現(xiàn)手術(shù)時(shí)間與術(shù)后PES 發(fā)生之間存在正相關(guān), 即手術(shù)時(shí)間越長(zhǎng),術(shù)后PES 的風(fēng)險(xiǎn)越高。但無(wú)論采用中位數(shù)或等級(jí)劃分的方式, 當(dāng)手術(shù)時(shí)間為75 min 時(shí),并不能將其視為PES 的危險(xiǎn)因素。 相反,SHAP 方法結(jié)合患者的綜合情況, 判斷出手術(shù)時(shí)間在某些患者中是一個(gè)重要的影響因素。 基于SHAP 方法的分析有助于醫(yī)務(wù)人員在個(gè)體水平上預(yù)測(cè)和分析術(shù)后PES。
本研究中不同機(jī)器學(xué)習(xí)模型中以隨機(jī)森林算法的綜合預(yù)測(cè)效果最佳。 隨機(jī)森林算法是并行式集成學(xué)習(xí)方法Bagging 的一個(gè)變形, 通過(guò)隨機(jī)屬性選擇, 再?gòu)闹羞x擇最優(yōu)劃分提高了準(zhǔn)確率降低方差,又避免了過(guò)擬合的發(fā)生,使得預(yù)測(cè)效果最佳。 研究者可考慮在相似的數(shù)據(jù)集使用隨機(jī)森林方法。 本研究中多種機(jī)器學(xué)習(xí)模型對(duì)于PES 發(fā)生的綜合預(yù)測(cè)效能高于邏輯回歸模型,可能是因?yàn)閭鹘y(tǒng)邏輯模型要求變量獨(dú)立且不能處理變量共線性的問題,盡管在統(tǒng)計(jì)分析時(shí)經(jīng)過(guò)單因素篩選,但在準(zhǔn)確率和精確率等方面低于其他機(jī)器模型。
本研究存在一定的局限性,首先作為回顧性研究存在一定的風(fēng)險(xiǎn)偏倚,收集的數(shù)據(jù)不可避免有人為誤差;其次為單中心研究,收集的病例數(shù)較少,因此未進(jìn)一步調(diào)整超參數(shù),盡管在訓(xùn)練過(guò)程中已經(jīng)成功避免過(guò)擬合問題,未來(lái)仍需要多中心大樣本來(lái)進(jìn)一步驗(yàn)證模型。
本研究通過(guò)機(jī)器學(xué)習(xí)技術(shù)對(duì)TACE 術(shù)后PES的發(fā)生進(jìn)行了預(yù)測(cè),并找到了相關(guān)危險(xiǎn)因素。 通過(guò)對(duì)患者術(shù)前和術(shù)中的危險(xiǎn)因素進(jìn)行預(yù)測(cè)和評(píng)估,臨床醫(yī)護(hù)人員可制定相應(yīng)策略以減少患者術(shù)后發(fā)生PES 的風(fēng)險(xiǎn)。