崔連順 徐翎鈺 李天陽 管陳 楊成宇 張凝馨 宋卓 徐巖
(1 青島大學(xué)附屬醫(yī)院腎病科,山東 青島 266003; 2 青島大學(xué)第一臨床醫(yī)學(xué)院; 3 東營市人民醫(yī)院腎內(nèi)科)
急性腎損傷(acute kidney injury,AKI)是一種常見的臨床綜合征,以患者短時間內(nèi)血肌酐(SCr)突然升高、尿量減少為特征,常伴有多種并發(fā)癥[1-2]。住院患者AKI的患病率為10%~15%,其中危重患者達30%~60%,病死率高達50%[3-4]。而通過擴容增加腎臟血流灌注是改善患者AKI的主要手段[5]。呋塞米是治療充血性心力衰竭和水腫最常用的利尿藥之一,AKI患者體內(nèi)的水電解質(zhì)紊亂難以糾正,通常會使用大劑量呋塞米增加尿量,逆轉(zhuǎn)腎損傷[6-7]。目前呋塞米與AKI之間的關(guān)系仍未完全闡明,研究發(fā)現(xiàn)預(yù)防性使用呋塞米反而會導(dǎo)致AKI發(fā)生。早期識別使用呋塞米后發(fā)生AKI的風(fēng)險因素并評估預(yù)后,對于指導(dǎo)呋塞米的臨床用藥具有重要意義。
機器學(xué)習(xí)(ML)是人工智能(AI)領(lǐng)域的重要分支,對大樣本及高維數(shù)據(jù)分析極具優(yōu)勢,經(jīng)常被用于疾病預(yù)測、預(yù)后分析等醫(yī)療工作。本研究基于多種ML算法構(gòu)建使用呋塞米的住院患者繼發(fā)AKI及死亡風(fēng)險的預(yù)測模型,并對最優(yōu)模型預(yù)測效能進行全面評估。通過多種SHAP圖在總?cè)巳杭盎颊邆€體層面對概率決策過程進行解析,以實現(xiàn)對患者的個體化預(yù)測。
本研究為單中心回顧性研究,選取2017年10月—2020年10月我院使用呋塞米的住院患者共計18 998例?;颊呒{入標準為:①住院期間使用呋塞米(以入院為起始時間,至末次SCr檢測時間為止使用過呋塞米,平均劑量>40 mg/d[8])且病歷資料完整者;②使用呋塞米后SCr檢測≥2次者?;颊吲懦龢藴?①年齡<18歲者;②入院診斷為AKI,或在入院第1天SCr改變≥26.5 μmol/L者;③兩次SCr檢測間隔時間>7 d者;④患有終末期腎病、進行血液透析或腎臟移植者;⑤住院時間<24 h者。
根據(jù)文獻數(shù)據(jù)及臨床經(jīng)驗[9-10],將包括人口信息學(xué)特征(如年齡、性別、吸煙史、飲酒史、體質(zhì)量指數(shù))、實驗室指標(如血常規(guī)、肝腎功能等)、合并癥(如糖尿病、高血壓、冠心病等)、合并用藥(如腎毒性抗生素、非甾體類抗炎藥、質(zhì)子泵抑制劑、降壓藥、調(diào)脂藥等)等200余個臨床指標納入本研究的資料收集范圍,通過正則表達式提取住院電子病歷中患者的上述信息,并基于2012年全球腎病改善(KDIGO)標準[11]對所有患者進行AKI診斷及分期。
將納入的病例以76.5∶8.5∶15.0的比例隨機分為訓(xùn)練集、驗證集與測試集。訓(xùn)練集與驗證集用于建立與優(yōu)化模型,使用10折交叉驗證與網(wǎng)格搜索確定模型最優(yōu)參數(shù)并防止過度擬合,測試集用于測試模型預(yù)測效能。使用輕量梯度提升機(LightGBM)、梯度提升機(GBM)、樸素貝葉斯(NB)分類器、隨機森林(RF)、K最近鄰(KNN)、支持向量機(SVM)和邏輯回歸(LR)等多種ML模型,預(yù)測使用呋塞米的住院患者發(fā)生AKI及死亡風(fēng)險,并通過比較曲線下面積(AUC)、精確率、召回率、準確度、F1分數(shù)、Brier分數(shù)和馬修斯相關(guān)系數(shù)選擇最優(yōu)模型用于后續(xù)分析。由于ML模型的“黑匣子”效應(yīng),其中的運算過程往往難以展現(xiàn),使預(yù)測結(jié)果的可信度受到質(zhì)疑。本研究使用SHAP條形圖、摘要圖、力圖及決策圖在總?cè)巳杭盎颊邆€體層面對最優(yōu)預(yù)測模型中的特征進行可視化分析。
使用Python語言(3.9.13)以及Visual Studio Code(1.81.1)集成開發(fā)環(huán)境進行數(shù)據(jù)分析。分類變量以例(率)表示,比較采用χ2檢驗,以P<0.05為差異有統(tǒng)計學(xué)意義。繪制受試者工作特征(ROC)曲線并計算AUC,通過決策曲線分析(DCA)、精確率、召回率、F1分數(shù)、Brier分數(shù)和馬修斯相關(guān)系數(shù)等指標評價模型效能。
本研究納入患者18 998例,其中發(fā)生AKI患者4 803例,非AKI患者14 195例,AKI發(fā)生率為25.28%,AKI的1、2、3期發(fā)生率分別為22.58%、2.01%、0.70%。全部患者中,AKI死亡患者共502例(病死率10.5%),非AKI死亡患者共306例(病死率2.2%),兩者差異有顯著性(χ2=606.542,P<0.05)。
排除患者缺失值≥15%[12]的臨床指標后,最終有175個指標納入構(gòu)建的預(yù)測模型?;诰W(wǎng)格搜索確定模型超參數(shù),并通過輸出AUC值等確定最優(yōu)模型。ROC曲線顯示,訓(xùn)練集及驗證集的8種ML模型中LightGBM模型區(qū)分度最好(圖1),LightGBM模型預(yù)測AKI發(fā)生風(fēng)險的AUC、精確率、召回率、準確度、F1分數(shù)、Brier分數(shù)和馬修斯相關(guān)系數(shù)分別為0.814、0.677、0.358、0.800、0.468、0.139和0.387,LightGBM模型預(yù)測死亡風(fēng)險的AUC、精確率、召回率、準確度、F1分數(shù)、Brier分數(shù)和馬修斯相關(guān)系數(shù)則分別為0.949、0.720、0.261、0.959、0.383、0.031和0.418。對LightGBM模型測試集數(shù)據(jù)進行進一步分析顯示,AKI發(fā)生及死亡風(fēng)險預(yù)測的AUC分別為0.803(95%CI=0.793~0.813)以及0.921(95%CI=0.917~0.926),結(jié)合ROC及DCA曲線分析,該模型預(yù)測AKI發(fā)生與死亡風(fēng)險均具有較好的校準度和臨床實用性(圖2)。
a:患者AKI發(fā)生風(fēng)險的ROC曲線,b:患者死亡風(fēng)險的ROC曲線
a:患者AKI發(fā)生風(fēng)險的ROC曲線,b:患者AKI發(fā)生風(fēng)險的DCA曲線,c:患者死亡風(fēng)險的ROC曲線,b:患者死亡風(fēng)險的DCA曲線
為明確使用呋塞米的住院患者AKI發(fā)生與死亡風(fēng)險的關(guān)鍵指標,我們使用SHAP法對預(yù)測模型中的指標進行了重要性排序及可視化分析。SHAP條形圖及摘要圖顯示,使用呋塞米后患者的血肌酐、血清胱抑素C、尿微量白蛋白/肌酐比值、聯(lián)合使用腎上腺素及聯(lián)合使用肝素是影響AKI發(fā)生的5個最主要因素(圖3a、b);使用呋塞米后的24 h尿蛋白定量、血漿凝血酶原時間國際標準化比值、血漿血小板計數(shù)、聯(lián)合應(yīng)用腎上腺素及住院期間發(fā)生AKI是導(dǎo)致使用呋塞米患者死亡的5個最主要因素(圖3c、d)。在SHAP力圖中,箭頭的長度對應(yīng)于特征的相關(guān)SHAP值,箭頭越長表示特征值的重要性越大(圖4);在SHAP決策圖中線的上下軌跡反映了相應(yīng)特征對模型輸出的影響(圖5)。SHAP力圖與決策圖顯示了具有相似AKI發(fā)生或死亡概率的使用呋塞米的住院患者具體的決策過程。
a:模型預(yù)測患者AKI發(fā)生風(fēng)險的SHAP條形圖,b:模型預(yù)測患者AKI發(fā)生風(fēng)險的SHAP摘要圖,c:模型預(yù)測患者死亡風(fēng)險的SHAP條形圖,d:模型預(yù)測患者死亡風(fēng)險的SHAP摘要圖
a、b:AKI風(fēng)險相似的2例患者LightGBM預(yù)測模型的SHAP決策圖,c、d:死亡風(fēng)險相似的2例患者LightGBM預(yù)測模型的SHAP決策圖
AKI是一種以短時間患者SCr突然升高及尿量減少為特征的臨床常見的綜合征,目前呋塞米的使用與AKI發(fā)生的關(guān)聯(lián)存在爭議[13-14,11]。既往研究表明呋塞米在成年患者的AKI預(yù)防和治療方面無明顯臨床優(yōu)勢,呋塞米治療可能會延長住院時間,對ICU住院患者不利[15-16]。有研究顯示,呋塞米的平均使用劑量高于40 mg/d即可能顯著增加患者發(fā)生AKI風(fēng)險[8]。我們的前期研究也發(fā)現(xiàn),住院患者AKI的發(fā)生與呋塞米的使用密切相關(guān)[17]。本研究中呋塞米相關(guān)AKI總體發(fā)病率高達25.28%,與前期HO等[18]報道的21.62%的結(jié)果相近,如此高的發(fā)生率可能與呋塞米的長期、大劑量使用有關(guān)[8]。此外本研究發(fā)現(xiàn),使用呋塞米的AKI患者病死率顯著高于未發(fā)生AKI患者,因此呋塞米相關(guān)AKI患者帶來的死亡風(fēng)險不應(yīng)被忽視。
為精準預(yù)測使用呋塞米的住院患者發(fā)生AKI的風(fēng)險因素,本研究使用LightGBM等8種機器學(xué)習(xí)方法,對18 998例使用呋塞米的住院患者進行AKI發(fā)生及預(yù)后分析,并獲得了影響AKI發(fā)生和全因死亡的主要因素,提示在呋塞米使用時密切關(guān)注患者腎功能,有助于早期識別使用呋塞米后易發(fā)生AKI及預(yù)后不良的患者。ML預(yù)測模型是指利用機器學(xué)習(xí)的方法對現(xiàn)有數(shù)據(jù)進行分析和建模,從而預(yù)測某指標未來趨勢及結(jié)果,該方法在醫(yī)學(xué)領(lǐng)域已得到廣泛應(yīng)用[19]。LightGBM模型在平衡相對簡單的模型結(jié)構(gòu)、變量選擇以及對結(jié)果進行通俗解釋方面具有創(chuàng)新性,其通過使用非線性交互作用模型,可以靈活預(yù)測涵蓋大量患者、多種診斷和合并癥的結(jié)果[20]。通過ML的方法,本研究構(gòu)建了使用呋塞米的住院患者AKI發(fā)生及死亡風(fēng)險因素的預(yù)測模型,其中LightGBM模型在AKI診斷及死亡風(fēng)險的預(yù)測方面均表現(xiàn)出優(yōu)越的性能,預(yù)測概率高達0.814和0.949,結(jié)合ROC及DCA決策曲線評估,該模型具備良好的預(yù)測能力和臨床適用性。
對結(jié)果缺少解釋是目前常規(guī)使用的風(fēng)險預(yù)測模型(如LR模型等)普遍存在的不足之處,也是此類模型難以進行臨床推廣的重要原因之一。本研究使用SHAP值對預(yù)測AKI診斷及死亡風(fēng)險的主要指標進行可視化分析,并將其進行重要性排序,發(fā)現(xiàn)使用呋塞米后的血肌酐、血清胱抑素C、尿微量白蛋白/肌酐比值、聯(lián)合使用腎上腺素及聯(lián)合使用肝素是影響AKI發(fā)生的5個最重要因素;而使用呋塞米后24 h尿蛋白定量、血漿凝血酶原時間國際標準化比值、血漿血小板計數(shù)、聯(lián)合應(yīng)用腎上腺素及住院期間發(fā)生AKI是導(dǎo)致使用呋塞米患者死亡的5個最重要因素。最新研究顯示,血清胱抑素C是評估腎小球濾過率的理想指標[21]。本研究結(jié)果亦提示,血清胱抑素C對于使用呋塞米患者的AKI發(fā)生風(fēng)險預(yù)測貢獻度僅次于SCr。已有研究證實,急性主動脈夾層患者的凝血功能障礙的存在與AKI發(fā)生風(fēng)險增加相關(guān),凝血功能障礙的嚴重程度則與AKI發(fā)生率呈正相關(guān)[22]。本研究中,凝血相關(guān)指標同樣是使用呋塞米患者AKI發(fā)生及全因死亡風(fēng)險的主要預(yù)測指標,這可能與腎臟血流豐富,對血流動力學(xué)變化敏感有關(guān),該結(jié)論也提示臨床使用呋塞米患者應(yīng)關(guān)注凝血功能與腎功能之間關(guān)系。
本研究存在一定不足之處。首先,這是一項單中心研究。其次,AKI是一種非常復(fù)雜且難以預(yù)測的疾病,盡管我們收集了患者近乎所有指標,并使用了合理的統(tǒng)計方法來消除偏差,但仍可能存在被忽略的導(dǎo)致AKI發(fā)生的潛在因素。另外,本研究未區(qū)分AKI的病因及使用呋塞米的原因,并納入了液體潴留的患者,因此使結(jié)果產(chǎn)生的偏差需要進一步的研究來糾正。
本研究為呋塞米的臨床應(yīng)用提供了必要證據(jù),提示在呋塞米使用時應(yīng)密切關(guān)注患者腎功能的變化,此有助于早期識別使用呋塞米后易發(fā)生AKI患者及預(yù)后不良患者。未來可以進一步搭建在線預(yù)測網(wǎng)站進行呋塞米使用患者的實時AKI發(fā)生與死亡風(fēng)險的預(yù)測,實現(xiàn)該模型的臨床轉(zhuǎn)化與推廣應(yīng)用。
倫理批準和知情同意:本研究涉及的所有試驗均已通過青島大學(xué)附屬醫(yī)院醫(yī)學(xué)倫理委員會的審核批準(文件號QYFYWZLL25838)。所有試驗過程均遵照《涉及人的生物醫(yī)學(xué)研究國際倫理準則》的條例進行。受試對象或其親屬已經(jīng)簽署知情同意書。
作者聲明:崔連順、徐翎鈺、李天陽、管陳、徐巖參與了研究設(shè)計;崔連順、徐翎鈺、管陳、楊成宇、張凝馨、宋卓、徐巖參與了論文的寫作以及修改。所有作者均閱讀并同意發(fā)表該論文,且均聲明不存在相關(guān)利益沖突。