高文鵬 呂海金 周瑯 郭圣文
急性腎損傷(acute kidney injury,AKI)在重癥監(jiān)護(hù)室 (intensive care unit,ICU)患者中很常見,具有較高的發(fā)病率與死亡率[1-2]。全球腎臟病預(yù)后組織KDIGO(Kidney Disease:Improving Global Outcomes)發(fā)表的 AKI 臨床實踐指南[3]中對AKI的具體判別標(biāo)準(zhǔn)為:48 h內(nèi)血清肌酐升高≥26.5 μmol /L 或在7 d內(nèi)血清肌酐增加到基線值的 1.5 倍以上,或尿量小于0.5 mL/(kg·h)且持續(xù)時間不少于6 h。研究表明,AKI導(dǎo)致ICU患者更高的治療費用、不良的臨床反應(yīng)和慢性腎病的發(fā)展[3],并且是ICU患者高死亡率的獨立影響因素[4-5]。
由于血清肌酐是AKI的非特異性標(biāo)志物,對AKI的診斷具有一定滯后性[6],而臨床中尿量不易監(jiān)測且操作誤差較大,故尋找影響AKI的重要臨床因素并進(jìn)行早期預(yù)測,是對ICU內(nèi)AKI風(fēng)險患者及時干預(yù)、指導(dǎo)治療的關(guān)鍵。迄今為止,有關(guān)AKI的早期預(yù)測通常有以下兩種方法:一種是尋找具有特異性的生物標(biāo)志物,另一種是基于統(tǒng)計學(xué)或機器學(xué)習(xí)方法建立風(fēng)險預(yù)測模型。由于生物標(biāo)志物的方法費用高、可納入樣本量少且受個體差異影響較大,其臨床應(yīng)用受限。
隨著開源重癥數(shù)據(jù)庫的建立和醫(yī)院電子病歷(electronic health records,EHR)的普及,ICU 患者臨床數(shù)據(jù)的可用性不斷提高[7],從而為AKI 預(yù)測研究提供充分的數(shù)據(jù)支持,相關(guān)研究逐漸增多。如Haines等[8]收集倫敦皇家醫(yī)院ICU內(nèi)830名患者的人口學(xué)信息和入院后24 h內(nèi)的血液學(xué)指標(biāo),使用邏輯回歸進(jìn)行AKI預(yù)測,結(jié)果顯示預(yù)測AKI 1~3期的受試者工作特征曲線(receiver operator characteristic curve,ROC曲線)下面積(area under curve,AUC)值為0.70,預(yù)測AKI 2~3期AUC值為0.91。Malhotra等[9]收集兩家獨立醫(yī)院ICU共2 017 名患者的人口學(xué)信息、合并癥、生命體征、血液學(xué)指標(biāo)及干預(yù)措施,使用多變量回歸分析進(jìn)行AKI預(yù)測,獨立測試集的AUC值為0.81。也有學(xué)者利用開源重癥數(shù)據(jù)庫進(jìn)行AKI預(yù)測,如李千惠[10]從 Medical Information Mart for Intensive Care(MIMIC)重癥數(shù)據(jù)庫中提取1 690例患者(AKI患者840例)的生命體征和血液學(xué)指標(biāo),使用邏輯回歸、Adaboost及多層感知機3種模型進(jìn)行 AKI早期預(yù)測,結(jié)果表明多層感知機性能最好,F(xiàn)1.5分?jǐn)?shù)為0.944。
張淵等[11]從MIMIC 數(shù)據(jù)庫中提取1 166名患者(AKI患者884例)的人口學(xué)信息、生命體征和血液學(xué)指標(biāo),使用邏輯回歸、隨機森林及LightGBM 3種模型進(jìn)行AKI發(fā)生前24 h預(yù)測,發(fā)現(xiàn)LightGBM 模型最優(yōu),AUC 值為0.92。Zimmerman等[12]提取MIMIC數(shù)據(jù)庫23 950例患者的人口學(xué)信息及入院后24 h內(nèi)、生命體征、血液學(xué)指標(biāo)、干預(yù)措施,使用邏輯回歸、隨機森林與多層感知機進(jìn)行AKI早期預(yù)測,平均AUC值為0.783。
目前對ICU患者AKI預(yù)測的研究主要存在以下不足:(1)納入樣本量不足,特別是AKI患者的樣本量普遍偏少,使得模型可靠性不足;(2)臨床或數(shù)據(jù)庫信息利用不充分,可能遺漏重要影響因素;(3)預(yù)測時間不及時,缺乏連續(xù)預(yù)警功能,導(dǎo)致臨床醫(yī)生沒有足夠的時間進(jìn)行干預(yù)。
針對以上不足,本研究基于30 020名ICU患者的人口學(xué)信息、入院信息、用藥情況、生命體征、血液學(xué)指標(biāo)、危重癥評分、合并癥、干預(yù)措施等8類臨床信息,按4∶1隨機劃分訓(xùn)練集與獨立測試集,分別應(yīng)用邏輯回歸、隨機森林和LightGBM 3種機器學(xué)習(xí)算法,建立24 h、48 h和72 h 3個時間點的AKI預(yù)測模型,對不同模型的性能進(jìn)行評估、比較與分析,并使用最優(yōu)模型進(jìn)行連續(xù)24 h預(yù)測,明確與AKI事件發(fā)生相關(guān)的重要因素。
本研究所用數(shù)據(jù)來自MIMIC-III數(shù)據(jù)庫[13],MIMIC-III是美國麻省理工提供的一個公開免費的多參數(shù)重癥監(jiān)護(hù)數(shù)據(jù)庫,包含了從2001年6月1日至2012年10月31日在波士頓的貝斯以色列女執(zhí)事醫(yī)療中心ICU收治的46 520名患者的住院記錄,具有樣本量大、臨床信息豐富的特點。
入組標(biāo)準(zhǔn):年齡>18歲;ICU住院時長>24 h。排除具有以下合并癥的患者:腎結(jié)石;輸尿管結(jié)石;腎癌;腎盂癌;尿路梗阻性疾病。首測肌酐值屬于正常范圍(31.8~116.0 μmol/L)的患者,以首測肌酐值作為基線肌酐值;首測肌酐值不屬于正常范圍的患者,在排除慢性腎病的前提下,取116.0 μmol/L作為基線肌酐值;多次入住ICU的患者,若連續(xù)兩次住ICU時間間隔超過48 h,則分別按照不同樣本納入。
根據(jù)以上標(biāo)準(zhǔn),最終納入30 020名患者,其中AKI患者共17 222名,占比57.4%。
(1)人口學(xué)信息:年齡、性別、體質(zhì)量、身高。
(2)入院信息:入院方式、ICU類型。
(3)藥物使用:抗生素、利尿劑、他克莫司、利福平、兩性霉素、順鉑。
(4)生命體征:平均動脈壓、心率、呼吸頻率、收縮壓、舒張壓、體溫。
(5)危重癥患者健康評分:Elixhauser comorbidity score、SAPS II、SOFA score、APSIII。
(6)合并癥:高血壓、糖尿病、心肌梗死、心力衰竭、膿毒癥、癌癥。
(7)血液學(xué)指標(biāo):肌酐、血紅蛋白、白蛋白、pH、碳酸氫鹽 、堿剩余、乳酸、鉀、氯、鈉、白細(xì)胞計數(shù)、葡萄糖、血尿素氮、膽紅素。
(8)干預(yù)措施:機械通氣、腎臟替代治療。
其中,入院方式包括ELECTIVE(有計劃的入院)、URGENT(急診,不危及生命)、EMERGENCY(急診,危及生命)3種;ICU類型包括SICU、MICU、CCU、TSICU、CSRU 5種;合并癥與干預(yù)措施用“0/1”表示,0表示無,1表示有;危重癥患者評分中,Elixhauser comorbidity score是針對患者的合并癥評分,SAPS II是簡化急性生理學(xué)評分,SOFA score是器官衰竭評分,APS III為急性生理學(xué)及慢性健康狀況評分。
本研究對AKI進(jìn)行提前24 h、48 h、72 h預(yù)測,參考Peng等[14]的數(shù)據(jù)收集方法,對于AKI患者,其數(shù)據(jù)收集范圍為入ICU到AKI發(fā)生前24 h、48 h、72 h;對于Non-AKI患者,其數(shù)據(jù)收集范圍為入ICU到出ICU前24 h、48 h、72 h。數(shù)據(jù)收集窗口如圖1所示。
圖1 AKI患者與Non-AKI患者的數(shù)據(jù)收集窗口Figure 1 Data collection windows for AKI patients and Non-AKI patients
根據(jù)數(shù)據(jù)收集時間窗,獲取特征參數(shù)后,對生命體征與血液學(xué)指標(biāo),分別計算它們在時間窗內(nèi)的首檢值、最小值、最大值、均值、標(biāo)準(zhǔn)差等,將統(tǒng)計特征納入特征隊列,以反映特征的統(tǒng)計分布特性。最后得到的特征維數(shù)為102。
邏輯回歸[15]是一種經(jīng)典的廣義的線性分析模型。
如果用x、θ、h、y分別表示訓(xùn)練數(shù)據(jù)、模型參數(shù)、預(yù)測輸出函數(shù)和真實標(biāo)簽,則分類問題實際上是一個伯努利分布:
P(y=1|x;θ)=hθ(x)
(1)
P′=P(y=0|x;θ)=1-hθ(x)
(2)
式(1)和式(2)可以合并為:
P′=(hθ(x))y(1-hθ(x))1-y
(3)
將式(3)的最大似然作為目標(biāo)函數(shù):
(4)
應(yīng)用梯度下降法對L(θ)求對數(shù),再對模型參數(shù)θ求偏導(dǎo)。
與線性回歸不同,邏輯回歸通過引入一個單調(diào)可微的Sigmoid函數(shù)作為輸出函數(shù),從而將線性方程預(yù)測的連續(xù)值映射成1/0兩個離散值。
邏輯回歸的計算代價不高,易于理解和實現(xiàn),但對模型中自變量多重共線性較為敏感,容易欠擬合,分類精度較低,難以處理數(shù)據(jù)不平衡的問題。
隨機森林[16]以決策樹為基本分類器,利用集成學(xué)習(xí)的Bagging思想,通過有放回的隨機抽樣,從原始數(shù)據(jù)集中隨機選取數(shù)據(jù)子集與特征,構(gòu)建多個決策樹進(jìn)行分類,其輸出類別是單個樹輸出類別的眾數(shù)。
隨機森林通過將多個分類器進(jìn)行結(jié)合,??色@得比單一學(xué)習(xí)器更優(yōu)越的泛化性能,但在噪聲比較大的數(shù)據(jù)上容易過擬合。隨機森林的算法流程圖如圖2所示。
圖2 隨機森林流程圖Figure 2 Flowchart of random forest
LightGBM(light gradient boosting machine)是對梯度提升決策樹算法(gradient boosting decision tree,GBDT)的優(yōu)化[17],主要包含兩個算法:單邊梯度采樣(gradient-based one-side sampling,GOSS)和互斥特征綁定(exclusive feature bundling,EFB)。
GOSS算法通過區(qū)分不同梯度的訓(xùn)練數(shù)據(jù),保留較大梯度數(shù)據(jù)的同時對較小梯度數(shù)據(jù)隨機采樣,從而達(dá)到減少計算量、提升運算效率的目的。定義O表示某個固定節(jié)點的訓(xùn)練集,訓(xùn)練集實例為x1,x2,…,xn,特征維度為s,分割特征為j,信息增益為V[17]。每次梯度迭時,模型數(shù)據(jù)變量的損失函數(shù)的負(fù)梯度方向表示為g1,g2,…,gn,則分割特征j在分割點d的信息增益為:
(5)
GOSS算法中,首先根據(jù)數(shù)據(jù)的梯度將訓(xùn)練數(shù)據(jù)降序。保留梯度最大的前a%的數(shù)據(jù),作為數(shù)據(jù)子集A,再從剩余的數(shù)據(jù)中進(jìn)行隨機采樣得到數(shù)據(jù)子集B。
EFB是通過特征捆綁的方式減少特征維度,從而提升計算效率。原始特征個數(shù)為feature,合并后特征個數(shù)為bundle,這種方式的特征復(fù)雜度從O1(data×feature)降到O2(data×bundle),由于bundle遠(yuǎn)小于feature,模型能夠極大地加速GBDT的訓(xùn)練過程而不影響最后的精度。
此外,LightGBM將連續(xù)的浮點特征值離散化成k個整數(shù),構(gòu)造出寬度為k的直方圖,當(dāng)遍歷完一次數(shù)據(jù)后,直方圖累積了離散化需要的統(tǒng)計量,之后進(jìn)行節(jié)點分裂時,可以根據(jù)直方圖上的離散值尋找最佳分割點,減少對內(nèi)存的消耗。LightGBM還摒棄了大部分GBDT使用的按層生長(level-wise)的決策樹生長策略,使用帶有深度限制的按葉子生長(leaf-wise)的策略,在分裂次數(shù)相同的情況下,可以降低更多的誤差,得到更好的精度。
評價指標(biāo)采用精確性(precision)、敏感性(sensitivity)、F1值和AUC。
(6)
(7)
(8)
式中:true negative(TN),稱為真陰率,表明實際是負(fù)樣本預(yù)測成負(fù)樣本的樣本數(shù);false positive(FP),稱為假陽率,表明實際是負(fù)樣本預(yù)測成正樣本的樣本數(shù);false negative(FN),稱為假陰率,表明實際是正樣本預(yù)測成負(fù)樣本的樣本數(shù);true positive(TP),稱為真陽率,表明實際是正樣本預(yù)測成正樣本的樣本數(shù)。
將30 020名患者按4∶1隨機劃分訓(xùn)練集和獨立測試集,訓(xùn)練集和獨立測試集的人數(shù)分別為24 016(其中AKI患者13 778名,Non-AKI患者10 238名)和6 004(包括AKI患者3 444名,Non-AKI患者2 560名)。模型訓(xùn)練階段采用十折交叉驗證,訓(xùn)練結(jié)束后,使用獨立測試集評估所訓(xùn)練模型的性能。
各模型十折交叉驗證與獨立測試集的結(jié)果如表1、表2所示,不同模型在對相同時間點預(yù)測時,除了邏輯回歸模型預(yù)測24 h后的AKI敏感性最高之外,邏輯回歸、隨機森林、LightGBM模型的性能依次遞增;隨著預(yù)測時間點由24 h、48 h至72 h增加,預(yù)測難度上升,同一模型預(yù)測性能逐漸下降。LightGBM的精確性和敏感性均比較高,且相差不大,隨機森林也類似,因此,二者的F1值和AUC值也較高,但邏輯回歸的精確性和敏感性相差較大,即邏輯回歸不能有效平衡查準(zhǔn)率與查全率,其F1值和AUC值較低。綜合比較,LightGBM在3個時間點的預(yù)測性能均最優(yōu),在獨立測試集上24 h、48 h、72 h預(yù)測AKI的AUC值分別為0.90、0.88、0.87。不同模型不同時間點預(yù)測的ROC曲線如圖3所示。
圖3 3種模型AKI預(yù)測的ROC比較Figure 3 Comparison of the ROC obtained by three prediction models
表1 不同時間點十折交叉驗證的結(jié)果Table 1 Results of 10-fold cross-validation of different time points
表2 不同時間點獨立測試集的結(jié)果Table 2 Results of independent test sets at different time points
應(yīng)用性能最優(yōu)的LightGBM,對AKI患者進(jìn)行連續(xù)24 h預(yù)測,即從入ICU第1天開始,預(yù)測24 h后發(fā)生AKI的風(fēng)險,第2天則根據(jù)當(dāng)天及當(dāng)天之前的數(shù)據(jù),進(jìn)行24 h預(yù)測,直至轉(zhuǎn)出ICU為止。將臨床確診為AKI的時間減去模型首次預(yù)測AKI成功的時間,作為提前時間(天數(shù)),統(tǒng)計預(yù)測成功的天數(shù)與比例(表3)。表3說明,LightGBM連續(xù)24 h預(yù)測的成功率較高,提前1、2、3天預(yù)測AKI風(fēng)險患者的成功率分別為89%、83%和80%。當(dāng)對1 587名根據(jù)KDIGO標(biāo)準(zhǔn)確診的AKI患者,模型能提前3天獲知其中1 272名患者具有AKI風(fēng)險,此時給臨床醫(yī)生預(yù)留了3天的時間進(jìn)行干預(yù)治療。
表3 LightGBM提前1~3天預(yù)測AKI的成功率Table 3 Success rates of AKI prediction of 1-3 days in advance using LightGBM
特征重要性可以反映每個特征對模型預(yù)測能力的貢獻(xiàn)程度。根據(jù)特征在模型訓(xùn)練過程中被使用的次數(shù),得到LightGBM 24 h、48 h與72 h 3個時間點的所有特征權(quán)重列表,選擇排列前35的特征,如圖4所示。
圖4 LightGBM 3個時間點AKI預(yù)測的前35重要特征Figure 4 Top 35 important features obtained by LightGBM at three time points
3個時間點預(yù)測模型得到的位居前列的特征大部分相同,均包括已住院時長、體質(zhì)量、體溫最小值、白細(xì)胞記數(shù)最大值/最小值、碳酸氫鹽最大值、葡萄糖最小值、舒張壓最大值、血尿素氮最小值/最大值、APS III評分、體溫最大值/首測值、血紅蛋白首測值、心率首測值、血清肌酐最小值/最大值、收縮壓最大值、心率首測值/最大值、葡萄糖最大值/首測值、收縮壓首測值和氯最大值等24個特征。
值得注意的是,3個時間點預(yù)測模型中:已住院時長、體質(zhì)量均位列前2,提示在早期預(yù)測AKI時,應(yīng)首先觀察這兩個指標(biāo);白細(xì)胞記數(shù)最大值、碳酸氫鹽最大值、體溫最小值均位列前10,需重點關(guān)注;而血清肌酐的重要性均未排入前10,表明血清肌酐對模型的作用不夠理想,僅以肌酐作為AKI診斷標(biāo)準(zhǔn)敏感性不足,具有一定滯后性。
為進(jìn)一步驗證重要特征的作用,并對特征進(jìn)行降維,在僅使用24個重要特征的情況下,對LightGBM不同時間點預(yù)測模型進(jìn)行訓(xùn)練和測試。獨立測試集的結(jié)果如表4所示。
由表4結(jié)果可知,當(dāng)僅使用24個重要特征時,LightGBM預(yù)測模型24 h、48 h、72 h的AUC值分別為0.88、0.86、0.85。與使用全部特征相比,AUC值降低不超過2個百分點。說明在102維全部特征當(dāng)中,24個重要特征對LightGBM模型的預(yù)測性能貢獻(xiàn)了絕大部分作用,僅使用重要特征也能對AKI進(jìn)行連續(xù)、有效的預(yù)測。
表4 LightGBM僅使用24個重要特征的預(yù)測結(jié)果 Table 4 Prediction results of LightGBM using only 24 important features
實驗結(jié)果表明,3種機器學(xué)習(xí)模型中,LightGBM模型性能最優(yōu),隨機森林次之,邏輯回歸較差。使用性能最佳的LightGBM可對AKI風(fēng)險患者進(jìn)行連續(xù)預(yù)測,僅使用重要特征時仍有較好的性能。
與以往的AKI預(yù)測研究相比[8-12],本研究的主要優(yōu)勢為:(1)納入較大樣本量??倶颖玖?、AKI患者數(shù)均大于上文提及的相關(guān)研究,樣本平衡性更好,結(jié)果可靠性更高。(2)使用8大類臨床信息構(gòu)造特征,降低了遺漏關(guān)鍵因素的可能性,并對特征降維,使用重要特征進(jìn)行預(yù)測,進(jìn)一步驗證了本文得到的重要特征的作用。(3)構(gòu)建了24 h、48 h、72 h 3個時間點預(yù)測模型,并對AKI風(fēng)險患者進(jìn)行連續(xù)預(yù)測,不僅能持續(xù)監(jiān)測患者病情,也為臨床醫(yī)生進(jìn)行干預(yù)與治療預(yù)留了更多時間。
LightGBM 24 h預(yù)測模型中,排列前10的主要特征包括已住院時長、體質(zhì)量、白蛋白首測值、白細(xì)胞計數(shù)最大值、收縮壓最小值、碳酸氫鹽最大值、葡萄糖最小值、白細(xì)胞計數(shù)最小值、體溫最大值、血尿素氮最小值,3個時間點預(yù)測模型中,位居前30的特征絕大部分相同。
ICU病房中,患者住院時間長,說明患者健康狀況嚴(yán)峻、疾病更為復(fù)雜,從而導(dǎo)致AKI的潛在風(fēng)險升高。體質(zhì)量作為最常見且易得到的指標(biāo),本實驗數(shù)據(jù)中,患者體質(zhì)量每增加5 kg,AKI發(fā)病率升高3.74%。
體溫過低會導(dǎo)致腎血流量下降、腎小管功能受損,可引起酸中毒和堿中毒[18-19]。在ICU內(nèi),超過40%的體溫過低患者會出現(xiàn)AKI[18]。
白細(xì)胞在炎癥反應(yīng)、宿主防御和修復(fù)中具有重要作用,是大多數(shù)器官損傷過程中起關(guān)鍵作用的免疫學(xué)因素之一。白細(xì)胞計數(shù)與AKI風(fēng)險之間呈現(xiàn)U型關(guān)系,白細(xì)胞計數(shù)降低導(dǎo)致的高AKI風(fēng)險可能歸因于淋巴細(xì)胞和單核細(xì)胞的減少,白細(xì)胞計數(shù)升高導(dǎo)致的高AKI風(fēng)險可能歸因于中性粒細(xì)胞的增多[20]。
血清中碳酸氫鹽有助于增加向腎臟的氧輸送,同時能夠中和腎臟部分的酸中毒,而較低的碳酸氫鹽水平會增加腎臟缺血性損傷的風(fēng)險,特別是在危重癥情況下[21]。
本研究尚存在以下不足:(1)樣本來自單中心數(shù)據(jù)庫,模型魯棒性有待多中心數(shù)據(jù)的進(jìn)一步驗證;(2)僅預(yù)測 AKI與非AKI,沒有對AKI按KIDGO診斷標(biāo)準(zhǔn)進(jìn)行分級(I-III級)預(yù)測。
本研究基于MIMIC-III數(shù)據(jù)庫 ,提取30 020名患者的人口學(xué)信息、入院信息、生命體征、危重癥評分、合并癥、血液學(xué)指標(biāo)、用藥及干預(yù)措施等8類臨床信息,分別使用邏輯回歸、隨機森林和LightGBM 3種機器學(xué)習(xí)算法,建立了24 h、48 h、72 h 3個時間點的AKI預(yù)測模型,比較不同模型的預(yù)測性能,獲取重要特征。結(jié)果表明LightGBM的預(yù)測性能最優(yōu),且在連續(xù)預(yù)測AKI風(fēng)險患者時具有高達(dá)80%的識別率,在僅使用重要特征進(jìn)行預(yù)測時仍有較高的性能。研究結(jié)果可對ICU患者發(fā)生AKI風(fēng)險提供連續(xù)、有效的預(yù)測,明確重要影響因素,并為醫(yī)護(hù)人員進(jìn)行及時合理的干預(yù)提供重要指導(dǎo)。