[摘要] 目的 利用機(jī)器學(xué)習(xí)算法預(yù)測(cè)早產(chǎn)兒重癥監(jiān)護(hù)病房(intensive care unit,ICU)死亡風(fēng)險(xiǎn),為臨床醫(yī)生提供早期診斷和風(fēng)險(xiǎn)評(píng)估的輔助決策工具。方法 回顧性收集兒科重癥監(jiān)護(hù)數(shù)據(jù)庫中早產(chǎn)兒病例的臨床數(shù)據(jù)。基于最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸分析和多因素Logistic回歸分析,篩選影響早產(chǎn)兒預(yù)后的關(guān)鍵臨床特征。研究通過人工少數(shù)類過采樣技術(shù)算法平衡數(shù)據(jù),結(jié)合7種機(jī)器學(xué)習(xí)模型構(gòu)建預(yù)測(cè)模型并評(píng)估其性能。使用沙普利加性解釋法(Shapley additive explanations,SHAP)進(jìn)行模型解釋。結(jié)果 最終納入患兒923例,生存組886例,死亡組37例,共收集38個(gè)臨床特征。LASSO篩選出8個(gè)與早產(chǎn)兒ICU死亡密切相關(guān)的變量(乳酸、呼吸頻率、氯離子濃度、中性粒細(xì)胞、紅細(xì)胞分布寬度等)。多因素Logistic回歸分析顯示乳酸、呼吸頻率是早產(chǎn)兒ICU預(yù)后的獨(dú)立影響因素。內(nèi)部測(cè)試及外部驗(yàn)證顯示輕量梯度提升機(jī)模型在準(zhǔn)確性、精確性等指標(biāo)上均優(yōu)于其他模型。SHAP分析顯示,呼吸頻率和乳酸對(duì)早產(chǎn)兒死亡風(fēng)險(xiǎn)的預(yù)測(cè)貢獻(xiàn)最大。結(jié)論 本研究為早產(chǎn)兒預(yù)后的早期識(shí)別和干預(yù)提供可靠工具,強(qiáng)調(diào)關(guān)鍵指標(biāo)的重要性。
[關(guān)鍵詞] 早產(chǎn)兒;ICU死亡風(fēng)險(xiǎn);機(jī)器學(xué)習(xí);輕量梯度提升機(jī)模型;風(fēng)險(xiǎn)預(yù)測(cè)
[中圖分類號(hào)] R722.6" """"[文獻(xiàn)標(biāo)識(shí)碼] A """[DOI] 10.3969/j.issn.1673-9701.2025.18.007
Mortality risk assessment and interpretability analysis of preterm infants in the ICU by using machine learning models
SU Yanfeng1, HONG Suru2, CHEN Yushuang3, WU Xiayang3
1.Department of Emergency Medicine, the Second Affiliated Hospital of Xiamen Medical College, Xiamen 361021, Fujian, China; 2.Department of Radiology, Xiamen Children’s Hospital, Xiamen 361006, Fujian, China; 3.Department of Pharmacy, Xiamen Children’s Hospital, Xiamen 361006, Fujian, China
[Abstract] Objective To aim at using machine learning algorithms to predict the risk of neonatal intensive care unit (ICU) mortality, providing clinicians with an early diagnosis and risk assessment tool to assist in decision-making. Methods Clinical data of preterm infants from the paediatric intensive care database retrospectively were collected. By using least absolute shrinkage and selection operator (LASSO) regression analysis and multivariate Logistic regression analysis, key clinical characteristics affecting preterm infant prognosis were screened. The study was balanced the data by using the synthetic minority oversampling technique, combined seven machine learning models to build a predictive model and evaluate its performance. The Shapley additive explanations (SHAP) was used for model interpretation. Results A total of 923 preterm infants were finally included, survival group comprised 886 infants, and death group comprised 37 infants. A total of 38 clinical characteristics were collected. LASSO screening identified 8 variables significantly associated with neonatal ICU mortality, including lactate, respiratory rate, chloride concentration, neutrophils, and red blood cell distribution width etc. Multivariate Logistic regression analysis revealed that lactate and respiratory rate were independent predictors of neonatal ICU outcomes. Internal testing and external validation showed that light gradient boosting machine model outperformed other models in terms of accuracy and precision etc. indicators. SHAP analysis indicated that respiratory rate and lactate levels had the largest predictive contribution to the risk of preterm infants mortality. Conclusion This study provides reliable tools for early identification and intervention in the prognosis of preterm infants, emphasizing the importance of key indicators.
[Key words] Preterm infants; ICU mortality risk; Machine learning; Light gradient boosting machine model; Risk prediction
早產(chǎn)兒因器官發(fā)育不成熟,出生后面臨嚴(yán)重的健康挑戰(zhàn),尤以重癥監(jiān)護(hù)病房(intensive care unit,ICU)死亡率居高不下為甚。研究表明早產(chǎn)兒在新生兒重癥監(jiān)護(hù)病房(neonatal intensive care units,NICU)中的呼吸窘迫、中樞神經(jīng)感染及壞死性小腸結(jié)腸炎等發(fā)生率明顯高于足月兒,提示需加強(qiáng)監(jiān)護(hù)和干預(yù)以降低死亡風(fēng)險(xiǎn)[1-2]。傳統(tǒng)預(yù)測(cè)方法在早期診斷中雖有一定作用,但對(duì)個(gè)體化風(fēng)險(xiǎn)預(yù)測(cè)仍有限。近年來,機(jī)器學(xué)習(xí)技術(shù)為復(fù)雜數(shù)據(jù)分析和高效預(yù)測(cè)提供新途徑,具有可解釋性的高性能模型有助于評(píng)估預(yù)后并支持臨床決策,然而此類模型在臨床較缺乏。因此,構(gòu)建應(yīng)用于早產(chǎn)兒ICU死亡風(fēng)險(xiǎn)預(yù)測(cè)且兼具良好可解釋性的機(jī)器學(xué)習(xí)模型,具有重要的臨床應(yīng)用價(jià)值。
本研究基于兒科重癥監(jiān)護(hù)(paediatric intensive care,PIC)數(shù)據(jù)庫進(jìn)行回顧性分析,旨在利用機(jī)器學(xué)習(xí)模型預(yù)測(cè)患兒的ICU死亡風(fēng)險(xiǎn)。為臨床醫(yī)生提供一種輔助決策工具,輔助早期診斷和風(fēng)險(xiǎn)評(píng)估,及時(shí)發(fā)現(xiàn)不良預(yù)后風(fēng)險(xiǎn)并進(jìn)行干預(yù),為臨床早產(chǎn)兒個(gè)性化治療方案提供數(shù)據(jù)支持和新的研究視角。
1" 資料與方法
1.1" 資料來源
本研究的回顧性隊(duì)列數(shù)據(jù)來源于PIC數(shù)據(jù)庫中診斷為早產(chǎn)兒的臨床病例資料,外部驗(yàn)證數(shù)據(jù)提取自美國(guó)大型重癥監(jiān)護(hù)醫(yī)學(xué)信息數(shù)據(jù)庫Ⅲ(medical information mart for intensive care Ⅲ,MIMIC-Ⅲ)。研究者已通過數(shù)據(jù)庫的相關(guān)課程,獲得數(shù)據(jù)庫的使用授權(quán)(證書編號(hào):64962098)。
1.2" 納排標(biāo)準(zhǔn)
納入標(biāo)準(zhǔn):①年齡0~1歲;②早產(chǎn)兒,依據(jù)國(guó)際疾病分類診斷編碼第10次修訂本(international classification of diseases-10,ICD10)識(shí)別P07.3; ③首次進(jìn)入ICU治療;④有完整的病例分析。排除標(biāo)準(zhǔn):需要研究的臨床數(shù)據(jù)缺失。
1.3" 提取數(shù)據(jù)
提取患兒的人口統(tǒng)計(jì)學(xué)資料和入住ICU首日的實(shí)驗(yàn)室指標(biāo)、生命體征、預(yù)后信息等。根據(jù)出ICU時(shí)是否診斷死亡將患兒分為生存組和死亡組。
1.4" 數(shù)據(jù)清洗
若某列數(shù)據(jù)缺失值達(dá)到總數(shù)的20%,則刪除該例數(shù)據(jù),避免大量缺失值帶來的分析偏差;缺失數(shù)據(jù)lt;20%時(shí)多重插補(bǔ)填充,最大限度減少偏差。
1.5" 特征篩選
采用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸篩選特征變量,通過壓縮回歸系數(shù)為零的變量,剔除不必要特征。將篩選出的非零系數(shù)指標(biāo)納入多因素Logistic回歸模型,確定與ICU死亡風(fēng)險(xiǎn)相關(guān)的獨(dú)立預(yù)后因素并計(jì)算優(yōu)勢(shì)比(odds ratio,OR)及對(duì)應(yīng)95%CI。
1.6" 模型構(gòu)建與評(píng)估
利用人工少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)平衡兩組患兒組間差異。將數(shù)據(jù)按7∶3的比例隨機(jī)分為訓(xùn)練集與內(nèi)部測(cè)試集,訓(xùn)練集用于建立模型,內(nèi)部測(cè)試集評(píng)估模型性能,并使用MIMIC-Ⅲ數(shù)據(jù)庫進(jìn)行外部驗(yàn)證。將臨床變量納入決策樹、梯度決策樹(gradient boosting decision tree,GBDT)、隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)、輕量梯度提升機(jī)(light gradient boosting machine,LGBM)、極端梯度提升機(jī)(extreme gradient boosting,XGB)、樸素貝葉斯(naive Bayes,NB)7種機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型,通過臨床決策曲線(decision curve analysis,DCA)比較各模型凈收益,計(jì)算受試者操作特征曲線下面積(area under the curve,AUC)、準(zhǔn)確度、精確度、召回率和F1值綜合評(píng)估模型性能,選擇最佳模型作進(jìn)一步解釋。
1.7" 統(tǒng)計(jì)學(xué)方法
采用DecisionLinnc 1.3軟件進(jìn)行統(tǒng)計(jì)分析。對(duì)計(jì)量資料進(jìn)行正態(tài)性檢驗(yàn)后,符合正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,組間比較采用t檢驗(yàn);不符合正態(tài)分布的計(jì)量資料以中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示,組間比較采用秩和檢驗(yàn)。計(jì)數(shù)資料以例數(shù)(百分率)[n(%)]表示,比較采用c2檢驗(yàn)或Fisher確切概率法。P lt;0.05為差異有統(tǒng)計(jì)學(xué)意義。
2" 結(jié)果
2.1 "兩組患兒的基線資料比較
本研究共納入923例患兒,生存組886例,死亡組37例。兩組患兒的性別、呼吸頻率、血小板計(jì)數(shù)、紅細(xì)胞分布寬度、鉀離子、總蛋白、球蛋白、pH、ICU時(shí)間差異有統(tǒng)計(jì)學(xué)意義(Plt;0.05),見表1。
2.2 "LASSO回歸篩選特征變量
通過LASSO回歸分析對(duì)38個(gè)變量進(jìn)行降維處理,篩選出最具代表性的死亡風(fēng)險(xiǎn)影響因素,見圖1。結(jié)果顯示呼吸頻率、淋巴細(xì)胞、紅細(xì)胞分布寬度、中性粒細(xì)胞、氯離子濃度、球蛋白、二氧化碳分壓和乳酸8個(gè)變量為早產(chǎn)兒ICU死亡的影響因素。
2.3" 早產(chǎn)兒ICU死亡風(fēng)險(xiǎn)影響因素的多因素Logistic回歸分析
以是否ICU死亡(死亡=1,存活=0)為因變量,LASSO回歸模型篩選的8個(gè)變量為自變量,通過多因素Logistic回歸模型進(jìn)一步分析,結(jié)果顯示乳酸、呼吸頻率是早產(chǎn)兒ICU死亡風(fēng)險(xiǎn)相關(guān)的獨(dú)立預(yù)后因素(Plt;0.001),見表2。
2.4" 構(gòu)建預(yù)測(cè)模型及性能評(píng)價(jià)
本研究生存組886例,死亡組37例,數(shù)據(jù)分布明顯失衡,可能影響模型性能[3]。常規(guī)解決方案包括過采樣與欠采樣。欠采樣可減少多數(shù)類樣本,但可導(dǎo)致信息丟失并降低預(yù)測(cè)精度,因此優(yōu)先選擇過采樣[4]。SMOTE算法可通過線性插值在少數(shù)類樣本間生成合成數(shù)據(jù),提升樣本均衡度,規(guī)避過擬合風(fēng)險(xiǎn)[3]。應(yīng)用SMOTE后,數(shù)據(jù)集擴(kuò)增至1740個(gè)樣本,按7∶3比例劃分訓(xùn)練集與內(nèi)部測(cè)試集。
DCA曲線分析顯示LGBM模型在較大閾值范圍內(nèi)均能顯著提高臨床凈獲益,見圖2。具體指標(biāo)方面,LGBM模型綜合表現(xiàn)最優(yōu):準(zhǔn)確率為0.9693,精確率為0.9601,特異性達(dá)0.9563,召回率為0.9815,AUC為0.9957,F(xiàn)1值為0.9707,見表3。
2.5" 預(yù)測(cè)模型的外部驗(yàn)證
外部驗(yàn)證結(jié)果顯示,LGBM模型的綜合性能良好,與內(nèi)部測(cè)試結(jié)果相同,見圖3、表4。
2.6" LGBM的模型解釋
針對(duì)7種模型中表現(xiàn)最佳的LGBM模型,本研究使用沙普利加性解釋法(Shapley additive explanations,SHAP)進(jìn)行解釋。結(jié)果顯示呼吸頻率、中性粒細(xì)胞、乳酸是模型中最重要的特征。中性粒細(xì)胞計(jì)數(shù)、氯離子濃度和淋巴細(xì)胞百分比的升高與死亡風(fēng)險(xiǎn)增加呈正相關(guān),而呼吸頻率和乳酸則與生存率改善相關(guān)。球蛋白和二氧化碳分壓點(diǎn)云分布較窄,表明其對(duì)預(yù)測(cè)的貢獻(xiàn)較低,見圖4。
3" 討論
本研究通過特征篩選發(fā)現(xiàn)呼吸頻率、淋巴細(xì)胞、紅細(xì)胞分布寬度、中性粒細(xì)胞、氯離子、球蛋白、二氧化碳分壓和乳酸與早產(chǎn)兒ICU死亡風(fēng)險(xiǎn)密切相關(guān)。這些指標(biāo)的異常反映早產(chǎn)兒當(dāng)前的健康狀況和潛在的并發(fā)癥,如肝功能障礙、代謝性酸中毒、呼吸功能不全及全身炎癥反應(yīng)等[5-7]。動(dòng)態(tài)監(jiān)測(cè)這些指標(biāo)并結(jié)合臨床干預(yù),可優(yōu)化早產(chǎn)兒的預(yù)后。
選擇LGBM作為核心模型,主要因其在高維數(shù)據(jù)處理中的優(yōu)越表現(xiàn)及高效訓(xùn)練能力,適合大規(guī)模數(shù)據(jù)分析,性能比較結(jié)果亦驗(yàn)證其優(yōu)勢(shì)。盡管機(jī)器學(xué)習(xí)模型存在“黑箱”性質(zhì),但本研究通過引入SHAP分析,計(jì)算每個(gè)特征對(duì)模型決策的貢獻(xiàn)值,從而提升模型的可解釋性。SHAP結(jié)果表明呼吸頻率和乳酸水平異常是預(yù)測(cè)死亡風(fēng)險(xiǎn)的最強(qiáng)貢獻(xiàn)因子,與早產(chǎn)兒呼吸窘迫綜合征及全身炎癥反應(yīng)密切相關(guān)[8-9]。乳酸水平異常提示組織低灌注,還與膿毒癥繼發(fā)的線粒體功能障礙相關(guān)[10-11];呼吸頻率異常則可能是肺順應(yīng)性下降和中樞性呼吸調(diào)控異常的早期征象[12]。此外,氯離子濃度和中性粒細(xì)胞升高的預(yù)測(cè)權(quán)重提示電解質(zhì)紊亂與感染風(fēng)險(xiǎn)的關(guān)鍵作用,這與Fleischmann-Struzek等[13]研究中院內(nèi)感染對(duì)早產(chǎn)兒死亡率的影響一致。
本研究構(gòu)建基于機(jī)器學(xué)習(xí)算法的早產(chǎn)兒ICU死亡風(fēng)險(xiǎn)預(yù)測(cè)模型,突破傳統(tǒng)評(píng)分系統(tǒng)依賴單一生理指標(biāo)的局限性。通過整合生理參數(shù)與實(shí)驗(yàn)室指標(biāo),更全面地反映早產(chǎn)兒機(jī)體的缺氧與代謝代償狀態(tài),為早期干預(yù)提供敏感生物標(biāo)志物。創(chuàng)新性結(jié)合SMOTE算法與SHAP可解釋技術(shù),有效解決兒科重癥數(shù)據(jù)中普遍存在的類不平衡與臨床可解釋性難題。
綜上,基于LGBM模型并動(dòng)態(tài)監(jiān)測(cè)呼吸頻率和乳酸水平等關(guān)鍵指標(biāo),可為早產(chǎn)兒的健康評(píng)估和早期干預(yù)提供更高效、更精確的工具。未來研究需擴(kuò)大樣本量,以提升模型的穩(wěn)定性和普適性。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻(xiàn)]
[1]"" 許敏, 趙冬瑩, 張擁軍. 早產(chǎn)兒晚發(fā)型細(xì)菌性和真菌性敗血癥的臨床早期鑒別[J]. 上海醫(yī)學(xué), 2017, 40(5): 280–285.
[2]"" DHIRENDRA K S, CLAIRE M M, KELLY A O, et al. Necrotizing enterocolitis: Bench to bedside approaches and advancing our understanding of disease pathogenesis[J]. Front Pediatr, 2023, 10: 1107404.
[3]"" NI Z, ZHU Y, QIAN Y, et al. Synthetic minority over-sampling technique-enhanced machine learning models for predicting recurrence of postoperative chronic subdural hematoma[J]. Front Neurol, 2024, 15: 1305543.
[4]"" SAMPATH P, ELANGOVAN G, RAVICHANDRAN K, et al. Robust diabetic prediction using ensemble machine learning models with synthetic minority over-sampling technique[J]. Sci Rep, 2024, 14(1): 28984.
[5]"" 蔡思銘, 岑紅霞, 廖趙妹, 等. 天冬氨酸轉(zhuǎn)氨酶與血小板比值指數(shù)對(duì)早產(chǎn)兒腸外營(yíng)養(yǎng)相關(guān)性膽汁淤積癥的預(yù)測(cè)價(jià)值[J]. 肝臟, 2021, 26(8): 917–919.
[6]"" 王麗穎. 早期呼吸管理在胎齡27~31周早產(chǎn)兒中的應(yīng)用價(jià)值[J]. 臨床醫(yī)學(xué)研究與實(shí)踐, 2021, 6(7): 93–95.
[7]"" NERMEEN A A, HODA A M, EMAN M N, et al. Prognostic biomarkers in predicting mortality in respiratory patients with ventilator-associated pneumonia[J]. Egypt J Bronchol, 2021, 15(1): 1–16.
[8]"" SWEET D G, CARNIELLI V P, GREISEN G, et al. European consensus guidelines on the management of respiratory distress syndrome: 2022 update[J]. Neonatology, 2023, 120(1): 3–23.
[9]"" MUSTAFA SENOL A, OZHAN A, ESIN O, et al. Systemic inflammatory indices as predictors of lung maturation in preterm infants born before 32 weeks of gestation[J]. J Pediatric Int Care, 2024. DOI: 10. 1055/s- 0044-1791788.
[10] SINGER M, DEUTSCHMAN C S, SEYMOUR C W, "et al. The third international consensus definitions for sepsis and septic shock (sepsis-3)[J]. JAMA, 2016, 315(8): 801–810.
[11] GARCIA-ALVAREZ M, MARIK P, BELLOMO R. Sepsis-associated hyperlactatemia[J]. Crit Care, 2014, 18(5): 503.
[12] SCHMIDT A R, RAMAMOORTHY C. Bronchopulmonary dysplasia[J]. Tidsskr Nor Laegeforen, 2022, 32(2): 174–180.
[13] FLEISCHMANN-STRUZEK C, GOLDFARB D M, SCHLATTMANN P, et al. The global burden of paediatric and neonatal sepsis: A systematic review[J]. Lancet Respir Med, 2018, 6(3): 223–230.
(收稿日期:2025–02–19)
(修回日期:2025–06–04)
通信作者:吳夏陽,電子信箱:56425477@qq.com