[摘要]"目的"采用諾莫圖模型、隨機(jī)森林模型、決策樹模型分別構(gòu)建血流感染(bloodstream"infection,BSI)的鑒別診斷模型。方法"回顧性分析2022年1月至2024年1月于浦江縣人民醫(yī)院診斷治療的BSI患者225例,按照7∶3的比例將患者分為訓(xùn)練集和驗(yàn)證集,運(yùn)用諾莫圖模型、隨機(jī)森林模型、決策樹模型建立革蘭陰性菌BSI(Gram"negative"BSI,GN-BSI)、革蘭陽(yáng)性菌BSI(Gram"positive"BSI,GP-BSI)的鑒別診斷模型,并分析不同模型的鑒別效能。結(jié)果"二元Logistic回歸分析顯示,中性粒細(xì)胞與淋巴細(xì)胞比值(neutrophil"to"lymphocyte"ratio,NLR)、C反應(yīng)蛋白(C-reactive"protein,CRP)、白細(xì)胞介素-6(interleukin-6,IL-6)、紅細(xì)胞體積分布寬度與血小板比值(red"cell"volume"distribution"width"to"platelet"ratio,RPR)、降鈣素原(procalcitonin,PCT)均為GN-BSI和GP-BSI的鑒別診斷變量(Plt;0.05)。在訓(xùn)練集中,諾莫圖模型、隨機(jī)森林模型、決策樹模型鑒別GN-BSI和GP-BSI的曲線下面積(area"under"the"curve,AUC)分別為0.900、0.911、0.884,其中隨機(jī)森林模型的預(yù)測(cè)AUC顯著高于決策樹模型(Z=3.521,P=0.038)。在驗(yàn)證集中,諾莫圖模型、隨機(jī)森林模型、決策樹模型鑒別GN-BSI和GP-BSI的AUC分別為0.908、0.916、0.893,其中隨機(jī)森林模型的預(yù)測(cè)AUC顯著高于決策樹模型(Z=3.412,P=0.042)。結(jié)論"3種模型對(duì)GN-BSI和GP-BSI均有較好的鑒別價(jià)值,其中隨機(jī)森林模型和諾莫圖模型的鑒別性能較高。
[關(guān)鍵詞]"血流感染;諾莫圖模型;決策樹模型;隨機(jī)森林模型
[中圖分類號(hào)]"R446.5""""""[文獻(xiàn)標(biāo)識(shí)碼]"A""""[DOI]"10.3969/j.issn.1673-9701.2024.31.013
Construct"a"machine"learning"model"for"differential"diagnosis"of"bloodstream"infection"based"on"laboratory"indicators
ZHANG"Mei1,"JIN"Miaoling1,"LI"Cui2
1.Department"of"Laboratory,"Pujiang"Branch"of"the"First"Affiliated"Hospital,"Zhejiang"University"School"of"Medicine"(Pujiang"County"People’s"Hospital),"Pujiang"322200,"Zhejiang,"China;"2.Department"of"General"Surgery,"Pujiang"Branch"of"the"First"Affiliated"Hospital,"Zhejiang"University"School"of"Medicine"(Pujiang"County"People’s"Hospital),"Pujiang"322200,"Zhejiang,"China
[Abstract]"Objective"To"construct"a"diagnosis"models"for"differential"diagnosis"of"bloodstream"infection"(BSI)"using"nomogram"model,"random"forest"model,"and"decision"tree"model,"respectively."Methods"A"retrospective"analysis"was"performed"on"225"BSI"patients"diagnosed"and"treated"innbsp;Pujiang"County"People’s"Hospital"from"January"2022"to"January"2024,"and"the"patients"were"divided"into"a"training"set"and"a"validation"set"according"to"a"ratio"of"7":"3."The"differential"diagnostic"models"for"Gram"negative"BSI"(GN-BSI)"and"Gram"positive"BSI"(GP-BSI)"were"established"by"nomogram"model,"random"forest"model,"and"decision"tree"model,"and"the"differential"diagnostic"efficacy"of"different"models"were"analyzed."Results"Binary"Logistic"regression"analysis"showed"that"neutrophil"to"lymphocyte"ratio"(NLR),"C-reactive"protein"(CRP),"interleukin-6"(IL-6),"red"cell"volume"distribution"width"to"platelet"ratio"(RPR),"procalcitonin"(PCT)"were"diagnostic"variable"between"GN-BSI"and"GP-BSI"(Plt;0.05)."In"training"set,"area"under"the"curve"(AUC)"of"nomogram"model,"random"forest"model"and"decision"tree"model"to"identify"GN-BSI"and"GP-BSI"were"0.900,"0.911"and"0.884,"respectively,"and"AUC"of"random"forest"model"was"significantly"higher"than"that"of"decision"tree"model"(Z=3.521,"P=0.038)."In"verification"set,"AUC"of"nomogram"model,"random"forest"model"and"decision"tree"model"for"identifying"GN-BSI"and"GP-BSI"were"0.908,"0.916"and"0.893,"respectively,"and"AUC"of"random"forest"model"was"significantly"higher"than"that"of"decision"tree"model"(Z=3.412,"P=0.042)."Conclusion"The"three"models"have"good"identification"value"for"GN-BSI"and"GP-BSI,"among"which"the"random"forest"model"and"nomogram"model"have"better"identification"performance.
[Key"words]"Bloodstream"infection;"Nomogram"model;"Decision"tree"model;"Random"forest"model
血培養(yǎng)是診斷血流感染(bloodstream"infection,BSI)和鑒別病原菌的金標(biāo)準(zhǔn),但其培養(yǎng)周期長(zhǎng)[1]。在診斷BSI后,臨床常采用廣譜抗生素進(jìn)行經(jīng)驗(yàn)性抗菌治療,導(dǎo)致耐藥菌和藥物不良反應(yīng)的風(fēng)險(xiǎn)增加。不同病原菌對(duì)抗生素的敏感性不同,因此及早明確BSI患者的病原菌對(duì)臨床合理使用抗生素有重要意義。目前關(guān)于革蘭陰性菌BSI(Gram"negative"BSI,GN-BSI)、革蘭陽(yáng)性菌BSI(Gram"positive"BSI,GP-BSI)的鑒別報(bào)道較多,Wang等[2]報(bào)道降鈣素原(procalcitonin,PCT)鑒別GN-BSI的曲線下面積(area"under"the"curve,AUC)為0.818;Gao等[3]報(bào)道PCT結(jié)合血小板參數(shù)對(duì)鑒別GN-BSI和GP-BSI有一定價(jià)值。本研究基于實(shí)驗(yàn)室常規(guī)檢測(cè)指標(biāo),通過(guò)3種模型構(gòu)建GN-BSI和GP-BSI的鑒別診斷模型,并對(duì)模型效能進(jìn)行驗(yàn)證和比較,現(xiàn)將結(jié)果報(bào)道如下。
1""資料與方法
1.1""研究對(duì)象
回顧性分析2022年1月至2024年1月于浦江縣人民醫(yī)院診治的BSI患者225例,其中男124例,女101例,平均年齡(56.79±12.37)歲。納入標(biāo)準(zhǔn):①BSI的診斷標(biāo)準(zhǔn)符合《醫(yī)院感染診斷標(biāo)準(zhǔn)(試行)》[4];②體溫gt;38℃或lt;36℃,伴寒戰(zhàn)或低血壓;③一次或多次從血培養(yǎng)中分離出病原菌;④年齡gt;18歲。排除標(biāo)準(zhǔn):①真菌性BSI;②伴惡性血液系統(tǒng)疾??;③多種細(xì)菌感染;④脾功能亢進(jìn);⑤臨床資料不完整。根據(jù)血培養(yǎng)中病原菌革蘭染色結(jié)果將其分為GN-BSI組和GP-BSI組。本研究經(jīng)浦江縣人民醫(yī)院倫理委員會(huì)批準(zhǔn),所有患者均簽署知情同意書。
1.2"nbsp;方法
通過(guò)電子病歷系統(tǒng)收集所有研究對(duì)象的年齡、
性別、病原菌種類、中性粒細(xì)胞(neutrophil,N)、淋巴細(xì)胞(lymphocyte,L)、紅細(xì)胞體積分布寬度(red"cell"volume"distribution"width,RDW)、血小板(platelet,PLT)、C反應(yīng)蛋白(C-reactive"protein,CRP)、PCT、白細(xì)胞介素-6(interleukin-6,IL-6),并計(jì)算N與L比值(neutrophil"to"lymphocyte"ratio,NLR)、RDW與PLT比值(RDW"to"ratio,RPR)。"""""按照7∶3的比例將所有研究對(duì)象分為訓(xùn)練集和驗(yàn)證集;訓(xùn)練集用于構(gòu)建鑒別模型,驗(yàn)證集用于模型性能驗(yàn)證。
1.3""統(tǒng)計(jì)學(xué)方法
采用SPSS"22.0軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。計(jì)數(shù)資料以例數(shù)(百分率)[n(%)]表示,組間比較采用χ2檢驗(yàn);正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差()表示,組間比較采用獨(dú)立樣本t檢驗(yàn),非正態(tài)分布的計(jì)量資料以中位數(shù)(四分位數(shù)間距)"""[M(Q1,Q3)]表示,組間比較采用Mann-Whitney"U檢驗(yàn)。采用二元Logistic回歸逐步篩選影響因素,將Plt;0.05的變量納入模型分析,先后通過(guò)諾莫圖模型、隨機(jī)森林模型、決策樹模型構(gòu)建BSI鑒別模型,通過(guò)受試者操作特征曲線(receiver"operating"characteristic"curve,ROC曲線)在訓(xùn)練集和驗(yàn)證集對(duì)模型的鑒別效能進(jìn)行分析,Plt;0.05為差異有統(tǒng)計(jì)學(xué)意義。
2""結(jié)果
2.1""訓(xùn)練集兩組患者的臨床資料比較
訓(xùn)練集包含GN-BSI患者92例,GP-BSI患者65例。GN-BSI組患者的NLR、RDW、RPR、CRP、PCT、IL-6均顯著高于GP-BSI組(Plt;0.05),見表1。
2.2""二元Logistic回歸分析
二元Logistic回歸分析中,變量方差膨脹因子均lt;10,說(shuō)明變量間不存在嚴(yán)重共線性。結(jié)果顯示NLR、CRP、IL-6、RPR、PCT均為GN-BSI和GP-BSI的鑒別因素(Plt;0.05),見表2。
2.3""諾莫圖模型
將二元Logstic回歸分析中有統(tǒng)計(jì)學(xué)意義的指標(biāo)納入諾莫圖模型中,將危險(xiǎn)因素分值相加后的總分對(duì)應(yīng)風(fēng)險(xiǎn)讀數(shù)即為GN-BSI的概率,見圖1。
2.4""隨機(jī)森林模型
采用重復(fù)5次十折交叉驗(yàn)證對(duì)自變量進(jìn)行取舍,當(dāng)變量為6時(shí)口袋外數(shù)據(jù)最小,因此本研究選取前6項(xiàng)變量對(duì)模型進(jìn)行優(yōu)化,重要性評(píng)分居前6位的依次為PCT、NLR、IL-6、CRP、RPR、RDW。
2.5""決策樹模型
以基尼系數(shù)為基礎(chǔ)進(jìn)行樹的生長(zhǎng),以最小代價(jià)復(fù)雜度減枝法對(duì)決策樹進(jìn)行減枝,結(jié)果顯示決策樹分為3層,見圖2。與GN-BSI相關(guān)的影響因素依次為PCT、IL-6、CRP、NLR、RPR、RDW。
2.6""訓(xùn)練集3種模型的鑒別價(jià)值比較
訓(xùn)練集中,諾莫圖模型、隨機(jī)森林模型、決策樹模型鑒別GN-BSI和GP-BSI的AUC分別為0.900、0.911、0.884,見圖3。隨機(jī)森林模型的預(yù)測(cè)AUC顯著高于決策樹模型(Z=3.521,P=0.038)。
2.7""驗(yàn)證集3種模型的鑒別價(jià)值比較
驗(yàn)證集包含GN-BSI患者40例,GP-BSI患者28例。諾莫圖模型、隨機(jī)森林模型、決策樹模型鑒別GN-BSI和GP-BSI的AUC分別為0.908、0.916、0.893,見圖4。隨機(jī)森林模型的預(yù)測(cè)AUC顯著高于決策樹模型(Z=3.412,P=0.042)。
3""討論
根據(jù)《拯救膿毒癥運(yùn)動(dòng):膿毒癥與感染性休克治療國(guó)際指南2021版》[5]要求,對(duì)疑似BSI患者,在留取血培養(yǎng)標(biāo)本后,應(yīng)盡早開始抗菌治療,并根據(jù)當(dāng)?shù)夭≡幟羟闆r決定經(jīng)驗(yàn)性治療是否需要覆蓋革蘭陽(yáng)性菌和革蘭陰性菌,待血培養(yǎng)和藥敏結(jié)果報(bào)告后,再進(jìn)行調(diào)整。因此,盡早判斷GP-BSI、GN-BSI對(duì)臨床治療、抗生素選擇、預(yù)后把控有一定價(jià)值。諾莫圖模型、隨機(jī)森林模型、決策樹模型是機(jī)器學(xué)習(xí)算法中重要的分類器,已被廣泛應(yīng)用于鑒別和預(yù)測(cè)模型中。由于3種模型運(yùn)算方法不同,其鑒別效能有所差異。本研究通過(guò)3種運(yùn)算方式構(gòu)建鑒別模型,以期為臨床快速判斷GP-BSI和GN-BSI,進(jìn)而為指導(dǎo)臨床用藥提供依據(jù)。
PCT既是診斷BSI的可靠指標(biāo),同時(shí)也對(duì)鑒別GP-BSI、GN-BSI有一定價(jià)值。Luo等[6]研究顯示GN-BSI患者的PCT高于GP-BSI患者,其鑒別AUC為0.752。本研究發(fā)現(xiàn)PCT在諾莫圖模型、隨機(jī)森林模型、決策樹模型中均為GP-BSI、GN-BSI的鑒別診斷變量。PCT鑒別診斷GP-BSI、GN-BSI的確切機(jī)制暫未明確,有研究認(rèn)為與革蘭陽(yáng)性菌和革蘭陰性菌激活炎癥反應(yīng)的信號(hào)通路不同有關(guān)[7]。CRP是一種由肝臟合成的急性時(shí)相反應(yīng)蛋白,可反映機(jī)體炎癥水平的高低。Sfetsiori等[8]發(fā)現(xiàn)惡性血液病患兒中,GN-BSI患兒的CRP高于GP-BSI,是GN-BSI的獨(dú)立影響因素。本研究發(fā)現(xiàn)CRP在3種分析模型中均為鑒別診斷變量,但在不同模型中的重要性稍有不同,可能與模型的運(yùn)算方式有關(guān)。Yang等[9]研究報(bào)道GN-BSI患者的IL-6明顯高于GP-BSI,其鑒別AUC為0.735,且對(duì)碳青霉烯腸桿菌同樣有一定的鑒別能力。本研究發(fā)現(xiàn)IL-6為3種模型共有鑒別變量,在二元Logistic回歸中OR值為1.009,在決策樹處于第2層,在隨機(jī)森林模型中處于第3重要因子。NLR結(jié)合與細(xì)胞免疫有關(guān)的中性粒細(xì)胞及與體液免疫相關(guān)的淋巴細(xì)胞,可穩(wěn)定反映機(jī)體炎癥狀態(tài)。錢樹坤等[10]研究顯示GN-BSI患者的NLR高于GP-BSI,是鑒別診斷GN-BSI、GP-BSI的潛在指標(biāo)。Li等[11]則比較9種炎癥標(biāo)志物對(duì)GN-BSI、GP-BSI的鑒別價(jià)值,發(fā)現(xiàn)NLR鑒別AUC為0.728,在9種炎癥標(biāo)志物中鑒別能力最高。本研究發(fā)現(xiàn)NLR為3種模型共有鑒別變量,在二元Logistic回歸中OR值為1.130,在決策樹模型中處于第2層,在隨機(jī)森林模型中處于第2重要變量。既往研究發(fā)現(xiàn)RDW不僅反映紅細(xì)胞體積的異質(zhì)性,還可提示感染的類別和嚴(yán)重程度[12]。余高平等[13]發(fā)現(xiàn)GN-BSI患者的PLT低于GP-BSI患者,是GN-BSI潛在鑒別變量。RPR作為新型炎癥標(biāo)志物已被證明與自身免疫性疾病、惡性腫瘤臨床分期及不良預(yù)后有一定關(guān)聯(lián)[14];暫未見其對(duì)區(qū)分GN-BSI、GP-BSI的報(bào)道。本研究發(fā)現(xiàn)GN-BSI患者的RDW、RPR高于GP-BSI,RPR在3種模型中均為共同鑒別變量。
諾莫圖模型具有直觀性和可操作性,被廣泛應(yīng)用于模型分析中,但在模型構(gòu)建過(guò)程中對(duì)數(shù)據(jù)要求較高(如數(shù)量、是否共線性),易因數(shù)據(jù)因素影響模型效能[15]。隨機(jī)森林模型對(duì)數(shù)據(jù)要求低,且可自動(dòng)分析因子間的交互作用和非線性作用,可通過(guò)有目的的放飛對(duì)數(shù)據(jù)的利用,提高模型的鑒別效能[16]。決策樹模型可通過(guò)樹形圖節(jié)點(diǎn)直觀了解變量的分析過(guò)程,且對(duì)數(shù)據(jù)缺失、數(shù)據(jù)類型要求較低,但模型呈現(xiàn)和應(yīng)用過(guò)程較為復(fù)雜,易出現(xiàn)泛化和擬合能力偏弱的現(xiàn)象。本研究分析3種模型在訓(xùn)練集和驗(yàn)證集的表現(xiàn),發(fā)現(xiàn)3種模型對(duì)GN-BSI、GP-BSI均有較高的鑒別效能,其中隨機(jī)森林模型鑒別效能最佳,其次為諾莫圖模型,這一結(jié)果與既往報(bào)道的機(jī)器學(xué)習(xí)模型一致[17]。
綜上所述,本研究通過(guò)諾莫圖模型、隨機(jī)森林模型、決策樹模型構(gòu)建GN-BSI、GP-BSI的鑒別模型。模型的構(gòu)建可規(guī)避單一指標(biāo)鑒別效能低下的局限,有助于及早識(shí)別GN-BSI和GP-BSI,提高臨床經(jīng)驗(yàn)性抗生素治療的科學(xué)性,減少耐藥菌株的產(chǎn)生。
利益沖突:所有作者均聲明不存在利益沖突。
[參考文獻(xiàn)]
(收稿日期:2024–05–31)
(修回日期:2024–10–13)