俞 霄
紹興市第七人民醫(yī)院檢驗(yàn)科,312000 浙江 紹興
急性ST段抬高型心肌梗死(ST-segment elevation myocardial infarction,STEMI)是嚴(yán)重危害人類(lèi)健康的心血管疾病,目前是冠心病的主要死亡原因[1]。治療急性STEMI首選的再灌注方式為經(jīng)皮冠狀動(dòng)脈介入治療(percutaneous coronary intervention,PCI),療效顯著且相對(duì)安全[2]。但是,仍有20%左右的急性STEMI患者在支架植入后,觀察不到足夠的心肌再灌注,這種現(xiàn)象稱為無(wú)復(fù)流,直接與心肌梗死不良預(yù)后相關(guān)[3-4]。已有研究表明急性STEMI患者PCI術(shù)后無(wú)復(fù)流的風(fēng)險(xiǎn)因素較多,如血小板/淋巴細(xì)胞比率(platelet to lymphocyte ratio,PLR)、平均血小板體積/淋巴細(xì)胞比率(mean platelet volume to lymphocyte ratio,MPVLR)等均與急性STEMI患者PCI術(shù)后無(wú)復(fù)流相關(guān)[5-7]。然而對(duì)風(fēng)險(xiǎn)因素進(jìn)行重要性排序,深度研究急性STEMI患者PCI術(shù)后無(wú)復(fù)流風(fēng)險(xiǎn)因素的研究不多。隨機(jī)森林算法能有效分析非線性、共線性和具有交互作用數(shù)據(jù),作為機(jī)器學(xué)習(xí)的經(jīng)典算法之一,在疾病風(fēng)險(xiǎn)預(yù)測(cè)和診斷方面具有較高的準(zhǔn)確性,目前在分子及基因水平等醫(yī)學(xué)領(lǐng)域得到廣泛應(yīng)用[8-9]。因此,本研究通過(guò)回顧性分析某院收住的行直接PCI術(shù)的急性STEMI患者的臨床資料,應(yīng)用隨機(jī)森林算法和多因素logistic 回歸分析相結(jié)合的方法進(jìn)一步探討急性STEMI患者PCI術(shù)后無(wú)復(fù)流風(fēng)險(xiǎn)因素,為行PCI術(shù)的急性STEMI患者的病情評(píng)估、早期預(yù)防提供進(jìn)一步依據(jù)。
回顧性分析2013年1 月至2019年6月期間某院行直接PCI術(shù)的急性STEMI患者資料。納入標(biāo)準(zhǔn):(1)年滿18周歲;(2)診斷和治療符合《ST段抬高型急性心肌梗死院前溶栓治療中國(guó)專家共識(shí)》[10];(3)初次診斷STEMI,PCI術(shù)在發(fā)病12 h內(nèi)進(jìn)行。排除標(biāo)準(zhǔn):(1)已經(jīng)行靜脈溶栓;(2)合并感染性疾病、血液系統(tǒng)疾病、惡性腫瘤等;(3)1個(gè)月內(nèi)有輸血史;(4)臨床資料不完整者。
收集患者入院時(shí)的一般臨床資料,包括性別、年齡、身體質(zhì)量指數(shù)(body mass index,BMI)、吸煙史、高血壓及糖尿病史、術(shù)前服藥史;行PCI術(shù)前各項(xiàng)相關(guān)血液指標(biāo),包括血常規(guī)、C-反應(yīng)蛋白(C-reactive protein,CRP)、血脂等指標(biāo)以及PCI術(shù)中情況等。
隨機(jī)森林是利用bootstrap 重采樣方法從原始樣本中抽取多個(gè)樣本,并為每個(gè)樣本生成獨(dú)立的決策樹(shù)的一種集成算法。每個(gè)決策樹(shù)中隨機(jī)選取63.2%的數(shù)據(jù)用于建模,而其余36.8%的數(shù)據(jù),即袋外數(shù)據(jù)(out-of-bag,OOB)用于模型驗(yàn)證。隨機(jī)森林在保持其他變量不變的情況下,隨機(jī)置換變量的觀測(cè)值后,通過(guò)比較袋外誤差(OOB error)得到變量的重要性。然后,通過(guò)OOB error的增加量和基于分裂時(shí)基尼系數(shù)(Gini coefficient)的減少量來(lái)評(píng)估每個(gè)變量的重要性。OOB error的增加量是由兩次袋外誤差的差異平均值決定的?;嵯禂?shù)衡量的是森林中所有樹(shù)木上每個(gè)變量的雜質(zhì)。每次使用變量組合在新的訓(xùn)練數(shù)據(jù)上使樹(shù)生長(zhǎng)到最大深度。在每個(gè)節(jié)點(diǎn)上,只搜索選定的特性以獲得最佳分割?;嵯禂?shù)越大,節(jié)點(diǎn)純度越高,表示變量越重要。
收集行直接PCI術(shù)的急性STEMI患者,共有352例符合納入標(biāo)準(zhǔn)。依據(jù)PCI術(shù)中冠狀動(dòng)脈有無(wú)復(fù)流,分為無(wú)復(fù)流組63例,有復(fù)流組289例。兩組患者性別、吸煙比例、糖尿病比例、白細(xì)胞計(jì)數(shù)(white blood cell,WBC)、血紅蛋白(hemoglobin,Hb)、血小板計(jì)數(shù)(platelet,PLT)、總膽固醇(total cholesterol,TC)、高密度脂蛋白(high density lipoprotein,HDL)、低密度脂蛋白(low density lipoprotein,LDL)、術(shù)前或術(shù)中使用藥物、病變血管數(shù)差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05);無(wú)復(fù)流組淋巴細(xì)胞計(jì)數(shù)(lymphocyte,LYM)低于有復(fù)流組(P<0.05);無(wú)復(fù)流組年齡、BMI、高血壓比例、平均血小板體積(mean platelet volume,MPV)、PLR、MPVLR、CRP、甘油三酯(triglyceride,TG)、發(fā)病到球囊擴(kuò)張時(shí)間(pain-to-balloon time,PBT)、病變長(zhǎng)度、置入支架數(shù)高于有復(fù)流組(P<0.05),見(jiàn)表1。
表1 兩組患者的各項(xiàng)資料比較
將單因素分析P<0.2的變量進(jìn)行變量賦值后納入隨機(jī)森林模型,變量賦值見(jiàn)表2。將數(shù)據(jù)按照7∶3的比例隨機(jī)分成訓(xùn)練集和測(cè)試集,隨機(jī)種子數(shù)設(shè)為123,利用Boruta函數(shù)進(jìn)行特征選取,Boruta函數(shù)運(yùn)行100次拒絕或接受選擇變量,綠線表示接受的變量,紅線表示拒絕的變量(圖1A)。結(jié)果顯示,各變量重要性由高到低依次是: MPVLR、病變長(zhǎng)度(lesion)、高血壓(HTN)、PBT、LYM、PLR、MPV、替羅非班(tirofiban)、BMI、吸煙(smoke)、年齡(age)、糖尿病(DM)、置入支架數(shù)(tents)、病變血管數(shù)(vessels)、HDL、TG、CRP、PLT。綠色方框的變量(MPVLR、lesion、HTN、PBT、LYM)表示隨機(jī)森林證實(shí)的重要變量,黃色方框的變量(PLR、MPV)表示可能重要的變量;紅色方框的變量(tirofiban、BMI、smoke、age、DM、tents、vessels、HDL、TG、CRP、PLT)表示不重要的變量(圖1B)。
表2 變量分組及賦值表
圖1 隨機(jī)森林特征變量選取
將數(shù)據(jù)按照7∶3的比例隨機(jī)分成訓(xùn)練集和測(cè)試集,構(gòu)建隨機(jī)森林模型,基于訓(xùn)練集的數(shù)據(jù)將各個(gè)變量代入算法進(jìn)行建模,然后在測(cè)試集中驗(yàn)證,使用C-index進(jìn)行評(píng)估。訓(xùn)練集C-index為0.980,95%CI(0.954, 0.994);測(cè)試集C-index為0.840,95%CI(0.753, 0.906)。模型預(yù)測(cè)效力尚可。隨機(jī)森林模型錯(cuò)誤率評(píng)估,trees選擇300以后, Error基本穩(wěn)定(圖2A);調(diào)試隨機(jī)森林模型以獲得最佳mtry,可見(jiàn)圖中位置最低點(diǎn)為3(圖2B),故選擇300作為trees參數(shù),3作為 mtry參數(shù)時(shí),袋外估算誤差率最低。最后進(jìn)行隨機(jī)森林模型重要性評(píng)分排序,結(jié)合變量特征選取結(jié)果,篩選出前6的變量MPVLR、lesion、HTN、PBT、LYM、PLR進(jìn)行進(jìn)一步分析(圖3)。
圖2 隨機(jī)森林模型錯(cuò)誤率及最佳mtry評(píng)估
圖3 隨機(jī)森林模型變量重要性評(píng)分
將篩選出的6個(gè)變量(MPVLR、lesion、HTN、PBT、LYM、PLR)納入多因素分析,應(yīng)用多因素logistic回歸驗(yàn)證上述參數(shù)。以是否發(fā)生無(wú)復(fù)流為因變量,以上述所選出的因素為自變量,進(jìn)行l(wèi)ogistic回歸分析,結(jié)果表明,MPVLR、高血壓、PBT、LYM、PLR均為影響急性STEMI患者直接PCI術(shù)后無(wú)復(fù)流的獨(dú)立風(fēng)險(xiǎn)因素。MPVLR≥5無(wú)復(fù)流風(fēng)險(xiǎn)是MPVLR <5的3.069倍;有高血壓無(wú)復(fù)流風(fēng)險(xiǎn)是無(wú)高血壓的1.909倍;PBT≥6 h無(wú)復(fù)流風(fēng)險(xiǎn)是PBT<6 h的2.112倍;LYM≤1.1×109/L無(wú)復(fù)流風(fēng)險(xiǎn)是LYM >1.1×109/L的2.218倍;PLR≥150無(wú)復(fù)流風(fēng)險(xiǎn)是PLR <150的2.562倍。見(jiàn)表3。
表3 急性STEMI患者直接PCI術(shù)后無(wú)復(fù)流的多因素logistic回歸分析
目前直接PCI仍是治療急性STEMI患者有效、安全的治療方法,但無(wú)復(fù)流現(xiàn)象的存在是直接PCI治療的不足及阻礙,因此,簡(jiǎn)單、快速、有效地尋找預(yù)測(cè)急性STEMI患者直接PCI術(shù)后無(wú)復(fù)流的影響因素,給予早期干預(yù)評(píng)估是臨床的關(guān)注重點(diǎn)[11-13]。
血小板活化和炎癥反應(yīng)在急性STEMI患者動(dòng)脈粥樣硬化斑塊形成血栓的過(guò)程中起重要作用。PLR表示血小板計(jì)數(shù)與淋巴細(xì)胞計(jì)數(shù)的比值,在急性STEMI患者明顯升高,更為主要的是血小板活性在急性STEMI中起著更為重要的作用,而血小板大小反映了其活性,較大的血小板在代謝和酶活性方面更具活性;MPV則是反應(yīng)血小板大小和活性的重要指標(biāo),而淋巴細(xì)胞的凋亡使得LYM減少,急性STEMI患者發(fā)生血管內(nèi)皮功能障礙,進(jìn)一步導(dǎo)致血小板活化和血栓形成,故MPVLR在急性STEMI患者明顯升高;而PBT的延長(zhǎng)更加導(dǎo)致血栓的加重;長(zhǎng)期的高血壓加重了血管內(nèi)皮的損傷,這些均導(dǎo)致了直接PCI術(shù)后無(wú)復(fù)流風(fēng)險(xiǎn)增大[14-17]。
本研究回顧性利用醫(yī)院數(shù)據(jù)應(yīng)用隨機(jī)森林算法和多因素logistic 回歸分析相結(jié)合的方法進(jìn)一步探討急性STEMI患者PCI術(shù)后無(wú)復(fù)流風(fēng)險(xiǎn)因素,MPVLR≥5無(wú)復(fù)流風(fēng)險(xiǎn)是MPVLR <5的3.069倍;有高血壓無(wú)復(fù)流風(fēng)險(xiǎn)是無(wú)高血壓的1.909倍;PBT≥6 h無(wú)復(fù)流風(fēng)險(xiǎn)是PBT<6 h的2.112倍;LYM≤1.1×109/L無(wú)復(fù)流風(fēng)險(xiǎn)是LYM >1.1×109/L的2.218倍;PLR≥150無(wú)復(fù)流風(fēng)險(xiǎn)是PLR <150的2.562倍。主要因素MPVLR、LYM、PLR為血常規(guī)指標(biāo),獲取方便,可早期獲取,并可及早干預(yù)縮短PBT,積極控制血壓等。本研究對(duì)急性STEMI患者直接PCI術(shù)后發(fā)生無(wú)復(fù)流風(fēng)險(xiǎn)快速有效評(píng)判有一定的價(jià)值,可根據(jù)分析結(jié)果可進(jìn)一步評(píng)估制定預(yù)防治療方案。
綜上所述,通過(guò)隨機(jī)森林分析篩選出急性ST段抬高型心肌梗死患者經(jīng)皮冠狀動(dòng)脈介入治療術(shù)后無(wú)復(fù)流風(fēng)險(xiǎn)因素,進(jìn)一步多因素logistic回歸表明MPVLR、高血壓、PBT、LYM、PLR為影響急性STEMI患者直接PCI術(shù)后無(wú)復(fù)流的獨(dú)立風(fēng)險(xiǎn)因素,為醫(yī)務(wù)人員快速簡(jiǎn)單的進(jìn)行風(fēng)險(xiǎn)分析、及早干預(yù)提供依據(jù)。
中國(guó)醫(yī)院統(tǒng)計(jì)2021年1期