孫 聰,戴國(guó)華,管 慧,高武霖,李 玨,劉 馨,付浩然,趙澤鵬
(1.山東中醫(yī)藥大學(xué)第二附屬醫(yī)院,濟(jì)南 250001;2.山東中醫(yī)藥大學(xué)附屬醫(yī)院,濟(jì)南 250014;3.山東中醫(yī)藥大學(xué),濟(jì)南 250014)
心力衰竭(heart failure,HF)是各種心臟疾病的終末期,再入院率和死亡率高,給家庭和社會(huì)帶來(lái)沉重的經(jīng)濟(jì)負(fù)擔(dān)。隨著現(xiàn)代醫(yī)學(xué)的發(fā)展,循證治療理論和技術(shù)的提高,慢性心力衰竭(chronic heart failure,CHF)患者的預(yù)后得到了顯著改善,但出院30-90天后再入院率仍高達(dá)25-30%,重癥患者的5年死亡率仍在50%以上[1-3],提高CHF患者的生存率已成為世界范圍內(nèi)迫切需要解決的醫(yī)學(xué)難題[4]。
預(yù)后模型是指在獲知預(yù)后因素的基礎(chǔ)上,運(yùn)用流行病學(xué)驗(yàn)證和統(tǒng)計(jì)分析方法,標(biāo)定每個(gè)預(yù)后因素的風(fēng)險(xiǎn)權(quán)重并考慮多因素作用的綜合效果,借助數(shù)學(xué)模型得到不良預(yù)后風(fēng)險(xiǎn)的量化指標(biāo),從而實(shí)現(xiàn)對(duì)未來(lái)預(yù)后風(fēng)險(xiǎn)狀態(tài)推斷的模型。預(yù)后模型研究是近年來(lái)CHF研究的熱點(diǎn),運(yùn)用預(yù)后模型對(duì)患者進(jìn)行早期預(yù)后評(píng)估,把握影響疾病預(yù)后的危險(xiǎn)因素,明確治療靶點(diǎn),有助于制定個(gè)體化治療方案,對(duì)于降低CHF患者的再入院率和死亡率具有重要意義。國(guó)內(nèi)外已經(jīng)建立了多種CHF預(yù)后評(píng)估模型[5,6],但無(wú)法滿足中醫(yī)臨床實(shí)踐的要求。一方面研究證實(shí),中醫(yī)藥干預(yù)能夠提高CHF患者生活質(zhì)量,降低再入院率和死亡率[7],但目前缺乏融合中醫(yī)藥預(yù)后因素的CHF預(yù)后模型。另一方面預(yù)后預(yù)測(cè)是一個(gè)復(fù)雜的多維過(guò)程,以往研究多以線性關(guān)系模型建模如Logistic回歸等,他并未開(kāi)展針對(duì)復(fù)雜相關(guān)算法的應(yīng)用研究。
為彌補(bǔ)CHF模型在中醫(yī)院臨床應(yīng)用的不足,本研究納入中醫(yī)證候元素,運(yùn)用機(jī)器學(xué)習(xí)分類算法中的決策樹(shù)算法,建立包含患者基線資料、實(shí)驗(yàn)室指標(biāo)、中醫(yī)證候分型、中西藥治療情況的CHF患者決策樹(shù)預(yù)后模型并進(jìn)行驗(yàn)證,以期對(duì)CHF患者的預(yù)后進(jìn)行全面評(píng)估,提供更為準(zhǔn)確的預(yù)后判斷,為中醫(yī)院CHF患者的防治及決策提供依據(jù),同時(shí)為此類研究提供示范。
選擇2017年1月至2019年12月山東中醫(yī)藥大學(xué)第一附屬醫(yī)院符合研究標(biāo)準(zhǔn)的住院慢性心力衰竭患者作為隊(duì)列人群,運(yùn)用HIS系統(tǒng)回顧性調(diào)查患者中西醫(yī)預(yù)后因素及住院期間終點(diǎn)事件發(fā)生情況,通過(guò)隨訪獲取患者出院后終點(diǎn)事件發(fā)生情況的原始數(shù)據(jù)。本研究通過(guò)山東中醫(yī)藥大學(xué)附屬醫(yī)院倫理委員會(huì)批準(zhǔn)。
選擇入院時(shí)間在2017年1月1日至2019年12月31日的患者。根據(jù)國(guó)際疾病分類ICD-10代碼,使用醫(yī)院信息系統(tǒng)(Hospital Information System,HIS)提取CHF患者的信息。
1.1.1 診斷標(biāo)準(zhǔn) 西醫(yī)診斷標(biāo)準(zhǔn)符合《中國(guó)心力衰竭診斷和治療指南2018》CHF診斷標(biāo)準(zhǔn)[8]。中醫(yī)辨證標(biāo)準(zhǔn)參照2014年《慢性心力衰竭中醫(yī)診療專家共識(shí)》[9]。
年齡在45至75歲之間;紐約心臟協(xié)會(huì)心功能分級(jí)(NYHA分級(jí))II、III、IV級(jí)。
急性HF患者;接受冠脈搭橋術(shù)或心臟再同步治療的患者;伴有惡性腫瘤、精神病等非心血管事件的患者,以及嚴(yán)重肝腎功能障礙的患者。
預(yù)后因素包含患者基線資料、實(shí)驗(yàn)室指標(biāo)、中醫(yī)辨證分型、中西藥物治療情況4大類共49項(xiàng)。
1.4.1 基線資料20項(xiàng) 年齡、性別、吸煙、飲酒、心率、收縮壓值、舒張壓值、紐約心臟病協(xié)會(huì)分級(jí)(NYHA分級(jí))、合并冠心病、合并高血壓型心臟病、合并糖尿病、合并高脂血癥、合并家族性心臟病、合并心律失常、合并腦血管病、合并呼吸系統(tǒng)疾病、合并消化系統(tǒng)疾病、合并腎臟疾病、合并周?chē)芗膊?、合并甲狀腺疾病?/p>
1.4.2 實(shí)驗(yàn)室指標(biāo)14項(xiàng) 左室射血分?jǐn)?shù)(left ventricular ejection fractions,LVEF)、N端腦鈉肽前體(NT-proBNP)、鉀(K+)、鈉(Na+)、肌酐、谷丙轉(zhuǎn)氨酶、總膽紅素、總膽固醇、甘油三酯、高密度脂蛋白、低密度脂蛋白、血糖、血紅蛋白、D-二聚體數(shù)值。
1.4.3 中醫(yī)辨證分型4項(xiàng) 氣虛血瘀證、氣陰兩虛血瘀證、陽(yáng)氣虧虛血瘀證、痰飲證。
1.4.4 中西醫(yī)藥物應(yīng)用情況11項(xiàng) 強(qiáng)心藥、利尿藥、血管緊張素轉(zhuǎn)化酶抑制劑(angiotensin converting enzyme inhibitors,ACEI)、血管緊張素受體阻滯劑(angiotensinreceptorblockers,ARB)、β受體阻滯劑、抗栓類、鈣拮抗劑、曲美他嗪、他汀類、益氣類中藥注射劑及活血類中藥注射劑的應(yīng)用。
采用復(fù)合終點(diǎn),發(fā)生心源性死亡、心力衰竭惡化、心源性休克、嚴(yán)重心律失常中的一種或多種均定義為發(fā)生復(fù)合終點(diǎn)事件。具體定義如下,心源性死亡:各種心臟原因引起的死亡,例如心衰死亡,心源性猝死和心臟驟停等。心力衰竭惡化:住院期間心衰癥狀和體征不斷加重,需要靜脈藥物或機(jī)械支持治療。心源性休克:心臟功能極度減退,導(dǎo)致心輸出量顯著減少并引起嚴(yán)重的急性周?chē)h(huán)衰竭的綜合征。嚴(yán)重心律失常:發(fā)生可引起嚴(yán)重的血流動(dòng)力學(xué)障礙、短暫意識(shí)喪失或猝死等危機(jī)狀態(tài)的心律失常,包括新發(fā)房顫、二度Ⅱ型以上房室傳導(dǎo)阻滯、多源性室性心動(dòng)過(guò)速、顯著心動(dòng)過(guò)緩等。
制定《中醫(yī)院慢性心力衰竭患者隊(duì)列研究調(diào)查表》,使用HIS獲取患者信息包括住院期間患者基本信息、基線資料、實(shí)驗(yàn)室指標(biāo)、中醫(yī)辨證分型、中西藥物治療情況及終點(diǎn)事件發(fā)生情況,進(jìn)行數(shù)據(jù)清理、整理后導(dǎo)入Epidate 3.1數(shù)據(jù)管理軟件,建立并調(diào)試數(shù)據(jù)庫(kù)。
采用電話隨訪結(jié)合門(mén)診隨訪,隨訪至滿2年或發(fā)生復(fù)合終點(diǎn)事件。失訪是指由于各種原因(如更改手機(jī)號(hào)碼,手機(jī)關(guān)機(jī),3次及以上未接聽(tīng))與患者失去聯(lián)系的情況以及患者拒絕合作。對(duì)已經(jīng)納入觀察的患者應(yīng)努力提高其應(yīng)答率及依從性,使失訪率<20%。
納入符合要求的CHF患者427人,其中44人失訪,失訪率10.3%,最終383人納入分析。經(jīng)過(guò)2年隨訪,住院及隨訪期間共17例(4.4%)患者發(fā)生心源性死亡,15例(3.9%)患者發(fā)生心力衰竭惡化,6例(1.6%)患者發(fā)生心源性休克,18例(4.7%)患者發(fā)生嚴(yán)重心律失常,即發(fā)生復(fù)合終點(diǎn)事件共56例(14.6%),未發(fā)生復(fù)合終點(diǎn)事件327例(85.4%)。差異性分析顯示,復(fù)合終點(diǎn)事件組與非復(fù)合終點(diǎn)事件組間,年齡、收縮壓、舒張壓、心率、NYHA分級(jí)、高血壓型心臟病、冠心病、糖尿病、飲酒、家族性心臟病、心律失常、腦血管疾病、呼吸系統(tǒng)疾病、NT-pro BNP、K+、Na+、膽紅素、D-二聚體、氣虛血瘀證、氣陰兩虛血瘀證、陽(yáng)氣虧虛血瘀證、ARB類藥物、β受體阻滯劑、鈣拮抗劑、益氣類中藥注射劑、活血類中藥注射劑間存在差異(見(jiàn)表1)。
表1 復(fù)合終點(diǎn)事件組與非復(fù)合終點(diǎn)事件組差異性分析
運(yùn)用Logistic單因素分析篩選與終點(diǎn)事件發(fā)生相關(guān)的中西醫(yī)預(yù)后因素,統(tǒng)計(jì)變量的OR值及95%可信區(qū)間,檢驗(yàn)α=0.05。結(jié)果顯示,年齡、心率、NYHA分級(jí)、冠心病、高血壓型心臟病、糖尿病、飲酒、家族性心臟病、心律失常、呼吸系統(tǒng)疾病、陽(yáng)氣虧虛血瘀證、NT-proBNP、谷丙轉(zhuǎn)氨酶、D-二聚體為復(fù)合終點(diǎn)事件的危險(xiǎn)因素。收縮壓、舒張壓、氣虛血瘀證、氣陰兩虛血瘀證、LVEF、總膽固醇、高密度脂蛋白、低密度脂蛋白、血紅蛋白、ARB、β受體阻滯劑、益氣類中藥注射劑、活血類中藥注射劑為復(fù)合終點(diǎn)事件的保護(hù)因素。其中總膽固醇與低密度脂蛋白為終點(diǎn)事件的保護(hù)因素,與臨床實(shí)際不符,故去除這2個(gè)變量共確定25項(xiàng)建模變量(見(jiàn)表2)。
表2 預(yù)后因素與復(fù)合終點(diǎn)事件的單因素Logistic回歸分析
預(yù)后因素變量間共線性診斷運(yùn)用容忍度和方差膨脹因子,設(shè)定容忍度<0.1,方差膨脹因子>5時(shí),認(rèn)為變量間存在共線性。納入的變量容忍度均>0.1,方差膨脹因子均<5,故認(rèn)為變量間不存在共線性(見(jiàn)表3)。
表3 預(yù)后因素的共線性診斷
使用R軟件將數(shù)據(jù)集按照9:4比例隨機(jī)分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集共263例,測(cè)試集共120例?;?63例訓(xùn)練集數(shù)據(jù),運(yùn)用決策樹(shù)算法,使用R軟件的rpart包構(gòu)建決策樹(shù)模型(見(jiàn)圖1示)。從樹(shù)的頂端開(kāi)始,依次按照條件成立與否往下進(jìn)行,直至到達(dá)終端節(jié)點(diǎn)則分類結(jié)束。第一層為高血壓型心臟病病史,說(shuō)明高血壓型心臟病病史是CHF患者發(fā)生復(fù)合終點(diǎn)事件的重要影響因素。在患有高血壓型心臟病的患者中NT-proBNP值為重要的影響因素,在無(wú)高血壓型心臟病的患者中影響預(yù)后的因素包括收縮壓、NT-proBNP和是否為陽(yáng)氣虧虛血瘀證。
圖1 慢性心力衰竭患者決策樹(shù)預(yù)后模型
圖中發(fā)生為發(fā)生終點(diǎn)事件,不發(fā)生為未發(fā)生終點(diǎn)事件,百分比為相應(yīng)條件下發(fā)生或不發(fā)生復(fù)合終點(diǎn)事件數(shù)占訓(xùn)練集總數(shù)的百分比。6個(gè)終止節(jié)點(diǎn)對(duì)應(yīng)的決策規(guī)則依次為:患有高血壓型心臟病,NT-proBNP≥2 694 pg/mL,預(yù)測(cè)發(fā)生終點(diǎn)事件;患有高血壓型心臟病,NT-pro BNP<2 694 pg/mL,預(yù)測(cè)不發(fā)生終點(diǎn)事件;無(wú)高血壓型心臟病,收縮壓<90 mmHg,預(yù)測(cè)發(fā)生終點(diǎn)事件;無(wú)高血壓型心臟病,收縮壓≥90 mmHg,NT-pro BNP<7 811 pg/mL,預(yù)測(cè)不發(fā)生終點(diǎn)事件;無(wú)高血壓型心臟病,收縮壓≥90 mmHg,NT-pro BNP≥7 811 pg/mL,中醫(yī)辨證為陽(yáng)氣虧虛血瘀證,預(yù)測(cè)發(fā)生終點(diǎn)事件;無(wú)高血壓型心臟病,收縮壓≥90 mmHg,NT-proBNP≥7 811 pg/mL,中醫(yī)辨證為非陽(yáng)氣虧虛血瘀證,預(yù)測(cè)不發(fā)生終點(diǎn)事件。
高血壓型心臟病是由于血壓長(zhǎng)期控制不佳導(dǎo)致左室舒張功能減退、左室肥厚,逐步發(fā)展出現(xiàn)心肌收縮功能減退,最終發(fā)生HF。腺嘌呤核苷三磷酸(adenosine triphosphate,ATP)供需矛盾造成心肌細(xì)胞能量耗竭,不僅影響細(xì)胞功能,還會(huì)發(fā)生細(xì)胞壞死或凋亡,高血壓型心臟病是CHF的危險(xiǎn)因素[10]。NT-proBNP是心力衰竭CHF死亡的獨(dú)立預(yù)測(cè)因子[11],也是CHF預(yù)后模型中出現(xiàn)頻率較高的預(yù)測(cè)因素。一項(xiàng)系統(tǒng)評(píng)價(jià)的分析結(jié)果表明,腦鈉肽每增加100 pg/ml,CHF患者相對(duì)死亡風(fēng)險(xiǎn)增加35%[12]。血壓控制水平與CHF患者預(yù)后存在復(fù)雜的相關(guān)性,根據(jù)“血壓悖論”現(xiàn)象,不同于更高的血壓水平在多數(shù)心血管疾病中與不良預(yù)后呈正相關(guān)。由于CHF患者心臟結(jié)構(gòu)和功能的異常,保持適當(dāng)?shù)妮^高水平的收縮壓反而是一種預(yù)后保護(hù)因素[13,14]。研究發(fā)現(xiàn),不同證素類型的CHF患者預(yù)后存在顯著差異,陽(yáng)虛證預(yù)后最差[15],氣陰兩虛證患者的5年生存率明顯高于陽(yáng)虛證患者[16]。
基于120例測(cè)試集數(shù)據(jù),使用建立的決策樹(shù)模型對(duì)患者結(jié)局進(jìn)行預(yù)測(cè),根據(jù)預(yù)測(cè)結(jié)果與實(shí)際結(jié)果建立混淆矩陣(見(jiàn)表4)。根據(jù)混淆矩陣,分類準(zhǔn)確率(12+90)/120=85.0%,靈敏度為12/(12+4)=75.0%,特異度為90/(90+14)=86.5%。
表4 決策樹(shù)模型預(yù)測(cè)結(jié)果與實(shí)際結(jié)果混淆矩陣
CHF是一種由心臟結(jié)構(gòu)及功能異常導(dǎo)致心室充盈和射血能力受損的復(fù)雜臨床綜合征,是各種心臟疾病的嚴(yán)重和終末階段。研究表明,CHF發(fā)病率高,預(yù)后水平差,已經(jīng)成為心血管病領(lǐng)域的重要公共衛(wèi)生問(wèn)題。重大疾病的防控重在“戰(zhàn)略前移”,要關(guān)注疾病發(fā)展的全過(guò)程,重視疾病的預(yù)測(cè)、預(yù)警和預(yù)防,這與中醫(yī)“治未病”的主動(dòng)健康理念相切合,為慢性疾病的防治提供了方向。因此,慢性心衰患者的早期預(yù)后評(píng)估成為疾病管理的重要環(huán)節(jié),明確預(yù)后危險(xiǎn)因素,構(gòu)建慢性心衰患者的預(yù)后評(píng)估模型,對(duì)于疾病管理具有重大現(xiàn)實(shí)意義。
預(yù)后評(píng)估的實(shí)質(zhì)是根據(jù)預(yù)后因素與疾病結(jié)局間關(guān)系推斷患者的預(yù)后情況,明確預(yù)后因素是構(gòu)建預(yù)后風(fēng)險(xiǎn)預(yù)測(cè)模型的前提。預(yù)后因素是指能夠影響疾病結(jié)局進(jìn)展或發(fā)生概率的要素,是疾病三級(jí)預(yù)防的重要切入點(diǎn)。當(dāng)前心力衰竭患者的預(yù)后因素研究主要以疾病特征、疾病標(biāo)志物、患者特征及診療情況等為主[17,18],缺乏中醫(yī)元素,無(wú)法滿足中醫(yī)臨床實(shí)踐的要求。幾千年來(lái),中醫(yī)通過(guò)癥狀、體征及證候等綜合判斷病勢(shì)及轉(zhuǎn)歸,具有豐富的預(yù)后評(píng)估經(jīng)驗(yàn),且中醫(yī)癥狀、舌脈等元素較西醫(yī)指標(biāo)具有獲取便捷、經(jīng)濟(jì)的優(yōu)勢(shì)。辨證論治是中醫(yī)學(xué)理論的核心,證型是中醫(yī)認(rèn)識(shí)、診斷疾病,并據(jù)此立法施治和觀察療效的核心要素,故可將中醫(yī)證候類型融入心力衰竭患者的預(yù)后因素研究,從中醫(yī)角度為心衰患者的預(yù)后研究增添新的元素。
終點(diǎn)指標(biāo)常為“是/否”、“發(fā)生/不發(fā)生”的二分類型數(shù)據(jù),結(jié)果多為定性而非定量形式,疾病結(jié)局預(yù)測(cè)本質(zhì)上為分類預(yù)測(cè)問(wèn)題,故可將分類算法應(yīng)用于預(yù)后建模研究。慢性心衰的影響要素較多,疾病發(fā)展的整個(gè)過(guò)程具有復(fù)雜性、模糊性和未知性,數(shù)據(jù)具有海量、高階、多維性,對(duì)統(tǒng)計(jì)方法具有較高的要求。傳統(tǒng)分類算法對(duì)數(shù)據(jù)分布有嚴(yán)格限定,在處理復(fù)雜數(shù)據(jù)時(shí)存在諸多局限,從而影響了模型的準(zhǔn)確性,如Logistic回歸對(duì)變量的共線性問(wèn)題極為敏感,而臨床研究中多種因素相互影響,多存在共線性,運(yùn)用Logistic回歸模型難以擬合和解釋。決策樹(shù)算法為機(jī)器學(xué)習(xí)分類算法的一種,其對(duì)變量類型無(wú)限制條件,更加適用于多影響因素的預(yù)后模型構(gòu)建研究。首先在處理大量數(shù)據(jù)時(shí),可根據(jù)屬性的重要程度自動(dòng)忽略冗余屬性。其次當(dāng)數(shù)據(jù)存在缺失時(shí),無(wú)需進(jìn)行缺失值替換,能夠處理孤立點(diǎn)。再次CART樹(shù)為二叉樹(shù)形式,建模過(guò)程清晰,具有高度可視化,相對(duì)于多叉樹(shù)能夠避免不必要的碎片信息[19,20]。曾雪元[21]等應(yīng)用決策樹(shù)構(gòu)建了包含中醫(yī)元素的缺血性卒中復(fù)發(fā)預(yù)測(cè)模型。因此,可將決策樹(shù)算法應(yīng)用到CHF患者的預(yù)后模型研究中,為模型構(gòu)建研究中的算法選擇提供新的思路。
本研究基于現(xiàn)有CHF預(yù)后評(píng)估模型中的不足,結(jié)合中醫(yī)證型在預(yù)后評(píng)估中的作用以及數(shù)據(jù)挖掘分類算法在模型構(gòu)建中的優(yōu)勢(shì),基于中西醫(yī)預(yù)后因素,運(yùn)用決策樹(shù)算法構(gòu)建中西醫(yī)預(yù)后模型,在一定程度上彌補(bǔ)了CHF患者中西醫(yī)預(yù)后模型研究的空白,對(duì)于中西醫(yī)預(yù)后模型的構(gòu)建具有方法學(xué)指導(dǎo)意義,但是仍存在一定的局限性。首先,樣本量偏少,可能會(huì)影響模型構(gòu)建過(guò)程中預(yù)測(cè)因子選擇的精確度。其次,不同結(jié)局指標(biāo)對(duì)應(yīng)的預(yù)測(cè)因子可能不同,本研究由于樣本量限制,采用復(fù)合終點(diǎn)指標(biāo),使得模型具有泛化性,可用于初步預(yù)測(cè)、評(píng)估判斷,但是會(huì)降低預(yù)測(cè)準(zhǔn)確性。因此,在今后研究中需要開(kāi)展大樣本多中心研究,基于某一種臨床結(jié)局篩選特定的預(yù)后因素建模,同時(shí)運(yùn)用外部數(shù)據(jù)進(jìn)行模型驗(yàn)證,進(jìn)一步改進(jìn)和完善模型,以供臨床參考。