崔偉鋒 劉蕭蕭 韓靜旖 范軍銘
(1河南省中醫(yī)藥研究院,河南 鄭州 450000;2鄲城縣人民醫(yī)院心內(nèi)科;3河南中醫(yī)藥大學(xué))
高血壓并發(fā)癥死亡人數(shù)為940萬,占全部疾病負(fù)擔(dān)的7% (按傷殘調(diào)整生命年測算),已成為影響全球疾病負(fù)擔(dān)的首要危險因素〔1,2〕。目前關(guān)于原發(fā)性高血壓預(yù)后危險因素的研究有很多,但缺少中醫(yī)證候相關(guān)信息。預(yù)測模型研究多以線性關(guān)系預(yù)測模型,尚未建立基于復(fù)雜關(guān)系的預(yù)后模型方法。本研究納入血管功能評價及中醫(yī)元素探索建立基于人工神經(jīng)網(wǎng)絡(luò)的原發(fā)性高血壓心血管風(fēng)險預(yù)后模型。該研究結(jié)果能夠?qū)Ω哐獕侯A(yù)后進(jìn)行全面評估,提供更為準(zhǔn)確的預(yù)后預(yù)判,有助于臨床工作者向患者及家屬提供更為精準(zhǔn)的預(yù)后信息、為臨床原發(fā)性高血壓心血管的防治及決策提供依據(jù)。
1.1研究對象 以原發(fā)性高血壓患者為研究對象,于2001~2016年在全國高血壓中醫(yī)診療中心建立的高血壓隊(duì)列人群。納入標(biāo)準(zhǔn):①符合原發(fā)性高血壓診斷標(biāo)準(zhǔn);②年齡≥18歲;③病程≥5年;④可以接受隨訪。采用調(diào)查表完成基線的采集和隨訪,基線采集包括年齡、性別、病程、有無早發(fā)心血管病家族史、身高、體重、腰圍、臀圍、吸煙史、飲酒史、情緒、睡眠、飲食習(xí)慣、運(yùn)動量、總膽固醇(TC)、三酰甘油(TG)、高密度脂蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C);血糖:空腹血糖、餐后2 h血糖、糖化血紅蛋白、空腹血胰島素;電解質(zhì):鉀(K)、鈉(Na);腎功能:尿素氮、肌酐、尿酸及血同型半胱氨酸(Hcy)、頸股脈搏波傳導(dǎo)速度(cfPWV)、頸橈脈搏波傳導(dǎo)速度(crPWV)、踝肱脈搏波傳導(dǎo)速度(baPWV)、踝臂壓指數(shù)(ABI)等;血管內(nèi)皮功能檢測:血流介導(dǎo)的血管舒張功能(FMD);心功能檢查:左室后壁厚度、室間隔厚度,左室射血分?jǐn)?shù)(LVEF)、左室舒張末期內(nèi)徑及中心動脈壓頭暈、頭痛、心悸、心慌、易怒、耳鳴、口干苦、面紅、失眠、水腫及辯證結(jié)果。隨訪時間為2015年1月至2016年12月。隨訪主要心血管事件發(fā)生情況及時間。主要心血管事件包括:腦血管死亡、腦梗死、腦出血、心肌梗死。
1.2統(tǒng)計(jì)方法 采用SPSS21.0軟件進(jìn)行分析,分別采用R語言進(jìn)行統(tǒng)計(jì)分析。計(jì)量資料符合正態(tài)分布的使用均數(shù)±標(biāo)準(zhǔn)差表示,進(jìn)行獨(dú)立樣本t檢驗(yàn);不符合正態(tài)分布則用中位數(shù)(四分位間數(shù))表示,采用秩和檢驗(yàn)進(jìn)行分析。計(jì)數(shù)資料的構(gòu)成比使用頻數(shù)(百分?jǐn)?shù))表示,使用χ2檢驗(yàn)或Fisher確切概率法進(jìn)行分析。使用COX回歸分析對可能與預(yù)后相關(guān)的因素進(jìn)行篩選。以P<0.05為差異具有統(tǒng)計(jì)學(xué)意義,對篩選后的變量進(jìn)行共線性診斷,將存在嚴(yán)重共線性的變量進(jìn)行刪減或替換。用R語言將數(shù)據(jù)按照7∶3的比例隨機(jī)分成訓(xùn)練集和測試集,使用R語言“randomForest”包構(gòu)建預(yù)后預(yù)測模型,基于訓(xùn)練集的數(shù)據(jù)將各個變量代入算法進(jìn)行建模,然后在測試集中驗(yàn)證。模型預(yù)測的效力使用混合矩陣評估其準(zhǔn)確性。
2.1病例分布情況 本研究共納入了1 000例原發(fā)性高血壓患者,剔除無法完成隨訪的病例后,共有985例進(jìn)入分析。985例患者隨訪時的平均年齡為(55.82±5.80)歲,平均病程(10.60±4.20)年,有早發(fā)心血管病家族史者431例(43.8%),基線血壓水平在正常范圍內(nèi)的為280例(28.4%),基線血壓水平達(dá)高血壓1級的有581例(59.9%),2級者95例(9.6%),3級者29例(2.9%)。985例高血壓患者中男833例(84.6%),有吸煙史者295例(30.0%),有飲酒史者384例(39.0%);在運(yùn)動量方面,經(jīng)常運(yùn)動者占比最多,有427例(43.4%),睡眠方面,睡眠較好者占比最多,有536例(54.4%);情緒方面,很少有不良情緒者占比較多,有430例(43.7%);飲食習(xí)慣方面,飲食一般者占比較多,有456例(46.3%)。985例患者經(jīng)查閱整理病例資料及隨訪資料,至隨訪結(jié)束時,有212例(6.6%)患者出現(xiàn)腦梗死,有8例(0.3%)腦血管病死亡;26例(1.5%)出現(xiàn)腦出血,38例(1.7%)心肌梗死,合計(jì)284例患者發(fā)生終點(diǎn)事件。
2.2確定建模變量 以是否發(fā)生心血管風(fēng)險為因變量,影響心血管風(fēng)險的因素為自變量構(gòu)建風(fēng)險比例模型,經(jīng)COX單因素、多因素篩選(多因素分析前共線性診斷后對同類變量進(jìn)行刪除或合并),從48個變量中篩共選出共有13個變量,病程、性別、早發(fā)心血管病家族史、體重指數(shù)(BMI)、飲食習(xí)慣、Hcy、平均ABI、平均動脈壓、FMD、氣虛血瘀證、陰虛陽亢證、肝腎陰虛證、陰陽兩虛證與心血管風(fēng)險相關(guān)。參考相關(guān)文獻(xiàn)數(shù)據(jù)并考慮模型的預(yù)測全面性及預(yù)測能力。糖耐量異常、脂代謝異常、cfPWV均與心、腦血管疾病的發(fā)生密切相關(guān),影響原發(fā)性高血壓患者的預(yù)后,本研究高血壓首發(fā)癥狀頭暈(14.0%)、頭痛(6.9%)發(fā)生頻率較高。最終確定進(jìn)入預(yù)后模型的變量。對以上18個變量進(jìn)行共線性診斷,發(fā)現(xiàn)這18個變量的容忍度均>0.1,方差膨脹因子均<10,各變量之間不存在共線性。見表1。
表1 建模變量的共線性診斷
2.3隨機(jī)森林建模變量重要程度分析 其中BMI、Hcy、平均ABI、平均動脈壓等變量對模型的正確率貢獻(xiàn)較大,見圖1。
圖1 隨機(jī)森林模型中變量的重要度
2.4預(yù)測模型 在模型訓(xùn)練方面,混淆矩陣提示隨機(jī)森林模型訓(xùn)練集中的總體錯誤率為28.7%,說明模型的對訓(xùn)練集分類的效果尚可,測試集總體錯誤率為28.5%,訓(xùn)練集與測試集結(jié)果接近。見表2。
表2 高血壓心血管風(fēng)險預(yù)測模型混淆矩陣(n)
高血壓在我國甚至全世界的發(fā)病率逐年上升,其并發(fā)癥具有較高的致殘、致死率,已成為我國沉重的家庭及社會負(fù)擔(dān),影響全球疾病負(fù)擔(dān)的首要危險因素〔1〕。尤其是如今我國人口老齡化進(jìn)程加速,高血壓患者數(shù)量快速增長,因此預(yù)計(jì)心腦血管疾病的發(fā)病率也將隨之上升,造成日益嚴(yán)重的社會負(fù)擔(dān)與社會危害〔3〕。
目前關(guān)于高血壓發(fā)病及其預(yù)后相關(guān)危險因素的研究較多,但多以現(xiàn)況研究為主、樣本例數(shù)少,因果論證強(qiáng)度不足;尚無基于中醫(yī)元素的預(yù)后預(yù)測模型研究;基于隊(duì)列研究設(shè)計(jì),直接探索中醫(yī)證型與高血壓預(yù)后關(guān)系的研究較少。目前臨床研究中大多以血壓及癥狀等指標(biāo)為效應(yīng)指標(biāo),對于評判預(yù)后更有意義的心腦血管終點(diǎn)事件等結(jié)局指標(biāo)缺乏研究〔4〕。本研究基于回顧性隊(duì)列研究,隨訪基線危險因素及心血管風(fēng)險發(fā)生情況,能夠推斷其因果關(guān)系,有利準(zhǔn)確原發(fā)性高血壓心血管風(fēng)險發(fā)生情況。本研究在分析心血管風(fēng)險的危險因素及建立預(yù)后預(yù)測模型時加入了動脈功能指標(biāo)和中醫(yī)證候,探索兩者在高血壓預(yù)后判斷中的作用,證實(shí)了血管功能指標(biāo)、中醫(yī)證候?qū)ε袛嘣l(fā)性高血壓病預(yù)后具有一定的作用,豐富了高血壓預(yù)后判斷的依據(jù)。
隨機(jī)森林是基于決策樹算法的分類器,能夠利用多棵樹對樣本進(jìn)行訓(xùn)練并預(yù)測,最后通過綜合多棵決策樹的表決結(jié)果來進(jìn)行類別判斷〔5〕。其優(yōu)勢在于能夠自動探索對類別具有較大幫助的變量,進(jìn)而構(gòu)建出類別差異明顯的分類器,對線性和非線性數(shù)據(jù)均能進(jìn)行分類〔6〕,適用性較廣。其局限性在于難以實(shí)現(xiàn)整個森林的可視化,且在處理某些噪聲較大的數(shù)據(jù)集時容易出現(xiàn)過度擬合的情況,因此在使用該算法過程中要注重對變量的篩選。本研究變量篩選根據(jù)原發(fā)性高血壓的隊(duì)列人群隨訪數(shù)據(jù),采用Cox單因素、多因素分析、共線性診斷,參考相關(guān)文獻(xiàn)數(shù)據(jù)并考慮模型的預(yù)測全面性及預(yù)測能力,參考最終確定18個變量納入預(yù)測模型變量,避免在構(gòu)建模型時出現(xiàn)過度擬合的情況。
本研究雖只是探索階段,仍有許多不足,但在一定程度上彌補(bǔ)了目前原發(fā)性高血壓病預(yù)后研究的不足之處,為其預(yù)后模型的構(gòu)建提供了一種新思路,具有臨床參考價值。通過加入動脈功能指標(biāo)和中醫(yī)證候,并構(gòu)建更好的預(yù)后預(yù)測模型,能夠幫助臨床醫(yī)師更好地判斷高血壓患者預(yù)后,為患者提供更科學(xué)、更細(xì)致的個體化治療方案,以期改善原發(fā)性高血壓的預(yù)后。