朱碧云 王 妮 黃艷群 喬伯文 李 博 陳 卉
(首都醫(yī)科大學附屬北京地壇醫(yī)院 北京 100015) (首都醫(yī)科大學生物醫(yī)學工程學院 北京 100069) (北京市石景山區(qū)衛(wèi)生信息中心 北京 100043) (首都醫(yī)科大學生物醫(yī)學工程學院 北京 100069)
高血壓是臨床中比較常見的一種心血管病癥[1],其病程長且無法治愈,對人們的健康有著極大的影響。流行病學調(diào)查發(fā)現(xiàn)近些年來高血壓發(fā)病率逐年上升[2],給患者及社會帶來了巨大的經(jīng)濟負擔。有研究表明一些慢性病常常相互伴隨發(fā)生,如高血壓、肥胖、糖尿病、血脂異常等[3-5],而且患者的性別、年齡、婚姻狀況等人口學因素[6-7]以及吸煙、飲酒、鍛煉、飲食等生活習慣[2,8]都對慢性病的發(fā)生有一定影響。因此對高血壓患者的共患病現(xiàn)象和其他潛在關(guān)聯(lián)因素進行分析將對高血壓的預防和治療有借鑒意義。
關(guān)聯(lián)規(guī)則挖掘是一種數(shù)據(jù)挖掘技術(shù)[9],用于探索事物之間的關(guān)聯(lián)性,目前已被用于中醫(yī)中藥、臨床醫(yī)學、流行病學等方面的研究,如發(fā)現(xiàn)腦卒中危險因素[10]、住院跌倒患者的防范[11]、患者就診規(guī)律挖掘[12]、慢性阻塞性肺疾病的協(xié)同疾病[13]、兒童安全用藥[14]、中醫(yī)藥處方配伍規(guī)律[15]等。本研究利用北京市石景山區(qū)社區(qū)公衛(wèi)系統(tǒng)數(shù)據(jù)集,通過關(guān)聯(lián)規(guī)則挖掘,探討高血壓與糖尿病、冠心病之間的關(guān)聯(lián)性及關(guān)聯(lián)強度,分析其他潛在關(guān)聯(lián)因素,研究高血壓患者的共患病現(xiàn)象,提供有效防治建議。
為2018年北京市石景山區(qū)社區(qū)公衛(wèi)系統(tǒng)數(shù)據(jù)集,其中包括人口學數(shù)據(jù)(性別、年齡、婚姻狀況等)、生活習慣(鍛煉、飲酒、吸煙、飲食等)、家族史、慢性病患病情況(糖尿病、冠心病、腦卒中)、生活條件(飲用水、燃料類型、廚房排風設(shè)施等)等106個指標。為了減化計算并盡可能挖掘出有效的關(guān)聯(lián)規(guī)則,本研究從中提取性別、年齡(>60歲定義為老年人)、婚姻狀況、身高、體重、是否患高血壓、是否患糖尿病、是否患冠心病、是否患腦卒中、父親有無高血壓、母親有無高血壓、鍛煉(經(jīng)常鍛煉、鍛煉無規(guī)律、不鍛煉)、飲酒(經(jīng)常飲酒、飲酒無規(guī)律、不飲酒)、吸煙(經(jīng)常吸煙、已戒煙、不吸煙)、睡眠(睡眠困難、入睡困難、早醒、夢游、嗜睡等)、飲食習慣(偏咸、偏甜、偏油、嗜熱食、素食、辛辣等)共16個指標。此外根據(jù)身高和體重計算體重指數(shù)BMI,參考世界衛(wèi)生組織的標準,將BMI>24 kg/m2定義為肥胖。
將原始數(shù)據(jù)導入Access軟件,提取所有高血壓患者的相應(yīng)分析指標作為研究內(nèi)容建立數(shù)據(jù)集并進行數(shù)據(jù)清理。采用Python(https://www.python. org/)數(shù)據(jù)挖掘軟件進行Apriori算法分析,挖掘支持度>10%、置信度>5%的規(guī)則并定義提升度>1的規(guī)則為強關(guān)聯(lián)規(guī)則。采用Gephi(https://gephi.org/)軟件繪制關(guān)聯(lián)規(guī)則的網(wǎng)狀圖,以節(jié)點表示特征,用節(jié)點間連線的粗細直觀地展示特征間關(guān)聯(lián)性的強弱。
從總數(shù)據(jù)集中共確定73 894名高血壓患者,年齡為67.5±12.0歲。所有高血壓患者中,55 649人(75.3%)至少合并冠心病或糖尿病之一。其中32 992人(44.6%)合并冠心病,28 427人(38.5%)合并糖尿病,16 185人(21.9%)則同時合并這兩種慢病。男性高血壓患者合并冠心病和糖尿病的發(fā)生率(42.7%和38.4%)高于女性(38.9%和35.8%,P值均<0.001),老年患者(49.8%和39.8%)高于非老年患者(38.0%和36.7%,P值均<0.001),見表1。
表1 高血壓合并冠心病、糖尿病患者的性別、年齡分布(n[%])
表2列出了有1個或兩個條件(先導)的部分強關(guān)聯(lián)規(guī)則(提升度分別>1和1.25)。從第1條規(guī)則可知高血壓患者同時合并冠心病和糖尿病的概率是21.9%;在所有合并冠心病的患者中有將近一半(49.1%)的人還患有糖尿?。桓哐獕夯颊吆喜⒐谛牟∈蛊浜喜⑻悄虿〉娘L險增加30%。此外年齡、飲食習慣和鍛煉情況都與糖尿病有關(guān)聯(lián)性。
表2 高血壓合并糖尿病的關(guān)聯(lián)規(guī)則挖掘結(jié)果
表3列出了包含有1個或兩個條件(先導)的部分強關(guān)聯(lián)規(guī)則(提升度分別>1或1.25)。結(jié)果顯示高血壓合并糖尿病的患者其冠心病的發(fā)生率達56.9%,而合并糖尿病且有睡眠障礙使冠心病的發(fā)生風險提高到60.4%。此外年齡、家族史、飲食習慣和鍛煉情況都與冠心病有關(guān)聯(lián)性。表2和表3列出的強關(guān)聯(lián)規(guī)則中所有單一先導規(guī)則的關(guān)聯(lián)網(wǎng)絡(luò),見圖1??梢姼哐獕夯颊吆喜⑻悄虿∨c合并冠心病間有很強的關(guān)聯(lián)性,飲食偏咸、鍛煉不規(guī)律與兩種慢病都有關(guān)聯(lián),老年高血壓患者常常伴隨發(fā)生糖尿病與冠心病。
表3 高血壓合并冠心病的關(guān)聯(lián)規(guī)則挖掘結(jié)果
圖1 關(guān)聯(lián)規(guī)則分析網(wǎng)絡(luò)
注:圖中線的粗細與規(guī)則提升度成比例
冠心病是目前世界范圍內(nèi)最首要的疾病死亡原因[20]。高血壓是冠心病發(fā)生的重要危險因素,控制高血壓不僅是預防冠心病的關(guān)鍵,也是減輕心血管疾病所造成的沉重經(jīng)濟負擔和保證患者生命及生活質(zhì)量的關(guān)鍵[21]。臨床和流行病研究顯示中老年人高血壓伴糖尿病與冠心病存在密切聯(lián)系,冠心病的發(fā)生率顯著提高[22-23]。本研究發(fā)現(xiàn)伴糖尿病使高血壓患者合并冠心病的可能性增加12.3%,與其他研究結(jié)果一致。高血壓合并糖尿病的患者冠狀動脈病變程度更重,臨床預后差[24],因此積極治療高血壓和糖尿病將有利于冠心病的防治。本研究人群中睡眠障礙導致高血壓伴糖尿病患者發(fā)生冠心病的可能性增加3.5%。其他研究揭示睡眠與高血壓、糖尿病和冠心病的發(fā)病都具有一定的關(guān)聯(lián)性,睡眠時間過短或過度睡眠均會提升高血壓、糖尿病和冠心病的發(fā)病率[25]。高鹽飲食可進一步導致高血壓合并糖尿病患者發(fā)生不良心血管事件[24],與本研究發(fā)現(xiàn)的飲食偏咸會導致高血壓伴糖尿病患者發(fā)生冠心病的風險增加(從56.9%提高到58.6%)一致。此外年齡一直以來都是重大慢性疾病的危險因素,高血壓伴冠心病的老年患者的糖尿病患病率提高了1.8%,高血壓伴糖尿病老年患者的冠心病患病率提高了3.1%,社區(qū)高血壓管理的重點仍將放在中老年人群上。
本研究利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則挖掘方法,基于社區(qū)居民健康檔案數(shù)據(jù),對近74 000名社區(qū)高血壓患者合并慢病及其影響因素進行分析。研究結(jié)果提示社區(qū)慢病管理中應(yīng)倡導健康生活方式(如高質(zhì)量睡眠、適當鍛煉、低鹽飲食、控制體重),定期監(jiān)測高血壓、糖尿病、冠心病的發(fā)生和變化,避免共患病的出現(xiàn)。通過關(guān)聯(lián)規(guī)則挖掘,全面分析高血壓患者合并其他慢性病的關(guān)聯(lián)因素,使得相關(guān)疾病的預防和干預更具有針對性,同時也能提高慢病管理效率。