王曉晨,張彩鳳,宋婷婷,崔楠,崔靜,孫健平
(1 濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院,山東 濰坊 261053; 2 陽光融和醫(yī)院; 3 萊西市中醫(yī)醫(yī)院; 4 青島大學(xué)附屬青島市中心醫(yī)院;5 青島大學(xué)附屬醫(yī)院; 6 青島市疾病預(yù)防控制中心青島市預(yù)防醫(yī)學(xué)研究院)
高尿酸血癥(HUA)是人體嘌呤代謝紊亂引起尿酸產(chǎn)生過多或(和)排泄減少,進(jìn)而導(dǎo)致尿酸水平升高而超出正常范圍的一類疾病,已經(jīng)成為威脅全球居民健康的重要公共衛(wèi)生問題。流行病學(xué)研究結(jié)果顯示,發(fā)達(dá)國家與發(fā)展中國家HUA的患病率均較高[1-2],在我國HUA的患病率亦高達(dá)13.3%[3]。HUA受年齡、性別、行為習(xí)慣及慢性病等多種因素影響[4-6]。既往對(duì)疾病危險(xiǎn)因素的研究多采用Logisitic回歸模型,但Logisitic回歸模型不利于數(shù)據(jù)本身信息的充分反映;而決策樹卻可以通過樹形圖模式按照結(jié)局概率進(jìn)行正確分類或精確預(yù)測(cè)[7]。本研究擬以青島地區(qū)中老年社區(qū)居民為研究對(duì)象,采用決策樹模型探討青島地區(qū)HUA患病的影響因素,為有效實(shí)施HUA健康管理提供參考。
研究對(duì)象來源于2006—2009年青島市糖尿病項(xiàng)目的橫斷面調(diào)查。調(diào)查采用4階段分層隨機(jī)抽樣的方法,分別于2006、2009年抽取了青島市3個(gè)城區(qū)(市南、原市北、原四方)中的30個(gè)社區(qū)(村)和3個(gè)農(nóng)村(膠南、即墨、黃島)的30個(gè)街道(鄉(xiāng)鎮(zhèn)),抽取在當(dāng)?shù)鼐幼?年以上、年齡35~74歲中老年社區(qū)居民12 100名(2006年6 100名,2009年6 000名)為研究對(duì)象,實(shí)際調(diào)查10 465名(2006年5 355名,2009年5 110名)研究對(duì)象,應(yīng)答率分別為87.79%和85.17%,2006年和2009年抽樣無重復(fù)研究對(duì)象。排除尿酸及體質(zhì)指數(shù)(BMI)信息缺失者,最終9 675名(2006年4 615名,2009年5 060名)研究對(duì)象納入本研究。
由經(jīng)統(tǒng)一培訓(xùn)的調(diào)查員對(duì)研究對(duì)象進(jìn)行問卷調(diào)查、體格檢查和實(shí)驗(yàn)室檢測(cè)。問卷調(diào)查內(nèi)容主要包括社會(huì)人口學(xué)信息及行為習(xí)慣等,包括:性別、年齡、文化程度、婚姻狀況、城鄉(xiāng)分布、個(gè)人月收入、職業(yè)體力活動(dòng)、吸煙、飲酒等。體格檢查內(nèi)容主要是身高、體質(zhì)量等,并計(jì)算體質(zhì)量指數(shù)(BMI(kg/m2)=體質(zhì)量(kg)/身高(m)2)。肥胖程度的分組依據(jù)BMI水平[8]:BMI<28 kg/m2為非肥胖,BMI≥28 kg/m2為肥胖。研究對(duì)象均于晚餐后禁食8~12 h,于次日清晨7:00~9:30采集靜脈血,分別進(jìn)行血糖、尿酸水平檢測(cè)。空腹血漿血糖(FPG)和餐后2 h血糖(2hPG)檢測(cè)采用葡萄糖氧化酶法,尿酸檢測(cè)采用尿酸酶法。糖尿病的診斷根據(jù)FPG和2hPG水平[9],F(xiàn)PG≥7.0 mmol/L和(或)2hPG≥11.1 mmol/L。HUA的診斷根據(jù)非同日2次空腹血尿酸水平[10]:男性>420 μmol/L,女性>350 μmol/L。
將HUA患病的相關(guān)因素進(jìn)行卡方自動(dòng)交叉檢驗(yàn)(CHAID)算法分析,分類規(guī)則如下:樹的生長(zhǎng)“枝條”分割顯著性水平αmerge=αsplit=0.05;樹的修剪采用預(yù)修剪法。將決策樹生長(zhǎng)層數(shù)設(shè)為3層,父節(jié)點(diǎn)最小樣本量為100,子節(jié)點(diǎn)最小樣本量為50,總正確率的識(shí)別采用10層交叉驗(yàn)證模型,以α=0.05為模型停止標(biāo)準(zhǔn)。
采用SPSS 22.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。分類資料采用例數(shù)(%)描述,率的比較采用χ2檢驗(yàn)。采用決策樹CHAID算法對(duì)HUA患病的影響因素進(jìn)行分析。相關(guān)變量賦值見表1。
本研究共納入9 675例研究對(duì)象,其中HUA病人為1 430例(14.8%)。HUA病人中男性(χ2=122.05)、年齡≥55歲(χ2=26.11)、受教育時(shí)間>9年(χ2=25.72)、城市居民(χ2=30.94)、個(gè)人的月收入≥600元/月(χ2=47.37)、輕中度職業(yè)體力活動(dòng)(χ2=23.63)、吸煙(χ2=7.92)、飲酒(χ2=85.74)、糖尿病(χ2=19.59)、肥胖(χ2=164.77)等比例均高于NUA者,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。HUA病人未婚或失婚的比例雖高于NUA者,但差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見表2。
表1 相關(guān)變量賦值
決策樹模型生長(zhǎng)3層,從上自下節(jié)點(diǎn)劃分的因素依次是肥胖、性別、城鄉(xiāng)分布、年齡和受教育程度。決策樹模型第一層是肥胖對(duì)HUA患病影響最顯著,肥胖者HUA患病率高于同層的非肥胖者;第二層是性別對(duì)HUA患病影響顯著,肥胖者與非肥胖者男性的HUA患病率均高于女性;第三層是城鄉(xiāng)分布、年齡、文化程度均對(duì)HUA患病影響顯著,城鄉(xiāng)分布、年齡對(duì)非肥胖者影響顯著,而文化程度、年齡對(duì)肥胖者影響顯著,城市非肥胖男性的HUA患病率高于農(nóng)村,文化程度>9年肥胖者的HUA患病率高于同層≤9年的肥胖者,年齡55~74歲非肥胖者與肥胖者HUA患病率均高于年齡35~54歲者(χ2=15.61~164.77,P<0.001)。見圖1。
決策樹模型中婚姻狀況、個(gè)人月收入、職業(yè)體力活動(dòng)情況、吸煙、飲酒、是否患糖尿病被剔除,決策樹模型識(shí)別總正確率為85.2%,風(fēng)險(xiǎn)統(tǒng)計(jì)量為0.148±0.004。
決策樹模型作為一種非參數(shù)回歸模型,具有以下優(yōu)勢(shì):首先,決策樹模型對(duì)納入模型中的變量無特殊要求,分類變量與連續(xù)變量均可納入模型;其次,決策樹模型作為一種機(jī)器學(xué)習(xí)模型,可以有效將變量中缺失值歸為某個(gè)眾數(shù),且結(jié)果不受變量共線性影響;再次,決策樹可以有效、直觀、分層顯示各危險(xiǎn)因素及它們之間的交互關(guān)系[7]。近年來,有研究成功地應(yīng)用決策樹模型預(yù)測(cè)內(nèi)外科疾病相關(guān)影響因素[11],也有部分關(guān)于HUA的決策樹研究,但其中HUA的研究對(duì)象均是體檢人群,而且年齡范圍較大[5-6]。本研究采用決策樹模型CHAID法對(duì)35~74歲中老年社區(qū)居民的HUA患病影響因素進(jìn)行分析,結(jié)果顯示肥胖是HUA患病的最顯著影響因素,性別、城鄉(xiāng)分布、文化程度及年齡均是HUA患病的影響因素。
表2 研究對(duì)象的人口學(xué)特征(例(χ/%))
圖1 CHAID方法研究HUA患病影響因素風(fēng)險(xiǎn)的分類樹型圖
肥胖是影響多種臨床疾病并能帶來不良健康的危險(xiǎn)因素,而HUA便是這些臨床疾病之一。橫斷面研究與隊(duì)列研究結(jié)果均顯示,肥胖與血尿酸呈正相關(guān)[12-13]。還有研究應(yīng)用決策樹和Logistic回歸分析進(jìn)行研究,結(jié)果均顯示,肥胖是HUA的危險(xiǎn)因素[5]。本文研究結(jié)果與其一致。另外遺傳學(xué)研究顯示,肥胖相關(guān)的遺傳基因與我國男性HUA患病風(fēng)險(xiǎn)相關(guān)[14],且肥胖個(gè)體由于高的尿酸生成和低的尿酸清除率導(dǎo)致尿酸水平升高[15]。此外,還有研究顯示,肥胖個(gè)體體質(zhì)量降低常常伴隨著尿酸水平和黃嘌呤氧化還原酶活性的降低,而黃嘌呤氧化還原酶能夠使次黃嘌呤和黃嘌呤分解成尿酸[16]。動(dòng)物實(shí)驗(yàn)亦表明,脂肪細(xì)胞因子調(diào)節(jié)失調(diào)和慢性低度炎癥能夠?qū)е路逝终咧窘M織中尿酸水平升高[17]。
流行學(xué)研究顯示,HUA患病率隨著年齡的增長(zhǎng)而增長(zhǎng)[18];決策樹分析顯示年齡是HUA患病的危險(xiǎn)因素[5]。本文研究結(jié)果與其相一致。然而,隨著年齡的增長(zhǎng),性激素水平呈現(xiàn)明顯的下降趨勢(shì),這可能是年齡對(duì)男性和女性代謝性疾病發(fā)生發(fā)展產(chǎn)生不同影響的原因。中國幅員遼闊,不同區(qū)域HUA患病率差異很大。青島為東部沿海地區(qū),HUA患病率較高,且本研究與以往研究結(jié)果均顯示城市非肥胖男性的HUA患病率明顯高于農(nóng)村非肥胖男性[18]。原因可能為:城市地區(qū)經(jīng)濟(jì)較發(fā)達(dá),因此海鮮、肉類和酒類等的攝入量明顯高于農(nóng)村。此外,本研究還顯示,文化水平較高的肥胖男性HUA患病率較高,這與以往的研究結(jié)果一致[18]??赡茉蚴牵何幕捷^高者生活水平較高,攝入海鮮、肉類、加工食品等高能量食物的機(jī)會(huì)更多,這就增加了攝入各種高嘌呤食物的機(jī)會(huì)。此外,隨著我國居民生活水平的提高,其飲食結(jié)構(gòu)也發(fā)生了變化,但我國居民尤其是中老年男性的營養(yǎng)知識(shí)卻依然匱乏,這也是文化水平與HUA患病率正相關(guān)的原因。
本次研究采用決策樹分析HUA患病的影響因素,決策樹分析能夠通過分割法深入數(shù)據(jù)細(xì)節(jié),挖掘在各影響因素節(jié)點(diǎn)層面下局部信息;其次,本研究采用決策樹模型得出的危險(xiǎn)因素均為非侵入性的易得信息,這非常適合大量人群的篩查。本研究存在以下局限性:首先本研究的數(shù)據(jù)來源于東部沿海地區(qū),無法確認(rèn)是否適合其他地區(qū)人群;其次,本研究的數(shù)據(jù)來源于青島糖尿病調(diào)查項(xiàng)目數(shù)據(jù),體育鍛煉、膳食營養(yǎng)等重要變量在調(diào)查時(shí)未收集,但采用職業(yè)體力活動(dòng)代替了體育鍛煉,而膳食營養(yǎng)卻無合適的變量代替;最后,由于本研究是橫斷面研究,無法判斷肥胖、性別、城鄉(xiāng)分布、文化程度、年齡等與HUA的因果關(guān)系,因此下一步有必要進(jìn)行隊(duì)列研究來確認(rèn)。
綜上所述,本文決策樹分析結(jié)果顯示肥胖、性別、城鄉(xiāng)分布、文化程度及年齡等與HUA患病風(fēng)險(xiǎn)相關(guān)聯(lián)。這為今后HUA等慢性病的篩查與防控提供理論依據(jù)。在HUA防治中,應(yīng)提倡健康的生活方式,并積極控制體質(zhì)量進(jìn)而降低HUA患病風(fēng)險(xiǎn)。