廣西壯族自治區(qū)疾病預防控制中心(530028)
陳玉柱 方志峰 唐振柱 陸武韜 韋利玲 劉展華 李忠友 周為文 李曉鵬
基于主成分回歸分析的尿酸與相關(guān)影響因素研究*
廣西壯族自治區(qū)疾病預防控制中心(530028)
陳玉柱 方志峰 唐振柱 陸武韜 韋利玲 劉展華 李忠友 周為文 李曉鵬
目的利用主成分回歸分析法探討尿酸水平與體檢和血生化指標的相關(guān)性。方法采用分層整群隨機抽樣方法,被調(diào)查者均接受問卷調(diào)查,測量身高、體重、血壓、腰圍(WC),檢測尿酸(UA)、空腹血糖(FPG),血紅蛋白(Hb)、甘油三脂(TC)、總膽固醇(TG)、高密度脂蛋白膽固醇(HDL-c),低密度脂蛋白膽固醇(LDL-c)。結(jié)果高尿酸組與尿酸正常組比較,各項指標差異有統(tǒng)計學意義(P<0.01);主成分回歸分析年齡、血紅蛋白、空腹血糖、甘油三脂、BM I、腰圍、收縮壓與血尿酸值成正相關(guān),HDL與血尿酸值成負相關(guān)。結(jié)論主成分回歸分析能較好解決尿酸相關(guān)指標的多重共線性,尿酸與糖尿病、肥胖、高血壓、血脂異常密切相關(guān)。
尿酸 主成分回歸分析 相關(guān)性
在醫(yī)學多變量資料分析中,各變量常常不是獨立存在的,而是存在一定程度的線性依存關(guān)系,這一現(xiàn)象稱為多重共線性。多重共線性關(guān)系增大估計參數(shù)的標準誤,從而降低模型的穩(wěn)定性,有時還出現(xiàn)與實際情況相反的結(jié)論。這種分析結(jié)果的不合理性可以通過主成分回歸分析來校正。尿酸是人體黃嘌呤氧化酶或脫氫酶降解核酸和其他嘌呤類化合物以及食物中的嘌呤形成的代謝終產(chǎn)物。其生成增加和排泄減慢會使血尿酸水平顯著升高,發(fā)生高尿酸血癥。近期許多研究表明,血尿酸與年齡、肥胖、高血壓等密切相關(guān),以往研究在進行尿酸與血生化和體檢相關(guān)分析時,多用多元回歸分析,但這些指標相互相關(guān)性較高,可能存在共線性,本文參考相關(guān)文獻[1-6],在 SPSS中利用主成分回歸分析探討尿酸與血生化和體檢指標的相關(guān)關(guān)系,對于正確利用類似資料具有實際意義。
1.調(diào)查對象 根據(jù)中國居民營養(yǎng)與健康調(diào)查2011-2012調(diào)查方案,于2011-2012年在廣西北海市、凌云、興安、賓陽4市、縣采用分層整群抽樣的方法,在每個市/縣抽取6個社區(qū)或自然村,再隨機抽取75戶,選取18歲及以上常住居民3090人作為研究對象。
2.調(diào)查方法與內(nèi)容 (1)詢問調(diào)查:采用入戶調(diào)查的方法,在簽署知情同意書后,對調(diào)查家庭的經(jīng)濟收入、人口進行調(diào)查,對個體調(diào)查對象的基本情況、一般健康狀況、運動、膳食等進行詢問調(diào)查。(2)體格檢查:采用校正的體重、身高測量儀進行身高和體重測量,站立平穩(wěn)呼吸時腰圍,血壓用水銀血壓計連續(xù)測量三次,取平均值作為血壓值。(3)血液指標:采集調(diào)查對象空腹靜脈血,血紅蛋白采用氰化高鐵法,血糖采用葡萄糖氧化酶化用721分光光度計測定,TG,TC,HDL-c,LDL-c,UL采用日立7600-020型全自動生化儀測定,試劑為德賽診斷系統(tǒng)(上海)有限公司試劑。
3.診斷標準 高尿酸血癥診斷標準依據(jù)全國臨床檢驗操作規(guī)范[7],男性大于428μmol/L,女性大于357μmol/L為高尿酸血癥。
4.質(zhì)量控制
(1)人員培訓 以調(diào)查市或縣為單位,對調(diào)查員和檢驗員進行統(tǒng)一嚴格的培訓。
(2)調(diào)查過程的質(zhì)量控制 成立省級質(zhì)量控制工作組,市或縣調(diào)查點安排專人負責質(zhì)量控制工作,按項目質(zhì)量控制工作規(guī)范及方法,負責調(diào)查全過程的質(zhì)量控制。
5.統(tǒng)計分析 數(shù)據(jù)統(tǒng)計分析采用SPSS19.0對數(shù)據(jù)進行整理分析。兩組比較采用t檢驗或非參數(shù)檢驗,多因素分析采用主成分回歸分析。
高尿酸組與尿酸正常組各項指標差異均有統(tǒng)計學意義(P<0.01)。見表1。
表1 兩組體檢及生化指標比較(ˉx±s)
由表2可見,年齡、血紅蛋白、空腹血糖、TG、HDL、BM I、腰圍、收縮壓8個變量對尿酸值的作用均有顯著性(P<0.001或0.05),其中空腹血糖、BM I的偏回歸系數(shù)為負值,與表1實際情況不符,其可能是由于自變量共線性引起的。從表3中可以看出,從5到9維特征值非常小,小于0.05;從第6維開始條件數(shù)大于15,一般認為條件指數(shù)大于15表示可能存在共線性,大于30表示高度共線性。同一維行中自變量方差比較大者表示其共線性較重。
表2 回歸系數(shù)和共線性診斷
表3 共線性診斷指標
依據(jù)累積貢獻率大于等于70%的原則提取4個主成分,并輸出評分變量和原始數(shù)據(jù)的均數(shù)和標準差。結(jié)果見表 4,5。
表4 解釋的總方差
表5 成份矩陣
在計算新變量 C1、C2、C3、C4后,以標化的尿酸作為因變量,以C1、C2、C3、C4做自變量,進行逐步回歸分析,結(jié)果見表6。主成分C1和C4納入方程,得到標化主回歸方程Zy=0.241C1+0.132C4。再依據(jù)表5成份1,4,得標化線性回歸方程:Zy=0.0155Zage+0.1521ZHb+0.0674ZFPG+0.0806ZTG-0.0320ZHDL-c+0.1191ZBMI+0.1342ZWC+0.0891ZSBP。
表6 回歸系數(shù)
計算變量的離均差平方和,一般方程偏回歸系數(shù)及常數(shù),得一般線性回歸方程Y=43.87+0.0990Xage+0.827XHb+5.035XFPG+5.381XTG-6.984XHDL-c+3.387XBMI+0.43XWC+0.436XSBP,結(jié)果表明,年齡、血紅蛋白、空腹血糖、甘油三酯、BM I、腰圍、收縮壓與血尿酸值成正相關(guān),HDL與血尿酸值成負相關(guān),符合實際情況。
醫(yī)學血生化和體檢指標部分往往存在較大的相關(guān)性,比如BM I和腰圍,收縮壓與舒張壓,由于這種共線性的存在,在進行多元回歸分析時,往往會導致與實際不相符的情況出現(xiàn)。本文共線性診斷發(fā)現(xiàn),多個維數(shù)的特征值小于0.05,有2個維數(shù)的條件數(shù)大于30,表明存在高度的共線性,導致多元回歸分析血糖、BM I與尿酸成負相關(guān),與高尿酸組和尿酸正常組比較時反映的實際情況不一致。通過主成分回歸分析解決了這種不合理的情況,使得血糖、BM I因變量得到了合理解釋。
從最后線性回歸方程可以看出,年齡、血紅蛋白、空腹血糖、甘油三酯、BM I、腰圍、收縮壓與血尿酸值成正相關(guān),HDL-c與血尿酸值成負相關(guān)。國內(nèi)外的研究表明,尿酸水平與甘油三酯正相關(guān),與高密度脂蛋白負相關(guān)[8-11],隨訪前瞻隊列研究發(fā)現(xiàn)其為未來高尿酸血癥的獨立預測因素[12],Concalves等[13]研究證實與血尿酸水平聯(lián)系最為緊密的是甘油三酯。腰圍是評價中心性肥胖的指標,已有研究通過logistic回歸分析認為腰圍是男性高尿酸的獨立危險因素[14]。Ryu等[15]研究發(fā)現(xiàn)BM I是高尿酸血癥的危險因素,但與LDL-c無顯著相關(guān)。本研究進一步證實BM I、腰圍與尿酸值相關(guān)。腰圍和BM I是兩個密切相關(guān)的指標,但是也存在腰圍大于正常值而BM I正常的情況,因此需對肥胖的不同類型進一步區(qū)分來明確其與尿酸的關(guān)系,這有待下一步探討。目前血糖與尿酸水平的認識不一致,于健等[8]研究未發(fā)現(xiàn)空腹血糖與尿酸水平有關(guān),日本研究顯示高尿酸血癥與糖尿病顯著相關(guān)[16]。本研究顯示尿酸水平與收縮壓正相關(guān),與已有研究報道的尿酸水平與收縮壓、舒張壓正相關(guān)略有不同[8];也有不同報道,楊松等[17]報道排除服用降壓藥影響并校正混雜因子后,尿酸水平與血壓變化及高血壓之間無關(guān)。尿酸與血紅蛋白成正相關(guān)還未見相關(guān)報道,這可能與高尿酸人群攝入較多肉類[18],而肉類含有豐富的鐵有關(guān)。
總之,通過主成分回歸分析,尿酸水平與年齡、血脂異常、肥胖、糖尿病、血壓密切相關(guān),需針對不同的人群開展相應的措施,高尿酸水平的人群需加強相應體檢和血生化指標的監(jiān)測和控制。
[1]陳峰.主成分回歸分析.中國衛(wèi)生統(tǒng)計,1991,8(1):20-22.
[2]郭呈全,陳希鎮(zhèn).主成分回歸的SPSS實現(xiàn).統(tǒng)計與決策,2011,5.157-159.
[3]劉潤幸,蕭燦培,宮齊,等.利用SPSS進行主成分回歸分析.數(shù)理醫(yī)藥學雜志 2001,14(2):103-105.
[4]羅文海,萬巧云,高永,等.主成分回歸分析與多元線性回歸的對比研究.數(shù)理醫(yī)藥學雜志,2003,16(2):140-143.
[5]孫振球.醫(yī)學統(tǒng)計學第二版.北京.人民衛(wèi)生出版社.2006,415-438.
[6]李玲,饒克勤,王啟俊.腫瘤危險因素的篩選與多重共線性的診斷和處理.中國衛(wèi)生統(tǒng)計,1999,16(3):136-138.
[7]中國醫(yī)師協(xié)會心血管內(nèi)科醫(yī)師分會,中國醫(yī)師協(xié)會循證醫(yī)學專業(yè)委員會.無癥狀高尿酸血癥合并心血管疾病診治建議中國專家共識.中國全科醫(yī)學,2010,13(11):1145-1149.
[8]于健,周玲,劉春雨,等.桂林市部分男性血尿酸水平與代謝綜合征相關(guān)性研究.現(xiàn)代預防醫(yī)學,2012,39(18):4903-4905.
[9]王東升,鄭虹,米樹華,等.代謝綜合鄭患者的尿酸與血脂脂蛋白相關(guān)性研究.中國綜合臨床,2006,22(8):710-711.
[10]苗志敏,趙世華,王顏剛.山東沿海居民高尿酸血癥及痛風的流行病學調(diào)查.中華內(nèi)分泌代謝雜志,2006,22(5):421-425.
[11]Lippi G,Monragnana M,Luca Salvagno G,et al.Epedemiological association between uric acid concentration in plasma,lipoprotein(a),and the traditional lipid profile.Clin Cardiol,2010,33(2):76-80.
[12]Nakanishi N,Tatara K,Nakamura K,et al.Risk factor for the incidence of hyperuricem ia:a 6-year longitudinal study of middle aged Japanesemen.Int JEpedemiol,1999,8(25):888-893.
[13]Gon?alves JP,Oliveira A,Severo M,et al.Cross-sectional and longitudinal associations between serum uric acid and metabolicsyndrome.Endocrine,2012,41(3):450-457.
[14]馬文峰,陳錦華,王萬山,等.廣州市某體檢人群高尿酸血癥患病率及相關(guān)危險因素分析.南方醫(yī)科大學學報,2012,32(12):1812-1815.
[15]Ryu S,Chang Y,Zhang Y,et al.A cohort study of hyperuricemia in middle-aged South Korean men.Am J Epidemiol,2012,175(2):133-143.
[16]Bicel C,Rupprecht HJ,Blankenberg S,et al.Serum uric acid as an independent predictor of mortality in patients with angiographially proven coronary artery disease.Am JCardiol,2002,89(8):12-17.
[17]楊松,趙彥平,趙祥海,等.農(nóng)村人群尿酸與血液變化及高血壓關(guān)系的流行病學分析.中華疾病控制雜志,2012,16(7):564-566.
[18]袁智敏,張麗崧,楊麗芳.廣州地區(qū)人群高尿酸血癥的調(diào)查分析.營養(yǎng)學報,2004,26(3):201-203.
Research on Uric Acid and Related Factors Based on Principal Component Regression Analysis
Chen Yuzhu,F(xiàn)ang Zhifeng,Tang Zhenzhu,et al(Guangxi Autonomous Regional Center for Disease Control and Prevention,(530028)Nanning)
ObjectiveExplore correlation between uric acid level,examination and blood biochemical indexes based on principal component regression analysis.MethodsA random stratified cluster sampling was conducted,and 3090 inhabitants were investigated in Guangxi,,the measure of height,weight,blood pressure,waist circumference(W),the detection of uric acid(UA),fasting plasma glucose(FPG),hemoglobin(Hb),triglycerides(TC),total cholesterol(TG),high density lipoprotein cholesterol(HDL-c),low-density lipoprotein cholesterol(LDL-c).ResultsLevels of all indicators in high uric acid group were statistically significantly different with the normal group,(P<0.01).The age,hemoglobin,fasting blood glucose,TG,BM I waist circumference,systolic blood pressure was positively correlated with uric acid,HDL and uric acid into a negative based on principal component regression analysis.ConclusionPrincipal component regression analysis can better solve the multicollinearity of uric acid-related indicators,uric acid and diabetes,obesity,hypertension,dyslipidemia are closely related.
Uric acid;Principal component regression analysis;Relevance
廣西壯族自治區(qū)疾病預防控制中心青年基金資助項目(201306)
(責任編輯:郭海強)