黃倩 沈艷明 施佳成 黃漓莉 鄒迪莎 江仁美 于萍 劉曉玲 王彩梅 周燕 于健
(廣西壯族自治區(qū)桂林醫(yī)學(xué)院附屬醫(yī)院 1內(nèi)分泌科,廣西 桂林 541001;2檢驗科,3呼吸疾病實驗室)
隨著人口增長、老齡化、城市化及肥胖和缺乏鍛煉,糖尿病(DM)的患病率逐年增加,預(yù)計全球日益增加的DM患者總數(shù)將從2000年的1.71億增加至2030年的3.66億人口,這將不可避免地增加心血管疾病死亡人數(shù)及其他DM并發(fā)癥的患病率和相關(guān)嚴重后果的增加〔1〕。作為醫(yī)務(wù)人員,對于DM流行病學(xué)特征研究的必要性毋庸置疑。目前針對DM危險因素的調(diào)查研究,大多數(shù)統(tǒng)計方法采用Logistic回歸或多因素線性回歸模型,但由于其對于變量共線性的處理存在不足,所以降低了分析效能;而分類樹統(tǒng)計方法不受變量間共線性的影響,以樹形圖這種直接的表現(xiàn)形式展示多水平變量間的相互作用關(guān)系,并且可分析出各變量的具體影響人群;自然而然分類樹模型作為一種新興分析方法在醫(yī)學(xué)領(lǐng)域中如疾病的預(yù)測和診斷方面越來越受到歡迎〔2〕。因此,本研究以廣西壯族自治區(qū)桂林市桂林醫(yī)學(xué)院附屬醫(yī)院部分體檢人群為研究對象,利用分類樹模型篩查2型糖尿病(T2DM)的相關(guān)影響因素。
1.1研究對象 采用整群隨機抽樣方法,抽取2017年7~10月在桂林醫(yī)學(xué)院附屬醫(yī)院體檢部體檢的體檢者,最終10 361例(男6 038例,女4 323例)資料完整的體檢人群納入統(tǒng)計分析。所有研究對象簽署知情同意書。排除標準:1型DM、急性感染、創(chuàng)傷或其他應(yīng)激情況下出現(xiàn)的暫時性血糖升高、長期口服如糖皮質(zhì)激素等影響血糖的藥物及嚴重肝腎功能受損患者。
1.2資料收集 由經(jīng)過專門培訓(xùn)的專業(yè)人員對研究對象進行詳細詢問,使用本研究設(shè)計的調(diào)查問卷表格。調(diào)查內(nèi)容包括基本信息(性別、年齡、民族、婚姻狀況、膳食、職業(yè)、吸煙及飲酒、疾病史如高血壓、DM等),體格測量包括身高、體重、收縮壓(SBP)和舒張壓(DBP)等,并計算體重指數(shù)(BMI),24.0 kg/m2≤BMI<28.0 kg/m2診斷為超重,BMI≥28.0 kg/m2為肥胖〔3〕。實驗室檢測:體檢者隔夜至少禁食8 h,次日清晨抽取靜脈血;三酰甘油(TG)、總膽固醇(TC)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)、空腹血糖(FPG)及口服葡萄糖耐量試驗(OGTT)2 h血糖(2 hPG),上述指標采用羅氏Cobas C501全自動生化分析檢測。由醫(yī)院專業(yè)超聲科醫(yī)生使用邁瑞 DC-6 ExpertⅡ型超聲檢查儀對受試者進行腹部彩超檢查,確定診斷。
1.3診斷標準 T2DM診斷標準〔4〕參照《2017年中國糖尿病防治指南》:典型DM癥狀加上隨機血糖檢測≥11.1 mmol/L;FPG≥7.0 mmol/L;2 hPG≥11.1 mmol/L。
高血壓診斷標準〔5〕參照2010年修訂版的《中國高血壓防治指南》,在未使用降壓藥的情況下,SBP≥140 mmHg和(或)DBP≥90 mmHg,或既往有高血壓病史,正在服用降壓藥物治治療者,即被診斷為高血壓。
非酒精性脂肪性肝病(NAFLD)診斷標準〔6〕參照中華醫(yī)學(xué)會肝病分會脂肪肝及酒精性肝病學(xué)會組制訂的《2006年版非酒精性脂肪性肝病診療指南》。
血脂異常診斷標準〔7〕參照2016年中國成人血脂異常防治指南的標準:TC≥6.2 mmol/L,LDL-C≥4.1 mmol/L,HDL-C<1.0 mmol/L,TG≥2.3 mmol/L,出現(xiàn)任何一項即診斷為血脂異常。
1.4統(tǒng)計學(xué)處理 運用SPSS19.0軟件進行χ2檢驗、分類與回歸樹、受試者工作特征(ROC)曲線下面積(AUC)分析。
2.1基本情況 共調(diào)查體檢人群10 361人,檢出622例DM患者,以DM患者為病例組,同期體檢正常人群為對照組。與對照組相比,病例組BMI、SBP、DBP、FPG、TG、TC、LDL-C水平明顯升高,HDL-C的水平明顯降低,而且患有NAFLD的人群比例明顯升高,差異均有統(tǒng)計學(xué)意義(P<0.01),見表1。
表1 兩組臨床與代謝特征比較
2.2構(gòu)建分類樹模型 以DM為因變量,患有DM賦值為1,未患DM賦值為0。將BMI、性別(男性為1,女性為0)、年齡、NAFLD(患有NAFLD=1,未患NAFLD=0)、高血壓(患有高血壓=1,未患高血壓=0)、TG、TC、HDL-C、LDL-C指標作為自變量代入研究分析,其中性別、NAFLD和高血壓定義為分類變量,其余變量為連續(xù)變量。根據(jù)預(yù)先設(shè)定樹的生長深度和修剪規(guī)則,本次建立的DM發(fā)病風(fēng)險分類樹模型結(jié)果顯示:共包含5層,23個結(jié)點,其中終末結(jié)點12個。最終納入影響DM的4個解釋變量,分別為:年齡、NAFLD、TG、高血壓。
2.3模型的分析 樹形結(jié)構(gòu)的第一層依據(jù)年齡進行拆分,因此年齡是DM最重要的危險因素,拆分點為50.5歲,年齡>50.5歲的DM患者比例(14.5%,444/3 061)明顯高于年齡≤50.5歲組(2.4%,178/7 300,P<0.05)提示隨著年齡的增長,DM的患病率明顯增加。隨后第二層篩選出的因素是NAFLD,在年齡>50.5歲時,患有NAFLD的人群DM患病率(25.1%,211/840)明顯高于無NAFLD的人群(10.5%,233/2 221),年齡≤50.5歲且患NAFLD的人群DM比例(8.1%,105/1 304)明顯高于無NAFLD的人群(1.2%,73/5 996,P<0.05);在模型第三層中,篩選出的因素為TG和年齡,在年齡≤50.5歲、NAFLD人群中,TG>4.015 mmol/L者(20.1%,31/154)的DM患病率明顯高于TG≤4.015 mmol/L者(6.4%,74/1 150,P<0.05);在年齡>50.5歲、NAFLD人群中,TG>2.205 mmol/L者(31.5%,105/333)的DM患病率明顯高于TG≤2.205 mmol/L者(20.9%,106/507),第四層的分支變量是年齡、高血壓,在年齡>50.5歲、無NAFLD、TG>2.505 mmol/L人群中,有高血壓的DM比例(31.2%,30/96)明顯高于無高血壓者(16.0%,21/131,P<0.05);到第五層的分支變量仍是高血壓,由此可見,高血壓對DM的重要影響。
2.4模型的評價 增益圖:累計增益圖是從0%開始以100%結(jié)束,且良好模型的增益圖應(yīng)先向100%快速增長,最后趨于平穩(wěn),此DM分類樹模型符合良好模型的標準,提示該模型良好,見圖1。
圖1 DM發(fā)病風(fēng)險分類樹模型收益圖
分類樹重替代估計量和交叉驗證估計量分別為0.060和0.061,標準誤差均為0.002,表示采用分類樹模型預(yù)測DM影響因素的正確率為94%,則證明模型擬合效果良好。
ROC曲線:利用此模型得出預(yù)測概率繪制ROC曲線,AUC為0.835(95%CI:0.827~0.842),標準誤為0.007,靈敏度為0.868(95%CI:0.839~0.894),特異度為0.660(95%CI:0.570~0.651),表明本次模型精確性較高,可以有效地篩選出DM相關(guān)的影響因素。見圖2。
圖2 DM分類樹模型的ROC曲線
DM是由遺傳和環(huán)境等多因素共同參與引起的臨床綜合征。如今,分類樹模型因具有針對分析多因素間交互作用的獨特優(yōu)勢,在各行各業(yè)中得到了廣泛應(yīng)用。醫(yī)學(xué)領(lǐng)域中,在分析疾病的多病因危險因素方面,相應(yīng)的需求也迅速增長,特別是應(yīng)用于樣本量較大的病因研究。
分類樹模型是一種類似樹形結(jié)構(gòu)的預(yù)測模型,根據(jù)各個自變量對因變量的相關(guān)程度逐個分層,至分層檢驗無統(tǒng)計學(xué)意義為止最終完成分類樹。這樣的樹形圖展現(xiàn)方式不僅直接、方便、簡單易懂,而且比傳統(tǒng)線性模型更清晰地表達自變量間的交互作用,能直觀地得出多個因素對疾病的影響作用順序。
本研究結(jié)合相關(guān)臨床資料信息,運用分類樹建立糖尿病預(yù)測模型,為疾病的預(yù)防和干預(yù)提供有力的理論依據(jù)。從本研究構(gòu)建的分類樹模型結(jié)果可以看出年齡、NAFID、TG、高血壓對DM患病率的重要性,與以往相關(guān)研究結(jié)果相符〔8,9〕。
具體分析如下,年齡作為第一個分類變量對糖尿病患病風(fēng)險影響最大,截點為50.5歲,提示針對中老年人應(yīng)加強健康宣教和早期干預(yù),早發(fā)現(xiàn)早治療從而提高生活質(zhì)量。處于目前世界經(jīng)濟迅速發(fā)展的時代,DM(特別是T2DM)患病率逐漸增加,尤其是老年人,因衰老對代謝的直接影響,使得這一人群DM的潛在病理生理學(xué)進展加劇,而且衰老帶來的效應(yīng)與DM相互作用,也會加速許多DM相關(guān)并發(fā)癥的進程。
分類樹的第二層拆分變量均為NAFLD,充分說明,無論老少,患有NAFLD的人群發(fā)生DM的概率都高于健康體檢者,從疾病發(fā)生機制角度看,肝臟脂肪變性(即肝臟中脂質(zhì)的過度沉積)通常伴有胰島素抵抗〔10〕。雖然迄今為止病毒性肝炎仍是一個重要的健康問題,但是NAFLD是目前世界上非常常見的肝臟疾病,而且呈上升趨勢,據(jù)估計,其發(fā)病率在東南亞城市地區(qū)高達60%〔11〕,因此,患有NAFLD人群必須引起高度重視,需要通過改變生活方式和膳食搭配適當減輕體重,其次定期復(fù)查肝臟彩超和肝功能指標。有文獻報道〔12〕,逆轉(zhuǎn)NAFLD可改善胰島素抵抗。第三層進一步拆分的變量為TG和年齡。高TG是血脂異常的表現(xiàn),提示血脂異常與DM之間的密切關(guān)聯(lián),既往研究顯示,血脂異常是由許多遺傳和非遺傳因素之間相互作用引起,不僅會導(dǎo)致血糖代謝異常,且是發(fā)生動脈粥樣硬化性心血管疾病的高危因素〔13〕,尤其是血漿TG濃度升高。因此,建議對血脂異?;颊邞?yīng)密切檢查,對內(nèi)分泌和心血管相關(guān)疾病評估篩查。
根據(jù)分類樹模型結(jié)果,與DM相關(guān)的第四層拆分變量含有年齡,另一變量是高血壓,緊接著第五層進一步拆分的仍為高血壓,說明高血壓的患病與否對DM影響顯著。已有臨床研究表明〔14〕,高血壓和胰島素抵抗之間存在緊密病理生理學(xué)聯(lián)系,飲食鹽和熱量的過量攝入,與血壓升高相關(guān)性大。那么,對于有高血壓的高危因素特別是有家族遺傳史的人群,應(yīng)當積極改正不健康的生活方式、做好血壓管理和合理規(guī)范的降壓治療。本次研究所建立的DM危險因素模型具有較滿意的說服力和可信度。
值得關(guān)注的是,分類樹模型同樣也有自身的弱點,它需要較大的樣本量才能保證逐層細分后單元格內(nèi)仍有充分的樣本數(shù),因此針對小樣本量的數(shù)據(jù)分析具有局限性。其次,對于線性關(guān)聯(lián)、無交互作用的數(shù)據(jù),其分析效果和模型解釋性均不如普通統(tǒng)計模型。
綜上所述,本研究結(jié)合相關(guān)臨床資料信息,應(yīng)用分類樹建立的DM預(yù)測模型,提示年齡、NAFLD、TG及高血壓是T2DM的危險因素,為疾病的預(yù)防和干預(yù)提供有力的理論依據(jù),在臨床實踐中應(yīng)針對不同高危人群采取個性化的預(yù)防措施,減少DM患病率并延緩并發(fā)癥的發(fā)展,降低醫(yī)療耗費成本。