■ 湯 如張金萍劉 暢曹秀堂高岱峰
利用連續(xù)健康體檢資料構(gòu)建疾病預(yù)測(cè)模型
■ 湯 如①?gòu)埥鹌饥趧?暢②曹秀堂①高岱峰②
連續(xù)健康體檢資料 GEE模型 高血壓
目的:利用連續(xù)體檢資料的變化,探討相關(guān)疾病的影響因素,為疾病預(yù)測(cè)提供新思路。方法:抽取5個(gè)單位經(jīng)過(guò)6年體檢的943人作為研究樣本,以是否患有高血壓分為兩組。運(yùn)用重復(fù)測(cè)量廣義估計(jì)方程(GEE模型)對(duì)選擇的樣本進(jìn)行模型構(gòu)建,將二項(xiàng)反應(yīng)變量設(shè)定為是否診斷為高血壓,篩選出高血壓的危險(xiǎn)因素。結(jié)果:5個(gè)受檢單位之間對(duì)高血壓的影響存在差異。收縮壓、高密度脂蛋白膽固醇、血紅蛋白濃度的變化對(duì)高血壓的發(fā)生具有統(tǒng)計(jì)學(xué)意義。結(jié)論:收縮壓、血紅蛋白濃度是高血壓的危險(xiǎn)因素,高密度脂蛋白膽固醇是高血壓的保護(hù)因素;通過(guò)建立連續(xù)體檢資料變化的模型能對(duì)疾病的預(yù)測(cè)提供幫助。
Author’s address:General Hospital of PLA, No.28, fuxing Road, Haidian District, Beijing, 100853, PRC
檢后服務(wù)是體檢服務(wù)的延伸,內(nèi)容包括建立電子檔案、提醒跟蹤、健康咨詢、健康教育、慢病風(fēng)險(xiǎn)評(píng)估等,受到各體檢機(jī)構(gòu)的日益重視[1]。檢后服務(wù)是提供優(yōu)質(zhì)體檢服務(wù)、吸引體檢客戶的重要措施。同時(shí),各體檢中心通過(guò)定期體檢積累了大量體檢信息[2]。特別可貴的是人群相對(duì)固定的歷次體檢信息,不僅能夠?yàn)槭軝z者提供各項(xiàng)指標(biāo)的動(dòng)態(tài)變化趨勢(shì),更能利用這些信息探索疾病發(fā)生、發(fā)展的規(guī)律。作者嘗試?yán)眠B續(xù)體檢指標(biāo)的變化,探索高血壓的影響因素,為充分利用體檢資料提供方法借鑒,并為提高檢后服務(wù)水平提供有效的工具和手段。
表1 5個(gè)單位體檢基線時(shí)資料描述
某體檢中心對(duì)相對(duì)固定的14個(gè)體檢單位,6282名參檢人群的體檢資料進(jìn)行整理。其中男性3749人,占59.68%。從中抽取經(jīng)過(guò)6年體檢的5個(gè)單位943人作為研究樣本,嘗試進(jìn)行疾病影響因素模型的構(gòu)建。資料描述詳見(jiàn)表1。
因體檢時(shí)間較長(zhǎng),有些體檢項(xiàng)目不完整,本研究保留了數(shù)據(jù)采集比較完整的指標(biāo),詳見(jiàn)表2。
連續(xù)體檢資料是同一人群的重復(fù)測(cè)量數(shù)據(jù),適合用重復(fù)測(cè)量廣義估計(jì)方程(GEE模型)進(jìn)行模型參數(shù)估計(jì)[3-5]。
本文使用GEE模型對(duì)5個(gè)受檢單位連續(xù)6年重復(fù)測(cè)量資料進(jìn)行模型構(gòu)建。以是否診斷為高血壓作為二項(xiàng)反應(yīng)變量,用表2中列出的解釋變量使用SAS 9.1.3統(tǒng)計(jì)軟件進(jìn)行模型擬合。假定每個(gè)受檢者高血壓狀態(tài)是等相關(guān),即可交換相關(guān)結(jié)構(gòu)。SAS語(yǔ)句如下:
3.1 GEE模型擬合結(jié)果
以G E E模型擬合參數(shù)的檢驗(yàn)結(jié)果為依據(jù),篩選符合要求的變量,最終入選變量的參數(shù)估計(jì)見(jiàn)表3。研究結(jié)果可見(jiàn),受檢單位之間對(duì)高血壓的影響存在差異,此外收縮壓、高密度脂蛋白膽固醇、血紅蛋白濃度的變化對(duì)高血壓的發(fā)生具有統(tǒng)計(jì)學(xué)意義。根據(jù)GE E參數(shù)估計(jì)結(jié)果,收縮壓的OR估計(jì)為1.0218(95%CI:1.0142~1.0295),血紅蛋白濃度的OR估計(jì)為1.0208(95%CI:1.0093~1.0323),是高血壓的危險(xiǎn)因素。高密度脂蛋白膽固醇的OR估計(jì)為0.4401(95%CI:0.2715~0.7143),是高血壓的保護(hù)因素。
3.2 慢病風(fēng)險(xiǎn)評(píng)估具有現(xiàn)實(shí)意義
體檢的根本目的是以較小的代價(jià),及時(shí)發(fā)現(xiàn)影響健康的苗頭,指導(dǎo)慢病高風(fēng)險(xiǎn)人群控制風(fēng)險(xiǎn)因素,換取長(zhǎng)期的健康狀態(tài)。對(duì)于體檢人群來(lái)說(shuō),根據(jù)歷年監(jiān)測(cè)指標(biāo)對(duì)患病風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),據(jù)此強(qiáng)化健康管理理念,促進(jìn)健康生活方式的養(yǎng)成,更具實(shí)際意義。充分利用每次體檢結(jié)果,針對(duì)自身指標(biāo)變化趨勢(shì),提出個(gè)性化健康指導(dǎo)策略,才能達(dá)到健康管理的目的。
3.3 數(shù)據(jù)采集的規(guī)范性需要加強(qiáng)
原始信息的采集不夠完整,是體檢中心普遍存在的問(wèn)題。需要加大體檢行業(yè)標(biāo)準(zhǔn)的建立,完善采集系統(tǒng),并實(shí)現(xiàn)信息共享,只有這樣,才能使海量的體檢信息發(fā)揮更大的價(jià)值。受本研究體檢中心當(dāng)前體檢模式和體檢軟件限制,沒(méi)有采集受檢者生活習(xí)慣、疾病史、家族史等可能的影響因素,且體檢結(jié)果描述不夠規(guī)范,未記錄疾病診斷的醫(yī)療機(jī)構(gòu)和確切診斷時(shí)間。故疾病診斷和記錄的準(zhǔn)確性可能不準(zhǔn)確。
對(duì)于高血壓患病情況,在數(shù)據(jù)記錄和分析中同樣存在一定問(wèn)題。記錄為高血壓者可以是新診斷高血壓,也可以是藥物控制后血壓仍然不正常;同樣,血壓記錄為正常者,也可能是藥物控制后達(dá)到正常。由于未記錄服藥情況,此混雜因素?zé)o法排除。作為示例介紹,本研究?jī)H以體檢指標(biāo)的變化作為疾病預(yù)測(cè)的影響因素,重在提供模型預(yù)測(cè)的方法,模型擬合結(jié)果僅供參考。
表2 參與模型構(gòu)建的指標(biāo)及基線值
表3 GEE參數(shù)估計(jì)(基于觀察的標(biāo)準(zhǔn)誤估計(jì))
[1] 王維民,曾強(qiáng).醫(yī)院開(kāi)展體檢后續(xù)服務(wù)的探索與實(shí)踐[J].中國(guó)醫(yī)院,2010,14(6):74-75.
[2] 錢英,王麗鳳.定期健康體檢對(duì)中老年生活質(zhì)量的影響[J].中國(guó)實(shí)用醫(yī)藥,2011,6(8):251-252.
[3] 韓偉,薛芳,姜晶梅.應(yīng)用廣義估計(jì)方程對(duì)老年冠心病患者非心臟手術(shù)術(shù)中高血壓發(fā)生風(fēng)險(xiǎn)的評(píng)價(jià)[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(6):613-616.
[4] 馮麗云,J ames Cui.縱向數(shù)據(jù)準(zhǔn)似然獨(dú)立準(zhǔn)則在GE E模型中的應(yīng)用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2008,25(4):369-372.
[5] 吳海磊,錢吉生,徐興大.用廣義估計(jì)方程研究大氣污染對(duì)SARS發(fā)病的影響[J].中國(guó)國(guó)境衛(wèi)生檢疫雜志,2005,28(1):12-15.
Using longitudinal physical examination data building disease prediction model
/ TANG Ru, ZHANG Jinping,LIU Chang, CAO Xiutang, GAO Daifeng// Chinese Hospitals. -2015,19(3):5-6
longitudinal health physical examination data,GEE model,hypertension
Objectives: To explore the influence factors of hypertension and new way to predict disease with longitudinal physical examination data. Methods: 943 examiners were extracted as the research sample from five units in six years and were divided into two groups according to hypertension. Generalized Estimating Equations (GEE) model was used to select risk factors of hypertension, set the two response variables as whether diagnosed with hypertension or not. Results: There are differences between 5 tested units on hypertension. Systolic blood pressure, high density lipoprotein cholesterol, hemoglobin concentration change are related with the occurrence of hypertension. Conclusions: Systolic blood pressure, hemoglobin concentration is a risk factor for hypertension. High density lipoprotein cholesterol is the protection factor in hypertension. The establishment of continuous physical examination data change model can provide help for the forecast of disease.
2014-10-25](責(zé)任編輯 王遠(yuǎn)美)
總后保健專項(xiàng)課題(13BJZ23)
①中國(guó)人民解放軍總醫(yī)院,100853 北京市海淀區(qū)復(fù)興路28號(hào)
②中國(guó)人民解放軍305醫(yī)院,100017 北京市西城區(qū)文津街甲13號(hào)
高岱峰:中國(guó)人民解放軍305醫(yī)院體檢中心主任,副主任醫(yī)師
E-mail:dfg2001@sohu.com