楊毅,叢慧文,王廉源,楊麗萍,包綺晗,王浩樺,李承圣,周立雯,丁子琛,石福艷*,王素珍*
腦卒中又稱中風(fēng),是全球第二位主要死亡原因,也是導(dǎo)致殘疾的主要因素之一[1]。雖然在過(guò)去20年中,全球腦卒中死亡率的年齡標(biāo)準(zhǔn)化率有所下降,但每年腦卒中患者的絕對(duì)人數(shù)、與腦卒中相關(guān)的死亡人數(shù)以及全球腦卒中總負(fù)擔(dān)均不斷增加[2-4]。近年來(lái),我國(guó)人群慢性病發(fā)病率呈上升趨勢(shì),腦卒中作為常見(jiàn)慢性病之一,因其高死亡率、高致殘率及預(yù)后較差等特點(diǎn)將給社會(huì)帶來(lái)極重的經(jīng)濟(jì)負(fù)擔(dān)和疾病負(fù)擔(dān)。然而,腦卒中又是一種可以有效預(yù)防和控制的疾病。相關(guān)研究表明,腦卒中死亡率大幅度下降的原因主要為危險(xiǎn)因素的下降[5-6]。因此,探討腦卒中的危險(xiǎn)因素,進(jìn)而有針對(duì)性地采取干預(yù)措施是降低腦卒中疾病負(fù)擔(dān)的關(guān)鍵措施之一。
健康體檢縱向數(shù)據(jù)累積了大量的健康信息,為慢性病的有效防控研究提供了重要平臺(tái)。許多學(xué)者采用Logistic回歸、Cox回歸模型等方法對(duì)體檢人群的相關(guān)健康信息進(jìn)行了深入挖掘,對(duì)體檢個(gè)體健康信息與健康結(jié)果之間的關(guān)聯(lián)性進(jìn)行了深入分析[7-8]。然而,健康體檢縱向數(shù)據(jù)由于缺失數(shù)據(jù)多、樣本量小等諸多問(wèn)題,導(dǎo)致健康體檢數(shù)據(jù)利用率低、重要的健康相關(guān)信息未能得到充分挖掘,進(jìn)而對(duì)健康體檢信息的有效利用、常見(jiàn)慢性病的有效防控等工作帶來(lái)一定困難。
近年來(lái),為了研究縱向指標(biāo)的動(dòng)態(tài)變化與生存結(jié)局指標(biāo)之間的關(guān)聯(lián),有研究者引入聯(lián)合模型(joint model)處理技術(shù)[9-10],該方法可分析縱向變量動(dòng)態(tài)變化軌跡對(duì)生存結(jié)局的影響,可減少模型中參數(shù)估計(jì)的偏差,為深入挖掘縱向隨訪數(shù)據(jù)信息提供了新的研究思路。相關(guān)研究表明,貝葉斯聯(lián)合模型具有對(duì)數(shù)據(jù)分布要求低、小樣本數(shù)據(jù)處理結(jié)果穩(wěn)健、可同時(shí)分析多個(gè)縱向檢測(cè)變量與生存結(jié)局的關(guān)系等優(yōu)點(diǎn)[11-12]。
鑒于此,本研究采用貝葉斯多變量聯(lián)合模型方法,基于健康體檢人群數(shù)據(jù),探討分析影響健康體檢人群腦卒中發(fā)病的主要影響因素,進(jìn)而為腦卒中的有效防控提供科學(xué)依據(jù),也可為其他慢性病危險(xiǎn)因素探討研究提供新的方法和思路。
1.1 一般資料 本研究使用空軍軍醫(yī)大學(xué)西京醫(yī)院健康醫(yī)學(xué)中心2008—2015年的體檢數(shù)據(jù),其中包括個(gè)人基本信息(姓名、性別、出生日期、年齡、婚姻狀況、文化程度),基本體格檢查指標(biāo)〔身高、體質(zhì)量、體質(zhì)指數(shù)(body mass index,BMI)、血壓、血脂四項(xiàng)〕等。隨訪情況:工作單位集體定期到院體檢,體檢間隔時(shí)間為1年,以首次發(fā)生腦卒中為結(jié)局事件,發(fā)生結(jié)局事件立即停止隨訪;若未發(fā)生,到2015年體檢信息收集完成后結(jié)束隨訪。
納入標(biāo)準(zhǔn):(1)體檢人群年齡≥20周歲;(2)常住地為陜西??;(3)個(gè)人基本信息完整。排除標(biāo)準(zhǔn):(1)隨訪時(shí)間<3年;(2)進(jìn)入隨訪隊(duì)列前已臨床確診糖尿病、心血管疾病、肝臟疾病及腎臟疾病等;(3)進(jìn)入隨訪隊(duì)列前已臨床確診腦卒中;(4)隨訪過(guò)程中相關(guān)診斷記錄缺失。
依據(jù)隨訪過(guò)程中是否發(fā)生腦卒中將體檢人群分為腦卒中組和非腦卒中組。本研究已通過(guò)濰坊醫(yī)學(xué)院醫(yī)學(xué)倫理委員會(huì)審批(濰醫(yī)倫理研2018第145號(hào)),研究對(duì)象的信息收集完全基于其自愿和知情同意的前提下進(jìn)行。
1.2 診斷標(biāo)準(zhǔn) 急性缺血性腦卒中的診斷標(biāo)準(zhǔn)為[13-14]:(1)急性起??;(2)局灶神經(jīng)功能缺損(一側(cè)面部或肢體無(wú)力或麻木,語(yǔ)言障礙等),少數(shù)為全面神經(jīng)功能缺損;(3)影像學(xué)檢查出現(xiàn)責(zé)任病灶或癥狀/體征持續(xù)24 h以上;(4)排除非血管性病因;(5)顱腦CT/MRI排除腦出血。根據(jù)國(guó)際臨床診斷標(biāo)準(zhǔn)[14],采用CT/MRI對(duì)其余類型腦卒中進(jìn)行診斷。糖尿病、心腦血管疾病、肝臟疾病等混雜疾病的診斷均以國(guó)際臨床診斷標(biāo)準(zhǔn)為準(zhǔn)[15-16]。
1.3 觀察指標(biāo)及樣本量確定原則 本研究納入的縱向觀察變量包括總膽固醇(total cholesterol,TC)、三酰甘油(triglyceride,TG)、低密度脂蛋白膽固醇(low-density lipoprotein,LDL-C)、高密度脂蛋白膽固醇(high-density lipoprotein,HDL-C)、體質(zhì)指數(shù)(body mass index,BMI)和收縮壓(systolic pressure,SBP)。以研究人群第一次記錄的體檢數(shù)據(jù)作為基線,對(duì)此后每年的體檢數(shù)據(jù)進(jìn)行記錄與整合,從而形成整體縱向數(shù)據(jù)。根據(jù)上述納入、排除標(biāo)準(zhǔn),共篩選得到234例研究對(duì)象,其中70例在隨訪期間發(fā)生腦卒中,運(yùn)用10 EPV(Events Per Variable)原則[17]對(duì)樣本含量進(jìn)行驗(yàn)證,滿足最小樣本含量要求。
1.4 研究方法 貝葉斯多變量聯(lián)合模型(Bayesian Multivariate Joint Models)[18-21]包括縱向子模型與生存子模型,縱向子模型的選擇包括廣義線性模型、線性混合效應(yīng)模型、比例優(yōu)勢(shì)累積logit模型等,生存子模型通常選擇Cox回歸模型。線性混合效應(yīng)模型既保留了傳統(tǒng)線性模型中的正態(tài)性假定條件,又對(duì)獨(dú)立性和方差齊性不做要求,進(jìn)而將協(xié)變量的固定效應(yīng)和隨機(jī)效應(yīng)同時(shí)分析,分析結(jié)果更加可靠;Cox回歸模型在生存分析研究中已被廣泛接受,且作為半?yún)?shù)模型,不對(duì)事件時(shí)間的分布做出任何假設(shè),分析過(guò)程更加簡(jiǎn)便靈活[22]。因此,本研究選用線性混合效應(yīng)模型作為縱向子模型,Cox回歸模型作為生存子模型。
1.4.1 縱向子模型 假設(shè)有k=(1,……,k)個(gè)縱向結(jié)局,令Yik(t)為個(gè)體i在時(shí)間tij上第k個(gè)縱向結(jié)局的值,此時(shí)多縱向數(shù)據(jù)的線性混合效應(yīng)模型為:。其中,βk是第 k 種縱向測(cè)量結(jié)局的固定效應(yīng),bik是第k種縱向測(cè)量結(jié)局的個(gè)體隨機(jī)效應(yīng),分別是固定效應(yīng)與隨機(jī)效應(yīng)的設(shè)計(jì)矩陣,εik(t)表示隨機(jī)誤差。
1.4.2 生存子模型 本研究以Cox回歸模型構(gòu)建生存子模型,即:。其中,λi(t)表示t時(shí)刻發(fā)生結(jié)局事件的風(fēng)險(xiǎn),λ0(t)表示未指定分布的基線風(fēng)險(xiǎn)函數(shù),X2i是生存過(guò)程中的基線協(xié)變量,γ為相應(yīng)的回歸系數(shù),W2i(t)表示多縱向過(guò)程與生存過(guò)程的關(guān)聯(lián)項(xiàng)。
在構(gòu)建貝葉斯多變量聯(lián)合模型的過(guò)程中,本研究以觀測(cè)時(shí)間為時(shí)依協(xié)變量,以TC、TG、HDL-C、LDL-C、BMI、SBP為因變量構(gòu)建縱向子模型;以生存時(shí)間和結(jié)局事件為因變量構(gòu)建橫向子模型。兩個(gè)子模型通過(guò)共享相同的隨機(jī)效應(yīng)鏈接。
1.4.3 貝葉斯參數(shù)估計(jì) 在貝葉斯方法下,采用無(wú)信息先驗(yàn)簡(jiǎn)化模型的分析過(guò)程,使用馬爾可夫蒙特卡羅(MCMC)算法對(duì)模型的參數(shù)進(jìn)行估計(jì)。假設(shè)縱向過(guò)程和結(jié)局事件發(fā)生相互獨(dú)立,且每個(gè)個(gè)體相互獨(dú)立,經(jīng)過(guò)MCMC迭代,在給定隨機(jī)效應(yīng)的情況下推導(dǎo)出模型參數(shù)的后驗(yàn)分布,為:p(yi│bi,θ)= ∏lp(yil│bi,θ)。其中θ表示全參數(shù)向量,p(·)表示概率密度函數(shù),從而進(jìn)行貝葉斯統(tǒng)計(jì)推斷。
1.5 統(tǒng)計(jì)學(xué)方法 采用Excel 2019整理腦卒中發(fā)病數(shù)據(jù)集,SPSS 22.0統(tǒng)計(jì)軟件對(duì)基線數(shù)據(jù)進(jìn)行初步分析?;€數(shù)據(jù)中,符合正態(tài)分布的計(jì)量資料以(±s)表示;腦卒中組與非腦卒中組的組間比較采用獨(dú)立樣本t檢驗(yàn);采用多因素Cox回歸模型分析基線情況對(duì)腦卒中結(jié)局事件的影響。采用貝葉斯多變量聯(lián)合模型將縱向變化過(guò)程對(duì)腦卒中結(jié)局事件的影響進(jìn)行分析,通過(guò)R 4.1.1軟件的JMbayes包實(shí)現(xiàn),迭代次數(shù)設(shè)定為3 000次,預(yù)熱500次。本研究的統(tǒng)計(jì)學(xué)分析均為雙側(cè)檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 研究對(duì)象基線情況 本研究共納入234例研究對(duì)象,總計(jì)1 581條縱向隨訪記錄,研究對(duì)象納入流程圖見(jiàn)圖1。234例研究對(duì)象基線平均年齡為(49.6±9.5)歲,中位年齡為50.5歲;隨訪時(shí)間為3~7年,平均隨訪時(shí)間為(6.4±1.2)年。隨訪過(guò)程中共70例(29.9%)研究對(duì)象發(fā)生腦卒中,歸入腦卒中組,其余為非腦卒中組,進(jìn)行研究分析。兩組患者基線TC、TG、LDL-C、HDL-C、BMI、SBP比較,差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),見(jiàn)表1。
圖1 234例研究對(duì)象納入流程圖Figure 1 The flowchart for inclusion of 234 subjects
表1 非腦卒中組與腦卒中組基線觀察指標(biāo)比較(±s)Table 1 Comparison of baseline observation variables between stroke and non-stroke groups
表1 非腦卒中組與腦卒中組基線觀察指標(biāo)比較(±s)Table 1 Comparison of baseline observation variables between stroke and non-stroke groups
注:TC=總膽固醇,TG=三酰甘油,LDL-C=低密度脂蛋白膽固醇,HDL-C=高密度脂蛋白膽固醇,BMI=體質(zhì)指數(shù),SBP=收縮壓;1 mm Hg=0.133 kPa
組別 例數(shù) TC(mmol/L) TG(mmol/L) LDL-C(mmol/L) HDL-C(mmol/L) BMI(kg/m2) SBP(mm Hg)非腦卒中組 164 4.5±0.9 1.9±1.1 1.6±0.6 2.8±0.7 24.2±1.8 124±15腦卒中組 70 4.4±0.9 2.1±1.6 1.6±0.8 2.6±0.9 24.4±3.1 126±20 t值 0.352 -0.834 -0.037 1.619 -0.417 -1.037 P值 0.725 0.405 0.970 0.107 0.667 0.247
2.2 研究對(duì)象體檢指標(biāo)動(dòng)態(tài)變化軌跡情況 分別對(duì)腦卒中組與非腦卒中組的TC、TG、LDL-C、HDL-C、BMI和SBP縱向軌跡變化情況進(jìn)行了分析,由圖2可知,腦卒中組和非腦卒中組研究對(duì)象的TC、TG、LDL-C等指標(biāo)的變化軌跡不同,其中腦卒中組研究對(duì)象的TC、TG、LDL-C和HDL-C指標(biāo)的變化幅度較大,而非腦卒中組研究對(duì)象的TC、TG、LDL-C和HDL-C變化軌跡趨于平穩(wěn)狀態(tài)。
圖2 兩組觀察指標(biāo)的縱向變化軌跡圖Figure 2 Longitudinal trajectory of the observation indexes in different groups
2.3 基線觀察指標(biāo)對(duì)腦卒中發(fā)病的影響情況分析 以腦卒中發(fā)生情況為因變量,以基線分析變量為自變量(賦值見(jiàn)表2),進(jìn)行多因素Cox回歸模型分析,結(jié)果顯示,基線TC、TG、LDL-C、HDL-C、BMI、SBP對(duì)腦卒中發(fā)病均無(wú)影響(P>0.05),見(jiàn)表3。
表2 基線觀察指標(biāo)對(duì)腦卒中發(fā)病影響的多因素Cox回歸模型賦值情況Table 2 Assignment of multifactorial Cox proportional risk models for the effect of baseline observables on stroke onset
表3 基線觀察指標(biāo)對(duì)腦卒中發(fā)病影響的多因素Cox回歸模型Table 3 Multivariate Cox proportional hazards model of the effect of baseline observation indexes on the incidence of stroke
2.4 貝葉斯多變量聯(lián)合模型的縱向觀察指標(biāo)對(duì)腦卒中發(fā)病的影響 本研究以TC、TG、LDL-C、HDL-C、BMI和SBP為縱向監(jiān)測(cè)變量,構(gòu)建貝葉斯多變量聯(lián)合模型的縱向子模型,以腦卒中是否發(fā)生為結(jié)局變量,構(gòu)建腦卒中發(fā)病風(fēng)險(xiǎn)貝葉斯多變量聯(lián)合模型的生存子模型,分析TC、TG、LDL-C等體檢指標(biāo)的縱向變化軌跡對(duì)腦卒中發(fā)病的影響,結(jié)果顯示,TG和LDL-C對(duì)腦卒中發(fā)病有影響(P<0.05)。TG每縱向升高1 mmol/L,腦卒中發(fā)病風(fēng)險(xiǎn)升高1.863倍;LDL-C每縱向升高1 mmol/L,腦卒中發(fā)病風(fēng)險(xiǎn)升高1.347倍(P<0.05),見(jiàn)表4。
表4 貝葉斯多變量聯(lián)合模型的縱向觀察指標(biāo)對(duì)腦卒中發(fā)病的影響Table 4 Results of the Bayesian multivariate joint model of the effect of longitudinal observation indexes on stroke incidence
腦卒中具有發(fā)病隱匿、潛伏期長(zhǎng)、發(fā)病后不能自愈或很難治愈等特點(diǎn),是目前影響人類健康的主要公共衛(wèi)生問(wèn)題之一[23-24]。近年來(lái),隨著健康體檢的逐步規(guī)范化及人們對(duì)健康體檢的重視,健康體檢項(xiàng)目逐步增多,采集的健康體檢信息也逐年增加,健康體檢數(shù)據(jù)對(duì)常見(jiàn)慢性病的有效防控帶來(lái)了諸多便利。本研究采用貝葉斯多變量聯(lián)合模型,基于健康體檢數(shù)據(jù),對(duì)體檢人群的腦卒中發(fā)病風(fēng)險(xiǎn)因素進(jìn)行了深入探討研究,以期為腦卒中的有效防控提供借鑒。
本研究中獨(dú)立樣本t檢驗(yàn)和多因素Cox回歸模型結(jié)果顯示:所有縱向觀測(cè)變量的基線情況比較無(wú)差異,且其對(duì)腦卒中發(fā)病均無(wú)影響(P>0.05),兩組研究對(duì)象的TC、TG、LDL-C等基線觀察指標(biāo)分布均衡。這與國(guó)內(nèi)外研究不完全一致。HAGBERG等[25]認(rèn)為,高BMI可能會(huì)增加心肺負(fù)擔(dān),通過(guò)影響腦部血液流動(dòng),致使腦卒中發(fā)病概率升高;PETERS等[26]發(fā)現(xiàn),女性腦卒中的發(fā)病率隨TC水平的增加而增加。本研究中傳統(tǒng)多因素Cox回歸模型結(jié)果并未得出影響腦卒中發(fā)病的危險(xiǎn)因素,造成上述結(jié)果的原因可能是傳統(tǒng)多因素Cox回歸模型只考慮了研究對(duì)象的基線情況,靜態(tài)模型并未考慮縱向指標(biāo)的動(dòng)態(tài)變化,因此可能產(chǎn)生一定的差異。而貝葉斯多變量聯(lián)合模型可以將縱向觀測(cè)指標(biāo)的動(dòng)態(tài)變化過(guò)程和結(jié)局事件關(guān)聯(lián)起來(lái),更加完整地考慮了生存過(guò)程,提高結(jié)果估計(jì)的精確性。
TC、TG、LDL-C等指標(biāo)的縱向變化軌跡圖分析結(jié)果顯示:相較于非腦卒中組,腦卒中組的TC、TG等體檢指標(biāo)的變化幅度較大,其動(dòng)態(tài)軌跡變化可能影響腦卒中的發(fā)病率。為進(jìn)一步深入探討分析TC、TG等指標(biāo)的縱向動(dòng)態(tài)變化軌跡對(duì)腦卒中發(fā)病的影響,本研究采用貝葉斯多變量聯(lián)合模型進(jìn)行分析,分析結(jié)果顯示:TG和LDL-C的動(dòng)態(tài)變化軌跡影響腦卒中發(fā)病(P<0.05),TG和LDL-C的縱向變化與腦卒中的發(fā)病率呈正相關(guān)。該研究結(jié)果與國(guó)內(nèi)外部分研究結(jié)論相似。大量研究表明,不良的脂質(zhì)縱向軌跡變化會(huì)增加心腦血管疾病的風(fēng)險(xiǎn)[27-30],其中TG作為心血管疾病的危險(xiǎn)因素,已廣泛被醫(yī)學(xué)界接受,高TG水平會(huì)引起冠心病、動(dòng)脈粥樣硬化,導(dǎo)致腦部血流量減少,增加腦卒中的發(fā)病風(fēng)險(xiǎn)。李志強(qiáng)[31]通過(guò)分析2008—2016年人群隊(duì)列研究發(fā)現(xiàn),腦卒中的發(fā)病風(fēng)險(xiǎn)會(huì)隨著TG水平的降低而降低。LEE等[32]進(jìn)行的一項(xiàng)前瞻性隊(duì)列研究發(fā)現(xiàn),高TG水平的成年人,其腦卒中發(fā)病的概率更高。LDL-C是一種運(yùn)載膽固醇進(jìn)入外周組織細(xì)胞的脂蛋白顆粒,當(dāng)其過(guò)量時(shí),其攜帶的膽固醇會(huì)在動(dòng)脈壁上累積,進(jìn)而引發(fā)動(dòng)脈硬化。GU等[33]通過(guò)納入6項(xiàng)共計(jì)267 500例研究對(duì)象的隊(duì)列研究發(fā)現(xiàn),LDL-C水平升高容易引發(fā)大動(dòng)脈硬化,同時(shí)隨著LDL-C水平升高,腦卒中的發(fā)病率也會(huì)增加。另外,前期相關(guān)研究表明,TC、HDL-C等也是影響腦卒中發(fā)病的危險(xiǎn)因素[32,34],但本研究中并未發(fā)現(xiàn)TC、HDL-C的動(dòng)態(tài)變化對(duì)腦卒中發(fā)病的影響,可能是因?yàn)楦逿C、低HDL-C水平與多數(shù)心腦血管疾病發(fā)病的相關(guān)度較高,本研究在設(shè)計(jì)前期為排除其他疾病對(duì)腦卒中發(fā)病的影響,將基線患有心腦血管疾病的患者排除,從而未能發(fā)現(xiàn)TC、HDL-C與腦卒中發(fā)病的相關(guān)性。
本研究也存在一定的局限性:如本研究納入的變量較少,且為一些常見(jiàn)的血脂、血糖等指標(biāo),缺乏腦卒中發(fā)病的特異性因素,后期在條件允許的情況下,可進(jìn)一步增加研究變量,以深入探討分析影響腦卒中發(fā)病的影響因素。另外,貝葉斯多變量聯(lián)合模型的擬合過(guò)程中僅考慮了無(wú)信息先驗(yàn)的情況,未來(lái)的研究可以考慮納入外部有信息先驗(yàn)進(jìn)而提升貝葉斯聯(lián)合模型的估計(jì)精度。
綜上所述,TG和LDL-C的縱向增長(zhǎng)是影響體檢人群腦卒中發(fā)病的關(guān)鍵危險(xiǎn)因素。本研究結(jié)果提示,健康體檢人群除了應(yīng)進(jìn)行定期體檢,注意體檢指標(biāo)是否異常外,還應(yīng)密切關(guān)注體檢對(duì)象體檢指標(biāo)的動(dòng)態(tài)變化軌跡,特別對(duì)于那些動(dòng)態(tài)軌跡變化較大的指標(biāo),應(yīng)提高警惕,并及時(shí)進(jìn)行有針對(duì)性的干預(yù)及治療,進(jìn)而降低人群發(fā)病的風(fēng)險(xiǎn)。此外,由本研究結(jié)果可知,貝葉斯聯(lián)合模型可用于健康體檢人群腦卒中等常見(jiàn)慢性病的危險(xiǎn)因素的探討研究。
作者貢獻(xiàn):楊毅負(fù)責(zé)選題、清洗保留研究數(shù)據(jù)、模型構(gòu)建、計(jì)算機(jī)代碼和支持算法的實(shí)現(xiàn)、原稿寫(xiě)作;叢慧文和王廉源負(fù)責(zé)模型構(gòu)建、計(jì)算機(jī)代碼和支持算法的實(shí)現(xiàn);楊麗萍負(fù)責(zé)調(diào)查開(kāi)展、提供研究數(shù)據(jù);包綺晗負(fù)責(zé)數(shù)據(jù)可視化展示;王浩樺和李承圣負(fù)責(zé)驗(yàn)證研究結(jié)果;周立雯和丁子琛負(fù)責(zé)清洗和整合研究數(shù)據(jù);通信作者石福艷和王素珍對(duì)選題進(jìn)行指導(dǎo),對(duì)文章涉及觀點(diǎn)及立論依據(jù)進(jìn)行審閱和修訂;所有作者確認(rèn)了論文的最終稿。
本文無(wú)利益沖突。