山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室(030001) 孔盼盼 張慧敏 孫倩倩 余紅梅
基于分段常數(shù)強度Markov模型的阿爾茨海默病進程研究*
山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室(030001) 孔盼盼 張慧敏 孫倩倩 余紅梅△
目的將分段常數(shù)強度Markov模型應(yīng)用于輕度認(rèn)知損害(mild cognitive impairment,MCI)向阿爾茨海默?。ˋlzheimer′s disease,AD)轉(zhuǎn)歸過程中,深入研究影響轉(zhuǎn)歸過程的因素,為制定不同發(fā)展階段的預(yù)防措施提供理論依據(jù),為其他多狀態(tài)慢性病不同發(fā)展階段影響因素的探討提供方法學(xué)借鑒。方法應(yīng)用太原市600名社區(qū)老年人的4次隨訪資料,以MCI為狀態(tài)1,中重度認(rèn)知損害為狀態(tài)2,AD為狀態(tài)3,擬合分段常數(shù)強度Markov模型,分析MCI向AD轉(zhuǎn)歸不同發(fā)展階段的影響因素,并根據(jù)模型計算3年轉(zhuǎn)移概率矩陣。結(jié)果經(jīng)假設(shè)檢驗,數(shù)據(jù)滿足Markov性(P=0.89),不滿足時齊性(P<0.001),應(yīng)用分段常數(shù)強度Markov模型擬合,經(jīng)多因素篩選,女性、年齡、吸煙、高血壓和糖尿病是MCI向AD轉(zhuǎn)歸的危險因素,高文化程度和從事腦力勞動是MCI向AD轉(zhuǎn)歸的保護因素。由中重度認(rèn)知損害向AD的轉(zhuǎn)移概率隨著隨訪時間的增加而增加。結(jié)論在數(shù)據(jù)滿足Markov性,不滿足時齊性時,分段常數(shù)強度Markov模型是對疾病轉(zhuǎn)歸過程的相關(guān)影響因素及其變化規(guī)律的有效分析方法。
多狀態(tài)模型 非齊次Markov模型 分段常數(shù)強度Markov模型 輕度認(rèn)知損害 阿爾茨海默病
阿爾茨海默?。ˋlzheimer′s disease,AD)是以近期記憶障礙為主要臨床表現(xiàn)的神經(jīng)變性疾病,常具有慢性進行性特征,是老年期癡呆的一個主要類型,約占老年期癡呆總數(shù)的2/3。輕度認(rèn)知損害(mild cognitive impairment,MCI)是指個體存在輕微的認(rèn)知障礙,但未達到癡呆標(biāo)準(zhǔn)且社會功能基本保持正常的認(rèn)知損害狀態(tài),是介于正常老化和癡呆之間的一種中間過渡狀態(tài),是AD的高危人群。
多狀態(tài)Markov模型(multi-state Markov model)是處理多狀態(tài)資料的有效工具,可同時考慮所有的狀態(tài)、結(jié)局、狀態(tài)間轉(zhuǎn)移的時間信息以及可能的影響因素,可連續(xù)性動態(tài)研究隨機過程,分析影響疾病進展的因素,是迄今研究疾病進程的最佳模型[1]。與多狀態(tài)Cox回歸模型相比,多狀態(tài)Markov模型最大的優(yōu)勢在于它能夠處理無法觀察到精確狀態(tài)轉(zhuǎn)移時間的資料。
許多研究AD的文獻表明疾病進展率對時間的依賴性是增加的,因此AD各狀態(tài)間的轉(zhuǎn)移概率在時間上不是常量,即不滿足時齊性的假設(shè)。本研究采用分段常數(shù)強度Markov模型分析不滿足時齊性的多狀態(tài)面板數(shù)據(jù),研究阿爾茨海默病進程的影響因素,為今后類似研究提供方法學(xué)借鑒。
1.研究對象
本研究沿用項目組前期隨訪的老年人群,共納入60歲及以上社區(qū)輕度認(rèn)知損害老年人600名,構(gòu)成隊列人群,分別于2010年11月、2011年5月、2011年11月和2012年5月共完成4次隨訪,進行問卷調(diào)查。
2.調(diào)查內(nèi)容
(1)基本情況調(diào)查表由項目組自行設(shè)計,包括:①社會人口學(xué)指標(biāo):年齡、性別、受教育程度、婚姻狀況、職業(yè)、經(jīng)濟收入、居住狀況;②生活方式:吸煙、飲酒、社會活動、讀書看報、體育活動、做家務(wù)、夫妻及子女關(guān)系;③健康狀況:現(xiàn)患病、曾患病、家族遺傳史及視力、聽力、血壓、體質(zhì)指數(shù)。
(2)認(rèn)知功能評定采用蒙特利爾認(rèn)知評估量表(Montreal cognitive assessment,MoCA),它由加拿大CharlesLeMoyne醫(yī)院神經(jīng)科臨床研究中心Nasreddine ZS根據(jù)臨床經(jīng)驗并參考簡易精神狀況量表(MMSE)制訂[2],是快速篩查癡呆高危人群——MCI的有效工具。
(3)狀態(tài)劃分
考慮到AD的發(fā)生和發(fā)展呈現(xiàn)進行性加重和不可逆性特點,結(jié)合本次研究流行病學(xué)調(diào)查的實際狀況,將AD進程劃分為三個狀態(tài):MCI(狀態(tài)1),中重度認(rèn)知損害(狀態(tài)2),AD(狀態(tài)3)。其中狀態(tài)1和狀態(tài)2為暫態(tài),狀態(tài)3為吸收態(tài)。根據(jù)王煒等[3]的研究結(jié)果,將19分作為MCI與中重度認(rèn)知損害狀態(tài)的截斷值;根據(jù)張立秀[4]的研究結(jié)果,將15分作為中重度認(rèn)知損害狀態(tài)與AD的截斷值。AD進程狀態(tài)結(jié)構(gòu)圖見圖1。
圖1 AD進程狀態(tài)結(jié)構(gòu)圖
1.Markov性檢驗與時齊性檢驗
Markov性假設(shè)是指未來的演變只取決于當(dāng)前狀態(tài),而與個體過去的歷史無關(guān)。
對于三個狀態(tài)的模型,我們需證明在MCI狀態(tài)(過去)上的逗留時間不影響中重度認(rèn)知損害狀態(tài)(當(dāng)前)到AD狀態(tài)(未來)的轉(zhuǎn)移。
時齊性假設(shè)是假設(shè)Markov模型的轉(zhuǎn)移概率矩陣不隨時間變化。如果滿足該假設(shè),說明轉(zhuǎn)移強度隨著時間是不變的,則過程為齊次Markov過程(homogeneous Markov process);如果不滿足該假設(shè),說明轉(zhuǎn)移強度隨著時間是變化的,則過程為非齊次Markov過程(non-homogeneous Markov process)。
2.分段常數(shù)強度Markov模型
在數(shù)據(jù)滿足Markov性,不滿足時齊性時,應(yīng)用分段常數(shù)強度Markov模型估計非齊次Markov過程:
假定隊列有N個個體,對于每一個體c,狀態(tài)間的mc次轉(zhuǎn)移發(fā)生在時點
如果對每個個體觀察到了mc次轉(zhuǎn)移,那么就有最大值個時間點從一個狀態(tài)到另一個狀態(tài)的轉(zhuǎn)移。將這些時間點排序,通過r個不同的截斷點分成時間分區(qū),保證在每個時間分區(qū)內(nèi)至少能觀察到一次狀態(tài)間轉(zhuǎn)移,形成一個時間分割序列{s1,…,sr}。因此,將隨訪時間分成r-1區(qū)間,每個區(qū)間內(nèi)的轉(zhuǎn)移強度矩陣假定為常數(shù),即
其中Qk為每個區(qū)間內(nèi)的常數(shù)矩陣。對每個區(qū)間用齊次Markov轉(zhuǎn)移強度的最大似然法估計Qk[5]。對于兩個連續(xù)的區(qū)間si≤t<si+1和si+1≤t<si+2,如果Qi=Qi+1,則認(rèn)為滿足齊性,從序列中刪除時點si+1,將這兩個區(qū)間合并,合并后繼續(xù)與下一個鄰近區(qū)間的轉(zhuǎn)移強度進行比較;若不滿足齊性則應(yīng)視為分割點,如此反復(fù),直至任意兩個連續(xù)區(qū)間都不滿足齊性為止。
設(shè)該模型的轉(zhuǎn)移強度矩陣為Q,共有3個需要估計的轉(zhuǎn)移強度:q12、q13、q23。
3.軟件實現(xiàn)
資料的描述性分析使用SPSS13.0完成,Markov模型的擬合采用R(2.14.0)軟件中的“msm”軟件包和R(1.9.1)軟件中的“tdc.msm”軟件包完成,報告風(fēng)險比及其95%置信區(qū)間。
1.研究對象基本特征
2007年篩選出的600例MCI老年人在3年后的2010年11月,經(jīng)過四次隨訪到2012年5月,有二次及二次以上隨訪的有效數(shù)據(jù)為486例,失訪25例,失訪率為5.1%。其中12例搬遷、8例退出研究、5例死亡。
最終擁有完全數(shù)據(jù)的461例老年人中,男性150例(32.5%),女性311例(67.5%)。年齡最大者89歲,年齡最小者65歲,平均70.44歲(70.44±6.55),其中65歲至70歲者207人(44.9%),71歲至74歲者131人(28.4%),75歲及以上者123人(26.7%)。
2.Markov性檢驗與時齊性檢驗
根據(jù)R(1.9.1)軟件tdc.msm軟件運行結(jié)果,似然比檢驗統(tǒng)計量為0.02,自由度為1,P=0.89,說明該過程滿足Markov性,可對該數(shù)據(jù)擬合Markov模型。
根據(jù)軟件R(2.14.0)運行結(jié)果,似然比檢驗統(tǒng)計量為47.74,自由度為3,P<0.001,說明轉(zhuǎn)移強度矩陣是隨時間變化的,過程為非齊次Markov過程。
3.分段常數(shù)強度Markov模型擬合結(jié)果
由于數(shù)據(jù)滿足Markov性,不滿足時齊性,選擇分段常數(shù)強度Markov模型進行擬合。根據(jù)選定各截斷點后似然函數(shù)的比較及確保各個時間區(qū)間內(nèi)都有合適的或足夠的轉(zhuǎn)移次數(shù),該模型選擇第三次調(diào)查的時間即12個月為截斷點。
(1)分段常數(shù)強度Markov模型多因素分析
在第一個時間區(qū)間[0,12)月內(nèi),性別、年齡、文化程度、職業(yè)和高血壓對狀態(tài)1到狀態(tài)2的轉(zhuǎn)移有統(tǒng)計學(xué)意義;年齡、文化程度、職業(yè)、高血壓和糖尿病對狀態(tài)1到狀態(tài)3的轉(zhuǎn)移有統(tǒng)計學(xué)意義;性別、年齡、文化程度、高血壓和糖尿病對狀態(tài)2到狀態(tài)3的轉(zhuǎn)移有統(tǒng)計學(xué)意義。具體結(jié)果見表1。
表1 分段常數(shù)強度Markov模型[0,12)月及[12,18]月多因素擬合結(jié)果
在第二個時間區(qū)間[12,18]月內(nèi),性別、年齡、文化程度、職業(yè)、吸煙和高血壓對狀態(tài)1到狀態(tài)2的轉(zhuǎn)移有統(tǒng)計學(xué)意義;文化程度、職業(yè)、吸煙、高血壓和糖尿病對狀態(tài)1到狀態(tài)3的轉(zhuǎn)移有統(tǒng)計學(xué)意義;年齡、文化程度、職業(yè)、吸煙、高血壓和糖尿病對狀態(tài)2到狀態(tài)3的轉(zhuǎn)移有統(tǒng)計學(xué)意義。具體結(jié)果見表1。
(2)模型評價
圖2為危險因素作用下四個隨訪時點各狀態(tài)的實際發(fā)生率曲線(實線)和利用模型擬合的理論發(fā)生率曲線(虛線),橫軸代表觀察時間,縱軸代表發(fā)生率。由圖2可以看出,模型擬合情況較好。
圖2 分段常數(shù)強度Markov模型擬合情況
(3)轉(zhuǎn)歸預(yù)測
兩個時間區(qū)間分段常數(shù)強度Markov模型3年后轉(zhuǎn)移概率矩陣分別見表2。結(jié)果顯示,對于第一個時間區(qū)間,處于MCI狀態(tài)的個體,3年后仍處于MCI狀態(tài)的概率為35.5%,轉(zhuǎn)移到中重度認(rèn)知損害狀態(tài)的概率為60.2%,轉(zhuǎn)移到AD狀態(tài)的概率為4.3%;對于處于中重度認(rèn)知損害狀態(tài)的個體,3年后仍處于中重度認(rèn)知損害狀態(tài)的概率為95.9%,轉(zhuǎn)移到AD狀態(tài)的概率為4.1%。
表2 分段常數(shù)強度Markov模型[0,12)月及[12,18]月3年后轉(zhuǎn)移概率矩陣
對于第二時間區(qū)間,處于MCI狀態(tài)的個體,3年后仍處于MCI狀態(tài)的概率為12.8%,轉(zhuǎn)移到中重度認(rèn)知損害狀態(tài)的概率為66.0%,轉(zhuǎn)移到AD狀態(tài)的概率為21.2%;對于處于中重度認(rèn)知損害狀態(tài)的個體,3年后仍處于中重度認(rèn)知損害狀態(tài)的概率為65.0%,轉(zhuǎn)移到AD狀態(tài)的概率為35.0%。
1.非齊次Markov模型的優(yōu)勢
大多數(shù)研究在應(yīng)用Markov模型時都假定其為齊次過程,即轉(zhuǎn)移概率僅依賴于觀察間經(jīng)過的時間。時間齊次模型通常用于慢性病發(fā)展過程的研究,但是很明顯這個模型在疾病自然史研究中有很嚴(yán)重的限制,這是由于轉(zhuǎn)移概率在相當(dāng)長的觀察時間內(nèi)始終保持恒定似乎是不太可能的,因此就需要使用一些非齊次模型。
估計非齊次Markov過程有兩種常用的方法,除上述介紹的分段常數(shù)強度Markov模型外,還有一種是時間轉(zhuǎn)換模型。非齊次強度矩陣是基線齊次強度矩陣和一個時間函數(shù)的乘積[6]。時間經(jīng)函數(shù)變換后,非齊次過程就轉(zhuǎn)化為齊次過程。此方法需要估計轉(zhuǎn)移強度矩陣和時間函數(shù)的參數(shù)。與分段齊次模型相比,它需要估計的參數(shù)較少而且需要觀察的轉(zhuǎn)移較少。另外,它不需要假設(shè)離散時間間隔內(nèi)的齊次性。Hubbard等(2008)[7]提出兩種時間轉(zhuǎn)換方法,指數(shù)時間轉(zhuǎn)換和非參數(shù)時間轉(zhuǎn)換。盡管這種方法看似比較巧妙,但它的限制性很強,因為所有的轉(zhuǎn)移強度都按照一種形式建模,其中時間函數(shù)對所有的轉(zhuǎn)移強度都是固定的。然而,實際上,通常發(fā)現(xiàn)的隨機過程是轉(zhuǎn)移強度隨著時間有不同的趨勢的,即每一個轉(zhuǎn)移強度通過不同的函數(shù)來建模[8]。當(dāng)認(rèn)為所有轉(zhuǎn)移強度隨著時間連續(xù)變化不現(xiàn)實時,分段常數(shù)強度模型為首選。
2.應(yīng)用分段常數(shù)強度Markov模型時需注意的問題
應(yīng)用分段常數(shù)強度Markov模型時要注意的一個問題就是考慮分多少個區(qū)間。本研究采用的方法是考慮了兩個區(qū)間,然而隨訪時間可以分成三個、四個甚至更多的區(qū)間來定義常數(shù)轉(zhuǎn)移矩陣,每個研究者選擇的區(qū)間數(shù)可能不同。因此需根據(jù)選定各截斷點后似然函數(shù)的比較及確保各個時間區(qū)間內(nèi)都有合適的或足夠的轉(zhuǎn)移次數(shù)等原則,選擇合適的區(qū)間數(shù)和截斷點。
3.本研究的不足之處
軟件R(1.9.1)中的軟件包tdc.msm[9]是目前唯一可用的進行Markov性檢驗的軟件工具,由于其不允許數(shù)據(jù)有缺失的情況,所以隨訪人群中有缺失數(shù)據(jù)的25例患者并未納入分析中,有可能會導(dǎo)致偏倚。
1.Andersen PK,Perme MP.Inference for outcome probabilities in multi-state models.Lifetime Data Analysis,2008,14(4):405-431.
2.Nasreddine ZS,Phillips NA,Bedirian V,et a1.The Montreal Cognitive Assessment,MoCA:a brief screening tool for mild cognitive impairment.Journal of the American Geriatrics Society,2005,53(4):695-699.
3.王煒,劉丹丹,解恒革,等.蒙特利爾認(rèn)知評估量表(中文版)在駐京軍隊離退休干部中界值劃分的初步研究.中華保健醫(yī)學(xué)雜志,2010,12(4):271-273.
4.張立秀,劉雪琴.蒙特利爾認(rèn)知評估量表中文版廣州市老人院人群劃界分探討.中國心理衛(wèi)生雜志,2008,22(2):123-125,151.
5.楊珊珊,李新毅,周立業(yè),等.基于多狀態(tài)Markov模型的老年人認(rèn)知損害轉(zhuǎn)歸研究.中國衛(wèi)生統(tǒng)計,2012,29(4):516-519.
6.Kalbfleisch JD,Law less JF.The analysis of panel data under a Markov assumption.Journal of the American Statistical Association,1985,80(392):863-871.
7.Hubbard RA,Inoue LYT,F(xiàn)ann JR.Modeling nonhomogeneous Markov processes via time transformation.Biometrics,2008,64(3):843-850.
8.Ricardo OR.Non-homogeneous Markov processes for biomedical data analysis.Biometrical journal,2005,47(3):369-376.
9.Meira-Machado L,Cadarso-Suárez C,deJ.tdc msm:an R library for the analysis of multi-state survival data.Computer methods and programs in biomedicine,2007,86(2):131-140.
(責(zé)任編輯:郭海強)
Piecewise Constant Intensities Markov Model in Outcome of Mild Cognitive Impairment to Alzheimer′s Disease
Kong Panpan,Zhang Huimin,Sun Qianqian,et al(Department of Health Statistics,Shanxi Medical University(030001),Taiyuan)
ObjectiveThe aim of this study was to introduce piecewise constant intensities Markov model in outcome prediction from mild cognitive impairment(MCI)to Alzheimer′s disease(AD)and to find out related factors in order to provide theory basis for AD prevention among various progressive stages.The suggested method for exploring influencing factors for various progressive stages of other chronic disease was also provided.MethodsOur data came from four waves of cohort study of 600 community dwelling older people in Taiyuan.MCI,moderate/severe cognitive impairment,and AD were defined as state 1,2 and 3,respectively.Piecewise constant intensities Markov model was applied to explore factors for various progressive stages from MCI to AD.According to the fitted model,three years transition probabilities among states were also estimated.ResultsBased on hypothesis testing,the Markov assumption was satisfied(P=0.89)and the time-homogeneous assumption was not(P<0.001),so piecewise constant intensities Markov model was applied.Multivariate analysis showed that women,older,smoking,hypertension and diabetes were risk factors for progression from MCI to AD while high education and intellectual work were protecting factors.The transition probability from moderate/severe cognitive impairment to AD may increase as follow-up time extending.ConclusionPiecewise constant intensities Markov model is an effective analysis method to the data when the Markov assumption was satisfied and the time-homogeneous assumption was not for related factors analysis and variation pattern during disease progressive process.
Multistate model;Non-homogeneous Markov model;Piecewise constant intensities Markov model;Mild cognitive impairment;Alzheimer′s disease
國家自然科學(xué)基金資助項目(81373106)
△通信作者:余紅梅,Email:yu_hongmei@hotmail.com