王家偉 韓耀風(fēng) 方 亞
廈門大學(xué)公共衛(wèi)生學(xué)院(361002)
【提 要】 在醫(yī)學(xué)研究中常借助潛變量增長(zhǎng)曲線(LGC)等模型分析縱向量表資料,但存在數(shù)據(jù)信息利用不充分、難以反映研究對(duì)象真實(shí)潛在特質(zhì)水平等不足??v向項(xiàng)目反應(yīng)理論(LIRT)模型是近年來提出的研究潛在特質(zhì)動(dòng)態(tài)變化的一種方法,它在縱向量表資料分析中具有一些獨(dú)特優(yōu)勢(shì)。本文對(duì)LIRT模型理論、軟件實(shí)現(xiàn)及其在醫(yī)學(xué)研究中的應(yīng)用進(jìn)行綜述,為醫(yī)學(xué)研究中縱向量表資料分析提供參考,以精準(zhǔn)評(píng)估研究對(duì)象各時(shí)點(diǎn)的潛在特質(zhì)動(dòng)態(tài)變化規(guī)律。
隨著醫(yī)學(xué)模式向生物-心理-社會(huì)模式轉(zhuǎn)變,醫(yī)學(xué)研究者對(duì)人體多維健康(生理、心理及社會(huì)適應(yīng))動(dòng)態(tài)變化規(guī)律的關(guān)注日益提高,縱向健康量表資料的分析需求隨之增加[1]。在分析縱向健康量表資料時(shí),常用潛變量增長(zhǎng)曲線(latent growth curve,LGC)模型,探究研究對(duì)象潛在特質(zhì)隨時(shí)間的動(dòng)態(tài)變化軌跡,但卻忽略了難度等項(xiàng)目因素對(duì)測(cè)量結(jié)果的影響,難以準(zhǔn)確測(cè)量研究對(duì)象各時(shí)點(diǎn)潛在特質(zhì)水平[2]?,F(xiàn)代測(cè)量理論中的項(xiàng)目反應(yīng)理論(item response theory,IRT)模型將被試者潛在特質(zhì)與項(xiàng)目難度置于同一尺度測(cè)量,既可準(zhǔn)確測(cè)量被試者潛在特質(zhì),也可以增加橫向資料的可比性,被逐漸應(yīng)用到醫(yī)學(xué)研究中[2]。
Conway于1990年提出的縱向項(xiàng)目反應(yīng)理論(longitudinal item response theory,LIRT)Rasch模型結(jié)合了IRT和LGC模型優(yōu)勢(shì),從量表項(xiàng)目水平出發(fā),既考慮到難度、區(qū)分度等項(xiàng)目因素對(duì)測(cè)量結(jié)果的影響,也可探究被試者潛在特質(zhì)隨時(shí)間的動(dòng)態(tài)變化規(guī)律,在醫(yī)學(xué)研究中的應(yīng)用愈加廣泛[3-13]。為進(jìn)一步推廣LIRT模型在醫(yī)學(xué)研究中的應(yīng)用,提高縱向健康量表的測(cè)量效能,精準(zhǔn)評(píng)估被試者不同年齡、時(shí)點(diǎn)的多維健康水平,本文在簡(jiǎn)要介紹IRT的基本原理及特點(diǎn)的基礎(chǔ)上,介紹常用的LIRT模型及其在醫(yī)學(xué)研究中的應(yīng)用進(jìn)展。
IRT早期主要用于教育和心理測(cè)量領(lǐng)域,其核心思想是從項(xiàng)目水平出發(fā),構(gòu)建被試者對(duì)各個(gè)項(xiàng)目作答與其潛在特質(zhì)、項(xiàng)目難度及區(qū)分度等參數(shù)的函數(shù)關(guān)系,從而評(píng)估被試者的潛在特質(zhì)水平以及量表的測(cè)量效能[14]。
相比經(jīng)典測(cè)量理論(classical test theory,CTT)對(duì)量表?xiàng)l目簡(jiǎn)單等權(quán)線性累加的計(jì)分方式,IRT模型充分利用了被試者所有的作答信息,將被試者潛在特質(zhì)和項(xiàng)目難度置于同一標(biāo)尺進(jìn)行測(cè)量和比較,既利于不同特征被試者的橫向比較,又能夠更準(zhǔn)確地估計(jì)量表及各個(gè)項(xiàng)目的測(cè)量誤差[15]。此外,IRT無需滿足CTT的正態(tài)性和平行測(cè)試假設(shè),可分析健康量表資料中呈偏態(tài)分布、含有離群值或缺失值的數(shù)據(jù)[8,11]。但另一方面,IRT模型仍需滿足局部獨(dú)立性、單維性和個(gè)體作答行為真實(shí)性等假設(shè),以保持模型結(jié)果的穩(wěn)定性[15]。
近年來,IRT模型在項(xiàng)目參數(shù)、潛在特質(zhì)維度及項(xiàng)目類別等方面不斷拓展,突破了模型提出之初的局部獨(dú)立性(條目間、被試者間)和單維性(單一潛在特質(zhì))等假設(shè),如分析多水平量表資料的多水平項(xiàng)目反應(yīng)理論模型(multilevel item response theory model,MLIRT)[16-17],分析多維量表資料的多維項(xiàng)目反應(yīng)理論模型(multidimension item response theory model,MIRT)[18-19],以及分析縱向量表資料的LIRT模型等[20-22]。
LIRT模型作為IRT模型族在時(shí)間維度的拓展,其核心思想是將IRT與LGC模型結(jié)合,從項(xiàng)目水平出發(fā),測(cè)量被試者各時(shí)點(diǎn)潛在特質(zhì)水平的同時(shí),探究潛在特質(zhì)隨時(shí)間的變化趨勢(shì)及軌跡[22]。
縱向單維項(xiàng)目反應(yīng)理論(longitudinal unidimensional item response theory,L-UIRT)模型是最基礎(chǔ)、最常用的LIRT模型,該模型適用于僅有一個(gè)主要潛在特質(zhì)隨時(shí)間變化的縱向量表資料。一般采用兩步法(two-step method)建模。
(1)擬合時(shí)間特異性單維項(xiàng)目反應(yīng)理論模型
根據(jù)量表資料類型,采用logit、probit及studentt等鏈接函數(shù)構(gòu)建L-UIRT模型,估計(jì)被試者潛在特質(zhì)。以二分類資料為例,構(gòu)建二分類兩參數(shù)logistic L-UIRT模型,假定樣本量為N,i(i=1,2,…,N)為樣本中的個(gè)體,t(t=1,2,…,T)為重復(fù)測(cè)量的時(shí)點(diǎn),j(j=1,2,…,P)為作答的項(xiàng)目,則樣本共有N×P×T個(gè)重復(fù)測(cè)量值。此時(shí)L-UIRT模型可表示為公式(1)。
(1)
(2)擬合個(gè)體特異性潛變量增長(zhǎng)曲線模型
基于第一步構(gòu)建模型,建立關(guān)于θ的LGC模型,其一般形式可寫做公式(2)。
θi=Xβ+Zvi+δi
(2)
(3)
圖1 L-UIRT分析路徑圖
根據(jù)量表測(cè)量維度及層次關(guān)系不同,LIRT模型可分為單維、多維和高階LIRT模型。L-UIRT模型適用于分析量表中所有項(xiàng)目反應(yīng)僅受被試者單一的潛在特質(zhì)影響,且僅此單一潛在特質(zhì)隨時(shí)間變化的研究資料;縱向多維項(xiàng)目反應(yīng)理論(longitudinal multidimension item response theory,L-MIRT)模型是在L-UIRT模型的基礎(chǔ)上,在潛在特質(zhì)測(cè)量維度上的拓展,適用于分析量表項(xiàng)目反應(yīng)受被試者多個(gè)相關(guān)的潛在特質(zhì)影響,且多個(gè)相關(guān)潛在特質(zhì)均隨時(shí)間變化的研究資料[23];而縱向高階項(xiàng)目反應(yīng)理論(longitudinal higher order item response theory,L-HO-IRT)模型是在L-MIRT模型的基礎(chǔ)上,與結(jié)構(gòu)方程模型(structural equation modeling,SEM)結(jié)合,能夠捕捉多階潛在特質(zhì)的層次關(guān)系、低階潛在特質(zhì)與對(duì)應(yīng)項(xiàng)目反應(yīng)的概率關(guān)系等[24]。如老年人認(rèn)知測(cè)量中,L-HO-IRT模型能夠測(cè)量老年人總體認(rèn)知能力和低階潛在特質(zhì)(語言力、計(jì)算力及記憶力等)的層次關(guān)系,同時(shí)能夠測(cè)量各低階潛在特質(zhì)與對(duì)應(yīng)項(xiàng)目反應(yīng)間的概率關(guān)系。
值得注意的是,模型的選擇應(yīng)結(jié)合量表設(shè)計(jì)的測(cè)量維度,鑒別研究數(shù)據(jù)中潛在特質(zhì)的維度以及不同維度潛在特質(zhì)間是否存在層次結(jié)構(gòu)。
總體來說,相較于常用的潛變量測(cè)量模型——LGC模型、SEM和多水平統(tǒng)計(jì)模型而言,LIRT模型具有以下優(yōu)勢(shì):(1)包含了縱向量表資料的因子結(jié)構(gòu),可用于分析單維、多維及分層的縱向量表資料[24];(2)通過非結(jié)構(gòu)化協(xié)方差矩陣或潛變量增長(zhǎng)曲線的非線性/線性變化模型,假設(shè)鏈接項(xiàng)目未發(fā)生項(xiàng)目參數(shù)漂移,保證縱向數(shù)據(jù)的測(cè)量不變性的同時(shí),還可捕捉潛在特質(zhì)隨時(shí)間變化的趨勢(shì)及軌跡[22,25];(3)將猜測(cè)參數(shù)結(jié)合到模型中,可解釋低水平潛在特質(zhì)者也有一定概率正確作答的情況[26];(4)在分析含有缺失值、呈偏態(tài)分布縱向量表資料時(shí),能夠保持結(jié)果的穩(wěn)定性,具有較好的時(shí)間測(cè)量效能,能夠較好地應(yīng)用于流行病學(xué)調(diào)查和臨床研究中[27]。
貝葉斯方法軟件(如WinBUGS、OpenBUGS、JAGS和Stan)、主流統(tǒng)計(jì)軟件(如R)和SEM軟件(如Mplus)均可實(shí)現(xiàn)LIRT模型構(gòu)建,三類統(tǒng)計(jì)軟件實(shí)現(xiàn)LIRT模型擬合的特點(diǎn)詳見表1。
表1 實(shí)現(xiàn)縱向項(xiàng)目反應(yīng)理論模型擬合的三類統(tǒng)計(jì)軟件
目前LIRT模型在醫(yī)學(xué)研究中的應(yīng)用,主要有縱向健康評(píng)價(jià)研究,縱向健康量表的研制、優(yōu)化和驗(yàn)證等。
主要從生理健康、心理健康及健康相關(guān)生命質(zhì)量方面簡(jiǎn)要介紹LIRT模型在縱向健康評(píng)價(jià)研究中的應(yīng)用現(xiàn)狀。
在生理健康領(lǐng)域,LIRT模型主要用于測(cè)量帕金森氏病(Parkinson disease,PD)、失能、疼痛、聽力損傷等進(jìn)行性軀體功能障礙性疾病或病理狀態(tài)的研究中[9,27,29]。Gottipati等基于LIRT模型通過國(guó)際運(yùn)動(dòng)障礙協(xié)會(huì)帕金森氏病評(píng)分量表(movement disorder society unified Parkinson′s disease rating scale,MDS-UPDRS)測(cè)量PD患者在個(gè)體及項(xiàng)目水平上隨時(shí)間變化軀體功能受損程度,發(fā)現(xiàn)PD患者功能較好一側(cè)的軀體功能較患側(cè)惡化速度更快[29]。Edjolo等通過LIRT模型探索老年人日常生活自理能力的層次關(guān)系,發(fā)現(xiàn)出現(xiàn)完全依賴的次序由易到難依次為洗澡、穿衣、大小便自控能力、吃飯、上廁所及室內(nèi)移動(dòng),并發(fā)現(xiàn)老年人存在4類日常生活自理能力變化軌跡[30]。
在心理健康領(lǐng)域,LIRT模型被應(yīng)用于抑郁、焦慮、認(rèn)知等心理疾病或問題的測(cè)量[10-11,31]。Chan等在量表?xiàng)l目數(shù)量與組合均不一致的情況下,利用LIRT模型比較不同文化、經(jīng)濟(jì)背景下的老年人認(rèn)知狀況,發(fā)現(xiàn)美國(guó)健康與退休研究老年人相較于英國(guó)縱向老齡研究老年人認(rèn)知水平更低[7]。Krekels等通過LIRT模型比較安慰劑與帕里哌酮對(duì)精神分裂癥患者陽性和陰性綜合征量表(positive and negative syndrome scale,PANSS)評(píng)分的影響,發(fā)現(xiàn)模型能夠較好地反映患者PANSS各項(xiàng)目、分量表及個(gè)體水平治療效果隨時(shí)間的變化[32]。
健康相關(guān)生命質(zhì)量,作為個(gè)體生理與心理健康的綜合健康指標(biāo),能夠較好地反映研究對(duì)象綜合生命質(zhì)量。有研究顯示,被試者對(duì)于生命質(zhì)量的理解,可能因健康狀況的好轉(zhuǎn)或惡化發(fā)生改變,從而導(dǎo)致自報(bào)告生命質(zhì)量縱向可比性較差,這種現(xiàn)象被稱為反應(yīng)轉(zhuǎn)移(response shift,RS)[33]。王旭霞等通過LIRT模型評(píng)估老年阿爾茨海默癥(Alzheimer′s disease,AD)患者入院前與出院后一個(gè)月的生命質(zhì)量,發(fā)現(xiàn)老年AD患者對(duì)量表項(xiàng)目的內(nèi)在評(píng)價(jià)和價(jià)值觀標(biāo)準(zhǔn)發(fā)生了反應(yīng)轉(zhuǎn)移,提示在評(píng)價(jià)住院治療對(duì)老年AD患者生命質(zhì)量的影響時(shí),應(yīng)考慮反應(yīng)轉(zhuǎn)移現(xiàn)象[34]。而許曉茜等的研究顯示,相比SEM,LIRT能夠更好地測(cè)量這種反應(yīng)轉(zhuǎn)移現(xiàn)象[3]。故而建議在評(píng)估干預(yù)措施和社會(huì)人口學(xué)特征等因素對(duì)生命質(zhì)量的影響時(shí),可采用LIRT模型識(shí)別這種反應(yīng)轉(zhuǎn)移現(xiàn)象,排除因反應(yīng)轉(zhuǎn)移而引入的測(cè)量誤差。
由于具有量表項(xiàng)目水平測(cè)量的優(yōu)勢(shì),LIRT模型也被用于各種縱向健康研究的量表研制、優(yōu)化和驗(yàn)證中[35]。通過比較項(xiàng)目特征參數(shù)、測(cè)量維度等,簡(jiǎn)化量表項(xiàng)目,避免現(xiàn)場(chǎng)研究中被試者因量表項(xiàng)目多、耗時(shí)長(zhǎng)等因素應(yīng)答率偏低,從而提高現(xiàn)場(chǎng)調(diào)查的應(yīng)答率和調(diào)查效率。
Arrington等通過LIRT模型簡(jiǎn)化MDS-UPDRS量表,基于真實(shí)數(shù)據(jù)比較,發(fā)現(xiàn)簡(jiǎn)化后量表的疾病進(jìn)展和藥物效應(yīng)方面的測(cè)量效能降低;基于模擬實(shí)驗(yàn)比較,發(fā)現(xiàn)簡(jiǎn)化后量表項(xiàng)目特征參數(shù)也發(fā)生了改變,提示MDS-UPDRS簡(jiǎn)表的測(cè)量效能低于原表,需謹(jǐn)慎使用[4,6]。有研究通過模擬實(shí)驗(yàn)也證明,LIRT模型在樣本量較小,但測(cè)量時(shí)點(diǎn)足夠的情況下,仍能較好地評(píng)價(jià)縱向量表工具的測(cè)量效能[35]。
在縱向健康評(píng)估時(shí),由于量表中各項(xiàng)目間難度、區(qū)分度存在差異,各測(cè)量時(shí)點(diǎn)間項(xiàng)目反應(yīng)存在時(shí)間依賴性,傳統(tǒng)的IRT模型及LGC模型不再適用。LIRT模型不僅能夠較好地測(cè)量各時(shí)點(diǎn)被試者健康水平及項(xiàng)目反應(yīng)轉(zhuǎn)移的情況,識(shí)別被試者健康水平隨時(shí)間的發(fā)展軌跡及其影響因素;同時(shí)可通過各時(shí)點(diǎn)量表項(xiàng)目特征參數(shù)(包括區(qū)分度、難度、猜測(cè)參數(shù)等)評(píng)估量表的測(cè)量效能。深入探討LIRT模型理論及在醫(yī)學(xué)研究中的應(yīng)用,有利于提高縱向健康量表的測(cè)量效能,精準(zhǔn)評(píng)估被試者不同年齡、時(shí)點(diǎn)的健康水平,為衛(wèi)生政策等的制定和實(shí)施提供科學(xué)依據(jù)。
在模型參數(shù)估計(jì)方面,伴隨著計(jì)算機(jī)算力和參數(shù)估計(jì)方法的提升,一定程度上減輕了模型參數(shù)估計(jì)的難度,但各種參數(shù)估計(jì)方法仍存在一些不足。如MCMC算法馬爾科夫鏈?zhǔn)諗克俾饰粗?通常需要5000次以上的迭代,運(yùn)算耗時(shí)較長(zhǎng)。希望未來研究聚焦于發(fā)展更簡(jiǎn)便、快速、易用的參數(shù)估計(jì)方法提高高維模型參數(shù)估計(jì)效率[36-41]。
最優(yōu)模型的選擇和模型輸出結(jié)果的可靠性檢驗(yàn)依賴于模型擬合檢驗(yàn)。雖然大多數(shù)的SEM軟件會(huì)自動(dòng)輸出如AIC、DIC等模型擬合參數(shù),但目前大部分的研究都尚未明確模型擬合參數(shù)的適宜界值。有研究也顯示W(wǎng)inBUGS等軟件自動(dòng)輸出的DIC并不能較好地反映模型擬合狀況[42]。杜文久等雖提出通過LP法(likelihood procedure)、正態(tài)擬合檢驗(yàn)法檢驗(yàn)?zāi)P蛿M合情況,為模型檢驗(yàn)提供新的思路,但仍存在一些問題[43-44]。希望未來的研究中,能夠提出更加有效、簡(jiǎn)便的LIRT模型擬合檢驗(yàn)評(píng)估體系。
中國(guó)衛(wèi)生統(tǒng)計(jì)2023年5期