唐文清 張敏強(qiáng) 黃憲 張嘉志 王旭
摘要:加速追蹤設(shè)計(jì)(ALD)是一種選擇相鄰多個(gè)群組同時(shí)進(jìn)行短期追蹤研究,獲得在測(cè)量上有重疊的多個(gè)群組追蹤數(shù)據(jù),對(duì)多個(gè)群組數(shù)據(jù)進(jìn)行合并建構(gòu)一條在時(shí)間跨度上較長(zhǎng)的發(fā)展趨勢(shì)或增長(zhǎng)曲線的方法。ALD結(jié)合真追蹤和橫斷設(shè)計(jì)的特征,既保持真追蹤設(shè)計(jì)的大部分優(yōu)點(diǎn),克服真追蹤研究中由于重測(cè)效應(yīng)和被試缺失導(dǎo)致的問(wèn)題,又嘗試分離年齡、群組和歷史時(shí)間效應(yīng),在發(fā)展心理研究有重要應(yīng)用。已有研究探討ALD的數(shù)據(jù)分析方法、ALD的有效性及設(shè)計(jì)特征。未來(lái)研究應(yīng)關(guān)注拓展設(shè)計(jì)條件下ALD的適應(yīng)性,探索非線性假設(shè)或群組效應(yīng)顯著時(shí)的數(shù)據(jù)分析方法和ALD中缺失數(shù)據(jù)處理問(wèn)題。
關(guān)鍵詞:追蹤研究:加速追蹤設(shè)計(jì);數(shù)據(jù)分析方法;設(shè)計(jì)特征
分類號(hào):B841
1、問(wèn)題提出
心理學(xué)研究中常采用橫斷設(shè)計(jì)和追蹤設(shè)計(jì)方法研究心理與行為發(fā)展變化過(guò)程及影響因素。橫斷設(shè)計(jì)(cross,sectional design,CSD)同時(shí)收集不同年齡群組(cohort)被試的數(shù)據(jù),通過(guò)比較不同群組的差異,鑒別個(gè)體心理發(fā)展的某些方面是否與年齡有關(guān)。橫斷研究可快速得到研究結(jié)果,有較高時(shí)效性,但面臨群組效應(yīng)(cohort effect,也叫朋輩效應(yīng))與年齡效應(yīng)(aging effect)的混淆,不能真正提供關(guān)于個(gè)體發(fā)展過(guò)程的信息,通過(guò)橫斷研究描述個(gè)體的心理發(fā)展過(guò)程有很大局限(Bell,1953;Hofer,Thorvaldsson,&Piccinin,2012;Stanger&Verhulst,1995)。
追蹤設(shè)計(jì)是在一段時(shí)間內(nèi)對(duì)研究對(duì)象進(jìn)行多次測(cè)量,描述心理與行為發(fā)展變化的方法。廣義的追蹤設(shè)計(jì)(10ngitudinal design)包含多種類型,但“真正的追蹤研究”是指“預(yù)期的追蹤研究”(劉紅云,張雷,2005),也叫固定樣本追蹤設(shè)計(jì)或真追蹤設(shè)計(jì)(trile longitudinal design,TLD)(Moerbeek,2011)。TLD在一段時(shí)間內(nèi)對(duì)同一組被試的心理特質(zhì)進(jìn)行反復(fù)觀測(cè),獲得長(zhǎng)時(shí)追蹤數(shù)據(jù),相比CSD,TLD可直接研究心理與行為的變化過(guò)程,分析個(gè)體隨時(shí)間變化在發(fā)展水平、變化速度的差異,鑒別導(dǎo)致不同結(jié)果的影響因素(Bell,1953;Duncan&Duncan,2012;Hofer et al.,2012),在發(fā)展心理研究中有越來(lái)越廣泛應(yīng)用。但TLD要求長(zhǎng)時(shí)間對(duì)一組被試進(jìn)行追蹤研究,經(jīng)濟(jì)消耗大,面臨嚴(yán)重的被試缺失、重測(cè)效應(yīng)及研究結(jié)果過(guò)時(shí)等問(wèn)題,影響研究結(jié)果的有效性。TLD只對(duì)一組被試進(jìn)行追蹤研究,難以確定心理與行為的變化是由自身發(fā)展成熟引起,還是由不同測(cè)量時(shí)間下的歷史、文化因素引起,即年齡和歷史時(shí)間效應(yīng)(period effect)的混淆(Duncan&Duncan,2012;Duncan,Duncan,&Hops,1996;Duncan,Duncan,&Strycker,2006a)。TLD在實(shí)際應(yīng)用中也常受到被試和時(shí)間等研究條件的限制而不能順利實(shí)施(Bell,1953,1954)。
由于CSD和TLD在發(fā)展心理研究應(yīng)用的局限,在很長(zhǎng)一段時(shí)間內(nèi),研究者都在尋找一種既可保持CSD和TLD的優(yōu)點(diǎn),又可減少CSD和TLD局限的方法。針對(duì)此問(wèn)題,Bell(1953)最早提出結(jié)合了CSD和TLD特點(diǎn)的收斂設(shè)計(jì)(convergence design),認(rèn)為同時(shí)對(duì)多個(gè)橫斷群組進(jìn)行追蹤研究,連接多個(gè)群組數(shù)據(jù)獲得近似TLD的研究結(jié)果,可很大程度克服CSD和TLD在發(fā)展心理研究應(yīng)用的局限,并在研究中初步證實(shí)通過(guò)收斂設(shè)計(jì)獲得近似TLD結(jié)果的有效性。加速追蹤設(shè)計(jì)(accelerated longitudinal design,ALD)是在收斂設(shè)計(jì)思想的基礎(chǔ)上發(fā)展起來(lái)。
文章將在闡述ALD的概念及優(yōu)點(diǎn)的基礎(chǔ)上,重點(diǎn)闡述ALD的數(shù)據(jù)分析方法、ALD的方法研究和應(yīng)用現(xiàn)狀,討論ALD方法及相關(guān)研究存在的問(wèn)題,提出進(jìn)一步的研究方向。
2、ALD方法的概述
收斂設(shè)計(jì)思想提出后,許多研究者對(duì)這種方法的特征、有效性及應(yīng)用作了充分論述(Nesselroade&BaRes,1979;Schaie,1965),并在數(shù)據(jù)分析方法研究方面取得重要成果,促進(jìn)了這種研究設(shè)計(jì)的發(fā)展(Duncan et al.,1996;Duncan,Duncan,&Hops,1 994;Raudenbush&Chan,1992,1993)。為體現(xiàn)收斂設(shè)計(jì)對(duì)CSD和TLD特點(diǎn)的結(jié)合,并與TLD相區(qū)別,把這種方法稱作加速追蹤設(shè)計(jì)(ALD)(Tonry,Ohlin,&Farrington,1991;Duncan et al.,1996),或群組序列設(shè)計(jì)(cohort-sequential design)(Nesselroade&Baltes,1979;Schaie,1965),也叫混合縱向設(shè)計(jì)(mixedlongitudinal design)(Berger,1986;Jang,2011),把TLD稱作真追蹤研究(true longitudinal study)(Duncan et al.,1996)或純追蹤研究(purelongitudinal study)(Jang,2011)。綜上所述,ALD是選擇相鄰多個(gè)群組同時(shí)進(jìn)行短期的追蹤研究,獲得在測(cè)量上有重疊的多個(gè)群組追蹤數(shù)據(jù),對(duì)多個(gè)數(shù)據(jù)的連接和合并建構(gòu)一條時(shí)間跨度較長(zhǎng)的發(fā)展趨勢(shì)或增長(zhǎng)曲線的方法。
ALD同時(shí)納入群組變量、年齡相關(guān)變量、測(cè)量次數(shù)和測(cè)量重疊度變量,有3個(gè)重要特征(如圖1是一個(gè)對(duì)3個(gè)年齡群組同時(shí)進(jìn)行6次測(cè)量,測(cè)量重疊為3次的ALD研究)。首先,ALD納入一個(gè)橫向的群組變量作為較高級(jí)的分組變量,群組間依次相鄰,每個(gè)群組包含一定樣本量被試,群組間樣本量可不同,同一時(shí)間測(cè)量可獲得橫斷數(shù)據(jù)(見(jiàn)圖1中群組和被試欄)。第二,納入縱向的年齡相關(guān)變量(如年齡、年級(jí))和測(cè)量次數(shù)變量(如圖1中橫軸表示年齡,每行的實(shí)線單元格數(shù)表示測(cè)量次數(shù),方格中的數(shù)據(jù)表示測(cè)量時(shí)間點(diǎn),虛線單元格表示該群組被試未被測(cè)量的時(shí)間點(diǎn)),對(duì)多個(gè)群組同時(shí)追蹤研究,可獲得多個(gè)群組追蹤數(shù)據(jù)。第三,納入測(cè)量重疊度變量,相鄰群組的相同年齡在測(cè)量上有一定程度重疊(圖l中,群組1的第4、5、6次測(cè)量與群組2的第l、2、3次測(cè)量重疊,即被試年齡相同),使不同群組追蹤數(shù)據(jù)可連接。ALD結(jié)合橫斷研究(選擇多個(gè)年齡群組)和縱向研究(每個(gè)群組都進(jìn)行追蹤研究)的特點(diǎn),具有單獨(dú)實(shí)施CSD和TLD研究所無(wú)法比擬的優(yōu)點(diǎn)。
首先,與TLD相比,ALD對(duì)多個(gè)群組同時(shí)進(jìn)行追蹤研究顯著縮短數(shù)據(jù)收集持續(xù)時(shí)間,較快獲得研究結(jié)果,提高研究的時(shí)效性和有效性。TLD選取單一樣本進(jìn)行長(zhǎng)時(shí)追蹤研究,面臨選擇特殊群體的危險(xiǎn),容易導(dǎo)致嚴(yán)重的被試缺失和研究結(jié)果不具時(shí)代性,導(dǎo)致無(wú)效的研究結(jié)果(Watt,2008)。而ALD同時(shí)對(duì)多個(gè)群組進(jìn)行追蹤研究,通過(guò)較短的時(shí)間追蹤就可獲得較長(zhǎng)時(shí)問(wèn)跨度的追蹤數(shù)據(jù)(如圖1中,6次測(cè)量的ALD研究可獲得12次測(cè)量的追蹤數(shù)據(jù)),顯著縮短時(shí)間,減少經(jīng)濟(jì)支出和被試缺失,保證研究過(guò)程的組織和控制(Baer&Schmitz,2000;Duncan et al.,1 996;Raudenbush&Chan,1993),降低學(xué)習(xí)、疲勞、測(cè)量材料解釋變化等重測(cè)效應(yīng)(Hertzog&Nesselroade,2003)。當(dāng)要進(jìn)行長(zhǎng)時(shí)間追蹤研究時(shí)(如10年),運(yùn)用ALD具有更好的時(shí)效性和有效性。
其次,ALD在發(fā)展心理研究中可相對(duì)獨(dú)立地分析群組效應(yīng)、年齡效應(yīng)和歷史時(shí)間效應(yīng),部分解決了CSD和TLD研究中的效應(yīng)混淆問(wèn)題。發(fā)展心理研究中,基于CSD的研究混淆了年齡效應(yīng)和群組效應(yīng),基于TLD的研究混淆了年齡效應(yīng)和歷史時(shí)間效應(yīng)(Duncan&Duncan,2012;Schaie,1986),要從研究中推論關(guān)于個(gè)體發(fā)展的有效結(jié)論,必須對(duì)三種效應(yīng)進(jìn)行分離。ALD同時(shí)納入群組、年齡、測(cè)量時(shí)間和測(cè)量重疊度變量,研究過(guò)程既可分析橫向特征和縱向發(fā)展,也可比較不同群組的相同年齡被試的差異來(lái)評(píng)估群組效應(yīng),通過(guò)橫向比較和縱向比較確定年齡效應(yīng),從而相對(duì)獨(dú)立地評(píng)估年齡效應(yīng)、群組效應(yīng)和歷史時(shí)間效應(yīng),得出關(guān)于個(gè)體發(fā)展的有效結(jié)論(Baltes,Baltes,&Reinert,1970;Baltes&Nesselroade,1970,1972)。
最后,ALD同時(shí)選擇多個(gè)年齡群組進(jìn)行短期追蹤研究,可獲得更多的關(guān)于各年齡群組的心理與行為的發(fā)展信息,提高研究結(jié)果的一般信度(Hertzog&Nesselroade,2003),在大型發(fā)展心理研究中尤其重要。
3、加速追蹤數(shù)據(jù)分析方法
ALD優(yōu)點(diǎn)之一是克服TLD的局限,通過(guò)ALD研究獲得近似TLD的結(jié)果。對(duì)ALD的數(shù)據(jù)進(jìn)行TLD推論的前提是不同群組的數(shù)據(jù)是收斂的(convergent),即不同群組的相同年齡被試的發(fā)展具有相同的水平和相似形態(tài),用一條共同的線型就可表達(dá)多個(gè)群組的發(fā)展過(guò)程。因此,對(duì)加速追蹤數(shù)據(jù)分析時(shí)要檢驗(yàn)群組間追蹤數(shù)據(jù)是否收斂(Anderson,1993,1995;Duncan et al.,1996;Miyazaki&Raudenbush,2000;Tildesley&Andrews,2008)。Bell(1953,1954)通過(guò)分析重疊測(cè)量年齡組的均值和變化的速度差異來(lái)檢驗(yàn)加速追蹤數(shù)據(jù)是否收斂,運(yùn)用方差分析對(duì)加速追蹤數(shù)據(jù)進(jìn)行分析?;貧w分析也被用于分析加速追蹤數(shù)據(jù)(Harezlak,Ryan,Giedd,&Lange,2005;Tang&Orwin,20091,但未考慮到加速追蹤數(shù)據(jù)的特征。統(tǒng)計(jì)方法的發(fā)展使基于結(jié)構(gòu)方程的潛變量增長(zhǎng)曲線模型(latent growth curve model,LGM)(Duncan,Duncan,&Strycker,2006b;McArdle&Anderson,1990;McArdle&Hamagami,1992)和階層線性模型(hierarchical linear model,HLM)(Bryk&Raudenbush,1992;Miyazaki&Raudenbush,2000)用于分析加速追蹤數(shù)據(jù),在檢驗(yàn)群組數(shù)據(jù)收斂性的同時(shí)分析發(fā)展過(guò)程的整體水平和個(gè)體差異。
3.1 LGM對(duì)加速追蹤數(shù)據(jù)的分析
LGM結(jié)合多變量方差分析和結(jié)構(gòu)方程的特點(diǎn),用類似驗(yàn)證性因素分析的方法定義潛變量,用時(shí)間函數(shù)確定因子載荷,通過(guò)兩個(gè)潛變量來(lái)描述增長(zhǎng)趨勢(shì)和變化特征(劉紅云,張雷,2005;Baer&Schmitz,2000;McArdle&Anderson,1990)。其中,截距因子是測(cè)量時(shí)間WO時(shí),因變量的取值,截距的均值和方差分別描述個(gè)體在t=0時(shí)的整體均值及個(gè)體差異;斜率因子表示個(gè)體的變化速度,斜率的均值和方差分別描述整體變化速度和個(gè)體差異?;灸P偷臄?shù)學(xué)表達(dá)式:
yti=βoi+βIiTti+εti(1)
t為重復(fù)測(cè)量次數(shù),t=1,2,3……T;i=1,2,3……n,yti表示第i個(gè)被試第t個(gè)時(shí)間點(diǎn)的測(cè)量結(jié)果,βoi、βIi分別表示截距和斜率,Tti為時(shí)間變量相關(guān)的函數(shù),εti為誤差。
McArdle和Anderson(1 990)較早運(yùn)用LGM分析加速追蹤數(shù)據(jù),Anderson,Baer和Duncan等通過(guò)一系列研究證實(shí)LGM分析加速追蹤數(shù)據(jù)的適宜性(Anderson,1993,1995;Baer&Schmitz,2000;Duncan et al.,1994,1996,2006b)。LGM對(duì)加速追蹤數(shù)據(jù)的分析是對(duì)不同群組分別定義增長(zhǎng)模型,通過(guò)限定不同群組發(fā)展趨勢(shì)相同來(lái)解決群組間發(fā)展是否存在差異及個(gè)體隨時(shí)間的發(fā)展趨勢(shì)問(wèn)題。如Duncan等(2006a)運(yùn)用LGM對(duì)9、11、13歲群組的青少年酒精使用的加速追蹤數(shù)據(jù)進(jìn)行分析,研究9-16歲青少年酒精使用的發(fā)展特征(見(jiàn)圖2)。圖2中截距因子載荷限定為1,不同群組的相同年齡在斜率因子的時(shí)間載荷定義為相等,限定不同群組發(fā)展趨勢(shì)相同,并隨年齡呈線性增長(zhǎng)。數(shù)學(xué)表達(dá)式:
Y(t,n=Mi(n)+L(t)Ms(n)+E(t,n) (2)
其中Y(t,n)表示第n個(gè)被試第t個(gè)時(shí)間點(diǎn)的測(cè)量值;Mi(n)是截距,Ms(n)是斜率,E(t,n)為誤差,L(t)是把變量Y與時(shí)間T聯(lián)系起來(lái)的數(shù)學(xué)函數(shù),若假設(shè)變化為線性函數(shù),則每個(gè)群組在四個(gè)時(shí)間點(diǎn)的測(cè)量值表達(dá)式分別為(以第一、第二群組為例):
第一群組:
y(1)=Mi+0Ms+E(t)
y(2)=Mi+1Ms+E(t)
y(3)=Mi+2Ms+E(t)
y(4)=Mi+3Ms+E(t)
第二群組:
y(2)=Mi+1Ms+E(t)
y(3)=Mi+2Ms+E(t)
y(4)=Mi+3Ms+E(t)
y(5)=Mi+4Ms+E(t)……
上述模型只簡(jiǎn)單定義了線性增長(zhǎng)模型,在實(shí)際研究中,可不固定斜率因子的載荷,運(yùn)用不定義LGM對(duì)數(shù)據(jù)進(jìn)行擬合,估計(jì)各時(shí)間點(diǎn)觀測(cè)變量對(duì)斜率因子的載荷,描述發(fā)展趨勢(shì)(如Duncanet al.,1996)。
根據(jù)已有研究(Anderson,1993;Baer&Schmitz,2000;Duncan&Duncan,20 12;Duncan etal.,1994,1996,2006a,2006b;劉紅云,張雷,2005),LGM分析加速追蹤數(shù)據(jù)時(shí)(以定義LGM為例),首先對(duì)不同群組分別建立和定義模型,限定不同群組發(fā)展趨勢(shì)相同來(lái)驗(yàn)證數(shù)據(jù)的收斂性;釋放限制模型中的某些限制條件(如群組條件),采用拉格朗日乘數(shù)(1agrange multipliers,LM)檢驗(yàn)釋放限制條件是否可顯著提高模型的擬合度(Duncan et al.,2006b);根據(jù)模型擬合度及LM檢驗(yàn)值選擇模型;最后考察斜率、截距及其均值和方差,分析發(fā)展趨勢(shì)及個(gè)體差異等特點(diǎn)。
LGM運(yùn)用潛變量描述和解釋發(fā)展趨勢(shì)和變化的個(gè)體差異,通過(guò)建模定義和探討變量之間的關(guān)系,在模型上具有很大的靈活性,廣泛應(yīng)用于加速追蹤研究的數(shù)據(jù)分析(De Haan,Prinzie,&Dekovi6,2010;Duncan,Duncan,StryckeL&Chaumeton,2007;King,Molina,&Chassin,2009;Kofler et al.,2011)。但LGM分析加速追蹤數(shù)據(jù)的適應(yīng)性是基于平衡設(shè)計(jì)的假設(shè),若ALD在研究應(yīng)用中的測(cè)量間隔或測(cè)量次數(shù)不等,或研究中要考驗(yàn)時(shí)間變化變量(time-vary variable)對(duì)發(fā)展的影響時(shí),LGM不適用(Duncan&Duncan,1995;Miyazaki&Raudenbush,2000)。
3.2 HLM對(duì)加速追蹤數(shù)據(jù)的分析
HLM把追蹤數(shù)據(jù)看成具有嵌套結(jié)構(gòu)的數(shù)據(jù),即重復(fù)測(cè)量嵌套于個(gè)體,個(gè)體嵌套于群體。HLM可同時(shí)分析個(gè)體發(fā)展趨勢(shì)和變化的個(gè)體差異,直接處理測(cè)量間隔或測(cè)量次數(shù)不等的追蹤數(shù)據(jù),靈活處理追蹤數(shù)據(jù)中的缺失問(wèn)題,適用于分析加速追蹤數(shù)據(jù)。當(dāng)加速追蹤研究中納入時(shí)間變化變量,HLM比LGM可更好地分析發(fā)展變化的問(wèn)題(Miyazaki&Raudenbush,2000;Raudenbush,Brennan,&Barnett,1995)。Raudenbush和Chan(1992)首先運(yùn)用HLM分析加速追蹤數(shù)據(jù);Miyazaki和Raudenbush(2000)詳細(xì)闡述了HLM分析加速追蹤數(shù)據(jù)的原理和過(guò)程;Watt(2004,2008)及Gerstorf,Ram,Hoppmann,Willis和Schaie(2011)在加速追蹤研究中采用HLM分析數(shù)據(jù)。Moerbeek(2011)系統(tǒng)探討HLM框架下加速追蹤研究的統(tǒng)計(jì)功效問(wèn)題,進(jìn)一步證實(shí)HLM分析加速追蹤數(shù)據(jù)的適宜性。
根據(jù)相關(guān)研究fMiyazaki&Raudenbush,2000;Moerbeek,2011;Raudenbush&Chan,1992,1993:Watt,2004,2008),HLM分析加速追蹤數(shù)據(jù)的基本假設(shè)是簡(jiǎn)化模型(不納人群組效應(yīng))嵌套于全模型(納入群組效應(yīng))。以2HLM下極大似然(maximumlikelihood)方法為例說(shuō)明具體步驟。首先,建立全模型并估計(jì)參數(shù),其中第二水平包含群組變量(見(jiàn)公式3-5)。第二步,建立簡(jiǎn)化模型并估計(jì)參數(shù)(見(jiàn)公式6-8)。第三步,建構(gòu)似然比檢驗(yàn)(likelihoodratio test,LR檢驗(yàn)),通過(guò)比較兩個(gè)模型擬合差異統(tǒng)計(jì)量選擇模型,判斷數(shù)據(jù)是否收斂(LR檢驗(yàn):S=D1-D0,D1為全模型的擬合差異統(tǒng)計(jì)量,D0為簡(jiǎn)化模型的擬合差異統(tǒng)計(jì)量)。其中S服從自由度為單獨(dú)施于簡(jiǎn)化模型的限制參數(shù)個(gè)數(shù)的卡方分布(n為大樣本),若S大于臨界值,拒絕原假設(shè)關(guān)于簡(jiǎn)化模型可較好表達(dá)加速追蹤數(shù)據(jù)的特征,反之,接受原假設(shè),加速追蹤數(shù)據(jù)收斂,可用一條共同的線型表述多個(gè)群組的發(fā)展趨勢(shì)。
全模型:
第一水平:yti=π0i+π1iTti+εti(3)
第二水平:π0i=β00+β01zi+μ0i(4)
π1i=β10+β11zi+μ1i(5)
其中zi為群組效應(yīng)的變量。
簡(jiǎn)化模型:
第一水平:yti=π0i+π1iTti+εti(6)