劉 源 ,劉紅云
(1.北京師范大學(xué) 心理學(xué)院,北京 100875;2.香港中文大學(xué) 教育學(xué)院,香港 999077)
早在西漢時(shí)期,劉向在《戰(zhàn)國(guó)策·齊冊(cè)三》中就提出來(lái)的“物以類聚,人以群分”的思想傳承至今,對(duì)于總體分群的科學(xué)研究意義也在于此。當(dāng)然,并不是所有的分群都像性別、出生地那樣可以直接觀測(cè)或通過(guò)測(cè)驗(yàn)得到。由于觀測(cè)不到的異質(zhì)性,研究者需要考慮同一個(gè)樣本或總體中的潛在群體,這就是潛類別分析(LCA)的初衷,即根據(jù)一系列的觀測(cè)變量將被試分群。然而,對(duì)于LCA的基本假設(shè),其觀測(cè)變量和潛變量均是離散型數(shù)據(jù),這對(duì)于被試特性的描述信息不充分[1],阻礙了潛類別分析的進(jìn)一步發(fā)展。所以,潛變量量尺的拓展成為這類模型發(fā)展新的契機(jī)。
由于心理學(xué)所研究的個(gè)體特質(zhì)的復(fù)雜性,潛變量技術(shù)對(duì)數(shù)據(jù)類型的要求也變得復(fù)雜。在結(jié)構(gòu)方程模型、因素分析等潛變量技術(shù)下,其重要前提假設(shè)就是群體的同質(zhì)性。反映在因素分析里,則假設(shè)“因素”(潛變量)是連續(xù)變量,即潛變量屬于“尺”量表。如果潛變量的量尺不能用一個(gè)連續(xù)的特質(zhì)來(lái)解釋,比如人群中的“特質(zhì)類型”或者發(fā)展趨勢(shì)中發(fā)展曲線不同的組,潛變量是連續(xù)變量的假設(shè)就被推翻,即潛變量屬于“類”或“群”量表,需要用到另外的模型。潛變量也和觀測(cè)變量一樣,存在一個(gè)量尺。Masyn,Henderson 和 Greenbaum[2]提出的“尺類譜(DCS)”描述了潛變量的量尺。在這個(gè)譜系上,潛變量由完全的類別變量變化到完全的連續(xù)變量,不同的潛變量數(shù)字特征類型對(duì)應(yīng)了不同的分析方法。
潛變量量尺的拓展,使得潛類別模型的應(yīng)用迅速拓展。研究者在不知道潛變量數(shù)據(jù)類型假設(shè)的時(shí)候,可以通過(guò)模型比較的方法探索,以確定潛變量的類型。如果在這個(gè)譜系的“尺量表”端,則使用因素分析(FA)/項(xiàng)目反應(yīng)理論(RT),它們假設(shè)潛在特質(zhì)(如FA中的因素,IRT中的被試能力水平θ)是連續(xù)變量;而另一端為“類量表”,則使用LCA模型,它假設(shè)潛變量為類別變量,總體具有不同質(zhì)的特征。從“尺量表”過(guò)度到“類量表”,可以將潛變量看成其他混合型數(shù)據(jù),根據(jù)潛變量在譜系上的不同位置,還可以使用混合因素分析(FMA)、半?yún)?shù)因素分析(FA)、混合半?yún)?shù)因素分析等不同的技術(shù)(詳見(jiàn)表1)。
表1 潛變量分析技術(shù)
想要宏觀地把握潛類別模型分析的技術(shù),可以根據(jù)心理學(xué)的研究范式,從橫斷和追蹤研究?jī)蓚€(gè)方面去了解各個(gè)模型的使用條件。
2.1.1 因素分析中的分類
對(duì)潛變量量尺的拓展,極大的豐富了潛類別模型的應(yīng)用。所以,從這個(gè)角度出發(fā),LCA也可以看成是一種廣義的因素分析模型(如圖1所示)。假設(shè)觀測(cè)變量都是類別(或連續(xù))變量的情況下,LCA模型假設(shè)潛在因子是一個(gè)類別變量,在項(xiàng)目的反應(yīng)概率量尺上有不同的類別,類內(nèi)不存在變異;而IRT模型(或FA模型)則是一個(gè)假設(shè)潛在因子(能力)是連續(xù)變量的模型,在項(xiàng)目反應(yīng)概率量尺上存在連續(xù)變化的一個(gè)群體[3]。其中,觀測(cè)變量為連續(xù),潛變量為類別的情況,較早的研究提出“潛在剖面分析”。但是隨著LCA技術(shù)的發(fā)展,其已經(jīng)將觀測(cè)變量拓展到連續(xù)變量的情形下,所以較新的研究都使用LCA代替之[4]。
圖1 幾種因素分析模型的數(shù)據(jù)假設(shè)及其比較
對(duì)于潛變量的數(shù)字特性,可以從原來(lái)的“連續(xù)”“類別”兩種極端情況推廣到“混合”模式。在尺類譜的中間,可以得到混合IRT(MIRT)或混合因素分析(FMA),潛變量是混合型,其數(shù)據(jù)特征要求總體不同質(zhì),即總體用“類”度量;同時(shí),在每一個(gè)群體里,都可以用連續(xù)的因素來(lái)表征,即群內(nèi)用“尺”度量[2]。在實(shí)際應(yīng)用中,F(xiàn)MA假設(shè)在項(xiàng)目反應(yīng)概率上存在不同的群類,而群類內(nèi)又存在組內(nèi)變異,可以解決因素分析中總體不同質(zhì)的問(wèn)題。
由此可知,在尺類譜上可以組合成很多較為實(shí)用的模型;不同模型假設(shè)不同,其解決的問(wèn)題也不同,針對(duì)不同總體內(nèi)部的形態(tài)也不同。如果分群不存在組內(nèi)差異,LCA便是較好的選擇,其在認(rèn)知、臨床、教育考試、心理測(cè)驗(yàn)等領(lǐng)域有廣泛的應(yīng)用[1,5]。如果分群具有組內(nèi)差異,MIRT(或FMA)則是首選。它們可以廣泛地應(yīng)用在臨床病理與學(xué)習(xí)障礙研究[6,7]、心理與人格測(cè)驗(yàn)[8,9]等領(lǐng)域,旨在連續(xù)的總體中找到不同的群,并探討用不同的機(jī)制和手段分別對(duì)不同的群體進(jìn)行干預(yù)。
2.1.2 多水平混合因素分析模型
前文中所提到的數(shù)據(jù)模式,均在同一層級(jí)的抽樣中產(chǎn)生。而在實(shí)際中,特別是在組織行為學(xué)和教育心理學(xué)領(lǐng)域,分層數(shù)據(jù)更為常見(jiàn)。這種數(shù)據(jù)就稱為多水平結(jié)構(gòu)的數(shù)據(jù),其分析方法多采用多水平模型(MLM)或多層線性模型(HLM)。在MLM中,多層數(shù)據(jù)結(jié)構(gòu)違反了一般回歸分析測(cè)量誤差殘差獨(dú)立的假設(shè),測(cè)量的變量來(lái)自于不同層級(jí)。在MLM的分析思路中,核心的思想就是將變異分解為組間變異和組內(nèi)變異[10]。此后,研究者將多水平的數(shù)據(jù)應(yīng)用到結(jié)構(gòu)方程模型當(dāng)中,衍生出了多水平驗(yàn)證性因素分析模型(MCFA)等技術(shù),并且開(kāi)發(fā)出了相應(yīng)的軟件(如Mplus)使得多層分析的技術(shù)得到了很好的發(fā)展。
在多水平數(shù)據(jù)的結(jié)構(gòu)下,變異同樣可能存在潛在的異質(zhì)性。多水平混合模型(MMM)[11]結(jié)合了多水平數(shù)據(jù)和混合模型的思路,可以探討多水平結(jié)構(gòu)下數(shù)據(jù)的潛在組別或者潛在群類對(duì)結(jié)果變量(連續(xù)變量、分類變量、稱名變量等變量類型)的影響。在該模型提出之后,一系列的研究者對(duì)其估計(jì)方法做出了拓展,一般建議使用EM的估計(jì)方法或貝葉斯的估計(jì)方法。
圖2是一個(gè)橫斷研究中混合MCFA的模型示意圖。觀測(cè)變量y1-y5的方差分解為組內(nèi)部分(方框)和組間部分(圓圈),需要估計(jì)隨機(jī)部分的在組內(nèi)用黑點(diǎn)表示。fw表示組內(nèi)的因子,受到潛類別變量c的直接影響。fb為組間的因子,在組間部分,c有組間的隨機(jī)效應(yīng),隨機(jī)截距便成為組間因子fb的指標(biāo)。在這個(gè)模型中,組間部分的因子殘差方差為0。如果在組間存在類別c與組間因子fb之間的路徑,該模型變會(huì)變得復(fù)雜,產(chǎn)生許多跨級(jí)交互作用。研究者將混合MCFA模型應(yīng)用到智力測(cè)驗(yàn)、人格測(cè)驗(yàn)、教育與學(xué)校的分層研究和臨床診斷等領(lǐng)域上。在此基礎(chǔ)上,研究者可以定義許多復(fù)雜的模型,且在不同層級(jí)上可以定義不同類別數(shù),這使得該模型變得非常靈活。比如在混合MCFA中,研究者可以將學(xué)生對(duì)學(xué)校的滿意度在不同學(xué)校的層級(jí)內(nèi)分別建模;在混合IRT模型框架下,例如在跨文化地域研究中,研究者可以針對(duì)不同國(guó)家、不同洲進(jìn)行分層,以建構(gòu)不同文化下的類別模型,或?qū)W(xué)業(yè)成就進(jìn)行DIF檢測(cè)。
圖2 多水平混合因素分析示意圖
2.2.1 群的調(diào)節(jié)作用:潛類別轉(zhuǎn)換分析
圖3 潛類別轉(zhuǎn)換分析模型示意圖
如果對(duì)于不同時(shí)間點(diǎn)分別做LCA分析,則衍生出潛類別轉(zhuǎn)換模型(LTA)。Nylund等人(2007)建議,在做LTA分析的過(guò)程中,首先就是在不同時(shí)間點(diǎn)分別做LCA模型(潛變量分別為c1和c2),其次使用列聯(lián)表觀察分類變化的情況,然后再分析類別c1到類別c2的轉(zhuǎn)換情況(圖3)。在這個(gè)列聯(lián)表中,研究者可以分析某一個(gè)類別的群體隨著時(shí)間的推移,其性質(zhì)發(fā)生了怎樣的改變,或者在什么樣的條件下(加入?yún)f(xié)變量),哪些群體會(huì)轉(zhuǎn)變成另外一個(gè)群體。這類研究思路旨在探討個(gè)體隨時(shí)間變化的類別轉(zhuǎn)變,特別在發(fā)展心理學(xué)中很有價(jià)值。
上述研究的例子表明,協(xié)變量(貧窮水平)成為一個(gè)類別轉(zhuǎn)換的調(diào)節(jié)作用。Muthén,Muthén和Asparouhov[12]在對(duì)同一批數(shù)據(jù)的處理當(dāng)中(c1和c2都有兩個(gè)類),將c1的兩個(gè)類別分別定義:第一個(gè)類自由估計(jì);第二個(gè)類的估計(jì)中,固定了c2的第一個(gè)類對(duì)貧窮回歸系數(shù)的概率為0(即EWR轉(zhuǎn)換為L(zhǎng)AK的概率為0),與前人得出了相同的結(jié)果。這表明,由于分析的關(guān)鍵變量(潛類別變量c1、c2和協(xié)變量X)都是分類變量,所以不僅協(xié)變量可以有調(diào)節(jié)作用,類別潛變量同樣可以分析調(diào)節(jié)作用。除此之外,他們還在此基礎(chǔ)上,添加另一個(gè)類別潛變量c作為高階因子,從中概括出具有不同轉(zhuǎn)換模式的群類[21]。同時(shí),他們還將LTA與FMA模型結(jié)合,其結(jié)果比傳統(tǒng)LTA模型擬合更好,且能發(fā)現(xiàn)與前人研究不太一致的地方,都是值得進(jìn)一步思考的問(wèn)題。
2.2.2 增長(zhǎng)模型中的群:潛類別增長(zhǎng)分析與混合增長(zhǎng)模型
和LTA不同的是,潛變量增長(zhǎng)模型(LGM)[13]側(cè)重的并不是類別中個(gè)體隨時(shí)間的轉(zhuǎn)換,而是個(gè)體隨時(shí)間的發(fā)展趨勢(shì)。它是在追蹤研究的范式下發(fā)展起來(lái)的以研究總體發(fā)展趨勢(shì)為中心的一類統(tǒng)計(jì)模型。它建立在驗(yàn)證性因素分析的模型基礎(chǔ)上,通過(guò)結(jié)構(gòu)方程模型的視角,揭示指標(biāo)變量、協(xié)變量與增長(zhǎng)因子之間的關(guān)系,并且與多水平模型(MLM)[14]模型融會(huì)貫通,LGM模型和MLM之間有相互等價(jià)轉(zhuǎn)換的關(guān)系[15]。
在增長(zhǎng)模型中的一個(gè)很重要的假設(shè)就是個(gè)體發(fā)展的同質(zhì)性。同樣在實(shí)際的情景中,總體可能并非同質(zhì),且這種非同質(zhì)性是無(wú)法測(cè)量的,即存在“觀測(cè)不到的異質(zhì)性”。在此情況下,需要對(duì)測(cè)量個(gè)體進(jìn)行分類,結(jié)合LCA衍生出兩種重要的模型:潛類別增長(zhǎng)分析(LCGA)[16]和混合增長(zhǎng)模型(GMM)[17]。圖4中表示了潛變量的兩種不同的假設(shè)(與圖1類似)。其中,如果模型中包涵虛線部分即GMM,如果沒(méi)有則為L(zhǎng)CGA。不難發(fā)現(xiàn),這兩種模型最主要的區(qū)別就是是否允許類內(nèi)存在變異。LCGA假設(shè)類別內(nèi)是同質(zhì)的,不存在變異;而GMM放寬了這種限定。此外,如果在圖4中不考慮與潛變量c有關(guān)的路徑,則該模型就是一個(gè)LGM模型。所以,LGM是只有1個(gè)類的GMM模型,而LCGA模型是限定潛類別變異為零的GMM模型,二者均是GMM模型的特例。一般地,LCGA假設(shè)觀測(cè)變量也是類別變量,但是由于軟件(如Mplus)的發(fā)展,LCGA也放寬了觀測(cè)變量為類別變量的假設(shè),只需限定GMM隨機(jī)部分為零即可[4]。
圖4 潛變量(混合)增長(zhǎng)模型的數(shù)據(jù)假設(shè)及其比較(包含虛線部分即混合增長(zhǎng)模型)
2.2.3 多水平混合增長(zhǎng)模型
在追蹤數(shù)據(jù)的分析方法中,MLM方法也很常用。因?yàn)檠芯空呖梢园炎粉檾?shù)據(jù)看作測(cè)量嵌套于個(gè)體的模式,這樣數(shù)據(jù)便有了多層結(jié)構(gòu)。在追蹤研究中,比如增長(zhǎng)趨勢(shì)類的研究,研究者可以將GMM與多水平數(shù)據(jù)相結(jié)合,衍生出多水平GMM模型(MGMM)。由此可知,MMM模型既可以應(yīng)用于橫斷研究,也可以拓展到追蹤研究中,但是由于追蹤研究本身就存在一個(gè)嵌套數(shù)據(jù)結(jié)構(gòu)(測(cè)量嵌套于個(gè)體),所以追蹤研究模型的層數(shù)比橫斷研究的多。如圖5所示,該模型中存在個(gè)體水平(第二水平)和組水平(第三水平)的協(xié)變量,且個(gè)體存在不同的類別,那么研究者就需要定義一個(gè)三水平的混合模型,其中iw和sw都是組內(nèi)的增長(zhǎng)因子,組內(nèi)的協(xié)變量為x,組內(nèi)類別為c;ib和sb為組間增長(zhǎng)因子,組間協(xié)變量為w,w會(huì)對(duì)分類造成影響。Palardy和Vermunt(2010)使用MGMM的多階段增長(zhǎng)模式對(duì)學(xué)生的數(shù)學(xué)成績(jī)進(jìn)行分析。其研究中,由于既分析了增長(zhǎng)曲線的類型,又考慮了個(gè)體水平(社會(huì)經(jīng)濟(jì)地位、是否為亞洲人、黑人或西班牙人等)與學(xué)校水平(平均社會(huì)經(jīng)濟(jì)地位、教師職業(yè)性等)的變量,故建立了三水平模型。按照一般多水平模型的思路,需要依次考慮不同截距和斜率的隨機(jī)部分,所以該研究中發(fā)現(xiàn),如果考慮不同水平的隨機(jī)部分之后,其最后選擇的類別數(shù)目也不同。
圖5 多水平混合模型示意圖
當(dāng)然,并不是所有研究都偏向于將被試進(jìn)行分類。Yampolskaya等人[18]的研究便采用MMM的方法在對(duì)兒童的研究中拒絕了兩類別的模型,得出其研究樣本同質(zhì)性的結(jié)論。該研究同時(shí)也指出,使用MMM模型不單可以分類,同樣可以根據(jù)統(tǒng)計(jì)指標(biāo)(如AIC、BIC)判斷被試是否同質(zhì)(關(guān)于類別選擇的問(wèn)題會(huì)在下文進(jìn)行探討)。盡管MMM應(yīng)用價(jià)值正在逐步體現(xiàn)出來(lái),但多水平模型本身比較復(fù)雜,加入各層的協(xié)變量后,交互作用特別是跨級(jí)交互作用也較為繁瑣,不易解釋,所以研究者需要對(duì)數(shù)據(jù)驅(qū)動(dòng)的模型進(jìn)行較為深刻的理論解釋。但是,可以推斷,在統(tǒng)計(jì)技術(shù)逐漸發(fā)展的當(dāng)今社會(huì),多水平模型會(huì)成為蓬勃發(fā)展的一個(gè)分支,對(duì)實(shí)證研究做出更大的貢獻(xiàn)。
前文描述的諸多潛變量分析技術(shù),按照潛變量的數(shù)字特征和研究類型可以總結(jié)成表1,研究者可以根據(jù)研究的內(nèi)容和數(shù)據(jù)特征靈活選用不同的潛變量分析技術(shù),從而得到合理的可以推廣的研究結(jié)論。
在潛類別模型中,模型選擇是一個(gè)比較復(fù)雜而且一直存在爭(zhēng)議的問(wèn)題。同樣由于混合模型數(shù)據(jù)驅(qū)動(dòng)嫌疑較大,所以研究者一般都采用探索性的方法對(duì)實(shí)際數(shù)據(jù)進(jìn)行分析。比如在追蹤研究中,研究者們同時(shí)使用GMM和LCGA對(duì)數(shù)據(jù)進(jìn)行擬合,并且從1個(gè)類別開(kāi)始,逐步增加類別,以“數(shù)據(jù)說(shuō)話”代替繁瑣的理論辯解,通過(guò)鑒定指標(biāo)來(lái)判斷最終模型應(yīng)該取多少個(gè)類別。大多數(shù)研究者偏向使用BIC,LRT以及熵值來(lái)判斷類別的擬合情況和模型的分類情況。也有一部分研究者對(duì)數(shù)據(jù)驅(qū)動(dòng)的模型提出質(zhì)疑,建議運(yùn)用協(xié)變量納入模型中進(jìn)行模型選擇,并強(qiáng)調(diào)實(shí)際意義應(yīng)該是研究者在分類中需要重點(diǎn)考察的和關(guān)心的問(wèn)題。
此外也有研究者偏向使用“返回指數(shù)”(如ARI)來(lái)選擇模型。因?yàn)榉祷刂笖?shù)在計(jì)算方法上不同于其他擬合指標(biāo),其可以評(píng)價(jià)不同指標(biāo)的優(yōu)劣。Steinley和Brusco[19]的研究中就使用了ARI去判斷比較使用BIC分類結(jié)果和CH指數(shù)分類結(jié)果的好壞。其他一些研究者也采用ARI來(lái)判斷各種分類指數(shù)分類結(jié)果和真實(shí)類別之間的返還程度。由此可知在研究者面臨多個(gè)選擇指標(biāo)的時(shí)候,ARI可以考察這些分類指標(biāo),而非僅僅考察數(shù)據(jù)。有了這個(gè)指標(biāo)之后,研究者在考慮使用何種指標(biāo)進(jìn)行最后的模型選擇就有了更有說(shuō)服力的依據(jù)。
對(duì)于模型選擇問(wèn)題,未來(lái)的研究應(yīng)該幾種在模擬和實(shí)證研究基礎(chǔ)上,為研究者們提供實(shí)際的證據(jù)。在眾多的擬合指標(biāo)中,研究者應(yīng)該先看什么,再看什么,最后再根據(jù)什么指標(biāo)進(jìn)行調(diào)整。特別是對(duì)于潛在距離不大的數(shù)據(jù),使用GMM和LCGA的兩難選擇問(wèn)題,以及模型的擬合(如BIC)與分類結(jié)果(如熵)確定性之間可能存在的相悖關(guān)系,需要進(jìn)一步深入研究討論。
在上述模型中也看到了,對(duì)于潛類別c的分類效果,研究者往往希望考慮協(xié)變量的影響而并非純粹的指標(biāo)變量的影響。比如在CACE效應(yīng)中,研究者往往會(huì)在模型中直接加入?yún)f(xié)變量X,這樣的c的分類結(jié)果就不能由純粹的指標(biāo)變量所導(dǎo)致。研究者就會(huì)有疑惑,潛在類別應(yīng)該是由固有的指標(biāo)變量決定的,還是由其他協(xié)變量相互影響而決定的?對(duì)于帶有協(xié)變量的LCA模型,也一直存在爭(zhēng)論:是否應(yīng)該加入?yún)f(xié)變量來(lái)決定最終分類的問(wèn)題?由于LCA模型固有的數(shù)據(jù)驅(qū)動(dòng)之嫌,研究者也在不斷探索出較為合理的分析步驟。一般研究者認(rèn)為,確定最終分類應(yīng)采用指標(biāo)變量。有兩種較為傳統(tǒng)的手段:一種是“三步法”,即先用指標(biāo)變量分出類別,再根據(jù)分類結(jié)果判斷出外顯的類別指標(biāo),最后再在此基礎(chǔ)上分析協(xié)變量;另一種是“一步法”,即在模型估計(jì)的時(shí)候就加入?yún)f(xié)變量對(duì)類別的影響。對(duì)于后者,研究者們進(jìn)行了反駁,認(rèn)為加入?yún)f(xié)變量之后,模型的估計(jì)會(huì)發(fā)生變化,但是前者卻只考察了正確分類的類別,并沒(méi)有將錯(cuò)誤類別的概率考察在內(nèi),故這種直接判別類別的方法沒(méi)有充分利用LCA模型的信息。Bolck,Croon和Hagenaars[20]就討論過(guò)這兩種方法的區(qū)別,針對(duì)第二步的分類誤差提出了“BCH三步法”對(duì)傳統(tǒng)三步法方法進(jìn)行矯正;在此基礎(chǔ)上,Vermunt[21]總結(jié)了前人的研究并提出了更優(yōu)化的“ML三步法”,認(rèn)為研究者需要考慮類別變量的分類概率的影響,利用后驗(yàn)概率的信息對(duì)外顯的分類結(jié)果進(jìn)行矯正。在“ML三步法”中,第一步估計(jì)仍然做傳統(tǒng)的LCA,不添加協(xié)變量,但是需要記錄其分類后驗(yàn)概率的結(jié)果;第二步根據(jù)分類的概率,計(jì)算出每個(gè)類別的發(fā)生比;第三步是在固定每個(gè)類的閾值等于發(fā)生比的基礎(chǔ)上,再考察協(xié)變量對(duì)預(yù)測(cè)變量的影響,這又體現(xiàn)了類別c的調(diào)節(jié)作用。之后,Asparouhov和Muthén[22]提出添加“輔助變量”的方式得以軟件的實(shí)現(xiàn)和方法的改進(jìn)。
Asparouhov和Muthén認(rèn)為,潛類別c和協(xié)變量X存在兩種不同的關(guān)系。一種是Vermunt[21]的“ML三步法”,X作為潛類別c的一個(gè)預(yù)測(cè)指標(biāo)去預(yù)測(cè)c的分類,此時(shí)研究者需要做c對(duì)X的邏輯回歸,即潛類別回歸分析;而另一種情況是c作為預(yù)測(cè)變量對(duì)一組外顯的X預(yù)測(cè),被稱為遠(yuǎn)端變量。在添加了輔助變量的估計(jì)中,最后根據(jù)模型的熵值來(lái)決定應(yīng)該怎樣選擇模型。他們根據(jù)模擬研究結(jié)果建議,在熵值<0.6的時(shí)候應(yīng)該使用傳統(tǒng)的一步法,熵值介于0.6到0.8之間時(shí)應(yīng)該考慮傳統(tǒng)的分類方法以及Vermunt的“ML三步法”,而當(dāng)熵值>0.8的時(shí)候,三種方法都尚可[22]。
當(dāng)然,這個(gè)規(guī)則也只是“拇指法則”。Asparouhov和Muthén在其模擬研究中,生成數(shù)據(jù)的時(shí)候使用了包涵了協(xié)變量的模型,所以該模擬結(jié)果勢(shì)必會(huì)偏向添加了輔助變量的結(jié)果。如果模型改變,輔助變量是否能繼續(xù)有效,比如在模擬的時(shí)候,生成的數(shù)據(jù)模型就不包涵協(xié)變量的數(shù)量關(guān)系,得到的結(jié)果是否還能一致的指向輔助變量的結(jié)果?對(duì)于這種剛剛興起的方法,還需更多的探索。
潛變量量尺的拓展使得潛類別模型千變?nèi)f化,衍生出各式各樣的新的模型。研究者如何在眾多模型中保證選擇恰當(dāng)?shù)哪P蛻?yīng)用到自己的研究中,需要對(duì)以下方面有所關(guān)注。
(1)潛變量和觀測(cè)變量。研究者需要清楚的了解所研究對(duì)象是否可以觀測(cè),如果是潛在特質(zhì),需要通過(guò)哪些外顯的行為指標(biāo),這些指標(biāo)是否可靠(如是否需要考慮輔助變量)。(2)連續(xù)變量和類別變量。分別從潛變量和觀測(cè)變量的角度去確定變量的性質(zhì),不同的數(shù)據(jù)特點(diǎn)對(duì)應(yīng)了不同的統(tǒng)計(jì)方法(如LCA與IRT的選擇)。如果是連續(xù)變量,需不需要考慮個(gè)體差異(如LCGA與GMM的選擇,LCA和MIRT的選擇)。(3)是否含有多水平數(shù)據(jù)。如果被試存在嵌套結(jié)構(gòu),那么多水平模型便成為研究者的首選;如果這種嵌套結(jié)構(gòu)不明顯(隨機(jī)效應(yīng)不顯著),那么仍然可以使用原有的模型(如CFA和MCFA的選擇)。
有了上述的思想,研究者可以進(jìn)一步的根據(jù)自己的研究,選擇合適的模型。在橫斷研究中,探討總體分群的問(wèn)題主要采用LCA的方法,以及將LCA與傳統(tǒng)的因素分析、IRT相結(jié)合的FMA、MIRT等混合的方法;在縱向研究中,LTA解決群間個(gè)體的轉(zhuǎn)換規(guī)律的問(wèn)題,而探討增長(zhǎng)趨勢(shì)的類別則用LCGA或GMM等。除此之外,多水平模型的框架下同樣可以探討橫斷或追蹤研究中的分群,解決嵌套數(shù)據(jù)結(jié)構(gòu)中總體不同質(zhì)的問(wèn)題。
當(dāng)然,由于該領(lǐng)域還十分年輕,還有很多值得研究者探討的地方。比如在類別數(shù)量的確定上一直存在的爭(zhēng)論,以及協(xié)變量對(duì)分類的影響,都有待進(jìn)一步的討論。潛類別模型會(huì)成為統(tǒng)計(jì)模型發(fā)展的一大趨勢(shì),對(duì)于連續(xù)變量無(wú)法解決的分群的問(wèn)題,以及群的轉(zhuǎn)換的問(wèn)題,潛類別模型會(huì)有巨大的發(fā)展空間。
[1]張潔婷,焦璨,張敏強(qiáng).潛在類別分析技術(shù)在心理學(xué)研究中的應(yīng)用[J].心理科學(xué)進(jìn)展,2010,18(12).
[2]Masyn K E,Henderson C E,Greenbaum P E.Exploring the Latent Structures of Psychological Constructs in Social Development using the Dimensional-categorical Spectrum[J].Social Development,2009,19(3).
[3]邱皓政.潛在類別模型的原理和技術(shù)[M].北京:科學(xué)技術(shù)出版社,2008.
[4]Muthén L,Muthén B.Mplus User's Guide(Seventh Edition)[M].Los Angeles,CA:Muthén&Muthén,2012.
[5]焦璨,張潔婷,關(guān)丹丹等.2007~2009年研究生心理學(xué)專業(yè)基礎(chǔ)綜合考試的潛在類別分析[J].中國(guó)考試,2010,(4).
[6]De Meyer G,Shapiro F,Vanderstichele H.DIagnosis-independent Alzheimer Disease Biomarker Signature in Cognitively Normal Elderly People[J].Archives of Neurology,2010,67(8).
[7]Muthén B.Should Substance use Disorders be Considered as Categorical or Dimensional?[J].Addiction,2006,101(Supplenent S1).
[8]Thomas M L,Lanyon R I,Millsap R E.Validation of Diagnostic Measures Based on Latent Class Analysis:A Step Forward in Response Bias Research[J].Psychological Assessment,2009,21(2).
[9]Maij-de Meij A M,Kelderman H,Van Der Flier H.Fitting a Mixture Item Response Theory Model to Personality Questionnaire Data:Characterizing Latent Classes and Investigating Possibilities for Improving Prediction[J].Applied Psychological Measurement,2008,32(8).
[10]Muthén B.Latent Variable Modeling in Heterogeneous Populations[J].Psychometrika,1989,54(4).
[11]Asparouhov T,Muthén B.Multilevel Mixture Models,in Advances in Latent Variable Mixture models[R].Hancock G R,Samuelson K M,Editors.Charlotte,NC:Information Age Publishing,2008.
[12]Muthén B,Muthén L,Asparouhov T.Latent Variable Modeling using Mplus[R].Beijing:National Survey Reserach Center at Renmin University of China,2012.
[13]Muthén B O.Beyond SEM:General latent Variable Modeling[J].Behaviormetrika,2002,29(1).
[14]Raudenbush S W,Bryk A S.Hierarchical Linear Models:Applications and data Analysis methods(2nd ed)[M].Thousand Oaks,California:Sage Publications,2002.
[15]Willett J B,Sayer A G.Using Covariance Structure Analysis to Detect Correlates and Predictors of Individual Change Over Time[J].Psychological Bulletin,1994,116(2).
[16]Nagin D S.Analyzing Developmental Trajectories:A Semiparametric,Group-based Approach[J].Psychological Methods,1999,4(2).
[17]Muthén B,Brown C H,Booil Jo K M,et al.General Growth Mixture Modeling for Randomized Preventive Interventions[J].Biostatistics,2002,3(4).
[18]Yampolskaya S,Armstrong M T,King-Miller T.Contextual and Individual-levelPredictors ofAbused Children's Reentry Into out-of-home care:A Multilevel Mixture Survival Analysis[J].Child Abuse&Neglect,2011,35(9).
[19]Vermunt J K.Latent Class Modeling with Covariates:Two Improved Three-step Approaches[J].Political Analysis,2010,18(4).
[20]Steinley D,Brusco M J.Evaluating Mixture Modeling for Clustering:Recommendations and Cautions[J].Psychological Methods,2011,16(1).
[21]Bolck A,Croon M,Hagenaars J.Estimating latent Structure Models with Categorical Variables:One-step Versus Three-step Estimators[J].Political Analysis,2004,12(1).
[22]Asparouhov T,Muthén B.Auxiliary Variables in Mixture Modeling:A 3-step Approach using Mplus[R].in Mplus Web Notes,No.15,2012.