王孟成 鄧俏文 畢向陽 葉浩生 楊文登
(1廣州大學(xué)心理系; 2廣州大學(xué)心理測量與潛變量建模研究中心; 3廣東省未成年人心理健康與教育認知神經(jīng)科學(xué)實驗室,廣州 510006) (4中國政法大學(xué)社會學(xué)院, 北京 102249)
以結(jié)構(gòu)方程模型為代表的潛變量建模方法在心理學(xué)和社會科學(xué)各領(lǐng)域得到了廣泛的應(yīng)用(侯杰泰, 溫忠麟, 成子娟, 2004; 王孟成, 2014)。然而在傳統(tǒng)的結(jié)構(gòu)方程模型中, 研究的樣本通常假設(shè)來自同質(zhì)性(Homogeneity)群體, 但這一假設(shè)在很多情況下并不成立。不同質(zhì)群體的結(jié)構(gòu)方程建??梢允褂枚嘟M分析(Multiple-Group Analysis)或多指標多因模型(MIMIC) (侯杰泰等, 2004)。不過這種處理的前提是存在明確的分組變量, 最多見的分組變量如性別、種族和宗教信仰等。但更多時候, 往往很難找到客觀的外顯分組變量, 最常見的例子就是心理疾病的診斷(e.g., Helzer, Kraemer, & Krueger, 2006;Widiger & Samuel, 2005; Zachar & Kendler, 2007)。目前的心理疾病診斷通常以患者滿足某種疾病最低的癥狀數(shù)目為確診依據(jù)即采用類型(Categorical)標準將個體分為異常和正常。然而實證研究的結(jié)果通常并不支持這種診斷劃分(e.g., Widiger, Livesley,& Clark, 2009), 即心理疾病不是有或無的類別。在不存在明確的分組變量的情況下, 不同質(zhì)群體(即異質(zhì)群體)的劃分是隱蔽的、潛在的, 因此需要通過基于模型的方法對潛在分組進行估計。
在統(tǒng)計學(xué)上, 為了處理潛在分組問題, 研究者提出了多種統(tǒng)計模型, 比如Taxometric分析法(Meehl,1995; Ruscio, Haslam, & Ruscio, 2006)和潛類別/潛剖面分析(McLachlan & Peel, 2000)。由于Taxometric方法在處理存在兩個以上的潛在群體方面存在很大的局限性(Lubke & Miller, 2015; Lubke & Tueller,2010), 潛類別/潛剖面分析是目前將人群分成不同潛在組最流行的方法(McClintock, Dale, Laumann,& Waite, 2016; Mokros et al., 2015; 王孟成, 畢向陽, 葉浩生, 2014)。
潛類別分析(Latent Class Analysis, LCA)或潛類別模型(Latent Class Model, LCM)是通過個體在觀測變量上的反應(yīng)模式將其劃分成不同的潛類別組, 與聚類分析在功能上類似, 只是LCA是基于模型的聚類方法, 因此也稱作潛聚類分析(latent cluster analysis)。潛類別模型主要處理分類的觀測變量, 如果觀測變量是連續(xù)指標時則稱作潛剖面分析(Latent Profile Analysis, LPA)。近年來LPA/LCA在心理學(xué)、預(yù)防醫(yī)學(xué)、精神病學(xué)、市場營銷、組織管理等諸多領(lǐng)域逐漸流行(e.g., Carragher, Adamson,Bunting, & McCann, 2009; Lanza, Rhoades, Greenberg,Cox, & The Family Life Project Key Investigators,2011; McClintock et al., 2016; Wang & Hanges, 2011;張潔婷, 焦璨, 張敏強, 2010)。例如, Carragher等(2009)在12,180個全美代表性樣本中應(yīng)用潛類別分析將抑郁癥狀劃分成4個類別:嚴重抑郁組(Severely Depressed, 40.9%)、軀體癥狀組(Psychosomatic,30.6%)、認知情感組(Cognitive-Emotional, 10.2%)和健康組(Non-depressed, 18.3%)。
LPA/LCA作為潛在分組的統(tǒng)計方法其分類精確性是應(yīng)用研究者關(guān)注的焦點, 目前絕大多數(shù)LPA/LCA均報告分類精確性指標(e.g., McClintock et al., 2016; Pastor, Barron, Miller, & Davis, 2007;Vannucci, Tanofsky-Kraff, Crosby et al., 2013), 因此深入分析分類精確性在不同條件下的表現(xiàn)將是評價 LPA/LCA作為潛分類分析法有效性和適切性的重要議題, 同時也將為實際使用者提供應(yīng)用參考。由于心理學(xué)研究中的變量通常為連續(xù)型變量, 所以本研究主要考察潛剖面分析的分類精確性。
k
個剖面的第i
個指標的方差可以分解為(Lazarsfeld & Henry,1968):LPA/LCA作為潛在聚類的分析方法, 其分類精確性是考查建模有效性的重要指標, 也是研究的主要興趣。例如, 在臨床診斷上, 根據(jù)LPA/LCA的結(jié)果將不同患者歸入不同的臨床分組, 分類的精確性將會影響診斷的有效性。在LPA/LCA模型中, 通常使用 Entropy作為分類精確性的指標, 取值范圍在0~1之間, 越接近1表明分類越精確。其計算公式如下:
P
為估計第i
個個體屬于第k
個類別的后驗概率,n
為樣本量。P
可通過如下貝葉斯后驗概率獲得:N
是基于模型估計的類別潛變量, 與實際的類別潛變量C
并不完全一致(完全一致時不存在分類誤差), 因此存在如下分類不確定率:N
c是根據(jù)N
將個體分配到C
的數(shù)量。k
= 1)的情況, 所以我們不考慮納入NEC作為評價分類精確性的指標。CLC和ICL_BIC的公式分別如下:樣本校正的ICL_BIC, SaICL_BIC的公式如下:
p
為模型估計的參數(shù)量,LL
為對數(shù)似然統(tǒng)計量,N
為樣本量。Entropy作為分類精確性的標準化衡量指數(shù),凡是影響潛類別分類精確性的因素均會對其產(chǎn)生影響, 其中最重要的影響因素是潛類別間距(Latent Class Separation)和類別內(nèi)方差(e.g., Lubke & Muthén,2007; Muthén, 2004)。
潛類別間距是指潛類別間差異的大小, 反映在項目反應(yīng)概率或均值上, 表現(xiàn)為不同類別個體間在所有觀測指標上存在顯著的差別(Collins & Lanza,2009)。潛類別間距越大, 對于來自任一潛類別的個體來說, 將其劃分到所屬類別的精確性越高。如果兩個類別間的差異不明顯, 即潛類別間距小, 將個體精確地劃分到所屬類別就越困難。因此, 潛類別間距的大小是影響分類精確性的重要因素, 也是影響潛類別個數(shù)保留的重要變量(Lubke & Neale, 2006)。
對分類精確性有影響的另一個因素是類別內(nèi)方差。在潛類別間距相同的情況下, 特定類別分布的方差越大, 兩個分布之間重疊的部分越大, 將個體劃分到特定類別組就越困難。類別分布的方差越小, 兩個分布之間重疊的部分越小, 將個體劃分到特定類別組就越容易。由于在此模擬研究中, 通過固定方差法來統(tǒng)一潛變量的單位, 所以本研究不考查類別內(nèi)方差對分類精確性的影響。
盡管Entropy是衡量分類精確性最常用的指標,然而令人遺憾地是, 在方法學(xué)文獻中考查該指數(shù)表現(xiàn)的研究非常少。據(jù)我們所知當(dāng)前僅有一項研究考查了Entropy與分類精確性的關(guān)系(Lubke & Muthén,2007), 其他研究只考查Entropy作為確定潛類別數(shù)目的評價指標時的表現(xiàn)(e.g., Peugh & Fan, 2013;Tein, Coxe, & Cham, 2013)。
Lubke和 Muthén (2007)的模擬研究在考查樣本量、潛類別間距、協(xié)變量和模型復(fù)雜性等因素對因子混合模型(factor mixture model)的參數(shù)估計和分類精確性的影響時, 發(fā)現(xiàn)當(dāng)Entropy < 0.60時相當(dāng)于超過20%的個體存在分類錯誤; Entropy≥0.80表明分類準確率超過90%。這一結(jié)果是否能推廣到研究設(shè)定因素之外的情況呢?另外, 在他們的研究中還存在如下幾個方面的不足。首先, 該研究考查的樣本量范圍有限, 僅考查了N
= 300時的情況。在本研究之前的預(yù)實驗中, 我們發(fā)現(xiàn)樣本量與Entropy呈負相關(guān), 即樣本量越大 Entropy值越小,所以擴大樣本量范圍對全面了解Entropy的表現(xiàn)具有重要意義。另外, 她們的研究只考查了存在2個潛在類別組即k
= 2的情況, 然而在實際研究中,潛類別數(shù)量通常多于2個。最后, 上述關(guān)于Entropy的臨界值是在考慮協(xié)變量的情況下獲得的, 在很多應(yīng)用研究中并未涉及協(xié)變量, 所以在其他條件下這些值是否適用有待進一步分析。最近, Peugh和 Fan (2013)的模擬研究考查了Entropy及其三種變式(CLC、NEC、ICL_BIC)在確定潛剖面類別個數(shù)中的表現(xiàn), 但沒有考查這些指數(shù)與分類精確性的關(guān)系。本研究將在上述兩個研究的基礎(chǔ)上, 進一步考察 Entropy及相關(guān)變式在不同樣本量、潛類別數(shù)目、類別距離和指標個數(shù)等因素在不同水平組合條件下的表現(xiàn)。
(1) 樣本量
樣本量是多變量模型考慮的重要因素之一。在先前針對 LPA/LCA的模擬研究中, 樣本量主要集中在100~3000的范圍內(nèi)(e.g., Nylund, Asparouhov,& Muthén, 2007; Peugh & Fan, 2013; Tein et al.,2013; Yang, 2006)??紤]到考查更小樣本量的重要性(Paxton, Curran, Bollen, Kirby, & Chen, 2001), 特別是臨床應(yīng)用研究(Kyriakopoulos et al., 2015)的樣本量通常不大; 同時為了更全面揭示樣本量對分類精確性的影響(Lubke & Muthén, 2007), 本研究主要考查以下5個樣本量:50, 100, 500, 1000, 3000。
(2) 類別距離
類別距離是影響分類精確性最重要的因素, 馬氏距離(Mahalanobis Distance, MD)常被用來衡量潛類別間的距離。MD測量兩個隨機向量X
(x
,x
,…,x
)和Y
(y
,y
,…,y
)之間的距離, 其中X
與Y
有著相同的分布和協(xié)方差矩陣S
。與之前的相關(guān)研究一致(e.g., Lubke & Muthén, 2007; Peugh & Fan, 2013),本研究采用馬氏距離來衡量潛類別間的距離, 公式如下(j
表示元素或變量個數(shù)):本研究選擇了 3個水平的類別距離, 分別為0.5、1.2和 3, 涵蓋了從小到較大的類別距離范圍(Lubke & Neale, 2006; Peugh & Fan, 2013)。正態(tài)分布的方差固定為 1, 具體的指標均值和馬氏距離的關(guān)系呈現(xiàn)在表1中。其中, 類別數(shù)為3時對應(yīng)的馬氏距離的均值等于類別數(shù)為5時對應(yīng)的馬氏距離的潛類別1-3的均值。
(3) 指標數(shù)
(4) 類別數(shù)目
另外一個考慮的變量是類別數(shù)。在模擬研究中,研究 3個潛類別數(shù)的情況比較多(e.g., Lubke &Neale, 2006; Peugh & Fan, 2013; Tein et al., 2013;Tofighi & Enders, 2008)。另外, 在多數(shù)應(yīng)用研究中通常發(fā)現(xiàn)3~5個潛在類別或剖面(e.g., Pastor et al.,2007; Vannucci et al., 2013; Wade, Crosby, & Martin,2006), 所以本研究考慮3和5個類別的情況。
本研究主要通過蒙特卡洛模擬(Monte Carlo simulation, MC)來考查分類精確性指標Entropy受上述因素及其組合影響的情況; 另外我們想通過模擬上述條件下的 Entropy值, 為應(yīng)用研究者提供合理的臨界值。基于以上文獻回顧, 我們提出如下研究假設(shè):首先, 由于 Entropy是衡量分類精確性的指標, 所以 Entropy應(yīng)該與分類精確率之間具有強的正相關(guān)(Lubke & Muthén, 2007)。其次, 我們希望通過此研究驗證Lubke和Muthén (2007)的發(fā)現(xiàn), 即Entropy < 0.60時相當(dāng)于超過20%的個體存在分類錯誤; Entropy≥0.80表明分類準確率超過90%。第三, 在預(yù)實驗中
, 我們發(fā)現(xiàn) Entropy隨樣本量的增加而減小, 在此研究中, 我們預(yù)計會出現(xiàn)同樣的結(jié)果。最后, 基于其他混合模型(Mixture model)的研究結(jié)果(e.g., Lubke & Neale, 2006; Tein et al., 2013;Wurpts & Geiser, 2014), 本研究還假設(shè)指標數(shù)和類別距離對分類精確性有正向的影響作用。plus
7.4 實現(xiàn)(Muthén & Muthén, 1998–2015) 。表1 馬氏距離(MD)與指標均值(指標數(shù)=4)
圖1 k=3指標數(shù)=4 (左圖)和指標數(shù)=20 (右圖)時Entropy和分類錯誤率隨類別距離(MD)和樣本量的變化情況(兩圖的圖例相同)
圖2 k=5指標數(shù)=4 (左圖)和指標數(shù)=20 (右圖)時Entropy和分類錯誤率隨類別距離(MD)和樣本量的變化情況(兩圖的圖例相同)
plus
直接輸出獲得。分類精確率是通過對每個類別的平均后驗概率值 求和再除以類別數(shù)得到, 具體做法是通過平均類別概率矩陣中的斜對角線上的分類確定性概率值獲得。另外,通過平均所有q
值獲得分類錯誤率。p
s < 0.001)。類別數(shù)為3時, Entropy< 0.64相當(dāng)于超過20%的個體存在分類錯誤; Entropy≥ 0.76表明分類準確率超過90%。類別數(shù)為5時,Entropy < 0.68相當(dāng)于超過30%的個體存在分類錯誤; Entropy > 0.84表明分類準確率超過90%。當(dāng)類別數(shù)為3指標數(shù)相同時, Entropy與樣本量的關(guān)系, 雖然不是單調(diào)遞減的形式, 但總體呈下降趨勢, 分類錯誤率隨樣本量的增大總體呈上升趨勢。當(dāng)類別距離達到3時, Entropy明顯高于其他類別距離下的結(jié)果, 分類錯誤率明顯小于其他類別距離下的結(jié)果(以4和20個指標為例, 見圖1)。隨樣本量的增大, 大類別距離的優(yōu)勢更加明顯。多指標數(shù)的情況下, 大樣本量更容易體現(xiàn)類別距離對Entropy和分類錯誤率的影響。類別數(shù)為5的模擬中呈現(xiàn)同樣的結(jié)果(見圖 2)。小樣本的情況下(N
=50~100), Entropy總體上隨指標數(shù)的增多而增大,逐漸接近1, 分類錯誤率逐漸接近0 (見表2)。整體來說, 在各種條件下CLC、ICL_BIC與樣本校正的ICL_BIC變化趨勢一致, 都隨著樣本量的增大而增大, 且類別距離越大, CLC、ICL_BIC與樣本校正的ICL_BIC值越大, 但跨類別距離之間的差異沒有Entropy明顯(以類別數(shù) = 3指標數(shù)為4和類別數(shù) = 5指標數(shù) = 20的CLC為例, 見圖3和圖4)。隨著指標數(shù)的增多, CLC、ICL_BIC與樣本校正的ICL_BIC之間變化的差異越來越小。
近年來 LPA/LCA在心理學(xué)等社會科學(xué)領(lǐng)域逐漸流行, 研究者通常選擇報告 Entropy作為分類精確性的衡量指標, 然而在方法學(xué)文獻中, 缺少考察Entropy在不同條件下表現(xiàn)的研究, 因此有必要探明 Entropy在不同條件下的表現(xiàn)。據(jù)此, 本研究系統(tǒng)考察了樣本量、類別距離、指標數(shù)和類別數(shù)對Entropy及相關(guān)指數(shù)影響的情況。
表2 不同樣本量和類別數(shù)目下Entropy值及對應(yīng)錯誤率
圖3 k=3指標數(shù)=4 CLC隨樣本量和類別距離的變化情況
圖4 k=5指標數(shù)=20 CLC隨樣本量和類別距離的變化情況
k
= 5)的結(jié)果可以發(fā)現(xiàn), 樣本量越大(N
= 250,500, 1000), Entropy的值越小。Lubke和Neale (2006)的研究中也發(fā)現(xiàn)大樣本量的情況下, 更傾向于高估類別數(shù)。在 Lubke和 Muthén (2007)的研究中沒有直接考查 LPA模型中指標數(shù)的變化對分類精確性影響的情況。盡管有研究發(fā)現(xiàn)指標數(shù)越多(指標數(shù) = 6,10, 15), Entropy的結(jié)果越好(N
= 250, 500, 1000;Tein et al., 2013), 但本研究發(fā)現(xiàn)這一規(guī)律只適用于小樣本的情況(N
= 50~100)。隨著樣本量的增大, 先是8個指標數(shù)的情況出現(xiàn)與這一結(jié)果的不一致現(xiàn)象,然后到 12個指標的組合情況。即中等以上的樣本(在本研究中為N
≥ 500)與指標數(shù)交互影響分類精確性的表現(xiàn), 所以不能忽略樣本量的影響而單純通過增多指標數(shù)來獲得好的分類精確性。d
表示, 分別為0.2, 0.5, 0.8, 1.5)。但本研究發(fā)現(xiàn)類別距離對分類精確性的影響依然受樣本量的影響。小樣本情況下(N
= 50~100), 類別距離越大, 分類精確性越好。但是對于更大的類別距離(MD = 3), Entropy明顯高于其他類別距離下的結(jié)果, 分類錯誤率明顯小于其他類別距離下的結(jié)果, 且具有跨樣本量的一致性。隨著樣本量的增大, 類別距離為3的優(yōu)勢更加明顯。當(dāng)類別數(shù)較多的時候(本研究中k
= 5), 大類別距離(MD = 3)的作用更明顯, 尤其是在指標數(shù)少或樣本量大的條件下。顯然, 要得到好的分類精確性, 且不用擔(dān)心樣本量的影響, 類別距離最好達到 3。另外, 盡管類別距離對 Entropy的變式 CLC、ICL_BIC、SaICL_BIC也有一定的影響, 但從這些變式的指數(shù)中可以發(fā)現(xiàn)類別距離對他們的影響比較小, 這主要是因為這些指標考慮了模型復(fù)雜程度,特別是公式包含對數(shù)似然值, 使得各因素對Entropy的影響被稀釋了。因此, 在LPA/LCA分析中采用Entropy衡量精確性比其變式更靈敏。k
= 2)考慮協(xié)變量后的研究結(jié)果表明:Entropy < 0.60時相當(dāng)于超過20%的個體存在分類錯誤; Entropy≥0.80表明分類準確率超過90%。但我們的研究發(fā)現(xiàn), 類別數(shù)為 3的時候, Entropy <0.64時相當(dāng)于超過 20%的個體存在分類錯誤,Entropy≥0.76時表明分類準確率超過 90%; 類別數(shù)為5時, Entropy < 0.68時相當(dāng)于超過30%的個體存在分類錯誤, Entropy > 0.84時表明分類準確率超過 90%。本研究中的 3個類別(k
= 3)時的結(jié)果與Lubke和Muthén (2007) 2個類別(k
= 2)時的結(jié)果相近, 當(dāng)類別數(shù)達到 5的時候, 差異比較大。由此可見, Entropy的表現(xiàn)不僅受協(xié)變量的影響, 還受類別數(shù)的影響。因此, 在選擇哪個臨界值作為 Entropy分類精確性的衡量指數(shù)時, 我們不僅要考慮有沒有協(xié)變量的影響, 還要根據(jù)不同的類別數(shù)進行抉擇。本模擬研究的不足主要有以下幾個方面:首先,與其他模擬研究一樣, 本研究的發(fā)現(xiàn)能否應(yīng)用于模擬之外的模型。例如, 研究只考慮3和5個潛類別的情況, 對于其他潛類別的數(shù)量的研究不一定適用。其次, 我們主要考察的是 LPA, 以后的研究可以探索本研究的結(jié)果能否推廣到其他混合模型。第三, 在當(dāng)前僅有的一項考查了 Entropy與分類精確性的關(guān)系(Lubke & Muthén, 2007)的研究中, 違反局部獨立性假設(shè)時Entropy分類精確性的問題并沒有被探究。而在有些情況下, 局部獨立性假設(shè)很難滿足。將來的研究可以探究違反局部獨立性時Entropy的表現(xiàn)。第四, 本研究考查的LPA模型并沒有考慮協(xié)變量的情況, 將來的研究可以對協(xié)變量的影響進行系統(tǒng)考查。最后, 我們擬合的是真模型,在實踐中可能存在高估或低估類別數(shù)的情況, 因此在誤設(shè)模型下, Entropy的表現(xiàn)也是未來研究的一個重要議題。
總的來說, 本研究首次系統(tǒng)地研究了樣本量、類別距離、指標數(shù)和類別數(shù)對分類精確性指標Entropy在LPA中的表現(xiàn)。隨著LPA/LCA這些處理潛變量的統(tǒng)計模型的廣泛應(yīng)用, 本研究的結(jié)果對應(yīng)用研究者而言有很大的參考價值。
基于本研究的發(fā)現(xiàn), 下面總結(jié)了幾點結(jié)論和為應(yīng)用研究者建議。
(1) 由于 Entropy受多種因素影響, 實踐中的模型各不相同, 因此不存在絕對的臨界值。但當(dāng)實際的模型與我們模擬的條件類似時可以參考表2和網(wǎng)絡(luò)版附表1-2的Entropy值及對應(yīng)的錯誤率。
(2) 其他條件不變的情況下, 樣本量越大Entropy的值越小, 分類精確性越差。因此從分類精確性的角度來說, 樣本量并非越多越好, 小樣本進行LPA分析是可行。另外, 當(dāng)小樣本(N
=50~100)時,指標數(shù)越多Entropy的結(jié)果越好。因此, 實踐中處理小樣本時可以通過增加指標數(shù)來提高分類精確性。(3) 盡管本研究發(fā)現(xiàn)類別距離對分類精確性影響最大, 但實際分析之前是不知道分類距離的, 所以在實踐中盡可能的抽取有代表性的樣本并盡可能的擴大群體異質(zhì)性。
致謝:
本文作者衷心感謝三位匿名評審專家對本文提出的修改意見和建議。感謝澳洲國立大學(xué)壽懿赟博士幫助修改英文摘要。Asparouhov, T., & Muthén, B. (2014). Auxiliary variables in mixture modeling: Three-step approaches using Mplus.Structural Equation Modeling: A Multidisciplinary Journal,21
, 329–341.Biernacki, C., Celeux, G., & Govaert, G. (2000). Assessing a mixture model for clustering with the integrated completed likelihood.IEEE Transactions on Pattern Analysis & Machine Intelligence, 22
, 719–725.Biernacki, C., & Govaert, G. (1997).Using the classification likelihood to choose the number of clusters
.Computing Science and Statistics
, 29, 451–457.Carragher, N., Adamson, G., Bunting, B., & McCann, S. (2009).Subtypes of depression in a nationally representative sample.Journal of Affective Disorders, 113
, 88–99.Celeux, G., & Soromenho, G. (1996). An entropy criterion for assessing the number of clusters in a mixture model.Journal of Classification
,13
, 195–212.Collins, L. M., & Lanza, S. T. (2009).Latent class and latent transition analysis: With applications in the social, behavioral,and health sciences
. London: John Wiley & Sons, Inc.Helzer, J. E., Kraemer, H. C., & Krueger, R. F. (2006). The feasibility and need for dimensional psychiatric diagnoses.Psychological Medicine, 36
, 1671–1680.Hou, J. T., Wen, Z. L., & Cheng, Z. J. (2004).Structural equation model and its applications.
Beijing: Education Science Press.[侯杰泰, 溫忠麟, 成子娟. (2004).結(jié)構(gòu)方程模型及其應(yīng)用
.北京: 教育科學(xué)出版社.]Kim, S. Y. (2012). Sample size requirements in single- and multiphase growth mixture models: A Monte Carlo simulation study.Structural Equation Modeling, 19
, 457–476.Kyriakopoulos, M., Stringaris, A., Manolesou, S., Radobuljac,M. D., Jacobs, B., Reichenberg, A., … Frangou, S. (2015).Determination of psychosis-related clinical profiles in children with autism spectrum disorders using latent class analysis.European Child & Adolescent Psychiatry, 24
, 301–307.Lanza, S. T., Rhoades, B. L., Greenberg, M. T., Cox, M., &The Family Life Project Key Investigators. (2011). Modeling multiple risks during infancy to predict quality of the caregiving environment: Contributions of a person-centered approach.Infant Behavior and Development, 34
, 390–406.Lazarsfeld, P. F., & Henry, N. W. (1968).Latent structure analysis
. Boston: Houghton Mifflin.Lubke, G. H., & Miller, P. J. (2015). Does nature have joints worth carving? A discussion of taxometrics, model-based clustering and latent variable mixture modeling.Psychological Medicine, 45
, 705–715.Lubke, G., & Muthén, B. O. (2007). Performance of factor mixture models as a function of model size, covariate effects,and class-specific parameters.Structural Equation Modeling,14
, 26–47.Lubke, G., & Neale, M. C. (2006). Distinguishing between latent classes and continuous factors: Resolution by maximum likelihood?Multivariate Behavioral Research, 41
, 499– 532.Lubke, G. H., & Tueller, S. (2010). Latent class detection and class assignment: A comparison of the MAXEIG taxometric procedure and factor mixture modeling approaches.Structural Equation Modeling, 17
, 605–628.Marsh, H. W., Hau, K. T., & Wen, Z. L. (2004). In search of golden rules: Comment on hypothesis-testing approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler’s (1999) findings.Structural Equation Modeling, 11
, 320–341.McLachlan, G. J., & Peel, D. (2000).Finite mixture models.
New York, NY: Wiley.McClintock, M. K., Dale, W., Laumann, E. O., & Waite, L.(2016). Empirical redefinition of comprehensive health and well-being in the older adults of the United States.Proceedings of the National Academy of Sciences of the United States of America, 113
, E3071–E3080.Meehl, P. E. (1995). Bootstraps taxometrics: Solving the classification problem in psychopathology.American Psychologist, 50
, 266–275.Mokros, A., Hare, R. D., Neumann, C. S., Santtila, P., Habermeyer,E., & Nitschke, J. (2015). Variants of psychopathy in adult male offenders: A latent profile analysis.Journal of Abnormal Psychology, 124
, 372–386.Muthén, B. (2004). Latent variable analysis: growth mixture modeling and related techniques for longitudinal data. In D.Kaplan (Eds.),The SAGE handbook of quantitative methodology for the social sciences
(pp. 345–368).
Thousand Oaks, CA:Sage Publications.Muthén, L. K., & Muthén, B. O. (1998–2015).Mplus user’s guide (7.4 Ed.)
. Los Angeles, CA: Muthén & Muthén.Nylund, K. L., Asparouhov, T., & Muthén, B. O. (2007).Deciding on the number of classes in latent class analysis and growth mixture modeling: A Monte Carlo simulation study.Structural Equation Modeling, 14
, 535–569.Pastor, D. A., Barron, K. E., Miller, B. J., & Davis, S. L.(2007). A latent profile analysis of college students’achievement goal orientation.Contemporary Educational Psychology, 32
, 8–47.Paxton, P., Curran, P. J., Bollen, K. A., Kirby, J., & Chen, F. N.(2001). Monte Carlo experiments: Design and implementation.Structural Equation Modeling, 8
, 287–312.Peugh, J., & Fan, X. T. (2013). Modeling unobserved heterogeneity using latent profile analysis: A Monte Carlo simulation.Structural Equation Modeling, 20
, 616–639.Ruscio, J., Haslam, N., & Ruscio, A. M. (2006).Introduction to the taxometric method: A practical guide.
London: Routledge.Sterba, S. K. (2013). Understanding linkages among mixture models.Multivariate Behavioral Research, 48
, 775–815.Tein, J. Y., Coxe, S., & Cham, H. (2013). Statistical power to detect the correct number of classes in latent profile analysis.Structural Equation Modeling, 20
, 640–657.Tofighi, D., & Enders, C. K. (2008). Identifying the correct number of classes in growth mixture models. In G. R.Hancock & K. M. Samuelsen (Eds.),Advances in latent variable mixture models
(pp. 317–341). Greenwich, CT:Information Age Pub.Vannucci, A., Tanofsky-Kraff, M., Crosby, R. D., Ranzenhofer,L. M., Shomaker, L. B., Field, S. E., ... & Yanovski, J. A.(2013). Latent profile analysis to determine the typology of disinhibited eating behaviors in children and adolescents.Journal of Consulting and Clinical Psychology, 81
, 494–507.Wade, T. D., Crosby, R. D., & Martin, N. G. (2006). Use of latent profile analysis to identify eating disorder phenotypes in an adult Australian twin cohort.Archives of General Psychiatry, 63
, 1377–1384.Wang, M. C. (2014).Latent variable modeling with Mplus
.Chongqing: Chongqing University Press.[王孟成. (2014).潛變量建模與Mplus應(yīng)用
. 重慶: 重慶大學(xué)出版社.]Wang, M. C., Bi, X. Y., & Ye, H. S. (2014). Growth mixture modeling: A method for describing specific class growth trajectory.Social Studies, 29
, 220–241.[王孟成, 畢向陽, 葉浩生. (2014). 增長混合模型——分析不同類別個體發(fā)展趨勢.社會學(xué)研究, 29
, 220–241.]Wang, M., & Hanges, P. J. (2011). Latent class procedures:Applications to organizational research.Organizational Research Methods, 14
, 24–31.Widiger, T. A., Livesley, W. J., & Clark, L. A. (2009). An integrative dimensional classification of personality disorder.Psychological Assessment, 21
, 243–255.Widiger, T. A., & Samuel, D. B. (2005). Diagnostic categories or dimensions? A question for the diagnostic and statistical manual of mental disorders—fifth edition.Journal of Abnormal Psychology, 114
, 494–504.Wurpts, I. C., & Geiser, C. (2014). Is adding more indicators to a latent class analysis beneficial or detrimental? Results of a Monte-Carlo study.Frontiers in Psychology, 5
, 920.Yang, C. C. (2006). Evaluating latent class analysis models in qualitative phenotype identification.Computational Statistics& Data Analysis, 50
, 1090–1104.Zachar, P., & Kendler, K. S. (2007). Psychiatric disorders: a conceptual taxonomy.American Journal of Psychiatry, 164
,557–565.Zhang, J. T., Jiao, C., & Zhang, M. Q. (2010). Application of latent class analysis in psychological research.Advances in Psychological Science, 18
, 1991–1998.[張潔婷, 焦璨, 張敏強. (2010). 潛在類別分析技術(shù)在心理學(xué)研究中的應(yīng)用.心理科學(xué)進展, 18
, 1991–1998.]附錄:
數(shù)據(jù)生成與分析的Mplus
語句(指標數(shù)=4, 類別數(shù)=3,類別距離=0.5, 樣本量=50)