喬欣宇 馮詠琳 潘俊豪
(中山大學(xué)心理學(xué)系,廣州 510006)
在心理學(xué)和管理學(xué)等領(lǐng)域,研究者通常使用問(wèn)卷測(cè)量人格和智力等不能直接觀測(cè)的潛變量。針對(duì)這些變量,研究者可以使用潛變量建模的方法進(jìn)行統(tǒng)計(jì)分析。用于反映潛變量的若干個(gè)可觀測(cè)變量,如問(wèn)卷中的多個(gè)測(cè)量條目,被稱為外顯變量?;诮Y(jié)構(gòu)方程模型的方法,研究者可以分析潛變量之間的關(guān)系。結(jié)構(gòu)方程模型在建模分析過(guò)程中考慮了外顯變量的測(cè)量誤差,可以獲得更準(zhǔn)確的變量間關(guān)系的估計(jì)。常用的驗(yàn)證性因子分析模型、中介效應(yīng)分析模型和增長(zhǎng)曲線模型等都可以使用結(jié)構(gòu)方程模型的形式表征。
結(jié)構(gòu)方程模型的估計(jì)主要有頻率學(xué)派方法和貝葉斯方法兩類。貝葉斯結(jié)構(gòu)方程模型是貝葉斯估計(jì)在結(jié)構(gòu)方程模型中的應(yīng)用,在2012年由Muthén和Asparouhov提出,是相對(duì)于傳統(tǒng)極大似然方法更加靈活的一種新方法。van de Schoot等(2017)的統(tǒng)計(jì)結(jié)果顯示,自2012年以來(lái),貝葉斯結(jié)構(gòu)方程模型得到了越來(lái)越多應(yīng)用研究者的青睞。
本文首先簡(jiǎn)單介紹貝葉斯分析的基本概念和優(yōu)勢(shì),隨后針對(duì)貝葉斯結(jié)構(gòu)方程模型估計(jì)中的先驗(yàn)設(shè)置、敏感性分析、后驗(yàn)分布的計(jì)算、模型收斂判斷以及模型擬合評(píng)估等問(wèn)題進(jìn)行基本的介紹,最后采用一個(gè)例子演示貝葉斯結(jié)構(gòu)方程模型的建模過(guò)程,有助于國(guó)內(nèi)心理學(xué)研究者了解貝葉斯結(jié)構(gòu)方程模型在處理交叉載荷、局部依賴性和小樣本等問(wèn)題的建模優(yōu)勢(shì),并將其用于解決自己的研究問(wèn)題。
對(duì)比傳統(tǒng)的頻率學(xué)派的方法(如極大似然估計(jì)方法),貝葉斯估計(jì)方法的優(yōu)勢(shì)在于可以在參數(shù)估計(jì)的過(guò)程中結(jié)合已有的知識(shí)或背景信息?;谪惾~斯估計(jì)框架,研究者可以得到模型未知參數(shù)的分布,而非具體的點(diǎn)估計(jì)值。貝葉斯估計(jì)方法與傳統(tǒng)的頻率學(xué)派的方法的本質(zhì)區(qū)別在于如何定義模型中的未知參數(shù)。
頻率學(xué)派使用樣本估計(jì)參數(shù)對(duì)總體參數(shù)進(jìn)行估計(jì),將模型的待估計(jì)參數(shù)視作常數(shù),基于模型得到的參數(shù)點(diǎn)估計(jì)值在最大程度上代表樣本數(shù)據(jù),被認(rèn)為是總體參數(shù)的最佳估計(jì)值,不同模型得到的參數(shù)的估計(jì)值不同(王孟成等,2017;Depaoli,2021)。在使用頻率學(xué)派的方法時(shí),研究者使用標(biāo)準(zhǔn)誤或者置信區(qū)間量化參數(shù)點(diǎn)估計(jì)值不確定性。
與頻率學(xué)派的方法相同,貝葉斯估計(jì)方法也認(rèn)為樣本數(shù)據(jù)隨機(jī)來(lái)自一個(gè)特定分布的總體。但不同的是,貝葉斯估計(jì)方法認(rèn)為參數(shù)是隨機(jī)的,研究者可以通過(guò)先驗(yàn)分布表示參數(shù)取不同值的可能性(王孟成等,2017;Depaoli,2021),并基于參數(shù)的后驗(yàn)分布得到貝葉斯95%可信區(qū)間。貝葉斯可信區(qū)間的解釋與頻率學(xué)派的方法不同,它被解釋為該區(qū)間包含參數(shù)總體真值的可能性(Depaoli,2021)。
貝葉斯定理是貝葉斯估計(jì)方法中的一個(gè)重要部分,對(duì)于觀測(cè)到的樣本數(shù)據(jù)y以及模型參數(shù)θ,貝葉斯定理如公式(1)所示,其中p(θ|y)表示在該樣本數(shù)據(jù)中,模型參數(shù)值出現(xiàn)的概率,即參數(shù)的后驗(yàn)概率;p(y|θ)表示該參數(shù)值下的樣本數(shù)據(jù)出現(xiàn)的概率;p(θ)表示該參數(shù)的先驗(yàn)概率信息,反映了在總體樣本中,參數(shù)不同取值的可能性。
在貝葉斯估計(jì)中,研究者需要基于已有的信息對(duì)參數(shù)的分布形態(tài)和可能的取值范圍進(jìn)行估計(jì),即設(shè)定模型參數(shù)的先驗(yàn)分布以及相應(yīng)的超參數(shù)?;诠剑?),研究者可以得到參數(shù)的后驗(yàn)分布,并基于后驗(yàn)分布的均值、中位數(shù)或眾數(shù)等得到參數(shù)的后驗(yàn)點(diǎn)估計(jì)值。
以包含p個(gè)測(cè)量條目和q個(gè)潛因子(p>q)的驗(yàn)證性因子分析模型為例,具體介紹貝葉斯結(jié)構(gòu)方程模型。該驗(yàn)證性因子分析模型如公式(2)所示。
其中yi為代表p×1的連續(xù)觀測(cè)數(shù)據(jù)向量;μ為表示p×1的截距向量;Λ為一個(gè)p×q的因子載荷矩陣,表示觀測(cè)變量與潛變量之間的關(guān)系;ωi表示一個(gè)q×1的因子分?jǐn)?shù)向量;εi為一個(gè)p×1的測(cè)量誤差(殘差)向量,服從均值為0,方差為Ψ的多元正態(tài)分布。在傳統(tǒng)頻率學(xué)派估計(jì)方法中,交叉載荷以及殘差協(xié)方差參數(shù)被嚴(yán)格限制為0,因此,Ψ為一個(gè)對(duì)角矩陣,Λ中一個(gè)條目?jī)H對(duì)應(yīng)一個(gè)因子。
在貝葉斯結(jié)構(gòu)方程模型中,研究者可以將根據(jù)已有理論或者研究結(jié)果為驗(yàn)證性因子分析中的未知參數(shù)θ=(μ,Λ,Ψ,ω)設(shè)定有信息的先驗(yàn)分布、弱信息先驗(yàn)分布或方差很大的無(wú)信息先驗(yàn)分布,并結(jié)合樣本信息以及先驗(yàn)信息使用馬爾科夫鏈蒙特卡洛算法(Markov Chain Monte Carlo;MCMC)估計(jì)方法得到未知參數(shù)的后驗(yàn)分布。
對(duì)比頻率學(xué)派的估計(jì)方法,貝葉斯結(jié)構(gòu)方程模型可以有效估計(jì)參數(shù)較多的復(fù)雜模型以及釋放嚴(yán)格的模型假設(shè)。例如,在傳統(tǒng)的極大似然方法中,不重要的交叉載荷或者殘差協(xié)方差參數(shù)通常都被嚴(yán)格固定為0。而這種嚴(yán)格的限制一方面并不能真實(shí)反映實(shí)際的測(cè)量情景,另一方面也可能會(huì)導(dǎo)致模型擬合不佳以及參數(shù)估計(jì)不準(zhǔn)確(Asparouhov &Muthén,2009;Marsh et al.,2013)。已有研究者指出,這種針對(duì)交叉載荷以及殘差協(xié)方差參數(shù)的嚴(yán)格限制是不合理的,即使在一個(gè)單維的量表中,題目之間仍然可能存在除共同的潛變量外的其他因素導(dǎo)致條目之間存在較小的相關(guān)關(guān)系(Zyphur&Oswald,2013)。如 Golay等(2013)使用貝葉斯結(jié)構(gòu)方程模型自由估計(jì)了被嚴(yán)格限制為0的交叉載荷參數(shù),結(jié)果發(fā)現(xiàn),與4因子結(jié)構(gòu)和高階模型相比,包含5個(gè)因子加上一般智力因子的直接分層CHC模型(Cattell-Horn-Carroll model,CHC)更能代表韋氏第四版兒童智力量表的結(jié)構(gòu)。Guo等(2019)的文章使用了 CFA、以及針對(duì)殘差協(xié)方差參數(shù)設(shè)置先驗(yàn)的 BSEM(Bayesian Structural Equation Model with Residual Covariance Priors,BSEM-RC)方法重新擬合了大五人格問(wèn)卷,研究結(jié)果發(fā)現(xiàn)使用BSEM-RC方法所得到的因子間的相關(guān)更低。因此,有必要對(duì)可能存在的交叉載荷以及殘差協(xié)方差參數(shù)進(jìn)行建模。
傳統(tǒng)的頻率學(xué)派的估計(jì)方法處理該問(wèn)題時(shí)存在較多局限,如使用模型修正指數(shù)方法一次只能修正一個(gè)參數(shù),如果模型中存在多個(gè)交叉載荷或殘差協(xié)方差參數(shù),使用該方法較為繁瑣且耗時(shí)較長(zhǎng),模型修正結(jié)果依賴模型中的參數(shù)修正順序及數(shù)量,且沒(méi)有一個(gè)較為明確且通用的停止模型修正的規(guī)則,研究者通?;谧约旱闹饔^經(jīng)驗(yàn)確定是否停止修正(Hill et al.,2007)。此外,如果釋放較多的參數(shù)自由估計(jì),模型可能無(wú)法識(shí)別,從而不能進(jìn)行參數(shù)估計(jì),導(dǎo)致不能得到結(jié)果(Asparouhov et al.,2015)。
而貝葉斯結(jié)構(gòu)方程模型在處理該問(wèn)題上具有一定的靈活性。它通過(guò)設(shè)置均值為0、方差較小的先驗(yàn),放寬將不重要的參數(shù)嚴(yán)格設(shè)置為零的假設(shè),如允許小交叉載荷或殘差協(xié)方差的出現(xiàn),并允許這些參數(shù)自由估計(jì),嘗試解決在傳統(tǒng)方法下模型的限制條件過(guò)于嚴(yán)格的問(wèn)題,兼顧了模型的可識(shí)別性與靈活性(Muthén&Asparouhov,2012)。相較于傳統(tǒng)頻率學(xué)方法,這種靈活性使得貝葉斯方法能夠處理更加復(fù)雜的數(shù)據(jù)類型和模型,比如數(shù)據(jù)缺失和殘差動(dòng)態(tài)結(jié)構(gòu)方程模型等。此外,貝葉斯結(jié)構(gòu)方程模型也可以得到關(guān)于交叉載荷參數(shù)以及殘差協(xié)方差參數(shù)的后驗(yàn)分布信息。
此外,貝葉斯結(jié)構(gòu)方程模型在小樣本中的表現(xiàn)更好,有利于緩解統(tǒng)計(jì)時(shí)樣本量不足的問(wèn)題。傳統(tǒng)極大似然估計(jì)通常假設(shè)需要大樣本,Lee和Song(2004)的研究發(fā)現(xiàn),當(dāng)對(duì)結(jié)構(gòu)方程模型使用極大似然估計(jì)時(shí),樣本量與模型參數(shù)數(shù)量的比值需高于5:1時(shí)才能得到準(zhǔn)確的參數(shù)估計(jì);而實(shí)際應(yīng)用中對(duì)樣本量的要求往往更加嚴(yán)格,可能需要樣本量與模型參數(shù)數(shù)量的比值達(dá)到10:1或20:1。而貝葉斯分析不像頻率學(xué)方法那樣假設(shè)大樣本,在相對(duì)較小的樣本量下也能得到比較高的檢驗(yàn)力(Lee &Song,2004;van de Schoot et al.,2015)。并且與先驗(yàn)信息相結(jié)合是貝葉斯估計(jì)的一大亮點(diǎn),先驗(yàn)信息和樣本數(shù)據(jù)信息共同影響參數(shù)的后驗(yàn)分布。小樣本情況下,樣本數(shù)據(jù)提供的信息較少并存在抽樣誤差,而對(duì)感興趣的參數(shù)設(shè)置具體的先驗(yàn)信息可以為模型估計(jì)提供一部分信息,且此時(shí)先驗(yàn)信息對(duì)參數(shù)后驗(yàn)分布的影響程度強(qiáng)于樣本信息,從而解決有偏的參數(shù)估計(jì)問(wèn)題和低檢驗(yàn)力的問(wèn)題(McNerish,2016;van de Schoot et al.,2015;Zondervan-Zwijnenburg et al.,2019)。
Smid等(2020)系統(tǒng)綜述了貝葉斯結(jié)構(gòu)方程模型在小樣本在參數(shù)估計(jì)上相對(duì)頻率的優(yōu)勢(shì)。樣本量與模型未知參數(shù)數(shù)量的比值小于2:1時(shí)通常被認(rèn)為是小樣本。綜述結(jié)果發(fā)現(xiàn)當(dāng)樣本很小時(shí),頻率方法確實(shí)可能導(dǎo)致嚴(yán)重的有偏估計(jì)和不收斂的解的問(wèn)題,而貝葉斯估計(jì)可以是一個(gè)可行的替代方法。具體而言,貝葉斯估計(jì)相比頻率估計(jì)表現(xiàn)出更優(yōu)的覆蓋率和檢驗(yàn)力,在結(jié)構(gòu)參數(shù)的后驗(yàn)分布點(diǎn)估計(jì)上也有更準(zhǔn)確的表現(xiàn)。但是作者也強(qiáng)調(diào)研究者在使用先驗(yàn)解決小樣本問(wèn)題時(shí)最好不要使用軟件的默認(rèn)無(wú)信息先驗(yàn)。因?yàn)槟J(rèn)先驗(yàn)可能導(dǎo)致有偏的方差參數(shù)估計(jì),而這個(gè)問(wèn)題只能通過(guò)結(jié)合先驗(yàn)信息來(lái)解決。研究者應(yīng)該更加積極地思考先驗(yàn)超參數(shù),設(shè)置有信息先驗(yàn)以解決小樣本帶來(lái)的問(wèn)題。
總的來(lái)說(shuō),貝葉斯方法對(duì)樣本量的要求更低,在小樣本條件下能夠避免嚴(yán)重的參數(shù)估計(jì)偏差,能夠處理更加復(fù)雜的數(shù)據(jù),可以分析傳統(tǒng)頻率學(xué)派下無(wú)法實(shí)現(xiàn)的復(fù)雜模型,能夠提供更多關(guān)于參數(shù)估計(jì)和模型擬合的信息(張瀝今等,2019;McNeish,2016;Muthén &Asparouhov,2012;Smid &Winter,2020)。此外,BSEM建模可以檢測(cè)傳統(tǒng)的CFA模型所忽略的交叉載荷與殘差協(xié)方差問(wèn)題,同時(shí)避免了由于估計(jì)參數(shù)較多、模型過(guò)于復(fù)雜而不可識(shí)別的難題(Guo et al.,2019)。
與貝葉斯結(jié)構(gòu)方程模型處理模型中的交叉載荷參數(shù)、殘差協(xié)方差參數(shù)嚴(yán)格為0的假設(shè)的思路一致,針對(duì)多組結(jié)構(gòu)方程模型,研究者同樣可以對(duì)參數(shù)的跨組差異值設(shè)置合適的先驗(yàn)(如均值為0,方差較小的正態(tài)分布),從而放寬在多組結(jié)構(gòu)方程模型中參數(shù)嚴(yán)格跨組不變的限制,得到更為準(zhǔn)確的參數(shù)估計(jì)結(jié)果(Asparouhov &Muthén,2014)。張瀝今等(2019)的文章中介紹了其他類型的貝葉斯結(jié)構(gòu)方程模型,宋瓊雅等(2021)的文章針對(duì)貝葉斯?jié)u近測(cè)量不變性,詳細(xì)介紹了該方法的原理及優(yōu)勢(shì),感興趣的讀者可以參考他們的文章深入了解貝葉斯結(jié)構(gòu)方程模型。
模型中未知參數(shù)的先驗(yàn)分布是貝葉斯結(jié)構(gòu)方程模型中的重要組成部分。先驗(yàn)信息包含了先前的結(jié)論或前人研究的經(jīng)驗(yàn)與結(jié)果,反映了研究者對(duì)待估計(jì)參數(shù)的了解程度,先驗(yàn)信息的豐富程度可以通過(guò)不同的超參數(shù)設(shè)定呈現(xiàn)。常見(jiàn)的超參數(shù)有先驗(yàn)分布均值和先驗(yàn)分布方差,前者反映了研究者基于已有的研究結(jié)果和理論知識(shí)對(duì)特定參數(shù)所確定的估計(jì)值,后者反映了研究者對(duì)其估計(jì)均值的相信程度,方差越小表示研究者對(duì)先驗(yàn)均值的信心越多(Liang et al.,2020)。
van de Schoot等(2013)認(rèn)為可以在研究理論、先驗(yàn)信息的豐富程度以及研究者對(duì)先驗(yàn)的確信程度的基礎(chǔ)上為參數(shù)設(shè)置不同類別的先驗(yàn)分布?;谒男畔⒊潭龋闰?yàn)可以分為有信息先驗(yàn)、弱信息先驗(yàn)和無(wú)信息先驗(yàn)。在傳統(tǒng)方法中,每個(gè)研究的假設(shè)總是基于當(dāng)前研究者的信念,而前人研究的結(jié)果未能在新的研究中起到最大的指引作用。貝葉斯分析中先驗(yàn)信息與觀測(cè)數(shù)據(jù)的結(jié)合有效改進(jìn)了這一點(diǎn),真正將前人研究的結(jié)果運(yùn)用在后續(xù)研究的分析之中,體現(xiàn)了知識(shí)的累積和與理論的進(jìn)步,相較于傳統(tǒng)方法更具優(yōu)勢(shì)(王孟成,畢向陽(yáng),2018;Muthén &Asparouhov,2012)。
對(duì)于貝葉斯結(jié)構(gòu)方程模型中不同的參數(shù),為保證模型可以被識(shí)別并估計(jì),研究者在考慮有關(guān)模型參數(shù)已有信息的同時(shí),對(duì)于不同類型的參數(shù)通常會(huì)選擇不同的先驗(yàn)分布形式。Mplus(Muthén &Muthén,1998—2017)和R語(yǔ)言中的blavaan軟件包(Merkle &Rosseel,2015)是在進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模過(guò)程中常使用的工具,表1總結(jié)了這兩個(gè)工具中不同參數(shù)的默認(rèn)先驗(yàn)形式與默認(rèn)先驗(yàn)超參數(shù)。
表1 Mplus 與blavaan 軟件包中不同參數(shù)的默認(rèn)先驗(yàn)形式與默認(rèn)先驗(yàn)超參數(shù)
對(duì)于貝葉斯結(jié)構(gòu)方程模型中的因子載荷、截距、斜率與回歸系數(shù),正態(tài)分布先驗(yàn)最為常用,表示為N[μ,σ2],μ其中為平均超參數(shù),決定了先驗(yàn)分布的中心,而σ2為方差超參數(shù),方差越小表明研究者對(duì)參數(shù)值的確信程度越高,信息量越大,而大方差表明研究者對(duì)參數(shù)值的確信程度更低,信息量較小。Mplus中默認(rèn)的超參數(shù)設(shè)置為N[0,1010],為無(wú)信息先驗(yàn);blavaan軟件包相較于Mplus中的默認(rèn)先驗(yàn)形式有所不同,測(cè)量截距的默認(rèn)先驗(yàn)為N[0,1000],截距、載荷以及回歸系數(shù)的默認(rèn)先驗(yàn)則為N[0,100]。
對(duì)于貝葉斯結(jié)構(gòu)方程模型中的方差協(xié)方差矩陣,常用的先驗(yàn)形式為逆Wishart分布,可以表示為IW[s,df],即當(dāng)存在q個(gè)因子(測(cè)量條目)時(shí),s是一個(gè)大小為q×q的正定矩陣,df則是一個(gè)表示自由度的整數(shù),通過(guò)改變df的大小可以為先驗(yàn)分布指定不同豐富程度的信息量,df越大表示對(duì)先驗(yàn)的確信程度越高(Barnard et al.,2000)。在軟件Mplus中,對(duì)于連續(xù)變量以及類別變量的方差協(xié)方差矩陣,所使用的默認(rèn)先驗(yàn)不同,連續(xù)變量的默認(rèn)先驗(yàn)為IW[0,-p-1],類別變量的則為IW[0,p+1],其中p為變量的數(shù)量,I為單位矩陣(Muthén &Muthén,1998—2017)。
對(duì)于殘差方差,常用的先驗(yàn)分布形式為逆Gamma分布,表示為IG[α,β],其中α為形狀超參數(shù),不同的α表示分布曲線形狀不同;β為尺度超參數(shù),在α大小不改變的條件下,不同大小的β會(huì)使得曲線以等比例放大或縮小。在Mplus中,默認(rèn)先驗(yàn)為IG[-1,0]。相較于正態(tài)分布先驗(yàn)和逆Wishart分布先驗(yàn)的超參數(shù)設(shè)置,逆Gamma分布先驗(yàn)的超參數(shù)設(shè)置顯得不那么直觀。根據(jù)Gelman等(2013)的建議,為確定這些超參數(shù)的值,可以使用來(lái)自先前研究(前人觀察樣本、前人研究或試點(diǎn)研究)的信息,以通過(guò)先前研究樣本量的作為超參數(shù)α,而超參數(shù)β可以被計(jì)算為先前研究樣本量的乘以先前研究的方差估計(jì)。假設(shè)研究者在試點(diǎn)研究中收集了20個(gè)參與者的數(shù)據(jù)并對(duì)模型進(jìn)行評(píng)估,對(duì)于某個(gè)條目的殘差方差估計(jì)為2,這時(shí)超參數(shù),超參數(shù),即可以在后續(xù)研究中對(duì)該條目的殘差方差設(shè)置IG[10,20]的先驗(yàn)。如果研究者對(duì)于先驗(yàn)不是十分確信,可以通過(guò)用較小的值代替先前研究的樣本量來(lái)增加先驗(yàn)中的不確定性,如將α設(shè)置為編碼樣本量里的,而將β設(shè)置為編碼樣本量的乘以先前研究的方差估計(jì)。根據(jù)這種情況,在上述例子中,超參數(shù),超參數(shù),可以在后續(xù)研究中對(duì)該條目的殘差方差設(shè)置IG[5,10]的先驗(yàn)。對(duì)于殘差方差的倒數(shù)形式,即殘差精度,常用的先驗(yàn)形式則為Gamma分布,表示為G[α,β],α和β同樣分別為形狀超參數(shù)與尺度超參數(shù)。
對(duì)于相關(guān)系數(shù),通常會(huì)為其設(shè)置均勻分布先驗(yàn),表示為U[l,u],其中超參數(shù)l和u分別表示上界和下界,這些超參數(shù)通常以±1為界(van Erp et al.,2018)。除Mplus與blavaan外,還有如Stan,Amos,WinBUGS等軟件可以實(shí)現(xiàn)貝葉斯結(jié)構(gòu)方程建模,其默認(rèn)先驗(yàn)的設(shè)置可以參考van Erp等(2018)的研究。
綜上,在各種軟件中一般都默認(rèn)是無(wú)信息先驗(yàn),當(dāng)對(duì)參數(shù)設(shè)置該類型先驗(yàn)時(shí),參數(shù)的后驗(yàn)分布更多取決于數(shù)據(jù)中包含的信息,這使得研究者們不用為參數(shù)的先驗(yàn)設(shè)置而煩惱,提供了便捷使用貝葉斯結(jié)構(gòu)方程模型的方式(Smid&Winter,2020;van Erp et al.,2018)。根據(jù)van de Schoot等(2017)的綜述,在1990年到2015年的近25年中,研究者們?cè)谑褂秘惾~斯方法進(jìn)行心理學(xué)領(lǐng)域研究時(shí)經(jīng)常依賴于軟件的默認(rèn)先驗(yàn)(26.3%),在已發(fā)表的文章中使用無(wú)信息或弱信息先驗(yàn)的研究占42.1%。然而,也有很多研究者指出,使用默認(rèn)的無(wú)信息先驗(yàn)并不能最大程度地發(fā)揮貝葉斯方法相較于傳統(tǒng)方法更加靈活的優(yōu)勢(shì),因?yàn)榍叭搜芯康谋尘爸R(shí)并不能有效通過(guò)默認(rèn)先驗(yàn)納入當(dāng)前分析,并且在小樣本情況下,軟件的默認(rèn)先驗(yàn)分布可能并不合適,希望默認(rèn)先驗(yàn)?zāi)茏畲笙薅润w現(xiàn)數(shù)據(jù)信息的想法可能會(huì)在小樣本中導(dǎo)致參數(shù)估計(jì)存在嚴(yán)重偏差(Smid &Winter,2020;Smid,McNeish,et al.,2020;van de Schoot et al.,2018)。
基于以上使用默認(rèn)先驗(yàn)可能導(dǎo)致的偏差,許多研究都推薦在貝葉斯結(jié)構(gòu)方程模型中對(duì)部分參數(shù)設(shè)置有信息的先驗(yàn)(Depaoli,2014;Gelman et al.,2013;McNeish,2016;Smid,Depaoli,et al.,2020)。Smid和Winter(2020)為研究者提供了選擇正確先驗(yàn)的指導(dǎo),了解未知參數(shù)值的合理范圍是避免使用不合理先驗(yàn)的關(guān)鍵。研究者可以考慮從前人文獻(xiàn)的結(jié)果中提取信息,或是考慮研究中讓所使用的問(wèn)卷與量表能夠得到分?jǐn)?shù)的合理范圍,亦或是詢問(wèn)相關(guān)領(lǐng)域?qū)<业膶I(yè)建議,從而為參數(shù)設(shè)置正確的先驗(yàn)分布。例如,根據(jù)Muthén和Asparouhov(2012),對(duì)于正態(tài)分布先驗(yàn),設(shè)置均值為0的小方差正態(tài)分布先驗(yàn)?zāi)軌蚋訙?zhǔn)確地反映出實(shí)質(zhì)性的理論,當(dāng)對(duì)于因子載荷設(shè)置N[0,0.01]的先驗(yàn)分布時(shí),因子載荷后驗(yàn)分布的95%可信區(qū)間將在-0.2與0.2之間;而對(duì)于逆Wishart分布先驗(yàn),推薦選擇自由度df≥p+4,其中p為變量的數(shù)量,以保證獲得可識(shí)別的后驗(yàn)分布。當(dāng)對(duì)于殘差協(xié)方差,設(shè)置IW[l,p+6]的先驗(yàn)分布,在該先驗(yàn)下殘差協(xié)方差的兩個(gè)標(biāo)準(zhǔn)差范圍為-0.2至0.2。
在使用貝葉斯結(jié)構(gòu)方程模型分析數(shù)據(jù)時(shí),研究者需要謹(jǐn)慎選擇先驗(yàn),因?yàn)椴煌南闰?yàn)設(shè)置可能會(huì)影響MCMC算法的性能;錯(cuò)誤的先驗(yàn)設(shè)置甚至?xí)?dǎo)致得到具有嚴(yán)重偏差的后驗(yàn)分布結(jié)果,影響參數(shù)估計(jì)的準(zhǔn)確性與模型的收斂率(Baldwin &Fellingham,2013;Depaoli&Clifton,2015;MacCallum et al.,2012;van Erp et al.,2018;Yuan &Mackinnon,2009;Zondervan Zwi-jnenburg et al.,2017)。例 如,Tong和Ke(2021)的研究結(jié)果表明,在貝葉斯非參數(shù)增長(zhǎng)曲線建模中,信息量水平不同的精度參數(shù)先驗(yàn)會(huì)影響模型的收斂速度、模型估計(jì)以及計(jì)算時(shí)間。Lee等(2020)發(fā)現(xiàn),在使用貝葉斯?jié)擃悇e分析時(shí),如果選擇了與參數(shù)的真實(shí)分布差異顯著的有信息先驗(yàn),可能會(huì)導(dǎo)致一類錯(cuò)誤率升高。此外,偏離參數(shù)真值分布的先驗(yàn)還會(huì)對(duì)貝葉斯模型擬合指標(biāo)判斷模型擬合情況的表現(xiàn)與選擇正確模型的能力造成影響,且不同的模型擬合指標(biāo)對(duì)先驗(yàn)分布的敏感性存在差異,越來(lái)越多的研究關(guān)注到頻率學(xué)派中模型擬合指標(biāo)的截?cái)嘀凳欠褚琅f適用于貝葉斯方法(Liu et al.,2021;Winter &Depaoli,2022)。
因此,盡管與先驗(yàn)分布相結(jié)合使得貝葉斯結(jié)構(gòu)方程模型相對(duì)于傳統(tǒng)模型具有更加靈活的優(yōu)勢(shì),但如何設(shè)置參數(shù)的先驗(yàn)分布是使用該方法最大的挑戰(zhàn)之一(van Erp et al.,2018)。對(duì)于判斷在貝葉斯結(jié)構(gòu)方程模型中選擇的先驗(yàn)是否合適,Smid和Winter(2020)提出了四種方法:
一是計(jì)算有效樣本量,即在后驗(yàn)鏈中有效獨(dú)立抽取的樣本數(shù)量,當(dāng)有效樣本量小于1000時(shí),可能說(shuō)明先驗(yàn)的選擇存在問(wèn)題。
二是看軌跡圖,當(dāng)軌跡圖中多條鏈大部分重合時(shí),可能可以說(shuō)明先驗(yàn)的選擇是合適的,但依舊要注意后驗(yàn)分布中是否存在現(xiàn)實(shí)中不可能出現(xiàn)的數(shù)值,在這種情況下即使多條鏈出現(xiàn)了重合,但依舊可能表明先驗(yàn)是不合適的,而當(dāng)多條鏈之間完全缺乏重合時(shí),很有可能說(shuō)明選擇的先驗(yàn)是非常不合適的。
三是比較先驗(yàn)分布、似然分布與后驗(yàn)分布,當(dāng)他們之間存在實(shí)質(zhì)性差異時(shí),需要注意設(shè)置的先驗(yàn)是否合適,當(dāng)似然與先驗(yàn)偏差很大時(shí),尤其是在小樣本的情況下,后驗(yàn)分布可能受先驗(yàn)分布影響很大,從而導(dǎo)致結(jié)果的偏差。
四是檢查后驗(yàn)標(biāo)準(zhǔn)差與95%的可信區(qū)間,當(dāng)標(biāo)準(zhǔn)差過(guò)大與可信區(qū)間范圍過(guò)寬時(shí),先驗(yàn)的選擇可能存在問(wèn)題。此時(shí),研究者可以使用敏感性分析,進(jìn)一步了解先驗(yàn)分布對(duì)結(jié)果的影響,從而選擇正確的先驗(yàn)(Smid &Winter,2020)。當(dāng)研究者想要探討某個(gè)特定的先驗(yàn)的影響時(shí),可以對(duì)該先驗(yàn)的均值超參數(shù)或方差超參數(shù)進(jìn)行敏感性分析,具體來(lái)說(shuō)可以對(duì)增大或者縮小均值超參數(shù)或方差超參數(shù),得到具有不同均值或方差超參數(shù)的先驗(yàn),并使用這些不同的先驗(yàn)進(jìn)行參數(shù)估計(jì);隨后,研究者可以通過(guò)比較幾個(gè)不同先驗(yàn)下模型的收斂率、計(jì)算速度、效應(yīng)量、模型擬合指標(biāo)的表現(xiàn)以及模型參數(shù)估計(jì)結(jié)果,從而檢查先驗(yàn)的超參數(shù)設(shè)置對(duì)于參數(shù)的估計(jì)是否具有實(shí)質(zhì)性的影響(Depaoli &van de Schoot,2017;Liu et al.,2021)。
van Erp等(2018)根據(jù)模擬研究的結(jié)果建議,如果希望在研究中使用默認(rèn)先驗(yàn),可以考慮包含軟件默認(rèn)無(wú)信息先驗(yàn)與多個(gè)水平的弱信息先驗(yàn)的敏感性分析。如果敏感性分析結(jié)果顯示在不同先驗(yàn)下模型分析的結(jié)果十分穩(wěn)定,可以認(rèn)為使用默認(rèn)先驗(yàn)得到的結(jié)果是可靠的;如果在研究中希望使用有信息先驗(yàn),可以對(duì)有信息先驗(yàn)與默認(rèn)無(wú)信息先驗(yàn)進(jìn)行敏感性分析,比較不同先驗(yàn)分布下模型的結(jié)果以考慮有信息先驗(yàn)分布下的研究結(jié)果是否可靠(Depaoli&van de Schoot,2017)。R語(yǔ)言中的MplusAutomation軟件包(Hallquist &Wiley,2018)可以通過(guò)調(diào)用Mplus生成多個(gè)先驗(yàn)條件下貝葉斯結(jié)構(gòu)方程模型的輸入文件,并對(duì)其進(jìn)行運(yùn)算,得出模型分析的結(jié)果,可以有效運(yùn)用于完成先驗(yàn)的敏感性分析。
研究者主要借助MCMC算法估計(jì)后驗(yàn)分布,該方法通過(guò)在參數(shù)的概率空間中隨機(jī)重復(fù)抽樣從而得到參數(shù)的近似分布(Gelfand &Smith,1990)。MCMC算法可以分為馬爾科夫鏈和蒙特卡洛兩個(gè)部分。其中馬爾科夫鏈過(guò)程確定每一次隨機(jī)抽樣的規(guī)則,即下一次迭代中參數(shù)估計(jì)值僅依賴當(dāng)前迭代中的參數(shù)估計(jì)值,而與之前的迭代過(guò)程無(wú)關(guān);蒙特卡洛方法是通過(guò)在分布中抽樣的方式確定模型參數(shù)的近似值及其后驗(yàn)分布,蒙特卡洛抽樣過(guò)程中的樣本均來(lái)源于特定的馬爾科夫鏈(Depaoli,2021;Van Ravenzwaaij et al.,2018)。
MCMC在不斷的迭代過(guò)程中,針對(duì)每一個(gè)參數(shù)都會(huì)形成馬爾科夫鏈,而鏈中的每一個(gè)值都是基于蒙特卡洛抽樣方法實(shí)現(xiàn)的(Depaoli,2021)。具體而言,在進(jìn)行MCMC的過(guò)程中,研究者首先需要給出模型參數(shù)的初始值,基于樣本數(shù)據(jù)、參數(shù)的先驗(yàn)信息以及模型參數(shù)的初始值,在每一次迭代中,研究者可以基于蒙特卡洛抽樣方法得到參數(shù)當(dāng)前的估計(jì)值;基于當(dāng)前迭代中的參數(shù)估計(jì)值,研究者可以得到下一次迭代中的參數(shù)估計(jì)值,多次重復(fù)該過(guò)程,每一次迭代中得到的參數(shù)估計(jì)值最終構(gòu)成了穩(wěn)定的參數(shù)后驗(yàn)分布。在構(gòu)成參數(shù)后驗(yàn)分布的過(guò)程中,并不是每一次迭代中基于蒙特卡洛得到的參數(shù)估計(jì)值都會(huì)被保留用于構(gòu)成參數(shù)后驗(yàn)分布。研究者可以使用不同的算法調(diào)整是否保留基于當(dāng)前的參數(shù)估計(jì)值確定的下一次迭代中的參數(shù)估計(jì)值的規(guī)則。常用的兩種算法為Gibbs抽樣和MH算法(Metropolis-Hastings algorithm;Depaoli,2021),具體關(guān)于該算法細(xì)節(jié)的介紹可以參考Bos(2004)以及Depaoli(2021)。
在使用MCMC算法進(jìn)行貝葉斯估計(jì)時(shí),隨著迭代的增加,模型參數(shù)的后驗(yàn)分布逐漸趨向穩(wěn)定,即模型達(dá)到收斂。判斷模型參數(shù)迭代收斂是評(píng)估模型后驗(yàn)參數(shù)估計(jì)的重要問(wèn)題之一。在實(shí)際應(yīng)用中,研究者可以基于多個(gè)不同的評(píng)價(jià)指標(biāo)判斷貝葉斯結(jié)構(gòu)方程模型是否已經(jīng)達(dá)到收斂。
(1)收斂圖或蹤跡圖。當(dāng)樣本的參數(shù)估計(jì)在蹤跡圖中的波動(dòng)較小,相對(duì)穩(wěn)定時(shí),表示該參數(shù)已經(jīng)達(dá)到收斂。這種基于蹤跡圖的方式較為直觀,因此并不能說(shuō)明是否該參數(shù)真正達(dá)到了收斂。但總的來(lái)說(shuō),該方法可以作為模型參數(shù)尚未達(dá)到收斂的標(biāo)準(zhǔn)(Mengersen et al.,1999)。如果模型參數(shù)的蹤跡圖表現(xiàn)出較大的波動(dòng)或者出現(xiàn)極端值,則該參數(shù)有較大的可能性尚未達(dá)到收斂。
(2)Geweke收斂診斷。該收斂診斷方法主要用于判斷單條鏈的第一部分是否與該鏈的最后一部分之間存在顯著差異,常用于判斷單條鏈?zhǔn)欠襁_(dá)到了收斂。研究者需要設(shè)定一定的迭代比例作為鏈的開(kāi)始以及鏈的結(jié)束。Geweke(1992)最早指出可以比較鏈前10%以及后50%的部分的結(jié)果進(jìn)行收斂性判斷。研究者可以基于實(shí)際情況調(diào)整用于比較的鏈的比例,確保用于比較的每一個(gè)部分足夠大從而保證基于兩次抽樣過(guò)程得到的均值彼此獨(dú)立?;谝粭l鏈的兩個(gè)部分彼此獨(dú)立的假設(shè),研究者可以使用z檢驗(yàn)的方法判斷是否達(dá)到收斂,即若z檢驗(yàn)顯著則說(shuō)明該參數(shù)的迭代并未達(dá)到收斂(Smith,2007)。研究者可以使用R工具包c(diǎn)oda完成Geweke收斂診斷(Plummer et al.,2006)。
(3)潛在尺度縮減因子(Potential Scale Reduction,PSR)或Gelman-Rubin法。PSR通過(guò)比較參數(shù)估計(jì)的鏈內(nèi)和鏈間的變異性判斷參數(shù)是否達(dá)到收斂,當(dāng)鏈間的變異性小于鏈內(nèi)的變異性時(shí),不同鏈得到的參數(shù)估計(jì)結(jié)果接近一致,則說(shuō)明該參數(shù)估計(jì)達(dá)到收斂(Gelman &Rubin,1992)。針對(duì)PSR,Mplus軟件使用的默認(rèn)標(biāo)準(zhǔn)為1.05,當(dāng)PSR小于1.05則認(rèn)為模型達(dá)到收斂(Muthén &Muthén,1998—2017)。Vehtari等(2019)的文章中針對(duì)該指標(biāo)的使用提出了更多的建議。
(4)自相關(guān)圖。在MCMC算法中,基于馬爾科夫鏈,每一次的抽樣過(guò)程僅依賴前一次的抽樣。理論上每連續(xù)兩次抽樣之間都會(huì)存在自相關(guān)系數(shù),而非連續(xù)兩次抽樣之間則相互獨(dú)立。但是在實(shí)際場(chǎng)景中,該假設(shè)很難得到滿足。因此,研究者通常會(huì)計(jì)算一定抽樣間隔的抽樣相關(guān)。當(dāng)自相關(guān)數(shù)小于0.1,則認(rèn)為抽樣樣本之間彼此獨(dú)立(Depaoli,2021)。
當(dāng)模型在迭代過(guò)程中尚未達(dá)到收斂時(shí),研究者可以通過(guò)修改模型參數(shù)估計(jì)的初始值以及增加迭代次數(shù)的方式提高模型的收斂。此外,當(dāng)模型的先驗(yàn)設(shè)置不正確時(shí),模型參數(shù)也會(huì)存在不收斂的情況,因此研究者也可以基于實(shí)際情況對(duì)模型參數(shù)的先驗(yàn)做出調(diào)整。研究者可以使用R工具包c(diǎn)oda繪制參數(shù)的自相關(guān)圖(Plummer et al.,2006)。
在貝葉斯結(jié)構(gòu)方程模型的模型擬合評(píng)估方面,貝葉斯近似擬合指標(biāo)和模型選擇指標(biāo)的數(shù)量以及關(guān)于這些指標(biāo)的研究深入程度都遠(yuǎn)遠(yuǎn)不及頻率學(xué)方法(West et al.,2012)。對(duì)于貝葉斯模型擬合指標(biāo),許多研究在早期僅局限于后驗(yàn)預(yù)測(cè)p值(Posterior predictivep-values,PPp,Gelman et al.,1996)。與傳統(tǒng)的顯著性檢驗(yàn)的p值不同,PPp中的p值是指觀測(cè)數(shù)據(jù)產(chǎn)生的卡方值比模型生成的樣本數(shù)據(jù)產(chǎn)生的卡方值小的比例,該值接近0.5則表示模型擬合越好,越偏離0.5則表示模型擬合越差,研究者通常使用0.05作為模型評(píng)估的標(biāo)準(zhǔn),若PPp值小于0.05,一般認(rèn)為模型擬合不佳。相應(yīng)地,研究者同樣可以獲取后驗(yàn)預(yù)測(cè)檢驗(yàn)的95%區(qū)間,用于表示樣本數(shù)據(jù)與模型生成的數(shù)據(jù)之間的統(tǒng)計(jì)檢驗(yàn)量差異,當(dāng)該區(qū)間的下限為負(fù)數(shù),且0位于該區(qū)間內(nèi)時(shí),則表示模型擬合良好(Muthén &Asparouhov,2012)。
Hoofs等(2018)首次提出了近似均方根誤差的貝葉斯變體,并命名為貝葉斯近似均方根誤差(Bayesian root mean square error of approximation,BRMSEA),Garnier-Villarreal和Jorgensen(2020)由此進(jìn)一步拓展了貝葉斯框架下的近似擬合指標(biāo),包括貝葉斯比較擬合指數(shù)(Bayesian Comparative Fit Index,BCFI)、貝葉斯Tucker-Lewis指數(shù)(Bayesian Tucker-Lewis Index,BTLI)。對(duì)于新提出的貝葉斯近似擬合指標(biāo),由于其與使用極大似然方法的近似擬合指標(biāo)具有相似的表現(xiàn),研究者推薦使用傳統(tǒng)近似擬合指標(biāo)的截?cái)嘀底鳛樨惾~斯框架下的近似擬合指標(biāo)對(duì)模型的評(píng)價(jià)標(biāo)準(zhǔn)(Asparouhov &Muthén,2021)。因此,根據(jù)Hu和Bentler(1999)提出的極大似然方法的近似擬合指標(biāo)的截?cái)嘀?,可以使用BRMSEA=0.06,BTLI=0.95,BCFI=0.95作為截?cái)嘀怠X惾~斯模型擬合指標(biāo)相對(duì)于傳統(tǒng)模型擬合指標(biāo)的一個(gè)優(yōu)勢(shì)在于可以計(jì)算模型擬合指標(biāo)的可信區(qū)間,而不是單純地使用點(diǎn)估計(jì)進(jìn)行模型擬合判斷,這可以給判斷模型擬合是否良好提供更豐富的信息(Asparouhov &Muthén,2021)。我們可以通過(guò)比較貝葉斯近似擬合指標(biāo)的可信區(qū)間和截?cái)嘀祦?lái)判斷模型擬合是否良好。當(dāng)截?cái)嘀蹈哂诳尚艆^(qū)間的最大值(對(duì)于BRMSEA而言是截?cái)嘀档陀诳尚艆^(qū)間最小值)時(shí),可以判斷模型擬合不佳;當(dāng)截?cái)嘀档陀诳尚艆^(qū)間的最小值(對(duì)于BRMSEA而言是截?cái)嘀蹈哂诳尚艆^(qū)間最大值)時(shí),則判斷模型擬合良好;當(dāng)截?cái)嘀当豢尚艆^(qū)間所包含,則不能明確判斷模型擬合不佳或模型擬合良好。舉例來(lái)說(shuō),假設(shè)BCFI的截?cái)嘀禐?.95。(1)當(dāng)BCFI的點(diǎn)估計(jì)為0.892時(shí),可信區(qū)間為[0.873,0.902],截?cái)嘀蹈哂诳尚艆^(qū)間的最大值,BCFI表明模型擬合不佳;(2)當(dāng)BCFI的點(diǎn)估計(jì)為0.961,可信區(qū)間為[0.958,0.976],截?cái)嘀档陀诳尚艆^(qū)間的最小值,BCFI表明模型擬合良好;(3)當(dāng)BCFI的點(diǎn)估計(jì)為0.950,可信區(qū)間為[0.872,0.963],截?cái)嘀当豢尚艆^(qū)間所包含,則不能明確判斷模型擬合不佳或模型擬合良好。
在貝葉斯結(jié)構(gòu)方程模型框架下,模型選擇指標(biāo)的數(shù)量相對(duì)更多,常用的指標(biāo)有偏差信息準(zhǔn)則(Spiegelhalter et al.,2002)、貝葉斯因子(Bayes factor,BF;Kass &Raftery,1995)、貝葉斯留一法(Bayesian leave-one-out,LOO;Gelfand et al.,1992)等,Lu等(2017)在CFA的框架下詳細(xì)對(duì)比了這些指標(biāo)。
對(duì)于上述貝葉斯模型選擇指標(biāo)以及貝葉斯近似擬合指標(biāo)在模型選擇過(guò)程中的應(yīng)用,各指標(biāo)也存在不同的截?cái)嘀祦?lái)表明兩個(gè)模型之間存在顯著差異。對(duì)于DIC,在模型比較中,兩個(gè)模型中DIC更小的模型擬合得更好,通常會(huì)使用兩個(gè)模型的DIC相減,得到ΔDIC。Cain和Zhang(2019)一項(xiàng)研究的結(jié)果表明,選取ΔDIC=7為截?cái)嘀的茌^好降低選擇錯(cuò)誤模型的概率。
對(duì)于貝葉斯近似擬合指標(biāo)在模型選擇的應(yīng)用,目前的研究依舊參照的是傳統(tǒng)極大似然方法下近似擬合指標(biāo)的截?cái)嘀?。但是由于近似擬合指標(biāo)被用于模型選擇的情況相較于模型選擇指標(biāo)更少,不同研究者針對(duì)不同近似擬合指標(biāo)給出了模型選擇的不同截?cái)嘀?。有研究者認(rèn)為當(dāng)CFI的差異值大于0.005,TLI的差異值大于0.005和RMSEA的差異值大于0.010時(shí),則說(shuō)明模型之間存在顯著差異;但也有研究者認(rèn)為當(dāng)CFI和TLI的差異值大于0.01,RMSEA的差異值大于0.015時(shí),則說(shuō)明模型之間存在顯著差異;并且在樣本量的不同水平,應(yīng)該選取不同的截?cái)嘀狄员3纸茢M合指標(biāo)進(jìn)行模型選擇判斷的敏感性(Chen,2007;Sokolov,2019)。
貝葉斯框架的模型擬合指標(biāo)已被證實(shí)與傳統(tǒng)極大似然方法中的近似擬合指標(biāo)合理近似,并已經(jīng)被Asparouhov和Muthén(2021)運(yùn)用在軟件Mplus中。由此,越來(lái)越多的研究者關(guān)注貝葉斯框架下的近似擬合指標(biāo),并展開(kāi)了關(guān)于先驗(yàn)設(shè)置敏感性的研究(Cain &Zhang,2019;Liang,2020;Winter &Depaoli,2022)。目前,關(guān)于近似擬合指標(biāo)進(jìn)行模型選擇的研究較少,對(duì)于貝葉斯近似擬合指標(biāo)的截?cái)嘀瞪写嬖跔?zhēng)議。McNeish和Wolf(2021)的研究基于模擬的方法來(lái)針對(duì)特定數(shù)據(jù)和結(jié)構(gòu)構(gòu)建特定的驗(yàn)證性因子分析模型動(dòng)態(tài)截?cái)嘀担㈤_(kāi)發(fā)了一個(gè)RStudio附帶的Shiny應(yīng)用程序(https://dynamicfit.app/),目前也可以通過(guò)名為“dynamic”的R包計(jì)算不同驗(yàn)證性因子分析模型的動(dòng)態(tài)截?cái)嘀担o研究者提供了能獲得更加精確的頻率學(xué)派結(jié)構(gòu)方程模型框架下的模型擬合指標(biāo)截?cái)嘀档姆椒?。未?lái)研究或許可以拓展該研究的發(fā)現(xiàn),進(jìn)一步探索用于貝葉斯近似擬合指標(biāo)的動(dòng)態(tài)截?cái)嘀?。然而,盡管貝葉斯方法如今在心理學(xué)領(lǐng)域仍未如頻率學(xué)方法一般得到廣泛應(yīng)用,但其優(yōu)點(diǎn)已在各種研究中逐漸顯現(xiàn),進(jìn)一步了解和探索新提出的貝葉斯模型擬合指標(biāo)進(jìn)將是普及使用貝葉斯結(jié)構(gòu)方程模型的重要課題與方向。
在本研究中,我們將使用一個(gè)實(shí)證數(shù)據(jù)展示和說(shuō)明貝葉斯結(jié)構(gòu)方程模型針對(duì)交叉載荷參數(shù)的建模過(guò)程。本文用于展示的軟件為Mplus,該軟件為最常用的潛變量建模軟件之一。其他的可以使用貝葉斯估計(jì)方法構(gòu)建結(jié)構(gòu)方程模型的軟件有WinBUGS、Stan、R軟件包blavaan等,關(guān)于這些軟件的介紹可以參考張瀝今等(2019)的文章。
本研究選用 Holzinger 和 Swineford的經(jīng)典數(shù)據(jù)集進(jìn)行展示,原有Holzinger和Swineford的智力測(cè)試中共包含了26個(gè)變量,本研究選擇了包含9個(gè)變量的數(shù)據(jù)子集。該數(shù)據(jù)子集同樣是R 語(yǔ)言的lavaan工具包和 blavaan工具包中的內(nèi)置數(shù)據(jù)。該數(shù)據(jù)集包含了來(lái)自Pasteur 學(xué)校和Grant-White 學(xué)校的 301 名七年級(jí)和八年級(jí)兒童的智力測(cè)試分?jǐn)?shù),為避免學(xué)校不同帶來(lái)的影響,本研究?jī)H考慮來(lái)自Grand-White學(xué)校的145名兒童的數(shù)據(jù)。
智力測(cè)試子集中的九個(gè)變量分別為視覺(jué)感知、立方體、菱形、短文理解、句子填空、詞義理解、加法、點(diǎn)計(jì)數(shù)與直曲線大寫字母,其中前三個(gè)變量用于測(cè)量空間能力,中間三個(gè)變量用于測(cè)量語(yǔ)言能力,最后三個(gè)變量用于測(cè)量反應(yīng)速度,具體的模型如圖1所示。該訓(xùn)練子集包含了來(lái)自Pasteur和Grant-White兩所學(xué)校的301名七年級(jí)和八年級(jí)兒童的智力測(cè)試數(shù)據(jù)。該智力子集的Cronbach’s α為0.760,各潛變量的Cronbach’s α分別為0.626、0.883、0.688。
為更加直觀地體現(xiàn)貝葉斯結(jié)構(gòu)方程模型的靈活性,本研究同時(shí)展示使用頻率學(xué)派的極大似然估計(jì)方法和貝葉斯結(jié)構(gòu)方程模型得到的結(jié)果。在貝葉斯結(jié)構(gòu)方程模型建模估計(jì)的例子中,本文著重體現(xiàn)貝葉斯結(jié)構(gòu)方程模型在處理交叉載荷參數(shù)問(wèn)題上的優(yōu)勢(shì),因此,針對(duì)主要的因子載荷參數(shù)以及因子間相關(guān)參數(shù),均使用Mplus軟件的默認(rèn)先驗(yàn);針對(duì)交叉載荷參數(shù),以均值為0,方差為0.01的正態(tài)分布先驗(yàn)N(0,0.01)為例展示建模過(guò)程及模型參數(shù)估計(jì)結(jié)果。隨后將展示默認(rèn)先驗(yàn)以及強(qiáng)信息先驗(yàn)的結(jié)果,以模擬在實(shí)際研究中研究者進(jìn)行敏感性分析的過(guò)程。
在使用Mplus進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模時(shí),研究者在進(jìn)行模型設(shè)定前,需要在ANALYSIS語(yǔ)句中先設(shè)定模型使用的估計(jì)方法以及方法的細(xì)節(jié)。如針對(duì)本研究的例子,需要使用貝葉斯估計(jì)方法進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模,則對(duì)應(yīng)的估計(jì)方法需要選擇BYAES,對(duì)應(yīng)的語(yǔ)句為“ESTIMATOR=BAYES”。當(dāng)研究者使用頻率學(xué)派的方法進(jìn)行估計(jì)時(shí),對(duì)應(yīng)的估計(jì)方法可以選擇極大似然估計(jì)方法或經(jīng)過(guò)均值和方差校正的最小二乘法等。針對(duì)貝葉斯估計(jì)方法,研究者同樣需要設(shè)置模型中的馬爾科夫鏈的數(shù)量和模型迭代次數(shù)等信息。
由于使用貝葉斯結(jié)構(gòu)方程模型對(duì)數(shù)據(jù)進(jìn)行建模的過(guò)程中,對(duì)比傳統(tǒng)的頻率學(xué)派方法,研究者需要基于已有的經(jīng)驗(yàn)給出模型中參數(shù)的先驗(yàn)信息,且針對(duì)模型參數(shù)也會(huì)存在不收斂以及參數(shù)后驗(yàn)分布準(zhǔn)確性等問(wèn)題,因此,圖2結(jié)合Depaoli(2021)對(duì)貝葉斯估計(jì)方法的結(jié)果報(bào)告的建議以及Depaoli 和 van de Schoot(2017)提出的 WAMBS 清單對(duì)估計(jì)結(jié)果的報(bào)告步驟進(jìn)行整理,本文的示例也將參考該過(guò)程報(bào)告結(jié)果。
圖2 貝葉斯結(jié)構(gòu)方程模型結(jié)果報(bào)告流程梳理
(1)樣本數(shù)據(jù)相關(guān)的人口學(xué)信息。與傳統(tǒng)頻率學(xué)派估計(jì)方法的結(jié)果報(bào)告一致,在報(bào)告參數(shù)估計(jì)結(jié)果前,研究者需要報(bào)告樣本數(shù)據(jù)的基本信息,如樣本量的大小、性別比例、正態(tài)分布情況和變量之間的相關(guān)信息等。如果對(duì)樣本數(shù)據(jù)進(jìn)行了拆分,如使用一部分被試用于確定模型中參數(shù)的先驗(yàn)信息,另外一部分用于估計(jì)模型的參數(shù)結(jié)果;或存在多個(gè)樣本數(shù)據(jù)時(shí),研究者需要分別報(bào)告多個(gè)樣本數(shù)據(jù)的相關(guān)信息,以及數(shù)據(jù)拆分的具體步驟和規(guī)則。在本文的示例中,總樣本量為145,其中男性被試72人,女性被試73人。變量均不存在嚴(yán)重的非正態(tài)情況,峰值范圍為2.520~5.164,偏度范圍為-0.544~0.721。
(2)貝葉斯結(jié)構(gòu)方程模型估計(jì)的軟件使用以及相關(guān)參數(shù)的設(shè)置。參數(shù)先驗(yàn)信息是貝葉斯估計(jì)中較為重要的一部分,研究者在報(bào)告貝葉斯結(jié)構(gòu)方程模型的參數(shù)估計(jì)結(jié)果前需要報(bào)告不同參數(shù)先驗(yàn)設(shè)置的理論背景和參數(shù)先驗(yàn)設(shè)置的細(xì)節(jié)。本研究的目的在于展示貝葉斯結(jié)構(gòu)方程處理交叉載荷問(wèn)題時(shí)的效果,因此僅對(duì)模型中的交叉載荷參數(shù)設(shè)置先驗(yàn)。考慮到在問(wèn)卷設(shè)置過(guò)程中,一般不假設(shè)模型中存在交叉載荷的情況,且針對(duì)交叉載荷參數(shù)常用正態(tài)分布作為先驗(yàn),因此,本研究中針對(duì)交叉載荷參數(shù)設(shè)置均值為0,方差為0.01的正態(tài)分布先驗(yàn),允許交叉載荷參數(shù)在[-0.2,0.2]范圍內(nèi)波動(dòng)。
另外,在報(bào)告結(jié)果時(shí),研究者需要報(bào)告貝葉斯估計(jì)中相關(guān)參數(shù)的設(shè)置,如模型中參數(shù)估計(jì)的初始值、模型迭代次數(shù)及模型中MCMC鏈的數(shù)量等。在示例展示中,我們使用Mplus軟件中的默認(rèn)初始值進(jìn)行估計(jì),并設(shè)置2條MCMC鏈。為保證模型參數(shù)估計(jì)更加準(zhǔn)確,在模型估計(jì)中使用50000次固定迭代。
(3)貝葉斯結(jié)構(gòu)方程模型的收斂情況。在實(shí)際應(yīng)用中,研究者可以通過(guò)“BCONVERGENCE=0.05;”語(yǔ)句修改PSR收斂判斷的標(biāo)準(zhǔn),其中0.05為Mplus默認(rèn)值。當(dāng)PSR<1+CONVERGENCE*factor則表示該參數(shù)已經(jīng)達(dá)到收斂。其中factor的取值范圍為[1,2],取值的標(biāo)準(zhǔn)為參數(shù)數(shù)量(Muthén&Muthén,1998~2017)。當(dāng)研究者使用單條MCMC鏈進(jìn)行估計(jì)時(shí),Mplus默認(rèn)使用第3/4和最后1/4鏈的迭代結(jié)果進(jìn)行計(jì)算。在本文中,BCONVERGENCE使用Mplus默認(rèn)值。
另外,通過(guò)在Mplus的輸入input文件(.inp)中,研究者可以使用“PLOT:TYPE=PLOT2;”語(yǔ)句輸出參數(shù)估計(jì)的后驗(yàn)分布結(jié)果圖;并在對(duì)應(yīng)output(.out)文件中,研究者可以通過(guò)PLOT→View Plot查看參數(shù)的后驗(yàn)分布、后驗(yàn)參數(shù)蹤跡圖、自相關(guān)圖和后驗(yàn)預(yù)測(cè)檢驗(yàn)圖得到模型的收斂情況。有關(guān)基于蹤跡圖、自相關(guān)圖等判斷模型收斂的介紹可以參考王孟成等(2017)的文章。
以測(cè)量條目Y9和因子空間能力之間的交叉載荷參數(shù)為例,圖3(a)表示該參數(shù)的蹤跡圖。本文僅考慮了兩條MCMC鏈,因此,圖中使用黑色和灰色分別表示了不同鏈的估計(jì)結(jié)果,其中橫坐標(biāo)表示對(duì)應(yīng)的迭代次數(shù),縱坐標(biāo)表示后驗(yàn)參數(shù)估計(jì)值,研究者可以基于蹤跡圖的方式直觀評(píng)估兩條鏈的參數(shù)估計(jì)值是否收斂到相同的、平穩(wěn)的分布。其中圖中最長(zhǎng)縱線之前的部分表示burn-in階段,后半部分的結(jié)果用于判斷模型是否達(dá)到收斂,從圖3(a)可以看出該參數(shù)逐漸迭代過(guò)程趨于平穩(wěn)。
圖3 條目Y9 與因子空間能力之間的交叉載荷參數(shù)估計(jì)的蹤跡圖和自相關(guān)圖
圖3(b)為測(cè)量條目Y9和因子空間能力之間的交叉載荷參數(shù)的自相關(guān)圖,其中縱坐標(biāo)表示相關(guān)系數(shù)大小,橫坐標(biāo)表示不同的迭代間隔次數(shù)或步長(zhǎng)。如圖3(b)所示,隨著迭代的增加,自相關(guān)系數(shù)逐漸低于0.1,趨于0,說(shuō)明模型收斂良好。結(jié)合TECH8的結(jié)果顯示,當(dāng)達(dá)到2500次迭代時(shí),PSR=1.008,已經(jīng)達(dá)到收斂的標(biāo)準(zhǔn)。這些結(jié)果均顯示模型的參數(shù)估計(jì)收斂良好。當(dāng)模型尚未達(dá)到收斂時(shí),研究者可以選擇增加迭代次數(shù)或修改模型估計(jì)的初始值。
(4)貝葉斯結(jié)構(gòu)方程模型模型擬合評(píng)估。在進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模時(shí),Mplus會(huì)輸出關(guān)于模型擬合的相對(duì)應(yīng)的結(jié)果,所使用的指標(biāo)有PPp、CFI、TLI、RMSEA等。在本研究中,模型擬合良好,其中PPp=0.436(后驗(yàn)預(yù)測(cè)檢驗(yàn)95%CI為[-25.85,31.81])、CFI=0.99、TLI=0.99、RMSEA=0.04。
(5)模型參數(shù)估計(jì)結(jié)果。在模型結(jié)果部分,Mplus會(huì)基于參數(shù)后驗(yàn)分布的中位數(shù)得到對(duì)應(yīng)參數(shù)的點(diǎn)估計(jì)值,并基于后驗(yàn)分布得到參數(shù)的95%的可信區(qū)間。表2展示了在本研究中,針對(duì)交叉載荷參數(shù)使用均值為0、方差為0.01的正態(tài)先驗(yàn)分布后對(duì)應(yīng)得到的模型因子載荷參數(shù)的結(jié)果。貝葉斯結(jié)構(gòu)方程模型檢測(cè)出一個(gè)顯著的交叉載荷參數(shù)。
表2 針對(duì)于交叉載荷參數(shù)設(shè)置N(0,0.01)先驗(yàn)的BSEM 模型的因子載荷參數(shù)估計(jì)結(jié)果
在進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模時(shí),為進(jìn)一步避免先驗(yàn)設(shè)置錯(cuò)誤導(dǎo)致的參數(shù)估計(jì)偏差,研究者可以進(jìn)行敏感性分析,比較設(shè)置不同先驗(yàn)的模型參數(shù)估計(jì)結(jié)果(Depaoli &Van de Schoot,2017)。為進(jìn)一步展示敏感性分析及其結(jié)果,本文修改了貝葉斯結(jié)構(gòu)方程模型中交叉載荷參數(shù)的先驗(yàn)作為展示,分別為:(1)Mplus默認(rèn)的先驗(yàn)信息;(2)強(qiáng)信息先驗(yàn),即均值為0,方差為0.0001的正態(tài)分布先驗(yàn),該先驗(yàn)設(shè)置交叉載荷參數(shù)的變化范圍為[-0.02,0.02]。相比均值為0,方差為0.01的正態(tài)分布先驗(yàn),該先驗(yàn)對(duì)交叉載荷參數(shù)變化范圍的限制更高。除交叉載荷參數(shù)的先驗(yàn)設(shè)置不同外,其他模型設(shè)置參數(shù)均與均值為0、方差為0.01的正態(tài)分布先驗(yàn)時(shí)的模型參數(shù)設(shè)置相同。
數(shù)據(jù)分析結(jié)果顯示,當(dāng)使用Mplus默認(rèn)的先驗(yàn)設(shè)置時(shí),模型中方差協(xié)方差矩陣不正定,模型不收斂。當(dāng)對(duì)交叉載荷參數(shù)使用強(qiáng)信息先驗(yàn)時(shí),結(jié)合參數(shù)的蹤跡圖以及自相關(guān)圖的結(jié)果均顯示模型收斂。在模型擬合評(píng)估中,PPp=0.023,小于0.05,即該結(jié)果顯示模型擬合不佳。在模型參數(shù)估計(jì)中,強(qiáng)信息先驗(yàn)BSEM模型未識(shí)別出交叉載荷參數(shù)。在強(qiáng)信息先驗(yàn)條件下,該先驗(yàn)條件限制交叉載荷參數(shù)在較小的范圍內(nèi)波動(dòng),且樣本量小,樣本數(shù)據(jù)能為模型參數(shù)估計(jì)提供的信息相對(duì)有限。因此交叉載荷參數(shù)估計(jì)值多在0.01附近波動(dòng)。綜合來(lái)看,雖然強(qiáng)信息先驗(yàn)的貝葉斯結(jié)構(gòu)方程模型達(dá)到了收斂的標(biāo)準(zhǔn),但是擬合不佳,尚未識(shí)別出其中可能存在的交叉載荷參數(shù)。而這也進(jìn)一步反映了當(dāng)處理小樣本的情況時(shí),先驗(yàn)條件的設(shè)置會(huì)對(duì)模型的參數(shù)估計(jì)產(chǎn)生較大的影響,研究者對(duì)此需要慎重考慮。
通過(guò)對(duì)比不同先驗(yàn)的貝葉斯結(jié)構(gòu)方程模型結(jié)果發(fā)現(xiàn),先驗(yàn)信息設(shè)置對(duì)模型的參數(shù)估計(jì)具有較為重要的影響。且在實(shí)際研究中,先驗(yàn)信息是基于已有的理論或結(jié)果,存在一定的主觀性,有必要嘗試使用不同的先驗(yàn)驗(yàn)證結(jié)果的穩(wěn)健性。
本研究同樣使用頻率學(xué)派的極大似然估計(jì)方法對(duì)數(shù)據(jù)進(jìn)行驗(yàn)證性因子分析,并基于模型修正指數(shù)MI釋放嚴(yán)格的模型假設(shè),優(yōu)先修正MI較大的交叉載荷參數(shù),估計(jì)可能存在的交叉載荷參數(shù)。參考CFI>0.95,TLI>0.95,RMSEA<0.08,SRMR<0.08的模型擬合良好的標(biāo)準(zhǔn)(Hu &Bentler,1999)判斷是否停止修正。如果模型擬合良好,則結(jié)束修正過(guò)程。
具體的模型修正過(guò)程及每一次修正后的模型估計(jì)結(jié)果如表3所示。該結(jié)果顯示,最終基于模型擬合良好的標(biāo)準(zhǔn)確定的模型中存在一個(gè)交叉載荷參數(shù),結(jié)果如圖4所示,該交叉載荷與貝葉斯結(jié)構(gòu)方程模型得到的結(jié)果一致。
表3 使用頻率學(xué)派極大似然估計(jì)方法進(jìn)行模型修正過(guò)程所得到的模型擬合結(jié)果
貝葉斯結(jié)構(gòu)方程模型在模型擬合和識(shí)別、參數(shù)估計(jì)、處理復(fù)雜模型以及小樣本問(wèn)題中都有較大優(yōu)勢(shì)?;谙闰?yàn)信息的設(shè)置,研究者可以釋放原有傳統(tǒng)測(cè)量模型中較為嚴(yán)格的參數(shù)限制,同時(shí)也可以將已有信息整合在當(dāng)前研究中,從而得到更準(zhǔn)確的模型參數(shù)估計(jì)結(jié)果。本研究示例所展示的結(jié)果表明,對(duì)比傳統(tǒng)頻率學(xué)派的估計(jì)方法,貝葉斯結(jié)構(gòu)方程模型可以準(zhǔn)確地檢測(cè)出模型中可能存在的交叉載荷參數(shù),得到相對(duì)準(zhǔn)確的參數(shù)估計(jì)結(jié)果。
國(guó)內(nèi)學(xué)者王孟成等在2017年簡(jiǎn)要介紹了貝葉斯統(tǒng)計(jì)在潛變量建模過(guò)程的應(yīng)用,隨后張瀝今等(2019)介紹了貝葉斯結(jié)構(gòu)方程模型的方法基礎(chǔ)以及常用的貝葉斯結(jié)構(gòu)方程模型的研究現(xiàn)狀,為更多研究者了解新的研究工具提供了一定的基礎(chǔ)。但截至2023年5月,基于中國(guó)知網(wǎng)的檢索發(fā)現(xiàn),國(guó)內(nèi)心理學(xué)領(lǐng)域有關(guān)貝葉斯結(jié)構(gòu)方程模型的應(yīng)用研究仍相對(duì)較少。希望本文可以幫助更多國(guó)內(nèi)心理學(xué)研究者了解貝葉斯結(jié)構(gòu)方程模型在處理小樣本、嚴(yán)格的模型參數(shù)假設(shè)和復(fù)雜模型等問(wèn)題上的優(yōu)勢(shì),基本掌握貝葉斯結(jié)構(gòu)方程模型解決實(shí)際研究問(wèn)題的操作。
在貝葉斯結(jié)構(gòu)方程模型建模中,模型參數(shù)的先驗(yàn)設(shè)置具有一定的主觀性,對(duì)參數(shù)的估計(jì)具有一定的影響。本文示例展示的結(jié)果同樣表明,先驗(yàn)設(shè)置可能會(huì)導(dǎo)致模型不收斂或者模型參數(shù)估計(jì)不準(zhǔn)確等問(wèn)題。因此,研究者在實(shí)際使用過(guò)程中有必要基于已有知識(shí)選擇多個(gè)先驗(yàn)條件建模,從而得到更為穩(wěn)健的參數(shù)估計(jì)結(jié)果。此外,由于貝葉斯估計(jì)方法在對(duì)參數(shù)的解釋上與傳統(tǒng)的頻率學(xué)派的方法存在一定差異,因此不可避免地可能會(huì)錯(cuò)誤解讀模型估計(jì)結(jié)果。Depaoli和Van de Schoot(2017)提出了WAMBS清單,該清單描述在應(yīng)用貝葉斯估計(jì)時(shí)需要重視10個(gè)點(diǎn),主要包括對(duì)先驗(yàn)的理解、模型收斂性的檢驗(yàn)以及模型估計(jì)結(jié)果的解釋三個(gè)方面。研究者在實(shí)際進(jìn)行貝葉斯結(jié)構(gòu)方程模型建模時(shí),也可以參考該清單完善自己的建模過(guò)程。
由于不同的軟件使用不同的抽樣方法進(jìn)行貝葉斯結(jié)構(gòu)方程模型的參數(shù)估計(jì),且當(dāng)研究者在使用默認(rèn)先驗(yàn)時(shí),不同軟件默認(rèn)的先驗(yàn)設(shè)置不同,這些都會(huì)影響最終的模型參數(shù)估計(jì)結(jié)果(Jak et al.,2021;van Erp et al.,2018)。因此,研究者需要注意不同軟件可能會(huì)導(dǎo)致不同的估計(jì)結(jié)果。
本文旨在簡(jiǎn)要介紹貝葉斯結(jié)構(gòu)方程的原理及其在心理學(xué)的應(yīng)用,更多關(guān)于貝葉斯結(jié)構(gòu)方程的方法基礎(chǔ)、原理以及在Mplus軟件上的應(yīng)用的相關(guān)信息,感興趣的研究者可以參考張瀝今等(2019)、王孟成等(2017)、Depaoli和Van de Schoot(2017)的文章以及Depaoli(2021)或王孟成(2014)主編的書(shū)籍。