復(fù)旦大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)教研室,公共衛(wèi)生安全教育部重點(diǎn)實(shí)驗(yàn)室(200032)
方綺雯 劉振球 袁黃波 蔡 寧 何 納 張鐵軍△
結(jié)構(gòu)方程模型(structural equation modeling,SEM),又稱協(xié)方差結(jié)構(gòu)模型(covariance structure modeling,CSM)、線性結(jié)構(gòu)方程(linear structural equation,LSE),是由因子分析(factor analysis)與路徑分析(path analysis)發(fā)展而來(lái)的高級(jí)統(tǒng)計(jì)方法。自瑞士統(tǒng)計(jì)學(xué)家、心理測(cè)量學(xué)家Karl G.Joreskog于 20世紀(jì)70年代初提出初步算法[1-2],該模型在社會(huì)科學(xué)等領(lǐng)域不斷進(jìn)行實(shí)踐,目前依然是應(yīng)用統(tǒng)計(jì)學(xué)科的研究熱點(diǎn)。作為一種整合了因子分析與路徑分析的多變量統(tǒng)計(jì)手段,結(jié)構(gòu)方程模型具有傳統(tǒng)統(tǒng)計(jì)學(xué)方法所不具備的優(yōu)勢(shì),然而現(xiàn)階段國(guó)內(nèi)結(jié)構(gòu)方程模型的應(yīng)用還不夠廣泛,其模型理論概念、以及軟件實(shí)現(xiàn)方面的文獻(xiàn)較為缺乏。故本文從實(shí)踐角度應(yīng)用AMOS軟件實(shí)現(xiàn)結(jié)構(gòu)方程模型構(gòu)建,并對(duì)涉及到的較易混淆以及難以理解的概念作出解釋。
以一項(xiàng)在某地區(qū)流動(dòng)人口當(dāng)中進(jìn)行的艾滋病自愿咨詢和檢測(cè)(voluntary HIV counselling and testing,VCT)意愿的影響因素研究為例,其潛在影響變量,包括調(diào)查對(duì)象年齡、性別、文化程度、人口流動(dòng)性以及對(duì)于艾滋病的KAP情況之間存在一定關(guān)聯(lián),且問(wèn)卷量表的調(diào)查方法對(duì)變量測(cè)量可能存在誤差。傳統(tǒng)的回歸分析方法不能很好地考慮并解決這些問(wèn)題,故此處擬采用SEM方法對(duì)VCT意愿的影響因素進(jìn)行分析建模。來(lái)源數(shù)據(jù)中變量的具體測(cè)量見(jiàn)文獻(xiàn)[3],簡(jiǎn)要變量賦值情況如表1所示。
根據(jù)專業(yè)知識(shí)與文獻(xiàn)調(diào)研結(jié)果理清待分析變量之間的關(guān)系,確定初始的假設(shè)模型,利用AMOS軟件左側(cè)的繪圖工具進(jìn)行模型框架圖繪制。
AMOS軟件提供五種方法以供選擇,其中最大似然法(maximum likelihood,ML)是AMOS默認(rèn)的參數(shù)估計(jì)方法,應(yīng)用最廣,但對(duì)數(shù)據(jù)正態(tài)性要求較高。當(dāng)樣本量較大(最好大于500)且觀察數(shù)據(jù)符合多變量正態(tài)分布時(shí)使用ML法最為合適;若觀察數(shù)據(jù)為大樣本,但不滿足多變量正態(tài)分布時(shí),推薦使用廣義最小二乘法(generalized least squares,GLS);未加權(quán)最小二乘法(unweighted least squares,ULS)是一種依賴量尺單位的估計(jì)方法,當(dāng)所有觀察變量以相同的單位測(cè)量時(shí),采用該法可獲得最適當(dāng)?shù)墓烙?jì)結(jié)果[4]。本例采用GLS法對(duì)模型參數(shù)進(jìn)行估計(jì)。
飽和模型與過(guò)度識(shí)別模型雖皆可識(shí)別,但飽和模型對(duì)模型中包含的所有變量間的兩兩關(guān)系進(jìn)行參數(shù)估計(jì),此時(shí)其整體適配度卡方值與模型自由度等于0,卡方值的顯著性概率值無(wú)法計(jì)算。另外需要注意的是,適配度指標(biāo)評(píng)價(jià)的是假設(shè)模型與搜集的數(shù)據(jù)是否相互適配,而非模型的好壞。一個(gè)適配度佳的模型不一定是具備科學(xué)性的模型(見(jiàn)表2)。
表1 VCT調(diào)查的變量賦值
表2 VCT的SEM適配度指標(biāo)摘要表
模型修正必須有合理的理論依據(jù)支持,在此前提下可將不合理的或是未達(dá)到顯著水平的影響路徑刪除,或通過(guò)一些手段提高模型適配度。模型適配度不佳的原因可能有數(shù)據(jù)的分布與樣本量大小不符合所選用參數(shù)估計(jì)方法的假定;數(shù)據(jù)中有缺失值存在;需估計(jì)的自由參數(shù)太少導(dǎo)致模型自由度過(guò)大;構(gòu)建的假設(shè)模型不合理等。當(dāng)適配度檢驗(yàn)判定數(shù)據(jù)與假設(shè)模型不適配時(shí),可從上述角度對(duì)模型加以修正,但要注意不要過(guò)于以數(shù)據(jù)為導(dǎo)向違反理論基礎(chǔ)。AMOS軟件提供的修正指標(biāo)(modification indices,MI)可作為改善模型適配度的參考。參數(shù)的MI值是評(píng)估釋放某一參數(shù)估計(jì)對(duì)降低模型適配度卡方值貢獻(xiàn)的指標(biāo)。目前對(duì)于需要修正的MI閾值尚無(wú)一致定論,但可從釋放具有最大MI值的固定參數(shù)開(kāi)始,結(jié)合期望參數(shù)改變量(expected parameter change,EPC)一次修正一個(gè)參數(shù),同時(shí)注意避免使一個(gè)可識(shí)別的模型無(wú)法識(shí)別。本例最終模型圖與適配度指標(biāo)分別如圖2、表2所示,模型適配度指標(biāo)基本符合參考標(biāo)準(zhǔn),擬合良好。在指向VCT意愿的直接路徑中,男性(P<0.001)、文化程度(P=0.032)及艾滋病KAP評(píng)分(P=0.002)的參數(shù)檢驗(yàn)具有統(tǒng)計(jì)學(xué)意義。
圖2 VCT意愿影響因素的結(jié)構(gòu)方程模型
本文通過(guò)簡(jiǎn)要介紹SEM的基本概念及統(tǒng)計(jì)分析的核心思想,并以VCT意愿的流行病學(xué)調(diào)查數(shù)據(jù)為例進(jìn)行了結(jié)構(gòu)方程模型構(gòu)建。其基本步驟可歸結(jié)為三步,即通過(guò)前期文獻(xiàn)資料調(diào)研界定假設(shè)模型,樣本數(shù)據(jù)代入模型進(jìn)行參數(shù)估計(jì),通過(guò)適配度檢驗(yàn)根據(jù)修正指標(biāo)對(duì)模型進(jìn)行修正,從而最終得到一個(gè)既符合理論背景假設(shè)且適配度佳的模型。本文所構(gòu)建模型由適配度指標(biāo)評(píng)價(jià)與數(shù)據(jù)的契合程度良好,發(fā)現(xiàn)艾滋病自愿咨詢檢測(cè)的主要影響因素為性別、文化程度與對(duì)艾滋病的KAP情況,這與之前采用傳統(tǒng)分析方法進(jìn)行的研究結(jié)論類似[3],說(shuō)明模型構(gòu)建合理以及該法應(yīng)用的可信度。相比之下,采用SEM進(jìn)行建模,引入了不能直接觀測(cè)到的潛在變量,并可在模型中估計(jì)誤差變量,使得變量之間關(guān)系的刻畫(huà)更加精確,根據(jù)估計(jì)的路徑系數(shù)寫(xiě)出相應(yīng)的結(jié)構(gòu)方程即可對(duì)VCT意愿做出估計(jì)。與此同時(shí),通過(guò)對(duì)路徑系數(shù)的代數(shù)運(yùn)算還可得到變量間的直接效應(yīng)(路徑系數(shù)本身)與間接效應(yīng)(路徑上系數(shù)乘積)以評(píng)估某一變量的總效應(yīng),從而在實(shí)施干預(yù)措施時(shí)優(yōu)先對(duì)效應(yīng)值較大的變量進(jìn)行干預(yù)。
隨著當(dāng)前各領(lǐng)域的研究問(wèn)題不斷復(fù)雜化精細(xì)化,除了所關(guān)心結(jié)局事件的影響因素,人們也越來(lái)越關(guān)注影響因素之間的關(guān)聯(lián),SEM相較于一般的統(tǒng)計(jì)學(xué)方法能夠較好地解決這類問(wèn)題,具有顯而易見(jiàn)的優(yōu)勢(shì),雖然仍存在一定局限性[5],但SEM的研究方法與分析軟件也順應(yīng)科學(xué)需求不斷發(fā)展、日益完善,例如結(jié)合貝葉斯方法的參數(shù)估計(jì)[6],類別變量[7]、非正態(tài)數(shù)據(jù)[8]、非線性結(jié)構(gòu)[9]、多水平結(jié)構(gòu)數(shù)據(jù)[10]的分析處理方法正在進(jìn)一步研究與發(fā)展中。隨著模型理論的不斷完善以及統(tǒng)計(jì)軟件的開(kāi)發(fā),結(jié)構(gòu)方程模型在醫(yī)學(xué)領(lǐng)域必將有更廣闊的應(yīng)用前景。本實(shí)例通過(guò)AMOS軟件進(jìn)行實(shí)踐操作,相較于其他SEM分析軟件,如LISREL、MPLUS、CALIS、RAMONA、以及R語(yǔ)言相關(guān)包等,AMOS軟件對(duì)于統(tǒng)計(jì)理論及編程的掌握要求相對(duì)較低,基于窗口點(diǎn)擊式操作便于入門,且隸屬于SPSS家族系列,便于與普遍使用的sav格式數(shù)據(jù)文件進(jìn)行對(duì)接,且提供VB、SAS等軟件的數(shù)據(jù)接口,方便實(shí)用。