鄧穩(wěn)根 戴海琦 黃海等
摘要調(diào)查了拓廣等級展開模型(GGUM)對EPQ反應(yīng)數(shù)據(jù)的擬合情況。結(jié)果發(fā)現(xiàn):(1)E量表最符合GGUM單維性的假設(shè),即得到2個線性主成分,項目在這2個主成分上的負(fù)荷略微呈現(xiàn)一個半圓形的模式;(2)約束GGUM的閾限參數(shù)在項目間相等而得到的模型A在對EPQ的數(shù)據(jù)進(jìn)行分析時是最簡潔而有效的;(3)模型A和2PLM相比,前者在E和P上的擬合顯著優(yōu)于后者,在N上,兩個模型提供了相似的擬合度。結(jié)果表明展開模型比優(yōu)勢模型更適合用于分析EP0的數(shù)據(jù)。
關(guān)鍵詞拓廣等級展開模型,人格,EPQ,模型一數(shù)據(jù)擬合。
分類號G449.1
1引言
項目反應(yīng)理論(IRT)當(dāng)前在國外廣泛用于包括才能、成就、熟練性、入學(xué)和職業(yè)資格考試的認(rèn)知能力評估中,但在態(tài)度、人格等領(lǐng)域中的應(yīng)用并不普遍。原因之一是大部分IRT模型是建立在反應(yīng)過程的優(yōu)勢假設(shè)基礎(chǔ)之上,即認(rèn)為個體在特質(zhì)連續(xù)體上的位置越高于項目的位置,作答正確的可能性就越大。而Andrich和Luo以及Roberts等人則認(rèn)為態(tài)度測量中的不贊成一贊成反應(yīng)是和理想點假設(shè)相關(guān)聯(lián)的,即只有當(dāng)個體在態(tài)度連續(xù)體上的位置與項目位置接近時,才最可能贊成項目,當(dāng)遠(yuǎn)離項目位置,無論是高于還是低于項目位置時,個體贊成項目的概率都較低。采用優(yōu)勢模型對態(tài)度陳述的反應(yīng)數(shù)據(jù)進(jìn)行分析會降低處于態(tài)度連續(xù)體兩個極端位置上的個體的特質(zhì)水平的測量效度。Chernyshenko等人和Stark等人認(rèn)為人格項目本質(zhì)上是關(guān)于人們自身的行為態(tài)度陳述,因而人格測驗的數(shù)據(jù)更適用于使用展開模型而不是優(yōu)勢模型進(jìn)行分析。
目前研究者提出了多種展開模型,既有參數(shù)式的模型,例如PARELLA模型、雙曲余弦模型(日CM)、等級展開模型(GUM)和拓廣等級展開模型(GGUM),也有非參數(shù)式的模型。非參數(shù)模型由于容易受到項目或被試抽樣的影響,在實際研究中使用較少。而參數(shù)模型由于提供了參數(shù)不變性的測量。有利于計算機(jī)自適應(yīng)測試(CAT)、題庫建設(shè)和項目參數(shù)的鏈接或等值,因而為大多數(shù)量表建構(gòu)和數(shù)據(jù)分析所采用。
在已有的幾個展開模型中,使用最多的是Roberts等人提出的一族展開模型,該族模型的最一般形式是GGUM問。GGUM允許區(qū)分度和閾限參數(shù)在項目間變化,適用于不贊成一贊成反應(yīng)類別的數(shù)據(jù)。對GGUM的項目區(qū)分度和閾限參數(shù)進(jìn)行不同形式的約束可以得到其余7個約束模型(詳細(xì)情況可參閱文獻(xiàn)),目前已經(jīng)有一些研究者開始探索GGUM在EPQ、16PF、大五人格問卷以及情感能力問卷的數(shù)據(jù)中的擬合性。在這些研究中,沒有直接調(diào)查數(shù)據(jù)是否滿足單維性的假設(shè),研究的重點僅放在優(yōu)勢模型和GGUM對項目反應(yīng)數(shù)據(jù)擬合的差異比較上,而沒有研究Roberrs等人提出的8個展開模型中哪個模型擬合最優(yōu)。本研究將采用主成分方法和平行分析程序直接檢驗EPQ各分量表反應(yīng)數(shù)據(jù)是否滿足單維性條件,并比較GGUM和它的三個約束模型在EPQ各分量表反應(yīng)數(shù)據(jù)上的擬合差異,最后將前一步得到的擬合最優(yōu)模型與2PLM進(jìn)行比較,以便獲得展開模型與優(yōu)勢模型在人格測量數(shù)據(jù)中擬合優(yōu)劣的證據(jù)。
2方法
采用陳仲庚修訂的EPQ問卷對某大學(xué)的1947名本科生進(jìn)行施測,其中男生1181人,女生766人,所有被試的平均年齡為18.6歲,標(biāo)準(zhǔn)差為1.08。
采用O'Connor編制的SPSS程序進(jìn)行主成分分析和平行分析。采用GGUM2004和BILOG-MG計算機(jī)程序估計項目和個人參數(shù),采用MODFIT計算擬合統(tǒng)計量的值。GGUM2004和MODFIT均可以從互聯(lián)網(wǎng)上獲得。
3結(jié)果
3.1單維性檢驗
Davision等人證實了當(dāng)數(shù)據(jù)擬合一個單維展開模型時,采用主成分分析將得到2個主成分,并且項目在這2個主成分上的負(fù)荷形成一個扇形的模式。Nandakumar等人在GGUM的模擬研究中發(fā)現(xiàn)因素主軸分析不適用于展開模型的維度檢驗,而采用主成分分析則顯得較為合理。他結(jié)合主成分分析和bootstrapped法平行分析也得到了2個線性主成分,各項目在這兩個成分上的負(fù)荷在第1和第1V象限內(nèi)形成一個半圓形的扇形模式。
本研究的結(jié)果如圖1和圖2所示。從圖1中可以看出,E和P量表的平行分析結(jié)果保留了兩個線性主成分。E量表的2個線性主成分的特征值分別為5,21和1.32。第一和第二主成分的負(fù)荷相差達(dá)3倍以上。P量表第一主成分和第二主成分的特征值相差并不大,分別為2.00和1.61。N量表保留了3個線性主成分。這三個線性主成分的特征值分別為5.66、1.44和1.30,第一主成分的特征值比第二第三主成分的特征值約高4倍或更多。進(jìn)一步以2個成分?jǐn)?shù)目進(jìn)行主成分抽取,分別得到各量表下的項目在這兩個主成分上的負(fù)荷(未旋轉(zhuǎn))散點圖(如圖2)。從散點圖可以看出,除E量表的成分負(fù)荷略呈半圓形的模式外,N和P量表的成分負(fù)荷均未呈現(xiàn)這種模式。綜合兩個方面的結(jié)果,本文認(rèn)為E量表較符合展開反應(yīng)型數(shù)據(jù)單維性假設(shè),相對其它兩個量表可能更適合采用展開模型來分析,而N量表由于第一主成分有足夠大;可能更符合優(yōu)勢反一應(yīng)型數(shù)據(jù)單維性的假設(shè),采用展開模型進(jìn)行分析并不會比累積模型有更大的優(yōu)勢。P量表對于兩種類型數(shù)據(jù)的單維性假設(shè)都不太滿足,采用兩種模型來分析都有可能不太擬合數(shù)據(jù)。
3.2四個展開模型之間的比較
Roberts等人提出,似然比統(tǒng)計量可以用來檢驗嵌套模型的整體擬合差異。方法是首先通過約束特定的項目參數(shù)得到一個嵌套的約束模型,然后將該約束模型的反應(yīng)似然(L*)和一個受更少約束(或無約束)模型的反應(yīng)似然(L)進(jìn)行比較。似然比統(tǒng)計量(LR)等于-2[1n(L*)1n(L)]。該統(tǒng)計量服從自由度等于2個模型中待估項目參數(shù)數(shù)量之差的)(分布。本研究中考察了GGUM的3個約束模型,其中模型A是將GGUM項目間的閾限參數(shù)(Tik)固定為常數(shù)而得到的模型,模型B是將項目間的區(qū)分度參數(shù)固定為1.0,模型C對這2個參數(shù)都進(jìn)行了固定。這三個約束模型都是GGUM的嵌套模型,而模型C又嵌套于模型A或B,因而可以使用似然比統(tǒng)計量來評價增加的模型擬合。表l概括了在EPQ上,這些模型的比較結(jié)果。從表中可以看出,和GGUM相比,模型B和C都導(dǎo)致顯著減少的擬合值,而模型A擬合值的減少并不大,表明EPQ問卷的反應(yīng)數(shù)據(jù)采用模型A來分析是最簡潔而有效的。
3.3模型A和2PLM的項目擬合情況比較
GGUM2004計算機(jī)程序中使用的項目擬合統(tǒng)計量是從優(yōu)勢模型中拓廣過來的,DeMars應(yīng)用它們到展開模型中時,發(fā)現(xiàn)它們的I型錯誤率都有些問題,所以在人格測量中。經(jīng)常采用單個項目、
兩項目對和三項目組的x2/df指數(shù)來考察項目的捌合情況。Drasgow等人認(rèn)為這個統(tǒng)計量對比較幾個競爭的IRT模型是非常有用的,最佳擬合的模型對單個項目和兩項目對以及三項目組都有較小(低于3)的校正的x2/df。如果校正的)x2/df>3則表明項目/選項反應(yīng)函數(shù)的參數(shù)形式被違背了,或者數(shù)據(jù)是多維的,這兩種情況都顯示所選的IRT模型不擬合數(shù)據(jù)。本研究將比較2PLM和模型A的校正)x2/df之所以選擇2PLM和模型A進(jìn)行比較,是因為大多數(shù)研究發(fā)現(xiàn)2PLM在優(yōu)勢模型中是擬合人格數(shù)據(jù)最優(yōu)的。比較的結(jié)果如表2所示。從表2中可以看出,模型A在E和P量表,特別是在P量表上的擬合顯著優(yōu)于2PLM。在N量表上兩個模型的擬合相類似,且擬合都比較優(yōu)良。
4討論
本研究結(jié)果表明,總體來看,展開模型比優(yōu)勢模型更擬合EPQ反應(yīng)數(shù)據(jù),這說明個體對人格項目的反應(yīng)更可能是基于理想過程假設(shè)而不是優(yōu)勢過程假設(shè)的。展開模型之間的比較結(jié)果顯示,盡管GGUM對項目參數(shù)的考慮更為完備,但并沒有因此導(dǎo)致模型對數(shù)據(jù)擬合的顯著改善,而更為簡潔的模型A(即限制閾限參數(shù)在項目間是固定的)提供了和GGUM一樣有效的結(jié)果,原因可能是現(xiàn)有的EPQ問卷的項目內(nèi)容一致性較強,導(dǎo)致這些項目的反應(yīng)閾限比較接近,從而限制各項目的閾限相等并不會導(dǎo)致模型的擬合變差。
本研究發(fā)現(xiàn)展開模型對E量表的項目反應(yīng)擬合最好,該結(jié)果印證了Nandakumar等人模擬研究的結(jié)果,即當(dāng)數(shù)據(jù)顯示出2個線性主成分,并且項目在這2個線性主成分上的負(fù)荷符合一個半圓形的扇形模式時,最適合采用展開模型進(jìn)行分析。本研究也發(fā)現(xiàn),當(dāng)?shù)?主成分遠(yuǎn)遠(yuǎn)大于第2主成分時,例如E和N量表,采用合適的優(yōu)勢模型和展開模型進(jìn)行分析。結(jié)果都比較良好。而當(dāng)?shù)趌主成分和第2主成分相差不大,且有2個主成分被保留時,例如P量表,展開模型的擬合顯著優(yōu)于優(yōu)勢模型。該結(jié)果是否具有一般性還需要進(jìn)一步研究。
本研究的結(jié)果顯示P量表第1和第2主成分的特征值相差并不大,表明該量表可能存在多維性。原因可能與該維度的確定缺乏一定的依據(jù)有關(guān)。目前已有實驗證據(jù)確定了E維度和N維度神經(jīng)機(jī)制的存在,但P維度存在的機(jī)制尚缺乏足夠的證據(jù)支持,導(dǎo)致該量表項目內(nèi)容的編制缺乏明確的界定,從而無法保證這些項目的同質(zhì)性,也就很難確保該量表的單維性。
5結(jié)論
本研究可以得出這樣的結(jié)論,即Roberts的展開模型比2PLM更適用于EPQ的數(shù)據(jù)分析,且EPQ問卷的E量表最適合采用他提出的展開模型進(jìn)行分析。本研究深化了Nandakumar等人的研究,即當(dāng)數(shù)據(jù)擬合單維展開模型時,不僅要求在采用主成分分析時能得到2個線性主成分,而且要求這2個主成分的差異要足夠大,這樣才有可能使得項目在這2個主成分上的負(fù)荷呈現(xiàn)半圓形的扇形模式。本研究中也發(fā)現(xiàn),當(dāng)一些人格變量的數(shù)據(jù)并不完全符合單維性假設(shè)時,采用單維展開模型也能較好地擬合它。