范曉玲 鄭 岱 盧謝峰
IRT等級展開模型在中學(xué)生學(xué)習(xí)焦慮綜合量表編制中的應(yīng)用
范曉玲 鄭 岱 盧謝峰
目的:運用IRT等級展開模型編制中學(xué)生學(xué)習(xí)焦慮綜合量表,為中學(xué)生學(xué)習(xí)焦慮的評估、咨詢與輔導(dǎo)提供工具,并探討中學(xué)生學(xué)習(xí)焦慮理論結(jié)構(gòu)。方法:采用理論與實踐相結(jié)合的方法構(gòu)建中學(xué)生學(xué)習(xí)焦慮結(jié)構(gòu),并在文獻(xiàn)、訪談和問卷調(diào)查的基礎(chǔ)上,構(gòu)建中學(xué)生學(xué)習(xí)焦慮項目庫,經(jīng)兩次測試與項目篩查,確定正式量表。取樣在湖南省長沙、邵陽、岳陽、婁底4市16所中學(xué)進(jìn)行,獲有效樣本2006份,其中各區(qū)人數(shù)分別為504、512、538、452人,男女生分別為888人和1113人,7~12年級學(xué)生分別為313、349、316、352、346、330人。結(jié)果:中學(xué)生學(xué)習(xí)策略量表由兩個分量表、42個項目構(gòu)成;正式問卷中自編項目31個,自編率達(dá)到了73.8%;IRT等級展開模型的項目分析顯示項目位置參數(shù)位于(-0.62,0.26)之間,區(qū)分度參數(shù)位于(0.61,2)之間,測驗整體和各項目的擬合度均良好;總量表α系數(shù)為0.90,重測信度為0.64,驗證性因素分析表明兩個分量表各項指標(biāo)的模型擬合度良好。結(jié)論:中學(xué)生學(xué)習(xí)焦慮綜合量表符合測量學(xué)的基本要求,并具有良好的自主性。
IRT;等級展開模型;學(xué)習(xí)焦慮;中學(xué)生
學(xué)習(xí)焦慮是學(xué)生學(xué)習(xí)過程中常見的一種心理現(xiàn)象。它是學(xué)生感到來自現(xiàn)實的或預(yù)想的學(xué)習(xí)情境對自己自尊心和價值感構(gòu)成威脅,而產(chǎn)生某種擔(dān)憂的心理反應(yīng)傾向。中學(xué)生是學(xué)習(xí)焦慮的高發(fā)群體,[1][2]一方面是因中學(xué)生處于被稱之為“困難時期”和“危險時期”的青春期,屬于人生的轉(zhuǎn)折階段,充滿著矛盾和復(fù)雜;另一方面則是由我國中學(xué)生學(xué)習(xí)負(fù)擔(dān)普遍偏重所致。隨著經(jīng)濟的不斷發(fā)展,社會對于人才的要求越來越高,這也導(dǎo)致家長、學(xué)校以及學(xué)生本人對學(xué)習(xí)的期望越來越高,各方施加給學(xué)生的壓力越來越大,由此學(xué)習(xí)焦慮現(xiàn)象也越來越普遍,已成為我國中學(xué)生心理健康的主要問題之一。[3][4]然而,以往有關(guān)學(xué)習(xí)焦慮的研究成果中,理論研究主要以焦慮理論為依據(jù),工具的研制以經(jīng)典測量理論和方法為主,測評內(nèi)容則集中于特定場景和單一學(xué)科上,如考試焦慮與英語學(xué)科焦慮等。學(xué)習(xí)涉及到學(xué)生學(xué)習(xí)生活的各個層面。本研究以當(dāng)代焦慮理論、學(xué)習(xí)焦慮研究的最新成果以及IRT等級展開模型為基礎(chǔ),研制適合我國中學(xué)生學(xué)習(xí)現(xiàn)狀的學(xué)習(xí)焦慮綜合量表,以期為學(xué)校心理咨詢和教育質(zhì)量監(jiān)測提供測評工具。
1.中學(xué)生學(xué)習(xí)焦慮量表的理論結(jié)構(gòu)與題本的形成
本研究首先在文獻(xiàn)分析的基礎(chǔ)上,依據(jù)Spielberg等人的狀態(tài)與特質(zhì)的焦慮理論,將學(xué)習(xí)焦慮分為特質(zhì)焦慮和狀態(tài)焦慮,然后依據(jù)Endler的多維焦慮結(jié)構(gòu)理論和小學(xué)生學(xué)習(xí)焦慮問卷[5]的結(jié)構(gòu)內(nèi)容,將特質(zhì)焦慮分為每日常規(guī)、社會評價、模糊性和身體危險,[6]將狀態(tài)焦慮分為學(xué)科焦慮、課堂焦慮、考試焦慮和作業(yè)焦慮。之后,我們根據(jù)中學(xué)教師、學(xué)生的訪談和開放式問卷結(jié)果,借鑒國內(nèi)外相關(guān)研究成果和自編項目,形成了包含104個項目的量表初稿。經(jīng)過兩輪預(yù)測和項目分析(預(yù)測人數(shù)分別為200和560),刪除題總相關(guān)小于0.30、具有“地板效應(yīng)”與“天花板效應(yīng)”,以及通俗水平小于0.60的項目,并對意義重復(fù)項目進(jìn)行刪改,獲得了包含90個項目的題本。項目采用四點記分,從“完全符合”到“完全不符合”,分別記為1分、2分、3分和4分。
2.施測對象
本研究在湖南省長沙、婁底、邵陽、岳陽四市的16所中學(xué)對2400名學(xué)生進(jìn)行施測,獲有效問卷2006份,其中男生888人,女生1113人,另有5人未注明性別;初一至高三學(xué)生分別為313、349、316、352、346和330人。14天之后,其中的554名初一至高三學(xué)生參與了重測。
1.項目位置參數(shù)及區(qū)分度參數(shù)
探索性因素分析表明,第一特征根為14.8,第二特征根為4.77。經(jīng)第一輪項目位置參數(shù)和區(qū)分度參數(shù)分析后形成問卷的43個項目,其項目位置參數(shù)和區(qū)分度參數(shù)如表1所示,其中項目位置參數(shù)在-0.62~0.26之間,區(qū)分度參數(shù)在0.61~2.00之間。
由表1的項目參數(shù)和圖1、圖2可知,數(shù)據(jù)在左端集中。
圖1 測驗特征曲線
圖2 項目位置估計
表1 項目位置參數(shù)及區(qū)分度
2.項目信息函數(shù)和測驗信息函數(shù)
如圖3、圖4所示,測驗項目的信息函數(shù)約為3左右,測驗的信息函數(shù)為70左右。
圖3 第3題的項目信息函數(shù)
圖4 測驗信息函數(shù)
3.擬合指標(biāo)分析
由圖5和圖6可知,本測驗不僅整體擬合性較好,而且項目擬合性較理想,即真實值與大部分研究項目的估計擬合情況是理想的。
圖5 全量表擬合圖
圖6 項目擬合圖
4.被試取樣合理性分析
IRT等級展開模型可用于評估被試取樣的合理性,即以θ值來判斷被試在特定空間中的整體分布情況。在實踐中,研究者往往希望使用較少的樣本量而能提高樣本的代表性。如圖7圖示,本測驗θ值分布約在-2.00~2.50之間。
圖7 被試特征分布圖
5.信度分析
本研究對全樣本進(jìn)行了內(nèi)部一致性信度分析,全量表的克倫巴赫α系數(shù)為0.90,特質(zhì)與狀態(tài)焦慮分測驗的α系數(shù)為0.90與0.77;全量表的重測信度為0.67,狀態(tài)和特質(zhì)焦慮分測驗的重測信度分別為0.70和0.64。
6.效度分析
本研究將被試按奇偶數(shù)分為兩個樣本,并以奇數(shù)樣本1003名被試數(shù)據(jù)進(jìn)行了探索性因素分析。首先,進(jìn)行一階因素分析,KMO=0.93,χ2= 27510.7,p=0.000,結(jié)果表明非常適應(yīng)做因素分析。之后,我們采用主成分法和Promax斜交旋轉(zhuǎn)抽取出8個因素:因素1有10項目,負(fù)荷量為0.50~0.75,主要反映英語學(xué)習(xí)焦慮;因素2有7個項目,負(fù)荷量為0.54~0.81,主要涉及數(shù)學(xué)學(xué)習(xí)焦慮;因素3有6個項目,負(fù)荷量為0.54~0.74,與中學(xué)生的日常生活有關(guān),命名為常規(guī)學(xué)習(xí)焦慮;因素4有8個項目,負(fù)荷量為0.49~0.73,主要涉及考試焦慮;因素5有3個項目,主要與學(xué)生的作業(yè)焦慮有關(guān),命名為作業(yè)焦慮;因素6有3個項目,負(fù)荷量為0.66~0.73,主要反映社會對于學(xué)生學(xué)業(yè)評價的擔(dān)憂,命名為社會評價焦慮;因素7有3個項目,負(fù)荷量為0.5~0.74,與語文學(xué)習(xí)有關(guān),命名為語文學(xué)習(xí)焦慮;因素8有3個項目,負(fù)荷量為0.41~0.46,主要涉及考試焦慮,與因素4合并。最終,本研究獲得了7個一階因素。
根據(jù)文獻(xiàn)資料及先前有關(guān)量表結(jié)構(gòu)的假設(shè),研究者對7個一階因子進(jìn)行了二階因素分析,其KMO=0.78,χ2=2907.4,p=0.000,適合做因素分析。結(jié)果如表2所示:因素1包括5個一階因素,分別是考試焦慮、英語焦慮、數(shù)學(xué)焦慮、作業(yè)焦慮以及語文焦慮,分別代表了中學(xué)生不同的學(xué)習(xí)狀態(tài),命名為狀態(tài)焦慮;因素2包括兩個一階因素,分別是社會評價和常規(guī)學(xué)習(xí)焦慮,主要與人們性格中固有的長期焦慮特征有關(guān),命名為特質(zhì)焦慮。
表2 二階因素負(fù)荷矩陣表
綜合項目分析和探索性因素分析的結(jié)果,研究者以偶數(shù)樣本1003名被試數(shù)據(jù),進(jìn)行了驗證性因素分析,結(jié)果如表3、圖7和圖8所示,兩個分測驗的擬合指標(biāo)均達(dá)到了可接受的水平。
圖7 狀態(tài)焦慮的路徑圖
表3 驗證性因素分析擬合指數(shù)
圖8 特質(zhì)焦慮的路徑圖
1.中學(xué)生學(xué)習(xí)焦慮綜合量表的結(jié)構(gòu)
中學(xué)生學(xué)習(xí)焦慮綜合量表的編制充分考慮了學(xué)習(xí)焦慮的內(nèi)涵和中學(xué)生的現(xiàn)實情況。首先,研究者以“狀態(tài)-特質(zhì)理論”為出發(fā)點,在大量文獻(xiàn)研究的基礎(chǔ)上,結(jié)合訪談和開放式問卷,建構(gòu)了中學(xué)生學(xué)習(xí)焦慮綜合量表的理論結(jié)構(gòu),即狀態(tài)、特質(zhì)焦慮兩個分量表,其中狀態(tài)焦慮分量表根據(jù)中學(xué)生不同的學(xué)習(xí)狀態(tài)分為學(xué)科焦慮、作業(yè)焦慮、考試焦慮以及課堂焦慮四個分測驗。在訪談和開放式問卷中我們發(fā)現(xiàn),中學(xué)生對于語文、數(shù)學(xué)、英語這三門學(xué)科的焦慮反應(yīng)比較普遍,同時在文獻(xiàn)檢索中也發(fā)現(xiàn)了同樣的現(xiàn)象。因此,綜合文獻(xiàn)研究與問卷調(diào)查的結(jié)果,我們將學(xué)科焦慮納入狀態(tài)焦慮。在進(jìn)行探索性因素分析后,研究者發(fā)現(xiàn)結(jié)果與理論框架基本吻合,但同時也可以看出,在實際施測中,中學(xué)生的學(xué)習(xí)焦慮與預(yù)先設(shè)想的維度稍有出入,因此,根據(jù)數(shù)據(jù)分析與邏輯分析,研究者適當(dāng)調(diào)整了原有分測驗,如課堂焦慮與作業(yè)焦慮在邏輯上與科目焦慮有所重疊,故將這一維度刪除。根據(jù)Endler的研究,特質(zhì)焦慮分每日常規(guī)(daily routines)、社會評價(social evaluation)、模糊性 (ambiguous)和身體危險(physical danger)。本研究發(fā)現(xiàn),身體危險對中國學(xué)生而言適應(yīng)性不太強。有研究認(rèn)為,雖然國外的研究表明,對于軀體癥狀的描述能準(zhǔn)確反映患者的焦慮傾向,但在中國的應(yīng)用上顯得難以適用,難以鑒別患者的焦慮傾向。[7]因此,本研究將“身體危險”這一維度予以剔除。另外,模糊性的項目可歸屬于每日常規(guī),本研究在進(jìn)一步的邏輯分析中也發(fā)現(xiàn),兩者確實存在邏輯上的重復(fù),因而將兩個維度予以合并和剔除。本研究最后對探索得到的理論結(jié)構(gòu)進(jìn)行了驗證,結(jié)果表明量表現(xiàn)有的結(jié)構(gòu)和內(nèi)容不僅與已有理論相吻合,而且符合中學(xué)生學(xué)習(xí)焦慮的特點。
2.中學(xué)生學(xué)習(xí)焦慮綜合量表的心理測量學(xué)指標(biāo)
IRT應(yīng)用的基本假設(shè)是單維性。通常按Hamilton的標(biāo)準(zhǔn),即最大特征根與第二特征根的比值大于3。[8]中學(xué)生學(xué)習(xí)焦慮綜合量表的第一特征根與第二特征根的比值為3.1,項目位置參數(shù)在-4至4之間,區(qū)分度參數(shù)在0.50與2.00之間,且集中于左端,這與測驗的性質(zhì)和項目位置意義有關(guān)。由于焦慮量表屬態(tài)度測驗,且位置參數(shù)反映著通俗性,以上數(shù)據(jù)說明測驗項目的可讀性較強。IRT的信息函數(shù)用于確定測驗的標(biāo)準(zhǔn)誤差,進(jìn)而反映測驗的信度。依據(jù)測驗信息函數(shù)的性質(zhì),當(dāng)性能參數(shù)比較優(yōu)良、適當(dāng),提供的測驗信息量多而充分時,其測量誤差較?。幌喾?,性能參數(shù)較差、不適當(dāng),提供的信息量就會減少,研究樣本的估計結(jié)果的精確性較差,其測量誤差較大。從IRT來看,測量的標(biāo)準(zhǔn)誤差(即測驗信度)主要受三個因素影響。一是測驗中的項目個數(shù)。測驗的信息函數(shù)是項目全部信息量的累加總和,用于測試的項目越多,測量的標(biāo)準(zhǔn)誤差會較小。二是測驗項目的質(zhì)量。若項目區(qū)分度越大,猜測參數(shù)越小,則測量中的標(biāo)準(zhǔn)誤會較小。三是被試水平與測驗項目位置參數(shù)間的比較關(guān)系。被試水平與項目位置參數(shù)互相匹配,測驗中信息量會越大,估計的標(biāo)準(zhǔn)誤會越小,測驗的信度相應(yīng)提高。通常,測驗中的標(biāo)準(zhǔn)誤不應(yīng)大于0.20,測驗中的全體信息量至少要達(dá)到25。[9]本研究中,中學(xué)生學(xué)習(xí)焦慮綜合量表的結(jié)果符合上述IRT的要求。測驗的擬合性分析主要是通過研究項目平均觀測值與期望值的擬合圖來進(jìn)行辨別,若研究的期望值與觀測的平均值比較靠近,說明其擬合情況很好,即觀測值越接近整體的真實水平。本研究中,雖然個別項目的期望值與觀測值有一些不同,但從總的測驗和部分項目的擬合圖中我們不難發(fā)現(xiàn),量表的擬合度水平較好,基本達(dá)到了測驗擬合指標(biāo)的要求。此外,本研究所編制的中學(xué)生學(xué)習(xí)焦慮綜合量表最終獲得42個項目,其中自編項目31個,自編率為73.8%。
中學(xué)生學(xué)習(xí)焦慮綜合量表的克倫巴赫α系數(shù)為0.90,兩個分測驗的α系數(shù)為0.90和0.77,表明同質(zhì)性信度很高;全量表的重測信度為0.67,兩個分測驗的重測信度為0.70與0.64。一般認(rèn)為,測驗的信度在0.70~1.00之間較為可靠,但測驗類型和測驗方式不同,信度也會有所不同。人格、興趣及態(tài)度等量表的重測信度往往低于能力傾向測驗。編制得好、能夠清晰測量所界定特征的量表,其重測信度才能達(dá)到0.80,[10]而團體測驗的重測信度要求達(dá)到0.70[11]。本研究中,中學(xué)生學(xué)習(xí)焦慮綜合量表的信度具有較好的統(tǒng)計意義和臨床意義。
[1]喬建中.學(xué)習(xí)焦慮水平與成敗歸因傾向關(guān)系的研究[J].南京師大學(xué)報(社會科學(xué)版),1997(1):27~29.
[2]王希永.中學(xué)生學(xué)習(xí)焦慮及其并發(fā)癥[J].青年研究,2000(2):30~33.
[3]陳永勝.348名初二學(xué)生一般性焦慮的測量[J].心理科學(xué)通訊,1990(3):20~22.
[4]馬惠霞,王福蘭.282名高中學(xué)生焦慮狀況的調(diào)查研究[J].教育理論與實踐,1994(6):47~51.
[5]李享.小學(xué)生學(xué)習(xí)焦慮量表的初步編制[D].長沙:湖南師范大學(xué),2011.
[6]Endler N S,Edward JM,Vitelli R. Endler Multidimensional Anxiety Scales (EMAS):computer program user’guide [M].Los Angeles,CA:Western Psychological Service,1991.
[7]魏源.多維焦慮評估量表的編制[J].中國臨床康復(fù),2005,9(12):30~31.
[8][9]Hamilton M. Develoment of A Rating Scale for Primary Depressive Illness[J].British Journal of Social and Clinical Psychology,1967(4):278~296.
[10][11]凱溫·R·墨菲,查爾斯·O·大衛(wèi)夏弗.心理測驗原理和應(yīng)用(第6版)[M].張娜,楊艷蘇,徐愛華(譯).上海:上海社會科學(xué)院出版社,2006.
責(zé)任編輯/王彩霞
G449
A
1674-1536(2014)12-0004-05
范曉玲/湖南師范大學(xué)教育科學(xué)學(xué)院教授,博士,碩士生導(dǎo)師。(長沙 410081)
鄭 岱/湖南師范大學(xué)教育科學(xué)學(xué)院碩士生。
盧謝峰/湖南師范大學(xué)教育科學(xué)學(xué)院副教授,博士。