貴州師范大學(xué)心理學(xué)院 高旭亮
教育統(tǒng)計與測量不僅是現(xiàn)代教育學(xué)科群中的重要成員,還是高等師范院校教育類專業(yè)的必修課程。它的基礎(chǔ)知識和技能是廣大從事教育行業(yè)工作者都應(yīng)該掌握的一門現(xiàn)代科學(xué)。[1]教育統(tǒng)計與測量課程包含教育統(tǒng)計學(xué)和教育測量兩部分內(nèi)容。教育統(tǒng)計主要包括了描述統(tǒng)計和推斷統(tǒng)計等內(nèi)容,描述統(tǒng)計是對數(shù)據(jù)進(jìn)行總體的概括分析,推斷統(tǒng)計是指如何利用樣本資料來對總體進(jìn)行推論。[2]教育測量主要包含了:一是如何開發(fā)和編制科學(xué)的教育測評測驗;二是如何評價題目質(zhì)量和測驗質(zhì)量,以提高測驗的精度。
學(xué)習(xí)和掌握教育統(tǒng)計與測量的理論和技術(shù),對于從事現(xiàn)代教育行業(yè)工作者具有重要的作用。具體來講,第一,教育統(tǒng)計與測量能夠指導(dǎo)教師編制科學(xué)的測驗。在平常的教學(xué)活動中教師經(jīng)常會自編測驗來對學(xué)生進(jìn)行測評,如果自編測驗的質(zhì)量本身存在很大的問題,那么基于測驗分?jǐn)?shù)進(jìn)行的推論就會存在較大地偏差,即不能對學(xué)生的能力做出正確的評估。因此,焦璨和張敏強(2012)指出作為一名合格的教師,必須要學(xué)會編制科學(xué)的教育評估測驗,這涉及教育測量中測驗編制的內(nèi)容。[3]第二,教育統(tǒng)計與測量能讓教師學(xué)會對測驗結(jié)果進(jìn)行科學(xué)的評價,即教師能夠應(yīng)用恰當(dāng)?shù)慕y(tǒng)計方法對測驗分?jǐn)?shù)進(jìn)行分析,例如,對測驗分?jǐn)?shù)進(jìn)行基本的描述統(tǒng)計,包括班級平均分,標(biāo)準(zhǔn)差,以及按分?jǐn)?shù)段統(tǒng)計學(xué)生的比例;教師可以了解每個學(xué)生在班級中所處的位置、了解學(xué)生在某些教學(xué)方法中是如何學(xué)習(xí)的、發(fā)現(xiàn)學(xué)生在學(xué)習(xí)中的優(yōu)勢和劣勢,從而幫助教師了解如何更好地教孩子/學(xué)生,使教學(xué)過程更有效。第三,教育統(tǒng)計與測量是開展教育科學(xué)研究的重要工具,統(tǒng)計和測量,是我們進(jìn)行教育研究設(shè)計,其中包括調(diào)查設(shè)計和實驗設(shè)計,科學(xué)地收集數(shù)據(jù),包括抽樣和測量,特別是對研究中獲得的數(shù)據(jù)進(jìn)行分析的有力方法和工具。[1]Garfield和Chance(2000)指出統(tǒng)計與測量可讓學(xué)習(xí)者更好地認(rèn)識教育現(xiàn)象的本質(zhì)和規(guī)律,培養(yǎng)科學(xué)的思維方式,并對測驗數(shù)據(jù)進(jìn)行定性和定量的分析。[4]
總之,對于教育類專業(yè)的本科生而言,掌握教育與統(tǒng)計測量的基本原理、分析方法具有重要的意義。焦璨和張敏強(2012)指出只有掌握了教育統(tǒng)計與計量的基本概念、理論和方法,才能完成基礎(chǔ)教學(xué)工作,成為一名優(yōu)秀的教師。[3]
當(dāng)前,教育統(tǒng)計與測量課程在教學(xué)過程中主要面臨來自三個方面的問題,分別是教材內(nèi)容略顯單薄、教學(xué)方法單一、課程設(shè)置欠佳。
當(dāng)前教材的教育測量內(nèi)容主要以經(jīng)典測量理論(CTT)內(nèi)容為主。該理論的出發(fā)點是假設(shè)考生的反應(yīng)之間的系統(tǒng)效應(yīng)僅是由于其感興趣的能力(即真實分?jǐn)?shù))而引起的。所有其他存在于考試材料、外部條件或考生內(nèi)部的潛在變異來源,要么被假定為通過嚴(yán)格的標(biāo)準(zhǔn)化而保持不變,要么被假定為具有非系統(tǒng)性或“隨機性”的影響。[5]戴海琦和羅照盛(2013)指出由于CTT理論的天然缺陷,其導(dǎo)致它在實際應(yīng)用中存在較大的局限性。例如,其項目參數(shù)的估計嚴(yán)重依賴于所使用的被試樣本;參加不同考試的考生之間無可比性;測驗誤差估計的“籠統(tǒng)性”;由于受到標(biāo)準(zhǔn)化測驗環(huán)境的影響,其測驗結(jié)果推廣性有限。[6]
為了克服CTT理論的缺陷,測量學(xué)專家提出了新的測驗理論:項目反應(yīng)理論,概化理論以及新近發(fā)展的認(rèn)知診斷理論。[7]這些現(xiàn)代測驗理論在教育評價中逐漸發(fā)揮著越來越重要的作用。然而,當(dāng)前教育統(tǒng)計與測量的教材幾乎未提及現(xiàn)代測驗理論,這并不利于學(xué)生更好地了解測驗理論的新發(fā)展,掌握現(xiàn)代教育測評的新趨勢和新理念。
本課程的教學(xué)方法主要是基于教師對基礎(chǔ)知識的講解,例如,統(tǒng)計原理,統(tǒng)計方法,公式推導(dǎo)。教師在課堂上很少解釋與本課程相關(guān)的實際應(yīng)用案例。其實,該課程是一門實踐性很強地課程,學(xué)生在學(xué)習(xí)這門課程時,除了要理解教育統(tǒng)計與測量的方法、原理之外,更重要的是了解這些方法的實際應(yīng)用,當(dāng)面對實際測驗數(shù)據(jù)時,能合理地選用這些統(tǒng)計和測量學(xué)方法分析測驗數(shù)據(jù),挖掘測驗信息。當(dāng)前教育統(tǒng)計與測量課程的教學(xué)過程過于注重知識的講解,即理論與實踐不能很好地結(jié)合,過分強調(diào)理論講解會降低學(xué)生學(xué)習(xí)的興趣和熱情。
課程設(shè)置不合理表現(xiàn)在課時安排不合理。該課程共計48學(xué)時,全部為課堂講授,并未安排上機實驗課時。該課程的一個重要目標(biāo)是讓學(xué)生學(xué)會統(tǒng)計分析軟件的使用,其中包括SPSS和Mplus等軟件的使用。大部分章節(jié)需要使用SPSS軟件進(jìn)行分析,包括描述統(tǒng)計,比較平均值,方差分析,回歸分析,非參數(shù)檢驗,題目難度和區(qū)分度、測驗信度和效度分析,而Mplus軟件主要用于演示因子分析(EFA和CFA)章節(jié)的數(shù)據(jù)分析過程。這2種統(tǒng)計軟件的使用都需要在機房進(jìn)行教學(xué),其缺少上機實驗安排,且不利于學(xué)生練習(xí)和掌握統(tǒng)計軟件的使用。
基于該課程所面臨的3個問題,我們分別從3個方面提出了提升的策略:重組教材內(nèi)容,豐富教學(xué)方法,合理安排課堂講授和上機課時。
對于當(dāng)前教育統(tǒng)計與測量教材內(nèi)容較少介紹現(xiàn)代測驗理論的缺點。建議在教材編排中增加一個章節(jié)來介紹測驗理論與技術(shù)的新發(fā)展。新增加的章節(jié)重點介紹三種新的測驗理論:項目反應(yīng)理論(IRT),概化理論(GT)和認(rèn)知診斷理論(CDT)。其中,對于IRT的介紹至少應(yīng)該包括:(1)與CTT理論相比,IRT的主要優(yōu)勢體現(xiàn)在哪些方面;(2)IRT的基礎(chǔ)模型;例如,Rash模型,Logistic模型;(3)IRT基礎(chǔ)模型的拓展;例如,多維IRT模型,多級評分IRT模型,多維多級評分的IRT模型;(4)項目特征曲線;(5)IRT模型的參數(shù)估計軟件;(6)IRT的相關(guān)技術(shù),例如,信息函數(shù)在評價項目和測驗質(zhì)量的應(yīng)用,計算機化自適應(yīng)測驗的開發(fā)、原理和實際應(yīng)用案例,題庫參數(shù)的等值技術(shù)。
概化理論的簡介應(yīng)包含:(1)測驗分?jǐn)?shù)的測量學(xué)意義;(2)誤差來源的多樣性與總分方差的結(jié)構(gòu);(3)概化理論的研究方法;(4)概化理論的測驗情境關(guān)系理論,其中包括測量目標(biāo),測量側(cè)面,概化理論的真分?jǐn)?shù)概念;(5)測驗設(shè)計的模型與種類;(6)G研究和D研究。
認(rèn)知診斷理論的介紹應(yīng)該包含:(1)認(rèn)知診斷理論的發(fā)展過程;(2)認(rèn)知診斷的基本概念;包括認(rèn)知診斷的目的,屬性,屬性邏輯關(guān)系,認(rèn)知診斷模型;(2)Q矩陣?yán)碚?;?)認(rèn)知診斷的流程;(4)編制認(rèn)知診斷測驗的方法;包括測驗編制的基本原則、編制的過程;(5)認(rèn)知診斷模型的介紹;(6)認(rèn)知診斷測驗的實際案例;(7)認(rèn)知診斷數(shù)據(jù)的分析。
增加案例法在教學(xué)過程中的應(yīng)用,通過案例法教學(xué),讓學(xué)生更了解統(tǒng)計測量方法在實際中的重要應(yīng)用,激發(fā)學(xué)生的學(xué)習(xí)興趣和動機。例如,在講解標(biāo)準(zhǔn)化教育成就測驗這一章節(jié)內(nèi)容時,給學(xué)生介紹當(dāng)前國際上大規(guī)模的教育成就測驗—國際學(xué)生評估項目(PISA測驗)。以某一年P(guān)ISA測驗的內(nèi)容,施測流程,數(shù)據(jù)分析過程,數(shù)據(jù)結(jié)果等為例,來詳細(xì)解釋標(biāo)準(zhǔn)化教育成就測驗的施測過程和重要應(yīng)用。通過分析PISA測驗所涉及的一些教育測驗理論和數(shù)據(jù)分析技術(shù),引導(dǎo)學(xué)生掌握標(biāo)準(zhǔn)化教育成就測驗的編制過程、數(shù)據(jù)分析方法。了解教育測評理論在大規(guī)模學(xué)科成就測驗中的重要意義,激發(fā)學(xué)生的學(xué)習(xí)熱情,鼓勵學(xué)生不斷提高專業(yè)素養(yǎng),培養(yǎng)刻苦鉆研的精神。
該課程總計48課時,全部為課堂講授課時。建議將課時分為課堂教學(xué)和計算機操作,課堂教學(xué)32課時,計算機實驗教學(xué)為16學(xué)時。其中,實驗課時穿插與課堂講授中,每一個章節(jié)講授完之后,安排2節(jié)上機實驗。例如,當(dāng)學(xué)習(xí)完集中量數(shù)和差異量數(shù)等內(nèi)容后,安排2節(jié)課時為上機實驗操作,在上機課中教師演示如何使用SPSS軟件對數(shù)據(jù)進(jìn)行描述統(tǒng)計分析,學(xué)生跟隨老師的步驟進(jìn)行課堂練習(xí)。為了讓學(xué)生更好地掌握統(tǒng)計軟件的使用,老師可布置一個課后作業(yè),讓學(xué)生完成一份使用軟件來分析數(shù)據(jù)的作業(yè)。作業(yè)內(nèi)容可為對一些實例數(shù)據(jù)進(jìn)行分析。例如,相關(guān)分析,比較平均值,方差分析,因子分析,回歸分析,以及對一份測驗數(shù)據(jù)進(jìn)行測量學(xué)分析,包括單選題的選項分析,多級評分題目的分?jǐn)?shù)分布,題目難度和區(qū)分度,測驗信度和效度等的分析。
教育統(tǒng)計與測量在教育學(xué)類專業(yè)中是一門重要的應(yīng)用型學(xué)科,但就目前該課程在教材內(nèi)容,教學(xué)方法和課程設(shè)置等方面仍存在一定的不足。未來的改進(jìn)策略可以考慮重組教材內(nèi)容,增加介紹一些新的測驗理論,讓學(xué)生及時了解教育測評的最新理念和趨勢;增加課堂小組討論和案例教學(xué)來豐富教學(xué)方法,從而提高學(xué)生的學(xué)習(xí)熱情;合理安排課堂講授和實驗上機課時,增加上機操作課時,讓學(xué)生在實際操作中掌握統(tǒng)計分析軟件的使用。