文/滿鑫
利用校本成績(jī)?cè)u(píng)價(jià)學(xué)校基礎(chǔ)教育質(zhì)量
文/滿鑫
如果把中考、高考成績(jī)看做是中學(xué)生學(xué)習(xí)成就的一次終極性評(píng)價(jià),那么中學(xué)生在校期間所參加的由學(xué)校自主進(jìn)行的各類(lèi)階段性測(cè)試成績(jī)就可以被認(rèn)為是中學(xué)生學(xué)習(xí)成就的過(guò)程性評(píng)價(jià)。我們可以將由學(xué)校根據(jù)本地區(qū)、本校實(shí)際情況,結(jié)合教育教學(xué)計(jì)劃所進(jìn)行的階段性考核評(píng)價(jià)結(jié)果定義為校本成績(jī)。校本成績(jī)因其具有廣泛性、時(shí)效性、針對(duì)性等特點(diǎn),可以作為評(píng)價(jià)學(xué)生學(xué)習(xí)情況以及學(xué)校教學(xué)質(zhì)量的重要依據(jù)。
教學(xué)評(píng)價(jià);校本考試;項(xiàng)目反應(yīng)理論
基礎(chǔ)教育是人才培養(yǎng)過(guò)程中最核心的環(huán)節(jié),基礎(chǔ)教育的質(zhì)量是衡量一個(gè)地區(qū)的教育水平發(fā)展的重要指標(biāo)。進(jìn)入新世紀(jì),一些重要的國(guó)際組織和政府對(duì)教育質(zhì)量越來(lái)越重視,并由此發(fā)展起多種基礎(chǔ)教育監(jiān)測(cè)手段。例如,國(guó)際學(xué)生評(píng)價(jià)項(xiàng)目(PISA)、國(guó)際數(shù)學(xué)和科學(xué)研究(TIMSS)、美國(guó)的國(guó)家教育進(jìn)步評(píng)估(NEAP)等。
中國(guó)在《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》中明確指出:把提高教育質(zhì)量作為教育改革發(fā)展的核心任務(wù),并多次強(qiáng)調(diào)與教育質(zhì)量的監(jiān)測(cè)和評(píng)價(jià)相關(guān)的內(nèi)容。具體來(lái)講,要“建立國(guó)家義務(wù)教育質(zhì)量基本標(biāo)準(zhǔn)和監(jiān)測(cè)制度,開(kāi)展由政府、學(xué)校、社會(huì)各方面共同參與的教育質(zhì)量評(píng)價(jià)活動(dòng)”。進(jìn)一步來(lái)說(shuō),我國(guó)要逐步形成國(guó)家、省、地市、縣四級(jí)基礎(chǔ)教育監(jiān)控網(wǎng)絡(luò),建立起覆蓋全國(guó)的教育質(zhì)量監(jiān)測(cè)系統(tǒng)。
(1)評(píng)價(jià)對(duì)象上存在的問(wèn)題
現(xiàn)有的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)主要采取抽樣的方法,選取有代表性的樣本進(jìn)行集中測(cè)試來(lái)評(píng)價(jià)一個(gè)地區(qū)基礎(chǔ)教育質(zhì)量情況,例如PISA采取矩陣抽樣的方法在每個(gè)國(guó)家(經(jīng)濟(jì)體)抽取4500至10000人作為評(píng)價(jià)對(duì)象。但在實(shí)際情況中,由于各個(gè)國(guó)家、各個(gè)地區(qū)的差異,勢(shì)必造成抽樣的誤差,無(wú)法準(zhǔn)確反映本國(guó)、本地區(qū)基礎(chǔ)教育質(zhì)量的真實(shí)情況。
(2)評(píng)價(jià)工具上存在的問(wèn)題
現(xiàn)有的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)所選用的工具,主要是由相關(guān)組織部門(mén)通過(guò)一定的技術(shù)手段開(kāi)發(fā)的評(píng)價(jià)試題和練習(xí)經(jīng)過(guò)檢測(cè)后編制的試題冊(cè)。由此所帶來(lái)的是:評(píng)價(jià)工具試題的有限性與工具開(kāi)發(fā)的高成本。首先,每一次的評(píng)價(jià)結(jié)果都是以一次評(píng)價(jià)獲取的數(shù)據(jù)為依據(jù),每次評(píng)價(jià)時(shí)的試題容量必定有限,同時(shí),不同地區(qū)接受同一測(cè)試也有失偏頗,能否全面準(zhǔn)確測(cè)出學(xué)生的真實(shí)情況有待考慮;其次,評(píng)價(jià)工具由專(zhuān)家組通過(guò)前期編制,以及后期反復(fù)檢測(cè)最終編制成試題冊(cè),成本較高,對(duì)于經(jīng)濟(jì)發(fā)展水平低的地區(qū)難以承受。
(3)評(píng)價(jià)的時(shí)間跨度
現(xiàn)有的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)主要是每3到4年進(jìn)行一次,如NAEP是每四年進(jìn)行一次,PISA每三年一輪,因此很難針對(duì)學(xué)生的基礎(chǔ)教育質(zhì)量進(jìn)行連續(xù)的監(jiān)測(cè),存在時(shí)間上的跨度。
校本考試是學(xué)校根據(jù)本地區(qū)、本校實(shí)際情況,結(jié)合教育教學(xué)計(jì)劃所進(jìn)行的階段性考核,例如單元檢測(cè),期中、期末考試等。校本考試考核范圍廣泛,涵蓋學(xué)生接受的所有課程內(nèi)容;其次,以單元檢測(cè)為例,學(xué)生進(jìn)行完某一階段的學(xué)習(xí)內(nèi)容,會(huì)及時(shí)的對(duì)該階段的學(xué)習(xí)效果進(jìn)行評(píng)價(jià),不存在時(shí)間上的斷續(xù)。因此具有廣泛性、針對(duì)性、時(shí)效性等優(yōu)點(diǎn)。
除此之外,每個(gè)學(xué)校在學(xué)生學(xué)習(xí)期間都會(huì)有大量的階段性考試數(shù)據(jù),如果棄之不用將造成數(shù)據(jù)信息的極大浪費(fèi)。利用校本考試數(shù)據(jù)對(duì)教學(xué)質(zhì)量進(jìn)行評(píng)價(jià),不需要進(jìn)行專(zhuān)門(mén)的抽樣及試題開(kāi)發(fā),成本上幾乎可以忽略不計(jì)。
總體來(lái)說(shuō),利用校本成績(jī)進(jìn)行教學(xué)評(píng)價(jià),具有成本低、效率高、準(zhǔn)確性強(qiáng),并與我國(guó)當(dāng)前形勢(shì)下的基礎(chǔ)教育現(xiàn)狀相適應(yīng)的特點(diǎn),可以預(yù)見(jiàn),將具有較強(qiáng)的實(shí)踐意義。
由于試題的難度存在差異,比如某位考生在一次考試中獲得了高分,但是下次考試難度提高后,即使其能力有所提升,但可能考試成績(jī)也會(huì)下降,因此不能簡(jiǎn)單的通過(guò)原始分?jǐn)?shù)的對(duì)比評(píng)價(jià)其學(xué)習(xí)質(zhì)量,另外,由于作答時(shí)存在考生猜測(cè)等因素,使原始分?jǐn)?shù)具有一定的誤差。而通過(guò)一種新的測(cè)量理論——項(xiàng)目反應(yīng)理論(IRT)的指導(dǎo),可以有效解決這個(gè)問(wèn)題。IRT理論即項(xiàng)目反應(yīng)理論(ItemResponseTheory,IRT),是一系列心理統(tǒng)計(jì)學(xué)模型的總稱(chēng),用來(lái)分析考試成績(jī)或者問(wèn)卷調(diào)查數(shù)據(jù)。這些模型的目標(biāo)是來(lái)確定的潛在心理特征是否可以通過(guò)測(cè)試題被反應(yīng)出來(lái),具有被試特質(zhì)水平不依賴(lài)于被試樣本的代表性、被試能力計(jì)算不依賴(lài)于測(cè)驗(yàn)項(xiàng)目組的特點(diǎn)。使用項(xiàng)目反應(yīng)理論計(jì)算出的學(xué)生能力值,不會(huì)因?yàn)闇y(cè)量?jī)?nèi)容的改變而發(fā)生變化,也就是說(shuō),無(wú)論測(cè)驗(yàn)難易程度如何,同一水平考生計(jì)算出的能力值是穩(wěn)定的。
若我們計(jì)算每次測(cè)驗(yàn)中考生的能力值,分析其變化趨勢(shì),即可以得出該校、該地區(qū)基礎(chǔ)教育的發(fā)展情況,對(duì)考生的真實(shí)能力變化進(jìn)行跟蹤研究。例如,在連續(xù)幾次測(cè)驗(yàn)中,學(xué)生的能力值曲線呈上升趨勢(shì),則可以認(rèn)為學(xué)校近期的教學(xué)質(zhì)量是有所提高的。另外,通過(guò)分析研究某一學(xué)生的能力值曲線還可以發(fā)現(xiàn)該生哪一部分內(nèi)容沒(méi)有掌握完善。值得一提的是,這種對(duì)學(xué)生能力值的計(jì)算是不需要花費(fèi)太大成本的,同一估算方法經(jīng)過(guò)簡(jiǎn)單修改后幾乎適用于任何類(lèi)型考試。
[1]戴海崎,劉啟輝. 錨題題型與等值估計(jì)方法對(duì)等值的影響,心理學(xué)報(bào),2002,34(4):367-370.
[2]羅照盛.項(xiàng)目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012,80
[3]漆書(shū)青.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].北京:高等教育出版社,2002,201-215
[4]李峰,朱彬鈺,辛濤. 十五年來(lái)心理測(cè)量學(xué)研究領(lǐng)域可視化研究——基于CITESPACE的分析[J].心理科學(xué)進(jìn)展,2012,07:1128-1138.
[5]熊江玲. 經(jīng)典測(cè)量理論、概化理論及項(xiàng)目反映理論比較研究[J]. 求索, 2004(04)
[6]尹秋蓮,王濤. 香港高考校本評(píng)核的運(yùn)用及啟示[J]. 河北師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2011,09:62-65.
[7]鄭曉敏,張永軍. 接軌國(guó)際 多元出路 強(qiáng)化校本——香港高中教育評(píng)核制度改革述評(píng)[J]. 教育科學(xué)論壇,2011,05:22-24
G
A
2095-9214(2015)02-0243-01
江西師范大學(xué)心理學(xué)院)