袁 莉 譯
編者按:這篇文章是Nuffield Foundation 資助的 “為了未來(lái)的評(píng)價(jià)系統(tǒng)”課題的研究成果。這個(gè)研究課題是由評(píng)價(jià)改革小組2003 年建立的,由劍橋大學(xué)教育學(xué)院的Wynne Harlen領(lǐng)導(dǎo)其他核心組成員①完成,旨在從對(duì)在校學(xué)生的終結(jié)性評(píng)價(jià)的研究和實(shí)踐中尋找證據(jù),從而獲取使學(xué)生從終結(jié)性評(píng)估中收益的教學(xué)方法。怎樣發(fā)揮教師在終結(jié)性評(píng)價(jià)中的作用是這個(gè)課題的重點(diǎn)。有關(guān)這個(gè)課題的詳細(xì)信息和評(píng)價(jià)改革小組的其他活動(dòng)及研究成果,請(qǐng)?jiān)L問(wèn)其網(wǎng)站www.assessment-reform-group.org
[關(guān)鍵詞] 教師;終結(jié)性評(píng)價(jià);作用
[中圖分類號(hào)] G632.471[文獻(xiàn)標(biāo)識(shí)碼] A[文章編號(hào)] 1672-1128(2007)10-0014-07
一、綜 述
評(píng)價(jià)和考試對(duì)年輕一代的生活和工作有著重大的影響。學(xué)校所作出的決定,特別是國(guó)家統(tǒng)一考試的成績(jī)極大地影響著學(xué)生的就業(yè)機(jī)會(huì)和前途。當(dāng)這些考試和考評(píng)的結(jié)果被用來(lái)評(píng)判老師和學(xué)校時(shí),也影響著教師的教學(xué)手段??紤]到考試和評(píng)價(jià)的重要性,終結(jié)性評(píng)價(jià)應(yīng)該盡可能準(zhǔn)確,并以正確的方式去反映和影響學(xué)生在校的學(xué)習(xí)是非常必要的。
目前,大量的研究結(jié)論表明,教育系統(tǒng)強(qiáng)烈地依賴于考試成績(jī)有許多缺陷,特別是用這種方式來(lái)考察學(xué)生學(xué)習(xí)的可信程度,即正確性和可靠性值得懷疑。本文提出,恰當(dāng)?shù)剡\(yùn)用教師判斷能夠減少終結(jié)性評(píng)價(jià)對(duì)教學(xué)所帶來(lái)的負(fù)面影響。同時(shí)也注意到了在運(yùn)用教師評(píng)價(jià)系統(tǒng)時(shí)應(yīng)該考慮到的許多問(wèn)題。特別強(qiáng)調(diào)了幾個(gè)方面:對(duì)教師的判斷必須有強(qiáng)有力的和持續(xù)的質(zhì)量保證及監(jiān)控程序;提供衡量發(fā)展的標(biāo)準(zhǔn)去指導(dǎo)以達(dá)到特定的目標(biāo)而進(jìn)行的學(xué)習(xí);教師可以得到精心設(shè)計(jì)的評(píng)價(jià)學(xué)生的技能和理解能力的考核任務(wù),從而幫助他們?cè)谧鞒雠袛嗟臅r(shí)候考慮到全方位的學(xué)習(xí)目標(biāo);教師崗前和在崗培訓(xùn)應(yīng)該提高他們對(duì)不同評(píng)價(jià)目的的理解和運(yùn)用能力。終結(jié)性評(píng)價(jià)要與形成性評(píng)價(jià)相結(jié)合,使其透明,并且老師的判斷要以事實(shí)為依據(jù)。所有的這些條件都具備了才能得出可信的結(jié)論。
另外,為了避免通過(guò)一錘定音的終結(jié)性評(píng)價(jià)去評(píng)估教師和學(xué)校所帶來(lái)的負(fù)面影響,特別強(qiáng)調(diào)衡量學(xué)校優(yōu)劣的標(biāo)準(zhǔn)不能單純地依賴于從學(xué)生終結(jié)性評(píng)價(jià)中得到的數(shù)據(jù),考察學(xué)生成績(jī)的標(biāo)準(zhǔn)應(yīng)該來(lái)自方方面面所收集的證據(jù)而不是每個(gè)學(xué)生的考試結(jié)果。這對(duì)那些制定評(píng)價(jià)政策和實(shí)施這些政策的人都具有重要的指導(dǎo)意義。
二、前 言
各種不同的評(píng)價(jià)方式被廣泛地運(yùn)用在教育中。為了改善和提高教學(xué)評(píng)價(jià),最引人矚目的是被稱作教學(xué)過(guò)程中的評(píng)價(jià)(形成性評(píng)價(jià))。這里主要討論的是對(duì)教學(xué)效果的評(píng)價(jià)(終結(jié)性評(píng)價(jià)),一般為了總結(jié)學(xué)生在一定的階段所學(xué)到的知識(shí)和掌握的技能以便匯報(bào)學(xué)生的學(xué)習(xí)成績(jī)和進(jìn)度。
2002年,英國(guó)的一些評(píng)價(jià)政策里已經(jīng)顯示出要有選擇性地使用外部的考試作為對(duì)學(xué)生的終結(jié)性評(píng)價(jià)。例如,英格蘭的政策已經(jīng)調(diào)整,傾向于在終結(jié)性評(píng)價(jià)中強(qiáng)調(diào)以教師為中心和發(fā)揮他們作用。威爾士、蘇格蘭和北愛(ài)爾蘭的改革,已從2005年夏季開始,賦予小學(xué)年齡段老師對(duì)學(xué)生進(jìn)行評(píng)價(jià)的責(zé)任。
在威爾士,小學(xué)低年齡段的考試(7歲)已經(jīng)在2002年就取消了,威爾士政府宣布,從2004年夏天起廢除對(duì)11歲和14歲年齡段學(xué)生的國(guó)家考試。在蘇格蘭,教師從電子庫(kù)里抽取國(guó)家考試試題去幫助他們對(duì)學(xué)生的成績(jī)作出判斷,但是,政府不再統(tǒng)計(jì)考試成績(jī)。北愛(ài)爾蘭政府決定停止階段性的考試和小學(xué)到中學(xué)的升學(xué)考試,而引入以教師評(píng)價(jià)為基礎(chǔ)的學(xué)生個(gè)人檔案。個(gè)人檔案能讓父母隨時(shí)了解他們的孩子的學(xué)習(xí)進(jìn)度和成績(jī),同時(shí)也為學(xué)生升中學(xué)和大學(xué)提供依據(jù)。
在2005年宣布的改革中,英格蘭教育部長(zhǎng)Stephen Twigg 說(shuō),他和他的同事將“給予教師完全的信任”。他強(qiáng)調(diào),在英國(guó)4700所學(xué)校進(jìn)行的實(shí)驗(yàn)表明,在小學(xué)低年齡段(7歲)盡管教師開始仍需用考試作為終結(jié)性評(píng)價(jià)過(guò)程中的一部分,但教師評(píng)價(jià)已經(jīng)明顯得以“強(qiáng)化”。英格蘭學(xué)歷和課程委員會(huì)的執(zhí)行主席在講話中指出:“與其他的競(jìng)爭(zhēng)對(duì)手相比,我們國(guó)家已經(jīng)有了實(shí)施嚴(yán)格的教師評(píng)價(jià)的基礎(chǔ),我們可以通過(guò)教師平時(shí)系統(tǒng)收集證據(jù)去得到比目前的評(píng)價(jià)更可靠的結(jié)果?!彼A(yù)測(cè),對(duì)11歲和14歲學(xué)生外部的終結(jié)性考試將被恰如其分的教師評(píng)價(jià)所取代,但是這個(gè)過(guò)程至少要花10年。他希望有一天,當(dāng)必須對(duì)學(xué)生進(jìn)行考試的時(shí)候,英格蘭的教師將可以從考試庫(kù)中根據(jù)需要去選擇相應(yīng)的試題和考核任務(wù)。本文表明了一個(gè)觀點(diǎn),那就是在盡可能短的時(shí)間內(nèi)推進(jìn)教師在終結(jié)性評(píng)價(jià)中所肩負(fù)的重大責(zé)任有其充分的以事實(shí)為根據(jù)的原因。
當(dāng)然,教師的終結(jié)性評(píng)價(jià)并不是靈丹妙藥,也會(huì)存在一些問(wèn)題。但是它在許多方面優(yōu)于以外部考試為標(biāo)準(zhǔn)的評(píng)價(jià)體系。這里提出的觀點(diǎn)是以大量的研究證據(jù)為基礎(chǔ)的,有的所引用的研究證據(jù)已經(jīng)在這里給出了參考書目,有的引用了網(wǎng)上評(píng)價(jià)改革小組的著作和文章。本文首先探討了運(yùn)用教師評(píng)價(jià)作為終結(jié)性評(píng)價(jià)目的的優(yōu)點(diǎn)和缺點(diǎn)以及為了確保它所提供的信息具有較高的可信任性(可靠性和有效性的結(jié)合)所需要采取的行動(dòng);然后總結(jié)了以考試和測(cè)驗(yàn)為基礎(chǔ)的終結(jié)性評(píng)價(jià)系統(tǒng)的一些問(wèn)題和怎樣才能確保終結(jié)性評(píng)價(jià)所提供的信息能夠滿足它所要面對(duì)的不同的用途。本文對(duì)于制定和實(shí)施教育政策的人具有重要的指導(dǎo)意義。雖然這里使用的是“中小學(xué)生”和“學(xué)校”這些詞,但是這里的一些觀點(diǎn)和意義與其他教育院校的學(xué)生也是相關(guān)的。
三、用教師的評(píng)價(jià)作為終結(jié)性評(píng)價(jià)的
優(yōu)勢(shì)和不足
通過(guò)對(duì)學(xué)生學(xué)習(xí)的評(píng)價(jià)去總結(jié)學(xué)生的成績(jī)有著不同的目的,其多樣性表現(xiàn)在從非正式的記錄學(xué)習(xí)過(guò)程到一錘定音的證書(見(jiàn)表1)以及貫穿于從小學(xué)到成人教育的各個(gè)階段。同時(shí)進(jìn)行評(píng)價(jià)的方式也是多種多樣的。 這里主要討論的是評(píng)價(jià)方式的采用必須基于所提供的信息符合其目的。
運(yùn)用教師的評(píng)價(jià)作為外部終結(jié)性評(píng)價(jià)已經(jīng)提倡了很長(zhǎng)時(shí)間了。當(dāng)我們想一想有效的終結(jié)性評(píng)價(jià)所應(yīng)該具備的質(zhì)量標(biāo)準(zhǔn),這種方式的價(jià)值就非常清晰了。與其他目的的評(píng)價(jià)相同,終結(jié)性評(píng)價(jià)應(yīng)該具備以下的一些質(zhì)量要求。
第一是有效性:評(píng)價(jià)必須覆蓋所有的并且只能包括那些與評(píng)價(jià)目的相關(guān)的學(xué)生的成績(jī)。第二是可靠性:評(píng)價(jià)應(yīng)該精心設(shè)計(jì)讓用戶對(duì)結(jié)果的準(zhǔn)確和目的的一致性有信心。第三是沖擊性:評(píng)價(jià)不僅只是衡量表現(xiàn)情況而且還要對(duì)教學(xué)和學(xué)生的學(xué)習(xí)動(dòng)機(jī)等起到促進(jìn)作用。評(píng)價(jià)通常對(duì)課程的開設(shè)和教學(xué)有著強(qiáng)烈的沖擊,因此,盡量減少任何的負(fù)面影響是非常重要的。第四是可行性:進(jìn)行終結(jié)性評(píng)價(jià)所需要的資源——教師的時(shí)間、專業(yè)知識(shí)、費(fèi)用以及學(xué)生的用于學(xué)習(xí)時(shí)間——應(yīng)該與其所提供的價(jià)值相符。
教師終結(jié)性評(píng)價(jià)怎樣才能成功地滿足這四個(gè)要求呢?下面,從正反兩方面對(duì)教師終結(jié)性評(píng)價(jià)的優(yōu)勢(shì)與不足進(jìn)行了比較(見(jiàn)表2)。但是,在我們展開這些爭(zhēng)論之前,非常重要的一點(diǎn)就是要對(duì)教師的終結(jié)性評(píng)價(jià)有一個(gè)明確的定義。從目前教師和專家的討論來(lái)看,它的定義僅限于教師對(duì)他們自己的學(xué)生的評(píng)價(jià)。教師終結(jié)性評(píng)價(jià)是教師通過(guò)一系列有計(jì)劃的,系統(tǒng)的方式去收集信息的過(guò)程,并基于他們的專業(yè)判斷去推斷學(xué)生的學(xué)習(xí)狀況和報(bào)告學(xué)生在特定時(shí)期的成績(jī)。
四、提高教師的終結(jié)性評(píng)價(jià)的可靠性
值得指出的是,研究中發(fā)現(xiàn)教師終結(jié)性評(píng)價(jià)中的不足,主要來(lái)自那些并沒(méi)有嘗試把教師的評(píng)價(jià)作為主要角色的項(xiàng)目。從其他把教師的評(píng)價(jià)作為終結(jié)性評(píng)價(jià)的目的的研究和一些國(guó)家的經(jīng)驗(yàn)來(lái)看,已經(jīng)發(fā)現(xiàn)了影響評(píng)價(jià)的可靠性的條件和可以提高其可靠性的方法。
通過(guò)對(duì)英國(guó)、澳大利亞和美國(guó)(昆士蘭州和加利福尼亞州)等實(shí)施教師終結(jié)性評(píng)價(jià)的考察和共同探討,我們得出了以下5個(gè)方面的經(jīng)驗(yàn)。這些也適用于在工作崗位和職業(yè)學(xué)校怎樣對(duì)學(xué)生獲取國(guó)家認(rèn)可的就業(yè)資格證書進(jìn)行評(píng)價(jià)。
第一,應(yīng)該有明確的標(biāo)準(zhǔn)去描述不同方面的成績(jī)以及所達(dá)到的水平,比較理想的是,他們應(yīng)該協(xié)助發(fā)展這些標(biāo)準(zhǔn)。同時(shí),給解釋所收集的信息提供一個(gè)基本原則,這些標(biāo)準(zhǔn)也應(yīng)該講清楚所要求的學(xué)習(xí)機(jī)會(huì)。這樣會(huì)使教師在以日常課堂作業(yè)為基礎(chǔ)對(duì)學(xué)生進(jìn)行評(píng)價(jià)時(shí)感到容易一些。
第二,為了讓教師按照程序去確保評(píng)價(jià)的可靠性,教師的專業(yè)培訓(xùn)是必須的。培訓(xùn)也應(yīng)該以那些將要被采用的標(biāo)準(zhǔn)和那些經(jīng)研究發(fā)現(xiàn)潛在的產(chǎn)生偏見(jiàn)的根源為核心。
第三,通過(guò)專業(yè)合作對(duì)教師的判斷形成一個(gè)系統(tǒng)的模式對(duì)促進(jìn)教學(xué)和評(píng)價(jià)都是有利的。模式影響評(píng)價(jià)的計(jì)劃和實(shí)施,從而影響教師對(duì)學(xué)習(xí)目標(biāo)以及在實(shí)施這些目標(biāo)進(jìn)度的標(biāo)準(zhǔn)的理解,它的作用遠(yuǎn)遠(yuǎn)大于質(zhì)量保證的功能。
第四,提供一個(gè)精心設(shè)計(jì)的任務(wù)庫(kù)以及評(píng)分標(biāo)準(zhǔn)能更好地幫助教師對(duì)自己學(xué)生的成績(jī)做出判斷。這些任務(wù)可以提供活動(dòng)范例讓學(xué)生能夠去實(shí)現(xiàn)一些重要的目標(biāo),例如,批判性的推理和將知識(shí)運(yùn)用到新的環(huán)境中。作為評(píng)價(jià)的一部分,它們能夠給學(xué)生提供有趣的和相關(guān)的學(xué)習(xí)經(jīng)歷。它們不能在評(píng)價(jià)過(guò)程中占統(tǒng)治地位,當(dāng)然,也不應(yīng)該被看作是游離于教師評(píng)價(jià)之外的單獨(dú)的方式。它們也不是去為了肯定教師的判斷。更確切地說(shuō),它們是所收集的信息的一部分,如果需要的話,能夠用來(lái)幫助教師確保他們達(dá)到評(píng)價(jià)所想要達(dá)到的目標(biāo)。
第五,當(dāng)教師和終結(jié)性評(píng)價(jià)的使用機(jī)構(gòu)已經(jīng)變得依賴于外在的考試時(shí),這就將需要更長(zhǎng)的時(shí)間去增加教師運(yùn)用動(dòng)態(tài)評(píng)價(jià)的能力和建立對(duì)教師判斷的信心。因此,給予足夠的時(shí)間去嘗試和評(píng)價(jià)創(chuàng)新的實(shí)踐活動(dòng)以及清晰的執(zhí)行程序和建立內(nèi)在的安全機(jī)制去確保評(píng)價(jià)的可靠性都是非常重要的。
五、以考試作為終結(jié)性評(píng)價(jià)存在的問(wèn)題
以教師評(píng)價(jià)作為終結(jié)性評(píng)價(jià)并不是沒(méi)有缺陷的,它有著與其他的終結(jié)性評(píng)價(jià)共同存在的問(wèn)題,特別是當(dāng)其結(jié)果被用來(lái)作為外部以擇優(yōu)選拔為目的的手段時(shí)。但是,這些問(wèn)題應(yīng)該提出來(lái)與那些以考試成績(jī)?yōu)闇?zhǔn)的評(píng)價(jià)所導(dǎo)致的問(wèn)題進(jìn)行比較。大量的證據(jù)表明,以下一些原因造成了以考試為標(biāo)準(zhǔn)的教育系統(tǒng)的問(wèn)題。
第一,不能夠提供一個(gè)反映飛速發(fā)展的社會(huì)和技術(shù)的變革所需要的全方位的教育成果的信息,因此,它不可能去鼓勵(lì)發(fā)展這些方面的技能。主要包括高層次的思考技能,適應(yīng)不斷改變的環(huán)境的能力,對(duì)怎樣去學(xué)習(xí)的理解以及在工作和學(xué)習(xí)中相互合作的能力和獨(dú)立工作及學(xué)習(xí)的能力。
第二,限制了已被證明能夠提高學(xué)習(xí)成績(jī)和縮小優(yōu)生及差生之間的差距的形成性評(píng)價(jià)(或?yàn)榱舜龠M(jìn)學(xué)習(xí)的評(píng)價(jià))的發(fā)展。
第三,所提供的數(shù)據(jù)并不象人們期待的那么可靠。例如,根據(jù)對(duì)英格蘭學(xué)校系統(tǒng)的重要階段考試(Key Stage Tests)的結(jié)果估算,至少有1/3的學(xué)生在第二階段的考試(KS2)和40%的學(xué)生在第三階段 (KS3)的考試是被給予了錯(cuò)誤的結(jié)論。
第四,考試結(jié)果缺乏可靠性意味著將影響一些學(xué)生,并對(duì)他們?cè)谛?nèi)、校間和校外發(fā)展作出不公正和不正確的決定。
第五,目前還沒(méi)有確鑿的證據(jù)支持考試可以提高學(xué)習(xí)成績(jī)的主張。
第六,降低了一些學(xué)生的學(xué)習(xí)動(dòng)力。
第七,考試造成的緊張氣氛,阻礙了一些學(xué)生發(fā)揮他們的最佳水平。
第八,它鼓勵(lì)以膚淺的和表層的學(xué)習(xí)為主的教學(xué)方式,而不是深層次的,對(duì)本質(zhì)概念的理解。
研究也表明,一些考試和考核結(jié)果被用來(lái)應(yīng)付各種目的,而它們所提供的價(jià)值是極為有限的。把每個(gè)學(xué)生的考試結(jié)果用于各種目的,從設(shè)定目標(biāo)到學(xué)校排名,這種做法實(shí)在是過(guò)于簡(jiǎn)單化。為了一個(gè)目的所收集的信息并不一定能滿足其他的目的的要求,用于收集某些類型的學(xué)習(xí)成果的方式也不能適應(yīng)所有的目的的需要。通過(guò)讓教師在評(píng)價(jià)個(gè)體學(xué)生中扮演重要的角色和用多樣化的方式去評(píng)估和考察教師及學(xué)校,可以減少終結(jié)性評(píng)價(jià)的負(fù)面影響。在討論這個(gè)問(wèn)題之前,很重要的一點(diǎn)是要說(shuō)明目前采用的終結(jié)性評(píng)價(jià)的方式不能充分衡量現(xiàn)代教育的一些關(guān)鍵性成果,它對(duì)學(xué)生,課程,教學(xué)以及通過(guò)評(píng)價(jià)去促進(jìn)學(xué)習(xí)都有負(fù)面的影響。
對(duì)于“評(píng)價(jià)什么”這個(gè)問(wèn)題,許多終結(jié)性評(píng)價(jià),例如,英格蘭學(xué)生在11歲和14歲參加的國(guó)家考試, 取決于學(xué)生在規(guī)定的時(shí)間內(nèi)所進(jìn)行的筆試成績(jī)。就像已經(jīng)提到的,這種形式限制了可以進(jìn)行評(píng)價(jià)的學(xué)習(xí)成果的范圍,把許多高層次的認(rèn)知和交流技能,獨(dú)立學(xué)習(xí)和相互合作的學(xué)習(xí)能力都給排除在外了??荚嚦煽?jī)所具有的“一錘定音”的特性鼓勵(lì)以應(yīng)付考試為目的教學(xué)和為了考試而進(jìn)行的過(guò)多的練習(xí)。研究證明,其導(dǎo)致的結(jié)果是學(xué)生盡管并不具備考試中所涉及的能力,但他們學(xué)會(huì)了如何去通過(guò)考試。一項(xiàng)英國(guó)教育和技能部資助的研究項(xiàng)目得出了這樣的結(jié)論:當(dāng)訓(xùn)練11歲的孩子去通過(guò)國(guó)家考試,很可能會(huì)提高學(xué)生的考試成績(jī),但并不能確定給學(xué)生今后的學(xué)習(xí)帶來(lái)多少幫助。利用考試對(duì)學(xué)習(xí)成果的評(píng)價(jià)的狹窄性是與教育和技能部在“關(guān)注孩子”的文件中所提出的全方位的學(xué)習(xí)目標(biāo)的觀點(diǎn)是相違背的。
對(duì)于“如何進(jìn)行評(píng)價(jià)”這個(gè)問(wèn)題,至關(guān)重要的一點(diǎn)是評(píng)價(jià)要覆蓋那些在一個(gè)迅速縮小的世界和改變的社會(huì)里,年輕人在工作和生活方面所必須要學(xué)會(huì)的東西。任何學(xué)科都有兩個(gè)重要的目標(biāo):“學(xué)習(xí)去理解”和“理解學(xué)習(xí)”。
第一個(gè)目標(biāo)是就發(fā)展“大思路”而言的:概念能被應(yīng)用到不同的環(huán)境,能夠使學(xué)生通過(guò)思考本質(zhì)聯(lián)系去判斷不同情況下的各種現(xiàn)象。 單純地去死記事實(shí)和一套固定的程序是不能幫助年輕人將所學(xué)的知識(shí)運(yùn)用到各種環(huán)境中去。
第二個(gè)目標(biāo)是與發(fā)展學(xué)習(xí)意識(shí)相關(guān)的?!皩W(xué)生不可能在學(xué)校里學(xué)到他們將來(lái)在社會(huì)生活中所需要的一切”已經(jīng)是被廣泛認(rèn)可的了。因此,學(xué)校必須給學(xué)生提供終生學(xué)習(xí)所需要的技能、理解力和求知欲。由于評(píng)價(jià)什么強(qiáng)烈地影響著教什么和怎樣教,所以我們必須認(rèn)真地看待評(píng)價(jià)什么的問(wèn)題。 如果不能覆蓋所需要去評(píng)價(jià)的學(xué)習(xí)成果,那么就需要改變?cè)u(píng)價(jià)方式。
評(píng)價(jià)對(duì)學(xué)生、教師和教學(xué)的沖擊也是值得重視的問(wèn)題。就像前面已經(jīng)強(qiáng)調(diào)的,目前的考試制度對(duì)學(xué)生的學(xué)習(xí)動(dòng)機(jī)和學(xué)習(xí)經(jīng)歷都有相當(dāng)重大的影響。研究發(fā)現(xiàn):考試的成績(jī)似乎已經(jīng)變得比學(xué)生到底學(xué)到了什么更重要;考試能降低成績(jī)不佳的學(xué)生的自尊,更難使其相信他們可以在其他的方面獲得成功;在考試練習(xí)時(shí)連續(xù)的失敗會(huì)挫傷一些學(xué)生的士氣,從而加大優(yōu)秀生和差生之間的距離;考試焦慮癥對(duì)女生的影響比對(duì)男生的影響更大;教學(xué)方式可能局限于那些考試所必須的內(nèi)容(例如,忽視實(shí)踐課)。
這些負(fù)面影響能直接作用于學(xué)生準(zhǔn)備來(lái)自外部的“一錘定音”的考試,或間接地給教師提供一個(gè)運(yùn)用于所有年級(jí)的拙劣的評(píng)價(jià)模式。
六、為了促進(jìn)學(xué)習(xí)的評(píng)價(jià)
通過(guò)評(píng)價(jià)去促進(jìn)學(xué)習(xí)(縮小高分和低分之間的距離)通常被忽視了。更糟糕的可能是對(duì)形成性評(píng)價(jià)的歪曲理解,評(píng)價(jià)改革小組將形成性評(píng)價(jià)過(guò)程定義為“尋找和解釋那些被學(xué)生和老師用來(lái)決定學(xué)生目前的學(xué)習(xí)進(jìn)度,需要達(dá)到的目標(biāo)和實(shí)現(xiàn)這些目標(biāo)的最佳途徑的信息”。
很多學(xué)校在實(shí)施形成性評(píng)價(jià)中發(fā)現(xiàn),在實(shí)際教學(xué)中,其所要求的教學(xué)理念的改變并沒(méi)有發(fā)生。這種情況可能出現(xiàn),例如, 教師受到了超出他們控制的外部的考試限制。 其結(jié)果是教師不可能像形成性評(píng)價(jià)所要求的那樣,為了發(fā)展學(xué)生終生學(xué)習(xí)的能力,在指導(dǎo)學(xué)生的學(xué)習(xí)過(guò)程中讓他們扮演主要角色。以考試為主的課堂評(píng)價(jià)的特性(見(jiàn)表3)。
PACE 課題對(duì)英格蘭小學(xué)的一組學(xué)生進(jìn)行了為期8年的跟蹤研究,這項(xiàng)研究開始于英國(guó)決定對(duì)7歲的學(xué)生進(jìn)行國(guó)家統(tǒng)一考試之前。其研究發(fā)現(xiàn)自從引入了外部考試以后,教師自己的課堂評(píng)價(jià)變得更像終結(jié)性評(píng)價(jià)。學(xué)生感到在引入考試之前教師的評(píng)價(jià)幫助他們的學(xué)習(xí),但是隨后他們注意到老師更加關(guān)注考試成績(jī)而不是學(xué)習(xí)過(guò)程。 學(xué)生自己開始采取終結(jié)性評(píng)價(jià)的標(biāo)準(zhǔn)去評(píng)論他們自己的作業(yè)。
七、滿足終結(jié)性評(píng)價(jià)目的的需要
1.形成性評(píng)估和終結(jié)性評(píng)估協(xié)調(diào)統(tǒng)一
考試對(duì)形成性評(píng)估的負(fù)面影響,是強(qiáng)化教師評(píng)價(jià)的主要原因之一,因此,把二者結(jié)合起來(lái)是非常重要的。 在課堂教學(xué)中,教師能夠通過(guò)觀察、提問(wèn),傾聽學(xué)生的交談和批改作業(yè)去收集學(xué)生的信息。在形成性評(píng)價(jià)中這些信息可以立即用來(lái)促進(jìn)學(xué)生的學(xué)習(xí)或可以儲(chǔ)存起來(lái)用于去計(jì)劃將來(lái)的學(xué)習(xí)機(jī)會(huì)。通過(guò)這種方式收集到的信息通常是不確定的,也可能是相互矛盾的,因?yàn)楸娝苤?,學(xué)生所能做的是受特定環(huán)境的影響的。這給終結(jié)性評(píng)價(jià)造成了問(wèn)題,但對(duì)達(dá)到形成性評(píng)價(jià)的目的卻是有用的。在為這兩個(gè)目的服務(wù)時(shí),在信息和信息的解釋之間需要區(qū)別對(duì)待。
對(duì)于形成性評(píng)價(jià)而言,信息的解釋是相對(duì)于一個(gè)學(xué)生朝著一個(gè)特定階段的學(xué)習(xí)目標(biāo)邁進(jìn)的進(jìn)度。然后按照什么已經(jīng)達(dá)到了和遇到了什么問(wèn)題去決定下一步計(jì)劃。說(shuō)明的是需要做什么去幫助今后的學(xué)習(xí),而不是什么水平和一個(gè)學(xué)生已經(jīng)達(dá)到的級(jí)別。為了滿足終結(jié)性評(píng)估的目的,需要運(yùn)用一些對(duì)所有的學(xué)生具有相同含義的常規(guī)的標(biāo)準(zhǔn)和總的成績(jī),如水平和級(jí)別。這就是說(shuō),如果已經(jīng)收集的,用作形成性評(píng)價(jià)的信息被用作終結(jié)性評(píng)價(jià),必須要滿足能夠明確報(bào)告水平和級(jí)別的標(biāo)準(zhǔn)。在終結(jié)性評(píng)價(jià)過(guò)程,為了及時(shí)掌握反映學(xué)生全方位的成績(jī)的最準(zhǔn)確的信息,必須動(dòng)態(tài)地考慮不同時(shí)間的變化。
反映學(xué)生學(xué)習(xí)成績(jī)的信息既可以用來(lái)促進(jìn)學(xué)習(xí)也可以用來(lái)作為匯報(bào)的目的,提供終結(jié)性評(píng)價(jià)并不是對(duì)形成性評(píng)價(jià)的一個(gè)總結(jié),而是按照更廣泛匯報(bào)成績(jī)的標(biāo)準(zhǔn)而進(jìn)行的重新評(píng)估。固定的記錄級(jí)別和分?jǐn)?shù)不是形成性評(píng)估,而是一系列的 “小終結(jié)性”評(píng)估。當(dāng)然,對(duì)終結(jié)性評(píng)估必須有必要的質(zhì)量保證。終結(jié)性判斷所占的分量越重,越需要嚴(yán)格的質(zhì)量保證,最好是包括學(xué)校間和學(xué)校內(nèi)的判斷模式。
采取措施增加以外部需求為目的的教師的終結(jié)性評(píng)價(jià)的可靠性,將不可避免地提高他們以內(nèi)在的需求為目的的評(píng)價(jià)能力。然而,為了避免對(duì)形成性評(píng)價(jià)的負(fù)面沖擊,非常重要的一點(diǎn)是,內(nèi)部的終結(jié)性評(píng)估不能過(guò)于頻繁,不能超過(guò)所真正需求的對(duì)學(xué)習(xí)進(jìn)度和成績(jī)的報(bào)告。經(jīng)常用水平和等級(jí)去評(píng)價(jià)學(xué)生意味著他們收到的反饋是評(píng)判為主的,鼓勵(lì)他們把自己與他人進(jìn)行比較。在這種狀況下,教師和學(xué)生不會(huì)把注意力放到形成性評(píng)價(jià)上。
2.為了評(píng)估的評(píng)價(jià)
評(píng)估存在于各個(gè)層次:個(gè)人,學(xué)校,當(dāng)?shù)亟逃块T以及整個(gè)國(guó)家的教育系統(tǒng)。評(píng)估在每個(gè)層次的沖擊取決于其考慮的信息的類型,用來(lái)判斷其效果的標(biāo)準(zhǔn)和評(píng)判之后采取的行動(dòng)。如果評(píng)估的信息是為了其它的終結(jié)性評(píng)價(jià)的目的而收集的,那它是不可能為評(píng)估的目的服務(wù)的。通過(guò)學(xué)生達(dá)到某個(gè)水平的百分比來(lái)對(duì)學(xué)校進(jìn)行判斷的不足如下:其結(jié)果不可能反映一所學(xué)校所努力去實(shí)現(xiàn)的全方位的教育成果;忽視了對(duì)“邊緣”學(xué)生的注意;鼓勵(lì)以通過(guò)考試和測(cè)驗(yàn)為主的狹窄的需要。
評(píng)估最好以學(xué)生全面的成績(jī)和學(xué)習(xí)行動(dòng)的信息為基礎(chǔ),根據(jù)學(xué)校的環(huán)境和條件去作出判斷。因此,學(xué)校應(yīng)該提供有關(guān)課程、教學(xué)方式,以及相應(yīng)的學(xué)生的背景和過(guò)去的學(xué)習(xí)情況等方面的信息。在學(xué)校自我評(píng)估中有一些很好的例子。
3.為了系統(tǒng)的監(jiān)控的評(píng)價(jià)
就教育系統(tǒng)而言, “監(jiān)控”所指的是學(xué)生的學(xué)業(yè)成績(jī),教育和教學(xué)等方面的變化。它所關(guān)注的通常是 “標(biāo)準(zhǔn)”是否提高了,降低了或者是保持在原有水平。雖然它所用的信息包括學(xué)生的成績(jī),但是它的目的是為了幫助制定和完善相應(yīng)的政策和實(shí)踐,而不是對(duì)每個(gè)學(xué)生進(jìn)行評(píng)判。學(xué)校一級(jí)的監(jiān)控最好是通過(guò)自我評(píng)估來(lái)進(jìn)行,同時(shí)收集其他能夠?qū)W(xué)生的評(píng)價(jià)數(shù)據(jù)進(jìn)行解釋的信息。盡管整個(gè)系統(tǒng)每年的變化不可能有太大的意義,但是一定時(shí)期的發(fā)展趨勢(shì)可以提供非常有用的信息。
系統(tǒng)監(jiān)控的價(jià)值依賴于所收集的各個(gè)方面的信息。英格蘭的方法是收集每個(gè)學(xué)生在國(guó)家統(tǒng)一考試的成績(jī)。為了確保督察的有效性,需要收集從觀察學(xué)生的實(shí)際操作技能和各種評(píng)價(jià)的結(jié)論等全方位的信息。
收集已有成績(jī)的方式具有其成本優(yōu)勢(shì),但必須取決于是否能夠提供有用的和相關(guān)的信息,如用中學(xué)最后階段的考試去判斷整個(gè)國(guó)家的教育發(fā)展情況。同樣的,建立和運(yùn)作覆蓋各個(gè)方面的教育成果的普查的花費(fèi)必須取決于能否給政策決策者和實(shí)踐者提供詳細(xì)的有用的信息。把監(jiān)控從個(gè)體學(xué)生的表現(xiàn)中分離出來(lái),可以避免集中收集每個(gè)學(xué)生的分?jǐn)?shù)。這將消除對(duì)“一錘定音”的考試的“需要”,能夠確保評(píng)價(jià)不再被考試所限制,更重要的是,教什么不再被考什么所限制。在一些國(guó)家進(jìn)行的持續(xù)的,定期的對(duì)部分學(xué)生的抽樣調(diào)查證實(shí)了這種作法的價(jià)值。
八、結(jié) 論
本文解釋了為什么以考試為主的評(píng)價(jià)系統(tǒng)所提供的學(xué)生的成績(jī),其信息的有效性和可靠性是不足的。究其原因,部分是由于所評(píng)價(jià)的知識(shí)和能力,部分是由評(píng)價(jià)的方法和怎樣去用這些結(jié)果。其后果是限制了課程和教學(xué)方式以及削弱為了促進(jìn)學(xué)習(xí)的評(píng)價(jià)的實(shí)施。同時(shí)它也導(dǎo)致了終結(jié)性評(píng)價(jià)太過(guò)頻繁。為了減少這些負(fù)面影響,終結(jié)性評(píng)價(jià)應(yīng)該設(shè)計(jì)成為為特殊的目的提供信息,并且只能當(dāng)學(xué)習(xí)過(guò)程中需要總結(jié)和評(píng)估才進(jìn)行。其它的時(shí)間教師應(yīng)該集中于形成性評(píng)價(jià)。
1.采用教師終結(jié)性評(píng)價(jià)中需要注意的問(wèn)題
從那些已經(jīng)用了和增加使用恰當(dāng)?shù)慕處熃K結(jié)性評(píng)價(jià)的教育系統(tǒng)所提供的信息來(lái)看,這種方式并沒(méi)有什么負(fù)面影響。但是,必須承認(rèn)這種方式需要采取一系列步驟去確保教師終結(jié)性評(píng)價(jià)所提供的學(xué)生成績(jī)的信息是可靠的,這是一個(gè)巨大的挑戰(zhàn)。關(guān)鍵的幾點(diǎn)如下:(1)需要對(duì)教師的判斷有一個(gè)強(qiáng)有力的和持續(xù)的質(zhì)量保證和控制程序,以確保教師終結(jié)性評(píng)價(jià)能夠?qū)W(xué)生的學(xué)習(xí)提供有效的和可靠的評(píng)估。(2)教師的崗前和在職培訓(xùn)應(yīng)該發(fā)展教師對(duì)不同的評(píng)價(jià)目的的理解和技能,強(qiáng)調(diào)教師評(píng)估中存在的潛在的偏見(jiàn),從而幫助教師減少評(píng)估對(duì)學(xué)生造成的負(fù)面影響。(3)必須投入精力和資源去制定達(dá)到一個(gè)特定目標(biāo)的學(xué)習(xí)進(jìn)度,并能夠運(yùn)用到各種活動(dòng)中去的發(fā)展標(biāo)準(zhǔn)。(4)教師應(yīng)該得到設(shè)計(jì)得比較完善的方案去評(píng)價(jià)學(xué)生的技能和理解,這能幫助他們?cè)诳紤]全方位的學(xué)習(xí)目標(biāo)的基礎(chǔ)上作出判斷。(5)程序應(yīng)該是非常透明的,教師的判斷要以事實(shí)為依據(jù)。(6)終結(jié)性評(píng)價(jià)必須融入形成性評(píng)價(jià)的程序中,應(yīng)該通過(guò)合理的設(shè)計(jì)去減少教師和學(xué)生的負(fù)擔(dān)。
另外,為了避免用“一錘定音”的終結(jié)性評(píng)價(jià)去評(píng)估教師和學(xué)校所帶來(lái)的負(fù)面影響:學(xué)校系統(tǒng)的評(píng)定不能單純地依賴,或主要來(lái)自于終結(jié)性評(píng)價(jià)的數(shù)據(jù)。這些數(shù)據(jù)應(yīng)該放在反映學(xué)校的其它成就的指數(shù)的環(huán)境中去報(bào)告和解釋。監(jiān)測(cè)學(xué)生所達(dá)到的標(biāo)準(zhǔn)應(yīng)該從各種信息中得來(lái)而不是每個(gè)學(xué)生的考試成績(jī)。教師評(píng)價(jià)在一個(gè)教育系統(tǒng)的作用是以一定數(shù)量的學(xué)生為樣本去收集各方面的信息。
2.采用教師終結(jié)性評(píng)價(jià)的意義
這些結(jié)論對(duì)那些在國(guó)家和地區(qū)一級(jí)制定方針,政策的,對(duì)那些在學(xué)校和大學(xué)里實(shí)施評(píng)價(jià)政策的,對(duì)顧問(wèn),督學(xué)和對(duì)師范教育工作者都有重要的指導(dǎo)意義。由于實(shí)施是以政策為依據(jù),所以這種改變要求那些在實(shí)踐中具體操作的人真正地理解這些政策,并采取相應(yīng)的行動(dòng),特別是包含著信任和責(zé)任。因此,下面所歸納的對(duì)政策決策者和實(shí)施者的意義是沒(méi)有等級(jí)區(qū)別的。
(1)對(duì)國(guó)家和地區(qū)一級(jí)的決策者的意義
認(rèn)識(shí)到目前在國(guó)家和學(xué)校各個(gè)層次上以考試為基礎(chǔ)的終結(jié)性評(píng)價(jià)政策,所投入的經(jīng)費(fèi)和時(shí)間并沒(méi)有得到相應(yīng)的價(jià)值的信息。通過(guò)教師判斷的模式去報(bào)告學(xué)生的成績(jī),從而取代現(xiàn)有的國(guó)家考試,把節(jié)省下來(lái)的一些時(shí)間和經(jīng)費(fèi)投入到提高教學(xué)的質(zhì)量中去?;仡櫤蜋z查教師評(píng)價(jià)在考核16至18歲的學(xué)生時(shí)的作用。提倡在教育系統(tǒng)進(jìn)行為什么需要改革和怎樣進(jìn)行改革的公開討論。對(duì)任何新的以教師判斷為基礎(chǔ)的終結(jié)性評(píng)估系統(tǒng)應(yīng)該給予至少兩年的實(shí)驗(yàn)和評(píng)估期,以及同樣的時(shí)間段去宣傳和培訓(xùn)教師。評(píng)估學(xué)校和鼓勵(lì)自我評(píng)估要以各個(gè)方面的指標(biāo)為依據(jù),而不只是學(xué)生的成績(jī),降低“一錘定音”的外部考試所帶來(lái)的負(fù)面影響。建立一個(gè)以國(guó)家監(jiān)測(cè)為目的的抽樣學(xué)生成績(jī)系統(tǒng),因此,在降低全面考試的負(fù)擔(dān)的同時(shí)增強(qiáng)信息的廣度和相關(guān)性。
(2)對(duì)學(xué)校管理層的意義
制定一項(xiàng)任何時(shí)候都以評(píng)價(jià)去支持和促進(jìn)學(xué)習(xí)的學(xué)校評(píng)價(jià)政策,并只在必要時(shí)為了檢查和報(bào)告進(jìn)度才需要終結(jié)性評(píng)價(jià)。對(duì)所有終結(jié)性評(píng)價(jià)有質(zhì)量保證的安排,包括任何教師給予的考試,使學(xué)校能夠基于可靠的信息對(duì)學(xué)生的進(jìn)度作出決定。確保家長(zhǎng)理解評(píng)價(jià)怎樣幫助學(xué)生學(xué)習(xí)和怎樣的標(biāo)準(zhǔn)是被用來(lái)報(bào)告一年中各個(gè)階段的進(jìn)度。抵制考試的硬指標(biāo)所帶來(lái)的壓力,鼓勵(lì)用能夠說(shuō)明學(xué)生學(xué)習(xí)情況的各種類型的信息。通過(guò)模式化給教師評(píng)價(jià)提供質(zhì)量保證和時(shí)間保障。
(3)對(duì)教師的意義
確保評(píng)價(jià)總是用來(lái)去幫助學(xué)習(xí),當(dāng)需要一個(gè)終結(jié)性評(píng)估報(bào)告時(shí),最好要對(duì)照相應(yīng)的標(biāo)準(zhǔn)和對(duì)證據(jù)的可靠性進(jìn)行判斷。把學(xué)生包括在自我評(píng)價(jià)的程序中,幫助他們理解以報(bào)告為目的,去評(píng)價(jià)他們的學(xué)習(xí)情況的標(biāo)準(zhǔn),以及終結(jié)性判斷是怎樣作出的。參與模式化的終結(jié)性判斷和其他質(zhì)量保證程序。只在最合適的時(shí)候用考試,而不是例行公事。
(4)對(duì)督學(xué)和顧問(wèn)的意義
檢查學(xué)校的政策和實(shí)踐以確保評(píng)估是用于教學(xué)的過(guò)程中而不是被終結(jié)性的考試和任務(wù)所代替。鼓勵(lì)運(yùn)用能說(shuō)明學(xué)生各方面的成績(jī)的信息。確保將評(píng)價(jià)納入教師的繼續(xù)教育中,以滿足那些需要這方面知識(shí)的教師的需要?;仡櫤蜋z查評(píng)價(jià)是否完全合適和其它質(zhì)量保證程序, 以及哪些對(duì)教學(xué)是有利的。幫助學(xué)校發(fā)展以各種評(píng)價(jià)方式為基礎(chǔ)的自我評(píng)估行動(dòng)計(jì)劃,而不只停留在學(xué)生的成績(jī)上。
(5)對(duì)崗前和在職專業(yè)發(fā)展課程提供者的意義
確保課程的設(shè)計(jì)中提供充足的時(shí)間去討論評(píng)價(jià)的不同目的和使用已有的評(píng)估數(shù)據(jù);讓參訓(xùn)者去辨別,舉例和評(píng)估不同的收集學(xué)生成就的信息的方式;分享設(shè)計(jì)與特殊的學(xué)習(xí)目標(biāo)相關(guān)的評(píng)價(jià)標(biāo)準(zhǔn)的經(jīng)驗(yàn);思考評(píng)價(jià)中存在偏見(jiàn)事例和其它問(wèn)題的根源,以及如何把它們最小化。
注釋
①評(píng)價(jià)改革小組的核心成員:Mr.David Bartlett,Co-ordinator for Assessment,Birmingham City Council Children and Young Person Services;Professor Paul Black,King’s College,University of London;Professor Richard Daugherty,University of Wales,Aberystwyth;Dr.Kathryn Ecclestone,University of Exeter;Ms.Janet English,Head Teacher,Malvern Way Infant and Nursery Schools,Croxley Green, Hertfordshire;Professor John Gardner,Queen’s University, Belfast;Professor Wynne Harlen,University of Bristol,ASF project director Ms Carolyn Hutchinson Head of Assessment Branch,Scottish Executive Education Department;Professor Mary James,Institute of Education,University of London;Mr.Martin Montgomery,Assessment Development Manager,Council for the Curriculum, Examinations and Assessment,Northern Ireland;Dr.Paul Newton,Principal Assessment Researcher,Regulation and Standards Division,Qualifications and Curriculum Authority;Dr.Catrin Roberts,Assistant Director,Nuffield Foundation;Mr. Jon Ryder Teacher,Lord Williams’s School,Thame,Oxfordshire;Professor Judy Sebba,University of Sussex;Dr.Gordon Stobart,Institute of Education,University of London;Ms Anne Whipp Curriculum and Teacher Assessment Manager,ACCAC,(the Qualifications,Curriculum and Assessment Authority for Wales).
譯者系英國(guó)女王大學(xué)教育學(xué)院博士
(責(zé)任編輯 潘靜波)