□ 劉聲濤
為了測量還是為了學(xué)習(xí):高校公正評價(jià)學(xué)生學(xué)業(yè)內(nèi)涵探析
□ 劉聲濤
教育部核準(zhǔn)并向社會(huì)發(fā)布的多所大學(xué)章程對學(xué)生學(xué)業(yè)評價(jià)的要求均是公正評價(jià)學(xué)生學(xué)業(yè)。多方面證據(jù)表明,目前我國高校行政管理人員、教師、學(xué)生主要將公正評價(jià)學(xué)生學(xué)業(yè)理解為考試并準(zhǔn)確評分。從測量技術(shù)角度看,準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)難以做到。承認(rèn)測量技術(shù)的局限性是一種基本的科學(xué)態(tài)度,過于依賴和關(guān)注考試不僅得不到想象中的準(zhǔn)確分?jǐn)?shù),還對師生有負(fù)面影響。學(xué)業(yè)評價(jià)的首要目標(biāo)是為了學(xué)習(xí)而不是測量。公正評價(jià)學(xué)生學(xué)業(yè)應(yīng)該被理解為實(shí)施為了學(xué)習(xí)的評價(jià),使學(xué)生獲得最適當(dāng)?shù)慕逃?。高校章程制定及高校以章程為依?jù)辦學(xué),都需要促進(jìn)對公正評價(jià)學(xué)生學(xué)業(yè)的正確理解與實(shí)踐。
高校;學(xué)業(yè)評價(jià);公正
《高等學(xué)校章程制定暫行辦法》實(shí)施以來,教育部核準(zhǔn)了多所大學(xué)的章程,這些章程對學(xué)生學(xué)業(yè)評價(jià)工作的表述高度一致,即:學(xué)生公正地獲得學(xué)業(yè)上的評價(jià)。這個(gè)表述中有兩個(gè)看似平常實(shí)則復(fù)雜多義的概念:公正、學(xué)業(yè)評價(jià)。博登海墨(Edgar Bodenheimer)說:“公正有一張普洛透斯似的臉,變幻無常,隨時(shí)可呈不同形狀,并且有極不相同的面貌。當(dāng)我們仔細(xì)查看這張臉并試圖揭開隱藏其表面之后的秘密時(shí),我們往往會(huì)深感迷惑。”[1]在不同的時(shí)代與人類活動(dòng)中,人們對公正的涵義有不同的理解,不同的學(xué)者對于公正也有不完全相同的闡述,迄今尚未形成一個(gè)統(tǒng)一的公正論。教育領(lǐng)域中的評價(jià)是一個(gè)正在發(fā)展中的概念,其內(nèi)涵在不斷地?cái)U(kuò)大與豐富中。國際上,學(xué)生學(xué)業(yè)評價(jià)近幾十年正在產(chǎn)生教育評價(jià)歷史上從未有過的變革[2]。當(dāng)公正與學(xué)業(yè)評價(jià)兩個(gè)復(fù)雜的概念在一起時(shí),有必要了解高校行政管理人員、教師、學(xué)生如何理解公正評價(jià)學(xué)生學(xué)業(yè),這種理解是否有偏差,如果有偏差那么更合適的理解又是什么。章程是高等學(xué)校依法自主辦學(xué)、實(shí)施管理和履行公正職責(zé)的基本準(zhǔn)則,探討上述問題有益于高校章程制定及以章程為依據(jù)來辦學(xué)。
有三方面的證據(jù)表明,當(dāng)前我國高校學(xué)業(yè)評價(jià)相關(guān)群體主要將公正評價(jià)學(xué)生學(xué)業(yè)理解為通過以考試為主的方式來給予學(xué)生應(yīng)得的分?jǐn)?shù)或等級的活動(dòng)。第一方面的證據(jù)來自于學(xué)生調(diào)查。2014年1月,筆者在某高校對大學(xué)生進(jìn)行了學(xué)業(yè)評價(jià)書面調(diào)查。調(diào)查包括三個(gè)問題:(1)大學(xué)期間,你的學(xué)業(yè)有沒有得到公正的評價(jià)?(2)請給出你或同學(xué)的學(xué)業(yè)被不公正評價(jià)的例子;(3)你認(rèn)為被不公正評價(jià)的原因是什么?學(xué)生針對這三個(gè)問題主要圍繞教師如何考及如何評分作答。第二方面的證據(jù)來自于高校相關(guān)政策文本的分析。有研究者對E大學(xué)學(xué)生評價(jià)管理機(jī)構(gòu)的管理職責(zé)、課程學(xué)習(xí)評價(jià)規(guī)定、學(xué)生實(shí)習(xí)評定和畢業(yè)論文評定的相關(guān)規(guī)定、畢業(yè)資格和學(xué)士學(xué)位授予資格的政策文本進(jìn)行分析,發(fā)現(xiàn)我國現(xiàn)行高校對學(xué)生評價(jià)的理解與要求是以專業(yè)知識(shí)為主要評價(jià)內(nèi)容,以考試為主要手段進(jìn)行考試成績鑒定[3]。第三方面的證據(jù)來自于研究文獻(xiàn)的內(nèi)容分析。以“高校、公正、評價(jià)”或“大學(xué)、公正、評價(jià)”為關(guān)鍵詞在
CNKI數(shù)據(jù)庫中查詢到論述高校公正評價(jià)學(xué)生學(xué)業(yè)相關(guān)問題的3篇論文,這些論文對公正評價(jià)學(xué)生學(xué)業(yè)的界定都是給予學(xué)生客觀公平的學(xué)業(yè)成績??梢?,人們對于高校公正評價(jià)學(xué)生學(xué)業(yè)的理解與實(shí)踐主要是圍繞學(xué)業(yè)考試和評分進(jìn)行,評價(jià)即考試,公正即評分準(zhǔn)確。
注重考試和評分的學(xué)業(yè)評價(jià)活動(dòng)發(fā)揮了評價(jià)的測量功能:收集并量化信息。從測量功能角度理解學(xué)生學(xué)業(yè)評價(jià)并不奇怪。我國考試文化盛行,在不少人看來,學(xué)業(yè)評價(jià)即考試是自然而然的。首先,考試在我國有長期的歷史。1930年教育評價(jià)專家泰勒(R.W.Tyler)開始在教育領(lǐng)域使用評價(jià)一詞,此前評價(jià)學(xué)習(xí)的術(shù)語就是考試和測驗(yàn),而西方的考試和測驗(yàn)發(fā)展的源頭正是我國的科舉制。其次,我國人口眾多,經(jīng)濟(jì)尚欠發(fā)達(dá),社會(huì)誠信體系不成熟,考試依然是對社會(huì)有重大影響力的人才選拔手段。
測量意義上的公正評價(jià)學(xué)生學(xué)業(yè)要求評分準(zhǔn)確。簡單地說,公正是在一定社會(huì)范圍內(nèi)通過對社會(huì)資源的公平合理分配使每一個(gè)成員得其所應(yīng)得[4]。測量意義上的學(xué)生學(xué)業(yè)評價(jià)分配什么?最容易被想到的就是學(xué)業(yè)評價(jià)的直接分配——分?jǐn)?shù)或等級。直接的分配類似于代幣,用來獲得真正的分配,如保研資格、獎(jiǎng)學(xué)金、工作機(jī)會(huì)等社會(huì)資源或和社會(huì)資源密切相關(guān)的東西。分?jǐn)?shù)或等級是學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)的數(shù)字表征,公正則意味著數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確。數(shù)字表征準(zhǔn)確指數(shù)字完全和學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)相符。因?yàn)楣饕头峙溆嘘P(guān),數(shù)字對學(xué)生學(xué)業(yè)成就在其團(tuán)體中所處位置表征準(zhǔn)確也能確保學(xué)生在分配時(shí)得其所應(yīng)得,這就是地位表征準(zhǔn)確。本文中將數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確統(tǒng)稱為準(zhǔn)確。
研究者若對測量意義上的學(xué)業(yè)評價(jià)的基本技術(shù)有更多的了解和思考,會(huì)發(fā)現(xiàn)準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)在測量的各環(huán)節(jié)上都面臨著挑戰(zhàn)。
首先是收集哪些方面的信息。學(xué)業(yè)評價(jià)需要收集學(xué)生在預(yù)期學(xué)習(xí)成果上的表現(xiàn)信息。高校中的學(xué)業(yè)評價(jià)主要是課程學(xué)業(yè)成就評價(jià)。為了保護(hù)高校教師的學(xué)術(shù)自由,同時(shí)也因?yàn)楦咝Un程多且不斷變化,課程應(yīng)該有怎樣的學(xué)習(xí)成果由教師自行決定。在制定高校學(xué)術(shù)標(biāo)準(zhǔn)和質(zhì)量標(biāo)準(zhǔn)方面世界領(lǐng)先的英國高等教育質(zhì)量保障署(Quality Assurance Agency for Higher Education, QAA) 也僅是在學(xué)科層次上制定基準(zhǔn),不再細(xì)化到專業(yè)、課程層次。表層上,教師理解課程、設(shè)定合適的教學(xué)目標(biāo)的能力以及個(gè)人風(fēng)格等方面的差異導(dǎo)致課程目標(biāo)多樣化。深層上,課程到底該取得何種學(xué)習(xí)成果及價(jià)值判斷,原本就是一個(gè)難有統(tǒng)一答案的問題。因而,不同教師授課的同一門課程上被評價(jià)的很可能是學(xué)生不同的學(xué)習(xí)成果的表現(xiàn)。
其次是用什么評價(jià)方法去收集信息。按學(xué)生在評價(jià)活動(dòng)中要做出的反應(yīng),測量學(xué)意義上的學(xué)業(yè)評價(jià)可分為選擇——反應(yīng)評價(jià)和建構(gòu)——反應(yīng)評價(jià)。選擇——反應(yīng)評價(jià)包括選擇題、判斷題、匹配題等需要學(xué)生找出答案的評價(jià)形式,建構(gòu)——反應(yīng)評價(jià)包括論文題、表現(xiàn)性測試、檔案袋評價(jià)等需要學(xué)生自己產(chǎn)生答案的評價(jià)形式。每種評價(jià)方式都有其適用情形及局限。選擇——反應(yīng)評價(jià)能考察學(xué)生大范圍的知識(shí)掌握情況,易于計(jì)分,但難以考察高層次能力;建構(gòu)——反應(yīng)評價(jià)能引發(fā)學(xué)生在高層次能力上的表現(xiàn),但難以對學(xué)生的真實(shí)狀況做準(zhǔn)確推論,難以計(jì)分。迄今為止,從測量技術(shù)上沒有找到能很好地克服每類評價(jià)方式局限性的方法。
再次是收集多少信息。由于用于信息收集的時(shí)間有限,實(shí)際工作中只能在預(yù)期學(xué)習(xí)成果中選擇若干并設(shè)計(jì)有限的評價(jià)任務(wù),因而學(xué)業(yè)評價(jià)只能測量學(xué)生特定的、有限的行為樣本。測量實(shí)質(zhì)上是對學(xué)生的真實(shí)狀態(tài)作出推論,推論基于有限的行為樣本,同時(shí)推論本身會(huì)有或多或少的誤差,這些都導(dǎo)致評分有誤差。
最后是收集到的信息如何量化。選擇——反應(yīng)評價(jià)具有易于計(jì)分但難以測量高層次能力的特點(diǎn)。高等教育的重要教學(xué)目標(biāo),如理解分析綜合能力、溝通合作能力、自主學(xué)習(xí)創(chuàng)新能力等都需要借助建構(gòu)——反應(yīng)評價(jià)方法來評價(jià)。教育測量學(xué)中,建構(gòu)——反應(yīng)評價(jià)的評分者一致性受到高度關(guān)注。因?yàn)楦叩冉逃闹匾虒W(xué)目標(biāo)難以量化,人們希望至少不同評分者對同一行為樣本的評分不要相差太遠(yuǎn)。但這種對評分者間一致性的期望也面臨挑戰(zhàn):評分者的標(biāo)準(zhǔn)設(shè)定或?qū)σ延袠?biāo)準(zhǔn)的理解不盡
相同,同時(shí)教育測量學(xué)已經(jīng)證實(shí)學(xué)業(yè)評價(jià)中各種心理效應(yīng)導(dǎo)致的評價(jià)偏差客觀存在且難以克服?;谠u分的困難,波帕姆(W.James Popham)等著名教育評價(jià)專家都認(rèn)為應(yīng)對論文題或檔案袋評價(jià)的使用持謹(jǐn)慎態(tài)度[5](P139)。
事實(shí)上,對測量技術(shù)有更多了解和反思的學(xué)者對考試有著冷靜而客觀的認(rèn)識(shí)。波帕姆認(rèn)為應(yīng)該降低教師對分?jǐn)?shù)能反映學(xué)生實(shí)際成就水平的迷信[5](P28);沃爾弗德(Barbara E.Walvoord)建議放棄擁有完美、簡單的等級評分體系的幻想,接受它會(huì)有缺陷和限制的現(xiàn)實(shí)[6](P10);劉易斯(Harry R.Lewis)認(rèn)為分?jǐn)?shù)決不可能成為準(zhǔn)確比較不同學(xué)科成績的標(biāo)尺,即使在一門課程內(nèi),分?jǐn)?shù)也是不準(zhǔn)確的[7];韋墨(Maryellen Weimer)指出分?jǐn)?shù)能夠精確地衡量與客觀評價(jià)學(xué)習(xí)的認(rèn)識(shí)是錯(cuò)誤的[8]。
可以說,準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)是一種誤解和想象,但當(dāng)前我國高校卻對它有著過度的依賴和關(guān)注,并且高校教和學(xué)中的很多負(fù)面現(xiàn)象都和這種依賴和關(guān)注有關(guān)。
盡管多數(shù)教師不能從測量技術(shù)的角度說清楚給學(xué)生準(zhǔn)確評價(jià)學(xué)業(yè)有多困難,但是他們會(huì)感受到這點(diǎn),尤其是面對建構(gòu)——反應(yīng)題時(shí)。有的教師會(huì)因沒有合理評價(jià)學(xué)生而內(nèi)心不安,還有教師擔(dān)心評分不合理導(dǎo)致學(xué)生投訴。為避免評分可能帶來的麻煩,高校教師經(jīng)常使用以下策略:(1)抬高分?jǐn)?shù)。給全體同學(xué)更高的分?jǐn)?shù),盡管這對于優(yōu)秀的學(xué)生不公正,但可以避免因評分過低而被學(xué)生投訴;(2)對學(xué)生按正態(tài)分布評分。正態(tài)分布是眾所周知的能力分布,按正態(tài)分布分配不同分?jǐn)?shù)等級的人數(shù)比例,這樣使得分?jǐn)?shù)看起來很正常;(3)盡量用選擇——反應(yīng)題。選擇——反應(yīng)題好評分,在理工科的測驗(yàn)中普遍使用;(4)秘而不宣的標(biāo)準(zhǔn)與任務(wù)。若公開標(biāo)準(zhǔn)與任務(wù),教師擔(dān)心學(xué)生通過不同的渠道做準(zhǔn)備,導(dǎo)致分?jǐn)?shù)看起來不符合學(xué)生水平。
一直以來,大學(xué)生學(xué)習(xí)研究不斷地證明著學(xué)業(yè)評價(jià)對于學(xué)生學(xué)習(xí)的影響[9]。學(xué)業(yè)評價(jià)過于依賴與關(guān)注考試對學(xué)生的負(fù)面影響包括:(1)膚淺學(xué)習(xí)。選擇——反應(yīng)評價(jià)主要考查記憶、再認(rèn)等低層次的認(rèn)知能力,這只需要學(xué)生的膚淺學(xué)習(xí)即能應(yīng)對。即便是形式上的建構(gòu)——反應(yīng)評價(jià),若沒有對題目及評分進(jìn)行精心設(shè)計(jì),也可能只是考查學(xué)生低層次能力。(2)突擊學(xué)習(xí)??荚嚢l(fā)生在學(xué)習(xí)告一段落后,再加上考察低層次能力,學(xué)生完全可以通過突擊學(xué)習(xí)通過考試,部分學(xué)生甚至還能獲得高分。(3)舞弊。既然評價(jià)注重的是分?jǐn)?shù)而不是學(xué)習(xí),學(xué)生就會(huì)想方設(shè)法獲得分?jǐn)?shù),包括以舞弊的方式。(4)對課程的誤解。事實(shí)上,學(xué)生是根據(jù)學(xué)業(yè)評價(jià)而不是教師的課程介紹來定義課程[10]。一門只要求死記硬背的課程在學(xué)生眼中就是枯燥無味、干巴巴的。不合適的學(xué)業(yè)評價(jià)會(huì)讓學(xué)生對真實(shí)的成人智力世界產(chǎn)生誤解。(5)失去通過學(xué)業(yè)評價(jià)調(diào)整自己學(xué)習(xí)的機(jī)會(huì)??荚囋趯W(xué)期末進(jìn)行,沒有反饋,而反饋被認(rèn)為是改進(jìn)學(xué)習(xí)的核心要素。
面對測量意義上公正評價(jià)學(xué)生學(xué)業(yè)的挑戰(zhàn),自然要提高測量技術(shù),以不斷提高對學(xué)業(yè)的測量能力及測量準(zhǔn)確程度。更重要的是,要意識(shí)到并承認(rèn)考試固有的局限性。承認(rèn)這種局限性不僅是正確使用考試的關(guān)鍵,更是一種基本的科學(xué)態(tài)度,它告訴我們要改變對考試與分?jǐn)?shù)的過分依賴與關(guān)注,正確認(rèn)識(shí)公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。
首先要正確認(rèn)識(shí)學(xué)業(yè)評價(jià)的內(nèi)涵。在過去的幾十年中,學(xué)業(yè)評價(jià)被不斷地審視與反思。早在1930年,泰勒開始在教育領(lǐng)域使用評價(jià)概念,提出評價(jià)比考試和測驗(yàn)有更多的功能和目的,認(rèn)為教育評價(jià)僅用于檢測學(xué)生的成就是不夠的,同時(shí)也要關(guān)注課程內(nèi)容、課程形式、學(xué)生活動(dòng)、學(xué)習(xí)的多種結(jié)果。20世紀(jì)60年代初,克龍巴赫(Cronbach,L.J.)建議評價(jià)者們重新確定評價(jià)的概念——不是根據(jù)競爭的成績,而是作為一個(gè)搜集和報(bào)告對課程研制有指導(dǎo)意義的信息過程,強(qiáng)調(diào)評價(jià)的診斷和反饋?zhàn)饔肹11]。可見,在評價(jià)的最初發(fā)展階段,學(xué)者主要就“什么需要被評價(jià)”及“評價(jià)起什么作用”擴(kuò)展了評價(jià)的含義,認(rèn)為評價(jià)的功能是信息收集及分析反饋,這一功能不僅學(xué)業(yè)成就檢測上需要,與學(xué)習(xí)相關(guān)的多項(xiàng)工作上都需要。在此階段,教師被認(rèn)為是評價(jià)的組織實(shí)施者及評價(jià)信息的分析使用者。1968年,布盧姆(Benjamin Bloom)將形成性評價(jià)的概念用于學(xué)生學(xué)習(xí),認(rèn)為應(yīng)在學(xué)生學(xué)習(xí)過程中通過檢測診斷學(xué)習(xí)中的問題。形成性評價(jià)主要就“什么時(shí)候評價(jià)”
擴(kuò)展了評價(jià)的含義。20世紀(jì)80年代后,社會(huì)經(jīng)濟(jì)發(fā)展不斷對人才培養(yǎng)工作提出更高要求,同時(shí)認(rèn)知心理學(xué)等學(xué)科揭示了學(xué)生在學(xué)習(xí)中發(fā)揮積極主動(dòng)性的作用,大量學(xué)者開始進(jìn)一步挖掘評價(jià)在學(xué)習(xí)中所能起的作用。學(xué)者主要就“評價(jià)的核心功能及其實(shí)現(xiàn)途徑”、“學(xué)生在評價(jià)中的角色”擴(kuò)展評價(jià)的含義。評價(jià)依然是信息收集及分析反饋工具,但這一工具被認(rèn)為應(yīng)該是以改進(jìn)學(xué)習(xí)為首要目標(biāo)。不同學(xué)者或研究組織用不同的名稱來稱呼這種以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià),如學(xué)習(xí)導(dǎo)向評價(jià)、為了學(xué)習(xí)的評價(jià)等,并且總結(jié)了這類評價(jià)的特征。英國的評價(jià)改革研究小組(Assessment Reform Group,ARG)認(rèn)為,為了學(xué)習(xí)的評價(jià)應(yīng)該是:有效的教學(xué)設(shè)計(jì)中的一部分;關(guān)注學(xué)生如何學(xué)習(xí);課堂活動(dòng)的核心內(nèi)容;教師需要掌握的關(guān)鍵專業(yè)技能;建設(shè)性的,因?yàn)槿魏卧u價(jià)都會(huì)帶來學(xué)生情緒、情感的影響;考慮到學(xué)生學(xué)習(xí)動(dòng)機(jī)的重要性;促進(jìn)對學(xué)習(xí)目標(biāo)的理解,在評價(jià)標(biāo)準(zhǔn)上應(yīng)該達(dá)成共識(shí);保證學(xué)生得到如何取得進(jìn)步的建設(shè)性指導(dǎo);發(fā)展學(xué)生自我評價(jià)的能力,促進(jìn)他們進(jìn)行反思和自我管理;認(rèn)可學(xué)生各個(gè)方面的成就[12]。不同學(xué)者或研究組織總結(jié)的為了學(xué)習(xí)的評價(jià)的特征大同小異,從這些特征中可以明顯看出為了學(xué)習(xí)的學(xué)業(yè)評價(jià)從目的到形式完全不同于考試。
其次要正確認(rèn)識(shí)學(xué)業(yè)評價(jià)中公正的內(nèi)涵。為了學(xué)習(xí)的學(xué)業(yè)評價(jià)分配什么?分配的是能改進(jìn)學(xué)生學(xué)習(xí)的信息以及根據(jù)這些信息所確定的合適的教育。聯(lián)合國教科文組織的著名報(bào)告《學(xué)會(huì)生存——教育世界的今天和明天》在談及教育中的機(jī)會(huì)平等時(shí)指出:“給每個(gè)人平等的機(jī)會(huì),并不是指名義上的平等,即對每一個(gè)人一視同仁,如目前許多人所認(rèn)為的那樣。機(jī)會(huì)平等是要肯定每一個(gè)人都能受到適當(dāng)?shù)慕逃?,而且這種教育的進(jìn)度和方法是適合個(gè)人的特點(diǎn)的?!盵13]應(yīng)像理解教育中的機(jī)會(huì)平等一樣理解學(xué)業(yè)評價(jià)中的公正,因?yàn)樗鼈冇兄餐氖姑寣W(xué)生學(xué)會(huì)生存,獲得發(fā)展。
澄清學(xué)業(yè)評價(jià)工作的首要目標(biāo)不僅是評價(jià)內(nèi)涵擴(kuò)展和豐富的結(jié)果,還是使評價(jià)活動(dòng)有效的要求。選拔、甄別、診斷、鑒定、認(rèn)證、發(fā)現(xiàn)、發(fā)展、管理等等都是評價(jià)可能具備的目標(biāo)。研究者認(rèn)為,包括學(xué)業(yè)評價(jià)在內(nèi)的評價(jià)活動(dòng)之所以很困難就在于評價(jià)可以同時(shí)具備多種目標(biāo)[14],但難以同等良好地實(shí)現(xiàn)所有目標(biāo),得到最重視的目標(biāo)決定評價(jià)的內(nèi)在結(jié)構(gòu)與外在形式。這也就是為什么在學(xué)業(yè)評價(jià)的研究文獻(xiàn)中總是可以看到學(xué)者指出對某些評價(jià)功能和目標(biāo)“過于重視”、“過于關(guān)注”、“過于依賴”、“過分強(qiáng)調(diào)”,認(rèn)為對某些評價(jià)功能和目標(biāo)應(yīng)該“突顯”、“強(qiáng)調(diào)”。評價(jià)工作需要確定首要目標(biāo),并從這個(gè)首要目標(biāo)出發(fā)設(shè)計(jì)評價(jià),以確保首要目標(biāo)的達(dá)成而不是其它。
人們依賴考試一方面是對考試的局限性了解不夠,另一方面是強(qiáng)調(diào)了學(xué)業(yè)評價(jià)在人才培養(yǎng)中不合適的目標(biāo)——管理。當(dāng)前我國高校中的學(xué)業(yè)評價(jià),與其說是一種教育方式,不如說是一種管理方式。在高校管理中,考試是高效且便利的以考促學(xué)的工具。高校中的學(xué)業(yè)考試是高利害的,因?yàn)樗彤厴I(yè)及各種榮譽(yù)有關(guān),這樣的考試自然能促使學(xué)生學(xué)習(xí)。但我們必須追問,有沒有導(dǎo)致正確的學(xué)習(xí)?不管考試在管理上多么高效和便利,它終究是以犧牲學(xué)生的利益為代價(jià)。正是對于以管理為目標(biāo)的學(xué)業(yè)評價(jià)的依賴,人們很難看到它和改進(jìn)學(xué)生學(xué)習(xí)的關(guān)系。只有把學(xué)生的利益放在第一位,而不是把管理的效率和方便放在第一位,才能正確理解公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。
為了學(xué)習(xí)的學(xué)業(yè)評價(jià)在國外高校人才培養(yǎng)工作中正在發(fā)揮著重要作用。首先政府部門和相關(guān)組織明確將以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià)寫進(jìn)政策文件中。美國高等教育協(xié)會(huì)(The American Association for Higher Education,AAHE)制定的良好學(xué)生學(xué)習(xí)評價(jià)活動(dòng)的第一條原則是:評價(jià)學(xué)生的學(xué)習(xí)必須從教育的價(jià)值開始[6](P171)。QAA明確要求:評估實(shí)踐應(yīng)促進(jìn)有效學(xué)習(xí)[15]。其次學(xué)者積極進(jìn)行理論研究,并和教師一起進(jìn)行學(xué)業(yè)評價(jià)改革。如,美國學(xué)者安吉洛和克羅斯(Anglo,T.&Cross,P.)等在20世紀(jì)80年代組織的課堂研究項(xiàng)目;澳大利亞學(xué)者南丁格爾(Nightingale,P.)等在20世紀(jì)90年代中期組織的大學(xué)教學(xué)促進(jìn)項(xiàng)目(Committee for the Advancement of University Teaching,CAUT)。這些項(xiàng)目均是由評價(jià)專家組織及指導(dǎo)教師進(jìn)行學(xué)業(yè)評價(jià)改革行動(dòng)研究,在實(shí)踐中發(fā)現(xiàn)問題,解決問題,形成豐富的學(xué)業(yè)評價(jià)資源。如,學(xué)業(yè)評價(jià)方法、學(xué)業(yè)評價(jià)范例供更多教師使用,并致力于在高校形成以
改進(jìn)學(xué)習(xí)為目標(biāo)的評價(jià)文化。相比之下,我國對高校學(xué)業(yè)評價(jià)的認(rèn)識(shí)及實(shí)踐還停留在考試階段,高校中盛行的依然是考試文化而不是評價(jià)文化。
在各項(xiàng)教育改革中,評價(jià)均被視為最難點(diǎn)或瓶頸。評價(jià)的首要目標(biāo)選擇不當(dāng)是評價(jià)不能取得預(yù)期效果的重要原因之一。長期以來,我國高校學(xué)業(yè)評價(jià)均承擔(dān)著測量者的角色,人們認(rèn)為公正評價(jià)即公正評分。在這種情況下,需要從政策層面對人們的認(rèn)識(shí)和實(shí)踐進(jìn)行正確引導(dǎo)。翻看我國《教育法》,可以發(fā)現(xiàn)教育部已核準(zhǔn)的章程中,對學(xué)生學(xué)業(yè)評價(jià)工作的表述基本上和《教育法》中的表述一致。章程要與教育法保持一致無可厚非,但保持一致并不意味著原封不動(dòng),其遣詞造句若能有利于糾正對高校學(xué)業(yè)評價(jià)即考試的片面認(rèn)識(shí),引導(dǎo)高校進(jìn)行有利于改進(jìn)學(xué)生學(xué)習(xí)的評價(jià)則更有益于高校提高人才培養(yǎng)質(zhì)量。即使對學(xué)生學(xué)業(yè)評價(jià)工作沿用和教育法一致的表述,也需要高校相關(guān)群體正確認(rèn)識(shí)與實(shí)踐公正評價(jià)學(xué)生學(xué)業(yè),讓學(xué)生真正從學(xué)業(yè)評價(jià)活動(dòng)中受益。
[1][美]博登海墨.法理學(xué)——法哲學(xué)及其方法[M].北京:華夏出版社,1987:238.
[2]崔允漷.促進(jìn)學(xué)習(xí):學(xué)業(yè)評價(jià)的新范式[J].教育科學(xué)研究,2010(03):11-15.
[3]沈曉麗.我國普通高校學(xué)生評價(jià)實(shí)踐研究——以E大學(xué)為個(gè)案[D].華東師范大學(xué)碩士學(xué)位論文,2008:摘要.
[4]洋龍.平等與公平、正義、公正之比較 [J].文史哲,2004(04):145-151.
[5][美]W.James Popham.促進(jìn)教學(xué)的課堂評價(jià)[M].北京:中國輕工業(yè)出版社,2003.
[6][美]Barbara E.Walvoord & Virginia Johnson Anderson.等級評分——學(xué)習(xí)和評價(jià)的有效工具[M].北京:中國輕工業(yè)出版社,2004.
[7][美]哈瑞.劉易斯.失去靈魂的卓越[M].侯定凱,等譯.上海:華東師范大學(xué)出版社,2012:117.
[8][美]瑪麗埃倫.韋默.以學(xué)習(xí)者為中心的教學(xué)——給教學(xué)實(shí)踐帶來的五項(xiàng)關(guān)鍵變化[M].洪崗譯.杭州:浙江大學(xué)出版社,2006:82.
[9]Nightingale,P.,Te Wiata,I.,Toohey,S.,Ryan,G.,Hughes,C.,and Magin,D.Assessing Learning in Universities.Sydney:University of New South Wales Press,1996.117.
[10]David Carless,Gordon Joughin,Ngar-Fun Liu.How Assessment Supports Learning:Learningoriented Assessment in Action[M].Hong Kong University Press.2006:2.
[11]王萍,高凌飚.“教育評價(jià)”概念變化溯源[J].華南師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2009(04):39-43.
[12]Assessment Reform Group.Assessment for Learning:10 Principles[R].Cambridge:University of Cambridge,2002.
[13]聯(lián)合國教科文組織國際教育發(fā)展委員會(huì).學(xué)會(huì)生存:教育世界的今天和明天[M].北京:教育科學(xué)出版社,1996:105.
[14]Carless,D.Learning-oriented assessment:conceptual bases and practical implications[J].Innovations in Education and Teaching International,2007(01):57-66.
[15]QAA.Code of practice for the assurance of academic quality and standards in higher education,Section 6:Assessment of students [EB/ OL].http://www.qaa.ac.uk/Publications/InformationAndGuidance/Pages/Code-of-practice-Section-6.aspx.2014-3-31.
(責(zé)任編輯 黃建新)
For Measurement or for Learning: Research on the Meaning of Learning Evaluation in Higher Education
LIU Sheng-tao
The approved constitutions made by six universities in 2013 require that learning evaluation should be just.There are several evidences which show that learning evaluation is understood as examination and accurate score by the administrative personnel, teachers and students in universities recently.From the perspective of measurement technology, it's hard to evaluate students' learning accurately.Relying too much on and paying too much attention to examination will bring negative influences to teaching and learning.The primary goal of learning evaluation is not measurement, but promoting learning.Impartial learning evaluation should be understood as the implementation of assessment for learning, and it's purpose is to enable students to obtain the most appropriate education.When we make and implement a constitution, we should promote accurate understanding and practice of just learning evaluation.
higher education; learning evaluation; justice
G641
A
1672-0717(2015)01-0059-05
2014-11-30
湖南省教育科學(xué)“十二五”規(guī)劃2012年度項(xiàng)目“高校有效學(xué)生學(xué)業(yè)評價(jià)研究”(XJK012CGD002);湖南省社科基金項(xiàng)目“高校發(fā)展性學(xué)習(xí)評估的國際經(jīng)驗(yàn)與借鑒”(13YBA077);全國教科規(guī)劃教育部重點(diǎn)項(xiàng)目“高校學(xué)業(yè)評估的國際比較研究”(DIA130302)。本文同時(shí)受湖南大學(xué)青年教師成長計(jì)劃經(jīng)費(fèi)資助。
劉聲濤(1976-),女,江西萍鄉(xiāng)人,教育學(xué)博士,湖南大學(xué)講師,主要從事高校教學(xué)與學(xué)習(xí)評估研究。