摘? ?要
學校文化學科需要改進結果評價、強化過程評價、探索增值評價、健全綜合評價。“分數評價”要轉向“等第評價”,克服成績排名排序的“唯分論”;“總分評價”要轉向“項目評價”,發(fā)揮考試評價的診斷性功能;“紙筆性評價”轉向“表現(xiàn)性評價”,發(fā)揮考試評價的導向性功能;“結果性評價”轉向“過程性評價”,發(fā)揮考試評價的促進性功能;“水平評價”轉向“增值評價”,發(fā)揮考試評價的發(fā)展性功能。
關鍵詞
學科考試評價? 等第評價? 項目評價? 表現(xiàn)性評價? 過程性評價? 增值評價
2020年10月13日,中共中央和國務院發(fā)布的《深化新時代教育評價改革總體方案》提出:“堅持科學有效,改進結果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術,提高教育評價的科學性、專業(yè)性、客觀性。堅持統(tǒng)籌兼顧,針對不同主體和不同學段、不同類型教育特點,分類設計、穩(wěn)步推進,增強改革的系統(tǒng)性、整體性、協(xié)同性?!绷x務教育學校文化學科考試評價必須實施改革,扭轉不科學的學科教育評價導向,順應我國新時代教育評價發(fā)展的新潮流。
一、“分數評價”轉向“等第評價”,克服成績排名排序的“唯分論”
學科紙筆考試成績通常用百分制表達,教師和家長習以為常。從考試的性質來看,義務教育學校文化學科考試是標準參照考試,關注學生是否達到國家課程標準,不在于分數的高低。初中文化學科紙筆考試難度值通常在0.75以上,小學學科通常在0.85以上。作為一份合格的標準參照考試試卷,試卷區(qū)分度應該比較小,區(qū)分重點在于達標和待達標,大部分學生成績差異不大。根據統(tǒng)計檢驗,小學生和初中生的學科成績差兩三分,沒有明顯的統(tǒng)計學差異。再者,目前中小學教師的命題能力比較低下,一線學??荚囋嚲淼目茖W性不高,其分數的信效度較低,相差兩三分,未必能真正反映出學生的學業(yè)水平差距。
在小學階段,家長和老師習慣把100分的學生看作學優(yōu)生,把低于90分甚至95分以下的學生看成“差生”。根據兒童心理學,小學生每次看到自己的分數比同學低1分,會錯誤地認為自己相差很多,好像“95分”比“96分”差很多。特別是有些班主任和學科教師會違規(guī)按照分數排名排序,甚至偷偷告訴家長,給幼小兒童帶來嚴重的學業(yè)負擔,造成心理焦慮。
改“分數評價”為“等第評價”,屬于結果性評價改革之一。采取等第評價以后,同一等第的學生沒有量化比較,沒有了排名,大大削減了分數差異帶來的負面影響。對老師、家長和學生而言,不再是分分計較,關注的重心轉向學生等級的躍遷,關注待達標生和達標生的進步。實際上,在國家監(jiān)測、省市級別的教育質量監(jiān)測中,學科成績已經采取等第評價,也有一些區(qū)域和學校已經實行等第評價。小學一般采用優(yōu)秀(A)、達標(P)、待達標(E)三個等第;初中一般采取優(yōu)秀(A)、良好(B)、達標(P)、待達標(E)四個等第。
《深化新時代教育評價改革總體方案》提出“堅決改變用分數給學生貼標簽的做法”。通過等第評價,引導教師面向全體學生,關注后進生的發(fā)展,克服了排名排序的“唯分論”,克服了“分數標簽”效應。
二、“總分評價”轉向“項目評價”,發(fā)揮考試評價的診斷性功能
同一次語文期末考試,學生甲和學生乙都是90分,其分數結構不一樣,代表語文學習的結果不一樣。學科評價除了總分評價,更應該體現(xiàn)項目評價。
學科項目評價的內容可以分為學科知識維度、學科能力維度和認知能力三個維度。以初中數學為例,知識維度就是知識模塊或章節(jié)單元,項目可以分為數與代數、圖形與幾何、統(tǒng)計與概率、綜合與實踐四個;學科能力維度的項目可以分為運算能力、空間想象能力、邏輯推理能力、數形結合能力、問題解決能力、探究能力等六個;認知能力維度的項目可以分為識記、理解、應用、綜合、評價與創(chuàng)新六個。不同學科項目分類結構不一樣,各呈學科特色。
每個項目都呈現(xiàn)滿分值或者權重,學生項目得分或得分率。滿分值和權重數據反映了這個項目在學科中地位的主次輕重,項目滿分值越大,權重越大,代表該項目的重要性越強。項目得分和得分率反映了學生在這個項目上學習成就,項目得分越高,得分率越大,表明學生在這個項目上學習成效越好。
考試結束,學生、家長和教師看到學科成績包含了這么多的“多維度、多層次”數據信息,相當于拿到全方位的“體檢單”,就會淡化考試的甄別功能,不再聚焦學科總分,而是關注項目數據的分析,發(fā)現(xiàn)優(yōu)勢在哪里,不足在哪里,接下來如何揚長補短,強化了考試數據的診斷功能。
三、“紙筆性評價”轉向“表現(xiàn)性評價”,發(fā)揮考試評價的導向性功能
傳統(tǒng)的紙筆考試具有考查內容覆蓋面廣、批改公平公正、操作簡易經濟等優(yōu)點,但是考試內容側重碎片化知識、孤立的能力和解習題能力,難以考查看、聽、說、演、做等實踐能力,難以考查解決真實問題的能力,難以考查情感態(tài)度和價值觀。
表現(xiàn)性評價要求學生在某種特定的真實或模擬情境中,運用先前所獲得的知識完成某項任務或解決某個問題,以考查學生知識與技能的掌握程度,或者問題解決、交流合作和批判性思考等多種復雜能力的發(fā)展狀況。
在中小學實施表現(xiàn)性評價早已有之。英語聽力口語考試、體育技能考試、藝術學科技能考試、物理化學生物的實驗操作考試等都是表現(xiàn)性評價。浙江省很早以前就明文規(guī)定小學低年級不允許紙筆考試,提倡現(xiàn)場表現(xiàn)性評價。目前,浙江省很多小學不僅在低段實施表現(xiàn)性評價,而且在中高段逐漸推廣表現(xiàn)性評價。
由單一的紙筆考試兼顧表現(xiàn)性評價,能突破單一考試類型的局限,使得測評內容立體豐富。表現(xiàn)性評價不僅能考查學生重要的學科知識和學科能力以及學生應用知識解決真問題能力、綜合評價和創(chuàng)新能力,還能考查學生聽、說、寫、畫、唱、做、演等行為化的實踐操作能力,還可以通過學生解決問題的過程和方法、現(xiàn)場行為考查學生的“情感態(tài)度和價值觀”。
評價方式發(fā)生變革,必然會引發(fā)相應的教學行為變革。通過表現(xiàn)性評價,轉變教師教學觀、考試觀、評價觀,由習題教育和應試教育轉向核心素養(yǎng)教育,引導教師教學從“知識立意”真正邁向“過程和方法、態(tài)度情感和價值觀”,從“重視解答習題能力”邁向“解決真實問題能力”和“實踐操作能力”,引領學生的考試和學習空間從教室走向實驗室功能室,走向校園、走向大自然、走向社會。課堂上減少習題教學,加大實驗操作、語言交際等活動;減少課外紙筆性作業(yè),加大實踐性、操作性、研究性的作業(yè)。
四、“結果性評價”轉向“過程性評價”,發(fā)揮考試評價的促進性功能
學科期末考試結果屬于結果性評價,是對學生一個學期的課程學習效果做出評估,評估學生是否達到該學科的國家課程標準。為了促進學生達到國家課程標準,學校常常會安排期中考試,備課組和教師通常會安排周測、月測、單元考試、章節(jié)模塊考試等。這些學期內進行的考試屬于過程性考試,有一定的必要性,因為符合學習規(guī)律和認知規(guī)律;但是,由于很多教師沒有理解過程性評價的原則和功能,誤把平常的過程性評價性質、功能等同于期末的結果性評價,異化了過程性評價的甄別選拔功能,導致過程性評價的試題容量過多、難度過大、區(qū)分度過大。這不僅沒有發(fā)揮過程性評價的促進性和積極性效應,反而成為學生學業(yè)負擔的主要來源,成為傷害學生身心健康發(fā)展的一種教學行為。
《深化新時代教育評價改革總體方案》提出“創(chuàng)新德智體美勞過程性評價辦法”“完善過程性考核與結果性考核有機結合的學業(yè)考評制度”。因此,加強過程性評價的同時要改進過程性評價的內容和方式。過程性評價是教學過程中實施的評價,是一種促進學生知識掌握、能力形成的評價,所以又稱為形成性評價。過程性評價對學生而言,其主要功能是診斷反饋、強化學習和激勵促進。對教師而言,獲得教學過程中的連續(xù)性反饋,了解學生的學習效果、學習歷程、學習特點、學習困難等信息,作為教學改進和個別輔導的依據,其主要功能是教學過程的監(jiān)控、反饋、補救和改進。
過程性評價命題原則是“教—學—評一致”:教什么考什么,教到什么程度考到什么程度,怎么教就這么考;學什么考什么,學到什么程度考到什么程度,怎么學就這么考。過程性評價試題在來源上,要盡量多一些課本上的、作業(yè)上的、課堂上的內容,引導學生重視課本閱讀、重視作業(yè)和作業(yè)訂正、重視聽課和筆記整理。保證讓那些上課認真、作業(yè)認真、重視課本的學生考出好成績。在考試重點上既要重視學科基礎知識和技能、過程和方法,也要加強“情感態(tài)度與價值觀”。在考試方式上,紙筆考試和現(xiàn)場表現(xiàn)性評價相兼顧,既要有學生個人獨立考試,也要有一些項目化小組考試,考查學生的交流能力、合作能力和綜合能力。在考試難度上,必須嚴格控制,要讓學生考出“成功”,考出“自信”,考出“夢想”,考出“追求”,考出“努力”,形成良性循環(huán)。改革過程性評價,讓過程性評價成為促進學生學業(yè)和身心健康和諧發(fā)展的一種教育方式。
五、“水平評價”轉向“增值評價”,發(fā)揮考試評價的發(fā)展性功能
文化學科考試后,通常給學生一個分數或一個等第,這屬于水平評價。基于水平評價,成績優(yōu)秀的學生容易得到表彰,成績差的學生容易受到批評;容易導致教師關注優(yōu)生,冷落后進生;容易導致學生之間的競爭,強化了學生學習的外部動機。根據國家、省市大規(guī)模教育質量監(jiān)測結果,我們發(fā)現(xiàn)義務教育階段學業(yè)水平優(yōu)秀的學生群體中,男生是女生的一半左右,學業(yè)水平低下的學生群體中,男生是女生的兩倍左右。僅僅采取水平評價,對男生身心健康成長可能存在不利影響。
增值評價就是關注學生進步的評價,簡單地說,學科增值評價就是兩次考試結果的比較。大家對增值評價說起來有些陌生,實際上,大部分學校和教師常常表揚考試名次進步的學生,雖然方式簡單,但也是一種增值評價的方式。增值評價能激勵每一個學生進步,強調學生自己與自己競爭,而不是與自己同學競爭。每一個人不一定都成為優(yōu)秀者,但是每一個人都可以成為進步者。讓自己學科水平優(yōu)秀,是一件低概率事件;讓自己學科成績有進步,是一件大概率事件?;谠鲋翟u價,讓很多后進生和中等生因為進步得到了肯定和激勵,特別有利于男生的進步。學校層面實施教師教學質量增值評價,能激發(fā)教師工作積極性,引導教師面向全體學生,特別關注后進生,因為后進生增值空間大。
學科總分采取增值評價,通常有兩種方法。第一種方法為名次法,直接采取總分排序名次或百分位名次做比較;采取名次法,只能呈現(xiàn)增值數據,絕對不能呈現(xiàn)學生的名次。第二種方法為標準分法,把兩次考試的原始分做標準化處理,轉變成百分制的量尺分,比較兩次量尺分大小。
筆者還建議各學科對各項目也做增值評價。分別計算出學生個體第一次、第二次考試各項目的得分率與常模的均差值,再比較這兩個均差值大小。以初中數學為例,某學生第一次考試“數與代數”項目得分率均差為-0.12,“圖形與幾何”為+0.21;第二次考試“數與代數”項目得分率均差為0.22,“圖形與幾何”為+0.01;“數與代數”項目增值為+0.34,“圖形與幾何”增值為-0.20;表明“數與代數”項目學習在進步,“圖形與幾何”項目在退步。如此,學生可以發(fā)現(xiàn)自己哪些項目在進步?哪些項目沒有進步?學生可以分析自己總分進步的原因在哪里?退步的原因在哪里?學生可以反思自己日常學習的投入與產出的情況,在哪些項目上效益較高?哪些項目上效益低?
學科評價是教育評價最重要的、涉及面最廣的領域。要提高學校學科評價的科學性、專業(yè)性、客觀性,必須改進學科結果評價,要強化學科過程評價,要探索學科增值評價,健全學科綜合評價,實現(xiàn)“五個轉變”。成功的學科評價改革,必然會促進學生高水平發(fā)展,培養(yǎng)出德智體美勞全面發(fā)展的社會主義建設者和接班人。
參考文獻
[1] 中華人民共和國中央人民政府.深化新時代教育評價改革總體方案[EB/OL].http://www.gov.cn/zhengce/2020-10/13/content_55510
32.html.2020-10-13
[2] 王旭東.表現(xiàn)性評價:實施核心素養(yǎng)教育的必然途徑[J].教育家,2018(04):13-15.
[3] 王旭東.紙筆測試 堅冰初融[J].當代教育家,2017(03):29-31.
[4] 王旭東.項目化 等第化 校本化——促進小學生健康成長的學業(yè)評價體系的構建[J].未來教育家,2017(12):56-59.
[5] 王旭東.教學質量增值評價常見模型與實踐思考[J].考試研究,2020(05):11-16.
[6] 張會杰.“四個評價”落實中的主要矛盾及化解思路[J].中國考試,2020(11):9-16.
[7] 雷新勇.關于教育評價改革的若干思考[J].中國考試,2020(09):11-15.
[8] 周光禮,袁曉萍.聚焦“四個評價”深化教育評價機制改革[J].中國考試,2020(08):1-5.
[9] 朱立明,宋乃慶,羅琳,等.新時代教育評價改革的思考[J].中國考試,2020(09):15-19.
【責任編輯? ?鄭雪凌】