柳夕浪
摘要推動《義務教育課程方案和課程標準(2022年版)》落地實施,必須破解考試評價這一卡點,構建基于課程標準的核心素養(yǎng)測評體系。核心素養(yǎng)測評是基于學生有關行為表現(xiàn)推斷其內(nèi)在素養(yǎng),對其學業(yè)成就表現(xiàn)做出解釋的過程,包括把握核心素養(yǎng)測評目標、開發(fā)核心素養(yǎng)測評項目、構建核心素養(yǎng)測評量規(guī)等重要環(huán)節(jié)。
關鍵詞 《義務教育課程方案和課程標準(2022年版)》;核心素養(yǎng)測評;測評目標;測評項目;測評量規(guī)
中圖分類號G63
文獻標識碼B
文章編號1002-2384(2022)06-0013-03
前不久剛剛發(fā)布的《義務教育課程方案和課程標準(2022年版)》要求學生從“會做題”轉(zhuǎn)向“會做事”,像學科從業(yè)者那樣思考和行動,在此過程中形成和發(fā)展核心素養(yǎng)。與此相適應,必須破解考試評價這一學校立德樹人工作的卡點,構建基于課程標準的核心素養(yǎng)測評體系。
核心素養(yǎng)測評是指在可觀察的真實世界的事物與我們關于事物的構念之間建立聯(lián)系,基于學生有關行為表現(xiàn)的證據(jù)推斷其內(nèi)在素養(yǎng)狀況,對學生的學業(yè)成就表現(xiàn)做出解釋的過程?;谡n程標準的核心素養(yǎng)測評主要包括三個密切聯(lián)系的重要環(huán)節(jié)。
測評目標即我們所期待的學生學習的結果。清晰界定、準確把握測評目標的內(nèi)涵,是有效測評的首要任務。
新修訂的課程標準關于學生學習結果的期待和界定,主要體現(xiàn)在“課程目標”“課程內(nèi)容”與“學業(yè)質(zhì)量”等幾個部分。把握測評目標,要注意厘清這幾部分之間的關系,形成關于學習結果的整體性認識?!皶鍪隆睆膬?nèi)部條件來看,要有一定的核心素養(yǎng)支撐。這些素養(yǎng)是知識、技能、品格、態(tài)度的有機整合,是一個人適應未來社會發(fā)展和個人終身發(fā)展所需要的正確價值觀、必備品格和關鍵能力。對這些素養(yǎng)的系統(tǒng)培育,不僅是各門課程也是整個學校教育的主要任務。
首先,在“課程目標”中,“核心素養(yǎng)內(nèi)涵”是對該課程內(nèi)在育人價值的凝練概括,明確回答這些素養(yǎng)是什么;“目標要求”是這些素養(yǎng)在義務教育階段的培育要求,與學生年齡特征相適應,體現(xiàn)出一定的學段特點。
其次,在“課程內(nèi)容”中,“學業(yè)要求”明確了各主題或單元核心素養(yǎng)培育的具體要求,強調(diào)通過主題或單元學習任務的完成去培育學生相關素養(yǎng),讓學生學會運用主題或單元知識去解決問題。學業(yè)要求是課程目標的具體化,是融入主題或單元內(nèi)容的素養(yǎng)要求,同時也是這些主題或單元教學和評價的直接依據(jù)。
最后,各學科課程標準中的“學業(yè)質(zhì)量”則是依據(jù)一定的核心素養(yǎng)發(fā)展模型,對學生完成該門課程階段性學習任務后學業(yè)成就的典型表現(xiàn)進行整體刻畫,為教師在該課程的教學和評價中分析、解釋學生的成就表現(xiàn),整體把握學生的核心素養(yǎng)發(fā)展水平提供了直接依據(jù)。進一步說,所謂學業(yè)成就表現(xiàn),就是在一定情境中像學科從業(yè)者那樣思考和行動的典型特征。如小學1~2年級科學思維的典型表現(xiàn)包括“能在熟悉的日常生活情境中”有“多角度提出觀點的意識”,能夠“嘗試用現(xiàn)象或經(jīng)驗支持自己的想法”“發(fā)現(xiàn)自己作品的問題和可能的解決方案”等。教師在進行日常教學評價時,可以通過觀察學生在熟悉的日常生活情境中是否具有上述典型表現(xiàn),來分析判斷學生的科學思維水平;在學業(yè)水平考試時則可通過命制相應的試題來考查學生能否用現(xiàn)象或經(jīng)驗支持自己的想法等。
從上述分析可以看出,核心素養(yǎng)是一門課程一以貫之的主線,是該課程的DNA;“目標要求”“學業(yè)要求”“學業(yè)質(zhì)量”是關于學生核心素養(yǎng)發(fā)展的具體期待。如果說平時的教學評價更多依據(jù)相關“學業(yè)要求”的話,那么階段總結性評價則應更多依據(jù)“學業(yè)質(zhì)量標準”,這兩方面的評價又都不能偏離該課程總體性的“目標要求”。
由于多方面原因,2022年版課程標準中有些核心素養(yǎng)測評目標還不是那么清晰。如歷史課程標準“目標要求”中的“初步學會在歷史唯物史觀的指導下看待歷史”“初步學會依靠可信史料了解和認識歷史”等,其中兩個“初步”的特征及具體要求是什么?這些要求與普通高中階段相比有什么差別?具體測評時還需要結合學生的年齡特征和教學實際情況,進一步澄清這些問題,這樣才能保證測評有著更為明確的指向和應有的效度。
測評要求考查學生在測評目標上的具體反應。這里的考查不僅指日常教學中隨時隨地觀察、做筆記,還要求在專門的考試考核情境中進行考查。核心素養(yǎng)測評的重要任務之一就是設計出一些項目,創(chuàng)設能夠引發(fā)核心素養(yǎng)表現(xiàn)的問題或任務??疾楹诵乃仞B(yǎng)的項目與考查知識技能的題目有什么不一樣呢?筆者以下列測試項目為例進行說明。
2014年9月,6位平均年齡72歲的老人從成都出發(fā),沿川藏公路318國道,歷時19天到達拉薩(圖略),完成了他們“追尋陽光、倡導環(huán)保、騎行川藏線”的夢想。
(1)川藏線道路艱險,沿途自然環(huán)境復雜多變。請推測老人們在騎行途中需要克服的不利自然條件。
(2)老人們原打算在7-8月騎行,在查閱氣象資料(表略)后,他們決定避開7-8月出行。簡述老人們這樣可以避開哪些不利于出行的因素。
(3)為應對沿途各種自然挑戰(zhàn),老人們在出發(fā)前制定了一個物品清單。請對清單進行補充,并說明攜帶這些物品的理由。
(4)近年來,川藏線成為自駕游的熱門線路,這給沿線生態(tài)環(huán)境造成了一定破壞。相對于駕駛汽車,騎行川藏線有哪些優(yōu)點?
上述測試項目沒有考查學生有關青藏高原地形、氣候等方面的知識,而是結合6位老人騎行川藏線的報道,設計了4個問題讓學生解答,要求學生從文字、圖像、表格中獲取關于地球表層環(huán)境的信息,并以此分析、解釋、評價6位老人的騎行川藏線行為,考查學生能否從人地關系的角度思考問題,具有一定的環(huán)境保護意識和地理實踐力。這便是一個素養(yǎng)立意的測評項目,它從已往以客觀測驗、選擇反應為主的是非題和選擇題等測試,轉(zhuǎn)向以考查學生在一定情境中的建構反應為主的表現(xiàn)性測評,注重完成任務的過程和結果,包括活動作品或制品等;從已往分解性、點對點的碎片式測驗轉(zhuǎn)向關注學科知識與學生經(jīng)驗的聯(lián)系以及學科知識之間內(nèi)在關聯(lián)的綜合考查,強調(diào)對事物或現(xiàn)象的整體性思考和行動,改變過于關注知識點認知的狀況;從過去憑個人經(jīng)驗的隨意測驗,轉(zhuǎn)向依據(jù)學業(yè)質(zhì)量標準、基于核心素養(yǎng)發(fā)展模型的規(guī)范測評,強調(diào)遵循一定的測評程序,通過專業(yè)人員的審查等改進測評項目質(zhì)量。大規(guī)模的測評通常要求選擇適當?shù)臏y量模型,把得到的分數(shù)與構念聯(lián)系起來,對被試的反應進行測量學分析,特別是效度、信度檢驗,既改進工具質(zhì)量,也便于把握分數(shù)的真實含義,指導在實踐中解釋和運用分數(shù)。
測評項目設計要在測評目標、課程內(nèi)容、情境之間建立內(nèi)在關聯(lián),至少要考慮這樣幾個問題。
其一,測評項目與測評目標的關系。如果說測評目標是課程標準確立的理論預設的話,那么測評項目就是選取適當方式實現(xiàn)該理論預設的過程,兩者本質(zhì)上是一致的。好的測評項目就是用來觀察學生在測評目標上處在哪個水平。
其二,測評項目與課程主題或單元內(nèi)容的關系。測評項目任務完成或問題解答所涉及的知識技能不得超過課程內(nèi)容規(guī)定的范圍。素養(yǎng)立意的測評關注的重心不在具體的知識技能點,但又不撇開知識技能,它主要指向?qū)W生在運用知識技能完成任務、解答問題中所表現(xiàn)出來的素養(yǎng)水平。
其三,測評項目與情境的關系。測評項目開發(fā)關鍵性的挑戰(zhàn)是找到與課程內(nèi)容相關的真實情境,讓不同社會文化背景下的學生都能夠理解和參與。測評項目通常要求適當簡化現(xiàn)實背景、相關情境,使學生比較容易接近;同時保持情境真實的一面,包括事情要有發(fā)生的可能性,提出的問題應與現(xiàn)實情境相一致,解決問題的目的就像實際情境中一樣明確,應用的語言要與實際情境相匹配,有關問題的信息和數(shù)據(jù)應該符合實際情況,數(shù)字應該真實,等等。
核心素養(yǎng)測評不限于學年末或?qū)W段末的紙筆測驗,更為重要的是嵌入日常教育教學過程中,通過設計綜合性的學科實踐或跨學科實踐項目進行。各地區(qū)或中小學??梢罁?jù)課程標準,結合實際情況,設計主題相對統(tǒng)一、學生可選的學科實踐或跨學科實踐項目,有效反映測評目標的內(nèi)涵和結構,并組織探究實踐報告交流或作品、制品答辯活動,建立學生成長檔案,借以考察有關核心素養(yǎng)形成情況。這應成為核心素養(yǎng)測評的常態(tài)。在2022年版課程標準中,有些學科的課程標準提供了少數(shù)測評項目案例,值得校長和教師仔細研讀。
核心素養(yǎng)測評項目的限定越少,學生完成任務的方式及表現(xiàn)形式就越多,解答問題的思路及答案就越多,測評越具有開放性。為此,在構建基于課程標準的核心素養(yǎng)測評體系時,要在預測的基礎上,依據(jù)學業(yè)要求、學業(yè)質(zhì)量標準和具體測評目標,對豐富多樣的答案、表達形式進行梳理,建立有限且無遺漏的、有序遞進的類別,予以相應的分級或賦分,構建測評量規(guī)。這是核心素養(yǎng)測評的又一個挑戰(zhàn)。
首先,測評量規(guī)的構建要以核心素養(yǎng)發(fā)展進階為依據(jù),以相關實證研究做基礎。義務教育各學科課程標準研究提出了該課程應重點加以培育的3~6個核心素養(yǎng),如歷史學科中的唯物史觀、時空觀念、史料實證、歷史解釋、家國情懷。測量學把它們視為潛在的連續(xù)變量,這些變量有一個由低到高、從消極到積極、由弱到強的發(fā)展過程,存在著有序的質(zhì)性水平。如“歷史解釋”這一核心素養(yǎng)的初級水平如下:能夠區(qū)分歷史敘述中的史實與解釋,把握歷史發(fā)展中的部分聯(lián)系,如古今聯(lián)系,使用相關術語對具體歷史事件做出解釋;其發(fā)展水平如下:嘗試從來源、性質(zhì)和目的等多個方面,在正確的歷史觀和方法論的指導下,對系列史事做出解釋,并對不同解釋的原因加以評析;其更高水平如下:在盡可能占有史料的基礎上,嘗試驗證已往的說法或提出新的解釋,在正確的歷史觀和方法論指導下,全面客觀地論述歷史和現(xiàn)實問題。上述發(fā)展進階明確指出了核心素養(yǎng)質(zhì)性水平序列及相關典型表現(xiàn),為構建量規(guī)提供了直接依據(jù)。此外,核心素養(yǎng)測評量規(guī)可根據(jù)具體的測評項目做必要的轉(zhuǎn)化和具體化,特別是有遞進的類別及相應賦分應與核心素養(yǎng)進階水平保持一致,而不宜在此之外另搞一套評分體系。
其次,好的量規(guī)是綜合考量核心素養(yǎng)發(fā)展規(guī)律及問題或項目任務場景而做出的專業(yè)判斷,具有鮮明的導向性、科學性和可操作性。在導向性方面,它指向核心素養(yǎng)典型表現(xiàn)的分級描述,體現(xiàn)正確的育人價值導向,不是對任務產(chǎn)出作品或制品特征的描述,也不限于認知層面;在科學性方面,它能準確揭示特定情境中不同素養(yǎng)表現(xiàn)的實質(zhì)性差異,是系統(tǒng)梳理、反復驗證的結果,每一種可能的反應都能納入對應的類別;在可操作性方面,它的用詞用語應該清晰準確、無歧義,不是程度副詞、形容詞的簡單堆積。核心素養(yǎng)測評不像知識技能點測查那么簡單,不是所有素養(yǎng)目標都能匹配可直接使用的測評量規(guī)。
最后,各門課程可依據(jù)課程標準和學段主要教學活動安排,開發(fā)核心素養(yǎng)測評手冊。該手冊不是單元測試題目匯編,而是分學段對區(qū)域或?qū)W校范圍內(nèi)的測評活動進行規(guī)劃設計。測評手冊的主要內(nèi)容包括核心素養(yǎng)發(fā)展模型、評價目標與量規(guī)、共同的表現(xiàn)性評價項目。其中核心素養(yǎng)發(fā)展模型要對課程標準中的核心素養(yǎng)內(nèi)涵、各要素間的關系及發(fā)展進階等做必要闡釋并舉例說明,讓師生看得明白。評價目標與量規(guī)要對期望的學段學習結果特別是素養(yǎng)發(fā)展水平做必要的界定。測評手冊依據(jù)學業(yè)質(zhì)量標準即學業(yè)成就典型表現(xiàn),制定相應的評價量規(guī),使之可把握、可操作;必要時可以主題或單元為單位,進一步細化評價目標和量規(guī),以強化其與課程內(nèi)容的連接。測評手冊還需要細化評價項目、學生表現(xiàn)證據(jù)收集與梳理、教師評分細則及反饋數(shù)據(jù)的收集和上傳、時間安排等具體評價活動。當然,測評手冊在統(tǒng)一安排之外還應為學?;蚪處熖峁┛蛇x擇的自主空間。
必須強調(diào)的是,比測評技術更重要的是測評理念的更新。義務教育階段的所有測評都倡導以評價促發(fā)展,以評價促進學生自我反思、自我教育,營造一種鼓勵學生從嘗試和錯誤中學習的文化。我們知道,越是重要的素養(yǎng)往往越難測評。因此,突破核心素養(yǎng)測評卡點,要保持對人的成長規(guī)律應有的敬畏態(tài)度。(編輯 崔若峰)
注釋:① 本文系國家社科基金教育學重點課題“新時代五育融合實踐路徑與評價改革研究”(課題批準號:AEA200011)的研究成果。本文作者為教育部義務教育課程修訂綜合組專家。