郭光明 馬秀誼
本文為江蘇省教育科學“十三五”規(guī)劃2018 年度考試招生改革專項重點資助課題“基于學科核心素養(yǎng)的高中學業(yè)水平等級性考試命題改革研究”(K-a/2018/03)的研究成果。
中國學生發(fā)展核心素養(yǎng)是黨的教育方針的具體化。為建立核心素養(yǎng)與課程教學之間的內(nèi)在聯(lián)系,充分挖掘?qū)W科課程教學對全面貫徹黨的教育方針、落實立德樹人根本任務(wù)、發(fā)展素質(zhì)教育的獨特育人價值,《普通高中歷史課程標準(2017 年版2020 年修訂)》(以下簡稱《課程標準》)基于學科的本質(zhì)凝練了歷史學科的核心素養(yǎng),明確了學生學習高中歷史課程后應(yīng)達成的正確價值觀念、必備品格和關(guān)鍵能力。[1]在此基礎(chǔ)上,《課程標準》還基于歷史學科核心素養(yǎng)不同水平的關(guān)鍵表現(xiàn),劃分了學業(yè)質(zhì)量水平,并明確將其作為普通高中歷史學業(yè)水平考試命題的依據(jù)。在這樣的背景下,如何通過系統(tǒng)化的命題設(shè)計,對學生的歷史學科核心素養(yǎng)進行科學有效的測評,讓考試評價促進高中歷史教學全面落實學科核心素養(yǎng)的育人目標,就成為普通高中歷史學業(yè)水平考試亟待解決的現(xiàn)實問題。本文嘗試從試卷藍圖設(shè)計、試題結(jié)構(gòu)設(shè)計和評分標準設(shè)計3 個層面進行探討。
學科核心素養(yǎng)的考查包含多個維度的要求,并非若干素養(yǎng)測試題目的簡單拼湊。只有根據(jù)《課程標準》,對各個維度的考查要求進行統(tǒng)籌安
郭光明/江蘇省教育考試院命題中心副研究員。(南京 210024)
馬秀誼/江蘇省教育考試院命題中心副研究員。排,才能保證學科核心素養(yǎng)測評的系統(tǒng)性。
(1)素養(yǎng)類別
《課程標準》基于歷史學的本質(zhì),將歷史學科核心素養(yǎng)概括為“唯物史觀”“時空觀念”“史料實證”“歷史解釋”和“家國情懷”5 個方面。[1]這些素養(yǎng)的內(nèi)涵和表現(xiàn)各不相同。對學生而言,歷史學科核心素養(yǎng)5 個方面的發(fā)展有時是不平衡的,某個方面的素養(yǎng)發(fā)展狀況并不代表其他方面的素養(yǎng)發(fā)展狀況。為引導(dǎo)學生形成全面的學科素養(yǎng)結(jié)構(gòu),學業(yè)水平考試命題應(yīng)兼顧這5 個方面的素養(yǎng)考查,并根據(jù)各方面素養(yǎng)在歷史學科中的地位、作用,合理確定其在一份試卷中的考查權(quán)重。
(2)素養(yǎng)水平
準確界定學生的歷史學科核心素養(yǎng)水平是普通高中歷史學業(yè)水平考試的本質(zhì)要求?!墩n程標準》以歷史學科核心素養(yǎng)及其表現(xiàn)水平為主要維度,將學業(yè)質(zhì)量劃分為四級水平,刻畫了學科核心素養(yǎng)在各級水平上的具體表現(xiàn),并規(guī)定了學業(yè)水平合格性考試和等級性考試對核心素養(yǎng)考查的不同水平要求。[1]學業(yè)水平考試命題應(yīng)嚴格依據(jù)《課程標準》的規(guī)定,并遵循教育測量的一般規(guī)律,在區(qū)分不同性質(zhì)學業(yè)水平考試的基礎(chǔ)上,合理確定一份試卷的素養(yǎng)水平測試梯度。
(3)學科內(nèi)容
系統(tǒng)的、結(jié)構(gòu)化的學科知識、技能、觀念和方法,是學生形成學科核心素養(yǎng)的基本前提。[2]《課程標準》圍繞歷史學科核心素養(yǎng)的落實,采用通史與專題史相結(jié)合的方式重組了課程內(nèi)容,依次設(shè)立“中外歷史綱要”“國家制度與社會治理”“經(jīng)濟與社會生活”“文化交流與傳播”“史學入門”和“史料研讀”6 個模塊,并將各模塊細分為若干專題。在此基礎(chǔ)上,《課程標準》規(guī)定了學業(yè)水平合格性考試和等級性考試的不同內(nèi)容范圍。[1]要有效測試學生的歷史學科核心素養(yǎng),學業(yè)水平考試命題應(yīng)當根據(jù)考試的內(nèi)容范圍,在理清歷史知識體系的基礎(chǔ)上,選取對評價歷史學科核心素養(yǎng)具有重要意義和代表性的內(nèi)容。
要在一份試卷中同時兼顧3 個維度的學科素養(yǎng)測試要求,必須考慮各維度之間的交叉關(guān)系,并采用雙向細目表形式設(shè)計試卷素養(yǎng)測試藍圖,如圖1 所示。
圖1 試卷素養(yǎng)測試藍圖
圖1 中,橫向設(shè)置學科內(nèi)容維度欄,縱向設(shè)置素養(yǎng)類別、素養(yǎng)水平維度欄。圖的中部橫向和縱向交叉的空格用于填寫同時滿足3 個維度要求的題數(shù)與分值。圖的右側(cè)設(shè)置素養(yǎng)分布統(tǒng)計欄,用以統(tǒng)計一份試卷中5 個學科核心素養(yǎng)所占的題數(shù)和分數(shù)。圖的底部設(shè)置內(nèi)容分布統(tǒng)計欄和水平分布統(tǒng)計欄,用以統(tǒng)計一份試卷中各內(nèi)容領(lǐng)域、素養(yǎng)水平的題數(shù)和分數(shù)。圖的右下角位置設(shè)置總題數(shù)統(tǒng)計欄和總分數(shù)統(tǒng)計欄。下面以普通高中歷史學業(yè)水平等級性考試為例,說明如何按圖1 設(shè)計試卷素養(yǎng)測試藍圖。
(1)分析《課程標準》中有關(guān)學業(yè)水平等級性考試的要求,在此基礎(chǔ)上分別對試卷的總題數(shù)、總分數(shù)和試卷中不同素養(yǎng)類別、不同素養(yǎng)水平、不同內(nèi)容模塊的試題分值比例及其允許的浮動范圍進行規(guī)定。假設(shè)規(guī)定如下:
試卷總題數(shù)為26~30 題,試題中考查不同素養(yǎng)類別、素養(yǎng)水平或內(nèi)容領(lǐng)域的問題在統(tǒng)計時視為獨立題數(shù)。試卷總分為100 分,其中,各素養(yǎng)類別的分值分別為“唯物史觀”(15 分)、“時空觀念”(20 分)、“史料實證”(20 分)、“歷史解釋”(30 分)、“家國情懷”(15 分),各素養(yǎng)水平的分值分別為水平1(10 分)、水平2(30 分)、水平3(40 分)、水平4(20 分),各內(nèi)容模塊的分值分別為中外歷史綱要(20 分)、國家制度與社會治理(30 分)、經(jīng)濟與社會生活(30 分)、文化交流與傳播(20 分)①,各素養(yǎng)類別、素養(yǎng)水平和內(nèi)容模塊的分值浮動范圍均為5 分。
(2)設(shè)計“普通高中歷史學業(yè)水平等級性考試試卷素養(yǎng)測試藍圖(示例)”,并分別在相應(yīng)欄目中填寫高中歷史學科的各素養(yǎng)類別、素養(yǎng)水平和內(nèi)容模塊的具體名稱。
(3)根據(jù)各素養(yǎng)類別的分值規(guī)定,初步確定其在不同素養(yǎng)水平上的分布。比如:“唯物史觀”的分值為15 分,考查“水平2”的有1 題,3 分;考查“水平3”的有3 題,共12 分。其他素養(yǎng)以此類推。
(4)根據(jù)各素養(yǎng)類別在不同素養(yǎng)水平上的分布,初步確定試題擬對應(yīng)的內(nèi)容模塊。比如:在考查“唯物史觀”的試題中,考查“水平2”的1題擬對應(yīng)“經(jīng)濟與社會生活”;考查“水平3”的3 題中,有2 題擬對應(yīng)“國家制度與社會治理”,另1 題擬對應(yīng)“文化交流與傳播”。其他素養(yǎng)以此類推。
(5)根據(jù)上述素養(yǎng)類別、素養(yǎng)水平和內(nèi)容領(lǐng)域的對應(yīng)關(guān)系,在圖的中部橫向和縱向交叉的空格填寫同時滿足3 個維度要求的題數(shù)與分值。比如:在“唯物史觀”“水平2”與“經(jīng)濟與社會生活”交叉的空格中,題數(shù)填“1”,分值填“3”;在“唯物史觀”“水平3”與“國家制度與社會治理”交叉的空格中,題數(shù)填“2”,分值填“6”;在“唯物史觀”“水平3”與“文化交流與傳播” 交叉的空格中,題數(shù)填“1”,分值填“6”。其他素養(yǎng)以此類推。
(6)統(tǒng)計試卷總題數(shù)、總分數(shù)和各素養(yǎng)類別、素養(yǎng)水平、內(nèi)容模塊的分值,判斷其是否符合原先的規(guī)定,如不符合,則予以調(diào)整,直至符合為止。
經(jīng)過上述步驟,就可設(shè)計出如圖2 所示的普通高中歷史學業(yè)水平等級性考試試卷素養(yǎng)測試藍圖。通過該藍圖,可對高中歷史學科5 種核心素養(yǎng)、4 級素養(yǎng)水平和4 個內(nèi)容領(lǐng)域的測試比例及其交叉分布做到一目了然,進而實現(xiàn)對試卷素養(yǎng)測試結(jié)構(gòu)的整體把握。
圖2 普通高中歷史學業(yè)水平等級性考試試卷素養(yǎng)測試藍圖(示例)
試卷素養(yǎng)測試藍圖是從總體上設(shè)定一份試卷中素養(yǎng)類別、水平、內(nèi)容等維度的比例及其交叉分布,要將其落實到具體試題,必須按照藍圖的指引,對試題素養(yǎng)測試的諸多要素進行整合。
(1)素養(yǎng)目標
素養(yǎng)目標是指試題準備測量考生哪方面的學科核心素養(yǎng)以及該素養(yǎng)的什么水平。只有對試題的素養(yǎng)目標有著清晰界定,才可能在情境設(shè)計、條件界定和試題設(shè)問等方面有明確指向。[2]
(2)內(nèi)容領(lǐng)域
內(nèi)容領(lǐng)域是指試題測試素養(yǎng)目標所依托的學科知識內(nèi)容。離開學科知識,學科素養(yǎng)就是空中樓閣,更無法測試。
(3)試題形式
試題形式是指試題命制所采用的題型,可從不同角度進行分類。比如,根據(jù)解題過程的構(gòu)建性可分為選擇題和非選擇題;根據(jù)試題答案的固定性,又可分為封閉性試題和開放性試題。研究表明,不同題型因答題要求的不同而具有不同的素養(yǎng)考核功能,有的適合考查記憶、識別、理解等基礎(chǔ)層次的素養(yǎng)水平,有的適合考查應(yīng)用、評價、創(chuàng)造等高級層次的素養(yǎng)水平。
(4)問題情境
問題情境是指試題測試某種素養(yǎng)時所創(chuàng)設(shè)的問題背景,是以問題或任務(wù)為中心構(gòu)成的活動場域。[3]學生能否應(yīng)對和解決陌生、復(fù)雜、開放性的真實問題情境,是檢驗其核心素養(yǎng)水平的重要方面。多維度地創(chuàng)設(shè)問題情境,考查學生在新情境下如何解決問題,有利于檢測和評價學生的歷史學科核心素養(yǎng)水平。[1]
(5)試題設(shè)問
試題設(shè)問是指試題要求考生解決的實際問題,其功能是將考生內(nèi)在的學科素養(yǎng)外化為可觀測的行為表現(xiàn)。為有效測試歷史學科核心素養(yǎng),試題設(shè)問應(yīng)符合所測素養(yǎng)及水平層次的表現(xiàn)特征,并要求考生聯(lián)系問題情境中提供的特定信息,運用歷史知識、思想和方法等去解答問題,防止出現(xiàn)試題設(shè)問與所測素養(yǎng)、問題情境或?qū)W科內(nèi)容脫節(jié)的情況。
試題素養(yǎng)測試的諸要素之間既相互獨立,又相互作用,只有做到各要素協(xié)調(diào)一致,才能充分實現(xiàn)試題的素養(yǎng)測試功能。筆者認為,可以在試卷素養(yǎng)測試藍圖指引下,根據(jù)各要素內(nèi)在聯(lián)系,設(shè)計如圖3所示的試題素養(yǎng)測試結(jié)構(gòu)。
圖3 試題素養(yǎng)測試結(jié)構(gòu)
現(xiàn)以一道試題為例,說明試題素養(yǎng)測試結(jié)構(gòu)的設(shè)計過程。
(1)確定試題素養(yǎng)目標。為實現(xiàn)整個試卷的素養(yǎng)類別和水平測試合理分布,每道試題素養(yǎng)目標的確定必須以試卷素養(yǎng)測試藍圖為依據(jù)。根據(jù)圖2 所示的素養(yǎng)測試藍圖,筆者首先假定要命制1 道考查“歷史解釋”水平2 的試題。在此基礎(chǔ)上,為便于命題過程中具體把握和對照,可依據(jù)《課程標準》,對“歷史解釋”水平2 在試題中涉及的表現(xiàn)特征進行描述,如“能夠選擇、運用相關(guān)材料并使用相關(guān)歷史術(shù)語對具體史實進行解釋”。
(2)確定試題內(nèi)容領(lǐng)域。為實現(xiàn)整個試卷的學科內(nèi)容分布,每道試題內(nèi)容領(lǐng)域的確定也必須以試卷素養(yǎng)測試藍圖為依據(jù)。依據(jù)圖2,考查“歷史解釋”水平2 的試題共有5 道,其中,1 道考查“國家制度與社會治理”,3 道考查“經(jīng)濟與社會生活”,還有1 道考查“文化交流與傳播”。以“國家制度與社會治理”的考查為例,因為內(nèi)容模塊的范圍太寬泛,難以進行命題操作,所以可進一步假定試題內(nèi)容只涉及其中的某個專題,如“官員的選拔與管理”。
(3)確定試題形式。試題設(shè)計應(yīng)充分考慮素養(yǎng)目標與試題形式之間的適應(yīng)關(guān)系,靈活采用不同題型實現(xiàn)學科核心素養(yǎng)的有效考核。本題考核的“歷史解釋”水平2 素養(yǎng)目標屬于基礎(chǔ)層次的素養(yǎng),可假定采用的題型為選擇題。
(4)設(shè)計問題情境。問題情境必須根據(jù)測試內(nèi)容領(lǐng)域和試題形式進行設(shè)計。從本題考查的內(nèi)容領(lǐng)域來看,問題情境應(yīng)該聚焦于“國家制度與社會治理”中的“官員選拔與管理”,這方面可以選用的制度及史實資料非常豐富。假定選用中國古代的科舉制度,以唐代的兩則科舉故事按選擇題的要求設(shè)計問題情境如下:
唐代詩人劉得仁系皇親國戚,其弟兄為達官顯貴,而他“出入舉場三十年,竟無所成”;唐宗室子弟李洞屢考不中,竟想去皇陵哭訴。[4]
(5)設(shè)計測試問題。試題設(shè)問取決于具體的試題形式和問題情境。根據(jù)選擇題的結(jié)構(gòu)及設(shè)問規(guī)則,本題可圍繞上述問題情境所體現(xiàn)的科舉制度公平性特征設(shè)計正確選項,再利用問題情境中人物的身份信息設(shè)計干擾選項,考查考生運用相關(guān)材料解釋具體史實的素養(yǎng)。假定設(shè)問[4]如下:
兩人的經(jīng)歷反映了唐代( )
A. 科舉考試不重考生詩才
B. 選官制度阻斷貴族入仕
C. 中央政府剝奪宗室特權(quán)
D. 科舉取士體現(xiàn)公平公正
經(jīng)過上述步驟,就形成了1 道具體試題的素養(yǎng)測試結(jié)構(gòu)。(見圖4)這既能使試題的素養(yǎng)目標和內(nèi)容領(lǐng)域符合試卷素養(yǎng)測試藍圖的要求,又能使試題具有內(nèi)在的素養(yǎng)測試功能。
圖4 試題素養(yǎng)測試結(jié)構(gòu)(示例)
基于學科核心素養(yǎng)測評的試卷藍圖設(shè)計與試題結(jié)構(gòu)設(shè)計,分別從試卷和試題兩個層面為全面有效測試考生的學科核心素養(yǎng)提供了方案,但這只是解決了學科核心素養(yǎng)的測試方法問題。要使測試結(jié)果準確反映考生的素養(yǎng)表現(xiàn),還需進行評分設(shè)計,解決學科核心素養(yǎng)的評價標準問題。
傳統(tǒng)的封閉性試題答案相對固定或結(jié)論唯一,評分標準較為簡單,以答對要點、答對步驟或選對選項等為依據(jù)進行評分。然而,在基于學科核心素養(yǎng)測評中,為突出創(chuàng)新精神和自主探究等能力的考查,開放性試題采用得越來越多。這些開放性試題不是要求考生寫出一個包含若干特定要點或解題步驟的答案,更不是要求考生在試題提供的選項中進行選擇,而是要求考生通過對問題的綜合分析和深層理解,創(chuàng)造性地解決問題,實質(zhì)是對學科核心素養(yǎng)的一種綜合考查。同時,開放性試題尊重考生的主體地位,承認不同的答案都可以具有合理性,對同樣的試題材料,考生可從不同角度、不同層面解讀,做出不同的假設(shè)與推論,形成富有個性的答案[5],為不同素養(yǎng)水平的考生充分展現(xiàn)其能力與思維特征提供了平臺。
開放性試題的特點決定了其測量目標具有高度的復(fù)雜性,按傳統(tǒng)的“踩點給分”或“按步驟給分”等評分標準,閱卷人員無法對開放性試題所測的考生素養(yǎng)表現(xiàn)做出準確的評價。這就需要針對開放性試題的特點,創(chuàng)新評分標準。筆者認為,可以嘗試借鑒PTA 量表法,依據(jù)試題的測量目標設(shè)計開放性試題評分量表,如表1 所示。該量表法的理論假設(shè)是:任何一種行為表現(xiàn),包括行為的和認知的,都會有一系列基本的要素,這些要素構(gòu)成學生學習某些知識、技能或行為表現(xiàn)的基本單元,只要找出這些基本單元,并對學生在這些基本單元中的行為表現(xiàn)做出準確的評定,那么學生在完成這些具體任務(wù)時的總體特征就可以得到適當?shù)脑u定。[6]
表1 開放性試題評分量表
現(xiàn)以一道開放性試題為例,說明如何運用開放性試題評分量表進行評分標準設(shè)計。
某一年的江蘇省普通高中學業(yè)水平等級性考試歷史卷的第22 題第2 問(分值為9 分)是一道史證題,該題以翁仕朝所處時代為背景,請考生根據(jù)試題提供的3 則材料(分別摘自王爾敏《儒學世俗化及其對于民間風教之浸濡》、20 世紀初翁仕朝授課教材和20 世紀30 年代翁仕朝手稿,限于篇幅,材料具體內(nèi)容略),結(jié)合所學知識,就翁仕朝的家國情懷提煉觀點,并從內(nèi)涵和成因兩方面進行論證。要求觀點明確,史論結(jié)合,邏輯嚴密,表達通暢,280 字左右。[4]
該題只是根據(jù)材料設(shè)定了論題和基本答題要求,考生需要對史料進行解讀與選擇,準確引用并充分運用史實和論據(jù),這樣才能得到較高分數(shù)。可以看出,試題的開放性很強。該題評分量表設(shè)計步驟如下。
閱讀試題可知,該題的設(shè)問為“根據(jù)試題提供的3 則材料,結(jié)合所學知識,就翁仕朝的家國情懷提煉觀點,并從內(nèi)涵和成因兩方面進行論證”。由此分析,試題測試的素養(yǎng)目標為“史料實證”水平4,目標行為表現(xiàn)是“能恰當?shù)剡\用史料對所探究問題進行論述”。根據(jù)該素養(yǎng)目標的行為表現(xiàn),可將其分解為“論點”“論據(jù)及論證”和“表述”3 個要素。
根據(jù)上述3 個目標要素在解答問題過程中的思維量大小及重要程度的不同,分配各要素分值。如本題分值為9 分,可將各要素分值規(guī)定為“論點”2 分、“論據(jù)及論證”6 分、“表述”1 分。
根據(jù)命題者的設(shè)想及考生實際作答情況,對上述3 個目標要素的行為表現(xiàn)水平分別進行分級,并對每個等級做出清晰描述或界定。比如,將“論點”分為3 級:等級1 的表現(xiàn)水平為明確歸納出中心論點“翁氏家國情懷具有時代性”;等級2 的表現(xiàn)水平為中心論點含“家國情懷”,但不涉及“時代性”;等級3 的表現(xiàn)水平為中心論點偏頗,或缺少中心論點。
根據(jù)目標要素分值及其水平分級情況,對3個目標要素的各級表現(xiàn)水平分別進行賦分。比如,“論點”要素的分值為2 分,其水平分為3 級,可以將“論點”要素3 級不同表現(xiàn)水平的賦分由高到低依次設(shè)定為2 分、1 分、0 分。
經(jīng)過上述4 個步驟,即完成了如表2 所示的試題評分量表的設(shè)計。該評分量表以行為目標的要素分解和行為表現(xiàn)的水平分級為基礎(chǔ),通過對各要素行為表現(xiàn)的評價匯總達到對整個行為表現(xiàn)的評價,不僅充分體現(xiàn)了開放性試題的素養(yǎng)考核目標,而且開放性試題的評分具有了較強的操作性。
表2 開放性試題評分量表(示例)[4]
注釋:
①《課程標準》規(guī)定,高中歷史學業(yè)水平等級性考試以必修和選擇性必修課程為考試內(nèi)容,具體包括“中外歷史綱要”“國家制度與社會治理”“經(jīng)濟與社會生活”“文化交流與傳播”4 個模塊。