蔣艷云 蔣培杰
(1.北京師范大學未來教育學院,廣東珠海,519087;2.湖南師范大學數(shù)學與統(tǒng)計學院,長沙,410081)
普通高中學業(yè)水平考試是省級國家大規(guī)模教育考試,是考生普通高中畢業(yè)和同等學歷認定的主要依據(jù)以及高校招生錄取的重要參考,每年各省的參考人數(shù)高達數(shù)十萬,是影響力僅次于高考的大規(guī)模、高利害教育考試。在新課標實施背景下,普通高中課程各個學科均有明確的學業(yè)質量標準,對學生在高中階段學習應養(yǎng)成的學科核心素養(yǎng)有明確的規(guī)定。以數(shù)學學科為例,根據(jù)《普通高中數(shù)學課程標準(2017年版2020年修訂)》,高中數(shù)學學業(yè)質量分為三個水平,其中學業(yè)質量水平一是高中生畢業(yè)應達到的要求,是普通高中數(shù)學學業(yè)水平考試命題的依據(jù)[1]。普通高中學業(yè)水平考試是對普通高中畢業(yè)會考的繼承和發(fā)展,強調學科核心素養(yǎng),更加符合立德樹人的理念。目前在普通高中學業(yè)水平考試的相關制度[2]、測量學[3]和評價標準[4]等方面已有一些研究,但是如何分析和利用普通高中學業(yè)水平考試的試題和成績等數(shù)據(jù)則少有研究成果。仍以數(shù)學學科為例,在數(shù)學學科核心素養(yǎng)的測評案例[5]和新理念下的數(shù)學高考命題[6]等方面都已有研究成果,但是基于普通高中數(shù)學學業(yè)水平考試相關大數(shù)據(jù)的教學質量分析和評價則相對較少。《教育部關于普通高中學業(yè)水平考試的實施意見》(教基二[2014]10號)文件指出:“各級教育行政部門要加強對學業(yè)水平考試結果的研究與分析,做好教學反饋與指導,不斷提高教學質量。”基于普通高中學業(yè)水平考試的教學質量評價是指基于普通高中學業(yè)水平考試產(chǎn)生的試題、答卷和成績等數(shù)據(jù)對普通高中的教育質量進行分析、評價,并對普通高中教育教學提出建議。由于普通高中學業(yè)水平考試生成的數(shù)據(jù)對高中教育質量的評價非常重要,對數(shù)據(jù)的正確分析和解讀有利于發(fā)現(xiàn)教育教學中存在的問題,從而提出有效的改進建議,促進高中教育質量的提升和教育公平的落實,因此基于普通高中學業(yè)水平考試的教學質量評價意義重大。本文主要以數(shù)學學科為例,探討在新課標背景下基于普通高中學業(yè)水平考試的教學質量評價的原則和框架。
教學質量評價是對教學質量的評定、區(qū)分和診斷,診斷的目的是改善和提高。普通高中學業(yè)水平考試能夠全面地反映學生完成高中階段學習時的水平和現(xiàn)狀,是高中教學質量的有效監(jiān)測手段[7],有助于發(fā)現(xiàn)當下高中階段教育突出存在的問題。找出主要問題就能針對問題提出改進辦法,從而保障并提高教學的質量。同時,雖然基于普通高中學業(yè)水平考試的教學質量分析能夠細致地反映出各地市、各學校甚至各教師的教學質量差異,但教學質量評價的主要目的不是甄別和區(qū)分,而是要幫助教師、學校和各地市教研機構積累有用的經(jīng)驗、發(fā)現(xiàn)存在的不足并有所改進。提高教學質量應作為基于普通高中學業(yè)水平考試的教學質量評價的根本原則。
教育公平是社會公平的重要組成部分,一直受到高度關注[8]?;谄胀ǜ咧袑W業(yè)水平考試的教學質量評價能夠揭示經(jīng)濟、教育和文化水平等多方面有差別的地市、鄉(xiāng)鎮(zhèn)甚至學校之間教學質量的差異,有助于教育研究人員分析導致高中學業(yè)水平差異的原因。如果這些原因涉及教育公平,比如,經(jīng)濟水平較好的地市學生學業(yè)成績顯著優(yōu)于經(jīng)濟落后的地市,那么教育決策者就能基于此作出正確的決策,引導優(yōu)質教育資源向經(jīng)濟落后地區(qū)傾斜,從而促進教育公平。促進教育公平是基于普通高中學業(yè)水平考試的教學質量評價的重要原則。
考試不僅要得到學生的最終成績,更重要的是通過對考試的評價來反饋教學,提高教學的質量[9],提供有效反饋是一切教育評價都應遵循的一般原則。之所以要基于普通高中學業(yè)水平考試作教學質量評價,就是希望通過分析學業(yè)水平考試的相關數(shù)據(jù)對當前的教育質量進行明確定位,進而判斷當前的教育狀況是否達到了既定的質量標準。同時,由于大數(shù)據(jù)揭示的規(guī)律往往具有一般性,普通高中學業(yè)水平考試相關數(shù)據(jù)能反映出高中教育突出的、普遍存在的問題,弄清楚存在的問題有助于找出具體對策,改善教學,從而提高教育的質量?;谄胀ǜ咧袑W業(yè)水平考試的教學質量評價的目的就是要積累經(jīng)驗、找出問題、尋求對策和提供建議,如果缺乏對教學和管理的有效反饋,教學質量評價就在最根本的地方失去了意義。
為使讀者更具體地了解評價框架,以下涉及普通高中學業(yè)水平考試均以數(shù)學學科為例??傮w分析包括對試卷的整體質量、學生的整體水平和學生存在的主要問題進行分析和評價。
(1)試卷的整體質量分析
試卷整體質量由信度、效度、難度、區(qū)分度和等第識別指數(shù)等指標來刻畫。信度指的是考試結果的一致性和可靠性程度,信度主要有重測信度、復本信度和內部一致性信度等。由于高中數(shù)學學業(yè)水平考試是大規(guī)模、高利害考試,無法施行試測和重測,因此一般采用試卷內部一致性信度,信度好的試卷克倫巴赫α系數(shù)應該在0.9以上。效度是試卷能夠測量其所要測量的目標的程度,主要包括內容效度、結構效度、效標關聯(lián)效度。高中數(shù)學學業(yè)水平考試試卷的效度主要指的是試題考查目標及其載體與課程標準要求的一致性程度,既可以通過因子分析得到結構效度,也可以由資深專家進行客觀評定給出內容效度[10]。難度是指試題的難易程度,是衡量試題對學生知識與能力水平適合程度的指標。高中數(shù)學學業(yè)水平考試試卷的難度一般采用經(jīng)典測驗理論意義下的整卷得分率,試卷的難度應在0.7~0.8之間(也有研究者認為難度應在0.75~0.80之間)[11]。識別指數(shù)是相對于兩個群體而言的,比如某試題對A等第群體和B等第群體的識別指數(shù)即A等第群體得分率減去B等第群體的得分率。試題的等第識別指數(shù)有利于找出不同水平考生群體的實質差別。
(2)學生總體水平分析
學生總體水平可以通過一系列描述性統(tǒng)計指標來刻畫。最高分、最低分、平均數(shù)、中位數(shù)、眾數(shù)、四分位數(shù)、標準差、變異系數(shù)、各層次學生人數(shù)以及整體分布等都有助于了解學生的總體水平。平均數(shù)消除了觀測值的隨機波動,但易受極端值的影響;中位數(shù)是排序后處于中間位置的數(shù),不受極端值影響;眾數(shù)是出現(xiàn)次數(shù)最多的數(shù);四分位數(shù)是排序后處于25%和75%位置上的值。平均數(shù)、中位數(shù)和眾數(shù)提供了對分數(shù)分布的整體判斷(左偏、對稱、右偏)。方差、標準差和變異系數(shù)等則反映考試成績的離散程度,有助于分析考生成績的差異性。
(3)學生整體優(yōu)勢和不足分析
學生整體優(yōu)勢和不足分析要指出學生整體在哪些方面比較擅長、在哪些方面相對薄弱。就試題而言,每個試題都有考查的知識和能力目標。由于整卷得分率是在0.7~0.8之間,如果考生整體在某試題上的得分率遠高于0.8,說明學生整體對該試題考查的目標較為擅長。同理,如果學生整體得分率遠低于0.7,則說明學生在該試題考查的目標上較為薄弱。如果得分率遠低于0.5,對于學業(yè)水平考試(合格性考試)而言,說明要么試題本身過難(試題存在質量問題),要么學生在相應知識內容的掌握上非常薄弱,應充分重視并作進一步分析。
試卷結構一般是指試卷的題型結構,而知識結構、能力結構和素養(yǎng)結構等則是試卷的考查目標結構,更具有本質性。由于試卷的結構性特點,可以就某一結構對學生的表現(xiàn)進行具體分析,進而指出學生在相應結構上的學業(yè)水平特點。
(1)題型結構與考生表現(xiàn)
普通高中數(shù)學學業(yè)水平考試試卷的題型主要有選擇題、填空題和解答題。有的省市試卷不包含選擇題,但都包括填空題和解答題。一般將選擇題和填空題視為客觀題,解答題視為主觀題。選擇題、填空題主要考查基礎知識和基本技能,解答題則主要考查考生應用數(shù)學知識獨立分析問題和解決問題的能力。考生在各題型上的得分率能夠反映其在基礎知識、基本技能以及分析和解決問題能力上的整體特點。而不同等第考生在各題型上的得分率則揭示出不同層次的學生群體在基礎知識、基本技能以及分析和解決問題能力上的特點。
(2)知識結構與考生表現(xiàn)
根據(jù)《普通高中數(shù)學課程標準(2017年版)》,數(shù)學學業(yè)水平考試的內容涉及集合、常用邏輯、復數(shù)、不等式、平面向量、算法、概率、統(tǒng)計、數(shù)列、三角函數(shù)、立體幾何、解析幾何、函數(shù)與導數(shù)等知識模塊[12]。每個知識模塊由若干個試題聯(lián)合考查,要統(tǒng)計每個知識模塊的滿分值、平均值、標準差、變異系數(shù)和得分率。知識模塊的滿分值在10分以上是重點考查的內容。平均值和得分率是等價的,反映的是考生整體對相應知識模塊的平均掌握程度。標準差和變異系數(shù)反映考生整體在掌握某一模塊知識上的差異程度。不同等第的考生在各知識模塊上的表現(xiàn)不同,通過對以上指標的解讀就能較為全面地把握學生的知識結構狀況,為未來教學提供有益參考。
(3)素養(yǎng)結構與考生表現(xiàn)
《普通高中數(shù)學課程標準(2017年版)》提出了數(shù)學“四基四能”、“三會”和“六個核心素養(yǎng)”的培養(yǎng)框架,六個核心素養(yǎng)為:直觀想象、數(shù)學抽象、數(shù)學運算、邏輯推理、數(shù)據(jù)分析和數(shù)學建模[13]。鑒于高中數(shù)學學業(yè)水平考試作為標準參照考試的特點,在實際的考試命題中,試題要相對簡單,無法做到每個試題都涉及數(shù)學核心素養(yǎng)的考查,不少試題僅僅需要基礎的數(shù)學知識和單一技能就能完成。此外,基礎知識和基本技能(“雙基”)本身是素養(yǎng)的一部分,因此可以補充基礎知識和基本技能這一維度,形成“雙基”加六個核心素養(yǎng)的七維度素養(yǎng)結構。通過計算考生整體在各個維度上得分的集中趨勢指標和離散趨勢指標,比較不同等第考生在各個維度上的得分情況,就能夠把握學生在高中數(shù)學素養(yǎng)結構上的特點。
典型試題主要是指反映重要概念理解水平的試題、反映學生數(shù)學技能掌握水平的試題和反映學生分析、解決數(shù)學問題水平的試題。
(1)反映學生對重要概念理解水平的試題
數(shù)學概念是數(shù)學學習的基礎,對概念的理解是數(shù)學學習成就的基本表現(xiàn)。一些重要的概念(比如函數(shù)概念等)貫穿整個高中數(shù)學學習,是高中數(shù)學知識的主線[14]。如何評價學生的概念理解一直是數(shù)學學習心理學研究的焦點。反映學生對重要概念理解水平的試題需要重點進行分析,分析的指標主要有平均分、標準差、區(qū)分度以及等第得分率。平均分能反映學生整體對該重要概念的理解程度,平均分與該題滿分的比就是該題的難度系數(shù)。標準差反映學生整體在該重要概念理解上的差異程度,等第得分率則更加細致刻畫了不同水平層次的學生群體對重要概念的掌握情況。
比如某省高中數(shù)學學業(yè)水平考試的一道填空題:“平面直角坐標系中角α的終邊與單位圓交于點,則sinα=____?!睂υ囶}可以這樣分析:該題考查任意角三角函數(shù)的定義,任意角三角函數(shù)的定義是高中數(shù)學的基本概念之一,是后續(xù)三角函數(shù)一系列性質和應用的基礎;該題滿分為2分,平均分為0.74,標準差為0.97,得分率僅為0.37(其中A等第得分率為0.93,B等第得分率為0.44,C等第得分率為0.05,D等第得分率為0.005);標準差比平均分還大,而且等第得分率差異懸殊,說明考生在該概念的理解上存在嚴重的問題,要給予充分重視。
(2)反映學生數(shù)學技能掌握水平的試題
數(shù)學技能是在數(shù)學學習過程中通過訓練從而能夠完成數(shù)學任務的行為方式或心智行為方式,分為操作技能和心智技能[15]。為方便分析,可以把數(shù)學技能細化為數(shù)值運算技能、符號操作技能、圖形處理技能、數(shù)據(jù)分析技能、推理論證技能和數(shù)學交流技能。重點考查計算、作圖和推理等技能的試題從不同側面反映出學生數(shù)學技能的結構特點和水平。通過對某一技能類型代表性試題的得分率、標準差、識別指數(shù)等統(tǒng)計指標進行分析就能了解學生在該技能水平上的特點,有助于積累好的經(jīng)驗和發(fā)現(xiàn)可能存在的問題,從而更有效地訓練學生的數(shù)學技能。
(3)反映學生分析和解決問題水平的試題
數(shù)學問題解決是數(shù)學教育領域的重要主題,提高學生的數(shù)學問題解決能力是數(shù)學教育的高階目標。數(shù)學問題是指對學生有一定難度的試題,學生解決這類問題需要進行一定程度的獨立思考。分析和解決數(shù)學問題的能力是普通高中課程標準強調的重要能力,高中數(shù)學學業(yè)水平考試的試題中有一些試題專門考查分析和解決問題的能力。評價過程中將這些試題中有代表性的選出來,分析試題的各個統(tǒng)計指標,并對各等第學生群體的指標進行對比,找出差異并解釋這些差異存在的具體原因,進而為以后的教學提供改進建議。
基于普通高中數(shù)學學業(yè)水平考試的教學質量評價目的就是為數(shù)學教學提供建議,進而促進數(shù)學教育質量的提高。評價首先應揭示有什么好的經(jīng)驗、存在什么問題,基于問題才能探索解決問題的策略,進而為教育教學工作者提供有效的建議。
(1)對教育行政管理部門的建議
教育行政管理部門非常關注當前的普通高中數(shù)學教育質量,因此在建議部分首先應該簡要陳述普通高中數(shù)學學業(yè)水平考試反映出來的數(shù)學教育質量的整體情況。要說明當前現(xiàn)狀是否達到了預期目標,是否符合課程標準的要求,明確指出哪些方面已經(jīng)較好,哪些方面存在不足。其次,對不同地市、等第的考生群體表現(xiàn)出來的知識、能力和素養(yǎng)上的差異,要解釋這些差異產(chǎn)生的原因,并提供消除差異的具體建議,促進教育公平。
(2)對教師教學的建議
對教師教學的建議建立在上述一應分析的基礎上,是普通高中數(shù)學學業(yè)水平考試教學質量評價最后也是最重要的環(huán)節(jié)。對教師教學的建議要在充分把握學生整體狀況的基礎上,通過評價專家組的所有專家進行深度思考、深入討論和嚴謹論證后才能給出。對教師教學的建議要明確指出未來的教學應該發(fā)揚什么、避免什么和應該如何改進,從而助力教師更有效地教學,促進先進教育理念的落實,提高數(shù)學教育質量。
對考試數(shù)據(jù)的分析和評價能積累有用的經(jīng)驗并揭示當前突出存在的問題,有助于教育決策者進行正確決策和教師改進教學。在新課標實施背景下,基于普通高中學業(yè)水平考試的教學質量評價要遵循提高教學質量、促進教育公平和提供有效反饋的原則。評價的主要框架包括總體分析、試卷結構分析、典型試題分析和教育教學建議四個部分。其中總體分析包括對試卷的信度、效度和難度等統(tǒng)計指標的分析、對學生總體水平的分析和對學生整體優(yōu)勢與不足的分析;試卷結構分析主要是題型結構、知識結構和素養(yǎng)結構與學生表現(xiàn)情況的關聯(lián)分析;典型試題分析是對反映學生重要概念理解水平、反映學生數(shù)學技能掌握水平和反映學生分析、解決數(shù)學問題水平的試題數(shù)據(jù)的評價;教育教學建議包括對教育行政管理部門的建議和對教師教學的建議?;谄胀ǜ咧袑W業(yè)水平考試的教學質量評價有助于提高教育質量,促進教育公平。