陳 蓓 喻 平
(1.江蘇第二師范學院 210013;2.南京師范大學 210013)
核心素養(yǎng)的發(fā)展是當前教育研究的熱點問題,2014年3月,教育部印發(fā)《關于全面深化課程改革,落實立德樹人根本任務的意見》,正式提出建立核心素養(yǎng)體系[1];2016年9月,《中國學生發(fā)展核心素養(yǎng)》正式發(fā)布,提出核心素養(yǎng)的關鍵詞:必備品格和關鍵能力[2].基于核心素養(yǎng)與課程教學的緊密聯(lián)系,立足于學科本質的學科核心素養(yǎng)研究引起廣泛關注.2018年1月,《普通高中數(shù)學課程標準(2017版)》(以下簡稱“課標”)提出數(shù)學學科核心素養(yǎng)包括:數(shù)學抽象、邏輯推理、數(shù)學建模、直觀想象、數(shù)學運算和數(shù)據(jù)分析[3].
目前國內外相關研究主要集中在數(shù)學核心素養(yǎng)的內涵、構成要素、影響因素、評價和發(fā)展策略等.那么,如何測評高中生的數(shù)學核心素養(yǎng)?不同類型高中生數(shù)學核心素養(yǎng)是否存在差異?如何評價高中生數(shù)學核心素養(yǎng)的水平?一系列問題,引發(fā)了思考.本研究使用數(shù)學核心素養(yǎng)測試卷,對高中生數(shù)學核心素養(yǎng)進行調查研究,以期拓展數(shù)學核心素養(yǎng)評價的思路.
許多國家(地區(qū))都將“問題解決”作為數(shù)學素養(yǎng)評價的核心要素之一,強調數(shù)學在現(xiàn)實生活中的應用.各國(地區(qū))對數(shù)學素養(yǎng)評價基本要素的分類,主要有以下兩種類型:一是學科素養(yǎng)要素,指數(shù)學知識、技能、思想、經(jīng)驗以及情感、態(tài)度、價值觀的綜合體現(xiàn).例如:與數(shù)與代數(shù)知識相關的數(shù)字計算[4]、數(shù)學符號[5]、測量估算[6]等素養(yǎng).二是一般意義上的素養(yǎng)要素,指學習者在系統(tǒng)的學習中,逐步形成的相對穩(wěn)定的思考問題、解決問題的思維方法和價值觀[7].例如:工具使用[8],信息交流[9],邏輯推理、創(chuàng)造、協(xié)調、溝通能力[10]等素養(yǎng).
PISA(The Programme International Student Assessment)是由OECD(經(jīng)濟合作與發(fā)展組織)統(tǒng)籌的國際學生評價項目,主要以15歲中學生為對象,測評學生現(xiàn)實生活和終身學習所必需的知識、技能等基本要素[11].PISA的測試領域為閱讀、數(shù)學、科學等,PISA測試的主項為數(shù)學素養(yǎng),測評內容包括:交流、數(shù)學化、表征、推理和論證、設計問題解決策略,使用符號、公式、專業(yè)語言,使用數(shù)學工具[12].TIMSS(Trends in International Mathematics and Science Study)是國際教育成就評價協(xié)會(IEA)組織的國際教育評價活動,目標對象主要是4年級和8年級學生[13].在TIMSS測試項目中,數(shù)學素養(yǎng)評價指標包括:數(shù)學知識技能、數(shù)學行為與社會技能、數(shù)學教學目標[14].
在建構數(shù)學核心素養(yǎng)評價指標時,將課標(2017版)中的6個素養(yǎng)(數(shù)學抽象、邏輯推理、數(shù)學建模、數(shù)學運算、直觀想象、數(shù)據(jù)分析)作為高中生數(shù)學核心素養(yǎng)評價的一級指標.一是因為該研究面向國內高中生,需要適合我國國情;二是因為數(shù)學核心素養(yǎng)的評價應與課標導向相輔相成.當然,數(shù)學核心素養(yǎng)評價的一級指標是一個有機整體,它們既相互獨立、又交叉融合.
在課標(2017版)中,將數(shù)學核心素養(yǎng)劃分為水平一(高中結業(yè))、水平二(高考)、水平三(高校自主招生),對每個數(shù)學核心素養(yǎng)水平的闡述,都涉及情境與問題、知識與技能、思維與表達、交流與反思四個方面.喻平以學科核心素養(yǎng)生成的本源是知識為邏輯起點,提出學科核心素養(yǎng)水平劃分為知識理解、知識遷移、知識創(chuàng)新三級水平(三個階段)[15].
諸學者對數(shù)學核心素養(yǎng)水平的劃分,主要基于兩點:其一,立足于學生數(shù)學學習的特點;其二,立足于數(shù)學核心素養(yǎng)發(fā)展的階段特征.因此,在本研究中,嘗試著將高中生數(shù)學核心素養(yǎng)分成三個水平:知識技能水平、問題解決水平、綜合發(fā)展水平.從水平一到水平三逐步升高,并且高水平蘊含了低水平.在這個劃分中,考慮以下因素:(1)學生的年齡特點和數(shù)學學習認知水平;(2)數(shù)學核心素養(yǎng)是一個集合概念,既包括知識、技能,又包含思想方法、活動經(jīng)驗等;(3)數(shù)學課程的教學內容、目標以及教學要求等.
水平一知識技能水平:指知識技能再現(xiàn)的數(shù)學核心素養(yǎng),包括對知識本質及其相關知識的理解、基本技能的形成與發(fā)展,即使用相應的知識、技能來解決單一性問題.
水平二問題解決水平:指問題解決的數(shù)學核心素養(yǎng),包括通過建立不同概念、定理、公理、推論、性質、方法、思想之間的聯(lián)系,來解決應用性問題.
水平三綜合發(fā)展水平:指綜合發(fā)展的數(shù)學核心素養(yǎng),包括建立現(xiàn)實問題和數(shù)學問題之間的聯(lián)系,運用論證、推理等方法,有創(chuàng)造性地解決綜合性問題.
首先初步建立數(shù)學核心素養(yǎng)評價框架,選擇評價內容主題,編制評價問卷;進行預研究施測,并對調查結果進行信度和效度的檢驗;根據(jù)預研究情況,修改完善正式測試問卷的試題分布、評分標準等,再進行高中生數(shù)學核心素養(yǎng)的正式測評.
研究采用分層整群抽樣的方法,在高一至高三年級學生中選擇被試樣本:首先,選取不同地區(qū)的4個城市;然后,在每個城市中選取不同層次的2所學校;最后,在每個樣本學校中,選取高一至高三學生(見表1)參加數(shù)學核心素養(yǎng)測試.
表1 數(shù)學核心素養(yǎng)測試樣本學生基本情況一覽表
綜上,8所學校共計1146名高中生參與調查,最終收回數(shù)學核心素養(yǎng)測試問卷1146份,有效樣表1141份,量表回收有效率為99.6%.在參加正式測試的學生中,男女比例基本相當(男生563人、女生468人),不同年級學生比例也基本相當.
(1)測試問卷
數(shù)學核心素養(yǎng)評價測試問卷的大部分試題選自國內外已有研究,包括:PISA公布的測試樣題、臺灣林福來教授研究團隊公布的數(shù)學素養(yǎng)評量樣本試題、數(shù)學素養(yǎng)評價博碩論文中使用的試題等.這部分測試題由一批優(yōu)秀的數(shù)學教育研究工作者集體研發(fā),不僅經(jīng)過實證研究的檢驗,而且適用于大范圍素養(yǎng)評價的測試.
高中生數(shù)學核心素養(yǎng)的正式測試安排在高中各個年級的下半學期,各個學校按照統(tǒng)一的測試要求和規(guī)范進行測試,時間45分鐘左右.《數(shù)學核心素養(yǎng)測試問卷》共三套試卷(高一~高三卷),每套試卷包括6個內容主題,有與6個任務情境相關的18道題,主要包括5個維度:數(shù)學內容、評價指標、水平、情境、問題類型維度.
(2)問卷評定
數(shù)學核心素養(yǎng)問卷的評價結果主要包括三類:一是該題的解答是否達到了預期的水平等級;二是對題目的解答情況給予評分;三是對題目的完成度,進行代碼評定.問卷經(jīng)過預測后,根據(jù)實證研究結果,對問題的考查目標、水平分級等情況進行了調整.
(3)成績等級細分
根據(jù)測試問卷,可以計算出每一位學生的數(shù)學核心素養(yǎng)原始成績.可以看出,這些原始成績普遍偏小,相互之間較為接近,不利于大樣本學生之間的分析.因此,為了增加區(qū)分度,將原始成績轉化為標準分,并不改變原始成績的分布形態(tài).[16]標準分的換算,選用大學入學考試和畢業(yè)考試學業(yè)能力傾向測驗中常用的標準分數(shù)——CEEB分數(shù).
其次,根據(jù)CEEB分數(shù)=100Z+500,可以求得,某學生的數(shù)學核心素養(yǎng)水平CEEB標準分是520分.在研究中,根據(jù)學生的分值情況,采取等級細分法,將其細分為0-6七個等級,來判斷學生核心素養(yǎng)的等級分布情況(見表2).
表2 等級細分表
(1)信度檢驗
對《數(shù)學核心素養(yǎng)測試問卷》進行信度檢驗,檢驗結果表明,高一卷各指標內部一致性系數(shù)在0.739~0.801之間,總問卷內部一致性系數(shù)為0.814;高二卷各指標內部一致性系數(shù)在0.721~0.818之間,總問卷內部一致性系數(shù)為0.811;高三卷各指標內部一致性系數(shù)在0.738~0.822之間,總問卷內部一致性系數(shù)為0.818.總體而言,調查問卷能夠達到預期的評價目的.
(2)效度檢驗
為了保證問卷的內容效度,問卷編制選用了較為完善的素養(yǎng)測試題,并進行了預測試,根據(jù)預測情況完善問卷;同時,邀請專家對問卷進行審核和調整,確保能夠較好地測試高中生數(shù)學核心素養(yǎng)水平.在問卷的結構效度方面,對問卷進行了相關分析,結果顯示,6個指標之間既有相對獨立性,又能對整個問卷做出較大貢獻.以高二卷數(shù)據(jù)為例,各個評價指標,相關系數(shù)在0.086~0.410之間;6個評價指標與總問卷之間的相關在0.390~0.746之間,為中等程度正相關,表明各評價指標與問卷總體評價一致.
高中生數(shù)學核心素養(yǎng)成績總體呈正態(tài)分布,并集中在等級(3~4等級),不同年級男女生在數(shù)學核心素養(yǎng)上具有不同的特點.
(1)高一學生數(shù)學核心素養(yǎng)成績在總體上呈比較合理的正態(tài)分布,絕大部分高一學生能夠達到等級3和4,極少數(shù)學生處于低等級0、高等級6;并且,在等級1-3范圍的女生數(shù)高于男生數(shù),等級4~5范圍的男生數(shù)高于女生數(shù),在等級0、等級6上男女生數(shù)相當(詳見表3).
表3 高一學生數(shù)學核心素養(yǎng)等級分布情況一覽表
(2)高二學生數(shù)學核心素養(yǎng)成績在總體上也呈比較合理的正態(tài)分布,絕大部分高二學生能夠達到等級3和4,極少數(shù)學生處于低等級0、高等級6;并且,在等級4-5范圍的女生數(shù)高于男生數(shù),等級3上男生數(shù)高于女生數(shù);其他等級上,男女生數(shù)相當(詳見表4).
表4 高二學生數(shù)學核心素養(yǎng)等級分布情況一覽表
(3)高三學生數(shù)學核心素養(yǎng)成績在總體上同樣呈比較合理的正態(tài)分布,絕大部分高三學生能夠達到等級3,極少數(shù)學生處于低等級0、高等級6;并且,在等級1-2范圍的女生數(shù)高于男生數(shù),等級4-5范圍的男生數(shù)高于女生數(shù);其他等級上,男女生數(shù)相當(詳見表5).
表5 高三學生數(shù)學核心素養(yǎng)等級分布情況一覽表
高中生數(shù)學核心素養(yǎng)成績在不同教學內容(數(shù)與代數(shù)、圖形與幾何、概率與統(tǒng)計)上的表現(xiàn)基本一致(詳見表6).高一學生在統(tǒng)計與概率問題的處理上,所表現(xiàn)出的數(shù)學核心素養(yǎng)略高一些;高二學生在數(shù)與代數(shù)、圖形與幾何數(shù)學內容上表現(xiàn)較好,高三學生在統(tǒng)計與概率、數(shù)與代數(shù)內容上表現(xiàn)較好.
表6 高中生數(shù)學核心素養(yǎng)在不同教學內容維度的得分情況
高中生數(shù)學核心素養(yǎng)在各個評價指標(數(shù)學抽象、邏輯推理、數(shù)學建模、數(shù)學運算、直觀想象、數(shù)據(jù)分析)上成績相當.
(1)高一學生數(shù)學核心素養(yǎng)在邏輯推理指標上的表現(xiàn)最佳,在數(shù)學抽象、直觀想象評價指標上表現(xiàn)較好,在邏輯推理指標上的表現(xiàn)較為均衡.
(2)高二學生數(shù)學核心素養(yǎng)的最高分出現(xiàn)在數(shù)學運算評價指標,最低分出現(xiàn)在數(shù)學抽象評價指標;學生在直觀想象、數(shù)據(jù)分析評價指標上表現(xiàn)較好.
(3)高三學生在各個指標上的數(shù)學核心素養(yǎng)均值、標準差均相當,數(shù)據(jù)趨近正態(tài)分布,最高分出現(xiàn)在數(shù)據(jù)分析評價指標,最低分出現(xiàn)在數(shù)學抽象評價指標.
根據(jù)問卷測試過程中學生的表現(xiàn)和試題編碼,進行高中生數(shù)學核心素養(yǎng)的水平判定.研究結果顯示,高中生的數(shù)學核心素養(yǎng)以水平一、水平二居多,更多的高三學生具有水平三的數(shù)學核心素養(yǎng).
(1)超過70%的高一學生具備水平一(知識技能水平)數(shù)學核心素養(yǎng),部分高一學生在某些數(shù)學核心素養(yǎng)評價指標上具備水平二(問題解決水平)數(shù)學核心素養(yǎng),僅有少數(shù)高一學生能夠達到水平三(綜合發(fā)展水平).
(2)高二學生數(shù)學核心素養(yǎng)水平比高一學生略有提升,在數(shù)學抽象、邏輯推理、直觀想象、數(shù)據(jù)分析4個指標上具有較高水平的表現(xiàn);在數(shù)學建模、數(shù)學運算2個指標上,有近30%的高二學生達到了水平二;少數(shù)學生能夠達到水平三.
(3)處于水平二層次的高三學生有所遞增,超過80%的學生在數(shù)學抽象指標上達到水平二,50%左右的學生在邏輯推理、數(shù)學運算、直觀想象指標上達到水平二;20%左右的學生在數(shù)學建模、數(shù)據(jù)分析指標上達到水平二;近30%的高三學生達到數(shù)學核心素養(yǎng)水平三.
調查數(shù)據(jù)表明,不同類型的問題情境試題有利于呈現(xiàn)學生核心素養(yǎng),但其不是影響學生核心素養(yǎng)的主要因素.高一學生在不同情境類型(個人情境、教育與職業(yè)情境、科學情境)題目上所表現(xiàn)出的數(shù)學核心素養(yǎng)基本相當,最高分出現(xiàn)在個人情境類數(shù)學測試題,最低分出現(xiàn)在科學情境類數(shù)學測試題.高二學生在不同情境類型(個人情境、教育與職業(yè)情境、公共情境)題目上所表現(xiàn)出的數(shù)學核心素養(yǎng)均值基本相近,最高分出現(xiàn)在個人情境類數(shù)學測試題,最低分出現(xiàn)在教育與職業(yè)情境類數(shù)學測試題.高三學生在不同情境類型(個人情境、公共情境、科學情境)題目上所表現(xiàn)出的數(shù)學核心素養(yǎng)均值相接近,最高分、最低分均出現(xiàn)在公共情境類數(shù)學測試題中,整體數(shù)據(jù)趨近正態(tài)分布.
調查數(shù)據(jù)表明,用不同問題類型來考查學生核心素養(yǎng),學生在開放型試題上呈現(xiàn)出較好的數(shù)學核心素養(yǎng),但題型對高中生數(shù)學核心素養(yǎng)并無顯著影響.高一學生在不同題型上所表現(xiàn)出的數(shù)學核心素養(yǎng)均值相近,最高分出現(xiàn)在開放型建構題、最低分出現(xiàn)在填空題,在選擇題上學生的數(shù)學核心素養(yǎng)分值更加趨近正態(tài)分析.高二學生在不同題型上所表現(xiàn)出的數(shù)學核心素養(yǎng)均值相近,最高分、最低分均出現(xiàn)在解答題上,在填空題上學生的數(shù)學核心素養(yǎng)分值更加趨近正態(tài)分析.高三學生在不同題型上所表現(xiàn)出的數(shù)學核心素養(yǎng)均值接近,最高分出現(xiàn)在開放型建構題、最低分出現(xiàn)在填空題上,在各類題型上學生的數(shù)學核心素養(yǎng)分值都趨近正態(tài)分析.
(1)高中生數(shù)學核心素養(yǎng)總體處于中等等級
從高中生數(shù)學核心素養(yǎng)的成績來看,大部分學生能夠達到等級3和4;在7個等級的分類中,低等級和高等級的高中生均占少數(shù).高中生數(shù)學核心素養(yǎng)處于中等等級,在低等級占比上,女生略高于男生.并且,高中生數(shù)學核心素養(yǎng)等級隨著年級的增長而逐步提升.
(2)高中生數(shù)學核心素養(yǎng)在不同教學內容維度上表現(xiàn)均衡
從不同教學內容來看,高中生數(shù)學核心素養(yǎng)在不同數(shù)學教學內容維度上表現(xiàn)均衡;并且,學生在數(shù)與代數(shù)問題上,表現(xiàn)出較好的數(shù)學核心素養(yǎng).
(3)高中生數(shù)學核心素養(yǎng)在不同評價指標上的表現(xiàn)相當
從不同評價指標來看,高中生數(shù)學核心素養(yǎng)基本相當;并且,高中生的邏輯推理、數(shù)學抽象、直觀想象、數(shù)據(jù)分析素養(yǎng)較好.
(4)高中生數(shù)學核心素養(yǎng)總體表現(xiàn)為問題解決水平
從不同發(fā)展水平來看,高中生數(shù)學核心素養(yǎng)水平以問題解決為主.高三學生在問題解決水平的學生數(shù)明顯增多,有部分學生能夠在不同數(shù)學核心素養(yǎng)指標上達到綜合發(fā)展水平.
(5)高中生數(shù)學核心素養(yǎng)在情境類問題上表現(xiàn)更佳
從不同問題情境來看,三個年級的高中生數(shù)學核心素養(yǎng),在不同問題情境上的表現(xiàn)基本類似,但學生在科學情境、教育與職業(yè)情境、公共情境相關的題目中,表現(xiàn)出更好的數(shù)學核心素養(yǎng).
(6)高中生數(shù)學核心素養(yǎng)適合用開放型建構題評價
從不同問題題型來看,高中生數(shù)學核心素養(yǎng),在不同問題類型上的表現(xiàn)基本相近;學生數(shù)學核心素養(yǎng)在開放型建構題、解答題上表現(xiàn)較好.由于開放型試題答案不唯一,并且有不同發(fā)展水平的梯度;因此,學生在解題的過程中,更能夠充分呈現(xiàn)其數(shù)學核心素養(yǎng).
高中生數(shù)學核心素養(yǎng)評價結果顯示,40%左右的學生處于問題解決水平,介于等級3和4之間(6個等級),因此,學生分階段數(shù)學核心素養(yǎng)水平的發(fā)展,是數(shù)學核心素養(yǎng)評價的目的所在.就社會發(fā)展而言,學生素養(yǎng)水平的發(fā)展,與教育的基本理念與總體目標相一致,反映了數(shù)學核心素養(yǎng)的價值;就學校教育而言,學生素養(yǎng)水平的發(fā)展,是學?!芭囵B(yǎng)什么樣的人”的評價依據(jù);就學生成長而言,學生素養(yǎng)水平的發(fā)展,是其終身學習與未來發(fā)展的堅實基礎.學生素養(yǎng)水平的發(fā)展需要小學、中學、大學不同學習階段的持續(xù)配合與跟蹤評價.
高中生數(shù)學核心素養(yǎng)評價研究數(shù)據(jù)表明,數(shù)學核心素養(yǎng)在不同教學內容、不同評價指標上表現(xiàn)相近,說明三者是互為一體、互為補充的關系.因此,數(shù)學核心素養(yǎng)評價指標尚需從以下幾個方面加以論證:(1)從數(shù)學學科的內在本質與發(fā)展價值,來探討數(shù)學核心素養(yǎng)評價指標是否涵蓋了數(shù)學基本內容;(2)從學生感悟、體驗與反思知識的角度出發(fā),來分析數(shù)學核心素養(yǎng)評價指標是否反映了學生分析問題、解決問題的過程;(3)從數(shù)學課程標準出發(fā),來判斷數(shù)學核心素養(yǎng)評價指標是否能實現(xiàn)“以人為本”的評價導向;(4)從數(shù)學核心素養(yǎng)發(fā)展水平出發(fā),來觀測數(shù)學核心素養(yǎng)評價指標是否符合學生素養(yǎng)實際狀況.
建議國家有關部門加大針對中小學生核心素養(yǎng)評價的專項研究、統(tǒng)一學業(yè)測試.從對高中生數(shù)據(jù)調研的結果來看,學生在與情境相關的各類題目上、在開放型建構題的題型上,能夠較好地表現(xiàn)出自己的數(shù)學核心素養(yǎng).所以,建議盡量選用與真實情境相關的試題,來考察學生的數(shù)學核心素養(yǎng).對數(shù)學核心素養(yǎng)的評價應從相對評價逐漸過渡到絕對評價,即采用等級或水平制,每個不同的分數(shù)等級或水平表示目標的達成度.