吳佳敏 林子植 石天然
摘? ?要:在新高考和新課標(biāo)的背景下,高考試題是衡量教育改革的重要性指標(biāo)。采用SEC一致性模型,構(gòu)建內(nèi)容主題和學(xué)業(yè)質(zhì)量水平的分析框架,從學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的內(nèi)容主題、表現(xiàn)水平和核心素養(yǎng)三個(gè)維度對(duì)首批新高考改革試點(diǎn)上海和浙江的14套高考數(shù)學(xué)卷進(jìn)行研究?;谘芯拷Y(jié)果,對(duì)提升試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的契合程度給出建議:量化學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),使教評(píng)有章可循;調(diào)整內(nèi)容主題比例,實(shí)現(xiàn)評(píng)標(biāo)一體化;把控認(rèn)知表現(xiàn)水平,完善學(xué)業(yè)評(píng)價(jià)體系;均衡核心素養(yǎng)分布,令命題合理科學(xué);研制本土一致性評(píng)價(jià)工具,貼合我國(guó)國(guó)情。
關(guān)鍵詞:新高考;新課標(biāo);學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn);高考數(shù)學(xué)卷;一致性
在新高考和新課標(biāo)的背景下,高考試題作為衡量教育改革的重要指標(biāo)。上海、浙江是最早開(kāi)始進(jìn)行高考綜合改革的試點(diǎn)省市,研究?jī)蓚€(gè)城市高考數(shù)學(xué)卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性,對(duì)其改革成果進(jìn)行檢驗(yàn)反饋與經(jīng)驗(yàn)總結(jié),能夠?yàn)楹罄m(xù)推進(jìn)高考綜合改革提供一定的參考依據(jù)。鑒于此,本文以2017—2023年上海和浙江兩地高考數(shù)學(xué)試卷為研究樣本,分析基于新高考數(shù)學(xué)評(píng)價(jià)機(jī)制和數(shù)學(xué)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的適切性,以期為高考數(shù)學(xué)命題者提供相關(guān)數(shù)據(jù)和為教師教學(xué)提供一定參考。
一、研究設(shè)計(jì)
1.研究對(duì)象
選取《普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2017年版2020年修訂)》(以下簡(jiǎn)稱(chēng)《標(biāo)準(zhǔn)》)中的“學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)”和上海、浙江14套新高考數(shù)學(xué)試卷作為研究對(duì)象,分別為2017—2023年上海高考數(shù)學(xué)試卷(以下簡(jiǎn)稱(chēng)“上海卷”)7套和2017—2023年浙江高考數(shù)學(xué)試卷(以下簡(jiǎn)稱(chēng)“浙江卷”)7套。
2.研究工具
美國(guó)學(xué)者諾曼·韋伯(Norman Webb)研發(fā)了評(píng)價(jià)與課程標(biāo)準(zhǔn)的一致性研究工具,他認(rèn)為一致性指的是事物之間相匹配的程度。1 在此基礎(chǔ)上,美國(guó)學(xué)者安德魯·波特(Andrew Porter)等人構(gòu)建了SEC一致性分析模式,該模式通過(guò)引入一致性指數(shù)來(lái)衡量評(píng)價(jià)項(xiàng)目和課程標(biāo)準(zhǔn)的一致性。2 該工具通過(guò)簡(jiǎn)單明了的方式展示評(píng)價(jià)結(jié)果,并借助MATLAB軟件中的函數(shù)運(yùn)算得到具體的一致性指數(shù)和臨界值。SEC一致性分析模式因其科學(xué)性和廣泛性受到研究者的廣泛認(rèn)可。3 故本研究采取SEC一致性分析模式,其中主要涉及四個(gè)關(guān)鍵步驟:構(gòu)建二維矩陣、編碼和統(tǒng)計(jì)、標(biāo)準(zhǔn)化和計(jì)算一致性系數(shù),以評(píng)估高考數(shù)學(xué)卷和認(rèn)知水平之間的一致性程度,模型如下:
[P=1-i=1mj=1nXij-Yij2]
在該模型中,一致性系數(shù)P表示評(píng)價(jià)項(xiàng)目和課程標(biāo)準(zhǔn)之間的一致性程度。其中,m代表二維矩陣的行數(shù),n代表二維矩陣的列數(shù)。[Xij]、[Yij]分別為《標(biāo)準(zhǔn)》中的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)試卷對(duì)應(yīng)的第[i]行、第[j]列的具體數(shù)值;P介于[0,1]之間,P與1越接近,意味一致性程度越高,反之亦然。
3.研究過(guò)程
(1)編碼框架確定
高中數(shù)學(xué)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)是以學(xué)科核心素養(yǎng)和表現(xiàn)水平為主要維度,結(jié)合課程內(nèi)容來(lái)描述學(xué)生學(xué)業(yè)成就的表現(xiàn)4 ,為了更好地展示學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)評(píng)價(jià)框架體系,根據(jù)《標(biāo)準(zhǔn)》中對(duì)此模塊的具體描述,以此繪制其框架圖(見(jiàn)圖1)。5 由圖1可知,知識(shí)點(diǎn)內(nèi)容和試題涵蓋核心素養(yǎng)的四個(gè)方面:情境與問(wèn)題、知識(shí)與技能、思維與表達(dá)和交流與反思。在此基礎(chǔ)上,將課程內(nèi)容和數(shù)學(xué)核心素養(yǎng)及其表現(xiàn)水平作為主要維度,構(gòu)建二維矩陣模式:
內(nèi)容主題×學(xué)業(yè)質(zhì)量水平(核心素養(yǎng)表現(xiàn)水平和核心素養(yǎng)類(lèi)型)
在SEC一致性模型的二維矩陣中,“內(nèi)容主題”對(duì)應(yīng)評(píng)價(jià)框架中的課程內(nèi)容,而核心素養(yǎng)及其表現(xiàn)水平合稱(chēng)為“學(xué)業(yè)質(zhì)量水平”,對(duì)應(yīng)二維矩陣中的“認(rèn)知水平”。
①內(nèi)容主題
根據(jù)《標(biāo)準(zhǔn)》,高中數(shù)學(xué)課程分為必修、選擇性必修和選修三個(gè)部分。為了研究方便,選取必修和選擇性必修兩個(gè)板塊進(jìn)行研究。高中數(shù)學(xué)課程涵蓋預(yù)備知識(shí)、函數(shù)、幾何與代數(shù)、概率與統(tǒng)計(jì)、數(shù)學(xué)建模與探究這五個(gè)主題。其中,預(yù)備知識(shí)、函數(shù)、幾何與代數(shù)、概率與統(tǒng)計(jì)是高考主要考查的內(nèi)容,因此我們將內(nèi)容主題劃分為這四個(gè)維度。
②學(xué)業(yè)質(zhì)量水平
根據(jù)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),將學(xué)業(yè)質(zhì)量劃分為表現(xiàn)水平和核心素養(yǎng)兩個(gè)維度。其中,表現(xiàn)水平分為3個(gè)級(jí)別,核心素養(yǎng)涵蓋了6個(gè)方面,具體參考《標(biāo)準(zhǔn)》的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)對(duì)于核心素養(yǎng)三水平六方面的細(xì)化描述。
基于核心素養(yǎng)及其表現(xiàn)水平,將上述內(nèi)容主題和學(xué)業(yè)質(zhì)量水平進(jìn)行結(jié)合,確定一致性分析框架。
(2)信效度分析
在進(jìn)行內(nèi)容編碼和試卷編碼前,首先對(duì)4位具有高中數(shù)學(xué)教學(xué)經(jīng)驗(yàn)的研究者培訓(xùn)(其中兩位是高中數(shù)學(xué)組骨干教師,另兩位分別取得碩士和博士學(xué)位),明確相關(guān)編碼準(zhǔn)則和步驟。然后由他們對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷進(jìn)行編碼,逐個(gè)判斷其內(nèi)容主題、表現(xiàn)水平和核心素養(yǎng)。每位編碼者獨(dú)立編碼,對(duì)存在分歧的部分進(jìn)行討論與協(xié)商,并向權(quán)威專(zhuān)家咨詢,最終確定編碼結(jié)果,以此保證編碼的客觀性和準(zhǔn)確性。據(jù)學(xué)者安德魯·波特等人研究表明,當(dāng)4位以上內(nèi)容專(zhuān)家進(jìn)行編碼時(shí),其所得結(jié)果的一致性信度達(dá)到了可接受的水平1 ,并借助SPSS對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷進(jìn)行信度分析,得到一致性系數(shù)分別為0.842和0.796,信度較高。
(3)對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷編碼
①對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)編碼
對(duì)內(nèi)容主題進(jìn)行編碼的過(guò)程如下:首先,將4個(gè)內(nèi)容主題分別編碼為1、2、3、4,分別代表預(yù)備知識(shí)、函數(shù)、幾何與代數(shù)、概率與統(tǒng)計(jì)。然后,對(duì)每個(gè)內(nèi)容主題下的二級(jí)主題進(jìn)行編碼。最后,對(duì)二級(jí)主題下的每個(gè)子目標(biāo)逐條進(jìn)行編碼。
學(xué)業(yè)質(zhì)量水平編碼過(guò)程如下:將6個(gè)核心素養(yǎng)編碼為A、R、M、I、O和D,分別代表數(shù)學(xué)抽象、邏輯推理、數(shù)學(xué)建模、直觀想象、數(shù)學(xué)運(yùn)算和數(shù)據(jù)分析。對(duì)每個(gè)核心素養(yǎng)下的3個(gè)水平進(jìn)行編碼,以數(shù)據(jù)分析為例,編碼為D.1、D.2和D.3。對(duì)于含有多個(gè)知識(shí)點(diǎn)的三級(jí)主題進(jìn)行拆分編碼;對(duì)于含有不同認(rèn)知水平的三級(jí)主題拆分編碼,并采取平均分配原則。
通過(guò)上述內(nèi)容主題和學(xué)業(yè)質(zhì)量水平的編碼方法對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)進(jìn)行編碼,共得到268條編碼內(nèi)容,便于后續(xù)計(jì)算和化簡(jiǎn)進(jìn)行標(biāo)準(zhǔn)化處理,得到學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的比率表(見(jiàn)表1)。
②對(duì)高考數(shù)學(xué)卷編碼
對(duì)上海卷和浙江卷進(jìn)行編碼的過(guò)程如下:首先,分析每道試題考查的知識(shí)點(diǎn),并與《標(biāo)準(zhǔn)》相對(duì)應(yīng)。然后,具體分析每題所涉及的表現(xiàn)水平,并確定相應(yīng)的數(shù)學(xué)核心素養(yǎng)。根據(jù)參考答案判斷每道題在內(nèi)容主題、表現(xiàn)水平和核心素養(yǎng)下的分值,如果一道題涉及多個(gè)知識(shí)點(diǎn)、表現(xiàn)水平和核心素養(yǎng),按照參考答案所占的分值進(jìn)行折算。進(jìn)而統(tǒng)計(jì)計(jì)算總分,并將其折合為總和為1的比率表。以2017年上海卷的編碼結(jié)果為例(見(jiàn)表2),其余樣本試卷均按照相同的方法進(jìn)行標(biāo)準(zhǔn)化處理。
二、研究結(jié)果與分析
1.一致性系數(shù)
(1)一致性系數(shù)參考值[P0]
在對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷的二維矩陣進(jìn)行標(biāo)準(zhǔn)化處理后,需要確定一致性系數(shù)P的臨界值[P0]。當(dāng)P達(dá)到臨界值[P0]時(shí),表示達(dá)到統(tǒng)計(jì)學(xué)意義上的顯著一致性。通過(guò)MATLAB軟件計(jì)算[P0]值,借鑒了美國(guó)學(xué)者加文·富爾默(Gavin W. Fulmer)關(guān)于一致性的研究思路1,將學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的知識(shí)點(diǎn)內(nèi)容要求總數(shù)和高考數(shù)學(xué)卷的總分進(jìn)行隨機(jī)賦值,形成所需的二維矩陣,重復(fù)2萬(wàn)次后得到2萬(wàn)個(gè)隨機(jī)矩陣,在對(duì)隨機(jī)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,得到14套數(shù)學(xué)卷的一致性系數(shù)參考值[P0]。
(2)高考數(shù)學(xué)卷和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性系數(shù)P
將學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷得到的編碼數(shù)據(jù)統(tǒng)計(jì)表的數(shù)值代入Porter指數(shù)一致性公式, 通過(guò)MATLAB軟件計(jì)算,得出了14套卷子的一致性系數(shù)P,并獲得了一致性系數(shù)參考值[P0](見(jiàn)表3)。
2.結(jié)果分析
(1)高考數(shù)學(xué)卷和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的總體一致性分析
2017—2023年浙江省和上海市共14套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性系數(shù)在0.33—0.45之間浮動(dòng)。其中有兩套高考數(shù)學(xué)卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(上海卷2022、浙江卷2023)的一致性系數(shù)大于參考值,說(shuō)明這兩套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有統(tǒng)計(jì)學(xué)意義上的一致性。其余12套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性均小于參考值,說(shuō)明兩者不具有統(tǒng)計(jì)學(xué)意義上的一致性。其中浙江卷2023一致性最高(0.4485),高出參考值0.0036,說(shuō)明這套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)最符合。浙江卷2020一致性最低(0.3365),低于參考值0.1089,說(shuō)明這份試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)較不符合。
對(duì)比浙江省和上海市的一致性系數(shù)和參考值的差值可以發(fā)現(xiàn),上海高考數(shù)學(xué)卷在參考值周?chē)?dòng),最大差值為0.0817,而浙江省高考數(shù)學(xué)卷的差值較大,最大差值達(dá)到0.1089。從同一省市的不同年份來(lái)看,上海卷前三年與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性符合程度處于波動(dòng)狀態(tài),到2019年波動(dòng)差值達(dá)到最大,后四年逐漸趨于穩(wěn)定,尤其是2022年和2023年,差值明顯減小。浙江卷整體波動(dòng)比較大,前三年與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)一致性系數(shù)均低于參考值,到2020年差值達(dá)到峰值,后兩年有下降趨勢(shì),但仍有大幅波動(dòng),在2023年與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)一致性系數(shù)吻合較好。
(2)高考數(shù)學(xué)卷和內(nèi)容主題一致性分析
通過(guò)對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷編碼數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和梳理,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的四個(gè)內(nèi)容主題安排比重為:預(yù)備知識(shí)(11.9%),概率與統(tǒng)計(jì)(23.9%),幾何與代數(shù)(30.6%),函數(shù)(33.6%)。從整體趨勢(shì)來(lái)看,預(yù)備知識(shí)和概率與統(tǒng)計(jì)的考查均略低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,函數(shù)和幾何與代數(shù)的考查高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,從7套上海卷和7套浙江卷在各個(gè)主題所占比重發(fā)現(xiàn),上海卷在函數(shù)占比稍高,浙江卷在幾何與代數(shù)所占權(quán)重更大。其中上海卷2017、上海卷2019、上海卷2022和浙江卷2018四套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)稍有差異,這可能和當(dāng)年知識(shí)點(diǎn)考查偏重相關(guān)。
在預(yù)備知識(shí)主題上,上海卷2019(11.9%)與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(11.9%)達(dá)到一致性,其余13套數(shù)學(xué)卷均低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求。在函數(shù)主題上,上海卷2022(34.0%)和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(33.6%)基本達(dá)到一致,其余13套數(shù)學(xué)卷均高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求。在幾何與代數(shù)主題上,浙江卷2022(30.3%)和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(30.6%)大體達(dá)到一致,浙江卷2017(29.3%)略低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,上海卷2019(32.7%)略高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求,其余11套試卷均明顯高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),其中上海卷2022(49.3%)最高,超出18.7%。在概率與統(tǒng)計(jì)主題上,14套高考數(shù)學(xué)卷均低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求,其中上海卷2023(18.3%)在14套卷中與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(23.9%)的差異最小,上海卷2017(4.4%)和浙江卷2018(2.6%)與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)差異較大,這可能和新高考改革有關(guān),導(dǎo)致前兩年處于不穩(wěn)定的狀態(tài)。
(3)高考數(shù)學(xué)卷和表現(xiàn)水平一致性分析
通過(guò)對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷編碼數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和梳理,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表現(xiàn)水平在各水平所占比重為:水平2(48.5%)>水平1(34.3%)>水平3(17.2%)。從整體上來(lái)看,上海卷2017和上海卷2023比較符合表現(xiàn)水平分布,在14套高考卷中,上海卷2021分布是水平1(60.6%)>水平3(24.0%)>水平2(15.4%),而其余11套高考數(shù)學(xué)卷分布均是:水平1>水平2>水平3。對(duì)水平1而言,上海卷2017(33.5%)和表現(xiàn)水平(34.3%)一致性程度最高,其余各套卷和表現(xiàn)水平的差值在-0.091—-0.305之間浮動(dòng),其中浙江卷2022、上海卷2021和浙江卷2020與表現(xiàn)水平的差異性較大,差值分別為:-30.5%、-26.3%和-25.8%。從水平2來(lái)看,上海卷2023(47.2%)和表現(xiàn)水平(48.5%)最為切合,其余各套卷與表現(xiàn)水平的差值在0.092—0.331上下波動(dòng),上海卷2021和浙江卷2022與表現(xiàn)水平的差異性較大,差值分別為:33.1%和30.7%。從水平3來(lái)看,14套高考數(shù)學(xué)卷和表現(xiàn)水平的差值在0.086—0.114之間浮動(dòng),在三個(gè)水平間與表現(xiàn)水平的差異最小,其中浙江卷2022(17.4%)與水平3(17.2%)最為一致。浙江卷2017和浙江卷2019相比其余各數(shù)學(xué)卷來(lái)看,差值較大,分別為8.6%和8.5%,可以看出前三年仍是處于不穩(wěn)定的狀態(tài)。從兩個(gè)省份來(lái)看,對(duì)于水平1和水平3的考查,上海卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表現(xiàn)水平更為契合,而對(duì)水平2的考查,浙江卷和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表現(xiàn)水平更為一致。
(4)高考數(shù)學(xué)卷和核心素養(yǎng)一致性分析
通過(guò)對(duì)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)和高考數(shù)學(xué)卷編碼數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和梳理,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)對(duì)數(shù)學(xué)核心素養(yǎng)的要求較為均衡,對(duì)于A(28.1%)要求最高,I(17.9%)、O(17.5%)、M(15.2%)素養(yǎng)的要求占比相差不大,R(11.2%)和D(10.1%)素養(yǎng)要求較低。從整體來(lái)看,上海卷在核心素養(yǎng)的分布大體是:O>R>A>I,其中D和M素養(yǎng)相差不大,考查相對(duì)較低;浙江卷在核心素養(yǎng)的大致分布為:O>R>I>A,對(duì)于D和M素養(yǎng)的考查也相對(duì)較低。從數(shù)學(xué)抽象素養(yǎng)來(lái)看,14套高考數(shù)學(xué)卷均略低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,差值在0.045—0.221浮動(dòng),其中上海卷2021(23.6%)與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(28.1%)最為接近,浙江卷2018(6.0%)、浙江卷2017(6.1%)和浙江卷2021(7.0%)與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的差異性較大。從邏輯推理素養(yǎng)來(lái)看,14套高考數(shù)學(xué)卷均略高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,差值在-0.056—-0.223波動(dòng),浙江卷2020(33.5%)、浙江卷2021(32.6%)和上海卷2019(28.4%)顯著高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求。從數(shù)學(xué)建模素養(yǎng)來(lái)看,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求略高于14套高考數(shù)學(xué)卷,差值在0.08—0.152之間浮動(dòng),其中上海卷2019未考查數(shù)學(xué)建模素養(yǎng),浙江卷2022(1.0%)、上海卷2022(1.1%)、浙江卷2020(1.2%)均考查較低。從直觀想象素養(yǎng)來(lái)看,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求略高于14套高考數(shù)學(xué)卷,差值在0.015—0.099之間浮動(dòng),其中浙江卷2017(16.4%)和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(17.9%)最為接近。從數(shù)學(xué)運(yùn)算素養(yǎng)來(lái)看,14套高考數(shù)學(xué)卷明顯高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,差值在-0.16—-0.357之間,浙江卷2018(53.2%)、浙江卷2019(49.5%)、浙江卷2017(48.9%)與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求的一致性存在一定差距,說(shuō)明浙江省前三年對(duì)于考查何種核心素養(yǎng)為重心也處于探索階段。從數(shù)據(jù)分析素養(yǎng)來(lái)看,浙江卷2023(16.1%)高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)(10.1%),其余13高考數(shù)學(xué)卷均低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求,差值在0.016—0.101之間浮動(dòng),其中浙江卷2017、浙江卷2019和上海卷2021均未考查數(shù)據(jù)分析素養(yǎng)。
三、結(jié)論與建議
1.研究結(jié)論
(1)總體上,14套高考數(shù)學(xué)卷中2套和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有統(tǒng)計(jì)學(xué)意義上的一致性
上海卷2022和浙江卷2023與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有統(tǒng)計(jì)學(xué)意義上的一致性,浙江卷2023與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性最高(0.4485),高出參考值0.0036,說(shuō)明這套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)最符合,進(jìn)一步說(shuō)明了高考數(shù)學(xué)卷和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)之間的一致性程度也在逐年遞升。而浙江卷2020與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性最低(0.3365),低于參考值0.1089,說(shuō)明這份試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)較不符合。從浙江省和上海市的一致性系數(shù)和參考值的差值上可以發(fā)現(xiàn),由于2017年是高考改革第一年,在前三四年兩個(gè)省份高考數(shù)學(xué)卷中其P和[P0]的差值一直處于波動(dòng)狀態(tài),后兩年逐漸趨于穩(wěn)定,和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性也逐漸提高。
(2)在內(nèi)容主題分布上,14套高考數(shù)學(xué)卷中4套與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有差異
在內(nèi)容主題分布上,上海卷2017、上海卷2019、上海卷2022和浙江卷2018四套試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)存在不一致,其余10套高考數(shù)學(xué)卷大體上比重排序依次為預(yù)備知識(shí)、概率與統(tǒng)計(jì)、幾何與代數(shù)和函數(shù);各個(gè)內(nèi)容主題的安排比重是一致的,在預(yù)備知識(shí)和概率與統(tǒng)計(jì)的考查均略低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求,函數(shù)和幾何與代數(shù)高于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的要求。上海卷和浙江卷在各個(gè)主題所占比重上,上海卷在函數(shù)上占比稍高,浙江卷在幾何與代數(shù)上所占權(quán)重更大。在預(yù)備知識(shí)主題上,上海卷2019與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)達(dá)到一致;在函數(shù)主題上,上海卷2022和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)基本達(dá)到一致;在幾何與代數(shù)主題上,浙江卷2022和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)大體達(dá)到一致;在概率與統(tǒng)計(jì)主題上,14套試卷均低于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)要求,上海卷2023與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的差異最小。
(3)在表現(xiàn)水平分配上,14套高考數(shù)學(xué)卷有2套與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)大同小異
高考數(shù)學(xué)卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表現(xiàn)水平上存在一定差異,學(xué)業(yè)質(zhì)量水平從大到小排序是:水平2、水平1和水平3,在14套試卷中只有上海卷2017和上海卷2023符合學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表現(xiàn)水平分布,而上海卷2021從大到小的排序是:水平1、水平3和水平2,剩余的11套試卷在各水平從大到小排序均是:水平1、水平2和水平3。從水平1的考查來(lái)看,上海卷2017和表現(xiàn)水平一致性程度最高;從水平2的考查來(lái)看,上海卷2023和表現(xiàn)水平最為切合;從水平3的考查來(lái)看,浙江卷2022與表現(xiàn)水平的最為一致。
(4)在核心素養(yǎng)考查上,14套高考數(shù)學(xué)卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)有所不同
學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)對(duì)數(shù)學(xué)核心素養(yǎng)的要求較為均衡,從高到低的排序是:A、I、O、M、R和D;上海卷的分布排序(從大到?。┦牵篛、R、A、I、D和M;浙江卷大致分布(從大到小)為:O、R、I、A、D和M??梢园l(fā)現(xiàn),14套高考數(shù)學(xué)卷均注重考查數(shù)學(xué)運(yùn)算,其次才是邏輯推理、直觀想象和數(shù)學(xué)抽象,這和學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有一定的差異,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)強(qiáng)調(diào)數(shù)學(xué)抽象的考查,而將數(shù)學(xué)運(yùn)算放在第3的位置上。
2.研究建議
(1)量化學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),使教評(píng)有章可循
分析發(fā)現(xiàn),只有1/7的試卷和課程標(biāo)準(zhǔn)具有統(tǒng)計(jì)學(xué)意義上的一致性。雖目前學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)根據(jù)內(nèi)容主題細(xì)化成六素養(yǎng)三水平,但對(duì)于具體界定沒(méi)有明確表述,這致使試卷命制者對(duì)試題的把握存在一定困難,導(dǎo)致試卷與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性存在一定偏差。《標(biāo)準(zhǔn)》的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)以核心素養(yǎng)和表現(xiàn)水平為基準(zhǔn),展現(xiàn)學(xué)生學(xué)業(yè)成就的關(guān)鍵特征,應(yīng)當(dāng)具有一定的操作性和科學(xué)性。1
(2)調(diào)整內(nèi)容主題比例,實(shí)現(xiàn)評(píng)標(biāo)一體化
根據(jù)分析結(jié)果可知,4套高考數(shù)學(xué)卷內(nèi)容主題的分布與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)具有一定的差異性。在新高考改革背景下,教育評(píng)價(jià)更應(yīng)貼合課程標(biāo)準(zhǔn)。從2020年開(kāi)始,教育部考試中心不再制定普通高等學(xué)校招生全國(guó)統(tǒng)一考試的大綱。2 所以,要將教育課程改革與高考綜合改革相結(jié)合,實(shí)現(xiàn)教、學(xué)、評(píng)的一致性。3在日常教學(xué)中,要以《標(biāo)準(zhǔn)》作為風(fēng)向標(biāo),不斷研讀學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),調(diào)整各內(nèi)容主題比例,營(yíng)造有利于學(xué)生可持續(xù)發(fā)展和終身學(xué)習(xí)的環(huán)境。
(3)把控認(rèn)知表現(xiàn)水平,完善學(xué)業(yè)評(píng)價(jià)體系
分析發(fā)現(xiàn),12套試卷的表現(xiàn)水平與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)存在一定差異。學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)提供了一個(gè)基于數(shù)學(xué)核心素養(yǎng)的評(píng)價(jià)框架,但仍需在命題路徑、方法、試題結(jié)構(gòu)和評(píng)分細(xì)則等方面進(jìn)行縝密探索,構(gòu)建一個(gè)嚴(yán)謹(jǐn)完備的學(xué)業(yè)評(píng)價(jià)體系,研發(fā)出相關(guān)的教育檢測(cè)工具。4通過(guò)改進(jìn)學(xué)業(yè)評(píng)價(jià)體系,試題命制中適當(dāng)增強(qiáng)認(rèn)知表現(xiàn)水平2的考查,關(guān)注個(gè)體差異性,從而發(fā)展學(xué)生的學(xué)習(xí)能力,為中國(guó)教育現(xiàn)代化培養(yǎng)出創(chuàng)新型人才。5
(4)均衡核心素養(yǎng)分布,令命題合理科學(xué)
14套高考數(shù)學(xué)卷核心素養(yǎng)的考查與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性表現(xiàn)各有差異。高考測(cè)評(píng)中需注重核心素養(yǎng)的均衡分布6,重視數(shù)學(xué)核心素養(yǎng)的評(píng)估和考核,加強(qiáng)學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)與學(xué)業(yè)評(píng)價(jià)的適切度,可以適當(dāng)增強(qiáng)試題中數(shù)學(xué)抽象,以此優(yōu)化評(píng)價(jià)方式,培養(yǎng)學(xué)生在數(shù)學(xué)領(lǐng)域的必備品格和關(guān)鍵能力,讓他們運(yùn)用數(shù)學(xué)抽象的思維方式來(lái)分析問(wèn)題。
(5)研制本土一致性評(píng)價(jià)工具,貼合我國(guó)國(guó)情
盡管我國(guó)在試題和課程標(biāo)準(zhǔn)的一致性研究方面進(jìn)行了一些探索,但主要采用的是美國(guó)的研究工具1,本研究也主要采取SEC模型。在學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)中,應(yīng)以核心素養(yǎng)為導(dǎo)向,以高考命題改革為立足點(diǎn),以更適切的研究工具來(lái)研究高考試題與學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的一致性。因此,我國(guó)亟須開(kāi)發(fā)一套符合中國(guó)實(shí)際的本土化研究工具,不僅能檢測(cè)學(xué)生的核心素養(yǎng)和對(duì)知識(shí)的掌握程度及其水平,而且為教育發(fā)展和人才選拔起到重要作用。2
Study on the Consistency between College Entrance Examination Mathematics Paper and Academic Quality Standards under the Background of the New College Entrance Examination Reform
—Taking the 2017-2023 Shanghai and Zhejiang College Entrance Examination Papers as an Example
WU Jiamin,LIN Zizhi,SHI Tianran
(1.Institute of Community for Chinese Nation,Central South Minzu University,Wuhan Hubei,430074;
2.College of Big Data Science,Jiangxi Normal University of Science and Technology,Nanchang Jiangxi,330013)
Abstract: In the context of the New College Entrance Examination and the New Curriculum Standards, the college entrance examination papers are important indicators of education reform. Using the SEC consistency model, this study constructs an analysis framework based on content themes and academic quality standards to study 14 sets of college entrance examination mathematics papers from Shanghai and Zhejiang, the first batch of pilot provinces, from the three dimensions of content themes, performance levels, and core literacy of academic quality standards. Based on the findings, suggestions are provided to improve the alignment between examination papers and academic quality standards:1.quantify academic quality standards to guide teaching and evaluation; 2. adjust the proportion of content themes to achieve integration of assessment standards; 3.control the cognitive performance levels to improve the academic assessment system; 4. balance the distribution of core literacy for reasonable and scientific examination design; 5. develop local consistency assessment tools to align with the national conditions.
Key words: New College Entrance Examination,New Curriculum Standards,academic quality standards,College Entrance Examination Mathematics Papers,consistency