[中圖分類號(hào)]G424.74[文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)] 1673—1654(2024)04—067—007
一、義務(wù)教育學(xué)校試卷質(zhì)量標(biāo)準(zhǔn)的必要性
準(zhǔn),引領(lǐng)教師提高命題技能,引領(lǐng)學(xué)校建立命題質(zhì)量評(píng)價(jià)機(jī)制,提高學(xué)??荚嚸}的科學(xué)性、專業(yè)性、客觀性[2]。
2021年教育部辦公廳頒布《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ罚蟾鞯亓x務(wù)教育取消區(qū)縣統(tǒng)考,全面實(shí)施學(xué)校自行考試。要克服試題“難度較大、質(zhì)量不高”的質(zhì)量問題,完善現(xiàn)有義務(wù)教育學(xué)校紙筆考試試卷質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),引導(dǎo)學(xué)校構(gòu)建試卷質(zhì)量管理機(jī)制,保障學(xué)校考試命題質(zhì)量;引領(lǐng)一線教師樹立正確的??济}理念,提高常規(guī)命題技術(shù)。試卷質(zhì)量評(píng)價(jià)指標(biāo)是衡量考試科學(xué)性和有效性的重要依據(jù),應(yīng)當(dāng)完善義務(wù)教育學(xué)??荚嚸}質(zhì)量評(píng)價(jià)標(biāo)
2021年中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見》,要求降低考試壓力,改進(jìn)考試方法,不得有提前結(jié)課備考、違規(guī)統(tǒng)考、考題超標(biāo)、考試排名等行為。同年,教育部辦公廳《關(guān)于加強(qiáng)義務(wù)教育學(xué)??荚嚬芾淼耐ㄖ访鞔_規(guī)定,“各地不得面向小學(xué)各年級(jí)和初中非畢業(yè)年級(jí)組織區(qū)域性或跨校際的考試;學(xué)校和班級(jí)不得組織周考、月考、單元考試等其他各類考試,也不得以測試、測驗(yàn)、限時(shí)練習(xí)、學(xué)情調(diào)研等各種名義變相組織考試”。隨著取消統(tǒng)考政策的落實(shí),??寂d起,學(xué)校必須端正教師的??济}理念,培訓(xùn)教師相關(guān)命題技能,建立學(xué)校考試管理機(jī)制,保障學(xué)??荚嚸}質(zhì)量。這些將是義務(wù)教育學(xué)校當(dāng)下非常重要的新工作。
二、義務(wù)教育學(xué)校試卷質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的特殊性
國外學(xué)者對(duì)于試卷質(zhì)量側(cè)重使用項(xiàng)目反應(yīng)理論和經(jīng)典測量理論做量化評(píng)價(jià),常見的定量評(píng)價(jià)指標(biāo)包括信度、效度、難度、區(qū)分度等。國內(nèi)公開發(fā)布的試卷質(zhì)量評(píng)價(jià)指標(biāo)體系或評(píng)價(jià)標(biāo)準(zhǔn)較少,側(cè)重學(xué)科定性評(píng)價(jià),常見的定性評(píng)價(jià)指標(biāo)包括適綱性、科學(xué)性、適度性、導(dǎo)向性、規(guī)范性、結(jié)構(gòu)性、公平性等。有學(xué)者基于學(xué)科定性評(píng)價(jià)和測量學(xué)定量評(píng)價(jià)提出了比較系統(tǒng)的中高考試卷質(zhì)量評(píng)價(jià)指標(biāo)體系,具有理念先進(jìn)、遵守學(xué)科課標(biāo)、符合測量常規(guī)、社會(huì)后效良好四個(gè)一級(jí)指標(biāo),包含重視政治方向、順應(yīng)教育改革、破解應(yīng)試教育、敢于命題創(chuàng)新、試題無錯(cuò)無瑕、突出主干知識(shí)、凸顯核心素養(yǎng)、合理控制難度、整卷信效度高、評(píng)分標(biāo)準(zhǔn)科學(xué)、排版科學(xué)美觀、公平公正性強(qiáng)、高分段高區(qū)分、合理引導(dǎo)教學(xué)、社會(huì)認(rèn)可度高15個(gè)二級(jí)指標(biāo)4。目前的國內(nèi)外試卷質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)比較適合大規(guī)模的區(qū)域性測試,如中考、高考、區(qū)域質(zhì)量監(jiān)測等,但不適合義務(wù)教育學(xué)??荚嚒?/p>
學(xué)??荚囀侵笇W(xué)校針對(duì)本校學(xué)生自行組織、命題、批改、診斷和評(píng)價(jià)的考試,是學(xué)校教育教學(xué)工作重要的常規(guī)環(huán)節(jié)。學(xué)生數(shù)量規(guī)模和成績分化程度明顯小于區(qū)域測評(píng)。其主要目的是獲得教學(xué)過程中的連續(xù)性反饋,及時(shí)了解學(xué)生的學(xué)習(xí)效果、學(xué)習(xí)歷程、學(xué)習(xí)特點(diǎn)、學(xué)習(xí)困難等信息,及時(shí)預(yù)測監(jiān)控班級(jí)和學(xué)生個(gè)體的發(fā)展態(tài)勢,作為下階段教學(xué)改進(jìn)的依據(jù)]。學(xué)??荚嚥皇沁x拔、評(píng)估和排名考試,而是側(cè)重導(dǎo)向、診斷、激勵(lì)和促進(jìn)的低利害的小規(guī)模校本化考試。要通過學(xué)??荚噧?nèi)容的導(dǎo)向,引導(dǎo)學(xué)生重視課上、作業(yè)等日常學(xué)習(xí)過程。還要通過考試數(shù)據(jù)診斷學(xué)生個(gè)體學(xué)習(xí)效果,基于成績變化診斷學(xué)生的學(xué)習(xí)效益;提供試題和題組的得分?jǐn)?shù)據(jù),發(fā)揮考試的促進(jìn)功能,提高學(xué)生自我評(píng)價(jià)、自我反思的能力,引導(dǎo)學(xué)生合理運(yùn)用評(píng)價(jià)結(jié)果改進(jìn)學(xué)習(xí)。應(yīng)當(dāng)預(yù)設(shè)合理的考試難度,保護(hù)學(xué)生的學(xué)習(xí)自信心、學(xué)習(xí)興趣和學(xué)習(xí)效能感,激勵(lì)學(xué)生努力學(xué)習(xí),以利于身心健康發(fā)展。同時(shí),還要基于考試數(shù)據(jù)診斷教師教學(xué)效果,促進(jìn)教師改進(jìn)教育教學(xué)行為。
義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量評(píng)價(jià)不能類似中高考、區(qū)域統(tǒng)考那樣高要求、高標(biāo)準(zhǔn)。原因有四,一是學(xué)??荚嚨男再|(zhì)和功能不同于這些大規(guī)模統(tǒng)考;二是學(xué)??荚嚨拿}者和評(píng)估者是一線普通教師,不是區(qū)域的命題專家和評(píng)估專家,兩者專業(yè)水平相差懸殊;三是學(xué)校考試采集到測量學(xué)數(shù)據(jù)的全面性、精細(xì)性遠(yuǎn)不如區(qū)域統(tǒng)考;四是要考慮到一線學(xué)校的操作性和教師的接受性。
綜上所述,義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量評(píng)價(jià)要突出四個(gè)原則。一是對(duì)教師的引領(lǐng)性原則,通過義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量的評(píng)價(jià)標(biāo)準(zhǔn)引領(lǐng)學(xué)校學(xué)科評(píng)價(jià)改革,提高教師學(xué)科命題評(píng)價(jià)能力;二是對(duì)學(xué)生的導(dǎo)向性原則,以命題評(píng)價(jià)改革引導(dǎo)學(xué)生改良學(xué)習(xí),促進(jìn)學(xué)生對(duì)自已學(xué)習(xí)過程的反思和改進(jìn);三是對(duì)命題者的通俗性原則,讓一線普通教師、特別是新教師都能看懂指標(biāo)、理解指標(biāo);四是對(duì)學(xué)校的可操性原則,有關(guān)指標(biāo)要易于學(xué)校采集和計(jì)算,讓學(xué)校普通管理者都可以根據(jù)本指標(biāo)體系,開展試卷質(zhì)量評(píng)價(jià)和管理工作。因此,基于這四個(gè)原則,在指標(biāo)設(shè)計(jì)上盡量做到學(xué)科質(zhì)性評(píng)價(jià)和教育測量學(xué)量化評(píng)價(jià)相結(jié)合,試題評(píng)價(jià)和整卷評(píng)價(jià)相結(jié)合,命題質(zhì)量評(píng)估和命題技術(shù)指導(dǎo)相結(jié)合,命題專家水準(zhǔn)和一線教師基礎(chǔ)相結(jié)合,理想的命題理念和實(shí)踐操作相結(jié)合。
三、義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量評(píng)價(jià)指標(biāo)體系與評(píng)價(jià)方法
根據(jù)義務(wù)教育學(xué)??荚嚨男再|(zhì)和功能、評(píng)價(jià)標(biāo)準(zhǔn)的特殊性和四個(gè)原則,構(gòu)建包含3個(gè)一級(jí)指標(biāo)、10個(gè)二級(jí)指標(biāo)的義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量評(píng)價(jià)體系,如表1所示。
(一)遵守學(xué)科標(biāo)準(zhǔn)
1.范圍要求合標(biāo)
學(xué)校考試命題要嚴(yán)格遵守課程方案、各學(xué)科的課程標(biāo)準(zhǔn)和學(xué)科學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),嚴(yán)格按規(guī)定的考試性質(zhì)和考試目的、命題原則、命題規(guī)劃、試題研制等規(guī)則進(jìn)行,不得超標(biāo)命題和隨意擴(kuò)大、壓減考試內(nèi)容范圍。
評(píng)價(jià)要素:(1)考試內(nèi)容范圍沒有超出課標(biāo)。(2)沒有偏題怪題、學(xué)科競賽試題及校外培訓(xùn)內(nèi)容。(3)考試水平要求與課標(biāo)要求一致。例如,課標(biāo)上規(guī)定的教學(xué)要求是“理解”,就應(yīng)考查“理解\"水平,不應(yīng)考查“識(shí)記”或“應(yīng)用”。(4)考試內(nèi)容不能超出國家課程標(biāo)準(zhǔn)規(guī)定的正常的教學(xué)進(jìn)度。
評(píng)價(jià)方法:(1)(2)(3)(4)都達(dá)標(biāo),優(yōu)秀;(1)(2)(3)達(dá)標(biāo),良好;(1)(2)達(dá)標(biāo),合格;其余情況,不合格。二級(jí)指標(biāo)包含若干評(píng)價(jià)要素,各評(píng)價(jià)要素采取0-1賦分,也就是達(dá)標(biāo)和不達(dá)標(biāo)(下同)。
2.突出主干知識(shí)
一冊教材涉及很多知識(shí)點(diǎn),這些知識(shí)點(diǎn)自成體系,必有學(xué)科主干知識(shí)和重難點(diǎn)??键c(diǎn)覆蓋面越大,越能夠提高試卷內(nèi)容效度。學(xué)??荚噧?nèi)容既要重視覆蓋面,也要凸顯學(xué)科主干知識(shí)和重難點(diǎn)。
評(píng)價(jià)要素:(1)各板塊內(nèi)容都要有考查,而且分?jǐn)?shù)占比與相應(yīng)的教學(xué)課時(shí)數(shù)相當(dāng)。(2)各單元內(nèi)容都要有考查,而且分?jǐn)?shù)占比與相應(yīng)的教學(xué)課時(shí)數(shù)相當(dāng)。(3)考點(diǎn)覆蓋面 80% 以上。(4)主干知識(shí)及重難點(diǎn)都要有考查,且題量和分值占 70% 以上。(5)適度減少總題量,讓學(xué)生作答時(shí)間有富余。
評(píng)價(jià)方法:5項(xiàng)達(dá)標(biāo),優(yōu)秀;4項(xiàng)達(dá)標(biāo),良好;3項(xiàng)達(dá)標(biāo),合格;其余情況,不合格。
3.重視學(xué)科素養(yǎng)
學(xué)校考試必須是基于學(xué)科課標(biāo)核心素養(yǎng)的考試評(píng)價(jià),強(qiáng)化素養(yǎng)導(dǎo)向,注重對(duì)正確價(jià)值觀、必備品格和關(guān)鍵能力的考查。2022年版各學(xué)科新課標(biāo)都提出了學(xué)科各自的核心素養(yǎng)和關(guān)鍵能力。
評(píng)價(jià)要素:(1)與學(xué)科核心素養(yǎng)、關(guān)鍵能力匹配的試題數(shù)量要占多數(shù)。(2)與學(xué)科核心素養(yǎng)、關(guān)鍵能力匹配的試題分?jǐn)?shù)權(quán)重較大。(3)死記硬背等機(jī)械記憶的試題較少。
評(píng)價(jià)方法:3項(xiàng)都達(dá)標(biāo),優(yōu)秀;2項(xiàng)達(dá)標(biāo),良好;(1)或(2)達(dá)標(biāo)為合格;其余情況,不合格。
4.整卷難度合理
新課程新課標(biāo)要求義務(wù)教育學(xué)??荚囈鰪?qiáng)日??荚囋u(píng)價(jià)的育人意識(shí),“雙減”新政要求給學(xué)生減負(fù)。學(xué)??荚囈侠戆盐赵嚲淼碾y度,讓合適的考試成績成為學(xué)生學(xué)習(xí)的催化劑和動(dòng)力,從而發(fā)揮學(xué)??荚嚨募?lì)功能和促進(jìn)功能。讓優(yōu)等生拿不到滿分,考出危機(jī)感;讓中等生的分?jǐn)?shù)差距縮小,考出競爭意識(shí);讓后進(jìn)生拿到基本分,考出希望和自信。
試卷難度分為整卷統(tǒng)計(jì)學(xué)難度和學(xué)科難度。一道試題即使學(xué)科難度很大,但如果考生都會(huì)做,那么統(tǒng)計(jì)學(xué)難度不大。要控制的是整卷的統(tǒng)計(jì)學(xué)難度。學(xué)校考試是過程性考試,是基于課程標(biāo)準(zhǔn)的考試,通常要求小學(xué)考試難度范圍0.9-0.95,初中0.80-0.85,盡量不出現(xiàn)滿分現(xiàn)象。盡量做到高及格率,小學(xué)不及格率要低于 5% ,初中不及格率要低于 10% 。低分段和高分段兩極要有較好的區(qū)分度,即小學(xué)考試對(duì)后 5% 和前 10% 左右的學(xué)生有較好的區(qū)分度,初中考試對(duì)后 10% 和前 20% 左右的學(xué)生有較好的區(qū)分度。分?jǐn)?shù)標(biāo)準(zhǔn)差較小,離散程度較小。分?jǐn)?shù)分布呈現(xiàn)狹窄高峰型,峰度系數(shù)大于3。
評(píng)價(jià)要素:整卷難度合理。
評(píng)價(jià)方法:小學(xué)難度值0.9-0.95,初中難度值0.80-0.85,優(yōu)秀;小學(xué)難度值0.95以上,初中難度值0.85以上,良好;小學(xué)難度值大于等于0.80,初中難度值大于等于0.75,合格;小學(xué)難度值低于0.80,初中難度值低于0.75,不合格。
(二)試題質(zhì)量良好
1.試題無錯(cuò)無瑕
評(píng)價(jià)要素:(1)試題描述明確、正確、準(zhǔn)確,不缺乏必要條件、無歧義。(2)試題的情景、設(shè)問、答案、評(píng)分標(biāo)準(zhǔn)具有內(nèi)在邏輯性,無學(xué)科性錯(cuò)誤。(3)設(shè)問符合教材課標(biāo)的教學(xué)要求,指向明確,不會(huì)讓學(xué)生答非所問。(4)答案正確、合理、無爭議。(5)試題的文字、數(shù)據(jù)、圖示和表格精煉。(6試題情境與學(xué)科內(nèi)容相互融合,具有真實(shí)性、典型性、適當(dāng)性和公平性。
評(píng)價(jià)方法:6項(xiàng)都達(dá)標(biāo),優(yōu)秀;(1)(2)(3)(4)達(dá)標(biāo),(5)或(6)達(dá)標(biāo),良好;(1)(2)(3)(4)達(dá)標(biāo),合格;其余情況,不合格。
2.評(píng)分標(biāo)準(zhǔn)科學(xué)
評(píng)價(jià)要素:(1)命題者在試卷印刷前必須提供完整的評(píng)分標(biāo)準(zhǔn)。(2)各題目分值累計(jì)與總分一致。(3)各題型、板塊、大題賦分合理。(4)各小題賦分合理。(5)計(jì)算題、問答題、議論題、寫作題等主觀題的評(píng)分標(biāo)準(zhǔn)比較規(guī)范,層級(jí)賦分符合認(rèn)知程度,對(duì)綜合題、開放題、探究題、項(xiàng)目化學(xué)習(xí)、跨學(xué)科等復(fù)雜的試題可采取SOLO評(píng)價(jià)賦分法。(6)對(duì)不同解法的評(píng)分細(xì)則有所不同。
評(píng)價(jià)方法:6項(xiàng)都達(dá)標(biāo),優(yōu)秀;(1(2)和其他2項(xiàng)達(dá)標(biāo),良好;(1(2)達(dá)標(biāo),合格;其余情況,不合格。
3.試題有區(qū)分度
試題效度是指對(duì)于一個(gè)既定的目標(biāo),在做出推論和提供解釋過程中評(píng)價(jià)的有用性程度,是高質(zhì)量評(píng)價(jià)的首要條件7]。
根據(jù)美國測驗(yàn)專家艾伯爾(R.L.Ebel)的研究成果:鑒別指數(shù)大于0.3,表明試題的區(qū)分度良好;大于0.2,區(qū)分度尚可;0.19及以下,區(qū)分度差;區(qū)分度是負(fù)值,說明優(yōu)生得分情況比后進(jìn)生差,屬于必須淘汰的題目[8]。
義務(wù)教育學(xué)??荚囀菢?biāo)準(zhǔn)參照考試,是達(dá)標(biāo)性考試,大部分試題側(cè)重達(dá)標(biāo)和不達(dá)標(biāo)的區(qū)分。由于小學(xué)和初中整卷難度分別在0.90、0.85以上,預(yù)期小學(xué)和初中學(xué)校考試很多試題區(qū)分度會(huì)低于0.2。區(qū)分度低于0.2的試題,對(duì)全體學(xué)生而言,沒什么區(qū)分度,但是對(duì)高分組或低分組學(xué)生依然可能有較好的區(qū)分度。
學(xué)??荚嚳梢圆捎迷囶}難度值曲線來直觀反映試題的區(qū)分度。如圖1,難度曲線顯示本題對(duì)各個(gè)層次學(xué)生都有良好的區(qū)分度,是區(qū)分度較高的試題。圖2中左邊的難度曲線顯示該題對(duì)低分組學(xué)生有較高的區(qū)分度,對(duì)中等生、高分段學(xué)生沒有區(qū)分度;中間的難度曲線顯示本題對(duì)中等生有良好的區(qū)分度,對(duì)低分組和高分組區(qū)分度較??;右邊的難度曲線顯示該題對(duì)高分組學(xué)生有良好的區(qū)分度,對(duì)中等生和低分組學(xué)生沒有區(qū)分度。圖3難度曲線呈凹型,低分組得分率高于中等生,表明該題有問題;同理,難度曲線呈凸型,表明中等生得分率高于優(yōu)生,也是有問題的試題。圖4難度曲線很平直,而且低分段的得分率略高于高分段,區(qū)分度是負(fù)值,也是有問題的試題。
學(xué)校也可以采用各等第學(xué)生的得分值(或得分率)來直觀反映試題的效度。把學(xué)生學(xué)科成績由高到低分成ABCDE五等,各占 20% 。ABCDE等第學(xué)生試題得分率依次明顯下降,說明該試題對(duì)全體學(xué)生有良好的區(qū)分度;如果五個(gè)等第得分率都差不多,說明本題沒有區(qū)分度;如果ABCDE五個(gè)等第的試題得分率依次明顯上升,說明本題區(qū)分度是負(fù)值,屬于負(fù)相關(guān)關(guān)系,是有問題的試題。
評(píng)價(jià)要素:(1)沒有出現(xiàn)負(fù)相關(guān)、區(qū)分度為負(fù)值的試題,沒有出現(xiàn)類似圖3、圖4現(xiàn)象。(2)沒有出現(xiàn)區(qū)分度低于0.1的試題(3)大部分試題區(qū)分度大于0.2。
評(píng)價(jià)方法:3項(xiàng)都達(dá)標(biāo),優(yōu)秀;(1(2)達(dá)標(biāo),或(1)(3)達(dá)標(biāo),良好;(1)達(dá)標(biāo),合格;(1)不達(dá)標(biāo),不合格。
(三)試卷結(jié)構(gòu)良好
1.試題來源結(jié)構(gòu)合理
通過試題來源的導(dǎo)向性,引導(dǎo)學(xué)生重視課堂,重視課本、作業(yè)等日常性學(xué)習(xí)。
評(píng)價(jià)要素:(1)直接或改編于課文中原文、例題、作業(yè)的試題數(shù)量、分值占 20% 左右。(2)直接或改編作業(yè)本或官方作業(yè)的試題數(shù)量、分值約占 20% 分值。(3)直接或改編課堂練習(xí),講評(píng)過的、考過的試題數(shù)量、分值約占 50% 分值。(4)其他來源試題數(shù)量、分值約占 10% 分值。
評(píng)價(jià)方法:4項(xiàng)都達(dá)標(biāo),優(yōu)秀;3項(xiàng)達(dá)標(biāo),良好;2項(xiàng)達(dá)標(biāo),合格;其余情況,不合格。
2.試題類型結(jié)構(gòu)合理
學(xué)??荚囈疾楹诵乃仞B(yǎng)、關(guān)鍵能力等,既要增加綜合性、開放性、應(yīng)用型、探究性試題比例,減少機(jī)械記憶性試題,同時(shí)也要防止試卷難度過大。所以學(xué)??荚囈黾泳C合性、開放性、應(yīng)用型、探究性試題數(shù)量比例,同時(shí)嚴(yán)格控制這些題目的分值。
評(píng)價(jià)要素:(1)情景題達(dá)半數(shù)以上。(2)綜合性、開放性、應(yīng)用型、探究性、跨學(xué)科試題數(shù)量較多。(3)綜合性、開放性、應(yīng)用型、探究性、跨學(xué)科試題的分值較少。(4)選擇題、填空題、計(jì)算題等題型結(jié)構(gòu)合理,其中死記硬背的填空題和選擇題的數(shù)量很少。(5)合理控制選擇題單題難度,減少學(xué)生考試猜測性。
評(píng)價(jià)辦法:5項(xiàng)達(dá)標(biāo)。優(yōu)秀;(1)和其他3項(xiàng)達(dá)標(biāo),良好;(1)和其他2項(xiàng)達(dá)標(biāo),合格;其余情況,不合格。
3.試卷答卷排版合理
試卷答卷的字體大小、行距大小、圖表大小、試題排序都會(huì)影響學(xué)生的考試心理和成績。排版要合理、易讀、美觀,方便學(xué)生審題和作答,同時(shí)要做到試卷和答題卡一一對(duì)應(yīng)。
評(píng)價(jià)要素:(1)答題卡和試卷必須一一匹配。(2)一道試題不能分在兩頁,尤其正反面。(3)試題圖片大小合適,印刷清晰,題圖對(duì)應(yīng),圖文一致,相互靠近,不容易錯(cuò)覺錯(cuò)位;不同題自的圖表不能過分靠近。(4)答題區(qū)域大小滿足答題需要。(5)字體大小合適、行距合適。(6)試題及其圖表中的文字、數(shù)字、字母符號(hào)的字體字號(hào)統(tǒng)一。(7)同一組試題排序總體上要先易后難、先熟悉后陌生,利于學(xué)生考試心理平穩(wěn),思維有序展開,正常發(fā)揮水平。
評(píng)價(jià)辦法:7項(xiàng)達(dá)標(biāo),優(yōu)秀;(1(2)(3)(4)和其他2項(xiàng)達(dá)標(biāo),良好;(1)(2)(3)(4)達(dá)標(biāo),合格;其余情況,不合格。
四、義務(wù)教育學(xué)??荚囋嚲碣|(zhì)量評(píng)價(jià)指標(biāo)賦分辦法
將二級(jí)指標(biāo)分為最重要指標(biāo)、重要指標(biāo)、一般指標(biāo)三個(gè)級(jí)別,對(duì)應(yīng)的分?jǐn)?shù)權(quán)重也由高到低分別為20% 0.10%.5% 。二級(jí)指標(biāo)滿分為100分,最重要指標(biāo)、重要指標(biāo)和一般指標(biāo)滿分值分別為20分、10分、5分。各學(xué)??梢愿鶕?jù)本校教師的命題水平和常見試卷質(zhì)量存在的問題,校本化微調(diào)二級(jí)指標(biāo)分?jǐn)?shù)權(quán)重大小。
試題無錯(cuò)無瑕和整卷難度合理這兩個(gè)二級(jí)指標(biāo)設(shè)為最重要指標(biāo);也特別規(guī)定,試題無錯(cuò)無瑕和整卷難度合理這兩個(gè)指標(biāo)都為一票否決指標(biāo);如果其中一個(gè)評(píng)價(jià)為不合格,全卷為不合格。
學(xué)校考試必須重點(diǎn)考查學(xué)科素養(yǎng)和主干知識(shí),必須體現(xiàn)教學(xué)的重難點(diǎn),這方面的試題數(shù)量和分值應(yīng)該多一些,這反映了試卷的效度,所以,這兩個(gè)指標(biāo)設(shè)為重要指標(biāo)。一線教師命題很容易忽略試題來源結(jié)構(gòu)和試題類型結(jié)構(gòu),影響了教學(xué)評(píng)一致性和整卷信效度,所以,這兩個(gè)指標(biāo)也為重要指標(biāo)。
二級(jí)指標(biāo)都采用A(優(yōu)秀)、B(良好)、C(合格)、D(不合格)四個(gè)等第賦分方法,四個(gè)等第得分權(quán)重分別為滿分值的 1、0.8、0.6、0.4 以下。5分指標(biāo)對(duì)應(yīng)得分分別為5、4、3、2-0,10分的指標(biāo)對(duì)應(yīng)得分分別為10,8,6,4-0,20 分的指標(biāo)對(duì)應(yīng)得分分別為20、16、12、8-0。這種等第評(píng)價(jià)介于精準(zhǔn)評(píng)價(jià)和模糊評(píng)價(jià)之間,是督導(dǎo)評(píng)估評(píng)價(jià)量表常用的方法,具有通用性和習(xí)慣性;這也是一線教師普遍采用的日常評(píng)價(jià)方法,具有較大的適宜性和操作性。四等第賦分法,既能提高評(píng)價(jià)的區(qū)分度,又能提高不同專家評(píng)價(jià)分?jǐn)?shù)的橫向可比性。
命題評(píng)價(jià)能力是一線教師最薄弱的專業(yè)能力之一,提高教師的命題評(píng)價(jià)能力是當(dāng)務(wù)之急。學(xué)校要組織教師解讀新課程新課標(biāo),理解學(xué)校考試的性質(zhì)和功能定位,樹立正確的??祭砟?,摒棄傳統(tǒng)的選拔性考試的思想;每次考試后都應(yīng)依據(jù)開展學(xué)科試卷質(zhì)量評(píng)價(jià)和優(yōu)秀試卷評(píng)選活動(dòng),把優(yōu)秀試卷認(rèn)定為重要的教科研成果,把不合格的試卷認(rèn)定為教學(xué)事故,以此發(fā)揮評(píng)價(jià)標(biāo)準(zhǔn)的導(dǎo)向功能和指導(dǎo)功能,從而提升學(xué)??荚囋嚲淼馁|(zhì)量。
參考文獻(xiàn):
[1]教育部辦公廳.教基廳函[2021]34號(hào)教育部辦公廳關(guān)于加強(qiáng)義務(wù)教育學(xué)校考試管理的通知[A/OL].http://www.moe.gov.cn/srcsite/A06/s3321/202108/t20210830_555640.html.
[2]教育部.中共中央國務(wù)院印發(fā)《深化新時(shí)代教育評(píng)價(jià)改革總體方案》[EB/OL].[2025-05-14].htp://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202010/t20201013_494381.htm.
[3]教育部.中共中央辦公廳國務(wù)院辦公廳印發(fā)《關(guān)于進(jìn)一步減輕義務(wù)教育階段學(xué)生作業(yè)負(fù)擔(dān)和校外培訓(xùn)負(fù)擔(dān)的意見》[EB/OL].http://www.moe.gov.cn/jyb_xxgk/moe_1777/moe_1778/202107/
t20210724_546576.html.
[4]王旭東.中高考試卷質(zhì)量評(píng)價(jià)指標(biāo)體系初探[J].浙江考試,2023,(6):7-11+16.
[5]黃光楊.教育測量與評(píng)價(jià)[M].上海:華東師范大學(xué)出版社,2005.
[6]教育部.義務(wù)教育課程方案2022年版[M].北京:北京師范大學(xué)出版社,2022.
[7]趙德成.促進(jìn)教學(xué)的測驗(yàn)與評(píng)價(jià)[M].上海:華東師范大學(xué)出版社,2016.
[8]張敏強(qiáng).教育測量學(xué)[M].北京:人民教育出版社,2019.
Research on the Quality Evaluation Standards for Paper-and-Pencil Examination Papers in Compulsory Education Schools
Wang Xudong WenzhouEducationAssessment Institute,Wenzhou,Zhejiang,325000
Abstract:To solve the existing problems of \"high dificulty and low quality\" in test paper design,it is necessary to develop quality standards for examination papers in compulsory education schools to guide and regulate the process.Considering the practical operationsof front-line teachersand middle-level school administrators,three first-level indicators have been establishedbased on leadership,orientation,simplicity,and operability:subject standards,good quality of test questions,and good structure of the examination paper.These indicators include ten second-level indicators,such as compliance with content requirements,emphasizing on core knowledge,focusingonsubject literacy,reasonable overall dificulty,error-freeand flawlessquestions,scientific scoring criteria,questions with differentiation,rational structure ofquestion sources,rational structure of question types,and rational layout of the examination paper.The second-level indicators also include specific evaluation elements and methods.These standards can guide schools in building a quality management mechanism for examinations and improving the qualityof schol test design.Theyalso lead front-line teachers to establish correct concepts for school-based examination design and enhance their routine test design skills.
Key Words:School Examinations,Test Design Quality,Examination Paper Evaluation,Test Question Evaluation
(責(zé)任編輯:陳暢)