摘要:難度是把握考試性質(zhì)、體現(xiàn)學(xué)情理解、反映命題質(zhì)量的重要指標(biāo)之一。基于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)合理轉(zhuǎn)化和闡釋試卷試題難度是依標(biāo)命題的關(guān)鍵所在。改變以往簡單以“了解、理解、應(yīng)用”等認(rèn)知性詞語來模糊對(duì)應(yīng)考試難度的做法,結(jié)合課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求,我們對(duì)現(xiàn)有難度模型進(jìn)行了重構(gòu),這一重構(gòu)將有利于促進(jìn)考試與課程標(biāo)準(zhǔn)的緊密銜接,對(duì)于考試結(jié)果的解釋與使用也將發(fā)揮重要的作用。
關(guān)鍵詞:核心素養(yǎng);依標(biāo)命題;考試難度模型;學(xué)業(yè)質(zhì)量水平
引用格式:任建英.依標(biāo)命題要求下考試難度的重構(gòu)與操作轉(zhuǎn)化[J].教學(xué)與管理,2025(07):63-67.
依據(jù)課程標(biāo)準(zhǔn)進(jìn)行命題已經(jīng)成為考試評(píng)價(jià)最突出的要求[1]??荚囯y度的“依標(biāo)”是依標(biāo)命題的核心要義。難度不僅指向診斷(區(qū)分)不同學(xué)生的學(xué)業(yè)水平,更重要的是難度的設(shè)定依據(jù)要和課程標(biāo)準(zhǔn)充分結(jié)合,這樣考試結(jié)果才能反映學(xué)生學(xué)習(xí)結(jié)果之于國家要求的實(shí)現(xiàn)程度。2017年以來,普通高中、義務(wù)教育新的課程方案和課程標(biāo)準(zhǔn)相繼頒布。課程標(biāo)準(zhǔn)系統(tǒng)構(gòu)建了以發(fā)展學(xué)生核心素養(yǎng)為目標(biāo)的教學(xué)、評(píng)價(jià)體系。全面依據(jù)課程標(biāo)準(zhǔn)命題、強(qiáng)化素養(yǎng)導(dǎo)向是新階段考試的重要要求,最核心的在于兩個(gè)方面:一是對(duì)課程內(nèi)容的覆蓋度;二是對(duì)核心素養(yǎng)及其水平的考察程度。前者本身具有層次性,現(xiàn)代學(xué)習(xí)進(jìn)階、知識(shí)結(jié)構(gòu)化等理論已有多方面的研究,主要強(qiáng)調(diào)對(duì)核心知識(shí)的覆蓋,很難具體說覆蓋到何種程度,因?yàn)榭荚囈疾鞂W(xué)生核心素養(yǎng)發(fā)展情況,知識(shí)總歸是一種載體。第二方面是本文討論的重點(diǎn),集中反映為學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)如何有效轉(zhuǎn)化到考試命題設(shè)計(jì)之中,這是一個(gè)理論問題,也是一個(gè)實(shí)踐問題。
一、考試難度研究現(xiàn)狀
題目難度以及難度分布是否合適,主要取決于測驗(yàn)的目的和性質(zhì)[2]??荚囯y度是測試測驗(yàn)的關(guān)鍵指標(biāo),得到了考評(píng)戰(zhàn)線以及研究人員廣泛的重視。當(dāng)前理論研究主要集中在三個(gè)方面:第一,超越難度的數(shù)據(jù)統(tǒng)計(jì)層面,從情緒意義、社會(huì)意義等多個(gè)角度來建立考試難度結(jié)構(gòu)。有學(xué)者從測量難度、感受難度、印象難度構(gòu)建了高考難度的三元框架,進(jìn)一步拓展了考試難度的內(nèi)涵與外延[3]。第二,系統(tǒng)分析考試難度的影響因素。有學(xué)者通過實(shí)證研究,提出影響物理合格性考試難度的因素包括建模、情境熟悉程度、閱讀量、提示度、認(rèn)知水平、圖表、推理廣度、數(shù)學(xué)復(fù)雜性、情境結(jié)合程度、知識(shí)量等[4]。有學(xué)者從問題表征(信息呈現(xiàn)方式、信息利用方式、情境陌生程度)、問題解決(知識(shí)綜合程度、思維層次)、結(jié)果輸出(答案表達(dá)方式、答案開放程度)三大維度對(duì)影響因素進(jìn)行了結(jié)構(gòu)化和定量化分析[5]。對(duì)于特定類型試題,也要把握好難度影響要素,如開放性試題設(shè)問要明確指向考查目標(biāo),不能無限開放;評(píng)分標(biāo)準(zhǔn)要符合學(xué)生的認(rèn)知水平,不能以教師的思維水平為依據(jù)來評(píng)價(jià)學(xué)生[6]。對(duì)于特定任務(wù),如聽力任務(wù)難度受到輸入語篇(長度、文本復(fù)雜度、語音特征、播放次數(shù))、測試任務(wù)(指導(dǎo)語、題干等)、試題三大要素的影響[7]。第三,對(duì)考試難度設(shè)置與控制理論的研究。高中等級(jí)性考試難度設(shè)計(jì)要充分考慮大規(guī)模教育考試的測量學(xué)要求、試點(diǎn)省份分?jǐn)?shù)轉(zhuǎn)換的理論模型、高考相關(guān)學(xué)科的實(shí)測數(shù)據(jù),體現(xiàn)對(duì)高考綜合改革實(shí)施的長遠(yuǎn)影響[8]。利用代表性小樣本試測新題的方法預(yù)控考試難度、采用計(jì)算機(jī)化自適應(yīng)測試方式控制考試難度、采用標(biāo)準(zhǔn)設(shè)定的方法預(yù)估考試難度,可以有效提高測量效果[9]。
總體而言,關(guān)于考試以及考試難度的研究在一定程度上都關(guān)注到了與課程標(biāo)準(zhǔn)要求的關(guān)系,但對(duì)于如何把課程標(biāo)準(zhǔn)要求有效轉(zhuǎn)化到考試命題流程與體系之中,研究很少,指導(dǎo)性、可操作性有限。基于這種情形,把課程標(biāo)準(zhǔn)特別是綜合反映新理念的學(xué)業(yè)質(zhì)量要求轉(zhuǎn)化到多維細(xì)目表之中,實(shí)現(xiàn)與考試難度設(shè)定的有機(jī)結(jié)合,迫切需要研究突破與指導(dǎo)。
二、考試難度解釋模型
雖然難度是計(jì)算出來的,但在命題中怎樣區(qū)分試題難易程度,需要一個(gè)理論模型或者解釋。當(dāng)前,預(yù)設(shè)難度、實(shí)測難度都主要分為“難、中、易”三個(gè)等級(jí)。一場考試的性質(zhì)集中反映在試卷難度以及難度結(jié)構(gòu)上,即試卷總體難度以及“難、中、易”等級(jí)上的試題(分值)比例?!半y、中、易”三個(gè)等級(jí)只是對(duì)試題難度的抽象標(biāo)識(shí),它的設(shè)定依據(jù)是什么?通常而言,“難、中、易”分別對(duì)應(yīng)“應(yīng)用、理解、了解”三個(gè)認(rèn)知層次(如圖1)。這三個(gè)詞主要來源于布魯姆認(rèn)知水平分類理論,為了規(guī)避該理論在高層次認(rèn)知活動(dòng)上的交叉與模糊,在考試中將布魯姆“了解、理解、應(yīng)用、分析、綜合、評(píng)鑒”六個(gè)層級(jí)概化為“了解、理解、應(yīng)用”三個(gè)層級(jí)。這種處理一定程度上解決了一些理論上的問題,而且從字面上或者直觀來講,“了解、理解、應(yīng)用”三個(gè)詞的層級(jí)差異性比較明顯。但進(jìn)一步分析可見,其自身的理論困境仍舊沒有解除。比如,一點(diǎn)不“理解”的“了解”有多大意義,特別是在人工智能迅猛發(fā)展的背景之下;不能“應(yīng)用”的“理解”是真的“理解”嗎?姑且不論認(rèn)知?jiǎng)釉~之間的邊界問題,動(dòng)詞本身具有的模糊特點(diǎn)實(shí)則才是最大的困難與問題所在。有人認(rèn)為,正是這種模糊性質(zhì)才給了命題人員與評(píng)卷人員空間與張力,說得難聽一點(diǎn),總會(huì)拼湊出一個(gè)合理的結(jié)果來回應(yīng)各方面的質(zhì)疑。然而,這與基礎(chǔ)教育階段新課程的理念和要求相去甚遠(yuǎn)。
如果以“了解、理解、應(yīng)用”來表征特定試題任務(wù)所需學(xué)生的認(rèn)知層級(jí),那么核心素養(yǎng)在哪里?具體而言,有三個(gè)突出問題:第一,“了解、理解、應(yīng)用”的認(rèn)知要求與核心素養(yǎng)如何關(guān)聯(lián)?當(dāng)前,一種折中的做法是,在多維細(xì)目表中仍然對(duì)每一道題使用“了解、理解、應(yīng)用”來標(biāo)識(shí)難度,同時(shí)說明該題考察的核心素養(yǎng)。然而,考察的核心素養(yǎng)以及學(xué)生應(yīng)有的表現(xiàn)與難度是什么關(guān)系?比如,學(xué)生達(dá)到“了解”的表現(xiàn)要求,學(xué)生素養(yǎng)發(fā)展相應(yīng)是怎樣的?這些都是當(dāng)前難度模型或解釋的突出矛盾或者不足。第二,是否符合課程標(biāo)準(zhǔn)的要求?有人說,“了解”主要指向記憶性試題,那么記憶性試題和素養(yǎng)導(dǎo)向的試題是什么關(guān)系?其考察目標(biāo)與相應(yīng)的學(xué)業(yè)質(zhì)量要求是否一致?第三,不利于診斷和改進(jìn)。倘若依托“了解、理解、應(yīng)用”來標(biāo)識(shí)難度,考后就很難描述清楚一個(gè)學(xué)生的素養(yǎng)發(fā)展?fàn)顩r,對(duì)于下一步學(xué)習(xí)的指導(dǎo)性便非常弱。以上問題都需要我們構(gòu)建一個(gè)關(guān)于考試難度的新的解釋模型,并合理使用之。
三、考試難度新模型的構(gòu)建與操作轉(zhuǎn)化
利用布魯姆認(rèn)知分類體系來指導(dǎo)考試命題,在一定歷史時(shí)期內(nèi),在世界范圍內(nèi)取得了突出的成就。然而,探討教育目標(biāo)分類的理論研究沒有停止,布魯姆理論的弊端越發(fā)凸顯,最突出的問題有三個(gè):一是經(jīng)驗(yàn)性的描述用于確認(rèn)顯性的行為問題不大,要用來確認(rèn)穩(wěn)性的、抽象的思想和情感就很困難,或者因描述過于抽象而導(dǎo)致泛化不可操作,或者因描述過于具體而失去目標(biāo)的本意。這一問題在紙筆考試中更加突出。二是當(dāng)目標(biāo)涉及高層次的思維活動(dòng)時(shí),其邏輯也有很大問題,所作的描述與被描述的目標(biāo)行為之間有較大的差異。三是“了解、理解、應(yīng)用”等認(rèn)知要求對(duì)于表征學(xué)生發(fā)展是單維的、不全面的,布魯姆本人也曾嘗試從認(rèn)知、情感意志、動(dòng)作技能三個(gè)領(lǐng)域來描述學(xué)生學(xué)習(xí)成果,只是后兩個(gè)領(lǐng)域由于不成熟而沒有得到應(yīng)有的關(guān)注和使用[10]。但奉之為圭臬的我國考試實(shí)踐卻未能充分重視這些新思考、新進(jìn)展,特別是不能有機(jī)結(jié)合新的育人理念,探索符合我國教育發(fā)展需要的難度模型,這是不合理的,也是不應(yīng)該的。
1.考試難度新模型的構(gòu)建
為了更好地發(fā)揮考試的診斷與改進(jìn)功能,我們必須改變現(xiàn)有考試難度模型的模糊化解釋,明確回歸到對(duì)學(xué)生學(xué)業(yè)表現(xiàn)綜合化、全面性要求更好的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)上來。學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)以核心素養(yǎng)(包括正確價(jià)值觀、關(guān)鍵能力、必備品格,而不僅僅是認(rèn)知要求)為主要維度,結(jié)合核心內(nèi)容、典型任務(wù)等,對(duì)學(xué)生學(xué)業(yè)成就的表現(xiàn)特征進(jìn)行了整體刻畫。從政策和理論的角度講,學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)對(duì)于特定考試的試卷和試題難度給出了較為清晰的邊界。至于學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)的表述方式,我們可以結(jié)合SOLO理論[11]來理解,其追求一種刻畫學(xué)生核心素養(yǎng)整體性的發(fā)展“階梯”?;谝陨嫌懻?,我們對(duì)圖1所示的難度解釋模型進(jìn)行了重構(gòu),將課標(biāo)中的學(xué)業(yè)質(zhì)量要求細(xì)化為若干水平,如水平A、水平B、水平C,代替“了解、理解、應(yīng)用”,并分別對(duì)應(yīng)“難、中、易”三個(gè)難度層次(如圖2)。
2.考試難度新模型的操作轉(zhuǎn)化
“操作轉(zhuǎn)化”可以概括為“水平細(xì)化、結(jié)構(gòu)對(duì)應(yīng)、試題具化”三個(gè)重要環(huán)節(jié)。這三個(gè)環(huán)節(jié)缺一不可,“水平細(xì)化”是“結(jié)構(gòu)對(duì)應(yīng)”的基礎(chǔ),“結(jié)構(gòu)對(duì)應(yīng)”為“水平細(xì)化”提供方向,為“試題具化”提供基本依據(jù)。前兩者由課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求演繹而來,是抽象概括的,具有一般性;后者結(jié)合具體測驗(yàn)題目的情境、內(nèi)容、任務(wù)等進(jìn)行表述。
(1)水平細(xì)化
對(duì)照特定考試性質(zhì)與功能,將課程標(biāo)準(zhǔn)提出的學(xué)業(yè)質(zhì)量參照水平細(xì)化為3個(gè)水平。這里說明兩個(gè)問題:一是在一次考試中要有差異化的不同水平來滿足命題需求,即要從這一參照水平中生發(fā)出更多水平(如圖3)。然而,要從這個(gè)參照水平生發(fā)出一個(gè)略高的水平和一個(gè)略低的水平如圖3中的模式一,還是生發(fā)出的水平都比參照水平低如圖3中的模式二?這兩種模式哪一種更好需要進(jìn)一步討論。二是細(xì)化的水平越多,考后的反饋指導(dǎo)就越精細(xì)和精準(zhǔn),比如五個(gè)水平。
下面以初中學(xué)業(yè)水平考試為例進(jìn)行討論。此時(shí),圖3中的“參照水平”便是學(xué)生學(xué)完九年義務(wù)教育課程后的“畢業(yè)水平”。模式一的優(yōu)勢在于,全面遵循了課標(biāo)提出的“畢業(yè)水平”的要求,但在命題上,水平C雖然只是略高于參照水平,卻又容易讓這種模式陷入“超標(biāo)”的質(zhì)疑。在實(shí)際操作過程中,要把握好水平C、水平A與水平B之間的距離,確保比較接近。模式二的優(yōu)勢非常突出,完全落實(shí)了“不超標(biāo)”的要求,但也存在一個(gè)潛在的問題,低于參照水平的水平B和水平A應(yīng)該是什么水平。通常有人會(huì)說,試卷中有一些“送分”題,說的就是這些水平對(duì)應(yīng)的試題,但存在“送”到何種程度的問題。比如,極端一點(diǎn),讓水平A對(duì)應(yīng)義務(wù)教育第一個(gè)學(xué)段(1~2年級(jí))的學(xué)業(yè)質(zhì)量要求,當(dāng)然絕大多數(shù)甚至是100%的學(xué)生都能夠正確作答相關(guān)試題。但如果水平A對(duì)應(yīng)7年級(jí)的學(xué)業(yè)要求,那么有些學(xué)生不一定可以得到滿分。當(dāng)然,沒有任何文件規(guī)定過水平B、水平A應(yīng)該對(duì)應(yīng)哪一個(gè)年級(jí)或者學(xué)段的水平,但水平B和水平A應(yīng)該比較接近“畢業(yè)水平”,而不是無限度地下沉到小學(xué),這是初中學(xué)業(yè)水平考試的性質(zhì)和定位決定的。按照模式二,以數(shù)學(xué)“抽象能力”“運(yùn)算能力”為例呈現(xiàn)細(xì)化結(jié)果(見表1)[12]。需要指出的是,表1以素養(yǎng)為維度呈現(xiàn),并未將所有素養(yǎng)統(tǒng)整起來表述學(xué)生發(fā)展水平,這有待進(jìn)一步研究和完善。
(2)結(jié)構(gòu)對(duì)應(yīng)
將難度劃分與細(xì)化水平充分對(duì)應(yīng)起來,比如三個(gè)水平分別對(duì)應(yīng)“易、中、難”;如果細(xì)化為五個(gè)水平,就可以對(duì)應(yīng)到更加精細(xì)的難度結(jié)構(gòu)上,如“易、較易、中等、較難、難”。在這種對(duì)應(yīng)之后,試題難度就直接關(guān)聯(lián)到了課程標(biāo)準(zhǔn)中的學(xué)業(yè)質(zhì)量要求,而不是漏洞百出且模棱兩可的“了解”“理解”或“應(yīng)用”。具體呈現(xiàn)在多維細(xì)目表之中(見表2),其中“學(xué)業(yè)考察水平”便是上述“細(xì)化水平”。
(3)試題具化
在表2中,要明確每一道試題考察學(xué)生到什么水平,并在“學(xué)業(yè)考察水平”中寫出學(xué)生作答該試題應(yīng)有的表現(xiàn)。整個(gè)試卷要對(duì)不同的難度水平進(jìn)行結(jié)構(gòu)性覆蓋,符合考試性質(zhì)、目的要求。為對(duì)上述模型及其使用作出更清晰的說明,我們選擇下題為例進(jìn)行分析,以展示實(shí)操過程和主要做法。
為了解蘇州市的地鐵線路圖,某校學(xué)生在網(wǎng)上查到部分線路圖并利用網(wǎng)格畫出示意圖(示意圖是軸對(duì)稱圖形)(如圖4)。現(xiàn)建立平面直角坐標(biāo)系,使得圖中表示石路站點(diǎn)的點(diǎn)A的坐標(biāo)為(-1,1),表示臨頓路站點(diǎn)的點(diǎn)D的坐標(biāo)為(2,0),且測得AB=BC,∠ABC=135°,則表示蘇州火車站點(diǎn)的點(diǎn)C的坐標(biāo)為" " " " " "。
該題主要考查學(xué)生的空間觀念和運(yùn)算能力。試題任務(wù)雖然源于現(xiàn)實(shí)情境,但是已經(jīng)基本完成了對(duì)真實(shí)問題的建模,不僅繪制了示意圖,而且給出了A點(diǎn)和D點(diǎn)的坐標(biāo),因而直角坐標(biāo)系的建立非常容易。結(jié)合軸對(duì)稱圖形和相關(guān)角度的提示,試題本身的計(jì)算也偏簡單?;诒疚奶接懙闹饕獑栴},現(xiàn)主要呈現(xiàn)試題的考察意圖、學(xué)業(yè)考察水平以及預(yù)設(shè)難度系數(shù)。學(xué)業(yè)考察水平的表述應(yīng)該是表1中水平A在該題的具體化(見表3)。若干題目接續(xù)呈現(xiàn)在表2中,結(jié)構(gòu)性覆蓋應(yīng)考察的核心素養(yǎng)及其不同水平。
學(xué)生核心素養(yǎng)發(fā)展?fàn)顩r主要依據(jù)其在解決實(shí)際問題過程中的表現(xiàn)來判斷。為進(jìn)一步強(qiáng)化真實(shí)問題解決,我們對(duì)上題作了一些調(diào)整,以更加突出建模方面的考察。建模意識(shí)和能力是學(xué)生“會(huì)用數(shù)學(xué)的眼光觀察現(xiàn)實(shí)世界、會(huì)用數(shù)學(xué)的思維思考現(xiàn)實(shí)世界、會(huì)用數(shù)學(xué)的語言表達(dá)現(xiàn)實(shí)世界”的關(guān)鍵方面,改編后的題目將對(duì)教學(xué)方式轉(zhuǎn)變發(fā)揮更加積極的引導(dǎo)作用。
圖4所示為蘇州市部分地鐵線路圖。圖中線路可近似看作軸對(duì)稱圖形,蘇州火車站所在交角近似為90°。當(dāng)前,某校學(xué)生在養(yǎng)育巷站,打算乘坐地鐵,在最短時(shí)間內(nèi)到達(dá)蘇錦站。
(1)建立適當(dāng)?shù)钠矫嬷苯亲鴺?biāo)系,并近似標(biāo)注沿途各站坐標(biāo)。“養(yǎng)育巷-樂橋”兩站為1個(gè)單位長度。
(2)假如1個(gè)單位長度為1cm,圖6比例尺為1:150000。結(jié)合生活經(jīng)驗(yàn),估算學(xué)生需要多長時(shí)間到達(dá)目的地。
改編后的題目具有了更強(qiáng)的開放性,學(xué)生需要根據(jù)插圖明確各個(gè)站點(diǎn)、線路之間的位置關(guān)系,通過測量和比例尺來估算各點(diǎn)之間的距離。在建立直角坐標(biāo)系的過程中,相比改編前,坐標(biāo)原點(diǎn)不固定,給了學(xué)生更多選擇與解釋空間。同時(shí),學(xué)生需要結(jié)合生活經(jīng)驗(yàn)估算地鐵行進(jìn)速度,并對(duì)加速和減速過程進(jìn)行適當(dāng)假設(shè)(初中學(xué)生可以假設(shè)整個(gè)過程作勻速運(yùn)動(dòng),但是必須要體現(xiàn)出對(duì)這一要素的考慮與假設(shè),確保論證嚴(yán)密)。這種改編在一定程度上會(huì)增加試題難度,可形成該題的多維細(xì)目表(見表4)。
對(duì)于更好體現(xiàn)素養(yǎng)立意的開放性試題,存在一個(gè)突出問題:試題的學(xué)業(yè)考察水平與評(píng)分標(biāo)準(zhǔn)(細(xì)則)有什么關(guān)系?評(píng)分標(biāo)準(zhǔn)(細(xì)則)的設(shè)定與難度控制關(guān)系很大,在開放性試題(給學(xué)生多重論證和解釋的空間,結(jié)論不確定、不唯一,關(guān)注學(xué)生的論證過程以及邏輯性合理性)的作答中尤為突出。當(dāng)學(xué)生作答表現(xiàn)符合了該題所設(shè)定的學(xué)業(yè)考察水平,應(yīng)該獲得滿分,且滿分之上的作答不再進(jìn)一步區(qū)分。有人提出,為什么要在主觀上模糊學(xué)生更高水平的表現(xiàn),從而弱化考試對(duì)學(xué)生的診斷與改進(jìn)功能?在一定程度上講,學(xué)生在開放性試題上的表現(xiàn)是上不封頂?shù)?,如果以最好的學(xué)生表現(xiàn)作為滿分答案,容易導(dǎo)致整體分?jǐn)?shù)的下滑,影響實(shí)測難度以及難度控制情況,這要綜合考試的性質(zhì)和目的來看待。
四、考試難度新模型使用的思考與建議
根據(jù)上述難度設(shè)計(jì)與實(shí)踐操作的探討,在一次考試結(jié)束之后,我們可以進(jìn)行三個(gè)方面的分析,以彰顯和深化這種難度新模型的優(yōu)勢,推進(jìn)基于課程標(biāo)準(zhǔn)的“教學(xué)評(píng)”一致性。
首先,對(duì)照多維細(xì)目表,分析試卷和試題實(shí)測難度和預(yù)設(shè)難度的一致性,特別是對(duì)于偏離預(yù)設(shè)難度較大的題目,要專門討論表3(或表4)中“學(xué)業(yè)考察水平”的設(shè)定和表述,全面分析偏離的主要原因,為下一步命題規(guī)劃的改進(jìn)提出建議。其次,考量每一道試題考查目標(biāo)的實(shí)現(xiàn)情況與水平細(xì)化結(jié)果的一致性。如果偏離應(yīng)有水平的試題較多,需要進(jìn)一步考慮當(dāng)?shù)亟糖閷W(xué)情與學(xué)業(yè)質(zhì)量要求的距離,為區(qū)域教育質(zhì)量改進(jìn)明確方向。進(jìn)一步講,從更大的范圍來說,這種對(duì)學(xué)生整體情況的反思也可以作為對(duì)課程標(biāo)準(zhǔn)中學(xué)業(yè)質(zhì)量的校正依據(jù)。同時(shí),根據(jù)學(xué)生作答,可以形成學(xué)生素養(yǎng)發(fā)展的質(zhì)性分析報(bào)告,對(duì)學(xué)生進(jìn)一步規(guī)劃學(xué)習(xí)發(fā)揮參考作用。再次,充分認(rèn)識(shí)和把握實(shí)測難度、預(yù)設(shè)難度之間的差距與教學(xué)方式之間可能存在的隱性矛盾。比如,對(duì)于特定試題,預(yù)設(shè)難度是0.8,但是實(shí)測難度卻是0.5乃至更低,那么原因是試題考察水平設(shè)定不合理,還是試題本身出了問題?如果這道題是為了充分考察學(xué)生核心素養(yǎng)而設(shè)計(jì)的開放性、探究性試題,而我們?nèi)粘=虒W(xué)又很少有時(shí)間有機(jī)會(huì)讓學(xué)生經(jīng)歷開放探究的學(xué)習(xí)過程,這種不適也可能造成實(shí)測難度、預(yù)設(shè)難度之間的巨大偏差。這個(gè)時(shí)候,需要理性認(rèn)識(shí)這一情況,堅(jiān)持素養(yǎng)考察的命題方向,而不能簡單地否定或者排斥。
參考文獻(xiàn)
[1] 教育部關(guān)于加強(qiáng)初中學(xué)業(yè)水平考試命題工作的意見(教基〔2019〕15號(hào))[EB/OL].(2019-12-20)[2024-09-05]. http://www.moe.gov.cn/srcsite/A06/s3321/201911/t20191128_409951.html.
[2] 黃光揚(yáng).教育測量與評(píng)價(jià)[M].上海:華東師范大學(xué)出版社,2022:64-67.
[3] 于涵.中國高考難度分析理論構(gòu)建初探[J].中國考試,2024(02):1-10.
[4] 馮雪媚,張殷.物理合格性考試試題難度影響因素的實(shí)證研究[J].招生考試研究,2022(04):1-16.
[5] 劉芳,王偉群,吳星.高中學(xué)業(yè)水平考試試題難度模型建構(gòu)[J].化學(xué)教育(中英文),2022,43(21):43-47.
[6] 陸璟.考試要有效體現(xiàn)對(duì)學(xué)生成長有價(jià)值的內(nèi)容——“雙減”背景下提高中考命題科學(xué)化水平的思考[J].人民教育,2022(09):39-41.
[7] BRINDLEY G, SLATYER H. Exploring task difficulty in ESL list-ening assessment [J]. Language Testing,2002,19(04):369-394.
[8] 趙雪,宋寶和.普通高中學(xué)業(yè)水平選擇性考試的難度設(shè)計(jì)研究[J].教育理論與實(shí)踐,2022,42(02):18-22.
[9] 楊志明,徐慶樹.考試難度及其測量學(xué)調(diào)控手段[J].教育測量與評(píng)價(jià),2022(04):3-10.
[10] 馬扎諾,肯德爾.教育目標(biāo)的新分類學(xué)[M].2版.高凌飚,吳有昌,蘇峻,譯.北京:教育科學(xué)出版社,2012:2.
[11] 彼格斯,科利斯.學(xué)習(xí)質(zhì)量評(píng)價(jià):SOLO分類理論[M].高凌飚,張洪巖,譯.北京:人民教育出版社,2010:27-32.
[12] 中華人民共和國教育部.義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2022年版)[S].北京:北京師范大學(xué)出版社,2022:82-83.
【責(zé)任編輯" " 王澤華】
* 該文為教育部課程教材研究所2024年度科研發(fā)展基金課題“核心素養(yǎng)導(dǎo)向的命題理論與實(shí)踐研究”(JCSZD24005)的研究成果