彭和強(qiáng) 鄭浩
高考是對學(xué)生高中階段學(xué)習(xí)成果的終結(jié)評價?!陡呖荚u價體系》中,明確了“立德樹人、服務(wù)選材、導(dǎo)向教學(xué)”的核心價值和功能。其中“導(dǎo)向教學(xué)”意為:高考要為高中一線教學(xué)指明方向。
診斷考試是地方教育管理部門對學(xué)生高中特定時段學(xué)習(xí)效果的過程性評價。過程性評價對一線教學(xué)也有著極其重要的導(dǎo)向作用,但卻沒有特定標(biāo)準(zhǔn)可參照。如果診斷試題不能進(jìn)行有效的考核評價和約束,試題的質(zhì)量難以得到有效保障,一線教學(xué)也就容易迷失方向,這將與高考評價體系中的“導(dǎo)向教學(xué)”理念背道而馳。
基于以上思考和分析,試圖找到能夠有效評價和考核診斷考試命題質(zhì)量的途徑。
一、研究對象和方式
研究對象為綿陽市某年級的93名學(xué)生,以歷次考試測試數(shù)據(jù)為基礎(chǔ)。
因每次考試均按照全市排名劃定A0、A優(yōu)、B優(yōu)分?jǐn)?shù)線,且每次劃線人數(shù)基本相當(dāng),故參照上線情況進(jìn)行統(tǒng)計(jì)分析,具有較強(qiáng)統(tǒng)計(jì)參照價值。通過上線人數(shù)、超線差值、置信度三方面進(jìn)行統(tǒng)計(jì)分析,能夠較好檢驗(yàn)診斷考試與高考之間的關(guān)聯(lián)度,從而檢驗(yàn)診斷試題質(zhì)量。
二、診斷考試與高考的關(guān)聯(lián)度分析
1. 上線人數(shù)的關(guān)聯(lián)度
從歷次考試各層次上線人數(shù)看(表1),A0和A優(yōu)上線人數(shù)波動幅度較大;B優(yōu)上線情況除三診外,均穩(wěn)定保持在75~76人。
從歷次考試上線結(jié)構(gòu)來看,無論哪個層次的上線人數(shù),高考都與該年級的一診最為接近,說明二者關(guān)聯(lián)度最強(qiáng);而三診測試結(jié)果與高考差異最明顯,B優(yōu)上線人數(shù)也產(chǎn)生較大差異,說明二者關(guān)聯(lián)度較差。
2. 超線差值的關(guān)聯(lián)度
學(xué)生考試成績與當(dāng)次優(yōu)生線之間存在一定差值,可稱為超線差值ΔM。理論上,如果所有學(xué)生高考超線差值ΔM1與診斷考試超線差值ΔM2之間的差值ΔE(即ΔE=丨ΔM1-ΔM2丨)無限接近于0,則表明當(dāng)次診斷考試關(guān)聯(lián)度越高。但客觀上講,因?qū)W生個體存在成績不定因素,做到無偏差自然不可能。但大量統(tǒng)計(jì)對分析診斷考試有效度也有積極意義。
表2以A優(yōu)線為參照,統(tǒng)計(jì)研究對象4次統(tǒng)考與高考之間ΔE值的大小分布情況。ΔE低值區(qū)分布人數(shù)越多,表明試題與高考關(guān)聯(lián)度越高。
通過表2數(shù)據(jù)分析可知,一診、二診考試ΔE≥15的人數(shù)相對較少,表明其關(guān)聯(lián)度較高。三診考試ΔE≥15的人數(shù)顯著偏多,其關(guān)聯(lián)度相對較差。
3. 置信度分析
置信度也可直觀分析出兩種數(shù)據(jù)之間的關(guān)聯(lián)度。將歷次診斷考試與高考上線情況進(jìn)行疊加,并進(jìn)行上線與未上線統(tǒng)計(jì),得到各層次和各次考試之間的列聯(lián)表。運(yùn)用卡方公式,得到隨機(jī)變量K?的觀測值k,再根據(jù)觀測值k對照表,得到診斷考試與高考之間的置信度。置信度越高,表明高考與當(dāng)次診斷考試的關(guān)聯(lián)度越高。分A線和B線兩個層次進(jìn)行置信度分析。
從A線分析來看(表3),二診、三診置信度較低,尤其是二診,置信度僅60%~75%,說明當(dāng)次診斷考試是否上A線與高考是否上A線之間缺乏必要聯(lián)系,考試關(guān)聯(lián)度和有效性不足。一診置信度較高,達(dá)到95%~97.5%,即當(dāng)年一診是否上A線很大程度上決定高考是否上A線,兩者之間關(guān)聯(lián)度較高。
從B線分析來看(表4),診斷考試和高考B線之間置信度整體較A線偏高,尤其一診考試達(dá)到99.9%,關(guān)聯(lián)度很高。但二診測試仍不足85%,關(guān)聯(lián)度偏低。
三、結(jié)論與建議
1.一診試題質(zhì)量較高
無論是A0、A線、B優(yōu)線,與高考之間的關(guān)聯(lián)度均最大。即學(xué)生在一診考試中是否上線,上什么層次的線,很大程度上決定學(xué)生在高考中的上線情況。表明當(dāng)年一診試題質(zhì)量高,教學(xué)指引性較強(qiáng),對各個層次學(xué)生復(fù)習(xí)指導(dǎo)價值較大。
2.二診、三診試題質(zhì)量較低
二診、三診僅在B線與高考有較大關(guān)聯(lián)度,而A0、A線與高考之間關(guān)聯(lián)度較小。說明這兩次診斷性考試對中后段學(xué)生的測試有效度較高,具有較強(qiáng)指導(dǎo)價值和意義,但是對中前段學(xué)生的測試有效度較低,指導(dǎo)意義不大。
3.加強(qiáng)命題管理的建議
(1)加大診斷試題命制投入
高考試題命制的人力、財(cái)力、時間投入,都比診斷考試多,因而試題更加嚴(yán)謹(jǐn)合理。診斷考試的命題者多為一線教師,且命題待遇偏低、時間不足,難以更高標(biāo)準(zhǔn)保障診斷試題質(zhì)量。
故加大診斷考試投入力度,能更高標(biāo)準(zhǔn)保障過程性檢測質(zhì)量,從而提高日常教學(xué)、高考復(fù)習(xí)的針對性、指導(dǎo)性,更有利學(xué)科人才培養(yǎng)。
(2)強(qiáng)化命題質(zhì)量監(jiān)督和管理
試題質(zhì)量不能僅從平均分、區(qū)分度、是否存在學(xué)科爭議、學(xué)科認(rèn)知錯誤等方面評判。市級教育科學(xué)研究部門應(yīng)建立完善命題有效性追蹤制度,并合理運(yùn)用測試所得大數(shù)據(jù),根據(jù)上線人數(shù)、越線分差、置信度等分析診斷試題的效度、方向指導(dǎo)性價值等,建立量化考核評價機(jī)制并進(jìn)行倒追獎懲。
影響學(xué)生診斷成績和高考成績的因素還有教師教學(xué)風(fēng)格、學(xué)生考試身心狀態(tài)等。本研究對象數(shù)量偏低,無法完全規(guī)避上述因素帶來的質(zhì)量評價差異。通過更大范圍數(shù)據(jù)統(tǒng)計(jì)和分析,建立量化考核評價機(jī)制,能更有效對試題質(zhì)量進(jìn)行評價,是一種行之有效的命題質(zhì)量管理途徑和手段。