劉蓉 唐婷 李興杰 楊佳
摘要:本文主要應(yīng)用數(shù)理統(tǒng)計(jì)相關(guān)知識,通過試卷的難度、效度、區(qū)分度、信度和覆蓋度等質(zhì)量指標(biāo),來分析試卷。并在研究探討課程考試試卷質(zhì)量分析的測評指標(biāo)及其計(jì)算公式的基礎(chǔ)上, 結(jié)合評價(jià)方法,對我校2017級高等數(shù)學(xué)考試試卷質(zhì)量進(jìn)行了分析。
關(guān)鍵詞:質(zhì)量分析;數(shù)理統(tǒng)計(jì);分析試卷
試卷質(zhì)量的分析是評價(jià)考試質(zhì)量,檢驗(yàn)考試有效性的基本方法。運(yùn)用數(shù)理統(tǒng)計(jì)的方法,通過分析學(xué)生的成績,計(jì)算此套試卷的難度,效度,區(qū)分度,信度,覆蓋度,從而推斷此套試卷的合理性。
一、試卷質(zhì)量分析指標(biāo)
(一)難度
難度是指試卷或試題的難易程度??梢杂脤W(xué)生在某一道題的錯(cuò)誤率來反應(yīng)試題的難度,即難度系數(shù)(0< <1)。難度系數(shù)越大,即錯(cuò)的人數(shù)越多,該題難度越大。數(shù)學(xué)試卷上的選擇填空題答案唯一屬于客觀題, =答錯(cuò)該題人數(shù)/總?cè)藬?shù);計(jì)算題解法多樣,一般按步驟計(jì)分屬于主觀題: ( 指考生在某一考題得分的平均值; 指該題的滿分值)。
一套試卷試題偏難,應(yīng)該用于選拔考試,難題的比例可以拉開分值。試卷試題偏簡單,難以判斷學(xué)生對知識的掌握情況,也無法評估教學(xué)效果。試題的難度直接影響考試成績的分布形態(tài)和離散度。過難,總體考試成績偏低,呈正偏態(tài)分布;過易,總體考試成績偏高,呈負(fù)偏態(tài)分布。一般應(yīng)用于學(xué)校測試的高質(zhì)量試卷的難易程度應(yīng)該適中,平均難度系數(shù)控制在0.5左右,即難、中、易試題的比例2:6:2。
(二)效度
效度是指評價(jià)考試結(jié)果的有效性與正確性的指標(biāo)。
(三)區(qū)分度
區(qū)分度是區(qū)別被測對象對于該測試學(xué)科理解掌握程度高低的指標(biāo),它反映出被測對象水平的高低。如果對于某道題,水平高的同學(xué)得高分,水平低的同學(xué)得低分,那么就說明該題目的區(qū)分度高,如果所有的同學(xué)全得滿分或者全不得分,說明該題目區(qū)分度低。一般區(qū)分度高于0.3,說明該題目質(zhì)量不錯(cuò)。下面我們用公式準(zhǔn)確計(jì)算。
計(jì)算區(qū)分度的方法有很多,不同的方法所得結(jié)果不同,其中最常用的是極端分組法,即將學(xué)生按照第j題所得的分?jǐn)?shù)從高到低排列,前27%的學(xué)生組成高分組,后27%的學(xué)生組成低分組,那么第 題的區(qū)分度為 。其中 表示高分組在第 題的總得分, 表示低分組在第 題的總得分, 表示第 題應(yīng)得滿分乘以單組人數(shù)之和。一般區(qū)分度 > 0.4說明區(qū)分度高,題目質(zhì)量非常好, 在0.2~0.4說明題目質(zhì)量一般, < 0.2說明題目區(qū)分度非常差,需要修改或淘汰。試卷的區(qū)分度 ,其中當(dāng) > 0.4,試卷整體區(qū)分度為優(yōu); < 0.2為差。
(四)信度
信度是評價(jià)試卷質(zhì)量的一項(xiàng)重要指標(biāo)。信度表示的是該試卷測試結(jié)果的可靠性,即能否真實(shí)地反映應(yīng)試者的真實(shí)水平。當(dāng)一份試卷多次測驗(yàn),應(yīng)試者所答相同時(shí),那么我們說該試卷的可信度高,質(zhì)量是可靠的,能反應(yīng)出考生的真實(shí)水平。
信度可采用克朗巴赫系數(shù)公式計(jì)算, 其中, 表示第 題的方差, 表示試卷的總方差, 表示試卷中的題目個(gè)數(shù)。因此,信度的最大值是1,最小值是-1。反映信度大小的量是方差,各題的方差小,則試卷的信度高,反之則信度低。一般標(biāo)準(zhǔn)化考試要求 >0.9。
(五)覆蓋度
覆蓋度是指該試卷的考點(diǎn)與檢測周期內(nèi)知識點(diǎn)之比,一份試卷考察的知識點(diǎn)越廣泛,覆蓋度則越高,試卷的質(zhì)量越好。覆蓋度是難易度、區(qū)分度、置信度、校度作為衡量試卷質(zhì)量指標(biāo)的有效前題,覆蓋度越高,指標(biāo)的有效性越好。一份試卷一定要有廣泛的覆蓋度,對于重要的知識點(diǎn)要面面俱到,這樣考察才具有代表性。
覆蓋度不能直接計(jì)算出來,一般用各題得分之間的相關(guān)系數(shù)矩陣 表示,公式如下: ,其中 越大,說明題目之間的相關(guān)性越大,考點(diǎn)越相似,試卷的覆蓋度越小,所以 越小,試卷的覆蓋度越廣泛,質(zhì)量越好。一般要求 < 0.2,反之說明試卷考察范圍太單一,應(yīng)及時(shí)修改試卷內(nèi)容。
二、試卷指標(biāo)實(shí)例分析
應(yīng)用上述指標(biāo)對某班高等數(shù)學(xué)期末試卷進(jìn)行分析,該班參加測試人數(shù)為59人,試卷共5大題,通過計(jì)算結(jié)果如下:
在所選實(shí)例試卷的各項(xiàng)數(shù)據(jù)系數(shù)中,①在難度這一欄,各大題難度系數(shù)的平均值為0.344,說明該試卷試題難度偏易,同學(xué)們錯(cuò)誤率較低,難度系數(shù)在0.3附近其中第三、四、五大題相對比較容易,第一、二題難度相對較大。②此次所選試卷效度為0.7542,達(dá)到0.4以上,說明此試題能夠真實(shí)有效的反應(yīng)出學(xué)生的學(xué)習(xí)水平。③從各大題的區(qū)分度來看,都大于0.4,各大題的區(qū)分度有明顯差距,但總體來看是合理的,這些試題的質(zhì)量對很好,可以很好的區(qū)分出學(xué)生的水平④此次試卷的信度為0.71,信度一般,小于0.9沒有達(dá)到標(biāo)準(zhǔn)試卷的信度要求,信度受到影響的因素有很多,比如考場監(jiān)考情況、學(xué)生考試態(tài)度等等。⑤從覆蓋度的矩陣中看, < 0.2的居多說明此份試題的覆蓋面大,所涉及到的知識點(diǎn)很全面。
綜上所述,該套試卷整體難度偏低,試卷試題偏簡單,可以適當(dāng)?shù)靥岣咴嚲黼y度,有利于更好地評估教學(xué)效果。其它指標(biāo)良好,說明該試卷考點(diǎn)分布合理,考查面廣,考核較全面。
參考文獻(xiàn):
[1]盛聚, 等.概率論與數(shù)理統(tǒng)計(jì)[M]. 北京: 高等教育出版社,1989.
[2]郭述平,王景英.教育測量[M].長春:東北師范大學(xué)出版社,1987
[3]張玲,基于數(shù)理統(tǒng)計(jì)方法的試題,質(zhì)量的科學(xué)評價(jià)與分析[J],理論與實(shí)踐2018.(1):23-25
[4]萬金鳳. 關(guān)于試卷質(zhì)量的分析方法[J]. 山西師范大學(xué)學(xué)報(bào): 自然科學(xué)報(bào),2006,20(1):22-24.
[5]熊德云,張東軍.概率論與數(shù)理統(tǒng)計(jì)及其應(yīng)用[M].科學(xué)出版社,2005.
[6]朱德全, 宋乃慶.現(xiàn)代教育統(tǒng)計(jì)與測評技術(shù)[ M] .重慶:西南師范大學(xué)出版社, 1998 .