曾如明
(西華師范大學(xué)數(shù)學(xué)與信息學(xué)院,四川南充 637009)
成績(jī)分析與試卷分析是一次考試結(jié)束后應(yīng)該進(jìn)行的工作.試卷質(zhì)量分析是考察試卷能否客觀準(zhǔn)確的檢測(cè)出學(xué)生對(duì)知識(shí)的掌握程度以及衡量教師教學(xué)效果的重要依據(jù)[1].目前主要依據(jù)難度、區(qū)分度、信度及效度對(duì)試卷進(jìn)行綜合分析[2].已有的試卷質(zhì)量分析的相關(guān)文獻(xiàn)都是針對(duì)語(yǔ)言類試卷,這類試卷在同一題型下的各個(gè)小題的分?jǐn)?shù)設(shè)置基本相同,在計(jì)算試卷的信度時(shí),往往只需要將試題按照題目順序的奇偶進(jìn)行分半,計(jì)算所劃分的兩部分試題的分半信度,即可得到整張?jiān)嚲淼男哦?對(duì)理工科類的試卷質(zhì)量的分析卻比較少,是因?yàn)槔砉た祁愒嚲淼姆謹(jǐn)?shù)設(shè)置較為復(fù)雜,即使在同一題型下的各個(gè)小題之間的分?jǐn)?shù)都不盡相同,故在計(jì)算該類型試卷的信度時(shí),如果仍采用一般的奇偶分半法來計(jì)算折半信度,會(huì)使試卷整體的信度大幅降低.
目前已有眾多國(guó)內(nèi)學(xué)者展開了相關(guān)研究,主要以難度、區(qū)分度、信度及效度為指標(biāo)展開分析.艾尼瓦爾·斯地克,張 峰,再米熱·阿布都沙拉木[3]主要對(duì)試卷進(jìn)行定量和定性分析這兩方面展開說明,通過對(duì)試卷進(jìn)行質(zhì)量分析,為進(jìn)一步提高試卷的質(zhì)量積累經(jīng)驗(yàn);施俊,楊勇[4]首先簡(jiǎn)單介紹了SPSS軟件的作用與功能,然后詳細(xì)給出了利用SPSS軟件對(duì)試卷進(jìn)行難度、區(qū)分度、信度及效度分析的操作步驟;苗利明, 馮健文[5]首先分析了難度、區(qū)分度、信度及效度的主要應(yīng)用場(chǎng)合,然后利用這四個(gè)指標(biāo)對(duì)某高校2015級(jí)計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的軟件工程試卷進(jìn)行了詳細(xì)的試卷質(zhì)量分析;張敬東, 閆紅, 李付學(xué)[6]簡(jiǎn)要闡述了試卷分析的重要性,并提出試卷質(zhì)量分析主要從定性和定量?jī)蓚€(gè)方面進(jìn)行;石佳燦[7]運(yùn)用SPSS軟件,以某中學(xué)的一次科學(xué)考試的試卷展開分析,通過難度、區(qū)分度、信度及效度這四個(gè)指標(biāo)的計(jì)算結(jié)果發(fā)現(xiàn),該套試卷的試題設(shè)置較為合理,為日后考試試題的設(shè)置提供了模板;王劍華,向玉鸞,楊宏穎[8]等人對(duì)某高校2014-2018學(xué)年臨床醫(yī)學(xué)專業(yè)期末內(nèi)科學(xué)試卷成績(jī)展開了分析,結(jié)果發(fā)現(xiàn),該套試題的題目設(shè)置還有待改進(jìn);敖希琴,蔣靜,曹莉[9]利用SPSS軟件從定性及定量?jī)蓚€(gè)角度對(duì)試卷進(jìn)行質(zhì)量分析,并利用古林法確定難度、區(qū)分度、信度及效度這四個(gè)指標(biāo)的權(quán)重系數(shù),最后建立了基于這四個(gè)指標(biāo)的試卷綜合評(píng)價(jià)模型.
為此,本文以某高校16級(jí)高分子化學(xué)課程的試卷成績(jī)?yōu)槔?,運(yùn)用SPSS軟件對(duì)試卷進(jìn)行定量分析,并根據(jù)試卷分?jǐn)?shù)的設(shè)置采用合適的分半法將試題分為兩部分,然后采用折半信度計(jì)算整個(gè)試卷的信度.并對(duì)該課程教學(xué)過程中存在的問題以及需要改進(jìn)的環(huán)節(jié)進(jìn)行說明,意在促進(jìn)該高校高分子化學(xué)課程教學(xué)改革,提高高分子化學(xué)專業(yè)學(xué)生的專業(yè)技能,為以后工作打下良好的專業(yè)基礎(chǔ).
信度[10]即可靠信,它是指采用同樣的方法對(duì)同一對(duì)象測(cè)量時(shí)所得結(jié)果的一致性程度.通常信度包括:重測(cè)信度、復(fù)本信度、內(nèi)部一致信度、折半信度和評(píng)分者信度.而試卷的信度一般采用折半信度來衡量.折半信度是通過試卷的具體構(gòu)成,采用合適的分半方法將試卷的題目分為兩部分,通過二者的相關(guān)系數(shù)計(jì)算整張?jiān)嚲淼男哦?
效度[10]即有效性,它是指測(cè)量工具或手段能夠準(zhǔn)確測(cè)量出所需測(cè)量的事物的程度.效度包括:表面效度、內(nèi)容效度、校標(biāo)效度、內(nèi)在效度和外在效度.試卷的效度通常包括內(nèi)容效度和校標(biāo)效度.
試卷中每一題的難度[11]通過難度系數(shù)來反映.難度系數(shù)是衡量試卷設(shè)置合理性的指標(biāo)之一,一份好的試卷應(yīng)該設(shè)置合適的難度系數(shù),難度系數(shù)既不能太大,也不能太小,例如,高考數(shù)學(xué)試卷的前幾個(gè)選擇題的難度系數(shù)一般較低,是為了考察學(xué)生對(duì)基礎(chǔ)知識(shí)的掌握情況,而最后幾個(gè)選擇題的難度系數(shù)一般較高,是為了篩選出較為優(yōu)秀的學(xué)生,其他題型的設(shè)置也是如此.本文中,每一題的難度系數(shù)=1-該題平均分/該題總分.
區(qū)分度[11]是衡量試卷質(zhì)量的主要指標(biāo)之一.試卷區(qū)分度能夠?qū)W(xué)生分為優(yōu)秀、一般、較差三個(gè)層次.一份好的試卷應(yīng)使得優(yōu)秀、一般、差三個(gè)層次的學(xué)生都有一定比例,如果某一分?jǐn)?shù)區(qū)間學(xué)生相對(duì)集中,高分太多或不及格太多的考試,則認(rèn)為區(qū)分度低,試卷試題設(shè)置不合理.通常情況下,D>0.4,認(rèn)為此題的區(qū)分度很好;0.3 對(duì)某高校2016級(jí)參加高分子化學(xué)課程考試的66位考生的試卷得分進(jìn)行分析,試卷滿分100分.包括四個(gè)大題,第一大題,填空題,共14個(gè)小題,34分;第二大題,合成題,共4個(gè)小題,16分;第三大題,選擇題,共10個(gè)小題,20分;第四大題,計(jì)算題,共3個(gè)小題,30分.基本得分情況如下表1-4: 圖1 總分直方圖Fig.1 The column diagram of total points圖2 總分箱線圖Fig.2 The boxplot graph of total points 由直方圖和箱線圖可知,全班平均分為69.83分,學(xué)生成績(jī)大致服從正態(tài)分布,且學(xué)生成績(jī)相對(duì)集中,沒有異常值出現(xiàn).大致認(rèn)為該套試題內(nèi)容設(shè)置合理,能夠較好的反應(yīng)學(xué)生平時(shí)的學(xué)習(xí)情況. 表1到表4為該套試卷每一小題下的具體得分情況及難度系數(shù)與區(qū)分度,從每個(gè)題的難度系數(shù)來看,第一大題填空題里的每個(gè)小題的難度適中,但區(qū)分度卻很大,說明部分學(xué)生的基礎(chǔ)知識(shí)掌握的不太扎實(shí),而老師的選題卻很經(jīng)典;同樣的,第二大題每個(gè)題目的選取也很有代表性;第三大題的第五個(gè)選擇題的區(qū)分度僅有0.06,表明該題的選取不太合適,可以將其刪除或修改;第四大題的每個(gè)小題的難度和區(qū)分度都很適中.總的來說,該套試題題目的設(shè)置能夠較好的反應(yīng)該班學(xué)生在這一時(shí)期的學(xué)習(xí)情況. 表1 填空題得分情況表Tab.1 The marks of Completion 由于是考試,故重測(cè)信度,復(fù)本信度等其他信度不適合用來判斷考試試卷的信度,本文選擇折半信度.該套試題只有四種類型題,且每一類型大題下又設(shè)有個(gè)數(shù)、難度、區(qū)分度不等小題,所以不能依據(jù)傳統(tǒng)的奇偶分半法把試卷簡(jiǎn)單分為兩部分,且每一大題中每一小題的分值設(shè)置不同,故不能直接把每一大題下的小題按所處題項(xiàng)的奇、偶分為兩部分,而是根據(jù)兩部分試題總分、區(qū)分度基本相同的原則將試題進(jìn)行劃分.為了做到兩部分試題區(qū)分度,總分基本相同,選擇第一大題的1-7小題,第二大題的第2、4題,第三大題的1、2、4、5、10題和第四大題的1、3題做為分半的一部分,其余題目做為另一部分.此時(shí)第一部分包括16個(gè)小題,共51分;第二部分包括15個(gè)小題,共49分.且第一部分總的區(qū)分度為11.77,第二部分總的區(qū)分度為11.86. 首先根據(jù)公式(1),計(jì)算兩部分試題的折半信度系數(shù)為0.82,(其中,N表示試卷的份數(shù),x1表示第一部分試卷的得分,x2表示第二部分試卷的得分)0.82>0.7,表明兩部分試題有較好的一致性.接著根據(jù)公式(2)計(jì)算可得整個(gè)試卷的信度為0.90,表明整張?jiān)嚲砭哂泻芎玫男哦? (1) (2) 校標(biāo)關(guān)聯(lián)效度是測(cè)量試卷有效程度的主要方式.通過選擇合適的校標(biāo),計(jì)算學(xué)生本次考試成績(jī)與所選校標(biāo)之間的相關(guān)系數(shù),能夠較準(zhǔn)確地測(cè)試出學(xué)生掌握和運(yùn)用所學(xué)知識(shí)的真實(shí)度.校標(biāo)即為一種參照標(biāo)準(zhǔn),常見的效標(biāo)主要有平時(shí)成績(jī)、等級(jí)評(píng)定、臨床診斷、特殊訓(xùn)練成績(jī)、實(shí)際工作表現(xiàn)、對(duì)團(tuán)體的區(qū)分、其他測(cè)驗(yàn)成績(jī)等. 好的校標(biāo)測(cè)量應(yīng)滿足: 1)校標(biāo)測(cè)量必須真實(shí)的反應(yīng)觀念校標(biāo)的重要側(cè)面; 2)校標(biāo)測(cè)量必須穩(wěn)定、可靠; 3)校標(biāo)測(cè)量必須客觀,避免偏見; 4)在保證有效性的前提下,校標(biāo)測(cè)量必須盡可能簡(jiǎn)單、省時(shí)、花費(fèi)少. 基于以上原則并考慮到工科類考生不僅得掌握理論知識(shí),更要注重實(shí)踐這一特點(diǎn),故選擇參與本次高分子化學(xué)課程的考生的平時(shí)成績(jī)與實(shí)驗(yàn)成績(jī)作為校標(biāo).首先計(jì)算每位考生平時(shí)成績(jī)與實(shí)驗(yàn)成績(jī)的平均分作為本次考試試卷的校標(biāo),再計(jì)算考試成績(jī)與所選校標(biāo)之間的校標(biāo)關(guān)聯(lián)系數(shù),一般來說,效度系數(shù)在 0.4 到 0.7 之間符合標(biāo)準(zhǔn),效度值越大效度越高.借助SPSS軟件19.0,計(jì)算可得二者之間的相關(guān)系數(shù)如下表所示: 由表5可以看出本次考試成績(jī)與所選校標(biāo)在顯著性水平為0.01下的相關(guān)系數(shù)是顯著的,即學(xué)生的考試成績(jī)與平時(shí)成績(jī)及實(shí)驗(yàn)成績(jī)相關(guān)性較強(qiáng),本次考試基本上反映了學(xué)生平時(shí)的學(xué)習(xí)情況,故效度基本符合要求. 對(duì)試卷進(jìn)行合理、有效的試卷分析,既能客觀的評(píng)價(jià)教師的教學(xué)效果,也能有效的掌握學(xué)生的學(xué)習(xí)狀況,方便教師及時(shí)發(fā)現(xiàn)課程教學(xué)所存在的問題,以便做出調(diào)整.試卷質(zhì)量分析主要從難度、區(qū)分度、信度及效度四個(gè)指標(biāo)展開.若通過折半系數(shù)來反映試卷的信度,要對(duì)試卷采用合適的分半方法,不同的分半方法會(huì)影響對(duì)試卷信度的判斷.對(duì)于各題型設(shè)置下每一小題分?jǐn)?shù)不盡相同的試卷,也可以使用分半信度系數(shù)來判斷試卷的信度.此時(shí),不能直接按照題目序號(hào)采用奇偶分半法,而要根據(jù)兩部分試題題量、總分、區(qū)分度基本相同的原則將試卷分為兩部分,進(jìn)而計(jì)算試卷整體的信度系數(shù).校標(biāo)效度是最為常用的試卷效度的衡量方式,對(duì)于工科類學(xué)生,不僅要掌握基本的理論知識(shí),更要重視實(shí)際操作,故將平時(shí)成績(jī)與實(shí)驗(yàn)成績(jī)相結(jié)合作為校標(biāo),能更好的體現(xiàn)校標(biāo)的客觀性.2 研究過程
2.1 卷基本情況
2.2 試卷的難度與區(qū)分度
2.2 信度分析
2.3 效度分析
4 結(jié)束語(yǔ)