敖希琴,蔣靜,曹莉
(安徽新華學(xué)院信息工程學(xué)院,安徽合肥230088)
基于SPSS的試卷質(zhì)量分析與建模
敖希琴,蔣靜,曹莉
(安徽新華學(xué)院信息工程學(xué)院,安徽合肥230088)
試卷質(zhì)量分析是考察試卷能否客觀準(zhǔn)確的檢測(cè)出學(xué)生對(duì)知識(shí)的掌握程度。為此借助SPSS對(duì)試卷考核結(jié)果進(jìn)行各類基本統(tǒng)計(jì)描述分析,將難度、區(qū)分度、信度以及效度作為試卷綜合質(zhì)量評(píng)價(jià)的指標(biāo)體系,并通過(guò)調(diào)研確定各個(gè)指標(biāo)間重要程度系數(shù),然后采用古林法確定各個(gè)指標(biāo)的權(quán)重,最終建立一個(gè)計(jì)算試卷綜合質(zhì)量系數(shù)的通用數(shù)學(xué)模型,從而為科學(xué)編制試題提供依據(jù)。
SPSS;指標(biāo)體系;古林法;試卷綜合質(zhì)量系數(shù)
考試結(jié)束后開(kāi)展的試卷分析工作是衡量教師教學(xué)效果的重要依據(jù)。合理、有效、可靠的試卷分析有助于教師科學(xué)的開(kāi)展教學(xué)過(guò)程組織和考試命題工作。目前,試卷分析主要是針對(duì)一份試卷的難度、信度等指標(biāo)進(jìn)行分析[1],對(duì)于兩份或多份試卷質(zhì)量比較的研究較少,并且未形成一套科學(xué)嚴(yán)謹(jǐn)?shù)脑u(píng)價(jià)體系及模型。為此本課題借助統(tǒng)計(jì)分析軟件SPSS,對(duì)試卷考核結(jié)果進(jìn)行基本統(tǒng)計(jì)描述分析,以及難度、區(qū)分度、信度以及效度的分析,建立一個(gè)通用的計(jì)算試卷綜合質(zhì)量系數(shù)的數(shù)學(xué)模型,可以計(jì)算任何一份試卷的綜合質(zhì)量系數(shù),進(jìn)行不同試卷間質(zhì)量的比較,從而為反饋教學(xué)效果、評(píng)價(jià)教學(xué)質(zhì)量和科學(xué)編制試題提供依據(jù)。
1.1 試卷基本情況
為保證研究的隨機(jī)性與準(zhǔn)確性,從13級(jí)財(cái)務(wù)管理1~10班中,隨機(jī)抽取了7班和10班所有學(xué)生的“管理信息系統(tǒng)A”期末試卷作為研究樣本,共110份樣本。試卷共4類題型,滿分100分,試卷結(jié)構(gòu)如表1所示。
表1 試卷結(jié)構(gòu)
1.2 數(shù)據(jù)的錄入
根據(jù)試卷結(jié)構(gòu),借助SPSS軟件,共設(shè)計(jì)了29個(gè)變量,分別用來(lái)存放學(xué)生學(xué)號(hào)、各小題得分和總分等,根據(jù)學(xué)生試卷得分情況錄入成績(jī),如圖1所示。
圖1 學(xué)生成績(jī)表
1.3 基本描述分析
首先,對(duì)數(shù)據(jù)的分布特征進(jìn)行描述。本課題選用的統(tǒng)計(jì)量為極大值、極小值、均值和標(biāo)準(zhǔn)差,對(duì)各題的得分情況進(jìn)行基本統(tǒng)計(jì)描述分析。借助于SPSS軟件對(duì)統(tǒng)計(jì)描述過(guò)程進(jìn)行分析,結(jié)果如表2所示。
表2 描述統(tǒng)計(jì)量
其次,對(duì)總分的分布狀態(tài)進(jìn)行考察。本課題選用了直方圖和箱圖對(duì)數(shù)據(jù)的分布情況進(jìn)行了展示,如圖2,3所示。
圖2 總分直方圖
圖3 總分箱圖
由直方圖可觀察到,學(xué)生試卷總分基本服從正態(tài)分布;由箱圖可觀察到,其中學(xué)號(hào)為53的學(xué)生,總分較低,被系統(tǒng)列為異常值。
在教育測(cè)量理論[2]中,主要按照試卷的難度P、區(qū)分度D、信度R及效度V這4個(gè)指標(biāo)對(duì)試卷的質(zhì)量進(jìn)行分析。
2.1 難度系數(shù)
難度系數(shù)是評(píng)價(jià)試卷質(zhì)量的主要指標(biāo)之一,旨在檢測(cè)試卷題目的難易程度。通常用字母P表示難度系數(shù),取值在0和1之間。如果考試試題被大部分學(xué)生答對(duì),則難度等級(jí)較?。蝗绻蟛糠謱W(xué)生沒(méi)答對(duì),則難度等級(jí)較大。
對(duì)于試卷中的客觀題和主觀題,可以通過(guò)常用的難度系數(shù)計(jì)算公式P=1-X/W來(lái)計(jì)算,其中X為學(xué)生在該題得分的平均值,W為該題的滿分值。對(duì)于客觀題,學(xué)生在答題時(shí)可能隨機(jī)猜測(cè)給出答案,為排除因隨機(jī)猜測(cè)對(duì)難度系數(shù)的影響,需要先計(jì)算出難度系數(shù)P,然后再根據(jù)難度系數(shù)矯正公式[3]CP=(kp-1)/(k-1)計(jì)算出矯正的難度系數(shù)CP,其中k為選項(xiàng)個(gè)數(shù)。通過(guò)難度系數(shù)公式可以看出,P值越小,表明試題越簡(jiǎn)單;P值越大,表明試題越難。本課題樣本試卷中各題難度系數(shù)計(jì)算結(jié)果如表3。
表3 各題難度系數(shù)
由難度系數(shù)結(jié)果可知,該試卷的選擇題和簡(jiǎn)答題難度系數(shù)較低,主要是對(duì)基礎(chǔ)知識(shí)點(diǎn)的考察;應(yīng)用題屬于中等難度題;案例分析題屬于偏高難度題,主要考察學(xué)生對(duì)知識(shí)點(diǎn)的綜合應(yīng)用能力。
2.2 區(qū)分度
區(qū)分度,即試題的鑒別力,是指一道題能多大程度上區(qū)分被測(cè)試對(duì)象水平等級(jí)的能力。在進(jìn)行區(qū)分度分析時(shí),考試總分通常反映出被測(cè)試對(duì)象的實(shí)際能力水平,某題的區(qū)分度是指該題的得分與總分之間的相關(guān)系數(shù)。因客觀題屬于順序數(shù)據(jù)類型,主觀題屬于非等間距測(cè)度的連續(xù)變量,在對(duì)客觀題和主觀題進(jìn)行區(qū)分度分析時(shí),通常分別采用斯皮爾曼等級(jí)相關(guān)分析和皮爾森相關(guān)分析。前者是求每道試題得分與總分之間的斯皮爾曼等級(jí)相關(guān)系數(shù),后者是求每道試題得分與總分之間的皮爾森相關(guān)系數(shù)[4]。借助于SPSS軟件,各題區(qū)分度的評(píng)價(jià)結(jié)果如表4所示。
表4 各題區(qū)分度系數(shù)
一般來(lái)說(shuō),若區(qū)分度小于0.2,說(shuō)明該試題對(duì)學(xué)生能力考察的區(qū)分度較差,在0.2和0.5之間屬于中等水平,0.5以上說(shuō)明區(qū)分度良好。從本案例的區(qū)分度分析結(jié)果可知,其中簡(jiǎn)答題和應(yīng)用題有較好的區(qū)分度,選擇題和案例分析題屬于基礎(chǔ)題和拔高題,區(qū)分度一般。
2.3 信度系數(shù)
通常將檢測(cè)結(jié)果的一致性、穩(wěn)定性及可靠性作為試卷分析的信度,一般將一致性作為反映測(cè)驗(yàn)信度高低的標(biāo)志。信度系數(shù)愈高說(shuō)明該測(cè)驗(yàn)的結(jié)果愈穩(wěn)定可靠。在統(tǒng)計(jì)學(xué)中一般采用科隆巴赫α系數(shù)來(lái)表示信度系數(shù),它可以計(jì)算任何測(cè)驗(yàn)的內(nèi)部一致性。本課題中樣本信度系數(shù)計(jì)算結(jié)果如表5所示,由結(jié)果可知該試卷的可靠性良好。
表5 信度系數(shù)
2.4 效度系數(shù)
效度是指測(cè)量的結(jié)果能夠體現(xiàn)所要檢測(cè)內(nèi)容的有效性,效度愈高說(shuō)明測(cè)量結(jié)果愈符合所要考察的內(nèi)容。本課題所研究的效度是指試卷能夠準(zhǔn)確反映考試所想檢測(cè)內(nèi)容的程度,亦指考試結(jié)果是否與被考察學(xué)生的實(shí)際能力水平相一致。
效標(biāo)關(guān)聯(lián)效度法通常被用來(lái)作為效度檢驗(yàn)的方法之一。首先確定一種可靠度高的效標(biāo),保證其能夠反映被測(cè)試對(duì)象的實(shí)際能力水平,繼而計(jì)算出測(cè)試結(jié)果與效標(biāo)之間的相關(guān)系數(shù),該相關(guān)系數(shù)即為效度系數(shù),亦即所求的效標(biāo)關(guān)聯(lián)效度[5]。本課題中把學(xué)生的平時(shí)成績(jī)作為效度分析的效標(biāo),利用皮爾森(Pearson)相關(guān)分析求效度,借助SPSS軟件,可得結(jié)果如表6所示,由結(jié)果可知,本課題中的試卷樣本效度良好。
表6 效度系數(shù)
為建立試卷質(zhì)量的綜合評(píng)價(jià)模型,并保證模型的準(zhǔn)確性與有效性,根據(jù)課題的研究思路,對(duì)本校十多位經(jīng)驗(yàn)豐富的老教師及教授進(jìn)行了訪問(wèn)調(diào)研,主要調(diào)研內(nèi)容為指標(biāo)的量化及指標(biāo)重要程度,為模型的建立奠定了基礎(chǔ)。
3.1 指標(biāo)體系的建立
通過(guò)上述研究可知,難度、區(qū)分度、信度、效度這4個(gè)指標(biāo)是對(duì)試卷質(zhì)量情況進(jìn)行評(píng)價(jià),因此,本課題選用這4個(gè)系數(shù)作為試卷綜合質(zhì)量評(píng)價(jià)模型的指標(biāo)體系。但對(duì)于某些指標(biāo)并非系數(shù)取值越高就越好,例如,對(duì)于普通的期末測(cè)試,難度系數(shù)應(yīng)在0.7~0.8范圍內(nèi)是最適中的,而對(duì)于信度系數(shù)和效度系數(shù),則是取值越高代表試卷質(zhì)量越好。因此,為統(tǒng)一各指標(biāo)對(duì)試卷質(zhì)量的影響程度,本課題提出將這4個(gè)指標(biāo)按照系數(shù)區(qū)間進(jìn)行量化。通過(guò)調(diào)研,可得各指標(biāo)的量化結(jié)果如表7的所示。例如,若系數(shù)區(qū)間在0.7~0.8范圍內(nèi),難度系數(shù)得分為3分,區(qū)分度系數(shù)得分為8分,信度系數(shù)得分為8分,效度系數(shù)得分為8分。
表7 各指標(biāo)得分量化表
3.2 指標(biāo)權(quán)重的確定
權(quán)重即每個(gè)評(píng)價(jià)指標(biāo)在試卷質(zhì)量綜合評(píng)價(jià)時(shí)所占的比重,表明了該指標(biāo)在評(píng)價(jià)試卷質(zhì)量時(shí)的重要程度。根據(jù)本課題中指標(biāo)體系的特點(diǎn),將古林法[6]作為確定各指標(biāo)權(quán)重的方法。具體如下。
(1)確定評(píng)價(jià)指標(biāo)的重要度Rj。如表8所示,按自上而下的原則對(duì)評(píng)價(jià)項(xiàng)目進(jìn)行兩兩比較,并用數(shù)值說(shuō)明其重要性。通過(guò)調(diào)研可得到以下結(jié)論:難度系數(shù)的重要程度是區(qū)分度系數(shù)的1.8倍、區(qū)分度系數(shù)是效度系數(shù)的1.5倍,效度系數(shù)是信度系數(shù)的1.2倍,然后填入表Rj一列中。
表8 指標(biāo)系數(shù)權(quán)重表
(2)Rj的基準(zhǔn)化處理。設(shè)基準(zhǔn)化處理結(jié)果為Tj,將最后一個(gè)評(píng)價(jià)指標(biāo)作為基準(zhǔn),設(shè)其T值為1,自下而上計(jì)算出其他評(píng)價(jià)項(xiàng)目的T值,直至求出所有的T值。
(3)Tj的歸一化處理。對(duì)Tj列的數(shù)值進(jìn)行求和,分別除以各行的T值,所得的結(jié)果即分別為各評(píng)價(jià)項(xiàng)目的權(quán)重Wj。
3.3 模型的建立
由上述兩個(gè)過(guò)程,可得試卷質(zhì)量綜合評(píng)價(jià)的各個(gè)指標(biāo)以及相應(yīng)的權(quán)重,所得試卷質(zhì)量綜合評(píng)價(jià)系數(shù)S模型如下
其中P′為試卷平均難度系數(shù)量化后的得分,D′為試卷平均區(qū)分度系數(shù)量化后的得分,R′為試卷信度系數(shù)量化后的得分,V′為試卷效度系數(shù)量化后的得分,Wj分別為各指標(biāo)的權(quán)重。試卷綜合質(zhì)量系數(shù)S取值在0和10之間,系數(shù)越大,說(shuō)明該試卷質(zhì)量越好。
3.4 模型的應(yīng)用
根據(jù)已建立的模型來(lái)計(jì)算本課題中樣本試卷的綜合質(zhì)量系數(shù)根據(jù)該試卷各指標(biāo)的系數(shù)區(qū)間,平均難度系數(shù)為0.255,平均區(qū)分度系數(shù)為0.677,信度系數(shù)為0.768,效度系數(shù)為0.657,由量化表可得各指標(biāo)系數(shù)量化得分分別為10,8,8和7分,由試卷綜合質(zhì)量系數(shù)(1)式,可計(jì)算出該試卷的綜合質(zhì)量系數(shù)為8.756,說(shuō)明該份試卷的綜合質(zhì)量良好。
在總結(jié)已有研究的基礎(chǔ)上,將難度、區(qū)分度、信度和效度等4項(xiàng)普遍采用的試卷質(zhì)量評(píng)價(jià)指標(biāo)作為試卷綜合質(zhì)量系數(shù)評(píng)價(jià)的指標(biāo)體系,并通過(guò)古林法確定了各評(píng)價(jià)指標(biāo)的權(quán)重,最終建立了試卷綜合質(zhì)量系數(shù)的計(jì)算模型。每份試卷都可以根據(jù)最終成績(jī)計(jì)算出難度、區(qū)分度、信度及效度,因此該模型具有一定的通用性,適用于任意類型試卷的綜合質(zhì)量系數(shù)的計(jì)算,也可用于不同試卷間質(zhì)量的比較,具有一定的現(xiàn)實(shí)意義。
[1]王本洋.試卷質(zhì)量分析的數(shù)學(xué)模型及其R語(yǔ)言實(shí)現(xiàn)[J].長(zhǎng)江大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,9(8):114-116.
[2]杜玉霞,梁武,方玲玲.高等數(shù)學(xué)試卷成績(jī)分析中的應(yīng)用[J].洛陽(yáng)師范學(xué)院學(xué)報(bào),2015,32(2):89-91.
[3]李玲.基于SPSS軟件的《計(jì)算機(jī)基礎(chǔ)》試卷分析[J].遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,39(1):54-58.
[4]劉偉東,屈華,石萍,等.試卷分析的量化與規(guī)范化[J].遼寧工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2012,14(4):100-102.
[5]韓放.試卷分析的算法應(yīng)用研究[D].大連:大連海事大學(xué),2010. [6]汪應(yīng)洛.系統(tǒng)工程[M].北京:機(jī)械工業(yè)出版社,2011:114-120.
Analysisand Modeling of Test Paper Quality Base on SPSS
AO Xi-qin,JIANG Jin,CAO Li
(Institute of Information Engineering,Anhui Xinhua University,Hefei,Anhui 230088,China)
The analysis of test paper quality is investigated for detection of the test paper,which is able to detect students'mastery of knowledge objectively and accurately.For this purpose,we use SPSS to analyze the results of the test papers.On the basis of summarizing the existing research,the difficulty,discrimination,reliability and validity are used as the index system of the comprehensive quality evaluation of the test paper,and the important degree coefficient of each index is determined through the investigation.Then the weight of each index is determined by the A.I.Kleemethod.Finally,a general mathematicalmodel is established to calculate the comprehensive quality coefficient of the test paper,the purpose is to provide the basis for the scientific establishmentof the testquestions.
SPSS;index system;A.I.Kleemethod;comprehensive quality coefficientof test paper
O213.9
A
1007-4260(2016)04-0037-04
時(shí)間:2017-1-3 17:19
http://www.cnki.net/kcms/detail/34.1150.N.20170103.1719.011.html
2016-04-20
安徽省高校自然科學(xué)重點(diǎn)項(xiàng)目(KJ2015A309)和安徽省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201512216030)。
敖希琴,女,安徽合肥人,碩士,安徽新華學(xué)院信息工程學(xué)院講師,研究方向?yàn)閿?shù)據(jù)分析處理。E-mail:424220838@qq.com
10.13757/j.cnki.cn34-1150/n.2016.04.011