王瑞雪
摘 要:本文從語言測(cè)試相關(guān)理論的角度,對(duì)銅陵市第六中學(xué)初二年級(jí)某班級(jí)期中英語考試進(jìn)行試卷分析,利用SPSS軟件,對(duì)試卷的整體結(jié)構(gòu)、信度進(jìn)行分析,并以單項(xiàng)選擇題為客觀題代表進(jìn)行難度及區(qū)分度的統(tǒng)計(jì),以此探究試題質(zhì)量和學(xué)生的表現(xiàn)情況。此項(xiàng)分析與研究不僅有利于審改題目、建立試題庫,更有利于從學(xué)生和教師兩個(gè)角度找到最有利于提高學(xué)習(xí)成績和學(xué)習(xí)效率的方法。
關(guān)鍵詞:SPSS軟件 ?語言測(cè)試 ?試卷分析 ?信度
一、 引言
語言測(cè)試是近幾十年來研究較多的熱門學(xué)科,它屬于應(yīng)用語言學(xué)的范疇,涉及計(jì)算機(jī)、教學(xué)法、二語習(xí)得和心理語言學(xué)等多方面領(lǐng)域的知識(shí)。通常來說,語言測(cè)試針對(duì)的是對(duì)外語的測(cè)試,因此在外語教學(xué)中有著舉足輕重的作用。從歷史發(fā)展的角度來說,語言測(cè)試可以分為四個(gè)階段,分別是科學(xué)前時(shí)期、結(jié)構(gòu)主義時(shí)期、社會(huì)語言學(xué)時(shí)期和交際語言測(cè)試時(shí)期,四個(gè)時(shí)期所關(guān)注的測(cè)試內(nèi)容和方法都有所不同。
二、信度和試卷分析
信度指測(cè)試成績的一致性,充分反映了成績與試題、試題與應(yīng)試者之間的關(guān)系。信度一般受以下因素影響:試題質(zhì)量、測(cè)試的組織及最后試卷的評(píng)閱情況。為了保證測(cè)試的高信度,試卷應(yīng)包含足夠的試題量。一般來說,試題量越大,試卷的信度越高。此外,試卷應(yīng)具備能夠區(qū)分不同成績等級(jí)學(xué)生的區(qū)分度。試題的難度應(yīng)適中,太難或太簡(jiǎn)單都無法對(duì)學(xué)生的水平做出足夠的區(qū)分。最后,試卷的評(píng)閱工作應(yīng)保持一致。
試卷分析是指利用計(jì)算機(jī)和軟件對(duì)測(cè)試的結(jié)果進(jìn)行數(shù)據(jù)分析,對(duì)提高測(cè)試水平和未來的測(cè)試準(zhǔn)備工作起著十分重要的作用。測(cè)試者可以借此將優(yōu)秀的試題放入試題庫,分析和試題修正之間的相互循環(huán)可以有效地使試題庫更加合理與科學(xué)。正因如此,很多大型考試的組織者會(huì)將試卷分析與閱卷評(píng)分放在同等重要的位置,并將其作為整個(gè)測(cè)試過程的重要組成部分。
三、 研究方法
本研究的樣本來自一次八年級(jí)學(xué)生的期中英語測(cè)試,因此研究對(duì)象為此次測(cè)試的成績和試卷。在剛過去的半學(xué)期中,該班級(jí)學(xué)生對(duì)大綱要求的詞匯和語法進(jìn)行了系統(tǒng)的學(xué)習(xí),這也正是本次測(cè)試的主要內(nèi)容,目的是為了檢測(cè)該班級(jí)學(xué)生是否掌握了過去半學(xué)期所應(yīng)該掌握的知識(shí)。對(duì)于本次研究,此數(shù)據(jù)真實(shí)可靠,具有可信度。
SPSS作為分析測(cè)試成績的工具,在測(cè)試分析當(dāng)中運(yùn)用十分廣泛。本文首先對(duì)試卷的整體結(jié)構(gòu)進(jìn)行概述和分析,包括試題分布,基于原始成績的成績分布直方圖,計(jì)算難度與區(qū)分度。作者試圖利用SPSS計(jì)算整張?jiān)嚲淼男哦龋雾?xiàng)選擇題作為客觀題代表,進(jìn)行進(jìn)一步分析。通過對(duì)其數(shù)據(jù)的統(tǒng)計(jì)和F.V.(易度系數(shù)),DI(區(qū)分度)數(shù)值的計(jì)算,在分析試題和原因的基礎(chǔ)之上對(duì)教學(xué)和試題的設(shè)計(jì)提出建議。
四、基于SPSS的具體試卷分析
(一)試卷結(jié)構(gòu)
整份試卷共分為六個(gè)部分,分別是單項(xiàng)選擇、完形填空、閱讀理解、詞匯、補(bǔ)全對(duì)話和寫作,其中除寫作是主觀題以外,其他五項(xiàng)均為客觀題。雖題型多樣,但試卷所測(cè)試的內(nèi)容主體為語法。本次測(cè)試是一次期中考試,目的在于測(cè)試學(xué)生是否掌握了過去半學(xué)期所學(xué)習(xí)的語法和詞匯,因此將大部分分值的試題設(shè)計(jì)成了客觀題,以此來測(cè)試學(xué)生的基本知識(shí),整體上來說,試卷的設(shè)計(jì)是相對(duì)公平合理的,能夠滿足測(cè)試的要求和目的。
(二)成績分析
下表反映了本次期中測(cè)試的一系列描述性數(shù)據(jù)以及整體成績分布直方圖。從成績分布直方圖來看,比較集中的分?jǐn)?shù)段是40—50、70—90,這兩個(gè)分?jǐn)?shù)段之間差距很大,說明學(xué)生的水平之間有很大的差異。任課教師應(yīng)該對(duì)低于50分的學(xué)生給予更多的關(guān)注,此水平的學(xué)生基數(shù)比較大,他們?nèi)狈δ軌蚪忸}的足夠基本知識(shí),應(yīng)該在課后多加強(qiáng)基礎(chǔ)知識(shí)的練習(xí)。同時(shí),70—90分?jǐn)?shù)段的學(xué)生數(shù)量也比較多,他們多為班級(jí)中優(yōu)良等級(jí)的學(xué)生,已經(jīng)掌握了大部分的所學(xué)知識(shí),可能這部分學(xué)生需要注意的就是提高練習(xí)和應(yīng)試技巧的問題,任課教師可針對(duì)這部分學(xué)生采取一些有效措施,如加強(qiáng)提高練習(xí)、對(duì)難點(diǎn)進(jìn)行梳理等。對(duì)于整個(gè)班級(jí)而言,高分組和低分組的同學(xué)結(jié)對(duì)互助學(xué)習(xí)也是有效且廣而行之的方法之一。
表一 描述性數(shù)據(jù)
表二 成績分布直方圖
(三)選擇題分析
1.信度
作為客觀題的典型代表,單項(xiàng)選擇題似乎是在無論大型還是小型考試中不可或缺的一種題型。在單項(xiàng)選擇這種題型中,選項(xiàng)和題干的多樣性很容易給學(xué)生造成迷惑,它的目的在于考查學(xué)生對(duì)知識(shí)的掌握情況,以及學(xué)生分析和辨別的技巧。因此,本文作者特意將單項(xiàng)選擇這一題型作為客觀題代表在SPSS數(shù)據(jù)分析的基礎(chǔ)上深入探討。
表三 ?信度
表四
表三和表四是基于SPSS的統(tǒng)計(jì)分析結(jié)果,其中表三顯示的是整個(gè)單項(xiàng)選擇的信度,表四反映的是單項(xiàng)選擇題中每道題的信度和整個(gè)單選題的信度對(duì)比。從表格當(dāng)中可以看出,大部分的選擇題信度都很符合整體的信度值,但其中也不乏少數(shù)相對(duì)信度值比較低的題目,因此在建立題庫時(shí),應(yīng)該有所舍棄。
2.D.I. 和FV數(shù)值計(jì)算與分析
表五 ?D.I. 和FV
表五給出的是單項(xiàng)選擇題中每道題的D.I.和FV值。理論上易度系數(shù)值應(yīng)該處在0到1之間,易度系數(shù)越高,題目則越簡(jiǎn)單。但通常情況下,為了保證題目不會(huì)太難或太簡(jiǎn)單,理想的易度系數(shù)值應(yīng)控制在0.3到0.7之間。從上表的數(shù)據(jù)來看,大部分的題目則未處于這個(gè)理想的范圍內(nèi),且題目設(shè)置過于簡(jiǎn)單。然而,結(jié)合之前給出的學(xué)生成績數(shù)據(jù)可看出,學(xué)生并沒有在這一部分得到很高的分?jǐn)?shù),為了探究這其中的原因,作者接下來將會(huì)從選擇題中抽取幾個(gè)例子來分析。
Item 4: Don't waste water again, or we will ? ? ? ? ?it one day.
A. look out ? B. take out ? C. run out of ? D. get out of
診斷1:在這道題中,四個(gè)選項(xiàng)均為關(guān)于out的短語,意義實(shí)則有很大差異,若學(xué)生無法清楚區(qū)分四者之間意義和用法上的區(qū)別,則無法最終選出正確答案,因此這題具有很高的區(qū)分度。
Item 17: She asks me if it ? ? ? ? tomorrow. If it ? ? ? ? ? ?tomorrow, she will go camping with me.
A. will rain; won't rain ? ? ? ?B. will rain; doesn't rain
C.rains; doesn't rain ? ? ? ? ? D.rains; won't rain
診斷2:此題目難度偏高,全班只有約四分之一的學(xué)生選出了正確答案。因?yàn)榇祟}有兩小空,所以對(duì)學(xué)生來說,兩空都答對(duì)難度就自然而然提升。此題是一道高區(qū)分度的題目。
通過對(duì)以上兩組抽樣分析,可以發(fā)現(xiàn)一些明顯存在的問題。學(xué)生們普遍對(duì)選項(xiàng)中的相似語法點(diǎn)感到迷惑,因而難以做出正確的判斷。對(duì)教師而言,應(yīng)該幫助學(xué)生總結(jié)學(xué)習(xí)過程中的這些難點(diǎn),并且在授課過程中結(jié)合相關(guān)練習(xí)加以強(qiáng)化。而對(duì)于學(xué)生,也應(yīng)該對(duì)自己的學(xué)習(xí)弱點(diǎn)進(jìn)行分析并且花費(fèi)額外的精力去努力克服。
五、 結(jié)語
本文以一項(xiàng)具體的考試為研究對(duì)象,對(duì)試卷結(jié)構(gòu)和測(cè)試結(jié)果進(jìn)行詳細(xì)分析。從分析的結(jié)果以及探究的原因來看,教師和學(xué)生雙方面均存在有待提高的地方。學(xué)生的水平層次不同,因而如何針對(duì)不同層次的學(xué)生設(shè)計(jì)有效的教學(xué)方法,提高整個(gè)班級(jí)的水平層次成為了教師最關(guān)心的問題,也許針對(duì)不同的學(xué)生布置有區(qū)別性課后提高練習(xí)會(huì)是個(gè)短期可行的方法之一。試卷分析通過統(tǒng)計(jì)數(shù)據(jù),提供了有關(guān)應(yīng)試者和試卷設(shè)計(jì)的相關(guān)信息,這些信息對(duì)應(yīng)試者、試卷設(shè)計(jì)者和教師有著很大的幫助。但從另一方面來說,機(jī)器畢竟是死板的,不能與人相比,正是由于試卷分析呈現(xiàn)出來的結(jié)果對(duì)風(fēng)險(xiǎn)承擔(dān)者來說十分重要,我們就更應(yīng)該客觀對(duì)待這些機(jī)器數(shù)據(jù)。一方面,它有自己的科學(xué)性,另一方面,當(dāng)我們?cè)谑褂眠@些數(shù)據(jù)的時(shí)候應(yīng)該小心謹(jǐn)慎,不能過于盲目,具體問題具體分析,用試卷分析的數(shù)據(jù)對(duì)題目進(jìn)行審查,提高考試的信度,使語言測(cè)試達(dá)到其真正最有價(jià)值的目的。
參考文獻(xiàn)
[1] Bachman&Palmer.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[2] Lado,R.Language Testing[M].New York:McGraw-
HillCompanies,1961.
[3] Spolsky,B.Measured Words[M].Oxford:Oxford University Press,1995.
[4] 鄒申,戴煒棟.語言測(cè)試(第二版)[M].上海:上海外語教育出版社,2012.