廣東省江門市五邑大學(xué)外國語學(xué)院 滕海區(qū) 關(guān)天萍
2016年廣州高考一模英語試卷質(zhì)量分析
廣東省江門市五邑大學(xué)外國語學(xué)院 滕海區(qū) 關(guān)天萍
測試是檢測教學(xué)評價(jià)的重要手段之一,而試卷則是測試的重要工具之一。一份信度效度高的試卷能夠較好地檢驗(yàn)教學(xué)效果,反映學(xué)生的學(xué)習(xí)能力,從而體現(xiàn)評價(jià)的科學(xué)性。本文通過實(shí)例,以廣東省某所國家示范性高中高三某班55位學(xué)生為樣本,采用SPSS 22.0對2016年廣州高考一模英語試卷進(jìn)行難度、區(qū)分度、信度的分析,探討試卷是否反映英語學(xué)科課程標(biāo)準(zhǔn)的整體要求、是否符合考試大綱的要求、是否全面檢測學(xué)生對英語語言基礎(chǔ)知識和基本技能的掌握。
SPSS;難易度;區(qū)分度;信度
2016年廣州高考一模英語測試以《普通高中英語課程標(biāo)準(zhǔn)》、教育部考試中心《2016年普通高等學(xué)校招生全國統(tǒng)一英語考試大綱》和《2016年普通高等學(xué)校招生全國統(tǒng)一英語考試大綱的說明(英語)》為依據(jù),并參考了全國卷(一)的試題及難度要求(廣州市教育研究院 2016)。按照往年的經(jīng)驗(yàn),我們可以總結(jié)出廣州高考一模難度接近高考,但會稍稍高于高考,是省內(nèi)最具參考意義的大型考試。2016年是廣東省第一年采用全國卷,因此對全國卷的命題思路、特點(diǎn)、風(fēng)格、趨勢,以及我省自主命題與全國命題之間的銜接程度,將充分展示在一模和二模當(dāng)中。本文擬用SPSS 22.0對2016 年廣東省某所國家示范性高中高三某班的學(xué)生在該測試中的試卷成績進(jìn)行分析,了解學(xué)生對知識的掌握情況,以便為及時(shí)調(diào)控教學(xué)策略提供客觀真實(shí)的依據(jù),從而科學(xué)指導(dǎo)教學(xué),提高教學(xué)質(zhì)量和高考備考效果,以幫助學(xué)生順利適應(yīng)從廣東卷到全國卷的過渡。
1.1 考試情況分析
本次考試參與人數(shù)為55人,試卷有效份數(shù)55份。該測試的性質(zhì)是關(guān)于能力方面的考試,主要目的是對學(xué)生前一階段學(xué)習(xí)情況進(jìn)行檢查,并借此預(yù)測學(xué)生應(yīng)對高考的能力,同時(shí)為下一階段的復(fù)習(xí)規(guī)劃提供有針對性的參考依據(jù)。該試卷的具體題型及分值分布如下:閱讀理解(30分)、七選五(10分)、完形填空(20分)、語法填空(10分)、短文改錯(cuò)(10分),以及書面表達(dá)(25分),全卷合計(jì)120分。
1.2 基本數(shù)據(jù)分析
首先對總分進(jìn)行描述統(tǒng)計(jì)分析,從分析的結(jié)果可知:本次考試最高分(Maximum)= 108.50分,最低分(Minimum)= 27分,全距(Range)= 81.50 分,平均分(Mean)=77.83分,標(biāo)準(zhǔn)差(Std. Deviation)=17.56分。標(biāo)準(zhǔn)差大表示本班學(xué)生的英語水平個(gè)體差距較大,兩極分化的情況比較嚴(yán)重。
其次,對總分進(jìn)行頻數(shù)分析,即可得到各分?jǐn)?shù)段學(xué)生分布圖。在大規(guī)??荚囍?,考生水平的分布一般是呈正態(tài)的,因此考生分?jǐn)?shù)的分布也應(yīng)當(dāng)呈正態(tài)分布。根據(jù)數(shù)據(jù)分析,全體考生的成績呈正態(tài)分布,說明這份試卷的命題是合理的。
1.3 難度分析
試題的難度表示試題的難易程度,是指全體考生在該題的失分情況。公式為:P=X/W,P為難度值,X為均分值,W為該題滿分值。試題的難度值與試題實(shí)際的難易程度成反比,難度值越大表示正確解答該題的學(xué)生越多;數(shù)值越小則表示試題越難。一般情況下,難度適中的試題更能客觀地反映出學(xué)生的學(xué)習(xí)效果,大部分的試題難度分布在0.3~0.7之間,選拔性的考試P值為0.5左右為宜。通常以期末考試為目的做參照性的考試,P值可適當(dāng)偏高,全卷的平均難度以0.7左右為宜,0.6~0.8 為正常(張玥 2013)。通過分析可知該試卷各題型的難度系數(shù)如下:閱讀理解為0.68,七選五為0.66,完形填空為0.63,語法填空為0.68,改錯(cuò)為0.69,書面表達(dá)為0.74,基本集中在0.63~0.74之間。而整份試卷中的難度系數(shù)是0.65,難度適中,符合以上所提及的標(biāo)準(zhǔn),在正常范圍內(nèi)。
1.4 區(qū)分度分析
區(qū)分度一般是指試題對于被測試對象實(shí)際水平的鑒別能力,是將考生區(qū)別開來的統(tǒng)計(jì)量。比如有一道題,考試中水平好的考生都答對了,水平差的考生都答錯(cuò)了,這道題的區(qū)分度就比較高。一般使用斯皮爾曼(Spearman)等級進(jìn)行客觀題相關(guān)的分析;而主觀題是非等間距測度的連續(xù)變量,該次測試的樣本大于30,因此采用皮爾遜(Pearson)等級進(jìn)行相關(guān)的分析(張玥 2013)。
通過分析的數(shù)據(jù)可知,各題型區(qū)分度分別為閱讀理解0.877,七選五0.590,完形填空0.843,語法填空0.845,短文改錯(cuò)0.874,書面表達(dá)0.749。由此可以看出,閱讀理解的區(qū)分度最高是0.877,說明學(xué)生的成績在此題被顯著拉開。建議教師在日后的復(fù)習(xí)工作中,針對閱讀理解所涉及的解題技巧對學(xué)生進(jìn)行重點(diǎn)訓(xùn)練以及輔導(dǎo),爭取在高考中提高分?jǐn)?shù)。其余幾題的區(qū)分度較高,說明該份試卷可以區(qū)分出學(xué)生之間的實(shí)際水平差異。
1.5 信度分析
信度反映測試結(jié)果的可靠性、穩(wěn)定性以及一致性。信度越高表示測試結(jié)果越可靠、穩(wěn)定及一致。對于語言類考試的信度,其測試結(jié)果是指被測試者的表現(xiàn)的可信度。影響測試信度的因素較多,就試題本身來說,信度取決于測試范圍和題量;而評分的信度則取決于評分標(biāo)準(zhǔn)的客觀性以及準(zhǔn)確性??蛇x用巴赫Alpha系數(shù)來計(jì)算測試中包含有非0~1記分的題目的一致性信度系數(shù)。
一般情況下大規(guī)模標(biāo)準(zhǔn)化考試的信度在0.9 以上,說明達(dá)到最好的標(biāo)準(zhǔn)化考試水平;當(dāng)信度系數(shù)在0.7~0.9之間,說明試卷信度較高;當(dāng)信度系數(shù)在0.5~0.7之間,說明部分試題需要改進(jìn);當(dāng)信度系數(shù)小于0.5,則說明試卷信度存有一定的問題,考試基本是無效的(張玥 2013)。通過統(tǒng)計(jì)的數(shù)據(jù)可知本試卷各題型的信度在0.832~0.870之間,幅度基本一致,信度較高。另外,本次測試的巴赫Alpha系數(shù)為0.87,說明整體測試結(jié)果穩(wěn)定可靠。
通過SPSS 對一模試卷成績的統(tǒng)計(jì)分析,可以了解到試卷整體的難度適中,符合學(xué)生的實(shí)際情況,比較客觀地反映教師與學(xué)生“教”與“學(xué)”的水平與效果,符合教學(xué)大綱要求并能有效地考查學(xué)生的綜合語言應(yīng)用能力與思維能力,真實(shí)地反映出學(xué)生知識掌握的實(shí)際水平,較好地檢測學(xué)生現(xiàn)有知識能力水平以及診斷學(xué)生知識能力的缺陷,符合對選拔類型考試進(jìn)行相關(guān)預(yù)測的要求,對下一階段的備考有較大的指向作用。
在后階段的備考復(fù)習(xí)中,教師需要強(qiáng)化備好策略和規(guī)范的有效訓(xùn)練,給予學(xué)生更多積極的反饋,讓學(xué)生在備考的過程中進(jìn)一步鞏固語言知識,梳理文化背景知識,提高思維能力。以下是幾點(diǎn)備考建議:①分析學(xué)生的具體情況,整體規(guī)劃,提高后一階段復(fù)習(xí)備考指導(dǎo)的有效性與針對性;②精心設(shè)計(jì)備考內(nèi)容,優(yōu)化復(fù)習(xí)過程,提高復(fù)習(xí)效率;③加強(qiáng)專題復(fù)習(xí),指導(dǎo)做題策略和題目所需的能力要求。
廣州市教育研究院. 2016. 2016年廣州市普通高中畢業(yè)班綜合測試分析報(bào)告[R]. 廣州:廣東教育出版社.
張玥. 2013. SPSS軟件在英語試卷質(zhì)量分析中的解析及應(yīng)用[J].職校論壇(7):320-321,380.