摘要:本文以本校高一年級(jí)期末考試的物理成績(jī)?yōu)檠芯繉?duì)象,用SPSS軟件對(duì)640份試卷進(jìn)行了初步的統(tǒng)計(jì)分析,計(jì)算出了試卷的難度、區(qū)分度、信度、效度等具體量化參數(shù),驗(yàn)證了一種提高試卷效度的方法,統(tǒng)計(jì)分析的結(jié)果增加了試卷質(zhì)量評(píng)估的可靠性、科學(xué)性,為指導(dǎo)和改進(jìn)課堂教學(xué)提供了參考基于SPSS的學(xué)科相關(guān)性分析和性別差異性分析也為學(xué)生選科和生涯規(guī)劃提供一定的借鑒意義.
關(guān)鍵詞:SPSS;考試數(shù)據(jù);試卷分析
基金項(xiàng)目:蘇州市教育科學(xué)“十三五”規(guī)劃2016年度課題“基于提升學(xué)生核心素養(yǎng)的初高中物理教學(xué)銜接的實(shí)踐與研究”(項(xiàng)目編號(hào):16032060).
作者簡(jiǎn)介:田曉華(1986-),女,甘肅定西人,碩士,中學(xué)一級(jí)教師,研究方向:高中物理教學(xué)及研究.
考試是檢驗(yàn)教師的教學(xué)效果和學(xué)生學(xué)習(xí)效果的一種重要手段,一份優(yōu)質(zhì)的試卷能為測(cè)試結(jié)果提供客觀、科學(xué)有效的評(píng)價(jià),因而試卷分析是教學(xué)工作中的一項(xiàng)重要內(nèi)容本文通過(guò)SPSS軟件對(duì)本校高一年級(jí)期末考試的物理成績(jī)進(jìn)行深度分析,以期對(duì)物理教師課堂教學(xué)策略的改進(jìn)和調(diào)整提供一些參考.
1原始數(shù)據(jù)錄入
本文使用的軟件為SPSS21版啟動(dòng)軟件,點(diǎn)擊菜單“文件”→“打開”→“數(shù)據(jù)”,選擇文件類型為“Excel”,將高一全年級(jí)學(xué)生的物理成績(jī)(含小題得分)導(dǎo)入,SPSS會(huì)根據(jù)Excel自動(dòng)添加變量名.
2試卷結(jié)構(gòu)
本試卷由兩部分組成,滿分120分,其中選擇題共38分,非選擇題共82分,見表1所示.
基本描述統(tǒng)計(jì)數(shù)據(jù)表顯示:學(xué)生總數(shù)為640人,無(wú)人缺考,全級(jí)均分8221分,最高分117分,最低分23分,全距為94分,方差235369,標(biāo)準(zhǔn)差為15342,說(shuō)明本次檢測(cè)中學(xué)生的個(gè)體差異較大筆者和學(xué)生溝通交流后發(fā)現(xiàn)原因在于:從初中進(jìn)入高中,物理學(xué)習(xí)梯度較大,有部分學(xué)生還沒有適應(yīng)高中物理的學(xué)習(xí),加上同時(shí)學(xué)習(xí)9門功課,部分學(xué)生往往無(wú)法合理安排學(xué)習(xí)時(shí)間,容易導(dǎo)致顧此失彼,甚至有個(gè)別學(xué)生產(chǎn)生直接放棄學(xué)習(xí)物理的念頭因此教師應(yīng)該在教學(xué)中做好分層教學(xué),因材施教,特別要多關(guān)注這部分低分學(xué)生,幫助其夯實(shí)基礎(chǔ)知識(shí),適時(shí)做好補(bǔ)差工作,探索多種教學(xué)策略,調(diào)動(dòng)學(xué)習(xí)物理的積極性.
32正態(tài)分布檢驗(yàn)
為了檢驗(yàn)試卷是否規(guī)范,需要觀察學(xué)生成績(jī)是否服從正態(tài)分布.圖形可以將數(shù)據(jù)分布比較直觀地呈現(xiàn)出來(lái),因此筆者首先做出分?jǐn)?shù)分布的直方圖運(yùn)行菜單:“分析”→“描述統(tǒng)計(jì)”→“頻率”,將“總分”拖入變量框,點(diǎn)擊“圖表”對(duì)話框,選中“直方圖(在直方圖上顯示正態(tài)曲線)”,運(yùn)行結(jié)果如圖1.
由圖1可知,全年級(jí)成績(jī)基本呈正態(tài)分布結(jié)合表2分析得知:峰度系數(shù)0357>0,表明該總體數(shù)據(jù)分布與正態(tài)分布相比較為陡峭,為尖頂峰;偏度系數(shù)為-0615<0,表明總體成績(jī)略微呈負(fù)偏態(tài)分布,即高分略多.
為進(jìn)一步檢驗(yàn),可做P-P圖或者趨降P-P圖.P-P圖的兩個(gè)坐標(biāo)軸分別表示理論累計(jì)概率和實(shí)際累計(jì)概率,如果數(shù)據(jù)服從正態(tài)分布,則其中的數(shù)據(jù)點(diǎn)應(yīng)和理論直線(對(duì)角線)基本重合趨降P-P圖,反映的是按正態(tài)分布計(jì)算的理論值和實(shí)際值之差的分布情況,即分布的殘差圖如果數(shù)據(jù)服從正態(tài)分布,則數(shù)據(jù)點(diǎn)應(yīng)較均勻地分布在Y=0這條直線上下[1].具體操作:點(diǎn)擊菜單“分析”→“描述統(tǒng)計(jì)”→“P—P圖”,在彈出的對(duì)話框中將全卷總分拖入變量框,單擊“確定”,運(yùn)行結(jié)果如圖2所示.
由圖2可知,本次測(cè)試學(xué)生的物理成績(jī)基本服從正態(tài)分布,表明試卷命題基本合理,反映了學(xué)生的實(shí)際水平這也說(shuō)明接下來(lái)的統(tǒng)計(jì)分析是有意義的.
33試卷的“四度”分析
331難度
難度是指測(cè)試題目的難易程度,用難度系數(shù)p表示,且0≤p≤1本文中用公式P=MW計(jì)算各題的難度系數(shù),期中M表示全體學(xué)生某題的平均分,W表示該題滿分分值試題的難度一般07以上為容易題,04~07為中等難度,04以下為較難題或難題通常期末考試為目標(biāo)參照性考試,可適當(dāng)偏高,全卷平均難度以07左右為宜,06~08為正常[2]
操作如下:首先在菜單欄點(diǎn)擊“分析”→“描述統(tǒng)計(jì)”→“描述”,將“q1”“q2”……“q18”拖入變量框,點(diǎn)擊“選項(xiàng)”對(duì)話框,選中“均值”,點(diǎn)擊“繼續(xù)”、“確定”,即可得到每題的平均分然后將“每題平均分”“每題的滿分”作為變量輸入相應(yīng)數(shù)值,點(diǎn)擊菜單“轉(zhuǎn)換”、“計(jì)算變量”,目標(biāo)變量設(shè)為“p”,數(shù)學(xué)表達(dá)式為“P=每題平均分/每題的滿分”,最后單擊“確定”,運(yùn)行便可得到各題的難度系數(shù),整理輸出結(jié)果見表3.
全卷的難度p可取各題難度的加權(quán)平均值,或按公式P=K 來(lái)計(jì)算,其中 表示所有考生的總分均值,K表示試卷滿分.
從難度分析來(lái)看,大部分題的難度大于07,選擇題中1、2、3、4、8、9、10為容易題,第5、7難度中等,第6、11屬于難題實(shí)驗(yàn)題中第12為容易題,13和14難度中等計(jì)算題中第15、16、17為容易題,18屬于難題全卷的難度系數(shù)P=8221/120=0685,難度中等,有利于測(cè)量學(xué)生的真實(shí)水平和更好地控制不及格率進(jìn)一步對(duì)照試卷內(nèi)容,發(fā)現(xiàn)難度系數(shù)大于09的幾道題目考察的知識(shí)點(diǎn)過(guò)于基礎(chǔ),選項(xiàng)過(guò)于明顯,故而需要修改才能加入題庫(kù)第11題難度系數(shù)較小,但該題非常新穎靈活,期末測(cè)試出現(xiàn)這樣一道題也很正常,從另一方面,也提示教師在教學(xué)中應(yīng)該多聯(lián)系生活實(shí)際,注重知識(shí)點(diǎn)靈活應(yīng)用.
332區(qū)分度
區(qū)分度是指試題對(duì)考生實(shí)際水平的區(qū)別能力,通常將試卷滿分作為考生的實(shí)際能力水平,而將考生某題得分與試卷總分的相關(guān)系數(shù)作為該題的區(qū)分度.
區(qū)分度常用D表示,取值在-1~1之間,值越大區(qū)分度越好按照美國(guó)伊貝爾(L.Ebel)提出的標(biāo)準(zhǔn),04以上表明此題的區(qū)分度很好;03~039表明此題的區(qū)分度良好,修改后更佳;02~029表明此題的區(qū)分度尚可,但需修改;019以下表明此題的區(qū)分度差,必須淘汰或改進(jìn)后方可使用另外,若區(qū)分度為負(fù)值,則為消極區(qū)分,說(shuō)明這個(gè)題目有問題,應(yīng)刪除或重新修訂;區(qū)分度為0,則無(wú)區(qū)分作用.
每道題的區(qū)分度在某種程度上可以衡量該題目的優(yōu)劣,而各題區(qū)分度的加權(quán)平均是衡量一份試卷優(yōu)劣的重要指標(biāo),可以按照公式D=∑ni=1KiDi∑ni=1Ki 計(jì)算,式中D表示試卷的區(qū)分度,Di表示第i題的區(qū)分度,Ki表示第i題的滿分.
具體操作:運(yùn)行菜單“分析”→“相關(guān)”→“雙變量”,在彈出的對(duì)話框中將“q1”“q2”……“q18”“總分”拖入變量框,相關(guān)系數(shù)選擇“Pearson”,其它為默認(rèn)值,點(diǎn)擊“確定”,得到各題的相關(guān)系數(shù)矩陣,輸出結(jié)果整理見表3.
由表3可知:第5、8、12~18題的區(qū)分度均大于04,區(qū)分度很好;第3、9、10題區(qū)分度良好;第4、6、7區(qū)分度尚可,第1、2、11題區(qū)分度很差結(jié)合難度系數(shù)還可以發(fā)現(xiàn),難度系數(shù)過(guò)高或過(guò)低的題目,區(qū)分度都很不好,因此在命題時(shí)應(yīng)綜合考量,適當(dāng)調(diào)整只有適當(dāng)?shù)碾y度才會(huì)增大區(qū)分度,這對(duì)試卷質(zhì)量的提升具有指導(dǎo)意義全卷的區(qū)分度計(jì)算得D=0491,整體區(qū)分度很好.
333信度
信度指測(cè)試結(jié)果的穩(wěn)定性或可靠性的程度,越高說(shuō)明考生受偶然因素影響的程度越小,可以比較真實(shí)客觀地反映考生的學(xué)習(xí)水平實(shí)際測(cè)量中有多種不同度量方式本文用科隆巴赫α(Cronbach's Alpha)系數(shù)來(lái)度量,取值范圍0~1,一般認(rèn)為大于09信度為優(yōu),07~09較好,低于07為不合格.
具體操作:運(yùn)行菜單,點(diǎn)擊“分析”→“度量”→“可靠性分析”,將變量“q1”……“q18”全部拖入項(xiàng)目框,模型選“α”,單擊“確定”,運(yùn)行結(jié)果如表4(a)和表4(b)所示.
由表4可見,本次試卷的信度為0714,屬于一般.各題項(xiàng)已刪除的 Cronbachs Alpha 值在0665~0717之間非選擇題除第15題外都低于07.
影響試卷信度的因素較多,可以嘗試從以下兩個(gè)方面提高試卷信度:(1)增加題目數(shù)量;(2)盡可能使全卷難度系數(shù)呈正態(tài)分布.
對(duì)于方法2,由于無(wú)法重新測(cè)試,筆者嘗試做出各題難度系數(shù)的直方圖,并再次用P-P圖進(jìn)行正態(tài)性檢驗(yàn),方法同前,運(yùn)行后輸出結(jié)果見圖3.
很顯然,全卷各題的難度系數(shù)并不符合正態(tài)分布,這也對(duì)信度產(chǎn)生一定影響同時(shí)也給命題者一定的啟示,為了獲得較高的信度,應(yīng)當(dāng)在一份試卷中將各種難度的題型、題量合理搭配,盡可能使試題的難度呈正態(tài)分布.
334效度
效度是指測(cè)量結(jié)果的準(zhǔn)確性和有效性的程度,亦即測(cè)量是否達(dá)到預(yù)期的目的效度的估計(jì)有多種方法,本文用效標(biāo)關(guān)聯(lián)效度,它是以測(cè)試分?jǐn)?shù)和校標(biāo)之間的相關(guān)系數(shù)來(lái)表示測(cè)試效度的高低效度用E表示,取值范圍0~1,一般大于07為優(yōu)秀試卷,04~07較好,低于04為不合格[4]
本文選擇高一(上)的期中考試成績(jī)作為校標(biāo),將學(xué)生的期考試中和期末考試成績(jī)作為變量輸入SPSS,利用Pearson相關(guān)分析,方法同前,輸出結(jié)果見表6可見兩次考試成績(jī)的Pearson相關(guān)系數(shù)為0675,故認(rèn)為本試卷效度較好
4學(xué)科分析
41物理與其他學(xué)科的相關(guān)性
按照新高考改革的方向,學(xué)生可以在語(yǔ)文、數(shù)學(xué)、英語(yǔ)三科之外,自由選擇物理、化學(xué)、生物、政治、歷史、地理中的三科作為高考考試科目,即所謂3+3模式各種選科組合給學(xué)生很多自由度,然而怎樣選擇搭配才較為合理科學(xué),筆者嘗試對(duì)物理成績(jī)與其他學(xué)科成績(jī)進(jìn)行Pearson相關(guān)分析,方法同前,輸出結(jié)果見表7.
Pearson相關(guān)系數(shù)用r表示,取值-1~1,當(dāng)r>095說(shuō)明極強(qiáng)相關(guān);當(dāng)r>08高度相關(guān);當(dāng)05 分析表7可知,無(wú)論男生還是女生,物理成績(jī)除與語(yǔ)文無(wú)關(guān)外,與其他學(xué)科均顯著相關(guān),但相關(guān)程度有所不同男生的物理成績(jī)與化學(xué)、生物、地理、數(shù)學(xué)呈中度相關(guān),女生的情況也基本相同據(jù)分析,在6個(gè)選科中,高校提出選考科目所占的比重由大到小依次排列為物理、化學(xué)、生物、地理、歷史、政治以上海高考為例,最多的組合是“物化生”,再次是“物化地”[5].可見,這樣的選科組合也是有一定科學(xué)依據(jù)的當(dāng)然,在選科時(shí)除了要符合高校對(duì)選科的要求,還要考慮自己的興趣、愛好、特長(zhǎng)等因素,綜合考量從而制定自己的生涯規(guī)劃. 42物理成績(jī)的性別差異分析 由前所述,物理對(duì)學(xué)生的高中生涯規(guī)劃尤為重要,然而很多學(xué)生、家長(zhǎng)甚至有些教師都普遍認(rèn)為“男生比女生更適合學(xué)物理”,因此筆者嘗試用SPSS中的獨(dú)立樣本T檢驗(yàn)來(lái)分析本次考試中男女生成績(jī)有無(wú)顯著差異. 操作如下:點(diǎn)擊菜單“分析”→“比較均值”→“獨(dú)立樣本T檢驗(yàn)”,在彈出的對(duì)話框中將全卷總分、卷1、卷2一起拖入“檢驗(yàn)變量”框,將“性別”拖入“分組變量”框,單擊“確定”,輸出結(jié)果見表8. 由表8可知,“全卷”、“卷1”、“卷2”三項(xiàng)的第一個(gè)sig均大于005,即方差齊,因此觀察方差齊性時(shí)的T檢驗(yàn)sig值,若sig>005,則表示兩組均值無(wú)顯著差異;若sig<005,則表示兩組均值存在顯著差異結(jié)果顯示,全卷sig=0759,卷1的sig=0195,卷2的sig=0882由此可以得出結(jié)論:無(wú)論全卷總分,還是卷1(選擇題)、卷2(非選擇題),男女生成績(jī)均無(wú)統(tǒng)計(jì)學(xué)意義上的顯著差異因而教師應(yīng)該糾正“女生不適合學(xué)物理”、“女生學(xué)不好物理”這種性別歧視觀點(diǎn),強(qiáng)化性別平等意識(shí),積極鼓勵(lì)女生學(xué)習(xí)物理鑒于篇幅原因,其它性別差異分析將單獨(dú)討論. 5結(jié)論與啟示 本文運(yùn)用SPSS軟件對(duì)一次考試成績(jī)進(jìn)行了初步的統(tǒng)計(jì)分析,得到較為客觀、準(zhǔn)確、科學(xué)、全面、清晰的量化分析,結(jié)果顯示,本次試卷難度P=0685,難度中等;區(qū)分度D=0491,整體區(qū)分度很好;信度α=0851,較好;效度E=0675,較好在大規(guī)模的考試中,如果試題的難度處于03與07之間,區(qū)分度大于03的話,則可以認(rèn)為試卷具有較高的質(zhì)量[6]因此該試卷是一份較為成功的試卷,統(tǒng)計(jì)分析的結(jié)果為物理課堂教學(xué)的調(diào)整和改進(jìn)提供了一定的參考意義,也對(duì)此后的命題工作提供了信息參考對(duì)物理與其他學(xué)科間的相關(guān)性分析和成績(jī)的性別差異分析也為學(xué)生的選科、生涯規(guī)劃提供了一定的參考價(jià)值. 參考文獻(xiàn): [1]張文彤,鄺春偉SPSS統(tǒng)計(jì)分析基礎(chǔ)教程[M].北京:高等教育出版社,2011. [2]王雪,鄧振偉,陳玲,田七SPSS軟件在試卷質(zhì)量分析中的應(yīng)用[J].讀與寫(教育教學(xué)刊),2009(3):74-77. [3]陳琪琪基于SPSS的物理試卷分析與評(píng)價(jià)[J].物理通報(bào),2017(12):103-106. [4]趙立新,陳文藝,郭子君試卷質(zhì)量的定量評(píng)價(jià)[J].華南農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2004(4):136-141. [5]鄭剛高考“3+3”模式下的生涯規(guī)劃指導(dǎo):如何選科[J].遼寧教育,2016(6):79-80. [6]章建石新高考改革背景下不同版本試卷測(cè)量學(xué)指標(biāo)的比較與監(jiān)測(cè)——以某年度英語(yǔ)試卷的分析為例[J].全球教育展望,2018(5):71-79.