王曉榮 錢旭升
SPSS是世界上最具影響力的統(tǒng)計(jì)軟件之一。綜合考慮操作簡(jiǎn)易程度與數(shù)據(jù)分析效果,SPSS是幫助歷史教師提高數(shù)據(jù)分析能力的最佳選擇,本文具體采用SPSS20.0中文版。
一、數(shù)據(jù)的來源、錄入
本文數(shù)據(jù)以桐廬富春高中高一期末歷史考試為例。該校學(xué)生成績(jī)?cè)谌h居于中等水平,其數(shù)據(jù)分析結(jié)論可推論至全縣乃至全市。這是本文以其為數(shù)據(jù)來源的原因。
SPSS的數(shù)據(jù)錄入通過數(shù)據(jù)窗口的變量視圖和數(shù)據(jù)視圖實(shí)現(xiàn),有手動(dòng)輸入和自動(dòng)導(dǎo)入兩種方式,后者以前者為基礎(chǔ)。數(shù)據(jù)視圖與excel相似,可導(dǎo)入excel,在導(dǎo)入時(shí)勾選“從第一行數(shù)據(jù)讀取變量名”。導(dǎo)入后,對(duì)自動(dòng)產(chǎn)生的其他變量屬性做必要修改。教師可根據(jù)要分析的變量的數(shù)量對(duì)原excel進(jìn)行刪減,只保留各題題號(hào)、總分作為變量,每位學(xué)生作為一個(gè)觀察項(xiàng)。可將該excel命名為“高一學(xué)生的各題及總分表”。
本次歷史考卷有30道選擇題每題2分,3道材料題各為15分、13分、12分,共100分。參考學(xué)生643名。故本次導(dǎo)入SPSS的變量有34個(gè),觀察項(xiàng)有643個(gè),在數(shù)據(jù)視圖中形成34×643個(gè)單元格。
二、數(shù)據(jù)的分析
SPSS的操作是手段,讓其跑出我們需要的統(tǒng)計(jì)結(jié)果是目的。我們無需學(xué)會(huì)SPSS的所有功能,甚至無需知道其計(jì)算、分析的統(tǒng)計(jì)學(xué)原理,而只需在明確具體分析目的后正確點(diǎn)擊、勾選、輸入即可。
(一)總分、主觀題得分的頻數(shù)分布分析
總分、主觀題得分是多值的,其頻數(shù)可能呈正態(tài)分布。點(diǎn)擊分析—描述統(tǒng)計(jì)—頻率,將“總分”、“t31”、“t32”、“t33”移入“變量”中,點(diǎn)擊圖表—直方圖,勾選“在直方圖上顯示正態(tài)曲線”,跑出直方圖。
觀察可得,總分、31題略顯負(fù)偏態(tài),32題、33題為明顯負(fù)偏態(tài)。教師也可通過K-S檢驗(yàn)對(duì)正態(tài)分布進(jìn)行量化判定。點(diǎn)擊分析—非參數(shù)檢驗(yàn)—單樣本,點(diǎn)擊“運(yùn)行”跑出結(jié)果。結(jié)果顯示四個(gè)sig.的值都小于0.05,所以四個(gè)原假設(shè)都被拒絕,即總分、31題、32題、33題的分值頻數(shù)都不呈正態(tài)分布,見表1。
(二)總分、主觀題得分的集中、離散趨勢(shì)分析
集中趨勢(shì)分析是指用一個(gè)代表值來反映一組數(shù)據(jù)的一般水平,常用統(tǒng)計(jì)量有均值、中位數(shù)、眾數(shù)。如表2顯示本次考試總分的平均分、中位數(shù)、眾數(shù)分別是47.51分、47分、52分。離散趨勢(shì)分析是指用一個(gè)特別值來反映一組數(shù)據(jù)相互之間的離散程度,用這個(gè)值來說明變量的各個(gè)值從這組數(shù)據(jù)的中間位置向兩端離散的程度,常用統(tǒng)計(jì)量有全距(又稱極差)、標(biāo)準(zhǔn)差、離散系數(shù)(標(biāo)準(zhǔn)差與均值的比,又稱差異系數(shù))。如表2顯示本次考試總分的全距為76﹣22=54分,標(biāo)準(zhǔn)差為10.231分,離散系數(shù)10.231÷47.51=21.5%。點(diǎn)擊分析—描述統(tǒng)計(jì)—頻率,將“總分”、“t31”、“t32”、“t33”移入“變量”中,點(diǎn)擊統(tǒng)計(jì)量,勾選集中趨勢(shì)下的“均值”、“中位數(shù)”、“眾數(shù)”,勾選離散下的“標(biāo)準(zhǔn)差”、“最小值”、“最大值”,跑出結(jié)果,見表2。
(三)試卷全卷及各題質(zhì)量分析
試卷質(zhì)量分析的指標(biāo)主要有:難度系數(shù)(P)、區(qū)分度(D)、信度(α)、效度(V)。
1. 難度系數(shù)
難度系數(shù)為平均分與滿分之比。一般認(rèn)為,p≥0.7為較易,0.4≤p<0.7為中等難度,p<0.4為較難。全卷平均分47.51分,難度系數(shù)0.48,屬中等難度。教師可將各題的平均分、滿分做成一個(gè)新excel直接導(dǎo)入SPSS。此時(shí)SPSS中有變量2個(gè)、觀察項(xiàng)33個(gè),在數(shù)據(jù)視圖中形成2×33個(gè)單元格。SPSS可以根據(jù)已有變量“轉(zhuǎn)換”得出新變量。點(diǎn)擊轉(zhuǎn)換—計(jì)算變量,在“目標(biāo)變量”框中輸入:p的值,在“數(shù)字表達(dá)式”框中移入或輸入:各題的平均分 / 各題的滿分,跑出結(jié)果,在數(shù)據(jù)視圖增加了一個(gè)新變量:p的值。
再對(duì)新變量“p的值”進(jìn)行“轉(zhuǎn)換”,得出另一個(gè)新變量:難易程度。點(diǎn)擊轉(zhuǎn)換—重新編碼為不同變量,在“輸出變量”框中輸入:難易程度,點(diǎn)擊舊值和新值,設(shè)置舊值和新值的對(duì)應(yīng)關(guān)系:0.7 thru Highest 對(duì)應(yīng)3,Lowest thru 0.3999對(duì)應(yīng)1,0.4 thru 0.6999對(duì)應(yīng)2。然后在變量視圖中設(shè)置新變量“難易程度”的值標(biāo)簽,1=較難、2=中等難度、3=較易。點(diǎn)擊分析—描述統(tǒng)計(jì)—頻率,跑出難易程度的頻率表,見表3。
2. 區(qū)分度
區(qū)分度是指試題對(duì)不同水平考生的區(qū)分程度。一般認(rèn)為,區(qū)分度最好大于0.3。教育統(tǒng)計(jì)學(xué)中利用某試題得分與總分的相關(guān)關(guān)系作為該試題的區(qū)分度,客觀題用Spearman等級(jí)相關(guān)系數(shù),主觀題用Pearson積差相關(guān)系數(shù)。導(dǎo)入excel“高一學(xué)生的各題及總分表”,點(diǎn)擊分析—相關(guān)—雙變量,將“t1”到“t30”及“總分”移入“變量”中,勾選相關(guān)系數(shù)下的“spearman”,跑出結(jié)果。主觀題的操作相似,區(qū)別是將“t31”到“t33”及“總分”移入“變量”中,勾選相關(guān)系數(shù)下的“pearson”,得出結(jié)果,見表4。
結(jié)果顯示12、13兩道客觀題的區(qū)分度為負(fù)數(shù),3道主觀題區(qū)分度分別為0.707、0.641、0.553。
3. 信度
信度是指測(cè)量工具對(duì)同一被試進(jìn)行兩次或多次測(cè)量的一致程度,是檢驗(yàn)試卷反映考生水平可靠性或穩(wěn)定性的指標(biāo)。信度有內(nèi)在信度、折半信度、重測(cè)信度等。教育統(tǒng)計(jì)學(xué)中通常用Cronbachs Alpha系數(shù)(簡(jiǎn)稱α系數(shù))測(cè)量試卷內(nèi)部題目一致性來實(shí)現(xiàn)對(duì)試卷內(nèi)在信度的檢驗(yàn)。一般認(rèn)為,α≥0.8時(shí)信度較好,0.6≤α<0.8時(shí)信度相當(dāng),α<0.6時(shí)信度較差。導(dǎo)入excel“高一學(xué)生的各題及總分表”,點(diǎn)擊分析—度量—可靠性分析,將“t1”到“t33”移入“項(xiàng)目”中,跑出α的值為0.66。
4. 效度
效度是指測(cè)量的有效程度,是檢驗(yàn)試卷是否考查了原定考查內(nèi)容的指標(biāo)。信度檢驗(yàn)穩(wěn)定性,效度檢驗(yàn)精準(zhǔn)性,兩者常配合使用。效度有內(nèi)容效度、關(guān)聯(lián)效度。教育統(tǒng)計(jì)學(xué)中,將結(jié)果與效標(biāo)之間的一致性程度作為試卷效度,這屬于關(guān)聯(lián)效度。SPSS中具體使用Pearson積差相關(guān)系數(shù),其操作過程與主觀題區(qū)分度的操作相同。以什么為效標(biāo),是SPSS中跑出效度的關(guān)鍵。隨著學(xué)習(xí)推進(jìn),會(huì)有部分學(xué)生進(jìn)步或退步較大,這會(huì)對(duì)效度的分析結(jié)果產(chǎn)生一定影響,可利用不同效標(biāo)多跑幾次Pearson系數(shù),再綜合判定。在效標(biāo)適當(dāng)?shù)那闆r下,效度值要求在0.3~0.7之間,不得低于0.3。如以期中歷史考試成績(jī)?yōu)樾?biāo),先在excel中將每位學(xué)生的期中成績(jī)與期末成績(jī)成對(duì),刪除因缺考使成績(jī)無法成對(duì)的學(xué)生后剩下學(xué)生606位。在SPSS中導(dǎo)入該excel,變量為期末成績(jī)、期中成績(jī),觀察項(xiàng)為606位學(xué)生,得出效度值為0.679。
三、討論與建議
通過學(xué)生成績(jī)、試卷質(zhì)量?jī)蓚€(gè)維度的分析,我們可作如下討論與建議:
(1)學(xué)生成績(jī)??偡?、主觀題分值頻數(shù)都呈負(fù)偏態(tài)分布,說明平均分及上下人數(shù)過少,而低于平均分人數(shù)過多尤其是32題、33題。頻率表顯示32題0分有145人占總?cè)藬?shù)22.6%之多。期末考試作為合格性考試,總分、主觀題分值的頻數(shù)應(yīng)呈正態(tài)或正偏態(tài)分布,即中等分值或高分值學(xué)生應(yīng)盡量多。
全卷47.51的平均分、0.48的難度系數(shù),偏低偏難。尤其32題、33題的平均分過低,中位數(shù)或眾數(shù)都只有2分、3分,直接影響區(qū)分度。我們建議應(yīng)適當(dāng)提高難度系數(shù),降低難度。10.231分的標(biāo)準(zhǔn)差、21.5%的離散系數(shù)可以接受,但全距偏大,說明學(xué)生的兩極分化比較嚴(yán)重,建議教師對(duì)低水平學(xué)生進(jìn)行針對(duì)性教學(xué)。
(2)試卷質(zhì)量。我們認(rèn)為期末試卷全卷難度系數(shù)控制在0.6~0.7比較適宜。本試卷33道題較易、中等難度、較難的比例為10:15:8,中等難度和較難占比69.7%,應(yīng)增加較易題。我們認(rèn)為三者比例5:3:2比較合適。
12、13題的區(qū)分度為負(fù)數(shù),說明有很多高水平同學(xué)反而選錯(cuò),需要命題者注意,也需要教師反思教學(xué)。3道主觀題的區(qū)分度都較高,說明區(qū)分度在主觀題的內(nèi)部分配不很合理。區(qū)分度與難度系數(shù)有一定關(guān)聯(lián),為提高難度系數(shù)可適當(dāng)降低區(qū)分度。中等難度題的區(qū)分度高,過易或過難的題都無法將不同水平學(xué)生區(qū)分開從而使區(qū)分度偏低。
信度為0.66可以接受。全卷信度與各題的區(qū)分度有一定關(guān)聯(lián),當(dāng)各題的區(qū)分度提高后,同一水平學(xué)生回答同一題的答案趨向一致,全卷信度隨之提升。作為合格性考試,區(qū)分度、信度可適當(dāng)降低。0.679的效度值,反映了本試卷的效度比較理想。