華東師范大學(xué)資源與環(huán)境科學(xué)學(xué)院(200241) 段玉山中華地圖學(xué)社(200063) 陳春方
地理測(cè)驗(yàn)的分析技術(shù)*
華東師范大學(xué)資源與環(huán)境科學(xué)學(xué)院(200241) 段玉山中華地圖學(xué)社(200063) 陳春方
當(dāng)一份地理試卷擺在我們面前,我們應(yīng)該科學(xué)地進(jìn)行試卷的反饋:一方面是針對(duì)測(cè)題及試卷的質(zhì)量,另一方面是針對(duì)測(cè)驗(yàn)結(jié)果的分析。
對(duì)測(cè)驗(yàn)質(zhì)量做定性分析,需檢測(cè)構(gòu)成測(cè)驗(yàn)的每一道題目是否真正符合了其相應(yīng)的命題原則。通過定性分析選出來的測(cè)題,其質(zhì)量并沒有足夠客觀的指標(biāo)進(jìn)行說明,因此必須將測(cè)驗(yàn)進(jìn)行預(yù)測(cè),然后運(yùn)用統(tǒng)計(jì)分析技術(shù),對(duì)所收集到的數(shù)據(jù)進(jìn)行客觀的定量分析,從而確定每一道題目的難度與區(qū)分度指標(biāo),進(jìn)而根據(jù)各項(xiàng)指標(biāo)進(jìn)一步篩選題目以及對(duì)題目進(jìn)行分類以供題庫使用。
1. 測(cè)題難度
難度是指題目的難易程度,它是反映題目對(duì)學(xué)生知識(shí)和能力水平的適合程度的指標(biāo)。
對(duì)地理測(cè)題,其原始回答數(shù)據(jù)由答題者對(duì)問題的正確作答、錯(cuò)誤作答及未作答的試題數(shù)構(gòu)成。根據(jù)這一信息可以立即算出正確作答題數(shù)的比例或百分比。這個(gè)統(tǒng)計(jì)量稱為題目難度。換句話說,難度的指標(biāo)通常以通過率來表示,即以答對(duì)或通過該題的人數(shù)比例來表示。當(dāng)題目分?jǐn)?shù)是二分變量(即答對(duì)為1,答錯(cuò)為0,如選擇題)時(shí):
式中:P為題目難度值,R為答對(duì)或通過該題的人數(shù),N為全體人數(shù)。
【例1】在一地理測(cè)驗(yàn)的某道選擇題上,100名學(xué)生中選擇正確答案的有68名,則該題難度為:
當(dāng)題目分?jǐn)?shù)是多分值時(shí),難度是全體學(xué)生在該題上的平均數(shù)與該題滿分的比例:
【例2】一組學(xué)生在某道地理題上得分分別為2,5,9,10,4,8,7,5,3,0。該題滿分為10分。則該題難度為:
當(dāng)被試人數(shù)較多時(shí),則可以根據(jù)測(cè)驗(yàn)總成績(jī)?nèi)”辉嚨母叻纸M(一般取分?jǐn)?shù)最高的27%被試)和低分組(一般取分?jǐn)?shù)最低的27%被試),分別求這兩組被試的通過率,再求題目難度:
式中:P為題目難度,PH高分組通過率,PL為低分組通過率。
當(dāng)題目以二分法計(jì)分時(shí),上式即為:
式中:P為題目難度,RH、RL分別為高、低分組被試答對(duì)人數(shù),NH、NL分別為高、低分組被試總?cè)藬?shù)。
當(dāng)題目分?jǐn)?shù)是多分值時(shí),難度又為:
【例3】從例2中取高分組學(xué)生3人,低分組學(xué)生3人,則該題難度為:
與例2的結(jié)果十分近似??梢娺@一方法可以簡(jiǎn)化分析過程。
此外,當(dāng)題目采用多項(xiàng)選擇時(shí),由于有多個(gè)可能的答案可供選擇,正確作答的數(shù)目可能受機(jī)遇的影響而增長(zhǎng),這就使P值變化。為了平衡選項(xiàng)數(shù)目對(duì)難度的影響,也可以對(duì)難度值做如下矯正,但這種方法使用不多。
式中:CP為矯正后的難度值,P為未經(jīng)矯正的難度值,K為選項(xiàng)數(shù)。
2. 測(cè)題區(qū)分度
測(cè)題的區(qū)分度又稱鑒別指數(shù),是指測(cè)題對(duì)于被試反應(yīng)的區(qū)分程度和鑒別能力。一般用某測(cè)題的得分與測(cè)驗(yàn)總分之間的相關(guān)關(guān)系數(shù)來表示。二者的相關(guān)程度高,表明該題的區(qū)分度高。就教育成績(jī)測(cè)驗(yàn)來說,區(qū)分度高就意味著該題對(duì)于學(xué)習(xí)成績(jī)好的和學(xué)習(xí)成績(jī)差的學(xué)生,有較好的區(qū)分和鑒別能力。也就是說,學(xué)習(xí)成績(jī)好的學(xué)生在該題上得分高,學(xué)習(xí)成績(jī)差的學(xué)生在該題上得分低。如果某題得分與測(cè)驗(yàn)總分之間的相關(guān)程度低,表明該題的區(qū)分度低。這意味著該題對(duì)于學(xué)習(xí)成績(jī)好的和學(xué)習(xí)成績(jī)差的學(xué)生的區(qū)別和鑒別能力差,即學(xué)習(xí)成績(jī)好的學(xué)生在該題上的得分反而低,學(xué)習(xí)成績(jī)差的學(xué)生在該題上的得分反而高。區(qū)分度是篩選測(cè)題的主要依據(jù)之一。
當(dāng)題目分?jǐn)?shù)是二分變量(即答對(duì)為1,答錯(cuò)為0,如選擇題)時(shí),用分組法估計(jì)測(cè)題的區(qū)分度。
將由高到低排列的測(cè)驗(yàn)總分,分成高分組和低分組。兩組的人數(shù)可以各取總?cè)藬?shù)的50%、33%、25%或27%,其中以取總?cè)藬?shù)的27%為最好。某題的區(qū)分度可以用高分組該題答對(duì)的人數(shù)比率與低分組該題答對(duì)的人數(shù)比率之差來表示,稱為測(cè)題的鑒別指數(shù)。用公式可表示為:
式中:D表示測(cè)題的鑒別指數(shù),PH表示高分組該題答對(duì)的人數(shù)比率,PL表示低分組該題答對(duì)的人數(shù)比率。美國(guó)測(cè)量學(xué)家伊貝爾根據(jù)自己編制測(cè)驗(yàn)題的經(jīng)驗(yàn)提出了從鑒別指數(shù)上評(píng)價(jià)測(cè)題的標(biāo)準(zhǔn)。
表1 鑒別指數(shù)的評(píng)價(jià)標(biāo)準(zhǔn)
【例4】一次地理測(cè)驗(yàn)的學(xué)生共18人,高分組和低分組若各取總?cè)藬?shù)的27%,那么兩組各為5人。其中第4題高分組5個(gè)人中全部答對(duì),低分組5個(gè)人中有1個(gè)人答對(duì),根據(jù)公式,該題的鑒別指數(shù)為:
3. 地理教學(xué)標(biāo)準(zhǔn)參照測(cè)驗(yàn)的題目分析
以上所述是常模參照測(cè)驗(yàn)測(cè)題的分析方法。由于常模參照測(cè)驗(yàn)的目的在于測(cè)量學(xué)生的相對(duì)位置,因此測(cè)題的區(qū)分度相當(dāng)重要,而且難度也要能使它充分發(fā)揮提高鑒別力的作用。標(biāo)準(zhǔn)參照測(cè)驗(yàn)的目的在于測(cè)量學(xué)生是否完成了預(yù)先規(guī)定的教學(xué)內(nèi)容和目標(biāo)。測(cè)題的難易程度應(yīng)根據(jù)教學(xué)內(nèi)容及目標(biāo)來確定。而測(cè)題的區(qū)分度對(duì)標(biāo)準(zhǔn)參照測(cè)驗(yàn)來說意義不大。例如,假如教學(xué)內(nèi)容及目標(biāo)較為簡(jiǎn)單,那么,測(cè)題也必然比較容易。在此情況下,有可能所有的學(xué)生都能答對(duì)某一測(cè)題。雖然其區(qū)分度為零,但對(duì)于標(biāo)準(zhǔn)參照測(cè)驗(yàn)來說,該題還是有效的。
標(biāo)準(zhǔn)參照測(cè)驗(yàn)測(cè)題的品質(zhì),可以用教學(xué)前后答對(duì)的人數(shù)比率之差來表示。用公式來表示為:
式中:RA表示教學(xué)后某題答對(duì)的人數(shù),RB表示教學(xué)前該題答對(duì)的人數(shù),T表示作答該題的總?cè)藬?shù)(不包括未答者)。
表2 初中地理標(biāo)準(zhǔn)參照測(cè)驗(yàn)測(cè)題分析結(jié)果
當(dāng)S值為正,則數(shù)值越大,表示測(cè)題對(duì)教學(xué)效果或?qū)W生的學(xué)習(xí)效果反映得越敏銳;當(dāng)S為零或?yàn)樨?fù)值,則為不良的測(cè)題,表示該題不能反映教學(xué)效果或?qū)W生的學(xué)習(xí)效果。
一次測(cè)驗(yàn)結(jié)束后,須判斷學(xué)生是否達(dá)到了預(yù)定的標(biāo)準(zhǔn),一般的傳統(tǒng)做法是以60分作為判斷的標(biāo)準(zhǔn),60分以上即為及格分?jǐn)?shù)。在教育測(cè)量學(xué)中我們將這一過程叫做設(shè)置標(biāo)準(zhǔn)。在地理教學(xué)標(biāo)準(zhǔn)參照測(cè)驗(yàn)中,我們需在施測(cè)前設(shè)置一個(gè)切點(diǎn)分?jǐn)?shù),以此分?jǐn)?shù)作為參照,對(duì)學(xué)生的測(cè)驗(yàn)分?jǐn)?shù)作出解釋。設(shè)置標(biāo)準(zhǔn)就是指建立切點(diǎn)分?jǐn)?shù)的過程。有多種方法設(shè)置標(biāo)準(zhǔn),這里列出三種:
1. 由了解測(cè)驗(yàn)內(nèi)容的專家和有經(jīng)驗(yàn)的教師來判斷標(biāo)準(zhǔn)
由了解測(cè)驗(yàn)內(nèi)容的專家和有經(jīng)驗(yàn)的教師來判斷標(biāo)準(zhǔn),判斷學(xué)生正確回答百分比應(yīng)該是多少,才表明學(xué)生達(dá)到了最低能力水準(zhǔn)。例如通過確定學(xué)生正確回答了60%的測(cè)驗(yàn)內(nèi)容,就認(rèn)為學(xué)生達(dá)到了最低能力水準(zhǔn)。
2. 根據(jù)測(cè)題內(nèi)容分析設(shè)置標(biāo)準(zhǔn)
這種方法也是由專家和有經(jīng)驗(yàn)的教師來判斷標(biāo)準(zhǔn),但做法比較細(xì)致??紤]到測(cè)題內(nèi)容和難度都會(huì)影響標(biāo)準(zhǔn)的設(shè)置,所以此法采用兩維的表格,從測(cè)題的內(nèi)容和難度兩方面對(duì)測(cè)題進(jìn)行分類,一維是測(cè)題與教學(xué)目標(biāo)的關(guān)聯(lián)性,分為三類:實(shí)質(zhì)性的、重要的、一般的;另一維是測(cè)題的難度,分為三類:難、中等、易。見表2的例子。表中的題數(shù)是統(tǒng)計(jì)出的地理測(cè)驗(yàn)屬于各類測(cè)題的數(shù)目,如屬于實(shí)質(zhì)性的容易的題目有6題,表中的百分比表示專家判斷出的該類題學(xué)生至少答對(duì)百分之幾十才能視為達(dá)標(biāo)。具體分析方法是:
(1)將測(cè)題逐一歸類到方格中,計(jì)算出屬于各方格的測(cè)題數(shù)量。
(2)由專家和有經(jīng)驗(yàn)的教師判斷每個(gè)方格中的測(cè)題,達(dá)標(biāo)的學(xué)生至少應(yīng)答對(duì)百分之幾十。例如,重要的中等的測(cè)題,及格的學(xué)生至少應(yīng)答對(duì)30%。這樣就編制完成表3。
表3 根據(jù)內(nèi)容設(shè)置測(cè)驗(yàn)標(biāo)準(zhǔn)的分析表
(3)計(jì)算切點(diǎn)分?jǐn)?shù)。即達(dá)標(biāo)學(xué)生的最低得分。計(jì)算公式如下:
式中:X為切點(diǎn)分?jǐn)?shù),P為各方格達(dá)標(biāo)學(xué)生至少應(yīng)答對(duì)的百分比,M為各方格中測(cè)題的規(guī)定的得分的總和,∑為全部方格的P與M的積的連加和。
在表3的例子中,假定每題1分,則切點(diǎn)分?jǐn)?shù)為:
(4)如果由多位專家判斷切點(diǎn)分?jǐn)?shù),則要各位專家判斷的切點(diǎn)分?jǐn)?shù)的平均數(shù),以平均數(shù)為達(dá)標(biāo)的標(biāo)準(zhǔn)。
3. 根據(jù)學(xué)生的成績(jī)?cè)O(shè)置標(biāo)準(zhǔn)
由熟悉學(xué)生的教師將學(xué)生分為成績(jī)較好的、中等的、不達(dá)標(biāo)的三組,分別統(tǒng)計(jì)成績(jī)較好組、不達(dá)標(biāo)組兩組該測(cè)驗(yàn)的分?jǐn)?shù),在同一個(gè)直角坐標(biāo)系中繪制兩組次數(shù)多邊圖,以圖中兩個(gè)次數(shù)分布多邊形的交點(diǎn)的橫坐標(biāo)為切點(diǎn)分?jǐn)?shù)。該例中兩組次數(shù)多邊圖的交點(diǎn)橫坐標(biāo)為“71”,則以71分為這次測(cè)驗(yàn)的達(dá)標(biāo)分?jǐn)?shù)線。
圖1 學(xué)生成績(jī)次數(shù)分布圖
*本文系全國(guó)教育科學(xué)“十二五”規(guī)劃2011年度教育部重點(diǎn)課題“高考加強(qiáng)能力考查的創(chuàng)新研究——以地理學(xué)科的命題研究為例”(項(xiàng)目號(hào):GFA111014)的階段性研究成果。