王煒杰
(漳州師范學(xué)院歷史與社會學(xué)系,福建漳州 363000)
淺談歷史試卷測量法的效度
王煒杰
(漳州師范學(xué)院歷史與社會學(xué)系,福建漳州 363000)
歷史測量法中,試卷測量法是人們經(jīng)常使用,也是最為廣泛使用的一種測量方法。作為一種重要的測量方法,歷史試卷測量法效度的提高顯得尤為重要。一份高質(zhì)量的試卷同時也是高效度的試卷,而要提高試卷測量的效度,出題者的經(jīng)驗和知識非常重要,除此之外,出題者要了解學(xué)生概況,了解并熟悉教材,懂得豐富的教學(xué)方法和各種不同習(xí)題的解決方法,出題者準(zhǔn)備得越充足,就越能把握好出題的難度以及所出題目的針對性,從而有利于提高試卷測量法的效度。
歷史試卷;測量法;效度;出題者
近年來學(xué)術(shù)界關(guān)于歷史測量的方法很多,有問答法、談話法、演講法、試卷測量法等。在這些測量方法中最為常用,使用最為悠久、最為廣泛的方法當(dāng)屬試卷測量法。學(xué)術(shù)界在試卷測量法的類別、作用以及使用情況方面均作了不少介紹。至于歷史試卷測量法的效度及其影響因素涉及的不是很多。下面就對歷史測量法的效度做以分析以及論證說明。
縱觀測量中學(xué)歷史課程教學(xué)質(zhì)量的各種方法,可以看得出試卷測量方法是使用最普遍也是最受歡迎的的一種測量方法?!霸谛睦砼c教育領(lǐng)域,測量也稱為測驗,兩者往往是一個概念?!保?]所謂試卷測量法,就是指把教師講授過、引導(dǎo)學(xué)生學(xué)習(xí)過的課程中所要求的各個知識點按照主觀與客觀兩種形式編寫的題型出現(xiàn)在試卷上,通過學(xué)生在規(guī)定時間內(nèi)所做的結(jié)果來評估教師教以及學(xué)生學(xué)習(xí)效果的一種測量方法。這種方法使用很廣泛,確實對教師教學(xué)質(zhì)量的評估和學(xué)生學(xué)習(xí)情況的考察起到了重要的作用。我國自隋代科舉考試以來,試卷測量法就已經(jīng)得到了統(tǒng)治階級的重視,相對其他測量方法也比較客觀公正,對人才的選拔起到了至關(guān)重要的作用。時下,試卷測量法仍然是國家選拔人才的重要方法。但是在使用測量方法時一定要注意,“歷史教育或心理測量是把事物或人的屬性加以數(shù)量化,用可以比較的數(shù)值計量歷史教學(xué)或歷史學(xué)習(xí)成果的?!保?]試卷測量作為一種評估教師教和學(xué)生學(xué)的一種重要測量手段,是按照不同的情況進(jìn)行劃分的。
針對升學(xué)考試,測量所采用的試卷是標(biāo)準(zhǔn)化試卷,也就是說試卷要有區(qū)分度,必須要把差生、中等生和優(yōu)秀學(xué)生區(qū)分開來,從而為選拔棟梁之才提供客觀的參考數(shù)據(jù)。標(biāo)準(zhǔn)化試卷所用的題型難度分為簡單題、中等題、難題,其中中等題占總題量的多半。比如考察歷史事件的年代、人物識記的題型就是比較容易的,屬于簡單題;對歷史事件的意義及影響的考察屬于中等題(如太平天國失敗的原因及其歷史意義);對一些歷史專業(yè)術(shù)語的考察一般要求比較深,比如讓學(xué)生論述井田制產(chǎn)生的背景及其歷史影響等。而針對水平考試,試卷題型仍然是由主觀和客觀兩大類題型構(gòu)成,但是試卷的題型難度降低,其中簡單題與中等題占了試卷試題中的絕大多數(shù),主要考察學(xué)生對基礎(chǔ)知識的了解、識記、理解等情況。這種試卷與升學(xué)考試試卷的考察深度具有顯著的區(qū)別,前者主要測量學(xué)生對知識點是否掌握到“化”的程度,后者主要測量學(xué)生對知識點是否掌握到“知”的程度。所謂“化”,本意是指消化的意思,這里就是指對知識點不但要達(dá)到識記的標(biāo)準(zhǔn),還要達(dá)到綜合應(yīng)用的程度,能夠通過一個知識點推論出相類似但又不同的新知識點而且要能夠把不同知識點有邏輯地排列,并能組織起來用到具體實踐之中去解決實際問題。所謂“知”,主要是指測量學(xué)生對知識點的識記與理解情況。學(xué)生只要達(dá)到記憶和理解的標(biāo)準(zhǔn)就可以滿足畢業(yè)的基本要求(如果要升學(xué)就要繼續(xù)努力向“化”邁進(jìn))。第三種試卷測量的方法是課內(nèi)測量法(過程性評價),這種試卷測量法主要是配合教師講、啟發(fā)誘導(dǎo)學(xué)生學(xué)習(xí)而用的一種方法。該方法是教師課堂教學(xué)的一個輔助手段。題量不易大,一般主要是由幾個題目構(gòu)成,出題的思路一定要根據(jù)不同程度的班級有區(qū)別地對待。命題角度一般要考慮學(xué)生的“最近發(fā)展區(qū)”,要讓學(xué)生“知而不會”,從而適當(dāng)引導(dǎo)并啟發(fā)學(xué)生學(xué)會思考。按照這個標(biāo)準(zhǔn)所出的試卷不但可以提高教師的課堂效果而且也可以刺激學(xué)生的求知欲,激發(fā)學(xué)生學(xué)習(xí)歷史的潛能。要做好這個工作,教師就要有明確的教學(xué)目標(biāo),正如一位學(xué)者所說的,“教學(xué)目標(biāo)是統(tǒng)領(lǐng)課堂教學(xué)的一個重要的方向性指標(biāo)。提問解決什么,教師要做到心中有數(shù),有的放矢。”[3]所以,教師在課堂教學(xué)中使用試卷時把握好這個度就非常重要了。
前面說起過試卷測量法在不同情況下的應(yīng)用,可以說試卷的測量效果以及可信度一直以來都是教育者們所關(guān)注的問題。歷史試卷作為一種重要的測量工具,如果測量的準(zhǔn)確性越高,產(chǎn)生的效果就越好,這種測量就越有利于教學(xué)的評估,而評估的標(biāo)準(zhǔn)又取決于測量的效度?!叭魏我环N測驗只是對一定的目的來說是有效的,對其他目的和用途卻不一定有效?!保?]對于歷史試卷測量法也是一樣,一定要達(dá)到預(yù)期的測量目的,盡可能地取得相應(yīng)的效果。通常測量所要達(dá)到的目標(biāo)的衡量標(biāo)準(zhǔn)是以效度為參考依據(jù)的。那么試卷效度該如何定義呢?所謂試卷效度就是指試卷測量所取得的效果以及測量的準(zhǔn)確性。試卷測量的效度越高,就說明教學(xué)目標(biāo)與測量結(jié)果越接近。如果測量結(jié)果與教學(xué)目標(biāo)相差甚遠(yuǎn),則證明試卷的效度很低,不適于作為教學(xué)評估的工具。如果要提高歷史課程的教學(xué)效果,對于學(xué)生學(xué)習(xí)的過程和結(jié)果的有效測量是必不可少的。所以提高歷史試卷的效度是非常重要的。影響歷史試卷測量效度的因素有很多,主要包括歷史試題的難度、出題者(教師)的水平、學(xué)生的因素、環(huán)境的因素等。下面筆者對此問題作以具體分析說明。
第一,歷史試題的難度。歷史試卷作為一種測量工具,并且客觀地反映出測量的結(jié)果,通常使用量化的數(shù)字去表示最終的結(jié)果,即分?jǐn)?shù)。試卷的難度通常用難度系數(shù)表示。難度系數(shù)按如下標(biāo)準(zhǔn)說明:以D表示難度系數(shù),N表示參加考試的總?cè)藬?shù),p表示答對題目的人數(shù),則D=P÷N。不難看出,D值越大,通過的人就越多,說明題越簡單;D值越小,通過的人就越少,說明題越難。說到這里也許會有人提出疑問:D值與試卷測量的效度有多大的相關(guān)性?關(guān)于這個問題不可一概而論。不同類型的考試,其試卷所要測量的標(biāo)準(zhǔn)是不同的。學(xué)業(yè)水平考試(有些地區(qū)叫會考)主要是測量學(xué)生對基礎(chǔ)知識掌握的程度(以“知”作為主要指標(biāo)來衡量),要求絕大多數(shù)學(xué)生可以順利通過。比如難度系數(shù)為0.9,那就說明學(xué)生已經(jīng)掌握了課程標(biāo)準(zhǔn)的要求,試卷滿足了大部分學(xué)生通過的目標(biāo),測量結(jié)果與實際教學(xué)目標(biāo)基本大為一致,試卷效度比較高;假如D為0.2,那么就說明只有20%的學(xué)生可以通過考試,而水平考試要求絕大部分考生通過考試,這就說明了測量的結(jié)果與教學(xué)目標(biāo)的差距比較大,由此可見效度就很低了。對于升學(xué)考試來說,試卷的難度要加大,從而滿足政府選拔人才的需要。以高考為例來說明,假如某個省選拔一本生,招收20%的學(xué)生,也就是說有80%的考生要在一本線之下。一份試卷如果用于這樣的選拔性考試,D值越接近0.2,則效度就越高,反之效度就低。
第二,出題者的水平。出題者往往由一線教師擔(dān)任的居多,教師作為教育工作者不僅僅要主管教學(xué)工作,還要參與管理與命題工作。一名優(yōu)秀的教師不但在教學(xué)上和管理上是一把手,在命題上也應(yīng)該是高手,并能準(zhǔn)確地把握題目的難度從而恰當(dāng)?shù)刈プ〕鲱}的關(guān)鍵因素。所以,教師是命制試卷的主導(dǎo)者,是重要的人力教育資源。一位學(xué)者巧妙地說道:“教師不僅是教學(xué)資源重要的載體,決定了教學(xué)資源的鑒別、利用、積累和開發(fā),而其本身就是教學(xué)過程中最重要的條件資源?!保?]所以,教師的水平直接影響試卷的含金量。通常教師的專業(yè)知識越扎實、教學(xué)經(jīng)驗越豐富,出題就越有真針對性。專業(yè)知識的牢固程度與教學(xué)經(jīng)驗直接決定了出題者的出題水平。要作為一名出色的出題者,首先就必須要達(dá)到這兩個條件。如果達(dá)不到其中的任何一個,那么試卷的質(zhì)量就會受到嚴(yán)重影響。原因比較明顯,假如教師專業(yè)知識不合格,他在命題的過程中一旦出現(xiàn)差錯,就會對學(xué)生造成誤導(dǎo),測出的結(jié)果也沒有參考價值,效度不高就成為必然了;如果教師的經(jīng)驗不多,那么他在出題的過程中也會出現(xiàn)嚴(yán)重的問題,諸如出題難度過小或者過大,不能很好地測量學(xué)生的實際水平,這些都會導(dǎo)致效度很低。
第三,學(xué)生因素分析。試卷測量法面對的畢竟是學(xué)生,不同的學(xué)生能力千差萬別,試卷測量的效度或多或少都會受到學(xué)生因素的影響?,F(xiàn)筆者說明學(xué)生因素的不同對測量結(jié)果的影響,例如有的學(xué)生字跡模糊,閱卷者看不清會給予錯誤的分?jǐn)?shù),一個學(xué)生個例,對整體測量的影響可以忽略不計。但如果抽取一部分學(xué)生作抽樣調(diào)查,如果恰好所抽到的學(xué)生都是書寫潦草粗心之人,那么以這樣的學(xué)生為測量樣本,其測量結(jié)果肯定不具有代表性,導(dǎo)致測量效度降低。再列舉分析,如果要測量學(xué)生學(xué)業(yè)水平,試題過難,出題者在抽樣時,如果不小心抽了幾個優(yōu)等生(偶然巧合),那么抽樣測量的通過率就會過高(會誤以為整體水平較高)。如果繼續(xù)以此試卷去測量學(xué)生整體水平,就可以看到測量的成績會低于預(yù)期目標(biāo)很多。再次,男女性別差異也是學(xué)生因素中影響測量效度的重要因素之一。男學(xué)生善于邏輯思維,但在語言和記憶上處于劣勢;女生則相反。所以測量時男女生比例要適中,以保證測量的準(zhǔn)確性和高效度。
既然歷史試卷作為測量教學(xué)效果和學(xué)生學(xué)習(xí)的工具,那么設(shè)計出高質(zhì)量、高效度的試卷就非常重要了。怎樣才可以設(shè)計出高質(zhì)量的試卷呢?筆者在此提出一些粗淺的建議僅供參考。首先,歷史的命題難度要適宜。如果難度過大就會對優(yōu)等生有不利的影響,學(xué)生的水平差異也很難檢查出來。例如,2009年高考文綜Ⅱ卷第23題,其內(nèi)容為:英國歷史學(xué)家霍布斯鮑姆在總結(jié)20世紀(jì)的歷史時說,最簡單明了的一點,就是到80年代,保加利亞與厄瓜多爾之間的相似之處,遠(yuǎn)比其各自與1939年時的本國或?qū)Ψ礁鼮榻咏?。他?qiáng)調(diào)的是:( )
A.走向現(xiàn)代化的國家經(jīng)濟(jì)上共同之處增多
B.經(jīng)濟(jì)全球化使各國之間的聯(lián)系日益密切
C.不同國家之間的社會發(fā)展水平差距縮小
D.各國經(jīng)濟(jì)發(fā)展速度加快
這道題看起來很令人費(fèi)解,而且在考場上,考生在心里極其緊張的狀況下讀懂其意思更是難上加難。這對于選拔性考試就很不利。正如某位副教授所言,“這道題的題干部分非常繞口,考生即使讀三遍恐怕也難全面理解其中的含義?!保?]所以,這道題目的測量效度就比較低,大量的優(yōu)等生、中等生以及差生都無法做出來,區(qū)分度差就不可避免了。其次,試題一定要在課程標(biāo)準(zhǔn)和考綱要求的范圍內(nèi)。下面舉一個例子具體說明,有一道簡答題,要求簡答馬關(guān)條約內(nèi)容及其對帝國主義侵略野心的影響。這道習(xí)題考察了八年級上冊中國近代史的內(nèi)容。仔細(xì)對照課本,可以看到書上的內(nèi)容僅僅提到了“條約內(nèi)容,即,規(guī)定清政府割讓遼東半島、臺灣、澎湖列島給日本,賠償軍費(fèi)白銀2億兩,增開沙市、重慶、蘇州、杭州為通商口岸,允許日本在通商口岸投資設(shè)廠等;負(fù)面影響就是中國的半殖民地化程度大大加深?!保?]課本上的內(nèi)容沒有涉及條約的內(nèi)容對帝國主義侵略野心影響的相關(guān)因素。故而言之,該題無法達(dá)到預(yù)期的測量效果,題目的超綱影響了題目的效度。出題者要在出題之前預(yù)先熟悉教材內(nèi)容是非常重要的。只有出題者熟悉考綱和課程標(biāo)準(zhǔn),所出的題才會有針對性。再次,出題者出的題盡量與當(dāng)今社會相聯(lián)系,這樣的測量才可以引導(dǎo)學(xué)生發(fā)展以史為鑒、評價歷史的能力。譬如,如果要考查羅馬人的法律的歷史意義,出題者就可以在命題時考慮到羅馬法與近代和當(dāng)今法律體系有哪些聯(lián)系。這個內(nèi)容也可以按照材料解析題型進(jìn)行命制,材料可以適當(dāng)涉及近代和當(dāng)今法律體系的一些相關(guān)內(nèi)容。例如,“拿破侖時期頒布的《民法典》、英國的權(quán)利法案、美國的《獨(dú)立宣言》、西方國家的某些司法原則等?!保?]都可以在羅馬法中找到淵源,材料的內(nèi)容可以把這些考慮其中。最后,就是題目考察的要求除了記憶和能力之外,還應(yīng)增加對歷史情景的考察。所以,在命制歷史試題盡量多用圖片(包含照片),讓學(xué)生通過圖直接感受歷史,這樣可以考察學(xué)生應(yīng)用歷史以及想象問題的能力。除此之外,還可以培養(yǎng)學(xué)生學(xué)習(xí)歷史的興趣和激情。用圖片出的題給人一種身臨其境的感覺,學(xué)生不但直接感受歷史,還可以對歷史事件和人物產(chǎn)生深刻的印象。圖片通常包含歷史上的人物、各種古董、古跡以及場景的照片等。某位學(xué)者說過:“以圖片為載體的識圖題使得試題形式新穎活潑,便于引起學(xué)生的學(xué)習(xí)興趣,激發(fā)學(xué)生的想象能力。”[9]
總之,歷史試卷測量法的效度是由出題者的知識和經(jīng)驗、學(xué)生因素、試卷的設(shè)計方法等幾個因素共同影響決定的,只有這幾個因素相互協(xié)調(diào),相互促進(jìn),那么試卷測量的準(zhǔn)確性才會得到相應(yīng)的提高。試卷的質(zhì)量提高了,其測量效果就會與預(yù)期的測量結(jié)果更為相近,測量效度也會得到相應(yīng)的提高。一份高效度的試卷離不開知識淵博、經(jīng)驗豐富的出題者,離不開教師對學(xué)生的了解,離不開出題者對教材的熟悉和研究,離不開出題者對題型和題型解法的研究,也更需要一線教師作為出題者(一線教師更加了解學(xué)生,熟悉教材、課標(biāo)要求,經(jīng)驗也最直接)。所以,一份高效度的試卷體現(xiàn)了知識的綜合以及教師教學(xué)方法等因素相互作用的結(jié)果。
:
[1]于友西.中學(xué)歷史教學(xué)法[M].北京:高等教育出版社,2009:275.
[2]姬秉新.歷史教育學(xué)概論[M].北京:教育科學(xué)出版社,1997:38.
[3]謝毓玲.淺析中學(xué)歷史課堂的有效提問[J].安慶師范學(xué)院學(xué)報,2010,(9):119.
[4]教育部人事司,伍新春.高等教育心理學(xué)[M].北京;高等教育出版社,1999:397.
[5]劉軍.中學(xué)歷史教學(xué)探究[M].北京;人民出版社,2009;214.
[6]史風(fēng)春.2009年高考全國文綜Ⅱ卷歷史試題評析[J].內(nèi)蒙古師范大學(xué)學(xué)報,2009,(8):85-86.
[7]王斯德.中國歷史初中二年級(上)[M].上海:華東師范大學(xué)出版社,2008:15-16.
[8]課程教材研究所,歷史課程教材研究開發(fā)中心.普通高中課程標(biāo)準(zhǔn)實驗教科書歷史必修1[M].北京:人民教育出版社,2007:29.
[9]劉桂章.利用歷史圖表創(chuàng)設(shè)歷史情景——2007年中考?xì)v史識圖題探析[J].試題與研究,2007,(14):5.
Brief Discussion on the Validity of the Measurement of Historical Examination Papers
WANG Wei-jie
(School of History and Sociology,Zhangzhou Normal University,Zhangzhou 363000,China)
In the historical measurement,paper measurement is frequently used,and it is also the most widely used measurement.It is of great importance to improve the validity of the measurement of historical paper,which is an important method of measurement.A piece of high quality paper is also a piece of paper with the high validity,and to improve the validity of the examination paper measurement,the experience and knowledge of the instructor is very important;in addition,the educator should understand the students'situations,be familiar with the teaching materials,understand the rich teaching methods and different kinds of problem solutions.The better the instructor prepared,the more they can grasp the difficulty of the topic as well as the pertinence,which helps to improve the validity of the examination paper measurement.
historical examination paper;measurement;validity;instructor
G427
A
1001-7836(2012)12-0113-03
10.3969/j.issn.1001-7836.2012.12.048
2012-06-12
王煒杰(1978-),男,陜西咸陽人,碩士研究生,從事歷史課程與教學(xué)論研究。