邵紅萬(wàn)
[摘要] 英語(yǔ)語(yǔ)言測(cè)試是語(yǔ)言教學(xué)中不可分割的環(huán)節(jié)。作為一名英語(yǔ)教師了解和掌握語(yǔ)言測(cè)試基本理論是當(dāng)務(wù)之急。本文介紹了英語(yǔ)語(yǔ)言測(cè)試的分類、信度、效度、可行性、難度、區(qū)分度等基本理論,分析了英語(yǔ)語(yǔ)言測(cè)試實(shí)踐中存在的四大主要問(wèn)題,并從三個(gè)方面圍繞如何使英語(yǔ)測(cè)試促進(jìn)英語(yǔ)教學(xué)進(jìn)行了嘗試性探討。
[關(guān)鍵詞] 語(yǔ)言測(cè)試 測(cè)試?yán)碚撊笔?測(cè)試類型 測(cè)試信度 測(cè)試效度 測(cè)試反撥
一、引言
Anastasi(1982)認(rèn)為“測(cè)試實(shí)質(zhì)上是對(duì)行為樣本所做的客觀的標(biāo)準(zhǔn)化測(cè)量”。Carroll (1968: 6)則認(rèn)為測(cè)試是一套程序,旨在誘發(fā)受試者的行為反應(yīng),并以此推導(dǎo)出他的相關(guān)特征(a procedure designed to elicit certain behavior from which one can make inferences about certain characteristics of an individual)。語(yǔ)言測(cè)試是語(yǔ)言教學(xué)中不可分割的環(huán)節(jié),測(cè)試內(nèi)容和形式常常會(huì)對(duì)教學(xué)內(nèi)容和方法起反撥作用(胡春洞,1990:247)。然而,由于英語(yǔ)教師測(cè)試?yán)碚撊笔?英語(yǔ)語(yǔ)言測(cè)試實(shí)踐出現(xiàn)一些列問(wèn)題。作為一名英語(yǔ)教師了解和掌握語(yǔ)言測(cè)試基本理論是當(dāng)務(wù)之急,如何使英語(yǔ)測(cè)試促進(jìn)英語(yǔ)教學(xué)是一個(gè)值得探討的問(wèn)題。
二、英語(yǔ)語(yǔ)言測(cè)試?yán)碚摶仡?/p>
(一)英語(yǔ)語(yǔ)言測(cè)試類型
Hughes(1989:9-19)依據(jù)測(cè)試目的、測(cè)試方法和方式、測(cè)試題型、測(cè)試成績(jī)判別標(biāo)準(zhǔn)和判卷標(biāo)準(zhǔn)進(jìn)行分類,將英語(yǔ)測(cè)試分為五大類。
1.依據(jù)測(cè)試目的進(jìn)行分類
(1)水平測(cè)試(proficiency test)
水平測(cè)試是為了測(cè)試人們語(yǔ)言能力而設(shè)計(jì)的,設(shè)計(jì)者不管被試學(xué)了多長(zhǎng)時(shí)間,也不考慮他們所學(xué)課程內(nèi)容或目標(biāo),而是測(cè)試被試是否達(dá)到某種語(yǔ)言水平。如TOEFL,GRE,IELTS,大學(xué)英語(yǔ)四六級(jí)、江蘇省英語(yǔ)應(yīng)用能力考試等都屬于水平測(cè)試。其目的是為了檢測(cè)被試是否能夠勝任某項(xiàng)學(xué)習(xí)任務(wù)或是否能夠勝任某項(xiàng)工作。
(2)學(xué)業(yè)成績(jī)測(cè)試(achievement test)
學(xué)業(yè)成績(jī)測(cè)試是用來(lái)考查被試在學(xué)習(xí)英語(yǔ)某一階段或最終階段的成功程度。與所學(xué)課程直接相關(guān),目的是看學(xué)習(xí)者是否取得了進(jìn)步,以及取得了多大進(jìn)步。設(shè)計(jì)學(xué)業(yè)成績(jī)測(cè)試可以依據(jù)課程內(nèi)容或教材內(nèi)容,也可依據(jù)課程目標(biāo),它們各有利弊。學(xué)業(yè)成績(jī)測(cè)試包含期末考試(final achievement tests)和階段性測(cè)試(progress achievement tests) (Hughes,1989:10)。
2.依據(jù)測(cè)試方法和方式進(jìn)行分類(束定芳,1996:179-181)
(1)直接測(cè)試(direct testing)
直接考察學(xué)生某一方面語(yǔ)言能力的測(cè)試稱為直接測(cè)試。我們要了解學(xué)生的作文能力就要求學(xué)生寫出一、二篇作文;我們要測(cè)試學(xué)生的語(yǔ)音語(yǔ)調(diào),就要求學(xué)生開口講話。直接測(cè)試的好處:①測(cè)試目的明確;②對(duì)測(cè)試結(jié)果的評(píng)估也比較直接;③因?yàn)樗鶞y(cè)試的內(nèi)容正是我們所要培養(yǎng)的技能,其正面反撥作用(positive backwash)十分顯著。
(2)間接測(cè)試(indirect testing)
間接測(cè)試即通過(guò)測(cè)試某一技能所具備某種能力來(lái)發(fā)現(xiàn)學(xué)生這方面的語(yǔ)言能力。間接測(cè)試的優(yōu)點(diǎn)是提供了一種通過(guò)測(cè)試部分有限的能力而了解到學(xué)生各種不同的語(yǔ)言能力。間接測(cè)試的缺點(diǎn)是學(xué)生測(cè)試結(jié)果與實(shí)際能力之間的關(guān)系并不十分明確。如通過(guò)要求學(xué)生判斷某對(duì)單詞是否同韻來(lái)測(cè)試學(xué)生的發(fā)音能力就屬于間接測(cè)試。
Hughes認(rèn)為,就水平測(cè)試和學(xué)業(yè)成績(jī)測(cè)試來(lái)說(shuō)直接測(cè)試比間接測(cè)試好,所獲取的對(duì)某種能力的信息要比間接測(cè)試精確和可靠。直接測(cè)試也比間接測(cè)試試題更容易設(shè)計(jì)。
3.依據(jù)測(cè)試題型進(jìn)行分類 (束定芳,1996:181)
分散點(diǎn)測(cè)試指每次只測(cè)試一個(gè)項(xiàng)目的測(cè)試,每道試題只測(cè)試某一特定的語(yǔ)法結(jié)構(gòu)等,屬于間接測(cè)試。如教師圍繞狀語(yǔ)從句虛擬語(yǔ)氣用法編寫30道選擇題進(jìn)行測(cè)試,這種測(cè)試就屬于分散點(diǎn)測(cè)試。
4.依據(jù)測(cè)試成績(jī)判別標(biāo)準(zhǔn)進(jìn)行分類 (束定芳,1996:181-182)
(1)常模參考型測(cè)試(norm-referenced testing)
把某一考生考試的結(jié)果與參與同一考試的考生成績(jī)相比較以判別其語(yǔ)言能力的測(cè)試叫常模參考型測(cè)試。如參加考試的考生有100人,考生A只考了30分(滿分100),但排名前十,說(shuō)明考生A的語(yǔ)言能力在100人的群體中屬于優(yōu)秀。
(2)標(biāo)準(zhǔn)參考型測(cè)試(criterion-referenced testing)
以某種特定的語(yǔ)言能力標(biāo)準(zhǔn)作為判別標(biāo)準(zhǔn)的測(cè)試稱為標(biāo)準(zhǔn)參考測(cè)試。標(biāo)準(zhǔn)參考型測(cè)試有兩大優(yōu)點(diǎn):①標(biāo)準(zhǔn)不變,主要要求學(xué)生能達(dá)到某一標(biāo)準(zhǔn);②考生可以有明確的奮斗目標(biāo),為達(dá)到這一標(biāo)準(zhǔn)而努力。
5.依據(jù)判卷標(biāo)準(zhǔn)進(jìn)行分類 (束定芳,1996:182)
(1)客觀測(cè)試(objective testing)
閱卷標(biāo)準(zhǔn)事先確定不需任何閱卷者個(gè)人主觀判斷,這種測(cè)試稱為客觀性測(cè)試。如多項(xiàng)選擇題,從四個(gè)選項(xiàng)中選出一個(gè)最佳答案,閱卷標(biāo)準(zhǔn)無(wú)須閱卷者做任何主觀判斷,這樣的測(cè)試就屬于客觀測(cè)試。
(2)主觀測(cè)試(subjective testing)
閱卷標(biāo)準(zhǔn)主要依據(jù)閱卷者個(gè)人判斷,這種測(cè)試稱為主觀測(cè)試,如作文、簡(jiǎn)答題等就屬于主觀測(cè)試。
(二)測(cè)試基本要素:效度
效度是一個(gè)單一而又整體的概念(a single, unitary concept)(Bachman,1990: 241),是指測(cè)試的內(nèi)容及其方式是否符合測(cè)試的目的和要求(胡春洞,1990:258)即測(cè)試所能取得某些目標(biāo)的有效程度(章兼中,1993:411)。一項(xiàng)測(cè)試只有能夠準(zhǔn)確測(cè)試它所希望測(cè)試的內(nèi)容才具有效度。
1.內(nèi)容效度(content validity)
內(nèi)容效度指測(cè)試內(nèi)容包括所要測(cè)試的語(yǔ)言技能、語(yǔ)言結(jié)構(gòu)等方面有代表性的要素。內(nèi)容效度越高就越能精確了解到所要測(cè)試的內(nèi)容。
2.標(biāo)準(zhǔn)效度(criterion-related validity)
標(biāo)準(zhǔn)效度是指測(cè)試結(jié)果與其它高信度測(cè)試結(jié)果進(jìn)行對(duì)比,看它們?cè)诙啻蟪潭壬衔呛?。作為?duì)比的其他測(cè)試結(jié)果就成了檢驗(yàn)現(xiàn)有測(cè)試的效度標(biāo)準(zhǔn)。這種測(cè)試的效度就稱為標(biāo)準(zhǔn)效度。標(biāo)準(zhǔn)效度主要包括同期效度(concurrent validity)和預(yù)測(cè)效度(predictive validity)。同期效度是指測(cè)試效度可與一個(gè)較長(zhǎng)、較全面的測(cè)試結(jié)果相對(duì)比,如果結(jié)果相一致,則被認(rèn)為具有同期效度。預(yù)測(cè)效度是指預(yù)測(cè)被測(cè)試未來(lái)語(yǔ)言實(shí)際能力的準(zhǔn)確程度。
三、英語(yǔ)語(yǔ)言測(cè)試實(shí)踐存在的問(wèn)題
筆者根據(jù)自身實(shí)踐和觀察,認(rèn)為當(dāng)前高職英語(yǔ)測(cè)試中仍然存在如下四方面的問(wèn)題。
(一)英語(yǔ)測(cè)試類型混用
在英語(yǔ)教學(xué)中由于教師缺乏英語(yǔ)語(yǔ)言測(cè)試?yán)碚?英語(yǔ)測(cè)試實(shí)踐中出現(xiàn)測(cè)試類型使用混亂的現(xiàn)象。如教師在編寫英語(yǔ)期末試卷時(shí),完全采用了江蘇省英語(yǔ)應(yīng)用能力考試試卷,未加任何修改。殊不知英語(yǔ)課程的期末考試屬于學(xué)業(yè)成績(jī)考試,而江蘇省英語(yǔ)應(yīng)用能力考試屬于水平測(cè)試。期末考試目的是了解學(xué)生一學(xué)期所學(xué)英語(yǔ)語(yǔ)言知識(shí)和技能掌握的情況,所取得的進(jìn)步。期末考試應(yīng)與所學(xué)課程內(nèi)容和要求緊密結(jié)合。而等級(jí)考試反映的是學(xué)生英語(yǔ)水平,與學(xué)生本學(xué)期英語(yǔ)課程所學(xué)內(nèi)容無(wú)關(guān)。
(二)英語(yǔ)測(cè)試信度、效度偏低
由于缺乏對(duì)測(cè)試的信度和效度了解,大多數(shù)英語(yǔ)教師在編寫試題過(guò)程中忽略信度和效度,造成測(cè)試的效度低且信度也很低。如期末考試由于選用水平測(cè)試,節(jié)省教師編制試題的時(shí)間和財(cái)力,測(cè)試的可行性得到保證。但由于考試內(nèi)容與學(xué)生本階段英語(yǔ)學(xué)習(xí)毫無(wú)關(guān)系,考試結(jié)果無(wú)法準(zhǔn)確反映學(xué)生一學(xué)期所學(xué)英語(yǔ)知識(shí)和技能掌握情況,因此考試效度很低。同時(shí),由于教師采用英語(yǔ)水平等級(jí)考試試題,引起學(xué)生猜題或押題,有的學(xué)生可能以前做過(guò)類似的試卷,測(cè)試的信度大大打折扣。
四、如何使英語(yǔ)測(cè)試服務(wù)于英語(yǔ)教學(xué)
一份好的測(cè)試應(yīng)遵循一定效度、信度和可行性以及良好的反撥作用。根據(jù)以上對(duì)測(cè)試實(shí)踐中存在問(wèn)題的分析,筆者總結(jié)了在英語(yǔ)教學(xué)中應(yīng)從如下三方面使英語(yǔ)測(cè)試促進(jìn)英語(yǔ)教學(xué),使其成為英語(yǔ)教學(xué)的有機(jī)組成部分。
(一)加強(qiáng)英語(yǔ)教師測(cè)試?yán)碚搶W(xué)習(xí)
通過(guò)教師自學(xué)、專家講座、教學(xué)研討等多種形式加強(qiáng)英語(yǔ)語(yǔ)言測(cè)試?yán)碚搶W(xué)習(xí),讓每位教師熟練掌握測(cè)試類型、測(cè)試目的、測(cè)試效度、信度、可行性、區(qū)分度、難度、編寫試題步驟等基本理論。在英語(yǔ)教學(xué)中針對(duì)不同測(cè)試目的采用不同測(cè)試,科學(xué)運(yùn)用英語(yǔ)測(cè)試,發(fā)揮英語(yǔ)測(cè)試的正面反撥作用,促進(jìn)英語(yǔ)教學(xué)。
(二)通過(guò)多種途徑提高測(cè)試信度
如何提高測(cè)試信度是語(yǔ)言測(cè)試實(shí)踐中的難題。Hughes(1989:36~42)提出14種提高測(cè)試信度的辦法,筆者認(rèn)為其中六種方法應(yīng)引起英語(yǔ)教師重視。
1.確保測(cè)試內(nèi)容豐富。測(cè)試內(nèi)容越多,信度越高。當(dāng)然鑒于測(cè)試的可行性,一般重要的考試時(shí)間控制在兩小時(shí)左右。如果測(cè)試結(jié)果非常重要,測(cè)試內(nèi)容和時(shí)間就可相應(yīng)加長(zhǎng),如TOEFL, GRE等。
2.限制被試答題范圍。不同作文考核被試側(cè)重點(diǎn)不同,如果寫作提供多個(gè)作文題目,且對(duì)內(nèi)容不加規(guī)定或限制,測(cè)試被試寫作能力的信度就會(huì)降低。
五、結(jié)論
Hughes(1989:1-2,44-48)指出語(yǔ)言測(cè)試會(huì)對(duì)語(yǔ)言教與學(xué)產(chǎn)生影響,這種影響可能是有益的,也可能是有害的。教學(xué)與測(cè)試關(guān)系應(yīng)該是伙伴關(guān)系。測(cè)試對(duì)好的教學(xué)發(fā)揮促進(jìn)作用,對(duì)不好的教學(xué)發(fā)揮糾正作用。作為英語(yǔ)教師只有掌握英語(yǔ)測(cè)試的理論,才能避免英語(yǔ)測(cè)試類型混用,通過(guò)多種途徑提高測(cè)試的信度和效度,兼顧難度和區(qū)分度,充分發(fā)揮英語(yǔ)測(cè)試對(duì)英語(yǔ)教學(xué)的正面反撥作用,使英語(yǔ)測(cè)試真正服務(wù)于英語(yǔ)教學(xué)。
參考文獻(xiàn):
[1]胡春洞.英語(yǔ)教學(xué)法[M].北京:高等教育出版社,1990.
[2]束定芳.現(xiàn)代外語(yǔ)教學(xué)——理論、實(shí)踐與方法[M].上海:上海外語(yǔ)教育出版社,1996.
[3]章兼中.外語(yǔ)教育學(xué)[M].浙江:浙江教育出版社,1993.
本文為江蘇省2007年教改課題編碼272《高職英語(yǔ)課程評(píng)價(jià)體系理論與實(shí)踐》與2007年院級(jí)課題《大學(xué)英語(yǔ)教學(xué)理論與實(shí)踐體系》。