王建梅
(重慶理工大學(xué)外國語學(xué)院,重慶 400054)
高風(fēng)險(xiǎn)語言測(cè)試負(fù)面后效產(chǎn)生的原因及對(duì)策
——以大學(xué)英語四級(jí)考試為例
王建梅
(重慶理工大學(xué)外國語學(xué)院,重慶 400054)
高風(fēng)險(xiǎn)語言測(cè)試負(fù)面后效產(chǎn)生的主要原因是測(cè)試目的不明確、測(cè)試目標(biāo)和教學(xué)目標(biāo)不一致、測(cè)試內(nèi)容與實(shí)際語言運(yùn)用不一致。測(cè)試開發(fā)者應(yīng)通過準(zhǔn)確定位高風(fēng)險(xiǎn)測(cè)試目的和使用范圍,開發(fā)更多語言測(cè)試,提供多種選擇等措施改善測(cè)試方法,減少高風(fēng)險(xiǎn)語言測(cè)試負(fù)面后效。同時(shí),社會(huì)、政府、學(xué)校都應(yīng)對(duì)測(cè)試后效的復(fù)雜性有充分認(rèn)識(shí),科學(xué)利用測(cè)試對(duì)教學(xué)的調(diào)控作用。
高風(fēng)險(xiǎn)語言測(cè)試;負(fù)面后效;大學(xué)英語四級(jí)考試;測(cè)試目標(biāo);教學(xué)目標(biāo)
語言測(cè)試后效(the impact of language testing)指測(cè)試對(duì)教師和學(xué)生個(gè)體、教學(xué)政策、教學(xué)實(shí)踐、教學(xué)體系以及社會(huì)等產(chǎn)生的影響[1]291。近年來,語言測(cè)試后效或反撥作用(washback)已成為語言測(cè)試研究中頻繁使用的一詞,并受到廣泛重視?!罢Z言測(cè)試工作者的研究重點(diǎn)逐步從提高測(cè)試信度和改進(jìn)測(cè)試效度發(fā)展到關(guān)注測(cè)試的后效?!盵2]語言測(cè)試后效研究主要有兩種:傳統(tǒng)的多項(xiàng)選擇測(cè)試和大規(guī)模測(cè)試[3]2。測(cè)試后效對(duì)教學(xué)的影響有積極的一面,也有消極的一面?!耙话銇碚f,測(cè)試,特別是語言測(cè)試,常常因其對(duì)教學(xué)產(chǎn)生負(fù)面影響而廣泛受到批評(píng)。”[3]12560多年前Vernon就發(fā)現(xiàn),在教學(xué)活動(dòng)中,教師容易忽視與通過考試關(guān)系不大的學(xué)習(xí)科目和活動(dòng)[4]166。接著許多語言研究者指出測(cè)試對(duì)教學(xué)活動(dòng)會(huì)產(chǎn)生負(fù)面效應(yīng)[5-9]。并且,高風(fēng)險(xiǎn)語言測(cè)試對(duì)教學(xué)更易產(chǎn)生直接的、負(fù)面的后效[10]3;考試風(fēng)險(xiǎn)越大,教學(xué)就越可能受到負(fù)面影響,遭到扭曲[11]。因此,語言測(cè)試研究和使用必須充分考慮和盡可能減少測(cè)試的負(fù)面后效。然而,測(cè)試負(fù)面效應(yīng)與測(cè)試質(zhì)量并不是簡(jiǎn)單的單項(xiàng)對(duì)應(yīng)關(guān)系?!耙粋€(gè)不好的測(cè)試可能會(huì)產(chǎn)生好的后效,而一個(gè)好的測(cè)試由于教育系統(tǒng)的其它原因可能產(chǎn)生壞的后效?!盵12]242語言測(cè)試的正面或負(fù)面后效,受到包括測(cè)試質(zhì)量在內(nèi)的多方面影響,如教育、社會(huì)、政治等多種因素?!敖?0年語言測(cè)試?yán)碚撗芯恐匾晒?就是認(rèn)識(shí)到學(xué)生考試分?jǐn)?shù)代表著復(fù)雜的多種因素影響?!盵3]2
作為全球每年參考人數(shù)最多的大學(xué)英語四級(jí)考試發(fā)展迅速,考試規(guī)模從20世紀(jì)80年代末的十多萬人發(fā)展到目前每年一千多萬,已成為一個(gè)大規(guī)模、高風(fēng)險(xiǎn)的考試[13]。在22年間,大學(xué)英語四級(jí)考試從廣為接受到備受爭(zhēng)議,經(jīng)歷了一系列變化。一開始,人們普遍認(rèn)為大學(xué)英語四級(jí)考試大大推動(dòng)了我國大學(xué)英語教學(xué),使學(xué)校、教育主管部門甚至社會(huì)對(duì)大學(xué)英語教育的重視程度普遍提高,各校英語教學(xué)條件、教學(xué)投入均有所改善,大學(xué)英語四級(jí)考試的正面效應(yīng)凸顯[14-17]。由于考試內(nèi)容有聽力、閱讀、寫作、語法結(jié)構(gòu)多項(xiàng)內(nèi)容,20世紀(jì)80年代末的大學(xué)英語教學(xué)也從過去只重視閱讀逐步轉(zhuǎn)向提高學(xué)生英語閱讀、聽力、寫作等多種技能。20世紀(jì)90年代初,大學(xué)英語四級(jí)考試的負(fù)面效應(yīng)逐漸顯現(xiàn),大多數(shù)高校存在英語應(yīng)試教學(xué),語言技能培養(yǎng)在很大程度上被題海訓(xùn)練所取代。大學(xué)英語四級(jí)考試開始受到各種批評(píng),如試題中客觀題比例大、題型單調(diào)、不能準(zhǔn)確反映學(xué)生的語言運(yùn)用能力等[18-20],四級(jí)考試改革的呼聲也隨之日益高漲。到20世紀(jì)90年代末及21世紀(jì)初,盡管大學(xué)英語四級(jí)考試中心采取了一系列的從考試內(nèi)容、考試計(jì)分體制到成績報(bào)告方式等多方面的改革,但各界對(duì)大學(xué)英語四級(jí)考試持批評(píng)意見的人越來越多,批評(píng)也日益深刻、尖銳[21-26],并且,關(guān)注焦點(diǎn)更多集中在測(cè)試的后效作用上。大學(xué)英語四級(jí)考試所帶來的應(yīng)試教學(xué)、學(xué)校和社會(huì)對(duì)考試成績的不當(dāng)使用、考試作弊等負(fù)面效應(yīng)并沒有隨著考試改革得到有效改善。那么造成考試負(fù)面效應(yīng)持續(xù)發(fā)展的主要原因是什么呢?
高風(fēng)險(xiǎn)語言測(cè)試的后效受到試題質(zhì)量、教育體制、社會(huì)、政治等多方面因素的影響。因此,語言測(cè)試工作者應(yīng)從試題設(shè)計(jì)開始就根據(jù)測(cè)試目的和測(cè)試對(duì)象準(zhǔn)確選定測(cè)試內(nèi)容,明確測(cè)試使用范圍,盡可能避免或減少語言測(cè)試帶來的負(fù)面效應(yīng)。
根據(jù)McNamara測(cè)試?yán)碚揫27]23-33,一個(gè)語言測(cè)試從構(gòu)思到實(shí)施的主要過程為:測(cè)試需求分析→測(cè)試受限分析→測(cè)試內(nèi)容→測(cè)試方法→試測(cè)試→效度檢測(cè)→改進(jìn)測(cè)試→實(shí)施測(cè)試→(測(cè)試后效出現(xiàn))??梢钥闯?語言測(cè)試的出現(xiàn)始于對(duì)該測(cè)試有需求,這個(gè)需求可能是教學(xué)需求也可能是社會(huì)需求。也就是說,設(shè)計(jì)一個(gè)測(cè)試,首先應(yīng)該明確此測(cè)試的目的是什么,是用于檢測(cè)教學(xué)內(nèi)容情況還是檢測(cè)學(xué)生學(xué)習(xí)水平;是用于某種門檻設(shè)置還是人才選拔?!皽y(cè)試的目的是整個(gè)測(cè)試設(shè)計(jì)、實(shí)施的基礎(chǔ),也是測(cè)試后效產(chǎn)生最直接、最主要的影響因素。”[28]78一旦由于教育、社會(huì)、政治等原因,測(cè)試目的扭曲,測(cè)試基石動(dòng)搖,那么測(cè)試效度就減弱,測(cè)試的負(fù)面效應(yīng)就會(huì)隨之加強(qiáng),此時(shí)的測(cè)試已經(jīng)不再是設(shè)計(jì)初衷的測(cè)試。并且,當(dāng)測(cè)試基石改變后,對(duì)測(cè)試內(nèi)容、測(cè)試方法等接下來的各環(huán)節(jié)加以改革,都不會(huì)對(duì)測(cè)試性質(zhì)產(chǎn)生根本性的改變,因?yàn)闇y(cè)試目的決定測(cè)試內(nèi)容和方法,從而影響測(cè)試后效??梢哉f,測(cè)試的負(fù)面效應(yīng)在很大程度上是由于測(cè)試本身屬性造成的。從大學(xué)英語四級(jí)考試、托福和雅思考試分析可以看出測(cè)試目的對(duì)測(cè)試后效的決定性影響。
20多年前大學(xué)英語四級(jí)考試出現(xiàn)時(shí),其測(cè)試目的是檢測(cè)大學(xué)英語課程大綱執(zhí)行和完成情況,即檢查學(xué)生經(jīng)過兩年的學(xué)習(xí)是否達(dá)到了大綱的教學(xué)目標(biāo)??荚囍行闹两袢月暦Q大學(xué)英語四級(jí)考試的目的依然是這樣:“大學(xué)英語目前仍是大學(xué)生的一門必修的基礎(chǔ)課程,終結(jié)性的大規(guī)模考試依然是評(píng)價(jià)教學(xué)質(zhì)量的重要手段之一?!盵13]由考試設(shè)計(jì)之初的目的可以確定,四級(jí)考試應(yīng)該是一標(biāo)準(zhǔn)參照考試(criteria-referenced test),“在一個(gè)標(biāo)準(zhǔn)參照考試中,學(xué)生的分?jǐn)?shù)能清楚地說明該生運(yùn)用現(xiàn)有語言能力所做到的和還不能做到的,并且能明確地反映該考生已經(jīng)達(dá)到的水平?!盵26]但四級(jí)考試的實(shí)施過程和成績使用又是典型的常模參照考試(nor m-referenced test),“大學(xué)英語四、六級(jí)考試是依據(jù)‘教育測(cè)量技術(shù)’‘大規(guī)?!某D⒄湛荚??!盵29]“大學(xué)英語四、六級(jí)考試的常模是1987年全國6所重點(diǎn)大學(xué)學(xué)生的四級(jí)考試成績,在此基礎(chǔ)上,每次考試后學(xué)生的原始分?jǐn)?shù)通過分?jǐn)?shù)等值處理后進(jìn)行報(bào)告。”[15]常模參照考試的最大特點(diǎn)就是要將所有考生成績進(jìn)行比較,只有很少一部分人能達(dá)到優(yōu)秀,大部分學(xué)生都處于中等及其以下的分?jǐn)?shù)段。這就是說,大多數(shù)學(xué)生無論是否達(dá)到了教學(xué)大綱的要求,他們都會(huì)長期處于全國四級(jí)考試成績“差”的群體中,成績顯示就是不合格。測(cè)試目的不明確,導(dǎo)致學(xué)校、社會(huì)和政府對(duì)四級(jí)測(cè)試分?jǐn)?shù)的不當(dāng)使用,即測(cè)試負(fù)面效應(yīng)的加劇。
與四級(jí)考試相比較,全球另外兩個(gè)大規(guī)模、高風(fēng)險(xiǎn)語言測(cè)試即托福(T OEFL)和雅思(IELTS)考試有明確目的。T OEFL,由美國教育測(cè)驗(yàn)服務(wù)社(ETS)在全世界舉辦,是一種針對(duì)母語非英語的人進(jìn)行的英語水平的考試。大多數(shù)英語國家都將T OEFL考試成績作為申請(qǐng)本科、碩士和博士入學(xué)的必備成績之一。雅思是由英國文化委員會(huì)(The British Council)、劍橋大學(xué)地方考試委員會(huì)(CUCLES)和澳大利亞教育國際開發(fā)署( IDP Education Australia)共同舉辦的國際英語水平測(cè)試。此項(xiàng)考試是為申請(qǐng)赴英聯(lián)邦國家(英國、澳大利亞、加拿大、新西蘭等)留學(xué)、培訓(xùn)的非英語國家學(xué)生而設(shè),用來評(píng)定考生運(yùn)用英語的能力,即雅思是對(duì)所有外國學(xué)生進(jìn)入英國大學(xué)學(xué)習(xí)的一種國際性的英語水平測(cè)試,是英國大學(xué)接收外國學(xué)生的一個(gè)語言標(biāo)準(zhǔn)。并且,根據(jù)考試對(duì)象和成績使用目的不同,雅思又具體將考試分為“培訓(xùn)類”(general training)和“學(xué)術(shù)類”(academic)兩種。
正是托福和雅思考試的目的非常明確,考試成績被濫用的程度要小得多,對(duì)考生帶來的負(fù)面影響也相對(duì)較小?!把芯勘砻?雅思對(duì)課堂教學(xué)有積極的效應(yīng)?!盵30]當(dāng)一個(gè)大規(guī)模、高風(fēng)險(xiǎn)測(cè)試結(jié)果使用不符合測(cè)試設(shè)立初衷時(shí),測(cè)試委員會(huì)或測(cè)試設(shè)計(jì)者有責(zé)任和義務(wù)向公眾澄清測(cè)試目的,明確限制測(cè)試使用范圍,而不能一味地將測(cè)試負(fù)面效應(yīng)推卸給成績使用者或社會(huì)。
語言測(cè)試是語言教學(xué)中的一個(gè)重要組成部分,存在于教學(xué)各個(gè)環(huán)節(jié),貫穿于教學(xué)始終。例如,在大學(xué),當(dāng)學(xué)生入校時(shí),往往要對(duì)他們進(jìn)行外語測(cè)試,以確定學(xué)生外語學(xué)習(xí)起點(diǎn)、學(xué)習(xí)內(nèi)容和學(xué)習(xí)方法的選擇;學(xué)習(xí)中也不斷要進(jìn)行測(cè)試,以檢查教學(xué)狀況、調(diào)整教學(xué)進(jìn)度和內(nèi)容;學(xué)期末還要進(jìn)行語言測(cè)試以評(píng)價(jià)學(xué)生學(xué)習(xí)效果、發(fā)現(xiàn)教學(xué)中的問題。高風(fēng)險(xiǎn)語言測(cè)試同樣也應(yīng)服務(wù)于語言教學(xué),各種語言測(cè)試的目標(biāo)應(yīng)該與教學(xué)目標(biāo)相一致,否則,測(cè)試的負(fù)面效應(yīng)必定會(huì)加大。同時(shí),如果教學(xué)目標(biāo)定位不符合社會(huì)實(shí)際需求,與之相對(duì)應(yīng)的測(cè)試也一定會(huì)帶來負(fù)面的社會(huì)效應(yīng)。
測(cè)試目的與測(cè)試內(nèi)容密切相關(guān),而測(cè)試內(nèi)容應(yīng)參照各學(xué)校相關(guān)的人才培養(yǎng)目標(biāo)所確定的知識(shí)和能力結(jié)構(gòu)要求。只有這樣,才能保證測(cè)試內(nèi)容與人才培養(yǎng)目標(biāo)、教學(xué)目標(biāo)的一致性,使測(cè)試能夠強(qiáng)化、促進(jìn)教學(xué)目標(biāo)和人才培養(yǎng)目標(biāo)的實(shí)現(xiàn),即起到積極的反撥作用。
如前文所述,大學(xué)英語四級(jí)測(cè)試的目的是檢測(cè)各高校大學(xué)英語課程大綱執(zhí)行和完成情況,即檢查學(xué)生經(jīng)過兩年的學(xué)習(xí)是否達(dá)到了大綱的教學(xué)目標(biāo)。然而,這一檢測(cè)對(duì)象的設(shè)立存在問題。全國1 800多所高等院校使用同一個(gè)英語教學(xué)大綱,這本身就不科學(xué)、不合理。我國各地區(qū)經(jīng)濟(jì)發(fā)展不平衡,各高校的特點(diǎn)各異,辦學(xué)目標(biāo)不同,教學(xué)條件、教學(xué)資源、教學(xué)水平差異顯著,怎么能用同一個(gè)教學(xué)大綱來統(tǒng)領(lǐng)全國大學(xué)英語教學(xué)?由此設(shè)計(jì)的全國大學(xué)英語四級(jí)統(tǒng)考必定會(huì)導(dǎo)致無意義的結(jié)果,“一流學(xué)校的大多數(shù)新生剛進(jìn)校就能通過四級(jí)考試,而普通院校師生拼死拼活,到大四還是有37.6%的學(xué)生不能通過英語四級(jí)考試?!盵31]因此,這樣的測(cè)試會(huì)對(duì)很多學(xué)生帶來非常大的消極的后效作用。
教育部已經(jīng)意識(shí)到全國大學(xué)英語教學(xué)使用同一大綱的不合理性。2002年12月,教育部正式啟動(dòng)了《大學(xué)英語教學(xué)改革》工程,制定了新的《大學(xué)英語課程教學(xué)要求》,該教學(xué)要求分為一般要求、較高要求和更高要求,供不同院校根據(jù)本校實(shí)際選擇。并且,教育部鼓勵(lì)各高校制定個(gè)性化、特色化的大學(xué)英語教學(xué)大綱。張堯?qū)W提出:“國家重點(diǎn)大學(xué)應(yīng)該逐漸轉(zhuǎn)向不設(shè)公共英語基礎(chǔ)課,學(xué)生入校后直接接受雙語教學(xué)?!盵32]近幾年,有些院校已經(jīng)開始打破傳統(tǒng)的“大學(xué)英語”課程設(shè)置,減少大學(xué)英語教學(xué)學(xué)分,嘗試比較靈活的學(xué)分制教學(xué)。與“大學(xué)英語教學(xué)要求”的改革不同,改革后的大學(xué)英語四級(jí)考試仍然沒有考慮我國地區(qū)、教學(xué)資源、學(xué)生個(gè)體等的差異,只對(duì)教學(xué)結(jié)果進(jìn)行統(tǒng)一評(píng)價(jià)。不同的教學(xué)大綱(教學(xué)要求)應(yīng)該有不同的考試內(nèi)容。那么,這種情況下的英語四級(jí)考試目標(biāo)與哪種英語教學(xué)目標(biāo)相一致呢?這樣,四級(jí)考試的負(fù)面效應(yīng)當(dāng)然不可能降低。
真實(shí)性是任何語言測(cè)試必須考慮的重要因素,它會(huì)對(duì)社會(huì)、教育、考生心理等多方面帶來影響。“語言測(cè)試中最復(fù)雜、最持久的問題就是如何處理好測(cè)試任務(wù)中的語言使用與日常語言交際中相應(yīng)的語言使用之間的關(guān)系。毫無疑問,測(cè)試的語言使用和現(xiàn)實(shí)生活中的語言使用之間有密切關(guān)系。否則,語言測(cè)試不能反映任何我們所期望測(cè)量出的考生語言能力,語言測(cè)試僅成為一個(gè)不真實(shí)的幻影,一系列無果程序的進(jìn)行?!盵33]23
當(dāng)然,測(cè)試和實(shí)際語言交際活動(dòng)之間有差別,語言測(cè)試設(shè)計(jì)和實(shí)施中不可能完全實(shí)現(xiàn)測(cè)試真實(shí)性。事實(shí)上,“測(cè)試就是進(jìn)行推斷。即使語言測(cè)試完全模擬現(xiàn)實(shí)世界中的語言運(yùn)用行為(如讀報(bào)、聽廣播、談話等),測(cè)試中的語言行為本身也無意義。我們只能由此推斷出考生在其相應(yīng)的真實(shí)世界中進(jìn)行相似或相關(guān)的語言交際任務(wù)中表現(xiàn)如何。”[27]7-8測(cè)試真實(shí)性反映在某一測(cè)試任務(wù)特點(diǎn)和目標(biāo)語言任務(wù)特點(diǎn)之間的符合程度。在設(shè)計(jì)一個(gè)語言測(cè)試時(shí),首先要確定目標(biāo)語言使用任務(wù)的主要特征,然后再據(jù)此設(shè)計(jì)或選擇測(cè)試任務(wù)。真實(shí)性高的測(cè)試任務(wù)會(huì)盡可能多地包含重要目標(biāo)語言任務(wù),使測(cè)試結(jié)果能全面、正確地反映考生實(shí)際語言運(yùn)用能力。參加這樣的測(cè)試,學(xué)生就必須掌握更多現(xiàn)實(shí)生活中所需的多方面技能和知識(shí)。因此,測(cè)試真實(shí)性會(huì)直接影響學(xué)生學(xué)習(xí)范圍及知識(shí)面。我國大學(xué)英語教學(xué)和大學(xué)英語四級(jí)測(cè)試的發(fā)展就是一個(gè)典型實(shí)例。20世紀(jì)80年代初,許多學(xué)校的大學(xué)英語測(cè)試不考聽力,或聽力占很小比重,結(jié)果是,盡管聽力是語言學(xué)習(xí)中一項(xiàng)重要技能,在教學(xué)中卻常常被忽視,有些學(xué)校根本沒有聽力課。自20世紀(jì)80年代末起,英語四級(jí)測(cè)試中聽力比重逐漸加大,大學(xué)英語教學(xué)中聽力訓(xùn)練開始被重視。測(cè)試的真實(shí)性不僅關(guān)系到學(xué)生學(xué)習(xí)內(nèi)容,還影響學(xué)生的學(xué)習(xí)方法。如果測(cè)試內(nèi)容范圍與目標(biāo)語言使用范圍不相吻合,而測(cè)試結(jié)果又會(huì)對(duì)教師和學(xué)生帶來較大影響(如高風(fēng)險(xiǎn)語言測(cè)試),那么,教師和學(xué)生就會(huì)采取各種應(yīng)試策略(如題海戰(zhàn)術(shù))提高測(cè)試分?jǐn)?shù),把真正應(yīng)該學(xué)習(xí)和掌握的教學(xué)內(nèi)容和語言技能擱置一邊,從而對(duì)教學(xué)產(chǎn)生較大副作用。
多年來,大學(xué)英語四級(jí)考試不斷進(jìn)行考試內(nèi)容改革,但測(cè)試真實(shí)性方面并沒有實(shí)質(zhì)性改變。如更能反映學(xué)生真正語言運(yùn)用能力的口語和寫作部分20多年間沒有什么變化。作為語言能力的重要標(biāo)志之一,口語仍然是非必考部分。只有在四級(jí)考試的筆試成績達(dá)到550分以上(滿分為710分)者才有資格參加口語測(cè)試。全國只有少部分學(xué)生有此資格。作為一個(gè)“能全面考核學(xué)生語言運(yùn)用能力”的、影響力很大的全國統(tǒng)考,將大部分學(xué)生拒口語考試門外,怎么能說這一考試的內(nèi)容效度高?另外,寫作部分多年來一直占考試總分的15%,且題型變化不大,雖然近幾年作文題目更貼近學(xué)生生活,但寫作體裁、要求、評(píng)分標(biāo)準(zhǔn)基本沒有變化,題型單調(diào)、模式化。因此,八股文式的作文訓(xùn)練在實(shí)際教學(xué)中廣泛使用,很多通過了四級(jí),甚至通過了六級(jí)考試的學(xué)生連自己的英文簡(jiǎn)歷都不會(huì)寫。現(xiàn)代測(cè)試?yán)碚撜J(rèn)為,一項(xiàng)有效的測(cè)試應(yīng)做到語言測(cè)試行為和語言的實(shí)際情況相一致,以提高測(cè)試的真實(shí)性,改善測(cè)試后效作用。例如,雅思考試一直采用最直接的考試形式,最大程度地接近現(xiàn)實(shí)生活中的語言活動(dòng),取得良好的考試正面效應(yīng)。雅思考試后效研究表明:考試對(duì)課堂教學(xué)和學(xué)習(xí)過程有著正面的影響,對(duì)教學(xué)起到了推動(dòng)作用[30]。
“高風(fēng)險(xiǎn)測(cè)試指那些用來做出重大決定或會(huì)帶來重要后果的測(cè)試”[11],測(cè)試風(fēng)險(xiǎn)越高,其可能產(chǎn)生的負(fù)面效應(yīng)就越大。因此,高風(fēng)險(xiǎn)語言測(cè)試應(yīng)該有非常明確地目的、性質(zhì)和結(jié)果使用范圍,避免對(duì)結(jié)果的濫用,從而有效減少語言測(cè)試負(fù)面效應(yīng)。
如前文分析,從大學(xué)英語四級(jí)考試的目的來看,它是一個(gè)校標(biāo)參照測(cè)試,檢查學(xué)生是否達(dá)到希望的教學(xué)要求。但在測(cè)試實(shí)施和分?jǐn)?shù)處理上采用的又是典型的常模參照考試。學(xué)校、教師、學(xué)生和社會(huì)都關(guān)注的是某考生的分?jǐn)?shù),在“常?!敝械奈恢?而非自己是否達(dá)到大綱要求。考試中心關(guān)心的是考試的信度和區(qū)分度,追求漂亮的正態(tài)分布,要給學(xué)生排隊(duì),把優(yōu)秀學(xué)生挑出,把大部分學(xué)生關(guān)在及格線外(每次四級(jí)考試的通過率在30%左右)[34]。這樣的考試不可能以教學(xué)內(nèi)容為參照,測(cè)出各校執(zhí)行自己教學(xué)大綱的情況。因此,大學(xué)英語四級(jí)考試作為水平測(cè)試更恰當(dāng),這樣可以減少四級(jí)考試與各校大學(xué)英語教學(xué)之間的沖突,學(xué)校和學(xué)生可以真正自由地選擇是否參加四級(jí)考試或其它測(cè)試,學(xué)校也可以根據(jù)本校的人才培養(yǎng)目標(biāo)和學(xué)生實(shí)際情況來進(jìn)行大學(xué)英語教學(xué)。這樣,中國的大學(xué)英語教學(xué)才可能出現(xiàn)百花齊放、百家爭(zhēng)鳴、各具特色的良好局面。
大規(guī)模、高風(fēng)險(xiǎn)語言測(cè)試,參考人數(shù)多,而考試結(jié)果又會(huì)對(duì)考生產(chǎn)生很大影響。但實(shí)際上,并不是所有考生的參考目的與考試本身意旨相同。學(xué)生參考是因?yàn)檎也坏狡渌梢宰C明其語言能力,同時(shí)又被廣為認(rèn)同的考試。如果有多種根據(jù)不同需求設(shè)計(jì)的高效度、高信度的語言測(cè)試,考生就可以根據(jù)自己的能力和需要選擇所要參加的考試。社會(huì)、用人單位也可以根據(jù)各自的需求,選用符合自己目標(biāo)的測(cè)試結(jié)果,從而分散某一高風(fēng)險(xiǎn)測(cè)試的社會(huì)權(quán)重,有效減小測(cè)試的負(fù)面效應(yīng)?!翱荚嚨纳鐣?huì)權(quán)重過大,常常是考試結(jié)果的誤用和濫用造成的。”[2]23在英國有一部分學(xué)校不僅把雅思成績作為評(píng)估語言的依據(jù),也承認(rèn)雅思和托福之外的替代考試的成績。例如,華威英語語言測(cè)試(WELT)受到華威大學(xué)、埃克塞特大學(xué)在內(nèi)的30所英國院校認(rèn)可;牛津入學(xué)英語測(cè)試(OPT)和院校自行組織的內(nèi)部測(cè)試也受到組織該考試的院校方認(rèn)可。
目前,隨著大學(xué)英語教學(xué)改革的推進(jìn),許多學(xué)校已在不同程度上對(duì)大學(xué)英語課程設(shè)置進(jìn)行了改革,根據(jù)學(xué)習(xí)者的特定目的和特定需要而開設(shè)的英語綜合、語言應(yīng)用、專業(yè)英語等課程越來越多。在這種形勢(shì)下,傳統(tǒng)的大學(xué)英語四級(jí)考試顯然不能滿足所有學(xué)校英語教學(xué)和社會(huì)的需要。與大學(xué)英語教學(xué)改革相適應(yīng)的大學(xué)英語考試,也應(yīng)該拿出一系列菜單式的不同測(cè)試供學(xué)生甚至用人單位選擇,使測(cè)試真正服務(wù)于教學(xué),對(duì)教學(xué)產(chǎn)生積極影響。否則,大學(xué)英語四級(jí)考試實(shí)際上就變成了中國大學(xué)英語教學(xué)的一種壟斷式測(cè)試。當(dāng)一個(gè)事物成為壟斷時(shí),其負(fù)面效應(yīng)就會(huì)變大。測(cè)試的決策者和設(shè)計(jì)者應(yīng)對(duì)測(cè)試負(fù)面效應(yīng)負(fù)主要責(zé)任,解決方法之一是開發(fā)多種能滿足不同需求的測(cè)試,供考生和成績使用者選擇。
“管理部門和政治家們應(yīng)該對(duì)測(cè)試后效的性質(zhì)負(fù)責(zé),因?yàn)闇y(cè)試常常被用來實(shí)施教育革新,引導(dǎo)和控制教學(xué)大綱的執(zhí)行。測(cè)試常簡(jiǎn)單的用作改革的杠桿。”[35]語言測(cè)試的主要功能之一,是通過采用“好的”測(cè)試,推動(dòng)自上而下的教育改革方案[36-37]。世界許多政策制定者都意識(shí)到測(cè)試的能量,利用測(cè)試來實(shí)施當(dāng)?shù)氐慕逃母?強(qiáng)行推行新教材、新的教學(xué)模式和教學(xué)方法。“測(cè)試是政策制定者的最愛。”[38]盡管高風(fēng)險(xiǎn)語言測(cè)試能夠幫助推動(dòng)教學(xué)改革,但這種考試驅(qū)動(dòng)教育改革有很大的局限性。“在教育中,通過引入一個(gè)新的語言測(cè)試作為命令式、義務(wù)式的測(cè)量方法,很容易產(chǎn)生不想看到的結(jié)果?!盵39]并且,Shepard指出,這種做法剝奪了大多數(shù)教師的權(quán)利[40]27;甚至是制定政策的一種不道德、不民主的舉措[41]11。如果測(cè)試改革、教學(xué)改革沒有得到執(zhí)行者(教師和學(xué)生)的認(rèn)同,而是自上而下的強(qiáng)制性執(zhí)行,許多教師就會(huì)反感,消極參與。這也是為什么測(cè)試往往只能影響教師教授的內(nèi)容,而對(duì)教學(xué)方法改革沒有多大作用。測(cè)試不會(huì)影響教師關(guān)于教學(xué)、教師和學(xué)生角色、教學(xué)方法等根本性的觀念[42-43]。國內(nèi)外語言測(cè)試后效研究都有此例,香港中學(xué)會(huì)考(HKCEE)曾試圖通過考試后效自上而下地影響英語教學(xué),18年的歷史證明,考試很快改變了教學(xué)內(nèi)容,但對(duì)教師如何教、學(xué)生如何學(xué)只有表面上的變化,沒有實(shí)質(zhì)性的改變?!霸噲D用測(cè)試后效正面影響課程改變的過程是非常緩慢的,并沒有實(shí)現(xiàn)測(cè)試的意圖?!盵3]41-43在北美、英國、澳大利亞等地的研究表明,權(quán)利強(qiáng)制,不能產(chǎn)生長效的、持久的變革[44]64。
中國大學(xué)英語四級(jí)考試的產(chǎn)生、改革,在很大程度上也是由政府機(jī)構(gòu)來決定。全國高等教育那么多科目,為什么只對(duì)大學(xué)英語一門課的學(xué)習(xí)效果采取統(tǒng)考形式檢查?沒有官方的行政命令,其他任何一個(gè)機(jī)構(gòu)都不可能做到,但行政管理者也應(yīng)該了解語言學(xué)習(xí)、語言測(cè)試的特點(diǎn),特別應(yīng)把握好測(cè)試作為推動(dòng)教學(xué)改革杠桿作用的局限性,因?yàn)榇笠?guī)模、高風(fēng)險(xiǎn)語言測(cè)試的后效常常不能與測(cè)試設(shè)計(jì)意圖一致。同時(shí),我們應(yīng)充分研究和借鑒國內(nèi)外語言測(cè)試后效研究成果,正確認(rèn)識(shí)語言學(xué)習(xí)、語言測(cè)試的特點(diǎn),科學(xué)指導(dǎo)我國大學(xué)英語教學(xué)工作。
大規(guī)模、高風(fēng)險(xiǎn)語言測(cè)試對(duì)學(xué)生、教師、學(xué)校、社會(huì)等多方面都會(huì)產(chǎn)生積極和消極后效,而且,負(fù)面效應(yīng)往往更突出。因此,測(cè)試開發(fā)者應(yīng)該在測(cè)試設(shè)計(jì)和實(shí)施的每一環(huán)節(jié)都要考慮測(cè)試可能產(chǎn)生的后效作用。首先,必須明確測(cè)試目的和使用范圍。當(dāng)測(cè)試使用范圍改變,測(cè)試的目的就發(fā)生了變化,即測(cè)試設(shè)立的初衷改變,此時(shí),試圖改變測(cè)試內(nèi)容來改善測(cè)試后效作用將無濟(jì)于事。其次,測(cè)試內(nèi)容要與教學(xué)目標(biāo)相一致,要與語言實(shí)際應(yīng)用相吻合。否則,高風(fēng)險(xiǎn)測(cè)試很容易成為管理者通過測(cè)試來操控語言教學(xué)的工具。在這種情況下,管理者試圖通過測(cè)試推進(jìn)教學(xué)改革、改進(jìn)教學(xué)質(zhì)量的良好愿望就很難實(shí)現(xiàn)。我國大學(xué)英語四級(jí)考試在22年間的經(jīng)歷證明,使用大規(guī)模、高風(fēng)險(xiǎn)語言測(cè)試主導(dǎo)教學(xué),推動(dòng)教學(xué)改革不一定有效。努力開發(fā)多種測(cè)試目的明確、滿足教學(xué)和市場(chǎng)需求的高信度、高效度的測(cè)試,是降低測(cè)試負(fù)面效應(yīng)的有效方法。同時(shí),社會(huì)、政府、學(xué)校都應(yīng)對(duì)測(cè)試后效的復(fù)雜性有充分認(rèn)識(shí),科學(xué)利用測(cè)試對(duì)教學(xué)的調(diào)控作用。
[1]Wall D. Impact and washback in language testing[C]. Dordrecht:Klower Academic.Language testing and assess ment,1997(7):291-302.
[2]楊惠中,杜詩春.語言測(cè)試的社會(huì)學(xué)思考[J].現(xiàn)代外語,2007(4):368-374.
[3]ChengL,Watanabe Y,Curtis A.Washback in Language Testing[M].London:Lawerece Erlbaum Associates, Inc.2004.
[4]Vernon P E.The measurement of abilities[M].2nded. London:University ofLondon Press,1956:166.
[5]W iseman S.Examinations and English education[M]. Manchester.England:ManchesterUniversityPress,1961.
[6]DaviesA.Language testing symposium:A psycholinguistic approach.[M].Oxford:Oxford University Press,1968.
[7]McEwen N.Educational accountability in Alberta[J]. Canadian Journal of Education,1995(20):27-44.
[8]Fish J.Responses to mandated standardized testing[M]. Unpublished doctoral dissertation.University of California,LosAngeles,1988.
[9]Alderson J C,Wall D.Does washback exist?[J].Applied Linguistics,1993(14):115-129.
[10]Noble A J,SmithM L.Measurement-driven reform:Research on policy,practice,repercussion[Z].Arizona State University,Center for the Study of Evaluation, 1994:3.
[11]Madaus G G.1988.The influence of testingon the curriculum[C]//Tanner,L.N.ed.Critical Issues in Curriculum:Eighty-seventh Yearbook of the National Society for the Study of Education.Chicago:University of Chicago Press,1990.
[12]Messick S.Validity and washback in language testing [J].Language Testing,1996(13):241-256.
[13]金艷.提高考試效度改進(jìn)考試后效[J].外語界,2006 (6):65-73.
[14]楊惠中.從四、六級(jí)考試看我國大學(xué)生當(dāng)前的實(shí)際英語能力[J].外語界,2000(1):47-53.
[15]楊惠中,金艷.大學(xué)英語四、六級(jí)考試分?jǐn)?shù)解釋[J].外語界,2001(1):63-69.
[16]陳祖芳.學(xué)術(shù)討論要尊重事實(shí)——就四、六級(jí)考試問題與劉潤清先生商榷[J].外語界,2004(1):76-79.
[17]吳啟迪.教育部2005年第二次新聞發(fā)布會(huì)[EB/OL]. [2005-02-25].http://www.moe.edu.cn/edoas/website18/info8745
[18]劉新民.對(duì)四、六級(jí)英語統(tǒng)考作文的幾點(diǎn)思考[J].外語教學(xué)與研究,1991(3):73-75.
[19]黃忠廉,劉麗芬,倪傳斌.CET-4新增翻譯題型的調(diào)查與分析[J].外語教學(xué)與研究,1996(3):61-65.
[20]葉國強(qiáng),趙錦.改進(jìn)大學(xué)英語四、六級(jí)考試題型和體系的設(shè)想[J].外語教學(xué)與研究,1999(4):61-64.
[21]呂良.CET的反撥效應(yīng)對(duì)外語教學(xué)的影響[J].山東外語教學(xué),1995(4):68-71.
[22]井升華.我國大學(xué)英語教學(xué)費(fèi)時(shí)低效的原因[J].外語教學(xué)與研究,1999(1):22-24.
[23]牛強(qiáng).現(xiàn)行高校英語測(cè)試中的問題[J].外語教學(xué)與研究,2001(2):140-143.
[24]劉潤清.高校英語教學(xué)改革筆談之三[J].外語教學(xué)與研究,2003(5):378.
[25]張堯?qū)W.關(guān)于大學(xué)本科公共英語教學(xué)改革的再思考[J].中國大學(xué)教學(xué),2003(7):1-4.
[26]韓寶成,戴曼純,楊莉芳.從一項(xiàng)調(diào)查看大學(xué)英語考試存在的問題[J].外語與外語教學(xué),2004(2):17-23.
[27]McNamara T.Language Testing[M].Oxford:Oxford U-niversity Press,2000.
[28]Bachman L F.Fundamental Consideration in Language Testing[M].Oxford:Oxford University Press,1990:78.
[29]楊惠中,C.Weir.大學(xué)英語四、六級(jí)考試效度研究[M].上海:上海外語教育出版社,1998.
[30]Charge N.IELTS[R].ALA,Wisconsin.2005-07-29.
[31]楊惠中.大學(xué)英語四、六級(jí)考試十五年回顧[J].外國語,2003(3):76-82.
[32]張堯?qū)W.加強(qiáng)實(shí)用性英語教學(xué)提高大學(xué)生英語綜合能力[J].中國高等教育,2002(8):3-8.
[33]Bachman L F,Adrian S P.Language Testing in Practice [M].Oxford:Oxford University Press,1996.
[34]蔡基剛.轉(zhuǎn)型時(shí)期的我國大學(xué)英語教學(xué)特征和對(duì)策研究[J].外語教學(xué)與研究,2007(1):27-32.
[35]D Chamberiain,Baumgardner,ed.ESP in the classroom:practice and evaluation[M].London:Modern English,1988:98-107.
[36]JamesM.Measured lives:The rise of assess ment as the engine of change in English schools[J].Curriculum Journal,2000(11):343-364.
[37]Linn R L.Assess ments and accountability[J].Educational Researcher,2000,29(2):4-16.
[38]Madaus G G.Public policy and the testing profession: You’ve never had it so good[J].Education measurement Issues and Practice,1985,4(4):5-11.
[39]ChengL,Couture J C.Teachers’work in the global culture of performance[J].Alberta Journal of Educational Research,2000,46(1):65-74.
[40]Shepard L A.Interview on assess ment issues with Lorrie Shepard[J].Educational Researcher,1991,20(2):21 -27.
[41]Shohamy E.Using language tests for upgrading knowledge [J].Hong Kong Journal of Applied Linguistics,2000,5 (1):1-18.
[42]ChengL.How does washback influence teaching? Implications for Hong Kong[J].Language and Education, 1997(11):38-54.
[43]Cheng L.Changing assess ment:Washback on teacher perspectives and actions[J].Teaching and Teacher Education,1999(15):253-271.
[44]Markee N.Managing curricular innovation[M].Cambridge,England:Cambridge University Press,1997:64.
(責(zé)任編輯魏艷君)
The Causes of the Negative Impact of High-stakesLanguage Testing and the Countermeasures——Taking CET-4 as an Example
WANG Jian-mei
(School of Foreign Languages,ChongqingUniversity of Technology,Chongqing 400054,China)
Taking College English TestBand 4(CET-4)as example,this paper probes into the main causes of the negative impact of high-stakes language testing.It is believed that the ambiguous objective of language testing,the contradiction between test objective and teaching objective,and the inconsistency of test contents and practical language use contribute most to the negative impact of testing.Instead of shirking the responsibility and shifting the blame onto the school and society,test developers can do a lot to reduce the negative impact by explicating the aim and limitation of the test, developing various reliable and validating language tests in accordance with the requirements and students and society.Meanwhile,the government,society and school should be well aware of the complexity of testing impact,and make use of language testing as a leverwith care and scientific mind.
high-stakes language testing;negative impact;CET-4;testing objective;teaching objective
G642.47
A
1674-8425(2011)01-0116-06
2010-07-15
王建梅(1964—),女,山西太原人,教授,研究方向:外語教學(xué)與測(cè)試、二語習(xí)得。