萬晶
(1.江西城市建設(shè)高級技術(shù)學(xué)校;2.江西省建筑工程學(xué)校,江西 南昌 330000)
隨著語言教學(xué)的發(fā)展,語言測試也有了很大的進(jìn)步。不同時(shí)期的語言學(xué)家都在思考語言的本質(zhì)(相對于語言教學(xué)和語言測試)以及如何看待語言能力。在不同時(shí)期,由于對語言本質(zhì)和語言能力的不同理解,Brown(2006)、McNamar(2003)和Bachman(1990)清楚地描述了語言測試發(fā)展的三個(gè)主要階段。人們把第一階段稱為科學(xué)前測試,把第二階段稱為心理測量結(jié)構(gòu)主義測試,把第三階段稱為交際語言測試,也稱為心理語言社會語言測試。
20 世紀(jì)40 年代以前出現(xiàn)的所有測試都被稱為科學(xué)前測試。在這一時(shí)期,人們以語言為知識進(jìn)行教學(xué)。這些知識包括語法、詞匯和語言學(xué)。Brown(2006)指出,科學(xué)前測試與語法翻譯方法密切相關(guān)。在這一階段,考試往往只根據(jù)教師的主觀判斷來評分或打分,并帶有一定的文化和文學(xué)偏見。因此,在測試中不需要特殊的能力和固定的標(biāo)準(zhǔn)。
20 世紀(jì)40 年代,心理測量結(jié)構(gòu)主義測驗(yàn)在測驗(yàn)方法上形成。從那時(shí)起,外語教學(xué)和測試就有了系統(tǒng)的、科學(xué)的理論基礎(chǔ)。20 世紀(jì)40 年代至70 年代,隨著結(jié)構(gòu)語言學(xué)、第二代測試系統(tǒng)的出現(xiàn),心理測量結(jié)構(gòu)主義方法在測試領(lǐng)域占據(jù)了主導(dǎo)地位。支持這一體系的語言學(xué)家認(rèn)為,語言是一個(gè)結(jié)構(gòu)體系,學(xué)生所學(xué)和測試的是操作這套結(jié)構(gòu)體系的技能。根據(jù)結(jié)構(gòu)主義心理測驗(yàn)理論,語言可以分為語言技能(聽、說、讀、寫)和語言要素(語音、語法、詞匯)。這個(gè)系統(tǒng)強(qiáng)調(diào)口語,因此人們在考試中更加注重口語(尤其是聽力)。這種系統(tǒng)往往忽略了語言語境,而不關(guān)心語言的真實(shí)情況。
20 世紀(jì)90 年代,巴赫曼(1990、1991)提出了一種新的語言能力模式,即交際語言能力(CLA)。他認(rèn)為交際語言能力是在語言的運(yùn)用中把語言知識與語言語境的特點(diǎn)結(jié)合起來,進(jìn)而創(chuàng)造和解釋語言的意義。這種能力包括語言能力、策略能力和心理生理機(jī)制。
巴赫曼認(rèn)為,語言的使用是一個(gè)動(dòng)態(tài)的過程:各種知識、技能和心理交織在一起,相互作用。這種交際式語言測試系統(tǒng)問世后,在語言測試領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響。Skehan(1991)說,這是語言測試史上的一個(gè)里程碑。該系統(tǒng)具有兩個(gè)突出特點(diǎn):(1)對語言交際能力的理解更全面、更深刻;(2)指出了測試工具與語言語境目標(biāo)的關(guān)系。此外,巴赫曼還提出了語言測試的真實(shí)性程度,并將其作為開發(fā)和評估測試的標(biāo)準(zhǔn)。
交際語言測試作為當(dāng)前測試?yán)砟畹闹髁?,衡量的是語言使用者在特定的、真實(shí)的語言環(huán)境下,能夠正確、恰當(dāng)?shù)厥褂媚繕?biāo)語言,有效地完成交際任務(wù)的語言能力。
交際性語言測試的交際性體現(xiàn)在其真實(shí)的測試內(nèi)容、直接的測試方法、評分標(biāo)準(zhǔn)和參考方法上。
語言測試的主要目的是對測試提供的信息進(jìn)行反饋、評價(jià)、選擇和研究,使教師掌握教學(xué)情況,評價(jià)教學(xué)效果,選擇合適的教材和方法,確定教學(xué)計(jì)劃;它也是開展語言語言學(xué)研究和語言教學(xué)研究的有力工具。
語言測試作為評價(jià)學(xué)習(xí)者能力、知識和行為的一種手段,必須滿足一定的要求,才能更有效地發(fā)揮作用。一個(gè)好的語言測試必須滿足四個(gè)要求:有效性、信度、辨別力和實(shí)用性。這是語言測試必須滿足的四個(gè)要素。
測試效度是測試中最重要的因素之一,是指測試內(nèi)容與測試目標(biāo)相一致。測試效度一般分為:(1)面子效度;(2)內(nèi)容效度;(3)結(jié)構(gòu)效度;(4)預(yù)測效度;(5)同時(shí)效度等。
可靠性是測試必不可少的。試驗(yàn)可靠性是指試驗(yàn)前所作的判斷與試驗(yàn)結(jié)果相一致。當(dāng)不同的考生在不同的時(shí)間參加同一張?jiān)嚲淼目荚嚂r(shí),考試結(jié)果是一致的。因此,這意味著該試驗(yàn)具有較高的可靠性。當(dāng)然,在實(shí)際的考試中,考試的信度受考生人數(shù)、考試時(shí)長、考試組織、評分方法和考生個(gè)人因素等多種因素的影響,因此,為了更好地確定考試的信度,人們可以采用以下三種方法:(1)平行表格法;(2)復(fù)試法;(3)對半法。并行表格法是觀察可靠性的最有效方法。
試題區(qū)分是指整套試卷或每道試題由簡單、一般、困難三個(gè)難度等級組成。
考試實(shí)踐性是指在設(shè)計(jì)好試題后,考試的組織和閱卷工作容易進(jìn)行,或者是指考試的時(shí)間、成本、組織和閱卷工作的現(xiàn)實(shí)性。如果試卷難度太大,考試時(shí)間太短,題量太大,加分工作太辛苦,考試的實(shí)用性就會差。
語言測試與語言教學(xué)之間的關(guān)系決定了兩者之間必然相互影響,測試結(jié)果能反映出語言教學(xué)的效果好壞,教育者也因此調(diào)節(jié)教學(xué)方法和教學(xué)模式。世界各國都把考試作為督促學(xué)習(xí)和選拔人才的一種有效手段加以利用。