摘 要: 語言測(cè)試偏差是指由于與測(cè)試構(gòu)念無關(guān)的因素導(dǎo)致某個(gè)或某些考生群體獲得系統(tǒng)性高分或低分,從而影響測(cè)試結(jié)果的準(zhǔn)確解釋和使用,降低測(cè)試效度。本文在綜述國(guó)外語言偏差研究理論成果的基礎(chǔ)上,闡明了英語語言測(cè)試中的偏差研究的重要性,分析了我國(guó)英語語言測(cè)試中的偏差的存在及其產(chǎn)生的原因。
關(guān)鍵詞: 英語語言測(cè)試 測(cè)試效度 偏差
1.前言
隨著國(guó)際交流的日益密切,英語作為國(guó)際通用語,已經(jīng)受到越來越多的人的重視。在我國(guó),英語語言測(cè)試是檢測(cè)考生是否達(dá)到某種英語語言運(yùn)用能力的主要手段,因此,在競(jìng)爭(zhēng)激烈、就業(yè)形式日益嚴(yán)峻的今天,通過考試和取得良好的成績(jī),對(duì)每個(gè)大學(xué)生來說都是十分重要的。但是如果測(cè)試中存在偏差,使部分考生的水平得不到真實(shí)的反映,就會(huì)直接影響測(cè)試的效度和公平性,所以研究英語語言測(cè)試中是否存在偏差,以及如何改進(jìn),是提高測(cè)試的公平性、建立公平公正的社會(huì)競(jìng)爭(zhēng)環(huán)境所需要迫切解決的重要問題之一。
2.語言測(cè)試中偏差的定義
偏差是非常復(fù)雜的問題,對(duì)于偏差的界定至今仍沒有統(tǒng)一、明確的定義。早在20世紀(jì)60年代美國(guó)語言學(xué)家在研究美國(guó)印地安人參加的語言測(cè)試中提出文化背景的差異應(yīng)該作為考試潛在的差異來源。而在同一時(shí)期,受美國(guó)民權(quán)運(yùn)動(dòng)和女權(quán)運(yùn)動(dòng)的影響,測(cè)量學(xué)家就開始關(guān)注測(cè)試和項(xiàng)目的偏差研究。近幾十年來很多語言測(cè)試界的學(xué)者和專家對(duì)測(cè)試的偏差理論進(jìn)行了大量的研究。Bachman曾指出,測(cè)試偏差是指當(dāng)由于考生的個(gè)體特征差異而非語言能力差異導(dǎo)致的測(cè)試結(jié)果呈現(xiàn)系統(tǒng)性的較大差異,測(cè)試結(jié)果傾向性地反映了考生的能力,降低了測(cè)試效度。但是在研究偏差的時(shí)候,我們也要注意,考生間的測(cè)試結(jié)果差異也可能真實(shí)地反映他們的能力差異。只有當(dāng)測(cè)試結(jié)果差異呈現(xiàn)系統(tǒng)性并與他們的個(gè)體特征(如民族、教育背景、性別、年齡、宗教、個(gè)人經(jīng)歷等)相關(guān)而不是由于所測(cè)試語言能力導(dǎo)致的時(shí),才能說這項(xiàng)測(cè)試中存在偏差。語言學(xué)家Shepard也指出,測(cè)試偏差是一個(gè)范圍很廣且很復(fù)雜的概念,包括分?jǐn)?shù)的錯(cuò)誤解釋、帶有性別歧視或種族主義的內(nèi)容、標(biāo)準(zhǔn)參照考試分?jǐn)?shù)對(duì)考生在其他測(cè)試中的表現(xiàn)的不準(zhǔn)確預(yù)測(cè)、由于考生經(jīng)歷不同引起的內(nèi)容上的不平等、基于分?jǐn)?shù)的不恰當(dāng)?shù)娜瞬胚x拔程序、行為抽樣的不完全、威脅性的分為和測(cè)試環(huán)境等(Shepard,1982:25)??梢?,偏差可解釋為在測(cè)試中的一種或多種與測(cè)試無關(guān)的因素,它對(duì)考生能力產(chǎn)生系統(tǒng)性的妨礙作用,造成測(cè)試結(jié)果的偏差,有利于一部分考生而不利于另一部分考生,從而影響測(cè)試結(jié)果的準(zhǔn)確性,降低測(cè)試效度。
3.我國(guó)英語測(cè)試中的偏差的存在及其原因
從試題的設(shè)計(jì)到測(cè)試結(jié)果的產(chǎn)生整個(gè)過程中是各個(gè)要素的綜合作用。其中人員涉及測(cè)試的設(shè)計(jì)者、組織者、評(píng)定者、考生,而測(cè)試要素還涉及測(cè)試內(nèi)容、測(cè)試方法、測(cè)試條件及測(cè)試結(jié)果的評(píng)定等。據(jù)劉慶斯(1991)對(duì)MET90進(jìn)行偏差分析可以看出我國(guó)的各類大學(xué)英語全國(guó)統(tǒng)一考試,考生在民族、性別、專業(yè)背景等方面存在較大差異。再者我國(guó)城鄉(xiāng)差距較大,經(jīng)濟(jì)發(fā)展不平衡,在大范圍內(nèi)進(jìn)行的統(tǒng)考,許多潛在因素影響到測(cè)試的公平性和有效性。
3.1由測(cè)試內(nèi)容引起的偏差
由于學(xué)生的專業(yè)背景、民族、性別和語言背景知識(shí)不同,測(cè)試內(nèi)容、題材選定的不同是引起語言測(cè)試偏差的主要原因之一。例如大學(xué)英語四級(jí)考試改革以來,新題型中出現(xiàn)的易引起偏差的話題不斷出現(xiàn)。如2006年聽力第三篇短文中涉及籃球的起源問題,其中出現(xiàn)了很多籃球術(shù)語,很多考生不了解籃球也就自然沒有答對(duì)。像以此類題目對(duì)考生的英語水平的考查很大程度上是取決于他們對(duì)某一領(lǐng)域的專業(yè)知識(shí)了解程度,這與語言測(cè)試目的是不符的,容易引起測(cè)試偏差。
3.2由測(cè)試方法引起的偏差
據(jù)Murphy(1978,1982)以及Wood(2001)的研究發(fā)現(xiàn),多項(xiàng)選擇測(cè)試中男生優(yōu)于女生,而寫作測(cè)試是女生優(yōu)于男生。在考試題型的設(shè)計(jì)上,如果沒有合理地考慮各個(gè)題型的分?jǐn)?shù)比配也很容易引起測(cè)試偏差。此外,隨著計(jì)算機(jī)在英語語言測(cè)試中的廣泛應(yīng)用,不同考生對(duì)計(jì)算機(jī)的不同熟悉程度也是引起測(cè)試偏差的主要方面之一。
3.3由測(cè)試成績(jī)?cè)u(píng)定者引起的偏差
一般而言,英語語言測(cè)試試題是由主觀試題和客觀試題組成的。對(duì)主觀試題進(jìn)行評(píng)定時(shí),由于存在得分區(qū)間,主觀打分就可能造成偏差問題??忌痤}的自由度越大,打分就越可能受到無關(guān)因素的影響,偏差的可能性就越大。例如評(píng)分者有可能會(huì)受到考生性別、種族、能力水平、社會(huì)階層等因素的影響。另一方面,評(píng)分者還容易受到考生字跡、答題風(fēng)格等無關(guān)因素的影響。
3.4由測(cè)試條件引起的偏差
測(cè)試條件是指除考生和試題外的其他與測(cè)試過程相關(guān)的因素,如測(cè)試的環(huán)境、考場(chǎng)氣氛、考官性別等。Nitko(1983)指出測(cè)試壓力,如焦慮感、受到冷遇、異性或異族考官等都會(huì)在不同程度上影響一些考生群體的測(cè)試表現(xiàn),因而具有偏差。
4.結(jié)語
隨著語言測(cè)試學(xué)及應(yīng)用語言學(xué)的發(fā)展,關(guān)于語言測(cè)試的偏差問題已經(jīng)引起越來越多人的關(guān)注,所以當(dāng)我們?cè)u(píng)估英語語言的測(cè)試效度時(shí)就不得不考慮測(cè)試的公平性。因此,借鑒國(guó)外偏差研究的理論和方法,對(duì)我國(guó)的英語測(cè)試進(jìn)行偏差研究已成為測(cè)試界刻不容緩的任務(wù)。
參考文獻(xiàn):
[1]Shepard,L.A.Definitions of Bias[A].In Berk R.A (ed.).Handbook of Methods for Detecting Test Bias[C].Baltimore:Johns Hopkins University Press,1982.
[2]Murphy,Roger,J.L.Sex Differences in Examination Performance:Do these Reflect Differences in Ability or Stereotypes?[J].Educational Review,1978,(30):259-263.
[3]Nitko,A.J.Educational Test and Measurement:An Introduction[M].New York:Harcourt Brace Jovanovich,1983.
[4]李筱菊.語言測(cè)試科學(xué)與藝術(shù)[M].長(zhǎng)沙:湖南教育出版社,1997.