劉雪英
[摘要]多項(xiàng)選擇是一項(xiàng)廣泛使用的測試手段,常見于各類英語語言考試當(dāng)中。本文通過分析多項(xiàng)選擇測試的特點(diǎn),探討在英語寫作課程開始時,多項(xiàng)選擇測試作為一種用來測試學(xué)習(xí)者語法知識掌握情況的手段,并論述了多項(xiàng)選擇測試各方面的信度與效度,以此來評估該測試手段對英語寫作課程的作用與局限性。
[關(guān)鍵詞]多項(xiàng)選擇 測試 信度 效度
一、多項(xiàng)選擇測試的特點(diǎn)
多項(xiàng)選擇是一項(xiàng)廣泛使用的測試手段。根據(jù)杰納西(1996)的觀點(diǎn),多項(xiàng)選擇是一種封閉測試,不需要應(yīng)試者給出反應(yīng)。布朗(2004)認(rèn)為多項(xiàng)選擇是一種接受性和選擇性的手段,而且評判時按照客觀標(biāo)準(zhǔn)進(jìn)行,不涉及閱卷者的主觀態(tài)度。此外,多項(xiàng)選擇構(gòu)成緊湊,非常適合初學(xué)者。因此多項(xiàng)選擇通常不用來測試口語和寫作能力,而是用于測試獨(dú)立的語法知識和詞匯量(普爾普拉,2004)。
多項(xiàng)選擇因其極高的信度而享有盛譽(yù),因?yàn)閼?yīng)試者與閱卷者都不會受到主觀因素的影響,評卷也十分省時省力迅速便捷。然而設(shè)計多項(xiàng)選擇題目卻要花費(fèi)許多時間力氣和專業(yè)知識,而且在設(shè)計過程中會出現(xiàn)這樣那樣的漏洞,比如沒有正確選項(xiàng),或者在題干中出現(xiàn)線索(修斯,2003)。有時要為一篇用來測試速讀技巧的文章設(shè)計足夠數(shù)目質(zhì)量滿意的多項(xiàng)選擇題目是非常困難和耗時的(威爾,1990)。威爾認(rèn)為多項(xiàng)選擇測試語言的某個非常具體的方面因而缺乏開放式的格式。測試設(shè)計者的意圖非常明顯,就是要避免參試者的主觀性和疑慮。
威爾同時指出多項(xiàng)選擇的一些弊端,其一是應(yīng)試者的答案并不能反映題目選項(xiàng)中可能挫折的錯誤:其二是不能確定應(yīng)試者是否具備選擇正確答案應(yīng)具備的知識或技能。因此有可能出現(xiàn)猜測的行為,以至于影響到該測試的效度。此外,多項(xiàng)選擇不能反映應(yīng)試者應(yīng)對真實(shí)環(huán)境下的應(yīng)對技巧。修斯(2003)指出,多項(xiàng)選擇可能會促進(jìn)考場作弊行為,因?yàn)榇鸢缚梢酝ㄟ^非語言交流方式來傳遞。
布朗(2004)對診斷性測試的定義是為診斷學(xué)習(xí)者對語言知識某一特定方面的掌握情況而設(shè)計的測試,該類測試以兩種方式著眼未來。首先,幫助學(xué)習(xí)者意識到他們的錯誤和需要努力之處;其次,幫助教師確定將來的教學(xué)活動中著重于語言的哪些方面。修斯(1989)也表明同樣的觀點(diǎn),即診斷性測試檢測學(xué)習(xí)者在語言知識方面的強(qiáng)弱項(xiàng)并且明確在將來的學(xué)習(xí)中要學(xué)習(xí)什么,因此對于未來的教學(xué)具有重要意義:因此通常在課程開始期間按照課程設(shè)計進(jìn)行診斷性測試。
二、多項(xiàng)選擇測試在英語寫作課程初期的適用情況
多項(xiàng)選擇測試用來診斷學(xué)習(xí)者在英語寫作課初期對于語法知識的掌握情況,可以用來精確地測試學(xué)習(xí)者從構(gòu)詞法知識到詞序等方面語法知識的掌握情況。以下是一些范例。
例1、用來測試形態(tài)詞法知識
There has been a great increase in retail sales____?
A.does there B.isn't there C.hasn't there D.isn'tit(答案:C)
該題目測試反義疑問句,即句法準(zhǔn)確性。四個選項(xiàng)中即有否定形式也有肯定形式,帶有不同的助動詞。該題目的目標(biāo)是測試學(xué)習(xí)者是否掌握了反義疑問句的構(gòu)成,是否能夠準(zhǔn)確使用助動詞和否定。
例2、用來測試句法
These people once had fame and fortune,now is left to them isutter poverty。
A.all that B.all what C.all which D.thatall(答案:A)
該題目用來測試學(xué)習(xí)者是否掌握了引導(dǎo)詞“that+all”用來引導(dǎo)主語從句。
通過上述諸例可以看出,多項(xiàng)選擇測試可以準(zhǔn)確地診斷學(xué)生對于語法知識點(diǎn)的掌握情況。教師可以看出學(xué)習(xí)者掌握語法點(diǎn)的情況并且可以據(jù)此做出判斷,來確定將來的教學(xué)活動中應(yīng)該做什么。教師也可以為將來的寫作課程設(shè)計多項(xiàng)選擇題目。例如,該寫作課程如果涉及旅游交流和廣告應(yīng)用的話,常用的語法點(diǎn)知識寶庫一般現(xiàn)在時,現(xiàn)在進(jìn)行體,描述與比喻性的語言,文體風(fēng)格和語域知識等等。教師一旦確定教學(xué)目標(biāo),就可以著手涉及機(jī)關(guān)的多項(xiàng)選擇題目。根據(jù)該多項(xiàng)選擇測試的結(jié)果,教師就可以對學(xué)習(xí)者的相關(guān)語法知識水平有一個總體的了解。教師可以對相關(guān)語法點(diǎn)的正確使用進(jìn)行強(qiáng)化,糾正錯誤,或者給予明確的解釋說明。然后教師可以布置作業(yè)以鞏固上述語法知識。
然而,多項(xiàng)選擇測試并不能完全為將來的教學(xué)提供所有的基礎(chǔ)。比如,多項(xiàng)選擇測試可以揭示學(xué)習(xí)者對哪些語法點(diǎn)掌握與否,但是卻不能描述學(xué)習(xí)者對該語法點(diǎn)知識的使用情況。多項(xiàng)選擇測試只能用來辨識錯誤和評估對語法知識的認(rèn)知情況,然而在知識與實(shí)際運(yùn)用之間是有差距的。此外,多項(xiàng)選擇測試不僅與實(shí)際使用的語言有出入,而且是脫離實(shí)際語境的。大多數(shù)多項(xiàng)選擇題目與現(xiàn)實(shí)生活脫節(jié),干擾項(xiàng)可能在實(shí)際上從來不會發(fā)生,并且實(shí)際上會有不止一個正確答案。考慮到上述兩點(diǎn),多項(xiàng)選擇測試并不能幫助教師來確定將來寫作課程的發(fā)展。
三、多項(xiàng)選擇測試的作用與局限性
多項(xiàng)選擇測試對于學(xué)習(xí)者英語語法知識掌握情況的評估可以從以下方面進(jìn)行。
1、實(shí)用性
根據(jù)杰納西(1996)和布朗(2004)的觀點(diǎn),此類多項(xiàng)選擇測試的實(shí)用性比較高,因?yàn)樗鷥r低廉,有充足的時間和空間進(jìn)行此類測試,管理比較方便,不需要額外的設(shè)備設(shè)施來進(jìn)行此類測試,因此降低了成本,并且閱卷程序比較便捷省時。該類測試可以在某個或某些特定的學(xué)習(xí)者群體內(nèi)進(jìn)行,不需要大規(guī)模的管理,因此比較省時和節(jié)省物力與資源。
2、信度
在評分方面多項(xiàng)選擇測試享有較高的信度。一方面,每—個題目都有標(biāo)準(zhǔn)答案,閱卷者甚至不需要專業(yè)知識或進(jìn)行判斷。評判內(nèi)與評判間信度都不會受到主觀因素的影響。而諸如測試長度、環(huán)境影響等因素可以通過教師和管理安排來避免。然而,有可能因?yàn)椴荒苷业阶銐虻母蓴_項(xiàng)或情景內(nèi)容而使受測項(xiàng)目不能充分得到測試,因此多項(xiàng)選擇在一定情況下的信度是受到影響的,因而使用場合是受到限制的。另一方面,如果設(shè)計該多項(xiàng)選擇的教師沒有很好的設(shè)計該題目,那么信度也會受到影響。不過這一點(diǎn)可以通過使用同一階段同一課程先前使用過的多項(xiàng)選擇題目來避免。對于學(xué)習(xí)者而言,信度可能會因?yàn)樵摐y試是在課程開始時進(jìn)行,而學(xué)習(xí)者有可能因?yàn)樵诜偶僦笸浟嗽S多知識點(diǎn)。同時,學(xué)習(xí)者有可能在有限的時間下經(jīng)過測試而感覺緊張。應(yīng)試表現(xiàn)有可能在不同時間段出現(xiàn)差異。endprint
3、效度
內(nèi)容效度:多項(xiàng)選擇題目由教師設(shè)計,根據(jù)為寫作課程的將來發(fā)展和診斷學(xué)習(xí)者語法知識的綜合考慮。因此測試的內(nèi)容與教師將來欲進(jìn)行的教學(xué)內(nèi)容息息相關(guān)。因此,該測試享有較高的內(nèi)容效度。
結(jié)構(gòu)效度:僅僅依靠多項(xiàng)選擇來測試學(xué)習(xí)者的語法知識水平不是一個完善的方法。根據(jù)普爾普拉(2004)的觀點(diǎn),應(yīng)該有一系列的測試方法來衡量學(xué)習(xí)者的語法知識水平。因而有足夠的空間來測試學(xué)習(xí)者語法知識的獨(dú)立因素和在實(shí)際生活中的語法能力。因此要使用多種測試手段來衡量學(xué)習(xí)者的語法知識水平。然而,在多項(xiàng)選擇題目中表現(xiàn)良好的學(xué)習(xí)者卻未必能夠準(zhǔn)確和正確運(yùn)用語法知識進(jìn)行寫作和口語。在這種情況想,考試成績與實(shí)際能力的關(guān)系并未能得到證實(shí)。因此,多項(xiàng)選擇題的得分并不能作為唯一的學(xué)習(xí)者語法能力的指標(biāo)。而這種缺陷嚴(yán)重影響了多項(xiàng)選擇作為測試手段的結(jié)構(gòu)效度(修斯,2003)。
效標(biāo)效度:如果學(xué)習(xí)者在多項(xiàng)選擇測試中的成績可以與其他類似能作為衡量標(biāo)準(zhǔn)的測試成績相比,用來測試其相同或相似的語法知識,那么該多項(xiàng)選擇測試是具有效標(biāo)效度的。因此可以在課程開始時的相同階段用該多項(xiàng)選擇測試來比對程度測試。我認(rèn)為多項(xiàng)選擇測試與程度測試相比具有更低的同時效度,而后者能夠?qū)W(xué)習(xí)者合理歸置而享有較高的結(jié)構(gòu)效度:此兩類測試在效標(biāo)效度方面有一些共同之處。
表面效度:多項(xiàng)選擇測試有較高的表面效度,因?yàn)樗铝τ跍y試學(xué)習(xí)者某方面的語法知識,并且與將來寫作課程的進(jìn)行密切相關(guān)。盡管可能包含類似的測試題目任務(wù)而損害其結(jié)構(gòu)效度,但是在規(guī)定時間內(nèi)進(jìn)行該類型測試的可能性是很高的。測試題目是否清晰復(fù)雜取決于題目設(shè)計者是否將之按照一定的標(biāo)準(zhǔn)進(jìn)行設(shè)計。測試的目標(biāo)應(yīng)該很明確,因?yàn)閷W(xué)習(xí)者們一般都很熟悉此類測試。因此,多項(xiàng)選擇測試享有較高的內(nèi)容效度,相應(yīng)的也有較高的表面效度。
4、反撥作用與真實(shí)可靠性
多項(xiàng)選擇測試有可能因?yàn)榇龠M(jìn)猜測和作弊而具有負(fù)面的反撥作用。測試必須貼近真實(shí)生活場景才能夠具備真實(shí)可靠性。多項(xiàng)選擇測試主要集中在測試語法知識點(diǎn)的掌握情況而非這些知識點(diǎn)的實(shí)際使用情況,因此并不能夠代表真實(shí)生活場景。而且此類測試的條目也很難內(nèi)部關(guān)聯(lián),盡管可以采用場景相關(guān)的段落作為鋪墊,但是與真實(shí)場景的聯(lián)系畢竟有限。因此多項(xiàng)選擇測試與語言使用環(huán)境關(guān)聯(lián)不大,于是對于學(xué)習(xí)者缺乏有意義的吸引力。
四、結(jié)論
多項(xiàng)選擇測試的目標(biāo)是在英語寫作課程開始時診斷學(xué)習(xí)者特定語法知識點(diǎn)的掌握情況。此類測試因?yàn)槠湓u分簡單客觀、管理方便、時間與資源浪費(fèi)少而容易實(shí)施。此類測試能夠衡量學(xué)習(xí)者對特定語法知識點(diǎn)的掌握情況,但是僅限于提供學(xué)習(xí)者是否掌握了語法知識點(diǎn)的信息,而該信息是接納性信息,不能夠表明學(xué)習(xí)者是否能夠應(yīng)用這些語法知識點(diǎn)進(jìn)行產(chǎn)出性活動。不考慮可能的設(shè)計失誤、情景影響和學(xué)習(xí)者的個人因素,此類測試不能為寫作課程這一產(chǎn)出性的語言活動提供足夠的信息:但是可以提醒教師注意某些語法錯誤并尋求對策。多項(xiàng)選擇測試的效度和真實(shí)可靠性有限,不能為教師提供充足的信息用來進(jìn)行寫作課程大綱的制定。endprint