摘 要: 外語(yǔ)教學(xué)評(píng)價(jià)是提高外語(yǔ)教學(xué)質(zhì)量的重要途徑,而評(píng)價(jià)信息效度的高低關(guān)系到能否反映學(xué)生真實(shí)的外語(yǔ)水平。本文就效度的定義、效度的收集方法、信息的收集方法等進(jìn)行了探討,以期為教學(xué)提供準(zhǔn)確的評(píng)價(jià)信息,使教師準(zhǔn)確把握學(xué)生的外語(yǔ)水平,有針對(duì)性地、更好地進(jìn)行教學(xué)。
關(guān)鍵詞: 外語(yǔ)教學(xué) 效度 評(píng)價(jià) 信息
對(duì)于外語(yǔ)教學(xué),我們通常采用定性(質(zhì)性)和定量性(量性)信息進(jìn)行評(píng)價(jià)。在評(píng)價(jià)中,信息的質(zhì)量是至關(guān)重要的。無(wú)論我們采取什么方法收集信息,必須始終關(guān)注用于評(píng)估的信息的質(zhì)量。信度和效度是信息質(zhì)量的兩個(gè)方面。信度是指信息的一慣性和穩(wěn)定性,效度是指信息的相關(guān)程度。信度和效度是判別信息質(zhì)量的關(guān)鍵[1]。同時(shí),在收集評(píng)價(jià)信息時(shí)還要注意所采用數(shù)據(jù)的實(shí)用性,在此我們主要探討外語(yǔ)教學(xué)評(píng)價(jià)中效度的收集問(wèn)題。
一、效度的定義
效度是我們所收集的材料對(duì)我們所要了解的對(duì)象的特征或?qū)傩缘恼鎸?shí)反映的程度[2]。這是對(duì)效度最直接的定義,但還有一些隱含的意義需要引起注意。首先,我們想要準(zhǔn)確知道的對(duì)象往往不是一個(gè)容易回答的問(wèn)題,特別是當(dāng)涉及外語(yǔ)學(xué)習(xí)時(shí)。比如,什么是交際能力?什么是外語(yǔ)學(xué)習(xí)的潛能?什么是關(guān)于基本句型的知識(shí)?所有這些問(wèn)題都是教師和語(yǔ)言學(xué)家們長(zhǎng)期以來(lái)爭(zhēng)論的問(wèn)題。其次,我們最關(guān)心的是信息的真實(shí)程度。例如,在一個(gè)有關(guān)學(xué)習(xí)背景的面談中,我們得到了大多數(shù)學(xué)生的學(xué)習(xí)背景的準(zhǔn)確信息,但也可能會(huì)有個(gè)別同學(xué)給出了不準(zhǔn)確的信息。有的學(xué)生在這種情景下傾向于夸大其詞,而有的卻對(duì)以前的經(jīng)歷描述不足,這可能是為了增強(qiáng)或者削弱采訪(fǎng)者對(duì)其外語(yǔ)能力的判斷,或者僅僅是因?yàn)樗麄冇洸磺辶?。這些回答表明了每個(gè)應(yīng)答者學(xué)習(xí)英語(yǔ)的時(shí)間的長(zhǎng)短,而實(shí)際上還被當(dāng)成了效度的指數(shù)。
正如信度一樣,效度也用0.00~1.00之間的數(shù)字來(lái)表示。完全效度用1.00來(lái)表示,而沒(méi)有效度用0.00來(lái)表示。這些數(shù)字表達(dá)的只是理論上的區(qū)間,在實(shí)踐中,我們永遠(yuǎn)沒(méi)有辦法確定我們?cè)谠u(píng)價(jià)過(guò)程中的效度,而只能估計(jì)。而在評(píng)價(jià)中,我們也不可能期望有完全效度的過(guò)程。我們應(yīng)該認(rèn)識(shí)到,信度和效度有一些很重要的關(guān)聯(lián)。首先,評(píng)價(jià)儀器或過(guò)程只具有它本身本次所具有的可靠性。也就是說(shuō),其他次別就可能會(huì)和本次不一致,而這些不一致的過(guò)程會(huì)降低評(píng)價(jià)的信度,評(píng)價(jià)結(jié)果會(huì)受到這些因素的影響。其結(jié)果是,這些因素會(huì)導(dǎo)致產(chǎn)生不一致的、錯(cuò)誤的信息。過(guò)多的信息也會(huì)降低效度。例如,對(duì)年齡的態(tài)度會(huì)影響學(xué)生對(duì)調(diào)查問(wèn)卷的回答。其次,沒(méi)有效度目的傾向的測(cè)試可能更可靠。比如,在評(píng)價(jià)表上有一個(gè)問(wèn)題問(wèn)學(xué)生對(duì)老師的印象。在不同的場(chǎng)合,學(xué)生可能會(huì)給出一致的答案。但他們這樣評(píng)價(jià)老師是因?yàn)樗麄冇X(jué)得這是一種被欣賞的社交應(yīng)答方式,或者他們害怕老師看到他們的評(píng)價(jià)而給低分。他們對(duì)老師的真實(shí)感覺(jué)可能完全不同,但回答卻是一致的。
二、效度的估計(jì)
效度與信度一樣,不能直接評(píng)價(jià)。要評(píng)價(jià)相關(guān)信息的效度,我們必須對(duì)評(píng)價(jià)對(duì)象的真實(shí)性或狀態(tài)有確切的把握,以便將其與我們收集到的信息進(jìn)行比對(duì)。在人為評(píng)價(jià)的范疇內(nèi),大多數(shù)優(yōu)秀的評(píng)價(jià)者不是對(duì)他們的評(píng)價(jià)對(duì)象而是對(duì)直接評(píng)價(jià)更感興趣。因?yàn)闆](méi)有直接的方法能使我們了解到我們所感興趣的對(duì)象的品質(zhì)及能力的真實(shí)水平,我們只有一些關(guān)于這些對(duì)象的信息,通過(guò)此了解我們所感興趣的對(duì)象,即只有通過(guò)間接的方法估計(jì)信息收集過(guò)程的效度。在評(píng)價(jià)中,我們收集信息的目的是能對(duì)有關(guān)學(xué)習(xí)或教學(xué)作出符合邏輯的判定。如果我們收集的信息有助于達(dá)到這一目的,就可以認(rèn)定得出這一結(jié)論的信息和過(guò)程是有效度的。依據(jù)我們想要得出的結(jié)論的種類(lèi),我們選擇所要評(píng)價(jià)的信息效度的收集方法。主要有三種方法[3]:
1.內(nèi)容相關(guān)度
內(nèi)容相關(guān)性是指通過(guò)有邏輯的、詳細(xì)而系統(tǒng)的方法檢測(cè)評(píng)價(jià)的內(nèi)容、方法和過(guò)程是否代表了我們所想要評(píng)價(jià)的語(yǔ)言技能。內(nèi)容相關(guān)性對(duì)評(píng)價(jià)來(lái)說(shuō)很重要,因?yàn)橥庹Z(yǔ)教師常常想知道學(xué)生在某一特定場(chǎng)景或某一類(lèi)型的情境下的表現(xiàn),而在這些場(chǎng)景下教師無(wú)法通過(guò)詢(xún)問(wèn)評(píng)價(jià)學(xué)生的表現(xiàn)。因此,評(píng)價(jià)學(xué)生在某一限定場(chǎng)景或者我們不感興趣的場(chǎng)景下的表現(xiàn)是很有必要的,通過(guò)總結(jié)這些評(píng)價(jià)結(jié)果,我們能得出我們所感興趣的場(chǎng)景下學(xué)生的表現(xiàn)。
內(nèi)容相關(guān)度在分班考試中非常重要,在標(biāo)準(zhǔn)測(cè)試中也很重要。在這些測(cè)試中,測(cè)試內(nèi)容是否代表了教師所教的語(yǔ)言技能或評(píng)價(jià)了教師最感興趣的東西是一個(gè)關(guān)鍵問(wèn)題。如果摸底考試的內(nèi)容不能準(zhǔn)確反映課堂所教的知識(shí),學(xué)生在考試中的成績(jī)就不能準(zhǔn)確反映他們?cè)谶@些課程中的表現(xiàn)。換句話(huà)說(shuō),如果摸底考試中所考的語(yǔ)言技巧和教學(xué)中所教的語(yǔ)言技巧之間沒(méi)有或幾乎沒(méi)有聯(lián)系,我們就不能通過(guò)摸底考試準(zhǔn)確判斷學(xué)生對(duì)這些課程的學(xué)習(xí)情況。
2.標(biāo)準(zhǔn)關(guān)聯(lián)效度
標(biāo)準(zhǔn)關(guān)聯(lián)效度是指用一種方法評(píng)價(jià)信息的屬性或者特征與用另外一種方法評(píng)價(jià)同一信息的屬性或特征所得出的結(jié)果之間的關(guān)聯(lián)程度。標(biāo)準(zhǔn)關(guān)聯(lián)效度可以通過(guò)統(tǒng)計(jì)計(jì)算得出某一評(píng)價(jià)和標(biāo)準(zhǔn)之間的一致程度。通常用0.00(無(wú)關(guān)聯(lián)效度)到1.00(完全關(guān)聯(lián)效度)之間的關(guān)聯(lián)效度指數(shù)來(lái)表示。
3.結(jié)構(gòu)效度
結(jié)構(gòu)效度對(duì)課堂評(píng)價(jià)來(lái)說(shuō)可能是最難理解且用途最小的一種效度。下面的例子可能會(huì)幫助我們理解什么是結(jié)構(gòu)效度。英語(yǔ)老師想要知道學(xué)生對(duì)于學(xué)習(xí)英語(yǔ)重要性的認(rèn)識(shí),于是讓學(xué)生在“很重要”、“重要”、“不重要”之間進(jìn)行選擇。隨后他將學(xué)生的選擇與他們的英語(yǔ)成績(jī)相比對(duì),結(jié)果發(fā)現(xiàn),那些認(rèn)為英語(yǔ)學(xué)習(xí)“很重要”的學(xué)生都是班里學(xué)習(xí)最好的學(xué)生。因此他得出這樣的結(jié)論,評(píng)價(jià)是有效度的,因?yàn)橥ǔ?lái)說(shuō),學(xué)習(xí)動(dòng)機(jī)越強(qiáng)的學(xué)生成績(jī)會(huì)越好。結(jié)構(gòu)效度在我們不了解要評(píng)價(jià)的內(nèi)容的準(zhǔn)確的屬性和特征時(shí)最有用,因此它不能用于內(nèi)容效度。
如信度一樣,評(píng)價(jià)過(guò)程的效度也可以通過(guò)鑒別影響效度的因素來(lái)確定。比如,在考試成績(jī)方面,除了學(xué)生的外語(yǔ)水平外,其他因素也可能會(huì)影響學(xué)生的成績(jī)。如果有許多其他因素影響學(xué)生的表現(xiàn),那么將這個(gè)評(píng)價(jià)過(guò)程作為衡量外語(yǔ)水平的標(biāo)準(zhǔn)就會(huì)效度很低。要提高信度,往往需要消除、減少或者將這些因素考慮在內(nèi)。
三、信息的收集方法
外語(yǔ)教學(xué)評(píng)價(jià)需要收集大量的教學(xué)信息(教學(xué)目的,教學(xué)計(jì)劃,教學(xué)實(shí)踐)、學(xué)生信息(學(xué)生需求,個(gè)人背景,語(yǔ)言閱歷,學(xué)習(xí)成績(jī),學(xué)習(xí)態(tài)度和感受)、教師信息(語(yǔ)言經(jīng)驗(yàn),語(yǔ)言技巧,教學(xué)態(tài)度)、學(xué)校信息(學(xué)校的教學(xué)和人力資源)等??梢圆扇〔煌姆椒ㄊ占煌男畔ⅰ?荚嚳梢杂脕?lái)收集學(xué)生學(xué)習(xí)成績(jī)方面的信息,但不能用來(lái)收集其他方面的信息,而其他的數(shù)據(jù)收集方法卻適合收集這些信息。比如,課堂觀察和學(xué)生會(huì)議可收集到學(xué)生在閱讀和學(xué)作中所使用的策略;對(duì)話(huà)記錄能說(shuō)明學(xué)生課堂學(xué)習(xí)的態(tài)度;學(xué)校記錄,課程檔案,或其他的資料能說(shuō)明學(xué)校的管理和人力資源情況,也能說(shuō)明教學(xué)本身。
有些信息的收集是直接的,不需要特別準(zhǔn)備的,比如,查看學(xué)校記錄和教學(xué)資料。在這種情況下,我們就可以了解到與此相關(guān)的信息,進(jìn)而了解其內(nèi)容。其他方法,比如檔案袋法、會(huì)議法、調(diào)查問(wèn)卷法需要事先準(zhǔn)備并有一定的程序。
我們不必在任何時(shí)候都要用所有方法收集信息,而是要決定哪個(gè)或者哪幾個(gè)是某一特定場(chǎng)景下能使我們作出最合適的決定的最恰當(dāng)?shù)姆椒?。何況,并不是所有的方法都適合我們所要收集的用于評(píng)價(jià)目的的信息。有些方法(比如,會(huì)議和日志)既可用于教學(xué)又可用于其他評(píng)價(jià)目的。因此,教師可以選用一些方法作為評(píng)價(jià)活動(dòng)的一部分,而選用何種方法則要由他們的評(píng)價(jià)目的來(lái)決定。
參考文獻(xiàn):
[1]Brian K.Lynch.Language Program Evaluation[M].Shanghai:Shanghai Foreign Language Education Press,2001.
[2]Fred Genesee Johna A.Upshur.Classroom-based Evaluation in Second Language Education[M].Beijing:Foreign Language Teaching and Research Press,2005.
[3]James Dean Brown.The Elements of Language Curriculum:A Systematic Approachto Program Development[M].Beijing:Foreign Language Teaching and Research Press,2001.