吳卓婭
摘要 研究了大連理工大學(xué)英語新模式課程評(píng)價(jià)體系,包括學(xué)生課堂評(píng)價(jià)、網(wǎng)絡(luò)學(xué)習(xí)記錄評(píng)價(jià)以及成就測試等主要評(píng)價(jià)手段的具體應(yīng)用問題,重點(diǎn)分析了各種評(píng)價(jià)手段在應(yīng)用過程中所具有的優(yōu)勢以及尚存在的各種問題和不足,以期使這些討論能促進(jìn)未來評(píng)價(jià)體系的改進(jìn)與建設(shè)。
關(guān)鍵詞 終結(jié)性/形成性評(píng)價(jià) 替代評(píng)價(jià) 反撥效應(yīng) 效度/信度 可行性
文章探討的是大連理工大學(xué)大學(xué)英語改革后課程評(píng)價(jià)體系和應(yīng)用問題。新的評(píng)價(jià)體系由形成性和終結(jié)性評(píng)價(jià)組成。該體系比較復(fù)雜,它包括不同教學(xué)目的不同課型、不同種類和在不同階段的評(píng)價(jià)手段?!懊糠N手段各有其優(yōu)勢和不足”Brown and Hudsons(1998),對這種結(jié)合式評(píng)價(jià)體系的研究將為改進(jìn)英語課評(píng)價(jià)的效度和信度提供有益的數(shù)據(jù)。事實(shí)上,這種綜合評(píng)價(jià)體系仍然存在許多值得探討和解決的問題。目前,基本的評(píng)價(jià)手段正在從終結(jié)性評(píng)價(jià)(期末一次性成績考試)向形成性評(píng)價(jià)(各種有選擇的階段性考評(píng))轉(zhuǎn)變。Hancock把這種形成性評(píng)價(jià)定義為“它是一種過程,這期間學(xué)生和老師用非傳統(tǒng)方式用語言對學(xué)生的學(xué)習(xí)做出評(píng)價(jià)。”(1994)這種評(píng)價(jià)要求學(xué)生在課上展示、表現(xiàn)并促使自己有較高的思維。如此,老師是根據(jù)學(xué)生在課堂上的表現(xiàn)進(jìn)行評(píng)價(jià)的(Brown & Hudson,1998)。所以,這種評(píng)價(jià)體系下,注重的是學(xué)生的學(xué)習(xí)過程、他們的參與度和對學(xué)習(xí)的投入。首先,學(xué)生們一開始就了解了這種評(píng)價(jià)體系和期末最終成績的構(gòu)成。以大學(xué)英語讀寫課為例,期末最終成績是:課堂口語成績占10%;期末口語考試占10%;網(wǎng)上自主學(xué)習(xí)占10%;課堂閱讀和寫作占10%;期中考試占10%;期末綜合考試50%。這種方式是使用反撥效應(yīng)的一種。因?yàn)檫@種評(píng)價(jià),可以使那些想要拿到好成績的學(xué)生不會(huì)把學(xué)習(xí)推到期末。也是因?yàn)橐?jīng)常在課上進(jìn)行這些評(píng)價(jià),而且這些評(píng)價(jià)任務(wù)要占很多的教學(xué)時(shí)間,所以,教學(xué)和評(píng)價(jià)是很難分清楚的。換句話說,所評(píng)價(jià)的是“學(xué)生此刻學(xué)得怎樣”,而不是“學(xué)生已經(jīng)學(xué)得怎樣”。因此,學(xué)生單獨(dú)一次性的期末考試對教師未來的教學(xué)啟示,遠(yuǎn)不如考察學(xué)生課上的表現(xiàn)。
一、課堂表現(xiàn)評(píng)價(jià)體系Kassim Shaaban (2001)的一篇文章探討了各種選擇性的評(píng)價(jià)手段。其中,大部分是考察學(xué)生們在課上的日常表現(xiàn)。如對面試、角色表演、筆頭描述、集體展示、模擬會(huì)議以及學(xué)生自評(píng)。在大連理工大學(xué),口語課主要采用對學(xué)生的課堂表現(xiàn)進(jìn)行評(píng)價(jià)的方式(這種考核約占課堂教學(xué)的30%學(xué)時(shí))。課上,通常要求學(xué)生完成模擬真實(shí)場景的并有創(chuàng)造性的練習(xí)。這種練習(xí)形式多樣,有兩人一組、角色表演、小組討論、小組代表做匯報(bào)、迷你劇表演、3分鐘演講、圖片描述、辯論和小型口語對抗賽等。(這種評(píng)價(jià)方式能夠有效彌補(bǔ)幾次有限的考試所造成的考試信度的問題)。具體來說,如果由6個(gè)人一組表演的迷你劇,評(píng)價(jià)結(jié)果將根據(jù)組內(nèi)每個(gè)學(xué)生的語言面貌、內(nèi)容的趣味性和合作效果來綜合評(píng)判。 課堂表現(xiàn)評(píng)價(jià)的總原則是口語的話題和展示形式(無論是個(gè)人,一組還是小組活動(dòng)等)??梢赃_(dá)到彌補(bǔ)內(nèi)容匱乏和形式單一所造成的效度問題。 對這些表現(xiàn)的評(píng)價(jià),可以是較正規(guī)也可以是隨便一些。學(xué)生的即席表演也可以依據(jù)老師的評(píng)判記錄分?jǐn)?shù),但這只是考核中一個(gè)小部分。大部分正軌考核都是要事先布置好,學(xué)生課下做好準(zhǔn)備。 教師布置的任務(wù)一定要進(jìn)行計(jì)分考核。也有的任務(wù),學(xué)生可互評(píng)。(這項(xiàng)做法可以彌補(bǔ)因其主觀評(píng)分所造成的考核信度的不足問題。也能使學(xué)生在互評(píng)中相互學(xué)習(xí)。)例如,在進(jìn)行3分鐘口語對抗賽時(shí),可以請學(xué)生作評(píng)委,他們根據(jù)老師定的評(píng)分標(biāo)準(zhǔn)。老師還可以更詳細(xì)的給出什么樣的問題和回答是好的,如“The speaker has made himself heard.”“I like his way of delivering his speech.”。還要強(qiáng)調(diào)肢體語言和目光的接觸問題。期末口語考試時(shí),任課班教師可以互換班級(jí)進(jìn)行考試。(該方法可以彌補(bǔ)自己班教師評(píng)判的主觀性。)課堂上對學(xué)生的各種評(píng)價(jià)是教師了解學(xué)生語言能力,文化、教育背景和經(jīng)歷、他們的學(xué)習(xí)態(tài)度、目標(biāo)、喜好以及其他一次性終結(jié)考試所不能體現(xiàn)出來的特質(zhì)和信息(Genesee,1996)。此外,還可以讓學(xué)習(xí)者對學(xué)習(xí)有自我控制和責(zé)任感(Genesee,1996)。教者可以創(chuàng)造出一種學(xué)習(xí)環(huán)境,無形中把學(xué)習(xí)的責(zé)任傳遞給學(xué)生。但對這種評(píng)價(jià)模式的反饋還是多種多樣的。第一,模式的實(shí)用性。這種按課堂表現(xiàn)的評(píng)價(jià)方式很耗時(shí),需要占據(jù)很大一部分課堂時(shí)間。某種程度來說,該評(píng)價(jià)模式已經(jīng)替代了原來檢查教學(xué)效果,成為加強(qiáng)教學(xué)的方式。第二,學(xué)生課上也許并不覺得輕松。雖然非正規(guī)的一些課堂評(píng)價(jià)標(biāo)準(zhǔn)還不是很嚴(yán)格,有時(shí)也不留記錄,因此,也會(huì)減弱其效力。此外,課堂活動(dòng)也會(huì)使教師和學(xué)生都感到具有過高的挑戰(zhàn)性和緊張感。
二、學(xué)生網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)體系目前,流行的網(wǎng)上學(xué)習(xí)課程提供了一種新型的評(píng)價(jià)形式,它似乎不屬于任何一個(gè)類別Brown and Hudson (1998)。學(xué)生網(wǎng)上學(xué)習(xí)記錄是計(jì)算機(jī)提供的簡易統(tǒng)計(jì)數(shù)據(jù),可供日后查閱學(xué)生的日常學(xué)習(xí)情況。這里,網(wǎng)上學(xué)習(xí)占課程學(xué)習(xí)的10%。學(xué)生可以利用自主學(xué)習(xí)平臺(tái)在他們方便的時(shí)候和機(jī)房進(jìn)行網(wǎng)上學(xué)習(xí)。學(xué)生可以利用所有的網(wǎng)上資源。目前,主要考察學(xué)生網(wǎng)上聽力、閱讀和寫作。教師給學(xué)生規(guī)定幾個(gè)學(xué)習(xí)節(jié)點(diǎn),以便是他們都能根據(jù)老師安排的統(tǒng)一步驟完成學(xué)習(xí)任務(wù)。對于新的學(xué)習(xí)方式和評(píng)價(jià)方式,學(xué)生們還是饒有興趣的,好處也很明顯。學(xué)生可以自己安排自己的學(xué)習(xí)進(jìn)度。自己決定什么時(shí)候?qū)W習(xí)、在哪學(xué)習(xí)、做幾遍聽力練習(xí),甚至可以自己控制音頻的速度,等等。學(xué)生們還可以通過互聯(lián)網(wǎng)和老師進(jìn)行互動(dòng)。不在老師的監(jiān)控下學(xué)習(xí)使他們感到輕松,并可以重復(fù)做練習(xí)、延遲提交作業(yè)直到覺得滿意為止。計(jì)算機(jī)上有較詳細(xì)網(wǎng)上學(xué)習(xí)記錄,這些記錄是一種較簡單的統(tǒng)計(jì),教師可據(jù)此來跟蹤學(xué)生的學(xué)習(xí)情況。但是問題也是顯而易見的。因?yàn)橛凶鞅椎目赡苄裕瑢W(xué)生網(wǎng)上學(xué)習(xí)記錄的信度風(fēng)險(xiǎn)度較大。比如,一個(gè)同學(xué)可以給另一個(gè)同學(xué)做網(wǎng)聽;或者可以從他人那里得到答案。有一次竟然出現(xiàn)了一些學(xué)生幾分鐘內(nèi)以100%的正確率完成了他們的網(wǎng)上作業(yè)。學(xué)生上網(wǎng)操作和對計(jì)算機(jī)的熟悉度是不一樣的,那么,這樣的結(jié)果勢必消弱這種評(píng)價(jià)手段的信度。盡管如此,使用該系統(tǒng)的可行性還是很大的,因?yàn)橹恍鑿哪惩庹Z教學(xué)出版社引進(jìn)這個(gè)系統(tǒng)就可以上網(wǎng)了。endprint
三、學(xué)業(yè)成績考試學(xué)業(yè)成績考試最重要的評(píng)價(jià)手段就是期末考試。其目的就是測試出每個(gè)學(xué)生根據(jù)既定目標(biāo)是否取得優(yōu)異的成績(Huges,1989)??荚嚢凑战虒W(xué)目的設(shè)計(jì),教學(xué)目的是依據(jù)課程要求制定《大學(xué)英語課程要求》(2007)。這種考試形式受到我國現(xiàn)行的大學(xué)英語四、六級(jí)考試的影響。因?yàn)樗?、六?jí)考試是大學(xué)畢業(yè)的前提(許多大學(xué)和院校),同時(shí)也是將來畢業(yè)求職的一張牌。大學(xué)英語考試委員會(huì)有極高的影響力,考試帶來的沖擊影響著教育部政策制規(guī)定者們。大學(xué)英語作為大學(xué)的一門課程直接由教育部指導(dǎo)的課程,這是典型的測試反撥效應(yīng)的作用(Cheng,2000)。盡管我們不在課上教考試技巧,但教學(xué)大綱中的教學(xué)目的卻要和大學(xué)英語四級(jí)考試水平一致(教學(xué)大綱,2006)。在我們學(xué)校,盡管四級(jí)考試和學(xué)生能否畢業(yè)不在掛鉤了,可是教學(xué)目標(biāo)仍需和大學(xué)英語四級(jí)的基本要求相符合。為了相適應(yīng),入校新生要參加英語入學(xué)考試,之后,會(huì)被按考試成績分配到相應(yīng)的大學(xué)英語1~4個(gè)級(jí)別。在各級(jí)別的英語課中,所選擇的教材、教學(xué)目標(biāo)和考試形式還是和英語四個(gè)級(jí)別的要求一致,除了幾個(gè)個(gè)別高級(jí)別的班級(jí)。所以,上述所提到的考試反撥作用確實(shí)有其根源。所有級(jí)別的期末考試都采用大學(xué)英語的考試形式,除了口語要單獨(dú)測試,卷內(nèi)包含各種技能的試題形式,有如下幾個(gè)部分:聽力(多項(xiàng)選擇和綜合填空題);閱讀(快讀和仔細(xì)閱讀);綜合技巧(完形填空,改錯(cuò)和翻譯);最后是寫作部分??梢宰⒁獾皆诮^大部分的題型中,都是由選擇題和主觀題組成。比如,聽力試題中既有選擇題又有填空題。快速閱讀采取了對或者錯(cuò)的簡單回答方式。閱讀題中,既有多項(xiàng)選擇題又有簡短回答問題的主觀試題,有時(shí)完形填空和改錯(cuò)題交替出現(xiàn)在試卷中。所以,考試的總趨勢是傳統(tǒng)的測試形式已不再是很固定了。測試綜合水平的要求在升高。由于有了計(jì)算機(jī),主觀題的測試部分可以進(jìn)行機(jī)考,接下來的主觀口語測試部分還需老師付出很多時(shí)間,同時(shí)教師互換班級(jí)以求提高考試的可信度。客觀試題試卷中,30%的內(nèi)容依據(jù)教科書,70%的內(nèi)容則選自課外同等水平的材料。對此考試的反饋如下:第一,70%的考試內(nèi)容選自課外材料有許多弊病。教師在出考試題時(shí),每個(gè)人負(fù)責(zé)出一部分題。但他們每個(gè)人對四級(jí)水平的試題的理解是各不相同的,同時(shí),1~4級(jí)之間又沒有嚴(yán)格的區(qū)分。更糟糕的是,我們所使用的教科書的內(nèi)容也是沒有嚴(yán)格的等級(jí)區(qū)別的。第一冊書和第二冊書只是在主題和詞匯上有一定的區(qū)分,而難易度并不明顯。結(jié)果是,考試題的信度和效度成了問題。試卷的一部分或者整個(gè)試卷不是容易了就是難了,更不用說有的老師在出題過程中有粗心大意的狀況。第二,教師分別工作在各自不同的級(jí)別小組之中。因此,1級(jí)組出題老師出的快速閱讀題結(jié)果可能比2級(jí)組的快速閱讀題還要難。這又一次證明了試題的效度有問題。第三,每學(xué)期開學(xué)后,各項(xiàng)教學(xué)如同機(jī)器一樣快速運(yùn)轉(zhuǎn)??荚嚽皼]有教師有能力關(guān)心試題的效度和信度。雖然我們期末也做一些常規(guī)的試卷分析,但這工作是形式作用大于對實(shí)際工作和未來評(píng)價(jià)的作用。所以,學(xué)??荚囍饕靡嬗诖髮W(xué)英語四級(jí)的反饋而不是平時(shí)的考試反饋。第四,目前也有一些試題庫。但其質(zhì)量堪憂。試題庫的開發(fā)需要對試題作嚴(yán)格的選擇,也要保持教科書的信度和相應(yīng)的難易度。那么,試題庫的建設(shè)還是有較長的路要走的。最后,本課程評(píng)價(jià)方式主要是標(biāo)準(zhǔn)參照考試。所以,學(xué)生A、B、C、D成績的等級(jí)分布不是很合理。這也使得學(xué)生們在成績方面處于劣勢。尤其是當(dāng)他們出國留學(xué)和需要提交本科成績時(shí),拿不出理想的成績單。
四、結(jié)語整體課程的評(píng)價(jià)體系很復(fù)雜也很難操作。老師和學(xué)生都有壓力感。有些老師不滿意,他們質(zhì)疑改革的區(qū)別在哪,因?yàn)檫@種考試的結(jié)果和從一次考試就能得到的成績幾乎相近。這些所謂的“麻煩”值得嗎?因此,該評(píng)價(jià)形式的價(jià)值和效果需要進(jìn)行驗(yàn)證,目前出現(xiàn)的問題也需要得到解答。更重要的是,怎樣面對廣大學(xué)生推出一份合理、公正和正確的考評(píng)機(jī)制。
參考文獻(xiàn)
[1]Brown,J.D. & Hudson,T.Alternatives in assessment. TESOL Quarterly,1998,32,(4):653-675.
[2]Cheng,L.Washback or Backwash: A review of the impact of testing on teaching and learning. ERIC Document,2000.
[3]Genesee,F(xiàn). Classroom-based Evaluation in Second Language Education,Cambridge University Press,1996.
[4]Hancock,C. B.Alternative assessment and second language study:What?and why?ERIC Digest.1994.
[5]Huges,A. Kinds of test and testing. In A. Hugh,Testing for language teachers. Cambridge: Cambridge University Press,1989.9-21.
[6]Shabaan,K.Assessment of Young learners.Forum,2001,39(4):16-27.
[7]教育部高等教育司.大學(xué)英語課程教學(xué)要求.清華大學(xué)出版社,2007.
[8]全國大學(xué)英語四、六級(jí)考試委員會(huì).大學(xué)英語四級(jí)考試大綱.外語教學(xué)與研究出版社,2006.endprint