陳周云 遲秀湘 牛潔珍
摘 要: 現(xiàn)代教育信息技術(shù)應(yīng)用于語(yǔ)言測(cè)試和教學(xué)領(lǐng)域是大勢(shì)所趨,本文介紹了目前國(guó)外比較流行的八種寫(xiě)作測(cè)評(píng)工具。相比較而言,國(guó)內(nèi)對(duì)于寫(xiě)作在線測(cè)評(píng)工具的研究尚處于初始階段,主要體現(xiàn)在三個(gè)方面:理論介紹、模型構(gòu)建和實(shí)證研究。雖然這項(xiàng)技術(shù)具備很大優(yōu)勢(shì),但是在技術(shù)革新和實(shí)際應(yīng)用方面仍然面臨諸多挑戰(zhàn),急需更多的實(shí)證研究達(dá)到最佳應(yīng)用效果。
關(guān)鍵詞: 寫(xiě)作在線測(cè)評(píng)工具 信息技術(shù) 語(yǔ)言測(cè)試
一、引言
現(xiàn)代教育技術(shù)的發(fā)展與普及為語(yǔ)言教學(xué)和語(yǔ)言測(cè)試的發(fā)展帶來(lái)了契機(jī),寫(xiě)作在線測(cè)評(píng)工具不斷研制、開(kāi)發(fā)和應(yīng)用就是一個(gè)極好的例子。寫(xiě)作在線測(cè)評(píng)工具就是利用現(xiàn)代教育技術(shù)對(duì)語(yǔ)言學(xué)生的作文進(jìn)行在線判斷、評(píng)分并且給出及時(shí)反饋的計(jì)算機(jī)軟件系統(tǒng)。它以反饋、調(diào)控和改進(jìn)為目的,具有改善教學(xué)活動(dòng)、監(jiān)控寫(xiě)作過(guò)程的功能,能夠達(dá)到及時(shí)反饋、改進(jìn)、調(diào)控學(xué)生學(xué)習(xí)進(jìn)程的效果。作為衡量語(yǔ)言輸出能力的重要指標(biāo)——寫(xiě)的能力,無(wú)論是檢測(cè)還是平時(shí)訓(xùn)練,都需要客觀、公正的評(píng)閱者,給予及時(shí)、中肯的反饋,同時(shí)為學(xué)生提供不斷修正、改進(jìn)的機(jī)會(huì),敏銳地捕捉他們的點(diǎn)滴進(jìn)步,調(diào)動(dòng)他們的寫(xiě)作積極性。計(jì)算機(jī)技術(shù)和信息系統(tǒng)的日新月異為解決這一亙古難題帶來(lái)了希望,國(guó)內(nèi)外各個(gè)領(lǐng)域的專(zhuān)家學(xué)者們紛紛研制開(kāi)發(fā)寫(xiě)作在線評(píng)閱工具。這種寫(xiě)作在線評(píng)閱工具主要應(yīng)用于語(yǔ)言測(cè)試和語(yǔ)言教學(xué)領(lǐng)域,針對(duì)已經(jīng)輸入計(jì)算機(jī)內(nèi)部的學(xué)生作文文本進(jìn)行評(píng)閱,主要用在高風(fēng)險(xiǎn)考試中,作為人工評(píng)分的補(bǔ)充進(jìn)行實(shí)際評(píng)分;還可以用在語(yǔ)言教學(xué)中,對(duì)學(xué)生的寫(xiě)作能力進(jìn)行診斷、提供修改建議等。
二、國(guó)外寫(xiě)作測(cè)評(píng)工具綜述
該項(xiàng)技術(shù)的研究始于20世紀(jì)60年代的美國(guó),目前國(guó)外較為成熟的寫(xiě)作自動(dòng)測(cè)評(píng)工具主要包括:Project Essay Grade(PEG),Intelligent Essay Assessor(IEA),Electronic Essay Rater(E-rater),Criterion,IntelliMetric,Bayesian Essay Test Scoring System(BETSY),My Access!,以及Writing Roadmap2.0(WRM)系統(tǒng)等。
1.PEG
作為最早被開(kāi)發(fā)出來(lái)的寫(xiě)作自動(dòng)測(cè)評(píng)工具,PEG主要針對(duì)所輸入文本的一些容易量化的特征,如:長(zhǎng)度(包括文章、句子、甚至單詞的長(zhǎng)度)、標(biāo)點(diǎn)符號(hào)、語(yǔ)法等因素,利用統(tǒng)計(jì)中的多元回歸分析,給文章評(píng)分。盡管PEG在實(shí)際應(yīng)用中與人工評(píng)分有著很高的相關(guān)性,準(zhǔn)確率也很高,但是由于PEG的評(píng)分標(biāo)準(zhǔn)只是表層特征,忽視或者說(shuō)沒(méi)有辦法量化文章的本質(zhì)特征,如:內(nèi)容的相關(guān)性、組織體裁、作者的觀點(diǎn)態(tài)度、篇章結(jié)構(gòu)等,而且不能提出反饋,因此沒(méi)有得到教育界的認(rèn)可和接受。不管怎樣,PEG是利用計(jì)算機(jī)代替人工閱卷的首次嘗試,為后來(lái)的技術(shù)改進(jìn)奠定了基礎(chǔ)。
2.IEA
IEA的基本原理是潛在語(yǔ)義分析——LSA(latent semantic analysis)技術(shù)。潛在語(yǔ)義分析用于作文評(píng)分時(shí)有三個(gè)步驟:首先,要挑選出有代表性的作文范文樣本;其次,這些樣本被表示為潛在語(yǔ)義分析中使用的變量;最后,待評(píng)分作文在內(nèi)容和概念的相關(guān)性上與這些樣本進(jìn)行比較,從而取最類(lèi)似范文的平均分?jǐn)?shù)(韓寧,2009)。與PEG只關(guān)注文本的表面語(yǔ)言特征相比,IEA關(guān)注文本的整體內(nèi)容,同時(shí)包含對(duì)文本的寫(xiě)作技巧,如語(yǔ)法、標(biāo)點(diǎn)等的反饋,與人工評(píng)分的相關(guān)性也很高,具有更大的教育價(jià)值,是作文自動(dòng)評(píng)分系統(tǒng)的重大突破。由于該方法只能對(duì)作文內(nèi)容進(jìn)行評(píng)價(jià),而不顧作文的語(yǔ)言質(zhì)量,因此評(píng)分效度很難保證。而且其設(shè)計(jì)初衷是為評(píng)價(jià)本族語(yǔ)作文所用,如果用于評(píng)測(cè)外語(yǔ)學(xué)習(xí)者的作文,其信度和效度就很難取得令人滿意的效果。
3.E-rater
E-rater利用了多種技術(shù),如統(tǒng)計(jì)技術(shù)、矢量空間模型技術(shù)和人工智能中的自然語(yǔ)言處理技術(shù),因此,E-rater既能夠像PEG那樣評(píng)判作文的語(yǔ)言表層特征,又能夠像IEA那樣評(píng)判作文的內(nèi)容質(zhì)量。此外,E-rater還能夠?qū)ψ魑牡钠陆Y(jié)構(gòu)進(jìn)行分析。E-rater兼顧作文的內(nèi)容和語(yǔ)言形式,是一種混合的自動(dòng)評(píng)分系統(tǒng),與人工評(píng)分之間的一致性達(dá)到了最高點(diǎn)。然而,E-rater并非十全十美。其旨在分析語(yǔ)言質(zhì)量的句法多樣性分析模塊不能全面衡量語(yǔ)言質(zhì)量的其他方面,如詞法、語(yǔ)言的準(zhǔn)確性等,從而影響了評(píng)分信度。另外,其旨在分析內(nèi)容質(zhì)量的主題內(nèi)容,分析模塊所使用的信息檢索技術(shù),與IEA所使用的潛在語(yǔ)義分析相比,有點(diǎn)落伍,不能有效排除由于詞匯同義和歧義所產(chǎn)生的干擾信息。其帶有創(chuàng)新意義的篇章結(jié)構(gòu)分析模塊主要靠在文本中搜索話語(yǔ)標(biāo)記語(yǔ),像in conclusion、first of all等容易產(chǎn)生不良的反撥作用,致使考生認(rèn)為,只要多使用這些話語(yǔ)標(biāo)記語(yǔ)就可以得高分。(梁茂成,文秋芳,2007)
4.Criterion
作為一個(gè)基于互聯(lián)網(wǎng)的作文評(píng)分和評(píng)價(jià)服務(wù)系統(tǒng),Criterion不僅可以用于考試評(píng)分,還可以給出作文個(gè)性化的診斷性反饋。其技術(shù)核心是綜合了E-rater和另一個(gè)軟件系統(tǒng)Critique,前者提供評(píng)分,后者可以對(duì)作者寫(xiě)作能力提供診斷信息,包括語(yǔ)法、用詞及寫(xiě)作機(jī)制(比如大小寫(xiě)、標(biāo)點(diǎn)符號(hào))等多方面。Criterion的改進(jìn)主要體現(xiàn)在三個(gè)方面:能評(píng)判與分析事先訓(xùn)練過(guò)的作文題目、能夠給出所有題目(包括新提供的題目)的診斷反饋信息、可以適用于母語(yǔ)非英語(yǔ)的寫(xiě)作。雖然其反饋的類(lèi)型比較有限,但是Criterion在提供形成性反饋信息方面畢竟邁出了一大步,開(kāi)創(chuàng)了寫(xiě)作評(píng)價(jià)工具服務(wù)于教學(xué)的先河。
5.IntelliMetric
IntelliMetric是第一套基于人工智能技術(shù)開(kāi)發(fā)出的作文評(píng)分系統(tǒng),取代E-rater用來(lái)給GMAT作文評(píng)分。它能夠模仿人工評(píng)卷,對(duì)作文的內(nèi)容、形式、組織和寫(xiě)作習(xí)慣進(jìn)行評(píng)分,集中了人工智能、自然語(yǔ)言處理和統(tǒng)計(jì)技術(shù)的長(zhǎng)處,是一種能夠內(nèi)化專(zhuān)家級(jí)評(píng)卷員集體智慧的學(xué)習(xí)機(jī)。它開(kāi)發(fā)了能夠分析詞性和句法關(guān)系的自然語(yǔ)言處理技術(shù),依據(jù)英語(yǔ)標(biāo)準(zhǔn)書(shū)面語(yǔ)的主要特征,內(nèi)化作文中與某些特征相關(guān)的每一個(gè)得分點(diǎn)評(píng)判作文。IntelliMetric能夠評(píng)估作文中語(yǔ)義、句法、篇章3個(gè)層次的300多項(xiàng)特征。據(jù)稱(chēng)在性能方面能夠跟專(zhuān)家級(jí)評(píng)卷員給出的分?jǐn)?shù)一樣準(zhǔn)確。另外,IntelliMetric能夠評(píng)閱除了英語(yǔ)以外的其他多種語(yǔ)言的作文。
6.BETSY
BETSY以概率論為指導(dǎo),其核心原理是貝葉斯分析方法,基于訓(xùn)練語(yǔ)料對(duì)文本進(jìn)行分類(lèi)的程序。該系統(tǒng)使用了包括內(nèi)容與形式方面的一個(gè)大型特征集,根據(jù)優(yōu)、良、合格、不合格四個(gè)類(lèi)型尺度,把一篇作文劃分到一個(gè)最合適的集合中。其開(kāi)發(fā)者聲稱(chēng)這個(gè)程序集合了PEG、LSA、E-rater的優(yōu)點(diǎn)并且具有自己的特色。例如,能夠用于短文評(píng)測(cè),產(chǎn)生診斷性結(jié)果,可以非常方便地應(yīng)用于不同的學(xué)科專(zhuān)業(yè)范圍,并且其結(jié)果對(duì)非統(tǒng)計(jì)人員來(lái)說(shuō)通俗易懂,可免費(fèi)下載使用。
7.My Access!
My Access!主要為學(xué)生提供一個(gè)寫(xiě)作環(huán)境,能夠迅速形成結(jié)構(gòu)化的形成性反饋和診斷報(bào)告,學(xué)生可以根據(jù)這些結(jié)果修改自己的作文,改進(jìn)寫(xiě)作技巧。同時(shí)也為教師提供了一個(gè)基于網(wǎng)絡(luò)的輔導(dǎo)環(huán)境,可以選擇多種的報(bào)告格式,瀏覽學(xué)生的歷史記錄,分析學(xué)生的錯(cuò)誤,把學(xué)生按水平分組,等等。My Access!還被大規(guī)模地應(yīng)用于課堂教學(xué)。大部分研究表明教師和學(xué)生對(duì)My Access!的使用持積極肯定態(tài)度,使用后學(xué)生成績(jī)也有明顯提高。教師對(duì)系統(tǒng)的積極態(tài)度和正確使用及對(duì)學(xué)生的正面引導(dǎo),系統(tǒng)評(píng)價(jià)、教師評(píng)價(jià)、同行互評(píng)等相結(jié)合是最佳使用方法。
8.WRM2.0
WRM2.0是美國(guó)McGraw-Hill公司設(shè)計(jì)的寫(xiě)作在線形成性評(píng)價(jià)工具。該系統(tǒng)可以針對(duì)作文的語(yǔ)言形式(如拼寫(xiě)、詞匯、語(yǔ)法結(jié)構(gòu)等)和語(yǔ)篇的內(nèi)容及組織結(jié)構(gòu)等提供多種形式的電子評(píng)語(yǔ)反饋信息,同時(shí)還具備教師調(diào)整評(píng)分功能,便于教師提供更加準(zhǔn)確、客觀、全面的評(píng)語(yǔ)和修改建議。該系統(tǒng)除了提供一個(gè)綜合評(píng)分以外,還可以根據(jù)六個(gè)維度(思想和內(nèi)容、組織機(jī)構(gòu)、體裁、詞匯運(yùn)用、流暢度、拼寫(xiě)及語(yǔ)法正確率等)給出分項(xiàng)分值,并且根據(jù)這六個(gè)維度和作文的篇章結(jié)構(gòu)給予評(píng)語(yǔ)反饋與修改建議。關(guān)于WRM的實(shí)證研究主要集中于美國(guó)的弗吉尼亞州,研究結(jié)果表明,使用WRM2.0的學(xué)生在州統(tǒng)考中成績(jī)明顯高于沒(méi)有使用的學(xué)生。WRM2.0已經(jīng)被國(guó)內(nèi)引進(jìn),一些關(guān)于該工具的應(yīng)用文獻(xiàn),將在下文進(jìn)一步闡述。
三、國(guó)內(nèi)研究現(xiàn)狀
國(guó)內(nèi)的一些專(zhuān)家和學(xué)者比較關(guān)注現(xiàn)代信息技術(shù)在語(yǔ)言教學(xué)中的應(yīng)用。然而,關(guān)于寫(xiě)作在線測(cè)評(píng)工具在語(yǔ)言教學(xué)和測(cè)試中的研究尚屬于初始階段,主要集中于三個(gè)方面:理論介紹、模型構(gòu)建和實(shí)證研究。
1.理論介紹
國(guó)內(nèi)對(duì)寫(xiě)作在線評(píng)價(jià)工具的興趣主要始于本世紀(jì)初,集中在對(duì)國(guó)外寫(xiě)作自動(dòng)評(píng)價(jià)系統(tǒng)的原理和特點(diǎn)的介紹。梁茂成、文秋芳(2007)評(píng)價(jià)和比較了國(guó)外具有代表性的三種作文自動(dòng)評(píng)分系統(tǒng):PEG、IEA、E-rater,指出這些評(píng)分系統(tǒng)在訓(xùn)練及作文的人工評(píng)分方法和機(jī)器評(píng)分效度等方面存在的問(wèn)題,并分析了這些作文自動(dòng)評(píng)分系統(tǒng)為我國(guó)自主開(kāi)發(fā)作文自動(dòng)評(píng)分系統(tǒng)所提供的借鑒作用。葛詩(shī)利、陳瀟瀟(2007)討論了國(guó)外的寫(xiě)作自動(dòng)評(píng)價(jià)工具在二語(yǔ)寫(xiě)作評(píng)分方面的表現(xiàn),分析了自動(dòng)作文評(píng)分技術(shù)在英語(yǔ)作為外語(yǔ)寫(xiě)作領(lǐng)域的發(fā)展及針對(duì)中國(guó)英語(yǔ)學(xué)習(xí)者作文自動(dòng)評(píng)分的研究,并且提出適合中國(guó)國(guó)情的研究方向及可能應(yīng)用的方法。陳瀟瀟、葛詩(shī)利(2008)介紹了國(guó)外比較有影響力的六種寫(xiě)作自動(dòng)評(píng)價(jià)工具,分析了國(guó)內(nèi)市場(chǎng)對(duì)寫(xiě)作自動(dòng)評(píng)價(jià)工具的需求,介紹了國(guó)內(nèi)對(duì)寫(xiě)作自動(dòng)評(píng)價(jià)工具的開(kāi)發(fā)研究,指出了英語(yǔ)作為外語(yǔ)的作文自動(dòng)評(píng)價(jià)工具研究的發(fā)展與不足之處。韓寧(2009)具體介紹了目前美國(guó)較流行的用于大規(guī)??荚囋u(píng)分和英語(yǔ)教學(xué)中的七個(gè)寫(xiě)作自動(dòng)評(píng)分系統(tǒng),詳細(xì)地闡明了各自的工作原理和特點(diǎn),同時(shí)也指出了今后的主要研究方向,尤其是在國(guó)內(nèi)引入這些評(píng)價(jià)系統(tǒng)時(shí)需要改進(jìn)的地方。
2.模型構(gòu)建
國(guó)內(nèi)最早設(shè)計(jì)符合中國(guó)學(xué)生英語(yǔ)作文自動(dòng)評(píng)價(jià)工具模型構(gòu)建的應(yīng)該是梁茂成(2005)。他的建模方法兼顧了PEG和IEA的長(zhǎng)處,設(shè)立訓(xùn)練集和驗(yàn)證集,在訓(xùn)練集的基礎(chǔ)上得到評(píng)分模型,用驗(yàn)證集交叉驗(yàn)證模型的可信度,進(jìn)而采用雙重交叉驗(yàn)證。他的模型是在訓(xùn)練集中提取大量的作文淺層文本特征,連同作文的內(nèi)容作為自變量,人工評(píng)分作為因變量一起用于多元回歸計(jì)算,得到作文評(píng)分的回歸方程。提取待評(píng)分作文的相關(guān)特征值,代入回歸方程即可得到該作文的得分。其模型的評(píng)分準(zhǔn)確率很高,但是由于樣本數(shù)量過(guò)小,作為自變量的淺層文本特征,還需要進(jìn)一步研究。在此基礎(chǔ)上,梁茂成(2011)研制了大規(guī)模英語(yǔ)考試作文評(píng)分系統(tǒng),基于人工評(píng)判的大量中國(guó)大學(xué)生作文語(yǔ)料庫(kù)建立模型,從語(yǔ)言、內(nèi)容和組織結(jié)構(gòu)三方面對(duì)作文進(jìn)行評(píng)價(jià),為開(kāi)發(fā)適合中國(guó)學(xué)生練習(xí)和評(píng)價(jià)的寫(xiě)作自評(píng)系統(tǒng)做出了很大的努力。
3.實(shí)證研究
國(guó)內(nèi)的實(shí)證研究主要集中使用技術(shù)相對(duì)比較成熟的WRM2.0。王淑雯(2011)結(jié)合教學(xué)實(shí)例,強(qiáng)調(diào)WRM2.0系統(tǒng)所能夠提供的及時(shí)、全面的多元化反饋有助于提高學(xué)生的語(yǔ)言正確率和寫(xiě)作水平。該項(xiàng)實(shí)驗(yàn)為期三個(gè)月,對(duì)系統(tǒng)使用情況采用問(wèn)卷調(diào)查、訪談和總結(jié),結(jié)果顯示,所有教師對(duì)系統(tǒng)采取積極態(tài)度,絕大部分學(xué)生認(rèn)為系統(tǒng)有助于提高他們的寫(xiě)作水平。由于該研究主要采用定性形式,缺乏定量數(shù)據(jù),沒(méi)有客觀的前測(cè)、后測(cè)成績(jī)比對(duì)及實(shí)驗(yàn)組和對(duì)照組成績(jī)比對(duì),而且使用周期太短,因此,其有效性還有待于進(jìn)一步考查。周穎(2011)的實(shí)驗(yàn)對(duì)象為某高校英語(yǔ)專(zhuān)業(yè)二年級(jí)學(xué)生,使用周期為一年,收集了以紙質(zhì)調(diào)查問(wèn)卷、訪談及實(shí)驗(yàn)組和對(duì)照組期末考試成績(jī)作為前測(cè)和后測(cè)成績(jī)等數(shù)據(jù),運(yùn)用SPSS 16.0對(duì)回收問(wèn)卷進(jìn)行常規(guī)數(shù)理統(tǒng)計(jì)。研究結(jié)果顯示:學(xué)生對(duì)在線形成性評(píng)價(jià)工具持肯定態(tài)度,實(shí)驗(yàn)組成績(jī)比對(duì)照組有顯著提高。文章還具體分析在線形成性評(píng)價(jià)工具在學(xué)生英語(yǔ)寫(xiě)作應(yīng)用過(guò)程中遇到的情況,進(jìn)而提出相應(yīng)的對(duì)策,為利用寫(xiě)作在線測(cè)評(píng)工具進(jìn)行教學(xué)提供新思路。蔣學(xué)清、蔡靜等(2011)以某高校非英語(yǔ)專(zhuān)業(yè)的二年級(jí)學(xué)生為研究對(duì)象,研究方法包括問(wèn)卷調(diào)查、訪談和實(shí)驗(yàn)前、后英語(yǔ)寫(xiě)作成績(jī)的統(tǒng)計(jì)學(xué)分析,研究時(shí)間是一學(xué)期。研究結(jié)果發(fā)現(xiàn),實(shí)驗(yàn)組和對(duì)照組的英語(yǔ)寫(xiě)作水平都有了明顯的進(jìn)步,但實(shí)驗(yàn)組的進(jìn)步幅度更大。這說(shuō)明寫(xiě)作在線測(cè)評(píng)工具所提供的形成性評(píng)價(jià)方式和自動(dòng)反饋功能對(duì)非母語(yǔ)英語(yǔ)學(xué)習(xí)者的寫(xiě)作能力可以發(fā)揮積極的作用。該研究還發(fā)現(xiàn),與對(duì)照組相比,實(shí)驗(yàn)組在作文結(jié)構(gòu)、語(yǔ)法、單詞拼寫(xiě)和標(biāo)點(diǎn)運(yùn)用方面有顯著提高,但在思想內(nèi)容、語(yǔ)體、選詞和句式變化方面的優(yōu)勢(shì)則并不顯著,并且分析了原因,包括學(xué)生方面和系統(tǒng)本身的不完善。遲秀湘(2013)的實(shí)驗(yàn)對(duì)象為某高校非英語(yǔ)專(zhuān)業(yè)二年級(jí)學(xué)生,使用周期為十周,收集的定性和定量數(shù)據(jù)包括實(shí)驗(yàn)組和對(duì)照組的前測(cè)、后測(cè)成績(jī)以及調(diào)查問(wèn)卷和訪談結(jié)果等。實(shí)驗(yàn)結(jié)果表明:參與實(shí)驗(yàn)的老師和學(xué)生普遍采取積極態(tài)度,學(xué)生成績(jī)顯著提高。但是也有個(gè)別學(xué)生持保留態(tài)度,影響他們態(tài)度和成績(jī)的因素有待進(jìn)一步研究。
四、關(guān)于寫(xiě)作在線測(cè)評(píng)工具應(yīng)用問(wèn)題反思
寫(xiě)作在線測(cè)評(píng)工具在國(guó)內(nèi)有著很大的潛在市場(chǎng)。在語(yǔ)言測(cè)試方面,除了漢語(yǔ)作文以外,作為主要外語(yǔ)的英語(yǔ)作文(這是本文及本項(xiàng)目主要關(guān)注的方向)出現(xiàn)在各種級(jí)別的語(yǔ)言測(cè)試中,包括中考、高考、大學(xué)生英語(yǔ)四、六級(jí)考試、專(zhuān)業(yè)英語(yǔ)四、八級(jí)、PETS、研究生入學(xué)考試等,閱卷工作量繁重,閱卷人員的信度也頗有爭(zhēng)議,急需客觀、公正、信度和效度較高的寫(xiě)作測(cè)評(píng)工具。在語(yǔ)言教學(xué)方面,良好的自動(dòng)閱卷工具會(huì)對(duì)教學(xué)產(chǎn)生積極正面的反撥效應(yīng)。而且,如果在線測(cè)評(píng)工具能夠根據(jù)作文的不同維度,提供形成性及時(shí)反饋診斷報(bào)告,則有助于學(xué)生對(duì)寫(xiě)作產(chǎn)生積極的態(tài)度,提高寫(xiě)作水平,而且能夠減少教師作文批改量,減輕教師負(fù)擔(dān),為教、學(xué)雙方帶來(lái)切實(shí)的好處。具體的優(yōu)勢(shì)體現(xiàn)在以下幾個(gè)方面。
1.反饋的多元性
系統(tǒng)能夠及時(shí)地提供電子反饋和教師可以參與的人工反饋;分?jǐn)?shù)反饋與診斷性評(píng)語(yǔ)反饋相結(jié)合;針對(duì)作文語(yǔ)言形式和語(yǔ)篇內(nèi)容結(jié)構(gòu)的反饋相結(jié)合;形成性反饋和終結(jié)性反饋相結(jié)合等多元反饋形式。
2.學(xué)生自主性和個(gè)性化
系統(tǒng)體現(xiàn)了“以學(xué)生為中心”的素質(zhì)教育理念,學(xué)生可以自主安排寫(xiě)作時(shí)間和地點(diǎn),自主選擇符合其水平和認(rèn)知風(fēng)格的寫(xiě)作任務(wù);可以無(wú)限次地提交作文—獲得反饋—再修改—再提交,形成良性循環(huán),完成寫(xiě)作任務(wù)。
3.形成性
系統(tǒng)能夠自動(dòng)記錄學(xué)生的歷次寫(xiě)作情況,對(duì)寫(xiě)作過(guò)程中的思維、行為、策略等進(jìn)行全面反饋并記錄,創(chuàng)建個(gè)人寫(xiě)作檔案,有助于教師隨時(shí)了解、監(jiān)控學(xué)生全體或個(gè)體的寫(xiě)作進(jìn)展,也有助于學(xué)生了解自己的學(xué)習(xí)情況及和同學(xué)之間的差距,反思寫(xiě)作中存在的問(wèn)題。
4.交互性
系統(tǒng)不僅可以實(shí)現(xiàn)學(xué)生、教師與機(jī)器的互動(dòng),還可以實(shí)現(xiàn)學(xué)生之間的同行互評(píng)、教師與學(xué)生的多方位互動(dòng)。教師不僅可以通過(guò)系統(tǒng)給學(xué)生布置寫(xiě)作任務(wù),還可以通過(guò)系統(tǒng)對(duì)電子分?jǐn)?shù)和反饋進(jìn)行人工干預(yù)和修改。
5.激發(fā)學(xué)習(xí)動(dòng)機(jī)
系統(tǒng)所提供的及時(shí)評(píng)分能夠有效彌補(bǔ)人工評(píng)分的滯后性,大大激發(fā)學(xué)生的學(xué)習(xí)動(dòng)機(jī)。同時(shí)診斷性反饋評(píng)語(yǔ)為學(xué)生及時(shí)修改作文給予提示,修改過(guò)后在分?jǐn)?shù)上立竿見(jiàn)影的體現(xiàn),會(huì)給學(xué)生帶來(lái)欣喜與成就感,大大調(diào)動(dòng)學(xué)生寫(xiě)作的積極性和主動(dòng)性。
然而,寫(xiě)作在線測(cè)評(píng)工具畢竟是信息技術(shù)的產(chǎn)物,其開(kāi)發(fā)、研制和改進(jìn)需要最先進(jìn)的技術(shù)為支撐,需要既了解信息技術(shù),又懂得語(yǔ)言教學(xué)、測(cè)試規(guī)律的復(fù)合型人才,不斷更新的信息技術(shù)是提高系統(tǒng)的效度和信度的關(guān)鍵。另外,寫(xiě)作在線測(cè)評(píng)工具在語(yǔ)言教學(xué)過(guò)程中的使用離不開(kāi)教師和學(xué)生,他們對(duì)系統(tǒng)的態(tài)度、對(duì)系統(tǒng)的掌握熟練程度、對(duì)系統(tǒng)的使用方法都會(huì)在很大程度上影響系統(tǒng)的實(shí)際應(yīng)用效果。因此,只有當(dāng)教師創(chuàng)造性地把軟件技術(shù)有機(jī)地融入教學(xué)中,引導(dǎo)學(xué)生合理有效地利用系統(tǒng),才能取得最佳效果。
現(xiàn)代信息技術(shù)進(jìn)入外語(yǔ)教學(xué)與測(cè)試領(lǐng)域是今后的發(fā)展方向,大勢(shì)所趨。雖然目前尚有需要完善的地方,但是我們要接受并且掌握它,在使用過(guò)程中探索它的潛能和局限性,為以后的完善改進(jìn)提出建議。站在這項(xiàng)改革浪潮上的外語(yǔ)教學(xué)一線教師應(yīng)該順勢(shì)而為、勇挑重?fù)?dān),掌握應(yīng)用最新的系統(tǒng)技術(shù),開(kāi)展全方位的實(shí)證研究,讓技術(shù)真正地服務(wù)于教學(xué)。
參考文獻(xiàn):
[1]陳瀟瀟,葛詩(shī)利.自動(dòng)作文評(píng)分研究綜述[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2008,31(5):79-83.
[2]葛詩(shī)利,陳瀟瀟.中國(guó)學(xué)習(xí)者自動(dòng)作文評(píng)分探索[J].外語(yǔ)界,2007,122(5):43-50.
[3]韓寧.幾個(gè)英語(yǔ)作文自動(dòng)評(píng)分系統(tǒng)的原理與評(píng)述[J].中國(guó)考試,2009,203(3):38-44.
[4]梁茂成,文秋芳.國(guó)外作文自動(dòng)評(píng)分系統(tǒng)評(píng)述及啟示[J].外語(yǔ)電化教學(xué),2007,217(5):18-24.
[5]梁茂成.大規(guī)??荚囉⒄Z(yǔ)作文自動(dòng)評(píng)分系統(tǒng)的研制[M].北京:高等教育出版社,2011.
[6]周穎.在線形成性評(píng)價(jià)工具在英語(yǔ)寫(xiě)作中的應(yīng)用——困難及對(duì)策探究[J].現(xiàn)代教育技術(shù),2011,21(9):88-93.
[7]梁茂成.中國(guó)學(xué)生英語(yǔ)作文自動(dòng)評(píng)分模型的構(gòu)建[D].南京:南京大學(xué)博士論文,2005.
[8]王淑雯.如何利用Writing Roadmap 2.0進(jìn)行在線英語(yǔ)寫(xiě)作反饋[J].現(xiàn)代教育技術(shù),2011,21(3):76-81.
[9]蔣學(xué)清,蔡靜,唐錦蘭.探析自動(dòng)作文評(píng)價(jià)系統(tǒng)對(duì)大學(xué)生英語(yǔ)寫(xiě)作能力發(fā)展的影響[J].山東外語(yǔ)教學(xué),2011,145(6):36-43.
[10]遲秀湘.探究在線形成性評(píng)價(jià)工具對(duì)學(xué)生英語(yǔ)寫(xiě)作能力的影響[J].海外英語(yǔ),2013,228(5):10-12.
基金項(xiàng)目:本研究得到北京市教育科學(xué)“十二五”規(guī)劃課題“在線形成性評(píng)價(jià)工具在英語(yǔ)寫(xiě)作中的應(yīng)用研究”(項(xiàng)目編號(hào):DDB12703)的資助。