趙 波
(河南師范大學(xué),河南 新鄉(xiāng) 453007)
語料庫技術(shù)驅(qū)動下的大學(xué)英語教材評價分析
——《21世紀(jì)大學(xué)英語讀寫教程》分析
趙 波
(河南師范大學(xué),河南 新鄉(xiāng) 453007)
教材設(shè)計的科學(xué)性是影響大學(xué)英語教學(xué)質(zhì)量的重要因素,對教材的科學(xué)評定有助于教材的改進(jìn)以及教師教學(xué)策略的調(diào)整。本文作者利用語料庫技術(shù),從詞匯層面對《21世紀(jì)大學(xué)英語讀寫教程》(全4冊)進(jìn)行了多維度分析,觀測了包括用詞多樣性、和《大學(xué)英語四級考試大綱》要求的呼應(yīng)程度、對學(xué)生自學(xué)能力培養(yǎng)的關(guān)注度、題材多樣性等多種要素,發(fā)現(xiàn)了問題并提出了建設(shè)性的應(yīng)對策略。
語料庫技術(shù);大學(xué)英語;教材評價
大學(xué)英語教學(xué)改革是當(dāng)下高等教育領(lǐng)域中一個備受關(guān)注的話題,針對教學(xué)方法、教學(xué)理念、課程設(shè)置等方面的研究和論述已產(chǎn)生出豐碩的成果。然而,針對大學(xué)英語教材的評價分析尚不多見。此外,由于評價一套教材的優(yōu)劣有很多方法和尺度,考察的要素可以包括文章題材、用詞多樣性、文體風(fēng)格等等,目前為止的針對課本科學(xué)性的分析大多建立在定性研究的基礎(chǔ)之上,主要依托評判者的知識體系和主觀感受來完成,缺乏穩(wěn)定的可操作性。
考慮到從1985年國家出臺《大學(xué)英語教學(xué)大綱》開始就明確了:“大學(xué)英語基礎(chǔ)階段的教學(xué)必須把重點放在語言基礎(chǔ)上”。1999年《大學(xué)英語教學(xué)大綱(修訂本)》再次指出大學(xué)英語教學(xué)目標(biāo)是:“幫助學(xué)生打下扎實的語言基礎(chǔ)。”2004/2007年《大學(xué)英語課程教學(xué)要求》提出的“大學(xué)英語的教學(xué)目標(biāo)是培養(yǎng)學(xué)生的綜合應(yīng)用能力,特別是聽說能力”實際上還是在打語言基礎(chǔ),作者認(rèn)為一套教材的重點應(yīng)放在學(xué)生語言基礎(chǔ)的培養(yǎng)上,而詞匯則是語言基礎(chǔ)中的基礎(chǔ),因此一套教材的科學(xué)性在很大程度上依賴于其詞匯構(gòu)成的科學(xué)性。
本文將研究的目光聚焦于《21世紀(jì)大學(xué)英語讀寫教程》(復(fù)旦大學(xué)出版社出版,是現(xiàn)行較為常見的教材之一,以下簡稱《教材》)的詞匯構(gòu)成。借助語料庫檢索軟件的詞表、類符形符統(tǒng)計、一致性分析等功能,分析該教材的用詞多樣性、和四級大綱詞匯要求的呼應(yīng)程度、對學(xué)生自學(xué)能力培養(yǎng)的關(guān)注度、題材多樣性等多種要素——從這些緯度來標(biāo)注一套教材的科學(xué)性。
所謂的類符(type)指的是每一個在語料庫中首次單獨出現(xiàn)的詞形,類符數(shù)可以告訴我們文本一共有多少不同的詞形;而形符(token)則是同一個詞在語料庫中出現(xiàn)的次數(shù),形符數(shù)則標(biāo)明了文本一共有多少詞。例如:在下面這句話中He sells newspapers every day, and she sold 500 newspapers yesterday, sells和sold就是sell這一類符所對應(yīng)的兩個形符。在詞頻統(tǒng)計中單純的形符和類符數(shù)是沒有什么意義的,其意義主要體現(xiàn)在標(biāo)準(zhǔn)化的類符形符比中。
人們一般認(rèn)為,在一個語料庫或是文本中,類符與形符的比值越大,就說明該語料庫或者說文本的詞語使用更好地體現(xiàn)了多樣性。然而,英語的詞匯量是一定的,特定語料庫中類符的增加不可能與形符增加的幅度保持一致,所以當(dāng)語料庫容量達(dá)到一定程度后,類符數(shù)增加的幅度越來越小,類符形符比也會越來越小,以至于最終無法反應(yīng)出語料庫用詞的多樣性。標(biāo)準(zhǔn)化處理后的這一比值則可以更科學(xué)地說明問題。具體做法是:將一個語料庫按照特定形符數(shù)分割成若干個文本,計算出每一個文本的類符形符比,然后求出其平均值。
詞匯密度是用于描述一套教材用詞豐富程度的重要標(biāo)準(zhǔn)。一般認(rèn)為,一個文本或是一套教材的詞匯密度越高,該文本可讀性越強,語言變化也會越復(fù)雜,進(jìn)而,語言學(xué)習(xí)者最容易感到難以駕馭的詞素知識出現(xiàn)幾率就會越高,如果教材能夠?qū)@些知識提供科學(xué)的講解和完善的練習(xí),那么,這套教材對于學(xué)習(xí)者來說就是好教材。Nation(2000)提出了“詞匯密度=類符數(shù)/形符數(shù)”,不過,考慮到在對不同詞容量的語料庫進(jìn)行比較分析時數(shù)據(jù)的可比性,本研究將詞匯密度=標(biāo)準(zhǔn)類符形符比。
所謂的釋義詞匯指的是詞典編纂者在詮釋詞條時所采用的一組詞匯。詞典編纂者需要用這些基于頻率計算的被嚴(yán)格挑選的詞匯解釋詞典中所有的詞條。不同的詞典編纂中確定的釋義詞匯詞表是不一致的,目前最具代表性的是《朗文當(dāng)代英語詞典》編纂過程中所使用的釋義詞匯,包括2226個單詞,10個前綴和39個后綴。由于這些釋義詞匯構(gòu)成了詞典釋義的基礎(chǔ),學(xué)習(xí)者要想能準(zhǔn)確全面地使用詞典就必須首先完全準(zhǔn)確地理解這些釋義詞匯。或者我們可以這樣說,作為大學(xué)英語學(xué)習(xí)者重要信息來源的教材,如果不能有效地涉及這些詞匯,幫助學(xué)習(xí)者了解和正確使用這些詞匯,那么,從培養(yǎng)學(xué)習(xí)者學(xué)習(xí)能力的角度來講,這套教材的科學(xué)性就值得考究了。
LOB語料庫的全稱是 Lancaster-Oslo-Bergen 語料庫,20世紀(jì) 80年代由蘭開斯特大學(xué)、奧斯陸大學(xué)以及挪威人文計算中心聯(lián)合編訂。本文之所以選擇LOB語料庫作為參照詞庫,主要因為其設(shè)計的科學(xué)性、收錄文本的規(guī)范性。該語料庫包括500個文本,每個文本2000字,涉及15個文本領(lǐng)域,包括:新聞報道、社論、綜述、宗教、技藝、貿(mào)易、興趣愛好、傳說、純文學(xué)、傳記、隨筆、文件、報告、學(xué)術(shù)及科技文章、普通小說、懸疑偵破小說、科幻小說、探險小說、游記、浪漫愛情故事、幽默等,體現(xiàn)了文本的多樣性、全面性;所有文章都在英國本土出版,由英國作家完成,保證了文本語言的規(guī)范性,避免了諸如美式英語等不同風(fēng)格的干擾,非常適合作為衡量教材的標(biāo)尺來使用
將《21世紀(jì)大學(xué)英語讀寫教程》(全四冊)建庫分析后,得到的統(tǒng)計數(shù)據(jù)為:形符數(shù)1-4冊分別為:22,456、26,246、26,130、33,586;類符數(shù) 1-4冊分別為:3,890、4,368、4,612、5,300;標(biāo)準(zhǔn)類符形符比1-4冊分別為: 54.93、52.00、50.84、52.80。從統(tǒng)計情況來看,從第一到第四冊的教材中,形符數(shù)發(fā)生了明顯變化,類符數(shù)與總句數(shù)雖出現(xiàn)變化,但幅度不大,其他各項監(jiān)測指標(biāo)基本無差別。尤其在觀察了標(biāo)準(zhǔn)類符形符比后,作者發(fā)現(xiàn),四冊教材的詞匯密度驚人的相似,換言之,這四套教材的用詞多樣性、詞語結(jié)構(gòu)的復(fù)雜程度趨同。根據(jù)Krashen的語言輸入假設(shè)理論,學(xué)習(xí)者在學(xué)習(xí)過程中所接觸的語言材料應(yīng)該略高于其已有水平,用公式表述為:i+1。這里的i指的就是學(xué)習(xí)者已有的水平,“1”就是略高于“i”水平的知識添加。基于這一理論,作者認(rèn)為,教材的編寫理應(yīng)秉承詞匯多樣性逐級遞增的模式,而這一點,在本套教材的四冊分布中并未很好地體現(xiàn)出來。
此外,作者還觀察了前一冊出現(xiàn)過的詞類是否在后一冊中得到了有效的體現(xiàn)和覆蓋(畢竟教材本身不光要肩負(fù)介紹新知識的使命,也要肩負(fù)幫助學(xué)習(xí)者溫習(xí)舊知識的責(zé)任),統(tǒng)計數(shù)據(jù)如下:只現(xiàn)于1冊、未現(xiàn)于2冊類符數(shù)1858,只現(xiàn)于2冊、未現(xiàn)于1冊類符數(shù)2335,1冊類符消亡率52.24%(1冊類符消亡率=(1冊類符數(shù)-只現(xiàn)于1冊、未現(xiàn)于2冊類符數(shù))/1冊類符數(shù)),2冊類符新生率53.46%(2冊類符新生率=只現(xiàn)于2冊、未現(xiàn)于1冊形符數(shù)/2冊類符數(shù))。從這個統(tǒng)計不難發(fā)現(xiàn),2冊較之1冊的類符重溫情況并不好,1冊中幾乎半數(shù)的類符在 2冊中得不到體現(xiàn),換言之,2冊較之1冊的最顯著變化在于具有新詞義的詞條的增加。
為了考察相鄰兩套教材的接續(xù)性,本文作者進(jìn)一步統(tǒng)計了共現(xiàn)于1、2冊教材的詞類的出現(xiàn)頻率,統(tǒng)計結(jié)果為:盡管第1冊中的詞類有47.76%被保留下來,然而這些被保留下來的詞類能夠在第2冊中保持出現(xiàn)10次以上的僅占共現(xiàn)于1、2冊詞類總數(shù)的16.54%,換言之,只有共現(xiàn)于1、2冊詞類總數(shù)的16.54%的詞類可以在第2冊教材中每單元平均出現(xiàn) 1次,按照現(xiàn)在比較普遍的課時安排來考量,相當(dāng)于1.5周出現(xiàn)一次;只有共現(xiàn)于1、2冊詞類總數(shù)的16.58%的詞類可以在第2冊教材中每2單元平均出現(xiàn) 1次,按照現(xiàn)在比較普遍的課時安排來考量,相當(dāng)于3周出現(xiàn)一次;而占到共現(xiàn)于1、2冊詞類總數(shù)的66.88%的詞類出現(xiàn)次數(shù)小于5次,其中出現(xiàn)次數(shù)為1次的詞類占共現(xiàn)于1、2冊詞類總數(shù)的28.99%,按照現(xiàn)在比較普遍的課時安排來考量,相當(dāng)于4--16周出現(xiàn)一次。這么低的 2冊重現(xiàn)率也是非常不利于學(xué)習(xí)者依托教材的溫故學(xué)習(xí)效果的。
利用同樣的方法,作者分析了2冊與3冊、3冊與4冊教材之間的詞類更新及溫故狀況,總的來說,(1)四冊教材保持了基本恒定的標(biāo)準(zhǔn)類符形符比(及詞匯密度),對于學(xué)習(xí)者來講可能沒有突兀的用詞多樣性變化,易于接受,但缺乏明確的遞進(jìn)性,不利于學(xué)習(xí)者在用詞多樣性上循序漸進(jìn)的提高;(2)四冊教材保持了相當(dāng)一致的更新率,雖然2—3冊的形符、類符增加都不明顯,但當(dāng)深入到具體詞條的更替分析時,作者發(fā)現(xiàn),1—4冊逐級上升的替代率或者說去“舊”(前一冊教材中提到的一些詞條)補“新”(后一冊教材中較之前一側(cè)增加的詞條)率基本恒定在50%左右,單就擴大學(xué)習(xí)者詞匯接觸面的角度來衡量,這套教材的效率是很高的;(3)在對相鄰冊的教材進(jìn)行比對后,作者發(fā)現(xiàn)即便之前一冊教材中涉及的詞類或詞條在隨后冊的教材中出現(xiàn),出現(xiàn)的頻率卻比較低,不利于依托教材溫故知識的同學(xué)對之前知識實現(xiàn)有效的鞏固和提高。
這一部分的分析,主要是將朗文釋義詞匯做成詞表(朗文出版社在釋義詞匯中包括了 2226個單詞,10個前綴,39個后綴;在本研究的朗文釋義詞匯詞表中,不包括 49個詞綴),《21世紀(jì)大學(xué)英語讀寫教程》詞匯做成詞表,然后進(jìn)行比對:考察《教材》對于基本釋義詞匯的涵蓋情況。
具體統(tǒng)計情況如下:《教材》中未體現(xiàn)的釋義詞匯384個,占釋義詞匯總量比重為17.25%;《教材》中體現(xiàn)且涉共四冊教材的釋義詞匯753個,占釋義詞匯總量比重為 33.83%;《教材》中體現(xiàn)且涉及共三冊教材的釋義詞匯384個,占釋義詞匯總量比重為17.25%;《教材》中體現(xiàn)且涉及共二冊教材的釋義詞匯355個,占釋義詞匯總量比重為 15.95%;《教材》中體現(xiàn)且涉及共一冊教材的釋義詞匯350個,占釋義詞匯總量比重為15.72%。數(shù)據(jù)表明,朗文釋義詞匯并未全面地被《教材》涵蓋,六分之一的釋義詞匯在教材中未被涉及,在全部四冊中得以體現(xiàn)的只有三分之一。雖然這種狀況的出現(xiàn)并不能就說明《教材》語料的選擇不科學(xué),但至少說明,這套教材就培養(yǎng)學(xué)習(xí)者學(xué)習(xí)的能力方面,做得不夠好。
之所以選定《CET4考試大綱》(以下簡稱《大綱》)詞匯表作為參照詞表,主要是考慮到4級水平是大學(xué)英語在完成兩年的教學(xué)任務(wù)后期待學(xué)生達(dá)到的水平。這一部分的分析,主要是將《大綱》詞匯做成詞表(共涉及詞條 4604個),《21世紀(jì)大學(xué)英語讀寫教程》詞匯做成詞表,然后進(jìn)行比對:考察《教材》對于基本釋義詞匯的涵蓋情況。
具體統(tǒng)計情況是:《教材》中未體現(xiàn)的《大綱》詞匯1252個,占《大綱》詞匯總量比重為27.19%;《教材》中體現(xiàn)且涉共四冊教材的《大綱》詞匯925個,占《大綱》詞匯總量比重為20.09%。簡而言之,《21世紀(jì)大學(xué)英語讀寫教程》(1-4冊)在對大綱原則的貫徹上存在問題,25.02%的未被涉及率則可能導(dǎo)致學(xué)生依托這套教材的學(xué)習(xí)很難保證達(dá)到國家規(guī)定的《大學(xué)英語四級》詞匯標(biāo)準(zhǔn)。
這一部分的研究則是要利用 WordSmith Tools中的Keywords(關(guān)鍵詞)功能,在比對《21世紀(jì)大學(xué)英語教程》詞表和LOB語料庫詞表后,觀察《21世紀(jì)大學(xué)英語教程》的關(guān)鍵詞分布特征,進(jìn)而通過這些關(guān)鍵詞判斷《教材》文章主題選擇上的特點。比照后,關(guān)鍵詞列表如表1:
表1 參照LOB語料庫后生成的《21世紀(jì)大學(xué)英語教程》的關(guān)鍵詞統(tǒng)計信息
通過對這些具有較大關(guān)鍵性的詞條加以觀察和分析后,作者發(fā)現(xiàn),這些詞條大多關(guān)聯(lián)的話題是日常生活、學(xué)校生活、人物描述。與LOB語料庫涉及15個文本領(lǐng)域(包括:新聞報道、社論、綜述、宗教、技藝、貿(mào)易、興趣愛好、傳說、純文學(xué)、傳記、隨筆、文件、報告、學(xué)術(shù)及科技文章、普通小說、懸疑偵破小說、科幻小說、探險小說、游記、浪漫愛情故事、幽默等體現(xiàn)了文本的多樣性、全面性)相比,題材顯得過于單一。
雖然大學(xué)英語學(xué)習(xí)者生活得環(huán)境主要是校園,但是他們所學(xué)習(xí)的語言知識注定是要在更廣泛的領(lǐng)域里加以利用的,過分單一的題材,會極大限制語言知識被利用的幾率,進(jìn)而影響學(xué)生學(xué)習(xí)語言的積極性。況且,教材的單元分割格局是非常有利于多題材的提供的,能否很好地利用這種便利,將在很大程度上影響一套教材的品級。
一套教材的編訂需要大量的專門人才根據(jù)教學(xué)要求(如《大綱》要求)從大量的預(yù)料中進(jìn)行篩選,根據(jù)題材的地道程度、一致性、篇幅的適用性整理成冊。然而,正是由于太多原則的限定,教材的編寫很難做到適合所有標(biāo)準(zhǔn),滿足所有人群的需要。但作者認(rèn)為,在教材不能輕易被改動的情況下,在教材以外采取一些方法,顯得尤為必要:
首先,《教材》的篇幅是一定的,但是《教材》相關(guān)的練習(xí)冊、快速閱讀材料卻可以不斷更新,涉及內(nèi)容也可以更加靈活,教學(xué)時間的安排也可以非常的機動。
其次,教師應(yīng)壓縮完全依托《教材》內(nèi)容的教學(xué)活動,引導(dǎo)學(xué)生涉獵更多話題相關(guān)的真實預(yù)料,而獲取這些預(yù)料的方法就可以是依托語料庫技術(shù)的,比如,利用wordsmith軟件提供的關(guān)鍵詞功能,在獲得了一定量的預(yù)料之后,通關(guān)對關(guān)鍵詞的觀察,確定被選定的語言材料是特定話題或主題相關(guān)的,進(jìn)而作為補充材料提供給學(xué)生。
再次,學(xué)習(xí)者也應(yīng)掌握語料庫的檢索技術(shù),利用KWIC(帶語境的關(guān)鍵詞)功能,根據(jù)自己實際使用的需要,獲取特定詞條在真實語境中使用的狀況,以彌補教師知識的局限性和教材涉及語料的局限性。
最后,這套教材的不足是顯而易見的,那么,針對大學(xué)英語學(xué)習(xí)者不同專業(yè)知識的需要,適時地開展專業(yè)英語教學(xué)就顯得尤為重要。各級學(xué)校應(yīng)該把專業(yè)英語的學(xué)習(xí)放在一個更加重要的位置來展開。
[1] J.Sinclair. Corpus,Concordance,Collocation [M]. Oxford: Oxford University Press, 1998.
[2] Krashen, Stephen. Second Language Acquisition and Second Language Learning [M]. New York: Pergamon Press, 1981.
[3] Nation, I. S. P.. "Vocabulary size, text coverage, and word lists", in Schmitt; McCarthy, Vocabulary: Description, Acquisition and Pedagogy[M]. Cambridge: Cambridge University Press, 1997. 6-19.
[4] 何安平,鄭旺全.語料庫視角下的高中英語教材與教法研究[M].北京:人民教育出版社,2009.
[5] 衛(wèi)乃興,李文忠,濮建忠,等.語料庫應(yīng)用研究[M].上海:上海外語教育出版社,2005,(2).
[6] 唐潔儀,何安平.語料庫在外語教學(xué)中的應(yīng)用[J].外語電化教學(xué),2004,(99):42-45.
Corpus-driven Evaluation and Analysis of College English Textbooks
ZHAO Bo
(Henan Normal University, Xinxiang Henan 453007, China)
The design of textbooks is one of the most influential factors in the whole course of college English teaching, and the scientific evaluation of textbooks contributes serves both the improvement of textbook itself and adjustment of teaching strategies. Aided by the corpus techniques, author of the thesis tries to describe 21st Century College English Reading and Writing (Volume I-IV) on the lexical level multi-dimensionally. Such factors as lexical diversity, correspondence between textbooks and the officially-made CET4 syllabus,contribution to learners’ improvement of self-teaching abilities, diversity of the subject matters, are discussed. Besides, some defects and counter-measures are provided as well.
Corpus Techniques; College English; Textbook Evaluation
H31
A
1009-5160(2012)-0086-04
趙波(1982-),男,講師,碩士, 研究方向:語料庫語言學(xué)及應(yīng)用語言學(xué).