陳松菁
(廣東藥學(xué)院 外語部,廣州 510655)
語料庫在大學(xué)英語寫作教學(xué)中的應(yīng)用初探
陳松菁
(廣東藥學(xué)院 外語部,廣州 510655)
語料庫在大學(xué)英語寫作教學(xué)中的作用有待發(fā)掘。英語教師可利用目前語料庫的研究成果和分析手段來總結(jié)學(xué)生作文中存在的突出問題。以大學(xué)生的英語書面語語體特征為例,對比中介語的研究給我們提供了分析語料的多個角度,運用現(xiàn)有的理論,本文嘗試考察了一次論說文寫作訓(xùn)練的語料,初步探討如何應(yīng)用語料庫輔助大學(xué)英語寫作教學(xué)。
語料庫研究;大學(xué)英語寫作;語體特征;作文指導(dǎo)
在2010年9月舉行的“首屆廣外應(yīng)用語言學(xué)論壇”期間,多位國內(nèi)知名學(xué)者聚首就“語料庫語言學(xué)與外語教學(xué)”的關(guān)系探討了兩門學(xué)科協(xié)同發(fā)展的情況及應(yīng)用前景等問題。學(xué)者們認(rèn)為,“語料庫語言學(xué)在外國和國內(nèi)都發(fā)展很快……但是總的來說,我們的語料庫研究還處在比較初級階段,需要提高”,而“外語教學(xué)正是語料庫語言學(xué)的重要應(yīng)用領(lǐng)域”,但可惜的是,“語料庫輔助的教學(xué)還未能切實進(jìn)入外語教學(xué)的主流(即課堂教學(xué))”,“普通外語教師和外語學(xué)習(xí)者充分利用語料庫的人少之又少”。論壇給我們的啟示是,在推動語料庫語言學(xué)研究成果的應(yīng)用過程中,一線語言教師要從一個被動的“語料庫產(chǎn)品(如教材)的消費者”轉(zhuǎn)變?yōu)榉e極的研發(fā)者、反思者和行動者。
語料庫在寫作教學(xué)中可發(fā)揮多元化的作用,例如:范文庫、句型庫、詞匯用法搜索、語言錯誤分析等。應(yīng)用語料庫工具來分析學(xué)生作文中存在的問題可使作文評講既全面又重點突出。本文將從一次大學(xué)英語教學(xué)寫作訓(xùn)練出發(fā),探討語料庫研究成果和分析手段在外語教學(xué)中的實踐指導(dǎo)意義。
桂詩春、楊惠中研究中國英語學(xué)習(xí)者語料庫(CLEC)時發(fā)現(xiàn),中國學(xué)習(xí)者的寫作基本上是“寫話”,具有口語化傾向,但又非完全口語化,是一種獨特的“中國學(xué)習(xí)者書面英語語體”。近20年來興起的對比中介語研究通過學(xué)習(xí)者語料分析讓我們不斷加深對這種特殊語體的認(rèn)識。Petch-Tyson發(fā)現(xiàn)高水平的二語學(xué)習(xí)者在學(xué)術(shù)寫作中過度使用第一/第二人稱代詞,讀者/作者顯現(xiàn)度比本族語使用者高。Cobb的研究發(fā)現(xiàn)二語學(xué)習(xí)者過度使用2000個高頻詞,致使單詞缺乏區(qū)分性與多樣性。據(jù)此他們提出了中介語使用者書面語有口語化的傾向。在兩者的研究基礎(chǔ)上,文秋芳、丁言仁、王文宇考察了中國英語專業(yè)四個年級的學(xué)習(xí)者書面語情況,也證實了中國高水平學(xué)習(xí)者的書面語和其他中介語使用者一樣存在口語化傾向,而且隨著英語水平的提高,書面語中口語化傾向有弱化的趨勢。吳瑾、鄒青從詞頻密度和詞頻角度研究了英語專業(yè)大學(xué)生口頭語和書面語的語言特征,進(jìn)一步證明了“中國大學(xué)生實際上傾向使用的是一種混合語體”。這種混合語體“反映了我國英語學(xué)習(xí)者主要通過書本和正式課堂學(xué)習(xí)英語,無論教師的教學(xué)過程還是學(xué)生的學(xué)習(xí)過程都比較強(qiáng)調(diào)語法和詞匯知識的積累,但往往忽視語境和語體的作用的現(xiàn)狀。”
以上研究從四個角度分析了中介語的語體特征:讀者/作者顯現(xiàn)度(reader/writer visibility)、詞頻分布、詞匯密度和詞頻,主要是針對高水平二語學(xué)習(xí)者(英語專業(yè)高年級學(xué)生或研究生)的語料庫進(jìn)行量化分析,缺乏非英語專業(yè)二語學(xué)習(xí)者的語體特征數(shù)據(jù),如何進(jìn)一步指導(dǎo)學(xué)習(xí)者了解和重視書面語與口頭語的區(qū)別并有意識運用符合語體的表達(dá)也沒有被深入探討。
在長期的大學(xué)英語教學(xué)實踐中筆者發(fā)現(xiàn),非英語專業(yè)的大學(xué)生普遍缺乏或忽視語體知識,在寫作文時經(jīng)常使用一些口語化的表達(dá)。這些錯誤并非語法錯誤,但是同樣會影響文章的質(zhì)量。在以往的作文評講中,筆者與大部分英語教師一樣側(cè)重歸納學(xué)生作文中出現(xiàn)的語法和詞匯搭配錯誤,很少提及語體失誤,甚至不知道這種語體失誤到底有多嚴(yán)重,應(yīng)該從哪些方面分析和給學(xué)生反饋。受到語料庫的相關(guān)研究啟發(fā),筆者決定做一次新的嘗試,用現(xiàn)有的分析手段去考察一次學(xué)生論說文訓(xùn)練語料的語體特征,探討語料庫輔助寫作教學(xué)的可行性。
普通高校的大學(xué)英語課程只有四個學(xué)期,為提高學(xué)生整體寫作水平及輔導(dǎo)學(xué)生準(zhǔn)備四級考試,在第三個學(xué)期筆者在精讀課上進(jìn)行了四次作文訓(xùn)練,重點分別為描寫記敘文、說明文、論說文和應(yīng)用文。由于其他語體特征研究的語料庫以論說文為主,因此筆者抽取了第三次作文訓(xùn)練的學(xué)生習(xí)作進(jìn)行對比。作文題目為“How to Keep Psychologically Healthy?”,在學(xué)習(xí)完《新世紀(jì)大學(xué)英語》第三冊第四單元Text A“How to Grow Old”后布置,課后完成。收到的作文共61篇,剔除4篇離題的作文再隨機(jī)抽樣40篇,然后逐篇準(zhǔn)確輸入,組成一個小型學(xué)生習(xí)作語料庫,平均字?jǐn)?shù)247字,庫容9865型符,類符/型符比:5.44。在分析語料時,我們使用了語料庫分析軟件WordSmith tool 5.0以及網(wǎng)上提供的詞匯分析工具Range(原名VocabProfile)與Frequency軟件。
(1)讀者/作者顯現(xiàn)度。讀者/作者顯現(xiàn)度是判斷書面語是否有口語化傾向的重要指標(biāo)。表1所示的是本研究所選語料與其他相關(guān)語料中讀者/作者顯現(xiàn)度各指標(biāo)的分布情況。其中美國大學(xué)生語料數(shù)據(jù)來自Petch-Tyson的研究(1998:112),高水平英語學(xué)習(xí)者語料數(shù)據(jù)參考的是文秋芳等的研究(2003:271)。對比發(fā)現(xiàn),這次學(xué)生習(xí)作中讀者/作者顯現(xiàn)度指標(biāo)達(dá)到787/萬詞,是高水平英語學(xué)習(xí)者的2.6倍,和本族語的每一萬詞出現(xiàn)119次相比高出6.6倍之多,但接近于文秋芳等發(fā)現(xiàn)的英語專業(yè)大一學(xué)生書面語特點:792/萬詞。從這個角度看,非英語專業(yè)的學(xué)生作文也有口語化傾向,符合潘鳴威等(2010)發(fā)現(xiàn)的“讀者/作者顯現(xiàn)度高是二語/外語學(xué)習(xí)者在論說文寫作中普遍存在的現(xiàn)象”。潘鳴威等還指出:“讀者/作者顯現(xiàn)度特征有所區(qū)別的主要原因是人稱代詞的使用,其他的因素,如模糊詞等的頻數(shù)差異并不大。”表1的統(tǒng)計結(jié)果也證實了這一點。我們還注意到,第一人稱復(fù)數(shù)在學(xué)生習(xí)作語料中的使用頻數(shù)是本族語者語料的十倍多,比高水平英語學(xué)習(xí)者也高出差不多兩倍。本來we等詞是客觀陳述的標(biāo)志,本族語者書面語中這類代詞與其它兩類代詞相比使用頻數(shù)最高,說明本族語者偏好使用這類動詞表達(dá)建議和說理,但是比例差別不至于如此大。針對這一異常,我們進(jìn)一步用Wordsmith分析了學(xué)生習(xí)作語料中we的搭配規(guī)律。這才發(fā)現(xiàn),學(xué)生習(xí)作中的we實質(zhì)上是一種偽裝的客觀表達(dá)而已,從搭配的詞來看還是個人觀點的強(qiáng)調(diào):檢索出與we的搭配比例最高的3組依次是we should/shouldn’t(29%),we can/can’t/could/couldn’t(20%)和we will/won’t(10%)。由此可見,非英語專業(yè)的大學(xué)生雖然意識到要客觀陳述觀點和論據(jù),但是由于缺乏適當(dāng)?shù)闹敢?,致使他們的表達(dá)方式只是“表面功夫”。
表1 讀者/作者顯現(xiàn)度指標(biāo)頻數(shù)對比(參考了文秋芳等2003:272)
續(xù)表
(2)不同詞頻等級的詞匯分布情況。表2列出的是學(xué)生習(xí)作使用不同詞頻等級的詞匯分布情況。這次作文訓(xùn)練中,學(xué)生使用首批1000詞的比例比本族語書面語高出15%,使用第二批1000詞的比例高出5%,其他兩類詞匯比例分別高出4%和6%,由此可見,非英語專業(yè)大二的學(xué)生在平時寫作文時與高水平英語學(xué)習(xí)者一樣存在過度使用高頻詞的問題,嚴(yán)重程度差不多。同時,我們發(fā)現(xiàn)上述5篇課文的詞頻分布與本族語書面語也有差距,卻跟中國學(xué)生的書面語詞頻分布接近。這似乎說明英語教材是針對學(xué)習(xí)者的水平特意挑選、改寫而成的,與真實語料有差別,而學(xué)生寫作時使用的詞句基本來自所學(xué)的課文,詞匯量有限是正常的。從這方面來看,詞頻分布特點是由學(xué)習(xí)者自身水平和所處的學(xué)習(xí)階段決定的,與其片面追求學(xué)習(xí)者的用詞比例與本族語者一致,還不如關(guān)注其用詞是否正確。
表2 不同等級詞頻等級的單詞分布(參考了文秋芳等2003:272)
(3)詞匯密度。根據(jù)Ure(1971)提出的計算公式:詞匯密度=實詞數(shù)/詞匯總數(shù)×100%,國外多位學(xué)者研究表明,本族語的口語語料的詞匯密度一般低于40%,而書面語普遍高于40%。吳瑾、鄒青發(fā)現(xiàn)CLEC中標(biāo)為ST5的語料(英語專業(yè)四級考試書面語語料)在詞匯密度方面較高,達(dá)到50.98%,但與其他書面語料以及口語語料的差別不大。參考了相關(guān)的詞匯密度計算方法,我們也測量了這次學(xué)生習(xí)作的實詞比例(如表3所示)。結(jié)果表明,這次平時作文的詞匯密度超過40%,與范文和CLEC的詞匯密度都沒有顯著差異,基本符合本族語書面語的語體特征。
表3 不同語料的詞匯密度(參考了吳瑾、鄒青,2009:10)
(4)詞頻。詞頻也可以反映書面語的語體特征。McCarthy&Carter對劍橋國際語料庫(Cam-bridge International Corpus,簡稱CIC)中的書面語料分析后發(fā)現(xiàn),本族語者書面語中使用最多的50個詞均為功能詞,如the,to,with,would等(見表4)。而吳瑾、鄒青卻發(fā)現(xiàn),在中國學(xué)生的英語書面語中,排前50位的高頻詞既包含了功能詞也包含了實詞,與本族語者的口語語體特征相仿。他們列出了CLEC中書面語料的高頻詞作為例證(見表4)。利用Frequency軟件,我們也列出了課文范文和學(xué)生習(xí)作中出現(xiàn)頻率最高的50詞,與英語專業(yè)學(xué)習(xí)者書面語和本族語書面語的詞頻進(jìn)行對比。如表4所示,學(xué)生習(xí)作中使用最頻繁的50詞中竟然有13個是實詞,占了26%,顯然與本族語的用詞規(guī)律相去甚遠(yuǎn)。
我們發(fā)現(xiàn),上述高頻詞中出現(xiàn)的實詞有三種異常情況。第一種情況是,在題目和提綱中出現(xiàn)的主題詞及其常用搭配在相關(guān)語料中會反復(fù)出現(xiàn),例如CLEC中的festival,學(xué)生習(xí)作中的keep,healthy,life,health,psychological,psychologically和suicide等。吳瑾等(同上)也指出,命題作文“出于闡述主題的需要,會導(dǎo)致一部分詞匯在這些語料中出現(xiàn)的頻率大為增加”。但我們認(rèn)為,更重要的原因是學(xué)習(xí)者濫用主題詞,沒有使用近義詞或同義表達(dá)的意識,才會導(dǎo)致相關(guān)實詞頻率過高。這似乎是二語學(xué)習(xí)者寫作時的普遍問題,因此教師在點評作文時要特別提醒學(xué)生重視主題詞的多樣化并提供例子。
第二種情況與people的所指有關(guān)。我們利用Wordsmith檢索學(xué)生習(xí)作中出現(xiàn)的people,共搜到72例,按照分層抽樣原則每隔五行選取一例進(jìn)行分析后發(fā)現(xiàn),people通常位于句中,前后沒有修飾語或只有籠統(tǒng)的some,many,different等修飾,范疇模糊。以下列舉10例:
1.o do to lead a better life.If people trust the world,they
2.n see that,as the time go by,people are taking more import
元數(shù)據(jù)是地理信息系統(tǒng)數(shù)據(jù)庫建設(shè)的基礎(chǔ),是一種對城市各類數(shù)據(jù)的描述性數(shù)據(jù)信息,具有數(shù)據(jù)共享的特征。隨著數(shù)字化城市建設(shè)進(jìn)程的加快,導(dǎo)致社會各行各業(yè)對準(zhǔn)確的、詳實的多源數(shù)據(jù)的需求日益增加,加之各類數(shù)據(jù)庫的逐步普及,不同用戶對數(shù)據(jù)需求的差異,促進(jìn)不同結(jié)構(gòu)數(shù)據(jù)之間的轉(zhuǎn)化、更新、檢索,甚至是數(shù)據(jù)集成等都離不開元數(shù)據(jù)。元數(shù)據(jù)有利于空間數(shù)據(jù)的生產(chǎn)和相互轉(zhuǎn)化利用,使得元數(shù)據(jù)成為建設(shè)地理信息系統(tǒng)數(shù)據(jù)庫的重要橋梁。
3.sed quickly,which shocks many people.Young adults are in t
4.be a difficult problem to some people that how to keep psych
5.lonely.In another hand,many people didn’t regard depress
6.at changes have taken place in people’s life in recent year
7.ch as the economy,technology,people’s living standard and
8.suicide,catches more and more people’s sight recently.Acc
9.e society.If we suicided,the people around us will feel f
10.ve confidence in us.Different people have different pressur
1l enjoy your company.Some old people are oppressed by the f
2hat intelligent but inflexible people don't have the right s
3 training for today's business people.As Daniel Goleman sug
4s the personal experience that people would understand the w
5s it is impossible for any two people to see the world exact
第三種情況是中國學(xué)習(xí)者動詞使用過于單一。本族語者書面語中動詞表現(xiàn)力很強(qiáng),富于變化,因此很少有動詞雷同的現(xiàn)象。相反,CLEC和學(xué)生習(xí)作中都有實義動詞位列高頻詞表前50位,可見二語學(xué)習(xí)者在使用動詞時有集中化趨勢。表中列出的高頻動詞有:do,keep,make,feel等。參考McCarthy&Carter研究話語語料庫(CANCODE)所得的結(jié)果,do在本族語口頭語高頻詞中也榜上有名,這說明do的過度使用可能是書面語口語化的結(jié)果。其他詞例都是學(xué)生習(xí)作中頻繁出現(xiàn)的,究其原因,keep與主題詞連用導(dǎo)致超頻使用;而feel的頻數(shù)高可能與命題涉及人們感受相關(guān),兩者皆受到題目的影響。但是make的過度使用顯得特殊。利用Wordsmith檢索,我們發(fā)現(xiàn)學(xué)生習(xí)作中有54處使用了make,其中69%的搭配有“使……”的意思,使動用法過度使用是典型的中式英語的表現(xiàn),這個現(xiàn)象從一個側(cè)面反映出非英語專業(yè)的大學(xué)生書面語不僅有書面語和口語的混合特征,而且還有中式英語的特點。
本研究應(yīng)用目前對比中介語分析語料的理論和手段,考察了非英語專業(yè)大二學(xué)生的論說文習(xí)作,目的是為了找出其語體特征和作文指導(dǎo)的重點。主要的結(jié)果歸納如下:
(1)非英語專業(yè)大學(xué)生書面語在作者/讀者顯現(xiàn)度指標(biāo)和高頻詞使用方面表現(xiàn)出口語化傾向的特征,而在詞頻分布和詞匯密度方面則表現(xiàn)出符合書面語的特征,這支持了中國學(xué)生使用的書面語是一種混合語體的看法。
(2)根據(jù)語體特征研究過程中定性分析,要讓學(xué)生寫出符合語體要求的作文,應(yīng)注意:一、指導(dǎo)學(xué)生合理使用人稱代詞,二、解釋書面語與口語用語的區(qū)別,三、強(qiáng)調(diào)主題詞多樣化的必要性并舉例說明,四、展示動詞及動詞詞組同義轉(zhuǎn)換的例子并多做替換練習(xí)。
[1]Cobb,T.Analyzing later interlanguage with learner corpora:Quebec replications of three European studies[J].Canadian Modern Language Review,2003,59(3):393-423.
[2]Halliday,M.Spoken and Written Language[M].Oxford:Oxford University Press,1985.
[3]Halliday,M.Spoken and written modes of meaning[A].In R.Horowitz&S.J.Samuels(eds.).Comprehending Oral and Written Language[C].New York:Academic Press,1987.
[4]Hyltenstam,K.Lexical characteristics of near-native second-language learners of Swedish[J].Journal of Multilingual and Multicultural Development,1988(9):67-84.
[5]Laurén,U.Some lexical features of immersion pupils’oral and written narration[A].InUniversity of Lund Working Papers in Linguistics50[C].Lund:Lund University Press,2002.
[6]McCarthy,M.&R.Carter.Written and spoken vocabulary[A].In N.Schmitt and M.McCarthy(eds.).Vocabulary:Description,Acquisition and Pedagogy[C].Cambridge:Cambridge University Press,1997.
[7]Petch-Tyson,S.1998.Writer/reader visibility in EFL written discourse A.In S.Granger(ed.).Learner English on Computer C.P p.107-118.
[8]Stubbs,M.Lexical density:A technique and some findings[A].In M.Coulthard(ed.).Talking about Text:Studies Presented to David Brazil on His Retirement:Discourse Analysis Monograph 13[C].Birmingham:English Language Research,1986.
[9]Ure.J.Lexical density and register differentiation[A].In G.E.Perren&I.L.M.Trim(eds.).Applications of Linguistics[C].Cambridge:Cambridge University Press,1971.
[10] 桂詩春,楊惠中.中國學(xué)習(xí)者英語語料庫[M].上海:上海外語教育出版社,2003.
[11] 桂詩春,馮志偉,楊惠中,何安平,衛(wèi)乃興,李文中,梁茂成.語料庫語言學(xué)與中國外語教學(xué)[J].現(xiàn)代漢語,2010(11):419-426.
[12] 潘鳴威,鄒申.英語專業(yè)高年級學(xué)習(xí)者寫作中讀者/作者顯現(xiàn)度再探——一項基于語料庫的分析[J].外語教學(xué),2010(7):48-52.
[13] 文秋芳,丁言仁,王文宇.中國大學(xué)生英語書面語中的口語化傾向— —高水平英語學(xué)習(xí)者語料對比分析[J].外語教學(xué)與研究,2003(4):268-274.
[14] 吳瑾,鄒青.中國學(xué)生英語口筆語語體特征研究:詞匯密度與詞頻[J].山東外語教學(xué),2009(1):8-13.
An Exploration on the Application of Corpus in Teaching College English Writing
CHEN Song-jing
(Department of Foreign Studies,Guangdong Pharmaceutical University,Guangzhou 510655,China)
College English teachers do not fully realize the power of corpus in teaching EFL writing.In fact,they can apply the existing theories and approaches of corpus studies to analyze the major problems lying in their students’work.Taking register features of Chinese learners’written English for examples,the studies in the field of contrastive interlanguage analysis provide us a range of perspectives to investigate the materials.This paper examines a corpus of compositions randomly selected from a writing assignment,trying to tap on the implications of corpus studies to college English writing.
corpus study;college English writing;register feature;composition gluidence
G642
A
1009-3907(2011)08-0107-05
2011-01-06
陳松菁(1978-),女,廣東廣州人,講師,碩士研究生,主要從事語篇分析方面研究。
責(zé)任編輯:劉 琳