張立柱
摘 要:基于自建的簡·奧斯丁六部小說語料庫,借助語料庫文體學(xué)的研究方法,通過對軟件得出的統(tǒng)計數(shù)據(jù)、高頻詞、詞表、詞簇等進行定量和定性分析,采用數(shù)據(jù)驅(qū)動的發(fā)現(xiàn)式學(xué)習(xí)方法指導(dǎo)英語專業(yè)學(xué)生進行英美文學(xué)課的學(xué)習(xí)。以語料庫驅(qū)動下學(xué)生細讀作品為出發(fā)點,通過課外資料查找、課堂演示和小組討論,把教學(xué)從被動的知識傳授轉(zhuǎn)化為學(xué)習(xí)者的主動建構(gòu),從而實現(xiàn)課堂的“翻轉(zhuǎn)”和教學(xué)效果的提高。
關(guān)鍵詞:語料庫驅(qū)動;英美文學(xué);教學(xué)模式;簡·奧斯丁
中圖分類號:G642.0 文獻標識碼:A 文章編號:1002-4107(2018)04-0024-04
英美文學(xué)課程是我國高等院校英語專業(yè)學(xué)生在高年級階段的一門必修課,屬于專業(yè)知識課程,對于培養(yǎng)學(xué)生的語言能力和文學(xué)修養(yǎng)都具有重要的作用。在高等院校中,由于就業(yè)壓力和應(yīng)用型導(dǎo)向,英美文學(xué)課在英語專業(yè)的課程設(shè)置中不斷被邊緣化,面臨著學(xué)時逐漸減少、教材設(shè)計簡單、師資力量不足、學(xué)生基礎(chǔ)薄弱等方面的問題。由于大學(xué)階段英語專業(yè)教學(xué)的特殊性,英美文學(xué)課的講授不適合涉及過多的背景知識和文學(xué)術(shù)語,而應(yīng)以英美新批評所倡導(dǎo)的“細讀法”為基礎(chǔ),回歸文學(xué)作品本身,尤其是以文本中的語言為基礎(chǔ)來理解和分析文學(xué)作品的意義,賞析作家的風(fēng)格。建構(gòu)主義教學(xué)法強調(diào)學(xué)生在教學(xué)過程中的主體地位,知識和能力需要學(xué)習(xí)者在一定情景下不斷進行學(xué)習(xí)和實踐,最終才能建構(gòu)和內(nèi)化所學(xué)知識,提高實際能力。當今教育界盛行的以“微課”“慕課”等網(wǎng)絡(luò)教學(xué)資源平臺開展“翻轉(zhuǎn)課堂”與建構(gòu)主義的觀點一脈相承。
一、語料庫文體學(xué)
語料庫語言學(xué)形成于20世紀50年代,主張語言研究應(yīng)以真實語料為基礎(chǔ),描寫語言使用的客觀規(guī)律,語料庫方法的應(yīng)用能夠提供關(guān)于語言運用的數(shù)據(jù),從而將定量研究(quantitative research)方法引入語言研究領(lǐng)域[1]。文體學(xué)是借助語言學(xué)的理論和方法來研究文學(xué)作品,考察文學(xué)作品中特定語言特征的選擇及其所產(chǎn)生的主題思想和藝術(shù)效果[2]。文體學(xué)是對文學(xué)文本的語言分析,語料庫語言學(xué)是通過電子手段對語言數(shù)據(jù)進行分析,兩者的結(jié)合催生出了語料庫文體學(xué),即對通過電子手段存儲的文學(xué)文本進行語言分析[3]。在文體學(xué)中,語料庫有助于發(fā)現(xiàn)語言表象以下無法靠直接經(jīng)驗獲得的隱性特征,因為言外之意常常有其特殊的表達方式。在研究作者風(fēng)格的時候,如果不使用語料庫技術(shù),任何關(guān)于歷史的、文體的研究都將是不完整的[4]。鑒于語料庫在文學(xué)文本的語言分析和作者風(fēng)格研究中的巨大優(yōu)勢,以語料庫為基礎(chǔ)在英美文學(xué)的教學(xué)中開展“數(shù)據(jù)驅(qū)動學(xué)習(xí)”(DDL),有利于發(fā)揮學(xué)習(xí)者的主觀能動性,培養(yǎng)批判性思維,從而提高語言文化知識的實際應(yīng)用能力。
二、奧斯丁小說語料庫驅(qū)動下的英美文學(xué)教學(xué)模式
(一)建立語料庫
18世紀英國著名女性小說家簡·奧斯丁的作品都是經(jīng)典作品,也不失其現(xiàn)代性,她的作品常常出現(xiàn)在當今各大暢銷書單中,根據(jù)她的作品改編成的影視作品同樣令現(xiàn)代觀眾深深著迷。她的作品也在學(xué)生讀者尤其是女性讀者中廣泛傳閱,深受歡迎,因此以下將嘗試以她的六部小說為例,運用語料庫的數(shù)據(jù)驅(qū)動方法對其進行分析,探索英美文學(xué)教學(xué)模式的改革。
筆者通過古登堡文本庫(http://www.gutenberg.org)很方便地采集到了簡·奧斯丁六部小說的電子版,并對其進行了除噪、整理、清潔、分詞以及簡單的標注,建立了一個語料庫(約72萬詞),以下簡稱為Austen Corpus。同樣,大部分沒有版權(quán)限制的英美經(jīng)典小說電子版都能在該網(wǎng)站輕松下載。此外,教師還可以通過文本電子掃描(OCR)、網(wǎng)上數(shù)字圖書館以及人工錄入等方式獲取文學(xué)作品的電子版。
(二)數(shù)據(jù)收集與統(tǒng)計
運用WordSmith Tools (5.0版)對Austen Corpus進行分析,可以得到關(guān)于該語料庫的一些基本統(tǒng)計數(shù)據(jù)以及詞表(word list)和詞簇(word cluster),詞表可以按頻率的順序也可以按字母表的順序進行排列。教師可以把詞表或詞簇制作好以電子版的形式發(fā)給學(xué)生,供學(xué)生觀察、學(xué)習(xí)和研究,或者通過網(wǎng)絡(luò)平臺指導(dǎo)學(xué)生使用軟件自己生成詞表或詞簇,這樣更有利于學(xué)生舉一反三,自己制作其他作家作品的小型語料庫,用于研究分析。由于Austen Corpus詞表中的詞達到一萬多個,數(shù)量可能過大,教師還可以以英國國家語料庫(BNC)為參照語料庫(reference corpus),提取出Austen Corpus的關(guān)鍵詞和關(guān)鍵詞詞簇,便于縮小學(xué)習(xí)和研究的范圍。
教師或?qū)W生在使用該語料庫的時候,可以以觀察到的某個詞或短語為檢索詞,在語料庫中進行檢索和分析,從而通過大量豐富的例句開展詞匯的教學(xué)和學(xué)習(xí)。由于每個詞和短語可以清楚地看到上下文,學(xué)生可以在一定的語境中閱讀和理解詞匯與短語的意思,從而通過反復(fù)閱讀熟悉作品的內(nèi)容。
1.基本數(shù)據(jù)分析。通過對語料庫軟件得出的一些基本數(shù)據(jù)進行分析,學(xué)生會對作品的語言使用有一個基本的總體認識,這種認識不是主觀印象式的、反復(fù)不定的,而是具有一定的客觀依據(jù)和數(shù)據(jù)支撐的,可以進行合理解釋的。比如,標準類符形符比(standardised TTR 或STTR)和平均句長(mean in words)是兩個比較常用的指標,前者可以表明詞匯的豐富程度,后者可以說明句子的復(fù)雜程度,而它們的標準差(standard deviation)則反映了詞匯豐富程度和句子長度在整部作品中的變化程度。
簡·奧斯丁六部小說的STTR為41.09,比英國國家語料庫(BNC)的42.66略低,由于奧斯丁小說選材的范圍相對比較小,小說中有大量日常生活中的人物對話,因此會出現(xiàn)詞匯豐富程度不如BNC的情況。奧斯丁六部小說中,《愛瑪》的STTR最小,為39.87,《諾桑覺寺》的STTR最大,為42.37,其他四部小說的STTR從小到大分別為41.05、41.17、41.41、41.59,相差很小,六部小說的STTR標準差也很相似,在56.34—59.36之間。這表明了簡·奧斯丁在這六部小說的創(chuàng)造過程中基本采用了豐富程度相當?shù)脑~匯,奧斯丁小說的語言在很大程度上具有同質(zhì)性。
平均句長方面,奧斯丁六部小說的平均句長為18.63,比BNC的20.59略低,主要原因也是對話比較多,所以句子相對較短。六部小說中,《愛瑪》的句子最短,為15.40,《勸導(dǎo)》的句子最長,達到了22.87,其他四部小說的平均句長從小到大分別為17.19、19.75、20.21和20.49,總體來說,相差也并不大。平均句長標準差在14.58—20.87之間,區(qū)別不大。Rudolf Flesch對英語句子長度與文體的關(guān)系做過如下的數(shù)字統(tǒng)計[5]。
Very easy(easy prose,mostly dialogue):8 words or less
Easy:11 words
Fairly easy:14 words
Standard(average reader):17 words
Fairly difficult(literary English):21 words
Difficult:25 words
Very difficult(scientific English):30 words or more
簡·奧斯丁六部小說的平均句長為18.63,小于文學(xué)類英語的平均值21詞,僅略高于標準英語文體的平均值17 詞,因此奧斯丁小說在文學(xué)類作品中的難度相對不是太大。其中《愛瑪》的句子長度15.40,小于標準英語文體的平均值17 詞,略高于比較簡單的文體的平均值14詞,適合大眾讀者閱讀。由于《愛瑪》的STTR也是六部小說中最小的,語言基礎(chǔ)相對薄弱的同學(xué)可以先從這部書開始閱讀,逐漸熟悉奧斯丁作品。
2.詞表分析。通過比較Austen Corpus里六部小說
《諾桑覺寺》《理智與情感》《傲慢與偏見》《愛瑪》《曼斯菲爾德莊園》和《勸導(dǎo)》(表1分別簡稱為:NA、SS、PP、E、MP和P)的前20位高頻詞(見表1)也可以觀察到,奧斯丁的用詞十分相似,六部小說的前20位高頻詞基本一致,甚至排列順序都相差不大,說明奧斯丁小說語言風(fēng)格的一貫性。
從北外CQPweb下載到狄更斯小說語料庫(本文簡稱為Dickens Corpus)的詞表(http://111.200.194.212/
cqp/dickens/),提取前20位高頻詞,連同BNC前20位高頻詞與Austen Corpus做一個對比(見表2),可以發(fā)現(xiàn)這三個語料庫前5位高頻詞完全一樣,只是排列順序有所不同。第6~20位高頻詞中,Austen Corpus中排第6位的“HER”,在Dickens Corpus中僅排第16位,在BNC中則沒有出現(xiàn)。Austen Corpus中排第11位的“SHE”,在另外兩個語料庫中都沒有出現(xiàn),女性代詞的高頻率出現(xiàn)表明了奧斯丁小說中的人物以女性角色為主,這也是其顯著特色。
從六部小說各自的詞表來看,出現(xiàn)頻率最高的第一個人名就是小說的女主人公,分別為CATHERINE(第28位)、ELINOR(第32位) & MARIANNE(第42位)、ELIZABETH(第33位)、EMMA(第32位)、FANNY(第29位)以及ANNE(第29位)。而且,Austen Corpus前200位高頻詞中還出現(xiàn)了“MRS”,“MISS”,“HRESELF”,“LADY”,“SISTER”,“MOTHER”等大量與女性相關(guān)的詞以及女性人名,也表明了小說的主題主要圍繞女性人物展開。除了“MRS”,“MISS”等女性尊稱之外,前200位高頻詞中還出現(xiàn)了“MR”,“SIR”等男性尊稱,表明人物間的稱呼十分禮貌,與奧斯丁刻畫的中產(chǎn)階級上流社會的慣例相吻合。
3.特殊高頻詞的檢索與分析。如表2所示,Austen
Corpus高頻詞中有一個詞“NOT”,共出現(xiàn)了8565次,排在第12位,而在Dickens Corpus 和BNC中前20位高頻詞中均未出現(xiàn),說明奧斯丁小說中的人物以及敘事者慣用否定語氣。六部小說中,每千詞“NOT”的出現(xiàn)次數(shù)從小到大分別為10.48、11.22、11.48、11.75、12.50、13.66,其中《愛瑪》中“NOT”出現(xiàn)的頻率最高,《理智與情感》最低?;诮y(tǒng)計數(shù)據(jù),教師可以以此為出發(fā)點,引導(dǎo)學(xué)生“細讀”作品,分析 “NOT”高頻出現(xiàn)的原因,發(fā)現(xiàn)語言背后所蘊含的文體意義。比如《愛瑪》中的伍德豪斯先生就偏愛否定形式,“not unwholesome”在他的對話中出現(xiàn)了兩次,通過語言手段,作者成功刻畫出了一個膽小怯懦、猶豫不定的人物形象[6]。
以“NOT”為檢索詞在Austen Corpus中進行檢索,同樣可以發(fā)現(xiàn)一些規(guī)律,“NOT”左側(cè)第一位的常用搭配詞除了“BE”,“DO”等助動詞外,多為“COULD”,“WOULD”,“WILL”,“SHOULD”,“MUST”,“MIGHT”,“SHALL”,“ NEED”,“MAY”,“OUGHT”等情態(tài)動詞,而且很多還是情態(tài)動詞的過去時態(tài)。從高頻三詞詞簇來看,也能驗證這一發(fā)現(xiàn),前200位高頻三詞詞簇中有39個包含否定詞“NOT”。前20位高頻三詞詞簇中有6個含有“NOT”,分別是“I DO NOT”,“SHE COULD NOT”,“COULD NOT BE”,“IT WAS NOT”,“IT IS NOT”,“DO NOT KNOW”,其中有2個含有情態(tài)動詞過去式“COULD”。以BNC為參照語料庫提取關(guān)鍵2~5詞詞簇,Austen Corpus中前20位中有三個含有“NOT”,分別為“COULD NOT”,“SHE COULD NOT”和“I DO NOT”。
Fischer-Starcke以《傲慢與偏見》中兩個含有否定式“NOT”的四詞詞簇“I DO NOT KNOW”和“SHE COULD NOT HELP”為例,分析了小說人物,主要是女性人物在表達對別人的批評,陳述自己的觀點以及表露自己感情時所有意采取的委婉、禮貌、含糊的語言策略,以此來符合社會慣例對女性的要求,同時也反映了女性人物內(nèi)心的不安全感[7]。
除了“NOT”的高頻使用之外,Austen Corpus中還有一些其他否定式的用法,如“NEVER”,“NO”的出現(xiàn)頻率也很高,教師可以指導(dǎo)學(xué)生結(jié)合具體例子進一步分析研究。同樣以《愛瑪》為例。
Her daughter enjoyed a most uncommon degree of popularity for a woman neither young,handsome,rich,nor married.Miss Bates stood in the very worst predicament in the world for having much of the public favour;and she had no intellectual superiority to make atonement to herself,or frighten those who might hate her into outward respect.She had never boasted either beauty or cleverness.Her youth had passed without distinction,and her middle of life was devoted to the care of a failing mother,and the endeavour to make a small income go as far as possible.And yet she was a happy woman,and a woman whom no one named without good-will[8].
這是書中的第三章,貝茨小姐在小說中第一次出場時作者的描述,短短幾句話作者用了很多否定詞和含有否定意思的詞,如“uncommon”,“neither”,“nor”,“no”,“never”,“without”,“no one”等,似乎要把一個又窮又老、既不漂亮又不聰明的“剩女”描述得異常凄慘,但是接下來筆鋒一轉(zhuǎn),這樣的一個女子竟然還很受歡迎,活得有滋有味,這種先抑后揚的寫作手法不禁讓人佩服奧斯丁不愧為“語言大師”,寥寥數(shù)語,不露聲色,沒有借助任何外貌、景物描寫,卻道盡了社會的世態(tài)炎涼,鮮活的人物形象躍然紙上,讓人讀起來忍俊不禁,同時也深刻理解了那個時代女性的命運。
同樣,還有其他一些高頻詞,通過數(shù)據(jù)檢索和深入分析,結(jié)合定量和定性研究,也會有許多新的發(fā)現(xiàn)。如,González-Díaz以奧斯丁小說人物尤其是女性人物角色使用程度副詞“QUITE”的頻率為研究出發(fā)點,從社會學(xué)和文體學(xué)角度深入分析了奧斯丁如何通過人物語言,尤其是女性人物的個人習(xí)語來塑造不同的人物性格和特點[9]。
(三)課堂展示和討論
通過在課堂或課外的語料庫呈現(xiàn)和觀察,學(xué)生可以圍繞具體的詞語或句子展開研究分析,結(jié)合自己的興趣,形成研究問題,探討其中的言外之意、修辭特點和文體風(fēng)格,比如上文中提到的“NOT”的高頻使用以及與情態(tài)動詞的搭配就是一個很好的出發(fā)點。在教師的指導(dǎo)下,學(xué)生以小組為單位在課外進行資料收集和整理,并在課堂上展示自己的發(fā)現(xiàn)和心得體會,使課堂教學(xué)設(shè)計以教師為中心向以學(xué)生為中心轉(zhuǎn)變,學(xué)生成為課堂的主體,展示和建構(gòu)自己的所思所得,并以此為基礎(chǔ)展開課堂討論,從而實現(xiàn)課堂真正意義上的“翻轉(zhuǎn)”。
隨著大數(shù)據(jù)、“互聯(lián)網(wǎng)+”時代的來臨,使用計算機、手機或其他移動平臺進行移動學(xué)習(xí)變得更加便捷和流行,語料庫驅(qū)動的學(xué)習(xí)方式是數(shù)據(jù)運用到教學(xué)上的一種形式,對于改進教學(xué)方式將具有巨大的潛力,但是語料庫如何與教學(xué)更好地在具體環(huán)節(jié)上結(jié)合起來仍需要廣大教師和學(xué)生通過實踐進行不斷探索和研究。
參考文獻:
[1]胡開寶. 語料庫翻譯學(xué)概論[M].上海:上海交通大學(xué)出版社,2011.
[2]任曉霏,馮慶華等.語料庫戲劇翻譯文體學(xué)[M].北京:中國社會科學(xué)出版社,2014.
[3]Fischer-Starcke,Bettina.Corpus Linguistics in Literary Analysis:Jane Austen and her Contemporaries [M].London: Continuum,2010.
[4]Biber,Douglas,Susan Conrad & Randi Reppen.Corpus Linguistics[M].Beijing:FLTRP,2000:222.
[5]連淑能.英漢對比研究[M].北京:高等教育出版社,2010.
[6]Page,Norman.The Language of Jane Austen[M].Routledge, 2011.
[7]Fischer-Starcke,Bettina.Keywords and frequent phrases of Jane Austens Pride and Prejudice[J].International Journal of Corpus Linguistics,2009,14(4):492-523.
[8]Austen,Jane.Emma[M].北京:中央編譯出版社,2013.
[9]González-Díaz,Victorina.‘I quite detest the man:Degree adverbs,female language and Jane Austen[J].Language and Literature,2014,23(4):310-330.