董曉燁,柴靜
?
語(yǔ)料庫(kù)輔助的文學(xué)作品主題分析
董曉燁,柴靜
(東北林業(yè)大學(xué) 外國(guó)語(yǔ)學(xué)院,黑龍江 哈爾濱 150040)
語(yǔ)料庫(kù)對(duì)英語(yǔ)學(xué)習(xí)具有極大的輔助作用。文學(xué)研究者在運(yùn)用語(yǔ)料庫(kù)進(jìn)行作家文體分析方面已經(jīng)取得了一定成果。本論文將數(shù)據(jù)和主題研究相結(jié)合,對(duì)文學(xué)主題進(jìn)行語(yǔ)料庫(kù)研究,考察通過(guò)檢索詞、句、篇章的頻率、搭配和分布等信息研究如何借用生文本和標(biāo)注文本來(lái)探討文學(xué)作品主題的方法,試圖將定量和定性分析相結(jié)合,提供了一種科學(xué)、系統(tǒng)、深入的文本解讀方式。
語(yǔ)料庫(kù);主題研究;生文本;標(biāo)注文本
文學(xué)作品的主題就是其“中心和重要思想。它也是與小說(shuō)的其它構(gòu)成元素相關(guān)的統(tǒng)一觀點(diǎn)和推動(dòng)力量”[1]。因此,它涉及作品的主要內(nèi)容、主要題材、中心思想和核心精神,確切地掌握文學(xué)作品的主題對(duì)理解文學(xué)作品非常重要。但是,以往讀者對(duì)文學(xué)作品主題的學(xué)習(xí)和闡釋都是主觀的和印象式的。不同的人在讀同一部作品時(shí),可能會(huì)歸納出不同的,甚至是大相徑庭的主題;缺乏文學(xué)感悟力或沒(méi)有經(jīng)過(guò)系統(tǒng)文學(xué)訓(xùn)練的人可能根本無(wú)法獲知文學(xué)作品的主題;同一個(gè)讀者對(duì)同一部作品的每一次重讀可能都會(huì)生成不同的印象,產(chǎn)生不同的感悟。
語(yǔ)料庫(kù)研究者認(rèn)為上述現(xiàn)象的產(chǎn)生源自傳統(tǒng)文論重直覺(jué)經(jīng)驗(yàn)性的感悟式思維和缺乏可操作性科學(xué)分析的特征。他們批評(píng)傳統(tǒng)文學(xué)評(píng)論的主觀操作性過(guò)強(qiáng)?!把芯恐黝}的過(guò)程就是用自己的詞匯來(lái)闡釋文學(xué)作品中所呈現(xiàn)的人類(lèi)經(jīng)驗(yàn)”[2]。他們認(rèn)為在進(jìn)行傳統(tǒng)方式的文學(xué)批評(píng)時(shí),即使是在那些意思十分突出的論文中,評(píng)論家也只是在從文本中尋找細(xì)節(jié)支持論點(diǎn)并對(duì)論據(jù)進(jìn)行一步步的細(xì)化,同時(shí)有意無(wú)意地忽視與論點(diǎn)相違背的數(shù)據(jù)。因?yàn)榭刹僮餍钥茖W(xué)分析的缺乏,在反主觀論者的眼中,任何一個(gè)論點(diǎn)的提出都是可疑的,學(xué)者的洞見(jiàn)因?yàn)槿鄙賹?shí)際數(shù)據(jù)的支撐而導(dǎo)致了說(shuō)服力弱化和學(xué)術(shù)交流的紛亂狀況,學(xué)者們對(duì)文學(xué)的理解幾乎無(wú)法達(dá)成共識(shí)。與之相比,語(yǔ)料庫(kù)輔助分析為解讀文學(xué)作品的主題提供了客觀的、有力的論據(jù),有助于促使讀者對(duì)文學(xué)作品形成初步的和直觀的理解。
語(yǔ)料庫(kù)的支持者的觀點(diǎn)略有夸大定量研究的功用之嫌,但我們也不可否認(rèn)語(yǔ)料庫(kù)方法對(duì)文學(xué)研究的輔助作用。運(yùn)用語(yǔ)料庫(kù)輔助分析文學(xué)作品的主題,有利于突顯文學(xué)研究的客觀依據(jù)。近年來(lái),隨著計(jì)算機(jī)科學(xué)的發(fā)展和人們對(duì)定量分析的重視,運(yùn)用語(yǔ)料庫(kù)語(yǔ)言學(xué)方法研究文學(xué)文本成為當(dāng)前文學(xué)研究的主要范式之一[3]。運(yùn)用語(yǔ)料庫(kù)語(yǔ)言學(xué)的方法便于研究作家的語(yǔ)言特色和技巧。除此之外,語(yǔ)料庫(kù)語(yǔ)言學(xué)的應(yīng)用對(duì)于研究文學(xué)作品的主題意義也具有非常強(qiáng)的指導(dǎo)意義。語(yǔ)料庫(kù)語(yǔ)言學(xué)為“挖掘文本的隱含意義”“提供了更便捷的服務(wù)”[4]。我們?cè)谘芯课膶W(xué)文本時(shí)可以運(yùn)用多種計(jì)算機(jī)輔助方法。最為初步的一種方法是對(duì)語(yǔ)料進(jìn)行搜集,研究高頻表達(dá)的隱喻意義,通過(guò)考察詞匯在文本中或文本的某一部分的分布和頻率,發(fā)現(xiàn)文本的特殊主題。這方面的研究我們可以直接借助生文本來(lái)進(jìn)行。
生文本是沒(méi)有經(jīng)過(guò)標(biāo)注的原始語(yǔ)料。我們可以利用初步的檢索手段,得出詞匯在文學(xué)文本中的顯現(xiàn)頻率,考察在文本中出現(xiàn)的高頻詞匯,從而分析文學(xué)作品的創(chuàng)作主題。
例如在分析20世紀(jì)初的英國(guó)作家詹姆斯·喬伊斯的著名的短篇小說(shuō)《阿拉比》時(shí),我們可以利用常用的語(yǔ)料庫(kù)檢索軟件AntConc來(lái)進(jìn)行詞匯檢索研究,得出一個(gè)主題詞頻率列表。去除語(yǔ)法虛詞之后,我們將出現(xiàn)頻率的排名在前五位的詞列表如下:
RankFrequencyWord 198I 220she 311street 49dark 49bazaar
從上述列表中,我們可以對(duì)小說(shuō)的情節(jié)和主題形成一個(gè)初步的認(rèn)知。小說(shuō)以第一人稱(chēng)敘事視角講述了發(fā)生在“我”和“她”之間的故事。故事主要發(fā)生在“街道”和“集市”上,小說(shuō)的氣氛“悲郁”。結(jié)合其它高頻度的主題詞和小說(shuō)閱讀,我們可以初步得出小說(shuō)的主題是借由講述一個(gè)男孩在初戀幻滅之后的成長(zhǎng),表現(xiàn)了成長(zhǎng)的幻滅和20世紀(jì)初愛(ài)爾蘭社會(huì)頹廢和空虛的癱瘓狀態(tài)。
以“bazaar”一詞為例?!癰azaar”表示集市,卻與“fair”和“market”等詞不同。它指中東的集市,因此具有異域風(fēng)情。它與“Araby”相關(guān)聯(lián),讓人想到阿拉伯和《一千零一夜》,因此引發(fā)了有關(guān)遙遠(yuǎn)、夢(mèng)想、神秘和浪漫的意象。阿拉比的集市是“我”愛(ài)戀的對(duì)象向往的地方,因此也代表了少年的理想和主人公的探索與追求的目標(biāo)?!拔摇卑殉鯌佼?dāng)作圣潔的瑪利亞去祈禱和崇拜,因此集市也成為了和信仰相關(guān)的朝圣地?!癰azaar”也是少年發(fā)生頓悟的場(chǎng)所。阿拉比本來(lái)蘊(yùn)含了少年美麗的想象和純潔的夢(mèng)想,但是當(dāng)他經(jīng)歷了一番波折終于到了他心目中的圣地之后,他所看到的阿拉比昏暗、破敗、蕭條,“像做完禮拜后空無(wú)一人的教堂一般死寂”。最后在他目睹了一個(gè)女服務(wù)員和兩個(gè)男人的調(diào)情之后,他對(duì)純潔愛(ài)情的想象和向往徹底轟塌了。
我們還可以借用AntConc的一些基本功能來(lái)檢索語(yǔ)料的主題特征。例如,我們可以對(duì)小說(shuō)中的另一個(gè)高頻詞匯“street”這個(gè)詞做cluster 功能檢索,看看它的前面有哪些修飾語(yǔ)。我們檢索到的直接用形容詞來(lái)修飾“street”的例子有“quiet street”、“silent street”和“flaring streets”,除此之外在后置定語(yǔ)中用來(lái)修飾“street”的詞還有“being blind”、“somber”、“feeble”、“jostled by drunken men and bargaining women”等。這些語(yǔ)句向讀者展示了一個(gè)愛(ài)爾蘭的典型場(chǎng)景?!拔覀儭鄙畹沫h(huán)境“死寂而缺乏活力”,而外面的花花世界充滿了吸引力,“燈光炫目”?!拔摇彼幼〉慕值朗且粭l“死胡同”,象征著生活在這里的人們難以與外界交流,進(jìn)而影射都柏林乃至整個(gè)愛(ài)爾蘭社會(huì)都沒(méi)有出路。這樣的環(huán)境“昏沉”、“無(wú)力”,“到處都是醉醺醺的男人和吵吵嚷嚷的女人”。上述意象與文中反復(fù)出現(xiàn)的“dark”一起構(gòu)成了小說(shuō)的背景氛圍和愛(ài)爾蘭社會(huì)的縮影:死寂與陰暗、庸俗與丑陋、黑暗與冷漠、癱瘓與沒(méi)落、無(wú)奈與凄涼并存。小說(shuō)的一個(gè)場(chǎng)景街道就是愛(ài)爾蘭千千萬(wàn)萬(wàn)的街道中的一條,代表了20世紀(jì)初愛(ài)爾蘭典型的生活場(chǎng)景。
我們還可以利用語(yǔ)料庫(kù)檢索分析來(lái)研究某一特定主題的呈現(xiàn)狀況。例如在分析19世紀(jì)美國(guó)女作家凱特·肖邦的代表作《覺(jué)醒》所體現(xiàn)的家庭倫理方面的主題時(shí),我們可以借助專(zhuān)業(yè)的語(yǔ)料庫(kù)檢索工具AntConc,或word文檔中常用的查找功能,檢索作品中的表示家庭成員關(guān)系的詞匯。檢索發(fā)現(xiàn),《覺(jué)醒》中表現(xiàn)人物關(guān)系的詞匯共有17種566個(gè)。我們可以就檢索結(jié)果做出相應(yīng)的分布圖(檢索詞包括單復(fù)數(shù)兩種形式),作為可供分析的實(shí)驗(yàn)數(shù)據(jù)。
以條形表格顯示高頻詞匯的分布和頻率,為讀者提供了對(duì)文學(xué)作品進(jìn)行直觀解讀的方式,也為學(xué)者的評(píng)論提供了支持性或是反對(duì)性的客觀證據(jù)和數(shù)據(jù)。上面的條形表格清晰地顯示《覺(jué)醒》一書(shū)中出現(xiàn)的最多的表示家庭倫理關(guān)系的詞匯是“女人”一詞,這說(shuō)明作品的主要?jiǎng)?chuàng)作主旨是關(guān)注女性命運(yùn),作品中呈現(xiàn)出作者鮮明的女性主義傾向和女性意識(shí)。書(shū)中出現(xiàn)最少的表示家庭倫理關(guān)系的詞匯是祖父母。這說(shuō)明了主人公家庭觀念的淡漠和家庭倫理關(guān)系的薄弱,與之相對(duì)應(yīng)的是對(duì)個(gè)體權(quán)力和價(jià)值的凸顯。另外,隔代親情關(guān)系的斷裂也表現(xiàn)了文化傳承的缺失。
由此可見(jiàn),通過(guò)詞頻來(lái)分析小說(shuō)的主題是一種有效而直觀的手段,也是語(yǔ)料庫(kù)輔助主題分析的初步應(yīng)用。
標(biāo)注文本是指經(jīng)過(guò)人工或自動(dòng)標(biāo)注的語(yǔ)料。在找到了高頻詞匯的基礎(chǔ)之上,我們可以進(jìn)一步對(duì)高頻詞匯進(jìn)行更為專(zhuān)業(yè)的標(biāo)注和加工,用計(jì)算機(jī)語(yǔ)言來(lái)記錄文學(xué)文本。與生文本相比,標(biāo)注文本獲得了增值,承載了更多有價(jià)值的信息,可以更清晰的顯現(xiàn)語(yǔ)料的結(jié)構(gòu)和內(nèi)容特征。
對(duì)自然語(yǔ)言進(jìn)行標(biāo)注的主要程序包括:進(jìn)行文本采集,創(chuàng)建符合研究目的的語(yǔ)料庫(kù);進(jìn)行文本整理,創(chuàng)建清潔文本;進(jìn)行信息標(biāo)注,創(chuàng)建能夠提供更多信息的研究文本。
我們進(jìn)行語(yǔ)言標(biāo)注的第一步是要根據(jù)研究的目的采集相應(yīng)的文本。例如要分析《覺(jué)醒》的主題時(shí),我們首先要獲取小說(shuō)完整的電子文本。在此基礎(chǔ)之上,為了更深入地挖掘作家的創(chuàng)作特色和歷史地位,我們也可以進(jìn)一步采集相關(guān)文本,如肖邦全部的小說(shuō)文本或是她在19世紀(jì)90年代,也就是與《覺(jué)醒》在同一時(shí)代出版的文本,如她的第一部長(zhǎng)篇小說(shuō)《過(guò)錯(cuò)》(,1890);肖邦其它文類(lèi)的創(chuàng)作,如散文、日記、信件等,或是與《覺(jué)醒》在同一時(shí)期產(chǎn)生的其它文類(lèi)的文本,如肖邦的三部短篇小說(shuō)集《牛軛湖的鄉(xiāng)親》(1894)、《阿卡迪亞之夜》(1897)、《一個(gè)職業(yè)和一個(gè)聲音》(1898);產(chǎn)生于同一時(shí)代的美國(guó)文學(xué)作品,如薩拉·奧恩·朱厄特(Sarah Orne Jewett)的《尖尖的榕樹(shù)之鄉(xiāng)》(1896)和瑪麗·弗里曼(Mary Freeman)的《一個(gè)英格蘭修女及其它故事》(1891);產(chǎn)生于同一時(shí)代的其它國(guó)家的作品,如英國(guó)19世紀(jì)重要的女性作家喬治·艾略特和蓋斯凱爾夫人的作品;產(chǎn)生于不同時(shí)代和不同地域但具有類(lèi)似主題的作品等等。
通過(guò)不同文本的比較研究,我們還原了文本的生產(chǎn)語(yǔ)境,挖掘出更多的相關(guān)主題?!哆^(guò)錯(cuò)》同《覺(jué)醒》一樣,探討了婚姻觀念、道德理想和現(xiàn)代女性的困惑等主題。肖邦的短篇小說(shuō)從多重視角探討了個(gè)人,尤其是女性在社會(huì)中的位置和困境,深化了女性主義話題。與朱厄特和弗里曼等同時(shí)代的美國(guó)女性小說(shuō)家的創(chuàng)作相比,肖邦在展現(xiàn)地方特色的同時(shí),體現(xiàn)出更為強(qiáng)烈的女性意識(shí)和與傳統(tǒng)決裂的決心。同樣,與19世紀(jì)英國(guó)女作家的創(chuàng)作相比,肖邦的創(chuàng)作更關(guān)注女性個(gè)體意識(shí)的覺(jué)醒,而喬治·艾略特和蓋斯凱爾夫人等英國(guó)女性小說(shuō)家的創(chuàng)作呈現(xiàn)出了更為強(qiáng)烈的批判現(xiàn)實(shí)主義傾向。此外,世界文壇上不乏出軌的家庭主婦的形象,雖然艾德娜、安娜·卡列尼娜和包法利夫人最后都自殺身亡,但與安娜和艾瑪別無(wú)出路的絕望自盡相比,艾德娜更多體現(xiàn)出對(duì)女性傳統(tǒng)社會(huì)角色的反叛、對(duì)自由靈魂和獨(dú)立個(gè)性的追求,因此,她裸身奔向大海的行為既是心靈獨(dú)立的體現(xiàn),也具有積極的社會(huì)意義。
隨后,我們要對(duì)采集的文本進(jìn)行整理,其目的是校正語(yǔ)言,保證文本的內(nèi)容正確,清潔受污染的文本,提高搜索結(jié)果的正確率,避免由于文本排版的清晰度或是詞匯的多種形式和同形異義詞等原因所引起的對(duì)搜索目標(biāo)的干擾。進(jìn)行文本整理的主要任務(wù)是校正格式,如統(tǒng)一混雜的標(biāo)點(diǎn)和字符,網(wǎng)頁(yè)拷貝文本中的換行符和空行,校正段落格式和文本換行等,進(jìn)行語(yǔ)言校正,如刪除亂碼、非英語(yǔ)字符和不屬于文本正文的嘈雜信息等。
進(jìn)行語(yǔ)料處理,為語(yǔ)料加上人工標(biāo)注,是進(jìn)一步獲取文本信息的有效手段?!罢Z(yǔ)料庫(kù)分析對(duì)象實(shí)際上囊括了語(yǔ)言的各個(gè)層面——詞匯層面、句法層面、語(yǔ)篇結(jié)構(gòu)和語(yǔ)篇類(lèi)型”[5]。我們可以進(jìn)行不同層次的標(biāo)注,如文本信息和附加信息等。文本信息主要指語(yǔ)言信息,包括文本的語(yǔ)言單位(詞和句子)和內(nèi)部結(jié)構(gòu)(語(yǔ)篇)。針對(duì)文本的語(yǔ)言信息,我們可以進(jìn)行相應(yīng)的詞法、句法、語(yǔ)義和語(yǔ)用標(biāo)注。例如,我們可以標(biāo)注詞的語(yǔ)音、構(gòu)詞、詞性、同義詞、反義詞等;標(biāo)注句子的語(yǔ)法信息和語(yǔ)法屬性,如句法和語(yǔ)義等;標(biāo)注語(yǔ)篇信息如語(yǔ)段結(jié)構(gòu)、銜接手段、開(kāi)頭策略和結(jié)尾策略等。除了上述通用的文本結(jié)構(gòu)信息之外,我們還可以對(duì)與文類(lèi)相關(guān)的特殊文本內(nèi)部結(jié)構(gòu)進(jìn)行標(biāo)注,如與詩(shī)歌和戲劇的文類(lèi)相關(guān)的標(biāo)題、章節(jié)、段落、句子、文體和錯(cuò)誤標(biāo)注等。為了開(kāi)展不同目的的研究,我們還可以對(duì)文本的特殊屬性進(jìn)行標(biāo)注,如文本的語(yǔ)料來(lái)源、出版信息、作者信息、語(yǔ)境信息等文本外部元信息和標(biāo)題、段落、文獻(xiàn)等文本內(nèi)部元信息等非語(yǔ)言信息。
我們對(duì)文本進(jìn)行標(biāo)注的目的是為了便于對(duì)語(yǔ)料進(jìn)行歸類(lèi)和關(guān)鍵詞索引,從而更為快速和準(zhǔn)確地獲取文本信息。“在語(yǔ)料庫(kù)語(yǔ)言學(xué)中,這種機(jī)器可讀的索引被稱(chēng)為縱向單”[6]??v向單包含許多字母順序排序的關(guān)鍵詞記錄。每一條記錄除包含關(guān)鍵詞之外,還包括它的頻率和識(shí)別位置等。這樣,通過(guò)語(yǔ)料整理、清潔和標(biāo)注,我們建立了可以利用的語(yǔ)料庫(kù)文本。接下來(lái),我們可以利用語(yǔ)料庫(kù)檢索軟件進(jìn)行檢索,還可以利用語(yǔ)料庫(kù)分析軟件從自動(dòng)標(biāo)注的語(yǔ)料中找到文本所包含的多種信息,以此深入了解文本的外部信息和內(nèi)部結(jié)構(gòu),避免忽視文本的諸多細(xì)節(jié)。一般說(shuō)來(lái),我們可以借助Go Tagger軟件對(duì)已搜集的語(yǔ)料進(jìn)行詞性賦碼和統(tǒng)計(jì)。
將語(yǔ)料庫(kù)應(yīng)用于文學(xué)研究有兩個(gè)重要的方法?!啊缮隙隆汀上露稀姆椒ā<椿谡Z(yǔ)料庫(kù)的方法和語(yǔ)料庫(kù)驅(qū)動(dòng)的方法?;谡Z(yǔ)料庫(kù)的方法,指的是先確定理論假設(shè),然后再用語(yǔ)料庫(kù)的數(shù)據(jù)來(lái)驗(yàn)證這種假設(shè);而語(yǔ)料庫(kù)驅(qū)動(dòng)的方法,指的是在采集大量數(shù)據(jù)的基礎(chǔ)上,通過(guò)分析數(shù)據(jù)現(xiàn)象,得出結(jié)論或總結(jié)出某種規(guī)律”[7]。接下來(lái),我們可以根據(jù)研究目的來(lái)分析已標(biāo)注的語(yǔ)料信息。例如通過(guò)對(duì)“Araby”進(jìn)行標(biāo)注,我們找到了它的同根詞“Arab”,從而得出了“Araby”一詞的象征意義,神秘、美麗、愛(ài)情、夢(mèng)幻、夢(mèng)想等。而“Araby”一詞的發(fā)音由同一元音字母的開(kāi)口音和非重讀音組成,加重了這種夢(mèng)幻式的情景。除此之外,整個(gè)單詞的發(fā)音由開(kāi)口音到閉口音的變化有力地表現(xiàn)了童年的純真夢(mèng)想的消失這一主題。
另外,我們通過(guò)同義詞和相關(guān)詞標(biāo)注發(fā)現(xiàn)在《阿拉比》中還有許多表示宗教意義的詞匯。在小說(shuō)的開(kāi)頭,作者插入了一個(gè)已經(jīng)死去的牧師的故事。在短短的幾句話中牧師死去這一事件不斷被重復(fù)。die、will、leave、late等詞不停地出現(xiàn),凸顯了死亡事件。通過(guò)初步分析,我們發(fā)現(xiàn)牧師影射了宗教。愛(ài)爾蘭是一個(gè)宗教氛圍濃厚的國(guó)家。大多數(shù)愛(ài)爾蘭人信仰天主教,這與英國(guó)國(guó)教發(fā)生沖突,因而導(dǎo)致愛(ài)爾蘭的宗教氛圍令人窒息。牧師的死亡意味著宗教在現(xiàn)代社會(huì)的敗落,影射了整個(gè)愛(ài)爾蘭社會(huì)的癱瘓狀態(tài)和生活于其間的人們的頹廢、空虛和無(wú)奈。
通過(guò)同義詞標(biāo)注,我們?cè)谖闹羞€發(fā)現(xiàn)了除“牧師”之外的許多與宗教相關(guān)的表述,例如圣杯、修道院和虔誠(chéng)等等。這樣的表述同樣暗示了文章的主題。如在小說(shuō)開(kāi)頭出現(xiàn)了一句話:“The wild garden behind the house contained a central apple-tree and a few straggling bushes, under one of which I found the late tenant’s rusty bicycle-pump.”這句話的意思是:“在房子后面有一個(gè)廢棄的花園?;▓@的中間長(zhǎng)著一顆蘋(píng)果樹(shù),園中還有一些雜亂的灌木,我在灌木叢下發(fā)現(xiàn)了已故的房客的上銹的自行車(chē)氣筒”。這句話中的“garden”和“apple”無(wú)疑都影射了伊甸園的典故,因此這句看似平常的話實(shí)際上含義豐富,表達(dá)了純真的失去、理想的陷落、宗教的丟棄和信仰的失落等等。小說(shuō)中還有一個(gè)重要的宗教意象“圣杯”。當(dāng)主人公經(jīng)過(guò)了一番波折終于到了他心中向往的圣地“阿拉比”之后,嘈雜、骯臟的環(huán)境令其不知所措,他只有默念著純潔的初戀的名字,“想象舉著我的圣杯在一群敵人中安然穿過(guò)?!笔ケ腔浇痰氖テ?,因此神圣而又珍貴。男孩將這個(gè)嘈雜混亂的環(huán)境想象成純潔的愛(ài)的圣地,因此,圣杯在此象征了純潔的愛(ài),而那群敵人無(wú)疑象征了充滿了敵意的愛(ài)爾蘭社會(huì)。
除此之外,我們也可以就標(biāo)注文本的元信息進(jìn)行分析。例如,《阿拉比》中的另外一個(gè)主要人物是曼根的姐姐(Mangan’s sister)。曼根是一名愛(ài)爾蘭詩(shī)人的名字,他寫(xiě)過(guò)一首非常流行的詩(shī)《褐色的羅薩琳》,此后人們常用《褐色的羅薩琳》來(lái)寓指愛(ài)爾蘭,因此我們可以推斷,這個(gè)小說(shuō)中沒(méi)有名字的女主人公實(shí)際上就是愛(ài)爾蘭的抽象的化身。男孩愛(ài)情的幻滅實(shí)際上體現(xiàn)了主人公對(duì)愛(ài)爾蘭的希望與失望、盼望與絕望的復(fù)雜感情。
再以我們提到的另一部小說(shuō)《覺(jué)醒》為例。我們可以對(duì)小說(shuō)中的詞法進(jìn)行標(biāo)注。例如標(biāo)注小說(shuō)標(biāo)題“The Awakening”的語(yǔ)音特征,發(fā)現(xiàn)這個(gè)詞的元音發(fā)音由中元音變成前元音,再變成中元音。這一系列的口型的變化,配合了“喚醒、覺(jué)醒”的詞義,表明了在覺(jué)醒前的半夢(mèng)半醒的狀態(tài)。另外,對(duì)“Awakening”的構(gòu)詞法和詞性進(jìn)行標(biāo)注。動(dòng)詞結(jié)尾加“ing”的用法具有現(xiàn)在分詞和動(dòng)名詞的雙重功用,既強(qiáng)調(diào)了覺(jué)醒的結(jié)果,也強(qiáng)調(diào)了覺(jué)醒的過(guò)程。我們還可以標(biāo)注小說(shuō)中其它詞匯信息。如法語(yǔ)姓名反應(yīng)了小說(shuō)的文化背景,主人公的名字與當(dāng)時(shí)流行的地方色彩小說(shuō)《圣艾爾墨》和《女人王國(guó)》中的女主人公同名,但肖邦在表現(xiàn)地方色彩的基礎(chǔ)之上,開(kāi)辟了具有反叛性的新女性的形象。
對(duì)小說(shuō)的語(yǔ)篇和創(chuàng)作手法進(jìn)行標(biāo)注,發(fā)現(xiàn)小說(shuō)呈現(xiàn)了三位典型的女性形象:艾德娜、艾德娜的朋友阿黛爾·勒布朗和蕾茨小姐。分別以三個(gè)人的名字Edna、Adele Ratignolle和Mademoiselle Reisz作為檢索詞,借助語(yǔ)料庫(kù)軟件 AntConc對(duì)小說(shuō)進(jìn)行檢索,再做concordance (語(yǔ)境共現(xiàn)) 和collocates (詞匯搭配)功能分析,“通過(guò)提取和分析語(yǔ)篇中具有超常頻率的詞以及具有共現(xiàn)關(guān)系的詞語(yǔ)或詞群, 可以確定語(yǔ)篇的主題和表達(dá)該主題的詞集, 進(jìn)而研究作者對(duì)某一主題的表述”[8]。檢索三位人物出現(xiàn)的文本語(yǔ)境和搭配表達(dá),標(biāo)注她們?cè)谕饷?、語(yǔ)言、行為、心理、生活環(huán)境等方面的特征,可以發(fā)現(xiàn)人物形象,比較得出肖邦對(duì)女性的社會(huì)角色的多重和深入思考。
以三位主人公的家庭關(guān)系為例,我們可以標(biāo)注出她們對(duì)家庭的不同態(tài)度。勒布朗夫人是典型的賢妻良母。她全身心服務(wù)于家庭。“結(jié)婚7年,兩年生一個(gè)孩子,并把這作為自己義不容辭的責(zé)任”[9]10。她寵愛(ài)孩子,常常責(zé)備艾德娜對(duì)孩子的關(guān)心不夠。她崇拜丈夫。在丈夫侃侃而談時(shí),“專(zhuān)心地聽(tīng)著,不愿錯(cuò)過(guò)一個(gè)字,時(shí)而隨聲附和,時(shí)而代他把話說(shuō)完”[9]69。配合對(duì)她的外貌和言行等方面的描寫(xiě),勒布朗夫人被塑造成傳統(tǒng)的家庭型女性。她迷人大方、舉止得體,極富女性氣質(zhì)。她獻(xiàn)身家庭,是完美的主婦。從勒布朗夫人在格蘭德島上的社會(huì)地位和周?chē)藢?duì)她的評(píng)價(jià)上,我們可以看出她是克里奧爾人心中完美女性。
蕾茨小姐與勒布朗夫人截然相反。她沒(méi)有家庭、丈夫和孩子,以教人彈琴謀生。與勒布朗夫人精致的生活狀態(tài)不同,蕾茨小姐長(zhǎng)相蒼老、衣著寒磣、生活窘迫。她在人們的眼中性情孤傲、“令人討厭、名聲最壞”[9]72,因此受人排斥,處在社會(huì)的邊緣地位。
艾德娜兼具二者的特征,試圖在兩者之間找到平衡。她擁有前者的美貌端莊和社會(huì)地位,但她卻喜愛(ài)藝術(shù)和思考,追求后者不受家庭束縛的自由。在對(duì)二者的思考中艾德娜開(kāi)啟了追求自我的覺(jué)醒之旅。她無(wú)法為了家庭而放棄自由,因此成為家人眼中的反叛的女兒、妻子和不盡責(zé)的家庭主婦和母親。在自我和家庭責(zé)任發(fā)生沖突時(shí),艾德娜拋棄了賢妻良母的社會(huì)角色,正如她所說(shuō),“我愛(ài)我的孩子,但我不能為他們而奉獻(xiàn)自己”[9]67。三種女性形象的并置說(shuō)明了女性氣質(zhì)的多變,環(huán)境對(duì)個(gè)人訴求的壓抑以及尋求個(gè)人精神獨(dú)立的代價(jià)。
標(biāo)注小說(shuō)的社會(huì)背景和作者信息也有助于挖掘主題。19世紀(jì)末男權(quán)主義的盛行、當(dāng)時(shí)女性的生存狀態(tài)、理想的女性角色、南方淑女的傳統(tǒng)等都說(shuō)明肖邦發(fā)出了女性主義小說(shuō)的先聲,但經(jīng)濟(jì)獨(dú)立和脫離家庭是一種超前的生活方式,這樣的女性在當(dāng)時(shí)受到人們的鄙視和排斥。這反映了女性追求自由獨(dú)立所面臨的困難和男權(quán)社會(huì)文化對(duì)女性意識(shí)的遏制。而肖邦本人家境富有,從小受到良好教育,愛(ài)好藝術(shù),但不斷痛失親人使她成為懷疑主義者。祖母、母親、女老師等聰明而獨(dú)立的單身女性提升了肖邦對(duì)女性個(gè)體價(jià)值的認(rèn)識(shí)。青年守寡,獨(dú)立支撐家庭重?fù)?dān)的經(jīng)歷使肖邦肯定女性的獨(dú)立和堅(jiān)強(qiáng)。
通過(guò)為語(yǔ)料加上人工標(biāo)注,我們能夠方便地獲取文本信息。有關(guān)文本內(nèi)的語(yǔ)言信息標(biāo)注可以直觀呈現(xiàn)文本的文體和語(yǔ)體特色,從而在詞法、句法和章法的研究中找到形式所反映的內(nèi)容和主題特征。有關(guān)文本外的元文本信息標(biāo)注有助于展現(xiàn)與主題相關(guān)的作者的創(chuàng)作語(yǔ)境、創(chuàng)作倫理、創(chuàng)作目的和文本接受效果等問(wèn)題。
綜上所述,“語(yǔ)料庫(kù)的優(yōu)勢(shì)在于它的信息儲(chǔ)存量巨大以及電腦檢索的快捷和準(zhǔn)確”[10]。數(shù)據(jù)的直觀呈現(xiàn)一方面可以使得隱藏于大量文本中的語(yǔ)言信息得以浮現(xiàn),另一方面可以大量地節(jié)省讀者的學(xué)習(xí)時(shí)間,提高學(xué)習(xí)的有效性。將數(shù)據(jù)和主題研究相結(jié)合,對(duì)文學(xué)主題進(jìn)行語(yǔ)料庫(kù)研究,考察詞、句、篇章的頻率、搭配和分布等信息同樣具有文學(xué)批評(píng)的優(yōu)勢(shì)。因此,語(yǔ)料庫(kù)的手段是對(duì)傳統(tǒng)文論批評(píng)的有力支持和補(bǔ)充。定量和定性分析相結(jié)合,提供了一種科學(xué)、系統(tǒng)、深入的文本解讀方式,既有助于呈現(xiàn)文本的細(xì)節(jié)特征,又有助于檢驗(yàn)我們的論斷,同時(shí)輔助提高那些沒(méi)有經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練的讀者的文學(xué)敏感性、闡釋能力和藝術(shù)鑒賞能力。
[1] 金莉,張劍.文學(xué)原理教程[M].北京:外語(yǔ)教學(xué)與研究出版社,2004:42.
[2] 林六辰.英美小說(shuō)要素解析[M].上海:上海外語(yǔ)教育出版社,2005:113.
[3] 盧衛(wèi)中,夏云.語(yǔ)料庫(kù)文體學(xué):文學(xué)文體學(xué)研究的新途徑[J].外國(guó)語(yǔ),2010 (1):47-53.
[4] 李晉,郎建國(guó).語(yǔ)料庫(kù)語(yǔ)言學(xué)視野中的外國(guó)文學(xué)研究[J].外國(guó)語(yǔ),2010(2):82-89.
[5] 李濤.語(yǔ)料庫(kù)文體學(xué):計(jì)算機(jī)輔助文學(xué)語(yǔ)篇的文體分析[J].外語(yǔ)電化教學(xué),2009(1):19-24.
[6] AITKEN A J.The Computer and Literary Studies[C].Edinburgh:Edinburgh UP,1973:172.
[7] 尚必武.敘事研究的新領(lǐng)域和新方法:語(yǔ)料庫(kù)敘事學(xué)評(píng)析[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2011(3):104-109.
[8] 張仁霞.語(yǔ)料庫(kù)檢索分析在文學(xué)評(píng)論領(lǐng)域中的應(yīng)用[J].廣東外語(yǔ)外貿(mào)大學(xué)學(xué)報(bào),2010(9):34-39.
[9] CHOPIN KATE.The Awakening[M].Londong:Everyman’s Library,1992.
[10] 何安平.語(yǔ)料庫(kù)與外語(yǔ)教學(xué)[J].國(guó)外外語(yǔ)教學(xué),2001(3):15-19.
Corpus-Assisted Thematic Analysis of Literary Works
DONG XIAOYE, CHAI JING
Corpus is an aid for English study and contributes to the analysis of literary style in which literary critics have won certain achievements. This paper tries to employ statistics into thematic study and develop corpus-assisted thematic analysis of literary works so as to retrieve the frequency of words, sentences, passages, collocation and distribution of textual data and then discusses the themes of original texts and tagged text. The cooperation of quantitative analysis and qualitative analysis bring about a scientific, systematic and profound method of textual interpretation.
corpus; thematic study; raw text; tagged text
本文推薦專(zhuān)家:
胡江波,中國(guó)科學(xué)院大學(xué)外語(yǔ)系,副教授,研究方向:英美文學(xué)與教學(xué)。
黃芙蓉,哈爾濱工業(yè)大學(xué)外國(guó)語(yǔ)學(xué)院,教授,研究方向:英美文學(xué)與教學(xué)。
2017-12-14
本文系黑龍江省高等教育學(xué)會(huì)高等教育科學(xué)研究“十三五”規(guī)劃課題“美國(guó)文學(xué)數(shù)據(jù)驅(qū)動(dòng)教學(xué)模式研究”(編號(hào):16Q022);中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金項(xiàng)目“文學(xué)倫理學(xué)視域下的華裔美國(guó)文學(xué)研究”(編號(hào):2572016CC02)階段成果。
董曉燁(1978-),女,黑龍江哈爾濱人,東北林業(yè)大學(xué)外國(guó)語(yǔ)學(xué)院,副教授,博士研究生,研究方向:英美文學(xué)與教學(xué);
柴 靜(1981-),女,黑龍江哈爾濱人,東北林業(yè)大學(xué)外國(guó)語(yǔ)學(xué)院,講師,研究方向:語(yǔ)料庫(kù)語(yǔ)言學(xué)。
H08
A
1008-472X(2018)02-0106-06
西安電子科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2018年3期