楊堅(jiān)定
(紹興文理學(xué)院 外國(guó)語(yǔ)學(xué)院,浙江 紹興312000)
計(jì)算機(jī)技術(shù)的發(fā)展為語(yǔ)言研究提供了一種新的研究方法——基于語(yǔ)料庫(kù)的語(yǔ)言研究方法。語(yǔ)料庫(kù)(corpus)是指根據(jù)一定標(biāo)準(zhǔn)收集和整理的文本的集合。借助語(yǔ)料庫(kù)可以對(duì)文本進(jìn)行定量研究,使研究更加客觀、更加科學(xué)。語(yǔ)料庫(kù)可以分為單語(yǔ)語(yǔ)料庫(kù) (monolingual corpus)、多語(yǔ)語(yǔ)料庫(kù) (multilingual corpus)、類比語(yǔ)料庫(kù) (comparable corpus)以及雙語(yǔ)語(yǔ)料庫(kù) (bilingual corpus)或平行語(yǔ)料庫(kù) (parallel corpus)等。平行語(yǔ)料庫(kù)通常被用于翻譯領(lǐng)域?qū)φZ(yǔ)言進(jìn)行對(duì)比研究,通過(guò)對(duì)原文和譯文對(duì)比可以從詞匯、句子和文體層面研究?jī)蓚€(gè)文本之間存在的異同。Baker(1995:230-236)指出,平行語(yǔ)料庫(kù)最重要的貢獻(xiàn)在于它使人們認(rèn)識(shí)到翻譯研究應(yīng)從規(guī)約性研究向表述性研究過(guò)渡。
基于雙語(yǔ)平行語(yǔ)料庫(kù)的翻譯研究在國(guó)內(nèi)取得了一些成果 (柯飛,2003,2005;秦洪武,2005,2009;徐欣,2010),為后人研究提供了一套較為成熟的研究思路和方法。本研究通過(guò)運(yùn)用自建的漢英多譯本平行語(yǔ)料庫(kù)對(duì)同一篇中文小說(shuō)的五位不同英譯者的翻譯文本進(jìn)行對(duì)比分析,定量反映不同譯者文本的詞匯密度/豐富度、用詞偏好、句法特征等,揭示譯文的獨(dú)特性和共同特征。
本研究以魯迅小說(shuō)《離婚》的五個(gè)英譯本為研究素材。《離婚》是魯迅以現(xiàn)實(shí)生活為題材所寫的最后一篇小說(shuō)。它運(yùn)用對(duì)話的形式展開(kāi)故事情節(jié),介紹人物。這種文學(xué)創(chuàng)作形式在當(dāng)時(shí)的文壇是一種創(chuàng)新。也許正是因?yàn)槠洫?dú)特的創(chuàng)作手法吸引了譯者們對(duì)該小說(shuō)翻譯的興趣。
迄今為止,小說(shuō)《離婚》共有五個(gè)英文譯本。按出版年份為序分別為埃德加·斯諾 (Edgar Snow)和姚克合譯本 (以下簡(jiǎn)稱斯譯本,1936)、美籍華人王際真譯本 (以下簡(jiǎn)稱王譯本,1941)、楊憲益戴乃迭 (Gladys Yang)夫婦合譯本 (以下簡(jiǎn)稱楊譯本,1960),美國(guó)著名漢學(xué)家威廉·萊爾 (William A.Lyell)譯本 (以下簡(jiǎn)稱萊譯本,1990)和二十一世紀(jì)英國(guó)青年學(xué)者藍(lán)詩(shī)玲 (Julia Lovell)譯本 (以下簡(jiǎn)稱藍(lán)譯本,2009)。紹興文理學(xué)院外國(guó)語(yǔ)學(xué)院于2009年創(chuàng)建了“魯迅小說(shuō)漢英平行語(yǔ)料庫(kù)”。本研究在該語(yǔ)料庫(kù)的基礎(chǔ)上,自建了一個(gè)《離婚》和五個(gè)英譯本的平行語(yǔ)料庫(kù)。
本研究主要采用語(yǔ)料庫(kù)研究方法,運(yùn)用語(yǔ)料庫(kù)檢索軟件WordSmith Tools 4.0對(duì)語(yǔ)料進(jìn)行檢索分析。
3.1 類符/形符比。類符/形符比 (Type/Token Ratio),即TTR值,是指特定語(yǔ)料中類符 (type)與形符 (token)的比率。可以用來(lái)統(tǒng)計(jì)數(shù)量大致相等的單位語(yǔ)料,衡量其詞語(yǔ)豐富性 (Lexical Richness)。所謂類符,是指語(yǔ)料中所用的不同詞語(yǔ)種類,而形符是指所有的詞及其表現(xiàn)形式。二者之比例在一定程度上反映了文本語(yǔ)料的詞匯豐富程度。TTR呈現(xiàn)值越高,說(shuō)明該語(yǔ)料所使用的詞匯越豐富,反之則反映作者或譯作的詞匯相對(duì)貧乏。TTR高低可以反映和比較不同語(yǔ)料中詞匯或用詞變化。Baker(2000:250)曾指出,TTR之比值的高低與詞匯豐富性呈正相關(guān)關(guān)系。如若比較長(zhǎng)度不同的文本時(shí),TTR則不足,而需采用標(biāo)準(zhǔn)類符形符比 (STTR)更為可靠。
本文采用標(biāo)準(zhǔn)類符形符比 (STTR)來(lái)衡量比較五個(gè)譯本語(yǔ)料的詞匯豐富性,文本標(biāo)準(zhǔn)長(zhǎng)度設(shè)1,000個(gè)形符,分批計(jì)算文本的STTR值,再求平均類符形符比以反映文本的信息量大小。
為了比較原文的信息容量與各譯文間的信息容量,我們運(yùn)用中國(guó)科學(xué)院計(jì)算技術(shù)研究所在多年研究工作積累的基礎(chǔ)上,研制了漢語(yǔ)詞法分析系統(tǒng)ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)進(jìn)行分詞和詞性標(biāo)注。
3.2 詞表。詞表 (Wordlist)屬于語(yǔ)料庫(kù)索引工具的基本功能。它可根據(jù)研究要求由詞表工具自動(dòng)排列,如以形符或類符在語(yǔ)篇中出現(xiàn)的頻率高低列出,或根據(jù)其字母順序進(jìn)行排列。
3.3 詞匯密度與個(gè)性風(fēng)格詞匯。詞匯密度 (Lexical Density)是指文本中實(shí)詞在總詞數(shù)中所占的比例,通??梢泽w現(xiàn)語(yǔ)篇信息量的大小和難度。文本詞匯密度若較高,說(shuō)明該文本使用的實(shí)詞數(shù)在語(yǔ)篇中所占的比例較大,故可以認(rèn)為其信息容量較大,難度一般認(rèn)為會(huì)相應(yīng)地增加。反之,詞匯密度偏低,則說(shuō)明語(yǔ)篇的難度小,易于理解和閱讀。在多譯本比較中,由于受譯者個(gè)人的話語(yǔ)風(fēng)格、語(yǔ)言規(guī)則、地域方言等差異性因素影響,譯者不同,語(yǔ)言運(yùn)用也會(huì)體現(xiàn)出一些差異性,比如,有些所謂的“個(gè)性風(fēng)格詞匯”,在A譯本里出現(xiàn)的頻次高或被高頻使用,而在B譯本中出現(xiàn)的頻次低甚至是零頻次使用。分析這些詞匯使用的分布范圍和出現(xiàn)頻度,有助于揭示譯者的翻譯風(fēng)格和語(yǔ)言使用規(guī)律。
3.4 平均句長(zhǎng)。平均句長(zhǎng)是指一個(gè)語(yǔ)篇的句子的平均長(zhǎng)度。它可以反映語(yǔ)篇句子結(jié)構(gòu)的復(fù)雜程度,體現(xiàn)語(yǔ)篇的難易度。
依據(jù)檢索方案,運(yùn)用WordSmith Tools 4.0進(jìn)行檢索分析、統(tǒng)計(jì),對(duì)比五個(gè)譯本得出下列數(shù)據(jù):
4.1 標(biāo)準(zhǔn)類符/形符比
表1 標(biāo)準(zhǔn)類符/形符比
從表1可以看出五個(gè)譯本的標(biāo)準(zhǔn)類符/形符比存在一定的差異。藍(lán)譯本最高,這說(shuō)明她的譯文詞匯變化性最大,用詞最豐富,其次是斯譯本和楊譯本,第四是萊譯本,王譯本的標(biāo)準(zhǔn)類符/形符比最小,說(shuō)明王譯本的用詞最不豐富,缺乏變化。另一方面,五個(gè)譯文的形符告訴我們?nèi)R譯本的譯文最長(zhǎng),藍(lán)譯本的譯文最短,藍(lán)譯本最接近原文的形符數(shù)。因此,藍(lán)譯本用詞豐富且譯文的長(zhǎng)度接近原文。萊譯本的長(zhǎng)度是楊譯本1.48倍,藍(lán)譯本的1.57倍,說(shuō)明萊譯本的譯文將原文中的一些隱性表達(dá)進(jìn)行了顯化處理,顯化現(xiàn)象明顯。
4.2 詞表
從表2我們發(fā)現(xiàn),五個(gè)譯本的前10個(gè)高頻詞的差異不大。除了動(dòng)詞was和王譯本的Honor和楊譯本的Seventh以及藍(lán)譯本的Mr.外,其余的高頻詞全是虛詞,其中“the,and,to,of,a,his”這六個(gè)詞在五個(gè)譯本中都是前10位的高頻詞,只是排列順序略有差異。連詞“and”在前四個(gè)譯本中均排在第二位,而在藍(lán)譯本卻排在第五位。這說(shuō)明其他四位譯者使用長(zhǎng)句和并列句的頻率較高,而藍(lán)詩(shī)玲則傾向于用短句且意群之間的關(guān)系劃分較為簡(jiǎn)練。另一個(gè)方面,在10個(gè)高頻詞中,除了楊譯本外,代詞占了3個(gè),而藍(lán)譯本的代詞竟高達(dá)4個(gè)。原文中前10位的高頻詞中只有一個(gè)代詞“我”,這符合英語(yǔ)譯文傾向指代照應(yīng) (anophoric reference)上文已出現(xiàn)名詞,代詞使用遠(yuǎn)多于漢語(yǔ)原文的特點(diǎn)。
表2 語(yǔ)料庫(kù)詞表前10位的詞
4.3 詞匯密度與“個(gè)性風(fēng)格詞匯”之計(jì)算。詞匯密度計(jì)算方中,實(shí)詞是指名詞、動(dòng)詞、形容詞和副詞四類。根據(jù)Biber(2000:62),計(jì)算公式是:詞匯密度=實(shí)詞數(shù)÷總詞數(shù)×100%。Ure指出,詞匯密度可以作為區(qū)別語(yǔ)體正式程度的一個(gè)指標(biāo),某文本的詞匯密度越高,則該文本的語(yǔ)體越接近正式端;反之,若該文本詞匯密度低,則可以說(shuō)明,該文本越靠近非正式端,越接近自然口語(yǔ)。據(jù)Ure(1971:443-452)的研究,口語(yǔ)的詞匯密度大概通常低于40%,而在書(shū)面語(yǔ)里,詞匯密度通常要超過(guò)40%。
表3 詞匯密度與個(gè)性風(fēng)格詞匯的使用
原文《離婚》是以人物對(duì)話展開(kāi)故事情節(jié)的。對(duì)話占小說(shuō)全文的69%。根據(jù)表3,原文的詞匯密度為30.31%,說(shuō)明原文是一篇以口語(yǔ)為主的小說(shuō)。五個(gè)譯本的詞匯密度均低于原文,均屬于口語(yǔ)的詞匯密度范圍。也就是說(shuō),五個(gè)譯者都能較好地保留了原文的口語(yǔ)體風(fēng)格。
為了進(jìn)一步驗(yàn)證這一點(diǎn)。筆者又統(tǒng)計(jì)了五個(gè)譯本中兩個(gè)到四個(gè)字母的常用詞數(shù)量與各個(gè)譯本的總形符之間的比例,結(jié)果如下:
表4 二—四個(gè)字母單詞總數(shù)與總形符的比例
表4顯示,五個(gè)譯者使用的常用詞比例都很高。王譯本使用的常用詞比例最高,其次是楊譯本、斯譯本、藍(lán)譯本和萊譯本。這進(jìn)一步說(shuō)明他們?cè)诜g小說(shuō)時(shí)基本保留了原文的文體風(fēng)格。
4.4 平均句長(zhǎng)。徐欣 (2010)認(rèn)為,一般人根據(jù)自己閱讀經(jīng)驗(yàn)的直觀感覺(jué)是,漢語(yǔ)小說(shuō)原文與翻譯的譯文相比,其句子和段落一般要短一些,而翻譯小說(shuō)在句子和段落兩個(gè)層面上都要長(zhǎng)于原文。在這方面,Baker(1996)進(jìn)行了研究,曾對(duì)Peter Bush和Peter Clark的多部譯著進(jìn)行了比較,并把平均句長(zhǎng)作為一個(gè)要素,進(jìn)行了對(duì)比分析,結(jié)果發(fā)現(xiàn)“平均句長(zhǎng)也是一般的譯者風(fēng)格標(biāo)記”(Baker,1996)。此外,Laviosa通過(guò)雙語(yǔ)對(duì)比語(yǔ)料庫(kù)比較了作為語(yǔ)料的英語(yǔ)原語(yǔ)和英語(yǔ)譯語(yǔ),研究的結(jié)論是,譯語(yǔ)的平均句長(zhǎng)明顯高于原語(yǔ) (Laviosa,1998:568)。那么本研究的統(tǒng)計(jì)結(jié)果又是如何呢?
表5 均句長(zhǎng)
表5告訴我們,五個(gè)譯本的總句子數(shù)均超過(guò)原文。按譯文的總句子數(shù)排列,分別為萊譯本、楊譯本、斯譯本、王譯本和藍(lán)譯本。五個(gè)譯本的總句子數(shù)分別高于原文句子數(shù)。這提示,各位譯者在翻譯時(shí)以更明顯的形式表達(dá)原文本的信息,運(yùn)用了“外顯化 (explicitation)”這種翻譯策略。從平均句長(zhǎng)看,除了楊譯本和藍(lán)譯本,其他三個(gè)譯本的平均句長(zhǎng)都超過(guò)原文。這三個(gè)譯本的文本長(zhǎng)度也超過(guò)原文,這也證實(shí)了Baker提出構(gòu)成翻譯普遍性假說(shuō)的特征之一“外顯化”(Baker,1996:178)。在翻譯過(guò)程中,譯者往往把內(nèi)容闡述得更加通俗易懂,如通過(guò)采用解釋性語(yǔ)句或運(yùn)用同義詞進(jìn)行重復(fù)等手段來(lái)明確原文中的一些隱含信息。為了更清楚地傳達(dá)原文的信息,譯者往往會(huì)重復(fù)前面已經(jīng)提及的細(xì)節(jié)或者擴(kuò)展?jié)饪s的語(yǔ)篇,所有這些翻譯策略都有利于提高目標(biāo)譯本的可讀性。此外,“外顯化”還有一個(gè)作用就是使譯文更加流暢和連貫” (VER S,1998:567)。斯諾、王譯本和萊爾的譯文中均采用了“歸化 (domestication)”策略。而平均句長(zhǎng)在楊譯本和藍(lán)譯本,都要小于原文。這提示,他通過(guò)用簡(jiǎn)單句式替代復(fù)雜冗長(zhǎng)的句子,刪減修飾性詞語(yǔ),減少句子的信息負(fù)載量,可能是在無(wú)意識(shí)地簡(jiǎn)化語(yǔ)言或信息,從而達(dá)到使譯文文體顯得更簡(jiǎn)單、更連貫、更流暢的目的。這也體現(xiàn)了Baker提出的“簡(jiǎn)略化 (simplification)”特征 (Baker,1996:182)。
本文運(yùn)用語(yǔ)料庫(kù)檢索工具對(duì)魯迅小說(shuō)《離婚》的五個(gè)英譯本進(jìn)行了譯文對(duì)比分析。研究發(fā)現(xiàn)五個(gè)譯本都較好地再現(xiàn)了原文的內(nèi)容。五個(gè)譯本中,藍(lán)譯本的譯文詞匯變化性最大,其用詞最豐富;從常用詞匯使用的比較看,王譯本使用的二到四個(gè)字母的常用詞匯最多,也就是說(shuō)他的譯文最通俗易懂;從譯文的平均句長(zhǎng)考察,筆者發(fā)現(xiàn)萊譯本的譯文平均句長(zhǎng)最長(zhǎng),說(shuō)明萊譯本在句子結(jié)構(gòu)是五個(gè)譯本中最復(fù)雜的。這一現(xiàn)象表明,萊譯本在翻譯時(shí)對(duì)一些文化現(xiàn)象進(jìn)行了顯化處理,為的是使讀者更容易理解。當(dāng)然這些異同與譯者的語(yǔ)言習(xí)慣和翻譯風(fēng)格有一定關(guān)系,筆者將另文討論,不在此贅述。
[1]Baker,M.Corpus-based Translation Studies:The Challenges thatLieAhead[A?.In Somers,H.(ed.),Terminology,LSP and Translation:Studies in Language Engineering,inHonourof Juan C.Sager[C?.Amsterdam-Philadelphia:John Benjamins.1996:175-186.
[2]Biber,D.et al Longman Grammar of Spoken and Written English[M].Beijing:Foreign Language Teaching and Research Press,2000.
[3]Laviosa,S.Core patterns of lexicaluse in a comparable corpus ofEnglish narrative prose[J].Meta,1998,43(4):557-570.
[4]Ure,J.Lexical density and register differentiation[A].In G.E.Perren & J.L.M.Trim(eds.).Applications ofLinguistics:Selected Papers of the Second InternationalCongress ofApplied Linguistics[C].Cambridge:CU P.1971:443-452.
[5]VER S,L.In search of the third code:an investigation of norms in literary translation[J].Meta,1998,43(2):557-570.
[6]柯飛.漢語(yǔ)把字句特點(diǎn)、分布及英譯研究[J].外語(yǔ)與外語(yǔ)教學(xué),2003(12).
[7]柯飛.翻譯中的隱和顯[J].外語(yǔ)教學(xué)與研究,2005](4).
[8]秦洪武,王克非.基于語(yǔ)料庫(kù)的翻譯語(yǔ)言研究——以“so...that”的漢語(yǔ)對(duì)應(yīng)結(jié)構(gòu)為例[J].現(xiàn)代外語(yǔ),2004(1).
[9]秦洪武,王克非.基于對(duì)應(yīng)語(yǔ)料庫(kù)的英譯漢語(yǔ)言特征分析[J].外語(yǔ)教學(xué)與研究,2009(2).
[10]王克非,等著.雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù):研制與應(yīng)用.北京:外語(yǔ)教學(xué)與研究出版社,2004.