陽鯤
(廣東財(cái)經(jīng)大學(xué)外國語學(xué)院,廣東廣州,510320)
《在語料庫翻譯研究中使用定量方法——描寫翻譯研究實(shí)用指南》2012年出版,為 John Benjamins出版社知名的Studies in Corpus Linguistics系列的第51本,是目前少有的全面介紹使用統(tǒng)計(jì)量化方法研究翻譯語料庫的論文集。兩位主編兼作者 Michael P. Oakes和 Meng Ji分別著有 Statistics for Corpus Linguistics和Phraseology in Corpus-Based Translation Studies。本文擬對此文集作簡要評介。
Mona Baker[1,2]“語料庫語言學(xué)和翻譯研究:啟示與應(yīng)用”一文,倡導(dǎo)用語料庫方法研究翻譯,標(biāo)志著基于語料庫的翻譯研究范式的誕生。“工欲善其事,必先利其器”。語言和翻譯研究也需要定量方法。本論文集收入17位作者的13篇文章,旨在系統(tǒng)描述能用于語料庫翻譯研究(Corpus-Based Translation Studies,CBTS)的各種統(tǒng)計(jì)方法。文章按照主題歸類,從較為宏觀的理論探討到微觀的詞匯研究,分為四個(gè)部分。
第一部分題為“理論探討”,包括三篇論文。
首篇“明晰與暗示:翻譯研究中定量與定性方法的互動”依據(jù)認(rèn)知語言學(xué)將意義視為基于身體經(jīng)驗(yàn)的概念化(conceptualization)的觀點(diǎn),作者認(rèn)為翻譯是對源語文本信息重新概念化的過程,亦即原文經(jīng)歷的質(zhì)的變化。諸如詞匯使用頻率、搭配和語義關(guān)系模式等語言形式參數(shù)上的變化則是原文經(jīng)歷的量的變化。這一質(zhì)和量的變化使得原文與譯文的形式具有各自語言特有的性質(zhì),因而翻譯是重新概念化的活動。作者建立的平行翻譯語料庫由一部當(dāng)代波蘭愛情小說和其英語譯文,以及一本英語財(cái)經(jīng)指南和其波蘭語譯文組成。參考語料庫比較多樣化,既有大型的英語國家語料庫(BNC)和波蘭語國家語料庫,又有小型的英語和波蘭語樣本語料庫,還包括與研究對象不同文類的波蘭詩歌以及譯文語料庫。借助Wordsmith工具,作者探討了四個(gè)方面:① 源語、譯語以及可比語料庫的關(guān)鍵性(keyness)比較;② 搭配作為確認(rèn)原文和譯文中隱喻的始源域和目標(biāo)域的工具;③ 句法模式作為翻譯中意象識解(image construal)和重新概念化的線索;④ 源語-譯語詞匯對等模式以及以“害怕” 一詞為例,體現(xiàn)的英語與波蘭語不同的隱喻和場景(scenario)。其結(jié)論是:翻譯的對等關(guān)系應(yīng)是有關(guān)詞叢和概念整合(conceptual blending)的域(domains)的整體對等。
第二篇“翻譯學(xué)中的回歸分析”的兩位作者介紹了如何使用R程序語言,一個(gè)自由、免費(fèi)、源代碼開放的軟件來對翻譯數(shù)據(jù)進(jìn)行Binary Logistic回歸分析和線性回歸分析。其研究數(shù)據(jù)來自Brighton大學(xué)Raf Salkie提供的INTERSECT語料庫,這是一個(gè)包含各種文類的英語原文和法語以及德語譯文的語料庫。具體的研究對象是英語和德語復(fù)合句中主句和壯語從句的先后順序。論文說明了 logistic回歸的一個(gè)關(guān)鍵統(tǒng)計(jì)量是怎樣與頻數(shù)(frequency)表卡方檢驗(yàn)(chi-square test)具有概念上的相似性,并且舉例展示了 logistic回歸的各種應(yīng)用,包括兩分類預(yù)測指標(biāo)(a binary predictor),間隔/比例測度預(yù)測指標(biāo)(an interval/ratio-scaled predicator),和這兩種指標(biāo)的組合預(yù)測指標(biāo)。
在“基于語料庫的文學(xué)翻譯研究中的假設(shè)檢驗(yàn)”中,作者以西班牙名著《堂吉訶德》的楊絳和劉京勝兩個(gè)中譯本為個(gè)案,探討原文與譯文、譯文文體與譯語語言變遷之間的相關(guān)性關(guān)系。古語(archaism)的大量使用是原文中一個(gè)突出的修辭手法,作者通過線性回歸分析古語在原文和兩譯文的詞匯和語法層面上出現(xiàn)的頻率差異,得出結(jié)論:劉譯本比楊譯本更遵循原文的古語使用模式,劉譯本的語言文體特色更為豐富多樣。其次,通過參照比對蘭卡斯特現(xiàn)代漢語語料庫(LCMC)和加州大學(xué)洛杉磯分校書面漢語語料庫(UCLA),作者解釋了劉譯本(1995)在成語使用上與楊譯本的差異是與現(xiàn)代漢語的發(fā)展變化相一致的:隨著漢語小說中成語使用數(shù)量的增加,出現(xiàn)在楊譯本出版近20年后的劉譯本也用了更多的成語表達(dá)。
第二部分“語料庫統(tǒng)計(jì)學(xué)精要”的主題是語料庫的創(chuàng)建與描寫。
目前絕大部分的語料庫都以英語為其中一種研究語言,對非英語語言之間的研究存在著明顯不足,因此由挪威卑爾根大學(xué)創(chuàng)建的挪威語-西班牙語平行語料庫(NSPC)有著重要意義。在“研制挪威語-西班牙語平行語料庫:方法與挑戰(zhàn)”中,兩位作者詳細(xì)介紹了這一研制過程,包括文本的選擇、分類、預(yù)處理、對齊以及與西班牙萊昂大學(xué)研制的英語-西班牙語語料庫(P-ACTRES)構(gòu)成可比語料庫的兼容問題。NSPC是單向翻譯平行語料庫,語料年代為2000年至2009年,體裁包括虛構(gòu)和非虛構(gòu)作品,采用全文收錄的方式,目前庫容為三百萬詞,標(biāo)注了與翻譯有關(guān)的文本信息。此外,作者還重點(diǎn)介紹了基于這一語料庫的幾項(xiàng)初步研究結(jié)果:總的看來,西班牙語譯文長度大于挪威語原文,句子數(shù)量少于原文,平均句長短于原文。方差分析(ANOVA test)和卡方檢驗(yàn)結(jié)果說明,句長與文類(genre)具有顯著的相關(guān)性;原文與譯文1:1的語句對應(yīng)同樣也與文本類型的相關(guān)性具有統(tǒng)計(jì)學(xué)意義。最后,作者簡述了基于NSPC的研究現(xiàn)狀和前景。
Michael Oakes在“描寫翻譯語料庫”中展示了如何借用統(tǒng)計(jì)學(xué)知識較為充分地對語料庫進(jìn)行描寫。利用統(tǒng)計(jì)手段對數(shù)據(jù)進(jìn)行整理能發(fā)現(xiàn)數(shù)據(jù)的基本特征。以一翻譯語料庫中一篇挪威語原文的十八個(gè)不同英語譯文的字符總數(shù)為樣本數(shù)據(jù),作者用諸如集中量數(shù)(measures of central tendency)等多種手段考察了翻譯語料庫中的語言特點(diǎn)成正態(tài)分布的情況、語料庫規(guī)模與語言特點(diǎn)出現(xiàn)次數(shù)的關(guān)系、語料庫的相關(guān)性問題(aboutness)、用詞的變化性以及搭配問題。其中語料庫的相關(guān)性是指哪些類符在何種程度上是這一語料庫中的典型類符。作者以《紅樓夢》的包譯本(Edward Bowra)和喬譯本(Henry Bencraft Joly)為例說明,通過統(tǒng)計(jì)頻數(shù)、卡方檢驗(yàn)、Tf-idf權(quán)重公式能找出譯文中最為典型的單詞,從而在一定程度上反映譯者的風(fēng)格。另一個(gè)能反映譯者寫作風(fēng)格的指標(biāo)是譯文中用詞的變化性。眾所周知,未經(jīng)標(biāo)準(zhǔn)化的類符形符比作用有限,因此作者介紹了另外兩種計(jì)算公式:Yule’s K和Heaps定律,其結(jié)論是兩譯本的用詞變化性并無大的差異;計(jì)算相互信息值(MI)和Z分值各有所長和所短,兩者結(jié)合才能測量詞語的搭配強(qiáng)度。
聚類分析(cluster analysis)是一組將研究對象分為相對同質(zhì)的群組的統(tǒng)計(jì)分析技術(shù)。“翻譯語料庫的聚類分析”一文旨在介紹各種能找出翻譯語料庫中相似信息的聚類技術(shù)和文本處理方法。基本步驟包括數(shù)據(jù)表示、計(jì)算相似性和數(shù)據(jù)聚類。首先,需要將自然語言的文檔“翻譯”成機(jī)器內(nèi)部表示結(jié)構(gòu),作者介紹了詞袋算法(bag-of-words),n元語法(n-Grams),多詞表示(multiple-word representation)的文檔表示技術(shù)。然后,通過語言學(xué)的或統(tǒng)計(jì)學(xué)的方法消減向量空間的維度(dimension reduction)。計(jì)算樣本間的距離常用的距離度量是D維特征空間中的Euclidean距離和余弦夾角(Cosine Angle)。聚類分析計(jì)算方法主要有劃分法(partitioning methods)和層次法(hierarchical methods)。
第三部分“文學(xué)翻譯的量化研究”側(cè)重對文學(xué)文本的譯文進(jìn)行量化分析。
兩位主編在首篇中比較了《紅樓夢》兩個(gè)早期英譯本的文體特征。英國人包臘(E. Bowra)前八回譯本發(fā)表于19世紀(jì)60年代末,英國駐澳門副領(lǐng)事喬利(Henry B. Joly)1892-3年譯本最早以整書形式出版。這兩個(gè)譯本在《紅樓夢》英譯史上有著重要影響。作者選取第一回為具體分析對象,以著名漢學(xué)家翟理思(H.A.Giles)在其《中國文學(xué)史》中譯介的《紅樓夢》為獨(dú)立樣本做參照,對經(jīng)過了詞性和語義標(biāo)注以及手動對齊后的三個(gè)英語文本的句長、情感詞、習(xí)語、類符形符比分別進(jìn)行配對樣本t檢驗(yàn)、獨(dú)立樣本t檢驗(yàn)、卡方檢驗(yàn)、皮爾遜相關(guān)系數(shù)檢驗(yàn)、Spearman秩相關(guān)系數(shù)、Wilcoxon符號秩和檢驗(yàn)以及曼-惠特尼U檢驗(yàn),發(fā)現(xiàn)了兩者在習(xí)語用法上的差異:喬譯本的英語習(xí)語用法更多、習(xí)語的結(jié)構(gòu)更靈活,包譯本則更多地保留了原文的邏輯結(jié)構(gòu),多用固定形式的習(xí)語。這一研究旨在體現(xiàn)翻譯語料的統(tǒng)計(jì)學(xué)研究的可行性與潛力。
統(tǒng)計(jì)的理念長期應(yīng)用于文體分析中,逐漸出現(xiàn)了偏重于統(tǒng)計(jì)的文體分析方法,這種方法被稱為“文體測量”或“計(jì)量文體學(xué)”(stylometry)。本章的第二和第三篇都屬于這一研究性質(zhì)。前者旨在通過分析喬伊斯的《都柏林人》(Dubliners)和土耳其譯文中的文體標(biāo)記:字?jǐn)?shù)體現(xiàn)的句長、最常用詞、類符長度、形符長度以及類符形符比,找出翻譯中的不變量(invariant)。其研究方法是逐步判別分析和線性判別分析(discriminant analysis)。結(jié)果顯示:常用詞是最能對英語短篇小說進(jìn)行分類判別的文體標(biāo)記;句子長度線性地從英文原文映射到土耳其譯文;原文和譯文的型符和類符分布都符合泊松分布(Poisson distribution,一種隨機(jī)分布規(guī)律),原文和譯文中類符型符的相對頻率曲線能讓我們找出原文和譯文的不變量及其特征。本研究的意義在于其結(jié)果可以用于評價(jià)一部作品的原文與譯文的一致性。
“隱形譯者的謎團(tuán):翻譯中的計(jì)量文體學(xué)”一文介紹了文體測量的歷史與現(xiàn)狀,指出其在作家身份確定方面(authorship attribution)的成就與不足。身份確定中最為廣泛使用的方法當(dāng)屬Newcastle大學(xué)的John Burrows教授的Delta分析技術(shù)。其主要的理據(jù)是,選擇某位作家的作品中出現(xiàn)頻率最高的80-150個(gè)文體標(biāo)記,多為功能詞、非主題名詞或動詞等,計(jì)算出每個(gè)高頻詞的Z值(z-score),然后對要鑒別的文章進(jìn)行匹配性計(jì)算,各項(xiàng) Z值到達(dá)一定的總值,就可判定該文章的作者就是這位作家。本文作者通過對大量英語-波蘭語平行語料進(jìn)行多元計(jì)算后得出結(jié)論:Delta分析技術(shù)不能區(qū)分譯者的文體特征,統(tǒng)計(jì)數(shù)字結(jié)果不能體現(xiàn)不同譯者的最常用詞差異,印證了“譯者的隱形”(Venuti,1995:8)這一為譯界詬病的現(xiàn)象。
第四部分“譯文詞匯的量化研究”有四篇文章之多,分別借助不同的統(tǒng)計(jì)方法研究各具特色的翻譯語料,多角度地展示了對詞語進(jìn)行量化分析可以帶來新穎的發(fā)現(xiàn)。
首篇“翻譯與科技術(shù)語”通過對語料的層次聚類分析(HCA)以及定性歸納,探討了西方譯者在將英法荷蘭語的科技著作譯為漢語時(shí)所采用的詞匯策略。作者M(jìn)eng Ji從歐洲漢學(xué)數(shù)字資源中心選取五個(gè)漢譯文本,以形符長度(token length,指一個(gè)漢語詞包含的方塊字的字?jǐn)?shù))和能表達(dá)語法意義和功能意義的虛詞(functional particle)分布為研究對象,發(fā)現(xiàn)十九世紀(jì)的這些傳教士和漢學(xué)家在翻譯時(shí)充分利用古漢語,形成了獨(dú)特的譯文用詞特點(diǎn)——多用兩字、三字和四字詞語;用八大類的虛詞來表示功能意義和語法意義,以對應(yīng)拉丁語系的原文慣用詞語的前后綴來表達(dá)的概念。研究這一時(shí)期的科學(xué)譯作對于我們了解對近代中國科技術(shù)語的形成能起到重要作用。
“譯者的對策:吠陀梵語翻譯中(vedic translation)的詞匯選擇”一文的研究目的在于借助多語平行語料庫和卡方檢驗(yàn),探討德語和俄語的兩位譯者在翻譯印度現(xiàn)存最重要的上古詩歌總集《梨俱吠陀》(Rgveda)時(shí),面對原文的各種限制與歧義時(shí)所采用的對策。研究發(fā)現(xiàn)在翻譯諸神的名稱以及一些有歧義的吠陀神學(xué)詞匯時(shí),兩位譯者最為常用的技巧是音譯,其次是顯化和隱化,都更傾向于顯化;無論是單個(gè)譯者的行為或是兩位譯者的一致行為,研究證明都是源于原文的內(nèi)容與語境的影響。
第三篇論文的視角獨(dú)特,關(guān)注的是頗不受重視的詞綴。作者用三種常用的多元統(tǒng)計(jì)分析方法對來自翻譯英語語料庫(TEC)中的23個(gè)前后綴的構(gòu)詞能力及其使用進(jìn)行了研究,指出因子分析(factor analysis)不適用于語料庫語言學(xué),而對語料進(jìn)行主成分分析(principal component analysis)和對應(yīng)分析(correspondence analysis),則能給我們帶來啟示:翻譯英語中詞綴與文本類型明顯有關(guān)聯(lián)——文本類型限制者譯者對詞綴的使用,詞綴的構(gòu)詞能力與原文的語言沒有關(guān)聯(lián),詞綴的分布與譯者的國別同樣無關(guān)聯(lián);譯者對詞綴的使用自覺或者不自覺地以文本類型的規(guī)范為目標(biāo)。
上文提到的對應(yīng)分析作為近年新發(fā)展起來的一種多元相依變量統(tǒng)計(jì)分析技術(shù),也是最后一篇論文所采用的研究工具,結(jié)合Binary Logistic回歸分析,作者通過對分別譯自英語和法語的荷蘭語的譯語文本以及荷蘭語原語文本研究發(fā)現(xiàn):翻譯語言與非翻譯語言之間的關(guān)系是多維度的;翻譯文本的保守化傾向(conservatism)這一翻譯語言共性并不完全成立,文體類型和原語類型才是影響譯者用詞的正式程度,亦即保守化的因素。鑒于目前語料庫翻譯研究中普遍存在的忽視文體類型對譯者的影響以及翻譯語料具有的多維度性質(zhì),這一研究具有重要的意義。
上述簡介的論文,加上附錄和索引,構(gòu)成了全書361頁的篇幅,展現(xiàn)了一幅用統(tǒng)計(jì)手段研究翻譯語料的精彩畫面,所使用語料庫涉及英、法、漢、日、德、俄、西班牙、意大利、波蘭、挪威、古印度和土耳其語等多種語言,體裁以文學(xué)作品為主,包括詩歌和小說,科技文類也有體現(xiàn)。單從語種范圍擴(kuò)大這一點(diǎn)就可以看出語料庫翻譯研究發(fā)展之迅速。
作者利用已有的平行語料庫或者自建語料庫,不僅提供大量數(shù)據(jù),而且對這些數(shù)據(jù)作出翻譯學(xué)的和文體學(xué)的理論分析和概括,對數(shù)據(jù)描述出新的趨勢和新的模式。每一位作者都具備翻譯學(xué)、語料庫和統(tǒng)計(jì)知識。充分使用統(tǒng)計(jì)量化方法這一強(qiáng)大工具來對翻譯進(jìn)行實(shí)證研究可以說是國外語料庫翻譯學(xué)研究的一大趨勢。這些論文合力證明,將統(tǒng)計(jì)分析和語料庫結(jié)合起來,能做出許多有益和獨(dú)到的發(fā)現(xiàn)。
本書有超過半數(shù)的文章(第3、5、6、7、8、9、10篇)涉及了譯作的文體特征或者譯者的文體表現(xiàn)。這也符合目前語料庫翻譯學(xué)的潮流。翻譯語言的共性、特征以及譯者文體等是語料庫翻譯研究最為深入的兩個(gè)方面。
最后應(yīng)該指出,本書有著西方出版的眾多學(xué)術(shù)論文集的通病,那就是忽略中國學(xué)者的研究成果。或許可以略為彌補(bǔ)其不足的是,它收入了以漢語語料為研究對象的兩篇論文。本書還有一些本應(yīng)避免的拼寫錯(cuò)誤,如出現(xiàn)在第 8、93、103、138頁的個(gè)別單詞。但瑕不掩瑜,本書無疑是新興的語料庫翻譯研究方向的一部力作?;蛟S要讀懂這部略顯艱深的跨學(xué)科著作,對于我國大都不具備統(tǒng)計(jì)知識背景的外語研究者來說,不是件易事,如要進(jìn)一步學(xué)習(xí)借鑒其方法來分析翻譯漢語語料,則更為不易。外語學(xué)者可以通過與有統(tǒng)計(jì)知識背景的學(xué)者合作來彌補(bǔ)不足,取長補(bǔ)短。
[1]Baker,M. Corpus Linguistics and Translation Studies:Implications and Applications[A]. In M.
[2]Baker,G. Francis and E. Tognini-Bonelli (eds.)Text and Technology:In Honour of John Sinclair[C]. Amsterdam:John Benjamins Publishing Company,1993:233-250.