摘" 要: 機(jī)器翻譯如今深刻影響著翻譯的各個(gè)領(lǐng)域。為觀察文學(xué)領(lǐng)域中人工譯本與機(jī)器譯本的語言特征差異,基于自建Peter Pan英文原文及其兩個(gè)人工譯本、兩個(gè)機(jī)器譯本的英漢平行語料庫,運(yùn)用Python、CRIE、Emeditor和ABBYY Aligner等工具,從詞法與句法兩個(gè)層面對(duì)人機(jī)譯本的17個(gè)語言計(jì)量特征進(jìn)行對(duì)比研究。研究結(jié)果表明:在文學(xué)作品翻譯中,機(jī)器翻譯尚不如人工翻譯,機(jī)器翻譯處理詞匯與句子不靈活,主要表現(xiàn)為代詞“顯化”明顯和行文缺乏邏輯。兩個(gè)人工譯本相比,任溶溶譯本語言富有韻律,閱讀難度較低;楊靜遠(yuǎn)譯本語言豐富,流暢自然。兩個(gè)機(jī)器譯本相比,谷歌譯本較有道譯本詞匯表達(dá)更多樣;有道譯本更貼近中文表達(dá)。
關(guān)鍵詞: 語料庫;語言計(jì)量特征;人工譯本;機(jī)器譯本;對(duì)比
中圖分類號(hào): H315.9
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1673-3851 (2024) 06-0299-07
DOI:10.3969/j.issn.1673-3851(s).2024.03.007
收稿日期:2023-06-18" 網(wǎng)絡(luò)出版日期:2024-01-05網(wǎng)絡(luò)出版日期
基金項(xiàng)目:湖南省哲學(xué)社會(huì)科學(xué)課題(19YBA295);湖南省教育廳課題(19C1617)
作者簡(jiǎn)介:袁艷玲(1983—" ),女,湖南衡陽人,副教授,碩士,主要從事語料庫語言學(xué)方面的研究。
Research on the linguistic features of human translation and machine
translation based on corpus: Taking Peter Pan′s four translations
as an example
YUAN" Yanling, XIAO" Yimei, HUANG" Jingjing
(School of Languages and Literature, University of South China, Hengyang 421001, China)
Abstract:" Machine translation has a profound impact on various fields of translation today. To observe the differences in linguistic features between human translation and machine translation in the field of literature, the authors built Peter Pan′s English-Chinese parallel corpus of the original English text and its two human translations and two machine translations. Tools such as Python, CRIE, Emeditor and ABBYY Aligner were used to conduct comparative research on 17 linguistic structures of the four translations from the lexical and syntactic levels. The research results show that in the field of literature, machine translation is not as good as human translation, with the former being less flexible than the latter in processing words and sentences, mainly inflected in features of evident \"explicitation\" of pronouns, and lack of logic in writing. It is found from the comparison of the two human translations that Ren Rongrong′s version is full of rhythm and easy to read, while Yang Jingyuan′s version is rich in language and fluent in text. It is found from the comparison of the two machine translations that the Google version has more diverse vocabulary expressions than the Youdao version , while the Youdao version is closer to Chinese expressions.
Key words: corpus; quantitative characteristics; human translation; machine translation; comparison
機(jī)器翻譯即計(jì)算機(jī)翻譯,指利用計(jì)算機(jī)將一種語言符號(hào)轉(zhuǎn)為另外一種語言符號(hào)[1]。目前,人機(jī)翻譯對(duì)比研究為一大熱點(diǎn),學(xué)者們從不同層面展開人機(jī)翻譯對(duì)比。如,梁君英等[2]從詞匯、句法、篇章等多維度系統(tǒng)分析了人工翻譯與機(jī)器翻譯的異同,總結(jié)了人類智能翻譯能力的三大優(yōu)勢(shì)。李奉棲[3]運(yùn)用錯(cuò)誤積分法,從五個(gè)維度對(duì)比研究英語專業(yè)翻譯學(xué)習(xí)者與神經(jīng)機(jī)器翻譯的英漢翻譯質(zhì)量,研究結(jié)果表明機(jī)器更擅長(zhǎng)處理術(shù)語翻譯,人工譯者則更擅長(zhǎng)處理文化差異問題。Sheng等[4]通過對(duì)比《勸學(xué)》和《論構(gòu)建人類命運(yùn)共同體》的人工譯本和機(jī)器譯本,發(fā)現(xiàn)人工譯者能夠更加巧妙地處理政治和意識(shí)形態(tài)問題,而神經(jīng)機(jī)器翻譯系統(tǒng)缺乏靈活性和主觀性。
然而,將語料庫與計(jì)量語言學(xué)結(jié)合,對(duì)比文學(xué)領(lǐng)域中機(jī)器翻譯與人工翻譯的相關(guān)文獻(xiàn)不多,且現(xiàn)有少量研究?jī)H僅將國(guó)內(nèi)的“百度翻譯”的譯本與人工譯本作比較[5-7],并未體現(xiàn)國(guó)外機(jī)器翻譯水平。為了更客觀地展現(xiàn)人工譯本與機(jī)器譯本的語言特征差異,本研究結(jié)合語料庫翻譯研究和計(jì)量語言學(xué)方法,選取兒童文學(xué)作品Peter Pan原文及其四譯本即任溶溶、楊靜遠(yuǎn)兩個(gè)人工譯本以及有道翻譯(中國(guó))、谷歌翻譯(美國(guó))的兩個(gè)機(jī)器譯本為研究文本,從詞法與句法兩個(gè)層面、17個(gè)語言計(jì)量單位對(duì)人工及機(jī)器譯本語言特征的差異進(jìn)行比較研究。本研究旨在回答以下兩個(gè)問題:一是,人工譯本與機(jī)器譯本分別有哪些語言特征?二是,人工譯本與機(jī)器譯本的語言特征有哪些差異?對(duì)比人工譯者與機(jī)器翻譯的語言特征差異,可深入探究發(fā)現(xiàn)機(jī)器翻譯存在的問題與局限性,這有助于指導(dǎo)機(jī)器翻譯系統(tǒng)的改進(jìn),提高翻譯質(zhì)量,優(yōu)化翻譯流程。
一、研究設(shè)計(jì)
(一)語料選取
本研究以兒童文學(xué)作品Peter Pan及其四譯本為語料,建立一對(duì)四的英漢雙語平行語料庫。其中,Peter Pan的英文文本采用蘇格蘭小說家及劇作家詹姆斯·馬修·巴利(James Matthew Barrier)所作、2018年由Wordsworth出版社出版的Peter Pan;兩個(gè)人工譯本為:任溶溶翻譯、2017年由少年兒童出版社出版的《小飛俠彼得·潘》(以下簡(jiǎn)稱“任譯本”)和楊靜遠(yuǎn)翻譯、2020年由南京大學(xué)出版社出版的《彼得·潘》(以下簡(jiǎn)稱“楊譯本”);兩個(gè)機(jī)器譯本為:有道翻譯自動(dòng)生成譯本(以下簡(jiǎn)稱“有道譯本”)和谷歌在線翻譯系統(tǒng)自動(dòng)生成譯本(以下簡(jiǎn)稱“谷歌譯本”)。根據(jù)各類語料庫檢索工具對(duì)英文原著以及四個(gè)譯本進(jìn)行統(tǒng)計(jì),任譯本、楊譯本、有道譯本和谷歌譯本的字?jǐn)?shù)分別為75812字、73844字、69492字和68608字。四個(gè)譯本的字?jǐn)?shù)相差不大,具有可比性,符合語料選擇的標(biāo)準(zhǔn)。
(二)語言特征選定
本研究所考察的對(duì)象為詞匯與句子層面的語言特征?;谝酝芯?,本研究總結(jié)歸納了人工譯本與機(jī)器譯本對(duì)比研究常用的語言計(jì)量單位。由于Peter Pan屬于文學(xué)領(lǐng)域中的兒童文學(xué),疊詞在兒童文學(xué)漢譯中的靈活運(yùn)用,可增強(qiáng)源語故事的感染力,提升兒童漢語語言文化認(rèn)知和故事審美體驗(yàn),是兒童文學(xué)漢譯語言研究不可或缺的一部分[8],因此本研究也考察疊詞的使用頻率。最終確定17個(gè)語言計(jì)量單位,用于比較分析人工譯本與機(jī)器譯本的語言特征差異。其中,詞匯層面共13個(gè)語言計(jì)量單位,分別為:標(biāo)準(zhǔn)類符/形符比、詞匯密度、高頻詞、疊詞、名詞比例、動(dòng)詞比例、形容詞比例、副詞比例、數(shù)詞比例、量詞比例、連詞比例、代詞比例、助詞比例;句法層面共4個(gè)語言計(jì)量單位,分別為:句長(zhǎng)、陳述句比例、疑問句比例和感嘆句比例。
(三)統(tǒng)計(jì)工具與統(tǒng)計(jì)方法
本研究采用Python、中文可讀性指標(biāo)自動(dòng)化分析系統(tǒng)(Chinese readability index explorer,CRIE)、Emeditor和ABBYY Aligner四個(gè)工具對(duì)上述17個(gè)語言計(jì)量單位進(jìn)行數(shù)據(jù)統(tǒng)計(jì)。對(duì)詞匯層面的數(shù)據(jù)首先運(yùn)用Python進(jìn)行分詞和詞性標(biāo)注,統(tǒng)計(jì)類符/形符比(Type token ratio,TTR)、標(biāo)準(zhǔn)化類符/形符比(Standardized type token ratio, STTR)、詞長(zhǎng)分布、詞匯密度、高頻詞等數(shù)據(jù);再通過CRIE獲取名詞、動(dòng)詞、形容詞、代詞等數(shù)量,各類詞數(shù)量與總詞數(shù)相比即可得出各詞匯比例。對(duì)疊詞的統(tǒng)計(jì)稍有不同,先利用Python進(jìn)行分詞之后,通過Emeditor輸入正則表達(dá)式提取檢索目標(biāo),再進(jìn)行人工篩選,最終統(tǒng)計(jì)出各類疊詞具體數(shù)量。而對(duì)句子層面的數(shù)據(jù)則先運(yùn)用ABBYY Aligner軟件將四個(gè)譯本與英文原文對(duì)齊,再利用CRIE計(jì)算出句子數(shù)目、字?jǐn)?shù)和平均句長(zhǎng),最終通過Python編程實(shí)現(xiàn)對(duì)標(biāo)點(diǎn)符號(hào)的識(shí)別及符號(hào)間單詞數(shù)量的統(tǒng)計(jì),得出陳述句、疑問句與感嘆句的句子數(shù)目,將各類句式數(shù)目與總句子數(shù)目相比便可得出各類句式比例。
二、詞匯層面的考察
基于各類工具所獲取的數(shù)據(jù),本研究將從標(biāo)準(zhǔn)類符/形符比、詞匯密度、實(shí)詞及虛詞比例、高頻詞、疊詞等數(shù)據(jù)對(duì)比四個(gè)英譯本的語言計(jì)量特征,并探討不同譯本之間的語言計(jì)量特征產(chǎn)生差異的原因。
(一)詞匯豐富度
Baker[9]提出,類符(type)指文本中不同的詞,排除重復(fù)并忽略大小寫;形符(token)指文本中所有出現(xiàn)的詞。他還指出,文本中類符/形符比值越高,說明作者的詞匯使用越豐富、用詞越富于變化[10]。標(biāo)準(zhǔn)類符形符比是按照一定長(zhǎng)度(如1000形符)切分文本,再逐個(gè)計(jì)算各切分文本的類符/形符比,最后取其平均值。STTR常用于比較不同長(zhǎng)度的文本,因?yàn)轭惙奂木鶆虺潭炔煌瑫?huì)影響類符/形符比值,所以采取標(biāo)準(zhǔn)化的類符/形符比值描述詞匯豐富度更可靠[10]。有關(guān)詞匯密度的統(tǒng)計(jì)數(shù)據(jù)如表1所示。
從表1來看,楊譯本的STTR高于兩個(gè)機(jī)器譯本,而任譯本的STTR與有道譯本持平但低于谷歌譯本,即楊譯本(35.68)>谷歌譯本(34.72)>任譯本(33.09)>有道譯本(33.03)。該結(jié)果說明,人工譯本與機(jī)器譯本在詞匯豐富度方面差異不大,二者均無明顯優(yōu)勢(shì)。程勇等[11]指出詞匯豐富度越高的文章,閱讀難度越高,而詞匯越單一、豐富度越低的文章,其閱讀難度也就越低。楊譯本的STTR稍高于其他三個(gè)譯本,說明在相同字?jǐn)?shù)的情況下,楊譯本的詞匯使用更為多樣,其主要原因是人工譯本的語言特征會(huì)因不同譯者的翻譯目的及主體性發(fā)揮而不同。細(xì)讀楊譯本,不難發(fā)現(xiàn)楊靜遠(yuǎn)在翻譯過程中運(yùn)用了一系列翻譯技巧,力求譯文語言活潑生動(dòng)且優(yōu)美動(dòng)人。為達(dá)到此翻譯目的,楊譯本有意采用豐富多樣的詞匯將故事呈現(xiàn)給孩子們,故而其譯文詞匯豐富度會(huì)高于其他譯文。而任溶溶在翻譯兒童文學(xué)作品時(shí)有其個(gè)性化的翻譯原則,即忠于原文、口語化、情境化等。任譯本的字?jǐn)?shù)最多,但其類符遠(yuǎn)低于楊譯本,這是由于任在翻譯過程中充分考慮到兒童讀者群體,秉持忠于原文為本的原則,有意識(shí)地減少類符數(shù)量,以降低文本的閱讀難度。神經(jīng)機(jī)器翻譯依賴數(shù)據(jù)驅(qū)動(dòng),其翻譯結(jié)果受到語料庫大小和質(zhì)量的影響[12]。谷歌譯本較有道譯本的詞匯豐富度高,其詞匯豐富度超過了任溶溶譯本,表明兩個(gè)神經(jīng)機(jī)器翻譯系統(tǒng)之間存在差別,谷歌翻譯系統(tǒng)所具備的語料庫龐大,在挖掘中英雙語語料與詞匯豐富度方面有優(yōu)勢(shì),其詞匯選取與運(yùn)用接近人工翻譯。
(二)詞匯密度
詞匯密度有兩種計(jì)算方法,一種是直接以類符/形符比(TTR)作為詞匯密度,另一種則是統(tǒng)計(jì)實(shí)詞形符在總形符數(shù)中的比例。由于語料庫容量和選材會(huì)對(duì)類符/形符比(TTR)有影響,不能真實(shí)反應(yīng)詞語變化度,因此以類符/形符比作為詞匯密度考察會(huì)有一定的誤差,故本研究選擇第二種方法。
經(jīng)計(jì)算,任譯本、楊譯本、有道譯本和谷歌譯本的詞匯密度分別是0.79、0.81、0.77和0.77,說明兩個(gè)人工譯本的詞匯密度均高于兩個(gè)機(jī)器譯本。王克非[13]提出了詞匯密度低反映信息量和文本難易度相對(duì)降低。機(jī)器譯本詞匯密度低于人工譯本,即在相同長(zhǎng)度的句子中機(jī)器譯本所運(yùn)用的實(shí)詞少于人工譯本,其所承載的信息量少于人工譯本,閱讀難度也低于后者。谷歌譯本與有道譯本的詞匯密度完全相同,說明谷歌翻譯系統(tǒng)與有道翻譯系統(tǒng)對(duì)于詞匯的處理差別不大。人工譯者對(duì)文本的處理方式因翻譯原則不同而有差異,故而二者的詞匯密度也會(huì)有所區(qū)別。任譯本的詞匯密度低于楊譯本,即譯本閱讀難度低于楊譯本,這與詞匯豐富度數(shù)據(jù)分析所得結(jié)論相同。
(三)詞" 頻
為了進(jìn)一步考察詞匯在各譯本中的使用差異,本研究將詞頻考察分為兩點(diǎn):一是各類詞的詞頻差異,二是高頻詞。運(yùn)用語料庫工具共統(tǒng)計(jì)了名詞、動(dòng)詞、形容詞、副詞、數(shù)詞、量詞、連詞、代詞、助詞的頻次比例,以及各譯文前十位高頻詞。以下將從不同詞性的詞頻差異與高頻詞差異,分析不同譯本的語言特征。
1.使用各類詞的詞頻差異
四個(gè)譯本使用各類詞的比例見表2。以下將對(duì)名詞、動(dòng)詞、副詞、連詞和代詞比例進(jìn)行分析,形容詞、數(shù)詞、量詞和助詞比例差距不大,故不作分析。
從表2可見,就名詞而言,任譯本與谷歌譯本的名詞比例持平,而楊譯本與有道譯本的名詞比例一致,這表明人工譯本與機(jī)器譯本在名詞的使用頻率上差異不大,機(jī)器翻譯能準(zhǔn)確識(shí)別和處理名詞。再看遠(yuǎn)高于其他詞性的頻率的動(dòng)詞,就動(dòng)詞而言,其使用頻率遠(yuǎn)高于其他詞性,且兩個(gè)人工譯本的動(dòng)詞比例均高于機(jī)器譯本。漢語傾向于多采用動(dòng)詞,人工譯者在翻譯各類詞時(shí)不僅會(huì)將動(dòng)詞譯為動(dòng)詞,還會(huì)將其他詞類轉(zhuǎn)化為動(dòng)詞,故而人工譯本的動(dòng)詞比例會(huì)高于機(jī)器譯本。這也表明機(jī)器翻譯不具備在詞性轉(zhuǎn)化功能上還有待進(jìn)一步優(yōu)化,目前尚無法貼近地道的漢語表達(dá)。
人工譯本與機(jī)器譯本各詞匯使用比例差異較大的還有副詞。英語中的副詞很豐富,使用頻率較高。在漢語中,副詞既可以修飾動(dòng)詞、形容詞,也可以修飾整個(gè)句子,作狀語和補(bǔ)語。人工譯本的副詞比例遠(yuǎn)高于機(jī)器譯本,說明機(jī)器翻譯對(duì)副詞的識(shí)別和處理能力不夠,使得機(jī)器譯本的篇章連貫性不強(qiáng)。而從連詞的角度來看,連詞是體現(xiàn)語義邏輯關(guān)系的重要形式,使語篇成為連貫的有機(jī)整體。英語中的連詞比漢語中的連詞種類數(shù)量多,使用頻率也高很多。機(jī)器譯本的連詞比例高于人工譯本,可見其篇章邏輯性與連貫性都不如后者,進(jìn)一步說明機(jī)器翻譯對(duì)文本中詞匯處理的靈活性不如人工譯者。
英語中代詞使用頻繁,而漢語則與之相反。受到了英語源語影響,漢語譯文代詞使用頻率會(huì)增加。王克非等[14]認(rèn)為,與原創(chuàng)漢語相比,漢語譯文具有虛詞與指代方式“顯化”等特征。機(jī)器譯本和任譯本的代詞比例均高于楊譯本,表明楊譯本采用其他形式取代英文中反復(fù)出現(xiàn)的代詞,使得譯文通順流暢。任譯本的代詞比例與有道譯本相同,可能是任溶溶秉持以忠實(shí)取向?yàn)楸镜脑瓌t,沒有優(yōu)化處理譯文代詞。而機(jī)器翻譯可能無法運(yùn)用其他方法來替換原文中的代詞,將源語中的代詞一一譯出,造成譯入語代詞“顯化”明顯。
2.高頻詞
高頻詞是指在一個(gè)文本里使用頻率特別高的詞語,通常通過一個(gè)詞語在整個(gè)文本中所占的百分比或者該詞語在整個(gè)詞頻中所占的前后位置來判斷[15]。本研究運(yùn)用Python統(tǒng)計(jì)四個(gè)譯本的詞匯頻率,以下列舉了前十位的高頻詞,各高頻詞的占比可在一定程度上反映文本的獨(dú)特性。四個(gè)譯本使用排名前十位的高頻詞統(tǒng)計(jì)如表3所示。
四個(gè)譯本的前十位高頻詞中出現(xiàn)頻率較高的主要是代詞(他、她、他們、我、你)。任譯本、楊譯本、有道譯本和谷歌譯本使用的前十位高頻詞中,代詞累計(jì)出現(xiàn)頻次比例分別為5.86%、4.50%、6.53%和6.39%,要特別指出的是機(jī)器譯本的代詞比例高出楊譯本兩個(gè)百分比。這進(jìn)一步表明,機(jī)器翻譯的代詞“顯化”尤為突出。具體可見例1:
例1" 英文原文:She flew away with Peter in the frock she had woven from leaves and berries in the Neverland, and her one fear was that he might notice how short it had become; but he never noticed, he had so much to say about himself.[16]190
任譯本:她穿著在夢(mèng)幻島的時(shí)候用樹葉編織鑲漿果的斗篷和彼得一起飛走,她怕彼得會(huì)注意到斗篷變得那么短,可是他根本沒有注意,關(guān)于他本人,他要說的事情太多了。[17]167
楊譯本:溫迪和彼得一起飛走時(shí),身上穿著她在永無島時(shí),用樹葉和漿果編織成的罩褂,她生怕彼得看出這罩褂已經(jīng)變得多么短了;可是彼得根本沒注意,他自己的事,他還說不完呢。[18]158
谷歌譯本:她和彼得一起飛走了,穿著她在夢(mèng)幻島用樹葉和漿果編織的連衣裙,她唯一的擔(dān)心是他可能會(huì)注意到它變得有多短;但他從來沒有注意到,他對(duì)自己有很多話要說。
有道譯本:她穿著在永無島用樹葉和漿果編織的連衣裙,和彼得一起飛走了。她唯一擔(dān)心的是,他會(huì)注意到這件連衣裙已經(jīng)變得很短了。但是他從來沒有注意到,他有那么多關(guān)于他自己的話要說。
從例1可見,楊譯本用人名代替了英語原文中頻繁出現(xiàn)的人稱代詞,使得譯文更加符合中文的閱讀習(xí)慣。而谷歌和有道翻譯無法根據(jù)上下文語境來表達(dá)邏輯關(guān)系以省略不必要的表達(dá),在譯文中顯化代詞,完全對(duì)應(yīng)于英文原文,有些拗口。而且對(duì)于“he had so much to say about himself”的翻譯,谷歌翻譯給出的譯文為錯(cuò)譯,有道譯本對(duì)這句話的處理便優(yōu)于前者。各詞匯比例與高頻詞分析可以交叉印證,機(jī)器翻譯無法識(shí)別上下文語義,無法根據(jù)語境準(zhǔn)確完成雙語轉(zhuǎn)換,譯文相較人工譯文較為生硬拗口。
(四)疊" 詞
Peter Pan是一本兒童讀物,考慮到讀者因素,譯本風(fēng)格應(yīng)遵循原文風(fēng)格,行文生動(dòng),富有童趣,從而吸引廣大兒童。疊詞是漢語中一種特殊的詞匯現(xiàn)象,表現(xiàn)為兩種形式:一是由兩個(gè)相同音節(jié)構(gòu)成的疊音詞,二是由兩個(gè)同詞根重疊組成的重疊詞[19]。根據(jù)疊詞的表現(xiàn)形式,本研究共統(tǒng)計(jì)了12類疊詞,詳見表4。
由表4可見,機(jī)器譯本所運(yùn)用的疊詞數(shù)量大致為人工譯本的一半??梢姍C(jī)器翻譯不善于將詞譯為疊詞這類特殊詞匯,即其在該類詞匯的處理上尚不如人工譯者。從任譯本和楊譯本來看,任譯本所運(yùn)用的疊詞數(shù)更多,該譯本應(yīng)更具趣味性,更富感染力,可體現(xiàn)出任溶溶注重讀者接受,譯文富有童趣。兩個(gè)機(jī)器譯本之間的疊詞數(shù)量也有差異,這可能是由于翻譯系統(tǒng)中雙語語料的不同。具體可見例2和例3。
例2 英文原文:One day when she was two years old she was playing in a garden, and she plucked another flower and ran with it to her mother.[16]3
任譯本:她兩歲的時(shí)候,有一天在花園里玩,摘了一朵花,拿著它噔噔噔跑到媽媽那里。[17]5
楊譯本:她兩歲的時(shí)候,有一天在花園里玩,她摘了一朵花,拿在手里,朝媽媽跑去。[18]4
谷歌譯本:兩歲時(shí)的一天,她在花園里玩耍,摘下另一朵花,跑到媽媽那里。
有道譯本:溫迪兩歲的時(shí)候,有一天她在花園里玩,她摘了另一朵花,帶著它跑向媽媽。
例3 英文原文:They could hear Nana barking, and John whimpered, \"It is because he is chaining her up in the yard\", but Windy was wiser.[16]23
任譯本:他們聽到南娜在汪汪叫,約翰抽抽嗒嗒地說:“都因?yàn)榘职职阉描F鏈拴在院子里了。”可是溫迪更聰明。[17]23
楊譯本:他們聽得見娜娜的吠聲,約翰嗚咽著說:“這都是因?yàn)樗阉┰谠鹤永锪??!笨墒菧氐现赖酶唷#?8]22
谷歌譯本:他們能聽到娜娜在叫,約翰嗚咽著說:“那是因?yàn)樗阉i在院子里了,”但溫迪更聰明。
有道譯本:他們聽見娜娜在叫,約翰嗚咽著說:“那是因?yàn)樗阉┰谠鹤永锪??!钡珳氐细斆鳌?/p>
例2中,任溶溶將“ran”譯為“噔噔噔跑”,其他三個(gè)譯本均譯為“跑”?!班忄忄狻鄙鷦?dòng)形象地表現(xiàn)出兩歲的溫迪想將花朵送給媽媽的喜悅與迫切心情,整個(gè)句子充滿了畫面感。例3中,“barking”和“whimpered”的譯文不太相同,任溶溶將二者分別譯為“汪汪叫”和“抽抽嗒嗒”,楊靜遠(yuǎn)則分別譯為“吠聲”和“嗚咽”,谷歌和有道譯文均為“叫”和“嗚咽”?!巴敉艚小焙汀俺槌猷眱蓚€(gè)疊詞均摹聲,使得原文描述的狗狗“娜娜”和約翰的形象更加生動(dòng),讀起來也朗朗上口。從例2和例3來看,任譯本多處運(yùn)用疊詞,譯本富有童趣,在韻律、形式和語義上更具有美感。由于機(jī)器翻譯往往選取最高頻的譯法,故谷歌和有道的譯文一致,而人工譯者會(huì)根據(jù)不同的語境選擇恰當(dāng)?shù)脑~匯,因此兩個(gè)人工譯者的譯文也有不同之處。
三、句法層面的考察
本研究將句子標(biāo)志設(shè)為問號(hào)、句號(hào)、感嘆號(hào)和省略號(hào),統(tǒng)計(jì)了英文原文與四個(gè)譯本的句子數(shù)和平均句長(zhǎng),并統(tǒng)計(jì)了陳述句、疑問句和感嘆句的使用比例。通過對(duì)平均句長(zhǎng)與句子特征的考察,可對(duì)比分析出四個(gè)譯本在句子層面的語言特征。
(一)平均句長(zhǎng)
小說原文與四個(gè)譯本的句子特征統(tǒng)計(jì)結(jié)果如表5所示??梢姡瑑蓚€(gè)機(jī)器譯本的平均句長(zhǎng)略低于原文句長(zhǎng)但基本一致,而兩個(gè)人工譯本的平均句長(zhǎng)則差距明顯。胡開寶等[1]指出機(jī)器翻譯的一大特征就是以句子為翻譯單位。兩個(gè)機(jī)器譯本平均句長(zhǎng)相同,可見機(jī)器翻譯對(duì)句子本身改動(dòng)不大,在句子層面操縱較少。比較兩個(gè)機(jī)器翻譯的翻譯方法,谷歌翻譯偏向于直譯,而有道翻譯可對(duì)句子進(jìn)行拆譯和合譯,從而導(dǎo)致谷歌譯本與有道譯本的平均句長(zhǎng)尚有細(xì)微差別。任譯本句子數(shù)量高于原文,平均句長(zhǎng)低于原文,這可能是因?yàn)槿稳苋芸紤]到讀者受眾為兒童以及他們文學(xué)接受能力的特殊性,故而減少句子所載的信息量,降低閱讀難度。楊靜遠(yuǎn)追求譯文與原文形式上的對(duì)等,句子數(shù)目與原文相差不大,但其平均句長(zhǎng)略高于任譯本。這表明句子層面分析所得結(jié)論與以上詞匯運(yùn)用分析結(jié)論相同,楊譯本的閱讀難度稍高于任譯本。綜合而言,機(jī)器翻譯拆分與合并處理句子能力尚不如人工譯者,無法像人工譯者那樣根據(jù)原文的含義對(duì)句子作適當(dāng)?shù)母膭?dòng)。
(二)句子特征
從表5可見,小說原文的陳述句、疑問句和感嘆句比例分別為0.90、0.06和0.04,谷歌譯本與有道譯本的三個(gè)比例與原文各類句式比例完全相同,這凸顯出機(jī)器翻譯可準(zhǔn)確識(shí)別出標(biāo)點(diǎn)符號(hào),按照原文句對(duì)句的翻譯。任譯本的陳述句均高于小說原文和楊譯本,疑問句數(shù)量則低于楊譯本,而感嘆句少于小說原文??梢?,任溶溶靈活使用標(biāo)點(diǎn)符號(hào),使得陳述句數(shù)量多于原文,而感嘆句數(shù)量少于原文。而楊譯本陳述句比例與原文相等,疑問句與感嘆句比例與原文有點(diǎn)偏差,楊靜遠(yuǎn)在翻譯句子時(shí)仍會(huì)適當(dāng)改變句子標(biāo)點(diǎn)符號(hào)??傊?,相較于兩種機(jī)器譯本而言,任和楊的譯本對(duì)原文句型的依賴較少,善于靈活轉(zhuǎn)換句型。這進(jìn)一步印證了機(jī)器翻譯無法識(shí)別和處理原文的語義與情感,無法根據(jù)原文含義創(chuàng)造性地改動(dòng)文本句子,搭建更為連貫的篇章,故而機(jī)器翻譯對(duì)文本句子處理的靈活性不如人工譯者。
四、結(jié)" 語
本研究以兒童文學(xué)作品Peter Pan及其四譯本為語料建立一對(duì)四的英漢雙語平行語料庫,從語料庫語言學(xué)及計(jì)量語言學(xué)的角度,運(yùn)用Python、CRIE和Emeditor等統(tǒng)計(jì)工具從17個(gè)語言計(jì)量單位對(duì)人工譯本與機(jī)器譯本的語言特征進(jìn)行了對(duì)比研究。本研究發(fā)現(xiàn):從詞匯方面來看,機(jī)器譯本較人工譯本在詞匯豐富度上沒有明顯優(yōu)勢(shì);機(jī)器翻譯詞性識(shí)別精確,譯文有忠實(shí)于原文的特點(diǎn),但是機(jī)器翻譯缺乏存在詞性轉(zhuǎn)化功能不佳,導(dǎo)致譯本中代詞“顯化”明顯、譯文不貼合漢語表達(dá)習(xí)慣等問題。而人工譯者根據(jù)自身翻譯目的并發(fā)揮主體性,可使譯本在詞匯豐富度上不遜色于機(jī)器譯本,甚至可能略勝一籌;同時(shí)人工譯者可巧妙轉(zhuǎn)化動(dòng)詞與代詞等,善于翻譯疊詞這類特殊詞匯,從而使譯文更貼近譯入語表達(dá)習(xí)慣、滿足讀者需求。從句子層面來看,機(jī)器翻譯可準(zhǔn)確識(shí)別標(biāo)點(diǎn)符號(hào),但其以句子為翻譯單位,缺乏對(duì)表達(dá)內(nèi)容進(jìn)行加工整合的能力,故機(jī)器譯本有行文不流暢、邏輯性不強(qiáng)等缺點(diǎn)。人工譯者可恰當(dāng)?shù)厍蟹只蛘暇渥硬㈧`活使用標(biāo)點(diǎn)符號(hào),因而其譯本更加自然流暢、更具邏輯性。兩個(gè)人工譯本以及兩個(gè)機(jī)器譯本內(nèi)部之間也有差別。人工譯者由于自身的經(jīng)歷與背景不同,其譯本會(huì)呈現(xiàn)出不同的風(fēng)格。有道和谷歌翻譯雖同屬于神經(jīng)機(jī)器翻譯,但由于記憶庫與術(shù)語庫等方面不同,二者對(duì)文本的處理仍存在著差異,各有特色。
文學(xué)作品翻譯不是將源語言轉(zhuǎn)化為目標(biāo)語言的簡(jiǎn)單工作,其應(yīng)具備藝術(shù)性與創(chuàng)造性。即使機(jī)器翻譯轉(zhuǎn)變至發(fā)展到以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),譯文質(zhì)量得到了一定程度的提升,但其仍面臨語義理解、情感識(shí)別和信息抽取等方面的困難,機(jī)器翻譯應(yīng)針對(duì)這幾個(gè)問題加以改進(jìn)。因此,現(xiàn)階段的機(jī)器翻譯在文學(xué)領(lǐng)域仍難以超越人工翻譯。當(dāng)然,本研究所建的語料庫規(guī)模不大而且僅從語言特征層面分析比較四個(gè)譯本。為了更加全面地對(duì)比人工譯本與機(jī)器譯本的異同,后續(xù)需持續(xù)深入地開展相關(guān)研究。
參考文獻(xiàn):
[1]胡開寶, 李翼. 機(jī)器翻譯特征及其與人工翻譯關(guān)系的研究[J]. 中國(guó)翻譯, 2016, 37(5):10-15.
[2]梁君英, 劉益光. 人類智能的翻譯能力優(yōu)勢(shì):基于語料庫的人機(jī)翻譯對(duì)比研究[J].外語與外語教學(xué),2023(3):74-84.
[3]李奉棲. 人工智能時(shí)代人機(jī)英漢翻譯質(zhì)量對(duì)比研究[J]. 外語界, 2022, 211(4): 72-79.
[4]Sheng A, Kong Y. Neural machine translation and human translation:A political and ideological perspective[J]. Babel, 2023, 69(4): 483-498.
[5]韓紅建, 蔣躍. 基于語料庫的人機(jī)文學(xué)譯本語言特征對(duì)""" 比研究:以《傲慢與偏見》三個(gè)譯本為例[J].外語教學(xué),2016,37(5):102-106.
[6]蔣躍, 張英賢, 韓紀(jì)建. 英語被動(dòng)句人機(jī)翻譯語言計(jì)量特征對(duì)比:以《傲慢與偏見》譯本為例[J].外語電化教學(xué),2016(3):46-51.
[7]蔣躍. 人工譯本與機(jī)器在線譯本的語言計(jì)量特征對(duì)比:以5屆韓素音翻譯競(jìng)賽英譯漢人工譯本和在線譯本為例[J]. 外語教學(xué), 2014, 35(5): 98-102.
[8]韓洋. 基于語料庫的兒童文學(xué)漢譯中疊詞的應(yīng)用研究:以李文俊的兒童文學(xué)翻譯為例[J]. 外語電化教學(xué), 2019(3): 15-21.
[9]Baker M. Corpora in translation studies: An overview and some suggestions for future research[J]. Target, 1995,7(2): 223-245.
[10]Baker M. Towards a methodology for investigating the style of a literary translator[J]. Target, 2000(2):241-266.
[11]程勇, 徐德寬, 董軍. 基于語文教材語料庫的文本閱讀難度分級(jí)關(guān)鍵因素分析與易讀性公式研究[J]. 語言文字應(yīng)用, 2020(1): 132-143.
[12]章鈞津,田永紅,宋哲煜,等.神經(jīng)機(jī)器翻譯綜述[J].計(jì)算機(jī)工程與應(yīng)用,2024,60(4):57-74.1-19[2023-10-25].http:∥kns.cnki.net/kcms/detail/11.2127.TP.20230920.1439.060.html.
[13]王克非. 語料庫翻譯學(xué)探索[M]. 上海: 上海交通大學(xué)出版社, 2012: 81.
[14]王克非, 秦洪武. 英譯漢語言特征探討:基于對(duì)應(yīng)語料庫的宏觀分析[J]. 外語學(xué)刊, 2009(1): 102-105.
[15]馮慶華. 思維模式下的譯文與詞匯[M]. 上海: 上海外語教育出版社, 2012: 5.
[16]James Matthew Barrie. Peter Pan [M]. Hertfordshire: Wordsworth Edition Ltd,2018.
[17]巴里.小飛俠彼得·潘[M]. 任溶溶,譯. 北京:少年兒童出版社, 2017.
[18]巴里.小飛俠彼得·潘[M]. 楊靜遠(yuǎn),譯. 北京:中國(guó)畫報(bào)出版社, 2013.
[19]周莉, 劉婭, 崔家平.《黃帝內(nèi)經(jīng)》疊詞基本特征及英譯研究[J]. 時(shí)珍國(guó)醫(yī)國(guó)藥, 2021, 32(8): 1958-1960.
(責(zé)任編輯:陳麗瓊)