——以“有道翻譯官”為例"/>
丁立福,蔣 威
(1.淮南師范學(xué)院 外國語學(xué)院,安徽 淮南 232038;2. 安徽理工大學(xué) 外國語學(xué)院,安徽 淮南 232001)
隨著經(jīng)濟全球化進(jìn)程的加快和互聯(lián)網(wǎng)的日益發(fā)展,網(wǎng)絡(luò)信息激增,國際社會交流愈加頻繁,如何克服交際過程中的語言障礙成為翻譯界的一大課題,機器翻譯應(yīng)運而生。有道翻譯官、谷歌翻譯、百度翻譯、金山詞霸等機器翻譯軟件的出現(xiàn),使翻譯及其研究領(lǐng)域出現(xiàn)了“技術(shù)轉(zhuǎn)向”。機器翻譯又可稱為計算機翻譯,簡單來說就是“利用計算機將一種語言符號轉(zhuǎn)換成另一語言符號”。機器翻譯軟件操作簡單、成本低廉、效率較高且能做到大規(guī)模翻譯,給人們了解世界進(jìn)而進(jìn)行交流帶來了莫大的便利。
1954年世界上第一臺翻譯機器投入試驗,IBM公司使用IBM-701計算機將幾個簡單的俄語句子翻譯成了英語,從此掀起了機器翻譯研究的浪潮。20世紀(jì)70年代末,機器翻譯開始走向?qū)嵱没?,一系列機器翻譯實用系統(tǒng)如EURPOTRA多國語翻譯系統(tǒng)、Weinder系統(tǒng)、TAUM-METEO系統(tǒng)問世并投入機器翻譯實踐之中。1997年,西班牙學(xué)者Neco和Forcada提出神經(jīng)網(wǎng)絡(luò)法,利用“編碼-解碼”框架進(jìn)行翻譯。2002年美國Language Weaver公司將統(tǒng)計機器翻譯軟件商品化,研制出統(tǒng)計機器翻譯軟件(Statistical Machine Translation Software)。2015年百度發(fā)布了將統(tǒng)計和自動學(xué)習(xí)相結(jié)合的在線機譯系統(tǒng)。Facebook2017年推出基于卷積神經(jīng)網(wǎng)絡(luò)開發(fā)的語言翻譯模型(Convolutioanal Neural Machine Translation),實現(xiàn)了目前為止機器翻譯質(zhì)量的大幅提升?,F(xiàn)今,最新的研究是將生成對抗網(wǎng)絡(luò)(GAN)與神經(jīng)機器翻譯(NMT)兩者結(jié)合到一起,提出Adversarial-NMT新框架并得到了很好的實驗效果。相信隨著研究的不斷深入和商業(yè)領(lǐng)域的創(chuàng)新實踐,機器翻譯將會給人們帶來更多驚喜。
機器翻譯作為未來翻譯發(fā)展的大趨勢,對國家市場經(jīng)濟和人民社會生活影響深遠(yuǎn)?,F(xiàn)代機器翻譯的研究可以追溯到20世紀(jì)50年代。在機器翻譯發(fā)展的初級階段,學(xué)者側(cè)重于機器翻譯技術(shù)研究,主要集中在機器翻譯自動化技術(shù)、機器翻譯評測技術(shù)、機器翻譯多系統(tǒng)融合技術(shù)等方面。后期研究側(cè)重于機器翻譯翻譯方法,被普遍研究的方法有直接翻譯方法、句法轉(zhuǎn)換方法、中間語言方法、基于規(guī)則的方法與基于語料庫的方法等?,F(xiàn)階段隨著科學(xué)技術(shù)的飛速發(fā)展,學(xué)者對機器翻譯的研究不只停留在技術(shù)和翻譯方法層面,更多學(xué)者開始從外界因素角度研究機器翻譯,而非研究機器翻譯本身。有些學(xué)者將機器翻譯與人工翻譯進(jìn)行比較,指出二者之間的關(guān)系為互補和互動。在確保機器翻譯譯文高質(zhì)量的前提下,機器翻譯不能脫離人工譯后編輯的輔助;反之,人工翻譯同樣需要機器翻譯的協(xié)助,以實現(xiàn)大規(guī)模和高效率的翻譯。另有學(xué)者從本地化角度研究機器翻譯,初次提及文化對機器翻譯的影響。然而值得遺憾的是,真正站在“文化語境”高度研究機器翻譯的鮮有人跡。
文化語境成為機器翻譯難以考慮的盲點,也是影響機器翻譯質(zhì)量的關(guān)鍵,可以推斷,如何基于文化語境提高機器翻譯質(zhì)量將是未來數(shù)年需要不斷深入研究的課題。有鑒于此,本文以“有道翻譯官”為例,從文化語境所涵蓋的四大要素深入探討其對機器翻譯質(zhì)量的影響,繼而論述應(yīng)對當(dāng)下機器翻譯弊端的諸種策略,以期為提高機器翻譯質(zhì)量和機器翻譯研究提供一些參考。
要提高機器翻譯的譯文質(zhì)量,首先要解決的是機器翻譯本身而不是程序設(shè)計問題,若只依靠若干程序來做機器翻譯系統(tǒng),是無法提高機器翻譯質(zhì)量的。因此,全面分析機器翻譯的特征至關(guān)重要。機器翻譯本質(zhì)上是一種基于雙語描寫、對比和匹配結(jié)果的形式化和程序化處理,以實現(xiàn)不同語言的自動翻譯,其特征主要表現(xiàn)為翻譯效率高、翻譯自由度低、受語境制約等。
隨著經(jīng)濟全球化的發(fā)展,翻譯的工作量與日俱增,機器翻譯的文字處理能力也隨之增強。機器翻譯從二十世紀(jì)七八十年代只能翻譯語法簡單的句子到現(xiàn)在能處理大篇幅的文章,其翻譯規(guī)模轉(zhuǎn)變巨大。針對一些專業(yè)性強、文字量大的技術(shù)資料或?qū)W術(shù)論文,機器翻譯占有很大優(yōu)勢。比如,在翻譯實踐中,難免會遇到加急文件,成千上萬字的源語言文本需要在半個工作日完成,對于一個沒有熟練技巧和豐富經(jīng)驗的譯員來說,是很難適應(yīng)這種工作難度的。職業(yè)筆譯譯員正常翻譯速度約2 000-4 000字詞/天,對于文學(xué)類翻譯和法律合同類翻譯等難度較大的文本,譯員的翻譯速度會有所降低,平均近1 000-1 500字詞/天。而“相關(guān)研究表明,機器翻譯的速度是人工翻譯的5-6倍”,機器翻譯可以在較短時間內(nèi)對大量源語言文本進(jìn)行翻譯處理,其翻譯速度遠(yuǎn)遠(yuǎn)超過人工翻譯。一臺機器翻譯軟件翻譯速度大概在25 000字詞/天,其中還含有譯后編輯的時間。
人工翻譯最大的優(yōu)勢在于譯者是靈活的,而機器設(shè)備軟件卻是死板的。譯者可以理解源語言文本所處的具體語境,從而進(jìn)行翻譯。在遇到問題時,譯者可以與客戶和團隊進(jìn)行有效的交流,從而更針對性地處理譯文,以提高譯文質(zhì)量和翻譯效果。因此,人工翻譯的翻譯自由度相當(dāng)高,具有很大的操作空間。機器翻譯沒有人工翻譯所具有的思維、推理、判斷能力,存在一些不可控性,缺乏人工譯者基本的綜合知識和長期培養(yǎng)的文化素養(yǎng)等,無法對源語言文本進(jìn)行全面的分析,只能在限定的范圍內(nèi)進(jìn)行翻譯。因次,產(chǎn)出的譯文缺乏思維能力和創(chuàng)造性。
馬林諾夫斯基1923年最早提出“語境”概念,他提出:“語言基本上植根于說該語言的民族的文化、社會生活和習(xí)俗,不參照這些廣泛的語境變難以理解語言。”語境可以分為語言語境、情景語境和文化語境。
語言語境是指詞、短語、語段或篇章的內(nèi)部環(huán)境,或稱上下文。情景語境是指篇章產(chǎn)生時的周圍情況,包括時間、地點、參與者關(guān)系和交際方式等。文化語境是指說話人或作者所處的語言社團的歷史、文化和風(fēng)俗人情。機器翻譯在翻譯過程中受到語言語境、情景語境和文化語境的制約。語言語境限制了譯文的詞義、句法和篇章結(jié)構(gòu);情景語境關(guān)系著譯員的翻譯策略和方法,同時也影響著譯文的翻譯風(fēng)格;文化語境主要制約著機器翻譯譯文的意義傳達(dá),文化語境的缺失會導(dǎo)致譯文意義模糊或出現(xiàn)歧義現(xiàn)象,嚴(yán)重影響著譯文的質(zhì)量。因此,在上述三種語境制約因素中,文化語境對機器翻譯質(zhì)量的影響最為顯著。
“翻譯也具有創(chuàng)作成分”,主要是相對于文化語境及其轉(zhuǎn)換而言的。文化語境概念最早由馬林諾夫斯基(Malinowski)提出,他認(rèn)為:“每個言語社團都有自己的歷史、文化、風(fēng)俗習(xí)慣、社會規(guī)約、思維方式、道德觀念和價值取向。而這種反映特定言語社團特點的方式和因素就構(gòu)成了文化語境。”。基于這一概念及其內(nèi)涵,下文擬從歷史文化、地理文化、風(fēng)俗文化和思維方式四方面探討文化語境因素對機器翻譯的限制。另需說明,本文所用語料主要來自于中國知網(wǎng)和萬方數(shù)據(jù)庫。
各國家都有其不同的發(fā)展歷程,歷史的不同導(dǎo)致國家之間形成各異的歷史文化。源語言作者在創(chuàng)作時也會因歷史文化背景不同在表達(dá)方式上存在差異。因此譯者在翻譯時應(yīng)尤為注意這些差異。例如,“龍”在中國是民族象征,是文化象征,中國古代的封建皇帝都自喻“真龍?zhí)熳印?;然而西方歷史文化中其含義并非如此,如《圣經(jīng)》中“dragon”是一個邪惡的象征,與上帝不和的撒旦惡魔被稱為“the great dragon”。所以,譯者在翻譯時應(yīng)考慮該詞因歷史文化不同所產(chǎn)生的特殊含義,使譯文彰顯出特定的歷史文化色彩。如:
例1 原文:科舉制度
譯文(有道翻譯官):The imperial examination system
例1中,有道翻譯官的譯文采取了直譯方式進(jìn)行翻譯,但忽略了歷史文化因素。隨著社會進(jìn)步與歷史發(fā)展,很多詞語已逐漸演變成歷史詞匯,在翻譯這一類詞語時要加以解釋,否則讀者不能理解其真正含義。因此“科舉制度”應(yīng)譯為“Imperial examination system (from the Sui Dynasty to the Qing Dynasty),解釋中注明了科舉制度從誕生到結(jié)束的歷史朝代,讓讀者能夠在特定歷史背景下真正理解“科舉制度”一詞。
例2原文:To meet one's Waterloo
譯文(有道翻譯官):遭遇滑鐵盧
滑鐵盧原是歐洲歷史上著名的滑鐵盧戰(zhàn)役的發(fā)生地,拿破侖在滑鐵盧戰(zhàn)役慘敗后就開始走下坡路了,后來引申為一個人失敗的地方或是讓一個人就此失敗的一件事情。從例3中可以看出,有道翻譯官的譯文有些不盡如人意,甚至令人費解?!癟o meet one's Waterloo”顯然不可直譯成“遭遇滑鐵盧”,可意譯為“一敗涂地”。因此,在翻譯時,譯者應(yīng)考慮詞匯因歷史文化因素而產(chǎn)生的引申意義。
地理文化是指受到地理環(huán)境影響而形成的具有地域特色的文化。如英國所處的地理位置為溫帶海洋性氣候,四季寒暑變化不大,夏天氣候溫和濕潤,是全年最舒適的季節(jié),因此夏天在英國就成為了一種美好的象征。莎士比亞曾在他的詩《我可否將你比作一個夏日》中通過將女孩比作夏天表達(dá)他對女孩的傾慕之情。英國是一個多島嶼國家,四面環(huán)水,所以英語表達(dá)中常見“water”一詞;而中國多高山,表達(dá)中經(jīng)常使用“土”字。如英語中“To spend money like water”與漢語相對應(yīng)的譯文為“揮金如土”。地理文化差異會對翻譯的表達(dá)習(xí)慣產(chǎn)生影響。如:
例3 原文:雨后春筍。
譯文(有道翻譯官):Bamboo shoots after a spring rain.
中國的地理環(huán)境形成了中國盛產(chǎn)竹筍這一特征,漢語中用竹筍作比喻的言語并不鮮見;然而英國并不產(chǎn)竹筍,所以不見有用竹筍來作比喻。有道翻譯官將“雨后春筍”直譯為“Bamboo shoots after a spring rain”,這種表達(dá)顯然不符合英語國家的表達(dá)習(xí)慣。但英國地理氣候條件適宜蘑菇生長,英語表達(dá)中常出現(xiàn)“mushroom”一詞,因此,與之相符的譯文應(yīng)為“Like mushrooms after rain”。
風(fēng)俗文化是指一個國家、民族、地區(qū)中集居的民眾所創(chuàng)造、共享、傳承的風(fēng)俗習(xí)慣。各國家民族特質(zhì)不同,風(fēng)俗文化也各異,呈現(xiàn)多元化的特性。如,在中國“?!睘楣糯r(nóng)業(yè)做出了巨大的貢獻(xiàn),老黃牛是一種吃苦耐勞的象征,而西方國家卻主要靠馬勞作,因此在翻譯時應(yīng)注意將兩種動物靈活對換。如,英語表達(dá)“as strong as a horse”可譯為“力大如?!保皌alk horse”可譯為“吹?!?。不同民族的語言反映著其民族自身的文化特點,因而在翻譯實踐中必須多注意源語言字面意思以外的內(nèi)涵意義,使譯文既保留原文的語言形象,又注重風(fēng)俗文化的呈現(xiàn)。如:
例4 原文:Working in office is my bread and butter.
譯文(有道翻譯官):辦公室工作就是我的面包和黃油。
有道翻譯官對例4的譯文顯然過于直譯,意義表達(dá)不明確。“bread”和“butter”作為熱量極高的食物,深受西方人的喜愛。隨著時間的推移,“面包”和“黃油”被賦予了文化色彩,用來指一個家庭或個人的經(jīng)濟收入或經(jīng)濟來源。因此,此句應(yīng)譯為“辦公室工作是我的經(jīng)濟來源?!?/p>
例5原文:There is no smoke without fire.
譯文(有道翻譯官):沒有火就沒有煙。
“There is no smoke without fire”被有道翻譯官直譯為“沒有火就沒有煙”,顯然沒有考慮到漢語的風(fēng)俗文化。漢語表達(dá)中偏愛使用“風(fēng)浪”一詞表示因果關(guān)系,“有風(fēng)就有浪”,“無風(fēng)不起浪”是漢語中的常見之詞。因此原文若譯為“無風(fēng)不起浪”,其譯文表達(dá)與漢語的文化更為貼切。
不同的自然環(huán)境和人文條件使人們在思維方式和表達(dá)方式上有所差異。英語表達(dá)屬于線性思維,多注重結(jié)構(gòu)、多長句、多從句、多名詞化、多被動、多引申和多省略;而漢語表達(dá)屬于彈性思維,多注重語義、多短句、多分句、多動詞化、多主動、多重復(fù)、多推理和多補充。英漢語思維方式表達(dá)的巨大差異要求機器翻譯軟件要有較強的思維轉(zhuǎn)換和思維應(yīng)變能力,進(jìn)而能夠更佳地處理源語言文本。
例7原文:We finished dinner and bought some fruits, then backed home.
譯文(有道翻譯官):我們吃過晚飯,又買了一些水果,然后就回家了。
有道翻譯官的譯文看似天衣無縫,意義明確,卻不符合漢語的表達(dá)習(xí)慣。英語長句中偏好使用一些連詞從而使句子連貫,但漢語表達(dá)不需要這些連詞,翻譯時應(yīng)盡量略去使句子精煉簡潔。因此這句話在修改之后可譯為“我們吃過晚飯,買了一些水果就回家了”。習(xí)慣的養(yǎng)成不可能一朝一夕完成,而機器翻譯的“習(xí)慣養(yǎng)成”在于提高機器翻譯軟件的記憶能力,擴充與之相關(guān)的語料庫。
機器翻譯在翻譯速度和規(guī)模上遠(yuǎn)遠(yuǎn)超越了人工翻譯,但其仍存在諸多弊端和不足。在處理結(jié)構(gòu)復(fù)雜的源語言文本時,機器翻譯機械化和自動化的特征導(dǎo)致其自身缺乏復(fù)雜性和創(chuàng)造性思維,不能對原文做出復(fù)雜的推理和判斷,致使譯文語義扭曲,令人費解。再者,機譯時文化語境的缺失也會讓譯文質(zhì)量大大降低,出現(xiàn)歧義、意義含糊不清現(xiàn)象。最后,機器翻譯譯文處理必須經(jīng)過譯后編輯這一過程,包括譯文校對、譯文審核和譯文定稿等繁瑣流程,需消耗巨大的人力、物力和財力。而采取以下策略有望解決以上不足,提高機器翻譯的質(zhì)量。
語言是人類最偉大的發(fā)明創(chuàng)造之一,人類對語言認(rèn)知是初步的,源于語言系統(tǒng)的復(fù)雜性和人類邏輯思維和判斷能力的局限性。機器翻譯若像人腦一樣靈活地處理自然語言絕非易事,譯者與翻譯系統(tǒng)之間要互相配合。機器翻譯一般借助門限循環(huán)單元、注意力機制和長短時記憶網(wǎng)絡(luò)等進(jìn)行翻譯,將源語言文本進(jìn)行向量化,極大提高了翻譯效率。人工譯后編輯主要用來提高機器翻譯譯文的精確度,對譯文進(jìn)行編輯和潤色,修改機器翻譯譯文的錯誤。機器翻譯和人工翻譯并非獨立個體,二者應(yīng)相輔相成。前者可以大量處理一些程式化文本和信息化文本,如科技文本、法律文本、合同等,以提高翻譯速度,減少了人工翻譯強度;反之,對于一些文學(xué)性強、創(chuàng)造性程度高、情感性豐富的源語言文本,機器翻譯需人工的輔助,以產(chǎn)出質(zhì)量高且富有人性化的譯文。
隨著人工智能和大數(shù)據(jù)時代的到來,機器翻譯系統(tǒng)發(fā)展迅速,主要包括基于規(guī)則的機器翻譯系統(tǒng)、統(tǒng)計機器翻譯系統(tǒng)和神經(jīng)網(wǎng)路機器翻譯系統(tǒng)?;谝?guī)則的機器翻譯系統(tǒng)主要通過中間語言實現(xiàn)源語言和目標(biāo)語言的轉(zhuǎn)換,注重句法和語法的分析。統(tǒng)計機器翻譯系統(tǒng)引入了語料庫方法、多元統(tǒng)計法和實例分析法等,使機器翻譯可以大規(guī)模從語料庫里獲取與源語相對的譯入語。統(tǒng)計機器翻譯系統(tǒng)也是谷歌、百度、微軟等多家翻譯公司的核心技術(shù)。神經(jīng)網(wǎng)路機器翻譯系統(tǒng)具有組織和自學(xué)習(xí)能力,其能從語料庫中自主識別源語的語言規(guī)則和特征,可對復(fù)雜源語進(jìn)行分層處理,轉(zhuǎn)化成計算機能夠“理解”的形式,最后形成準(zhǔn)確性和可讀性高的譯文。三種翻譯技術(shù)各有其獨特的優(yōu)勢,如能將三者優(yōu)勢結(jié)合,可大大提高機器翻譯的質(zhì)量。
文化語境不能脫離現(xiàn)實而存在,一般在事件發(fā)生的環(huán)境中產(chǎn)生。若將文化語境徹底地融入到機器翻譯系統(tǒng)的語料庫中,需建立三維或四維的空間,以現(xiàn)在的科學(xué)技術(shù)尚不可實現(xiàn)。但機器翻譯系統(tǒng)的語料庫具有記憶功能,可向其擴充一些約定成俗、變化程度小、模式穩(wěn)定的文化因素,如成語、諺語、不同語種表達(dá)習(xí)慣、簡單的思維方式等。與語言語境和情景語境相比,文化語境靈活性強,且會隨著時代的更迭而變化。因此,機器翻譯系統(tǒng)的語料庫應(yīng)實時更新,以適應(yīng)社會文化的潮流,提高譯文的時代性特征。
從前方論述可以看出,若要提高機器翻譯質(zhì)量,不僅要考慮機器翻譯自身的技術(shù)因素,也要考慮文化語境的影響因素。歷史文化、地理文化、風(fēng)俗文化和思維方式作為文化語境所涵蓋的四大要素嚴(yán)重影響著機器翻譯質(zhì)量。在機譯過程中,文化語境的缺失會導(dǎo)致機譯譯文出現(xiàn)歧義、語義不明等現(xiàn)象。消除機器翻譯這一弊端的關(guān)鍵在于要把文化語境融入機器翻譯之中,加強機譯和人工的交互協(xié)作、融合多種機器翻譯系統(tǒng)優(yōu)勢、補充基于文化語境的語料庫等策略均可提高機器翻譯質(zhì)量。隨著科學(xué)技術(shù)的進(jìn)步和人工智能時代的到來,機器翻譯研究將更加科技化、現(xiàn)代化和時代化,對于研究者來講,此趨勢既是機遇,又是挑戰(zhàn)。