陳友勛
(重慶文理學(xué)院外國語學(xué)院,重慶永川402160)
真正從事職業(yè)翻譯的人員,一般都對 MT(Machine Translation:機(jī)器翻譯)嗤之以鼻,而對TM(Translation Memory:翻譯記憶)情有獨(dú)鐘。在他們看來,MT完全是糊弄外語盲的花哨噱頭,沒有任何實用價值,用它翻譯出來的文章全是錯誤,不忍卒讀,去檢查和修正這些錯誤所花的時間和精力,甚至遠(yuǎn)遠(yuǎn)超出譯者自己獨(dú)自翻譯源文所需投入的時間和精力,因此絕大多數(shù)譯者寧愿全靠自己人工翻譯也不愿求助于機(jī)器翻譯。但對于TM,以及以 TM為核心而建立起來的 CAT(computer aided translation:計算機(jī)輔助翻譯)軟件,絕大多數(shù)譯者都是非常器重,認(rèn)為TM給翻譯帶來了真正意義上的技術(shù)革命,大大提高了譯者翻譯的效率和準(zhǔn)確性,具有極為寶貴的實用價值。
其實無論MT還是TM,都是人類在認(rèn)知經(jīng)濟(jì)原則驅(qū)動下,試圖減輕翻譯難度而進(jìn)行的一種積極探索或有益嘗試,其背后都體現(xiàn)了人類追求效益的認(rèn)知取向。這些探索或嘗試本身,不論成敗,都是一種積極而有益的努力:因為成功的探索固然讓我們享受到了它對翻譯實踐的促進(jìn)效果,但失敗的嘗試至少也給我們揭示了提高翻譯效率將要努力的方向。
關(guān)于翻譯,圣經(jīng)中有一個著名的故事叫做The Story of Babel(見《圣經(jīng)·舊約》創(chuàng)世紀(jì)第十一章)。對于其中的Babel,漢語中有兩種譯法,分別是“通天塔”和“巴別塔”。筆者認(rèn)為前者是一種意譯的結(jié)果,強(qiáng)調(diào)的是人們對翻譯所寄予的一種厚望,即希望借翻譯之功重修“通天”之塔——完成傳說中人類未竟之業(yè)(Come,let us build ourselves a city,with a tower that reaches to the heavens,so that we may make a name for ourselves and not be scattered over the face of the whole earth:讓我們修建一座通天之塔,以此揚(yáng)名立萬并永不分離)。這也間接反映出人們在翻譯實踐中追求的理想境界是像故事源文所宣揚(yáng)的那樣“(if)as one people speaking the same language…,then nothing they plan to do will be impossible for them”,即通過翻譯幫助人們達(dá)到像說同一種語言的效果,可以溝通無障礙,做任何事情都無往而不利。而在本文中我們要談?wù)摰腗T,可以說就是人們在改造翻譯實踐時產(chǎn)生的這種“重建通天塔”似的努力。
機(jī)器翻譯(Machine Translation:簡寫為MT)是探索如何借助計算機(jī)程序?qū)⑽淖只蛘Z音從一種自然語言翻譯成另外一種自然語言的技術(shù)。人們曾懷著美好的愿望,期待有一天所有的翻譯問題都能交給計算機(jī)自動完成,從此人類可以從語言交流的障礙中解脫出來,更加自如地專注于自己的事業(yè)。但早在機(jī)器翻譯問世之初,美國著名數(shù)理邏輯學(xué)家Bar-Hillel就指出,除非計算機(jī)可以自動根據(jù)語料習(xí)得語義,否則全自動高質(zhì)量的機(jī)器翻譯(Fully Automatic and High Quality MT)就是不可能的。而美國科學(xué)院語言自動處理咨詢委員會在1964年曾專門調(diào)查過機(jī)器翻譯的研究情況,并在報告中對機(jī)器翻譯也采取了否定的態(tài)度,指出機(jī)器翻譯研究遇到了難以克服的“語義障礙”(semantic barrier)問題。更有甚者,他們嘲笑說MT不是 machine translation的縮寫,而是指mad translation(瘋子的翻譯)。在這方面,德國翻譯學(xué)者Snell-Hornby的觀點具有代表性:“毫無疑問,技術(shù)的產(chǎn)物,無論怎么復(fù)雜,都不能和人腦的創(chuàng)造能力相媲美?!?Snell-Hornby,1997:66)事實果然如此。盡管人類進(jìn)入了二十一世紀(jì),盡管計算機(jī)技術(shù)也突飛猛進(jìn),同時我們對語言的研究也日益深入,但機(jī)器翻譯離真正的實用階段還差得太遠(yuǎn)。
所以,盡管人類提出TM的初衷是良好的,是希望借此一勞永逸地解決翻譯中的所有問題,從而可以重返遠(yuǎn)古社會人類交流的“黃金時代”——(the whole world had one language and a common speech:人們使用同樣的語言,說著同樣的口音)。但是,正如圣經(jīng)中修建通天塔的努力最終夭折一樣,MT在現(xiàn)實生活中也遭受了同樣的命運(yùn),被證明只是一種不切實際的烏托邦,是翻譯中的最終幻想(final fantasy)。
前文提到,漢語中對Babel第二種流行譯法是“巴別塔”,這主要強(qiáng)調(diào)現(xiàn)實生活中人類語言千差萬別的實際狀態(tài),而這也反映出我們對翻譯的探索已經(jīng)從理想的高空回歸到現(xiàn)實的大地上,開始腳踏實地地探索翻譯現(xiàn)象。于是在機(jī)器翻譯(MT)裹足不前的時候,翻譯記憶(TM)的概念應(yīng)運(yùn)而生,并且,正如下文即將論及的那樣,這一轉(zhuǎn)變在翻譯實踐中被證明是極為成功的。所以,如果MT代表的是重建“通天塔”的幻想,那么TM則代表了實踐中人類利用“巴別塔”所取得的輝煌。
翻譯記憶(Translation Memory,翻譯記憶,簡寫為TM)是“譯者運(yùn)用計算機(jī)程序部分參與翻譯過程的一種翻譯策略?!?Shuttleworth&Cowie,1997:98)它是通過計算機(jī)軟件來實現(xiàn)的專業(yè)翻譯解決方案。形式最簡單的翻譯記憶只是一個數(shù)據(jù)庫,譯者可以記錄(通常是半自動化地)以前的翻譯結(jié)果以便于將來再次使用以及進(jìn)行方便有效的檢索。換言之,翻譯記憶的工作原理是計算機(jī)利用用戶已有的原文和譯文,建立起一個或多個翻譯記憶庫,在翻譯過程中,電腦將自動搜索翻譯記憶庫中相同或相似的語料資源(如句子、段落等),給出參考譯文,使用戶避免無謂的重復(fù)勞動,只需專注于新內(nèi)容的翻譯。并且,對于給出的參考譯文,譯者可以完全照搬,也可以修改后使用,如果覺得不滿意,還可以棄之不用。正是在這個意義上,翻譯記憶實際起到了輔助翻譯的作用,所以叫做“Computer-Aided Translation”(計算機(jī)輔助翻譯:CAT)。
國際上開發(fā)翻譯記憶(TM)軟件的廠家有很多,比較著名的有 Trados,SDL X,Dejavu,Transit,WordFisher,Wordfast等。國內(nèi)的有雅信 CAT、通譯等,其中最為知名和廣泛使用的是德國的塔多思(Trados)。
目前在職業(yè)翻譯領(lǐng)域,CAT軟件的使用是極為廣泛的,不少翻譯公司甚至同時使用好幾套不同的CAT軟件,這樣可以取長補(bǔ)短,配合使用,以此滿足譯者的不同要求,最大程度地提高翻譯的效率。其實,這些軟件盡管具體形式有所變化,但都是基于TM而設(shè)計開發(fā)的,TM才是他們的核心概念。因此,限于篇幅,我們在本文中無暇論及這些CAT軟件的表面差異,只是希望針對MT和TM做進(jìn)一步的探討,尋找其中的認(rèn)知根源,加深我們對它們的認(rèn)識,進(jìn)而促進(jìn)我們對CAT軟件的改進(jìn)和革新。
黑格爾曾說,存在的都是合理的,而合理的都是自然的。于是人們對周圍的事物往往因見慣不驚而疏于去探詢其中的究竟。這種情況同樣體現(xiàn)在我們對MT和TM的態(tài)度上。我們想當(dāng)然地只是把MT和TM當(dāng)成人類翻譯實踐中兩種努力方向,很少有人去研究其背后是否隱藏著某種認(rèn)知規(guī)律,更別說是具體探究這些規(guī)律是否存在相同之處。這種情況,被美國認(rèn)知心理學(xué)家 Fodor(1983,107;2002,89)恰當(dāng)?shù)乜偨Y(jié)為“認(rèn)知科學(xué)不存在的第一條法則”,即對于越是常見的認(rèn)知現(xiàn)象,人們越是習(xí)以為常,鮮有研究?;蛘咦鰝€通俗的類比,常見現(xiàn)象背后隱藏的認(rèn)知規(guī)律,就好比人們生活中的鹽:作為基本的調(diào)味品,雖然家家必備、頓頓不缺,但平時很少有人對它加以關(guān)注,遑論研究??蛇@種現(xiàn)象若任其發(fā)展下去,顯然也不利于我們對它們進(jìn)行深入的探索和改進(jìn)。就像人們一直不對生活用鹽加以研究,也就不會促進(jìn)食鹽工業(yè)的發(fā)展,于是今天的超市柜臺上也就不會出現(xiàn)低鈉鹽、調(diào)味鹽、麻辣鹽、胡椒鹽、湯料鹽、保健鹽等五花八門的含鹽調(diào)料,從而豐富飲食結(jié)構(gòu),提高生活質(zhì)量。因此,本文將對職業(yè)翻譯中的這類“鹽”現(xiàn)象——即翻譯實踐中的 MT和 TM概念,做一個類似的深入研究,以期找出其中的認(rèn)知規(guī)律,提高我們對翻譯認(rèn)知本質(zhì)的認(rèn)識,并在此基礎(chǔ)上對CAT軟件的設(shè)計提供改進(jìn)意見。
其實,在翻譯中無論是應(yīng)用MT還是TM,從最基本的認(rèn)知層面上卻是相通的,其中都體現(xiàn)了人類一以貫之的認(rèn)知策略——省力原則(the Principle of Least Effort)(Zipf,1949)。在認(rèn)知研究中,“省力原則”又被稱為認(rèn)知的經(jīng)濟(jì)原則(the economy principle),可以簡單地概括為:以最小的代價換取最大的收益,或者從反面解釋,人類總是傾向于在完成任務(wù)時采用偷懶的方法。法國語言學(xué)家馬爾丁內(nèi)(Martinet,1962)認(rèn)為認(rèn)知經(jīng)濟(jì)原則是語言“運(yùn)轉(zhuǎn)的基本原理”(Principle de fonctionannement),是指導(dǎo)人類行為的一條根本性原則。姜望琪(2005)則撰文指出,經(jīng)濟(jì)原則體現(xiàn)了人類行為的一種惰性趨向,卻是“指導(dǎo)人類行為的一條根本性原則”。
例如,人類研究機(jī)器翻譯,其目的是想一勞永逸地解決困擾我們的語言溝通問題。但由于遭遇到難以克服的語義障礙,MT研究至今裹足不前,事實上成為了一個翻譯研究中的通天塔幻想。這種情況,正如有的學(xué)者所概括的那樣“MT做了人類想做的事情,但沒有做好?!?/p>
而TM借鑒了MT失敗的教訓(xùn),不再好高騖遠(yuǎn),而是腳踏實地,主要是代替人類老老實實地完成翻譯中那些機(jī)械的重復(fù)和繁瑣的查詢工作。而做這方面的工作正好是人類的弱項、電腦的長項,因此人類在翻譯實踐中應(yīng)用TM可謂是讓人腦與電腦達(dá)到了取長補(bǔ)短、珠聯(lián)璧合的效果。根據(jù)前面的介紹,我們知道翻譯記憶就是充當(dāng)譯者的擴(kuò)展記憶庫,為他積累以前的翻譯經(jīng)驗,讓譯者對同一個句子不必翻譯兩遍,從而達(dá)到節(jié)約時間、提高效率、同時保證譯文前后一致的積極作用。這正如有的學(xué)者評價的那樣“TM做了人類不想做的工作,但是做得相當(dāng)好”。
到目前為止,在這場MT和TM的較量之中,TM能夠勝出的最主要原因可以歸結(jié)為語義現(xiàn)象產(chǎn)生的瓶頸效應(yīng)。
我們知道,目前無論是MT還是TM,其計算根據(jù)都是人類對語義現(xiàn)象的外部形態(tài)進(jìn)行描寫、總結(jié)、并進(jìn)而轉(zhuǎn)換成電腦程序而實現(xiàn)的,因此翻譯研究中的語義問題構(gòu)成了MT和TM發(fā)展過程中的一個瓶頸。
語言表達(dá)與語言意義之間是形式和內(nèi)容的關(guān)系,從哲學(xué)上講,形式是表現(xiàn)屬性,內(nèi)容才是變化的根本。從語言學(xué)的角度,二者相當(dāng)于喬姆斯基提出的語言運(yùn)用 (linguistic performance)與語言能力(linguistic competence),或表層結(jié)構(gòu)(surface structure)和深層結(jié)構(gòu)(deep structure)之間的關(guān)系。在翻譯過程中,如果要排除語義的影響而不影響表達(dá)結(jié)果的準(zhǔn)確性,除非我們能夠事先窮盡人類所有可能的語義-表達(dá)的配對形式,并把它們?nèi)哭D(zhuǎn)化為計算機(jī)可以識別的程序語言,而這顯然是不現(xiàn)實的想法。因為人類語言無論是其形式還是其意義本身,都是在無法預(yù)料的動態(tài)的因素(如語境)下綜合作用而產(chǎn)生的,具有創(chuàng)造性是其鮮明的特征,即既可以用有限的形式表達(dá)無限的意義,也可以把同樣的意義用無限的形式來表達(dá)。而人類是不能超越無限的,這就決定了語言的形式和意義之間絕不可能存在某種確然的一一對應(yīng)關(guān)系。既然語言形式-意義之間的配對關(guān)系不存在確然性和有限性這兩個基本的前提,那么翻譯問題從邏輯上就不可能單單依靠其形式特征,即指望通過頻率統(tǒng)計從而簡化為機(jī)械的匹配過程。換言之,計算機(jī)要解決翻譯問題,必須另辟蹊徑。
喬姆斯基認(rèn)為人類有一套天生的語言習(xí)得機(jī)制(LAD),可以靠有限的輸入獲得無限的語言語用能力。所以這個語言習(xí)得機(jī)制的核心就是人腦對語言現(xiàn)象的自我適應(yīng)和學(xué)習(xí)。而目前電腦之所以不具備處理語義的基本能力,也就在于電腦不具備自我學(xué)習(xí)的能力,沒有這方面的任何主動性和智能性。也就是說,在習(xí)得語言方面,電腦完全是被動的、靜態(tài)的,無法處理新出現(xiàn)的語言現(xiàn)象,因此MT在發(fā)展的道路上被擋在了“此路不通”的牌子前,而TM正好是明智地避開了對語義現(xiàn)象的直接處理而把電腦的長處訴諸對語言之間的轉(zhuǎn)換特征進(jìn)行形式計算,所以才發(fā)展出一片廣闊的天空。所以,正是對翻譯過程中所涉及的語義現(xiàn)象采取了不同的態(tài)度(面對或回避),才導(dǎo)致MT和TM今天不同的命運(yùn)。
基于同樣的原因,筆者也相信,除非將來有一天,計算機(jī)可以要采用發(fā)展的、可以自我修正、更新和擴(kuò)展的語言處理系統(tǒng),即智能化語言程序,擺脫一切都只能靠外部輸入的被動局面,否則我們還是不要指望MT能夠有比今天更好的作為,而應(yīng)當(dāng)繼續(xù)關(guān)注和發(fā)展TM的務(wù)實道路。
此外,TM勝出的原因還在于職業(yè)翻譯所涉及的材料具有單一性和專業(yè)性,具有相對固定的術(shù)語范圍和表達(dá)模式。從語言學(xué)的角度分析,人類語言具有兩種不同的表達(dá)功能:工具性和藝術(shù)性。語言的藝術(shù)性主要表現(xiàn)于文學(xué)作品之中,它盡量以新奇的表達(dá)和怪異的結(jié)構(gòu)來凸顯作者的個性,其追求的表達(dá)效果是“存異”,所以才會出現(xiàn)“一百個讀者心目中有一百個哈姆雷特”,而像《紅樓夢》等文學(xué)名著也才會被電影導(dǎo)演們樂此不倦地反復(fù)翻拍。而語言的工具性恰恰相反,它的目的是“求同”,即盡量排除主觀的干擾,消除語言表達(dá)中的歧義,強(qiáng)調(diào)語言指稱對象的客觀性和準(zhǔn)確性,使不同的讀者讀同一篇文章能夠獲得基本相同的理解效果。出于這個目的,強(qiáng)調(diào)工具性的文體往往都有相對固定的表達(dá)術(shù)語和語言模式。這在科技和商務(wù)文體中表現(xiàn)得尤為明顯。
而這就使得這類文體特別適合于用電腦進(jìn)行數(shù)學(xué)意義上的統(tǒng)計分析。此外,電腦代替人腦完成這部分工作,解放人腦專門從事對藝術(shù)性語言的翻譯,這樣各盡其責(zé),優(yōu)勢互補(bǔ),又正好體現(xiàn)了認(rèn)知經(jīng)濟(jì)原則。事實也的確如此。比如職業(yè)翻譯所涉及的翻譯資料往往數(shù)量巨大,但范圍相對狹窄,主要集中于某個或某幾個專業(yè),如政治、經(jīng)濟(jì)、軍事、航天、計算機(jī)、通訊等專業(yè),這就必然帶來翻譯資料在不同程度的重復(fù)。據(jù)統(tǒng)計,在不同行業(yè)和部門,這種資料的重復(fù)率達(dá)到20% ~70%。這就意味著如果不使用CAT軟件,譯者至少有20%以上的工作是無謂的重復(fù)勞動。而翻譯記憶技術(shù)就是從這里著手,首先致力于消除譯者的重復(fù)勞動,從而提高工作效率。
職業(yè)翻譯涉及的一個巨大挑戰(zhàn)來源于專業(yè)術(shù)語。這些術(shù)語在商務(wù)、科技領(lǐng)域的資料中大量而頻繁地出現(xiàn),而且專業(yè)化的程度很高,有時太新的術(shù)語根本找不到相關(guān)的查詢資料。而對術(shù)語的翻譯要求是“忠實”“地道”和“統(tǒng)一”(張新紅、李明,2003:14)。所以,可以肯定地說,任何個人都無法獨(dú)自勝任這樣高標(biāo)準(zhǔn)的科技或商務(wù)翻譯。但CAT軟件中通過專門的工具處理Glossary(如塔多思是用Multiterm來儲存這些專業(yè)術(shù)語),并且還可以通過在線連接,分享別人或網(wǎng)絡(luò)中儲存的術(shù)語庫,從而成功地解決了以往讓人頭疼不已的術(shù)語難題。
所以,通過使用翻譯記憶,譯者不必再囿于手工作坊似的傳統(tǒng)翻譯手段,而是利用認(rèn)知規(guī)律并借助現(xiàn)代化的手段,大大地降低了職業(yè)翻譯的難度,提高了翻譯的效率,以較小的認(rèn)知代價換取了較大的認(rèn)知收益,體現(xiàn)了翻譯活動中所遵循的經(jīng)濟(jì)原則。
如果說經(jīng)濟(jì)原則體現(xiàn)的是譯者使用翻譯記憶的一種基本的認(rèn)知策略,屬于翻譯中的積極因素,那么譯者認(rèn)知資源總量的有限性則是翻譯中的一種消極因素,從這個角度研究翻譯記憶,則可以說使用翻譯記憶是譯者無奈之下的一種被動選擇。
梁寧建(2003)在《認(rèn)知心理學(xué)》中指出人類進(jìn)行認(rèn)知處理時都面臨一個瓶頸障礙——認(rèn)知資源總量的有限性。它是個人認(rèn)知負(fù)荷的最大值,人們可以勝任在其范圍之內(nèi)的認(rèn)知操作,并且這種認(rèn)知操作的強(qiáng)度是和它距這個最大值之間的長度成正比關(guān)系的:即越是遠(yuǎn)離這個最大值,越是感覺輕松自在、游刃有余,但越是逼近這個最大值,越是讓人力不從心,感覺緊張和疲憊。此外,值得指出的是,個人認(rèn)知負(fù)荷的最大值在短時期內(nèi)是一個相對恒定的數(shù)值,基本上可以認(rèn)為是穩(wěn)定不變的。因此認(rèn)知資源總量是一個全局性的常量,其對人類認(rèn)知活動產(chǎn)生的制約作用無時不有、無處不在。出于以上原因,人類在完成認(rèn)知任務(wù)時,如何制定活動策越,分配有限的認(rèn)知資源、實現(xiàn)認(rèn)知資源的最優(yōu)化配置,就顯得極為重要,事實上這也一直是認(rèn)知研究中的一大熱點。如法國學(xué)者丹尼爾·吉爾在《口筆譯訓(xùn)練的基本概念與模式》(Basic Concepts and Models for Interpreter and Translator Training)曾專門開辟章節(jié)研究翻譯過程中的認(rèn)知資源分配方案,并進(jìn)而提出了著名的“精力分配模式”(Effort Model),指導(dǎo)譯者在進(jìn)行翻譯轉(zhuǎn)換時,通過動態(tài)的調(diào)整資源分配方式,從而帶來最佳的翻譯體驗,實現(xiàn)最好的翻譯效果。
當(dāng)然,我們知道,進(jìn)行這樣的資源配置、優(yōu)化組合,最重要的是知人善任,即讓最適合的對象去完成他最擅長的部分。而CAT軟件中使用的TM概念,通過分解筆譯任務(wù),把其中繁瑣機(jī)械的重復(fù)翻譯部分和術(shù)語提取工作交給電腦完成,讓譯者集中精力處理新出現(xiàn)的待譯源文,可以說是給翻譯帶來了一種出色的“雙贏”局面:既分解了筆譯任務(wù),有效地降低了翻譯難度,同時也讓電腦和人腦各得其所,各盡其能。所以,在翻譯中使用TM其實也是一種“精力分配模式”,同樣對譯者有限的認(rèn)知資源起到了優(yōu)化重組的作用。
從認(rèn)知科學(xué)的角度,我們知道人類認(rèn)知的一大特點是“喜新厭舊”,即人類喜歡接觸從未見過的事情或任務(wù),并善于從觀察這些新奇事物中分析、提煉其特征規(guī)律并進(jìn)而找出其對應(yīng)的解決方案。這是一種“知難而上”的認(rèn)知傾向,因為新奇事物所帶來的新鮮感和挑戰(zhàn)性能夠讓人興致盎然而樂于參與,同時人們也能從解決這些新奇事物的過程中獲得一種前所未有的滿足感和成就感。換言之,人腦擅長的是面向新鮮事物的創(chuàng)造性思維,而不習(xí)慣于對以往經(jīng)驗的簡單重復(fù)。失眠的人都有這樣的生活經(jīng)驗,即通過數(shù)數(shù)字來讓自己早點進(jìn)入夢鄉(xiāng),因為這種簡單乏味的機(jī)械重復(fù)是最缺乏挑戰(zhàn)性和刺激感的任務(wù),最容易讓人喪失興趣而暈暈欲睡。
但機(jī)械重復(fù)恰好就是電腦的長項。因為電腦按其設(shè)計原理就是面向過去經(jīng)驗的機(jī)械操作。電腦軟件的一切操作其實只不過是按事先設(shè)定好的程序步驟去提取、比較數(shù)據(jù)并根據(jù)簡單的二進(jìn)制判斷輸出顯示結(jié)果(即把電子管物理性質(zhì)的開關(guān)操作轉(zhuǎn)換成二進(jìn)制中的0和1進(jìn)行數(shù)值計算)。但正如人類無法準(zhǔn)確地預(yù)見未來的情況一樣,再智能的電腦程序都無法做到事先就把未來所有可能發(fā)生的結(jié)果都考慮進(jìn)去并記錄在案,因此再先進(jìn)的電腦目前都無法獨(dú)立處理從未見過的語言現(xiàn)象(在翻譯中主要就是指semantic barrier,語義障礙),這也是MT無法推廣應(yīng)用的主要原因。但我們?nèi)祟愐矡o法否認(rèn)電腦在處理數(shù)據(jù)方面的巨大優(yōu)越性:首先是電腦不存在人腦那樣的遺忘機(jī)制,數(shù)據(jù)一旦存儲進(jìn)去,在理論上就可以永久存在。其次是電腦能高效快速地完成對海量數(shù)據(jù)的提取、分析和轉(zhuǎn)換,并且只要電源充足,電腦運(yùn)行起來就永不疲憊。因此,一切翻譯現(xiàn)象,只要能夠轉(zhuǎn)換成電腦可以識別的數(shù)據(jù)格式,就可以在電腦中得到高效的運(yùn)用。換言之,翻譯記憶之所以可以在職業(yè)翻譯中大行其道,就是因為電腦擅長于對以往翻譯經(jīng)驗的復(fù)現(xiàn)。
從以上比較中,我們可以得出這樣的結(jié)論,即翻譯記憶正好是取電腦之長補(bǔ)人腦之短,二者可以揚(yáng)長避短,各盡其能。因此譯者使用CAT軟件進(jìn)行翻譯是獲得了一種相得益彰的互補(bǔ)搭配,從而保證了職業(yè)翻譯的高效和準(zhǔn)確。如果我們從“人”(譯者)的角度來說,就認(rèn)為翻譯記憶在認(rèn)知方面的一大貢獻(xiàn)是用電腦解放了人腦,讓譯者從此可以集中精力,專注于翻譯新出現(xiàn)的句子。
如果我們具體分析TM在CAT軟件中的呈現(xiàn)方式,可以看出它對譯者的輔助作用主要是依靠統(tǒng)計其出現(xiàn)概率的方式實現(xiàn)的?,F(xiàn)在CAT用戶一般都可以對軟件進(jìn)行自定義設(shè)置,規(guī)定計算機(jī)在檢索翻譯記憶庫時,如果當(dāng)前待譯源文與記憶庫中的TM片段在結(jié)構(gòu)上的相似度達(dá)到或超過某一個閾值(通常為一個百分比數(shù)字)時,就在翻譯編輯界面給出相應(yīng)提示??梢?,CAT軟件中這種提取TM的方法其實和統(tǒng)計機(jī)器翻譯(Statistical Machine Translation,SMT)的基本思想如出一轍,即認(rèn)為如果翻譯記憶庫中存在和源文片段類似的表達(dá)結(jié)構(gòu),那么從源文到譯文的轉(zhuǎn)換只是一個概率問題。換言之,可能翻譯記憶庫中同時存在好幾個TM片段,都和源文片段具有對應(yīng)關(guān)系,但每對備選的TM片段在實際翻譯中出現(xiàn)的頻率肯定不一樣,理論上出現(xiàn)頻率大的TM片段應(yīng)當(dāng)是接受程度最高的表達(dá),因此其中的翻譯片段自然也應(yīng)當(dāng)是最佳的候選譯文,于是提取TM的任務(wù)就轉(zhuǎn)變成了搜索翻譯記憶庫中對應(yīng)概率最大的TM片段。馮志偉(2007)曾從語言哲學(xué)的高度對機(jī)器翻譯進(jìn)行了總結(jié),認(rèn)為統(tǒng)計機(jī)器翻譯(SMT)是以大規(guī)模語料庫的分析為基礎(chǔ),體現(xiàn)了科學(xué)研究中的“經(jīng)驗主義”,那我們也可以說CAT軟件中對TM的實際應(yīng)用其實也是這樣的一種“經(jīng)驗主義”——是一種基于過去翻譯經(jīng)驗的翻譯實踐。
但正如前文分析的那樣,基于過去翻譯經(jīng)驗的CAT軟件,是響應(yīng)用戶當(dāng)前選擇的源文而提取以前類似的翻譯例子,屬于一種被動的再現(xiàn),其最大的弊端就是缺乏創(chuàng)造性,不能應(yīng)對從未遇見的源文表達(dá),因此無法直接針對當(dāng)前源文本身進(jìn)行操作,在職業(yè)翻譯中只能處于從屬地位,起到一個輔助作用。
不過如今隨著網(wǎng)絡(luò)技術(shù)的進(jìn)一步發(fā)展,許多主流的CAT軟件,如SDL Trados 2009,已經(jīng)意識到CAT軟件中存在的這一弊端,于是在設(shè)計中引進(jìn)了自動翻譯機(jī)制,即當(dāng)前選擇的源文片段在TM中不存在符合設(shè)置要求的對應(yīng)例子時,便自動聯(lián)網(wǎng)登錄在線翻譯引擎(塔多思是以 language weaver為默認(rèn)翻譯引擎,當(dāng)然Google在線翻譯也深受很多CAT軟件的青睞)并把機(jī)器翻譯的譯文反饋回翻譯編輯界面供譯者參考。整個過程完全是在后臺自動進(jìn)行,不會干擾譯者的思維流程,并且由于職業(yè)翻譯中大多數(shù)內(nèi)容屬于格式和用語都比較固定、規(guī)范的科技或商務(wù)資料,所以這樣獲得的機(jī)器翻譯譯文也的確具有一定的參考價值,甚至不排除在個別句式簡單、術(shù)語規(guī)范的情況下譯者可以直接引用機(jī)器翻譯的譯文。
當(dāng)然,值得指出的是,此處的機(jī)器翻譯應(yīng)當(dāng)是基于規(guī)則的機(jī)器翻譯RBMT(Rule-based Machine Translation),即將人類翻譯時所采用的知識和規(guī)律總結(jié)、抽象出來,以特定的形式存入計算機(jī)。然后在翻譯過程中,計算機(jī)結(jié)合源語言的輸入,選擇相應(yīng)的知識進(jìn)行推理或轉(zhuǎn)換,生成目標(biāo)語言的翻譯結(jié)果作為輸出。和先前的統(tǒng)計機(jī)器翻譯的原理相反,馮志偉認(rèn)為基于規(guī)則的機(jī)器翻譯是以轉(zhuǎn)換生成語言學(xué)為基礎(chǔ)的方法,體現(xiàn)的不是基于先前翻譯語料的“經(jīng)驗主義”,而是科學(xué)演繹為主的“理性主義”?;蛘呖梢赃@樣說,基于規(guī)則的機(jī)器翻譯直接面向當(dāng)前譯文本身進(jìn)行分析和翻譯,在一定程度上克服了TM單純面向過去翻譯經(jīng)驗的弊端,因此可以說TM(Translation Memory)和MT(Machine Translation)的結(jié)合是CAT軟件未來發(fā)展的方向。
1.切實加強(qiáng)目前的成功機(jī)制,切實加強(qiáng)和發(fā)揮TM在形式計算方面的功能
以前的CAT軟件主要是靠譯者個人積累的翻譯資料,進(jìn)行本地化存儲。這些軟件除了自動把譯者在軟件中進(jìn)行的翻譯保存為TM資料之外,也提供相應(yīng)的擴(kuò)展功能可以把以前的翻譯資料轉(zhuǎn)換為 TM文件(如 Trados 2007中的WinAlign)。后來隨著翻譯業(yè)務(wù)的擴(kuò)展,很多翻譯任務(wù)必須依靠多人協(xié)作才能盡快完成,于是又出現(xiàn)了通過CAT軟件在特定成員內(nèi)部共享TM資源,這從量和質(zhì)兩方面都大大擴(kuò)展了TM的使用價值。但這仍然只是局限于少數(shù)人員之間,沒有充分發(fā)揮TM概念的完整意義。而當(dāng)前海量網(wǎng)絡(luò)資源的免費(fèi)共享才是TM發(fā)展的終極之道,才可以從真正意義上實現(xiàn)共享全人類的翻譯經(jīng)驗。
當(dāng)前的CAT軟件已經(jīng)體現(xiàn)了TM的發(fā)展趨勢是從個人到集體、從本地到網(wǎng)絡(luò),逐漸包括盡可能多的網(wǎng)絡(luò)資源(如在線詞典和在線句庫等)。國內(nèi)的“雪人”翻譯和Transdog(翻譯狗)都直接內(nèi)置了好幾個著名的翻譯網(wǎng)站,其他的軟件也可以通過自定義功能擴(kuò)展使用這些網(wǎng)絡(luò)資源。以英漢翻譯為例,Cnki翻譯助手、中國譯典、金山詞霸、海詞在線、句酷網(wǎng)等都是國內(nèi)比較著名的在線網(wǎng)絡(luò),提供了優(yōu)秀的詞級、句級的TM資源。
2.可以引進(jìn)“預(yù)翻譯”的概念
“預(yù)翻譯”除了指電腦自動把TM庫中和源文匹配程度達(dá)到或超過某一閾值的進(jìn)行自動翻譯之外(如塔多思的翻譯工作臺的“100%匹配”和“翻譯至下一匹配處”的功能),還可以指對術(shù)語的自動處理:即電腦直接針對源文材料進(jìn)行處理,自動對待譯源文進(jìn)行掃描統(tǒng)計。對其中出現(xiàn)頻率達(dá)到一定閾值的詞匯自動認(rèn)定為專業(yè)詞匯,因此需要固定譯法,從而達(dá)到譯文前后一致的效果。如果在當(dāng)前的本地術(shù)語庫中找不到相應(yīng)的譯文,則可以聯(lián)網(wǎng)搜索相應(yīng)的在線詞典,并自動下載譯文供譯者參考。目前SDL 2009 Mutiterm Extract可以在以前的TM文件中提取術(shù)語表,而Transdog則可以直接聯(lián)網(wǎng)在線詞庫并提取當(dāng)前源文的術(shù)語表。
3.繼續(xù)優(yōu)化TM和MT在翻譯過程中的配合使用
除了我們設(shè)定TM的優(yōu)先級別高于TM之外,即搜索不到相應(yīng)的TM就自動聯(lián)網(wǎng)進(jìn)行機(jī)器翻譯,同時整個輔助功能應(yīng)當(dāng)全在后臺運(yùn)行,并且是以一種自然的方式把搜索結(jié)果呈現(xiàn)給譯者作為翻譯的參考。
此外,TM和MT還應(yīng)可以根據(jù)源文的類型自動選擇最具參考價值的網(wǎng)絡(luò)資源進(jìn)行搜索和翻譯,這樣既提高響應(yīng)速度,同時也提高了搜索結(jié)果的準(zhǔn)確性。其中重要的一點是,整個搜索過程不影響到前臺工作的譯者。這除了是為了最大程度地減輕譯者工作強(qiáng)度之外,還主要是體現(xiàn)了一種流暢性思維。翻譯過程中流暢性思維極為重要。這種流暢,從認(rèn)知上是指譯者在翻譯過程中的工作思維不受其他不相干因素的干擾,能夠始終專注于翻譯工作本身,并且以一定的節(jié)奏有條不紊地進(jìn)行下去。在這種流暢思維的作用下,翻譯工作才可能如行云流水一樣高效而準(zhǔn)確,同時也給譯者自身帶來舒適的翻譯體驗并進(jìn)而提高他對翻譯工作的成就感。這就要求我們的CAT軟件應(yīng)當(dāng)體現(xiàn)一種人性化的設(shè)計思想,即真正做到“以人為本”:使用軟件本身不是干擾,而是要符合人們的翻譯習(xí)慣、提高翻譯的舒適度、準(zhǔn)確度和速度。設(shè)計優(yōu)秀的CAT軟件在使用過程中,應(yīng)當(dāng)使譯者忘記自己是在使用軟件翻譯,產(chǎn)生的感覺仿佛就是完全靠自己在翻譯,達(dá)到了所謂物我兩忘、渾然一體的最高境界。
其次,我們在設(shè)計CAT軟件時應(yīng)當(dāng)擴(kuò)展新的途徑。這方面我們可以通過劃分翻譯單位來充分發(fā)揮MT和TM的作用。運(yùn)用翻譯單位最基本的操作就是把源文劃分為一個個更小的表達(dá)結(jié)構(gòu),這其實也起到了認(rèn)知經(jīng)濟(jì)的效果,即借助翻譯單位我們可以在翻譯實踐中化繁為簡、化長為短、化難為易。如果從TM配對上來說,越小的源文單位找出匹配譯文的幾率也更大。因為大的語言結(jié)構(gòu)都是由更小的語言結(jié)構(gòu)組合起來的,所以越小的語言結(jié)構(gòu)使用頻率也就越高,越是容易找到匹配的對象。從MT實用性來說,語義的復(fù)雜性主要表現(xiàn)在語言組合結(jié)構(gòu)之間的邏輯關(guān)系上,而邏輯關(guān)系主要是一個純粹的語義判斷問題,既然目前的計算機(jī)是無法直接針對語義現(xiàn)象進(jìn)行運(yùn)算的(所以MT翻譯長句總是錯誤百出),所以運(yùn)用翻譯單位也就降低了翻譯過程中進(jìn)行語義判斷的難度(該部分工作已經(jīng)被人類譯者在劃分翻譯單位時完成了),從而可以間接提高了MT翻譯的精度,提升了其實用性。
從以上論述可以看出,在翻譯過程中,能否對源文進(jìn)行結(jié)構(gòu)分析顯得相當(dāng)重要。雖然結(jié)構(gòu)分析主要是一個語義問題,目前只能靠人工完成,但必要的形式輔助也可以大大降低其中的操作難度、提高分析的效率。特別是在科技英語中,出現(xiàn)長句的幾率相當(dāng)大,包含幾十或甚至上百個單詞的句子屢見不鮮,有時甚至一個句子就是一個段落。實踐之中譯者往往是借助紙筆在源文稿件上進(jìn)行勾畫分析,但目前采用電子稿件的翻譯形式也極為普遍,這就決定了傳統(tǒng)的以紙筆方式進(jìn)行結(jié)構(gòu)分析的方式已經(jīng)落伍過時,我們應(yīng)當(dāng)與時俱進(jìn),采取更科學(xué)的方式。如果我們的CAT軟件能夠在這方面設(shè)計并提供相應(yīng)的功能,輔助譯者對源文方便而直觀地進(jìn)行結(jié)構(gòu)分析,則無疑可以提高軟件的實用性和親和力。而目前的軟件都沒有提供這種功能,不能不說讓人大為遺憾。
[1]馮志偉.自然語言處理中的哲學(xué)問題[J].心智與計算,2007(03):333-353.
[2]姜望琪.Zipf與省力原則[J].同濟(jì)大學(xué)學(xué)報(社會科學(xué)版),2005(1):87-95.
[3]梁寧建.當(dāng)代認(rèn)知心理學(xué)[M].上海:上海教育出版社,2003.
[4]張新紅,李明.商務(wù)英語翻譯[M].北京:高等教育出版社,2003.
[5]Fodor,J.A.(1983),The modularity of mind.MIT Press,Cambridge,MA.
[6]J.A.福多.心理模塊性[M].上海:華東師范大學(xué)出版社 ,2002.
[7]Martinet,A.A Functional View of Language[M].Oxford:Oxford University Press,1962.
[8]Shuttleworth,Mark & Cowie, Moria. Dictionary of Translation Studies[M].St.Jerome publishing,1997.
[9]Zipf,G K.Human Behavior and the Principle of Least Effort:An Introduction to Human Ecology[M].Cambridge,Mass.:Addison Wesley Press,INC.,1949.