三峽大學 田緒軍
如果要消除專業(yè)譯者對于機器翻譯偏見和擔憂,機器翻譯系統(tǒng)需要一種新的形象,包括對其性能的現(xiàn)實看法。人們采用機器翻譯的不同目的關系重大,因為這種多樣性將保證機器翻譯研究的繼往開來。此外,一些大學,如卡內基梅隆大學、馬里蘭大學,京都大學、艾塞克斯大學,蒙特利爾大學和韓國高等科技學院等和一些私營公司,如美國電話電報公司、IBM、微軟、日本電話電報公共公司、全錄復印機、Systran和索尼等,一直都積極參與機器翻譯研究。
但是,如我們所見,許多項目仍然處在起始或實驗階段,因此對大眾的吸引力不強。由于系統(tǒng)很初始,其結構和翻譯出來的作品只能供研究人員討論、參考,目前還不能為大眾服務。
當前,我們在一些翻譯工作站或者是大公司內部網客戶服務器系統(tǒng)上可以看到可操控性機器翻譯系統(tǒng)。專業(yè)譯者以及一般用戶都能夠使用機器翻譯系統(tǒng)和在線機器翻譯服務。但是在未來,帶有翻譯功能的集成商業(yè)翻譯系統(tǒng)和在線機器翻譯系統(tǒng)很會變得更為普遍。當前試驗的交互式機器翻譯系統(tǒng)經過發(fā)展,將成為商業(yè)翻譯系統(tǒng),這些商業(yè)翻譯系統(tǒng)通過發(fā)展和演變,能夠讓譯者完全控制其翻譯過程。機器翻譯系統(tǒng)翻譯出來的作品通常需要大量的譯后編輯才能出版,而這些系統(tǒng)將會讓譯者更加容易操控。(Macklovitch,Valderrabanos2001)。由于可以進行人機交互,譯者可以在翻譯過程中進行修改,因此,人機交互機器翻譯系統(tǒng)可以減少譯后編輯的工作量。另外,人們重新對機器翻譯產生興趣的背后的一個主要原因是人工翻譯不能滿足翻譯市場的需要。這將緩解“翻譯瓶頸”,同時為翻譯市場提供了巨大的機會。(Macklovitch:2001)。
數(shù)據(jù)驅動法的誕生帶動了自然語言處理領域的更多研究。目前可以通過像Google這樣的搜索引擎從網絡上檢索信息。(Macklovitch:2001)但是,為了獲得大量信息,我們需要更加強勁的跨語種的信息檢索方法。其中一個叫做多語種信息檢索(MLIR)。多語種信息檢索是指通過輸入一種語言查詢,能夠從網絡或者是存儲的數(shù)據(jù)庫中檢索相關多語種文本和非文本(例如,聲音和圖象)材料的能力。如果終端用戶要閱讀收集來的多語種材料,這些材料隨即被翻譯成終端用戶所使用的語言。使用機器翻譯系統(tǒng)就能達到這個目的。但是,它不能翻譯所有語言。機器翻譯系統(tǒng)依賴于語言,因為它是為了特定的某些語言和翻譯方向所設計的。即使在線機器翻譯系統(tǒng)也一樣,雖然它們能翻譯很多種語言,但是大多數(shù)仍然只能翻譯幾種常用的語言。因此,不是所有材料都能翻譯成終端用戶所使用的語言。而且,有些語言為了區(qū)別相似的詞,而在詞的前后、上下等作出各種各樣不同的標記,來標示其差別、口音和音調,機器翻譯系統(tǒng)在處理這些標記的時候特別容易犯錯誤。結果,也許翻譯出來的譯文反而對終端用戶毫無用處。近年來,關于多語種信息檢索和機器翻譯系統(tǒng)作為翻譯工具的研究和實驗已經在進行。目前,雖然前景很可觀,但是還有更多的工作要做---如何優(yōu)選收集的材料,尤其是從網絡上優(yōu)選收集的材料;如何使用終端用戶能理解的在線或者脫機系統(tǒng)提供足夠的翻譯。
對于機器翻譯研究未來,Schaler,Way和Carl將翻譯質量分為三個級別:高、中和低,對應三種不同的文本類型。最高級,采用人工翻譯而不是機器翻譯,通常翻譯一些富含創(chuàng)作靈感的文本,比如,含有很多比喻的文本。廣告和戲劇屬于這種文本類型。中等級別,人工翻譯和機器翻譯相結合,用來翻譯大量的不同領域的文本,對于這些文本,準確性和格式相當重要,尤其是圖表。這類文本包括實驗室報告和使用指南。最低級別,采用機器翻譯而不是人工翻譯來進行大致意思的翻譯,通?;ㄙM很小甚至沒有。譬如,那些在線機器翻譯系統(tǒng)翻譯的東西。Schaler,Way,Carl(2003)認為,像這樣質量要求不高的文本包括一些產品、服務和一般信息網頁。隨著翻譯技術研究與開發(fā)的不斷進步和更加可靠的翻譯系統(tǒng)的開發(fā),預計機器翻譯的作用將象表中箭頭指示的那樣逐步增加。
機器翻譯的遠景是樂觀的,但同時不僅需要公眾改變對翻譯的困難和自動化局限方面的看法,而且要知道需要有不同類型的翻譯(Macklovitch:2001)。此外,大多數(shù)機器翻譯系統(tǒng)詞匯量大,覆蓋范圍廣,而且能生成較低或中等質量的翻譯。為了生成優(yōu)質翻譯,機器翻譯系統(tǒng)必須僅限于一個非常小的具體領域---詞匯量和語法基于一種控制語言(住田和今村2002)。相應地,許多商業(yè)系統(tǒng)專門設計為某些主題領域或有具體要求用戶服務(哈瓊斯1994)。在十年前,分析復雜句子、選擇最佳對等譯文和生成慣用語譯文等問題都待解決,哈瓊斯(Hutchins:1994)指出,目前的情形和當時一樣(Somers2003)。作為這個解決問題的進程一部份,研究人員們意識到翻譯自動化決非易事。盡管擁有所需的知識、專家和技術,仍然有許多問題克服----處理那些經常用不同的方式表達同意一個事物的不同語言。我們將在本章節(jié)的最后部分看到,計算機是遵循人們設定的程序規(guī)則的重要設備,并且它們很難處理這些“不一致”。此外,語言分析、轉化和綜合、學習和常識推理等問題,特別是機器翻譯系統(tǒng),仍然需要充分解決。
我們可能還記得曾經企圖用新一代基于語科庫的機器翻譯系統(tǒng)取代舊的基于規(guī)則的系統(tǒng),但成效不是很顯著。在這個問題上,有一點很重要,那就是基于語科庫的方法不應該被當成另外一種選擇,而是為對基于規(guī)則的方法的補充完善。雖然基于語科庫的方法的優(yōu)點是他們先前翻譯的材料中生成新的翻譯,但是要讓基于語科庫的機器翻譯系統(tǒng)更加功能強大,仍然需要語言學知識。因而當前機器翻譯的研究方向傾向于綜合基于語科庫的機器翻譯系統(tǒng)和基于規(guī)則的方法,這就是“綜合法”。結果,隨著時間的推移,許多機器翻譯系統(tǒng)改變了,有的改變了結構,有的變成了綜合體,還有的繼續(xù)保留他們各自不同的方法。
技術上的變化也引起了觀點上的變化,甚至包括那些對機器翻譯持懷疑態(tài)度的人,主要是因為經濟方面的可行性和在某些方面使用機器翻譯系統(tǒng)更有優(yōu)勢。實際上,一些專家指出:在一個多語種世界里,機器翻譯是形形色色的多功能自然語言處理程序世界的一個重要的工具(Bell:2001)。
[1]Archer,J.(2002)’Internationalisation,Technology and Translation’,in Perspectives:Studies in Translatology,10(2):87-117.
[2]Bell,R.(1991)Translation and Translating:Theory and Practice,London:Longman.
[3]Baker,M.(2001)’Investigating the Language of Translation:A Corpus-based Approach’,in Patfmays of Translation Studies,P.Fernandez Nistal andJ.M.Bravo Gozalo(eds).Spain:Centre Buendia,Universidad de Valladolid.
[4]Catford,J.C.(1965)A Linguistic Theory of Translation.London:Oxford University Press.
[5]Gamper,J.and P.Dongilli(1999)’Primary Data Encoding of a Bilingual Corpus’,Proceedings of GLDV,Germany,http://www.inf.unibz.it/~dongilli/papers/gldv-99.pdf.November 2004.
[6]Godwin-Jones,B.(2001)’Emerging Technologies:Tools and Trends in Corpora use for Teaching and Learning’,Language Learning and Technology,55(3):7-12.
[7]Hutchins,W.J.and H.L.Somers(1994)An Introduction to Machine Translation.London:Academic Press Limited.
[8]Macklovitch,E.(1999)’Regional Survey:M(A)T in North America’,Proceedings of MT Summit VII,Singapore:73-9.
[9]Schaler,R.,A.Way and M.Carl(2003)’EBMT in a Controlled Environment’,in Recent Advances in Example-based Machine Translation:Text,Speech and Language Technology,Vol.21,M.Carl and A.Way(eds)(2003a).Dordrecht:Kluwer Academic:83-114.