張為為
引言
機(jī)器翻譯又稱自動(dòng)翻譯,是利用計(jì)算機(jī)來進(jìn)行的語言之間的轉(zhuǎn)換,它是自然語言處理的一個(gè)分支,與計(jì)算語言學(xué)、自然語言理解之間存在著密不可分的關(guān)系。它是橫跨語言學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、翻譯學(xué)及人工智能等的綜合學(xué)科,也是信息時(shí)代語言應(yīng)用的一個(gè)重要領(lǐng)域。
一、機(jī)器翻譯的歷史和必要性
1.機(jī)器翻譯的歷史。20世紀(jì)30年代初,法國(guó)科學(xué)家 G.B.阿爾楚尼提出了用機(jī)器來進(jìn)行語言翻譯的想法。隨著科技的進(jìn)步,1946年人類第一臺(tái)現(xiàn)代電子計(jì)算機(jī)ENIAC誕生,1949年,韋弗(W. Weaver)在其發(fā)表的《翻譯備忘錄》中,正式提出了機(jī)器翻譯的思想。中國(guó)機(jī)器翻譯研究開始起步于1957年,是世界上第四個(gè)開始搞機(jī)器翻譯的國(guó)家。80年代中期以后,中國(guó)機(jī)器翻譯研究發(fā)展進(jìn)一步加快。90年代初KY-1 和MT/EC863兩個(gè)機(jī)譯系統(tǒng)的研制成功,表明中國(guó)在機(jī)器翻譯技術(shù)方面取得了歷史性突破,隨著互聯(lián)網(wǎng)的普及和人們對(duì)翻譯需求的迅猛增長(zhǎng),機(jī)器翻譯又迎來新的發(fā)展機(jī)遇,我國(guó)相繼推出了一系列在線翻譯系統(tǒng)
2.機(jī)器翻譯的必要性。同人工翻譯相比,機(jī)器翻譯有很多優(yōu)勢(shì)。首先,存儲(chǔ)容量大。存儲(chǔ)100萬個(gè)詞條對(duì)計(jì)算機(jī)來說是一件輕而易舉的事情,這是人的大腦無法企及的。其次,翻譯速度快。機(jī)器的翻譯速度是人工翻譯速度的幾十倍,乃至上百倍。再次,更加經(jīng)濟(jì)和節(jié)省勞動(dòng)力。據(jù)戴爾電腦制造商韋恩·波蘭德說,他的公司網(wǎng)站需要提供28種語言,機(jī)器翻譯已經(jīng)為其節(jié)省了40%的翻譯時(shí)間。隨著對(duì)信息獲取速度要求的不斷提高和國(guó)際間交流的日益頻繁,人工翻譯的低效率、高成本遠(yuǎn)遠(yuǎn)不能滿足需要,機(jī)器翻譯將毋庸置疑地成為必要的輔助翻譯工具。
3.機(jī)器翻譯的主要方法。機(jī)器翻譯的過程一般可簡(jiǎn)化為三個(gè)階段:原文分析、原文譯文轉(zhuǎn)化和譯文生成。表象上,機(jī)器翻譯的核心問題是翻譯的準(zhǔn)確性;實(shí)質(zhì)上,體現(xiàn)在技術(shù)層面則是機(jī)器翻譯系統(tǒng)采用的方法論問題。在方法論層面,機(jī)器翻譯系統(tǒng)可分為基于規(guī)則(Rule-Based)和基于語料庫(kù)(Corpus-Based)兩大類?;谝?guī)則(Rule-Based)就是由詞典和語法規(guī)則庫(kù)構(gòu)成翻譯知識(shí)庫(kù)。基于語料庫(kù)(Corpus-Based)則是以語料的應(yīng)用為核心,由經(jīng)過劃分并具有標(biāo)注的語料庫(kù)構(gòu)成知識(shí)庫(kù)。語料庫(kù)通常指為語言研究收集的、用電子形式保存的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。
二、漢英機(jī)器翻譯中常見錯(cuò)誤分析
漢英機(jī)器翻譯中,漢語到英語的轉(zhuǎn)換實(shí)際上是一個(gè)信息增加的過程。在漢語中所沒有的各種形態(tài)信息,如單復(fù)數(shù)、時(shí)態(tài)、語態(tài)等等,在轉(zhuǎn)換和生成中都必須添加上去與過去相比,漢英機(jī)器翻譯譯的速度和質(zhì)量盡管已明顯提高,但與人工翻譯相比,機(jī)譯的文本依然會(huì)出現(xiàn)許多錯(cuò)誤。下面就在漢英機(jī)器翻譯過程中常見的錯(cuò)誤加以舉例分析:
1.直譯的錯(cuò)誤。漢語中一詞多義現(xiàn)象非常普遍,一個(gè)詞在與不同的詞語搭配時(shí)具有不同的詞義。人工翻譯會(huì)根據(jù)語境來選擇,而機(jī)器翻譯還達(dá)不到通過語境來判斷語義,通常是根據(jù)該詞的第一個(gè)詞義來直接翻譯,這就容易出現(xiàn)一些選詞不當(dāng)或錯(cuò)誤的翻譯結(jié)果。2.被動(dòng)語態(tài)使用錯(cuò)誤。漢英機(jī)器翻譯中,主動(dòng)語態(tài)和被動(dòng)語態(tài)的轉(zhuǎn)換也是對(duì)計(jì)算機(jī)的一個(gè)嚴(yán)峻考驗(yàn),因?yàn)闈h語句子中并沒有相應(yīng)的語法標(biāo)志,只能根據(jù)句子所處的上下文環(huán)境和語義及常識(shí)進(jìn)行判斷。3.冠詞使用錯(cuò)誤。漢語沒有冠詞,在英語的名詞短語中卻往往要加上冠詞,這其中又分為零冠詞、定冠詞和不定冠詞三種情況。同時(shí),英語中的冠詞有時(shí)候相當(dāng)于漢語中的指示代詞“這”、“那”、“該”等。因此,如何把握就成了機(jī)器翻譯的難題,就會(huì)出現(xiàn)表達(dá)不當(dāng)?shù)那闆r。4.介詞及其搭配使用錯(cuò)誤。據(jù)統(tǒng)計(jì),漢語中總共有介詞30個(gè)左右,英語中有介詞286個(gè),其中在一百個(gè)英語句子里幾個(gè)常用的介詞如at,in,on和for的重復(fù)出現(xiàn)率為二、三百之多。英語介詞不但多,而且使用范圍廣,所以機(jī)器翻譯起來往往錯(cuò)誤百出。5.句法結(jié)構(gòu)的錯(cuò)誤。英語重形合,漢語重意合。所謂“形合”是指語言的詞語、分句以及句子之間借助語 言形式手段(如關(guān)聯(lián)詞)實(shí)現(xiàn)詞語或句子的連接,表達(dá)語法意義和邏輯意義。
三、幾點(diǎn)建議
1.正確使用機(jī)器翻譯。機(jī)器翻譯發(fā)展經(jīng)歷了不同階段,從開始只能翻譯簡(jiǎn)單的句子,到現(xiàn)在翻譯整篇的文章,已有了巨大的發(fā)展,在處理專業(yè)性強(qiáng)、數(shù)量大的技術(shù)資料和論文等有相當(dāng)?shù)膬?yōu)勢(shì)。隨著新機(jī)器翻譯系統(tǒng)的開發(fā),人工譯員不再只是聽機(jī)器的指令,而是以一種與人工翻譯決策過程類似的方式來指引翻譯過程。但是,無論用多么復(fù)雜的技術(shù)制造出來的產(chǎn)品均不能與人類大腦的創(chuàng)造天賦相比。人工譯員介入改善翻譯文本仍然相當(dāng)重要。因此,我們應(yīng)根據(jù)自己的實(shí)際需求,客觀確定機(jī)器翻譯譯文質(zhì)量的接受值,機(jī)器翻譯的結(jié)果也不能作為最終數(shù)據(jù)直接用于科研學(xué)術(shù)研究。
2.建立功能更加完善的語料庫(kù)。漢英機(jī)器翻譯處理的是語言問題,處理語言問題就不應(yīng)該離開語言知識(shí)的輔助,機(jī)器翻譯時(shí)所需要的主要信息是一個(gè)大型的雙語語料庫(kù),若是輸入的東西數(shù)據(jù)庫(kù)里沒有,機(jī)器就翻不出人們想要的結(jié)果。語言學(xué)家經(jīng)過長(zhǎng)期努力創(chuàng)建了含有成千上萬條規(guī)則的語料庫(kù),覆蓋了多樣的語言現(xiàn)象,但是,如今信息的日新月異導(dǎo)致現(xiàn)實(shí)中的語言現(xiàn)象復(fù)雜多變,涉及到詞法、句法理論以及語用理論等。翻譯這些語料不僅需要扎實(shí)的語言功底,而且還需要有廣闊的文化和百科知識(shí),甚至需要有很高程度的新學(xué)科領(lǐng)域的專門知識(shí)。作者認(rèn)為目前的語料庫(kù)已無法滿足漢英機(jī)器翻譯的需求,這就導(dǎo)致漢英機(jī)器翻譯中諸多問題的出現(xiàn)。因此,從根本上還要依靠語言學(xué)家和每位語言愛好者更加深入細(xì)致的研究工作,投入更大的人力和物力,建立一個(gè)功能更加完善的語料庫(kù),這樣可以大大提高機(jī)器翻譯的正確率及可讀性。