桂林電子科技大學(xué)外國語學(xué)院 羅華珍 潘正芹 易永忠
人工智能翻譯的發(fā)展現(xiàn)狀與前景分析
桂林電子科技大學(xué)外國語學(xué)院 羅華珍 潘正芹 易永忠
近年來,人工智能(Artificial Intelligence,以下簡稱AI)技術(shù)迅猛發(fā)展,越來越深刻地影響各行各業(yè).其中,語言服務(wù)業(yè)涉及的機器翻譯,有"AI中的AI"之稱,一直被視作人類的最后一塊智慧高地,"AI王冠上的寶石".這塊璀璨的寶石引來了眾多高校與研究機構(gòu)競相研究,更引來了包括谷歌、阿里在內(nèi)的企業(yè)巨頭踴躍投入.此外,不少傳統(tǒng)的語言服務(wù)企業(yè)也意欲向此轉(zhuǎn)型.那么,人工智能翻譯技術(shù)的現(xiàn)狀究竟如何?AI會給語言服務(wù)業(yè)帶來哪些深刻影響?人工翻譯與機器翻譯的未來,又該何去何從?本文結(jié)合人工智能翻譯的發(fā)展現(xiàn)狀及其當(dāng)前應(yīng)用的成果,對以上問題進行分析探討,以期對AI翻譯領(lǐng)域的研究方向,提供理論參考依據(jù).
人工智能;機器翻譯;人工翻譯;深度學(xué)習(xí);循環(huán)神經(jīng)網(wǎng)絡(luò);積卷神經(jīng)網(wǎng)絡(luò);翻譯眾包;機器學(xué)習(xí)技術(shù)
隨著科技和經(jīng)濟的快速發(fā)展,全球各國的互聯(lián)互通已經(jīng)成為不可阻擋的發(fā)展趨勢.為了實現(xiàn)不同國家之間低成本的有效交流,機器翻譯應(yīng)運而生.其優(yōu)點主要體現(xiàn)為:
1.成本低:
相比于人工翻譯,機器翻譯的成本要低很多.因為機器翻譯需要人工參與的時候很少,基本上由計算機自動完成翻譯,大大降低了預(yù)算.
2.易把控:
機器翻譯的流程簡單快捷,在翻譯時間的把控上也能進行較為精準(zhǔn)地估算.
3.速度快
計算器程序的運行速度非常快,機器翻譯正好利用了這一優(yōu)點.
相信常跟外語打交道的讀者都感覺到,機器翻譯越來越強大了.從最開始的只能翻譯單詞,翻譯句子簡直一竅不通的,到之后翻譯出來句子可以符合基本的語法,再慢慢變得越來越有基本的邏輯性了,再到現(xiàn)在部分軟件可以聯(lián)系上下文,翻譯結(jié)果的可讀性與正確性都大為改觀.
近年來,加入了"深度學(xué)習(xí)技術(shù)"等人工智能的機器翻譯,已經(jīng)不再簡單地將一個個單詞翻譯成另一種語言,而是可以像人一樣,不斷向前回顧以理解結(jié)構(gòu)復(fù)雜的句子,并且結(jié)合上下文,理解每一個It/He/She具體指代誰.
實現(xiàn)這種功能,分別依賴于兩種神經(jīng)網(wǎng)絡(luò)架構(gòu),一個是Recurrent Neural Networks(RNN)--循環(huán)神經(jīng)網(wǎng)絡(luò),另一個則是Convolutional Neural Networks(CNN)--卷積神經(jīng)網(wǎng)絡(luò).關(guān)于RNN和CNN哪個更適用于機器翻譯的爭論也很多,我們先來看看這兩種神經(jīng)網(wǎng)絡(luò)都是如何為機器翻譯"開光加持"的.
RNN:機器翻譯的創(chuàng)派宗師
首先我們要明白,所謂機器翻譯,就是一個解碼后再編碼的過程.如果要把英語翻譯成中文,就要先把英語原文解碼成"神經(jīng)代碼",再編碼生成中文.
循環(huán)神經(jīng)網(wǎng)絡(luò)的關(guān)鍵,就在于循環(huán)二字上.系統(tǒng)會"記住"上一次輸出的內(nèi)容,以此來決定下一次輸出.有了上一次和下一次的概念,神經(jīng)網(wǎng)絡(luò)就不會把輸入和輸出的信息看做獨立的,而是相互關(guān)聯(lián)的時間序列.這樣就可以通過以往的序列關(guān)聯(lián)猜測到下一個序列會出現(xiàn)的詞.
在翻譯時,RNN把源語言當(dāng)做輸入序列,把翻譯語言當(dāng)做輸出序列,由于每一次輸出都會參考上一次輸出的結(jié)果,所以機器翻譯更具整體性,而不是簡單的翻譯單詞.
目前對RNN應(yīng)用的最為爐火純青的應(yīng)該就是谷歌翻譯了,去年谷歌提出了用神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行機器翻譯,據(jù)稱漢譯英的錯誤率最高下降85%,在當(dāng)時還小小的引起了一番轟動.
如果說傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在翻譯時,永遠是用一片空白的大腦面對每一個句子,那么RNN在翻譯時則擁有持久的思想,而谷歌翻譯所應(yīng)用的LSTM更加強了這一點.LSTM是RNN的一類變種,被譯為長短期記憶網(wǎng)絡(luò),是一種時間遞歸神經(jīng)網(wǎng)絡(luò).RNN的缺陷在于,"于謙的父親-王老爺子"這種間隔很短的序列預(yù)測以前很容易,但要預(yù)測"今天出門晚了,所以上班[]"這類句子,需要聯(lián)系到間隔較遠的上下文,這時RNN可能就表現(xiàn)的沒那么優(yōu)秀了.
而LSTM,就可以學(xué)習(xí)并理解這種長期依賴關(guān)系.LSTM通過一系列計算將句子中的各個元素的特征構(gòu)建成非線性的組合,同時還設(shè)立了"遺忘機制",將權(quán)重較低的元素遺忘掉.這就意味著LSTM可以"更新"記憶,讓長期依賴因素不斷的存在于距離較近的神經(jīng)元中.
CNN:GPU的寵兒
就在RNN機器翻譯還在不斷更新時,又有人提出了將CNN--卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于機器翻譯之上.
從上文我們可以得出結(jié)論,RNN(LSTM)機器翻譯按照序列進行工作,也就是和人一樣,按照順序一個個的進行翻譯.但要記住的一點是,目前比較主流的GPU最大的有點是可以進行并行計算.這樣一來RNN就沒法最大化利用GPU的計算能力.
而CNN則可以同時處理多個語言片段,并且具有信息分層處理能力.將文本序列化、單詞向量化,經(jīng)過分層處理后再輸出結(jié)果.在分層過程中,還會不斷回顧源文本來確定下一個輸出序列.
提出這種技術(shù)的是Facebook和最近的機器翻譯新秀DeepL.2017年上半年,Facebook宣布推出了基于CNN開發(fā)的語言翻譯模型,據(jù)說比基于RNN開發(fā)的語言翻譯模型速度快9倍,而且準(zhǔn)確率更高.在測試上,Facebook翻譯系統(tǒng)在英語-德語、英語-法語的測試上都比RNN更接近人工翻譯.
并且,不管是CNN還是RNN都不是機器翻譯的終點,比如谷歌近期提到的不再基于RNN的注意力機制,以及多層神經(jīng)網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)等等,都是解決機器翻譯的方法.在速度、計算資源消耗、情感理解等等多種維度上都有不同的表現(xiàn).
如果從最終的實用性來說,神經(jīng)網(wǎng)絡(luò)模型能影響到的僅僅只是一部分.更多的是語料庫的大小、繁重的語料標(biāo)注工作等等,同時這也注定了蒙古語、藏語這種語料較少語言仍然無法受益于機器翻譯.
人工智能翻譯技術(shù)的飛速發(fā)展,使得近幾年來機器翻譯取代人工翻譯的呼聲,似乎越來越高.不少人工智能的狂熱信徒,動不動就威脅要人工翻譯人員下崗,甚至滅絕.
然而,人類語言的復(fù)雜性眾所周知,人尚且有誤解的時候,冰冷的機器真的足以勝任自然語言的翻譯嗎?
至少目前看來,顯然不能.
首先,在人類語言當(dāng)中,很多用詞和表達方式是多義的、模糊的、跟特定應(yīng)用環(huán)境相關(guān)的.即使是同一個句子,在不同語境下的意思也不相同.例如碰到這樣的情況,機器也會 "迷茫".
請解釋下文中每個"意思"的意思:
阿呆給領(lǐng)導(dǎo)送紅包時,兩人的對話頗有意思. 領(lǐng)導(dǎo):"你這是什么意思?"
阿呆:"沒什么意思,意思意思." 領(lǐng)導(dǎo):"你這就不夠意思了."
阿呆:"小意思,小意思." 領(lǐng)導(dǎo):"你這人真有意思."
阿呆:"其實也沒有別的意思."
我們再通過一些科技文獻翻譯實例的對比,看看AI翻譯與人工翻譯的差距:
原句:
One of the valves in the engine must have gone wrong
谷歌翻譯:發(fā)動機中的閥門之一必須出錯.
人工翻譯:發(fā)動機的一個氣門肯定出了問題.
分析:在汽車制造業(yè),VALVE作為汽車零件,不是通常意義上的"閥門",而是發(fā)動機的"氣門".AI翻譯無法辨識特定應(yīng)用語境中,詞匯多種含義的正確對應(yīng),導(dǎo)致了錯誤的翻譯結(jié)果.而詞語組合gone wrong和應(yīng)該譯作"出錯"還是"出了問題",機器翻譯由于不具備人腦的宏觀直覺,故而也沒能輸出更符合語言習(xí)慣的譯文.
與人工翻譯相比,在處理復(fù)雜的、專業(yè)性或技術(shù)性強的語段時,AI的翻譯結(jié)果,不僅僅是可讀性,流暢性存在差距,縱然是作為基本要求的正確性,也仍有不可容忍的缺陷.更不必說,在不少翻譯實例中,得出正確譯文的關(guān)鍵點,不僅僅是對原文之字面意義"正確認識",更要求對作者的言外之意加以領(lǐng)會.我們再看看以下的例句:
原句:
The 20th century will not be remembered as the era when space was conquered, or the power of the atom, harnessed, but that in which were made the first machines having intelligence.
谷歌翻譯:
二十世紀(jì)不會被記住為空間被征服的時代,或原子的力量,被利用,而在第一臺有智慧的機器.
人工翻譯:
如果在20世紀(jì),人類不制造出具備智能的首批機器,這一時代,也不會作為"征服宇宙的世紀(jì)"或"原子能利用的世紀(jì)"而被人銘記.
可見,就科技英語而論,理解原文的過程,在多數(shù)情況下,是一個語義辯認,語法分析和邏輯分析三方面交互作用的過程,而不單單是一個邏輯分析的過程,請看下面的例句.
原句:
Shortly before the uninhabited space station reached orbit in May 1973,aerodynamic pressure ripped off a meteoroid and heat shield.
谷歌翻譯:
1973年5月無人空間站到達軌道之前不久,空氣動力學(xué)壓力剝離了流星體和隔熱罩.
人工翻譯:
在1973年5月無人太空站到達軌道前不久,它的一個防流星體和防熱的護罩被空氣動力的壓力剝離.
分析:首先,從邏輯上看,說:"空氣動力壓力扯破了一個流星體",是不合事理的,荒謬可笑的.其次,從語言上看,不定冠詞a是說明shield的,而不是說明meteoroid的.通過邏輯分析和語言分析可以清楚地看出,名詞meteoroid和名詞heat原來都是名詞shield的定語.A meteoroid and heat shield 的意思是:一個防流星體和防熱的護罩.而想要對文字信息實現(xiàn)這種層次的理解判斷,必須具備人腦的認知與聯(lián)想.
人工翻譯的優(yōu)勢在于人是有思維的,具有靈活性,翻譯過程中對句子結(jié)構(gòu),語法應(yīng)用,以及上下文的邏輯思想等等都可以自由的分析思考,翻譯出的東西不至于語法混亂,邏輯不清;而且像有些文學(xué)性較強的文章、稿件,人工翻譯就可以有血有肉的表達出其中的韻味,其中的各種思想精髓,不至于生澀難懂.還有人工翻譯可以根據(jù)譯語使用者的語言習(xí)慣,思維方式,風(fēng)俗習(xí)慣等,把譯文翻譯的更符合語使用者的閱讀思維習(xí)慣,使譯文更加的地道精確.翻譯出的譯文也具有很強的可讀性.故此在這一層面的應(yīng)用中,機器翻譯仍然存在著難以克服的缺陷.
語言服務(wù)業(yè)從剛開始堅信"人工翻譯無法替代",到接受人機結(jié)合并紛紛試水擁抱變化,中間經(jīng)歷了抵觸、恐慌、接納的各種轉(zhuǎn)變.
當(dāng)人工翻譯遇上AI,是機遇,還是挑戰(zhàn)?人工翻譯會不會"有朝一日"被機器翻譯完全取代?這個問題一直備受爭議--并且,在 "被取代"之前,這個爭議將一直繼續(xù)下去.
但可以肯定的是,這一天的到來,必定以"機器完全擁有人類智慧"為前提.如果這一設(shè)想當(dāng)真在有朝一日變?yōu)楝F(xiàn)實,那么屆時不止是語言服務(wù)行業(yè),而是整個社會的各行各業(yè),人工勞力都將被人工智能所取代.
就目前發(fā)展趨勢分析,筆者認為,雖然現(xiàn)在可以通過一些實用的技術(shù)讓機器去模擬人的智能活動,模擬人對語義的理解,但相對于徹底的人工智能和語義理解,還有相當(dāng)長的道路.如果有一天機器真的能夠?qū)崿F(xiàn)準(zhǔn)確的實時翻譯,它們的角色更應(yīng)該是輔助相關(guān)產(chǎn)業(yè)的工作人員更輕松、便捷地開展工作,而不是取代人工翻譯的工作崗位.
此外,針對上文分析到的問題,在人工智能的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)領(lǐng)域,有一些解決方案可以作為比較高效的補充,也許這些會成為神經(jīng)網(wǎng)絡(luò)翻譯企業(yè)接下來的重點戰(zhàn)場.
1.引進NMT以外的人工智能技術(shù):巧合的是,近兩年關(guān)于機器翻譯的技術(shù)突破往往來自其他人工智能領(lǐng)域.比如注意力模型,是來自Deepmind在機器視覺領(lǐng)域的技術(shù)構(gòu)想.主動引入其他領(lǐng)域的算法和模型,或許在翻譯領(lǐng)域有神奇的效果.
2.建立機器學(xué)習(xí)使用的用戶數(shù)據(jù)庫,激發(fā)互動:在機器學(xué)習(xí)的原理當(dāng)中,對錯誤樣本糾錯往往是最好的學(xué)習(xí)途徑,但翻譯上的糾錯行為顯然是企業(yè)難以完成的.調(diào)動用戶主動糾錯翻譯結(jié)果,并以之建立數(shù)據(jù)庫,或許是非常便捷的辦法.現(xiàn)在的機器翻譯平臺當(dāng)然都有糾錯功能,但用戶的參與熱情和參與方式是個問題.
3.嘗試優(yōu)質(zhì)訓(xùn)練資料下的弱監(jiān)督學(xué)習(xí):目前的NMT體系,歸根結(jié)底是個有監(jiān)督學(xué)習(xí)過程,很多所謂"莫名其妙"的翻譯結(jié)果都來自翻譯機制無法優(yōu)化.嘗試一些深度學(xué)習(xí)架構(gòu)讓翻譯系統(tǒng)自我優(yōu)化,也許是個解決方案.
4.垂直領(lǐng)域語料數(shù)據(jù)庫&數(shù)據(jù)抽調(diào)系統(tǒng):解決具體的專業(yè)領(lǐng)域,甚至文言文的中英互譯.
(當(dāng)然也包括英文的詩歌和文學(xué)文本),其實也沒什么特別的辦法,擁有強大的垂直領(lǐng)域數(shù)據(jù)庫是硬實力,當(dāng)然好的數(shù)據(jù)抽調(diào)模型會事半功倍.
智能+人工=翻譯的未來
為了彌補人工智能的不足,許多翻譯技術(shù)公司已經(jīng)在嘗試新模式,即人工智能+翻譯眾包(Translation Outsourcing)的結(jié)合.這或許代表了翻譯的未來發(fā)展趨勢.
在這種模式中,人工智能首先完成最基本的翻譯.在拿到來自機器的初步翻譯結(jié)果后,普通譯者首先對機器翻譯的差錯進行更正.隨后,高級譯者將對翻譯后文本的文學(xué)性和專業(yè)性做進一步修訂.這樣的流水作業(yè)將帶來更高的效率,同時確保質(zhì)量.
機器學(xué)習(xí)技術(shù)也會參與這一過程.通過機器學(xué)習(xí),計算機將基于人工修訂后的結(jié)果學(xué)到準(zhǔn)確的單詞表達,以及人類的語言習(xí)慣,從而優(yōu)化未來的翻譯能力.另一方面,計算機也會對人工翻譯的"硬性"部分進行追蹤,幫助譯者避免低級錯誤.在這一過程中,人工智能和人工翻譯將形成良性循環(huán).
人工智能對人工翻譯的幫助還不僅于此.例如,在眾包譯者工作的同時,人工智能將會了解不同譯者具備的專業(yè)性.通過對這類數(shù)據(jù)的收集和分析,人工智能可以向不同譯者分配他們擅長的翻譯內(nèi)容.例如,關(guān)于計算設(shè)備說明書的翻譯將精準(zhǔn)分配至電腦專家,而財務(wù)報告的翻譯將可以由會計專業(yè)的譯者來擔(dān)任.
這種模式正在引起全球投資人的關(guān)注.例如,硅谷創(chuàng)業(yè)孵化器Y Combinator在2014年冬季班時孵化了這樣一家公司Unbabel.與傳統(tǒng)人工翻譯相比,人工智能的引入提高了效率,而不同于單純的機器翻譯,人工翻譯使翻譯的表達更準(zhǔn)確、更流暢,更適合用于正式場合.
在國內(nèi),市場最主要的翻譯需求是中英文之間的互譯,無論是新聞媒體、學(xué)術(shù)論文,還是英美影劇.人工智能和人工翻譯的結(jié)合可以優(yōu)化當(dāng)前翻譯的效率,帶來更自由的跨國交流,創(chuàng)造更大的市場機會.
更重要的是,對于尚未被納入互聯(lián)網(wǎng)的少數(shù)族裔語言,這種模式將帶來明顯幫助.可以想象,通過統(tǒng)一的人工智能數(shù)據(jù)庫,谷歌、雅虎、Facebook等網(wǎng)站將自動翻譯成非洲、南亞或印第安語言,而當(dāng)?shù)刂驹刚呖梢栽诖嘶A(chǔ)上高效的完成優(yōu)化.這將消除互聯(lián)網(wǎng)向貧窮國家普及過程中的語言障礙,成為真正連接全世界的"信息高速公路".
文章的最后,筆者再做一個小小的展望:未來,在機器翻譯領(lǐng)域,一定會出現(xiàn)很多,以某種特定語言為優(yōu)勢的翻譯機構(gòu).這個領(lǐng)域也將吸引更多在語言方面有天才的創(chuàng)業(yè)者的加入,另外,由于文字是文化的重要載體,所以機器翻譯對各個國家文化的傳承,也將發(fā)揮不可磨滅的作用.
[1]Arnold,D.Balkan,L.Meijer,S.Humphreys,R.L.Sadler,Machine Translation:An Introductory Guide[M].University of Essex,2015.
[2]Biber,Douglas,Susan Conrad and Randi Reppen. Corpus Linguistics[M].Cambridge:Cambridge University Press,2013.
[3]Carnie,Andrew.Syntax:A Generative Introduction[M].USA:BLACKWELL PUBLISHING,2014.
[4]Chomsky,N.Aspects of the Theory of Syntax[M].Cambridge,Mass:MIT Press,2016.
[5]Grishman,R.Computational Linguistics:An Introduction[M].Cambridge: Cambridge University Press,1986.
[6]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司,2004.
[7]胡壯麟.語言學(xué)教程[M].北京:北京大學(xué)出版社,2007.
[8]易綿竹,南振興.計算機語言學(xué)[M].上海:上海外語教育出版社,2005.
[9]張政,苗天順.計算語言學(xué)與機器翻譯導(dǎo)論[M].北京:外語教學(xué)與研究出版社,2010.
廣西教育廳"英漢機器翻譯與語言學(xué)接口研究:問題與出路",編號:KY2015YB115.
羅華珍,桂林電子科技大學(xué)外國語學(xué)院副教授,研究方向:英語教學(xué)法.
潘正芹,桂林電子科技大學(xué)外國語學(xué)院副教授,研究方向:翻譯和第二語言習(xí)得.
易永忠,桂林電子科技大學(xué)外國語學(xué)院教授,研究方向:翻譯,英語教學(xué)法.