文/吾守爾·斯拉木 范曉明
近現(xiàn)代以來,隨著歐洲文藝復興、工業(yè)革命,全球經(jīng)濟貿(mào)易文化交流與合作日益緊密,翻譯事業(yè)得到快速發(fā)展。
據(jù)不完全統(tǒng)計,目前人類自然語言約有8000余種,即使最強大的語言大師,窮其一生也只能掌握30多種,人們在日常交往以及政治、經(jīng)濟、文化、科技等信息交互中,主要依賴翻譯或專業(yè)翻譯機構。
國人上小學起就開始學習外語,用外語交流總不如母語得心應手,到頭來真正熟練掌握一門外語并非易事,更不用說掌握多門外語了。對于外國人來說,學習漢語同樣困難,不僅口語難學,象形文字漢字尤其難學,更不用說還有那么多各地方言!是否能夠不通過專業(yè)翻譯,不用學習其他語言,直接使用母語就能讓講不同語言的人們自由交流呢?
實現(xiàn)不同語種之間的無障礙溝通,一直都是人類終極夢想之一。早在1933年,法國工程師阿爾楚尼就萌生了機器翻譯的設想,并獲得一項翻譯機專利。
什么是機器翻譯呢?就是使用計算機把一種語言翻譯成另一種語言的一門學科。機器翻譯要遵循準確、通順、優(yōu)美的基本原則,這個原則是我國清代思想家、翻譯家嚴復首先提出的。
近年來,國內(nèi)外著名高校、互聯(lián)網(wǎng)巨頭提出端到端的神經(jīng)機器翻譯,引入注意力機制,使得基于深度學習的機器翻譯獲得重大突破,神經(jīng)機器翻譯達到實用化階段。谷歌、微軟、百度、科大訊飛、騰訊等機器翻譯系統(tǒng)紛紛上線運行,標志著機器翻譯大規(guī)模應用時代的到來,人類不同語種之間的無障礙溝通夢想或將實現(xiàn)。
我們的科研團隊致力于機器翻譯前沿技術研究,承擔了原國家863計劃“維-漢機器翻譯”項目,應用最先進的基于詞對齊的統(tǒng)計翻譯模型研究出維-漢機器翻譯原型。20多年來,我們的科研團隊面向絲綢之路經(jīng)濟帶和新疆少數(shù)民族信息化需要,在阿爾泰語系、閃含語系多語種操作系統(tǒng)、辦公套件、電子詞典、文字識別、語音識別、語音合成、機器翻譯等領域突破了一批關鍵核心技術,取得了大量科研成果。
新疆大學與科大訊飛股份有限公司聯(lián)合研制的基于語音識別、語音合成、機器翻譯的漢語—維吾爾語雙向語音機器智能翻譯系統(tǒng)研制成功并正式上線,開始為新疆2300多萬漢族和少數(shù)民族群眾提供語言智能翻譯服務,在社會治理、公共服務、文化交流、教育科研中發(fā)揮了巨大作用,初步實現(xiàn)了不同語種之間的無障礙溝通。
雖然翻譯機器的很多核心技術已掌握,但是多語言的共性模型(如通用聲學模型、語言模型、通用算法)和預料數(shù)據(jù),以及知識庫的構建、相互轉換是當前研究的難題,我們期待混合智能認知計算及腦機融合技術將進一步突破,讓機器具備人腦的感知、理解、推理、決策和學習能力,這是多種語言機器翻譯的目標。
當前,研究機構人才眾多、投入也不少,但沒有形成合力,非常需要整合人力和物力資源,共同攻克“一帶一路”多語言互譯平臺建設的許多難關,才能提升翻譯機器的研究水平及其產(chǎn)業(yè)化應用。