哈斯葉提·居瑪
摘要:隨著互聯(lián)網(wǎng)的興起與發(fā)展,不僅僅是帶來一場新技術(shù)的革命,同時也是對傳統(tǒng)行業(yè)的巨大挑戰(zhàn),比如翻譯工作。在互聯(lián)網(wǎng)時代下人工智能技術(shù)和CAT技術(shù)的發(fā)展與成熟,大家開始擔(dān)心機(jī)器會逐漸取代傳統(tǒng)人工翻譯。但是漢語言博大精深,不光日常用語、用法不好掌握,就拿極具文化底蘊(yùn)的詩歌來說,即便是人工翻譯也不能保證完全轉(zhuǎn)譯,能達(dá)到七八分神韻和意味已經(jīng)是非常接近了,何況是機(jī)器翻譯呢。人工翻譯是一個古老的職業(yè),需要具有非常專業(yè)的文化、學(xué)識水平,新時代的快速發(fā)展,并不意味著可以使機(jī)器翻譯取代人工翻譯,但是卻對人工翻譯提出了更高的要求,只有緊跟時代的發(fā)展并且借助科技力量,與時俱進(jìn),才能更好更精準(zhǔn)的去翻譯。本文從機(jī)器翻譯的原理,人工智能翻譯的發(fā)展現(xiàn)狀與前景分析進(jìn)行論述。
關(guān)鍵詞:人工智能翻譯 發(fā)展現(xiàn)狀 前景分析
在經(jīng)濟(jì)高速發(fā)展的今天,隨著互聯(lián)網(wǎng)的深入,人工智能會是社會發(fā)展的必然選擇。已有的事實證明機(jī)器人通過加強(qiáng)學(xué)習(xí),可以勝任很多的職位,尤其是AI智能翻譯,以前我們想南北方地域差異,語言存在一定的理解錯誤,但是現(xiàn)在智能手機(jī)可以實時翻譯不再是難事。因此人工智能翻譯需要不斷地學(xué)習(xí),提升,包括計算能力、對于科學(xué)信息的認(rèn)知、語言學(xué)等等,這也是人工智能翻譯的更高目標(biāo),實現(xiàn)更為精準(zhǔn)的翻譯。
一、翻譯的本質(zhì)與定義
翻譯是不同語言之間的轉(zhuǎn)換,如果要達(dá)到精準(zhǔn)翻譯就得結(jié)合不同地區(qū),不同國家的語言規(guī)范以及標(biāo)準(zhǔn),它的本質(zhì)是科學(xué)性和藝術(shù)性的有機(jī)統(tǒng)一。黃振定指出,對于翻譯活動而言,其中蘊(yùn)含著一定的科學(xué)以及藝術(shù)特性,可以說是兩者的協(xié)調(diào)統(tǒng)一。王寧對翻譯有著這樣的理解,即:翻譯是一種媒介,通過翻譯可以實現(xiàn)兩種不同語言、形象與語言、符碼與文字等的良好轉(zhuǎn)換,是一種將不理解的事物轉(zhuǎn)化為可理解事物的過程。劉宓慶提出,對于翻譯的藝術(shù)性以及科學(xué)性,兩者都是不可被忽視的,這是由于這項活動既具備科學(xué)性質(zhì)有具備藝術(shù)性質(zhì)。若通過機(jī)器進(jìn)行翻譯,其原理是以語料庫為主要基礎(chǔ)開展相應(yīng)的翻譯活動,這一翻譯方式雖然具備一定的科學(xué)性,不過在藝術(shù)性的表現(xiàn)上差強(qiáng)人意,甚至有時無法將其藝術(shù)性表現(xiàn)出來,特別是對于文學(xué)作品的翻譯,這一問題更為突出,而若想將翻譯活動的藝術(shù)性以及科學(xué)性都體現(xiàn)出來,往往需要通過人工翻譯的方式。
近年來,科學(xué)技術(shù)的不斷發(fā)展下,人們的閱讀習(xí)慣逐漸呈現(xiàn)出多樣化的變化趨勢,翻譯不僅僅只局限于語言間的轉(zhuǎn)換,而是逐漸向表現(xiàn)形式、字符以及圖像等方向進(jìn)行延伸。例如,課堂上教師會將文言文轉(zhuǎn)化為白話文,從而使學(xué)生對其內(nèi)容進(jìn)行了解;生活中父母會拿著圖畫書為孩子講述其中的故事等等,以上行為均屬于翻譯活動,這種類型的翻譯活動,是無法通過機(jī)器實現(xiàn)的?,F(xiàn)階段,機(jī)器翻譯往往只是語種間的翻譯,沒有辦法實現(xiàn)現(xiàn)代文與古文的互譯,更難以進(jìn)行圖像、字符、表現(xiàn)形式等人的主觀性要求較高的翻譯材料的翻譯。
二、機(jī)器翻譯原理
機(jī)器翻譯還被稱為人工智能翻譯,具體是指在機(jī)器的深度學(xué)習(xí)下,將一種抽象的符號系統(tǒng)向符號系統(tǒng)進(jìn)行轉(zhuǎn)化的過程,機(jī)器的翻譯行為,代表著人工智能與人類的一種深度競爭,其原理共包括兩種:第一種,基于語法規(guī)則的機(jī)器翻譯;第二種,基于統(tǒng)計的機(jī)器翻譯,下文分別做出闡述。
首先,基于語法規(guī)則的機(jī)器翻譯
大多數(shù)機(jī)器翻譯都是基于語法規(guī)則下進(jìn)行的,常見的有中間語言法、轉(zhuǎn)化法以及直接法。對于中間語言法,其是利用無歧義的、通用的中間語言實現(xiàn)過渡。對于轉(zhuǎn)化法,是將中間表達(dá)式置于原語和譯語間,利用中間表達(dá)式實現(xiàn)翻譯目的。對于直接法,是將譯文的詞、句通過原文詞、句進(jìn)行表達(dá),并適當(dāng)調(diào)整詞序。以上方法中,直接法是較為典型的翻譯方式,一直沿用至今。
其次,基于統(tǒng)計的機(jī)器翻譯
這種方式是將機(jī)器翻譯看作噪音信道問題,語言A通過信道變形為語言B,通過對源語言B的觀察,從而得到目標(biāo)語言A,通過概率法找到可能性最大的S。
三、機(jī)器翻譯發(fā)展現(xiàn)狀
機(jī)器翻譯是將計算機(jī)技術(shù)作為主要的技術(shù)支撐,將一種自然語言向另一種自然語言進(jìn)行轉(zhuǎn)化的過程,作為一種應(yīng)用工程,其是多種科學(xué)的集合,包括語言科學(xué)、計算機(jī)科學(xué)、數(shù)理邏輯科學(xué)等,屬于邊緣學(xué)科或交叉學(xué)科領(lǐng)域。早在20世紀(jì)50年代,美國就出現(xiàn)了機(jī)器翻譯,現(xiàn)今,大多數(shù)國家都已經(jīng)具備機(jī)器翻譯的能力。近年來,在計算機(jī)技術(shù)的不斷發(fā)展下,機(jī)器翻譯能力也得以增強(qiáng),逐漸具備了智能聲控翻譯功能,例如,手機(jī)具有語音識別能力,可以執(zhí)行簡單的聲控翻譯了,不懂外語的人只要選擇手機(jī)上的相應(yīng)功能按鈕,就可以通過有聲語言輸入,轉(zhuǎn)換成所需要的外語,不過這個翻譯技術(shù)還處于簡單的語言處理階段。由于機(jī)器翻譯速度快,成本低,已經(jīng)成為翻譯界最受青睞的翻譯工具。在我國,機(jī)器翻譯進(jìn)入百姓生活最早是在20世紀(jì)90年代,最初的詞對詞翻譯軟件是金山詞霸,發(fā)展至今,機(jī)器翻譯已經(jīng)能夠做到在短短的幾分鐘內(nèi),完成大篇幅文章的處理工作,是當(dāng)前不可缺少的翻譯方式。并且,在機(jī)器翻譯的開發(fā)上,也逐漸向多元化方向發(fā)展,出現(xiàn)了較多的網(wǎng)絡(luò)在線翻譯平臺、翻譯軟件等,規(guī)模逐漸壯大,較多的開發(fā)機(jī)構(gòu)以及軟件也逐漸拓寬了自身發(fā)展領(lǐng)域,不僅僅局限于大的公司、企業(yè),而是朝向更為豐富、開闊的方向發(fā)展。現(xiàn)階段,全國各大城市,基本上均具有機(jī)器翻譯的軟件開發(fā)公司,較多的電腦公司也逐漸向機(jī)器翻譯的開發(fā)市場進(jìn)發(fā),想要在此開疆拓土,目前,基于語料庫的翻譯漢維互譯實例正成為未來發(fā)展的方向,少數(shù)民族語言的翻譯也開始初露端倪。
四、AI翻譯的發(fā)展前景
一開始,語言服務(wù)業(yè)一直認(rèn)為“人工翻譯無法替代”,隨著科學(xué)技術(shù)的不斷發(fā)展,逐漸進(jìn)行人機(jī)結(jié)合積極探究新的轉(zhuǎn)變方向,在這一過程中經(jīng)歷了種種轉(zhuǎn)變,從開始的抵觸到恐慌最終達(dá)接納。AI的出現(xiàn),對于人工翻譯而言到底是促進(jìn)其發(fā)展的良機(jī),還是一種不可阻擋的挑戰(zhàn)?是否在未來的某一天,機(jī)器翻譯完全取代人工翻譯也是一直以來各界關(guān)注的話題,針對這一問題,在人工翻譯真正“被取代”之前,會一直繼續(xù)下去。但可以肯定的是,這一天的到來,必定以“機(jī)器完全擁有人類智慧”為前提。如果這一設(shè)想當(dāng)真在有朝一日變?yōu)楝F(xiàn)實,那么屆時不只是語言服務(wù)行業(yè),而是整個社會的各行各業(yè),人工勞力都將被人工智能所取代。
就目前發(fā)展趨勢分析,雖然當(dāng)前能有利用一些實用的技術(shù)讓機(jī)器去模擬人的智能活動,模擬人對語義的理解,不過相對于徹底的人工智能以及語義理解,仍然有較大的發(fā)展空間。若在未來機(jī)器真的可以實現(xiàn)準(zhǔn)確的實時翻譯,其角色更應(yīng)該是輔助相關(guān)產(chǎn)業(yè)的工作人員更輕松、便捷地開展工作,并不是完全取代人工翻譯。此外,針對上文分析到的問題,在人工智能的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)領(lǐng)域,有一些解決方案可以作為比較高效的補(bǔ)充,或許在未來,這些會成為神經(jīng)網(wǎng)絡(luò)翻譯企業(yè)接下來的重點發(fā)展方向。
第一,引進(jìn)NMT以外的人工智能技術(shù):近年來,在其他人工智能領(lǐng)域機(jī)器翻譯技術(shù)實現(xiàn)了新的突破。例如,注意力模型的出現(xiàn),是始于Deepmind在機(jī)器視覺領(lǐng)域的技術(shù)構(gòu)想。由此可見,將其他領(lǐng)域的算法與模型引入翻譯領(lǐng)域,或許可以取得意想不到的收獲。
第二,建立機(jī)器學(xué)習(xí)使用的用戶數(shù)據(jù)庫,激發(fā)互動:在機(jī)器學(xué)習(xí)的原理當(dāng)中,往往通過對錯誤樣本糾錯能夠起到較好的學(xué)習(xí)效果,不過,通常情況下,企業(yè)很難完成翻譯上的糾錯行為。調(diào)動用戶主動糾錯翻譯結(jié)果,同時,將其作為主要依據(jù)進(jìn)行數(shù)據(jù)庫的建立,或許是非常便捷的辦法?,F(xiàn)今,存在的大多機(jī)器翻譯平臺都會具備糾錯功能,不過有些用戶的參與熱情以及參與方式會直接影響到實際的應(yīng)用效果。
第三,建立完善和深度的學(xué)習(xí)架構(gòu),是為了讓翻譯系統(tǒng)不斷地進(jìn)行自我優(yōu)化,從而解決很多“不知所述、莫名其妙”的翻譯結(jié)果。其實就是嘗試優(yōu)質(zhì)訓(xùn)練資料下的弱監(jiān)督學(xué)習(xí),歸根結(jié)底是個有監(jiān)督學(xué)習(xí)過程,也許是個解決方案。
第四,利用專業(yè)的系統(tǒng)領(lǐng)域去解決一些專業(yè)方面的翻譯,比如文言文的漢維翻譯,這些沒有特別的方法,擁有強(qiáng)大的垂直領(lǐng)域數(shù)據(jù)庫是硬實力,當(dāng)然好的數(shù)據(jù)抽調(diào)模型會事半功倍。