西北農(nóng)林科技大學(xué)外語系 邵 華 楊曉峰
人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng),作為推動(dòng)未來生產(chǎn)力發(fā)展和產(chǎn)業(yè)融合的重要驅(qū)動(dòng)力,已成為繼移動(dòng)互聯(lián)網(wǎng)之后的當(dāng)前國際競(jìng)爭(zhēng)新焦點(diǎn)。2017年7月,國務(wù)院首次發(fā)布《新一代人工智能發(fā)展規(guī)劃》,要求建設(shè)人工智能學(xué)科,“利用智能技術(shù)加快推動(dòng)人才培養(yǎng)模式、教學(xué)方法改革”,宣布將舉國之力在2030年搶占人工智能全球制高點(diǎn)。2018年3月5日,李克強(qiáng)總理在政府工作報(bào)告中四次提及“智能”,特別指出要“加強(qiáng)新一代人工智能研發(fā)應(yīng)用”、“發(fā)展智能產(chǎn)業(yè)”。2018年3月21日,教育部公布關(guān)于2017年度普通高等學(xué)校本科專業(yè)備案和審批結(jié)果的文件,數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、機(jī)器人工程、智能科學(xué)與技術(shù)等人工智能專業(yè)屢次上榜;在新增備案本科專業(yè)名單中,包括中國人民大學(xué)、廈門大學(xué)、華南理工大學(xué)在內(nèi)的89所教育部直屬高校申請(qǐng)開設(shè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),人工智能一時(shí)風(fēng)頭無兩。
在語言服務(wù)領(lǐng)域,人工智能與翻譯相結(jié)合,使得以計(jì)算機(jī)為主體的機(jī)器全自動(dòng)翻譯和以人工為主體的計(jì)算機(jī)輔助翻譯(機(jī)器半自動(dòng)翻譯)成為可能。谷歌、百度、阿里巴巴等商業(yè)巨頭在此爭(zhēng)相分羹,電子詞典、翻譯軟件層出不窮,給傳統(tǒng)語言服務(wù)行業(yè)帶來了機(jī)遇的同時(shí),也提出了新的疑難:人工智能翻譯是否能取代人工翻譯?翻譯行業(yè)人才又將何去何從?
從早期詞典匹配結(jié)合語言學(xué)知識(shí)的規(guī)則翻譯,到基于語料庫的統(tǒng)計(jì)機(jī)器翻譯,再到基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)算法,如今的機(jī)器翻譯已擺脫逐字逐句的生搬硬套。利用LSTM((Long-Short-Term-Memory))的循環(huán)神經(jīng)網(wǎng)絡(luò),人工智能可以模擬人腦理解語言,通過大量的(輸入、目標(biāo)語言)句子集合來訓(xùn)練完整的框架,機(jī)器“知道”輸入的語言類別,甚至可以宏觀把握原文的整個(gè)語篇及到目前為止生成的譯文,以提供更加準(zhǔn)確流暢的翻譯。在“主+謂+賓”和“主+賓+謂”兩種不同語序的語言之間翻譯時(shí),可以重新排序,達(dá)到譯文流暢、通順易讀的基本目標(biāo)。
圖1
比如提供英語→日語和英語→漢語翻譯訓(xùn)練,機(jī)器將輸入的語言解碼,轉(zhuǎn)化成內(nèi)在的通用語言形式,便可以自動(dòng)地實(shí)現(xiàn)日語→漢語的轉(zhuǎn)化。如任何語言中“足球”這個(gè)詞,都讓人想到由黑白兩色的正五邊形拼接而成的球體——機(jī)器所理解概念意義上的“足球”,不受語種的限制。如此,機(jī)器像人腦一樣不斷輸入、學(xué)習(xí)、處理、轉(zhuǎn)化、吸收,有望實(shí)現(xiàn)多語言實(shí)時(shí)翻譯、跨語言數(shù)據(jù)檢索和深度文本分析,為人類再造語言的巴別塔。
圖2
目前,人工智能翻譯的觸角已伸及“即時(shí)視覺翻譯”:利用移動(dòng)終端的攝像頭即時(shí)取詞,實(shí)時(shí)將文本OCR識(shí)別、解碼翻譯,通過增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,簡(jiǎn)稱AR)將譯文覆蓋原文,達(dá)到人工同聲傳譯的效果。在2018年的博鰲亞洲論壇上,騰訊同傳作為官方指定的獨(dú)家人工智能(AI)同聲傳譯合作伙伴,開創(chuàng)了博鰲亞洲論壇使用非人類同傳翻譯的先河。
計(jì)算機(jī)輔助翻譯(Computer-Aided Translation,簡(jiǎn)稱CAT)是由機(jī)器翻譯發(fā)展而來,有別于全自動(dòng)的機(jī)器翻譯,計(jì)算機(jī)輔助翻譯以人工翻譯為主導(dǎo),輔助以翻譯工具,包括術(shù)語詞典、翻譯記憶庫、翻譯軟件、翻譯術(shù)語工具、翻譯記憶工具和翻譯平臺(tái)網(wǎng)站等。因其兼顧效率和準(zhǔn)確性,在譯員工作中起到事半功倍的效果而廣受翻譯市場(chǎng)歡迎。
計(jì)算機(jī)輔助翻譯的核心技術(shù)是翻譯記憶。譯員利用CAT軟件翻譯時(shí),原文和譯文會(huì)保存在后臺(tái)建立的翻譯記憶庫中,當(dāng)遇到相似的語料,系統(tǒng)通過自動(dòng)搜索記憶庫中相同或相似的片段并給出參考譯文,用戶可采納、編輯或舍棄,如此譯員可以避免無謂的重復(fù)勞動(dòng),只需專注于新內(nèi)容的翻譯,工作效率和譯文質(zhì)量得到保障和提升。
目前翻譯市場(chǎng)主流的計(jì)算機(jī)輔助翻譯包括翻譯記憶系統(tǒng)、對(duì)其工具、術(shù)語管理系統(tǒng)、項(xiàng)目管理系統(tǒng)等模塊,各自在規(guī)模性的筆譯項(xiàng)目中互相配合,參與需求處理、譯前處理、資源匹配、譯員培訓(xùn)、里程碑分析、稿件派發(fā)、翻譯、審校、質(zhì)檢排版、交付、反饋修改等過程,集成完成計(jì)算機(jī)輔助翻譯。
以翻譯軟件Trados為例,譯員個(gè)人利用CAT完成一項(xiàng)翻譯任務(wù)步驟包括:接收SDLXLIFF文件—翻譯單個(gè)文檔—?jiǎng)?chuàng)建翻譯記憶庫—加載術(shù)語—合并術(shù)語—相關(guān)搜索(語料庫)—確認(rèn)并移至下一句—審校修訂—導(dǎo)出以進(jìn)行雙語校審(Word)—提取術(shù)語—Tag處理—批任務(wù)—分析文件、導(dǎo)出—最終交付。過程看似繁復(fù),實(shí)則省時(shí)省力,CAT大大提高了譯員的翻譯速度和翻譯質(zhì)量。
如今翻譯公司在市場(chǎng)運(yùn)作中或購買專業(yè)CAT工具,或兼有科技公司性質(zhì)自主研發(fā)CAT軟件,人工智能+翻譯創(chuàng)造的生產(chǎn)力達(dá)史前最高峰,國內(nèi)眾多互聯(lián)網(wǎng)巨頭更是紛紛跑馬圈地,競(jìng)相布局以爭(zhēng)風(fēng)口,市場(chǎng)一片繁榮向好。
承認(rèn)與否,人工智能新時(shí)代已經(jīng)來臨??拼笥嶏w董事長(zhǎng)攜曉譯翻譯機(jī)亮相兩會(huì),AlphaGo戰(zhàn)勝人類頂尖圍棋手李世石、柯潔,人機(jī)高考大戰(zhàn)AI表現(xiàn)出色,無人駕駛汽車相繼亮相街頭,生產(chǎn)車間裝滿智能化、自動(dòng)化流水線,還有智能機(jī)械手臂、無人駕駛、人臉識(shí)別……不經(jīng)意間,人工智能已經(jīng)悄無聲息地滲透到人類生活,在各行各業(yè)中得到一定普及與應(yīng)用,在這個(gè)追求效率和服務(wù)至上的時(shí)代,成為了當(dāng)之無愧的寵兒,甚至在國民經(jīng)濟(jì)發(fā)展中扮演的角色也愈加重要。
與此同時(shí),人工智能威脅論、人類失業(yè)危機(jī)等負(fù)面輿論甚囂塵上,成了目前人類對(duì)人工智能強(qiáng)勢(shì)崛起最為忌憚的痛點(diǎn)所在。就語言服務(wù)領(lǐng)域來說,機(jī)器客服、智能翻譯憑借語音或文本的方式已經(jīng)實(shí)現(xiàn)與用戶的自然交互,傳統(tǒng)行業(yè)從業(yè)者收到的沖擊不容小覷。
無論如何模擬人腦,人工智能終歸是受計(jì)算機(jī)語言控制,按照預(yù)先的算法和設(shè)定的程序運(yùn)作,結(jié)果是在一定范圍內(nèi)的選擇,而非無限的可能和創(chuàng)造。AlphaGo圍棋可以戰(zhàn)勝李世石、打敗柯潔,一定程度上是得益于圍棋競(jìng)技本身具有算數(shù)推演、可能有限的特點(diǎn),而語言并非如此。
“本質(zhì)上,機(jī)器翻譯是基于雙語描寫、對(duì)比和匹配結(jié)果的形式化和程序化處理,實(shí)現(xiàn)不同語言的自動(dòng)翻譯,其特征主要表現(xiàn)為自動(dòng)化、機(jī)械化、以句子為翻譯單位、二度模仿和語境制約有限等特征?!边@決定了其多適用于高重復(fù)率高程式化文本,比如法律文書、產(chǎn)品說明、合同訂單。在含有豐富的語言現(xiàn)象、文學(xué)理念、修辭手法以及特定環(huán)境的文本中,機(jī)器翻譯無法替代人腦做出聯(lián)想和想象,無法傳遞人際間的情感與審美,無法描繪出一萬個(gè)讀者心目的一萬個(gè)哈姆雷特。
語言是人類的文明成果,是思維邏輯的載體。拿中英翻譯來說,中文語言意合形散、規(guī)則性弱,英語語言邏輯縝密、形式嚴(yán)謹(jǐn),是兩個(gè)民族在歷史發(fā)展過程中形成的獨(dú)家藝術(shù),反映了各自不同的哲學(xué)思想和思維方式,二者本身就存在無法全盤轉(zhuǎn)化和表達(dá)的弊端。人類語言系統(tǒng)之錯(cuò)綜復(fù)雜,使人類自身對(duì)大腦思維與自然語言之間的處理方式、語言思維與文化背景之間的聯(lián)絡(luò)關(guān)系就認(rèn)知尚淺,又怎能訓(xùn)練機(jī)器做到與人腦反應(yīng)無二?
騰訊AI在博鰲論壇同傳中犯下“一條公路和一條腰帶”這般讓人啼笑皆非的錯(cuò)誤,曉譯翻譯機(jī)無法識(shí)別言語復(fù)雜和口齒不清的語句······種種缺憾證明目前AI翻譯或是AI對(duì)話中,語義分析、語篇分析、語境分析都是尚未攻克的難題,又何談文化思維的翻譯轉(zhuǎn)化;加之保證語料庫的與時(shí)更新和硬件技術(shù)的支持保障本身就是一項(xiàng)浩瀚工程,現(xiàn)在的人工智能遠(yuǎn)非至善,還有長(zhǎng)足的發(fā)展空間。
5.3.1 高校課程改革
AI的尚未完美和冉冉升起,正是人才培養(yǎng)和發(fā)展的改革機(jī)遇期。目前諸多高校已順應(yīng)科技潮流和市場(chǎng)變化,積極調(diào)整課程大綱和專業(yè)設(shè)置,培養(yǎng)符合時(shí)代要求的翻譯人才。北京大學(xué)軟件與微電子學(xué)院計(jì)算機(jī)技術(shù)系率先開設(shè)計(jì)算機(jī)輔助翻譯專業(yè),作為新興的交叉學(xué)科,培養(yǎng)文理兼?zhèn)涞膹?fù)合型人才;筆者所在的西北農(nóng)林科技大學(xué)外語系開設(shè)計(jì)算機(jī)輔助翻譯課程,采取傳統(tǒng)理論教學(xué)+翻譯輔助工具模式,利用Trados、MemoQ等翻譯軟件帶領(lǐng)學(xué)生開展項(xiàng)目實(shí)踐。綜合來看,高校管理者和翻譯專業(yè)師生已經(jīng)意識(shí)到,未來市場(chǎng)需要的不是僅能掌握翻譯原理和技巧的傳統(tǒng)譯員,而是“專業(yè)+技術(shù)”,“效率+質(zhì)量”的高端翻譯人才。
5.3.2 “智能+人工”——翻譯的理想國
分析看來,機(jī)器翻譯、計(jì)算機(jī)輔助翻譯、人工翻譯都是提供語言服務(wù)的手段和工具,目的是達(dá)到一定的服務(wù)質(zhì)量和服務(wù)效率,各有千秋,工力悉敵。機(jī)器在程式化翻譯上的效率無可比擬,人類在情感和審美上的思考獨(dú)一無二。人工智能或?qū)⑷〈斯しg的觀點(diǎn)多是技術(shù)、商圈、媒體為引資本、博噱頭而夸下的???,卻無意中攪亂了行業(yè)的風(fēng)向標(biāo),致使有人或?qū)θ斯しg唉聲嘆氣,或?qū)C(jī)器翻譯嗤之以鼻,而忽視了人工與智能之間的互補(bǔ)互助、互不替代的聯(lián)結(jié)關(guān)系。
筆者認(rèn)為,隨著體力工作和知識(shí)工作自動(dòng)化進(jìn)程,人工智能會(huì)重新定義翻譯行業(yè):“人工智能+翻譯眾包(Translation Outsourcing)”或?qū)⑹俏磥戆l(fā)展方向。由人工智能完成初級(jí)翻譯和低錯(cuò)質(zhì)檢,人工譯員進(jìn)行專業(yè)化的潤(rùn)色修改;同時(shí)機(jī)器在后臺(tái)自動(dòng)存儲(chǔ)和不斷學(xué)習(xí)修改的譯文,變得更加“聰明”、更具“人性”特征。不僅如此,人工智能將與人工譯員成為個(gè)性化拍檔,AI學(xué)習(xí)特定譯員的語言風(fēng)格、掌握一定領(lǐng)域的專業(yè)表達(dá),與人工譯員合作完成復(fù)雜多樣的翻譯任務(wù),進(jìn)一步提高服務(wù)效率和服務(wù)質(zhì)量。
“君子性非異也善假于物也”,未來翻譯的理想國里,不是機(jī)器取代人工,而是善用工具的譯員取代傳統(tǒng)守舊的譯員,專業(yè)高級(jí)譯員取代底端從業(yè)者。精益求精、工匠精神,是未來各行各業(yè)免受AI侵蝕的必然要求,是人類社會(huì)發(fā)展到一定程度的自然現(xiàn)象。