湖南張家界不少出租車司機(jī)經(jīng)常拉“老外”,不會(huì)外文也能交流無礙;2019 世界人工智能大會(huì)上,各國大咖扎堆演講,現(xiàn)場卻不見同聲傳譯者;更多中國人海外游,面對東京的日文菜單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語而慌張……
這一切都源于一項(xiàng)近年來不斷取得突破的技術(shù)——機(jī)器翻譯。
全球知名翻譯公司“一小時(shí)翻譯”首席執(zhí)行官奧弗·紹尚曾指出,未來一至兩年內(nèi),基于神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)的機(jī)器翻譯將會(huì)承擔(dān)價(jià)值400億美元翻譯市場上的近一半工作,預(yù)計(jì)會(huì)導(dǎo)致50萬名翻譯失業(yè)。
神經(jīng)機(jī)器翻譯(NMT)自2014年在科學(xué)論文中首次被提及以來,已使機(jī)器翻譯領(lǐng)域出現(xiàn)翻天覆地的變化,它開始全面超越以統(tǒng)計(jì)模型為基礎(chǔ)的統(tǒng)計(jì)機(jī)器翻譯(SMT),快速成為在線翻譯系統(tǒng)的主流標(biāo)配。
神經(jīng)機(jī)器翻譯的“神經(jīng)元”可以學(xué)習(xí)和收集信息,模仿人類大腦的神經(jīng)元建立聯(lián)系。它克服了傳統(tǒng)方法將句子分割為不同片段進(jìn)行翻譯的缺點(diǎn),充分利用上下文信息,對句子進(jìn)行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經(jīng)機(jī)器翻譯系統(tǒng)越來越多,國內(nèi)的阿里巴巴、騰訊、百度、科大訊飛、搜狗,國外的谷歌、臉書、微軟等都在布局,這使相關(guān)技術(shù)發(fā)生質(zhì)變。
如今,許多出租車司機(jī)都能用手機(jī)上的翻譯軟件,輕松和外國朋友溝通。在不少國際會(huì)議上,機(jī)器翻譯干脆直接扮演現(xiàn)場同聲傳譯角色。
語音識(shí)別技術(shù)發(fā)展在這場翻譯革命中也功不可沒。語音識(shí)別包括遠(yuǎn)場識(shí)別、噪聲識(shí)別以及多輪交互,是人工智能的重要切入點(diǎn)。
因此,這場機(jī)器翻譯技術(shù)革命正是人工智能革命夢想照進(jìn)現(xiàn)實(shí)的重要一環(huán)。
“以前,人工智能的翻譯質(zhì)量往好了說,也就是讓你能對文本的內(nèi)容有個(gè)大致了解,專業(yè)翻譯寧愿自己從頭開始翻,”奧弗·紹尚說,“如今,通過神經(jīng)機(jī)器翻譯,人們只要對機(jī)器翻譯內(nèi)容進(jìn)行少量修改,就能獲得人性化翻譯?!?/p>
近年來,隨著深度學(xué)習(xí)的進(jìn)展,機(jī)器翻譯技術(shù)飛速發(fā)展,翻譯質(zhì)量大幅提升,與此同時(shí),機(jī)器翻譯應(yīng)用量也正呈加速增加態(tài)勢。
比如,阿里巴巴達(dá)摩院基于Transformer結(jié)構(gòu)進(jìn)行了網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn)和對詞語位置信息的充分利用,全面改進(jìn)了機(jī)器翻譯的性能,幫助速賣通平臺(tái)上的中國及全球中小賣家,將產(chǎn)品詳情與評論自動(dòng)翻譯成當(dāng)?shù)卣Z言,還實(shí)現(xiàn)了實(shí)時(shí)人工智能語言翻譯的客戶服務(wù)與業(yè)務(wù)咨詢。阿里巴巴的電商機(jī)器翻譯總量已達(dá)到每日7.5億次。在電子郵件和網(wǎng)站頁面語言轉(zhuǎn)換方面,谷歌公司稱,其機(jī)器翻譯服務(wù)每天在全世界被使用超過10億次。
旅游業(yè)對翻譯需求更加旺盛。文旅部數(shù)據(jù)顯示,2018年中國公民出境旅游接近1.5億人次,較2017年增長14.7%。解決語言溝通問題正成為越來越多中國出境游客的迫切需求。
許多中國游客借助智能翻譯軟件和機(jī)器,輕松解決國外道路路牌、餐館菜單和超市購物,甚至在旅途中認(rèn)識(shí)外國朋友。
機(jī)器翻譯的應(yīng)用場景正不斷豐富,越來越多的政府和企業(yè)網(wǎng)站需將內(nèi)容“多語言化”,視頻網(wǎng)站可能需要借助機(jī)器翻譯將視頻內(nèi)容翻譯成多語言版本,就連人工翻譯服務(wù)供應(yīng)商也會(huì)借助機(jī)器翻譯來提升人工翻譯的效率。
圖/東方IC
隨著人工智能技術(shù)的發(fā)展,“機(jī)器取代人”的趨勢日益顯現(xiàn),傳統(tǒng)人工翻譯公司的市場份額正在不斷被機(jī)器翻譯公司占領(lǐng)?!皶r(shí)代的發(fā)展讓傳統(tǒng)翻譯企業(yè)壓力倍增?!眰魃裾Z聯(lián)網(wǎng)網(wǎng)絡(luò)科技股份有限公司董事長兼CEO何恩培說,在1分鐘內(nèi),機(jī)器的翻譯速度是50萬字,而人工翻譯最快速度僅為300字,頂級編輯閱讀速度為每分鐘1500字,也就是說機(jī)器翻譯的速度已遠(yuǎn)遠(yuǎn)超過了人閱讀的速度。
盡管如此,何恩培認(rèn)為“機(jī)器翻譯還無法代替人類譯員”,因?yàn)檎Z言作為人類特有的認(rèn)知能力,涉及社會(huì)、文化、語境、心理等多個(gè)方面,短時(shí)間內(nèi),機(jī)器翻譯要做到真正的“信、達(dá)、雅”,仍面臨不少困難。
加拿大國家研究委員會(huì)研究員、阿里巴巴達(dá)摩院資深算法專家陳博興表示,由于中文的語義復(fù)雜性,在谷歌翻譯的一次測試中,中英互譯的準(zhǔn)確率遠(yuǎn)低于法語和西班牙語的英語互譯,如在公共場所常見的“小心碰頭”(Mind your head)標(biāo)語,機(jī)器翻譯往往出現(xiàn)“Carefully bang head”“Meet carefully”“Look out,Knock head”等啼笑皆非的翻譯結(jié)果?!霸诳梢灶A(yù)見的未來,機(jī)器翻譯質(zhì)量還達(dá)不到專業(yè)譯員水平。”陳博興表示,與人工翻譯相比,機(jī)器翻譯成本低得多,其適用于對翻譯錯(cuò)誤有一定容忍度的場景,如日常會(huì)話、資訊信息、社交網(wǎng)絡(luò)等。今后,大量簡單的可讀翻譯會(huì)被機(jī)器取代,但優(yōu)質(zhì)翻譯仍將是人的天下,專業(yè)譯員不必太擔(dān)心失業(yè)問題。
陳博興介紹,2017年,人工語言服務(wù)約翻譯了1500億個(gè)詞語,全球翻譯市場規(guī)模約450億美元,同比增速超過10%;2018年,機(jī)器每一天的在線翻譯量就高達(dá)8000億至1萬億詞語,其市場空間驚人?!霸谡虝?huì)見、合同文書等專業(yè)翻譯領(lǐng)域,人機(jī)共譯模式將是未來的發(fā)展方向?!焙味髋嗾J(rèn)為,隨著人工智能技術(shù)升級,每一名譯員背后都會(huì)配有專屬翻譯電腦,在數(shù)年學(xué)習(xí)、適應(yīng)譯員的翻譯風(fēng)格后,就像警察和警犬一樣分工協(xié)作,使人工翻譯速度提高40倍至100倍。