摘 要:談及AI時(shí)代,人類將面對(duì)史無(wú)前例的失業(yè)潮,然而當(dāng)這個(gè)時(shí)代初露光芒的時(shí)候,展現(xiàn)的卻是輔助人類更好完成工作的能力。在使用的過(guò)程中,有些行業(yè)的表現(xiàn)符合期待值,有些行業(yè)的表現(xiàn)揭示了這一個(gè)時(shí)代或許遠(yuǎn)未來(lái)到。
關(guān)鍵詞:AI;滿足;實(shí)現(xiàn);翻譯;開(kāi)發(fā)
作者簡(jiǎn)介:郭衡廣(1988.8-),男,漢族,湖南省衡陽(yáng)市人,對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)英語(yǔ)學(xué)院,研究生在讀,研究方向:外國(guó)語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)。
[中圖分類號(hào)]:H08 [文獻(xiàn)標(biāo)識(shí)碼]:A
[文章編號(hào)]:1002-2139(2018)-26--02
每隔一段時(shí)間,總會(huì)因?yàn)橐患掳l(fā)明普及應(yīng)用,引發(fā)新一輪失業(yè)恐慌。寒暑歷經(jīng)千載,從未有過(guò)比AI更令人緊張焦慮的沖擊。它不僅以更徹底,更深刻,更廣泛地姿態(tài)進(jìn)入日常生活,還以更受歡迎的形式永久取代了一個(gè)又一個(gè)傳統(tǒng)行業(yè)。持續(xù)幾十年的告誡——“機(jī)器將取代人類”不再是飯后笑談,隨著AI一代代更新,這句告誡正一步步成為可能。
這種可能最初認(rèn)定為一只沒(méi)有耳朵的藍(lán)色機(jī)器貓。因?yàn)樗哪L(fēng)趣,攜帶各種稀奇古怪的發(fā)明,總能恰到好處滿足主角的愿望,比人類更加智能,更能適應(yīng)各種環(huán)境變換。它創(chuàng)作不久就風(fēng)靡全球,大眾甚至把它奉為AI的終極形態(tài)。畫面與好萊塢商業(yè)電影差距巨大,有些許爭(zhēng)執(zhí),但其影響力無(wú)可非議。動(dòng)畫片中許多發(fā)明在上個(gè)世紀(jì)80年代看起來(lái)是天方夜譚,如今已經(jīng)一一實(shí)現(xiàn),并且比當(dāng)年設(shè)想的構(gòu)造更加先進(jìn),比如3D打印機(jī),立體全息投影,全球定位系統(tǒng)等等。
每一件發(fā)明都完美貼合設(shè)想的背后,基于有效順暢的溝通,才能讓機(jī)器貓快速準(zhǔn)確處理人類語(yǔ)言信息,并適當(dāng)給出最完美的方案。若發(fā)生卡頓,那么一切都不會(huì)實(shí)現(xiàn)。這恰恰是所有發(fā)明中最難以實(shí)現(xiàn)的部分。人之所以為人,是因?yàn)槿祟愑凶晕乙庾R(shí),能思考,能創(chuàng)造,能產(chǎn)生喜怒哀樂(lè),用理智去適應(yīng)和造福世界。而機(jī)器貓更像是一種輔助程序,執(zhí)行任何即時(shí)命令,讓人類生活的障礙與挫折變成打怪升級(jí)的小關(guān)卡。
迄今為止,使用頻率最接近與機(jī)器貓溝通的智能程序是Siri。無(wú)論使用者是中國(guó)人還是美國(guó)人或者來(lái)自他地區(qū)的公民,架起智能程序與人類溝通的橋梁必須通過(guò)語(yǔ)言來(lái)實(shí)現(xiàn)。無(wú)論是早期只能哼哼歌的siri,還是更趨人性化的siri,通過(guò)特定的算法和結(jié)構(gòu),僅可以高效的完成人類交給的單一任務(wù)。觸發(fā)任務(wù)并非全語(yǔ)音操控,必須在即時(shí)語(yǔ)音對(duì)講之前,點(diǎn)擊特定的功能選項(xiàng),說(shuō)出一段完整的簡(jiǎn)單句。比如對(duì)siri說(shuō)“找尋附近的銀行”,它將以當(dāng)前GPS定位為基準(zhǔn),搜出符合目標(biāo)語(yǔ)言的所有選項(xiàng)。語(yǔ)句再?gòu)?fù)雜一點(diǎn),增加幾個(gè)修飾語(yǔ),如“找尋附近有快遞的銀行”,它將顯示兩種結(jié)果,一種結(jié)果是附近快遞和銀行在同一個(gè)系統(tǒng)的郵政銀行,另一種就是離快遞很近的銀行。在中國(guó),正確答案顯然是前一種。因?yàn)殂y行設(shè)點(diǎn)常常處于城市的繁華地段,快遞網(wǎng)點(diǎn)更多位于租金低廉的偏僻地帶。看起來(lái)有點(diǎn)挫折,然而表現(xiàn)結(jié)果至少做出了快速反應(yīng)。將語(yǔ)句的難度再進(jìn)行提高,加入地方特色或者行業(yè)術(shù)語(yǔ)等等,如“找尋附近可做跨境購(gòu)付無(wú)紙化的銀行”,它將一遍一遍重復(fù):“請(qǐng)?jiān)僬f(shuō)一次,我聽(tīng)不懂您的意思?!?/p>
中文也許不是開(kāi)發(fā)者所擅長(zhǎng)的語(yǔ)言,那么換成開(kāi)發(fā)者所在國(guó)家的母語(yǔ),其結(jié)果依舊難以讓人滿意。按住語(yǔ)音輸入虛擬話筒,發(fā)出指令“How to get the nearest bank?(找尋最近的銀行)”它搜索英語(yǔ)的速度比中文快很多,詞條識(shí)別準(zhǔn)確,夾雜一段詼諧流利的調(diào)侃:“Be careful your wife(小心枕邊人)”。如同使用中文時(shí)一樣的操作,給輸入的語(yǔ)句加一點(diǎn)限定詞:“How to get the nearest bank with express?(哪有銀行辦理快遞業(yè)務(wù))”。它瞬間秒回附近所有的快遞和銀行網(wǎng)點(diǎn),顯然它將express和bank識(shí)別為2個(gè)獨(dú)立的單位。再加入指定更加明顯的地域背景:“How to the nearest bank between a hospital and a hotel”,它將不知所云,并迅速流利地迸出一套非常官方的說(shuō)辭:“I dont know where you are, but you can show me . Go to Settings, tap Privacy, tap Location Services and turn it on. Then scroll to Siri and turn that on, too.(請(qǐng)?zhí)峁┳钫_的定位。依次進(jìn)入設(shè)置-隱私-定位,重新點(diǎn)開(kāi)siri進(jìn)行操作)”。相比中文,Siri處理英語(yǔ)的信息變得更加豐富流暢,結(jié)果依舊存在盲區(qū),難以傳遞最合適最準(zhǔn)確的答案。雖然聯(lián)網(wǎng)讓Siri擁有龐大的語(yǔ)庫(kù),但增加的便利有限。
無(wú)論上述任何一種語(yǔ)句都必須完整無(wú)停頓輸入,如果在語(yǔ)句輸入后,Siri捕捉到了呼吸聲,或者人下意識(shí)的語(yǔ)氣嘆詞,比如嘿嘿、哈哈、呵呵等,它將自我檢索許多不受控制的詞匯,從而提供一大堆偏離原指令的選項(xiàng)。
僅僅是測(cè)試siri不能完全概括目前AI所達(dá)到的高度。翻譯是目前遭受AI挑戰(zhàn)最矚目的行業(yè)。雙語(yǔ)轉(zhuǎn)換一直當(dāng)做不可企及的高峰,不同語(yǔ)言之間存在大量獨(dú)特的根植于本土文化的特有詞匯,屬于不可轉(zhuǎn)譯的范疇。
谷歌作為世界上AI技術(shù)最發(fā)達(dá)的公司之一,開(kāi)發(fā)了GNMT(神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)),宣布其可以模仿人類思考,翻譯的誤差率降低了55%~85%。據(jù)統(tǒng)計(jì)表明,英語(yǔ)使用者遍布全球3/5的國(guó)家地區(qū),中文使用者超過(guò)18億人,占據(jù)全球接近1/3的人口,中英互譯是AI翻譯的核心業(yè)務(wù)。從短句至長(zhǎng)句依次檢驗(yàn)AI中英互譯達(dá)到何種水平。
第一組為中文翻譯為英語(yǔ)的短語(yǔ):
皮皮蝦!我們走!
Mantis shrimps! Lets go!
小心夾手!
Careful grip!
請(qǐng)出示邀請(qǐng)函!
Please show your invitation!
第二組為英語(yǔ)翻譯為中文的短語(yǔ):
After death!Your doctor!
死后!你的醫(yī)生!
Heads up! Watch out!
抬頭!小心!
Why do you want a Visa for?
為什么要簽證?
AI第二組的表現(xiàn)明顯比第二組提高了準(zhǔn)確率,但仍讓人難以滿意?!捌てのr”在中國(guó)人眼中,特指體型弱小,戰(zhàn)斗力強(qiáng)大的生物。騎上皮皮蝦走路表達(dá)自身無(wú)可比擬的運(yùn)氣征服了強(qiáng)大的生物。正確的譯句應(yīng)該是“I am a lucky dog”。Your doctor并不是指一個(gè)人的醫(yī)生,而是指曾經(jīng)有位醫(yī)生,總是在人死后才到。全句引義為雨后送傘。GNMT遇到約定俗成的言語(yǔ)表達(dá)時(shí),總是傾向于翻譯字面的意思,忽略了文化背景,所以造成了目標(biāo)語(yǔ)言原意丟失。
而其翻譯簡(jiǎn)單警告標(biāo)示亦有點(diǎn)不倫不類?!靶⌒膴A手”為省略主語(yǔ)的動(dòng)賓結(jié)構(gòu),提醒人手遠(yuǎn)離狹小縫隙的地方,以免發(fā)生危險(xiǎn)。Careful grip指小心抓取,與原意相去甚遠(yuǎn),起到警告相反的作用。將第二組的“Heads up!Watch out!”改為“Fingers off!Watch out!”,或許更接近原意。
再將其置于日常生活應(yīng)用場(chǎng)景中,得益于網(wǎng)絡(luò)越來(lái)越發(fā)達(dá),語(yǔ)料庫(kù)有足夠的匹配選項(xiàng),兩組短句翻譯非常準(zhǔn)確。如果放到元素比較多的語(yǔ)境之中,GNMT展示了另一幅面孔。例如:
據(jù)北京市住建委員會(huì)網(wǎng)站顯示,2018年北京將有三個(gè)房地產(chǎn)項(xiàng)目獲批預(yù)售證,均位于朝陽(yáng)區(qū),分別為遠(yuǎn)洋山水、金隅時(shí)代、時(shí)代莊園。
According to the website of the Beijing Municipal Housing and Construction Committee, in 2018, three real estate projects in Beijing will be approved for pre-sales, all located in Chaoyang District, namely Ocean Landscape, Jinluo Times and Times Manor.
根據(jù)語(yǔ)境,“遠(yuǎn)洋山水”、“金隅時(shí)代”、“時(shí)代莊園”都是樓盤名稱,應(yīng)當(dāng)使用拼音直譯。至于名稱背后傳遞的意境,GNMT完全從字面上翻譯,缺失了原意的美好。
隨著全球經(jīng)濟(jì)合作越來(lái)越頻繁,雙語(yǔ)交流已經(jīng)遠(yuǎn)遠(yuǎn)滿足不了需求,三種語(yǔ)言及以上的多語(yǔ)交流頻頻發(fā)生。GNMT以掌握語(yǔ)言的數(shù)量占據(jù)絕對(duì)性的壓倒優(yōu)勢(shì),至于效果,依舊要打上一點(diǎn)折扣。輸入“難以說(shuō)出口的事情往往是最重要的”,其提供的英語(yǔ)譯句即“Things that are difficult to say are often the most important”,法語(yǔ)譯句即“Les choses difficiles à dire sont souvent les plus importantes”。
對(duì)AI來(lái)說(shuō),最難的不是技術(shù),而是意識(shí)。無(wú)論是Siri或者GNMT,雖然各有側(cè)重,但依舊無(wú)法清晰區(qū)分語(yǔ)言各要素在不同的國(guó)家,不同的位置,含義與詞性已經(jīng)發(fā)生了改變,只能逐字逐句一一對(duì)應(yīng)翻譯,內(nèi)在的邏輯關(guān)系往往置之不理。字詞的翻譯準(zhǔn)確率高,結(jié)構(gòu)卻很松散,亦不符合語(yǔ)法習(xí)慣?!癟hings that are difficult to say are often the most important”的正確譯文為“Those hard to say are always the most important”?!癓es choses difficiles à dire sont souvent les plus importantes”的正確譯文為“Les choses qui sont difficiles à dire sont souvent les plus importantes”。
如今的AI是一種“弱智AI”,雖然在制造業(yè)領(lǐng)域,AI正以推古拉朽之勢(shì),讓一家家企業(yè)改良了生產(chǎn)設(shè)備,優(yōu)化了人才結(jié)構(gòu)。但與人類溝通不是基于理解語(yǔ)言,而是不斷對(duì)單一詞語(yǔ)的解碼與編碼,無(wú)法擁有人類的思考能力,也無(wú)法獲悉每種文明背后的深厚底蘊(yùn),只能依照腳本,運(yùn)行設(shè)定好的情節(jié)。單語(yǔ)、雙語(yǔ)和多語(yǔ)之中的交流,經(jīng)常產(chǎn)生誤解,難以實(shí)現(xiàn)無(wú)障礙問(wèn)答。
至于制造“高智AI”仍遵循“科幻先于科學(xué)”的規(guī)律。在科幻作品中,它擁有人類一樣的分析判斷能力,能根據(jù)不同場(chǎng)景,快速學(xué)習(xí)掌握周圍的信息,可以是人類情感伴侶,也有可能站在生物鏈最頂端。而此刻,形形色色佇立在各個(gè)角落的智能設(shè)備,或縮在標(biāo)題欄左側(cè)的智能程序,以及愛(ài)不釋手的智能玩具,咿咿呀呀如同嬰兒一般,重復(fù)著機(jī)械簡(jiǎn)單的工作,或許還沒(méi)到形成思考的概念。
參考文獻(xiàn):
[1]張?zhí)烊?,《從擲骰子到阿爾法狗:趣談概率》,清華大學(xué)出版社,2018年6月.
[2]張玉宏,《深度學(xué)習(xí)之美:AI時(shí)代的數(shù)據(jù)處理與佳實(shí)踐》作者:張玉宏,電子工業(yè)出版社,2018年6月.
[3]黃美靈《Spark MLlib機(jī)器學(xué)習(xí):算法、源碼及實(shí)戰(zhàn)詳解》,電子工業(yè)出版社,2016年3月.
[4]鄭澤宇,梁博文,顧思宇,《TensorFlow 實(shí)戰(zhàn)Google深度學(xué)習(xí)框架》,電子工業(yè)出版社,2018年2月.
[5]唐旭日,張際標(biāo),《計(jì)算機(jī)輔助翻譯基礎(chǔ)》,武漢大學(xué)出版社,2017年7月1日.
[6]杰里米·芒迪(英),《翻譯學(xué)導(dǎo)論:理論與應(yīng)用》(第3版),外語(yǔ)教學(xué)與研究出版社,2014年9月1日.
[7]彭萍,《實(shí)用英漢對(duì)比與翻譯(英漢雙向)》,中央編譯出版社,2012年10月.
[8]David·W·Ferguson,《我可能學(xué)的是假英語(yǔ)》,石油工業(yè)出版社,2018年2月.