賀麗媛
摘 要:21世紀技術領域的重大變革使“人工智能”一詞逐漸為我們耳濡目染,這無疑是一個很寬泛的話題。從幾乎人手必備的智能手機到無人駕駛汽車的試運行,當今我國人工智能在人臉識別、語音識別、安防監(jiān)控、智能音箱、智能家居等領域均走在國際前沿,無一不令人嘆為觀止。深度學習即成為當下熱門研究領域,文章以該領域下的一個重要應用分支—機器翻譯為實例,探討人工智能的發(fā)展現(xiàn)狀、技術特點以及當前存在的一些弊端。
關鍵詞:人工智能;深度學習;機器翻譯
人工智能即旨在使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。近年來,大數(shù)據(jù)、物聯(lián)網、云計算這些IT行業(yè)最新的技術發(fā)展趨勢正推動著這一學科的興起,并使其廣泛應用于語音識別、圖像識別、自然語言處理以及專家決策等研究領域。因其實力差異,人工智能又可分為弱人工智能、強人工智能和超人工智能,但強人工智能和超人工智能還未真正實現(xiàn)。當下我們身邊隨處可見的生活助手、智能家居、智能建筑等其實都是一種弱人工智能的體現(xiàn),即專注于實現(xiàn)某一特定方面的功能,并可以與人類媲美甚至超越人類。從深藍到戰(zhàn)勝圍棋世界冠軍的AlphaGo,它們采用的核心技術就是深度學習算法。作為機器學習的諸多方法之一,深度學習的靈感來源于人類大腦的結構和功能,通過模擬神經元間的互聯(lián)關系從而構建人工神經網絡以進行反復“訓練”直至輸出期望值,本文要探討的機器翻譯正是基于這種原理。
1 機器翻譯的發(fā)展現(xiàn)狀
在人工智能技術尚未發(fā)展成熟之前,傳統(tǒng)人工翻譯一直扮演著舉足輕重的角色。直至當今,諸如Google翻譯、阿里翻譯、百度翻譯等AI行業(yè)巨頭推出的翻譯平臺逐漸憑借其翻譯過程的高效性和翻譯結果的準確性占據(jù)了翻譯行業(yè)的主導地位。其中,Google公司提供的機器翻譯已經將漢譯英的正確率和專業(yè)化程度提升到了一個新的高度,并受到社會各界人士的認可。一項在20世紀需要語言專家連續(xù)工作若干小時才能完成的翻譯工作在今天或許只要在機器前守候幾秒鐘即可呈現(xiàn)出完整的翻譯結果,這是一種跨時代的技術飛躍。
總而言之,機器翻譯的問世實則是生產力大幅度提高的一種體現(xiàn)[1]。首先是節(jié)省了資源成本,不像傳統(tǒng)人工翻譯要求大量人力參與,且后期還需反復校對核查的繁瑣流程,機器翻譯全程僅需要一臺計算機和電源即可,且不會出現(xiàn)拼寫遺漏等低級錯誤,其工作的高效性是人工所不能媲美的。其次,因其背后的大數(shù)據(jù)支持和擁有強大的計算機系統(tǒng)作為支撐,機器翻譯能夠在確保正確率和即時性的條件下表現(xiàn)出與時俱進的特性。通過不斷“訓練”以自動完善和優(yōu)化內部網絡結構,從而進一步提高翻譯質量。
2 機器翻譯的技術特點
機器翻譯因工作原理的不同可分為基于規(guī)則的機器翻譯、基于統(tǒng)計的機器翻譯和基于神經網絡的機器翻譯。基于規(guī)則的機譯系統(tǒng)以詞典和語法規(guī)則庫作為知識提取源,并結合語言學領域的專家知識以進行源語種到目標語種的轉換,其實也可以說是一種符號的變換。因為它更多時候是在對語法進行剖析的基礎上展開翻譯工作,而不曾深入到語義層面,實為一種“直譯”?;诮y(tǒng)計的機器翻譯實則是一種基于語料庫的機譯系統(tǒng),不同于前者,它的語料庫已經過嚴格劃分并加以標注,其工作原理可以類比為一種語言信息在信道傳輸?shù)倪^程。機器會默認源語言庫中的任何一句話都可能與目標語言庫中的某句話形成映射關系,不同的只是這種關系的產生概率,因而其目標就是尋找概率最大的句子作為譯文予以呈現(xiàn),這其實也是一種統(tǒng)計學思想。
當下深度學習的熱潮已席卷全球,循環(huán)神經網絡及其重要變型、卷積神經網絡等具有不同拓撲結構的人工仿生網絡在自然語言處理上均具有突出效果。這里將著重對后者,即通過構建人工神經網絡,采用深度學習算法以實現(xiàn)的機器翻譯模型進行探討。在該種翻譯模型中,諸如詞匯、短語、句子等自然語言的基本組成單位均采用連續(xù)空間來表示,其中的人工神經網絡則用于實現(xiàn)由原文至譯文的直接映射,而無需經過依存分析、規(guī)則抽取、詞語對齊等基于統(tǒng)計的機器翻譯才涉及的處理過程。在實際語句轉換過程中,原文語言序列的輸入由編碼器讀入并以一定維度的語義向量作為輸出,再由解碼器對其進行解碼,進而輸出目標語言序列,即翻譯后的結果[2]。這種采用編碼—解碼形式的機器翻譯能夠自發(fā)地從語料庫中學習語言特征,而無需在深度學習算法中設定相關特征值以闡述翻譯規(guī)律,因而在對自然語言的處理過程中省去了特征設計的工作,其模型架構如圖1所示。
3 機器翻譯暴露的弊端
正如任何事物都是作為矛盾統(tǒng)一體而存在,機器翻譯也是一把“雙刃劍”。當我們采用辯證的眼光去看待它時,其背后的技術支持也并非沒有缺陷。高級翻譯領域向來都是以“信”“達”“雅”作為標準[3],而機器翻譯要想完美復現(xiàn)這3種“譯境”,還有待時間的考證。
3.1 語義轉換的專業(yè)性不足
機器翻譯對于基本詞匯和常用詞組的把控能力不容置疑,但當它用于翻譯一些外文文獻時,因同一個專業(yè)術語在不同學科領域所指代的含義存在差異性,使得機器翻譯在該情況下的語義轉換還未實現(xiàn)真正的智能化。而人工翻譯則能有意識地去判斷文獻所在的學科領域,并通過查閱相關資料進一步確定其深層含義,從而使譯文所闡述的內容與原文不會有太大出入,確保了翻譯過程的專業(yè)性,此所謂“信”之譯境。
3.2 復雜句式處理效果欠佳
限于當前的科技水平,機器翻譯對于一些簡單句型的處理可謂是得心應手,但一旦碰到復雜句子結構或層層句式嵌套的情況,機器翻譯會機械地將其分解為各個子句再進行排列組合,這就是一種斷章取義的表現(xiàn)。而人工翻譯則會根據(jù)具體情況分析其中的邏輯關聯(lián)再予以拆分,顯然后者呈現(xiàn)出的翻譯結果將更加自然流暢,此所謂“達”之譯境。
3.3 缺乏一定的感情色彩
機器翻譯歸根到底還是一種無意識的行為,而語言作為文化的載體,它更需要字里行間的情感流露。尤其是諸如詩詞歌賦之類的翻譯材料,機器翻譯的表現(xiàn)不免有些生硬、乏味,甚至會讓讀者心生一種不食人間煙火的感覺,而人工翻譯在這方面的處理則遠勝于機器翻譯。畢竟語言是人類創(chuàng)造的,通過結合譯者豐富的社會經驗和生活閱歷[4],人工翻譯將會使譯文的呈現(xiàn)更為生動、形象并頗具情感色彩,進而激發(fā)讀者的情感共鳴,此所謂“雅”之譯境。
4 結語
縱然人工智能在機器翻譯領域的應用依舊存在些許弊端,但在對自然語言的處理上,AI科學無疑已經取得了較大突破。我們作為科技成果的體驗者,亦不得不承認它的誕生的確為我們的日常生活、工作和學習提供了極大的便利。相信隨著AI科學的進一步發(fā)展,通過深度學習將有望使機器逐漸掌握各種技能以適應人們的美好生活需求。這場21世紀的偉大技術革命注定會推動弱人工智能向著強人工智能過渡,進而引領人類開創(chuàng)超人工智能時代的歷史新紀元。
[參考文獻]
[1]張詩博.以機器翻譯為例分析人工智能技術的應用[J].農家參謀,2019(5):211.
[2]高明虎,于志強.神經機器翻譯綜述[J].云南民族大學學報(自然科學版),2019(1):72-76.
[3]徐艷平.人工智能翻譯應用前景分析[J].合作經濟與科技,2018(19):78-81.
[4]宋仕振.試論機器翻譯與人工翻譯的未來關系[J].未來與發(fā)展,2019(2):25-30.