【摘要】隨著我國信息技術的快速發(fā)展,機器翻譯在跨文化交流中扮演著越來越重要的角色。然而,機器翻譯在處理新造詞的過程中仍面臨著諸多挑戰(zhàn)。本論文選取了四個機器翻譯軟件對同一新造詞進行翻譯并整合其翻譯結果,通過分析翻譯結果,以期能夠對機器翻譯面臨的問題提出解決思路和方法,從而提高機器翻譯在專業(yè)領域的適用性和準確性。
【關鍵詞】機器翻譯;新造詞;韓中翻譯
【中圖分類號】H085 " "【文獻標識碼】A 【文章編號】2097-2261(2025)05-0066-04
【DOI】10.20133/j.cnki.CN42-1932/G1.2025.05.018
一、機器翻譯與新造詞
(一)新造詞的可譯性與不可譯性
新造詞具有可譯性,這就決定了機器翻譯可以實現(xiàn)對新造詞的翻譯。新造詞往往具有社會性和時代性,反映了當時社會的現(xiàn)象及社會熱點話題,并且會隨著社會的進步而不斷發(fā)展。全人類共同生活在這一個地球上,且大腦的生理結構相同,對一些社會現(xiàn)象也會產生相同的內心體驗,因此盡管表達的語言不同,但是可以通過翻譯進行相互理解、溝通。例如,“?? ??(生理貧困)”這一新造詞,反映出了低收入女性們在購買生理用品時遇到困難的現(xiàn)象,且四個翻譯器都實現(xiàn)了準確翻譯。
新造詞也具有不可譯性,這說明在翻譯新造詞的過程中,機器翻譯很容易產生誤譯。韓語和中文在詞語方面有著一定的差異,很有可能因為語言特殊性、文化的差異等因素造成譯文不能很好地再現(xiàn)原語的意思,甚至產生誤譯。新造詞通常比較簡潔,便于記憶和傳播,并且很多新造詞都是由長句子或長短語縮略而來,例如,“????(見到你很高興)”就是“??? ??? ? ???”的縮略形式,而由于中韓兩國語法結構的差異,大部分機器翻譯不能準確譯出該新造詞的意思。
(二)機器翻譯對新造詞的影響
一方面,機器翻譯有助于新造詞的傳播,可以讓一種語言的新造詞在另一種語言中產生某些意義或影響。機器翻譯具有翻譯速度快、翻譯成本低、可譯范圍廣等特點,因此可以更加方便快捷地使大范圍的翻譯對象語言的使用者了解到新造詞的意義,從而使新造詞在世界范圍內更廣泛地傳播。
另一方面,由于機器翻譯的不足,很有可能讓新造詞在機器翻譯的過程中產生意思偏差。機器翻譯的翻譯質量不穩(wěn)定,在不同領域的翻譯中,機器翻譯很有可能因為缺乏該領域的數(shù)據(jù),從而導致翻譯準確率下降,機器翻譯的準確率受制于算法和訓練數(shù)據(jù)的質量,例如在科技、法律等非文學方面機器翻譯的效果往往不錯,但是在文學翻譯方面,機器翻譯往往不如人工翻譯;機器翻譯對文化理解不足,語言實際上是文化的載體,無論是詞語還是表達方式都蘊含著豐富的文化,而機器翻譯往往難以掌握這些文化,因此就可能導致誤譯。例如一些成語、諺語等,如果只按照字面意思進行翻譯,那么其背后深厚的文化寓意就無法體現(xiàn)。
二、譯例分析
韓國的新造詞來源眾多,為了保障準確性和客觀性,本文選擇了官方渠道發(fā)布的最新版本,即韓國國立國語院公布的2019年新造詞中使用頻率最高的100個新造詞作為譯本,將之分別放入NAVER詞典(譯本1)、谷歌翻譯(譯本2)、有道翻譯(譯本3)和百度翻譯(譯本4)中進行翻譯。韓語主要由固有詞、漢字詞、外來詞這三部分構成[8],本文將新造詞分為固有詞、漢字詞、外來詞、固有詞+漢字詞、固有詞+外來詞、漢字詞+外來詞、固有詞+漢字詞+外來詞這七大類型進行對比分析。
新造詞各類型所占比例如圖1所示。
韓語中的漢字詞含量達到了57%[10],占據(jù)韓國詞匯的大半部分。新造詞的主要使用群體多為年輕人,而年輕人使用外來語的情況居多,因此這些由“年輕人”創(chuàng)造出的“新造詞”含有漢字詞和外來詞的比例較高。同時,也反映出了外國文化對韓國新造詞的影響。
另外,由統(tǒng)計可以得知各類新造詞機譯的準確率如下。
由表1可知,翻譯器對“漢字詞”新造詞的翻譯準確率最高,達到了35.3%,其次是“固有詞”新造詞,達到了25%,機器翻譯對于單一語翻譯的準確率大于對混合語翻譯的準確率,可見當一個翻譯對象內包含兩種以上語言時,機器翻譯的翻譯準確率會降低。
(一)“固有詞”新造詞譯例分析
例:???
翻譯:老師(譯本1);Sseuang先生(譯本2);斯龐先生(譯本3);老師(譯本4)
“???”實際上是“???”,由電視劇中演員的發(fā)音演變而來。從翻譯結果上看,只有譯本1和譯本4翻譯出了“老師”的意思,而譯本2 和譯本3都將“?”翻譯成了“先生”,對“??”則沒有準確翻譯。
(二)“外來詞”新造詞譯例分析
例:????????
翻譯:慢化(譯本1);緩慢打包(譯本2);慢活(譯本3);慢化(譯本4)
“????????”實際上是“??(slow)”和“????????(globalization)”的結合,指的是世界化速度放緩這一現(xiàn)象。在四個譯本中都翻譯出了“??(slow)”的意思,只有譯本1和譯本4翻譯出了“ization”即表示過程、狀態(tài)的“……化”的意思。
(三)“漢字詞”新造詞譯例分析
例:???
翻譯:小確幸 [由“?(?。?,????(確實的),??(幸福)”組成的縮略詞。雖小卻能實現(xiàn)的幸福](譯本1);小機會(譯本2);牛擴行(譯本3);小確幸(譯本4)
針對“???”的翻譯,NAVER詞典也給出了較為全面的解釋,意為“雖然小卻能實現(xiàn)的幸?!?,并且“小確幸”這一新造詞在中國也有很廣泛的使用。但是只有譯本1和譯本4準確翻譯出了這一新造詞,譯本3將“?、?、?”這三個字分別翻譯,“?”對應的漢字有“小”“?!薄八亍钡?,“?”對應的漢字有“確”“擴”“霍”等,“?”對應的漢字有“行”“幸”“杏”等,如果不了解新造詞的真正含義,只是一味地堆砌對應的漢字,很容易產生誤譯。
(四)“固有詞+外來詞”新造詞譯例分析
例1:???
翻譯:春季度假(譯本1);春假(譯本2);春天康斯坦(譯本3);春季度假(譯本4)
例2:???
翻譯:森林度假(譯本1);森林度假(譯本2);森林康斯(譯本3);森林度假(譯本4)
例3:???
翻譯:花度假(譯本1);花假期(譯本2);花康斯坦(譯本3);花度假(譯本4)
這三個新造詞都是固有詞和外來詞“vacance”的結合,其中譯本1、2、4都將“vacance”準確翻譯為了“假期”相關詞語,而譯本3則將其音譯為“康斯坦、康斯”。而在“???”這一詞的翻譯中,盡管譯本1、2、4還是將之直接譯為了“花假期”,但是在中文里,這個說法顯得十分生硬,譯為“賞花休假”更符合其原本的含義。
(五)“漢字詞+外來詞”新造詞譯例分析
例:???
翻譯:社牛,人脈王,超合群人士(譯本1);核英薩(譯本2);核的便宜(譯本3);核Insider(譯本4)
“???”是表示程度的漢字詞“?”和外來詞“??(insider)”的結合。它指“在各種活動或聚會上都積極參與并且能和大家打成一片的人”。NAVER詞典將該詞巧妙轉化成了中國與之意思類似的新造詞“社?!?,起到了很好的翻譯效果;而譯本2將“??”直接音譯為“英薩”;譯本3則將“??”分開識別,把“?”識別成了“便宜”;譯本4雖然識別出“??”是“insider”的縮略形式,但是并沒有對其進行徹底的翻譯,譯本讀者仍然不能充分理解該詞的意思。
(六)“漢字詞+固有詞”新造詞譯例分析
例:???
翻譯:混名族(譯本1);本名人(譯本2);離婚名族(譯本3);混名族(譯本4)
“???”是指“自己過節(jié)的人或群體”,在韓國的傳統(tǒng)文化中,過節(jié)一定要回家和家人團聚,但如今,由于韓國的單人家庭的比例不斷增加,現(xiàn)代韓國人過節(jié)不返鄉(xiāng)而是選擇獨自休息的情況也不在少數(shù)。而四個譯本無一能體現(xiàn)韓國社會當前的這種現(xiàn)象。
(七)“漢字詞+固有詞+外來詞”新造詞譯例分析
例:?? ??
翻譯:德力滿級(譯本1);美德等級最高(譯本2);德力滿格(譯本3);德力滿級(譯本4)
“?? ??”是固有詞“?”和漢字詞“?”、漢字詞“?”和外來詞“?(level)”的結合。該詞指的是“十分熱愛一個領域,并且對這個領域相關的知識和經驗都已經達到了最高水準”。這里的“?”是日語“otaku(御宅)”的意思,但是四個譯本都將之翻譯為了中文漢字詞“德”,產生了誤譯。
統(tǒng)計出的四項機器翻譯的準確率如下。
表2 機器翻譯準確率
對于同一新造詞,各翻譯器產生的譯本各不相同,準確率也大相徑庭,這是由于各翻譯器的翻譯技術、算法模型、用戶群體等存在區(qū)別。
第一,NAVER詞典。NAVER詞典與其他翻譯器不同的是,NAVER詞典是權威詞庫、開放型詞庫以及網絡詞庫的結合。同時,NAVER詞典是韓國的本土詞典,所擁有的韓國語料數(shù)據(jù)庫更加豐富。在開放型詞庫這一版塊,用戶可以針對自己不了解且查詢不到的詞進行提問,有了解的用戶可以提供解答;當用戶輸入的單詞在詞庫中無法找到時,NAVER詞典還會提供與之相近的搜索結果;NAVER詞典還會針對部分新造詞提供解釋。
第二,谷歌翻譯。谷歌翻譯的用戶多是英語語言使用者,因此與其他翻譯軟件相比,在翻譯英文外來詞時,具有較高的準確性。
第三,有道翻譯。有道翻譯在四類翻譯器中準確率最低,在進行新造詞翻譯時,經常出現(xiàn)誤譯、漏譯的情況,因此還須針對這部分進行加強。
第四,百度翻譯。百度翻譯作為中國本土的翻譯平臺,在有的情況下能達到跟韓國的翻譯軟件差不多的釋義,從翻譯結果來看,百度翻譯的準確率僅次于NAVER詞典。
三、機器翻譯目前的問題及解決方案
(一)機器翻譯目前面臨的問題
第一,錯譯及漏譯現(xiàn)象嚴重。對于一些小眾或者新產生的詞匯,機器翻譯可能由于詞匯庫沒有及時更新,導致無法對這些詞匯進行識別。例如,“??”這一詞是“?? ??”和“??(me too)”的結合,意為“揭示遭受校園霸凌的經驗以及校園霸凌的嚴重性”,谷歌翻譯將之譯為“學習”,顯然谷歌翻譯只翻譯出了“?”的意思,而漏譯了“?”。
翻譯器在翻譯新造詞時,大多進行逐字翻譯,這也是造成誤譯的主要原因之一。例如, “?? ??”被翻譯為“赴菲旅游”(譯本1)、“菲米旅游”(譯本2)、“被美國旅行”(譯本3)、“費米旅行”(譯本4)等。
第二,文化背景理解不足。語言是文化的載體,語言背后蘊含的文化往往是機器翻譯面臨的一大難題。例如“?? ???”的四個譯本分別為“發(fā)送靈魂”(譯本1)、“發(fā)送你的靈魂”(譯本2)、“送靈魂過去”(譯本3)、“發(fā)送靈魂”(譯本4),這四個譯本都解釋出了該詞的本義,但卻未能觸及其真正的含義,該詞義為“為了增加自己喜歡的電影的票房和觀影人數(shù),將購買的電影票贈予他人或者購票卻不去現(xiàn)場觀看的行為”,因此單純譯為“發(fā)送靈魂”遠遠不能體現(xiàn)其真正含義。
第三,專業(yè)領域知識匱乏。在金融、法律、醫(yī)學等專業(yè)領域,一些特定的專業(yè)術語的翻譯也是很大難點。翻譯器很有可能因為缺乏這些專業(yè)術語的數(shù)據(jù),而對專業(yè)領域的交流和研究產生影響。例如,“??? ??”是經濟領域的新造詞,意為“在既存的時尚、美容領域中加入信息通信技術,使之產生新價值的工作或服務”,四個譯本分別為“造型技術”(譯本1)、“風格技術”(譯本2)、“時尚技術”(譯本3)、“造型技術”(譯本4),均未能體現(xiàn)出其含義。
(二)解決方案
第一,研發(fā)團隊繼續(xù)深入技術研發(fā)。研發(fā)團隊應該加強對語料數(shù)據(jù)的數(shù)量及質量的管理,在擴大語料數(shù)量的同時,嚴格篩選并審核數(shù)據(jù),確保數(shù)據(jù)庫量大、準確;使用大量的平行語料來訓練機器翻譯模型,語料的種類應該多樣、范圍應該大,讓機器能更好地掌握更多高質量語料;將多部權威詞典整合到一起,或者與可靠的門戶網站結合,實現(xiàn)傳統(tǒng)詞庫與網絡詞庫的結合;同時,還應該進一步優(yōu)化算法、研發(fā)技術,有效提高機器翻譯的質量。
第二,加強人工輔助作用。為了提高機器翻譯的準確性,人工輔助必不可少。NAVER詞典中的開放型詞典,就給我們提供了一個很好的思路,精通兩國語言的譯者,可以自發(fā)在翻譯器中上傳詞語及解釋,機器可以根據(jù)同一個詞的不同解釋,整合分析,展示出最恰當?shù)姆g結果。當然,NAVER詞典目前的這種模式也存在著一定的弊端,開放型詞典的準確性還有待考察。因此,可以引入人工校對和標注,讓專業(yè)人士針對翻譯結果進行校對,并且將錯誤反饋給機器,便于進一步的優(yōu)化調整。由于機器翻譯對文化背景理解的匱乏,也可以借助人工輔助,提供大量的人工翻譯語料,建立豐富的文化知識庫,培養(yǎng)機器的文化適應性,使得機器翻譯能夠更好地傳達語言中所蘊含的文化。
第三,優(yōu)化專業(yè)領域知識。針對特定專業(yè)領域,建立專業(yè)的術語表,將術語及正確的翻譯輸入系統(tǒng),給機器翻譯提供更加準確的學習和訓練資源。還可以加強與相關領域專家的合作,對機器翻譯的結果進行審核和反饋,以此提高翻譯結果的準確性和專業(yè)性。
四、結語
現(xiàn)階段的機器翻譯還無法取代人工翻譯,機器翻譯要走的路還很長。翻譯活動從不是簡單地由原語轉換到目標語的過程,在這一過程中,譯者要考慮翻譯手段、用詞選取、藝術情感、表達方式等,是一個極其復雜的過程。在人工智能背景下,機器輔助人工翻譯是未來的發(fā)展方向,機器翻譯可以為譯者提供很多幫助,促進高端翻譯市場的發(fā)展。針對機器翻譯面臨的困境,我們應該不斷探究,提出行之有效的解決策略,提升機器翻譯的質量,為跨語言和跨文化交流提供更加準確的服務。
參考文獻:
[1]王珍珍.數(shù)字時代機器翻譯引發(fā)的問題及思考[J].云南師范大學學報(哲學社會科學版),2024,56(05):44-54.
[2]楊運,王健芳.人工智能背景下機器翻譯的困境與策略研究[J].佳木斯職業(yè)學院學報,2024,40(10):31-33.
[3]李蓮花,李辰剛.AI時代韓漢機器翻譯軟件使用情況及機譯局限性與對策探究[J].中國信息界,2024(04):62-64.
[4]盧星華.韓國語聽力教材研究——基于韓國語準口語語料庫中的代詞計量特征分析[J].東疆學刊,2017,34(03):62-67+112.
[5]劉早.媒體融合背景下詞典App的融合功能探析——以《NAVER詞典》App為例[J].傳播與版權,2022(09):13-16.
[6]王志國.關于韓國語新詞構造的研究[J].韓國語教學與研究,2018(03):11-15.
[7]姬旭.反映社會現(xiàn)象的韓國語新詞特點研究[D].延吉:延邊大學,2016.
[8]王丹.大學韓國語語法[M].北京:北京大學出版社,2012:100.
[9]?????.2019? ?? ??[R].?????,2019.
[10]?????.???????[M].?????,1999.
作者簡介:
曹佳美(2002.10-),女,漢族,遼寧朝陽人,研究生在讀,研究方向:朝鮮語口譯。