【摘要】隨著人工智能技術的發(fā)展,大語言模型應運而生,標志著翻譯模式的變革。Chat GPT作為代表性的大語言模型之一,其翻譯性能研究具有重要意義。為探究Chat GPT在散文翻譯中的適用性,以老舍的《想北平》為原文本,張培基譯本為人譯目的語語料,Chat GPT譯本為機譯目的語語料,對比分析兩個譯本,從而分析Chat GPT在散文翻譯中的表現(xiàn)。研究結果表明,Chat GPT在散文翻譯中既有優(yōu)勢也有劣勢。優(yōu)勢包括三方面:快捷的背景資料查詢、準確的多義詞翻譯、貼切的原文風格再現(xiàn);劣勢包括四方面:不準確的文化負載詞翻譯、不完整的內容補充、不清晰的邏輯關系分析以及欠缺情感表達。
【關鍵詞】Chat GPT;散文翻譯;適用性;《想北平》
【中圖分類號】H315 【文獻標識碼】A 【文章編號】2096-8264(2024)47-0095-04
【DOI】10.20024/j.cnki.CN42-1911/I.2024.47.025
隨著全球化的不斷發(fā)展,跨語言交流變得越來越頻繁,各類大語言模型應運而生。Chat GPT是美國人工智能研究實驗室Open AI推出的一款大語言模型,因為其敢于質疑用戶提出的問題、綜合理解用戶的多輪對話、主動承認自己回答錯誤等方面的優(yōu)勢廣受歡迎,同時也將機器翻譯帶入了全新模式[1]。在參照國內Chat GPT研究現(xiàn)狀的基礎上,本研究聚焦于散文翻譯領域,以老舍的《想北平》為原文本,對比分析張培基譯本和Chat GPT譯本,總結Chat GPT在散文翻譯領域的優(yōu)勢和劣勢,為深入了解當前Chat GPT在散文翻譯中的表現(xiàn)提供參考,進而推動翻譯技術的進步。
一、研究概述
以“Chat GPT翻譯”為主題詞,統(tǒng)計中國知網(wǎng)的發(fā)文情況,截至2024年,知網(wǎng)共收錄146篇相關文章,其中核心期刊文章共30篇,且都是2023年發(fā)表的,碩士論文共2篇。從發(fā)文年限和高質量論文占比來看,國內對Chat GPT翻譯方面的研究起步較晚,研究層次不高。現(xiàn)有研究主要集中于Chat GPT發(fā)展概述,各類機器翻譯性能比較以及Chat GPT翻譯在各個領域發(fā)揮的作用。
Chat GPT自2018年問世以來,已經(jīng)歷經(jīng)了6年的發(fā)展。不少文章梳理了Chat GPT各個版本發(fā)布的年份、模型參數(shù)量變化以及功能更新。其中有代表性的研究有張超的《Chat GPT與知識生產和復用:賦能、挑戰(zhàn)與治理》和鄭世林的《Chat GPT新一代人工智能技術發(fā)展的經(jīng)濟和社會影響》[2][3]。此類文章對Chat GPT進行了較為全面的介紹,但只是稍有提及Chat GPT的翻譯功能,并沒有深入探究其具體表現(xiàn)。Chat GPT翻譯功能雖強大但也不是完全可靠。對Chat GPT的翻譯質量進行嚴格的測評尤為重要。此類研究集中在以下兩方面:1.各類大語言模型之間的性能比較。趙雪等人依據(jù)ROUGE、MAUVE等測評指標,測評了16個大語言模型在5個典型語言處理任務上的表現(xiàn),總體而言Chat GPT的翻譯性能最優(yōu)[4]。2.Chat GPT與傳統(tǒng)機器翻譯的比較。王天恩的《Chat GPT的特性、教育意義及其問題應對》指出Chat GPT在多個方面的性能都超過了傳統(tǒng)的機器翻譯,翻譯的準確度大大提升[5]。此類研究以真實的數(shù)據(jù)展現(xiàn)了Chat GPT的翻譯質量,證明了Chat GPT在翻譯領域有著廣闊的應用前景,但目前研究主要是其翻譯表現(xiàn)的綜合測評,缺乏結合翻譯實例的人工測評。Chat GPT的翻譯功能在眾多領域發(fā)揮了重要作用,已有學者關注到了Chat GPT翻譯為教育、財務和編輯出版行業(yè)帶來的便利,例如郭亞軍、束開和徐敬宏等[6][7][8]。此類文章共14篇,但是關于Chat GPT翻譯功能的論述所占篇幅較短。當然Chat GPT在翻譯方面存在局限性,其翻譯結果是由訓練語料決定的,有時候會輸出帶有偏見性、敏感性的翻譯,對于文化負載詞的翻譯也不準確。其中有代表性的有湯景泰的《Chat GPT給謠言治理帶來嚴峻挑戰(zhàn)》和崔茹茹的《〈蒙古族翻譯史研究〉漢英翻譯實踐報告》[9][10]。此類文章只有4篇,可見只有較少學者關注到了Chat GPT翻譯方面的劣勢,研究比較零散,研究水平也層次不齊。
綜上所述,現(xiàn)有研究讓我們對Chat GPT從誕生至今的發(fā)展歷程,其在翻譯任務中所展現(xiàn)出的性能以及它在不同領域的應用情況有了一個初步的認識。然而,目前關于Chat GPT的學術研究相對較少,且研究的深度和廣度都有待提升。盡管已有一些文獻嘗試對Chat GPT的翻譯效果進行綜合性的評估,但這些評估往往缺乏具體翻譯實例的支撐,使得研究結果的說服力有限。此外,專門針對Chat GPT在某一特定體裁文本翻譯表現(xiàn)的研究更是寥寥無幾。
二、文本特點分析
《想北平》是一篇文筆優(yōu)美的散文佳作,作者運用獨特的語言藝術,通過質樸真摯的詞匯、流暢而富有節(jié)奏感的句子構造,以及層次分明、情感遞進的篇章布局,成功地將對北平的無限眷戀和深情懷念呈現(xiàn)給了讀者。
詞匯層面,《想北平》中含有大量文化負載詞和多義詞。文化負載詞是凝聚著中國人獨特的思想文化的“中華思想文化術語”,這類術語是中國人創(chuàng)造的,現(xiàn)已形成了固定的表達形式,其中蘊含著中華民族獨特的哲學智慧、思考方式、文化精神、價值理念[11]?!断氡逼健分械摹氨逼健北闶且粋€例子。多義詞是具有多種相關意義的詞,例如散文中“空閑”一詞。但在具體的語境中,多義詞表示的意義是確定的、單一且不變化的。句子層面,文章多處使用了省略的手法,省略不言自明的內容,從而達到言有盡而意無窮的效果。篇章層面,《想北平》的遣詞造句十分考究,注重作者的情感表達。
《想北平》有著獨特的散文語言特點,因此要想產出優(yōu)質的散文翻譯并不是一件易事,這對Chat GPT來說是一大挑戰(zhàn)。
三、Chat GPT在散文翻譯中的優(yōu)勢
Chat GPT在翻譯領域有著廣闊的應用前景,其準確性和流暢度已經(jīng)逐步接近人類翻譯的水平,在背景資料查詢、多義詞翻譯和原文風格再現(xiàn)方面表現(xiàn)突出。
(一)背景資料查詢
Chat GPT可以進行自然語言查詢。用戶可以用自然的語言形式提出問題,而不必拘束于特定的關鍵詞或查詢語法,這使得搜索過程更加直觀和人性化。譯者可以借助Chat GPT查詢散文中難以理解的概念,打破知識的壁壘,從而判斷機譯結果是否正確。例如“單擺浮擱”是一個充滿地方色彩的的詞匯表達。在Chat GPT中輸入“單擺浮擱是什么意思?”給出的答案是:“單擺浮擱”是一個中國的俗語,意思是沒有選擇或無法表達自己的意見。在這個上下文中,可以理解為僅僅簡單隨意地描繪北平,但是所描寫的事物之間缺乏聯(lián)系。張培基將這個詞翻譯成了“exclusively”,Chat GPT將其翻譯成了“shallow”。可見張培基譯本和Chat GPT都將這層含義表達了出來。
翻譯工作者們在面對復雜的語言轉換任務時會面臨不同程度的挑戰(zhàn)。不同于電腦可以輕易地存儲和檢索各行各業(yè)的海量知識,翻譯工作者的大腦容量是有限的,他們無法像計算機那樣快速地訪問和處理廣泛的信息。因此,必要時譯者可以借助Chat GPT來搜索資料,驗證機器翻譯的正確性。
(二)多義詞翻譯
傳統(tǒng)的機器翻譯常出現(xiàn)多義詞翻譯錯誤的情況,翻譯出的結果不符合該句語境。而Chat GPT與傳統(tǒng)機器翻譯的一個最大不同就是它有著更嚴謹?shù)恼Z言邏輯,因為其納入了人類語境并且進行大數(shù)據(jù)訓練,而且通過機器學習深耕,獲得邏輯嚴密性。劉洋指出當前的人工神經(jīng)網(wǎng)絡機器翻譯應用的編碼器—解碼器首先會將每個詞匯轉換成向量表示,遞歸神經(jīng)網(wǎng)絡將各個詞匯的向量聯(lián)系起來形成整個句子的向量。目的語端的遞歸神經(jīng)網(wǎng)絡將整個句子的向量解碼成英文句。每個詞匯的向量中同時包含著左側和右側詞的信息,因此神經(jīng)網(wǎng)絡可以動態(tài)計算出該詞最符合上下文語境的意思[12]。
文中“空閑”一詞有兩個意思,一方面可以指沒有事情可做的人;另一方面則指沒有被使用或占用的物品。在這種情況下,Chat GPT通過分析詞匯所包含的上下文向量信息,準確判斷出此處“空閑”是用來修飾物品的,即指這片土地是未被占用的。因此,Chat GPT將“空閑”翻譯為英文中的“open”,而不是表示時間空閑的“l(fā)eisure”。這一翻譯不僅傳達了原文的字面意思,更準確地捕捉了原文的深層含義。張培基的翻譯同樣采用了“open”這一譯法,這不僅與Chat GPT的翻譯結果一致,而且進一步印證了Chat GPT在處理多義詞翻譯時的準確性和可靠性。
(三)原文風格再現(xiàn)
周領順指出作品風格是文學家的生命,文學翻譯的作者也十分重視風格再現(xiàn),因此能否實現(xiàn)風格再現(xiàn)是評價翻譯質量的一個標準[13]。Chat GPT風格再現(xiàn)方面的表現(xiàn)可圈可點,主要表現(xiàn)在詞匯層面的人稱顯化處理、句子層面的句式模仿和篇章層面的句長把控。
詞匯層面,《想北平》是一片抒情散文,頻繁使用第一人稱有助于抒發(fā)作者的真情實感,但有時候作者也會省略人稱,形成無主句。因此,譯文中的人稱顯化,一方面可以明晰原文的含義,另一方面有助于引發(fā)讀者情感共鳴。例如Chat GPT將“真愿成為詩人”翻譯成“I wish I were a poet”,增譯了第一人稱“I”并且用了虛擬語氣,幫助讀者了解到這句話是作者內心的愿望,且實現(xiàn)的可能性不大。張培基譯文將這句話處理成了“If only I were a poet”,同樣增加了第一人稱。
句子層面,原文多處運用排比的修辭技巧,例如將北平與其他城市進行對比,突出北平的優(yōu)勢;將自己對北平的愛與對母親的愛進行類比,使得情感更加充沛。排比句的使用可以達到增強節(jié)奏感和氣勢的效果。因此,譯文可以通過再現(xiàn)這種句法結構來還原原文的語言風格。例如原文中作者將自己對北平的愛與對母親的愛進行類比,表達自己對北平愛得深沉,Chat GPT將“在我……的時候,我……;在我……的時候,我……”排比句式譯為“When I think of doing something to please her,I smile quietly to myself; when I worry about her health,tears well up in my eyes”。原文中“在我……的時候,我……”的結構重復了兩次,形成排比句,Chat GPT在處理這話的時候同樣使用了排比的句式,“When I...”的結構出現(xiàn)了兩次,中間以分號隔開,實現(xiàn)了與原文句式結構上的對等。張培基譯文同樣使用了排比句式,“When I...when I...”重復兩次,進一步印證了Chat GPT在還原語言風格方面的優(yōu)異表現(xiàn)。
篇章層面,原文通過簡短而有力的句式來增強語言的沖擊力。文章中,作者采用了一貫的平民化語言風格,讓讀者能夠直接感受到文字背后的真摯情感。要想再現(xiàn)樸素平實風格,譯文同樣也需要采用簡短句子來切合原文語體。表1為Chat GPT譯文的句長分布圖,以10為基本單位,1—10為一組,11—20為一組,20以上為一組。根據(jù)《英漢互譯實用教程》中對英文短句的定義(20個詞以下為短句),可以計算出Chat GPT譯文中的短句占比75%[14]。因此,譯文使用的主要是簡短的句子,貼合原文簡潔樸素的風格。
表1 Chat GPT譯文的句長分布圖
句長 1-10 11-20 大于20
比例 20% 55% 25%
四、Chat GPT在散文翻譯中的劣勢
Chat GPT在散文翻譯中存在著局限性。人類語言的產生是一個復雜的過程,而機器是人類將自己的思想轉化為行動的一個產物。相比較而言,機器要比人腦簡單得多,對于人們所說的一些語言以及產生的一些思想活動,機器是無法解讀或破譯的。Chat GPT翻譯的劣勢主要表現(xiàn)在內涵理解,內容補充,邏輯分析和情感表達四個方面。
(一)內涵理解不準確
Chat GPT在內涵理解方面的缺陷主要表現(xiàn)在對文化負載詞的翻譯上。漢語詞匯與文化是相互影響的,正如薩丕爾所說的詞匯承載著文化,語言史和文化史是一同發(fā)展的[15]。因此,漢語詞匯常常含有豐富的象征意義、風俗習慣或歷史知識,這是Chat GPT所不能理解的。
原文中出現(xiàn)了多次“北平”,張培基將“北平”翻譯成了“Peiping”,但是Chat GPT直接翻譯成了“Beijing”。這兩種翻譯雖然指的是同一個地方,但是反應的歷史含義完全不一樣。1928年,北京改名為北平。而《想北平》寫作時北京的名字仍然是北平。名字里附帶著特定的歷史信息,如果譯作Beijing一定程度上屬于錯譯。
不過令人欣慰的是通過明確的指令,Chat GPT可以修正自己的錯誤。以“考慮歷史因素,北平應該翻譯成Beijing還是Peiping?”進行提問,Chat GPT給出了以下解釋“考慮到歷史因素,北平通常會被翻譯成Peiping,因為在20世紀早期和中期,Peiping是北平的英文名稱。然而,自1949年中華人民共和國成立后,北平的名稱被改為北京。因此,根據(jù)時間和歷史語境,Peiping可能更適合早期的文本,而Beijing則更適合現(xiàn)代和當代的文本?!?/p>
(二)省略內容補充不完整
胡壯麟認為中文經(jīng)常會省略掉一些不言而喻的內容,從而使文章結構更加緊湊,這些被省略的內容可以在上下文中找MdJ8PdMej02PIgLlXHn/fQdvipjXfr2GOBzxBYPt2YU=到[16]。因此,省略的信息并不會給源語讀者造成理解上的障礙。但是Chat GPT在翻譯的時候無法根據(jù)上下文語境補充出中文文本中省略的內容,導致英文讀者不能獲得完整信息,甚至造成誤解。例如原文中“我的北平”是一個省略表達,完整的意思應該是“和完整的北平相比,我知道北平只是……”因此,張培基增譯了該部分省略的信息,使得譯文更加流暢易懂。但是Chat GPT無法補充出該部分的意思,只是直譯成“my Beijing”,容易讓讀者將此處的修飾關系理解為所屬關系。
(三)邏輯分析不清
漢語是意合型語言,上下句的邏輯是通過意思來展現(xiàn)的而不是邏輯詞,而英語是形合型語言,注重邏輯詞的使用[17]。因此,漢英翻譯中要將邏輯詞顯化,從而表達得更加嚴謹。崔啟亮表示機譯錯誤主要是因為機器不能理解復雜的句間邏輯[18]。此外,由于中文語料在Chat GPT訓練中占比較小,所以Chat GPT很難理解中文句子之間隱性的邏輯關系[19]。例如原文中將巴黎與北京對比,進而突出北京的好,Chat GPT將其翻譯成“In Paris,there are many places that can be exhausting,so coffee and wine are necessary for stimulation;in Beijing,a cup of mild fragrant tea is enough”。原文兩句話運用了對比的手法,但兩句話之間并沒有出現(xiàn)轉折連詞。譯文中轉折意義的表達既可以通過轉折連詞實現(xiàn)也可以通過分號來實現(xiàn)。分號雖然有轉折的用法,但是日常使用較多的是并列用法。但其對比意味不如轉折連詞,讀者需要自己通過上下文語境去體會句間的轉折含義。張培基譯文用“while”來體現(xiàn)兩個城市之間的對比關系,北平的優(yōu)勢更為凸顯。Chat GPT卻只是用分號來連接兩句話,其對比意味明顯不如轉折連詞“while”。
為了測試Chat GPT能否在邏輯連接方面做出改進,輸入指令“增強上句的轉折意味”。Chat GPT輸出的結果是:“In Paris,where the hustle and bustle can drain one’s energy,coffee and wine serve as vital pick-me-ups;whereas in Beijing,amid a more tranquil ambiance,a soothing cup of fragrant tea suffices to revitalize the spirit.”可以發(fā)現(xiàn),這次的結果使用了轉折連詞“whereas”,增強了對比含義。
(四)情感表達欠缺
散文十分注重表達作者內心體驗和抒發(fā)作者內心情思[20]。但是Chat GPT無法體會文章的情感,難以選擇恰當?shù)脑~來傳達作者的真情實感。蔣躍指出機譯譯文在情感表達方面不夠豐富,在這一點上是遠遠比不上人工譯者的[21]。例如文中“我心中有個北平”表達了作者對北平的熱愛,以至于心被北平占滿了。張培基譯文用“possessing”表示“有”的概念,表明北平已經(jīng)占據(jù)了“我”的心,突出表達作者的思鄉(xiāng)之情。Chat GPT只是將“有”翻譯成了“have”,讀來十分平淡,使讀者不能感受到作者對北平的思之切愛之深。
雖然第一次機譯結果缺乏情感,但Chat GPT可以對其潤色。輸入指令“潤色上述語句以體現(xiàn)作者對北平的愛”。Chat GPT給出的回答是:“I cannot fall in love with Shanghai and Tianjin,for in my heart,Beijing holds a special place.”這次將“有”翻譯成了“holds a special place”(在心里占據(jù)特殊的位置)明顯比第一次更能體現(xiàn)作者情感。
五、結論
Chat GPT是一款通用的大參數(shù)預訓練自然語言生成模型,在翻譯領域獲得了越來越廣泛的應用。本文以老舍的《想北平》為原文本,深入分析了張培基的經(jīng)典譯本與Chat GPT生成的譯本之間的差異,旨在評估Chat GPT在散文翻譯這一特定領域的表現(xiàn)和能力。研究結果表明,Chat GPT在資料查詢,多義詞翻譯和散文風格再現(xiàn)方面有突出優(yōu)勢。但是Chat GPT也有自身的局限性。Chat GPT無法準確理解文化負載詞的內涵,無法補充出省略的內容并且無法自動選取貼合文章情感的詞匯。
參考文獻:
[1]何哲,曾潤喜,秦維等.Chat GPT等新一代人工智能技術的社會影響及其治理[J].電子政務,2023,(4):2-24.
[2]張超,韓虓,王芳.Chat GPT與知識生產和復用:賦能、挑戰(zhàn)與治理[J].圖書與情報,2023,(3):52-60.
[3]鄭世林,姚守宇,王春峰.Chat GPT新一代人工智能技術發(fā)展的經(jīng)濟和社會影響[J].產業(yè)經(jīng)濟評論,2023, (3):5-21.
[4]趙雪,趙志梟,孫鳳蘭等.面向語言文學領域的大語言模型性能評測研究[J].外語電化教學,2023,(6):57-65+114.
[5]王天恩.Chat GPT的特性、教育意義及其問題應對[J].思想理論教育,2023,(4):19-25.
[6]郭亞軍,郭一若,李帥等.Chat GPT賦能圖書館智慧服務:特征、場景與路徑[J].圖書館論壇,2023,(2):30-39+78.
[7]束開,郭奕.Chat GPT在財務領域的應用探索[J].財務與會計,2023,(22):56-59.
[8]徐敬宏,張如坤.Chat GPT在編輯出版行業(yè)的應用:機遇、挑戰(zhàn)與對策[J].中國編輯,2023,(5):116-122.
[9]湯景泰.Chat GPT給謠言治理帶來嚴峻挑戰(zhàn)[J].探索與爭鳴,2023,(3):33-35.
[10]崔茹茹.《蒙古族翻譯史研究》漢英翻譯實踐報告[D].內蒙古大學,2023.
[11]陳海燕.淺析中國思想文化術語翻譯中的難點[J].中國翻譯,2015,(5):13-17.
[12]劉洋.神經(jīng)機器翻譯前沿進展[J].計算機研究與發(fā)展,2017,54(6):1144-1149.
[13]周領順.譯者行為批評“行為-社會視域”評價系統(tǒng)[J].上海翻譯,2022,(5):1-7+95.
[14]宋天錫.翻譯新概念:fiXfQ+MqG+im7pdWQEXe/Q==英漢互譯實用教程[M].北京:國防工業(yè)出版社,2007.
[15]愛德華,薩丕爾.語言論[M].北京:商務印書館, 2003.
[16]胡壯麟.語篇的銜接與連貫[M].上海:上海外語教育出版社,1994:76.
[17]沈家煊.“零句”和“流水句”——為趙元任先生誕辰120周年而作[J].中國語文,2012,(5):403-415+479.
[18]崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯, 2014,(6):68-73.
[19]鄭麗芬.賦能與重構:AIGC驅動下的出版業(yè)[J].出版發(fā)行研究,2023,(4):37-44.
[20]方遒.散文學總論[M].合肥:安徽教育出版社,2004: 178.
[21]蔣躍.人工譯本與機器在線譯本的語言計量特征對比[J].外語教學,2014,(5):98-102.
作者簡介:
楊睿穎,女,河北滄州人,河北工業(yè)大學外國語學院MTI在讀碩士研究生,研究方向:人文社科翻譯。