郭愛娜
(山東科技大學(xué),山東 青島 266590)
基于事物發(fā)展的規(guī)律,語言是一門有邏輯性的學(xué)科,也是靈動的、主觀的表達(dá),在胡庚申先生提出生態(tài)翻譯理論時,正是結(jié)合了中文語言下的基本結(jié)構(gòu)以及語言的表達(dá)習(xí)慣。 而新興事物ChatGPT,當(dāng)下作為一款可溝通的聊天機(jī)器人,在對話中所遵循的邏輯亦是如此。 不同的是,前者更多的是理論的總結(jié)、文本語言學(xué)的研究,后者則更多地基于互聯(lián)網(wǎng)信息時代下匯合的數(shù)據(jù)集。
ChatGPT 是由人工智能研究實驗室OpenAI 在2022 年11 月30 日發(fā)布的全新聊天機(jī)器人模型,一款人工智能技術(shù)驅(qū)動的自然語言處理工具。 其既能夠通過學(xué)習(xí)和理解人類的語言來進(jìn)行對話,還能根據(jù)聊天的上下文進(jìn)行互動,真正像人類一樣來聊天交流,甚至完成撰寫郵件、視頻腳本、文案、翻譯、代碼等任務(wù)。
ChatGPT 出世時,各大媒體爭相報道,谷歌震動,微軟裁員,央視新聞和半月談,包括一些跟數(shù)據(jù)行業(yè),人工智能AI 相關(guān)的公眾號知乎號文章層出不窮,知網(wǎng)上也已經(jīng)有了關(guān)于ChatGPT 的評論文章,人工智能“自然語言處理”增加了里程碑式的一幕。上線僅2 個月,ChatGPT 的活躍用戶突破了一億。
生態(tài)翻譯理論由胡庚申先生在其2004 年的《翻譯適應(yīng)與選擇論》一書中首次提出,后來在2013 年時發(fā)表的《生態(tài)翻譯學(xué):診釋與構(gòu)建》中變得成熟。他將達(dá)爾文著名的生物進(jìn)化論結(jié)合到了翻譯的研究中,并形成了名為翻譯適應(yīng)選擇論的觀點,即譯者為了適應(yīng)語言的生態(tài)來篩選詞句的翻譯。 其是當(dāng)下中國首個被獨立創(chuàng)造出來的翻譯理論,也叫翻譯生態(tài)學(xué)[1]。 其中,“三維轉(zhuǎn)換理論”表現(xiàn)的是該理論具體的翻譯方法,一共分為語言維度、文化維度以及交際維度。
1. 背景
ChatGPT 之父Altman,29 歲聯(lián)合馬斯克創(chuàng)辦OpenAI,其現(xiàn)價值290 億美元。 當(dāng)微軟宣布投資100 億美元與ChatGPT 母公司OpenAI 合作后,谷歌就宣布與OpenAI 競爭對手、人工智能(AI)初創(chuàng)公司Anthropic 建立新的合作伙伴關(guān)系。 AI 兌現(xiàn)紅利的標(biāo)準(zhǔn)之一是現(xiàn)實的應(yīng)用場景。 而搜索引擎,就是這個場景之一。 ChatGPT 付費版的推出,可以使得生成式人工智能 AIGC ( Artificial intelligence generated content)在商業(yè)化上有望再進(jìn)一步。 代表人工智能構(gòu)思內(nèi)容的AIGC,是新一輪內(nèi)容生產(chǎn)方式變革,而且AIGC 內(nèi)容在Web3.0 時代也將出現(xiàn)指數(shù)級增長。
2. 發(fā)展歷程
如表1 所示,GPT 家族經(jīng)歷了三代的時間,其中GPT 家族與BERT 模型都是知名的NLP 模型,都基于Transformer 技術(shù)。 GPT-1 只有12 個Transformer層,而到了GPT-3,則增加到96 層。
表1 GPT 模型發(fā)展歷程
InstructGPT/GPT3.5 是ChatGPT 的前身,它與GPT-3 的主要區(qū)別在于,新加入了被稱為RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學(xué)習(xí))。 這一訓(xùn)練范式增強了人類對模型輸出結(jié)果的調(diào)節(jié),并且對結(jié)果進(jìn)行了更具理解性的排序。 為了讓GPT 3.5 初步具備理解指令的意圖,首先會在數(shù)據(jù)集中隨機(jī)抽取問題,由人類標(biāo)注人員,給出高質(zhì)量答案,然后用這些人工標(biāo)注好的數(shù)據(jù)來微調(diào)GPT-3.5 模型(獲得SFT 模型,Supervised Fine-Tuning)。 2022 年12 月,Anthropic 再次發(fā)表論文Constitutional AI:Harmlessness from AI Feedback介紹人工智能模型Claude。
3. 應(yīng)用領(lǐng)域
第一,ChatGPT 可以幫助各行各業(yè)的從業(yè)人員提高工作效率,及時地獲得有效有邏輯的實時信息。作為輔助工具,它的優(yōu)勢在于精準(zhǔn)搜索,有效排序,客觀及時且準(zhǔn)確,為專業(yè)人員省去了煩瑣的信息篩選過程,充分發(fā)揮主觀能動性,提高思考和分析能力。
第二,ChatGPT 在輸出時,符合大眾的表達(dá)習(xí)慣,可以跟人一樣可以實現(xiàn)語言的自然化處理,實現(xiàn)人機(jī)高效互動和信息急速處理。
4. 局限性
ChatGPT 可貴在其半監(jiān)督學(xué)習(xí)算法,目前的“干貨較少”,邏輯強于內(nèi)容,邏輯推理暫且沒有顯式的應(yīng)用。 所以可以說ChatGPT 只是對話質(zhì)量高,在商業(yè)化的道路上仍然艱難。 ChatGPT 既不是知識系統(tǒng),知識不夠準(zhǔn)確,也不是陪伴系統(tǒng),情商沒有那么的高,現(xiàn)在還處在蠻荒時代。 ChatGPT 涉及自然語言處理NLP/NLU 領(lǐng)域時,已知局限包括對重復(fù)文本、對高度專業(yè)的主題的誤解以及對上下文短語的誤解。 對人類或AI,將需接受多年的訓(xùn)練才能正常對話。 對NLP 類模型,GPT 不僅要理解單詞的含義,還要理解如何造句和給出上下文有意義的回答,甚至使用合適的俚語和專業(yè)詞匯。
盡管ChatGPT 確實能讓查找信息的過程更加直觀,當(dāng)下時代知識正在變得更加容易獲取,學(xué)習(xí)門檻降低,學(xué)習(xí)過程也在縮短。 但ChatGPT 在很長一段時間內(nèi)只可以達(dá)到互補的關(guān)系,并在此基礎(chǔ)上發(fā)展AI 助教,智能醫(yī)療,智能金融等,既能實現(xiàn)人機(jī)的更大交互,也能進(jìn)一步聯(lián)系好人機(jī)關(guān)系。
1. 三維轉(zhuǎn)換體現(xiàn)在對譯文的處理上
第一,在語言維度上,又可以分為詞法結(jié)構(gòu)和句法結(jié)構(gòu),那么人們會需要考慮源語和目標(biāo)語的文化和社會差異,如中英文的修辭方式等,從而調(diào)整目標(biāo)語的表達(dá)形式,使得譯文符合讀者的閱讀習(xí)慣。
第二,在文化維度上,可能會存在文化差異的問題,這要求譯者充分地理解兩種語言的文化意義,并在內(nèi)涵和形式上都進(jìn)行轉(zhuǎn)換,使得受眾的審美要求得到滿足。 并且,譯者在翻譯過程中需要具備文化意識,注意文化差異導(dǎo)致的阻礙[2],從而保證信息的正確交流。
第三,在交際維度上,交際維度的適應(yīng)性體現(xiàn)在選擇轉(zhuǎn)換上,譯者在進(jìn)行翻譯時,需要合理地結(jié)合上下文以及語境,使目的語讀者能夠理解原作者想要表達(dá)的深層次含義,甚至再建立感情上的鏈接,讓譯出語的讀者可以理解作者所想,甚至產(chǎn)生共鳴,達(dá)到交際的目的。
2. 生態(tài)翻譯理論指導(dǎo)下的翻譯方法
(1)詞法層面
第一,換詞轉(zhuǎn)譯。 有些語境下,中文里存在引申意義,譯者可能需要因此調(diào)整表達(dá)方式,修改表達(dá)內(nèi)容。 同時,由于表達(dá)習(xí)慣有所不同,同一個中文也會被翻譯成不同意義的英文(如中文里的多義詞)。
第二,詞性轉(zhuǎn)換。 由于中文中多用動詞以及副詞,而英文則使用更多的名詞。 在翻譯過程中,動詞名詞化和名詞動詞化實屬于常見的兩種翻譯技巧。當(dāng)然使用翻譯技巧的前提是保持原文意義的不變并應(yīng)用來提高譯文語言地道性和可讀性[3]。
(2)句法層面
中英文是不同語系,需要特別處理一些特殊的句法結(jié)構(gòu)。 因此,必要時需要運用以下翻譯技巧,用來最大化地實現(xiàn)譯文的轉(zhuǎn)換。
第一,語序轉(zhuǎn)換。 英文表達(dá)中,一般習(xí)慣將重點放在前面,而中文將重點放在后面。 中文多動詞,而英文句子中只能有一個謂語動詞。 因此,筆者需要在翻譯過程中,采用語序轉(zhuǎn)換的翻譯技巧,以使譯文表達(dá)更加合適各自語言的表達(dá)習(xí)慣。
第二,語態(tài)轉(zhuǎn)換。 中文句子中多使用主動語態(tài),而英文表達(dá)中則被動語態(tài)使用較多,且常缺少主語,所譯的內(nèi)容皆需要根據(jù)具體情況,將原文中部分主動語態(tài)轉(zhuǎn)換成被動語態(tài)。
第三,拆句重組。 長句如果直接按照原文形式翻譯,會使譯文顯得十分冗長,所以此時需要將長句拆成短句后重新組合,但前提是保留原文的邏輯不變。 使譯文在準(zhǔn)確傳達(dá)的基礎(chǔ)上,同樣條理清晰,減輕讀者的閱讀負(fù)擔(dān),提升關(guān)注譯文的內(nèi)容信息的水平。
(3)語篇的層面
文化維度和交際維度的適應(yīng)性選擇與轉(zhuǎn)換是指譯者需要將原文蘊含的文化信息在翻譯的過程中進(jìn)行傳遞且應(yīng)當(dāng)是較大程度地傳遞到譯文中。 也就是說,譯者不僅需要關(guān)注語言的形式和語言的內(nèi)涵,還要考慮原文存在的交際功能。
生態(tài)翻譯是指在原文的生態(tài)結(jié)構(gòu)中,不特別強調(diào)翻譯過程,然后選擇文本來翻譯并且反復(fù)實行這樣的做法,所以,生態(tài)翻譯是帶有語言特色的翻譯[4]。 生態(tài)翻譯是以生態(tài)的視角和眼光來對翻譯進(jìn)行綜合觀察的理論,有一定的主觀性。
而Siri、安卓、華為以及其他智能手機(jī)下的語音助手,相比幾年前的功能,也已經(jīng)相對人性化,人工智能更加貼切生活必然是未來的趨勢。 當(dāng)下人工智能已經(jīng)涉及更大范圍的應(yīng)用。 除了各種翻譯軟件,國內(nèi)的抖音、小紅書,國外的谷歌搜索、Ins、Youtube,皆涵蓋深度學(xué)習(xí)下的神經(jīng)網(wǎng)絡(luò)的應(yīng)用,包括個性化推薦、大數(shù)據(jù)、大數(shù)據(jù)下數(shù)據(jù)疊加、卷積神經(jīng)網(wǎng)絡(luò)等。而在自然語言處理下,像ChatGPT 這樣的應(yīng)用模型是人工智能應(yīng)用進(jìn)程中的“最后一公里”。 對機(jī)器來說,它無法完全遵循人類的語言去表達(dá),因為機(jī)器人是基于客觀的數(shù)據(jù)集去歸類的,并不能主觀能動地去思考。 相對的,主觀思考和能動性,這對人類來說很簡單。 反之,人類在復(fù)雜數(shù)學(xué)計算上暴露的短板,用機(jī)器就能更加快捷和高效。 機(jī)器和機(jī)器人的出現(xiàn)是因為技術(shù)的進(jìn)步,使得生產(chǎn)力達(dá)到原先全靠人力而不能達(dá)到的水平,這也理解為“自然語言處理下的發(fā)展”。 播客里“Round table”播音員的一句話:“如果未來,50 歲的我可以跟25 歲的我聊天,那真的是太詭異了。”從客觀角度來講,這是時間上的穿越。 比如《流浪地球2》里面的MOSS,也投射這是ChatGPT 的應(yīng)用的影子。 把人的某階段的記憶封存為數(shù)據(jù)的形式,就可以達(dá)到數(shù)據(jù)層面的永生。 而影片中的小女孩,她的記憶是一串?dāng)?shù)據(jù),通過與外界不斷地交互信息,產(chǎn)生每隔兩分鐘,這也體現(xiàn)出靈活的自然語言對話形式,盡管它實際是基于數(shù)據(jù)的、客觀的。 但影片的父親,便可以這種方式讓他覺得自己的女兒永遠(yuǎn)生活著,即便現(xiàn)實情況下,他清楚地知道,這是人工智能“自然語言處理”的數(shù)千萬種結(jié)果的一次次呈現(xiàn)。
回到生態(tài)翻譯理論,生態(tài)翻譯理論強調(diào)的是從原文固有的生態(tài)結(jié)構(gòu)出發(fā),最后達(dá)到適應(yīng)的目的,在翻譯的過程中反復(fù)遵循其內(nèi)在的生態(tài)結(jié)構(gòu),并表現(xiàn)在另一種語言中,實現(xiàn)最終三維的轉(zhuǎn)換。 生態(tài)翻譯對文本,就好比ChatGPT 對人類語言,或者說自然語言處理對人類語言而言。 以《流浪地球》系列的影片為例,其字幕翻譯部分便充分展示了生態(tài)翻譯理論的應(yīng)用。 如:在中華語言文化中,多音字、形近字、同音不同形的字、多義詞、四字短語、成語、歇后語、諺語、俗語、俚語再配上各種修辭手法,可能還有隱喻等。 地道的中文表達(dá),直譯往往是不正確或不準(zhǔn)確的,為了更多地基于文化專項、文化負(fù)載,站在生態(tài)翻譯理論下三維轉(zhuǎn)換語言,可以幫助外國的觀眾在該翻譯方法下理解翻譯的內(nèi)容,并以英文慣用的表達(dá)形式,最終準(zhǔn)確理解影片中表達(dá)的意思,從而實現(xiàn)文化的輸出和文化交互。 在字幕翻譯過程中產(chǎn)生的語言轉(zhuǎn)換,由于其本身所有的特點以及影片面向觀眾的特性,則常會出現(xiàn)自然語言,基于上述的成語、歇后語以及修辭手法,翻譯的譯員需要像自然語言處理一樣,先做到NLU(Natural Language understanding ), 再 做 到 NLG ( Natural Language generating),翻譯出英文的或其他語言的字幕,與“encode”和“decode”同理。 與字幕翻譯相同的是,字幕翻譯和ChatGPT 皆有一定的信息即時性。 字幕翻譯在影片播放時一閃而過,ChatGPT 在聊天對話框即時性輸出。
正如生態(tài)翻譯理論指導(dǎo)的譯文,既可以應(yīng)用這樣的理論,也可以讓理論引導(dǎo)我們,但是想要完全吃透人類語言,搞定一切固有結(jié)構(gòu),還有十分長的路要走。
實現(xiàn)更好的機(jī)器輔助,將是長期的主題。 目前要做的就是如何生成和適應(yīng)自然的固有結(jié)構(gòu),遵循底層的邏輯,就如同生態(tài)翻譯理論所表達(dá)的這樣。從人類語言文化的角度來看,中國語言文化積累上下五千年,沒有什么機(jī)器可以瞬間打破文化的積淀,人腦的創(chuàng)新思維以及人類的好奇心所可能拓展的能達(dá)到的領(lǐng)域。 即便是人工智能,也同樣是人類智慧的產(chǎn)物。