中圖分類號:H059 DOI:10.12339/j.issn.1673-8578.2025.03.026
A Comparative Study of Human and Machine English Translations of Chinese Prose Based on Corpus Stylistics//WANG Shuli,YUAN Wei
Abstract:Corpusstylisticsnablessystematicinvestigationof tylisticfeaturesthroughquantitativemethods,yetitsapplicationmachinetranslationstudiesremainsunderexplored.Thisstudyaddreses thisgapbycompilingacomparablecorpusof humanandmachine-translatedCneseprose.Amuiimensionalanalysisientifiesdistictstrengtsandliiatiosinumanandmachetralations,supportdbyatisticaldtadtextalomprisosAplgctortworkeoy,tesearchaiesuman-aie teraction paterns in translation processes,aiming to promote the spread of excellent Chinese prosemore effectively. Keywords: corpus stylistics ; prose translation;machine translation;actor-network theory
語料庫文體學(xué)(CorpusStylistics)結(jié)合語料庫語言學(xué)的分析方法與文體學(xué)理論,運用統(tǒng)計學(xué)手段自下而上地描寫文本的文體特征,已廣泛應(yīng)用于語言學(xué)、文學(xué)、翻譯學(xué)等學(xué)科[1]。然而,該方法在機器翻譯領(lǐng)域的應(yīng)用尚存探索空間。本研究嘗試將語料庫文體分析框架進(jìn)行適度延伸,系統(tǒng)考察翻譯工具產(chǎn)出的譯文在文體風(fēng)格上與人工譯文方面的差異特征。研究發(fā)現(xiàn)不同翻譯主體的文體偏好差異,為引入行動者網(wǎng)絡(luò)理論(actor-networktheory)提供了實證基礎(chǔ)。該理論突破傳統(tǒng)翻譯研究的人類中心主義范式,主張將技術(shù)系統(tǒng)視為平等行動者,恰好契合人機翻譯協(xié)同機制的研究需求。通過考察人類譯者與翻譯工具在詞匯、句式和篇章構(gòu)建層面的互動關(guān)系,本研究試圖探索人機協(xié)作翻譯的相關(guān)模式。
1 研究理據(jù)
現(xiàn)有研究表明,機器翻譯在信息類文本處理中已實現(xiàn)較高準(zhǔn)確率,但其在文學(xué)翻譯尤其是散文領(lǐng)域的適用性仍存爭議。散文翻譯作為一種高層次的審美實踐活動,要求譯者在追求語言準(zhǔn)確性的同時深入挖掘并傳達(dá)其內(nèi)在的深刻意蘊[2]。將語料庫文體學(xué)的研究范式應(yīng)用于散文翻譯,有助于發(fā)現(xiàn)定性研究方法中易被忽視的語言事實和細(xì)節(jié),為系統(tǒng)探究人機翻譯的文體差異提供了量化路徑。這些實證數(shù)據(jù)不僅可以客觀呈現(xiàn)人類譯者與翻譯工具譯文在各維度上的文體差異,更構(gòu)成探究人機協(xié)同機制的重要考察基礎(chǔ)。行動者網(wǎng)絡(luò)理論強調(diào)人類與非人類要素共同構(gòu)建網(wǎng)絡(luò)的核心觀點[3],適用于解析翻譯過程中譯者、技術(shù)與文本的動態(tài)交互過程。該理論聚焦多元要素的聯(lián)結(jié)過程,為人機協(xié)作研究提供了新視角。但截至目前,行動者網(wǎng)絡(luò)理論視域下的翻譯研究,多涉及宏觀的整體翻譯過程,強調(diào)譯者、編輯和讀者等主體的互動,較少涉及微觀詞句選擇上的分析考察,其主體并未涉及人工智能翻譯?;诖耍疚慕梃b行動者網(wǎng)絡(luò)理論,將翻譯工具視為具有算法能動性的“非人類行動者”,探討人機雙方如何通過“轉(zhuǎn)譯”重構(gòu)翻譯網(wǎng)絡(luò)
2 研究設(shè)計
2.1 研究問題
本研究旨在回答以下問題:譯本是否體現(xiàn)了人工翻譯和機器翻譯的文體差異?差異何在?造成差異的原因是什么?如何通過人機協(xié)作提升中國散文的英譯質(zhì)量?
2.2 語料庫構(gòu)建及研究步驟
本研究選取數(shù)本散文集,構(gòu)建參照語料庫(約10萬詞)和可比語料庫(約35萬詞)。參照語料由英美經(jīng)典散文構(gòu)成,可比語料涵蓋卜立德、張培基等中外權(quán)威譯者譯本及有道翻譯、GPT-4的譯本,中文源文本選自兼具文學(xué)價值與外宣功能的散文名篇。研究分為三階段展開:首先清洗、整理文本建成45萬詞可比語料庫;接著使用TreeTagger3.0、Wordsmith7.0、MAT等工具進(jìn)行各維度指標(biāo)的量化分析;最后借鑒文體學(xué)家Crystal和Davy的研究框架[4],從詞匯(標(biāo)準(zhǔn)類符/形符比、平均詞長和詞匯密度)、句法(平均句長、復(fù)雜結(jié)構(gòu)占比)、語篇(可讀性指數(shù)、信息維度值和文本類型)三個維度系統(tǒng)解析數(shù)據(jù),使用AntConc檢索示例進(jìn)行分析。
3 結(jié)果與討論
3.1 詞匯層面
3.1.1 標(biāo)準(zhǔn)類符/形符比
標(biāo)準(zhǔn)類符/形符比能有效衡量文本詞匯多樣性。其中類符指文本中不同單詞的總數(shù),而形符代表文本中所有詞匯的總數(shù)。該值越高,表示文本中的詞匯使用越多樣化。表1顯示了語料的統(tǒng)計結(jié)果。
數(shù)據(jù)顯示,中外譯者譯本的比值較高,表明其突出的詞匯多樣性,而翻譯工具GPT譯文的數(shù)值則偏低??梢娙祟愖g者作為傳統(tǒng)翻譯行動者,通過詞匯選擇主動重構(gòu)文本網(wǎng)絡(luò)。例如,在翻譯散文中“藍(lán)布大褂、小坎肩,戴瓜皮小帽”等具有地方特色詞匯時,譯者選用“in a bluecloth gownwith a short sleevelessjacket overitanda skullcap onthehead”等具象表達(dá),既聯(lián)動原文詼諧幽默的文化語境,又回應(yīng)目標(biāo)讀者的認(rèn)知預(yù)期,形成跨文化轉(zhuǎn)譯的動態(tài)網(wǎng)絡(luò)。相較之下,翻譯工具受限于算法邏輯,傾向于選擇“wear”“small”“hat”等通用詞匯,優(yōu)先完成信息傳遞的基礎(chǔ)網(wǎng)絡(luò)構(gòu)建。此舉有助于不熟悉源語言文化的讀者迅速理解文本的基本信息,但缺乏細(xì)節(jié)生動感。
3.1.2 平均詞長與詞匯密度
平均詞長指文本中每個單詞所含字母數(shù)量的平均值,詞匯密度指實詞數(shù)量在文本中的占比,其計算可以評估不同文本在難度方面的差異[5]。一般而言,詞長和詞匯密度值較高意味著文本理解難度較大。表2展示了各譯本詞長和詞匯密度的統(tǒng)計數(shù)據(jù)。
如表2所示,中外譯者譯本平均詞長高于英美原創(chuàng)散文及翻譯工具譯文,其中中國譯者譯本的詞匯密度最高。中國譯者在面臨傳達(dá)原文復(fù)雜概念和專業(yè)術(shù)語的挑戰(zhàn)時,往往傾向于選擇較長實詞以確保信息的精確傳遞。如在介紹中國古代器具的《銅鏡》散文譯文中,中國譯者將“磨光發(fā)亮”譯為polished,glistens”;“有的飾單層”譯為“embellished with single-layeredpatterns”。這種精準(zhǔn)的術(shù)語翻譯反映出中國譯者在中華文化傳播網(wǎng)絡(luò)中的中介責(zé)任。反觀機器翻譯系統(tǒng),雖在詞匯密度參數(shù)上接近人類譯者,但其本質(zhì)是算法對原文風(fēng)格的機械化模仿。例如,在處理上文“磨光發(fā)亮”一詞時,僅選擇“shiny”等基礎(chǔ)詞匯,反映出技術(shù)網(wǎng)絡(luò)對文化異質(zhì)性要素的標(biāo)準(zhǔn)化處理傾向。值得注意的是,外國譯者譯文的詞匯密度最低,可能源于對目標(biāo)語表達(dá)流暢性的強調(diào)。
3.2 句法層面
3.2.1 平均句長
平均句長指文本中單個句子所包含的詞語數(shù)量的平均值,和文本風(fēng)格與難度聯(lián)系緊密。表3為語料統(tǒng)計數(shù)據(jù)。
如上表所示,外國譯者譯文平均句長高于中國譯者及翻譯工具,可見外國譯者在處理復(fù)雜文化意象時,通過句法重構(gòu)強化跨文化闡釋網(wǎng)絡(luò)。例如,在翻譯介紹康橋游船種類的文段中,通過添加邏輯連詞構(gòu)建“thereis...and...\"的長句框架,雖強化了文本邏輯性,但也導(dǎo)致句式略有冗余。機器翻譯則呈現(xiàn)反向行動路徑,將“長形撐篙船”簡化為“l(fā)ongpolingboats”,在降低認(rèn)知負(fù)荷的同時弱化了原文的描寫特質(zhì)。
3.2.2 句子結(jié)構(gòu)
句子結(jié)構(gòu)對譯文可讀性產(chǎn)生直接影響。以下數(shù)據(jù)通過L2CSA(L2 syntactic complexity analyzer)分析得到:T單位包含主句和相關(guān)從句,這一表層指標(biāo)與名詞短語結(jié)構(gòu)所代表的深層指標(biāo)共同構(gòu)成評估文本復(fù)雜性的重要依據(jù)[6。具體而言,復(fù)雜T單位的比率越高,字句中復(fù)雜的名詞性短語數(shù)量越多,意味著文本的句法結(jié)構(gòu)越復(fù)雜。
表4顯示,中外譯者譯本在復(fù)雜T單位比率上略高于機器翻譯。結(jié)合譯文分析可知,人類譯者的句法重構(gòu)策略具有顯著的主體性特征:如張培基在《黃昏》譯文中將“遠(yuǎn)近有悲壯的笳聲”譯為“Fromnear,then far,comes the solemn,tragic sound of aflute”[7],通過時空副詞序列(near-far)與情感修飾語(solemn-tragic)的復(fù)合疊加,既保留了漢語空間敘事的意象流動性,又呼應(yīng)了英語讀者對抒情散文的修辭期待。相較而言,機器翻譯系統(tǒng)雖能生成高密度的復(fù)雜名詞短語,但其結(jié)構(gòu)選擇略有生硬。例如,將同一語句處理為被動結(jié)構(gòu)“Asolemnandstirringcallofaflutewasheardnearandfar”,看似符合英語語法規(guī)范,卻消解了“由近而遠(yuǎn)”的動態(tài)空間敘事。
3.3 語篇層面
3.3.1 語篇可讀性
借助語篇可讀性這一指標(biāo)可推測讀者對于譯文的可接受度和理解度[8]。表5呈現(xiàn)了語料的弗萊士易讀數(shù)(Fleschreadingease)和弗萊士-金凱德年級水平(Flesch-Kincaidgradelevel)。
由數(shù)據(jù)可知,中外譯者譯文的復(fù)雜指數(shù)高于英美散文和翻譯工具譯文。人工譯者往往通過復(fù)雜句法結(jié)構(gòu)和高密度文化符號,保留原文的語言風(fēng)格和文化內(nèi)涵,導(dǎo)致易讀數(shù)較低。相比之下,機器翻譯系統(tǒng)通過句長壓縮與詞匯泛化提高譯文的流暢度和易理解度,實現(xiàn)技術(shù)效率最大化。然而,這種簡化也可能導(dǎo)致原文的文化深度和情感層次的喪失。
3.3.2 文本信息負(fù)載量
多維分析作為量化文體特征的研究方法,能夠通過統(tǒng)計分析語言特征識別功能維度,計算其得分,以量化文體特征識別其最接近的文本類型[其中維度1主要聚焦于信息性語言的使用,體現(xiàn)信息密度和精確度。在這一變量上得分較低,通常表明文本具有較高的信息密集度,如散文和學(xué)術(shù)文章等。相關(guān)結(jié)果見表6。
由表可知,中國譯者譯本的文化闡釋強度高于機器譯文。這種差異可能由于中國譯者主動添加解釋和修辭以完善文化轉(zhuǎn)譯網(wǎng)絡(luò)。例如,張培基在翻譯“桃花杏花搖曳紅袖”時,用到“peachandapricotblossoms atop the walls,like graceful girls waving theirred sleeves”[10],通過添加“graceful girls”的擬人化修飾,既保留了漢語“紅袖”的文化隱喻,又為目標(biāo)語讀者構(gòu)建了具象化的審美體驗。而GPT譯文對同一意象的處理較為扁平化:“peachandapricotblossomswavingonthewalls”,省略文化修飾成分,僅保留基礎(chǔ)物象指稱。此外,GPT譯文的文本類型出現(xiàn)變異,與其他譯本(均屬敘述類)形成分野,這種變異有可能源于人工智能語料庫的訓(xùn)練數(shù)據(jù)主要來自技術(shù)性或?qū)嵱眯晕谋尽?/p>
4 范式探賾
行動者網(wǎng)絡(luò)理論揭示人機協(xié)同翻譯的本質(zhì)是異質(zhì)行動者的動態(tài)聯(lián)結(jié)。其核心三要素:行動者、網(wǎng)絡(luò)和轉(zhuǎn)譯,為人機協(xié)同提升散文翻譯質(zhì)量提供理論依據(jù)。
4.1行動者能力邊界:人機翻譯優(yōu)勢比較
人類譯者作為翻譯過程中傳統(tǒng)的行動者具備文化闡釋的語境敏感性與審美判斷力,在語義深度解碼與文體風(fēng)格控制方面具有核心優(yōu)勢。上文研究結(jié)果說明,他們傾向于使用復(fù)雜的詞匯和句子結(jié)構(gòu),增強譯文的信息量和表達(dá)力,能夠較為充分地滿足人們多樣化的審美需求。翻譯工具則包含了大量的數(shù)據(jù)、算法和模型,能夠模擬人類翻譯過程實現(xiàn)語言規(guī)范的形式化建模,在術(shù)語一致性維護(hù)與流暢性方面表現(xiàn)突出,但缺乏人類譯者的直覺和創(chuàng)造力,在文采和個性表達(dá)方面存在明顯的不足[]
4.2 網(wǎng)絡(luò)互動邏輯:動態(tài)聯(lián)系,雙向優(yōu)化
網(wǎng)絡(luò)是指連接行動者的關(guān)系結(jié)構(gòu),其結(jié)構(gòu)和連接方式對行動者的行為和決策產(chǎn)生重要影響。翻譯網(wǎng)絡(luò)可視作不同參與者的協(xié)作系統(tǒng)。人類譯者通過經(jīng)驗積累形成個性化策略,機器翻譯系統(tǒng)則基于大數(shù)據(jù)建立語言規(guī)則庫。兩者之間可以取得動態(tài)聯(lián)系,通過持續(xù)交互實現(xiàn)共同進(jìn)步:人類對機器譯文的修改幫助優(yōu)化算法模型,機器的快速處理能力輔助人類提升效率。這種互動能夠形成雙向提升的良性循環(huán),推動翻譯質(zhì)量持續(xù)改進(jìn)。
4.3轉(zhuǎn)譯協(xié)商機制:彼此取優(yōu),效能提升
轉(zhuǎn)譯指社會實體間通過互動重構(gòu)價值共識的過程[12],在翻譯中可以表現(xiàn)為人機協(xié)同的雙向優(yōu)化機制。人類譯者憑借文化認(rèn)知優(yōu)勢,對機器翻譯系統(tǒng)輸出的譯文進(jìn)行語境化調(diào)適;機器翻譯系統(tǒng)則通過持續(xù)學(xué)習(xí)譯后編輯數(shù)據(jù),提升上下文適應(yīng)性處理能力。雙方通過三個遞進(jìn)層實現(xiàn)價值整合:初級語言規(guī)范校準(zhǔn)(語法修正)、中級文體風(fēng)格適配(文學(xué)性表達(dá)優(yōu)化)、深度文化補償(文化認(rèn)知差異填補)。這種協(xié)作模式在提升翻譯效率的同時,實現(xiàn)文化信息的系統(tǒng)性傳遞,最終生成既符合目標(biāo)語規(guī)范又保留源語文化特質(zhì)的譯作。
5結(jié)語
本研究基于語料庫文體學(xué)框架,通過構(gòu)建中國散文人機英譯可比語料庫,系統(tǒng)揭示了人工翻譯與機器翻譯在詞匯、句法和語篇層面的文體差異。量化分析表明,人類譯者憑借文化敏感性與審美判斷力,在詞匯多樣性、句法復(fù)雜性及文化深度闡釋方面展現(xiàn)出核心優(yōu)勢,能有效傳遞散文的文學(xué)性。機器翻譯則在術(shù)語一致性、句法流暢性及處理效率上表現(xiàn)突出,但其譯文存在詞匯泛化、文化轉(zhuǎn)譯淺表化等問題,反映出算法邏輯對文學(xué)性表達(dá)的局限性?;谛袆诱呔W(wǎng)絡(luò)理論,本文提出人機協(xié)同翻譯的動態(tài)互動范式,強調(diào)二者通過“轉(zhuǎn)譯”機制實現(xiàn)語言規(guī)范校準(zhǔn)、文體適配與文化補償?shù)确矫娴膬?yōu)化,從而平衡效率與質(zhì)量,助力中國散文外譯的深度傳播。
本研究的局限在于語料規(guī)模與文本類型的覆蓋面有限,未來研究可拓展至多模態(tài)語料庫構(gòu)建,并深入驗證行動者網(wǎng)絡(luò)理論在多樣化翻譯場景中的解釋力。本文的研究結(jié)果為優(yōu)化人機協(xié)作模式、推動翻譯技術(shù)的人文適配提供了理論與實踐參考,亦為中華文化“走出去”的跨學(xué)科研究開辟了新路徑。
參考文獻(xiàn)
[1]胡顯耀.語料庫文體統(tǒng)計學(xué)方法與應(yīng)用[M].北京:外語教學(xué)與研究出版社,2020:1-5.
[2]劉小燕.從翻譯美學(xué)觀看戴乃迭對《邊城》中美學(xué)意蘊的藝術(shù)再現(xiàn)[J].北京交通大學(xué)學(xué)報(社會科學(xué)版),2005(2) :70-74.
[3]LATOUR B. Science in Action:How to Follow ScientistsandEngineers through Society[M].Cambridge:HarvardUniversity Press,1987 :44-45.
[4]CRYSTAL D,DAVY D. Investigating English Style[J].Language,1969,47(4) :264.
[5]LAUFERB,NATIONP.Vocabulary size and use:Lexicalrichness in L2 writen production. Applied linguistics,1995,16(3) :307-322.
[6]TONO Y,OBANA Y. L2 Syntactic Complexity Analyzer(L2SCA)[J]. JALT CALL Journal,2014,1O(1) :17-36.
[7]張培基.英譯中國現(xiàn)代散文選(二)[M].上海:上海外語教育出版社,2012:134-138.
[8]MCLAUGHLIN G H. SMOG Grading:A New ReadabilityFormula[J]. Journal of Reading,1969,12(8) :639-646.
[9]BIBER D.Variation across Speech and Writing[M]. Cam-bridge:Cambridge University Press,1988:61-63.
[10]張培基.英譯中國現(xiàn)代散文選(一)[M].上海:上海外語教育出版社,2012:267-272.
[11]王克非.智能時代翻譯之可為可不為[J].外國語,2024,47(1) :5-9,13.
[12]CALLON M. Some Elements of a Sociology of Translation :Domestication of the Scallops and the Fishermen of StBrieuc Bay[J]. The Sociological Review,1986,32(S1):196-233.