高佳琪 孫皓
基金項目:本文為2020年吉林省大學生創(chuàng)新訓練計劃項目“基于Python的《春香傳》中文譯本平行語料庫搭建”(項目編號:2020076)的階段性成果;2019年吉林省教育廳“基于生態(tài)翻譯學的《春香傳》中文譯本研究”(項目編號:JJKH20190532SK)的階段性研究成果。
摘? 要:《春香傳》這部優(yōu)秀的韓國文學名著,深受我國翻譯人士的喜愛。關于《春香傳》中文譯本的研究尚停留在文本研究的層面,亟需進行更加深入、細致地整理與研究。本文依托筆者負責的大學生創(chuàng)新項目,旨在對《春香傳》中文譯本利用Python建立平行文本語料庫,通過機輔翻譯這一手段,分析諸譯本間存在的問題及翻譯偏誤,從而達到提高翻譯效率的目的,以便更好地為翻譯工作者提高翻譯質(zhì)量。
關鍵詞:春香傳;韓國古典文學;機輔翻譯;大學生創(chuàng)新項目
作者簡介:高佳琪(1999.9-),女,漢,吉林延吉人,大三本科生;孫皓(1981.10-),男,河北撫寧人,研究生,副教授,研究方向:韓中比較文學。
[中圖分類號]:I106? [文獻標識碼]:A
[文章編號]:1002-2139(2021)-08--02
一、《春香傳》的中文譯本情況
《春香傳》、《沈清傳》、《興夫傳》是韓國古典文學的三大傳,《春香傳》、《紅樓夢》、《源氏物語》是亞洲三大古典小說。它真實地反映了朝鮮王朝時期人民的生活面貌,通過講述藝妓之女成春香與兩班貴族公子李夢龍的愛情故事,生動地描繪了追求個性、婚姻自由,勇敢、堅貞不屈的成春香和出生于兩班階級但卻與封建統(tǒng)治階級對立的清官李夢龍的人物形象。從上世紀五十年代中期開始,華語世界中先后誕生了五種不同風格的中文譯本,對于國內(nèi)讀者查找閱讀、理解《春香傳》小說的內(nèi)容提供了便利。下面對這幾個中文譯本介紹如下:
1)冰蔚、張友鸞本[1]
朝鮮作家同盟出版社于1954年以原始盤索里唱劇為藍本出版了小說《春香傳》。1956年7月,冰蔚、張友鸞二人翻譯的《春香傳》由作家出版社出版。這也是這部優(yōu)秀的古典小說目前可考的最早譯本。譯者對流行在朝鮮的各種版本的《春香傳》分別進行了介紹,譯文風格保留了很多長句和古漢語語體。同年7月,人民文學出版社也出版了署名“冰蔚、木弟”的《春香傳》譯本[2]。
2)許世旭本[3]
1967年,臺灣商務印書館出版了韓國學者許世旭的《春香傳》譯本,該譯本共分五十二個小章節(jié)。在譯文正文之前,譯者輔以韓國第一代《春香傳》專家金臺俊所寫的《春香傳考釋》,內(nèi)容分為序說、起源、年代與作者、異本、評價五個部分。此譯本中個別詞匯為譯者自造,讀者理解起來有些困難。
3)柳應九本[4]
2006年,新世界出版社出版了韓國學者柳應九的中文譯本,該譯本采用韻、散文筆墨交替翻譯的方式最大限度地再現(xiàn)了原作的藝術(shù)風貌。該譯本共分二十個小章節(jié),并附有插圖和注釋,譯者的話觀點是此譯本供一般讀者欣賞使用。
4)丁生花本[5]
2007年,民族出版社出版了丁生花的譯本。此譯本的底本是韓國人趙浩相使用現(xiàn)代韓國語重新轉(zhuǎn)寫的版本,內(nèi)容上對原文中難于理解、生澀的詞匯進行了替換。此譯本最后收錄了趙浩相的韓文轉(zhuǎn)寫原文。
5)薛舟、徐麗紅本[6]
2010年,人民文學出版社出版了薛舟、徐麗紅的譯本,內(nèi)容分為偶遇、離別、蒙冤、重逢四章,最后譯附底本作者韓國人宋晟旭的《春香傳直解》一文。這版更符合現(xiàn)階段隨著社會的不斷發(fā)展的大環(huán)境下,人們的生活水平不斷提高,精神文化生活不斷豐富,在更為開放的譯介環(huán)境下,人們需要一本更符合當代人語言習慣、更與時俱進的譯本。
可以說上述五種中文譯本由于翻譯時代、譯者身份的差異使得譯文風格各具特色,同時翻譯中出現(xiàn)的錯誤也在所難免。本文中使用的《春香傳》譯本語料庫內(nèi)容源于除了丁生花本之外的其他四個中文譯本。
二、機輔翻譯的發(fā)展現(xiàn)狀
翻譯是語言和語言之間的信息轉(zhuǎn)換,在不斷進行的翻譯實踐中,通過對許多有經(jīng)驗的翻譯者的問卷調(diào)查了解到,傳統(tǒng)的口譯和筆譯中多次出現(xiàn)的句式和詞組對翻譯效率的提高形成了阻礙,并不能滿足譯者對于翻譯質(zhì)量和翻譯效率的需要;并且隨著時代的發(fā)展,計算機和互聯(lián)網(wǎng)逐漸滲透到了各個領域,計算機輔助翻譯(Computer aided translation,CAT)應運而生,它不同于以往的機器翻譯軟件,而是一種人工為主,機器為輔的翻譯手段。與傳統(tǒng)的人工翻譯相比,機輔翻譯的翻譯質(zhì)量更高、翻譯效率更快,它能夠幫助翻譯者優(yōu)質(zhì)、高效、輕松地完成翻譯工作,在某種程度上,機輔翻譯對傳統(tǒng)的翻譯方法造成了一定的沖擊。對于翻譯新手來說,機輔翻譯也能很好地幫助他們了解和學習更多的翻譯技巧和知識。在這個強調(diào)大數(shù)據(jù)資源共享的時代,傳統(tǒng)的人工翻譯所積累的翻譯經(jīng)驗只能保存在每個譯者自己的知識系統(tǒng)中,機輔翻譯出現(xiàn)以后,它可以通過計算機把這些翻譯經(jīng)驗存儲在計算機系統(tǒng)中,并通過整合形成數(shù)據(jù)庫,這樣一來,無論是翻譯水平高還是翻譯水平有待提高的翻譯者都可以通過機輔翻譯獲取到對于同一個詞的不同的翻譯方法,可以更直觀地對不同的翻譯文本進行比較和學習,更專業(yè)的翻譯經(jīng)驗得以公開,更豐富的翻譯資源得以共享,從而達到提高翻譯效率,提升翻譯水平的目的。
三、《春香傳》與機輔翻譯的結(jié)合
首先我們根據(jù)現(xiàn)有的實驗條件和項目難度,成立了一個包括指導教師在內(nèi)的6人研究小組。本項目對成員的要求有較高的韓語水平的同時要掌握基礎的計算機相關知識并達到熟練的程度,且對研究項目比較感興趣,會主動積極地參與每一項工作。當然必不可少的一點是要對韓國文學有一定的了解,特別是對《春香傳》要有一定的興趣。根據(jù)要求選拔上來的小組成員均具有較高的韓語水平和較為熟練的計算機操作技術(shù)。小組成員確定之后,我們就隨即開展了項目的前期準備工作,明確了基本的實踐方向,項目的任務和項目的實施步驟。
本項目的任務是基于Python的春香傳中文譯本平行語料庫的搭建,利用Python構(gòu)建語料庫框架,在北京語言大學技術(shù)團隊的幫助下將語料庫知識進行分模塊處理,項目成員將收集的內(nèi)容分類輸入進語料庫,并對庫內(nèi)內(nèi)容進行實時更新。本項目的實施分為以下幾個階段:
(1)學習項目操作流程
(2)熟讀《春香傳》原文
(3) 學習張玉婷(2013)碩士畢業(yè)論文中對于《春香傳》中文譯本的研究思路
(4)將4本《春香傳》中文譯本進行文本電子化處理
(5)將分配好標簽的文本利用python進行編程
(6)對已建成的《春香傳》中文譯本平行語料庫進行調(diào)試和校對。
項目實施過程中首先遇到的困難就是四本《春香傳》中文譯本的獲取。1956年的版本和1967年版本的《春香傳》由于發(fā)行時間距今長達半個世紀、內(nèi)地也沒有引進版權(quán),因此在文本的獲取上存在一定的困難。中文讀秀學術(shù)資源中,該版本的電子資源屬于付費下載資源,且只能部分購買,因此該版本的譯文文本獲取上可以考慮通過網(wǎng)絡,聯(lián)系臺灣當?shù)氐亩謺u家進行單獨購買。2006年版本和2010年版本可以考慮直接購買,其他研究條件均已具備。
項目進行中最大的困難還是對于Python軟件的掌握。當下炙手可熱的Python是一種跨平臺的計算機程序設計語言。它的功能主要在于數(shù)據(jù)分析和可視化,人工智能、機器學習以及自動化。它可以用更少的代碼在更短的時間內(nèi)解決復雜的問題,進而提高了辦公效率。北京語言大學的韓林濤老師就曾在期刊《中國翻譯》中提到從原來的翻譯世界到今天的翻譯中國,市場對‘翻譯+技術(shù)人才的需求都很迫切?!?/p>
學習編程對于朝鮮語專業(yè)的學生,有一定的難度,所以在項目實施的過程中,小組通過各種渠道查找相關書籍、論文資料,觀看網(wǎng)絡課程等形式對Python形成了一個簡單的了解,具體內(nèi)容包括:
文本清潔(Normalization)、分詞(tokenization)、詞形還原(lemmatization)、詞形標注(part speech tagging)等。文本清潔就是將原文本語料中因人工輸入避免不了出現(xiàn)的中英文符號混雜、特殊符號Python無法識別等情況,通過導入Python中的NLTK自然語言處理包[7]進行識別和處理后,得到清潔的文本的過程。這樣就避免了因原始語料內(nèi)容繁瑣而無法實現(xiàn)進一步的處理和應用的問題。分詞是將文本中的每一串字符都拆分成一個個容易識別的形符的過程。詞形還原是把一個語言詞匯還原為該詞匯的一般形式。詞性標注把一個個形符按照詞性分類,并自動標注的過程。
通過向?qū)煂で髱椭?,項目小組現(xiàn)已獲取到四個中文譯本的文本資源,并和小組成員一起完成了項目的前期準備工作、《春香傳》四本中文譯本的文本電子化工作。未來將會請教北京語言大學韓林濤老師的團隊,具體在實踐中將所了解到的基礎編程知識運用到實際語料庫的建立過程中,提高對《春香傳》中文譯本的數(shù)據(jù)分析與整理的能力。在項目的準備階段至初期階段,制定計劃時,要對所要實施的計劃的難度有一定的預估,對計劃實施過程中的突發(fā)狀況制定相應的應急方案,除特殊情況的影響之外,要保證項目研究順利進行。在對文本的處理上要通過查詢資料確認每一個不熟悉的字、詞的讀音,保證文本的準確度。文本的準確度關系到后續(xù)研究的可行性大小和困難程度的多少;面對不熟悉的領域的時候,要有善于鉆研的精神,要積極詢問相關專業(yè)人士。
四、結(jié)語
本文主要基于本人所負責的大學生創(chuàng)新訓練計劃項目,論述了如何利用Python實現(xiàn)《春香傳》中文譯本與機輔翻譯的有機結(jié)合,建立平行語料庫,更好地為譯者在日后的翻譯工作中提供有效的幫助。論文主要以項目過程記錄的方式進行論述,前半部分對《春香傳》4本中文譯本的自然情況、機輔翻譯的產(chǎn)生原因以及發(fā)展現(xiàn)狀做了簡單介紹,后半部分主要記述了從項目建立之初小組成員的選拔開始,到項目實施的計劃、實施過程、實施過程中已解決和未解決的困難,反思了在項目實施過程中出現(xiàn)的問題以及項目未來的研究方向。
注釋:
[1]冰蔚、張友鸞:《春香傳》,作家出版社,1956年。
[2]冰蔚、木弟:《春香傳》,人民文學出版社,1956年。
[3]許世旭:《春香傳》,商務印書館,1967年。1934年出生于韓國仁實。歷任韓國中文學會會長、韓國現(xiàn)代文學學會會長、美國加州柏克萊大學研究員、中國復旦大學顧問教授。
[4]柳應九:《春香傳》,新世界出版社,2006年。他是韓國著名漢學家、翻譯家,慶尚大學的教授。
[5]丁生花:《春香傳》,民族出版社,2007年。
[6]薛舟、徐麗紅:《春香傳》,人民文學出版社,2010年。
[7]操作過程參考劉旭:《基于Python自然語言處理工具包在語料庫研究中的運用》,昆明冶金高等??茖W校學報,2015年第5期。
參考文獻:
[1]耿嘯秋.《人工智能時代計算機輔助翻譯技術(shù)》數(shù)碼世界,2020.
[2]韓林濤,劉和平.語言服務本科人才培養(yǎng):“翻譯+技術(shù)”模式探索[J].中國翻譯,2020.
[3]劉旭.基于Python自然語言處理工具包在語料庫研究中的運用[J].昆明冶金高等??茖W校學報,2015.