劉克強,沈映梅
(紅河學院外語學院,云南蒙自661100)
基于漢英平行語料庫對漢語詞匯的英譯研究
——以漢語常用動詞“發(fā)展”為例
劉克強,沈映梅
(紅河學院外語學院,云南蒙自661100)
語料庫語言學與語言學習的結(jié)合已有時日,但如何使用平行語料庫進行翻譯的研究才剛剛開始。對于漢英翻譯來說,漢英平行語料庫對漢英詞匯對等系統(tǒng)的建立能夠提供很大的幫助。在自建漢英平行語料庫的基礎上,本文通過提取漢語的高頻動詞“發(fā)展”,從而發(fā)現(xiàn)和總結(jié)其在不同文本中的英語翻譯規(guī)律。旨在為今后翻譯與之相關(guān)的句子時提供真實、可靠的譯例,同時也表明平行語料庫在翻譯當中有廣闊的使用前景和潛在的開發(fā)價值。
發(fā)展;平行語料庫;翻譯
目前,國際上建立了為數(shù)不少的平行語料庫,加拿大是最早建立的國家之一,研究者收集加拿大議會辯論的英法雙語建立了Hansard平行語料庫[3],以研究英法雙語詞匯和句型翻譯。但一般認為,Mona Baker[2]發(fā)表的論文是推動語料庫翻譯研究發(fā)表的開山之篇,此后一批學者利用語料庫探討翻譯方面的諸多問題。在國內(nèi),北京外國語大學建成了規(guī)模約2,000萬字詞的大型句對齊英漢平行語料庫[7],基于此語料庫,該校研究人員已展開了翻譯領(lǐng)域的相關(guān)研究,不過大眾能接觸到的很少,且他們研究的大多是翻譯的普遍性問題,對于詞匯、句子層次的研究相對比較少。然而,詞匯的翻譯在翻譯具體實踐中往往起著很大的作用,因此研究詞匯,尤其是常用詞匯的對應翻譯顯得尤為重要。
《現(xiàn)代漢語常用詞表(草案)》[5]將“發(fā)展”這個詞排在其詞表的第一百七十一位,Xiao[4]著的《漢語詞頻詞典》中,基于漢語語料庫,按照詞頻編排了漢語常用的五千詞,“發(fā)展”作為動詞位于第一百零九位,而在所有的動詞中居第二十二位。這本詞典是基于七千三百萬漢字約合五千萬詞的漢語語料統(tǒng)計分析出來的,而且這些語料包括四大語域:口語,新聞,小說,非小說。因此我們可以斷定,“發(fā)展”這個動詞確確實實為漢語常用動詞。作為漢語常用動詞,在漢語中出現(xiàn)如此頻繁,在翻譯過程當中如何根據(jù)上下文情況翻譯“發(fā)展”呢?是不是一碰見“發(fā)展”就翻譯成“develop”,“development”呢?下面我們通過自建的漢英平行語料庫來展示如何分析“發(fā)展”的翻譯情況。
要利用漢英平行語料庫來進行翻譯研究,就必須建立相應的漢英平行語料庫,在選擇漢語譯文時,根據(jù)樸松林、王克非[7]的經(jīng)驗,首先必須注意翻譯質(zhì)量問題,其次是選擇語料的問題和取樣問題。為了保證翻譯質(zhì)量,本研究選擇的漢語譯文都是在國內(nèi)外權(quán)威出版社出版,有很高質(zhì)量的譯文;在語料的選擇方面,盡量多地選擇各種體裁的語料。著眼于實際研究的需要,所有語料都是全文收錄。此語料庫分為三部分:小說部分,非小說部分,科學技術(shù)部分。
其中小說部分包括:《魯迅小說集》、《子夜》、《圍城》、《春蠶》、《駱駝祥子》、《青春之歌》、《暴風驟雨》、《芙蓉鎮(zhèn)》等小說及其英語譯文,其中漢語以字計算,英語以詞計算,共計約250萬字詞。
非小說部分包括:《毛澤東選集》、《鄧小平文選》、政府白皮書、政府工作報告及一些法律文件及其英語譯文等。計算方法同上,共計約包含300萬字詞。
科技部分大多是電腦、工程方面的資料及其英語譯文,計算方法同上,共計約有50萬字詞。
如前所述,本研究的目的是為了找出“發(fā)展”對應的翻譯,即提取語言間對譯轉(zhuǎn)換的信息。因此,我們首先需要確立每對詞匯翻譯在各自語言的相應語境,如段落、句子,為實現(xiàn)這個目標,必須借助于軟件幫助對齊局部單位,根據(jù)研究需要,本文使用Trados的WinAlign。下面以2009溫家寶總理所做的政府工作報告的漢語版本及其英譯版本的部分段落為例來說明如何進行句子層次的對齊。限于篇幅,表1是政府工作報告的一小部分。實際操作時,應當將報告的漢、英全文進行對齊。
表12009 政府工作報告部分漢語及其英語翻譯
這里使用的是TRADOS 7.0,在安裝此軟件后,點擊TRADOS 7.0,在其下菜單中選擇“WinAlign”,雙擊“WinAlign”,進入對齊工作界面,在文件菜單下選擇“new project”后,再依次選擇待對齊語料的語言,選擇的source language為漢語,target language為英語。在進行相關(guān)切分的標點設置后,載入待對齊的漢、英語料,就可以進行對齊了,運行后的界面如圖1所示:
圖1 TRADOS WinAlign將語料對齊后的界面
由于是軟件輔助對齊語料,不可能做到百分之百正確,好在此軟件提供了人工干預的很多命令,點擊認為對齊不盡如意的地方,可以進行合并、切分等等,限于篇幅,此處不再深入。最后將滿意的對齊語料保存并導出,然后整理該文件,就生成漢、英平行語料庫了。
為了實現(xiàn)對動詞“發(fā)展”的提取,從而發(fā)現(xiàn)對應的翻譯,必須給漢語語料添加某種符號,以便軟件識別和提取,利用中科院開發(fā)的ICTCLAS 1.0(漢語詞法分析系統(tǒng)1.0版)[8]可以給漢語語料的每個詞加上對應的詞性符號,為了便于分析,從該報告中選擇下面一句:“按照出手要快、出拳要重、措施要準、工作要實的要求,迅速推出進一步擴大內(nèi)需、促進經(jīng)濟增長的十項措施,爭分奪秒地加以落實;接連出臺金融支持經(jīng)濟發(fā)展、促進輕紡工業(yè)健康發(fā)展、促進房地產(chǎn)市場健康發(fā)展、搞活流通擴大消費和保持對外貿(mào)易穩(wěn)定增長、穩(wěn)定就業(yè)等政策措施,加快制定重點產(chǎn)業(yè)調(diào)整振興規(guī)劃。”利用ICTCLAS標注后,本句話就變成:
按照/p出手/v要/v快/a、/w出/v拳/n要/v重/a、/w措施/n要/v準/a、/w工作/vn要/v實/a的/u要求/n,/w迅速/ad推出/v進一步/d擴大/v內(nèi)需/n、/w促進/v經(jīng)濟/n增長/vn的/u十/m項/q措施/n,/w爭分奪秒/i地/u加以/v落實/v;/w接連/d出臺/v金融/n支持/vn經(jīng)濟/n發(fā)展/vn、/w促進/v輕紡/j工業(yè)/n健康/ad發(fā)展/v、/w促進/v房地產(chǎn)/j市場/n健康/ad發(fā)展/v、/w搞活/v流通/vn擴大/v消費/vn和/c保持/v對外貿(mào)易/l穩(wěn)定/a增長/vn、/w穩(wěn)定/ad就業(yè)/v等/u政策/n措施/n,/w加快/vd制定/v重點/n產(chǎn)業(yè)/n調(diào)整/vn振興/vn規(guī)劃/n。
觀察經(jīng)過標注后的語料,可以發(fā)現(xiàn)原來的漢語語料進行了詞切分,并且對切分后的詞附上詞性碼,如“發(fā)展”一詞,就被標上“/v”和“/vn”兩種詞性,前者表示動詞,也就是我們所要分析的;后者相當于動名詞。這樣我們將對齊并標注的語料載入ParaConc軟件(Barlow,2003),檢索“發(fā)展/v”就可以將所有的動詞“發(fā)展”所在的句子提取出來,而這些句子所對應的英語翻譯也相應的顯示出來。圖2就是載入語料后,在該軟件的search框中輸入“發(fā)展/v”,得到的結(jié)果。
在圖2中點擊上框中每一句漢語,下框就有是它對應的譯文,這樣就可以進行“發(fā)展”的翻譯分析。為了方便閱讀漢語句子,在下面的例子當中,須將進行標注的漢語句子進行整理,去掉詞的詞性標注。
(一)在小說文體中的典型翻譯
1.現(xiàn)在訂了婚,彼此間還留著情感發(fā)展的余地,這是樁好事。
In the case of their engagement now,there was still room left between them for their feelings to develop,and that was a very good thing.
2.他們發(fā)展企業(yè)的一場大夢!現(xiàn)在快到夢醒了罷?
They had dreamed of giving industry a new lease of life,but now-now it looked as if they would soon be brought back to earth with a jolt!
3.外圍組織也幾乎都被破壞;剩下的,情緒不安,也很難發(fā)展。
Most of the organizations close to the Party have broken up,the rest are so disorganized that it is equally hard for them to expand.
4.他不斷化裝,不斷地變化著職業(yè),因此,他來到定縣雖然半年多了,可是敵人并沒有發(fā)覺他,而定縣農(nóng)村中的革命組織卻一天天地恢復并發(fā)展了。
He changed his disguise and occupation so often that he was able to work in Tinghsien for more than half a year without being discovered.The revolutionary bodies in that area gained strength with every passing day.
5.有志之士被壓迫得慢慢像西洋大都市的交通路線,向地下發(fā)展,地底下原有的那些陰毒曖昧的人形爬蟲,攀附了他們自增聲價。
Men of good will were so depressed that,like the transportation lines in major Western cities,they slowly began to go underground,while the dark,insidious reptiles in human form,which had been underground all along,boosted their prestige by latching on to them.
(二)在非小說文體中的典型翻譯
1.進一步發(fā)展高中階段教育、高等教育和各類職業(yè)教育。
Efforts should be made to further develop senior secondary school education,higher education and all types of vocational education.
2.重點培育和發(fā)展要素市場,尤其是資本市場。
We need to focus our efforts on the development of markets for production factors,especially capital.
3.積極發(fā)展多種形式的產(chǎn)學研結(jié)合。
Efforts should be made to promote the integration of production,teaching and research in a variety of ways.
4.繼續(xù)發(fā)展對外承包工程和勞務合作。
Overseas contracted projects and labor services should be further expanded.
5.大力發(fā)展經(jīng)濟適用住房,建立廉租房供應保障體系。
We need to build more affordable and functional housing and establish a system to ensure an adequate supply of low rent housing.
(三)在科技文體中的典型翻譯
1.發(fā)展高強度扭桿,大幅度提高車輛的懸掛性能
To Develop the High Strength Torsion-ber for Highly Improving the Performances of the Vehicle Suspension
2.一項當前的應用--通過個人通信器查民航機票價的能力--將繼續(xù)擴大和發(fā)展,最終把個人通信器轉(zhuǎn)化成綜合的公務出差的計劃工具。
One current application,the ability to check airline fares via personal communicator--will continue to expand and develop,eventually transforming the personal communicator into a comprehensive business tripplanning tool.
3.在1995年間,語音識別和輸入及管理聲音和數(shù)據(jù)的功能也取得了大的發(fā)展。
Speech recognition and the capability to input and manipulate voice and data also have been big advancements during 1995.
4.短短的幾年中,Internet以指數(shù)的速度發(fā)展著,從科學與學術(shù)界用的網(wǎng)絡成長為一種通用的系統(tǒng),給數(shù)百萬計的人員和單位提供簡單但有效的通信服務和信息訪問。
In a few years,the Internet has grown exponentially from a network for the scientific and academic community into a universal system providing millions of people and organizations with simple but effective communications services and information access.
5.由于全雙工和干線方案可用于將以太網(wǎng)帶寬推向更高,以太網(wǎng)的發(fā)展將會繼續(xù)下去。
But the story doesn't stop there,since full-duplex and trunking schemes can be used to push Ethernet bandwidth even higher.
通過建設平行語料庫的方法,可以發(fā)現(xiàn)“發(fā)展”在不同的文體中有很多種對應的翻譯,它們既有相同的,也就是三種文體共享的翻譯方法,更加重要的是,還有大量的根據(jù)上下文的理解和文體的不同翻譯成其他的形式。這樣為研究提供了真實、可靠的示例,對外語教育工作者的教學和科研都有十分重要的意義,同時也表明了雙語平行語料庫在翻譯教學和科研上有著廣闊的使用前景。
[1]Barlow M.ParaConc:A Concordancer for Parallel Texts.Paraconc Help,2003.
[2]Baker,Mona.Corpus Linguistics and Translation Studies: Implications and Applications[A].In Mona Baker,Gill Francis,and Elena Tognini-Bonelli(eds)Text and Technology:In Honor of John Sinclair.Amsterdam-Philadephia: John Benjamins,1993.
[3]Brown P,et al.Aligning Sentences in Parallel Corpora[A].In Proceedings of the 29th Annual Meetings of the Association for Computational Linguistics[C].Berklery,Ca,1991.
[4]Xiao,Richard,Paul Rayson,Tony McEnery.A Frequency Dictionary of Mandarin Chinese:Core Vocabulary for Learners.[M].London:Routledge,2009.
[5]《現(xiàn)代漢語常用詞表》課題組.現(xiàn)代漢語常用詞表(草案)[M].北京:商務印書館,2008.
[6]樸松林,王克非.國內(nèi)外雙語對應語料庫研制現(xiàn)狀[A].王克非等著.雙語對應語料庫研制與應用[C].北京:外語教學與研究出版社,2004.
[7]王克非.英漢/漢英語句對應的語料庫考察[J].外語教學與研究,2003(6).
[8]張華平.ICTCLAS 1.0,2002.
[責任編輯張燦邦]
On the Translations of Chinese Words Based on a Parallel Corpus——take"Fazhan"as an Example
LIU Ke-qiang,SHEN Ying-mei
(School of Foreign Languages,Honghe University,Mengzi 661100,China)
Corpus has been acclaimed recently as a new resource for language teaching.But the use of parallel corpus in translation has barely started,especially for Chinese-English translation;parallel corpus can facilitate the extraction of equivalent lexical system between Chinese and English.Based on the self-built Chinese-English parallel corpora(about 6 million characters/words in size),this paper probes into the application of parallel corpora to translation equivalent extraction with the frequent Chinese verb"Fazhan"as an example.It shows that a parallel corpus can provide rich parallel samples for the verb in different texts and its use in translation awaits widening and its potentiality awaits exploiting.
fazhan;parallel corpora;translation
book=3,ebook=62
H159
A
1008-9128(2009)02-0091-04
2010-02-22
云南省教育廳科學研究基金項目:“漢語常用動詞及英譯的類聚研究”(07C40184)
劉克強(1971-),男,陜西西安人,講師,在讀博士生。研究方向:應用語言學、語料庫語言學。