■尹辰玥(四川外國語大學(xué)重慶南方翻譯學(xué)院)
隨著“一帶一路”的推進(jìn)和全球化進(jìn)程,外語人才的需求量也在增長。如今的外語人才除了要求翻譯能力外,也需要他們具有翻譯專業(yè)領(lǐng)域的能力,例如,汽車、工程、經(jīng)濟等方面??萍技夹g(shù)的進(jìn)步與發(fā)展,各個專業(yè)的專有名詞和特殊句型亦日漸豐富,外語人才也面臨著龐大的記憶需求。
筆者利用兩個月的時間建立了一個包含76989字,共937條語料的日漢雙語小型語料庫,內(nèi)容選取“一帶一路”金融方向的相關(guān)公文,并在校內(nèi)部分師生群中做了小范圍的推廣。本文總結(jié)了構(gòu)建金融方向日漢雙語語料庫和小范圍的應(yīng)用推廣的經(jīng)驗,期望可以拋磚引玉,吸引更多人士將語料庫推廣到更多專業(yè)層面和課堂教學(xué)上。
語料庫,指經(jīng)科學(xué)取樣和加工的大規(guī)模電子文本庫,使用者可以借助計算機等工具快速尋找一個或者多個真實使用的語言范例。
雖然目前國內(nèi)已有多項語料庫相關(guān)的研究和建設(shè),但開放型語料庫相對來說數(shù)量不多。已開發(fā)的語料庫尚未完全進(jìn)入到外語課堂,多數(shù)外語專業(yè)學(xué)生依賴于詞典和網(wǎng)絡(luò)搜索。目前公開的可以低價或免費利用的雙語語料庫中,日語語料庫從內(nèi)容量和更新率來講遠(yuǎn)遠(yuǎn)低于英語語料庫。
根據(jù)報道,北京語言大學(xué)等國內(nèi)多家大學(xué)已經(jīng)完成雙語語料庫、垂直語料庫的建設(shè),但多為英漢雙語,日語語料庫和日漢雙語語料庫較少。目前常被提及的日語語料庫有日本國立國語研究所研究的《現(xiàn)代日語書面語均衡語料庫》(BCCWJ),收錄了在日本發(fā)行的日語書籍、報刊、雜志、政府白皮書等出版物,共計詞匯量一億多。國內(nèi)方面,有北京外國語大學(xué)北京日本學(xué)研究中心徐一平主持的《中日對譯語料庫》(CDROM)。筆者在實際使用了多個日語/日漢雙語語料庫后感受到語料庫更新較慢,專業(yè)性詞匯較少。并且在日語外語學(xué)習(xí)者中語料庫沒有得到真正的推廣,實際的使用率較低。
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和市場的需求,越來越多的學(xué)者也指出,今后語料庫勢必會進(jìn)入到外語教學(xué)的課堂,也會向?qū)I(yè)化、共享化、智能化方向發(fā)展。筆者認(rèn)為在大數(shù)據(jù)時代的背景下,構(gòu)建一個專業(yè)方向的雙語語料庫,符合當(dāng)前外語教學(xué)中語言加專業(yè)化的發(fā)展趨勢,也希望通過建立一個語料庫的平臺達(dá)到學(xué)生、教師雙方互利的局面。
本研究第一,希望可以解決學(xué)生們對于日語詞匯的局限性。在目前的外語教學(xué)中,學(xué)生對于日語詞匯的理解多源于課本或者字典上的翻譯解釋和教師的講解,一個日語詞匯對照一個中文翻譯,在實際的使用中生搬硬套,整句不符合日語表達(dá)習(xí)慣。語料庫包含大量的真實語例,可以讓學(xué)生了解到詞匯的正確使用和搭配,幫助學(xué)生選擇更符合母語習(xí)慣的詞匯。
第二,翻譯工作中要求翻譯內(nèi)容必須滿足“專業(yè)性、統(tǒng)一性、準(zhǔn)確性”,但由于目前課本更新速度有限,部分詞匯在工具書中找不到對應(yīng)的翻譯,在實際的翻譯教學(xué)現(xiàn)場,同一個專有詞匯經(jīng)常被翻譯為不同的對應(yīng)內(nèi)容。日語專業(yè)金融方向日漢雙語語料庫,讓學(xué)生在做金融方向相關(guān)翻譯時可以準(zhǔn)確、快捷地找到標(biāo)準(zhǔn)翻譯,提高翻譯質(zhì)量,縮短翻譯時間。
第三,提供語言運用真實范例。在目前的日語教學(xué)中,教師會花費大量的時間思考例句,但其例句的實用性和邏輯性都有不足,利用日漢雙語語料庫既可以減少教師編寫教案的時間量,也可以利用真實的語境語例,提高學(xué)生的外語語感。
第四,語料庫中收集的政府公文、新聞報道、金融機構(gòu)公文等不同文體可以給學(xué)生提供正式的雙語文體模板。
第五,希望可以改變現(xiàn)有的教與學(xué)的被動模式,為學(xué)生提供自學(xué)、自查的平臺,提高學(xué)生自主學(xué)習(xí)的動機和能力。
構(gòu)建日漢雙語語料庫具體分為:收集日漢對譯內(nèi)容語料、語料降噪、語料對齊、語料上傳和語料庫公開分享五個步驟。
按照:1.原文和譯文為對應(yīng)關(guān)系;2.原文具有可讀性;3.譯文應(yīng)符合譯出語的表達(dá)習(xí)慣。這三項標(biāo)準(zhǔn),筆者選取了一帶一路相關(guān)官方文章中三篇內(nèi)容,《海上絲綢之路的愿景與行動》《亞洲基礎(chǔ)設(shè)施投資銀行協(xié)定》《中國關(guān)鍵詞--一帶一路》。三篇文章的中文文本選自一帶一路網(wǎng)、中華人民共和國財政部官方網(wǎng)站等,對應(yīng)的日語文本選擇自SciencePortalChina、中國駐日本大使館等官方性或?qū)W術(shù)性網(wǎng)站,保證語料的真實性、有效性和行文的嚴(yán)謹(jǐn)。
語料收集自網(wǎng)絡(luò),因此文字內(nèi)容在轉(zhuǎn)換處理時會將原本網(wǎng)頁的代碼等非文章本身的內(nèi)容帶入,需要利用Word 軟件轉(zhuǎn)換收集的語料格式,剔除和文章內(nèi)容無關(guān)的信息。由于在中文系統(tǒng)下,日語漢字和假名在批量轉(zhuǎn)換格式時會出現(xiàn)錯字、別字、漏字的情況,最后需要加入人工校對檢查語料的正確性和完整性。
將降噪過的語料上傳到Tmxmall 的在線對齊功能Aligner 系統(tǒng),由于Aligner 系統(tǒng)不能完全做到工整對齊,因此需要通過人工檢查,將日語和漢語以句子為單位進(jìn)行拆分,但由于日語和漢語語法不一致,語句無法做到嚴(yán)格的一一對應(yīng),因此在拆分時會出現(xiàn)一對多或者多對一的情況。以保證原文的句法邏輯完整為準(zhǔn),按照句號為標(biāo)記拆分原文,譯文不管內(nèi)容多少則需要和原文拆分后的內(nèi)容相符合。逐一檢查句法的邏輯性和完整性,以及錯譯、漏譯、錯字、漏字等并一一討論修改。最后利用軟件的對齊功能調(diào)整對齊文章。若文章較長或有多篇文章,建議分?jǐn)?shù)次上傳對齊。
通過Tmxmall的Aligner對齊后,利用系統(tǒng)自帶的導(dǎo)出功能導(dǎo)出對譯語料存為tmx格式。在Tmxmall個人頁面中新建記憶庫并命名,將導(dǎo)出后的多個tmx格式的語料逐一上傳至建立的記憶庫中,完成金融方向日漢雙語語料庫。
語料庫構(gòu)建完成之后,通過Tmxmall的付費功能,可以將語料庫分享給多人。本次完成的一帶一路經(jīng)濟方向語料庫共搜集937條內(nèi)容,共計76989字。建立完成后在本校進(jìn)行了為期三個月的小范圍的師生分享使用體驗。
為了得到語料庫的實際使用感受,筆者按照語料庫收錄內(nèi)容設(shè)計了一個小型的實際應(yīng)用案例。筆者選取本校兩名大三日語系學(xué)生,要求將日語原文的《財務(wù)部長談亞洲基礎(chǔ)投資銀行》翻譯成為中文,原文為訪談類文章,共計3054字,內(nèi)容為2015年3月日本記者就亞洲投資銀行的相關(guān)問題采訪當(dāng)時的中國財政部部長。根據(jù)譯前問卷調(diào)查,兩名學(xué)生此前未翻譯過訪談類的文體或相關(guān)內(nèi)容,也未翻譯過較長的文字內(nèi)容。翻譯原文中亦涉及到多處一帶一路相關(guān)政策、金融類專有名詞等。筆者要求學(xué)生以此語料庫為參考工具,并提出翻譯的“專業(yè)性、統(tǒng)一性、準(zhǔn)確性”三個標(biāo)準(zhǔn),將文章翻譯為適合發(fā)布的中文內(nèi)容。
每名學(xué)生平均花費約4個小時左右,完整譯出文章。譯文經(jīng)三位教師對譯檢查,對各項指標(biāo)進(jìn)行審查。對其評價為:學(xué)生的譯文符合漢語母語規(guī)范,準(zhǔn)確、有效地翻譯出了原文中存在的各個專有名詞,并且譯文滿足了訪談文章的特殊體裁。
在三個月的試用期后,筆者向使用了語料庫的師生們收集了關(guān)于語料庫使用的感想。其中對于語料庫的不足的意見主要有:
(1)語料庫的內(nèi)容較少,內(nèi)容比較單一,只能完成針對性強的內(nèi)容。
(2)檢索目標(biāo)詞匯時,搜索結(jié)果中只標(biāo)記了目標(biāo)詞匯,對譯的內(nèi)容則沒有相應(yīng)的標(biāo)記。
(3)希望開發(fā)app應(yīng)用程序,可以利用移動設(shè)備隨時查找。
(4)希望加入語音查找功能,加快查找的效率。
此外,對于語料庫感到滿意的地方有:
①對于專有名詞、口號、標(biāo)題等固定格式的翻譯可以通過語料庫快速準(zhǔn)確地找到對譯內(nèi)容。
②對于公文、條例、采訪、規(guī)章等特殊文體的翻譯時有較好的啟示性和示范性作用。
③利用語料庫快速找到詞匯、語法、句型的例句,對于教師備課提供了一個準(zhǔn)確、快捷的平臺。
現(xiàn)在的網(wǎng)絡(luò)提供了非常豐富的語料資源和便捷的語料制作存放平臺。本次語料庫的打造耗時約1個半月,利用網(wǎng)絡(luò)可以即時收集到最新的雙語資料,也可以通過多方面的對比,篩選優(yōu)質(zhì)的符合標(biāo)準(zhǔn)的雙語語料內(nèi)容。雖然計算機可以批量操作減少部分工作量,但是在語料降噪,語料對齊等步驟時依舊需要加入人工的篩選和刪減,因此如要建立大型的語料庫,也需要采取多人合作的方式,投入相應(yīng)的人力成本。
此外,目前可存放語料庫的平臺較少,按照語料的數(shù)量、可分享的人數(shù)、可同時啟用查詢的記憶庫最大數(shù)量、每天可檢索次數(shù)的最大數(shù)量的不同,而產(chǎn)生相應(yīng)的費用,且使用費用不低,若要建立大型語料庫供多人查閱,其成本也是不可忽略的一方面。并且對于如今習(xí)慣移動設(shè)備操作的使用者來講,網(wǎng)頁版的使用操作具有一定的局限性。
在實際應(yīng)用方面,語料庫可以讓學(xué)生迅速查找到專有名詞的對應(yīng)譯法,也可以通過完整的句子和段落,幫助學(xué)生掌握詞匯的固定搭配,以及公文、演講、書信等特殊文體的表達(dá)方式。通過提供多個語言實例和語言出現(xiàn)的頻率和概率,讓學(xué)生可以在同義詞中選擇正確合適的選項。
在翻譯教學(xué)方面,許多學(xué)者提出了翻譯教學(xué)中需要加強學(xué)生的跨文化意識,要求學(xué)生在翻譯時不能停留在表面的語言轉(zhuǎn)換表達(dá)上,而是需要符合譯出語的語境和表達(dá)習(xí)慣。語料庫為學(xué)生提供了真實有效的語言表達(dá),學(xué)生可以將語料庫的翻譯作為參考,和自己的譯文對比,在檢索和對比的學(xué)習(xí)中,了解譯出語的語境和表達(dá)習(xí)慣,讓譯出語更符合母語者的用法,也就是所謂的更“地道”。并且,在以往的教學(xué)工作中,教師需要花費大量的時間思考例句,但是大部分的例句在邏輯性和實用性上都不太理想。教師可以利用語料庫尋找更貼近實際語境、更有邏輯性和實用性的語句。
除了現(xiàn)有的大型語料庫外,學(xué)生可以按照自己的需求建立語料庫。在語料庫的建設(shè)中接觸大量的原文,對于學(xué)生來講也是一個鍛煉學(xué)習(xí)的機會。
語料庫需要大量的語料支撐才能成為有利用價值的語料庫。隨著大數(shù)據(jù)技術(shù)的發(fā)展,語料庫也應(yīng)該走出研究室走出大學(xué),成為共建共享的資源。打造語料庫簡單操作,易上手,對于中高級外語學(xué)習(xí)者和譯者來說也是一個一勞永逸的項目。雖然語料庫的建立和使用都需要一定的費用,但是如果可以吸引更多的企業(yè)和學(xué)校加入語料庫的打造,提供資金和技術(shù)的支持,相信語料庫可以得到更大的推廣。
語料庫的建設(shè)無論是在日常教學(xué)中或者譯員翻譯中都有著積極的作用。但目前語料庫依舊處于研究、應(yīng)用、教學(xué)相互獨立的階段,想要語料庫有更好的應(yīng)用和發(fā)展需要更多人的關(guān)注和意見,如果學(xué)者和教師都能夠參與其中,將語料庫引入實際的課堂教學(xué)和翻譯現(xiàn)場,今后語料庫也將成為生活學(xué)習(xí)中便利的工具。