王 灝,郭建麗
(西北師范大學(xué) 外國(guó)語(yǔ)學(xué)院,甘肅 蘭州 730070)
國(guó)內(nèi)平行語(yǔ)料庫(kù)應(yīng)用現(xiàn)狀調(diào)查研究
——基于近十年CNKI期刊論文的數(shù)據(jù)分析
王 灝,郭建麗
(西北師范大學(xué) 外國(guó)語(yǔ)學(xué)院,甘肅 蘭州 730070)
將我國(guó)期刊全文數(shù)據(jù)庫(kù)中從2005年到2015年所出版的有關(guān)平行語(yǔ)料庫(kù)的學(xué)術(shù)論文作為研究樣本,分別以語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)為關(guān)鍵詞檢索了國(guó)內(nèi)核心期刊中有關(guān)平行語(yǔ)料庫(kù)的學(xué)術(shù)論文,利用對(duì)上述數(shù)據(jù)的分析,對(duì)國(guó)內(nèi)平行語(yǔ)料庫(kù)應(yīng)用現(xiàn)狀展開調(diào)查,找出近幾年國(guó)內(nèi)平行語(yǔ)料庫(kù)應(yīng)用的特點(diǎn)及存在的問題。
平行語(yǔ)料庫(kù);學(xué)術(shù)論文;應(yīng)用現(xiàn)狀
隨著計(jì)算機(jī)應(yīng)用技術(shù)的迅猛發(fā)展以及語(yǔ)料庫(kù)語(yǔ)言學(xué)的不斷壯大,“語(yǔ)料庫(kù)”(corpus或corpora[復(fù)])一詞逐漸受到越來(lái)越多的專家、學(xué)者的關(guān)注。真正意義上的語(yǔ)料庫(kù)是一個(gè)按照一定的采樣標(biāo)準(zhǔn)采集而來(lái)的、能夠代表一種語(yǔ)言或某種語(yǔ)言的一種變體或文類的電子文本集。(宋紅波等,2013)語(yǔ)料庫(kù)基于大量的真實(shí)語(yǔ)言數(shù)據(jù),極大地豐富了已有的研究方法,基于語(yǔ)料庫(kù)的實(shí)證研究也在逐年增加。平行語(yǔ)料庫(kù)是與電子信息技術(shù)結(jié)合而建立的平臺(tái),其對(duì)于語(yǔ)言和翻譯研究、外語(yǔ)教學(xué)、詞匯編纂以及信息檢索等用處很大,此外對(duì)一些以單語(yǔ)語(yǔ)料或者直覺為基礎(chǔ)所做的假設(shè)還可進(jìn)行考察與驗(yàn)證,因此其發(fā)展前景十分廣闊。它還有互相對(duì)應(yīng)的兩種語(yǔ)言,和語(yǔ)言對(duì)比研究聯(lián)系緊密,是語(yǔ)言對(duì)比研究中的主要數(shù)據(jù)來(lái)源;此外,由于其有對(duì)應(yīng)詞與對(duì)應(yīng)單詞,因此也是詞典編著者有效的數(shù)據(jù)來(lái)源之一;源語(yǔ)言與目標(biāo)語(yǔ)言相互對(duì)應(yīng)的特點(diǎn)也使其成為重要的翻譯教學(xué)與外語(yǔ)學(xué)習(xí)工具。
我國(guó)對(duì)于平行語(yǔ)料庫(kù)的研究并不十分深入,從全球第一個(gè)平行語(yǔ)料庫(kù)The Canadian Hansard Corpus(包括英、法語(yǔ)版本的加拿大議會(huì)辯論語(yǔ)料)創(chuàng)建至今也只有約20年的歷史。然而因?yàn)槠叫姓Z(yǔ)料庫(kù)在語(yǔ)言的對(duì)比研究、翻譯以及詞典編纂上有著不可估量的使用價(jià)值,因此一經(jīng)開發(fā)之后便快速發(fā)展。近十年左右,我國(guó)的平行語(yǔ)料庫(kù)也有了突破性進(jìn)展,目前建有的平行語(yǔ)料庫(kù)有英漢以及日漢等,比如北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所的漢英平行語(yǔ)料庫(kù)以及后來(lái)建成的英漢平行語(yǔ)料庫(kù),還有哈爾濱工業(yè)大學(xué)的英漢雙語(yǔ)語(yǔ)料庫(kù)。此外,我國(guó)近年來(lái)還創(chuàng)建了部分專門用語(yǔ)語(yǔ)料庫(kù),比如上海交通大學(xué)就建成了莎士比亞戲劇英漢平行語(yǔ)料庫(kù),燕山大學(xué)建成了《紅樓夢(mèng)》譯本平行語(yǔ)料庫(kù),還有紹興文理學(xué)院建成了魯迅小說(shuō)漢英平行語(yǔ)料庫(kù)等。上述語(yǔ)料庫(kù)由于專業(yè)性比較強(qiáng),且語(yǔ)料來(lái)源較少,范圍有限,因此適用于專業(yè)研究,而對(duì)于通用研究不適用。
本文通過在中國(guó)期刊全文數(shù)據(jù)庫(kù)中分別以語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)以及平行語(yǔ)料庫(kù)應(yīng)用為主題進(jìn)行檢索后發(fā)現(xiàn),相比較而言,以語(yǔ)料庫(kù)為主題的文章較多,而以平行語(yǔ)料庫(kù)和平行語(yǔ)料庫(kù)應(yīng)用為主題的文章較少,而發(fā)表在核心期刊的關(guān)于平行語(yǔ)料庫(kù)應(yīng)用的文章寥寥無(wú)幾。所以本文希望通過數(shù)據(jù)分析找出國(guó)內(nèi)平行語(yǔ)料庫(kù)應(yīng)用的特點(diǎn)及存在的問題,為以后平行語(yǔ)料庫(kù)創(chuàng)建提供參考價(jià)值。
本研究采用文獻(xiàn)檢索的方式,首先,通過在中國(guó)知網(wǎng)中以語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)為關(guān)鍵詞檢索出2005年至2015年所發(fā)表的學(xué)術(shù)論文,將其按照時(shí)間順序統(tǒng)計(jì)如圖1所示。
圖1 2005-2015歷年有關(guān)語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)研究的論文數(shù)量統(tǒng)計(jì)
其次,篩選出10種外語(yǔ)類研究的核心期刊,分別以語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)為關(guān)鍵詞進(jìn)行檢索,精確匹配出2005年至2015年發(fā)表在核心期刊的學(xué)術(shù)論文,并將其具體信息統(tǒng)計(jì)如圖2所示。
圖2 2005-2015歷年有關(guān)語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)研究的核心論文數(shù)量
首先,在中國(guó)期刊全文數(shù)據(jù)庫(kù)里以語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)為主題詞,對(duì)2005-2015年間全部期刊進(jìn)行檢索。然后還是以以上兩個(gè)詞為關(guān)鍵詞,對(duì)與語(yǔ)料庫(kù)相關(guān)的核心期刊(《外語(yǔ)界》《外語(yǔ)教學(xué)與研究》《中國(guó)翻譯》《外語(yǔ)電化教學(xué)》《現(xiàn)代外語(yǔ)》《外國(guó)語(yǔ)》《外語(yǔ)教學(xué)》《語(yǔ)言文字應(yīng)用》《當(dāng)代語(yǔ)言學(xué)》《上海翻譯》)進(jìn)行人工檢索,組成了此次研究的數(shù)據(jù)樣本。以論文發(fā)表的時(shí)間、所登期刊和論文主題為劃分依據(jù)將其進(jìn)行分類,從而得出了本文的統(tǒng)計(jì)結(jié)果。
統(tǒng)計(jì)數(shù)據(jù)顯示國(guó)內(nèi)關(guān)于平行語(yǔ)料庫(kù)的研究少之又少,而基于語(yǔ)料庫(kù)的研究?jī)?nèi)容卻非常豐富。筆者將檢索到的有關(guān)語(yǔ)料庫(kù)的論文分類后發(fā)現(xiàn)主要包括以下幾方面:(1)語(yǔ)料庫(kù)翻譯研究。廖七一(2000)、王克非(2006)深入探討了語(yǔ)料庫(kù)研究方法;王克非、黃立波(2008)對(duì)近20年來(lái)語(yǔ)料庫(kù)翻譯學(xué)的發(fā)展史與研究觀念進(jìn)行了綜合論述。(2)語(yǔ)料庫(kù)輔助教學(xué)研究。桂詩(shī)春等(2010)學(xué)者將海內(nèi)外的語(yǔ)料庫(kù)語(yǔ)言學(xué)進(jìn)行了整理歸納,并表示語(yǔ)料庫(kù)輔助外語(yǔ)教學(xué)將會(huì)成為將來(lái)外語(yǔ)教學(xué)的主要方向。(3)詞匯搭配研究。婁寶翠(2004)與李曉紅(2004)各自利用語(yǔ)料庫(kù)語(yǔ)言學(xué)的方法對(duì)health以及effect兩個(gè)詞語(yǔ)的搭配進(jìn)行了研究;何安平(2001)通過語(yǔ)料庫(kù)語(yǔ)言學(xué)就中國(guó)中學(xué)生的外語(yǔ)拼寫錯(cuò)誤展開了研討。(4)詞典編纂研究。在沒有語(yǔ)料庫(kù)語(yǔ)言學(xué)之前,中國(guó)詞典在編寫時(shí)一直都是沒有系統(tǒng)的依據(jù)。一直到了上個(gè)世紀(jì)70年代,辛克萊教授開創(chuàng)了COBULD 語(yǔ)料庫(kù),并通過詞語(yǔ)索引技術(shù)開展了大范圍調(diào)查,進(jìn)而為當(dāng)代詞典的編纂奠定了一定基礎(chǔ)。當(dāng)前,我國(guó)研究人員對(duì)語(yǔ)料庫(kù)的探索基本都集中在其對(duì)于詞典編纂的引導(dǎo)作用、以語(yǔ)料庫(kù)為基礎(chǔ)的詞典編寫方法以及詞典評(píng)價(jià)等。
通過上述分析可以看出,近十年間我國(guó)在平行語(yǔ)料庫(kù)上發(fā)展迅速,以前只能單純研究國(guó)外的語(yǔ)料庫(kù),但現(xiàn)在我國(guó)已有能力自行建立平行語(yǔ)料庫(kù),而且運(yùn)用到各個(gè)研究領(lǐng)域。與此同時(shí),在分析的過程中可以發(fā)現(xiàn)國(guó)內(nèi)平行語(yǔ)料庫(kù)的研究還是存在一些問題。
第一,語(yǔ)料庫(kù)還需進(jìn)一步地深入加工。通常,語(yǔ)料庫(kù)的建設(shè)與研究目標(biāo)合為一體,在加工標(biāo)注語(yǔ)料庫(kù)時(shí)也是基于預(yù)設(shè)研究目標(biāo)為基礎(chǔ)的,但是在創(chuàng)建大規(guī)模、綜合性以及多用途的平行語(yǔ)料庫(kù)時(shí)往往要考慮全面,標(biāo)注的信息要便于今后的持續(xù)性研究。從預(yù)期研究目的入手,依照具體研究對(duì)象設(shè)計(jì)軟件兼容的標(biāo)注符,再通過軟件編輯來(lái)批量賦碼。
第二,應(yīng)當(dāng)加強(qiáng)學(xué)科之間的溝通與合作。語(yǔ)料庫(kù)的發(fā)展與運(yùn)用離不開計(jì)算機(jī)技術(shù)的支持,在過去較長(zhǎng)一段時(shí)間里,人們?cè)谘芯空Z(yǔ)料庫(kù)時(shí)往往集中于計(jì)算機(jī)專業(yè)以及計(jì)算語(yǔ)言學(xué)專業(yè),對(duì)于技術(shù)性的研究要更為重視。但是近年來(lái),語(yǔ)料庫(kù)語(yǔ)言學(xué)的崛起將語(yǔ)言與翻譯研究很好的和計(jì)算機(jī)技術(shù)結(jié)合到一起,兩方面專業(yè)工作者的交流也不斷增多,語(yǔ)言研究者與翻譯研究者為計(jì)算機(jī)專業(yè)人員指出了新的研究方向,而計(jì)算機(jī)專業(yè)人士則為其研究提供技術(shù)輔助。
第三,語(yǔ)料庫(kù)研究領(lǐng)域還有待擴(kuò)展。就當(dāng)前而言,以平行語(yǔ)料庫(kù)為基礎(chǔ)的語(yǔ)言對(duì)比要就還不夠深入,翻譯研究也基本都是類比研究,以時(shí)代、譯者、翻譯內(nèi)容等為分類參數(shù)的研究要比較少見。??祁愓Z(yǔ)料庫(kù)的一對(duì)多模式是指一個(gè)原文的相應(yīng)譯文至少有兩種,這種模式也是其特色所在,不但能夠運(yùn)用到多語(yǔ)言轉(zhuǎn)換研究中,還可以進(jìn)行多種類比研究等。然而當(dāng)前這樣的研究還只局限在文學(xué)作品當(dāng)中,對(duì)于非文學(xué)作品,如政論以及新聞等文本的類似研究尚比較缺乏。在開發(fā)語(yǔ)料庫(kù)的過程中要不斷完善其翻譯研究方法,除了英漢語(yǔ)對(duì)比研究外,積極開發(fā)別的研究對(duì)象,創(chuàng)造全新研究方式,比如基于超大規(guī)模平行語(yǔ)料庫(kù)輔助下對(duì)翻譯語(yǔ)言進(jìn)行歷史變遷探究、翻譯語(yǔ)言和原創(chuàng)語(yǔ)言的歷時(shí)對(duì)照研究、各種翻譯方面的翻譯方法對(duì)比研究等。
首先可以預(yù)見的是,超級(jí)平行語(yǔ)料庫(kù)的建設(shè)是未來(lái)的必然趨勢(shì)。之所以說(shuō)“超級(jí)”,是因?yàn)槠洳坏珟?kù)存量巨大,并且還具有一定的跨度性。這個(gè)庫(kù)主要由人文、社會(huì)以及自然科學(xué)等眾多分庫(kù)組成,各個(gè)分支之間可以相互獨(dú)立又可以互相融合。人文類語(yǔ)料還可以進(jìn)一步劃分為文學(xué)、法律、歷史、哲學(xué)、宗教等子庫(kù);社會(huì)科學(xué)也可以劃分為文化、地理、旅游、考古、經(jīng)濟(jì)、政治等多個(gè)子庫(kù);自然科學(xué)則涵蓋生物、化學(xué)、物理、天文、醫(yī)藥等。各個(gè)語(yǔ)料庫(kù)在內(nèi)部還可以進(jìn)一步分類,在時(shí)間上也有一定的間隔,可實(shí)現(xiàn)歷時(shí)的對(duì)比與研究。如此一來(lái),語(yǔ)料庫(kù)的功能將更加強(qiáng)大,不但能夠用于各種學(xué)術(shù)性研究與實(shí)際應(yīng)用,還可以拓展語(yǔ)料庫(kù)翻譯研究的范圍。
其次,語(yǔ)料庫(kù)語(yǔ)言與翻譯研究都必須建立在語(yǔ)料的加工標(biāo)注研究基礎(chǔ)之上。信息技術(shù)的發(fā)展給翻譯研究帶來(lái)了很大的方便。對(duì)語(yǔ)料的加工不單單是運(yùn)行計(jì)算機(jī),而應(yīng)該有一定的語(yǔ)言學(xué)理論基礎(chǔ),在此基礎(chǔ)上才能做好翻譯研究。標(biāo)注是否深入恰當(dāng)對(duì)于將來(lái)的研究起了很大的決定作用,現(xiàn)在的自動(dòng)標(biāo)注是遠(yuǎn)遠(yuǎn)達(dá)不到要求的。
第三,積極設(shè)計(jì)新的軟件,建立完善的網(wǎng)絡(luò)平臺(tái)。語(yǔ)料庫(kù)本身是一種研究工具,但是創(chuàng)立語(yǔ)料庫(kù)也需要用先進(jìn)的工具。與別的國(guó)家進(jìn)行比較,我國(guó)在適用于漢英翻譯研究的有關(guān)軟件開發(fā)上還比較落后。因此,語(yǔ)料庫(kù)研究有關(guān)軟件的研發(fā)將會(huì)是未來(lái)語(yǔ)料庫(kù)翻譯研究的核心內(nèi)容之一。此外,建設(shè)語(yǔ)料庫(kù)的目的是為了方便理論研究與實(shí)際運(yùn)用,對(duì)于這兩方面的要求,大規(guī)模、綜合性以及多用途的國(guó)家級(jí)平行語(yǔ)料庫(kù)能夠很好的滿足。單從實(shí)際運(yùn)用上說(shuō),當(dāng)前的方法主要是將語(yǔ)料庫(kù)作為背后運(yùn)行的數(shù)據(jù)庫(kù)來(lái)建立網(wǎng)絡(luò)檢索平臺(tái)。檢索到的信息內(nèi)容是否完整,是否深入完全決定于數(shù)據(jù)庫(kù)的大小以及加工深度。但是當(dāng)前平臺(tái)只能夠提供簡(jiǎn)單的詞語(yǔ)、搭配等單一檢索,利用率較差。但是隨著將來(lái)語(yǔ)料標(biāo)注和加工技術(shù)的進(jìn)一步深入,檢索平臺(tái)必定能夠更加完善,提供更優(yōu)質(zhì)的服務(wù)。
歷經(jīng)多年的發(fā)展之后,我國(guó)的語(yǔ)料庫(kù)建設(shè)有了很大的進(jìn)展,并且在語(yǔ)料庫(kù)語(yǔ)言研究上也碩果累累,但是還是有一些不足之處,如:語(yǔ)料庫(kù)語(yǔ)言學(xué)研究領(lǐng)域較為單一,很多方面的研究還比較淺薄。語(yǔ)料庫(kù)語(yǔ)言學(xué)還需要不斷完善和發(fā)展,有關(guān)人員要繼續(xù)努力,研發(fā)出更為高效的語(yǔ)料庫(kù)處理軟件,為研究者提供有效支持。相信語(yǔ)料庫(kù)語(yǔ)言學(xué)未來(lái)會(huì)有更加美好的前景。
[1]桂詩(shī)春,等.語(yǔ)料庫(kù)語(yǔ)言學(xué)與中國(guó)外語(yǔ)教學(xué)[J].現(xiàn)代外語(yǔ),2010(11).
[2]何安平. 學(xué)生英語(yǔ)拼寫錯(cuò)誤分析[J]. 外語(yǔ)教學(xué)與研究, 2001(3).
[3]黃立波, 王克非. 翻譯普遍性研究反思[J].中國(guó)翻譯,2006(5).
[4]李曉紅. 基于語(yǔ)料庫(kù)的EFFECT搭配行為對(duì)比研究[J].外語(yǔ)教學(xué), 2004(6).
[5]婁寶翠. 英語(yǔ)常用詞搭配使用的對(duì)比:以health 為例[J]. 外語(yǔ)與外語(yǔ)教學(xué),2004(7).
[6]廖七一. 語(yǔ)料庫(kù)與翻譯研究[J]. 外語(yǔ)教學(xué)與研究,2000(5).
[7]宋紅波, 王雪利. 近十年國(guó)內(nèi)語(yǔ)料庫(kù)語(yǔ)言學(xué)研究綜述[J].山東外語(yǔ)教學(xué),2013(3).
Class No.:H030 Document Mark:A
(責(zé)任編輯:蔡雪嵐)
Investigation on the Application of Parallel Corpus —Based on CNKI Papers from 2005 to 2015
Wang Hao,Guo Jianli
(School of Foreign Languages and Literature, Northwest Normal University, Lanzhou, Gansu 730070,China)
In this paper, the academic papers about parallel corpus published from 2005 to 2015 in CNKI are used as the research samples. The corpus and the parallel corpus are used as the key words to retrieve the academic papers in the domestic core journals. By analyzing the above data, the author aims at investigating the application of domestic parallel corpus and finding out the characteristics of domestic parallel corpus and the existing problems.
parallel corpus; academic papers; application
王灝,副教授,碩士生導(dǎo)師,西北師范大學(xué)外國(guó)語(yǔ)學(xué)院。 郭建麗,在讀碩士,西北師范大學(xué)外國(guó)語(yǔ)學(xué)院。
西北師范大學(xué)2014年度青年教師科研能力提升計(jì)劃項(xiàng)目(人文社科類)“構(gòu)建甘肅地方性法規(guī)翻譯平行語(yǔ)料庫(kù)的可行性研究”(編號(hào):SKQNYB14014)。
1672-6758(2017)07-0146-4
H030
A
黑龍江工業(yè)學(xué)院學(xué)報(bào)(綜合版)2017年7期