孫海燕,呂 靜
(河南師范大學(xué)外國語學(xué)院,河南新鄉(xiāng)453007)
中國英語語料庫的建庫與應(yīng)用
孫海燕,呂 靜
(河南師范大學(xué)外國語學(xué)院,河南新鄉(xiāng)453007)
英語的全球化和本土化是語言學(xué)研究領(lǐng)域的一項(xiàng)重要課題,中國英語語料庫的建設(shè)可以使研究者深入地分析中國英語的特點(diǎn)。語料庫標(biāo)注是實(shí)現(xiàn)原始語料機(jī)讀化的關(guān)鍵環(huán)節(jié)。本文討論了中國英語的概念,介紹了中國英語語料庫的標(biāo)注方法,闡述了其在翻譯和英語教學(xué)中的應(yīng)用。
本土化;中國英語語料庫;標(biāo)注;應(yīng)用
隨著英語的迅速國際化,英語在中國的本土化也在加深。學(xué)術(shù)界開始對與世界英語理論有聯(lián)系的中國英語進(jìn)行了探討,不少學(xué)者論證了中國英語存在的客觀事實(shí),討論了中國英語這一概念的理論意義、教學(xué)啟示和社會(huì)價(jià)值。中國英語不僅有益于中華文明和文化傳播、彌補(bǔ)漢語在世界范圍影響廣度不大這一缺憾,而且還具有凝聚社團(tuán)成員的功能,承載著重要的社會(huì)意義。近年來,描述中國英語的本土化在語言各個(gè)層面(語音、詞匯、語法和語篇)的特征表現(xiàn)的研究方興未艾,但在論述中所用舉例法無法提供令人折服的數(shù)據(jù),也無法探究現(xiàn)象形成的深層次原因。語料庫的蓬勃發(fā)展為中國英語深入系統(tǒng)的研究提供了有力的工具。國際學(xué)術(shù)界已經(jīng)建立了各國英語變體的語料庫,但沒有包括英語使用者最多的中國英語變體。李文中教授主持的國家社科基金項(xiàng)目“基于語料庫的中國英語本土化研究”,建設(shè)中國英語語料庫 (China English Corpus,簡稱CEC),可以很好地填補(bǔ)中國英語研究的空白。在大型語料庫所提供的豐富語料和先進(jìn)技術(shù)的基礎(chǔ)上,我們可以更好地了解中國英語的特點(diǎn),并進(jìn)一步將研究成果應(yīng)用于英語教學(xué)之中。
英語的全球化是不可否認(rèn)的現(xiàn)實(shí),然而另一個(gè)現(xiàn)實(shí)同樣不可否認(rèn),那就是英語的本土化。英語的本土化就是英語與其他語言和文化長期接觸而發(fā)生變異的產(chǎn)物。隨著各國社會(huì)經(jīng)濟(jì)的全球化,各種帶有地域色彩的英語不斷發(fā)展,在對外交際中發(fā)揮越來越重要的作用。英語的“唯一標(biāo)準(zhǔn)”和“多元標(biāo)準(zhǔn)”成為英語研究界爭論的焦點(diǎn)問題之一。主張“唯一標(biāo)準(zhǔn)”的學(xué)者認(rèn)為各種“英語變體”均應(yīng)以英國英語或美國英語為標(biāo)準(zhǔn)進(jìn)行自我匡正。該派的代表人物是英國著名語言學(xué)家 Randolph Quirk?!岸嘣獦?biāo)準(zhǔn)”的倡導(dǎo)者是美國語言學(xué)家B.Kachru,認(rèn)為應(yīng)對“各種英語”予以認(rèn)可,并應(yīng)對其輪廓和文化導(dǎo)入等由英語的學(xué)習(xí)和使用所引發(fā)的一系列問題進(jìn)行全方位探討[1]。
葛傳椝首次將“中國英語”作為一個(gè)嚴(yán)肅的概念提出,指出 China English(中國英語)和 Chinese English(中式英語)的區(qū)別,認(rèn)為“各國有各國的情況。就我國而論,不論在舊中國或新中國,講或?qū)懹⒄Z時(shí)都有些我國所特有的東西需要表達(dá)”[2],如Four Books(四書)、eight-legged essay(八股文)、May Fourth Movement(五四運(yùn)動(dòng))、xiucai(秀才)、Mr.Science(賽先生)、ideological remoulding(思想改造)和four modernizations(四個(gè)現(xiàn)代化)等。他對中國英語提出了如下觀點(diǎn):一是中國英語屬客觀存在,是一種事實(shí);二是中國英語是專門用來表達(dá)中國特有的事物的詞匯;三是中國英語常常會(huì)引起交際上的困難,但經(jīng)過解釋依然可以理解;四是中國英語的使用不排除中國人使用英語的前提,即依照英語民族的習(xí)慣用法。汪榕培給中國英語下的定義是:中國人在中國本土上使用的,以標(biāo)準(zhǔn)英語為核心、具有中國特點(diǎn)的英語[3]。1993年,李文中發(fā)表《中國英語和中式英語》一文,建議將“中國英語”定義為:“以規(guī)范英語為核心,表達(dá)中國社會(huì)文化諸領(lǐng)域特有事物,不受母語干擾,通過音譯、譯借及語義再生諸手段進(jìn)入英語交際,具有中國特點(diǎn)的詞匯、句式和語篇。”[4]主張稱“中國英語”為China English。而中式英語是英語學(xué)習(xí)者在學(xué)習(xí)過程中因英語能力的欠缺和漢語母語的干擾而造成的不合英語文化習(xí)慣的錯(cuò)誤英語,是錯(cuò)誤分析的對象。
有些學(xué)者對于中國英語的研究表示懷疑,認(rèn)為中國英語和中國式英語除了在使用目的上有所不同外,并不存在本質(zhì)區(qū)別,提倡中國英語容易引起理論和實(shí)踐上的混亂,影響國際交際效果。孫驪認(rèn)為將在中國使用的英語看作是語言學(xué)上的一種變體條件尚未成熟[5]。謝之君指出中國英語和中式英語都存在漢語干擾,兩者之間并沒有很大差異[6]。邱立中、寧全新認(rèn)為“目前提倡中國英語既不實(shí)際也無必要”,不利于外語教學(xué)現(xiàn)狀的改善,會(huì)進(jìn)一步刺激中介語的流行與石化,影響我國對外政治、經(jīng)濟(jì)、文化的交流[7]。
近年來,對中國英語持肯定態(tài)度的觀點(diǎn)明顯占據(jù)了上風(fēng),這在某種程度上是因?yàn)樯鐣?huì)語言學(xué)理論的支持。在討論地域英語變體時(shí),連續(xù)統(tǒng)一體是英語世界化理論研究者們普遍使用的分析手段。中國的學(xué)者也注意到這種研究對中國英語研究的指導(dǎo)意義。從語言自身發(fā)展規(guī)律來看,每個(gè)國家和地區(qū)都有其獨(dú)特的本土文化、語言習(xí)慣和思維模式,作為反映現(xiàn)實(shí)生活的語言,有些具有特定文化內(nèi)涵的概念在英語中沒有很好的表達(dá)方式,因而借用了當(dāng)?shù)卣Z言的一些現(xiàn)象。而且,語言是思維的一部分,中國英語的特色體現(xiàn)了中國人的思維模式和中國的特有事物,中國英語的特征在語音、詞匯、句式、語篇等層面上都非常明顯。盡管許多學(xué)者都承認(rèn)中國英語的存在,并開始探討中國英語在語言各個(gè)層面表現(xiàn)的特征,但在研究中缺乏豐富的數(shù)據(jù)材料,理論分析不夠系統(tǒng),而大型語料庫的建設(shè)可以彌補(bǔ)以往研究的不足,為中國英語深入系統(tǒng)的研究提供有力的支持。
在河南師范大學(xué)李文中教授的帶領(lǐng)下,經(jīng)過對建庫原則和方案的反復(fù)論證和修改,中國英語語料庫正處于建設(shè)之中。中國英語語料庫的建設(shè),可以為我們研究中國英語的特點(diǎn)提供一個(gè)很好的平臺,使我們能夠在大量語料的基礎(chǔ)上分析中國英語各個(gè)層面的特征,并探討其應(yīng)用價(jià)值。這里我們簡單介紹一下中國英語語料庫的建庫原則和標(biāo)注方案,以期為語料庫使用者提供有用的信息。按照語料來源,我們將語料分為以下幾類:報(bào)紙、雜志、學(xué)術(shù)期刊、畢業(yè)論文、文學(xué)作品、政府文件、網(wǎng)絡(luò)、其他。在進(jìn)行建庫時(shí),我們遵循盡量保持語料原貌的原則,在輸入文本的同時(shí)也盡可能地把材料中的非文本信息錄入庫中,如網(wǎng)頁中的各種圖像等,研究者可以從語料庫中提取原文本。為了提高語料庫的利用價(jià)值,我們對語料進(jìn)行了各種信息的標(biāo)注,即把表示各種語言特征的附碼添加到相應(yīng)的語言成分上,以便于計(jì)算機(jī)對特定語料進(jìn)行識別和提取。中國英語語料庫參考了國內(nèi)外語料庫標(biāo)注方面的有關(guān)成果,在附碼時(shí)主要遵循以下原則:(1)所有語料的附碼可以刪除,即加工后的“熟語料”能夠恢復(fù)到加工前的“生語料”狀態(tài)。(2)語料附碼所采用的方案便于操作和修改。(3)保證各子語料庫前后附碼的一致性和整個(gè)語料庫各組成部分附碼的一致性。(4)充分考慮標(biāo)注系統(tǒng)的詳細(xì)程度和標(biāo)注方案的可行性,爭取達(dá)到二者之間的最佳結(jié)合點(diǎn)。為了方便使用者日后使用和提取語料,我們針對整個(gè)語料庫以及各個(gè)子庫編寫了詳細(xì)的附碼標(biāo)注方案和使用手冊。
中國英語語料庫(CEC)的標(biāo)注采用XML標(biāo)準(zhǔn)進(jìn)行標(biāo)記,其標(biāo)注信息共有四層:第一層為元元信息,即各組成部分語料的全局信息;第二層為語料的文獻(xiàn)信息,參照APA標(biāo)準(zhǔn),說明語料文本的基本屬類信息;第三層為語料文本的結(jié)構(gòu)和形態(tài)信息;第四層信息為詞性信息。第一、二層信息放置在語料庫文件的頭部,為頭部信息;第三、四層信息嵌入語料文本中,為文本標(biāo)注信息。最外層標(biāo)簽為〈cec〉,所有語料庫文檔以該標(biāo)簽開始,并以該標(biāo)簽結(jié)束?!碿ec〉的下一層標(biāo)簽有兩層平行標(biāo)簽,即文本頭部信息(〈text_head〉)和文本正文(〈text〉)。文獻(xiàn)信息標(biāo)簽包含詳細(xì)文本屬類信息,參照APA分類標(biāo)準(zhǔn)設(shè)置標(biāo)簽層,其中包括:作者、文獻(xiàn)標(biāo)題、文件發(fā)布單位、出版時(shí)間等信息。在語料庫建成后,為了對語料進(jìn)行詞匯層面上的研究,我們采用傳統(tǒng)的方法對所有文本進(jìn)行自動(dòng)詞性附碼。這些標(biāo)注的意義在于,它不但方便使用者提取語料信息,還可以增加語料的重復(fù)使用性和增強(qiáng)語料庫的多功能性。
中國英語研究的重要目的之一就是應(yīng)用,面向應(yīng)用的本體研究一方面能夠拓寬理論研究的領(lǐng)域,另一方面也具有方法論意義。中國英語研究以本體研究為基點(diǎn),對翻譯研究、英語教學(xué)、教材編寫等方面有很大啟示意義。目前翻譯界普遍認(rèn)為,在翻譯中國特有事物時(shí),如果沒有對應(yīng)的英語表達(dá)方式,可以表達(dá)成中國英語。由于文化的明顯差異,中國人用英語表達(dá)中國的特有現(xiàn)象時(shí),不可避免地要運(yùn)用一些帶有中國特色的新詞,如:spiritual civilization (精神文明),Xiaokang society(小康社會(huì))及iron rice bowl(鐵飯碗)。隨著時(shí)代的發(fā)展,大量反映中國國情以及相關(guān)文化的詞匯和表達(dá)法不斷涌現(xiàn),它們具有鮮明的中國特色和時(shí)代性,準(zhǔn)確合適地翻譯這批新詞是一項(xiàng)極具開拓性的工作。中國英語可以用來表達(dá)中國特有的文化內(nèi)涵的概念,其翻譯的主要手段是音譯、譯借和語義再生。漢英翻譯中,可以運(yùn)用異化譯法,將文化空缺詞譯成“中國英語”。中國英語語料庫的建設(shè),可以為我們解決在翻譯過程中如何翻譯具有中國特色的詞匯問題提供有益的參考。
在英語教學(xué)方面,我們應(yīng)該認(rèn)真思考中國英語教學(xué)的目標(biāo)、教材和教法,既重視對外國文化的了解,又注重對本土文化的介紹。我們的教學(xué)目標(biāo)應(yīng)該是傳授學(xué)生多元的文化,這樣不僅能豐富我們的語言和文化,也能促進(jìn)我們和他人之間的相互了解、交流。在中國長期以來,英語教師的任務(wù)就是要把英語所承載的文化灌輸給學(xué)生,而忽視自己的文化。然而,這種單一文化的傳授已不再適合當(dāng)今這個(gè)時(shí)代的英語教學(xué)。因?yàn)槲覀儗τ⒄Z的需求已經(jīng)發(fā)生改變,在這個(gè)全球一體化的時(shí)代,單一地學(xué)習(xí)英、美國家的文化已經(jīng)不足以使我們具有很好的競爭力。我們要適應(yīng)社會(huì)的變化,調(diào)整英語教學(xué)的教材和教法。在材料選擇上,教材不應(yīng)該只選擇來自英美國家的文章,而應(yīng)該放寬選擇范圍,體現(xiàn)英語全球化的特點(diǎn)。因此,在英語課程教材編寫方面,應(yīng)增加一些介紹中國文化特色的內(nèi)容,使外國人了解中國的特點(diǎn)。中國英語語料庫的建設(shè)可以為教材編寫提供大量素材,教材編寫者可以從中選取有代表性的材料,以增加課本的實(shí)用性。在教學(xué)實(shí)踐中,應(yīng)聯(lián)系中國的社會(huì)現(xiàn)實(shí),重視身邊現(xiàn)象的英語表述。綜上所述,中國英語研究給英語教學(xué)帶來了新的研究課題,對英語教學(xué)具有宏觀的指導(dǎo)作用,對英語課程教材建設(shè)和教學(xué)實(shí)踐有著積極的意義。
隨著中國對外開放的深入和中國經(jīng)濟(jì)的進(jìn)一步發(fā)展,中國英語在世界英語中的地位會(huì)進(jìn)一步提高。中國英語理論需要進(jìn)一步系統(tǒng)化和整合,中國英語各層面的研究還有待加強(qiáng),其性質(zhì)、目標(biāo)、研究對象和研究方法應(yīng)該更加清晰。我們既要開展對中國英語語言和表達(dá)層次的研究,也要注意探究現(xiàn)象形成的深層次原因。語言的發(fā)展與社會(huì)生活的變化是密不可分的,中國英語作為一種語言變體,也是社會(huì)語言學(xué)研究的重要對象??隙ㄖ袊⒄Z的存在,對英語教學(xué)的目標(biāo)、教學(xué)方法和教材編寫等方面也有較大的影響。我們認(rèn)為,中國英語教學(xué)的目的應(yīng)該是使學(xué)生掌握作為全球通用語的英語,以適應(yīng)與不同民族、不同文化之間的交往。它既包括對外國文化的了解,也包括對中國文化的了解。中國英語語料庫的建設(shè),使我們可以采用更嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)方法,分析中國英語各個(gè)層面的特點(diǎn),了解中國人使用英語的規(guī)律,有助于我們科學(xué)地探究中國英語形成的深層次原因。正確認(rèn)識和研究英語在中國的本土化有助于世界英語理論的完善,有助于國際社會(huì)了解中國。
[1]杜瑞清,姜亞軍.近二十年“中國英語”研究述評[J].外語教學(xué)與研究,2001(1).
[2]葛傳椝.漫談?dòng)蓾h譯英問題[J].翻譯通訊,1980(2).
[3]汪榕培.中國英語是客觀存在[J].解放軍外語學(xué)院學(xué)報(bào),1991(1).
[4]李文中.中國英語和中式英語[J].外語教學(xué)與研究,1993(4).
[5]孫驪.英語國別變體的研究和英語在中國[J].外國語,1989(2).
[6]謝之君.中國英語:跨文化語言交際中的干擾性變體[J].現(xiàn)代外語,1995(4).
[7]邱立新,寧全新.“中國英語”質(zhì)疑——與杜瑞清、姜亞軍先生商榷[J].外語教學(xué),2002(6).
H312
A
1000-2359(2010)01-202192-03
孫海燕(1975-),女,河南焦作人,河南師范大學(xué)外國語學(xué)院副教授,文學(xué)博士,研究方向?yàn)閼?yīng)用語言學(xué)。
國家社科基金項(xiàng)目(07BYY022);河南省人文社會(huì)科學(xué)研究項(xiàng)目(2009-ZS-135)
2009-09-20