【摘要】當(dāng)今世界,信息技術(shù)突飛猛進(jìn),日新月異的大數(shù)據(jù)方法和人工智能已悄然滲入人類(lèi)活動(dòng)的各個(gè)角落。在此背景下,將信息技術(shù)用于語(yǔ)言研究是必然趨勢(shì),語(yǔ)料庫(kù)語(yǔ)言學(xué)作為現(xiàn)代語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)與教育學(xué)跨學(xué)科互動(dòng)的新興學(xué)派,已經(jīng)進(jìn)入了當(dāng)今科研的主流,為語(yǔ)言教學(xué)提供了大量?jī)?yōu)質(zhì)教學(xué)資源。但就語(yǔ)言研究這一學(xué)術(shù)活動(dòng)而言,如何有效地將信息技術(shù)的產(chǎn)物——語(yǔ)料庫(kù)運(yùn)用到英語(yǔ)教學(xué)中是極具挑戰(zhàn)性的問(wèn)題。本文針對(duì)語(yǔ)料庫(kù)在外貿(mào)英語(yǔ)教學(xué)中的構(gòu)建及應(yīng)用進(jìn)行分析,探討語(yǔ)料庫(kù)在外語(yǔ)教學(xué)中的獨(dú)特功能,以促進(jìn)外貿(mào)英語(yǔ)教學(xué)的高質(zhì)量發(fā)展。
【關(guān)鍵詞】語(yǔ)料庫(kù);檢索;語(yǔ)料加工;英語(yǔ)教學(xué)
【作者簡(jiǎn)介】王梅笑,南陽(yáng)廣播電視大學(xué)。
【基金項(xiàng)目】本文系河南省2021年科研發(fā)展計(jì)劃課題“基于深度學(xué)習(xí)的河南省特色外貿(mào)行業(yè)開(kāi)放式漢英雙語(yǔ)語(yǔ)料庫(kù)建設(shè)及應(yīng)用研究”(課題編號(hào):212400410453)。
隨著國(guó)家對(duì)外開(kāi)放、信息技術(shù)發(fā)展,社會(huì)對(duì)專(zhuān)業(yè)外貿(mào)復(fù)合型應(yīng)用人才的需求日益增加,為加強(qiáng)對(duì)外貿(mào)實(shí)用性人才的培養(yǎng),更好地服務(wù)當(dāng)?shù)亟?jīng)濟(jì)發(fā)展,各高職院校加大了對(duì)外貿(mào)英語(yǔ)教學(xué)的投入,利用語(yǔ)料庫(kù)進(jìn)行外貿(mào)英語(yǔ)課堂教學(xué)也逐漸被越來(lái)越多的教師接受,可以說(shuō)語(yǔ)料庫(kù)構(gòu)建及應(yīng)用是未來(lái)語(yǔ)言學(xué)習(xí)和研究的一種趨勢(shì),能夠極大地提高學(xué)習(xí)效率和教學(xué)質(zhì)量。
語(yǔ)料庫(kù)是指按照一定的語(yǔ)言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語(yǔ)言運(yùn)用文本或話(huà)語(yǔ)片段而建成的具有一定容量的大型電子文庫(kù)。語(yǔ)料庫(kù)中的語(yǔ)言是真實(shí)使用的語(yǔ)言實(shí)例,如實(shí)地反映了語(yǔ)言現(xiàn)象,克服了“坐在扶手椅的語(yǔ)言學(xué)家”憑借自己頭腦里的語(yǔ)言直覺(jué)和智慧,通過(guò)主觀臆斷來(lái)撰寫(xiě)語(yǔ)言規(guī)范的不足(何安平,2017)。所以,“語(yǔ)料庫(kù)的出現(xiàn)不僅標(biāo)志著語(yǔ)言研究手段的技術(shù)進(jìn)步,而且還標(biāo)志著語(yǔ)言研究思想的重大轉(zhuǎn)變”(于連江,2004)。
由于語(yǔ)料規(guī)模大、話(huà)題和語(yǔ)境種類(lèi)繁多、標(biāo)注體系復(fù)雜等原因,且多數(shù)外貿(mào)英語(yǔ)術(shù)語(yǔ)和通用英語(yǔ)詞匯有重合,但在不同語(yǔ)境中,意思大相徑庭,查找起來(lái)費(fèi)時(shí)費(fèi)力,要想解決這個(gè)問(wèn)題,除了平時(shí)大量閱讀,在具體語(yǔ)境中體會(huì)單詞的含義、語(yǔ)域、感情色彩外,可以適當(dāng)運(yùn)用一些權(quán)威詞典和語(yǔ)料庫(kù),幫助我們更加準(zhǔn)確地領(lǐng)會(huì)單詞、句子的意思及在不同語(yǔ)境中的用法。因此,有必要在外貿(mào)英語(yǔ)教學(xué)中構(gòu)建小型專(zhuān)門(mén)外貿(mào)平行語(yǔ)料庫(kù),以便提高外貿(mào)英語(yǔ)教學(xué)質(zhì)量和學(xué)習(xí)效率。
一、外貿(mào)中英雙語(yǔ)平行語(yǔ)料庫(kù)的建構(gòu)
語(yǔ)料的采集。在進(jìn)行語(yǔ)料采集時(shí),需要考慮兩個(gè)因素:一是原始語(yǔ)料本身的質(zhì)量,二是語(yǔ)料庫(kù)的應(yīng)用目標(biāo)。語(yǔ)料的質(zhì)量主要就其語(yǔ)言質(zhì)量、翻譯質(zhì)量以及語(yǔ)料保存的規(guī)范性而言(柏曉靜,2002)。原始語(yǔ)料的收集是一項(xiàng)較為復(fù)雜且繁重的工作,其中包括對(duì)該語(yǔ)料庫(kù)規(guī)模的設(shè)計(jì),對(duì)不同類(lèi)型語(yǔ)料的分類(lèi),對(duì)樣本大小的明確,通過(guò)實(shí)證調(diào)查對(duì)原始語(yǔ)料及目標(biāo)語(yǔ)料資源的收集,劃分標(biāo)注標(biāo)準(zhǔn)(包括調(diào)查語(yǔ)料使用頻率的統(tǒng)計(jì)、是否使用該原始語(yǔ)料的評(píng)估等)。同時(shí)要將語(yǔ)料的代表性、平衡性、一致性、標(biāo)簽性和描述元語(yǔ)言等納入考慮范疇。
1. 語(yǔ)料分庫(kù)類(lèi)型,在把握定性定量的標(biāo)準(zhǔn)下通過(guò)調(diào)查分層抽樣,在遵循平衡原則下更加關(guān)注應(yīng)用目標(biāo),即是否高頻被外貿(mào)行業(yè)使用,收集高質(zhì)量具有代表性的有效語(yǔ)料。語(yǔ)料素材主要來(lái)源有三個(gè)方面:語(yǔ)料大部分從在線語(yǔ)料庫(kù)下載,通過(guò)檢索將外貿(mào)術(shù)語(yǔ)提取到語(yǔ)料庫(kù);人工錄入外貿(mào)專(zhuān)業(yè)術(shù)語(yǔ)詞典;語(yǔ)料來(lái)自實(shí)際外貿(mào)活動(dòng),包括文本和口語(yǔ),語(yǔ)料來(lái)源不限于口頭采訪、文本、問(wèn)卷等形式(原始語(yǔ)料語(yǔ)種可為中文或英文)。
2. 語(yǔ)料的保存和分類(lèi)。通過(guò)對(duì)前期語(yǔ)料的收集,將未分析處理的原始語(yǔ)料按照分庫(kù)類(lèi)型保存至保密性高的網(wǎng)絡(luò)云盤(pán)和大容量的本地存儲(chǔ)設(shè)備,保存方式按照相關(guān)約定設(shè)置為PDF和MASK兩個(gè)版本文件(分庫(kù)標(biāo)準(zhǔn)主要從語(yǔ)料來(lái)源行業(yè)、位于供應(yīng)鏈的所屬環(huán)節(jié)、常用語(yǔ)境范圍等三個(gè)框架進(jìn)行分類(lèi),每個(gè)語(yǔ)料在不同框架內(nèi)可重復(fù)收錄處理)。
二、語(yǔ)料加工
1. 擬采用雙語(yǔ)對(duì)齊技術(shù),通過(guò)互聯(lián)網(wǎng)、相關(guān)文本、現(xiàn)有語(yǔ)料庫(kù)以及通過(guò)對(duì)以英語(yǔ)為母語(yǔ)的外貿(mào)行業(yè)從業(yè)人員的訪問(wèn)中轉(zhuǎn)譯,對(duì)收集到的原始語(yǔ)料進(jìn)行對(duì)齊處理得到目標(biāo)語(yǔ)料。每個(gè)雙語(yǔ)語(yǔ)料的對(duì)齊工作應(yīng)包括但并不僅限于對(duì)漢語(yǔ)部分進(jìn)行切詞、詞性標(biāo)注及注音,對(duì)英語(yǔ)語(yǔ)料進(jìn)行分詞、形態(tài)還原和詞性標(biāo)注。該語(yǔ)料常用于語(yǔ)境,使用頻率較高的中英文例句,部分語(yǔ)料在中外兩種經(jīng)濟(jì)活動(dòng)中的使用區(qū)別。
2. 擬借鑒國(guó)內(nèi)較成熟的雙語(yǔ)語(yǔ)料庫(kù)編碼體系,例如北京大學(xué)漢英雙語(yǔ)語(yǔ)料庫(kù)所采用的XML編碼,對(duì)語(yǔ)料進(jìn)行描述和標(biāo)記。將編碼描述后的內(nèi)容上傳至服務(wù)器,按照框架和所在框架內(nèi)的類(lèi)別進(jìn)行分庫(kù)(XML語(yǔ)言作為編碼的元語(yǔ)言是目前編碼體系中最容易獲得廣泛軟件支持的編碼語(yǔ)言)。
3. 擬使用穩(wěn)定性較高的語(yǔ)料庫(kù)編撰軟件,如Concapp04、Antconc等對(duì)編碼后的加工語(yǔ)料進(jìn)行輸錄,主要提供語(yǔ)料檢索功能。
三、平行語(yǔ)料庫(kù)在外貿(mào)英語(yǔ)教學(xué)中的應(yīng)用
外貿(mào)英語(yǔ)語(yǔ)料規(guī)模大、話(huà)題和語(yǔ)境種類(lèi)繁多,而且多數(shù)外貿(mào)英語(yǔ)術(shù)語(yǔ)與普通詞匯相重合。如圖1(語(yǔ)料來(lái)源COCA)所示,單詞“order”在英語(yǔ)中一般是“命令”“秩序”等意思,但在外貿(mào)術(shù)語(yǔ)中意為“訂單”“訂購(gòu)”,在通用語(yǔ)料庫(kù)中很難快速準(zhǔn)確地查到目標(biāo)語(yǔ),加之外貿(mào)標(biāo)注體系復(fù)雜等原因,通用語(yǔ)料庫(kù)往往難以直接走進(jìn)課堂教學(xué)。正如任何語(yǔ)言教學(xué)理念和教育技術(shù)的實(shí)施和應(yīng)用都必須結(jié)合日常教學(xué)實(shí)際情況一樣,語(yǔ)料庫(kù)的資源和技術(shù)要走進(jìn)課堂教學(xué)也必須經(jīng)歷一番教學(xué)加工(McCarthy,2006)。教學(xué)加工的定義可歸納為:將大型語(yǔ)料庫(kù)的語(yǔ)料、調(diào)查結(jié)果乃至語(yǔ)料庫(kù)技術(shù)轉(zhuǎn)化為有利于實(shí)現(xiàn)日常語(yǔ)言教學(xué)目標(biāo)的學(xué)習(xí)資源和教學(xué)手段的加工過(guò)程(何安平,2017)。其過(guò)程有兩個(gè)層面:一是對(duì)語(yǔ)料庫(kù)作為教學(xué)資源的加工,側(cè)重于如何讓語(yǔ)料庫(kù)輔助教學(xué)設(shè)計(jì);二是對(duì)語(yǔ)料庫(kù)作為教學(xué)手段的加工,側(cè)重于語(yǔ)料庫(kù)輔助課堂教學(xué)的實(shí)施技術(shù)和教學(xué)效果評(píng)估等,這里主要分析前者在教學(xué)中的應(yīng)用。
1. 語(yǔ)料庫(kù)輔助的語(yǔ)音教學(xué)。(1)探究單詞的發(fā)音和拼寫(xiě)規(guī)律。使用通配符“*”和“?”來(lái)批量提取共享某些字母的單詞或某類(lèi)音節(jié)結(jié)構(gòu),運(yùn)用不同顏色凸顯字母而非單詞輔助英語(yǔ)發(fā)音規(guī)律或拼寫(xiě)規(guī)則的教學(xué)(何安平,2017)。如圖2(語(yǔ)料來(lái)自COCA)中的單音節(jié)詞拼寫(xiě)的規(guī)律,即都在元音字母i后面有一個(gè)輔音字母再加一個(gè)不發(fā)音的e,這個(gè)結(jié)構(gòu)中元音字母通常發(fā)其字母音。但也有少數(shù)單詞live, give中的元音字母并沒(méi)有發(fā)其字母音。而且在觀察檢索結(jié)果的過(guò)程中不斷發(fā)現(xiàn)不合乎規(guī)則的新問(wèn)題,如where, here, are等,從而設(shè)置新一輪檢索,繼而發(fā)現(xiàn)新的規(guī)律。這種方法有利于將已有將新學(xué)到的語(yǔ)音知識(shí)應(yīng)用于批量的而非單個(gè)的語(yǔ)言事實(shí)。
2. 語(yǔ)料庫(kù)輔助的詞匯教學(xué)。(1)辨析同形異義詞。以單詞like為例,如圖3所示的上傳like,提取所有帶like的例句,發(fā)現(xiàn)該圖顯示這批高頻動(dòng)詞基本屬于感官類(lèi)動(dòng)詞,如feel, look, smell, taste, sound, seem等,主要用于表達(dá)“感覺(jué)像……”這類(lèi)意義,這里like用作介詞,意思是“像……”。圖4中,通過(guò)檢索獲得like前面的單詞是人稱(chēng)代詞,如you, I, we, 可以得出like 在人稱(chēng)代詞后面用作動(dòng)詞,表示“喜歡”。學(xué)生可以通過(guò)“l(fā)ike”在語(yǔ)料庫(kù)不同句子中的表達(dá)快速準(zhǔn)確掌握一詞多義的用法。除了詞義辨析外,還可以通過(guò)語(yǔ)料庫(kù)學(xué)習(xí)構(gòu)詞法、詞語(yǔ)搭配等,這里不再一一贅述,教師可以通過(guò)語(yǔ)料庫(kù)清晰系統(tǒng)地進(jìn)行詞匯歸納講解。
當(dāng)然,語(yǔ)料庫(kù)除了可以輔助語(yǔ)音、詞匯教學(xué)外,還可以輔助閱讀、翻譯及寫(xiě)作等教學(xué),只是檢索錄入的工作量很大,本語(yǔ)料庫(kù)建設(shè)的主要目的是幫助學(xué)生快速準(zhǔn)確查找外貿(mào)專(zhuān)業(yè)術(shù)語(yǔ)及用法,語(yǔ)料量有限,僅供內(nèi)部使用。
四、結(jié)語(yǔ)
小型英漢雙語(yǔ)平行語(yǔ)料庫(kù)在英語(yǔ)教學(xué)中的應(yīng)用,不僅能夠輔助教師在課堂上進(jìn)行語(yǔ)音、詞匯及翻譯寫(xiě)作等全方位教學(xué),幫助教師歸納知識(shí)點(diǎn),增強(qiáng)了知識(shí)的系統(tǒng)性、邏輯性,使學(xué)生更容易理解接受,而且為學(xué)生提供了人機(jī)互動(dòng)的學(xué)習(xí)工具,大大縮短了檢索信息的時(shí)間,提高了學(xué)習(xí)效率,同時(shí)也培養(yǎng)了學(xué)生的自主學(xué)習(xí)能力。可以說(shuō),語(yǔ)料庫(kù)在英語(yǔ)課堂上的應(yīng)用,有效提高了英語(yǔ)教學(xué)質(zhì)量,相信隨著信息技術(shù)和人工智能的發(fā)展,語(yǔ)料庫(kù)在英語(yǔ)教學(xué)中的應(yīng)用會(huì)更加廣泛,教學(xué)效果也會(huì)更加突出。
參考文獻(xiàn):
[1]何安平.語(yǔ)料庫(kù)輔助英語(yǔ)教學(xué)入門(mén)[M].北京:外語(yǔ)教學(xué)與研究出版社,2017.
[2]楊惠中.語(yǔ)料庫(kù)語(yǔ)言學(xué)導(dǎo)論[M].上海:上海外語(yǔ)教育出版社,2002.
[3]于連江.基于語(yǔ)料庫(kù)的翻譯教學(xué)研究[J].外語(yǔ)電化教學(xué),2004(2):40-44.