摘要:個(gè)性化虛擬語(yǔ)料庫(kù)是大數(shù)據(jù)時(shí)代應(yīng)運(yùn)而生的新興工具,在語(yǔ)言教學(xué)與研究中應(yīng)用前景廣闊。它是以現(xiàn)有語(yǔ)料庫(kù)或互聯(lián)網(wǎng)語(yǔ)料為基礎(chǔ),根據(jù)個(gè)性化需求臨時(shí)創(chuàng)建的專(zhuān)題語(yǔ)料庫(kù)。本文以美國(guó)楊百翰大學(xué)維基百科英文語(yǔ)料庫(kù)為例,介紹了如何創(chuàng)建、編輯、管理和使用個(gè)性化虛擬語(yǔ)料庫(kù),包括其檢索方法,闡述了如何從中挖掘利用語(yǔ)言教學(xué)和詞典編纂所需的各類(lèi)詞表,并探索了其在專(zhuān)門(mén)用途英語(yǔ)教學(xué)中的應(yīng)用,最后提出了如何有效利用該類(lèi)資源的建議和展望。
關(guān)鍵詞:個(gè)性化虛擬語(yǔ)料庫(kù);維基百科語(yǔ)料庫(kù);詞表;專(zhuān)門(mén)用途英語(yǔ)教學(xué);專(zhuān)科詞典編纂
中圖分類(lèi)號(hào):H319.3 文獻(xiàn)標(biāo)識(shí)碼:B 論文編號(hào):1674-2117(2017)09-0096-05
近年來(lái),語(yǔ)言教學(xué)與研究正日益廣泛地用到語(yǔ)料庫(kù)(corpus)資源。用戶(hù)可在現(xiàn)成正規(guī)語(yǔ)料庫(kù)或互聯(lián)網(wǎng)語(yǔ)料的基礎(chǔ)上,根據(jù)自身需求臨時(shí)創(chuàng)建專(zhuān)題語(yǔ)料庫(kù),即個(gè)性化虛擬語(yǔ)料庫(kù)(customized virtual corpus)。這兩種語(yǔ)料來(lái)源各有優(yōu)缺點(diǎn),現(xiàn)成的正規(guī)語(yǔ)料庫(kù)制作規(guī)范,標(biāo)注與統(tǒng)計(jì)功能強(qiáng)大,但由于是靜態(tài)資源,語(yǔ)料庫(kù)容量有限,所以在建成之初其語(yǔ)料就已經(jīng)“過(guò)時(shí)”。而互聯(lián)網(wǎng)語(yǔ)料實(shí)際上是大數(shù)據(jù)時(shí)代的“網(wǎng)絡(luò)語(yǔ)料庫(kù)”(web as corpus,又譯作“以網(wǎng)絡(luò)為語(yǔ)料庫(kù)”),它主要通過(guò)Google等搜索引擎來(lái)收集最新語(yǔ)料,其中以英國(guó)伯明翰城市大學(xué)的WebCorp等為代表,但由于受到搜索引擎功能的限制,缺乏正規(guī)語(yǔ)料庫(kù)的標(biāo)注和統(tǒng)計(jì)功能,所以它往往無(wú)法按語(yǔ)言工作者的需要精確檢索到語(yǔ)料。
美國(guó)楊百翰大學(xué)(Brigham Young University)Mark Davies教授于2015年發(fā)布了具有開(kāi)放性和動(dòng)態(tài)性的維基百科英文語(yǔ)料庫(kù)平臺(tái)(The Wikipedia Corpus)。它為用戶(hù)專(zhuān)門(mén)設(shè)置了創(chuàng)建個(gè)性化虛擬語(yǔ)料庫(kù)的功能,這克服了“網(wǎng)絡(luò)語(yǔ)料庫(kù)”的目的性和針對(duì)性不強(qiáng)的缺點(diǎn),同時(shí)又具有正規(guī)(靜態(tài))語(yǔ)料庫(kù)的語(yǔ)料處理功能。該庫(kù)用戶(hù)可根據(jù)所需主題,檢索相關(guān)內(nèi)容的語(yǔ)料,臨時(shí)聚合語(yǔ)料并分類(lèi)管理,從而創(chuàng)建個(gè)性化的專(zhuān)題(子)庫(kù)(劉喜琴 & Davies, 2017)。與Sketch Engine等提供的虛擬語(yǔ)料庫(kù)功能相比,該庫(kù)創(chuàng)建、管理和使用起來(lái)更加靈活方便,進(jìn)一步降低了用戶(hù)的技術(shù)門(mén)檻,因而具有廣闊的應(yīng)用前景。目前,該庫(kù)語(yǔ)料來(lái)源于所有英語(yǔ)國(guó)家,庫(kù)容達(dá)190億個(gè)詞,含4,400,000個(gè)文件。雖然容量巨大,但檢索速度很快,是Sketch Engine的五六倍。其優(yōu)勢(shì)還體現(xiàn)在它的語(yǔ)料檢索功能遠(yuǎn)遠(yuǎn)超過(guò)維基百科原有系統(tǒng),而且與學(xué)校其他十多個(gè)免費(fèi)權(quán)威語(yǔ)料庫(kù)(如COCA、COHA、BYU-BNC等)實(shí)現(xiàn)了無(wú)縫對(duì)接(Davies, 2015)。
眾所周知,維基百科專(zhuān)業(yè)性強(qiáng)、規(guī)模大、應(yīng)用廣,具有很高的自然語(yǔ)言研究?jī)r(jià)值,因此引起了國(guó)內(nèi)外學(xué)者的普遍關(guān)注(趙飛等,2010),如挖掘雙語(yǔ)語(yǔ)料以建造雙語(yǔ)平行語(yǔ)料庫(kù)等(孟桂國(guó),2010;胡弘思,2013)。在國(guó)外,個(gè)性化虛擬語(yǔ)料庫(kù)已逐步應(yīng)用于語(yǔ)言教學(xué)與詞典編纂等方面(Avinesh et al,2012),但國(guó)內(nèi)學(xué)界對(duì)其仍比較陌生,本文嘗試以維基百科英文語(yǔ)料庫(kù)為例,探索如何將其應(yīng)用于個(gè)性化教學(xué)等方面。
個(gè)性化虛擬語(yǔ)料庫(kù)的創(chuàng)建與管理
登錄楊百翰大學(xué)的維基百科語(yǔ)料庫(kù)網(wǎng)站(http://corpus.byu.edu/wiki/),可看到“Create corpus”按鈕,點(diǎn)擊即可進(jìn)入創(chuàng)建頁(yè)面。在“Title word(s)”(標(biāo)題框)中輸入包含在文檔標(biāo)題中的字符串,底下四個(gè)框還可以分別設(shè)置標(biāo)題或網(wǎng)頁(yè)中要包含或剔除的字符串,以及網(wǎng)頁(yè)數(shù)量(pages)。例如,我們想創(chuàng)建一個(gè)關(guān)于圣誕節(jié)的專(zhuān)題庫(kù),通過(guò)網(wǎng)頁(yè)查詢(xún)Christmas后,發(fā)現(xiàn)需要過(guò)濾掉一些有關(guān)歌曲或電影的網(wǎng)頁(yè)??梢韵仍跇?biāo)題框中輸入Christmas,然后在“(Optional)Words not in title”框中輸入“song film”,在“(Optional)Words not in pages”框中輸入“movie film television”。
同時(shí),也可以在建好的專(zhuān)題庫(kù)中建立更小的子庫(kù),如想在BIOLOGY庫(kù)下面建立STEM CELL子庫(kù),只需在BIOLOGY庫(kù)中查詢(xún)字符串“stem cell”,就能將系統(tǒng)自動(dòng)顯示的網(wǎng)頁(yè)保存建庫(kù)。
建好庫(kù)后不僅可以對(duì)自建庫(kù)進(jìn)行編輯管理——從屏幕右邊的自建庫(kù)管理窗口開(kāi)始進(jìn)行各種操作,如將某庫(kù)刪除(delete)、隱藏(hide)、恢復(fù)隱藏等,還可以對(duì)各庫(kù)順序進(jìn)行重排或重命名(rename),或?qū)Ω鲙?kù)進(jìn)行分類(lèi)(regroup)并對(duì)類(lèi)別進(jìn)行命名。如下圖所示,BASTKETBALL、BIOLOGY和INVESTMENTS三個(gè)專(zhuān)題庫(kù)分別歸在Sports類(lèi)(Sp)、Science類(lèi)(Sc)和Finance類(lèi)(Fi)。
楊百翰大學(xué)語(yǔ)料庫(kù)的檢索方法
語(yǔ)料庫(kù)檢索方法是其使用過(guò)程中的關(guān)鍵,在語(yǔ)言教學(xué)、詞典編纂和語(yǔ)言研究中也比較重要。楊百翰大學(xué)的語(yǔ)料庫(kù)系統(tǒng)界面友好,查詢(xún)方便,檢索方式多樣,檢索功能強(qiáng)大。
1.簡(jiǎn)單檢索
首先,用戶(hù)需要了解一些基本的通配符(正則表達(dá)式),如*、?等,以及基本的統(tǒng)計(jì)學(xué)概念,如頻數(shù)、互信息值、關(guān)聯(lián)度等。輸入字符串有嚴(yán)格的規(guī)定,可參看其網(wǎng)站介紹。查詢(xún)一個(gè)單詞時(shí)中間不要隨意加空格,否則會(huì)被默認(rèn)為兩個(gè)連續(xù)的單詞。如果要限定單詞的詞性(詞類(lèi)),可在單詞后面加一個(gè)點(diǎn),然后加中括號(hào),將詞性標(biāo)簽放入中括號(hào)內(nèi)。點(diǎn)的前面和后面都不能有空格,否則會(huì)被視為兩個(gè)連續(xù)的單詞。如果要進(jìn)行近義詞檢索和用戶(hù)定制清單,則需要查詢(xún)所匹配單詞的所有屈折變化形式,只需在中括號(hào)外另加一對(duì)中括號(hào),也可選擇詞目及詞性。例如,鍵入s?ng*,則代表要查詢(xún)song、singer、songbirds等單詞(通配符問(wèn)號(hào)代表一個(gè)字母)。如果想查詢(xún)suggestive后面一般接哪些介詞,在檢索框中鍵入suggestive,POS LIST選擇prep.ALL即可。
如果要在自建庫(kù)中查詢(xún)?cè)~頻表或詞組頻數(shù)表,則在自建庫(kù)管理窗口中點(diǎn)選“FIND KEYWORDS”;如果要分類(lèi)型來(lái)查,單詞可查名詞、動(dòng)詞、形容詞和副詞四種,詞組可查“名詞+名詞”“形容詞+名詞”兩種,按需點(diǎn)擊相應(yīng)按鈕即可;如果要拿整個(gè)維基百科語(yǔ)料庫(kù)作為參照,查詢(xún)自建庫(kù)的主題詞(又稱(chēng)關(guān)鍵詞,但實(shí)際上不同于被查詢(xún)的字符串“語(yǔ)境中的關(guān)鍵詞KWIC”),此時(shí)應(yīng)點(diǎn)選“SPECIFIC”。
2.高級(jí)檢索
這里主要介紹句法檢索和搭配詞檢索。
維基百科語(yǔ)料庫(kù)的句法檢索比較強(qiáng)大,像ADJ/NOUN+fund或者market+NOUN這類(lèi)檢索,無(wú)需逐個(gè)輸入確切的詞組,只用一次性輸入,僅需幾秒鐘時(shí)間,這是一般的語(yǔ)料庫(kù)系統(tǒng)無(wú)法做到的。
在查詢(xún)界面(SEARCH)可找到搭配詞(COLLOCATES)按鈕。查詢(xún)搭配詞時(shí)需要在兩個(gè)選擇框中設(shè)置左右位置的范圍。兩個(gè)選擇框中的左框表示搭配詞在目標(biāo)字詞左邊(L)出現(xiàn)的最遠(yuǎn)位置,右框(R)則相反,默認(rèn)情況下均為前后4個(gè)詞的距離范圍。如果想查詢(xún)market后面常接哪些名詞,可以在查詢(xún)框中輸入字符串“market”,然后點(diǎn)擊詞性下拉菜單(POS),選擇“noun.ALL”。如果想查詢(xún)哪些名詞附近常用wear,或laughter附近常用哪些動(dòng)詞,可以輸入“[wear]+a NOUN”或“VERB+his laughter”。如果想查詢(xún)動(dòng)詞后面接介詞of并且該結(jié)構(gòu)位于句尾的情況,可以在查詢(xún)框中鍵入查詢(xún)表達(dá)式of.(of后面加一個(gè)空格,再加一個(gè)英文句號(hào)),POS框選擇verb.ALL,COLLOCATES框選擇1L和0R,就可以查到think、heard、know、made、speak、dreamed、rid等動(dòng)詞形式(劉喜琴,2013)。
各類(lèi)詞表的挖掘利用
語(yǔ)料庫(kù)輔助語(yǔ)言教學(xué)最明顯的優(yōu)勢(shì)體現(xiàn)在詞匯方面,同時(shí)語(yǔ)料庫(kù)也是現(xiàn)代詞典編纂必不可少的工具。在語(yǔ)料庫(kù)檢索中,通常以檢索項(xiàng)為切入點(diǎn),進(jìn)而得到大量的檢索行,并通過(guò)語(yǔ)境來(lái)觀察檢索項(xiàng)的實(shí)際使用情況。但創(chuàng)建大規(guī)模語(yǔ)料庫(kù)的目的之一是希望能夠得到有關(guān)語(yǔ)言的宏觀認(rèn)識(shí),詞表技術(shù)即可實(shí)現(xiàn)此功能。
在語(yǔ)料庫(kù)語(yǔ)言學(xué)中,詞表(word list)是指詞頻表(frequency list),而不是簡(jiǎn)單的單詞列表,這是詞典收詞立目的重要依據(jù)之一,當(dāng)然還可以選擇按字母表順序(alphabetical)排列。如果孤立地觀察單詞,顯然無(wú)法解決語(yǔ)言中的眾多問(wèn)題,所以有學(xué)者提出了詞簇(cluster)這個(gè)概念。詞簇是指在語(yǔ)料文本中反復(fù)出現(xiàn)的兩詞或兩詞以上的結(jié)構(gòu),又被稱(chēng)為語(yǔ)塊(chunk)或多詞單位(multi-word unit)。雖然該類(lèi)結(jié)構(gòu)未必是語(yǔ)法和語(yǔ)義上完整的結(jié)構(gòu),但仍可觀察到詞匯的高頻搭配規(guī)律。要在維基百科語(yǔ)料庫(kù)的自建庫(kù)中查詢(xún)某類(lèi)詞頻表或詞組頻數(shù)表,在自建庫(kù)管理窗口中點(diǎn)選單詞或詞組的類(lèi)型即可,也可以將語(yǔ)料保存在本地,用語(yǔ)料庫(kù)軟件如AntConc(Anthony, 2014)等,提取任何類(lèi)型的詞表和詞簇表,這樣就不會(huì)局限于維基百科語(yǔ)料庫(kù)提供的詞類(lèi)和詞組類(lèi)型。
如果要查詢(xún)自建庫(kù)的主題詞,系統(tǒng)默認(rèn)用整個(gè)維基百科語(yǔ)料庫(kù)作為參照語(yǔ)料庫(kù)(reference corpus),這特別適合于語(yǔ)體比較、專(zhuān)門(mén)用途英語(yǔ)學(xué)習(xí)和專(zhuān)科詞典編纂。如果拿某個(gè)或多個(gè)文本跟別的文本相比,往往會(huì)發(fā)現(xiàn)其中有一些詞出現(xiàn)的頻率特別高,這些詞叫做主題詞或關(guān)鍵詞(keyword或key word)。通過(guò)觀察主題詞,可以發(fā)現(xiàn)某一給定文類(lèi)或主題文本的詞語(yǔ)特征。例如,在旅游英語(yǔ)語(yǔ)篇中,ticket、booking、luggage、tour、guide、route、flight、coach等詞出現(xiàn)的頻率特別高,因此被視為主題詞。主題表中主題詞的頻率顯著程度(keyness)是根據(jù)對(duì)數(shù)似然率(log likelihood)或卡方檢驗(yàn)(chi-square)計(jì)算出來(lái)的。主題詞提取后,我們可以對(duì)其進(jìn)行分類(lèi)整理,輔助文本分析與教學(xué)。
教師可以利用搭配詞表優(yōu)化語(yǔ)塊教學(xué),在教材與詞典中,應(yīng)將高頻詞匯搭配優(yōu)先呈現(xiàn)給學(xué)習(xí)者。語(yǔ)料庫(kù)語(yǔ)言學(xué)認(rèn)為語(yǔ)言的核心是詞匯,頻率與搭配這兩個(gè)中心概念應(yīng)該受到重視,如Sinclair的習(xí)語(yǔ)原則、Hunston的型式語(yǔ)法、Hoey的詞匯觸發(fā)理論等都支持該觀點(diǎn)。
專(zhuān)門(mén)用途英語(yǔ)教學(xué)中的應(yīng)用
專(zhuān)門(mén)用途英語(yǔ)(English for Special Purposes,簡(jiǎn)稱(chēng)ESP)教學(xué)是目前全球英語(yǔ)教學(xué)的發(fā)展趨勢(shì)。目前,我國(guó)的ESP教學(xué)仍由英語(yǔ)教師來(lái)承擔(dān),這往往會(huì)遇到學(xué)科制約的瓶頸。英語(yǔ)教師常需要查詢(xún)專(zhuān)門(mén)學(xué)科的英語(yǔ)語(yǔ)料庫(kù),但實(shí)際上這樣的英語(yǔ)語(yǔ)料庫(kù)往往無(wú)法找到,所以教師有必要自建個(gè)性化虛擬語(yǔ)料庫(kù),按專(zhuān)題來(lái)選擇語(yǔ)料并進(jìn)行分類(lèi)管理。教師應(yīng)結(jié)合具體專(zhuān)業(yè)學(xué)科內(nèi)容,在課堂活動(dòng)設(shè)計(jì)、教材編寫(xiě)等方面適當(dāng)引入語(yǔ)料庫(kù)數(shù)據(jù),兼顧國(guó)際化和本土化特色,以幫助學(xué)習(xí)者在真實(shí)語(yǔ)料信息中獲取專(zhuān)業(yè)知識(shí),與國(guó)際學(xué)術(shù)前沿接軌(王健燕,2012)。
個(gè)性化虛擬語(yǔ)料庫(kù)應(yīng)用于ESP教學(xué),主要體現(xiàn)在專(zhuān)業(yè)詞匯、閱讀與翻譯教學(xué)上。利用個(gè)性化虛擬語(yǔ)料庫(kù)挖掘詞表、詞簇表和主題詞表,可以幫助學(xué)習(xí)者積累該專(zhuān)業(yè)的特色詞匯。維基百科語(yǔ)料庫(kù)為這些專(zhuān)業(yè)術(shù)語(yǔ)提供了詳細(xì)的定義與解釋?zhuān)梢灾苯佑米鲗W(xué)習(xí)材料,如在電子詞匯表中制作有關(guān)術(shù)語(yǔ)的維基百科語(yǔ)料庫(kù)超鏈接,能讓學(xué)生使用起來(lái)非常方便。
在ESP閱讀教學(xué)方面,教師可按照具體學(xué)科的體系建立一個(gè)多層級(jí)的個(gè)性化虛擬語(yǔ)料庫(kù)系統(tǒng),挑選最合適的閱讀材料提供給學(xué)習(xí)者。一個(gè)教學(xué)班的學(xué)生往往來(lái)自不同專(zhuān)業(yè),因此需要根據(jù)其專(zhuān)業(yè)特點(diǎn)選擇不同的閱讀材料。而維基百科語(yǔ)料庫(kù)因其語(yǔ)料專(zhuān)業(yè)性強(qiáng)且更新快而在這方面特別有優(yōu)勢(shì)。例如,我們建立一個(gè)BIOLOGY的專(zhuān)題庫(kù),里面可分為ZOOLOGY(動(dòng)物學(xué))、BOTONY(生物學(xué))、MICROBIOLOBY(微生物學(xué))等子庫(kù)。學(xué)習(xí)者在閱讀中遇到專(zhuān)業(yè)術(shù)語(yǔ)等方面的困難,可以隨時(shí)查詢(xún)總庫(kù)或其他子庫(kù)資源。
教師還可以通過(guò)楊百翰大學(xué)語(yǔ)料庫(kù)網(wǎng)站的Word and Phrase主頁(yè)(http://www.wordandphrase.info/),獲取某篇閱讀文章的詞匯的宏觀與微觀信息。只需將干凈的文本(如txt格式)輸入其主頁(yè)所指示的框內(nèi),系統(tǒng)便自動(dòng)呈現(xiàn)文本詞匯統(tǒng)計(jì)數(shù)據(jù)。統(tǒng)計(jì)表中的任何單詞都有鏈接,點(diǎn)擊就可以查看其頻率信息、定義、詞匯搭配情況等。
在ESP翻譯教學(xué)中,國(guó)外已有值得借鑒的先例(Avinesh et al, 2012),他們特別注重母語(yǔ)與目的語(yǔ)專(zhuān)業(yè)文檔的積累和對(duì)比學(xué)習(xí),在找不到合適的平行語(yǔ)料庫(kù)(parallel corpus)時(shí),個(gè)性化虛擬語(yǔ)料庫(kù)能進(jìn)行一些補(bǔ)償。國(guó)內(nèi)基于維基百科語(yǔ)料庫(kù)的平行語(yǔ)料庫(kù)建設(shè),也能為教學(xué)應(yīng)用提供啟示。教師還可以利用多語(yǔ)語(yǔ)料庫(kù)軟件ParaConc(Barlow, 2009)等處理和檢索自建庫(kù)的語(yǔ)料,輔助翻譯教學(xué)。
結(jié)語(yǔ)
在語(yǔ)言教學(xué)中,教師可以深化數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)法(Data-driven Learning),根據(jù)學(xué)生的英語(yǔ)水平、專(zhuān)業(yè)、興趣和需求篩選語(yǔ)料,引導(dǎo)學(xué)生掌握語(yǔ)料庫(kù)基本術(shù)語(yǔ)和復(fù)雜檢索所需的正則表達(dá)式,以提高其對(duì)個(gè)性化虛擬語(yǔ)料庫(kù)的利用程度,培養(yǎng)他們的自主學(xué)習(xí)能力。為了加深學(xué)生對(duì)外國(guó)文化的理解,教師可以引導(dǎo)學(xué)生查詢(xún)蘊(yùn)含濃厚文化信息的關(guān)鍵詞,觀察其搭配詞的特點(diǎn),探索話(huà)語(yǔ)社團(tuán)的主流思想與社會(huì)文化形態(tài)的變化趨勢(shì)。
在詞典學(xué)研究與實(shí)踐中,維基百科語(yǔ)料庫(kù)與個(gè)性化虛擬語(yǔ)料庫(kù)特別適合充當(dāng)專(zhuān)科詞典(specialized dictionary)編纂的輔助工具。在編纂過(guò)程中,詞典學(xué)家可以利用這類(lèi)語(yǔ)料庫(kù)協(xié)助選條、挑選搭配等,從而驗(yàn)證收錄在專(zhuān)科詞典中的術(shù)語(yǔ)和釋義的真實(shí)性(Tarp & 薛梅,2016)。
在技術(shù)方面,個(gè)性化虛擬語(yǔ)料庫(kù)還有待實(shí)現(xiàn)一些復(fù)雜的檢索功能,這主要取決于自然語(yǔ)言處理的瓶頸之一——語(yǔ)義標(biāo)注技術(shù)的突破。隨著計(jì)算機(jī)科技的發(fā)展,相信“網(wǎng)絡(luò)語(yǔ)料庫(kù)”(web as corpus)會(huì)發(fā)展到“以網(wǎng)絡(luò)瀏覽器為檢索器”(web browser as concordancer),甚至是“以網(wǎng)絡(luò)瀏覽器為標(biāo)注器”(web browser as tagger),即虛擬標(biāo)注——服務(wù)器端的自動(dòng)語(yǔ)言信息標(biāo)注。
總之,個(gè)性化虛擬語(yǔ)料庫(kù)應(yīng)用前景廣闊,但還有待語(yǔ)言工作者和技術(shù)人員不斷嘗試,大力推廣。
參考文獻(xiàn):
[1]Anthony L. AntConc (Version 3.4.3)[DB/CP].http://www.laurenceanthony.net/software.html,2014.
[2]Avinesh P., D. Mccarthy, D. Glennon,et al.Domain specific corpora from the web: Proc EURALEX[Z].Oslo,Norway: 2012.
[3]Barlow M. ParaConc[DB/CP].http://www.paraconc.com,2009.
[4]Davies M.The Wikipedia Corpus[EB/OL].http://corpus.byu.edu/wiki/,2015.
[5]Tarp S., 薛梅.語(yǔ)料庫(kù)驅(qū)動(dòng)詞典學(xué)、語(yǔ)料庫(kù)詞典學(xué)與語(yǔ)料庫(kù)輔助詞典學(xué)——論語(yǔ)料庫(kù)在注釋專(zhuān)科術(shù)語(yǔ)詞條的局限性[J].辭書(shū)研究,2016(4).
[6]胡弘思.基于維基百科的雙語(yǔ)可比語(yǔ)料的句子對(duì)齊[D].上海:上海交通大學(xué),2013.
[7]劉喜琴.語(yǔ)料庫(kù)輔助EFL自主學(xué)習(xí)的多維探索[M].廣州:華南理工大學(xué)出版社,2013.
[8]劉喜琴,M. Davies.BYU語(yǔ)料庫(kù)系統(tǒng)及其語(yǔ)言研究應(yīng)用[J].中國(guó)教育信息化,2017.
[9]孟桂國(guó).基于維基百科的雙語(yǔ)語(yǔ)料挖掘技術(shù)研究[D].蘇州:蘇州大學(xué),2010.
[10]王健燕.論英語(yǔ)語(yǔ)料庫(kù)輔助下的學(xué)科專(zhuān)業(yè)英語(yǔ)(ESP)教學(xué)[J].南京航空航天大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012(1).
[11]趙飛,周濤,張良,等.維基百科研究綜述[J].電子科技大學(xué)學(xué)報(bào),2010(3).
本研究得到廣東省哲學(xué)社會(huì)科學(xué)“十二五”規(guī)劃項(xiàng)目(GD15XWW23)和2016年度廣州市哲學(xué)社會(huì)科學(xué)發(fā)展“十三五”規(guī)劃課題(2016GZGJ68)的資助,感謝吉林師范大學(xué)李亮博士的技術(shù)指導(dǎo)。