張爾謙 陳志良 謝林川
摘要:教師個(gè)人或小的教學(xué)團(tuán)體在掌握電子語料庫的基本理論和研究方法后,著手構(gòu)建小型電子語料庫往往面臨軟件的獲取和選用、語料的分類這兩個(gè)現(xiàn)實(shí)問題,而語料的分類思路又決定了語料的收集思路。該文就構(gòu)建教學(xué)用小型語料庫時(shí)要注意的以上兩個(gè)問題進(jìn)行了探討。
關(guān)鍵詞:電子語料庫;語料的分類
中圖分類號:G424 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)27-6274-02
Abstract: The teacher individual or small group teaching in the basic theory and research method of master electronic corpus, to build a small electronic corpora are often faced with the two practical problems software acquisition and selection, corpus and corpus classification, classification of thinking also decided that the corpus collection of ideas. This article discusses on the construction of more than two problems to the attention of using small corpus teaching.
Key words: electronic corpus; corpus classification
電子語料庫是指按照一定的語言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語言運(yùn)用文本或話語片段而建成的具有一定容量的大型電子文庫。電子語料庫有非常強(qiáng)大的功能,它的最突出的特點(diǎn)是能迅速地通過檢索關(guān)鍵詞得到有關(guān)該關(guān)鍵詞的大量語料,并以KWIC(Key words In Context)等一些形象清晰的形式呈現(xiàn)出來,供使用者分析參考。語料庫可以用來分析關(guān)鍵詞的各種搭配方式的頻度、上下文語境,還可以統(tǒng)計(jì)分析某一特定文章的話題、修辭等數(shù)據(jù),其應(yīng)用于教學(xué)能夠?qū)虒W(xué)模式的改革和教師教學(xué)思路的拓展產(chǎn)生重大影響。
電子語料庫這種分析工具誕生的初期主要應(yīng)用于對語言學(xué)的研究和大型詞典編纂,后來在一些比較重要的大規(guī)??荚?,如大學(xué)英語四六級考試中,以及確定教學(xué)大綱等工作中有了較為廣泛的應(yīng)用。但總的來說,廣大教師個(gè)人應(yīng)用電子語料庫這一強(qiáng)大工具輔助教學(xué)和研究的情況還比較少。究其原因主要是對電子語料庫的相關(guān)理論和電子語料庫檢索工具缺乏了解,尤其對目前比較優(yōu)秀的電子語料庫檢索軟件在操作使用上缺少必要的學(xué)習(xí)和培訓(xùn)。近些年來信息技術(shù)飛速發(fā)展使得個(gè)人計(jì)算機(jī)的功能變得越來越強(qiáng)大,價(jià)格越來越便宜,應(yīng)用于教學(xué)越來越普遍,廣大教師通過網(wǎng)絡(luò)可以獲得的教學(xué)資源(包括構(gòu)建電子語料庫所需的文本資源)也越來越豐富,同時(shí)掃描儀等幫助將紙質(zhì)文檔轉(zhuǎn)化為電子文本的工具的應(yīng)用也逐漸變得普遍。這些情況都在很大程度上方便了教師個(gè)人構(gòu)建電子語料庫。把電子語料庫應(yīng)用于語言教學(xué),尤其是英語教學(xué),對教學(xué)資源建設(shè)和教學(xué)改革都有重要的現(xiàn)實(shí)意義。
教師個(gè)人或小的教學(xué)團(tuán)體在掌握電子語料庫的基本理論和研究方法后,著手構(gòu)建小型電子語料庫用于教學(xué)和教學(xué)研究往往面臨軟件的獲取和選用、語料的分類等現(xiàn)實(shí)問題,而語料的分類思路又決定了語料的收集思路。下面就構(gòu)建教學(xué)用小型電子語料庫的以上兩個(gè)常見問題進(jìn)行探討。
1 軟件的獲取和選用
電子語料庫的構(gòu)建和使用一般要借助一些語料庫索引軟件。目前功能較為完備,使用較為方便的語料庫索引軟件有以下幾種:
1.1 Concordance
Concordance是英國大學(xué)教師R.J.C. Watt開發(fā)的語料庫索引軟件。該軟件成功實(shí)現(xiàn)了電子語料庫索引軟件的基本功能。它比較突出的一個(gè)特色是可以把關(guān)鍵詞的索引結(jié)果以網(wǎng)頁的形式呈現(xiàn)出來,方便在網(wǎng)絡(luò)上發(fā)布。該軟件是一款獨(dú)立軟件,可利用它對電子語料庫文本進(jìn)行檢索分析。Concordance可以在下載安裝后免費(fèi)試用30天。(下載地址:http://www.concordancesoftware.co.uk)
1.2 Wordsmith Tools
Wordsmith Tools是由英國利物浦大學(xué)的Mike Scott開發(fā)的語料庫索引軟件,這款軟件包括關(guān)鍵詞提取、詞頻統(tǒng)計(jì)、詞表生成等一些常用工具,功能非常強(qiáng)大。該軟件也是目前在中國應(yīng)用最為廣泛的電子語料庫檢索分析工具之一。Wordsmith Tools是一款付費(fèi)軟件,購買地址為http://www.lexically.net/wordsmith/index.html。
1.3 AntConc
AntConc由日本早稻田大學(xué)Laurence Anthony設(shè)計(jì),包含索引、索引定位、文件查看、N元模式、搭配、詞叢、詞表、關(guān)鍵詞表等八大功能,這八個(gè)功能分別由八個(gè)程序來實(shí)現(xiàn)。該軟件在處理大規(guī)模語料時(shí)的性能略遜于Wordsmith Tools,但該軟件是免費(fèi)軟件,免費(fèi)下載地址是http://www.antlab.sci.waseda.ac.jp。
1.4 Range
Range是新西蘭維多利亞大學(xué)的P. Nation和A. Coxhead設(shè)計(jì)的一款語料庫索引軟件。該軟件自帶三個(gè)基礎(chǔ)詞表,分別包含最常用的約1000個(gè)詞族、次常用的約1000個(gè)詞族和最常用的學(xué)術(shù)詞匯570個(gè)詞族。研究者可以利用Range的三個(gè)基礎(chǔ)詞表對相關(guān)語料進(jìn)行詞匯深度和廣度的分析研究。Range可免費(fèi)下載使用,地址http://www.vuw.ac.nz/lals/staff/ paul-nation。
1.5 TACT
TACT(Text Analysis Computing Tools)是加拿大多倫多大學(xué)開發(fā)的一個(gè)電子語料庫檢索分析軟件。這款軟件包括16個(gè)功能相對獨(dú)立的可執(zhí)行程序,具備語料庫索引分析的大部分常用功能。
2 語料的分類
教師個(gè)人或小的教學(xué)團(tuán)體構(gòu)建小型電子語料庫的目的主要是用于教學(xué)和教學(xué)研究。這種目的性決定了教學(xué)用語料庫應(yīng)有自己的特色。尤其在語料的內(nèi)容和分類上應(yīng)有的原則和標(biāo)準(zhǔn)。語料的內(nèi)容對其應(yīng)用起到了相當(dāng)大的限制和決定作用??茖W(xué)的語料分類原則能為科學(xué)確定語料內(nèi)容提供幫助,同時(shí)也為確定語料的收集來源和語料的整理工作提供了很好的思路。
2.1 教材語料
教材語料主要是指學(xué)習(xí)者深入學(xué)習(xí)的各種教材為內(nèi)容的語料。主要以精讀教材為主。
美國認(rèn)知教育心理學(xué)家戴維·保羅·奧蘇貝爾(David Paul Ausubel, 1918-2008) 認(rèn)為,學(xué)習(xí)者在掌握知識和技能的初學(xué)階段需要大量重復(fù)的練習(xí),這種重復(fù)練習(xí)的目的之一就是增加新習(xí)得的知識的意義和穩(wěn)定性。語言知識的習(xí)得有其自身的特點(diǎn),它對對記憶的依賴性比較強(qiáng)。而根據(jù)教育心理學(xué)中與記憶相關(guān)的理論,提高對學(xué)習(xí)材料的加工水平和過度學(xué)習(xí)(Overlearning)這兩種方式都可以顯著地促進(jìn)知識的保持和記憶。提高對學(xué)習(xí)材料的加工水平主要是指通過關(guān)注記憶材料的細(xì)節(jié)以對新材料從多個(gè)方面進(jìn)行感知,或賦予意義并與有關(guān)觀念形成聯(lián)想,從而提高記憶效果的方法。過度學(xué)習(xí)是指所學(xué)材料達(dá)到剛剛成誦后的附加學(xué)習(xí)。語言知識的習(xí)得也要經(jīng)過反復(fù)的練習(xí),進(jìn)行一定程度的過度學(xué)習(xí),同時(shí)提高對學(xué)習(xí)材料的加工水平,從而提高知識掌握的效率。對精讀材料缺乏反復(fù)的學(xué)習(xí)和練習(xí)對學(xué)習(xí)材料的加工水平太低,是造成詞匯量和綜合語言水平提高緩慢一個(gè)重要原因。教師利用各種語料庫索引分析工具對教材語料的系統(tǒng)分析和研究,幫助學(xué)生提高對教材知識的加工水平,對提高學(xué)習(xí)者的語言水平有重要意義。同時(shí)教師還可以基于教材語料,利用各種語料庫索引分析工具設(shè)計(jì)練習(xí),提高復(fù)習(xí)階段的效果和效率。
2.2 閱讀語料
提高學(xué)生的閱讀能力是語言教學(xué)的一項(xiàng)重要任務(wù)。閱讀語料指基于一定分類原則搜集的電子文本閱讀資料。
閱讀語料的收集和整理要充分考慮到詞匯量體裁和題材等問題。俄國心理學(xué)家維果斯基的“最近發(fā)展區(qū)”理論對于確定閱讀語料的詞匯量有很好的指導(dǎo)意義。閱讀語料的詞匯量要與學(xué)習(xí)者目前的詞匯量水平大體一致,可以有一定量的生詞但不能過多。閱讀語料的詞匯量過低雖然能對已有語言知識起到一定的的復(fù)習(xí)鞏固作用,但不利于閱讀能力的提高。閱讀語料的詞匯量過高,容易挫傷學(xué)習(xí)者的閱讀積極性也不可取。
2.3 試題語料
試題語料指以考試試題的電子文本為內(nèi)容的語料。試題語料可以為重要的語言知識點(diǎn)提供參考實(shí)例,可以起到輔助學(xué)習(xí)者語言習(xí)得的目的。
2.4 學(xué)習(xí)者語料
學(xué)習(xí)者語料指通過搜集不同程度的外語學(xué)習(xí)者的外語作文文本并將其轉(zhuǎn)換為電子文本而形成的語料。利用語料庫索引軟件對學(xué)習(xí)者語料庫進(jìn)行分析和研究可以發(fā)現(xiàn)不同水平外語學(xué)習(xí)者的詞匯量差距和出現(xiàn)的錯(cuò)誤,尤其是通過具體的統(tǒng)計(jì)分析數(shù)據(jù)可以發(fā)現(xiàn)在某一水平的學(xué)習(xí)者中普遍存在的錯(cuò)誤。發(fā)現(xiàn)這些具有普遍性的錯(cuò)誤并及時(shí)進(jìn)行糾正,能有效地避免中介語石化現(xiàn)象,有利于學(xué)習(xí)者語言水平的提高。
當(dāng)然,語料的分類思路不是也不可能是唯一的,不同的具體應(yīng)用決定了不同的語料分類思路,而語料的分類思路很大程度上決定了語料的搜集整理思路,因而語料的分類思路對于構(gòu)建教學(xué)用小型電子語料庫是非常重要的。
參考文獻(xiàn):
[1] 張爾謙.基于語料庫的計(jì)算機(jī)輔助英語教學(xué)研究[D].山東師范大學(xué),2007.
[2] 劉靈.藝術(shù)類院校英語教學(xué)中構(gòu)建小型視聽語料庫的研究[J].鄭州航空工業(yè)管理學(xué)院學(xué)報(bào),2010.
[3] 王建新.計(jì)算機(jī)語料庫的建設(shè)與應(yīng)用[M].北京:清華大學(xué)出版社,2005.
[4] 楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.
[5] Sinclair, John. Corpus, Concordance, Collocatin [M]. 上海:上海外語教育出版社,1999.
[6] 何克抗.鄭永柏.謝幼如.教學(xué)系統(tǒng)設(shè)計(jì)[M].北京:北京師范大學(xué)出版社,2002.
[7] 張大均.教育心理學(xué)[M].北京:人民教育出版社,1999.