摘要:語料庫語料豐富,對語料庫中語料的統(tǒng)計分析,可以為對外漢語提供很多有價值的研究材料。本文收集了近幾年對外漢語領(lǐng)域使用語料庫輔助研究的文獻(xiàn),歸納出語料庫在研究漢語學(xué)習(xí)者習(xí)得情況、研究漢語語言現(xiàn)象、漢語教學(xué)工具書信息來源、回饋課堂教學(xué)等方面的作用。傳統(tǒng)語料庫在對外漢語領(lǐng)域未盡其用,游離于課堂教學(xué)之外,真正適用于對外漢語課堂教學(xué)的語料庫還有待研發(fā)和建立。
關(guān)鍵詞:語料庫對外漢語課堂教學(xué)語料庫是由大量語言實際使用的信息組成,專供語言研究、分析和描述的語言資料庫,簡而言之,就是存放語料的倉庫。語料庫存放的語料豐富而有序,研究者利用計算機(jī)可以從數(shù)百萬的語料中調(diào)出某個詞、短語或者句子的實例,簡捷方便。在真實語境中,語言符號的意義不是完全確定、一成不變的,隨機(jī)性特點(diǎn)顯著,因此通過收集大量的真實語言素材,對其進(jìn)行統(tǒng)計分析,得出語言在實際應(yīng)用中的內(nèi)在規(guī)律就顯得十分必要。
近些年來,從事對外漢語教學(xué)工作者對語料庫在對外漢語領(lǐng)域的教學(xué)研究和理論研究方面所起到的作用有了更深刻的認(rèn)識,新的針對對外漢語領(lǐng)域的語料庫不斷地被研發(fā)和使用,使得傳統(tǒng)的研究語言的依靠直覺經(jīng)驗的方法被量化的統(tǒng)計方法所取代。
一、對外漢語語料庫的研發(fā)與使用概況
北京語言大學(xué)崔希亮教授主持開發(fā)了“HSK動態(tài)作文語料庫”,該語料庫是針對母語非漢語的外國人設(shè)立的,是以他們參加的高等漢語水平考試(HSK高等)的作文考試為語料來源,收集了1992年以來歷年高等漢語水平考試的全部作文答卷,并隨著漢語考試的不斷進(jìn)行,語料的不斷增加,語料庫不斷得到充實。語料庫由原始語料庫、考生信息庫、字信息庫、詞信息庫、句信息庫、篇章信息庫以及各種計算機(jī)輔助程序構(gòu)成。語料庫1.0版收入語料10740篇,約400萬字;語料庫1.1版語料總數(shù)達(dá)到11569篇,共計424萬字。運(yùn)用該語料庫,可以進(jìn)行多方面的研究,例如漢語中介語研究、第二語言習(xí)得研究、對外漢語教學(xué)理論研究、對外漢語教材研究、漢語水平考試研究、漢語本體研究等等。
北京大學(xué)CCL語料庫由北京大學(xué)中國語言學(xué)研究中心開發(fā),最后更新時間為2009年,語料涵蓋了現(xiàn)代漢語和古代漢語的各種語用現(xiàn)象和內(nèi)容?,F(xiàn)代漢語的語料來源包括口語、文學(xué)、戲劇、報刊、史傳、翻譯作品、電視電影、網(wǎng)文等;古代漢語的語料來源包括全唐詩、全宋詞、全元曲、辭書、道藏、筆記、蒙學(xué)讀物、諸子百家以及歷朝歷代的史傳文學(xué)。語料庫規(guī)模超過4.77億字。北京大學(xué)語料庫為我們提供了中國人使用漢語的大量真實語料,為量化統(tǒng)計漢語語法特點(diǎn)提供了幫助。
另外,很多研究者為了使研究的方向或結(jié)果更具針對性,采用發(fā)放調(diào)查問卷、收集試卷、定向測試等手段收集語料,形成供自己研究方向需要的小型語料庫。這種小型語料庫的優(yōu)點(diǎn)是針對性強(qiáng),可以快速地統(tǒng)計某一國別、某一漢語水平的學(xué)生在學(xué)習(xí)漢語過程中獨(dú)有的特點(diǎn);缺點(diǎn)是普遍性較差,某一學(xué)?;蚪虒W(xué)模式在語料中遺留的痕跡重,研究成果不具有普遍代表性。
二、語料庫在對外漢語領(lǐng)域的應(yīng)用情況
經(jīng)過對近幾年對外漢語領(lǐng)域中涉及到語料庫應(yīng)用的文獻(xiàn)成果的調(diào)查、整理和分析,對外漢語語料庫的作用主要體現(xiàn)在以下幾個大的方面:
(一)研究漢語學(xué)習(xí)者的習(xí)得情況
研究者通過對語料庫中漢語學(xué)習(xí)者的真實語料進(jìn)行定向統(tǒng)計分析,可以研究漢語學(xué)習(xí)者的偏誤情況或他們漢語習(xí)得過程的規(guī)律。
1.研究漢語學(xué)習(xí)者的偏誤
華東師范大學(xué)2011屆碩士陳瑛通過語料庫統(tǒng)計分析,將所有留學(xué)生漢字偏誤分為錯字、別字、拼音字三大類,并分別再細(xì)分為不同的小類。將各類漢字偏誤的出錯率與考生的文字背景和漢語水平聯(lián)系起來,從不同的角度對這些數(shù)據(jù)進(jìn)行統(tǒng)計、綜合、分析,找出了其中的一些聯(lián)系與規(guī)律,并依據(jù)所得的結(jié)果提出對外漢字教學(xué)需要針對不同文字背景和不同漢語水平學(xué)習(xí)者采取不同的教學(xué)方法和內(nèi)容,以幫助學(xué)習(xí)者習(xí)得和識記漢字。
湖北工業(yè)大學(xué)2012屆碩士劉穆楠以北京語言大學(xué)HSK動態(tài)作文語料庫中的留學(xué)生作文為語料來源,對常用的動賓離合詞在語料庫中的使用情況進(jìn)行搜集、整理,對留學(xué)生動賓離合詞的使用偏誤進(jìn)行分類,并針對統(tǒng)計的結(jié)果,分析偏誤產(chǎn)生的原因,給出教學(xué)上的建議。
廣州大學(xué)2011屆碩士鄧林玲通過分析、研究,歸納出了韓國留學(xué)生遞進(jìn)復(fù)句的偏誤類型,發(fā)現(xiàn)韓國留學(xué)生遞進(jìn)復(fù)句中的偏誤是由于留學(xué)生對遞進(jìn)復(fù)句各分句之間的語言關(guān)系把握不準(zhǔn)確,對遞進(jìn)關(guān)系關(guān)聯(lián)詞的基本用法掌握不牢等導(dǎo)致的。為此,文章從對外漢語遞進(jìn)復(fù)句課堂教學(xué)實際操作的角度簡要地歸納了“別說”句、“不但……而且……”句、“尚且……何況……”句的語法、語義特征,為對外漢語課堂遞進(jìn)復(fù)句教學(xué)提供了可行的教學(xué)策略。
2.研究漢語學(xué)習(xí)者習(xí)得過程
南京大學(xué)2012屆碩士薛羽為考察兩名初中級水平留學(xué)生習(xí)得“把”字句的發(fā)展過程設(shè)計了實驗研究。實驗分為兩個部分,首先是教學(xué)實驗,按照肖奚強(qiáng)的“把”字句習(xí)得順序研究成果,選取了初級階段應(yīng)該掌握的7種“把”字句,再進(jìn)一步細(xì)分為10種,歷時半年,在課堂上依次講授。其次是口語語料追蹤實驗。選取教學(xué)對象中的兩位學(xué)生作為被試,歷時18周進(jìn)行追蹤錄音,采用自然訪談的形式獲取語料。通過分析她們的口語語料,考察了這兩名初中級水平被試習(xí)得“把”字句的發(fā)展過程。
南京師范大學(xué)2012屆碩士慈龍梅以對外漢語課堂教學(xué)中學(xué)習(xí)者的漢語輸出作為研究對象,收集了學(xué)習(xí)者在漢語課堂上輸出的漢語語料生成小型學(xué)習(xí)者輸出語言語料庫,考察了對外漢語課堂這一特定場合不同漢語水平學(xué)習(xí)者的漢語輸出情況,并且以此為基礎(chǔ)探索學(xué)習(xí)者在漢語課堂上輸出漢語的特點(diǎn)和規(guī)律。
(二)研究漢語語言現(xiàn)象在語境中的意義和用法
利用語料庫,研究者可以從大量的語料中檢索出某個語素、詞、短語、語法結(jié)構(gòu)的語言形式以及它們出現(xiàn)的語境,可以從宏觀角度對語言形式及其語境進(jìn)行全面的觀察和分析。從漢語的實際使用中發(fā)現(xiàn)語法結(jié)構(gòu)和語用規(guī)則,甚至從認(rèn)知學(xué)上總結(jié)語言規(guī)律,這樣所進(jìn)行的語法結(jié)構(gòu)分析更加可靠,也有助于更加全面準(zhǔn)確地認(rèn)識漢語語言形式在語境中的意義和用法,便于漢語學(xué)習(xí)者理解和掌握。
山東大學(xué)2011屆碩士杜婷利用“國家語委現(xiàn)代漢語通用平衡語料庫”對“口部”動詞的總體頻度作了計量分析。以高頻“口部”動詞為例,探討了“口部”動詞的搭配情況,包括“口部”動詞的兩階搭配和動賓搭配。隨后討論了“口部”動詞作為成詞語素的派生能力,主要是派生為合成詞和熟語的情況。在語用方面,主要研究了“口部”動詞的使用語境以及“口部”動詞在詞類和句法層面的活用情況。這種研究方法對現(xiàn)代漢語動詞小類研究有一定的啟發(fā)意義。文章與對外漢語詞匯教學(xué)的結(jié)合,為漢語作為第二語言教學(xué)的詞匯研究、教材編寫等提供了新思路,也為對外漢語“口部”動詞教學(xué)的后續(xù)研究提供了可參考依據(jù)。
(三)通過研究語料庫優(yōu)化課堂教學(xué)
在對外漢語教學(xué)中,使用語料庫可以縮小課堂中教的語言與人們實際使用的語言之間的差距;可以比較語言使用方面的不同,如書面語與口語的不同;可以比較、分析詞語及其用法,研究詞序,幫助學(xué)生更準(zhǔn)確地理解一些詞語在實際交際中的意義和用法;可以使教師編寫練習(xí)或測試題變得更加容易,并且使題目更具真實性和可靠性;可以研究新詞語。
暨南大學(xué)2012屆碩士謝莉琳設(shè)想通過收集足量的網(wǎng)絡(luò)新聞標(biāo)題構(gòu)建網(wǎng)絡(luò)新聞標(biāo)題新詞語語料庫,利用網(wǎng)絡(luò)新聞標(biāo)題提供的大量語境實例,去發(fā)現(xiàn)新詞語的意義和用法,從而提高漢語自學(xué)能力。利用網(wǎng)絡(luò)新聞標(biāo)題學(xué)習(xí)新詞語的方法使學(xué)生從被動學(xué)習(xí)變?yōu)橹鲃游眨淖円酝詭煘楸镜慕虒W(xué)理念,從而提高學(xué)生學(xué)習(xí)的積極性。
北京語言大學(xué)2003屆研究生王祖嫘通過自建的小規(guī)模課堂用語語料庫,對課堂教學(xué)語言進(jìn)行初步探討,總結(jié)出了對外漢語課堂教學(xué)語言的六個特點(diǎn):結(jié)構(gòu)的特殊性、受限性、啟發(fā)性、設(shè)定性、表達(dá)方式的特殊性和雙重性,比如“說”在對外漢語課堂上占有絕對優(yōu)勢;特指問句和“留空句”的使用最多。作者還提出了這些特點(diǎn)對教學(xué)的啟示,并且希望能夠通過繼續(xù)充實課堂教學(xué)語言的語料,建立大規(guī)模的對外漢語課堂教學(xué)語言語料庫。
(四)語料庫可以作為漢語教學(xué)工具書的信息來源
大型的漢語語料庫為編寫對外漢語教學(xué)專用的辭書提供大量真實客觀的語料和相關(guān)的語言信息,諸如詞頻統(tǒng)計、詞匯分級、詞性標(biāo)注、詞語搭配、語體特征、詞語用法、語境中的例句等等。
山東大學(xué)2011屆碩士張雁以《漢語水平詞匯大綱》中丙級詞里的動詞為研究對象,對《商務(wù)館學(xué)漢語詞典》的動詞釋義進(jìn)行分析。重點(diǎn)分析釋義方式、釋義語言、釋義示例等內(nèi)容,探究《商務(wù)館學(xué)漢語詞典》在釋義方面的成功之處和存在的不足,為今后的對外漢語詞典編纂提供借鑒。
西安外國語大學(xué)2012屆碩士李一霆選取了三套使用廣泛、質(zhì)量較高、編寫委員會較為權(quán)威的中級口語教材建立起語料庫來進(jìn)行課文的分析研究,根據(jù)教材編寫的基本原則和教材評估的相關(guān)理論,采用文獻(xiàn)法、對比分析法和數(shù)據(jù)統(tǒng)計法,從課文的體裁、題材、“說的漢語”和“看的漢語”以及三套教材中一些其他問題來進(jìn)行研究,文章分析討論了三套教材在這幾方面存在的不足,指出課文選編在這幾個方面應(yīng)該注意的事項,提出了對今后中級口語教材課文編寫的幾點(diǎn)建議:1.課文體裁要多樣化,但應(yīng)該以日常對話為主體;2.課文題材應(yīng)該盡可能豐富,但要以日常生活和人際交往類題材為主;3.課文的語言要符合“說的口語”的要求,表述要規(guī)范;4.課文的選材要注意時代性,讓課文能夠展現(xiàn)當(dāng)前社會的真實風(fēng)貌;5.課文中應(yīng)弘揚(yáng)積極、健康、正面的文化,這一方面要注意東西方文化的差異,另一方面要傳播正確的、主流的文化;6.課文的長度和句子的長度要控制在一個適當(dāng)?shù)姆秶鷥?nèi)。
三、語料庫在對外漢語教學(xué)中未盡其用
通過對近幾年與語料庫和對外漢語有關(guān)的文獻(xiàn)的整理和分析,我們可以將對外漢語領(lǐng)域語料庫所應(yīng)用的方面歸納為以下4大類:1.研究者通過對漢語語料庫的深入調(diào)查和研究,發(fā)現(xiàn)一些習(xí)焉不察的語言規(guī)律,從而修正或補(bǔ)充前人的結(jié)論,促進(jìn)語言科學(xué)的發(fā)展;2.通過中介語語料庫,研究留學(xué)生習(xí)得中的問題和特點(diǎn),為以后優(yōu)化教學(xué)模式提供支持;3.為適合第二語言學(xué)習(xí)者的詞典、工具書編寫提供幫助;4.通過利用語料庫對學(xué)習(xí)者學(xué)習(xí)過程或課堂環(huán)境的觀察,回饋課堂教學(xué),為優(yōu)化課堂提供建議。但是不難發(fā)現(xiàn),這些研究都是一種滯后于教學(xué)的研究成果,語料庫并沒有在當(dāng)前教學(xué)中直接使用,簡而言之,語料庫在對外漢語教學(xué)中依然遠(yuǎn)離課堂教學(xué)。
其實,語料庫還可以在很多方面為對外漢語教學(xué)提供幫助,比如張則順主張在對外漢語教學(xué)中使用“語料庫方法”?!罢Z料庫方法”是一種研究型教學(xué)法,把學(xué)習(xí)者同時看成研究者,鼓勵學(xué)生探索新鮮語料,發(fā)現(xiàn)語言規(guī)律。其優(yōu)勢在于能在課堂中調(diào)動學(xué)生的主觀能動性讓,學(xué)生從被動接受到主動探索,激發(fā)學(xué)生探索目的語的興趣。學(xué)生自己探索總結(jié)出的語言規(guī)律往往印象更加深刻。張則順提出通過語料庫方法可以進(jìn)行語法的講解,比如講解某些虛詞的用法、講解某些實詞的搭配和語義背景、用于話語標(biāo)記的教學(xué)、用于全面展示某個句式或詞的用法;語料庫同時可以應(yīng)用于課堂練習(xí)的設(shè)計,以應(yīng)對固定的教材預(yù)期掌握的重點(diǎn)與學(xué)生實際掌握情況的脫節(jié)問題。
雖然張則順主張的語料庫教學(xué)法還需要滿足4個相對苛刻的條件(學(xué)習(xí)者語言水平要在中級以上;學(xué)習(xí)者為喜歡探索未知世界的主動型學(xué)生;教學(xué)活動中要留有足夠的時間供學(xué)生思考;需要教師將“生”語料加工成“熟”語料)才能自由地施展,但這為我們提供了一種語料庫建設(shè)的新的思路和新的標(biāo)準(zhǔn)。
在對語料庫應(yīng)用情況的文獻(xiàn)的統(tǒng)計中,我們也能看到很多構(gòu)建新的語料庫的構(gòu)想,這些構(gòu)想多為語言學(xué)習(xí)的某一領(lǐng)域服務(wù)。如李如龍認(rèn)為,為了編制高質(zhì)量的配套教材,有必要組織專業(yè)力量研制基礎(chǔ)漢語的語料庫。這種理想的語料庫除了要有科學(xué)、系統(tǒng)的高頻率常用字表、常用詞表、常用句型表、不斷增補(bǔ)的新詞詞語表、多義字組詞詞表,還要有用常用虛詞組成的例句語料庫、口語語料庫、中介語語料庫、韻文語料庫。有了語料庫,執(zhí)教人員就可以根據(jù)教學(xué)需要隨時編寫課文和練習(xí),用來補(bǔ)充已有課本的不足,或用它替換不合用的部分。這對提高教師的業(yè)務(wù)水平和教學(xué)能力都是大有好處的。
呂軍、曹效英討論建設(shè)漢語發(fā)音自動評分系統(tǒng),這就需要籌建兩個語料庫訓(xùn)練發(fā)音單元模型——標(biāo)準(zhǔn)發(fā)音語料庫和非標(biāo)準(zhǔn)發(fā)音語料庫,標(biāo)準(zhǔn)發(fā)音語料庫主要用來訓(xùn)練發(fā)音單元模型,非標(biāo)準(zhǔn)語料庫主要用來通過專家手工訓(xùn)練分級打分模型并測試系統(tǒng)性能,需要具有廣泛的代表性。
由這些構(gòu)建新的語料庫的構(gòu)想可以看出,傳統(tǒng)的語料庫很難滿足對外漢語領(lǐng)域各個方面的需求,更不用說傳統(tǒng)的滯后于課堂的語料庫不能滿足教學(xué)直接應(yīng)用的需求了。當(dāng)然,這與現(xiàn)在研究者所使用的語料庫其研發(fā)的初衷或針對性有關(guān),如“北大語料庫”并非為對外漢語領(lǐng)域量身定做。張則順通過對教師使用語料庫進(jìn)行第二語言教學(xué)的調(diào)查發(fā)現(xiàn),在教學(xué)中使用語料庫的教師微乎其微,經(jīng)常使用語料庫的教師多是在備課階段使用語料庫收集例句,但是教師們坦言現(xiàn)有的母語語料庫不好用,原因大概有這樣幾個方面:1.詞匯量很難控制在HSK詞匯大綱之內(nèi);2.句子結(jié)構(gòu)可能過于復(fù)雜,句子提供的語境難以幫助留學(xué)生清晰明了地理解詞匯含義;3.例句的數(shù)目巨大,教師很難馬上窮盡最有代表性的例句類型。這些原因?qū)е陆處煆恼Z料庫找到的語料仍然需要進(jìn)行二次加工才能應(yīng)用于課堂之中,反而增加了教師的工作量,與通過語料庫尋找語料以節(jié)省備課時間的初衷完全背道而馳。教師們希望有專門的詞匯和語法的例句語料庫可供查找以節(jié)省備課時間。
四、結(jié)語
語料庫分析作為一種可以把語言研究從依靠直覺經(jīng)驗的方法轉(zhuǎn)變?yōu)榱炕y(tǒng)計的方法的手段,為我們研究漢語學(xué)習(xí)者的習(xí)得、研究語言現(xiàn)象的意義和用法、優(yōu)化課堂教學(xué)、研發(fā)專業(yè)辭書和教輔書籍提供了幫助。但傳統(tǒng)語料庫依然游離于課堂教學(xué)之外,傳統(tǒng)語料庫并非全部為對外漢語領(lǐng)域量身定做;類似英語學(xué)習(xí)者語料庫ICLE那么完備的漢語學(xué)習(xí)者語料庫還沒有建立;其他與對外漢語課堂密切相關(guān)的例句語料庫、教材語料庫、口語語料庫很難找到;一線教師不熟悉語料庫的操作和檢索辦法。真正適用于對外漢語課堂教學(xué)的語料庫還有待研發(fā)和建立,這需要語料庫語言學(xué)家、第二語言習(xí)得專家和對外漢語一線教師的通力合作。
參考文獻(xiàn):
[1]杜婷.現(xiàn)代漢語口部動詞研究[D].濟(jì)南:山東大學(xué)碩士學(xué)位論
文,2011.
[2]陳瑛.外國漢語學(xué)習(xí)者漢字偏誤研究[D].上海:華東師范大學(xué)碩
士學(xué)位論文,2011.
[3]鄧林玲.韓國留學(xué)生遞進(jìn)復(fù)句偏誤研究[D].廣州:廣州大學(xué)碩士
學(xué)位論文,2011.
[4]劉穆楠.基于HSK動態(tài)語料庫的留學(xué)生動賓離合詞習(xí)得偏誤研究
[D].武漢:湖北工業(yè)大學(xué)碩士畢業(yè)論文,2012.
[5]呂軍,曹效英.基于語音識別的漢語發(fā)音自動評分系統(tǒng)的設(shè)計與
實現(xiàn)[J].計算機(jī)工程與設(shè)計,2007,(5):1232~1235.
[6]李如龍.對外漢語基礎(chǔ)教材建設(shè)[J].海外華文教育,2010,(2).
[7]謝莉琳.試論對外漢語報刊閱讀課中新詞語的教學(xué)[D].廣州:暨
南大學(xué)碩士畢業(yè)論文,2012.
[8]張雁.對外漢語學(xué)習(xí)詞典動詞釋義方法初探[D].濟(jì)南:山東大學(xué)
碩士學(xué)位論文,2011.
[9]張則順.語料庫如何走進(jìn)對外漢語課堂[R].中國語文現(xiàn)代化學(xué)會
第一屆國際會議暨第九次學(xué)術(shù)會議、語言研究與信息處理國際研討會,2011.
[10]王春磊.淺析語料庫在對外漢語教學(xué)中的作用及其發(fā)展趨勢
[J].南昌教育學(xué)院學(xué)報,2008,(4):25~27.
[11]盧偉.語料庫在對外漢語教學(xué)中的應(yīng)用[J].廈門大學(xué)學(xué)報(哲
學(xué)社會科學(xué)版).1999,(4).
[12]李一霆.三種對外漢語中級口語教材課文分析[D].西安:西安
外國語大學(xué)碩士學(xué)位論文,2012.
[13]王祖嫘.對外漢語課堂教學(xué)語言中詞語和句子的使用情況探究
[D].北京:北京語言大學(xué)碩士學(xué)位論文,2003.