譚曉平
(上海師范大學(xué) 對外漢語學(xué)院,上海 200234)
可比語料庫(comparable corpus)是指內(nèi)容或形式上具有某些相似屬性的語料的集合,可分為多語可比語料庫和單語可比語料庫。前者多應(yīng)用于翻譯研究、機(jī)器翻譯、信息檢索等,后者常應(yīng)用于語言對比研究[1]。本文所構(gòu)建的漢語可比語料庫屬于后者。
在國外,單語可比語料庫應(yīng)用于以下三方面: ①翻譯研究。英國曼徹斯特大學(xué)構(gòu)建的英語可比語料庫(ECC)包括英文譯文語料子庫和原創(chuàng)英文語料子庫。通過該資源可以更好地考察翻譯英語的獨(dú)特性[2]。②區(qū)域語言對比研究。英國倫敦大學(xué)學(xué)院構(gòu)建的國際英語語料庫(ICE)采集了美國、英國、印度、新加坡等23個(gè)地區(qū)的英語語料?;谠撜Z料庫可以更好地研究不同地區(qū)英語的使用特點(diǎn)[3]。③外語教學(xué)與研究。美國密歇根大學(xué)英語學(xué)術(shù)論文語料庫(MICUSP)收錄了英語母語者撰寫的已發(fā)表的英文學(xué)術(shù)論文及不同母語背景英語學(xué)習(xí)者撰寫的尚未發(fā)表的英文學(xué)術(shù)論文。基于該語料庫,可以更好地分析不同母語背景學(xué)習(xí)者在英語學(xué)術(shù)寫作上的特點(diǎn),提高學(xué)習(xí)者學(xué)術(shù)英語的寫作水平[4]。此外,在此類語料庫的基礎(chǔ)上,學(xué)者們還進(jìn)行了學(xué)習(xí)者句法復(fù)雜度、語言流利性及準(zhǔn)確性的研究[5-6]。
漢語可比語料庫的建設(shè)及應(yīng)用主要集中在以下兩方面: ①翻譯研究。西南大學(xué)構(gòu)建的當(dāng)代漢語翻譯小說語料庫(CCTFC)收錄了譯自英、美、法、日等11個(gè)國家八種語言的漢語翻譯小說[7]。英國蘭卡斯特大學(xué)構(gòu)建的漢語可比語料庫由漢語譯文語料庫(ZCTC)和漢語本族語語料庫(LCMC)構(gòu)成[8]。②華語對比研究。例如香港理工大學(xué)的兩岸三地漢語語料庫、香港城市大學(xué)的五地共時(shí)語料庫(LIVAC)以及暨南大學(xué)的全球華語語料庫[9-11]。
可見,與國外可比語料庫的建設(shè)相比,我國尚缺少服務(wù)于漢語二語教學(xué)的可比語料庫資源?,F(xiàn)有對比研究主要依賴于: ①通用平衡語料庫,如國家語委現(xiàn)代漢語通用平衡語料庫、CCL語料庫、BCC語料庫[12-13]。②漢語中介語語料庫,如HSK動(dòng)態(tài)作文語料庫、漢字偏誤標(biāo)注的漢語連續(xù)性語料庫、暨南大學(xué)中介語語料庫。③對外漢語教材語料庫,如北京師范大學(xué)、中山大學(xué)的對外漢語教材語料庫[14-15]。此外,部分學(xué)者還自建了可用于對比研究的語料庫[16-19]。鑒于此,本文以“把”字句為例,探討對外漢語教學(xué)領(lǐng)域可比語料庫的構(gòu)建及應(yīng)用問題。
本文認(rèn)為面向漢語二語教學(xué)的可比語料庫應(yīng)包含自然語料、教材語料、中介語語料,原因在于: 教材語料與母語語料的對比,有助于發(fā)現(xiàn)教材語料與母語語料之間的差異;中介語語料與自然語料的對比,有助于了解學(xué)習(xí)者與母語者的差距;中介語與教材語料的對比,有助于探究語言輸入與輸出的關(guān)系。
本研究的自然語料來自于CCL語料庫(網(wǎng)絡(luò)在線版)。為保證語料的平衡性,我們先從CCL語料庫中檢索出50萬條包含“把”字的語料,然后采用等距提取語料的方法,每隔1 000條語料提取1條,共獲得語料500條。刪除其中不是“把”字句的語料,此外,若一條語料中包含多個(gè)“把”字句,則分別對其進(jìn)行標(biāo)注。最后獲得標(biāo)注語料534條。
教材語料來源于北京師范大學(xué)的對外漢語教材語料庫。該庫包含有141 464條對外漢語教材語料及HSK樣題文本語料。本文從語料庫中提取了三套(17冊)對外漢語教材,分別是《新實(shí)用漢語課本》(1~6冊)(劉珣等 2010)、《博雅漢語》(初級漢語起步篇、準(zhǔn)中級加速篇、中級沖刺篇、高級飛翔篇)(李曉琪等 2013)、《漢語縱橫·精讀課本》(0~6冊)(汝淑媛等 2011)。之所以選擇這三套教材,原因有二: 一是它們都是經(jīng)典的對外漢語教材,能反映出教材編寫的實(shí)際情況;二是它們屬于精讀類教材,與口語或報(bào)刊類教材相比,與自然語料進(jìn)行對比研究時(shí),更具可比性。
中介語語料來源于HSK動(dòng)態(tài)作文語料庫。為了保證三類語料規(guī)模上的一致性,我們從語料庫中隨機(jī)提取了500條包含“把”字句的語料。三類語料的規(guī)模如表1所示。
表1 可比語料庫的規(guī)模及構(gòu)成
需要指出的是,這三類語料的相似或相關(guān)性表現(xiàn)在: 均為漢語語料,規(guī)模相當(dāng),都包含有“把”字句,并進(jìn)行了統(tǒng)一的標(biāo)注加工。
可比語料庫的標(biāo)注分為外部標(biāo)注和內(nèi)部標(biāo)注兩部分,標(biāo)注框架如表2所示。
表2 可比語料庫的標(biāo)注框架
語料類型指標(biāo)注的語料是自然語料、教材語料,還是中介語語料。來源信息需要指出所標(biāo)注的語料來源于哪個(gè)語料庫或網(wǎng)站。體裁包括敘述文、說明文、議論文、應(yīng)用文、演講稿。語體包括對話體、敘述體。教材語料中的課型包括綜合、口語、聽力、閱讀、寫作、文化。教材語料中的適用地區(qū)包括大陸、港澳臺、東南亞、北美洲、南美洲、歐洲、非洲、大洋洲。教材語料和中介語語料中的漢語水平分為初、中、高三個(gè)等級。中介語語料中的使用錯(cuò)誤分為冗余、漏用、錯(cuò)用。需要指出的是,中介語語料中只標(biāo)注使用正確的語法項(xiàng)目的語義類別及結(jié)構(gòu)形式信息。
語法項(xiàng)目是漢語二語教學(xué)中的重要內(nèi)容,涉及各類課型,也貫穿于初、中、高三個(gè)階段。本研究重點(diǎn)進(jìn)行語法項(xiàng)目的標(biāo)注。語法項(xiàng)目不同,其句法語義的標(biāo)注框架也不同,本文以“把”字句為例進(jìn)行說明。
2.2.1 “把”字句的語義標(biāo)注框架
文獻(xiàn)[20-22]從漢語作為第二語言教學(xué)的角度分別將“把”字句分為六類、五類和三類。本文在上述分類的基礎(chǔ)上,結(jié)合標(biāo)注實(shí)踐,形成了 “把”字句語義類別的標(biāo)注框架。與以往分類不同之處在于本研究將“把”字句的語義類別分為三個(gè)級別。第一級別: 處置類、判斷或認(rèn)同類、致使類。第二級別: 將處置類分為強(qiáng)調(diào)動(dòng)作的結(jié)果、強(qiáng)調(diào)轉(zhuǎn)移、強(qiáng)調(diào)動(dòng)作的方式、次數(shù)。第三級別: 將強(qiáng)調(diào)轉(zhuǎn)移類的“把”字句分為具體空間轉(zhuǎn)移、抽象空間轉(zhuǎn)移、時(shí)間上的轉(zhuǎn)移、信息轉(zhuǎn)移。釋義及示例*文中示例來自CCL語料庫。如下所示:
① 強(qiáng)調(diào)動(dòng)作的結(jié)果。例如: 請把門關(guān)上
② 具體空間的轉(zhuǎn)移(處所、人物、單位或組織)。例如: 把書放在外邊|把書給他
③ 抽象空間的轉(zhuǎn)移(范圍、領(lǐng)域、目標(biāo))。例如: 他們把DNA比對技術(shù)應(yīng)用到了相親上
④ 時(shí)間上的轉(zhuǎn)移。例如: 把參觀者帶回到那個(gè)年代
⑤ 信息的轉(zhuǎn)移。例如: 快把這個(gè)消息告訴他
⑥ 強(qiáng)調(diào)動(dòng)作的方式、次數(shù)等。例如: 把價(jià)格一次性提高|把這本書讀三遍
⑦ 表示判斷或認(rèn)同。例如: 把學(xué)生當(dāng)成孩子
⑧ 表示致使。例如: 這事兒把他愁死了
2.2.2 “把”字句結(jié)構(gòu)形式的標(biāo)注框架
文獻(xiàn)[20-21、23-24]分別將“把”字句的結(jié)構(gòu)形式分為18類、10類、16類、20類。本文在以上分類的基礎(chǔ)上,結(jié)合語料標(biāo)注實(shí)踐,將“把”字句的結(jié)構(gòu)形式分為四大類40小類。分類及示例如下所示:
第一類: S+把+N+V+補(bǔ)語
① S+把+N+V+趨向補(bǔ)語。例如: 把學(xué)生的精神力量發(fā)動(dòng)起來。
② S+把+N+V+結(jié)果補(bǔ)語。例如: 如何把我們這個(gè)農(nóng)村中的城市建設(shè)好?
③ S+把+N+V+狀態(tài)補(bǔ)語。例如: 把一方土地組合得鮮艷而且豐滿。
④ S+把+N+V+數(shù)量補(bǔ)語。例如: 把他打了一頓。
⑤ S+把+N1+V+數(shù)量補(bǔ)語+N2。例如: 把他的情況做了一下介紹。
⑥ S+把+N+V+時(shí)量補(bǔ)語。例如: 他們把我的護(hù)照手續(xù)耽誤了一個(gè)星期。
第二類: S+把+N1+V+N2+(來/去)
⑦ S+把+N1+V+N2。例如: 有人把蕭軍在社會上的所作所為告訴了魯迅。
⑧ S+把+N1+V+N2+N3。例如: 把我們公司的客戶名單給他一份。
⑨ S+把+N1+V在+N2。例如: 把聲學(xué)系統(tǒng)應(yīng)用在軍事技術(shù)中。
⑩ S+把+N1+V到+N2。例如: 把它推廣到歐洲。
第三類: S+把+N1+V+補(bǔ)語+N2+(來/去)
第四類: 把+N+V+(其他)
2.2.3 “把”字句的標(biāo)注示例
可比語料庫的外部標(biāo)注存儲為XML格式,內(nèi)部標(biāo)注采用Excel表格的形式。圖1是自然語料中“把”字句句法語義信息的標(biāo)注示例。
圖1 自然語料中“把”字句的句法語義標(biāo)注示例
基于標(biāo)注語料的統(tǒng)計(jì)研究與對比分析,可以進(jìn)一步了解教材編排的特點(diǎn),發(fā)現(xiàn)學(xué)習(xí)者的習(xí)得規(guī)律。下文以“把”字句的數(shù)據(jù)分析為例進(jìn)行說明。
3.1.1 “把”字句語義類別的數(shù)據(jù)統(tǒng)計(jì)與對比分析
“把”字句各種語義類別在三類語料中的分布如表3所示。
需要指出的是: 在表3中,中介語語料的數(shù)據(jù)是基于正確語料的統(tǒng)計(jì)結(jié)果。500條語料中,正確使用了“把”字句的語料共有211條,正確率為42.2%。為了更清楚地顯示“把”字句的語義類別在三類語料中的分布情況并進(jìn)行對比研究,我們先以自然語料的百分比為基準(zhǔn),將統(tǒng)計(jì)結(jié)果按降序從高到低排列,再將排列后的數(shù)據(jù)轉(zhuǎn)換為如圖2所示的折線圖。
表3 語義類別的統(tǒng)計(jì)
圖2 “把”字句語義類別的分布
從圖2可以看出: ①“強(qiáng)調(diào)動(dòng)作的結(jié)果”的“把”字句在三類語料中的使用率在40%及40%以上,教材設(shè)置基本反映了自然語言的實(shí)際情況,學(xué)習(xí)者掌握得也較好。②表示“具體空間轉(zhuǎn)移”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為: 28.1%、38.3%、18.0%,差別較大。與自然語料相比,教材中該類“把”字句的設(shè)置偏多,而學(xué)習(xí)者使用得較少。③表示“抽象空間轉(zhuǎn)移”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為12.2%、3.6%、20.9%,差別較大。與自然語料相比,教材中該類“把”字句的設(shè)置偏少,學(xué)習(xí)者的使用率卻較高。但從教學(xué)經(jīng)驗(yàn)判斷,表示“抽象空間轉(zhuǎn)移”的“把”字句的習(xí)得難度應(yīng)大于表示“具體空間轉(zhuǎn)移”的“把”字句的習(xí)得難度,但為什么從數(shù)據(jù)來看“抽象空間轉(zhuǎn)移”比“具體空間轉(zhuǎn)移”的使用率要高呢?本文認(rèn)為原因有二: 一是學(xué)習(xí)者對“抽象空間轉(zhuǎn)移”的表達(dá)需求高于對“具體空間轉(zhuǎn)移”的表達(dá)需求;二是在語料中,出現(xiàn)了22條“……放在第一位”的語料,使用語境也基本相似。本文推測,大概是因?yàn)檠芯克玫恼Z料取自HSK動(dòng)態(tài)作文語料庫,可能作文題目中出現(xiàn)了這一句型,而考生在寫作過程中模仿著使用了這一句型,從而造成了統(tǒng)計(jì)結(jié)果與教學(xué)經(jīng)驗(yàn)的背離。④“表示判斷或認(rèn)同”類的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為12%、7.7%、10.0%。與自然語料相比,教材中該類“把”字句的設(shè)置偏少,中介語語料中該類“把”字句的使用率基本能反映自然語言的特點(diǎn)。⑤“強(qiáng)調(diào)動(dòng)作的方式、次數(shù)等”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為3%、5.6%、0.9%,與自然語料相比,教材中該類“把”字句設(shè)置偏多,而學(xué)習(xí)者的使用率偏低。⑥表示“信息轉(zhuǎn)移”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為0.9%、2.9%、0.5%,在自然語料、中介語語料中,該類“把”字句的使用率都在1%以下,使用率低,而在教材語料中使用率偏高,說明教材中該類“把”字句的設(shè)置偏多。⑦表示“時(shí)間上的轉(zhuǎn)移”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為0.6%、0.6%、1.4%,教材中該類“把”字句的設(shè)置反映了自然語言的實(shí)際情況,但在中介語語料中的使用率略高,說明學(xué)習(xí)者有一定的表達(dá)需求。⑧“表示致使”的“把”字句在自然語料、教材語料、中介語語料中的使用率分別為0.2%、1.3%、0%。在自然語料、中介語語料中,該類“把”字句的使用率低,教材語料中使用率較高,說明教材過于強(qiáng)調(diào)“表示致使”類“把”字句的學(xué)習(xí)。
從以上分析可以發(fā)現(xiàn): ①教材設(shè)置偏多的“把”字句依次為: 表示具體空間轉(zhuǎn)移、強(qiáng)調(diào)動(dòng)作的方式和次數(shù)等、信息轉(zhuǎn)移、表示致使的“把”字句。教材設(shè)置偏少的“把”字句依次為: 表示抽象空間的轉(zhuǎn)移、表示判斷或認(rèn)同的“把”字句。②學(xué)習(xí)者對于“強(qiáng)調(diào)動(dòng)作的結(jié)果”的“把”字句掌握得較好,但仍須加強(qiáng)對其他類別“把”字句的學(xué)習(xí)。
3.1.2 “把”字句結(jié)構(gòu)形式的數(shù)據(jù)統(tǒng)計(jì)與對比分析
“把”字句的各種結(jié)構(gòu)形式在三類語料中的分布如表4所示。需要指出的是,中介語語料的數(shù)據(jù)是基于正確語料的統(tǒng)計(jì)結(jié)果。
表4 結(jié)構(gòu)形式的統(tǒng)計(jì)結(jié)果
續(xù)表
為更清楚地顯示“把”字句各種結(jié)構(gòu)形式在三類語料中的分布情況并進(jìn)行對比研究,我們先將結(jié)構(gòu)形式分為兩類: 一是自然語料中使用率在1%以上的結(jié)構(gòu)形式;二是使用率在1%以下的結(jié)構(gòu)形式。然后以自然語料為基準(zhǔn),分別將兩類統(tǒng)計(jì)結(jié)果按降序從高到低排列,最后將數(shù)據(jù)轉(zhuǎn)換為如圖3、圖4所示的折線圖。
(1) 自然語料中使用率在1%以上的結(jié)構(gòu)形式
圖3是自然語料中使用率在“1%”以上的“把”字句結(jié)構(gòu)形式在三類語料中的分布情況。
從圖3可以看出: ①自然語料中使用率在1%以上的結(jié)構(gòu)形式有21種,它們在三類語料中的使用率有較大差異。②從教材中“把”字句結(jié)構(gòu)形式的設(shè)置來看, 本文認(rèn)為如果某個(gè)結(jié)構(gòu)形式在教材中的使用率比在自然語料中的使用率多1個(gè)百分點(diǎn),則認(rèn)為教材對于該結(jié)構(gòu)形式的設(shè)置偏離了自然語言的實(shí)際情況,也就是說用教材語料的百分比減去自然語料的百分比,當(dāng)它們之間的“差”在“1%”以上時(shí),說明教材中該結(jié)構(gòu)形式的設(shè)置偏多,而且“差”越大,偏離得越嚴(yán)重。數(shù)據(jù)顯示: 在教材中設(shè)置偏多的結(jié)構(gòu)形式依次為: S+把+N+V+狀態(tài)補(bǔ)語(4.90%)*括號內(nèi)的百分?jǐn)?shù)是教材語料的百分比減去自然語料的百分比的差。、S+把+N1+V+N2(2.40%)、S+把+N1+V在+N2(2.20%)、S+把+N1+V給+N2(1.50%)、S+把+N+AD+V(1.20%)。同樣,用教材語料的百分比減去自然語料的百分比,當(dāng)它們之間的“差”在“-1%”以下時(shí),說明教材設(shè)置偏離了自然語言的實(shí)際情況,而且“差”越小,偏離得越嚴(yán)重。數(shù)據(jù)顯示: 在教材中設(shè)置偏少的結(jié)構(gòu)形式依次為: S+把+N1+V為+N2(-4.60%)、S+把+N1+V到+N2(-2.30%)、S+把+N+V+趨向補(bǔ)語(-1.30%)、S+把+N1+V向+N2(-1.30%)、
圖3 結(jié)構(gòu)形式的分布1
圖4 結(jié)構(gòu)形式的分布2
S+把+N+V(-1.20%)、S+把+N1+V于+N2(-1.10%)。③從中介語語料來看,各結(jié)構(gòu)形式在中介語語料中的使用率均低于自然語料中的使用率。如果某個(gè)結(jié)構(gòu)形式在中介語語料中的使用率小于在自然語料中的使用率,則認(rèn)為需要加強(qiáng)該結(jié)構(gòu)的教學(xué)與學(xué)習(xí),也就是說用中介語語料的百分比減去自然語料的百分比,當(dāng)它們之間的“差”在“-1%”以下時(shí),說明該結(jié)構(gòu)形式是須加強(qiáng)教學(xué)與學(xué)習(xí)的結(jié)構(gòu)形式,而且“差”越小,說明越重要。統(tǒng)計(jì)結(jié)果表明: 需要加強(qiáng)教學(xué)與學(xué)習(xí)的結(jié)構(gòu)形式依次為: S+把+N+V+趨向補(bǔ)語(-11.50%)、S+把+N1+V到+N2(-5.70%)、S+把+N1+V為+N2(-5.70%)、S+把+N+V1+V2(-3.70%)、S+把+N+V+結(jié)果補(bǔ)語(-3.50%)、S+把+N+V+狀態(tài)補(bǔ)語(-2.40%)、S+把+N+V+了(-2.20%)、S+把+N1+V進(jìn)+N2(-2.20%)、S+把+N+V(-2.20%)、S+把+N1+V于+N2(-1.90%)、S+把+N1+V作/做+N2(-1.80%)、S+把+N1+V給+N2(-1.80%)、S+把+N1+V向+N2(-1.70%)、S+把+N1+V上+N2(-1.50%)、S+把+N+V+數(shù)量補(bǔ)語(-1.10%)、S+把+N1+V入+N2(-1.10%)、S+把+N1+V到+N2+來/去(-1.10%)。
(2) 自然語料中使用率在1%以下的結(jié)構(gòu)形式
圖4是自然語料中使用率在“1%”以下的“把”字句結(jié)構(gòu)形式在三類語料中的分布情況。
從圖4可以看出: ①自然語料中使用率在“1%”以下的結(jié)構(gòu)形式有19種,它們屬于低頻用法,并且在三類語料中的分布差異較大。②從教材中“把”字句結(jié)構(gòu)形式的設(shè)置來看,S+把+N+V+著+(N)、S+把+N+V一V這兩種結(jié)構(gòu)形式在教材語料和自然語料中的使用率均為0.4%,S+把+N1+V+時(shí)量補(bǔ)語在教材語料和自然語料中的使用率均為0%,說明教材中這三種結(jié)構(gòu)形式的“把”字句的設(shè)置基本反映了自然語言的使用特點(diǎn)。另外,S+把+N1+V+數(shù)量補(bǔ)語+N2、S+把+N1+V+N2+N3、S+把+N1+V過+N2、S+把+N1+V進(jìn)+N2+來/去、S+把+N1+V下+N2、S+把+N1+V下+N2+來/去、S+把+N1+V出+N2+來/去、S+把+N1+V滿+N2、S+把+N+VV在自然語料中的使用率為0,而它們在教材語料中的使用率在0.2%~0.4%之間,說明教材中這九種結(jié)構(gòu)形式的“把”字句設(shè)置偏多。此外,S+把+N1+V往+N2、S+把+N+一+V、S+把+N1+V至+N2、S+把+N1+V回+N2+來/去、S+把+N+V了V在自然語料中的使用率在0.2%~0.4%之間,而教材語料中的使用率均為0%,說明教材中這五種結(jié)構(gòu)形式的“把”字句設(shè)置略微偏少。③從中介語語料來看,這19種結(jié)構(gòu)形式的“把”字句的使用率均為0%,可見學(xué)習(xí)者對于這19種結(jié)構(gòu)形式較為陌生。但因它們在自然語料中的使用率也較低,因此可不作為重點(diǎn)學(xué)習(xí)的內(nèi)容。
本文在標(biāo)注語料的基礎(chǔ)上,開發(fā)了可比語料的檢索工具,檢索界面如圖5所示。教師通過該檢索工具可以獲取教學(xué)所需的例句,比較教材語料及自然語料的差別,預(yù)測學(xué)習(xí)者可能出現(xiàn)的偏誤。學(xué)習(xí)者也可以通過該檢索工具選擇難易程度適合自己的語料,進(jìn)行自主學(xué)習(xí)。
圖5 可比語料庫的檢索界面
當(dāng)用戶在文本框中輸入“‘把’字句”并點(diǎn)擊“檢索”按鈕后,可以獲得包含該語法項(xiàng)目的教材語料、自然語料和中介語語料。對外漢語教材語料的文本框下設(shè)置有全部、初級、中級、高級四個(gè)按鈕,用戶可以根據(jù)學(xué)習(xí)者的漢語水平,選擇合適的語料。中介語語料文本框下設(shè)置有學(xué)習(xí)者的國籍信息,用戶可以根據(jù)國籍來查看中介語語料。此外,在高級檢索中,用戶還可以根據(jù)“把”字句的語義信息、結(jié)構(gòu)形式來查詢相應(yīng)語料。
本文以“把”字句為例,探討了漢語可比語料庫的構(gòu)建及在漢語二語教學(xué)中的應(yīng)用問題。本文構(gòu)建了一個(gè)包含自然語料、教材語料、介語語料的小型“把”字句可比語料庫,規(guī)模約為11萬字,制訂了“把”字的句法語義標(biāo)注體系,對語料庫中的1 556個(gè)“把”字句進(jìn)行了句法語義標(biāo)注,開發(fā)了檢索界面,探討了該資源在“把”字句教學(xué)與研究中的應(yīng)用。研究發(fā)現(xiàn): 對外漢語教材中表示具體空間轉(zhuǎn)移、強(qiáng)調(diào)動(dòng)作的方式和次數(shù)、信息轉(zhuǎn)移、表示致使的“把”字句偏多,但表示抽象空間轉(zhuǎn)移、判斷或認(rèn)同類的“把”字句偏少。學(xué)習(xí)者對于結(jié)果類“把”字句掌握較好;教材中S+把+N+V+狀態(tài)補(bǔ)語、S+把+N1+V+N2等五種結(jié)構(gòu)形式的“把”字句偏多,但S+把+N1+V為+N2、S+把+N1+V到+N2等六種結(jié)構(gòu)形式的“把”字句偏少。學(xué)習(xí)者需要依次加強(qiáng)S+把+N+V+趨向補(bǔ)語、S+把+N1+V到+N2等17種結(jié)構(gòu)形式的“把”字句的學(xué)習(xí)。研究認(rèn)為,漢語可比語料庫可為教材研究、教材編排、二語習(xí)得研究、課堂教學(xué)提供數(shù)據(jù)支持與語料基礎(chǔ)。此外,可比語料庫的構(gòu)建還有利于提高現(xiàn)有資源的利用率,推動(dòng)資源共享的發(fā)展。
在今后的研究中,將進(jìn)一步擴(kuò)大語料的規(guī)模,從詞匯、句子、篇章層面進(jìn)行對比研究,并進(jìn)一步開發(fā)語料庫的檢索功能,探討其在教師備課、課堂教學(xué)、數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)中的應(yīng)用。
[1] Rapp R, Zweigenbaum P, Sharoff S. Introduction to BUCC 2016[C]//Proceedings of the 9th Workshop on Building and Using Comparable Corporation, 2016.
[2] Laviosa S. The english comparable corpus: A resource and a methodology[J]. Unity in diversity, 1998: 101-112.
[3] Greenbaum S. ICE: the international corpus of English[J]. English Today, 1991, 7(4):3-7.
[4] R?mer U, Wulff S. Applying corpus methods to written academic texts: Explorations of MICUSP[J]. Journal of Writing Research, 2010, 2(2): 99-127.
[5] Mancilla R L, Nihat P, Ahmet O. Akcay. An investigation of native and nonnative English speakers’ levels of written syntactic complexity in asynchronous online discussions[J]. Applied Linguistics,2017,38(1): 112-134.
[6] G?tz S. Fluency in ENL, ESL, EFL: A corpus-based pilot study[C]//Proceedings of the 18th International Congress of Phonetic Sciences, DISS, 2015: 2-5.
[7] 胡顯耀. 基于語料庫的漢語翻譯小說詞語特征研究[J]. 外語教學(xué)與研究,2007,(03):214-220,241.
[8] Xiao, Richard. How different is translated Chinese from native Chinese?: A corpus-based study of translation universals[J]. International Journal of Corpus Linguistics,2010, 15(1): 5-35.
[9] 刁晏斌. 關(guān)于進(jìn)一步深化兩岸四地語言對比研究的思考[J]. 北京師范大學(xué)學(xué)報(bào)(社會科學(xué)版),2016(2):68-75.
[10] Tsou B K. Augmented comparative corpora and monitoring corpus in Chinese: LIVAC and Sketch Search EngineCompared[C]//Proceedings of ACL-IJCNLP 2015, 2015: 1.
[11] 劉華,郭熙. 海外華語語言生活狀況調(diào)查及華語多媒體語言資源庫建設(shè)[J]. 語言文字應(yīng)用,2012(4):125-133.
[12] 靳光瑾,肖航,富麗,等. 現(xiàn)代漢語語料庫建設(shè)及深加工[J]. 語言文字應(yīng)用,2005(2):111-120.
[13] 荀恩東,饒高琦,肖曉悅,等. 大數(shù)據(jù)背景下BCC語料庫的研制[J]. 語料庫語言學(xué),2016(1):93-109,118.
[14] 楊麗姣,肖航. 面向語義搜索的語料庫語境信息標(biāo)注研究[J]. 語言文字應(yīng)用,2015(1):107-116.
[15] 周小兵,薄巍,王樂,等. 國際漢語教材語料庫的建設(shè)與應(yīng)用[J]. 語言文字應(yīng)用,2017(1):125-135.
[16] 馬明艷. 漢語學(xué)習(xí)者書面語作文“口語化”傾向的語體表征[J]. 漢語學(xué)習(xí),2017(1):81-90.
[17] 梁珊珊,楊崢琳. 韓國學(xué)生口語多重因果轉(zhuǎn)折語篇使用情況分析[J]. 世界漢語教學(xué),2016(3):356-367.
[18] 江新,房艷霞,楊舒怡. 漢語母語者和第二語言學(xué)習(xí)者名名組合的理解[J]. 世界漢語教學(xué),2016(2):226-238.
[19] 崔希亮. 歐美學(xué)生漢語介詞習(xí)得的特點(diǎn)及偏誤分析[J]. 世界漢語教學(xué),2005(3):83-95,115-116.
[20] 呂文華. “把”字句的語義類型[J]. 漢語學(xué)習(xí),1994(4):26-28.
[21] 崔希亮. “把”字句的若干句法語義問題[J]. 世界漢語教學(xué),1995(3):12-21.
[22] 呂必松. “把”字短語、“把”字句和“把”字句教學(xué)[J]. 漢語學(xué)習(xí),2010(5):76-82.
[23] 李英,鄧小寧. “把”字句語法項(xiàng)目的選取與排序研究[J]. 語言教學(xué)與研究,2005(3):50-58.
[24] 丁崇明,榮晶. 漢語第二語言學(xué)習(xí)者應(yīng)學(xué)的“把”字句及其變換[J]. 語言文字應(yīng)用,2007(S1):11-18.