• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    語料庫檢索的模式、問題及啟示

    2011-12-05 06:38:16
    當(dāng)代外語研究 2011年10期
    關(guān)鍵詞:賦碼介詞語料庫

    陳 功

    (北京外國語大學(xué),北京,100089)

    1.引言

    目前語料庫已經(jīng)被越來越多的研究者所接受,成為語言研究的“默認(rèn)數(shù)據(jù)源”(Teubert 2005)。通過語料庫檢索軟件對語言現(xiàn)象進(jìn)行檢索,能夠系統(tǒng)地對海量的文本進(jìn)行審視,并且快速獲得該語言現(xiàn)象使用的基礎(chǔ)數(shù)據(jù),如頻數(shù)信息,使我們有可能發(fā)現(xiàn)一些過去從未有機(jī)會發(fā)現(xiàn)的語言事實(Sinclair 1991)??梢哉f,語料庫檢索已經(jīng)成為語言研究的重要手段之一。研究者若能對語料庫進(jìn)行有效、準(zhǔn)確的檢索,不僅可以觀察到豐富的語言現(xiàn)象,還可以從語料庫中獲得科學(xué)、準(zhǔn)確的基礎(chǔ)數(shù)據(jù)。

    然而,在語料庫語言學(xué)研究飛速發(fā)展的過程中,語料庫檢索這一看似簡單實則重要的問題被擱置了下來。本文認(rèn)為,在語料庫用戶結(jié)構(gòu)逐漸多元化的今天,語料庫檢索方面的問題開始凸顯。主要基于以下兩個現(xiàn)實:(1)語料庫研究不再局限于本領(lǐng)域或相關(guān)領(lǐng)域的研究者,不同學(xué)術(shù)背景的研究人員紛紛介入(衛(wèi)乃興2009)。新的研究群體對語料庫研究方法的完全接納需要一個過程,而且并不是所有人都能最終完全掌握。(2)具體到語料庫檢索方面,如今網(wǎng)絡(luò)搜索引擎的強(qiáng)大影響力讓很多研究者誤認(rèn)為,語料庫檢索操作很簡單。但是,在實際檢索過程中,我們往往容易忽略很多重要的細(xì)節(jié),從而導(dǎo)致語言現(xiàn)象的漏檢或誤檢。因此,如果我們對語料庫檢索的有效性和準(zhǔn)確性不給予足夠的重視,語料庫研究的價值可能會大打折扣。

    2.語料庫檢索模式

    對不同格式的語料庫①進(jìn)行檢索,需要相應(yīng)檢索工具的支持,這是語料庫檢索的一個重要前提。檢索工具的性能和局限暫且不論,作為語言研究者,我們更應(yīng)該關(guān)注的是如何最大限度地利用好已有的檢索工具,從語料庫中準(zhǔn)確查找出符合研究目的所需的語言信息。這就要求我們要有針對性地使用不同的檢索模式,以達(dá)到預(yù)期的研究目的。

    按照用戶所使用的檢索語言,我們將常用的語料庫檢索分為以下三種模式:自然語言檢索、人工語言檢索、自然語言和人工語言相結(jié)合的檢索。

    2.1 自然語言檢索

    自然語言檢索,顧名思義,即通過構(gòu)成語料庫文本的字面字符串(literal string)進(jìn)行的語料庫檢索。檢索項可以是任意的單詞、短語或句子。是三種模式中最簡單易學(xué)的檢索方式,主要有以下兩方面的優(yōu)勢:(1)該檢索模式的操作方式簡單,往往是研究者在研究初期觀察語料時最常用、最便捷的檢索方式。通過觀察索引行可以幫助研究者判斷該語言現(xiàn)象是否具有深入研究的價值;(2)對于語料庫初學(xué)者來說,直接使用自然語言進(jìn)行檢索更符合其行為習(xí)慣,而且容易上手,因此他們大多傾向于使用自然語言檢索。目前,我國語料庫研究者能夠從互聯(lián)網(wǎng)獲取的通用性英語語料庫檢索工具已經(jīng)達(dá)10余種(李亮2007),基本上都支持自然語言檢索。

    然而,自然語言檢索模式往往無法滿足較為復(fù)雜的研究需求。例如,在英語三詞復(fù)雜介詞②的研究中,如果使用自然語言檢索模式,研究者首先需要解決的問題就是如何窮盡所有的三詞復(fù)雜介詞。在這種模式下,語料庫檢索反而變得復(fù)雜、繁瑣,而且無法充分利用語料庫研究方法的優(yōu)勢。可見,自然語言檢索模式雖簡單易懂,但其有限的檢索表達(dá)能力在實際研究中局限性較大。

    2.2 人工語言檢索

    所謂人工語言檢索,其實是相對于自然語言檢索而言的。這里探討的人工語言主要有兩種③:語料庫標(biāo)注碼和正則表達(dá)式。兩者產(chǎn)生的目的和發(fā)展階段雖各不相同,但都是根據(jù)自然語言設(shè)計的規(guī)范性人造語言,為語料庫研究突破自然語言檢索模式的局限提供了最大限度的可能性。

    2.2.1 語料庫標(biāo)注碼檢索

    多層級標(biāo)注是對語料庫進(jìn)行深度分析的必備條件(梁茂成2006)。因此,標(biāo)注碼檢索模式下,首先要求對語料庫生文本(raw text)做進(jìn)一步加工,按照制定好的標(biāo)注方案對語料庫進(jìn)行標(biāo)注,如詞性標(biāo)注、句法標(biāo)注、語義標(biāo)注等,才能“從語言學(xué)的角度對語料庫進(jìn)行解釋”(Leech 1997:2)。目前通行的英語語料庫大部分都為研究者提供了帶有詞性標(biāo)注的語料(POS tagged data)。

    標(biāo)注給語料庫增加了信息,也就意味著,研究者可以充分利用這些信息拓展自己的研究。Tognini-Bonelli(2001)認(rèn)為標(biāo)注使得語言的結(jié)構(gòu)容易把握,方便從抽象層面進(jìn)行語言研究。這是該檢索模式的一大優(yōu)勢。以詞性標(biāo)注為例,詞性賦碼大多是在傳統(tǒng)語言學(xué)詞類劃分的基礎(chǔ)上設(shè)計的,因此,同類詞的賦碼便具有共同的特征,如在CLAWS賦碼集中,情態(tài)動詞的碼為VM。也就是說,只需檢索VM就可以得到包含所有情態(tài)動詞的索引行和相關(guān)數(shù)據(jù)。Hunston(2002/2006:79)把這種通過標(biāo)注碼進(jìn)行語料庫研究的方法稱為“基于類”(category-based)的研究方法。其檢索項可以是單個碼或者多碼序列,取決于研究者的研究目的。

    顯然,與基于自然語言的檢索相比,使用標(biāo)注碼進(jìn)行語料庫檢索在研究某一類語言現(xiàn)象上優(yōu)勢明顯,但在使用中也存在一些問題。首先,對于多數(shù)初級用戶而言,對不同格式標(biāo)注碼的熟悉和靈活使用需要一個過程。其次,任何一種語料庫標(biāo)注碼的設(shè)計都不是完美的,這也會給研究帶來不可避免的問題。我們將在第三部分做進(jìn)一步探討。

    2.2.2 正則表達(dá)式檢索

    正則表達(dá)式成熟于計算機(jī)程序匯編工作中對文本處理的需求。有著同樣需求的語料庫語言學(xué)研究者正是看到了正則表達(dá)式出色的文本處理能力,而將其應(yīng)用到了語料庫研究中來?!斑@種技術(shù)簡潔而功能強(qiáng)大,可以用為數(shù)不多的幾個符號來匹配各種存在一定規(guī)律的字符串?!梢詷O大地提高檢索效率,因此正則表達(dá)式是語料庫檢索和文本清潔過程中必備的技術(shù)”(梁茂成等2010:17)。

    與語料庫詞性賦碼的類屬相比,正則表達(dá)式的一些符號可以表示比字符串更大范圍的“類”的概念,如S(表示所有非空格)、w(表示所有的字母、數(shù)字和下劃線)、d(表示所有的數(shù)字);還可以表示字符串的數(shù)量等,如{1,}表示字符串使用一次以上,那么very{1,}可以匹配very使用一次以上的情況。不過,單單使用正則表達(dá)式往往無法實現(xiàn)對具體語言現(xiàn)象的檢索。因此,在實際的語料庫應(yīng)用研究中,正則表達(dá)式通常會和語料庫標(biāo)注碼或字符串一起作為檢索項使用,以便更準(zhǔn)確地定位檢索目標(biāo),實現(xiàn)較好的查準(zhǔn)率。例如,如果要在CLAWS賦碼文本中觀察have所有形式的使用情況,則可以通過兩種人工語言相結(jié)合的方式,檢索“w+_VHw”④輕松得到觀察語料。目前,大部分語料庫檢索軟件和文本處理工具都支持正則表達(dá)式。

    近年來,越來越多的語料庫研究者已經(jīng)意識到了正則表達(dá)式在語料庫檢索和文本處理中的強(qiáng)大功能。但是,對于大多數(shù)非計算機(jī)專業(yè)背景的研究者來說,正則表達(dá)式是一種完全不熟悉的語言,加之其易讀性差,導(dǎo)致用戶在理解和接受方面還存在困難,這在一定程度上也限制了該檢索模式的推廣。為了讓更多的研究者能夠享受正則表達(dá)式帶來的便捷,國內(nèi)學(xué)者,如梁茂成教授,為此做了一系列的努力,編寫出了國內(nèi)第一款免費的正則表達(dá)式編寫輔助工具Pattern Builder(參見梁茂成2009;梁茂成等2010),不僅可以方便初學(xué)者了解正則表達(dá)式在檢索中的作用,還為中高級用戶提供了正則表達(dá)式測試功能。

    2.3 自然語言和人工語言相結(jié)合的檢索

    在實際的語料庫研究中,除了自然語言檢索和人工語言檢索之外,還有一種非常重要的檢索模式,即將自然語言和人工語言相結(jié)合進(jìn)行檢索。簡單來講,就是將“字符串+語料庫標(biāo)注碼”、“字符串+正則表達(dá)式”或“字符串+語料庫標(biāo)注碼+正則表達(dá)式”作為檢索項的檢索模式。目的是為了最大限度地準(zhǔn)確完成研究者制定的檢索任務(wù)。

    例如,在CLAWS賦碼的文本中觀察“it is+形容詞+that…”結(jié)構(gòu),可將檢索項寫為:

    it_(S+)sis_(S+)s(S+)_JJsthat_(S+)

    這個檢索項包含了字符串(it,is,that)、語料庫詞性標(biāo)注碼(JJ,表示普通形容詞)和正則表達(dá)式(S+和s,其中S+用于匹配未知的標(biāo)注碼或詞,s表示空格)。檢索結(jié)果如下圖所示:

    不難看出,組合檢索模式不僅突破了自然語言有限的檢索表達(dá)能力,還發(fā)揮了人工語言在類屬關(guān)系等方面的優(yōu)勢。具體來說,組合模式一方面利用字符串或標(biāo)注碼進(jìn)行精確定位,另一方面借助正則表達(dá)式強(qiáng)大的匹配功能進(jìn)行查找,有效實現(xiàn)了對某一語言現(xiàn)象的檢索??梢灶A(yù)見,這種組合模式的檢索將在語料庫研究中發(fā)揮愈加重要的作用,應(yīng)該引起研究者的關(guān)注。

    3.語料庫檢索中可能存在的問題及原因

    在語料庫研究中,我們不僅需要根據(jù)研究內(nèi)容選擇有效的檢索模式,同時也要確保檢索過程的科學(xué)性和檢索結(jié)果的準(zhǔn)確性。作為語料庫研究的前期工作之一,語料庫檢索對后續(xù)的研究意義重大。因為通過初期檢索獲得的基礎(chǔ)數(shù)據(jù),如頻數(shù),往往成為研究者進(jìn)一步進(jìn)行統(tǒng)計檢驗和分析的基礎(chǔ),基礎(chǔ)數(shù)據(jù)一旦出現(xiàn)問題,將會給整個研究帶來顛覆性的后果。而“作為語料庫研究的一個基本前提,數(shù)據(jù)及其算法的準(zhǔn)確性具有至高無上的重要性”(陳功、梁茂成2010)。因此,我們對語料庫檢索需持科學(xué)謹(jǐn)慎的態(tài)度。

    3.1 語料庫檢索的問題

    語料庫檢索過程中可能發(fā)生這樣或者那樣的問題,對各種因素或細(xì)節(jié)的忽視都會導(dǎo)致檢索結(jié)果的不準(zhǔn)確。下面分別用兩個簡單的案例說明:

    案例一:

    檢索對象:英語三詞復(fù)雜介詞,如bymeansof,intermsof等;

    檢索文本:經(jīng)過CLAWS自動詞性賦碼后的語料庫(LOCNESS),其中三詞復(fù)雜介詞有統(tǒng)一的賦碼,如:in_II31terms_II32of_II33;

    檢索項:根據(jù)CLAWS三詞復(fù)雜介詞賦碼的特性,將檢索項設(shè)置為:

    (S+_II31)s(S+_II32)s(S+_II33)

    檢索結(jié)果:經(jīng)過人工核對,能夠全部檢索出帶有相應(yīng)標(biāo)注碼的三詞復(fù)雜介詞,說明該檢索模式還是有效的。但是通過反向隨機(jī)檢查⑤卻發(fā)現(xiàn),部分研究內(nèi)容由于被賦予了其他形式的標(biāo)注碼而被遺漏,如by_IIvirtue_NN1of_IO,for_IFpurposes_NN2of_IO等。

    案例二:

    檢索對象:形容詞最高級中使用most的情況,如themostsignificant;

    檢索文本:WECCL(1.0)賦碼語料庫;

    檢索項:根據(jù)已知項和待檢項,設(shè)置如下:

    (the_AT)s(most_RGT)s(S+_JJ)

    檢索結(jié)果:未找到匹配的檢索對象。檢索失敗的原因是:檢索項編寫格式與文本標(biāo)注格式不一致,即WECCL(1.0)語料庫詞性賦碼格式為:“單詞+空格+<詞性標(biāo)注碼>”,如“the ”,而上述檢索表達(dá)式是按照“單詞_詞性標(biāo)注碼”的賦碼格式編寫而成的。因此,應(yīng)該將檢索項設(shè)置為:

    (thes)s(mosts)s(S+s)

    3.2 語料庫檢索問題之原因分析

    通過上述兩個簡單的案例可以發(fā)現(xiàn),語料庫檢索需要考慮許多方面的因素,有時即便是忽略一個空格都會造成檢索結(jié)果的不準(zhǔn)確,而“檢索的效果會直接影響到研究的信度”(梁茂成等2010:70)。因此,在語料庫檢索中,研究者要結(jié)合研究目的設(shè)計準(zhǔn)確的檢索模式,做到精確檢索。當(dāng)然,還要找出容易導(dǎo)致檢索失誤的原因,這對提升語料庫檢索的準(zhǔn)確性意義重大。本文認(rèn)為,語料庫檢索結(jié)果不準(zhǔn)確可能是由客觀和主觀兩方面因素造成的。

    3.2.1 客觀因素

    研究者有時會在語料庫檢索的實際操作中發(fā)現(xiàn),有些困難和問題是難以避免的。然而,不論如何,我們都應(yīng)對其根本原因有客觀充分的認(rèn)識。

    (1) 不論是語料庫加工者還是語料庫應(yīng)用研究者,對語言的認(rèn)識都是有限的。相應(yīng)地,為語料庫添加語言學(xué)信息的深度也是有限的,標(biāo)注碼的設(shè)計也無法做到盡善盡美。例如,what在CLAWS詞性賦碼文本中被標(biāo)注為DDQ(wh-determiner),而what在具體使用中絕非只有這一種用法,如what在感嘆句中的標(biāo)注就值得我們考慮(What_DDQa_ATterrible_JJlife_NN1 !_!)。那么,標(biāo)注碼的設(shè)計到底應(yīng)該細(xì)致到何種程度才算合適?過于寬泛,則無法反映語言的特殊現(xiàn)象;過于細(xì)致,卻容易失去分類的意義。在大量的語料面前,這個矛盾讓語料庫加工者很難找到一個合理的平衡。而這個問題對語料庫應(yīng)用者的實際操作來說也有不小的影響,很多時候,我們只能通過人工判斷來篩選合乎研究目的的檢索結(jié)果。

    (2) 自然語言是在不斷發(fā)展變化的,相對而言,語料庫標(biāo)注碼的設(shè)計則略顯滯后。在面對一些尚處在發(fā)展過程中、或尚未進(jìn)入詞典的語言現(xiàn)象時,標(biāo)注碼的設(shè)計者可能會有所忽略。例如,案例一中CLAWS對英語三詞復(fù)雜介詞的標(biāo)注,就可能遺漏了一些語言現(xiàn)象。其中inregardto被標(biāo)注為in_II31regard_II32to_II33,而inregardsto則被標(biāo)注成了in_RPregards_VVZto_II。顯然,CLAWS詞性標(biāo)注碼的設(shè)計者將inregardto放在了固定復(fù)雜介詞之列,而未給inregardsto一個合理的身份。然而,通過BNC在線檢索系統(tǒng)(http:∥corpus.byu.edu/bnc/)檢索發(fā)現(xiàn),inregardto使用頻率為3次,而inregardsto出現(xiàn)了7次;只不過兩者出現(xiàn)的語體有所差異,前者均出現(xiàn)在書面語正式文體中,而后者則多出現(xiàn)在口語中。由此,我們至少可以肯定,inregardsto在語言使用中的地位已經(jīng)基本確立。對于我們語料庫應(yīng)用研究者來說,一旦發(fā)現(xiàn)類似的、由于語言演變造成的標(biāo)注碼滯后問題,唯一的補(bǔ)救辦法就是在經(jīng)過考證之后,修改語料庫中的賦碼,并加以說明,使檢索結(jié)果盡可能科學(xué)準(zhǔn)確。

    (3) 語料庫標(biāo)注的誤差。馮志偉(2009:xxviii)總結(jié)了學(xué)術(shù)界對語料庫標(biāo)注的批評,其中一種批評認(rèn)為,“手工標(biāo)注的語料庫準(zhǔn)確性高而一致性差,自動或半自動的標(biāo)注一致性高而準(zhǔn)確性差,語料庫的標(biāo)注難以做到兩全其美?!币宰詣釉~性標(biāo)注為例,CLAWS7對英語本族語者書面語進(jìn)行自動標(biāo)注時,賦碼準(zhǔn)確率可達(dá)到96%~97%(梁茂成2006)。雖然達(dá)到這樣的準(zhǔn)確率已實屬不易,但誤差是客觀存在的,如CLAWS將in_RPregards_VVZto_II中的regards標(biāo)為動詞第三人稱單數(shù)顯然是不對的。因此,作為研究者,我們在檢索中要注意細(xì)心觀察索引行,及時排除類似問題。尤其在使用人工標(biāo)注的語料庫時,更要警惕標(biāo)注一致性的問題。

    3.2.2 主觀因素

    客觀因素雖然存在,但主觀因素往往是導(dǎo)致語料庫檢索出現(xiàn)問題的直接原因。主要有以下幾個方面:

    (1) 未做好檢索項的設(shè)計。在考慮檢索需求時,語料庫研究者應(yīng)該盡可能全面地考慮某一語言現(xiàn)象的各種使用情況。比如,理論上,修飾名詞的形容詞可以有無窮多個,那么我們在編制檢索項時就應(yīng)該盡量照顧到這個現(xiàn)象。只有充分考慮各種可能性,才能使語料庫檢索結(jié)果盡可能窮盡所有的相關(guān)語言現(xiàn)象。但是規(guī)則之后總是潛藏著一些例外。比如,絕大部分的形容詞都在名詞之前做修飾語,但也有一些只能位于名詞之后。而哪些問題可解決,哪些問題不可避免,都是我們在研究前期的不斷嘗試中應(yīng)該考慮清楚的。

    (2) 未了解語料庫文本的特征。在進(jìn)行語料庫檢索之前,研究者首先需要認(rèn)識文本,確定研究應(yīng)使用生文本還是經(jīng)過標(biāo)注的文本。如果是經(jīng)過標(biāo)注的語料庫,則要確認(rèn)標(biāo)注內(nèi)容(是詞性標(biāo)注,還是句法標(biāo)注、語義標(biāo)注,或錯誤標(biāo)注等)、標(biāo)注格式⑥(即單詞和標(biāo)注信息的組合呈現(xiàn)方式),以及所依據(jù)的標(biāo)注集(tagset)分別是什么。案例二中的檢索失敗就是由于不了解語料庫賦碼文本的格式導(dǎo)致的。

    (3) 未了解檢索工具的設(shè)置。檢索工具啟動之后均表現(xiàn)為系統(tǒng)的默認(rèn)設(shè)置,如AntConc3.2.2w啟動之后,Search Term默認(rèn)設(shè)置為Words,不區(qū)分大小寫,File Setting為.txt文件,Tag setting為Show tags等等。如果研究有特殊要求,我們就應(yīng)該對檢索工具進(jìn)行重新設(shè)置。如果想用AntConc3.2.2w檢索What一詞在句首的使用情況,就應(yīng)將Search Term的第二個選項Case選中,同時在檢索框中輸入首字母大寫的What(參見下圖)。

    同理,需要使用正則表達(dá)式進(jìn)行檢索時,也要點擊Regex的復(fù)選框進(jìn)行設(shè)置。

    (4) 未做好人工核準(zhǔn)工作。語料庫研究有了工具的輔助,并不意味著單靠工具就可以得到準(zhǔn)確的結(jié)果,相反,語料庫檢索的每一步都離不開研究者的檢查核對。首先,檢索項編寫好之后要反復(fù)測試,以便盡可能窮盡相關(guān)內(nèi)容,在使用正則表達(dá)式時尤其應(yīng)該注意其匹配范圍。其次,要對檢索結(jié)果進(jìn)行反查,以便及時發(fā)現(xiàn)遺漏問題。另外,需要注意的是,為了不遺漏任何一例語言現(xiàn)象,檢索項設(shè)置時往往需要擴(kuò)大匹配目標(biāo),但同時也不可避免地導(dǎo)致了冗余語例的出現(xiàn)。因此,還需要人工判斷檢索結(jié)果,剔除不相關(guān)內(nèi)容。

    4.結(jié)語

    語料庫檢索是一個反復(fù)的、循環(huán)式的、不斷完善優(yōu)化檢索結(jié)果的過程。語料庫檢索的有效性和準(zhǔn)確性應(yīng)該成為研究者密切關(guān)注的問題。“能否使用正確的方法對不同格式的語料庫文本進(jìn)行檢索是語料庫數(shù)據(jù)分析和提取的關(guān)鍵”(梁茂成等2010:57)。做好一次語料庫檢索,其實現(xiàn)過程要比聽上去復(fù)雜得多,這其中的每一個環(huán)節(jié)都需要研究者認(rèn)真對待。我們反對唯工具論,語料庫研究工具固然是研究的有力助手,但卻愈發(fā)需要研究者深刻思想的指引和嚴(yán)謹(jǐn)細(xì)致的科學(xué)態(tài)度的規(guī)范。正像Hunston(2002/2006:214)的感慨一樣:“語料庫使生活變得更加簡單,但語料庫同時也使生活變得更加復(fù)雜”,語料庫研究不僅僅讓我們“更加無法忽略語言本身無限的復(fù)雜性”,也需要我們能夠正視研究過程的復(fù)雜性并謹(jǐn)慎對待之。

    附注:

    ① 主要指未經(jīng)過標(biāo)注(raw)或經(jīng)過標(biāo)注(tagged)的語料庫。其中,標(biāo)注過的語料庫也可能有不同的呈現(xiàn)方式,詳見附注⑥。

    ② 英語復(fù)雜介詞(complex preposition)指的是在語義和句法功能上與單個介詞相同的多詞序列,包括兩詞組合(becauseof)、三詞組合(bymeansof)以及四詞組合(asaresultof)等(Biberetal.1999:75)。

    ③ 嚴(yán)格來講,一些檢索工具指定的通配符也可以在語料庫檢索中發(fā)揮積極的作用,但是由于各個檢索工具的通配符并不一定有統(tǒng)一的設(shè)置標(biāo)準(zhǔn),因此,本文在此暫不做討論。

    ④ 在“w+_VHw”這個表達(dá)式中,w+匹配have所有的形式,VH為have各形式詞性標(biāo)注碼中共有的前兩位,后面的w匹配一個字母、數(shù)字或下劃線,也就是說“VHw”可匹配have所有形式的詞性標(biāo)注碼,如VH0(have原形)、VHZ(has)、VHG(having)等。

    ⑤ 得到檢索結(jié)果后,通過觀察所有三詞復(fù)雜介詞的組合規(guī)律,發(fā)現(xiàn)第一位上的介詞通常為in,by,for,on,with,as,而最后一位上的介詞通常為of,from,to,for,with。這樣,便可以通過這些已知信息反過來對檢索結(jié)果進(jìn)行核查,如(in_S+)s+(S+_S+)s+(of_S+)。

    ⑥ 以詞性標(biāo)注為例,呈現(xiàn)方式主要有以下幾種:word_tag,word,word,word/tag,word。

    Biber, D., S.Johansson, G.Leech, S.Conrad & E.Finegan.1999.LongmanGrammarofSpokenandWrittenEnglish[M].London: Longman.

    Hunston, S.2002/2006.CorporainAppliedLinguistics[M].Beijing: World Publishing Corporation.

    Leech, G.1997.Introducing corpus annotation [A].In R.Garsideetal.(eds.).CorpusAnnotation:LinguisticInformationfromComputerTextCorpora[C].London/New York: Longman.1-18.

    Sinclair, J.1991.Corpus,Concordance,Collocation[M].Oxford: Oxford University Press.

    Teubert, W.2005.My version of corpus linguistics [J].InternationalJournalofCorpusLinguistics10(1): 1-13.

    Tognini-Bonelli, E.2001.CorpusLinguisticsatWork[M].Amsterdam/Philadelphia: John Benjamins.

    陳功、梁茂成.2010.首屆全國學(xué)習(xí)者語料庫專題研討會綜述[J].外語電化教學(xué)134:77-80.

    馮志偉.2009.導(dǎo)讀[A].R.Mitkov.牛津計算語言學(xué)手冊[M].北京:外語教學(xué)與研究出版社.

    李亮.2007.英語語料庫檢索工具的設(shè)計理念及其深層化[J].外語電化教學(xué)118:16-20.

    梁茂成.2006.學(xué)習(xí)者英語書面語料自動詞性賦碼的信度研究[J].外語教學(xué)與研究(4):279-286.

    梁茂成.2009.詞性賦碼語料庫的檢索與正則表達(dá)式的編寫[J].中國外語教育(2):65-73.

    梁茂成、李文中、許家金.2010.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社.

    衛(wèi)乃興.2009.語料庫語言學(xué)的方法論及相關(guān)理念[J].外語研究(5):36-42.

    猜你喜歡
    賦碼介詞語料庫
    基于實物“ID”的變電站整站賦碼管控系統(tǒng)及方法研究
    吉林電力(2022年2期)2022-11-10 09:24:38
    介詞和介詞短語
    《語料庫翻譯文體學(xué)》評介
    介詞不能這樣用
    把課文的優(yōu)美表達(dá)存進(jìn)語料庫
    基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
    語言與翻譯(2015年4期)2015-07-18 11:07:45
    煙包二維碼賦碼離線還是凹印在線?
    中短單,我們選擇小盒賦碼
    嬰幼兒奶粉監(jiān)管新政引發(fā)賦碼技術(shù)熱潮
    語料庫語言學(xué)未來發(fā)展趨勢
    亚洲一区高清亚洲精品| 一a级毛片在线观看| 动漫黄色视频在线观看| 久久精品亚洲精品国产色婷小说| 国产又黄又爽又无遮挡在线| 国产真实乱freesex| 亚洲精品影视一区二区三区av| 五月玫瑰六月丁香| 18禁黄网站禁片免费观看直播| 成人国产一区最新在线观看| 久久国产精品影院| 一级毛片高清免费大全| 亚洲不卡免费看| 欧美色欧美亚洲另类二区| 免费看十八禁软件| 90打野战视频偷拍视频| 国产精品,欧美在线| 国产三级在线视频| 国产精品99久久99久久久不卡| 最近最新中文字幕大全电影3| 蜜桃亚洲精品一区二区三区| 亚洲人成伊人成综合网2020| 黄色片一级片一级黄色片| 亚洲七黄色美女视频| 丰满的人妻完整版| 12—13女人毛片做爰片一| 日韩欧美在线乱码| 亚洲在线观看片| 一卡2卡三卡四卡精品乱码亚洲| 99热6这里只有精品| 男插女下体视频免费在线播放| 日韩欧美免费精品| 国产欧美日韩精品亚洲av| 国产欧美日韩一区二区三| 亚洲精品在线观看二区| 精品国产亚洲在线| 国产成+人综合+亚洲专区| xxx96com| 精品日产1卡2卡| 成年免费大片在线观看| 18禁美女被吸乳视频| 久久久久久大精品| 国产精品三级大全| 老汉色av国产亚洲站长工具| 美女黄网站色视频| 一区福利在线观看| 国产精品,欧美在线| 黄片小视频在线播放| 久久婷婷人人爽人人干人人爱| 亚洲国产精品999在线| 久久久久久人人人人人| 亚洲 欧美 日韩 在线 免费| 欧美+日韩+精品| 国产色婷婷99| 在线播放国产精品三级| 99热6这里只有精品| 国产成人影院久久av| 男女下面进入的视频免费午夜| 尤物成人国产欧美一区二区三区| 97超级碰碰碰精品色视频在线观看| 毛片女人毛片| 69av精品久久久久久| 女生性感内裤真人,穿戴方法视频| 少妇丰满av| 中文字幕av成人在线电影| 免费av不卡在线播放| 日韩免费av在线播放| 久久欧美精品欧美久久欧美| 黄色成人免费大全| 欧美乱色亚洲激情| 啦啦啦韩国在线观看视频| 婷婷丁香在线五月| 无人区码免费观看不卡| 亚洲五月婷婷丁香| 母亲3免费完整高清在线观看| 噜噜噜噜噜久久久久久91| 国产高清视频在线观看网站| 午夜a级毛片| 国产三级在线视频| 久久精品人妻少妇| 久久精品91蜜桃| 少妇高潮的动态图| 欧美日本视频| 成人一区二区视频在线观看| 中文在线观看免费www的网站| 欧洲精品卡2卡3卡4卡5卡区| 首页视频小说图片口味搜索| 国产淫片久久久久久久久 | 日韩欧美国产在线观看| 久久久国产成人精品二区| 18禁黄网站禁片午夜丰满| 日韩欧美精品免费久久 | 亚洲av免费在线观看| avwww免费| 日韩欧美精品v在线| 日韩欧美国产一区二区入口| 亚洲精品在线美女| 免费av不卡在线播放| 国产毛片a区久久久久| 757午夜福利合集在线观看| 一区二区三区国产精品乱码| 天堂网av新在线| 99热这里只有是精品50| 99久久成人亚洲精品观看| 色综合欧美亚洲国产小说| 蜜桃亚洲精品一区二区三区| 日本黄色片子视频| 国产成人aa在线观看| 亚洲欧美日韩高清专用| 成人性生交大片免费视频hd| www.www免费av| 一个人免费在线观看电影| 亚洲性夜色夜夜综合| 18禁美女被吸乳视频| 最近最新免费中文字幕在线| 1024手机看黄色片| 在线观看免费午夜福利视频| 亚洲成人久久爱视频| 国产成人aa在线观看| 热99re8久久精品国产| 亚洲一区高清亚洲精品| 99久国产av精品| 欧美日韩亚洲国产一区二区在线观看| 成熟少妇高潮喷水视频| 高清在线国产一区| 欧美最黄视频在线播放免费| 中文字幕高清在线视频| 特级一级黄色大片| 一个人看的www免费观看视频| 全区人妻精品视频| 国产午夜福利久久久久久| 精品一区二区三区人妻视频| 亚洲专区中文字幕在线| 婷婷精品国产亚洲av在线| 国产成人系列免费观看| 少妇丰满av| 精品乱码久久久久久99久播| 日本精品一区二区三区蜜桃| 亚洲内射少妇av| 久久久久久大精品| 亚洲欧美日韩卡通动漫| 久久性视频一级片| 丰满人妻熟妇乱又伦精品不卡| 亚洲第一电影网av| 午夜久久久久精精品| 天堂网av新在线| 精品久久久久久久人妻蜜臀av| 国产伦在线观看视频一区| 伊人久久精品亚洲午夜| 婷婷亚洲欧美| 小说图片视频综合网站| 亚洲精品在线美女| 亚洲精品在线观看二区| 日韩欧美精品v在线| 男女下面进入的视频免费午夜| 国产精品,欧美在线| 欧美性猛交黑人性爽| 欧美日韩乱码在线| 18禁裸乳无遮挡免费网站照片| 1024手机看黄色片| 99热6这里只有精品| 久久精品国产99精品国产亚洲性色| 91麻豆av在线| 国产精品亚洲美女久久久| 国产亚洲精品久久久久久毛片| 久久久久久久久中文| 欧美+日韩+精品| 网址你懂的国产日韩在线| 国产真实伦视频高清在线观看 | 国产又黄又爽又无遮挡在线| 9191精品国产免费久久| 亚洲av五月六月丁香网| 国产乱人视频| 草草在线视频免费看| 九九久久精品国产亚洲av麻豆| 淫秽高清视频在线观看| 欧美一区二区亚洲| 国模一区二区三区四区视频| 久久午夜亚洲精品久久| 99久久精品国产亚洲精品| 亚洲avbb在线观看| 国产精品一区二区免费欧美| 国产精品野战在线观看| 亚洲一区二区三区不卡视频| 成人特级黄色片久久久久久久| 亚洲精品在线美女| 欧美绝顶高潮抽搐喷水| 免费一级毛片在线播放高清视频| 亚洲av成人精品一区久久| 搡老熟女国产l中国老女人| 国产精品乱码一区二三区的特点| 一区二区三区激情视频| 国产三级中文精品| 91麻豆精品激情在线观看国产| 十八禁网站免费在线| 午夜亚洲福利在线播放| 国模一区二区三区四区视频| 两人在一起打扑克的视频| 亚洲avbb在线观看| 国产av麻豆久久久久久久| 色老头精品视频在线观看| 成年女人看的毛片在线观看| av天堂在线播放| 他把我摸到了高潮在线观看| av在线天堂中文字幕| 日韩av在线大香蕉| 欧美成狂野欧美在线观看| x7x7x7水蜜桃| 欧洲精品卡2卡3卡4卡5卡区| 欧美乱码精品一区二区三区| 国产精品99久久99久久久不卡| 亚洲真实伦在线观看| 亚洲精品色激情综合| 亚洲av一区综合| 性色avwww在线观看| 欧美一级毛片孕妇| 脱女人内裤的视频| 免费av不卡在线播放| 999久久久精品免费观看国产| 村上凉子中文字幕在线| 男女下面进入的视频免费午夜| 亚洲熟妇熟女久久| 亚洲欧美日韩卡通动漫| 1024手机看黄色片| 一卡2卡三卡四卡精品乱码亚洲| 国产探花在线观看一区二区| www日本在线高清视频| 一进一出抽搐gif免费好疼| 久久99热这里只有精品18| 久久久久久大精品| 性色avwww在线观看| 99热6这里只有精品| 法律面前人人平等表现在哪些方面| 内射极品少妇av片p| 日韩欧美精品v在线| 观看美女的网站| 可以在线观看的亚洲视频| 日本三级黄在线观看| netflix在线观看网站| 国内精品美女久久久久久| 一a级毛片在线观看| 亚洲av一区综合| 美女 人体艺术 gogo| 国产成人av激情在线播放| 成人高潮视频无遮挡免费网站| 精品一区二区三区人妻视频| 国产一区二区在线观看日韩 | 日日干狠狠操夜夜爽| 黄色片一级片一级黄色片| 日本熟妇午夜| 国产高潮美女av| av欧美777| 国产高清视频在线观看网站| 日韩欧美免费精品| 一级黄片播放器| 国产又黄又爽又无遮挡在线| 欧美日韩瑟瑟在线播放| 国产乱人视频| 在线免费观看的www视频| 香蕉丝袜av| 成人av在线播放网站| 中文在线观看免费www的网站| 搞女人的毛片| 亚洲 国产 在线| 深夜精品福利| 欧美xxxx黑人xx丫x性爽| 99久久综合精品五月天人人| 国产激情偷乱视频一区二区| 999久久久精品免费观看国产| 男女做爰动态图高潮gif福利片| 国产高清有码在线观看视频| 日本黄色片子视频| 欧美乱色亚洲激情| 日本免费一区二区三区高清不卡| 一进一出好大好爽视频| 丝袜美腿在线中文| 亚洲一区高清亚洲精品| 看免费av毛片| 99视频精品全部免费 在线| 亚洲欧美日韩无卡精品| 国产一区二区三区在线臀色熟女| 精品欧美国产一区二区三| 久久人妻av系列| 小说图片视频综合网站| 五月伊人婷婷丁香| 超碰av人人做人人爽久久 | 性欧美人与动物交配| 日日摸夜夜添夜夜添小说| 国产视频一区二区在线看| 国产一区二区在线观看日韩 | 亚洲成人久久爱视频| 最新美女视频免费是黄的| 精品不卡国产一区二区三区| 美女免费视频网站| 亚洲av日韩精品久久久久久密| 亚洲成av人片免费观看| 天堂影院成人在线观看| 黄色日韩在线| 久久婷婷人人爽人人干人人爱| 18禁美女被吸乳视频| 女人被狂操c到高潮| 欧美精品啪啪一区二区三区| 欧美+亚洲+日韩+国产| 亚洲国产欧洲综合997久久,| 久久久久国内视频| 法律面前人人平等表现在哪些方面| 国产伦在线观看视频一区| 神马国产精品三级电影在线观看| 国产精品三级大全| 欧美乱妇无乱码| 尤物成人国产欧美一区二区三区| 国产精品国产高清国产av| 亚洲精品日韩av片在线观看 | 女人被狂操c到高潮| 变态另类成人亚洲欧美熟女| 宅男免费午夜| 在线观看午夜福利视频| 天堂影院成人在线观看| 精品不卡国产一区二区三区| 国内揄拍国产精品人妻在线| 母亲3免费完整高清在线观看| 老司机福利观看| 成年版毛片免费区| 亚洲av美国av| 精品欧美国产一区二区三| 99热精品在线国产| 亚洲成人久久性| 国产国拍精品亚洲av在线观看 | 欧美一级毛片孕妇| 国产探花极品一区二区| 免费看a级黄色片| 18禁在线播放成人免费| 午夜激情福利司机影院| 看黄色毛片网站| 欧美又色又爽又黄视频| 九九热线精品视视频播放| 国产淫片久久久久久久久 | 久久亚洲真实| 国产高清三级在线| 国产男靠女视频免费网站| 69人妻影院| 最新在线观看一区二区三区| 老司机深夜福利视频在线观看| 2021天堂中文幕一二区在线观| 欧美性猛交╳xxx乱大交人| 欧美3d第一页| 国产精品亚洲美女久久久| 午夜福利18| 日本 欧美在线| 国产成人av激情在线播放| 国产免费一级a男人的天堂| 中文字幕人妻丝袜一区二区| 久久久色成人| 亚洲人成网站高清观看| 亚洲 欧美 日韩 在线 免费| 欧美黄色片欧美黄色片| 欧美成人一区二区免费高清观看| 亚洲精品乱码久久久v下载方式 | 久久久久久国产a免费观看| 久9热在线精品视频| 99热精品在线国产| 12—13女人毛片做爰片一| 99精品欧美一区二区三区四区| 久久久久九九精品影院| 两个人看的免费小视频| 成人特级黄色片久久久久久久| 18禁国产床啪视频网站| 一边摸一边抽搐一进一小说| 中文在线观看免费www的网站| 国产老妇女一区| 美女高潮的动态| 一卡2卡三卡四卡精品乱码亚洲| 国产伦在线观看视频一区| 国产午夜精品久久久久久一区二区三区 | 国产精华一区二区三区| 老师上课跳d突然被开到最大视频 久久午夜综合久久蜜桃 | 国产麻豆成人av免费视频| 免费观看精品视频网站| 色哟哟哟哟哟哟| 久久久久久国产a免费观看| 国产成人aa在线观看| 小蜜桃在线观看免费完整版高清| 人人妻人人澡欧美一区二区| 制服丝袜大香蕉在线| 老司机午夜福利在线观看视频| 亚洲欧美日韩东京热| 搡女人真爽免费视频火全软件 | 久久久成人免费电影| 免费看十八禁软件| 亚洲中文日韩欧美视频| 热99在线观看视频| 高清毛片免费观看视频网站| 免费一级毛片在线播放高清视频| av天堂在线播放| 国产成人影院久久av| 国产av麻豆久久久久久久| 97碰自拍视频| 69av精品久久久久久| 在线国产一区二区在线| 久久精品国产自在天天线| 久久九九热精品免费| 亚洲无线观看免费| 黄色女人牲交| 狂野欧美白嫩少妇大欣赏| 两性午夜刺激爽爽歪歪视频在线观看| 国产蜜桃级精品一区二区三区| 美女cb高潮喷水在线观看| a级一级毛片免费在线观看| av天堂在线播放| 精品久久久久久久末码| 黑人欧美特级aaaaaa片| 每晚都被弄得嗷嗷叫到高潮| 偷拍熟女少妇极品色| 欧美大码av| 成人国产一区最新在线观看| 亚洲av熟女| 欧美大码av| 亚洲精品一区av在线观看| 免费人成视频x8x8入口观看| 中文字幕久久专区| 97人妻精品一区二区三区麻豆| www.www免费av| 人人妻人人看人人澡| 国产私拍福利视频在线观看| 99久国产av精品| 免费在线观看影片大全网站| 国产精品女同一区二区软件 | 18禁黄网站禁片免费观看直播| 中国美女看黄片| 99久久精品一区二区三区| 午夜福利18| 午夜免费激情av| 香蕉久久夜色| 深夜精品福利| 99久国产av精品| 一区二区三区高清视频在线| 国产高清有码在线观看视频| 怎么达到女性高潮| 亚洲美女黄片视频| 成年人黄色毛片网站| 在线十欧美十亚洲十日本专区| 久久中文看片网| 国产中年淑女户外野战色| 成年版毛片免费区| 麻豆国产97在线/欧美| 精品午夜福利视频在线观看一区| 久久精品91蜜桃| 国产精品自产拍在线观看55亚洲| 一本精品99久久精品77| 免费看a级黄色片| www.www免费av| 久久久久免费精品人妻一区二区| 久久这里只有精品中国| 少妇人妻精品综合一区二区 | 亚洲美女视频黄频| 看片在线看免费视频| 国产色婷婷99| 午夜影院日韩av| 十八禁人妻一区二区| 一级毛片高清免费大全| www日本黄色视频网| 国产精品嫩草影院av在线观看 | 麻豆成人av在线观看| 99在线人妻在线中文字幕| 蜜桃亚洲精品一区二区三区| 亚洲成人免费电影在线观看| 中文字幕熟女人妻在线| 日本在线视频免费播放| 久久精品人妻少妇| 精品一区二区三区视频在线 | 久久久久九九精品影院| 国产精品98久久久久久宅男小说| 亚洲黑人精品在线| 成人高潮视频无遮挡免费网站| 在线免费观看的www视频| 亚洲欧美激情综合另类| 日本成人三级电影网站| 18禁在线播放成人免费| 国产高清videossex| 国产三级在线视频| 午夜免费激情av| 成人永久免费在线观看视频| 精品乱码久久久久久99久播| xxxwww97欧美| 夜夜看夜夜爽夜夜摸| 男女之事视频高清在线观看| 美女免费视频网站| 亚洲精品久久国产高清桃花| 免费av观看视频| 18禁国产床啪视频网站| 首页视频小说图片口味搜索| 国产午夜福利久久久久久| 亚洲欧美日韩卡通动漫| 成人精品一区二区免费| 国产精品免费一区二区三区在线| 夜夜夜夜夜久久久久| 999久久久精品免费观看国产| 精品免费久久久久久久清纯| 国产精品野战在线观看| 亚洲av免费在线观看| 色av中文字幕| 波多野结衣高清无吗| 国产精品嫩草影院av在线观看 | 亚洲真实伦在线观看| 日本一二三区视频观看| 国产探花极品一区二区| 国产一区二区在线av高清观看| 国产精品 欧美亚洲| 2021天堂中文幕一二区在线观| 给我免费播放毛片高清在线观看| 国产精品乱码一区二三区的特点| 成年女人永久免费观看视频| 欧美中文综合在线视频| 亚洲国产精品999在线| 成人性生交大片免费视频hd| 夜夜看夜夜爽夜夜摸| 丝袜美腿在线中文| 香蕉久久夜色| 99国产综合亚洲精品| 国产成人a区在线观看| 香蕉av资源在线| 美女高潮的动态| 久久精品人妻少妇| 国产欧美日韩一区二区精品| 国产视频一区二区在线看| 男女视频在线观看网站免费| 搡老熟女国产l中国老女人| 久久久国产精品麻豆| 免费人成在线观看视频色| 国产伦精品一区二区三区视频9 | 国产综合懂色| 国产不卡一卡二| www国产在线视频色| 亚洲精品在线观看二区| 午夜精品久久久久久毛片777| 精品国产亚洲在线| 久久九九热精品免费| 国产精品久久久久久久电影 | 一本综合久久免费| 亚洲无线在线观看| 尤物成人国产欧美一区二区三区| 一级a爱片免费观看的视频| 国产日本99.免费观看| 亚洲一区二区三区色噜噜| 一边摸一边抽搐一进一小说| 白带黄色成豆腐渣| а√天堂www在线а√下载| 99久久99久久久精品蜜桃| 国产亚洲欧美在线一区二区| 亚洲中文日韩欧美视频| 国产精品日韩av在线免费观看| xxx96com| 亚洲激情在线av| 国产久久久一区二区三区| www日本黄色视频网| 欧美3d第一页| av中文乱码字幕在线| 三级毛片av免费| 午夜福利高清视频| 男人和女人高潮做爰伦理| 欧美日韩综合久久久久久 | 桃色一区二区三区在线观看| 婷婷精品国产亚洲av在线| 一级作爱视频免费观看| 999久久久精品免费观看国产| 欧美xxxx黑人xx丫x性爽| 亚洲色图av天堂| 亚洲欧美日韩卡通动漫| 国产免费男女视频| 欧美性感艳星| 欧美日本视频| 久久久国产精品麻豆| 免费一级毛片在线播放高清视频| 一二三四社区在线视频社区8| 黑人欧美特级aaaaaa片| 他把我摸到了高潮在线观看| 日本在线视频免费播放| 久久精品夜夜夜夜夜久久蜜豆| 亚洲欧美精品综合久久99| 亚洲国产精品sss在线观看| 欧美丝袜亚洲另类 | 午夜精品在线福利| 精品国产超薄肉色丝袜足j| 久久久久九九精品影院| 国产精品亚洲一级av第二区| 欧美成人一区二区免费高清观看| 亚洲精品一卡2卡三卡4卡5卡| 99国产精品一区二区蜜桃av| 又黄又爽又免费观看的视频| 一夜夜www| 日本熟妇午夜| 亚洲av第一区精品v没综合| 99国产精品一区二区三区| 在线观看美女被高潮喷水网站 | 天天一区二区日本电影三级| 丝袜美腿在线中文| 国语自产精品视频在线第100页| 18美女黄网站色大片免费观看| 全区人妻精品视频| 欧美成狂野欧美在线观看| 国产一级毛片七仙女欲春2| 久9热在线精品视频| 久久精品人妻少妇| 蜜桃亚洲精品一区二区三区| 日本 av在线| 丰满人妻熟妇乱又伦精品不卡| 日韩欧美一区二区三区在线观看| 高清在线国产一区| 美女高潮喷水抽搐中文字幕| 天堂网av新在线| 亚洲精品粉嫩美女一区| 亚洲av中文字字幕乱码综合| 成人特级av手机在线观看| 真人做人爱边吃奶动态| 久久久久久久午夜电影|