• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多語料庫中漢語四字格的切分和識別研究

    2013-10-15 01:37:20徐潤華曲維光陳小荷王東波
    中文信息學(xué)報 2013年5期
    關(guān)鍵詞:字格分詞語料

    徐潤華,曲維光,陳小荷,王東波

    (1.金陵科技學(xué)院人文學(xué)院,江蘇 南京210038;2.南京師范大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 南京210046;3.南京師范大學(xué) 文學(xué)院,江蘇 南京210097;4.南京農(nóng)業(yè)大學(xué) 信息科學(xué)技術(shù)學(xué)院,江蘇 南京210095)

    1 前言

    “四字格”這個術(shù)語最早由陸志韋先生[1]提出,是指由四個漢字組成的一種獨(dú)特語言格式。在漢語言文學(xué)發(fā)展的歷史中,四字格的形式起著非常重要的作用,四字格形式在語音、語法、構(gòu)詞、語用、修辭等方面都對漢語產(chǎn)生了深刻的影響。四字格不僅在字?jǐn)?shù)、結(jié)構(gòu)、韻律等方面有著獨(dú)特的優(yōu)勢[2],它還有著深厚的文化土壤,從老子的“千里之行,始于足下”到孔子的“學(xué)而不厭,誨人不倦”,名人名言多見四字警句。

    四字格結(jié)構(gòu)的能產(chǎn)性和派生性極強(qiáng),利用四字格派生出新詞語的模式,在漢語言發(fā)展史上一直起著積極的作用,推動著漢語的發(fā)展。直到今天,利用四字格模式創(chuàng)造出的新詞數(shù)量在現(xiàn)代漢語詞匯中仍然呈上升趨勢,四字詞語的數(shù)量有增無減。楊曉黎[3]通過統(tǒng)計(jì)得出結(jié)論認(rèn)為“在新詞語中雙音節(jié)優(yōu)勢已經(jīng)讓位于四音節(jié)詞語了”。在信息化迅猛發(fā)展的今天,可以很容易地獲取大規(guī)模語料,對四字格結(jié)構(gòu)的研究不能僅僅局限于文獻(xiàn)和理論,而應(yīng)該將目光更多地投向語料庫,投向大量真實(shí)文本中的四字格。

    語料庫中的四字格所面臨的最大問題是,同一個詞在文本中是否保持了相同的切分形式。如果不能很好地解決四字格的切分和識別工作,會給漢語的自動分詞工作帶來麻煩。目前,自然語言處理尚缺乏對漢語四字格的專門性研究,本文希望通過對語料庫中漢語四字格的研究,給自然語言處理領(lǐng)域的自動分詞工作,以及在自動分詞基礎(chǔ)上進(jìn)行的語料深加工、句法分析、話語理解等后續(xù)任務(wù)帶來有益的幫助。

    2 語料庫中四字格的分類

    不同語料庫中的四字格由于語料來源、語言風(fēng)格、切分原則等方面的差異而呈現(xiàn)出多樣性和特殊性。為了能更好地揭示出語料庫中四字格的全貌,引入多個語料庫來進(jìn)行四字格的研究十分有必要。本文研究所選用的分詞語料庫是Sighan中文分詞競賽的部分訓(xùn)練語料①語料來源網(wǎng)址:http://www.sighan.org:北京大學(xué)《人民日報》分詞語料庫、微軟亞洲研究院中文分詞語料庫、中國國家語委中文分詞語料庫這三個簡體中文分詞語料庫。選取三個不同的語料庫來進(jìn)行四字格的分類工作,可以更全面地考察多語料庫中的四字格并在此基礎(chǔ)上進(jìn)一步比較各個語料庫之間的四字格切分特點(diǎn)。

    2.1 語料庫中四字格的篩選

    語料庫中的四字格,通常指的是那些結(jié)構(gòu)穩(wěn)定、意義凝固、可獨(dú)立運(yùn)用且長度為四的詞語。因此在分詞語料庫中,四字格最直觀的形式特征就是它的長度。但長度為四的分詞單位,并不一定都是四字格。其中包含了相當(dāng)數(shù)量的“非四字格”卻長度為四的分詞單位。這些“非四字格”分詞單位主要由數(shù)字串、命名實(shí)體等構(gòu)成。例如,數(shù)字串或含數(shù)字串的詞串:“七八千元”、“五十余篇”;人名和地名,尤其以音譯詞居多,如“莎拉波娃”、“巴勒斯坦”;機(jī)構(gòu)名如“順天集團(tuán)”、“西康鐵路”等。這些四字長的分詞單位是不能歸入到四字格范疇中去的。這里需要說明一下成語。成語多是四字格[4],它結(jié)構(gòu)穩(wěn)定基本不存在切分不一致的情況。而且作為一個封閉的類別,對成語進(jìn)行識別也較為容易?;诔烧Z的結(jié)構(gòu)穩(wěn)定、容易識別的特點(diǎn),為了更直接地針對開放性、派生性強(qiáng)的四字格結(jié)構(gòu)進(jìn)行研究,成語也沒有被納入本文研究的四字格范疇之內(nèi)。

    通過篩選、去除上述成分之后,北京大學(xué)《人民日報》1998年1月分詞語料庫中四字格篩選后數(shù)量為2830條;微軟亞洲研究院中文分詞語料庫中四字格篩選后數(shù)量為2739條;中國教育部國家語委分詞語料庫中四字格篩選后數(shù)量為1999條。

    2.2 語料庫中四字格的分類方法

    周薦[5]把四字格分為“陳述式”、“偏正式”、“述賓式”等八種類型。本文提出的四字格的分類方法,并不單純從語法層面去分析四字格的結(jié)構(gòu),而是更偏重于為計(jì)算機(jī)處理四字格切分、識別任務(wù)而服務(wù)的一種分類方法,所以對四字格結(jié)構(gòu)內(nèi)部的組成關(guān)系并不十分關(guān)注。分詞語料庫中的四字格,按照四字格的構(gòu)詞模式,大致可以分為“詞語構(gòu)成型”、“結(jié)構(gòu)構(gòu)成型”、“固定結(jié)構(gòu)型”這三種類型,如表1所示。

    詞語構(gòu)成型,指的是那些內(nèi)部構(gòu)成方式簡單易于觀察,在語料庫中常常切分成兩種穩(wěn)定切分形式的四字格,例如,“工薪階層”,或者切分為一個完整的四字格結(jié)構(gòu),或者就是切分為“工薪 階層”的形式。詞語構(gòu)成型還可以細(xì)分為“‘2+2’式”和“‘3+1’或‘1+3’式”,兩者都是從音段組合規(guī)律上對四字格所進(jìn)行的劃分[6]。

    表1 四字格的構(gòu)詞模式

    結(jié)構(gòu)構(gòu)成型四字格的內(nèi)部結(jié)構(gòu)復(fù)雜,在語料庫中切分形式不穩(wěn)定,例如,“各負(fù)其責(zé)”,可能出現(xiàn)“各負(fù) 其責(zé)”的形式,也可能出現(xiàn)“各 負(fù) 其 責(zé)”的形式。當(dāng)四字格被切分成形如“鍋 碗 瓢 盆”這樣處于同一層次的四個單音節(jié)詞時,則稱之為“四字駢語”[7]。詞語構(gòu)成型的四字格內(nèi)部全部是由詞構(gòu)成,而結(jié)構(gòu)構(gòu)成型的四字格內(nèi)部不全是由詞構(gòu)成,它可能是“結(jié)構(gòu)”+“詞”的形式,例如,“大飽耳福”;也可能是“結(jié)構(gòu)”+“結(jié)構(gòu)”的形式,例如,“筆簡意深”,這種前后結(jié)構(gòu)形式對稱的四字格也稱為并列式四字格[8]。

    固定結(jié)構(gòu)型,指的是用法固定結(jié)構(gòu)穩(wěn)定不可變的一些四字格,常見于一些表示轉(zhuǎn)折或條件關(guān)系的四字格,例如“不管怎樣”、“也就是說”等。

    3 語料庫中四字格的切分

    3.1 四字格切分不一致的問題

    圖1 四字格切分不一致類型的對應(yīng)關(guān)系

    分詞語料庫中的切分不一致現(xiàn)象一直是中文信息處理領(lǐng)域的難點(diǎn)。四字格的切分不一致現(xiàn)象是整個分詞語料庫中分詞不一致研究工作的重要組成部分之一。四字格也屬于分詞單位,馮志偉[9]認(rèn)為:“四字成語和習(xí)慣用語,各成分意義結(jié)合緊密,難以拆開,不切分”,但是在實(shí)際的分詞過程中,四字格往往不被切分成一個完整的分詞單位,而是被“切碎”了:例如,“傾而不倒”這個四字格,在語料庫中既出現(xiàn)過“傾_而_不_倒”這樣的切分實(shí)例,也出現(xiàn)過“傾_而_不倒”這樣的切分實(shí)例。切分不一致大大降低了分詞的精度,影響了自然語言處理的后續(xù)工作。切分不一致問題若得不到較好解決,將會對漢語自動分詞、分詞規(guī)范統(tǒng)一、語料庫建設(shè)等方面造成影響。

    除了成語之外,沒有被詞典收錄的四字慣用語、習(xí)語,都可以算作多詞表達(dá)的一種[10]。多詞表達(dá)需要從整體上把握多詞合成后所表達(dá)的意義,而四字格切分不一致的現(xiàn)狀會給多詞表達(dá)的相關(guān)研究帶來困難。

    3.2 四字格切分不一致的類型

    對于一個四字格而言,只要它在分詞語料庫中沒有被切分成一個四字長的分詞單位,就認(rèn)為它被切碎了。在理論上,切碎了的四字格可以是各種各樣的形式,但無論這些四字格的切分不一致結(jié)果多么紛繁復(fù)雜,最終都可以歸結(jié)到三種四字格的切分不一致類型中:被切分成兩個詞(2型四字格)、被切分成三個詞(3型四字格)、被切分成四個詞(4型四字格)。一個四字長的分詞單位,所有可能的切分形式,都包含于這三種切分不一致類型中。

    分詞語料庫中四字格的三種切分不一致類型,和本文前述的從四字格構(gòu)詞模式角度提出的四字格分類體系是對應(yīng)的。2型四字格對應(yīng)的是詞語構(gòu)成型四字格,3型四字格和4型四字格對應(yīng)的是結(jié)構(gòu)構(gòu)成型四字格,其中3型四字格對應(yīng)于結(jié)構(gòu)構(gòu)成型四字格中的“‘結(jié)構(gòu)’+‘詞’式”。具體的對應(yīng)關(guān)系如圖1所示。

    3.3 語料庫中四字格切分不一致的提取實(shí)驗(yàn)

    四字格切分不一致的提取工作,就是要找出語料庫內(nèi)部和語料庫之間某個特定四字格所有不同的切分形式。例如,北京大學(xué)語料庫中有這樣一個四字格:“懲惡揚(yáng)善”,在別的語料庫中出現(xiàn)了“懲_惡_揚(yáng)_善”和“懲惡_揚(yáng)善”兩種切分形式,切分不一致提取工作就需要把這兩種不同的切分形式都找出來。為了能夠發(fā)現(xiàn)所有的切分不一致情況,提取算法需要同時檢索這六個不同的切分串:“懲惡_揚(yáng)善”、“懲_惡揚(yáng)善”、“懲惡揚(yáng)_善”、“懲_惡_揚(yáng)善”、“懲惡_揚(yáng)_善”、“懲_惡_揚(yáng)_善”。這其實(shí)就包含了“懲惡揚(yáng)善”這個四字格所有可能的切分形式。

    (1)實(shí)驗(yàn)方案及數(shù)據(jù)

    本實(shí)驗(yàn)考察了三個語料庫之間的四字格切分不一致數(shù)據(jù),同時也對三個語料庫各自內(nèi)部的四字格切分不一致數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)。考察了四字格切分不一致的三種類型(2型、3型、4型四字格),以及每種類型的類別數(shù)(types)和實(shí)例數(shù)(tokens)這兩個統(tǒng)計(jì)量。統(tǒng)計(jì)數(shù)據(jù)如表2和表3所示,數(shù)據(jù)示例如表4所示。

    表2 分詞語料庫內(nèi)部的四字格切分不一致數(shù)據(jù)

    表3 分詞語料庫之間的四字格切分不一致數(shù)據(jù)

    表4 語料庫中四字格切分不一致的數(shù)據(jù)示例

    (2)實(shí)驗(yàn)分析

    觀察數(shù)據(jù)可以看出,三個語料庫內(nèi)部的四字格切分不一致數(shù)量要遠(yuǎn)少于三個語料庫之間的四字格切分不一致數(shù)量。例如,國家語言文字工作委員會語料庫內(nèi)部的四字格切分不一致例數(shù)僅有220例,而語委語料庫和微軟語料庫之間的切分不一致例數(shù)卻多達(dá)7055例。這也和直覺相符:一個語料庫內(nèi)部的切分方式和切分原則相對穩(wěn)定,而不同語料庫之間的切分方式和切分原則差異較大。

    在進(jìn)行分詞語料庫之間四字格切分不一致的比較時,四字格切分一致數(shù)量和切分不一致數(shù)量的比例是衡量兩個語料庫之間四字格切分相似程度的一個重要依據(jù)。通過計(jì)算“四字格切分不一致數(shù)量/四字格切分一致數(shù)量”的值可以發(fā)現(xiàn),《人民日報》語料庫和國家語委語料庫之間的這個比值為(311+445)/(845+806)=45.8%,是所有語料庫之間的最低值,說明這兩個語料庫之間的四字格切分方式最接近;《人民日報》語料庫和微軟亞洲研究院語料庫之間的這個比值為(855+615)/(1041+960)=73.5%,是所有語料庫之間的最高值,說明這兩個語料庫之間在四字格的切分問題上“分歧”最多。

    4 語料庫中四字格的識別

    分詞語料庫中的四字格分為兩類:一類是未被切碎、可以利用詞長或者詞性信息直接找到的、形如“_茶飯不思_”形式的四字格;另一類,是被切碎成若干更小長度的分詞單位、無法在語料庫直接找到、形如“_如_詩_如_畫_”形式的四字格。四字格識別研究所要針對的正是第二類四字格。

    被切碎了的四字格又分為兩種,一種是在某個語料庫中被切碎,但在其他語料庫中未被切碎的四字格;另一種是在各個語料庫中都被切碎,但確實(shí)應(yīng)當(dāng)被切分為一個分詞單位的四字格。對于前者的識別,只需通過建立一個簡單的四字格實(shí)例詞表即可實(shí)現(xiàn);而對于后者,我們無法在語料庫中找到匹配實(shí)例,要識別出這些四字格,就必須要借助于統(tǒng)計(jì)模型來訓(xùn)練大量數(shù)據(jù)、機(jī)器學(xué)習(xí)四字格的結(jié)構(gòu)特征并以此對四字格進(jìn)行自動標(biāo)注。

    4.1 CRF的訓(xùn)練語料獲取

    條件隨機(jī)場(Conditional Random Field,CRF)是一種用于在給定輸入節(jié)點(diǎn)值時計(jì)算指定輸出結(jié)點(diǎn)值的條件概率的無向圖模型,是一個基于統(tǒng)計(jì)的序列標(biāo)注和分割的方法[11]。目前,CRF廣泛應(yīng)用于自然語言處理的各個方面,特別是在序列化標(biāo)注例如詞性標(biāo)注任務(wù)中,CRF表現(xiàn)優(yōu)異。我們可以把四字格的識別過程想像為一種特殊的詞性標(biāo)注:給每個分詞單位一個標(biāo)記,該標(biāo)記用于表明分詞單位是或者不是四字格的成分之一。把連續(xù)出現(xiàn)的有四字格標(biāo)記的分詞單位找出來,當(dāng)它們的詞長相加正好為四的時候,就可以認(rèn)為這是一個四字格。

    CRF模型需要大量做過人工標(biāo)注的語料用于訓(xùn)練。單靠人力去發(fā)現(xiàn)語料庫中被切碎了的四字格并對其進(jìn)行四字格信息的標(biāo)注,是一項(xiàng)極其耗時耗力的工作。一種可行的方法是,利用不同語料庫之間四字格的切分不一致數(shù)據(jù)來實(shí)現(xiàn)四字格訓(xùn)練語料的自動獲取。例如,有語料庫A和B,在語料庫A中可以找到四字格“為國分憂”,而它在語料庫B中則被切成了“為_國_分憂”,那么“為_國_分憂”這個切分實(shí)例就可以成為CRF模型訓(xùn)練語料的一部分。采用這種思路來自動獲取訓(xùn)練語料,上文關(guān)于四字格切分不一致的統(tǒng)計(jì)結(jié)果就可以直接為CRF模型的訓(xùn)練過程提供大量數(shù)據(jù)。

    俞士汶[12]提出,形如“調(diào)查_研究”、“總結(jié)_經(jīng)驗(yàn)”這樣的“四個字短語,通常應(yīng)切分”。2型四字格均由兩個詞語構(gòu)成,結(jié)構(gòu)方式上趨近于詞組,在語料庫中的切分不一致情況多屬于切分粗細(xì)的問題,而非切分正誤的問題。因此,本研究的四字格識別工作只把3型四字格和4型四字格作為識別對象。去除2型四字格的切分不一致結(jié)果,只保留切分成3型和4型四字格的切分不一致結(jié)果,本文研究選取的三個分詞語料庫中共有2742例四字格切分不一致數(shù)據(jù)。如表5所示。

    表5 切分成3型和4型的四字格切分不一致數(shù)據(jù)(例數(shù))

    除了四字格本身,還需要提供四字格的上下文語境信息用于CRF模型訓(xùn)練,即真正用于CRF模型訓(xùn)練的,是包含了四字格的句子,而不是單獨(dú)的四字格本身。對應(yīng)于2742個四字格切分不一致實(shí)例,用于CRF模型訓(xùn)練的包含四字格的句子也是2742個。

    4.2 CRF的特征列和模板定制

    圖2 四字格的特征列

    按照CRF模型的語料格式要求,針對3型四字格和4型四字格這兩種識別對象,給出兩種四字格特征列,如圖2所示。圖中的第一列是文本,第二列是詞性標(biāo)記和詞長信息,第三列是四字格標(biāo)記?!皀one”表示該詞不是四字格成分,“head_3”、“body_3”、“tail_3”或“head_4”、“body1_4、body2_4”、“tail_4”分別表示該詞是四字格成分的首部、中部、尾部,后面的數(shù)字“3”或“4”表示該四字格被切碎成了3個或者4個部分。

    CRF模型是一個通用工具,用戶需要定制自己的特征模板。模板的基本格式為%x[行、列],它用于確定輸入數(shù)據(jù)中的一個詞例。行,表示%x相對于當(dāng)前詞例的行數(shù);列,表示%x在列上的絕對列數(shù)。以訓(xùn)練語料中的“陽光/n走遍/v它/r不/d為/p人/n知/v的/u另/r一/m 面/n”這句話來示例特征模板,假設(shè)當(dāng)前詞為“為”,本研究所采用的CRF特征訓(xùn)練模板如圖3所示。

    圖3 特征模板示例

    4.3 基于CRF模型的四字格識別實(shí)驗(yàn)

    基于CRF模型的識別實(shí)驗(yàn)采用的訓(xùn)練語料是北京大學(xué)《人民日報》1998年1月語料、微軟亞洲研究院中文分詞語料、中國國家語委分詞語料。封閉測試語料選用的是北京大學(xué)《人民日報》1998年1月語料,開放測試語料選用的是北京大學(xué)《人民日報》1998年2~6月語料,實(shí)驗(yàn)結(jié)果如表6和表7所示。

    表61998年1月至6月北京大學(xué)《人民日報》語料庫中的四字識別結(jié)果

    表71998年1月至6月北京大學(xué)《人民日報》語料庫識別結(jié)果中的3、4型四字格分布

    作為開放測試語料,1998年2月至6月的《人民日報》語料并未參與到四字格切分不一致數(shù)據(jù)的獲取過程中,但利用CRF模型對其進(jìn)行的四字格識別實(shí)驗(yàn)仍然取得了93%以上的正確率,甚至部分超過了封閉測試的效果;表7列出了半年《人民日報》語料中識別出的3、4型四字格分布,可以看出識別出的被切碎四字格的數(shù)量較多、分布平均,3型四字格和4型四字格之間的比例也趨于平衡沒有明顯的偏重,這些都表明了,利用四字格切分不一致數(shù)據(jù)并輔以CRF模型來識別四字格的方法能行之有效地解決多語料庫中四字格的識別難題。

    識別得到的四字格中,有些可以在北京大學(xué)、國家語委、微軟三個訓(xùn)練語料庫中找到完全匹配的實(shí)例,例如,

    持續(xù)不斷 從頭做起

    催人淚下 多黨合作

    凡此種種 蜂擁而來

    干旱少雨 公布于眾

    但這些四字格只占識別得到的2229例四字格中很小的一部分,占比最多的國家語委語料庫也只有3.8%;絕大多數(shù)識別得到的四字格在三個訓(xùn)練語料庫中都找不到與之完全匹配的實(shí)例,換言之都被切碎了,例如,

    冰封雪蓋 官去室空

    船推浪移 肩扛手提

    車毀人傷 肩扛背馱

    房倒屋塌 以短養(yǎng)長

    這部分識別出的四字格是無法通過查找匹配實(shí)例來識別的,也進(jìn)一步驗(yàn)證了本研究引入統(tǒng)計(jì)模型參與識別工作的必要性。相關(guān)數(shù)據(jù)詳見表8。

    表8 四字格識別結(jié)果在三個語料庫中是否有匹配實(shí)例的分布數(shù)據(jù)

    5 結(jié)語

    本文的研究對象是語料庫中的四字格,本文著重對“四字格的分類”、“四字格的切分”、“四字格的識別”這三個問題進(jìn)行了深入研究。如圖4所示。

    圖4 四字格研究框架

    通過抽取不同分詞語料庫中的四字格并進(jìn)行篩選、分類,本文解決了第一個問題;利用篩選、分類的結(jié)果,在不同語料庫中尋找它們所有的切分形式,分析歸納這些四字格切分形式上的特點(diǎn),本文解決了第二個問題;利用不同語料庫間四字格的切分不一致結(jié)果,在分詞語料庫中實(shí)現(xiàn)了對四字格的識別工作,至此本文解決了第三個問題。通過實(shí)驗(yàn)表明,多語料庫中的四字格識別正確率可以達(dá)到93%以上。

    本研究依然有許多尚未完成或亟需改善之處:四字格分類體系仍顯粗糙;研究所使用的分詞語料庫規(guī)模有待擴(kuò)大;四字格資源需要繼續(xù)補(bǔ)充和完善。下一步工作考慮引入語法、語義方面的知識來進(jìn)一步提高四字格特別是可派生型四字格的識別效果。

    [1]陸志韋.漢語的并立四字格[J].語文研究,1956,(1):45-82.

    [2]馬國凡.四字格論[J].內(nèi)蒙古師范大學(xué)學(xué)報,1987,(3):51-58.

    [3]楊曉黎.四音節(jié)新詞語及其成因[J].江淮論壇,1996,(4):100-103.

    [4]莫彭齡.“四字格”與成語修辭[J].常州工學(xué)院學(xué)報,2003(3):54-58.

    [5]周薦.論四字語和三字語[J].語文研究,1997,(4):26-31.

    [6]鞠君.四字格中“1+3”音段和“3+1”音段組合規(guī)律初探[J].漢語學(xué)習(xí),1995,(1):37-39.

    [7]安華林.“四字駢語”初探[J].信陽師范學(xué)院學(xué)報,2001,(1):79-82.

    [8]時秀娟.淺析漢語并列式四字格結(jié)構(gòu)及其理據(jù)性[J].萊陽農(nóng)學(xué)院學(xué)報,2001,(3):44-47.

    [9]馮志偉.確定切詞單位的某些非語法因素[J].中文信息學(xué)報,2001,(5):8-14.

    [10]劉榮、王弈凱:2011:《利用統(tǒng)計(jì)量和語言學(xué)規(guī)則提取多字詞表達(dá)[J].太原理工大學(xué)學(xué)報,2011,(3):133-137.

    [11]Lafferty,J.McCallum,A.Pereira,F(xiàn).,Conditional random fields:Probabilistic models for segmenting and labeling sequence data[C]//Proceedings of the 18th International Conference on Machine Learning(ICML 2001),2001:282-289.

    [12]俞士汶,段慧明,朱學(xué)鋒,等.北京大學(xué)現(xiàn)代漢語語料庫基本加工規(guī)范[J].中文信息學(xué)報,2002,(5):49-64.

    猜你喜歡
    字格分詞語料
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    《同音》二字格探析
    西夏學(xué)(2019年1期)2019-02-10 06:22:06
    老虎棋
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    值得重視的分詞的特殊用法
    《世說新語》四字格研究
    河北遷安方言四字格俗語研究
    華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
    国产三级黄色录像| 久久精品国产清高在天天线| 精品国产亚洲在线| 男女午夜视频在线观看| 亚洲人成77777在线视频| 99在线视频只有这里精品首页| 丰满人妻熟妇乱又伦精品不卡| 国产精品电影一区二区三区| 久久久久国产精品人妻aⅴ院| 亚洲中文字幕日韩| 精品乱码久久久久久99久播| 18美女黄网站色大片免费观看| 狂野欧美激情性xxxx| 日韩欧美在线乱码| 999精品在线视频| 在线免费观看的www视频| 亚洲精华国产精华精| 午夜福利成人在线免费观看| 一本大道久久a久久精品| 久久欧美精品欧美久久欧美| 天堂√8在线中文| 成人手机av| 欧美成人免费av一区二区三区| 91九色精品人成在线观看| 日韩免费av在线播放| 久久精品国产亚洲av香蕉五月| 亚洲精品中文字幕一二三四区| 97超级碰碰碰精品色视频在线观看| 精品高清国产在线一区| 日韩欧美国产一区二区入口| 欧美性猛交╳xxx乱大交人| 亚洲人与动物交配视频| 丁香六月欧美| 久久欧美精品欧美久久欧美| 制服丝袜大香蕉在线| 国内精品久久久久久久电影| 国产免费男女视频| 日韩 欧美 亚洲 中文字幕| 黄频高清免费视频| 91麻豆av在线| 亚洲精品一卡2卡三卡4卡5卡| 日韩 欧美 亚洲 中文字幕| 国产黄色小视频在线观看| 精品无人区乱码1区二区| 国产1区2区3区精品| 悠悠久久av| АⅤ资源中文在线天堂| 99精品久久久久人妻精品| 亚洲在线自拍视频| 成人国产一区最新在线观看| 视频区欧美日本亚洲| 亚洲人与动物交配视频| 熟妇人妻久久中文字幕3abv| 啦啦啦免费观看视频1| 在线观看美女被高潮喷水网站 | 精品第一国产精品| 久久婷婷成人综合色麻豆| 男女床上黄色一级片免费看| 狂野欧美白嫩少妇大欣赏| 国产精品野战在线观看| 天天躁狠狠躁夜夜躁狠狠躁| 免费人成视频x8x8入口观看| 欧美大码av| 一级黄色大片毛片| 99精品欧美一区二区三区四区| 国产亚洲av嫩草精品影院| 两个人看的免费小视频| 日韩免费av在线播放| 国产精品九九99| 欧美日韩一级在线毛片| 精品久久久久久久人妻蜜臀av| 久久久久久人人人人人| 国产精品av久久久久免费| xxxwww97欧美| netflix在线观看网站| 日韩欧美国产一区二区入口| 免费看美女性在线毛片视频| 国产精品久久电影中文字幕| 国产亚洲精品久久久久久毛片| 国产蜜桃级精品一区二区三区| 在线观看午夜福利视频| 两个人看的免费小视频| 日韩精品青青久久久久久| 色综合站精品国产| 亚洲欧美精品综合久久99| 欧美精品啪啪一区二区三区| 午夜a级毛片| av视频在线观看入口| 欧美中文综合在线视频| 婷婷精品国产亚洲av| 亚洲精品久久成人aⅴ小说| 午夜福利在线观看吧| 级片在线观看| 999久久久国产精品视频| 国产一区二区在线av高清观看| av福利片在线| 免费在线观看视频国产中文字幕亚洲| 午夜免费观看网址| 亚洲色图 男人天堂 中文字幕| 欧美久久黑人一区二区| 日本免费一区二区三区高清不卡| 精品国产乱码久久久久久男人| 国产日本99.免费观看| 国产亚洲精品av在线| av中文乱码字幕在线| 亚洲性夜色夜夜综合| 亚洲一区高清亚洲精品| 久久国产精品影院| 美女高潮喷水抽搐中文字幕| 亚洲一卡2卡3卡4卡5卡精品中文| 精品高清国产在线一区| 天天躁狠狠躁夜夜躁狠狠躁| 久久天躁狠狠躁夜夜2o2o| 日日爽夜夜爽网站| 成人av一区二区三区在线看| 精品久久久久久久毛片微露脸| av片东京热男人的天堂| 亚洲av五月六月丁香网| 亚洲精品美女久久久久99蜜臀| 在线观看日韩欧美| 亚洲午夜理论影院| 国产不卡一卡二| av超薄肉色丝袜交足视频| 国产久久久一区二区三区| 在线观看66精品国产| 男女床上黄色一级片免费看| e午夜精品久久久久久久| 成人永久免费在线观看视频| 欧美黑人精品巨大| 99在线视频只有这里精品首页| 欧美最黄视频在线播放免费| 亚洲国产精品999在线| 日本a在线网址| 色尼玛亚洲综合影院| www日本在线高清视频| 在线观看一区二区三区| 制服诱惑二区| 成人永久免费在线观看视频| 国产高清激情床上av| 99riav亚洲国产免费| 国产在线精品亚洲第一网站| 2021天堂中文幕一二区在线观| 久久精品国产亚洲av高清一级| 亚洲国产精品久久男人天堂| www.自偷自拍.com| 亚洲精品粉嫩美女一区| 18禁黄网站禁片午夜丰满| 一级毛片女人18水好多| av福利片在线观看| 天堂√8在线中文| 免费在线观看亚洲国产| 又黄又爽又免费观看的视频| 久久精品国产亚洲av香蕉五月| 91国产中文字幕| 国产精品电影一区二区三区| 国产不卡一卡二| 久久久久九九精品影院| 黄色毛片三级朝国网站| 国产主播在线观看一区二区| 三级毛片av免费| 日韩精品中文字幕看吧| 亚洲av日韩精品久久久久久密| 少妇的丰满在线观看| 黄色成人免费大全| 嫩草影院精品99| 亚洲国产中文字幕在线视频| 大型黄色视频在线免费观看| 这个男人来自地球电影免费观看| 99久久99久久久精品蜜桃| 18禁黄网站禁片免费观看直播| 欧美成人一区二区免费高清观看 | 夜夜看夜夜爽夜夜摸| 亚洲精品国产精品久久久不卡| 国产单亲对白刺激| 久久婷婷成人综合色麻豆| 叶爱在线成人免费视频播放| 午夜精品一区二区三区免费看| 国产精品久久久久久亚洲av鲁大| 日韩高清综合在线| 久久精品亚洲精品国产色婷小说| 国产精品一及| 亚洲免费av在线视频| 亚洲午夜精品一区,二区,三区| 在线免费观看的www视频| 免费在线观看成人毛片| 国产99白浆流出| 亚洲九九香蕉| 精品国产乱子伦一区二区三区| 亚洲熟女毛片儿| 亚洲av电影在线进入| 亚洲精品国产一区二区精华液| 小说图片视频综合网站| 我要搜黄色片| 窝窝影院91人妻| 亚洲成人中文字幕在线播放| 99在线视频只有这里精品首页| 欧美 亚洲 国产 日韩一| 国产91精品成人一区二区三区| 久久久久性生活片| 妹子高潮喷水视频| 国产精品久久久久久人妻精品电影| 欧美一级a爱片免费观看看 | 可以在线观看毛片的网站| 一级a爱片免费观看的视频| 欧美乱妇无乱码| 亚洲一区二区三区不卡视频| 国产欧美日韩精品亚洲av| 久久草成人影院| 久久久久九九精品影院| 岛国在线观看网站| 中文字幕熟女人妻在线| 亚洲av成人精品一区久久| 婷婷精品国产亚洲av| 亚洲成人中文字幕在线播放| 99热6这里只有精品| 国语自产精品视频在线第100页| 99在线人妻在线中文字幕| 精品久久蜜臀av无| 亚洲成人久久性| 搡老妇女老女人老熟妇| 看免费av毛片| 免费电影在线观看免费观看| 欧美一级毛片孕妇| 亚洲真实伦在线观看| www.www免费av| 国产伦一二天堂av在线观看| 变态另类丝袜制服| 99热这里只有精品一区 | 五月伊人婷婷丁香| 亚洲人成电影免费在线| 国产精品久久久久久久电影 | 亚洲av日韩精品久久久久久密| 法律面前人人平等表现在哪些方面| 好男人电影高清在线观看| 久久亚洲真实| 欧美高清成人免费视频www| 黄色女人牲交| 婷婷丁香在线五月| 午夜影院日韩av| 午夜福利视频1000在线观看| 国产精品98久久久久久宅男小说| 我要搜黄色片| 免费观看精品视频网站| 宅男免费午夜| 亚洲欧美精品综合久久99| 国产爱豆传媒在线观看 | 91字幕亚洲| 久久亚洲真实| 国内精品一区二区在线观看| 久久久精品欧美日韩精品| 两个人看的免费小视频| 国产免费av片在线观看野外av| 97超级碰碰碰精品色视频在线观看| 在线观看www视频免费| 欧美成人性av电影在线观看| 91九色精品人成在线观看| 亚洲18禁久久av| 欧洲精品卡2卡3卡4卡5卡区| 欧美在线黄色| 99在线视频只有这里精品首页| 国产黄片美女视频| 欧美成人性av电影在线观看| 亚洲专区字幕在线| 成在线人永久免费视频| 国产探花在线观看一区二区| 久久久久久久久久黄片| 日本在线视频免费播放| 男女下面进入的视频免费午夜| 免费在线观看成人毛片| 大型黄色视频在线免费观看| 国产真实乱freesex| 精品福利观看| 欧美在线一区亚洲| 无限看片的www在线观看| 亚洲精品粉嫩美女一区| 一级毛片女人18水好多| 国产蜜桃级精品一区二区三区| 成年免费大片在线观看| 亚洲 国产 在线| 两性夫妻黄色片| 岛国在线观看网站| 亚洲精品中文字幕一二三四区| 色综合婷婷激情| 99精品欧美一区二区三区四区| 欧美中文综合在线视频| 国产精品香港三级国产av潘金莲| 欧美3d第一页| 亚洲精品一区av在线观看| 麻豆国产av国片精品| 黄色成人免费大全| 最近最新免费中文字幕在线| 变态另类成人亚洲欧美熟女| 亚洲一码二码三码区别大吗| 男男h啪啪无遮挡| 欧美黄色片欧美黄色片| 亚洲天堂国产精品一区在线| 丰满的人妻完整版| 亚洲国产中文字幕在线视频| avwww免费| 性欧美人与动物交配| 亚洲专区中文字幕在线| 可以在线观看的亚洲视频| 久久精品91蜜桃| 亚洲黑人精品在线| 岛国在线观看网站| 日韩欧美免费精品| 搞女人的毛片| 男女之事视频高清在线观看| 成人永久免费在线观看视频| 日韩欧美免费精品| 国产av麻豆久久久久久久| 国产精品一及| 国产又黄又爽又无遮挡在线| 一进一出好大好爽视频| 亚洲欧洲精品一区二区精品久久久| 亚洲成人中文字幕在线播放| 精品欧美一区二区三区在线| 在线视频色国产色| 国产区一区二久久| 午夜福利18| 99久久国产精品久久久| 男人舔奶头视频| av福利片在线| 天天躁夜夜躁狠狠躁躁| 欧美日韩一级在线毛片| 亚洲专区中文字幕在线| 午夜老司机福利片| 国内少妇人妻偷人精品xxx网站 | 真人做人爱边吃奶动态| 色综合站精品国产| 亚洲国产欧美网| 变态另类丝袜制服| 久久 成人 亚洲| www.999成人在线观看| 伦理电影免费视频| 丰满人妻一区二区三区视频av | 十八禁人妻一区二区| 亚洲一区中文字幕在线| 两个人视频免费观看高清| 搡老熟女国产l中国老女人| 九九热线精品视视频播放| 一级毛片精品| 淫秽高清视频在线观看| 色综合婷婷激情| 欧美日韩中文字幕国产精品一区二区三区| 国产1区2区3区精品| 变态另类丝袜制服| 亚洲中文日韩欧美视频| 欧美性猛交╳xxx乱大交人| 午夜日韩欧美国产| 听说在线观看完整版免费高清| 国产激情偷乱视频一区二区| 久久久久久国产a免费观看| 淫妇啪啪啪对白视频| 美女高潮喷水抽搐中文字幕| 看免费av毛片| 欧美性猛交黑人性爽| 一级毛片精品| 亚洲av电影在线进入| 国产成人精品久久二区二区免费| 亚洲狠狠婷婷综合久久图片| 欧美乱码精品一区二区三区| 香蕉丝袜av| 女人爽到高潮嗷嗷叫在线视频| 中文字幕熟女人妻在线| 又黄又粗又硬又大视频| 99国产精品一区二区蜜桃av| 国产精品免费视频内射| 高清毛片免费观看视频网站| 国产一区二区三区视频了| 成人手机av| 不卡一级毛片| 久99久视频精品免费| 国产精品综合久久久久久久免费| 18禁黄网站禁片午夜丰满| 亚洲 国产 在线| 中文字幕精品亚洲无线码一区| 18禁观看日本| 免费在线观看成人毛片| 国产成人系列免费观看| 欧美成人免费av一区二区三区| 中文字幕人成人乱码亚洲影| 人妻久久中文字幕网| 男人舔女人下体高潮全视频| 国产高清videossex| 少妇被粗大的猛进出69影院| 九色国产91popny在线| 久久婷婷人人爽人人干人人爱| svipshipincom国产片| 国产av一区二区精品久久| 欧美国产日韩亚洲一区| 岛国视频午夜一区免费看| 精品一区二区三区av网在线观看| 亚洲中文av在线| 一级毛片精品| 叶爱在线成人免费视频播放| 日韩精品中文字幕看吧| 久久久久国内视频| 亚洲成人久久性| 久99久视频精品免费| 日韩精品青青久久久久久| 97超级碰碰碰精品色视频在线观看| 村上凉子中文字幕在线| 亚洲男人的天堂狠狠| 日韩欧美一区二区三区在线观看| 久久国产精品人妻蜜桃| 日韩三级视频一区二区三区| 国产成人精品久久二区二区免费| 性色av乱码一区二区三区2| 色老头精品视频在线观看| 一级片免费观看大全| 国产精品1区2区在线观看.| 午夜福利在线观看吧| 国产精品久久久久久久电影 | 国产成人影院久久av| 亚洲中文字幕日韩| 亚洲成人久久爱视频| 人人妻,人人澡人人爽秒播| 国产区一区二久久| 日本 av在线| 制服人妻中文乱码| 国产av不卡久久| 男男h啪啪无遮挡| 俄罗斯特黄特色一大片| 国产精品一区二区三区四区免费观看 | 一本大道久久a久久精品| 成人午夜高清在线视频| 中文亚洲av片在线观看爽| 欧美乱妇无乱码| 999久久久国产精品视频| 99久久精品国产亚洲精品| 亚洲成人中文字幕在线播放| 国产av一区在线观看免费| 国产精品,欧美在线| 淫妇啪啪啪对白视频| 国产精品日韩av在线免费观看| 中文资源天堂在线| 久久亚洲真实| 999精品在线视频| 久久久精品国产亚洲av高清涩受| 国产一区二区激情短视频| 欧美另类亚洲清纯唯美| 久久国产乱子伦精品免费另类| 国产成人av教育| 免费在线观看影片大全网站| 日韩欧美精品v在线| 91成年电影在线观看| 亚洲精华国产精华精| 黄色成人免费大全| 亚洲18禁久久av| 啦啦啦韩国在线观看视频| 在线永久观看黄色视频| 久久草成人影院| 免费看a级黄色片| 亚洲人成伊人成综合网2020| 国产爱豆传媒在线观看 | 特级一级黄色大片| 国产高清有码在线观看视频 | 宅男免费午夜| 亚洲男人的天堂狠狠| www.www免费av| 欧美绝顶高潮抽搐喷水| 中文字幕熟女人妻在线| 天堂av国产一区二区熟女人妻 | 黄片大片在线免费观看| 亚洲av五月六月丁香网| 亚洲欧美一区二区三区黑人| 国产精品乱码一区二三区的特点| 这个男人来自地球电影免费观看| 亚洲全国av大片| 欧美中文日本在线观看视频| 99久久精品热视频| 日日夜夜操网爽| 国产亚洲精品久久久久5区| 午夜激情av网站| 成年人黄色毛片网站| 波多野结衣高清无吗| 一卡2卡三卡四卡精品乱码亚洲| 久久天堂一区二区三区四区| 亚洲中文日韩欧美视频| 一个人观看的视频www高清免费观看 | 欧美绝顶高潮抽搐喷水| 久久久久九九精品影院| 日本五十路高清| 久久伊人香网站| 床上黄色一级片| 国产亚洲精品一区二区www| 国产精品久久视频播放| 国产精品综合久久久久久久免费| 91麻豆av在线| 亚洲av成人av| 亚洲专区字幕在线| 国产亚洲av嫩草精品影院| 99国产极品粉嫩在线观看| 美女扒开内裤让男人捅视频| 变态另类丝袜制服| 国产精品野战在线观看| 18禁美女被吸乳视频| 欧美成人午夜精品| aaaaa片日本免费| 久久精品夜夜夜夜夜久久蜜豆 | 久久天堂一区二区三区四区| 国产成人精品久久二区二区免费| av超薄肉色丝袜交足视频| 老熟妇仑乱视频hdxx| 精品久久蜜臀av无| 亚洲熟妇中文字幕五十中出| 国产伦在线观看视频一区| 久久天躁狠狠躁夜夜2o2o| 天天躁夜夜躁狠狠躁躁| 日韩欧美在线二视频| 日韩三级视频一区二区三区| 欧美激情久久久久久爽电影| 亚洲色图 男人天堂 中文字幕| 久久国产乱子伦精品免费另类| 制服人妻中文乱码| 丝袜美腿诱惑在线| 一边摸一边做爽爽视频免费| 亚洲欧美激情综合另类| 1024香蕉在线观看| 香蕉久久夜色| 日本 欧美在线| 亚洲全国av大片| 国产成人啪精品午夜网站| 国产精品九九99| 亚洲av五月六月丁香网| 18禁黄网站禁片午夜丰满| 日韩精品免费视频一区二区三区| 脱女人内裤的视频| 99国产精品一区二区蜜桃av| 国内少妇人妻偷人精品xxx网站 | 精品少妇一区二区三区视频日本电影| 亚洲人与动物交配视频| 久久99热这里只有精品18| 久久久久久久久中文| 母亲3免费完整高清在线观看| 天天躁夜夜躁狠狠躁躁| 国产精品永久免费网站| 精品久久久久久久毛片微露脸| 三级男女做爰猛烈吃奶摸视频| 精品无人区乱码1区二区| 免费av毛片视频| 午夜日韩欧美国产| 十八禁人妻一区二区| 午夜影院日韩av| 日本一本二区三区精品| 久久久精品欧美日韩精品| 亚洲人成网站在线播放欧美日韩| 亚洲免费av在线视频| 欧美黄色片欧美黄色片| 欧美性长视频在线观看| 精品熟女少妇八av免费久了| 草草在线视频免费看| 亚洲av片天天在线观看| 国产精品久久视频播放| 欧美日本亚洲视频在线播放| 成人18禁高潮啪啪吃奶动态图| 国产一区二区激情短视频| 国产精品一区二区精品视频观看| x7x7x7水蜜桃| 亚洲,欧美精品.| 日韩国内少妇激情av| 午夜精品久久久久久毛片777| avwww免费| 午夜日韩欧美国产| 男人的好看免费观看在线视频 | 黑人欧美特级aaaaaa片| 欧美日韩乱码在线| 亚洲一区二区三区色噜噜| 久久久久国产一级毛片高清牌| 国产黄a三级三级三级人| 欧美精品亚洲一区二区| 国内精品久久久久久久电影| 免费在线观看完整版高清| 天天一区二区日本电影三级| 可以在线观看的亚洲视频| 国产蜜桃级精品一区二区三区| 在线观看舔阴道视频| 两性夫妻黄色片| 色噜噜av男人的天堂激情| 精品高清国产在线一区| 桃红色精品国产亚洲av| 丁香欧美五月| 丁香六月欧美| 十八禁人妻一区二区| 一级a爱片免费观看的视频| 日日爽夜夜爽网站| 久久久久国内视频| 国产在线观看jvid| 亚洲av中文字字幕乱码综合| 午夜福利在线观看吧| 无遮挡黄片免费观看| 窝窝影院91人妻| 一边摸一边抽搐一进一小说| 午夜福利18| 可以在线观看毛片的网站| 1024视频免费在线观看| 欧美av亚洲av综合av国产av| 免费在线观看日本一区| 18美女黄网站色大片免费观看| 亚洲自拍偷在线| 成人一区二区视频在线观看| 亚洲精品久久国产高清桃花| 欧美av亚洲av综合av国产av| 黄色毛片三级朝国网站| 久久久久九九精品影院| 亚洲国产看品久久| 99久久99久久久精品蜜桃| 亚洲色图 男人天堂 中文字幕| 国产精品av视频在线免费观看| 国产伦一二天堂av在线观看| 欧美日韩一级在线毛片| 亚洲成人国产一区在线观看| 99国产精品一区二区三区| 国产成人一区二区三区免费视频网站|