• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于字的分布表征的漢語(yǔ)基本塊識(shí)別

    2014-02-28 01:25:53李國(guó)臣黨帥兵王瑞波李濟(jì)洪
    中文信息學(xué)報(bào) 2014年6期
    關(guān)鍵詞:基本塊分詞漢語(yǔ)

    李國(guó)臣,黨帥兵,王瑞波,李濟(jì)洪

    (1.太原工業(yè)學(xué)院 計(jì)算機(jī)工程系,山西 太原 030008;2. 山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006;3. 山西大學(xué) 計(jì)算中心,山西 太原 030006;)

    1 引言

    漢語(yǔ)句法分析體系,目前主要有兩種: 第一種是直接在分詞、詞性標(biāo)注的基礎(chǔ)上構(gòu)建漢語(yǔ)句子的完全句法分析樹(shù),另外一種是將漢語(yǔ)句子分割成不同層面的語(yǔ)塊的淺層句法分析。后者的典型代表是周強(qiáng)等提出的語(yǔ)塊分析體系[1]。該體系中提出了漢語(yǔ)基本塊、多詞塊和功能塊3種塊。周強(qiáng)構(gòu)建了相應(yīng)語(yǔ)料,并設(shè)置了漢語(yǔ)基本塊等自動(dòng)識(shí)別任務(wù),開(kāi)發(fā)了自動(dòng)分析工具。周強(qiáng)構(gòu)建的第一個(gè)基于規(guī)則的漢語(yǔ)基本塊分析器[2],在其測(cè)試集上F值達(dá)到89.47%。不過(guò),該基本塊分析器十分依賴于漢語(yǔ)句子的分詞和詞性標(biāo)注性能。后來(lái),宇航等[3]使用條件隨機(jī)場(chǎng)模型構(gòu)建了一個(gè)漢語(yǔ)基本塊標(biāo)注模型,模型的F值達(dá)到89.54%。在周強(qiáng)組織的漢語(yǔ)基本塊分析評(píng)測(cè)CIPS-Pars-Eval-2009中,基本塊自動(dòng)識(shí)別的最好結(jié)果為F值[4]93.20%(封閉測(cè)試)和90.53%(開(kāi)放測(cè)試)。

    需要注意的是,上述評(píng)測(cè)任務(wù)中,絕大多數(shù)是通過(guò)使用最大熵、條件隨機(jī)場(chǎng)等模型對(duì)漢語(yǔ)句子中的每個(gè)詞語(yǔ)進(jìn)行標(biāo)注,直接將詞語(yǔ)、詞性等原子特征及組合特征加入到學(xué)習(xí)算法中進(jìn)行訓(xùn)練,并最終將預(yù)測(cè)得到的標(biāo)記合并成漢語(yǔ)基本塊的識(shí)別結(jié)果。這種做法存在兩個(gè)問(wèn)題: 第一,這些基本塊識(shí)別模型的性能非常依賴于測(cè)試集中分詞的正確性和一致性。設(shè)想如果測(cè)試集中使用的分詞規(guī)范和訓(xùn)練集不一致時(shí),基本塊自動(dòng)識(shí)別的性能會(huì)有很大的下降。第二,這些基本塊識(shí)別模型主要使用詞、詞性等示性特征,機(jī)器學(xué)習(xí)算法很難學(xué)習(xí)、泛化相同或相近句法結(jié)構(gòu)而使用不同詞語(yǔ)表達(dá)的樣例。

    第一個(gè)問(wèn)題的一種解決思路是避免使用詞語(yǔ)作為標(biāo)注單位,而直接使用漢字作為標(biāo)注單位。這樣可以避免由于分詞錯(cuò)誤或者不一致而導(dǎo)致的基本塊標(biāo)注的性能明顯下降。目前,已經(jīng)有很多的研究工作在探究直接從漢字出發(fā)來(lái)識(shí)別句法塊,構(gòu)建漢語(yǔ)句法分析樹(shù)[5]。本文采用這種方法,直接將漢語(yǔ)基本塊看作是以漢字為標(biāo)注單位的任務(wù),并使用條件隨機(jī)場(chǎng)、最大熵和深層神經(jīng)網(wǎng)絡(luò)等機(jī)器模型來(lái)進(jìn)行標(biāo)注。

    第二個(gè)問(wèn)題中,我們可以使用幾種方法來(lái)將詞語(yǔ)之間的句法、語(yǔ)義關(guān)聯(lián)信息加入到機(jī)器學(xué)習(xí)算法中。其中,一種方法是,直接使用知網(wǎng)、同義詞詞林等人工構(gòu)建的語(yǔ)義資源,以這些資源構(gòu)建特征加入到機(jī)器學(xué)習(xí)算法中,來(lái)提高模型識(shí)別的性能[6]。另外一種方法是,使用潛在語(yǔ)義分析,PLSA[7]以及LDA[8]等算法在使用大規(guī)模生語(yǔ)料庫(kù)訓(xùn)練出各個(gè)詞語(yǔ)的實(shí)值向量表示,并將這些表示作為特征加入到機(jī)器學(xué)習(xí)算法中,來(lái)改進(jìn)模型識(shí)別的精度。在本文提出的方法中,我們直接使用兩種經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型(C&W[9]和word2vec[10-12])在大規(guī)模語(yǔ)料上進(jìn)行無(wú)監(jiān)督的訓(xùn)練,得到漢字的分布表征,并將這種表征加入到基于字的漢語(yǔ)基本塊識(shí)別模型中,來(lái)驗(yàn)證該分布表征信息對(duì)模型性能的影響。

    使用神經(jīng)網(wǎng)絡(luò)來(lái)獲取字以及詞的分布表征信息已經(jīng)得到了研究者的廣泛關(guān)注。其中,最著名的是Bengio等人[13]提出的語(yǔ)言模型。該工作中,將英文句子中詞語(yǔ)的n-gram串通過(guò)一個(gè)實(shí)值矩陣映射成一個(gè)固定維度的實(shí)值向量,然后將其作為輸入,使用神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了一個(gè)概率語(yǔ)言模型。在大規(guī)模語(yǔ)料上進(jìn)行訓(xùn)練中,不斷地對(duì)實(shí)值矩陣中的各個(gè)元素進(jìn)行更新學(xué)習(xí),最終形成了每個(gè)詞語(yǔ)的分布表征。在Collobert和Weston等人[9]的工作中,通過(guò)替換n-gram詞串的當(dāng)前詞來(lái)構(gòu)造出一些偽例,然后將真實(shí)的n-gram串和構(gòu)造的偽例作為訓(xùn)練樣本,使用hinge損失函數(shù)來(lái)無(wú)監(jiān)督地訓(xùn)練整個(gè)神經(jīng)網(wǎng)絡(luò)模型,獲得了英文詞語(yǔ)的分布表征。后來(lái)的很多研究工作將這種方法獲得的分布表征稱為C&W分布表征。另外一個(gè)著名的工作是Mikolov等人提出的[10]。該工作中提出的CBOW方法和Skip-gram算法具有訓(xùn)練速度快、分布表征性質(zhì)良好等特點(diǎn)。這些工作中有很多的例子表明,使用大規(guī)模無(wú)監(jiān)督的語(yǔ)料進(jìn)行訓(xùn)練后,詞語(yǔ)的分布表征可以較好地體現(xiàn)原詞語(yǔ)的句法、語(yǔ)義信息的相似性。本文主要使用了漢語(yǔ)字的C&W[9]分布表征和word2vec[10-12]分布表征(使用CBOW方法獲得)。

    字和詞的分布表征也被很多研究者使用到自然語(yǔ)言處理的各種任務(wù)之中,例如,英文的情感分析、詞性標(biāo)注、命名體識(shí)別、語(yǔ)義角色標(biāo)注以及漢語(yǔ)的分詞[14]、基本塊識(shí)別[15]等任務(wù)中。Collobert和Weston等人的研究工作[9]將英文中的詞性標(biāo)注、名命體識(shí)別和語(yǔ)義角色標(biāo)注等多個(gè)任務(wù)直接放入到一個(gè)神經(jīng)網(wǎng)絡(luò)模型中,使用分布表征矩陣來(lái)將英文詞映射到實(shí)值向量上,并使用梯度下降算法進(jìn)行訓(xùn)練,得到了一個(gè)接近于目前最好性能的自然語(yǔ)言理解模型。Turian在文獻(xiàn)[16]中提出一種適用于自然語(yǔ)言理解任務(wù)的半監(jiān)督學(xué)習(xí)框架,即: 將無(wú)監(jiān)督訓(xùn)練得到的詞語(yǔ)的分布表征作為特征加入到有監(jiān)督的機(jī)器學(xué)習(xí)算法中,來(lái)改進(jìn)各種自然語(yǔ)言理解模型的性能。來(lái)斯惟等人使用字的分布表征和神經(jīng)網(wǎng)絡(luò)算法來(lái)構(gòu)建漢語(yǔ)分詞模型[14]。他們的實(shí)驗(yàn)結(jié)果表明,該方法在漢語(yǔ)分詞任務(wù)上有很大的潛力。侯瀟琪等人[15]將詞的分布表征加入到基本塊識(shí)別模型中,在正確分詞基礎(chǔ)上BIO的標(biāo)記精度達(dá)到85.90%的。不過(guò),該工作使用詞作為標(biāo)注單位,實(shí)用中標(biāo)注結(jié)果明顯依賴于分詞性能的好壞。

    本文直接將字作為標(biāo)注單位來(lái)構(gòu)建基本塊識(shí)別模型。在僅僅使用以字構(gòu)建的特征下,本文對(duì)比了條件隨機(jī)場(chǎng)、最大熵和深層神經(jīng)網(wǎng)絡(luò)等標(biāo)注模型,并對(duì)比了字的隨機(jī)向量表示、C&W表示和word2vec表示三種分布表征。實(shí)驗(yàn)結(jié)果表明,在[-3,3]窗口下,將字的word2vec分布表征融入到五層神經(jīng)網(wǎng)絡(luò)下,漢語(yǔ)基本塊的識(shí)別性能最好,可以達(dá)到77.12%的F值。本文的主要目的是基于漢語(yǔ)基本塊識(shí)別任務(wù),探討漢語(yǔ)詞語(yǔ)的表示學(xué)習(xí)以及深層神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型的有效性。

    本文章節(jié)安排如下: 第2節(jié)介紹了本文的整個(gè)基本塊識(shí)別模型框架,并詳細(xì)給出了本文使用的深層神經(jīng)網(wǎng)絡(luò)的具體配置以及標(biāo)注算法所使用的標(biāo)記集合;第3節(jié)描述了本文所用的實(shí)驗(yàn)數(shù)據(jù)、實(shí)驗(yàn)設(shè)置和評(píng)價(jià)指標(biāo);第4節(jié)總結(jié)了實(shí)驗(yàn)結(jié)果,并進(jìn)行了深入的分析;最后對(duì)本文工作做了總結(jié),并給出下一步的研究方向。

    2 基于字的漢語(yǔ)基本塊識(shí)別模型描述

    本文將基本塊識(shí)別轉(zhuǎn)化成漢字的序列標(biāo)注任務(wù),然后借助于多種統(tǒng)計(jì)機(jī)器學(xué)習(xí)算法對(duì)該序列標(biāo)注問(wèn)題進(jìn)行建模。

    2.1 問(wèn)題描述

    漢語(yǔ)基本塊識(shí)別任務(wù)是對(duì)給定的一個(gè)漢語(yǔ)句子,標(biāo)注每個(gè)基本塊的位置,確定基本塊中所包含的具體詞語(yǔ)。由于一個(gè)句子中的漢語(yǔ)基本塊不存在重疊、嵌套和交叉問(wèn)題。因此,我們可以很容易地將其轉(zhuǎn)化成一個(gè)序列分割問(wèn)題,數(shù)學(xué)描述如下:

    上述的序列分割問(wèn)題,通常要引入一個(gè)標(biāo)記集合來(lái)將一個(gè)分割的識(shí)別問(wèn)題轉(zhuǎn)化到分割中所包含字的標(biāo)注問(wèn)題,即: 給分割中包含的每一個(gè)字賦予一個(gè)標(biāo)記來(lái)標(biāo)識(shí)該字在分割中的位置。常用的標(biāo)記集合有IOB1, IOB2, IOE1,IOE2, IOBES等,具體的轉(zhuǎn)化方法請(qǐng)參見(jiàn)文獻(xiàn)[17]。本文中采用了IOBES標(biāo)記集合。其中用“S”標(biāo)記單字基本塊,對(duì)于包含多個(gè)字的基本塊,塊中的第一個(gè)字用“B”標(biāo)記,最后一個(gè)字用“E”標(biāo)記,中間的字用“I”標(biāo)記,對(duì)于塊外的字統(tǒng)一用“O”標(biāo)記。具體的對(duì)應(yīng)關(guān)系如下例所示。

    原始句子: 醫(yī)和藥是密切相關(guān)的。

    基本塊信息: [ 醫(yī) ] 和 [ 藥 ] [ 是 ] [ 密切相關(guān) ] 的 。

    標(biāo)記信息: 醫(yī)/S 和/O 藥/S 是/S 密/B 切/I 相/I 關(guān)/E 的/O 。/O

    通過(guò)轉(zhuǎn)化,基本塊識(shí)別問(wèn)題可以轉(zhuǎn)化成一個(gè)序列標(biāo)注問(wèn)題: 給定漢語(yǔ)句子序列X=(x1x2…xn),正確識(shí)別出一個(gè)句子的基本塊信息標(biāo)記序列Y=y1y2…yn,其中,yi屬于{I,O,B,E,S}。即找到:

    (1)

    s.t.Y*是一個(gè)合理的序列,可以還原出基本塊信息。

    2.2 深層神經(jīng)網(wǎng)絡(luò)模型

    解決式(1)所描述的問(wèn)題,條件隨機(jī)場(chǎng)模型[18]是一種較好的算法。不過(guò),本文僅在一部分對(duì)比實(shí)驗(yàn)中使用了條件隨機(jī)場(chǎng)模型。本文主要關(guān)注最大熵模型和深層神經(jīng)網(wǎng)絡(luò)模型。這兩種模型均把式(1)描述的原始問(wèn)題轉(zhuǎn)化成如下的問(wèn)題:

    s.t.Y*是一個(gè)合理的序列,可以還原出基本塊信息。

    實(shí)際上,只有當(dāng)標(biāo)記序列Y中任意兩個(gè)yi和yj(i不等于j)之間相互獨(dú)立時(shí),式(1)才可以轉(zhuǎn)化成式(2)和式(3)。在本文中,為了簡(jiǎn)單處理,我們假設(shè)這種獨(dú)立性成立。最大熵算法的基本思想和模型形式在文獻(xiàn)[19]中已經(jīng)給出了很好的描述。這里,我們僅給出本文使用的深層神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)及一些參數(shù)設(shè)置。

    本文所使用的深層神經(jīng)網(wǎng)絡(luò)為5層結(jié)構(gòu)(算上原始輸入層),如圖1所示。其中,原始輸入是w個(gè)字在字表中對(duì)應(yīng)的索引值,然后通過(guò)在分布表征矩陣中查找出這w個(gè)字中每個(gè)字所對(duì)應(yīng)的n維的實(shí)值向量,并依字序首尾相接成的w·n維的實(shí)值向量v。在第1隱層直接使用tanh函數(shù)對(duì)向量v進(jìn)行非線性變換形成h1,該層中的每個(gè)節(jié)點(diǎn)h1j都與表示層中的每個(gè)節(jié)點(diǎn)vi相連。進(jìn)而,在第2隱層中,將h1使用tanh變換得到h2。同樣,h1和h2之間的節(jié)點(diǎn)也是完全相連的。最后,在輸出層,使用softmax函數(shù)對(duì)h2層的節(jié)點(diǎn)值進(jìn)行概率歸一化得出P(yi=t|X),t屬于{B,I,O,E,S}。最終,使用輸出層的5個(gè)節(jié)點(diǎn)中最大概率值對(duì)應(yīng)的標(biāo)記作為第i詞的最終標(biāo)記。

    圖1 深層神經(jīng)網(wǎng)絡(luò)模型圖

    2.3 字的分布表征

    一般來(lái)說(shuō),在使用機(jī)器學(xué)習(xí)算法解決式(1)和式(3)中描述的問(wèn)題時(shí),并沒(méi)有將整個(gè)句子X(jué)中的所有信息引入來(lái)預(yù)測(cè)每個(gè)字的標(biāo)記信息。在預(yù)測(cè)第i個(gè)字的標(biāo)記時(shí),通常只是將該字周圍的一些字的信息作為特征加入到機(jī)器學(xué)習(xí)算法中,即,使用開(kāi)窗口的方式來(lái)進(jìn)行特征選取。本文也采用了這種做法。

    區(qū)別于直接使用字、詞作為特征,本文使用了字的分布表征作為特征信息。不同于字的0-1向量表

    示,字的分布表征是將字表示成為一個(gè)定長(zhǎng)的實(shí)值向量。該實(shí)值向量是通過(guò)某個(gè)表示學(xué)習(xí)模型來(lái)獲得的。具體請(qǐng)參考本文第一部分給出的相關(guān)文獻(xiàn)。

    需要注意的是,假設(shè)常用字有5 000個(gè),并且特征窗口設(shè)置為[-2,2],如果直接使用字的0-1向量表示作為特征,那么機(jī)器學(xué)習(xí)算法就必須處理25 000維的特征向量。如果再考慮上字、詞特征之間的組合特征等,那么特征向量的維度會(huì)成倍地往上增長(zhǎng)。這很容易引起維數(shù)災(zāi)難問(wèn)題。并且,在這樣的特征矩陣?yán)?,存在著?yán)重的稀疏問(wèn)題。字的分布表征一般為低維(比如100維)的實(shí)值向量,那么上面的問(wèn)題就可以轉(zhuǎn)化為一個(gè)在500維特征上的一個(gè)學(xué)習(xí)問(wèn)題。值得說(shuō)明的是,字的分布表征中能學(xué)習(xí)到字之間的句法、語(yǔ)義的某些關(guān)聯(lián)性,這為自然語(yǔ)言處理許多任務(wù)帶來(lái)新思路、新方法。下面的幾節(jié)中,給出漢語(yǔ)基本塊識(shí)別任務(wù)實(shí)驗(yàn)。

    3 實(shí)驗(yàn)設(shè)置

    本文實(shí)驗(yàn)主要關(guān)心使用字的分布表征來(lái)進(jìn)行基本塊的識(shí)別實(shí)驗(yàn)。在所有實(shí)驗(yàn)中,基本塊的識(shí)別問(wèn)題被轉(zhuǎn)化成字層面的序列標(biāo)注問(wèn)題。本文主要使用了IOBES標(biāo)注集合。實(shí)驗(yàn)中嘗試了多種機(jī)器學(xué)習(xí)算法,并對(duì)它們進(jìn)行了比較。

    3.1 實(shí)驗(yàn)語(yǔ)料

    實(shí)驗(yàn)語(yǔ)料使用了CIPS-ParsEval-2009中發(fā)布的漢語(yǔ)基本塊分析語(yǔ)料。語(yǔ)料庫(kù)總規(guī)模為765 820字, 訓(xùn)練文件數(shù)為171個(gè), 包含14 249條句子, 共計(jì)618 231字。測(cè)試文件數(shù)為 43個(gè), 包含3 751條句子 ,共計(jì)147 589字。語(yǔ)料中,基本塊的塊長(zhǎng)(塊中所含字?jǐn)?shù))統(tǒng)計(jì)如表1所示。

    表1 基本塊語(yǔ)料塊長(zhǎng)度統(tǒng)計(jì)

    從表1中可以看出,塊長(zhǎng)小于等于5的塊占到近95%,而長(zhǎng)度不大于7的塊占所有塊的99%。因此,在實(shí)驗(yàn)中,本文分別使用[-2,2]和[-3,3]窗口內(nèi)的字的分布表征作為特征,來(lái)對(duì)當(dāng)前字進(jìn)行標(biāo)注。

    3.2 要對(duì)比的標(biāo)注模型

    本文使用了3種標(biāo)注模型: 最大熵、條件隨機(jī)場(chǎng)和深層神經(jīng)網(wǎng)絡(luò)。其中,條件隨機(jī)場(chǎng)模型在序列分割和標(biāo)注任務(wù)中得到了廣泛的應(yīng)用[18]。本文使用了張樂(lè)博士開(kāi)發(fā)的MaxEnt最大熵工具包[20]。在將字的分布表征作為特征值代入到最大熵工具時(shí),做了平移處理(加上某個(gè)常量)讓所有的值都轉(zhuǎn)變?yōu)檎龜?shù)。實(shí)驗(yàn)中,高斯懲罰參數(shù)設(shè)為1.0。本文使用的深層神經(jīng)網(wǎng)絡(luò)模型是在pylearn2工具包[21]上開(kāi)發(fā)得到的。本文主要構(gòu)建了一個(gè)五層神經(jīng)網(wǎng)絡(luò)模型,該模型的結(jié)構(gòu)在3.2節(jié)中給出。其中,第一個(gè)隱層的單元個(gè)數(shù)為300,第二個(gè)隱層的單元個(gè)數(shù)為100。另外,本文進(jìn)行對(duì)照實(shí)驗(yàn)使用條件隨機(jī)場(chǎng)模型的crfpp工具包[22]。

    3.3 字的分布表征學(xué)習(xí)算法

    本文使用C&W算法[9]和 word2vec工具包[10-12]的CBOW算法來(lái)獲得字的分布表征。其中,我們?cè)O(shè)置每一個(gè)字使用100維的實(shí)值向量來(lái)表示。兩種工具包的訓(xùn)練語(yǔ)料均使用的是山西大學(xué)500萬(wàn)分詞語(yǔ)料。學(xué)習(xí)分布表征前,我們對(duì)語(yǔ)料庫(kù)進(jìn)行了簡(jiǎn)單的預(yù)處理,把所有的英文字母統(tǒng)一用“WORD”表示,所有的數(shù)字用“NUMBER”表示。在進(jìn)行基本塊識(shí)別前,我們將每一個(gè)字的分布表征單位化成一個(gè)長(zhǎng)度為1的向量。

    在C&W算法中,本文僅將隱層設(shè)置為一層,學(xué)習(xí)率設(shè)置為0.000 000 01,迭代時(shí)使用的是句子中字的5元組作為原始輸入。模型使用BGD(Batch Gradient Descent)優(yōu)化算法,其中,每一個(gè)minibatch設(shè)置為1 000。由于該表示學(xué)習(xí)算法可以無(wú)限地迭代下去,本文僅選擇迭代到5 500萬(wàn)minibatch后生成的字的分布表征。

    在word2vec工具包中,本文使用的是CBOW算法,并且使用層次化的softmax層作為輸出層,在訓(xùn)練時(shí)設(shè)置窗口大小為5。

    為了觀察C&W方法和word2vec方法的訓(xùn)練效果,本文仿照文獻(xiàn)[14],選取了“一”、“李”、“江”和“急”4個(gè)字,并給出了它們的最相似字。這里,我們先將字的分布表征向量進(jìn)行單位化,然后使用夾角余弦計(jì)算相似度。具體結(jié)果見(jiàn)表2。

    從表2中可以看出,C&W和word2vec兩種方法學(xué)習(xí)到的字的分布表征還是有所差別的。從直覺(jué)來(lái)看,C&W方法對(duì)“李”的聚類結(jié)果要比word2vec方法的要好。而對(duì)于“一”、“江”和“急”,兩種方法的聚類結(jié)果盡管不盡相同,但是,并沒(méi)有明顯的好壞之分。

    表2 不同字表示學(xué)習(xí)方法得到的“一”“李”“江”“急”的最相似字

    3.4 評(píng)價(jià)指標(biāo)

    本文從字層面和塊的層面來(lái)評(píng)價(jià)基本塊識(shí)別模型的性能。其中,在字層面,本文使用了標(biāo)記準(zhǔn)確率,它指的是所有標(biāo)簽中標(biāo)記正確的標(biāo)記數(shù)與總的標(biāo)記數(shù)的比值。在塊層面,本文使用了塊識(shí)別的準(zhǔn)確率、召回率和F值。它們的定義如下:

    4 實(shí)驗(yàn)結(jié)果和分析

    本節(jié)中,我們首先分析了不使用字的分布表征,只使用字作為特征的各種基本塊識(shí)別模型性能,然后又分析了使用字的分布表征的各模型性能,最后對(duì)基于詞的神經(jīng)網(wǎng)絡(luò)模型與基于字的神經(jīng)網(wǎng)絡(luò)模型做了對(duì)比分析。

    4.1 不使用字的分布表征的結(jié)果

    我們直接將字作為特征代入到基本塊識(shí)別模型中。表3和表4分別給出了兩種學(xué)習(xí)算法使用字特征時(shí)的基本塊識(shí)別性能。

    表3 MaxEnt算法+字特征

    表4 Crfpp算法+字特征

    對(duì)比表3和表4可以發(fā)現(xiàn),兩者的實(shí)驗(yàn)結(jié)果都較目前較好的一些基本塊分析模型的性能[4]要差很多。這主要是因?yàn)樯鲜鰧?shí)驗(yàn)中并沒(méi)有考慮詞性特征和詞、詞性的組合和搭配特征,而這些特征的加入可以明顯改善基本塊識(shí)別的性能。之所以不加入這些特征,主要是本文旨在探討字的分布表征對(duì)基本塊識(shí)別的影響。

    表5中給出了將詞作為標(biāo)注單位,將[-2,2]窗口內(nèi)的詞特征加入到條件隨機(jī)場(chǎng)模型中,進(jìn)行基本塊識(shí)別的結(jié)果。為了對(duì)比字特征與詞特征對(duì)于基本塊識(shí)別性能的影響,我們?cè)趯?shí)驗(yàn)中也未使用詞性特征,以及多元的組合搭配特征。

    表5 詞為標(biāo)注單位+Crfpp+[-2,2]窗口

    從表5中可以看出,如果分詞信息正確,基本詞層面的塊識(shí)別F值可以達(dá)到82.18%。但是,當(dāng)使用山西大學(xué)分詞軟件FC2000對(duì)測(cè)試集的句子自動(dòng)分詞后,基本塊識(shí)別的F值僅可以達(dá)到73.16%,明顯低于分詞信息正確時(shí)的實(shí)驗(yàn)結(jié)果。這說(shuō)明以詞語(yǔ)為標(biāo)注單位的基本塊識(shí)別模型在實(shí)際使用中,對(duì)于分詞系統(tǒng)的性能有著很大的依賴性。這也是本文希望研究以字為標(biāo)注單位的基本塊識(shí)別模型的重要原因之一。

    4.2 使用字的分布表征的結(jié)果

    這一小節(jié),我們將字的分布表征分別加入到最大熵模型,CRF模型和深層神經(jīng)網(wǎng)絡(luò)模型后的實(shí)驗(yàn)結(jié)果。

    4.2.1 最大熵+字的分布表征

    為了對(duì)比驗(yàn)證,我們將如下3種字的分布表征加入到最大熵模型中。3種分布表征中,除了包含上文提到的C&W字表示和word2vec字表示,本文還加入了完全隨機(jī)的字表示。隨機(jī)字表示是針對(duì)每一個(gè)字隨機(jī)生成了一個(gè)100維的實(shí)值向量。向量中的每一個(gè)元素從[-0.01,0.01]的均勻分布中抽取,然后,對(duì)該向量進(jìn)行單位化。

    表6給出了將字的3種分布表征加入到最大熵算法中的基本塊識(shí)別結(jié)果。

    表6 MaxEnt算法+字的分布表征

    對(duì)比表6中的3種分布表征的實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn),雖然C&W表示特征和word2vec表示特征的識(shí)別結(jié)果較完全隨機(jī)的表示特征有著明顯的上升(F值上升近10%~15%),但識(shí)別結(jié)果也很不理想(F值僅在50%左右)。探究其原因,從分類算法的角度來(lái)看,主要因?yàn)樽畲箪胤诸惼鞑⒉豢紤]整個(gè)序列的全局優(yōu)化,僅是針對(duì)每個(gè)字的標(biāo)記的單點(diǎn)優(yōu)化;從特征的表示來(lái)看,C&W和word2vec的分布表征盡管克服了原有的0-1表示特征的數(shù)據(jù)稀疏問(wèn)題,但是,兩種分布表征是使用無(wú)監(jiān)督的方式訓(xùn)練得到的,而沒(méi)有針對(duì)具體任務(wù)進(jìn)行優(yōu)化,因此,它們并沒(méi)有很好地表達(dá)出基本塊識(shí)別所需要的句法語(yǔ)義信息。

    對(duì)比表6中的兩種窗口下的實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn),窗口的擴(kuò)大并沒(méi)有帶來(lái)識(shí)別結(jié)果的明顯提升,甚至在隨機(jī)分布表征和word2vec分布表征的兩種情況下,窗口的擴(kuò)大還帶來(lái)了塊F值的些許下降。

    4.2.2 CRF+字的分布表征

    為了與基于字特征的CRF模型作對(duì)比,我們把上述3種分布表征作為特征直接應(yīng)用到CRF模型中。表7是得到的詳細(xì)結(jié)果。

    表7 CRF算法+字的分布表征

    對(duì)比表7和表4,可以發(fā)現(xiàn),使用字的分布表征時(shí),其最好結(jié)果也明顯低于僅使用字特征的CRF模型。

    4.2.3 深層神經(jīng)網(wǎng)絡(luò)+字的分布表征

    這一小節(jié),我們給出了使用深層神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行基本塊識(shí)別的實(shí)驗(yàn)結(jié)果。表8中詳細(xì)總結(jié)了在兩種窗口下3種分布表征的條件下,基本塊識(shí)別的詳細(xì)結(jié)果。

    表8 深層神經(jīng)網(wǎng)絡(luò)+字的分布表征

    分別對(duì)比表8和表6、表7,可以看出,5層的神經(jīng)網(wǎng)絡(luò)模型的實(shí)驗(yàn)結(jié)果明顯好于最大熵模型和CRF模型。這一方面得益于深層神經(jīng)網(wǎng)絡(luò)模型使用多個(gè)非線性隱層來(lái)對(duì)原始的分布表征進(jìn)行變換,形成更為有用的特征。另一方面體現(xiàn)出深層神經(jīng)網(wǎng)絡(luò)在進(jìn)行基本塊的學(xué)習(xí)過(guò)程中,對(duì)原有分布表征進(jìn)行調(diào)整,形成了對(duì)基本塊識(shí)別任務(wù)更為有利的分布表征。

    對(duì)比表8中3種分布表征的影響,可以看出,盡管基于C&W分布表征和word2vec分布表征所得到的基本塊識(shí)別結(jié)果都比使用完全隨機(jī)的分布表征要好一些,但是3種分布表征的實(shí)驗(yàn)結(jié)果之間的差異不大,word2vec分布表征的結(jié)果略高一些。也就是說(shuō),3種表示作為深層神經(jīng)網(wǎng)絡(luò)的初始輸入,對(duì)最后的基本塊識(shí)別影響不大。這也說(shuō)明,神經(jīng)網(wǎng)絡(luò)模型在迭代計(jì)算的過(guò)程,對(duì)字的分布表征進(jìn)行不斷地學(xué)習(xí)、修正,弱化了對(duì)初始值的依賴,形成了基本塊識(shí)別任務(wù)需要的字的分布表征。

    在表8中,不同窗口的實(shí)驗(yàn)結(jié)果表明,擴(kuò)大特征窗口可以帶來(lái)識(shí)別結(jié)果的明顯上升。而且在[-3,3]窗口內(nèi),使用word2vec分布表征可以達(dá)到本文最高的識(shí)別F值,即77.12%。這明顯好于表4中給出的條件隨機(jī)場(chǎng)情況下使用字特征得到的實(shí)驗(yàn)結(jié)果(F值為72.28%)。需要強(qiáng)調(diào)的是,和最大熵模型一樣,本文使用的深層神經(jīng)網(wǎng)絡(luò)模型是僅針對(duì)每個(gè)字的單點(diǎn)標(biāo)記似然進(jìn)行最大化,而不是優(yōu)化整個(gè)序列上的似然函數(shù)。因此,使用深層神經(jīng)網(wǎng)絡(luò)的識(shí)別結(jié)果能高出條件隨機(jī)場(chǎng)識(shí)別結(jié)果近5%的F值也是相當(dāng)可觀的。

    另外,本文使用word2vec分布表征,分別用4層、6層神經(jīng)網(wǎng)絡(luò)也做了實(shí)驗(yàn),其結(jié)果均低于5層神經(jīng)網(wǎng)絡(luò)模型,但差異不大(表9)。這說(shuō)明,在漢語(yǔ)基本塊識(shí)別任務(wù)中選擇5層神經(jīng)網(wǎng)絡(luò)是合適的。從語(yǔ)言層面來(lái)分析,可以將h1隱層理解為關(guān)于詞的特征表示,h2隱層可以理解為關(guān)于基本塊的特征表示。字的分布表征是經(jīng)過(guò)詞的特征表示再到基本塊的特征表示,或略掉詞的特征表示層(h1隱層)直接到基本塊的特征表示層(h2隱層),即用4層神經(jīng)網(wǎng)絡(luò),是不可取的。同樣,多于5層時(shí)模型結(jié)構(gòu)難以從語(yǔ)言層面合理解釋,相應(yīng)的標(biāo)注結(jié)果也有所下降。

    表9 使用word2vec的4層和6層神經(jīng)網(wǎng)絡(luò)的結(jié)果

    4.3 基于詞的深層神經(jīng)網(wǎng)絡(luò)模型結(jié)果

    表10給出了基于詞的神經(jīng)網(wǎng)絡(luò)模型結(jié)果,為了與基于字的神經(jīng)網(wǎng)絡(luò)模型作對(duì)比,測(cè)試集分別使用了原人工標(biāo)注的正確分詞語(yǔ)料和經(jīng)過(guò)山西大學(xué)分詞軟件FC2000重新分詞后的語(yǔ)料。

    表10 基于詞的神經(jīng)網(wǎng)絡(luò)模型

    對(duì)比表10和表5可以看出,本文所用到的神經(jīng)網(wǎng)絡(luò)模型性能要優(yōu)于CRF模型,這也與上一小節(jié)得到的結(jié)論一致。比較表10和表8可以看出當(dāng)測(cè)試集使用自動(dòng)分詞語(yǔ)料時(shí),其結(jié)果要低于基于字的神經(jīng)網(wǎng)絡(luò)模型,這也在神經(jīng)網(wǎng)絡(luò)模型上驗(yàn)證了4.1小節(jié)由表5得到的結(jié)論。

    5 總結(jié)與展望

    本文研究和對(duì)比了使用字的分布表征來(lái)進(jìn)行基本塊識(shí)別的若干種方法。在這些方法中,本文主要使用了最大熵、條件隨機(jī)場(chǎng)和深層神經(jīng)網(wǎng)絡(luò)3種模型,并且使用了字的C&W分布表征、word2vec分布表征、隨機(jī)的字分布表征,在[-2,2]和[-3,3]兩種特征窗口情形下,我們對(duì)多個(gè)基本塊識(shí)別模型進(jìn)行了對(duì)比。實(shí)驗(yàn)結(jié)果表明,使用在[-3,3]窗口下,將字的word2vec分布表征融入到5層神經(jīng)網(wǎng)絡(luò)模型下,可以得到漢語(yǔ)基本塊的一個(gè)較好的識(shí)別性能(F值達(dá)到了77.12%)。這個(gè)結(jié)果要明顯好于直接將[-3,3]窗口內(nèi)的字特征加入到條件隨機(jī)場(chǎng)模型所得到的識(shí)別模型(F值為72.28%)。

    實(shí)際上,本文的所有實(shí)驗(yàn)中并未能融入詞性信息、字的組合搭配信息等更為豐富的特征信息。我們相信如果將這些信息進(jìn)一步加入到本文的模型中,基本塊的識(shí)別性能還會(huì)有大幅度的提高。但如何獲得詞性的分布表征以及相鄰字的組合串的分布表征是需要我們進(jìn)一步研究的。

    [1] 周強(qiáng),任海波,孫茂松. 分階段構(gòu)建漢語(yǔ)樹(shù)庫(kù)[C].

    Proceedings of The Second China-Japan Natural Language Processing Joint Research Promotion Conference, 2002: 189-197.

    [2] 周強(qiáng). 基于規(guī)則的漢語(yǔ)基本塊自動(dòng)分析器[C].第七屆中文信息處理國(guó)際會(huì)議論文集(ICCC-2007).2007: 137-142.

    [3] 宇航,周強(qiáng). 漢語(yǔ)基本塊標(biāo)注系統(tǒng)的內(nèi)部關(guān)系分析[J]. 清華大學(xué)學(xué)報(bào),2009, 49(10): 136-140.

    [4] 李超,孫健,關(guān)毅,徐興軍,侯磊,李生. 基于最大熵模型的漢語(yǔ)基本塊分析技術(shù)研究[R]. CIPS-ParsEval -2009.

    [5] 趙海,揭春雨,宋彥. 基于字依存樹(shù)的中文詞法-句法一體化分析[C].全國(guó)第十屆計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(C- NCCL-2009), 2009: 82-88.

    [6] 齊璇,王挺,陳火旺. 義類自動(dòng)標(biāo)注方法的研究[J]. 中文信息學(xué)報(bào),2001,15(3): 9-15.

    [7] 吳志媛,錢雪忠 .基于PLSI的標(biāo)簽聚類研究[J]. 計(jì)算機(jī)應(yīng)用研究,2013,30(5): 1316-1319.

    [8] David M. Blei. Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003(3): 993-1022.

    [9] Ronan Collobert, Jason Weston, Léon Bottou, et al. Natural Language Processing (Almost) from Scratch[J]. Journal of Machine Learning Research (JMLR), 2011(12): 2493-2537.

    [10] Tomas Mikolov, Kai Chen, Greg Corrado, et al. Efficient Estimation of Word Representations in Vector Space [R]. arXiv preprint arXiv,2013.

    [11] Tomas Mikolov, Ilya Sutskever, Kai Chen, et al. Distributed representations of words and phrases and their compositionality[R]. arXiv preprint arXiv,2013.

    [12] Tomas Mikolov,Wen-tau Yih, and Geoffrey Zweig.Linguistic Regularities in Continuous Space Word Repre- sentations[C]//Proceedings of NAACL HLT, 2013.

    [13] Yoshua Bengio, Rejean Ducharme, Pascal Vincent, et al. A neural probabilistic language model[J]. Journal of Machine Learning Research (JMLR),2003(3): 1137-1155.

    [14] 來(lái)斯惟,徐立恒,陳玉博,劉康,趙軍. 基于表示學(xué)習(xí)的中文分詞算法探索[J]. 中文信息學(xué)報(bào),2013,27(5): 8-14.

    [15] 侯瀟琪,王瑞波,李濟(jì)洪. 基于詞的分布式實(shí)值表示的漢語(yǔ)基本塊識(shí)別[J]. 中北大學(xué)學(xué)報(bào)(自然科學(xué)版).2013,34(5): 582-585.

    [16] Turian Joseph, Lev Ratinov, and Yoshua Bengio. Word representations: a simple and general method for sem- i-supervised learning[C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (ACL).2010.

    [17] Taku Kudo, Yuji Matsumoto. Chunking with support vector machine[C]//Proceedings of the second meeti- ng of North American chapter of association for computational linguistics(NAACL), 2001: 192-199.

    [18] John Lafferty, Andrew Mccallum, FernandoPereira. Conditional random fields: Probabilistic models for segmenting and labeling sequence data[C]//Proceedings of International Conferenceon Machine Learning (ICML 01). Williamstown, MA, USA, 2001: 282-289.

    [19] Berger Adam, Stephen Della, Pietra Adam, Vincent Della Pietra. A maximum entropy approach to natural language processing [J]. Computational Linguistics, 1996, 22(1): 39-71.

    [20] 張樂(lè). 最大熵工具包MaxEnt(2004版)[CP/OL].2004.http://homepages. inf.ed.ac.uk/s0450736/maxent_ toolkit .html.

    [21] Ian J. Goodfellow, David Warde-Farley, Pascal Lamblin, Vincent Dumoulin, Mehdi Mirza, Razvan Pascanu, James Bergstra, Frédéric Bastien, Yoshua Bengio. Pylearn2: a machine learning research library[J]. arXi-v preprint arXiv: 1308.4214.

    [22] TakuKudo, CRF++toolkit[CP], 2005. http://crfpp.sourceforge.net/.

    猜你喜歡
    基本塊分詞漢語(yǔ)
    學(xué)漢語(yǔ)
    金橋(2022年6期)2022-06-20 01:36:16
    基于級(jí)聯(lián)森林的控制流錯(cuò)誤檢測(cè)優(yōu)化算法
    距離與權(quán)重相結(jié)合的導(dǎo)向式灰盒模糊測(cè)試方法
    輕輕松松聊漢語(yǔ) 后海
    金橋(2020年11期)2020-12-14 07:52:56
    一種檢測(cè)控制流錯(cuò)誤的多層分段標(biāo)簽方法
    結(jié)巴分詞在詞云中的應(yīng)用
    追劇宅女教漢語(yǔ)
    漢語(yǔ)不能成為“亂燉”
    值得重視的分詞的特殊用法
    高考分詞作狀語(yǔ)考點(diǎn)歸納與疑難解析
    eeuss影院久久| 成人亚洲精品av一区二区| 国内精品宾馆在线| 99在线视频只有这里精品首页| 久9热在线精品视频| 人妻少妇偷人精品九色| 亚洲va在线va天堂va国产| 啪啪无遮挡十八禁网站| 97热精品久久久久久| 欧美成人一区二区免费高清观看| 亚洲va在线va天堂va国产| 日韩 亚洲 欧美在线| 一本一本综合久久| 国内久久婷婷六月综合欲色啪| 精品久久久噜噜| netflix在线观看网站| 日韩精品中文字幕看吧| 人妻制服诱惑在线中文字幕| 成人国产综合亚洲| 免费av观看视频| 国产精品不卡视频一区二区| 久久久久免费精品人妻一区二区| 日本熟妇午夜| 成人高潮视频无遮挡免费网站| 久久久精品大字幕| 免费人成在线观看视频色| 99热精品在线国产| 美女被艹到高潮喷水动态| 国产精品人妻久久久久久| 人妻制服诱惑在线中文字幕| 免费观看在线日韩| 久久久午夜欧美精品| 精品人妻视频免费看| 国产精品久久久久久精品电影| 亚洲av美国av| 深爱激情五月婷婷| 亚洲黑人精品在线| 免费搜索国产男女视频| 在线播放国产精品三级| 成年女人看的毛片在线观看| 有码 亚洲区| 亚洲国产色片| 久久久久久久久中文| 日韩一本色道免费dvd| 亚洲av成人av| 无人区码免费观看不卡| 亚洲中文日韩欧美视频| 午夜福利18| 亚洲狠狠婷婷综合久久图片| 性欧美人与动物交配| 国产午夜精品论理片| 亚洲真实伦在线观看| 丰满乱子伦码专区| 国产v大片淫在线免费观看| 欧美人与善性xxx| 国产精品福利在线免费观看| 国产黄色小视频在线观看| 欧美色欧美亚洲另类二区| 中文字幕高清在线视频| 国产午夜精品久久久久久一区二区三区 | 真人一进一出gif抽搐免费| av黄色大香蕉| 日韩欧美 国产精品| 国产亚洲91精品色在线| 51国产日韩欧美| 国产激情偷乱视频一区二区| 婷婷精品国产亚洲av在线| 最近视频中文字幕2019在线8| 热99re8久久精品国产| 一本一本综合久久| 日本一本二区三区精品| 精品人妻偷拍中文字幕| 床上黄色一级片| 久久久国产成人免费| 啦啦啦观看免费观看视频高清| 精品一区二区三区视频在线观看免费| 欧美一区二区国产精品久久精品| 免费看av在线观看网站| 变态另类成人亚洲欧美熟女| 久久精品影院6| а√天堂www在线а√下载| 欧美色视频一区免费| 国产成人aa在线观看| 国产日本99.免费观看| 蜜桃亚洲精品一区二区三区| 亚洲av成人精品一区久久| 成人永久免费在线观看视频| av.在线天堂| 精品久久久久久,| 亚洲18禁久久av| 一夜夜www| 成人性生交大片免费视频hd| 久久精品国产亚洲av天美| 免费av观看视频| av.在线天堂| 日本色播在线视频| 88av欧美| x7x7x7水蜜桃| 99久久九九国产精品国产免费| 草草在线视频免费看| 亚洲五月天丁香| 久久精品国产鲁丝片午夜精品 | 亚洲最大成人手机在线| 国产精品人妻久久久久久| 午夜福利18| 国产高清有码在线观看视频| 观看免费一级毛片| 国产精品久久久久久亚洲av鲁大| 亚洲av成人精品一区久久| 麻豆久久精品国产亚洲av| 麻豆国产97在线/欧美| 国产真实乱freesex| 真人做人爱边吃奶动态| 日韩中字成人| 日韩亚洲欧美综合| 免费看光身美女| 在线观看一区二区三区| 嫁个100分男人电影在线观看| 人妻丰满熟妇av一区二区三区| 国内少妇人妻偷人精品xxx网站| 日韩欧美三级三区| 美女高潮的动态| 伦理电影大哥的女人| 我的女老师完整版在线观看| 国产欧美日韩一区二区精品| 欧美+日韩+精品| 一区福利在线观看| 成人av在线播放网站| 国产精品不卡视频一区二区| 亚洲av.av天堂| 国产亚洲av嫩草精品影院| 免费观看精品视频网站| 亚洲精品成人久久久久久| 最近最新免费中文字幕在线| 免费一级毛片在线播放高清视频| 精华霜和精华液先用哪个| 亚洲五月天丁香| 欧美一级a爱片免费观看看| 大型黄色视频在线免费观看| 欧美在线一区亚洲| 看片在线看免费视频| 免费看a级黄色片| 夜夜爽天天搞| 可以在线观看毛片的网站| av中文乱码字幕在线| 亚洲欧美日韩卡通动漫| 联通29元200g的流量卡| 少妇被粗大猛烈的视频| 亚洲欧美清纯卡通| 搞女人的毛片| 国产男人的电影天堂91| 免费看av在线观看网站| 成年女人看的毛片在线观看| 一夜夜www| 亚洲天堂国产精品一区在线| 亚洲美女黄片视频| 18禁裸乳无遮挡免费网站照片| 免费人成在线观看视频色| 天天躁日日操中文字幕| 99riav亚洲国产免费| 国产男靠女视频免费网站| 最近视频中文字幕2019在线8| 一级黄片播放器| 少妇的逼水好多| 日韩人妻高清精品专区| www.色视频.com| 嫩草影院精品99| 性色avwww在线观看| 真实男女啪啪啪动态图| 日本黄色视频三级网站网址| 国产精品人妻久久久影院| 99久久精品国产国产毛片| 久久久精品大字幕| 亚洲经典国产精华液单| 国产男靠女视频免费网站| 免费高清视频大片| 偷拍熟女少妇极品色| 国产美女午夜福利| 国产大屁股一区二区在线视频| 少妇高潮的动态图| 亚洲国产精品sss在线观看| 丰满乱子伦码专区| 在现免费观看毛片| 乱码一卡2卡4卡精品| av福利片在线观看| 日本 av在线| 欧美zozozo另类| 91麻豆av在线| 国产伦在线观看视频一区| 亚洲成人久久性| 精品乱码久久久久久99久播| 熟女人妻精品中文字幕| 熟女电影av网| 国产伦人伦偷精品视频| 窝窝影院91人妻| 婷婷色综合大香蕉| 欧美xxxx性猛交bbbb| 色综合色国产| av在线天堂中文字幕| 国产精品永久免费网站| 日韩一本色道免费dvd| 少妇猛男粗大的猛烈进出视频 | 免费人成视频x8x8入口观看| 午夜免费男女啪啪视频观看 | 久久亚洲真实| 亚洲成av人片在线播放无| 久久亚洲精品不卡| 桃色一区二区三区在线观看| 99久久久亚洲精品蜜臀av| а√天堂www在线а√下载| 91麻豆av在线| 国产av在哪里看| 一本久久中文字幕| 免费无遮挡裸体视频| 女生性感内裤真人,穿戴方法视频| 人妻久久中文字幕网| 91久久精品电影网| 中国美女看黄片| 日韩在线高清观看一区二区三区 | 国产单亲对白刺激| 欧美日韩黄片免| 日日干狠狠操夜夜爽| 免费观看精品视频网站| 色吧在线观看| 亚洲久久久久久中文字幕| 大型黄色视频在线免费观看| 国产成人影院久久av| 国产成人一区二区在线| 国产成年人精品一区二区| 久久精品国产99精品国产亚洲性色| 亚洲电影在线观看av| 制服丝袜大香蕉在线| 精品久久久久久久久久免费视频| 国内揄拍国产精品人妻在线| 国产精品伦人一区二区| 日本五十路高清| 国产精华一区二区三区| 一个人看的www免费观看视频| 欧美性猛交黑人性爽| 99久久成人亚洲精品观看| av在线观看视频网站免费| 久久国内精品自在自线图片| 国产乱人伦免费视频| a级毛片a级免费在线| 老师上课跳d突然被开到最大视频| 2021天堂中文幕一二区在线观| 久久久久国内视频| 国产白丝娇喘喷水9色精品| 久久久久久大精品| 免费在线观看日本一区| 久久久久久久久久黄片| 国产一级毛片七仙女欲春2| 99九九线精品视频在线观看视频| 天堂av国产一区二区熟女人妻| 午夜a级毛片| 精品无人区乱码1区二区| 99视频精品全部免费 在线| 欧美一区二区亚洲| 中文字幕av在线有码专区| 丰满的人妻完整版| 色av中文字幕| 2021天堂中文幕一二区在线观| 日韩精品中文字幕看吧| 内地一区二区视频在线| 欧美3d第一页| 看免费成人av毛片| 久久中文看片网| 97超视频在线观看视频| 亚洲人与动物交配视频| 国产黄片美女视频| 亚洲狠狠婷婷综合久久图片| 欧美精品国产亚洲| 91av网一区二区| 日韩精品中文字幕看吧| 久久久精品大字幕| 欧美极品一区二区三区四区| 久久精品国产99精品国产亚洲性色| 午夜久久久久精精品| 亚洲va日本ⅴa欧美va伊人久久| 看片在线看免费视频| 色5月婷婷丁香| 身体一侧抽搐| 999久久久精品免费观看国产| 国产免费一级a男人的天堂| 一区二区三区高清视频在线| 无遮挡黄片免费观看| 一进一出好大好爽视频| 日韩av在线大香蕉| 国产伦在线观看视频一区| 色吧在线观看| 婷婷丁香在线五月| 最好的美女福利视频网| 日韩 亚洲 欧美在线| av在线老鸭窝| a级一级毛片免费在线观看| 精品久久久久久久人妻蜜臀av| 国产亚洲精品综合一区在线观看| 看十八女毛片水多多多| 欧美黑人欧美精品刺激| 亚洲图色成人| 亚洲欧美日韩无卡精品| 在线免费观看不下载黄p国产 | 成年免费大片在线观看| 国产爱豆传媒在线观看| 亚洲最大成人手机在线| av天堂中文字幕网| а√天堂www在线а√下载| 天堂av国产一区二区熟女人妻| 精品国产三级普通话版| 中出人妻视频一区二区| av天堂在线播放| 久久久色成人| 国产精品久久久久久久电影| а√天堂www在线а√下载| 欧美高清成人免费视频www| 日韩欧美三级三区| 尤物成人国产欧美一区二区三区| 欧美bdsm另类| 亚洲精品456在线播放app | 久久草成人影院| ponron亚洲| 99riav亚洲国产免费| 尾随美女入室| 国产一区二区激情短视频| 精品人妻一区二区三区麻豆 | 免费电影在线观看免费观看| 亚洲图色成人| 国产免费av片在线观看野外av| 女人被狂操c到高潮| 国产高清视频在线播放一区| 亚洲中文日韩欧美视频| 岛国在线免费视频观看| 搡女人真爽免费视频火全软件 | 99久久无色码亚洲精品果冻| 一本一本综合久久| 国产aⅴ精品一区二区三区波| 国产精品乱码一区二三区的特点| av在线天堂中文字幕| 欧美最黄视频在线播放免费| 88av欧美| 亚洲人成网站高清观看| 国产精品,欧美在线| 亚洲avbb在线观看| 午夜福利欧美成人| 精品日产1卡2卡| 人人妻人人澡欧美一区二区| x7x7x7水蜜桃| 欧美又色又爽又黄视频| 亚洲人与动物交配视频| 国产三级中文精品| 三级毛片av免费| av在线蜜桃| 亚洲va在线va天堂va国产| 亚洲av五月六月丁香网| 免费人成视频x8x8入口观看| 亚洲av二区三区四区| 69人妻影院| 91狼人影院| 淫秽高清视频在线观看| 亚洲中文日韩欧美视频| 乱人视频在线观看| 国产伦一二天堂av在线观看| 观看美女的网站| 在线国产一区二区在线| 久久99热这里只有精品18| 成人av在线播放网站| 亚洲中文字幕一区二区三区有码在线看| 色综合站精品国产| 直男gayav资源| 国产主播在线观看一区二区| 欧洲精品卡2卡3卡4卡5卡区| 国产主播在线观看一区二区| 国产av一区在线观看免费| 久久99热这里只有精品18| 日韩欧美在线二视频| 国产精品av视频在线免费观看| 成熟少妇高潮喷水视频| 最新中文字幕久久久久| 色尼玛亚洲综合影院| 日本 av在线| 精品99又大又爽又粗少妇毛片 | 九色国产91popny在线| 久久久成人免费电影| 亚洲不卡免费看| 日韩精品有码人妻一区| 亚洲图色成人| 亚洲av美国av| 啦啦啦观看免费观看视频高清| 亚洲自偷自拍三级| 啦啦啦韩国在线观看视频| 长腿黑丝高跟| 真人做人爱边吃奶动态| 我要看日韩黄色一级片| 国产精品99久久久久久久久| 国产高清有码在线观看视频| 99久久九九国产精品国产免费| 99国产精品一区二区蜜桃av| 国产精品98久久久久久宅男小说| 午夜免费激情av| 中文亚洲av片在线观看爽| 欧美成人一区二区免费高清观看| 亚洲国产高清在线一区二区三| 日本一二三区视频观看| 1000部很黄的大片| 久久久久性生活片| 成人三级黄色视频| 免费黄网站久久成人精品| 在线观看一区二区三区| 国产av一区在线观看免费| 精品乱码久久久久久99久播| 日韩一区二区视频免费看| 综合色av麻豆| 内射极品少妇av片p| 亚洲av第一区精品v没综合| 色综合色国产| 亚洲精品久久国产高清桃花| 日本黄色视频三级网站网址| 国产淫片久久久久久久久| 欧美一区二区精品小视频在线| 乱系列少妇在线播放| 亚洲 国产 在线| 精品无人区乱码1区二区| 午夜免费成人在线视频| 成人亚洲精品av一区二区| avwww免费| 国产精品永久免费网站| 国产主播在线观看一区二区| 欧美另类亚洲清纯唯美| 一进一出好大好爽视频| 99精品在免费线老司机午夜| 国产精品爽爽va在线观看网站| 国产精品亚洲美女久久久| 久久6这里有精品| 黄色日韩在线| 久久九九热精品免费| 1000部很黄的大片| 成年免费大片在线观看| 国产三级在线视频| 亚洲人成网站在线播| 精品一区二区免费观看| 欧美一级a爱片免费观看看| 国产成人福利小说| 国产久久久一区二区三区| av天堂在线播放| 99久久精品国产国产毛片| 色综合婷婷激情| 久久精品国产清高在天天线| 久9热在线精品视频| 欧美不卡视频在线免费观看| 久久人人爽人人爽人人片va| 老司机午夜福利在线观看视频| 久久精品人妻少妇| 亚洲最大成人手机在线| 国产老妇女一区| 最近视频中文字幕2019在线8| 免费在线观看日本一区| 我的女老师完整版在线观看| 亚洲精品456在线播放app | 别揉我奶头~嗯~啊~动态视频| 又紧又爽又黄一区二区| 免费观看人在逋| 欧美国产日韩亚洲一区| 此物有八面人人有两片| 亚洲aⅴ乱码一区二区在线播放| 久久久久精品国产欧美久久久| 美女黄网站色视频| 简卡轻食公司| 日本黄色视频三级网站网址| 欧美性猛交黑人性爽| 天堂影院成人在线观看| 久久热精品热| 一区二区三区免费毛片| 在线观看舔阴道视频| 日本精品一区二区三区蜜桃| 99热这里只有精品一区| 日日啪夜夜撸| 麻豆成人午夜福利视频| 亚洲经典国产精华液单| 国产精品自产拍在线观看55亚洲| 亚洲三级黄色毛片| 久久精品国产清高在天天线| 日本在线视频免费播放| 精品久久久久久,| 亚洲成人久久爱视频| 亚洲电影在线观看av| 一区二区三区四区激情视频 | 欧美精品国产亚洲| 人妻久久中文字幕网| 久久久午夜欧美精品| 免费观看的影片在线观看| 欧美日韩瑟瑟在线播放| 我要看日韩黄色一级片| 精品久久久久久久久久免费视频| 国产 一区精品| 国产精品美女特级片免费视频播放器| 黄色日韩在线| 在线观看美女被高潮喷水网站| av在线老鸭窝| 久久精品久久久久久噜噜老黄 | 亚洲精品乱码久久久v下载方式| 2021天堂中文幕一二区在线观| 亚洲四区av| 小说图片视频综合网站| 狠狠狠狠99中文字幕| 亚洲性久久影院| 色综合站精品国产| 日韩大尺度精品在线看网址| 国内揄拍国产精品人妻在线| 麻豆av噜噜一区二区三区| 亚洲av中文av极速乱 | 不卡一级毛片| 嫁个100分男人电影在线观看| h日本视频在线播放| 舔av片在线| 窝窝影院91人妻| 久久人人爽人人爽人人片va| 一本精品99久久精品77| 久久亚洲精品不卡| 免费看av在线观看网站| 波野结衣二区三区在线| 最近中文字幕高清免费大全6 | 精品一区二区三区视频在线观看免费| 搡老妇女老女人老熟妇| 人人妻人人看人人澡| 少妇的逼好多水| 直男gayav资源| www日本黄色视频网| 国产精品久久久久久久久免| 最好的美女福利视频网| 国产单亲对白刺激| 国产真实伦视频高清在线观看 | 成人特级黄色片久久久久久久| 欧美黑人巨大hd| 久久久久久久久久成人| 99九九线精品视频在线观看视频| 在线播放无遮挡| 乱人视频在线观看| 国产精品亚洲美女久久久| 嫩草影院精品99| 18+在线观看网站| 亚洲av成人av| 免费在线观看日本一区| 欧美日韩中文字幕国产精品一区二区三区| 国产成人a区在线观看| 久久久久久久久久黄片| 啦啦啦观看免费观看视频高清| 有码 亚洲区| 国产亚洲精品av在线| 在线观看美女被高潮喷水网站| 国产精品乱码一区二三区的特点| 欧美黑人巨大hd| 国内少妇人妻偷人精品xxx网站| 女的被弄到高潮叫床怎么办 | 尾随美女入室| 久久九九热精品免费| 97人妻精品一区二区三区麻豆| 99热这里只有是精品50| 99九九线精品视频在线观看视频| 久久精品91蜜桃| 干丝袜人妻中文字幕| 国产精品国产三级国产av玫瑰| 国产精品99久久久久久久久| 好男人在线观看高清免费视频| 一级a爱片免费观看的视频| 亚洲在线自拍视频| 久久6这里有精品| 日韩人妻高清精品专区| 国产av一区在线观看免费| 俄罗斯特黄特色一大片| 一区二区三区激情视频| 久久久国产成人精品二区| 欧美黑人欧美精品刺激| 欧美激情久久久久久爽电影| 热99re8久久精品国产| 久久这里只有精品中国| 中文字幕av在线有码专区| 色精品久久人妻99蜜桃| 日日啪夜夜撸| 精品久久久久久久久久免费视频| av视频在线观看入口| 男女啪啪激烈高潮av片| 国产大屁股一区二区在线视频| 深爱激情五月婷婷| 国产极品精品免费视频能看的| 久久草成人影院| 国产一区二区亚洲精品在线观看| 精品不卡国产一区二区三区| 桃色一区二区三区在线观看| 免费不卡的大黄色大毛片视频在线观看 | 成年女人看的毛片在线观看| 三级毛片av免费| av国产免费在线观看| 在线播放国产精品三级| 亚洲一级一片aⅴ在线观看| 成人一区二区视频在线观看| 欧美一区二区亚洲| 小说图片视频综合网站| 欧美xxxx性猛交bbbb| 黄片wwwwww| 精品久久久噜噜| 久久久精品欧美日韩精品| 国产白丝娇喘喷水9色精品| 麻豆国产av国片精品| av国产免费在线观看| 成人综合一区亚洲| а√天堂www在线а√下载| 亚洲中文字幕一区二区三区有码在线看| 在线免费观看不下载黄p国产 | 免费在线观看成人毛片| 美女大奶头视频| 中文字幕人妻熟人妻熟丝袜美| АⅤ资源中文在线天堂| 特级一级黄色大片| 中亚洲国语对白在线视频| 国产高清视频在线播放一区|