• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于維基百科的中文嵌套命名實(shí)體識別語料庫自動(dòng)構(gòu)建

    2018-11-20 06:42:56李雁群何云琪錢龍華周國棟
    計(jì)算機(jī)工程 2018年11期
    關(guān)鍵詞:維基百科維基嵌套

    李雁群,何云琪,錢龍華,周國棟

    (蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 自然語言處理實(shí)驗(yàn)室,江蘇 蘇州 215006)

    0 概述

    信息抽取的目的是從無結(jié)構(gòu)的自由文本中抽取出實(shí)體及其相互關(guān)系并轉(zhuǎn)化為結(jié)構(gòu)化表達(dá)形式,從而為知識庫的構(gòu)造提供數(shù)據(jù)基礎(chǔ)[1-2]。嵌套命名實(shí)體是一種特殊形式的實(shí)體,其內(nèi)部包含其他實(shí)體,嵌套在里面的實(shí)體稱為內(nèi)部實(shí)體,最外層的實(shí)體稱為外部實(shí)體。如外部實(shí)體“[[[中共]nt [北京]ns 市委]nt 宣傳部]nt”包含“[中共]nt”“[北京]ns”和“[中共北京市委]nt”3個(gè)內(nèi)部實(shí)體。其中,嵌套實(shí)體的類型標(biāo)注采用《人民日報(bào)》語料的格式,即nr表示人名,ns表示地名,nt表示組織名。由于嵌套命名實(shí)體含有豐富的實(shí)體信息以及實(shí)體之間的相互關(guān)系,且其結(jié)構(gòu)復(fù)雜多變,因此嵌套命名實(shí)體的識別成為信息抽取中值得研究的任務(wù)之一。

    目前的嵌套命名實(shí)體識別都采用有監(jiān)督的機(jī)器學(xué)習(xí)方法,因而需要一定規(guī)模的語料庫。GENIA V3.02[3]是生物醫(yī)學(xué)領(lǐng)域內(nèi)的命名實(shí)體語料庫,其中包含了嵌套命名實(shí)體,被廣泛應(yīng)用于生物醫(yī)學(xué)領(lǐng)域的命名實(shí)體識別研究。該語料庫包含2 000條MEDLLINE摘要和94 014個(gè)實(shí)體引用,其中約有17%的實(shí)體嵌套在其他實(shí)體中。EPPI[4]是生物醫(yī)學(xué)領(lǐng)域內(nèi)另一個(gè)標(biāo)注了蛋白質(zhì)及其相互作用關(guān)系的語料庫,它包含217個(gè)從PubMed和PubMedCentral選出來的摘要和全文文獻(xiàn),總共有134 059個(gè)實(shí)體引用。RCAHMS[5]是一個(gè)標(biāo)注實(shí)體及其語義關(guān)系的歷史檔案語料庫,包含1 546個(gè)文本和28 272個(gè)實(shí)體引用,其中18.7%的實(shí)體嵌套在其他實(shí)體中。

    中文方面的命名實(shí)體語料有來源廣泛的MSRA語料和新聞?lì)I(lǐng)域的1998年1月份的 《人民日報(bào)》語料,兩者都標(biāo)注了最外層實(shí)體,但后者還標(biāo)出了嵌套在內(nèi)層的命名實(shí)體,因此中文嵌套命名實(shí)體識別研究大都基于《人民日報(bào)》語料[6-7]。該語料庫總共有61 922個(gè)實(shí)體引用,其中,13.8%的實(shí)體嵌套在其他實(shí)體中。不過,由于《人民日報(bào)》語料是1998年的新聞?wù)Z料,因而其局限性較大,難于拓展到其他領(lǐng)域的嵌套命名實(shí)體識別。本文提出基于中文維基百科的方法來自動(dòng)構(gòu)建面向?qū)挿侯I(lǐng)域的中文嵌套命名實(shí)體識別語料庫。該方法對中文維基百科的條目進(jìn)行實(shí)體分類,并從這些實(shí)體條目中自動(dòng)構(gòu)造出中文嵌套命名實(shí)體。

    1 相關(guān)工作

    嵌套命名實(shí)體識別方法主要分為基于規(guī)則的方法和基于機(jī)器學(xué)習(xí)的方法。早期的方法是在基本實(shí)體識別的基礎(chǔ)上采用基于規(guī)則的后處理方法來識別嵌套命名實(shí)體[8-9],其不足之處是規(guī)則的靈活性較差?;跈C(jī)器學(xué)習(xí)的方法大都采用層次模型,即將嵌套命名實(shí)體的識別轉(zhuǎn)換成多個(gè)層次的序列標(biāo)注問題。層次模型可以從3個(gè)層面展開:1)標(biāo)簽層次化[4],即擴(kuò)充一個(gè)詞的標(biāo)記使它反映出該詞所參與的所有實(shí)體類型,然后用一個(gè)序列化標(biāo)注模型來識別,其不足之處是標(biāo)記集龐大,從而導(dǎo)致訓(xùn)練語料稀疏,訓(xùn)練時(shí)間較長;2)模型層次化[4,10],即采用多個(gè)疊加的序列化標(biāo)注模型,第1個(gè)序列化模型首先識別出基本實(shí)體,然后再用第2個(gè)模型識別出第2層嵌套命名實(shí)體,以此類推,其特點(diǎn)是模型數(shù)量較多;3)語料層次化[5],即將一定范圍內(nèi)的單詞從左到右連成長度不一的詞串作為實(shí)例,然后用序列化標(biāo)注模型來識別,其缺點(diǎn)是數(shù)據(jù)復(fù)雜度較高。

    與序列化標(biāo)注方法不同,文獻(xiàn)[11]采用判別式成分句法分析器來訓(xùn)練嵌套命名實(shí)體識別模型。該方法把每個(gè)嵌套命名實(shí)體轉(zhuǎn)換成一棵句法分析樹,其中每一個(gè)詞作為該樹的葉子節(jié)點(diǎn),而每個(gè)內(nèi)部實(shí)體作為該樹的子樹,其優(yōu)點(diǎn)是樹的表示法可以清晰地表示任意層數(shù)的嵌套命名實(shí)體。

    中文嵌套命名實(shí)體識別的研究都是在《人民日報(bào)》語料上進(jìn)行的,大都采用層次化模型。文獻(xiàn)[6]將人名和地名作為基本實(shí)體在第1層進(jìn)行識別,然后將識別結(jié)果傳遞到第2層模型進(jìn)行嵌套組織機(jī)構(gòu)名的識別。文獻(xiàn)[12]用相似的方法,差別在于第1層識別基本實(shí)體,第2層再識別3層實(shí)體,如果要識別更高層的嵌套命名實(shí)體還要采用啟發(fā)式規(guī)則進(jìn)行后處理。與上述研究工作不同的是,文獻(xiàn)[7]提出一種聯(lián)合學(xué)習(xí)模型,將中文嵌套命名實(shí)體識別看作是一種聯(lián)合切分和標(biāo)注任務(wù),采用平均感知器算法進(jìn)行在線訓(xùn)練,運(yùn)用集束搜索算法進(jìn)行解碼。該方法獲得了較快的收斂速度和較好的識別效果,缺點(diǎn)是只能識別兩層嵌套命名實(shí)體。

    2 嵌套命名實(shí)體識別語料庫的構(gòu)建

    本文的核心思想是利用中文維基百科來自動(dòng)構(gòu)建一個(gè)高質(zhì)量的中文嵌套命名實(shí)體語料庫。一方面,中文維基百科含有大量的條目,其中包含大量的各種類型的命名實(shí)體,如人物、組織和機(jī)構(gòu)等,可以采用機(jī)器學(xué)習(xí)的方法從這些維基條目中以較高的性能識別出命名實(shí)體及其類型[13]。另一方面,這些維基百科條目之間本身就蘊(yùn)含著上下級關(guān)系,如條目“上海市虹口區(qū)足球場”為地名實(shí)體,而其中的“上海市”和“虹口區(qū)”又分別都是維基條目中的地名實(shí)體。因此,可以利用這樣的包含關(guān)系來自動(dòng)構(gòu)建一個(gè)嵌套命名實(shí)體“[[上海市]ns [虹口區(qū)]ns 足球場]ns”。具體而言,從維基百科構(gòu)建嵌套命名實(shí)體語料庫包含以下2個(gè)步驟:

    1)中文維基條目實(shí)體分類。利用機(jī)器學(xué)習(xí)的方法對所有的維基百科條目進(jìn)行分類,從中識別出命名實(shí)體條目。

    2)嵌套命名實(shí)體自動(dòng)生成。利用維基條目實(shí)體分類結(jié)果以及維基頁面中的相關(guān)信息進(jìn)行嵌套命名實(shí)體自動(dòng)標(biāo)注。

    2.1 中文維基條目實(shí)體分類

    對英文維基百科條目進(jìn)行分類主要有2種方法:基于啟發(fā)式規(guī)則的方法[14]和基于機(jī)器學(xué)習(xí)的方法[15-17]。在中文維基百科上,文獻(xiàn)[13]采用機(jī)器學(xué)習(xí)的方法進(jìn)行維基條目的實(shí)體分類,從中文維基百科條目的半結(jié)構(gòu)化信息及維基頁面的文本中提取各類特征,并根據(jù)中文的特點(diǎn)加入更多額外特征,構(gòu)造相應(yīng)的特征向量,然后使用SVM分類器進(jìn)行條目實(shí)體分類,獲得了較高的分類性能。本文使用該方法進(jìn)行中文維基條目的實(shí)體分類,其主要特征包括以下4個(gè)方面:

    1)信息框?qū)傩悦?。頁面信息框的?nèi)容是關(guān)于該條目的基本屬性,每一個(gè)屬性包含屬性名和屬性值,將其中所有的屬性名以詞包形式提取出來作為一個(gè)特征。例如,在一個(gè)人物條目的信息框中可能有屬性對<“國籍”“中華人民共和國”><“姓名”“XXX”>和<“出生日期”“XXXX年XX月XX日”>等,分別提取“國籍”“姓名”和“出生日期”等作為詞包特征。

    2)分類框中心詞。每個(gè)條目所對應(yīng)頁面的分類框?yàn)楫?dāng)前條目所屬的各個(gè)類別。例如,一個(gè)人物的分類框中可能有“XXXX年出生”“在世人物”和“中國人民大學(xué)校友”等類別信息,分別提取每個(gè)類別的中心詞“出生”“人物”和“校友”等作為特征。

    3)定義句中心詞。每個(gè)維基頁面文本的第一段通常為該條目的摘要,而第一句則是定義句,介紹當(dāng)前條目的基本概念。通過對定義句進(jìn)行分詞和詞性標(biāo)注,找出其最右邊的名詞作為定義句的中心詞。此外,當(dāng)定義句的句式結(jié)構(gòu)為 “……是(為)……”時(shí),還能通過正則匹配獲得該句中心詞。例如,從“馬云”維基條目的摘要中提取到的特征為“企業(yè)家”。

    4)中文相關(guān)特征。與中文有關(guān)的4個(gè)額外特征,具體如下:

    (1)條目標(biāo)題的首字是否為中國人名的姓氏且標(biāo)題長度為2個(gè)到4個(gè)字。

    (2)條目標(biāo)題中是否包含外國人譯名中使用的分隔符“·”。

    (3)標(biāo)題的最后一個(gè)字和詞,詞可以通過分詞工具獲得。

    (4)維基百科分類框中心詞在同義詞詞林[18]中的語義編碼。

    在人工標(biāo)注的條目實(shí)體類型語料上的實(shí)驗(yàn)結(jié)果表明,該方法的總體性能較高,準(zhǔn)確率達(dá)到97%,召回率達(dá)到95%,平均性能F1指數(shù)達(dá)到了96%,這樣的性能滿足了后續(xù)要求。

    2.2 嵌套命名實(shí)體自動(dòng)生成

    通過上述的維基條目實(shí)體分類得到了一個(gè)大規(guī)模的實(shí)體字典,其中有大量的實(shí)體條目包含了其他實(shí)體條目,很多情況下一個(gè)實(shí)體中甚至包含了3個(gè)到4個(gè)內(nèi)部實(shí)體,這為自動(dòng)構(gòu)建嵌套命名實(shí)體語料庫提供了大量的數(shù)據(jù)基礎(chǔ)。雖然該實(shí)體字典規(guī)模很大,但也存在下列問題:

    1)字典匹配的假正例問題。在實(shí)體文本中進(jìn)行單純的字典匹配經(jīng)常會(huì)產(chǎn)生假的嵌套命名實(shí)體,這種情況尤其會(huì)發(fā)生在外國實(shí)體名稱中。如“奧雷爾韋爾拉克”是法國阿韋龍省的一個(gè)市鎮(zhèn),而“奧雷”則是法國利穆贊大區(qū)上維埃納省的一個(gè)市鎮(zhèn),兩者沒有任何的嵌套關(guān)系。簡單的名稱匹配很容易使后者成為前者的內(nèi)部實(shí)體,但這是一個(gè)假正例。

    2)實(shí)體歧義問題。如“中國”這個(gè)詞在當(dāng)今語境下(包括《人民日報(bào)》語料庫和微軟語料庫)沒有任何歧義,就是指“中華人民共和國”,但由于中文維基百科是一個(gè)綜合性的知識庫,其中“中國”還可以指向1931年由中國共產(chǎn)黨所創(chuàng)建的“中華蘇維埃共和國”,1927年建立的以南京為首都的“中華民國”,袁世凱在1915年稱帝成立的“中華帝國”等,甚至還可以指向日本九州的“中國”地區(qū),這種實(shí)體的歧義給的構(gòu)建工作帶來了困難。

    為了解決上述問題,本文提出了自動(dòng)構(gòu)造中文嵌套命名實(shí)體的算法。

    算法嵌套命名實(shí)體自動(dòng)生成

    輸入CWE[],中文維基實(shí)體名稱列表

    WID{},中文維基實(shí)體名稱到維基條目id的映射表

    WLK{},維基條目id到該維基頁面中的內(nèi)鏈接列表的映射表

    輸出CNE[],中文嵌套命名實(shí)體列表

    初始化:CNE=[]

    1.對每一個(gè)中文維基實(shí)體名稱CWE[i]:

    2. 如果WID{CWE[i]}有多個(gè)元素,則跳過該實(shí)體

    3. 以CWE為字典,使用最長匹配原則從左到右識別出其中所包含的內(nèi)部實(shí)體,匹配后的嵌套實(shí)體為ne

    4. 將ne加入到CNE數(shù)組

    5.對每一個(gè)中文嵌套命名實(shí)體CNE[i]:

    6. 對CNE[i]的每一個(gè)內(nèi)部實(shí)體e:

    7. 若WID{e}中存在一個(gè)id等于WID{CNE[i]},則在CNE[i]中刪除e的標(biāo)注

    8. 若WID{e}中沒有一個(gè)id在WLK{WID{CNE[i]}}中,則刪除CNE[i]

    9.對每一個(gè)中文嵌套命名實(shí)體CNE[i]:

    10. 對每一個(gè)中文嵌套命名實(shí)體CNE[i]:

    11. 若CNE[i]以內(nèi)部實(shí)體e出現(xiàn)在CNE[i]中,則用CNE[i]的標(biāo)注代替CNE[i]中e的標(biāo)注

    在算法中,CWE為從上節(jié)獲得的中文維基實(shí)體名稱列表,WID將實(shí)體名稱映射到維基id,當(dāng)id有多個(gè)時(shí),表明實(shí)體名稱具有多個(gè)含義,即岐義性,WLK可根據(jù)id得到該頁面中的所有內(nèi)鏈接的id列表。該算法主要包括匹配、過濾和匯聚3個(gè)步驟:

    1)匹配。即基于字典的命名實(shí)體識別(第1步~第4步)。對實(shí)體字典中的每一個(gè)實(shí)體名稱(稱為外部實(shí)體),以字典本身作為詞表,使用最長匹配原則從左到右識別出其中所包含的所有內(nèi)部實(shí)體。如果外部實(shí)體本身有歧義時(shí),則不考慮該實(shí)體。如實(shí)體名稱“[上海交通大學(xué)徐匯校區(qū)]ns”,字典中包含“[上海交通大學(xué)]nt”和“[徐匯]ns”2個(gè)實(shí)體,因此可直接得到嵌套命名實(shí)體“[[上海交通大學(xué)]nt [徐匯]ns 校區(qū)]ns”。

    2)過濾。把不滿足嵌套關(guān)系的內(nèi)部實(shí)體作為假正例過濾掉(第5步~第8步),原則如下:

    (1)內(nèi)部實(shí)體的某一個(gè)含義和外部實(shí)體指向同一個(gè)維基頁面(第7步),如“[西藏自治區(qū)]ns”中的“[西藏]ns”指向同一個(gè)維基頁面,因此后者不能作為前者的內(nèi)部實(shí)體。事實(shí)上,“[西藏自治區(qū)]ns”是一個(gè)不能再分割的整體。

    (2)內(nèi)部實(shí)體的任何一個(gè)含義所指向的實(shí)體都沒有出現(xiàn)在外部實(shí)體的頁面中(第8步),其中,WLK{WID{CNE[i]}}表示外部實(shí)體所指向的維基頁面中的所有內(nèi)鏈接id列表,即如果在外部實(shí)體的頁面中找不到對內(nèi)部實(shí)體的引用,則認(rèn)為兩者之間的嵌套關(guān)系不存在,如實(shí)體“[奧雷爾韋爾拉克]ns”頁面中不存在對實(shí)體“[奧雷]ns”的引用,因而嵌套關(guān)系不成立。同樣,實(shí)體“[中國中央電視臺(tái)]nt”的頁面中出現(xiàn)了“中國”的一個(gè)含義“[中華人民共和國]ns”的引用,因此“[中國]ns”就是一個(gè)內(nèi)部實(shí)體。需要注意的是,這個(gè)規(guī)則也會(huì)把一些真正的正例過濾掉,如“[七十三軍抗戰(zhàn)陣亡將士墓]ns”中的內(nèi)部實(shí)體“[七十三軍]nt”,由于沒有出現(xiàn)在前者的頁面中而被濾掉。因此,直接把它從實(shí)體列表中移除,既不作為正例,也不作為負(fù)例。

    3)匯聚。如果一個(gè)包含內(nèi)部實(shí)體的外部實(shí)體又作為內(nèi)部實(shí)體出現(xiàn)在另一個(gè)外部實(shí)體中(稱為上級實(shí)體),則將它的嵌套關(guān)系匯聚到上級實(shí)體中,這樣就可以保證一個(gè)外部實(shí)體包含所有可能層次的內(nèi)部實(shí)體(第9步~第11步)。如實(shí)體“[[上海]ns 交通大學(xué)]nt”和“[[上海交通大學(xué)]nt [徐匯]ns 校區(qū)]ns”可以匯聚成一個(gè)單一嵌套命名實(shí)體“[[[上海]ns 交通大學(xué)]nt[徐匯]ns校區(qū)]ns”。

    3 語料庫統(tǒng)計(jì)和評估的自動(dòng)構(gòu)建

    3.1 語料庫統(tǒng)計(jì)的自動(dòng)構(gòu)建

    通過上述方法從維基百科中自動(dòng)構(gòu)建出包含嵌套命名實(shí)體層次結(jié)構(gòu)的實(shí)體列表,稱為嵌套命名實(shí)體識別自動(dòng)構(gòu)建語料,該語料可用于從外部實(shí)體中識別出它所包含的內(nèi)部實(shí)體。語料庫的統(tǒng)計(jì)情況如表1所示。

    表1 維基語料實(shí)體統(tǒng)計(jì)

    從表1可以看出:

    1)人名沒有嵌套現(xiàn)象,但人名可以出現(xiàn)在內(nèi)部實(shí)體中。

    2)無嵌套結(jié)構(gòu)的外部實(shí)體中大部分是人名(約55%)和地名(約39%),以及少量的組織名(約6%)。

    3)有嵌套結(jié)構(gòu)的外部實(shí)體中地名(約53%)和組織名(約47%)差不多各占一半,而內(nèi)部實(shí)體則反之,大部分是地名(約82%),小部分是組織名(約13%)和人名(約5%)。

    3.2 語料庫人工評估的自動(dòng)構(gòu)建

    為了衡量自動(dòng)構(gòu)建語料庫的質(zhì)量,從中隨機(jī)選取了200個(gè)外部實(shí)體,首先進(jìn)行嵌套命名實(shí)體的手工標(biāo)注,然后再與自動(dòng)標(biāo)注的嵌套命名實(shí)體進(jìn)行比較,并采用與準(zhǔn)確率和召回率相類似的標(biāo)對率和標(biāo)全率以及F1指數(shù)來反映語料的自動(dòng)標(biāo)注質(zhì)量,抽樣統(tǒng)計(jì)結(jié)果如表2所示。

    表2 自動(dòng)標(biāo)注語料質(zhì)量的抽樣統(tǒng)計(jì)

    從表2可以看出,整體標(biāo)對率達(dá)到了92.31%,然而整體標(biāo)全率較低,只達(dá)到了72.85%。錯(cuò)標(biāo)17條地名漏標(biāo)的主要原因有:

    1)維基條目缺失(12條),如地名“境主廟水庫”應(yīng)該標(biāo)注為“[[境主廟]ns 水庫]ns”,但是維基條目中沒有地名“境主廟”這個(gè)條目。

    2)維基鏈接缺失(4條),如“大坂產(chǎn)業(yè)大學(xué)短期大學(xué)部”應(yīng)標(biāo)注為“[[[大坂]ns 產(chǎn)業(yè)大學(xué)]nt 短期大學(xué)部]nt”,但因?yàn)椤按筵喈a(chǎn)業(yè)大學(xué)”頁面沒有包含“大坂”的鏈接,所以最后標(biāo)注為“[[大坂產(chǎn)業(yè)大學(xué)]nt 短期大學(xué)部]nt”。

    3)條目類型錯(cuò)誤(1條),即在維基條目實(shí)體分類時(shí)識別為非實(shí)體,如“汲水門燈籠洲燈塔”應(yīng)標(biāo)注為“[[汲水門]ns [燈籠洲]ns 燈塔]ns”,但由于“燈籠洲”的條目類型識別為非實(shí)體,因此標(biāo)注為“[[汲水門]ns 燈籠洲燈塔]ns”。

    4 自動(dòng)構(gòu)建語料的實(shí)驗(yàn)評估

    為了衡量自動(dòng)標(biāo)注語料的實(shí)用性,把它應(yīng)用于具體的嵌套命名實(shí)體識別任務(wù)中。首先在已有中文實(shí)體識別語料基礎(chǔ)上人工構(gòu)建一個(gè)嵌套命名實(shí)體的測試語料,稱為人工標(biāo)注語料,然后再用它來衡量自動(dòng)構(gòu)建語料上訓(xùn)練出來的模型的識別性能。

    4.1 人工標(biāo)注語料

    目前,中文命名實(shí)體識別[19]中常用的語料有微軟語料和《人民日報(bào)》語料,其中后者還標(biāo)注了嵌套命名實(shí)體,因此為了減少標(biāo)注工作量,把《人民日報(bào)》語料作為測試語料。不過,該語料只標(biāo)注了二層嵌套結(jié)構(gòu),且都是命名實(shí)體。如嵌套命名實(shí)體“[中共/j 北京/ns 市委/n 宣傳部/n]nt”不能滿足對嵌套命名實(shí)體的定義,其正確的標(biāo)注應(yīng)該是“[[[中共]nt [北京]ns市委]nt宣傳部]nt”。

    本文采用自動(dòng)抽取加人工調(diào)整的方式來產(chǎn)生中文嵌套命名實(shí)體測試語料,同時(shí)為了減少重復(fù)標(biāo)注,只對實(shí)體而非一個(gè)實(shí)體的多個(gè)引用進(jìn)行標(biāo)注,具體過程為:

    1)自動(dòng)抽取。從1998年1月的《人民日報(bào)》語料中抽取出復(fù)雜命名實(shí)體,并去除重復(fù)的實(shí)體引用,保留其中的命名實(shí)體標(biāo)注。如實(shí)體“[中共/j 北京/ns 市委/n 宣傳部/n]nt”提取后變成實(shí)體“[中共 [北京]ns 市委宣傳部]nt”。

    2)人工調(diào)整。人工標(biāo)注提取出的嵌套命名實(shí)體,通常是添加新的內(nèi)部實(shí)體。如第1步中的實(shí)體“[中共 [北京]ns 市委宣傳部]nt” 經(jīng)人工調(diào)整后為“[[[中共]nt [北京]ns 市委]nt 宣傳部]nt”。

    標(biāo)注后的《人民日報(bào)》中所有實(shí)體統(tǒng)計(jì)情況如表3所示,從表3可以看出,無嵌套結(jié)構(gòu)的外部實(shí)體中的組成與維基語料差別不大,大部分是地名(約47%)和人名(約43%),再加少量的組織名(約10%);有嵌套結(jié)構(gòu)的外部實(shí)體的組成與維基語料大為不同,大部分是組織名(約90%),再加少量的地名(約10%),而內(nèi)部實(shí)體的組成與維基語料基本一致,大部分是地名(約75%),小部分是組織名(約24%),還有極少數(shù)是人名(約1%)。

    表3 《人民日報(bào)》語料嵌套命名實(shí)體統(tǒng)計(jì)

    4.2 實(shí)驗(yàn)方法

    嵌套命名實(shí)體識別是從外部實(shí)體中識別出嵌套的內(nèi)部實(shí)體,因此首先需要從文本中識別出外部實(shí)體,然后再從外部實(shí)體中識別出內(nèi)部嵌套命名實(shí)體。由于本文的研究重點(diǎn)在于語料庫的自動(dòng)構(gòu)建,而不在于方法本身,因此選擇較易實(shí)現(xiàn)的基于序列標(biāo)注的CRF模型來實(shí)現(xiàn)最外層實(shí)體的識別。

    4.2.1 嵌套命名實(shí)體識別方法

    對于嵌套命名實(shí)體識別,采用由內(nèi)而外的層次模型方法,即使用多個(gè)CRF模型來識別由內(nèi)到外不同嵌套層次的實(shí)體。初步實(shí)驗(yàn)結(jié)果表明,由內(nèi)而外的方法總體上優(yōu)于其他嵌套命名實(shí)體識別方法。

    圖1列出了嵌套命名實(shí)體“[[[中共]nt [北京]ns 市委]nt宣傳部]nt”中各個(gè)層次的標(biāo)簽,其中零層標(biāo)簽是指最外層實(shí)體識別時(shí)的標(biāo)簽(為一致起見省略了其上下文),其生成的模型稱為零層模型,一層到三層標(biāo)簽是指在識別嵌套命名實(shí)體時(shí)各層模型采用的標(biāo)簽,這3層模型可以統(tǒng)稱為多層模型。零層模型的訓(xùn)練和測試需要考慮外層實(shí)體所在的上下文,而多層模型是在外層實(shí)體的范圍內(nèi)進(jìn)行訓(xùn)練和測試,與外層實(shí)體的上下文無關(guān),因而訓(xùn)練和測試速度較快。

    圖1 嵌套命名實(shí)體識別的各層標(biāo)簽

    4.2.2 CRF特征

    以往的中文命名實(shí)體識別研究表明[20],以字為單位的CRF模型在資源最少(即不進(jìn)行分詞)的情況下能取得較好的識別性能,因此本文也采用基于字符的CRF模型,且只采用了最基本的上下文特征,具體如下:

    Cn(n=-2,-1,0,1,2)

    CnCn+1(n=-1,0)

    其中,C0代表當(dāng)前的字,Cn代表當(dāng)前位置之后第n位的字,CnCn+1代表第n位及其下一個(gè)字的組合。例如,對于序列“中華人民共和國”來說,當(dāng)以字為單位時(shí),若C0為“人”,則C1代表“民”,C-1代表“華”,而C0C1代表“人民”。

    需要說明的是,訓(xùn)練零層模型時(shí)只有字特征,而訓(xùn)練多層模型時(shí)除包含字特征外,還包含所有下層的標(biāo)簽作為特征,而在測試時(shí)多層模型則采用下層模型識別的結(jié)果作為其特征。

    4.2.3 評估方法

    采用常規(guī)的P、R、F1指數(shù)來評估實(shí)體識別的性能,P為準(zhǔn)確率,R為召回率,F1為兩者的調(diào)和平均。實(shí)驗(yàn)評估包含2個(gè)部分:一是交叉驗(yàn)證,即和其他《人民日報(bào)》語料上的研究工作一樣[7]采用十折交叉方法,將《人民日報(bào)》語料劃分為10份,其中,1份作為測試集,另外9份作為訓(xùn)練集,總體性能取10次結(jié)果的平均值;二是跨庫驗(yàn)證,即使用自動(dòng)構(gòu)建語料庫訓(xùn)練出多層模型,然后在《人民日報(bào)》語料最外層實(shí)體識別出來的基礎(chǔ)上再進(jìn)行嵌套命名實(shí)體的識別。

    4.3 實(shí)驗(yàn)結(jié)果

    本文實(shí)驗(yàn)結(jié)果主要包括以下方面:

    1)外層實(shí)體識別的交叉驗(yàn)證性能

    表4列出了在《人民日報(bào)》語料上最外層實(shí)體識別的交叉驗(yàn)證性能,同時(shí)也給出了各個(gè)類型的實(shí)體數(shù)量和占總數(shù)百分比。從表4可以看出,外層實(shí)體識別的總體F1性能達(dá)到了88%,且各個(gè)類型上的識別性能相差不大,盡管組織名實(shí)體所占比例較少(約20%)。

    表4 外層實(shí)體識別的交叉驗(yàn)證性能

    2)嵌套命名實(shí)體識別的交叉驗(yàn)證性能

    表5列出了在《人民日報(bào)》語料上嵌套命名實(shí)體識別的交叉驗(yàn)證性能,該性能是在外層實(shí)體識別的基礎(chǔ)上采用多層訓(xùn)練模型得到的結(jié)果。

    表5 嵌套命名實(shí)體識別的交叉驗(yàn)證性能

    從表5可以看出:

    (1)嵌套命名實(shí)體識別的總體性能低于外層實(shí)體識別性能,特別是召回率較低,其主要原因是有些較長的外層實(shí)體在零層模型中沒有被召回,因而導(dǎo)致其中的嵌套命名實(shí)體在下一步也無法識別出來。

    (2)人名實(shí)體的性能比地名和組織名實(shí)體的性能要低很多,這主要是由于其數(shù)量很少,但同時(shí)對總體性能的影響也微乎其微。

    3)嵌套命名實(shí)體識別的跨庫驗(yàn)證性能

    利用維基條目自動(dòng)構(gòu)建語料庫來訓(xùn)練多層模型,然后利用該模型來識別表4中已經(jīng)識別出的外層實(shí)體中的嵌套命名實(shí)體,從而通過實(shí)驗(yàn)來驗(yàn)證自動(dòng)構(gòu)建語料庫的質(zhì)量。實(shí)驗(yàn)結(jié)果如表6所示。

    表6 嵌套命名實(shí)體識別的跨庫驗(yàn)證性能

    從表6可以看出:

    (1)自動(dòng)構(gòu)建語料在中文嵌套命名實(shí)體識別上取得了67.19%的F1值,雖然不如人工標(biāo)注語料的性能高,但這是在沒有任何人工標(biāo)注的前提下取得的結(jié)果。

    (2)與人工標(biāo)注語料相比,召回率仍然偏低,這可能是由于維基語料中還有不少噪音,即遺漏了需標(biāo)注的嵌套命名實(shí)體,這也是今后進(jìn)一步研究的方向。

    4)與其他嵌套命名實(shí)體識別系統(tǒng)的性能比較

    表7列出了各中文嵌套命名實(shí)體識別系統(tǒng)在《人民日報(bào)》語料上的實(shí)驗(yàn)結(jié)果。需要指出的是,該結(jié)果僅供參考,主要原因是:

    (1)文獻(xiàn)[6-7,10]采用的《人民日報(bào)》嵌套命名實(shí)體語料沒有任何的調(diào)整,它只標(biāo)注了嵌套命名實(shí)體,因此只有二層嵌套,而本文重新標(biāo)注了多層的嵌套命名實(shí)體。

    (2)文獻(xiàn)[6-7]給出了所有實(shí)體(包含外層實(shí)體)的識別性能,而文獻(xiàn)[10]的計(jì)算方法和本文的方法相近,只考慮了嵌套命名實(shí)體的識別性能。

    總體而言,嵌套命名實(shí)體的識別性能還不夠理想,今后還需要進(jìn)一步的研究。

    表7 中文嵌套命名實(shí)體識別系統(tǒng)的性能比較 %

    5 結(jié)束語

    本文在中文維基百科條目實(shí)體分類的基礎(chǔ)上,通過匹配、過濾和匯聚3個(gè)階段,自動(dòng)構(gòu)建了一個(gè)大規(guī)模的中文嵌套命名實(shí)體識別語料庫。在人工標(biāo)注的《人民日報(bào)》中文嵌套命名實(shí)體識別上的實(shí)驗(yàn)結(jié)果表明,雖然自動(dòng)構(gòu)建語料的性能不能與手工標(biāo)注語料的性能相媲美,但是維基語料具有規(guī)模大和領(lǐng)域廣的特點(diǎn),能夠適應(yīng)寬泛領(lǐng)域上的中文嵌套命名實(shí)體識別任務(wù)。本文的不足之處在于,目前自動(dòng)構(gòu)建的維基百科語料在實(shí)驗(yàn)性能上召回率不高,主要原因是維基條目中的部分嵌套命名實(shí)體沒有被自動(dòng)標(biāo)注出來,即標(biāo)全率不高。因此,下一步的研究包括:改善該語料的標(biāo)全率,使用更多的百科資源是一個(gè)有效的途徑;將維基百科語料進(jìn)行領(lǐng)域劃分,從而更好地適應(yīng)不同目標(biāo)領(lǐng)域的中文嵌套命名實(shí)體識別任務(wù)。

    猜你喜歡
    維基百科維基嵌套
    例析“立幾”與“解幾”的嵌套問題
    維基百科影響司法
    英語世界(2023年10期)2023-11-17 09:18:46
    基于嵌套Logit模型的競爭性選址問題研究
    維基百科青年
    英語文摘(2021年8期)2021-11-02 07:17:46
    愛的最后一課
    基于變長隱馬爾科夫模型的維基詞條編輯微過程挖掘
    維基解密大爭論:爭論固有焦點(diǎn)和在互聯(lián)網(wǎng)時(shí)代呈現(xiàn)的爭論新特征
    新聞傳播(2015年4期)2015-07-18 11:11:29
    APP
    一種基于區(qū)分服務(wù)的嵌套隊(duì)列調(diào)度算法
    無背景實(shí)驗(yàn)到有背景實(shí)驗(yàn)的多重嵌套在電氣專業(yè)應(yīng)用研究
    河南科技(2014年23期)2014-02-27 14:19:17
    中文字幕av成人在线电影| 免费人成在线观看视频色| svipshipincom国产片| www.熟女人妻精品国产| 黄色丝袜av网址大全| 国产精品 欧美亚洲| 99热这里只有精品一区| 亚洲在线自拍视频| 99国产精品一区二区三区| 国产精品99久久99久久久不卡| 久久久久久人人人人人| 中文亚洲av片在线观看爽| 欧美绝顶高潮抽搐喷水| 精品99又大又爽又粗少妇毛片 | 99热这里只有是精品50| 欧美区成人在线视频| 日韩 欧美 亚洲 中文字幕| 极品教师在线免费播放| 成人鲁丝片一二三区免费| 一区二区三区国产精品乱码| 久久久久久九九精品二区国产| 岛国视频午夜一区免费看| 一区二区三区免费毛片| 色尼玛亚洲综合影院| 亚洲欧美日韩东京热| 婷婷精品国产亚洲av在线| 床上黄色一级片| 最近最新免费中文字幕在线| 特大巨黑吊av在线直播| 在线十欧美十亚洲十日本专区| 欧美又色又爽又黄视频| av在线天堂中文字幕| 热99re8久久精品国产| 国产精品一区二区免费欧美| 12—13女人毛片做爰片一| 欧美午夜高清在线| 午夜精品在线福利| 国产欧美日韩精品一区二区| 日韩欧美 国产精品| 日本精品一区二区三区蜜桃| 亚洲av免费高清在线观看| 中文字幕人妻熟人妻熟丝袜美 | 午夜精品久久久久久毛片777| av黄色大香蕉| 动漫黄色视频在线观看| 18禁国产床啪视频网站| 精品熟女少妇八av免费久了| 国产亚洲精品一区二区www| 欧美又色又爽又黄视频| 91在线精品国自产拍蜜月 | 他把我摸到了高潮在线观看| 久久午夜亚洲精品久久| 亚洲欧美日韩高清在线视频| 波多野结衣高清无吗| 国产亚洲欧美在线一区二区| 色视频www国产| 亚洲国产日韩欧美精品在线观看 | 欧美中文综合在线视频| 国产视频一区二区在线看| 日韩欧美一区二区三区在线观看| 母亲3免费完整高清在线观看| 熟女少妇亚洲综合色aaa.| 亚洲欧美日韩东京热| 精华霜和精华液先用哪个| 日韩欧美免费精品| 亚洲av不卡在线观看| 亚洲最大成人中文| 日韩欧美一区二区三区在线观看| 久9热在线精品视频| 日韩大尺度精品在线看网址| 国产三级中文精品| av视频在线观看入口| 特大巨黑吊av在线直播| 国产精品一区二区三区四区免费观看 | 国产黄色小视频在线观看| 国产69精品久久久久777片| 91在线观看av| 久久精品夜夜夜夜夜久久蜜豆| 欧美在线一区亚洲| 真实男女啪啪啪动态图| 日本免费一区二区三区高清不卡| 偷拍熟女少妇极品色| 老司机午夜十八禁免费视频| 色老头精品视频在线观看| av欧美777| 亚洲精品影视一区二区三区av| 黄色丝袜av网址大全| 亚洲成人免费电影在线观看| 一二三四社区在线视频社区8| 亚洲国产色片| 国产成+人综合+亚洲专区| 在线视频色国产色| 桃红色精品国产亚洲av| 国产亚洲精品综合一区在线观看| 欧美av亚洲av综合av国产av| 3wmmmm亚洲av在线观看| 久久6这里有精品| 国产v大片淫在线免费观看| 日本熟妇午夜| 久久中文看片网| 国产亚洲av嫩草精品影院| 免费观看精品视频网站| 99久久久亚洲精品蜜臀av| 国产一区二区亚洲精品在线观看| 国产成人欧美在线观看| 日本熟妇午夜| 亚洲av成人av| 99久久精品国产亚洲精品| 久久精品亚洲精品国产色婷小说| 亚洲美女视频黄频| 久久久久九九精品影院| 精品久久久久久久久久免费视频| 亚洲真实伦在线观看| 国内毛片毛片毛片毛片毛片| 国内久久婷婷六月综合欲色啪| 亚洲专区国产一区二区| 女生性感内裤真人,穿戴方法视频| 国产麻豆成人av免费视频| 在线观看舔阴道视频| 精品久久久久久,| 男女视频在线观看网站免费| 免费在线观看日本一区| 成人国产一区最新在线观看| 亚洲aⅴ乱码一区二区在线播放| 一卡2卡三卡四卡精品乱码亚洲| 网址你懂的国产日韩在线| 一进一出好大好爽视频| 99热6这里只有精品| 欧美绝顶高潮抽搐喷水| 亚洲av成人av| 免费在线观看成人毛片| 欧美绝顶高潮抽搐喷水| 天堂动漫精品| 首页视频小说图片口味搜索| 中文亚洲av片在线观看爽| 亚洲,欧美精品.| 黄色视频,在线免费观看| 国产成人欧美在线观看| 欧美绝顶高潮抽搐喷水| 欧美在线黄色| 操出白浆在线播放| 国产成+人综合+亚洲专区| 久久精品夜夜夜夜夜久久蜜豆| 黄片大片在线免费观看| 亚洲无线观看免费| 色噜噜av男人的天堂激情| 免费看十八禁软件| 搡老熟女国产l中国老女人| 久久人人精品亚洲av| 中文字幕熟女人妻在线| 国产高清videossex| 91久久精品电影网| 欧美成人性av电影在线观看| 国产探花在线观看一区二区| 亚洲精品成人久久久久久| 免费看十八禁软件| 久久精品亚洲精品国产色婷小说| 在线观看舔阴道视频| 中文字幕人成人乱码亚洲影| 国产精品嫩草影院av在线观看 | 国产高清有码在线观看视频| 18禁美女被吸乳视频| 午夜福利在线观看免费完整高清在 | 亚洲av日韩精品久久久久久密| 99在线视频只有这里精品首页| 真人一进一出gif抽搐免费| 国产成人a区在线观看| 黄色成人免费大全| 一区福利在线观看| 亚洲国产精品成人综合色| 成人亚洲精品av一区二区| 成人永久免费在线观看视频| 亚洲成人久久性| 波多野结衣高清作品| 久久久久国内视频| 在线播放国产精品三级| 又黄又爽又免费观看的视频| 国产高清激情床上av| 欧美成人a在线观看| 欧美另类亚洲清纯唯美| 国产精品一区二区三区四区免费观看 | 啦啦啦观看免费观看视频高清| 成人特级黄色片久久久久久久| 免费电影在线观看免费观看| 18禁在线播放成人免费| 国产中年淑女户外野战色| 国产亚洲精品综合一区在线观看| 午夜免费成人在线视频| 一夜夜www| 99热6这里只有精品| 亚洲国产精品久久男人天堂| av福利片在线观看| 我的老师免费观看完整版| 亚洲av成人av| 精品无人区乱码1区二区| 免费看光身美女| 亚洲专区中文字幕在线| 亚洲精品色激情综合| 69av精品久久久久久| 热99re8久久精品国产| 欧美+日韩+精品| 国产男靠女视频免费网站| 18禁国产床啪视频网站| 99riav亚洲国产免费| 久久久国产成人精品二区| 亚洲国产精品合色在线| 婷婷精品国产亚洲av在线| 日韩欧美免费精品| xxxwww97欧美| 香蕉久久夜色| 国产三级在线视频| 日日干狠狠操夜夜爽| 亚洲avbb在线观看| 少妇高潮的动态图| 宅男免费午夜| 国产精品 国内视频| 国产在线精品亚洲第一网站| 日本黄大片高清| 免费高清视频大片| 99精品久久久久人妻精品| a级一级毛片免费在线观看| 中文字幕av成人在线电影| 亚洲国产欧美人成| 一级黄片播放器| 欧美日韩国产亚洲二区| avwww免费| а√天堂www在线а√下载| 欧美丝袜亚洲另类 | 久久精品91无色码中文字幕| 国产97色在线日韩免费| 人妻丰满熟妇av一区二区三区| 国产伦在线观看视频一区| 村上凉子中文字幕在线| av视频在线观看入口| 国产97色在线日韩免费| 欧美+日韩+精品| 精品电影一区二区在线| 天堂√8在线中文| 桃色一区二区三区在线观看| 老熟妇乱子伦视频在线观看| 国产蜜桃级精品一区二区三区| 国产精华一区二区三区| 99久久精品一区二区三区| 无遮挡黄片免费观看| 岛国在线免费视频观看| 日本黄色片子视频| 三级男女做爰猛烈吃奶摸视频| 老汉色av国产亚洲站长工具| 欧美日韩一级在线毛片| 国内精品久久久久精免费| 日本免费一区二区三区高清不卡| 亚洲欧美日韩卡通动漫| 久久人妻av系列| 久久久久久九九精品二区国产| 少妇的逼好多水| 两人在一起打扑克的视频| 99国产精品一区二区蜜桃av| 极品教师在线免费播放| 久久精品国产99精品国产亚洲性色| 在线十欧美十亚洲十日本专区| 国产精品av视频在线免费观看| 久久久久国内视频| 欧美高清成人免费视频www| 村上凉子中文字幕在线| 亚洲av熟女| av片东京热男人的天堂| 中文资源天堂在线| av中文乱码字幕在线| 99久久无色码亚洲精品果冻| 免费在线观看亚洲国产| 亚洲中文日韩欧美视频| 人妻夜夜爽99麻豆av| 岛国视频午夜一区免费看| 日韩亚洲欧美综合| 中文字幕av在线有码专区| 亚洲精品一区av在线观看| 日本 欧美在线| 国产成人av激情在线播放| 老汉色∧v一级毛片| 国产欧美日韩一区二区三| 99riav亚洲国产免费| 亚洲欧美日韩高清在线视频| 亚洲精品在线观看二区| 欧美黑人巨大hd| 中文字幕久久专区| eeuss影院久久| 成年人黄色毛片网站| 中文资源天堂在线| 国产主播在线观看一区二区| 99精品久久久久人妻精品| 欧美乱码精品一区二区三区| 少妇丰满av| 亚洲五月婷婷丁香| 波多野结衣巨乳人妻| 成年女人看的毛片在线观看| 天堂动漫精品| 亚洲人与动物交配视频| 91在线观看av| 波多野结衣高清作品| 日本在线视频免费播放| 国产伦精品一区二区三区视频9 | 99久久九九国产精品国产免费| 听说在线观看完整版免费高清| 啦啦啦观看免费观看视频高清| 欧美午夜高清在线| 久久伊人香网站| 日韩成人在线观看一区二区三区| 美女 人体艺术 gogo| 身体一侧抽搐| 免费观看的影片在线观看| 亚洲av五月六月丁香网| 两个人视频免费观看高清| 9191精品国产免费久久| 综合色av麻豆| 亚洲av中文字字幕乱码综合| 久久精品综合一区二区三区| 日日摸夜夜添夜夜添小说| 日本精品一区二区三区蜜桃| 天堂网av新在线| 亚洲激情在线av| 欧美中文综合在线视频| 久久精品国产亚洲av香蕉五月| 精品日产1卡2卡| 在线视频色国产色| 欧美丝袜亚洲另类 | 亚洲精品在线美女| 亚洲av免费高清在线观看| 99视频精品全部免费 在线| 嫩草影院入口| av福利片在线观看| 成人无遮挡网站| 日韩精品中文字幕看吧| 最近最新中文字幕大全免费视频| 亚洲av五月六月丁香网| 亚洲国产欧美人成| 看黄色毛片网站| 少妇的逼好多水| 欧美一级a爱片免费观看看| 18禁国产床啪视频网站| 99热这里只有是精品50| 国产成年人精品一区二区| 国产aⅴ精品一区二区三区波| 欧美在线黄色| 日韩欧美在线二视频| 一级a爱片免费观看的视频| 亚洲成a人片在线一区二区| 中文字幕av成人在线电影| 一级作爱视频免费观看| 成人av一区二区三区在线看| 亚洲人与动物交配视频| 99国产极品粉嫩在线观看| 国产中年淑女户外野战色| 精品电影一区二区在线| 国内精品久久久久久久电影| 日本五十路高清| 国产麻豆成人av免费视频| 国产乱人视频| 两人在一起打扑克的视频| 亚洲真实伦在线观看| 国内精品久久久久久久电影| 免费看a级黄色片| xxxwww97欧美| 一级a爱片免费观看的视频| 亚洲精品456在线播放app | 伊人久久大香线蕉亚洲五| 别揉我奶头~嗯~啊~动态视频| 人妻夜夜爽99麻豆av| 最近在线观看免费完整版| 人妻夜夜爽99麻豆av| 麻豆国产av国片精品| 国产99白浆流出| 精品欧美国产一区二区三| 国产午夜福利久久久久久| 亚洲av免费高清在线观看| 999久久久精品免费观看国产| 18禁裸乳无遮挡免费网站照片| 国产亚洲精品久久久久久毛片| 久久精品91无色码中文字幕| 精品国产亚洲在线| 在线观看免费午夜福利视频| 嫩草影视91久久| 国产成人av教育| 好男人电影高清在线观看| 国产美女午夜福利| 午夜影院日韩av| 最新在线观看一区二区三区| 男人舔女人下体高潮全视频| 国产精品 欧美亚洲| 丰满的人妻完整版| 日本一本二区三区精品| 久久精品影院6| 免费在线观看日本一区| 淫秽高清视频在线观看| 老司机深夜福利视频在线观看| 偷拍熟女少妇极品色| 内射极品少妇av片p| 欧美日韩乱码在线| 色老头精品视频在线观看| 国产精品 国内视频| 精品不卡国产一区二区三区| 国产亚洲av嫩草精品影院| 老司机在亚洲福利影院| a级毛片a级免费在线| 99精品久久久久人妻精品| 性色avwww在线观看| 高潮久久久久久久久久久不卡| 波多野结衣高清无吗| 成人午夜高清在线视频| 欧美一级a爱片免费观看看| 午夜福利18| 国产成人影院久久av| 成人高潮视频无遮挡免费网站| 成年女人永久免费观看视频| 天堂影院成人在线观看| 在线视频色国产色| 狂野欧美白嫩少妇大欣赏| 九九在线视频观看精品| 日日干狠狠操夜夜爽| 人人妻人人看人人澡| 日本精品一区二区三区蜜桃| 国产成人啪精品午夜网站| 亚洲精品一区av在线观看| 国产真实乱freesex| 女同久久另类99精品国产91| 狠狠狠狠99中文字幕| 看片在线看免费视频| 亚洲18禁久久av| 热99re8久久精品国产| 又黄又粗又硬又大视频| 国产一区二区激情短视频| 久久久久久久亚洲中文字幕 | 国产一区二区在线观看日韩 | 欧美午夜高清在线| 欧美xxxx黑人xx丫x性爽| 日韩欧美在线乱码| 国产成人系列免费观看| 欧美乱妇无乱码| h日本视频在线播放| 国产精品三级大全| 法律面前人人平等表现在哪些方面| 成人av一区二区三区在线看| 欧美xxxx黑人xx丫x性爽| av天堂中文字幕网| 嫩草影院入口| 国产午夜精品论理片| 有码 亚洲区| 国产高清三级在线| 婷婷六月久久综合丁香| 午夜影院日韩av| 十八禁人妻一区二区| 亚洲一区二区三区不卡视频| АⅤ资源中文在线天堂| 亚洲国产精品久久男人天堂| 搡老岳熟女国产| 一级黄片播放器| 两个人的视频大全免费| 国产精品久久视频播放| 韩国av一区二区三区四区| 长腿黑丝高跟| 国产aⅴ精品一区二区三区波| 18禁国产床啪视频网站| 少妇的逼水好多| 亚洲欧美一区二区三区黑人| 成人特级黄色片久久久久久久| 国产精品美女特级片免费视频播放器| 亚洲成人精品中文字幕电影| 亚洲天堂国产精品一区在线| 丰满乱子伦码专区| 两性午夜刺激爽爽歪歪视频在线观看| 久久久久国内视频| 欧美+亚洲+日韩+国产| 国产v大片淫在线免费观看| 亚洲激情在线av| 日日摸夜夜添夜夜添小说| 天美传媒精品一区二区| 在线天堂最新版资源| 国产麻豆成人av免费视频| 一级a爱片免费观看的视频| 欧美大码av| 琪琪午夜伦伦电影理论片6080| 天天一区二区日本电影三级| 国产亚洲av嫩草精品影院| 久久欧美精品欧美久久欧美| 法律面前人人平等表现在哪些方面| 国产精品一区二区三区四区久久| 欧美日韩国产亚洲二区| 日韩高清综合在线| 亚洲专区中文字幕在线| 校园春色视频在线观看| 哪里可以看免费的av片| 天天一区二区日本电影三级| 亚洲成av人片免费观看| 国产男靠女视频免费网站| 久久伊人香网站| 亚洲精品国产精品久久久不卡| 日韩国内少妇激情av| 美女cb高潮喷水在线观看| 波多野结衣高清无吗| 精品久久久久久成人av| 有码 亚洲区| 少妇熟女aⅴ在线视频| 性色avwww在线观看| 久久欧美精品欧美久久欧美| 日本在线视频免费播放| 午夜福利免费观看在线| 白带黄色成豆腐渣| 操出白浆在线播放| 午夜a级毛片| 啦啦啦韩国在线观看视频| 国内毛片毛片毛片毛片毛片| 亚洲中文字幕日韩| 美女高潮的动态| 18禁国产床啪视频网站| 中文资源天堂在线| 国产成人影院久久av| 人人妻,人人澡人人爽秒播| svipshipincom国产片| 久久久久久国产a免费观看| 激情在线观看视频在线高清| 久9热在线精品视频| 搡老岳熟女国产| 久久久精品大字幕| 欧美日韩乱码在线| 亚洲中文字幕一区二区三区有码在线看| 国产97色在线日韩免费| 久久久久久久久久黄片| 香蕉久久夜色| 毛片女人毛片| 91av网一区二区| 高潮久久久久久久久久久不卡| 国产伦人伦偷精品视频| 国产精品1区2区在线观看.| 性色avwww在线观看| 国产极品精品免费视频能看的| 久久天躁狠狠躁夜夜2o2o| 国产精品国产高清国产av| 午夜福利视频1000在线观看| 成人av一区二区三区在线看| 久9热在线精品视频| 国内少妇人妻偷人精品xxx网站| 麻豆成人午夜福利视频| 亚洲一区二区三区色噜噜| 很黄的视频免费| 少妇人妻一区二区三区视频| 精品午夜福利视频在线观看一区| 3wmmmm亚洲av在线观看| 成人亚洲精品av一区二区| 欧美bdsm另类| 色尼玛亚洲综合影院| 老汉色av国产亚洲站长工具| 国产伦在线观看视频一区| 狠狠狠狠99中文字幕| av福利片在线观看| 国产亚洲精品久久久com| 99视频精品全部免费 在线| 久久午夜亚洲精品久久| 欧美一区二区精品小视频在线| 少妇人妻精品综合一区二区 | 蜜桃久久精品国产亚洲av| 国产精品久久久久久精品电影| 国产精品永久免费网站| 国产蜜桃级精品一区二区三区| 国产色爽女视频免费观看| 中文字幕人妻丝袜一区二区| 国产伦精品一区二区三区四那| 在线观看美女被高潮喷水网站 | 欧美日韩瑟瑟在线播放| 日本 欧美在线| 亚洲一区二区三区色噜噜| 午夜激情福利司机影院| 中文字幕人成人乱码亚洲影| 久久久久久久亚洲中文字幕 | 日韩亚洲欧美综合| 91字幕亚洲| 精品日产1卡2卡| 一进一出好大好爽视频| 国产欧美日韩精品一区二区| 亚洲欧美一区二区三区黑人| 成人特级黄色片久久久久久久| 欧美日韩一级在线毛片| 亚洲av成人不卡在线观看播放网| 91麻豆av在线| 亚洲国产欧洲综合997久久,| 久久精品国产综合久久久| 欧美日韩乱码在线| 在线天堂最新版资源| 欧美色欧美亚洲另类二区| 色综合亚洲欧美另类图片| 小蜜桃在线观看免费完整版高清| 狠狠狠狠99中文字幕| 国产极品精品免费视频能看的| 最新在线观看一区二区三区| 国产精品,欧美在线| 中文字幕高清在线视频| 天美传媒精品一区二区| 亚洲 欧美 日韩 在线 免费| 麻豆国产av国片精品| 神马国产精品三级电影在线观看| 国产视频内射| 国产精品久久久久久精品电影| 一区二区三区国产精品乱码| 夜夜爽天天搞| 午夜福利高清视频| x7x7x7水蜜桃| 久久99热这里只有精品18| 美女被艹到高潮喷水动态| 精品免费久久久久久久清纯| 久久国产精品影院| 51国产日韩欧美| 国产高清激情床上av| 一区二区三区国产精品乱码| 日本 欧美在线| 国产精品影院久久| 亚洲第一电影网av| 国产精品日韩av在线免费观看|