• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    旅游領(lǐng)域?qū)嶓w和關(guān)系聯(lián)合抽取方法研究

    2022-09-21 05:38:26古麗拉阿東別克馬雅靜
    計算機工程與應(yīng)用 2022年18期
    關(guān)鍵詞:三元組嵌套實體

    陳 赟,古麗拉·阿東別克,馬雅靜

    1.新疆大學 信息科學與工程學院,烏魯木齊830017

    2.新疆多語種信息技術(shù)實驗室,烏魯木齊830017

    知識圖譜(knowledge graph)是以圖的形式表現(xiàn)客觀世界中的實體(概念、人、事物)及其之間關(guān)系的知識庫[1]。知識圖譜于2012 年5 月17 日被Google 正式提出[2],其目的是優(yōu)化搜索引擎性能,提升用戶的搜索質(zhì)量以及搜索體驗。國內(nèi)垂直領(lǐng)域的知識圖譜進展較快的多為金融領(lǐng)域和醫(yī)療領(lǐng)域的項目,旅游領(lǐng)域涉及較少。通過構(gòu)建旅游領(lǐng)域的知識圖譜并結(jié)合智能問答、個性化推薦等上層應(yīng)用,可以促進旅游行業(yè)智能信息服務(wù)技術(shù)的快速發(fā)展,從而帶來更高的經(jīng)濟效益。

    知識圖譜中的數(shù)據(jù)通常以“實體-關(guān)系-實體”或“實體-屬性-屬性值”的關(guān)系三元組存儲,形成一個圖狀知識庫,因此從非結(jié)構(gòu)化文本信息中抽取關(guān)系三元組是構(gòu)建知識圖譜的關(guān)鍵任務(wù)。而旅游領(lǐng)域的文本信息中存在著大量的實體嵌套和關(guān)系重疊現(xiàn)象,例如表1文本中包含的以(subject,predicate,object)形式的關(guān)系三元組有[(杭州西湖風景區(qū),所在城市,杭州),(杭州西湖風景區(qū),著名景點,蘇堤春曉),(蘇堤春曉,所屬景區(qū),杭州西湖風景區(qū)),(蘇堤春曉,所在城市,杭州)]。

    表1 旅游領(lǐng)域關(guān)系重疊樣例Table 1 Sample relation overlapping in tourism domain

    在實體抽取過程中,其中作為景點名稱的實體“杭州西湖風景區(qū)”中嵌套作為城市名稱的“杭州”,Luo 等人[3]提出基于注意力機制的Att-BiLSTM-CRF模型進行化學領(lǐng)域命名實體識別,使用B/I/O 標簽加實體類型來區(qū)分實體的開頭、中間和結(jié)尾或者判斷是否為實體。這種命名實體識別的方法無法將實體“杭州西湖風景區(qū)”中的“杭”同時標注為景點名稱的開頭和城市名稱的開頭,因而無法解決實體嵌套問題。

    在關(guān)系抽取的過程中,表1 中文本包含EPO(entity pair overlap)和SEO(single entity overlap)兩種關(guān)系重疊形式。其中,EPO 是指句子中至少有兩個關(guān)系三元組,并且至少有兩個關(guān)系三元組以相同或者相反的順序共享一對實體;SEO 是指句子中有多個關(guān)系三元組,并且至少有兩個關(guān)系三元組共享一個相同的實體。由于管道抽取模型存在誤差積累和實體冗余會造成模型性能大幅下降,不能夠有效處理關(guān)系重疊問題。Zheng等人[4]提出的聯(lián)合抽取模型將問題轉(zhuǎn)化為序列標注問題,生成標注序列后將關(guān)系標簽合并為實體三元組時采用就近組合的方法,雖然能夠從句子中抽取出多種關(guān)系,但并不能處理實體出現(xiàn)重疊的關(guān)系抽取問題。

    由于目前聯(lián)合抽取的方法并不能有效地處理信息抽取任務(wù)中實體嵌套和關(guān)系重疊的問題,本文提出了BAMRel 模型(joint extraction model based on biaffine attention mechanism)。模型的主要特點是通過共享參數(shù)使用Biaffine 模型分別構(gòu)建邊界注意力矩陣和關(guān)系注意力矩陣來解決實體嵌套和關(guān)系重疊問題,同時將實體標簽作為特征融入關(guān)系抽取部分,在構(gòu)建的旅游領(lǐng)域關(guān)系抽取數(shù)據(jù)集TFRED(tourism field relation extraction dataset)上和公開數(shù)據(jù)集上均取得了較好的實驗結(jié)果。

    綜上所述,本文的貢獻主要有以下三點:

    (1)基于遠程監(jiān)督的思想,利用結(jié)構(gòu)化三元組進行數(shù)據(jù)回標,構(gòu)建了包含近2萬個關(guān)系三元組的旅游領(lǐng)域關(guān)系抽取數(shù)據(jù)集TFRED。構(gòu)建流程和部分數(shù)據(jù)開源在:https://github.com/chenyun-lh/TFRED,后續(xù)將持續(xù)對數(shù)據(jù)量進行擴充。

    (2)提出BAMRel 模型,共享BERT 編碼參數(shù)的同時,實體抽取和關(guān)系抽取部分共用Biaffine 模型來分別解決實體嵌套和關(guān)系重疊問題,降低了聯(lián)合抽取模型的復雜度,提供了一種不僅限于旅游領(lǐng)域的簡潔高效的模型方案。

    (3)進行實驗嚴格論證了實體標簽作為特征對關(guān)系抽取結(jié)果的影響,并量化了影響程度。

    1 相關(guān)工作

    目前關(guān)系三元組的抽取方法主要分為管道抽取方法和聯(lián)合抽取方法。管道抽取方法是將關(guān)系三元組的抽取作為實體識別和關(guān)系抽取兩個獨立的子任務(wù)進行,本章將介紹管道抽取方法的兩個子任務(wù)和聯(lián)合抽取方法的相關(guān)工作。

    1.1 命名實體識別方法

    早期命名實體識別(named entity recognition,NER)方法主要是基于規(guī)則的方法?;谝?guī)則的系統(tǒng)依賴于手工制定的規(guī)則,無法轉(zhuǎn)移到其他領(lǐng)域。后來產(chǎn)生了基于機器學習的命名實體識別方法,NER任務(wù)被轉(zhuǎn)換為一個分類問題或序列標注問題,這類方法降低了人工成本,但依賴于特征工程。近年來,基于深度學習的NER模型占據(jù)了主導地位,與基于機器學習的方法相比,深度學習有利于自動發(fā)現(xiàn)隱藏的特征無需人工構(gòu)建特征。Dong 等人[5]提出使用BiLSTM-CRF 來進行中文命名實體識別,在NER 任務(wù)中有很好的表現(xiàn)。2018 年谷歌提出BERT 預(yù)訓練模型[6],通過微調(diào)的方法可以靈活應(yīng)用到各項NLP任務(wù)中,所以在實體識別任務(wù)中將BERT作為編碼層的模型會成為性能很強的基線模型[7-9]。

    但是在中文NER 任務(wù)中,基于序列標注框架并不能解決實體嵌套問題。針對實體嵌套的問題,Jia等人[10]提出通過動態(tài)地堆疊基于序列標注的實體識別層來識別嵌套實體,每一層的模型參數(shù)及其輸入是完全獨立的,因而嵌套實體識別過程不會受到其他層的干擾。Fu等人[11]提出部分觀察樹TreeCRF方法,將嵌套實體識別過程視為部分觀察樹的選區(qū)分析,用統(tǒng)一的方式對觀察樹中觀察實體和潛在實體聯(lián)合建模。Shen 等人[12]針對包含嵌套實體的長實體識別提出兩階段識別方法,首先對生成的可能實體邊界進行過濾和邊界回歸,然后對邊界調(diào)整后的實體邊界標注相應(yīng)的類別。指針網(wǎng)絡(luò)(PointerNet)最早應(yīng)用于機器閱讀理解(machine reading comprehension,MRC)中,Li 等人[13]基于該思想構(gòu)建問題指代所要抽取的實體類型,引入了先驗語義知識,使用單層指針網(wǎng)絡(luò)來解決實體嵌套的問題。多標簽指針網(wǎng)絡(luò)由單層指針網(wǎng)絡(luò)衍生而來,如圖1所示多標簽指針網(wǎng)絡(luò)使用n個(n為實體類型數(shù)量)二元指針網(wǎng)絡(luò)進行嵌套實體識別。Yu 等人[14]使用雙仿射變換構(gòu)建三維矩陣,把實體抽取任務(wù)看成為識別實體開始與結(jié)束位置索引的問題,同時對這個開始與結(jié)束位置形成的實體邊界(span)賦予類型。

    圖1 多標簽指針網(wǎng)絡(luò)嵌套實體識別Fig.1 Multi-label pointer network nested entity recognition

    1.2 關(guān)系抽取方法

    在管道抽取方法中,早期的關(guān)系抽取方法主要是基于模板匹配的方法,此類方法適用于小規(guī)模特定領(lǐng)域,召回率低、可移植性差。后來出現(xiàn)了半監(jiān)督學習的關(guān)系抽取方法,主要有bootstrapping和遠程監(jiān)督方法。遠程監(jiān)督方法基于一個很強的假設(shè),如果一個實體對滿足某種給定關(guān)系,包含該實體對的句子都在闡述該關(guān)系。但很多包含該實體對的句子并不代表此種關(guān)系,會引入大量噪聲。為了緩解這一問題,研究者采取了多示例學習[15-18]、強化學習[19]和預(yù)訓練機制[20]等改進策略。

    目前主流監(jiān)督學習的關(guān)系抽取方法是基于深度學習的方法,Soares 等人[20]基于BERT 模型采用多種不同結(jié)構(gòu)來進行實體對的特征提取進行關(guān)系分類,但該方法會對同一個句子進行重復編碼,耗費計算資源。為了解決該問題Wang等人[21]將多次關(guān)系抽取轉(zhuǎn)化為同時抽取問題,將句子一次輸入進行多個關(guān)系分類。Kong等人[22]針對在管道抽取方法中的歧義實體和詞典信息融入到字符信息丟失的問題提出一種在嵌入層自適應(yīng)地包含詞信息的方法,利用詞典將所有匹配每個字符的詞合并到一個基于字符輸入的模型中,以此來提高實體準確率減少誤差傳播。Wang等人[23]提出了一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的關(guān)系抽取模型,該模型將上下文感知模型與以依賴樹為特征的加權(quán)圖卷積網(wǎng)絡(luò)模型相結(jié)合,融合了上下文和相關(guān)的結(jié)構(gòu)信息,并將剪枝策略應(yīng)用于輸入樹刪除冗余信息。

    1.3 聯(lián)合抽取方法

    為了解決實體識別的誤差傳遞問題,研究者提出聯(lián)合抽取的方法。早期出現(xiàn)了基于特征的聯(lián)合抽取方法[24-27],這種方法需要人工設(shè)計特征,因此需要大量工作對數(shù)據(jù)進行預(yù)處理。Miwa等人[28]首次將神經(jīng)網(wǎng)絡(luò)模型用于解決實體關(guān)系聯(lián)合抽取任務(wù),通過共享參數(shù)的方法將兩個任務(wù)整合到同一個模型當中,但兩個任務(wù)仍然是分離的過程,產(chǎn)生大量的冗余信息。為了解決該問題,Zheng 等人[4]設(shè)計了一種新穎的標注方法,這種方法對實體和關(guān)系同時抽取,將抽取問題轉(zhuǎn)化成為了標注任務(wù),通過使用神經(jīng)網(wǎng)絡(luò)來建模,避免了復雜的特征工程。目前,如何解決關(guān)系抽取任務(wù)中的關(guān)系重疊問題成為了研究熱點,主要的方法有基于圖神經(jīng)網(wǎng)絡(luò)方法和注意力機制的方法。在基于圖神經(jīng)網(wǎng)絡(luò)的方法中,F(xiàn)u等人[29]提出了一種基于圖卷積網(wǎng)絡(luò)(GCN)的端到端聯(lián)合抽取模型GraphRel,該模型利用圖卷積網(wǎng)絡(luò)聯(lián)合學習命名實體和關(guān)系。Fei等人[30]將復雜的重疊情抽取任務(wù)視為一個多重預(yù)測問題,使用圖注意模型對實體之間的關(guān)系圖進行建模。Zhao 等人[31]提出了一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)的表示迭代融合關(guān)系抽取方法,將關(guān)系和詞建模為圖上的節(jié)點,并通過消息傳遞機制來得到更適合關(guān)系抽取任務(wù)的節(jié)點表示。在基于注意力機制的方法中,Liu等人[32]提出了一種基于注意力的聯(lián)合關(guān)系抽取模型,該模型設(shè)計了一種有監(jiān)督的多頭自注意機制作為關(guān)系檢測模塊,分別學習每種關(guān)系類型之間的關(guān)聯(lián)來識別重疊關(guān)系和關(guān)系類型。Lai等人[33]提出了一種基于序列標注的聯(lián)合抽取模型,該模型在句子編碼信息之后添加多頭注意力層以獲得句子和關(guān)系的表征,并對句子表示進行序列標注來獲得實體對。Geng 等人[34]采用卷積運算得到字級和詞級的嵌入,并傳遞給多頭注意機制。然后使用多頭注意機制對上下文語義和嵌入進行編碼,得到最終的標簽序列。Nguyen等人[35]使用BiLSTM對句子進行編碼,在關(guān)系抽取部分使用雙仿射注意力機制來解決關(guān)系重疊問題,在CoNLL04 數(shù)據(jù)集上驗證了雙仿射分類器比線性分類器的顯著優(yōu)勢,但該模型的標注框架無法解決中文領(lǐng)域嵌套實體的關(guān)系抽取問題。

    2 模型介紹

    BAMRel 模型主要思路是共享BERT 編碼層,將編碼層信息共用于實體抽取和關(guān)系抽取部分。在實體抽取部分利用BERT 最后兩層編碼信息進行全連接層降維來分別表示實體的頭部信息和尾部信息,然后使用雙仿射注意力機制進行分類,形成對實體邊界span及標簽類型type 的界定;在關(guān)系抽取部分,實體類型作為較強特征,對實體抽取部分得到的實體標簽類型進行嵌入,與BERT 最后兩層降維后的編碼信息進行拼接分別表示分別關(guān)系三元組中主體subject和客體object信息,然后將編碼信息引入biaffine 模型構(gòu)建關(guān)系矩陣,最后利用實體邊界信息解碼形成對關(guān)系三元組(subject,predicate,object)的抽取。

    本文提出的BAMRel 模型整體結(jié)構(gòu)圖如圖2 所示,模型從功能上可以分為句子編碼層、實體抽取層和關(guān)系抽取層三個部分。接下來將對這三個部分進行介紹。

    圖2 BAMRel模型的整體框架Fig.2 Overall framework of BAMRel model

    2.1 句子編碼層

    BERT(bidirectional encoder representation from transformers)[6]是一種自然語言處理預(yù)訓練語言表征模型,通過預(yù)訓練和微調(diào)可以解決多種NLP的任務(wù),推動了自然語言處理的發(fā)展。BERT 的結(jié)構(gòu)是來自于Transformers模型的Encoder 部分,內(nèi)部結(jié)構(gòu)由Self-Attention Layer和Layer Normalization 堆疊而產(chǎn)生。針對傳統(tǒng)預(yù)訓練模型無法并行處理句子編碼、一詞多義和預(yù)訓練向量一成不變等問題,BERT 模型加入了位置編碼(positional encoding)和多頭自注意力機制(self-attention)來解決上述問題,使得預(yù)訓練模型性能得到了極大的提升,并在多個任務(wù)中廣泛應(yīng)用。

    如圖3 所示,BERT 模型輸入包括三個部分,分別為字或詞嵌入(token embedding)、片段嵌入(segment embedding)和位置編碼嵌入(position embedding)。由于片段嵌入是為了在需要判斷兩個句子之間關(guān)系的任務(wù)中區(qū)分兩個句子信息,故在關(guān)系抽取任務(wù)中不適用片段嵌入。將句子x通過分詞器得到分詞后的序列X,X=(x1,x2,…,xn),然后將X編碼成一個字嵌入矩陣We和位置嵌入矩陣Wp,將兩個向量相加得到輸入的向量E=(E1,E2,…,EN),如式(1)所示,然后將向量E通過第一層和第N層的Transformer網(wǎng)絡(luò)得到文本的向量表示H1和HN,分別如式(2)和式(3)所示:

    圖3 BERT模型結(jié)構(gòu)圖Fig.3 Structural diagram of BERT model

    其中,HN為句子經(jīng)過第N層Transformer 網(wǎng)絡(luò)進行編碼后的輸出。本文將包含有不同語義信息的BERT 最后兩層編碼層作為共享編碼層,即HN-1和HN層。

    2.2 實體抽取層

    實體抽取層完成命名實體識別(NER)任務(wù),最常見的標注方式是序列標注,但在信息抽取任務(wù)中已經(jīng)無法解決實體嵌套、類型混淆等復雜抽取問題。旅游領(lǐng)域信息抽取實體嵌套標注樣例如表2所示。

    表2 旅游領(lǐng)域?qū)嶓w嵌套標注樣例Table 2 Sample nested annotation of entities in travel domain

    首先將BERT最后兩層編碼信息HN-1和HN進行拼接得到包含有不同特征的句子表示x,然后使用兩個單獨的全連接神經(jīng)網(wǎng)絡(luò)對特征降維,分別創(chuàng)建span不同表示的起點hs和終點he。

    其中,si和ei分別是實體i的span開始和結(jié)束的位置索引。與直接使用BERT模型的輸出相比,這樣處理得到的實體的開始和結(jié)束的上下文是不同的,為雙仿射變換提供了更準確的信息。最后,在句子上使用雙仿射模型創(chuàng)建維度l×l×c評分函數(shù)rm,其中l(wèi)為句子長度,c為實體類型種類數(shù)+1(一種非實體類型),如式(7)所示:

    其中,Um對hs(i)為頭he(i)為尾的實體類別后驗概率建模,維度為d×c×d;Wm對hs(i)為頭或he(i)為尾的實體類別后驗概率分別建模,維度為2d×c;bm為偏置,對類別為c的先驗概率建模。

    通過計算rm就可以得到在滿足si≤ei條件的所有實體所有可能的標簽類型分數(shù),并對任意實體span賦予分類標簽y:

    然后類別分數(shù)rm對所有可能的span進行降序排列。最后設(shè)定閾值,對第i種實體類別標簽分數(shù)y(i)大于閾值的位置進行解碼。

    此任務(wù)是一個多分類問題,在softmax 激活函數(shù)之后使用交叉熵損失函數(shù)對模型進行優(yōu)化,實體抽取部分損失函數(shù)Lner如下:

    2.3 關(guān)系抽取層

    首先將共享編碼層x經(jīng)過兩個前饋神經(jīng)網(wǎng)絡(luò)分別得到主體(subject)和客體(object)的特征表示s(i) 和o(j),目的是將高維度包含豐富信息的編碼層通過全連接神經(jīng)網(wǎng)絡(luò)降為只包含關(guān)系依賴信息的低維度的特征,這樣可以加速訓練,同時防止過擬合。第i個主體和第j個客體向量表示為:

    其中,si和oj分別是主體和客體位置索引。同時實體抽取部分得到的實體標簽進行標簽嵌入轉(zhuǎn)化為特征向量ce,分別與s(i)和o(j)進行concat連接,然后得到了包含關(guān)系依賴信息和實體標簽信息的主體token 序列S(i)和客體token序列O(j)。實體標簽融合后第i個主體和第j個客體向量表示為:

    其中,ei和ej分別是實體和客體實體類型標簽的位置索引。目標是為主體S(i)每個tokenSi(i)識別出和每個客體Oj(j)的組合最可能對應(yīng)的關(guān)系標簽rk,最后S(i)和O(j)的token序列進行雙仿射變換后構(gòu)建出維度為l×l×r的Attention 矩陣,其中l(wèi)為句子長度,r為關(guān)系類型數(shù)。計算給定關(guān)系標簽rk的tokenSi(i)和Oj(j)之間分數(shù)的公式如式(15):

    其中,Uk對Si(i)為主體Oj(j)為客體關(guān)系類別后驗概率建模,維度為d×r×d;Wk對Si(i)為主體或Oj(j)為客體的關(guān)系類別后驗概率建模,維度為2d×r;bk為偏置,對類別關(guān)系為r的先驗概率建模。

    使用sigmoid 激活函數(shù)對主體Si(i)選擇Oj(j)作為它們之間具有關(guān)系標簽rk的客體的概率進行計算,計算如公式(16):

    然后設(shè)置閾值,對于在某種關(guān)系類型下概率值超出閾值的組合標記為1,其他標記為0。最后對標記為1的位置進行解碼。

    使用交叉熵損失函數(shù)對關(guān)系抽取損失進行計算,關(guān)系抽取部分損失函數(shù)Lrel如式(17):

    對于聯(lián)合實體和關(guān)系的抽取任務(wù),最終的損失函數(shù)定義為:

    2.4 解碼方式

    實體抽取部分,設(shè)置閾值的為0.5。由2.2 節(jié)可知,圖2 中輸入文本使用雙仿射模型創(chuàng)建維度l×l×c評分函數(shù)rm,第一個維度l表示實體的開始位置,第二個維度l表示實體的結(jié)束位置,第三個維度c表示實體類型編號。經(jīng)過實體抽取層計算則有:在實體類型為“景點名稱”的標簽上經(jīng)過降序排列后有rm(0,6,1)>0.5,rm(9,12,1)>0.5,即實體類型為“景點名稱”的實體有“杭州西湖風景區(qū)”和“蘇堤春曉”;在實體類型為“城市名稱”的標簽上經(jīng)過降序排列后有rm(0,1,2)>0.5,即實體類型為“城市名稱”的實體有“杭州”。通過解碼可得到實體列表[“杭州”“杭州西湖風景區(qū)”“蘇堤春曉”]。圖4 為嵌套實體“杭州西湖風景區(qū)”使用Biaffine機制構(gòu)造的Span矩陣。

    圖4 Biaffine機制構(gòu)造的Span矩陣Fig.4 Span matrix constructed by Biaffine mechanism

    關(guān)系抽取部分,設(shè)置閾值為0.5。由2.3節(jié)可知,圖2中輸入文本經(jīng)過實體抽取層將實體類型信息融入到共享的句子編碼信息中,然后使用雙仿射模型創(chuàng)建維度l×l×r評分函數(shù)rk,第一個維度l表示主體(subject)最后一個字符的位置,第二個維度l表示客體(object)最后一個字符的位置,第三個維度r表示關(guān)系類型編號。經(jīng)過關(guān)系抽取層計算則有:σ(rk(6,1,1))>0.5,σ(rk(6,12,2))>0.5,σ(rk(12,1,1))>0.5,σ(rk(12,6,3))>0.5,如圖2關(guān)系抽取部分所示,這些位置在對應(yīng)關(guān)系位置上均被標注為1。

    最后,結(jié)合實體列表和關(guān)系編號列表即可完成對含有嵌套實體的關(guān)系三元組[(杭州西湖風景區(qū),所在城市,杭州),(杭州西湖風景區(qū),著名景點,蘇堤春曉),(蘇堤春曉,所在城市,杭州),(蘇堤春曉,所屬景區(qū),杭州西湖風景區(qū))]的抽取。

    3 實驗與分析

    3.1 實驗數(shù)據(jù)集介紹

    由于旅游領(lǐng)域暫無公開的實體和關(guān)系抽取聯(lián)合任務(wù)的數(shù)據(jù)集,本文綜合考慮結(jié)構(gòu)化關(guān)系三元組中景點信息缺失程度和旅游領(lǐng)域文本信息中出現(xiàn)頻次,定義了實體類型和關(guān)系類型。結(jié)構(gòu)化三元組和文本信息主要爬取自百度百科和去哪兒、攜程、馬蜂窩等垂直旅游網(wǎng)站,然后基于遠程監(jiān)督的思想,利用結(jié)構(gòu)化三元組對文本信息進行回標,輔助構(gòu)建數(shù)據(jù)集,最終構(gòu)建了旅游領(lǐng)域關(guān)系抽取數(shù)據(jù)集TFRED(tourism field relation extraction dataset),句子條數(shù)共計10 604 條,包含嵌套實體句子1 166 條,約占數(shù)據(jù)集11%。每條句子包含一種或多種關(guān)系,句子中的關(guān)系三元組共計18 480 個。訓練集、驗證集、測試集按照8∶1∶1 比例分割,數(shù)據(jù)集詳細統(tǒng)計信息如表3所示。

    表3 TFRED數(shù)據(jù)集詳細統(tǒng)計Table 3 Detailed statistics of TFRED dataset

    為了驗證模型改進策略的有效性和BAMRel 模型的魯棒性,在公開的中文關(guān)系抽取數(shù)據(jù)集DuIE[36]上進行驗證。DuIE數(shù)據(jù)集包含45萬個實例、49種常用關(guān)系類型、32 種實體類型、34 萬個關(guān)系三元組、21 萬條句子。該數(shù)據(jù)集包含大量重疊關(guān)系,因此基于該數(shù)據(jù)集可以對模型重疊關(guān)系抽取能力進行評估。

    3.2 實驗環(huán)境及參數(shù)設(shè)置

    本文模型使用的GPU 為GeForce RTX 2080Ti,編程語言為Python3.7,深度學習框架為tensorflow2.0。本文使用模型對句子長度進行了限制,最大句子長度為128,訓練過程中batch_size 大小為16,使用初始學習率為1E-5的Adam優(yōu)化器在訓練集上學習100輪,在驗證集上獲得最佳F1 值模型,并在測試集上得到實驗結(jié)果。模型實體抽取部分和關(guān)系抽取部分共享編碼層后連接的前饋神經(jīng)網(wǎng)絡(luò)維度均為128,使用的激活函數(shù)均為relu。在關(guān)系抽取部分嵌入的實體標簽維度為16,使用Dropout 大小為0.2 來加快訓練速度和防止過擬合。實體抽取部分使用softmax 多分類交叉熵損失函數(shù),關(guān)系抽取部分使用sigmoid 二分類交叉熵損失函數(shù),兩部分閾值設(shè)置為0.5,該閾值通過實驗進行搜索得到。

    3.3 對比模型介紹

    為了驗證BAMRel模型的有效性和魯棒性,本文選取了以下主流的聯(lián)合抽取模型和相關(guān)改進模型進行對比實驗。

    (1)Multi-head[37]:使用BiLSTM作為共享編碼器,在實體識別部分使用條件隨機場解碼,將實體類型信息融合到關(guān)系抽取過程中,并把關(guān)系抽取轉(zhuǎn)化為一個多頭選擇的問題。

    (2)BERT+Multi-head:將Multi-head 中的BiLSTM替換為BERT編碼器。

    (3)Multi-head(Ptr-Net):將Multi-head中的BiLSTM替換為BERT 編碼器,同時為了解決實體嵌套問題,將基于條件隨機場的解碼方式替換為多標簽指針網(wǎng)絡(luò)。

    (4)CasRel[38]:提出一種用于解決關(guān)系重疊問題的級聯(lián)式二元標注框架,使用BERT 作為句子編碼器,將關(guān)系建模為將句子中的主語映射到賓語的函數(shù),使用多層關(guān)系標簽的指針網(wǎng)絡(luò)進行解碼。此方案中對于每組文本數(shù)據(jù),分別抽取其所有不同的S(Subject)以及其相關(guān)的PO組成多組數(shù)據(jù)進行訓練。

    (5)CasRel*:將CasRel模型訓練方式更改為每組文本數(shù)據(jù)僅隨機抽取一個S(Subject)以及其相關(guān)的PO構(gòu)建成一組數(shù)據(jù)的方式進行訓練。

    (6)CopyMTL[39]:一種基于復制機制編碼器-解碼器結(jié)構(gòu)的聯(lián)合關(guān)系抽取模型,Encoder 部分使用BiLSTM建模句子上下文信息,Decoder 部分則結(jié)合復制機制生成多對三元組。

    (7)WDec[40]:一個主要解決關(guān)系重疊問題提出的編碼器-解碼器結(jié)構(gòu)的聯(lián)合關(guān)系抽取模型,在實體識別的過程中使用掩碼機制,然后根據(jù)實體識別結(jié)果進行字解碼。

    (8)Seq2UMTree[41]:為了解決序列到序列模型在解碼過程中曝光偏差問題提出一種新的序列到無序多樹的聯(lián)合抽取模型,解碼器部分使用一個簡單的樹形結(jié)構(gòu)來生成三元組。

    (9)FETI[42]:一種新的融合頭尾實體類型信息的聯(lián)合抽取模型,在解碼階段增加了頭尾實體類別的預(yù)測,并通過輔助損失函數(shù)進行約束。

    (10)Biaffine(NER):將Multi-head(Ptr-Net)實體抽取部分的多標簽指針網(wǎng)絡(luò)替換為雙仿射分類器進行嵌套實體識別,關(guān)系抽取部分使用多頭選擇機制進行重疊關(guān)系抽取。

    (11)Biaffine(RE):將Multi-head(Ptr-Net)關(guān)系抽取部分的多頭選擇機制替換為雙仿射分類器進行重疊關(guān)系抽取,實體抽取部分使用多標簽指針網(wǎng)絡(luò)進行嵌套實體識別。

    3.4 評價指標

    實體抽取部分和關(guān)系抽取部分評價指標都使用準確率(P),召回率(R)和F1 值,公式參數(shù)定義如下:TP為正確識別的個數(shù),F(xiàn)P 是識別出的不相關(guān)的個數(shù),F(xiàn)N是數(shù)據(jù)集中存在且未被識別出來的個數(shù)。

    通常精確率和召回率的數(shù)值越高,代表實驗的效果好,然而有時精確率越高,召回率越低。所以需要綜合考量加權(quán)調(diào)和平均值,也就是F1值,F(xiàn)1值定義如下:

    在本實驗中,采用嚴格的評價指標,即如果實體的邊界和類型都是正確的,則認為該實體識別是正確的;當關(guān)系的類別和頭尾實體都正確時,則認為抽取的關(guān)系是正確的。

    3.5 實驗分析

    3.5.1 非嵌套實體聯(lián)合抽取對比實驗

    由于主流的聯(lián)合抽取模型無法解決包含嵌套實體的重疊關(guān)系抽取問題,故將TFRED 數(shù)據(jù)集篩選出不包含嵌套實體的句子進行對比實驗。為了驗證模型的有效性魯棒性,同時也在不包含嵌套實體的百度DuIE 數(shù)據(jù)集上進行了對比實驗,實驗結(jié)果如表4所示。

    表4 非嵌套實體聯(lián)合抽取實驗結(jié)果Table 4 Results of non-nested entity joint extraction experiments

    實驗結(jié)果顯示,BAMRel模型在自行構(gòu)建的TFRED數(shù)據(jù)集和公開數(shù)據(jù)集DuIE 數(shù)據(jù)集上的表現(xiàn)均優(yōu)于主流的聯(lián)合抽取模型,體現(xiàn)了模型在更加復雜場景中的魯棒性和有效性。其中基線模型CopyMTL、WDec、Seq2UMTree 實驗結(jié)果均來自于文獻[41]中的結(jié)果,F(xiàn)ETI 選擇F1 值最高的解碼順序。從TFRED 數(shù)據(jù)集上的實驗結(jié)果來看,Multi-head 的多頭選擇機制在使用BERT 作為編碼器后關(guān)系抽取結(jié)果提升了0.053,而BAMRel 模型比BERT+Multi-head 模型實驗結(jié)果高出0.012。這是由于使用雙仿射注意力機制構(gòu)建的分類矩陣擁有更多的參數(shù),且乘性方法相比于Multi-head的多頭選擇機制能捕捉到Subject 和Object 特征之間的交叉關(guān)系,而Multi-head 則是通過簡單的線性變化進行組合。CasRel 模型由于設(shè)計原因?qū)τ诿拷M文本數(shù)據(jù)每次只能傳入一個S(Subject)和其相關(guān)的PO 進行訓練,而存在重疊關(guān)系的復雜句子中可能主語不同,因此對每條文本遍歷所有不同主語(S)的標注樣本構(gòu)建訓練集比隨機選擇S更能增加模型的魯棒性,因此CasRel比CasRel*的實驗結(jié)果高了0.012。

    從DuIE數(shù)據(jù)集上的實驗結(jié)果來看,CopyMTL、WDec、Multi-head 等模型的準確率要高于召回率0.01~0.015,這是由于模型對句子包含多種關(guān)系三元組時抽取能力不足造成的,這類模型不適用于更加復雜的關(guān)系抽取場景。而Multi-head 改進后的Multi-head(Ptr-Net)在緩解了高準確率低召回率的情況下模型性能提升了近0.01,體現(xiàn)了預(yù)訓練模型對模型性能提升產(chǎn)生的巨大影響。Seq2UMTree 和FETI 模型都是基于編碼器-解碼器的模型,但FETI在解碼過程中融合了實體類型信息,F(xiàn)1值比Seq2UMTree提升了0.015,說明了實體類型信息對關(guān)系抽取結(jié)果提升具有促進作用,側(cè)面說明了BAMRel模型融合實體類型信息進行關(guān)系抽取的合理性和有效性。CasRel 模型使用多層標簽指針網(wǎng)絡(luò)巧妙地將關(guān)系的預(yù)測隱性的放在了尾實體的抽取過程中,結(jié)合預(yù)訓練模型BERT 在兩個數(shù)據(jù)集上取得了較高的F1 值。忽略模型本身設(shè)計方面的差異,解碼時CasRel的多個二元指針網(wǎng)絡(luò)使用的是簡單的線性分類器,而本文BAMRel模型在實體抽取部分和關(guān)系抽取部分都使用雙仿射分類器。雙仿射分類器構(gòu)建的注意力矩陣能夠使實體識別過程中開始位置token和結(jié)束位置token產(chǎn)生信息交互,同時能夠捕捉到關(guān)系抽取時頭尾實體特征之間的交叉關(guān)系而提升實驗結(jié)果,因而BAMRel 模型F1 值在TRFED數(shù)據(jù)集和DuIE 數(shù)據(jù)集上比CasRel 模型分別高出0.006和0.004。

    3.5.2 嵌套實體聯(lián)合抽取對比實驗

    本文首先將Multi-head[37]聯(lián)合抽取模型應(yīng)用于中文關(guān)系抽取,并針對其無法對句子中包含嵌套實體的關(guān)系進行抽取和抽取性能欠佳進行了改進,表5為一系列改進策略在包含嵌套實體的TRFED數(shù)據(jù)集上進行的對比實驗。在進行實體標簽類型嵌入時存在兩種方案。第一種方案是頭尾實體的所有token信息都與實體類型信息進行拼接,第二種方案是只對頭尾實體最后一個字符的token信息與實體類型信息進行拼接,其余的token實體類型都編碼為0,這兩種改進方案分別對應(yīng)表5 第一組對比實驗標簽全部嵌入(All)和標簽部分嵌入(Part)。從此實驗結(jié)果來看,在實體識別結(jié)果差異不大的情況下,頭尾實體部分標簽嵌入比全部標簽嵌入F1 值高了0.007,顯然第二種方案更適合關(guān)系抽取方式,只對頭尾實體的最后一個字符傳入實體類型信息在不會造成信息丟失的情況下增加了實體內(nèi)token 信息的區(qū)分度,有利于頭尾實體之間關(guān)系的判斷。

    表5 嵌套實體聯(lián)合抽取實驗結(jié)果Table 5 Results of nested entity joint extraction experiments

    Biaffine(NER)與Multi-head(Ptr-Net)相比,實體識別F1 值提升了0.009,同時關(guān)系抽取F1 值提升了0.005。Biaffine(RE)與Multi-head(Ptr-Net)相比,實體識別F1 值與Multi-head(Ptr-Net)模型保持不變的情況下,關(guān)系抽取F1 值提升了0.011。原因是雙仿射分類器比線性分類器擁有更多的參數(shù),且能捕捉到特征之間的交叉關(guān)系,從而提升實驗結(jié)果??梢詫⒈?中的第二組實驗看作BAMRel模型對雙仿射注意力的消融實驗,在Multi-head(Ptr-Net)模型上驗證了使用雙仿射注意力機制構(gòu)建分類矩陣的優(yōu)越性。BAMRel 模型在實體抽取部分和關(guān)系抽取部分共用Biaffine模型,最終在TFRED數(shù)據(jù)集上F1 值達到了91.8%,關(guān)系抽取F1 值比基礎(chǔ)模型提升了0.017。

    3.5.3 BAMRel模型實體和關(guān)系抽取能力評估

    為了進一步驗證BAMRel 模型從包含不同三元組數(shù)量的句子中對實體識別和關(guān)系抽取的能力,將TFRED數(shù)據(jù)集分成了5 類,表6 顯示了從不同三元組數(shù)量的句子中識別實體和關(guān)系抽取的能力。

    表6 BAMRel模型實體和關(guān)系抽取能力評估結(jié)果Table 6 Evaluation results of BAMRel model entity and relation extraction capabilities

    從表6中實體識別結(jié)果可以發(fā)現(xiàn),在包含不同關(guān)系數(shù)量的句子上實驗結(jié)果表現(xiàn)出較大差異性。分析其原因是由于每個句子中都可能存在沒有預(yù)定義關(guān)系的實體,但在進行實體識別時都將其識別了出來因而產(chǎn)生誤差。聯(lián)合抽取模型在數(shù)據(jù)標注時只標注了有預(yù)定義關(guān)系的頭尾實體,而句子中不同程度存在無關(guān)系實體,例如標注樣例:{"text":"青島海軍博物館,東鄰魯迅公園、西接小島公園與棧橋隔水相望、南瀕一望無際的大海、北面是著名景點信號山公園,占地4 萬多平方米。","spo_list":[{"predicate":"所在城市","object":"青島","subject":"青島海軍博物館","object_type":"城市","subject_type":"景點"},{"predicate":"占地面積","object":"4萬多平方米","subject":"青島海軍博物館","object_type":"Number","sub-ject_type":"景點"}]}

    在此樣例中標注的實體只有“青島海軍博物館”“青島”“4萬多平方米”,其中城市“青島”為嵌套實體,而在句子中還存在未被標注的“魯迅公園”“小島公園”“棧橋”和“信號山公園”無關(guān)系實體會被識別出來,因而會造成實體識別結(jié)果出現(xiàn)低準確率高召回率的情況。每個測試句子中包含無關(guān)系實體不同的數(shù)量造成了實體識別結(jié)果的差異性。表6 中包含實體嵌套的命名實體識別F1 值均值為0.968,與表4 中不包含嵌套實體的F1值0.967 相差不大,說明BAMRel 較好地解決了實體嵌套的問題。

    從表中關(guān)系抽取結(jié)果可以發(fā)現(xiàn),隨著句子中所包含的三元組的數(shù)量增加,模型的性能逐步降低。排除關(guān)系抽取難度最小(N=1)的情況,句子中關(guān)系數(shù)量從2增加到5 以上對關(guān)系抽取的F1 值僅降低了0.031,意味著模型受到輸入句子復雜性增加的影響較小,適合用于從復雜句子中抽取多個有重疊關(guān)系的三元組。

    3.5.4 實體類型對關(guān)系抽取影響評估

    本文提出的BAMRel模型和Multi-head[37]模型都將實體類型信息與共享的編碼信息融合進行關(guān)系抽取。但是實體識別部分設(shè)計存在兩種方案,第一種是實體識別僅確定實體邊界,來減少誤差傳播。第二種方案是實體識別同時確定實體邊界和實體類型,更多的實體標簽數(shù)量會增加識別難度傳播更多的誤差,但實體類型標簽可作為特征融合到關(guān)系抽取過程中得到更好的實驗結(jié)果。此時無法判斷兩種方案的優(yōu)劣和第二種方案中融合實體類型信息對關(guān)系抽取結(jié)果的影響程度。因此設(shè)計了表7 四組對比實驗來評估兩種方案優(yōu)劣和實體類型對關(guān)系抽取部分的影響。

    由于Multi-head 模型使用序列標注方式,無法對嵌套實體進行識別,故將TFRED 數(shù)據(jù)集篩選出不包含實體嵌套的句子進行對比實驗。表7 中對不同模型關(guān)系抽取過程中是否融合實體邊界信息(Span)和實體類型信息(Type)進行了對比實驗。從第一組實驗結(jié)果中可以看出,實體識別任務(wù)同時確定實體邊界和實體類型信息的F1 值比只確定邊界信息的F1 值降低了0.12,但是在關(guān)系抽取的過程中融合實體類型信息的F1值比不融合實體類型信息的F1值高了0.018。圖5記錄了表7中第一組實驗50 個epoch 實驗結(jié)果(Ner_f1 和Re_f1 分別代表實驗中未融合實體類型的實體識別F1值和關(guān)系抽取F1 值,Ner_t_f1 和Re_t_f1 分別代表實驗中融合實體類型的實體識別F1值和關(guān)系抽取F1值),Ner_t_f1在50個epoch 的測試集上的表現(xiàn)一直低于Ner_f1,而趨于穩(wěn)定的Re_t_f1 卻比Re_f1 平均高0.02 左右,因此可以得到以下三點結(jié)論:

    圖5 第一組對比實驗結(jié)果Fig.5 Results of first set of comparative experiment

    (1)在模型評估階段,實體識別任務(wù)在同時確定實體邊界和實體類型產(chǎn)生的誤差對關(guān)系抽取結(jié)果的不利影響遠小于將實體類型信息將其融合到關(guān)系抽取部分對關(guān)系抽取結(jié)果的有利影響,因此值得犧牲實體識別部分性能確定實體類型信息將其融合到關(guān)系抽取部分。

    (2)實體識別部分功能設(shè)計的兩種方案中,融合實體類型信息方案優(yōu)于另外一種。

    (3)Multi-head模型使用BiLSTM作為編碼器,在關(guān)系抽取部分融合實體類型信息比不融合實體類型信息F1值提升了約0.02。

    從表7中的第二組對比實驗的結(jié)果可以看到,在使用預(yù)訓練模型的情況下,實體識別任務(wù)同時確定實體邊界和實體類型信息的F1值比只確定邊界信息的F1值只降低了0.005,縮小了兩種識別方案的差距,但是在關(guān)系抽取的過程中融合實體類型信息的F1值比不融合實體類型信息的F1 值還是高了0.01 左右,同樣縮小了關(guān)系抽取結(jié)果的差距。結(jié)合圖6第二組對比實驗50個epoch在測試集上的表現(xiàn),依舊滿足第一組實驗的結(jié)論,實體類型信息對關(guān)系抽取的影響不可忽視,但是預(yù)訓練模型弱化了實體類型對關(guān)系抽取結(jié)果的影響,Re_t_f1 比Re_f1平均高0.01左右。

    圖6 第二組對比實驗結(jié)果Fig.6 Results of second comparative experiment

    表7 實體類型標簽對關(guān)系抽取影響評估結(jié)果Table 7 Evaluation results of impact of entity type labels on relation extraction

    第三組實驗是對融合實體邊界信息和實體類型信息Multi-head和BERT+Multi-head進行的消融實驗。從實驗結(jié)果來看,在關(guān)系抽取過程中不融合實體邊界和實體類型信息得到的實驗結(jié)果與只融合實體邊界信息得到的實驗結(jié)果相差不大。圖7和圖8分別是兩個模型在50個epoch的測試集上的表現(xiàn)(Re_t_f1表示融合了實體邊界信息和實體類型信息的關(guān)系抽取F1值,Re_u_f1表示未融合實體邊界信息和實體類型信息的關(guān)系抽取F1值),由圖7 圖8 可知Multi-head 模型Re_t_f1 比Re_u_f1平均高0.02左右,Bert+Multi-head模型Re_t_f1比Re_u_f1平均高0.01 左右,可以得到結(jié)論,實體類型對關(guān)系抽取F1 值的影響范圍大致在0.01~0.02。最后,設(shè)置第四組實驗,在BAMRel 模型上驗證該結(jié)論。從實驗結(jié)果可知,BAMRel模型融合實體邊界和實體類型信息的關(guān)系抽取F1 值比高0.008,對模型性能的提升接近這個范圍,該結(jié)論成立。

    圖7 Multi-head消融實驗Fig.7 Multi-head ablation experiment

    圖8 BERT Multi-head消融實驗Fig.8 BERT Multi-head ablation experiment

    綜上所述,在聯(lián)合抽取模型中,實體類型可作為關(guān)系抽取模型的重要特征輸入,對關(guān)系抽取模型F1 值的提升大致在0.01~0.02 的范圍內(nèi)。本文提出的BAMRel模型融合實體類型信息進行關(guān)系抽取是合理有效的。

    4 總結(jié)

    本文提出一種基于雙仿射注意力機制的實體關(guān)系聯(lián)合抽取模型BAMRel,模型在自行構(gòu)建的TFRED 數(shù)據(jù)集和公開的DuIE 數(shù)據(jù)集上都達到了最佳的實驗結(jié)果,證明了BAMRel模型可以有效解決實體嵌套和關(guān)系重疊的三元組抽取問題。同時實體抽取和關(guān)系抽取部分共用Biaffine 模型構(gòu)造分類矩陣,降低了聯(lián)合抽取模型的復雜度,使得模型具有良好的性能。

    在實驗過程中,BAMRel模型在訓練階段使用實體真實標簽,而在評估階段使用預(yù)測標簽,訓練階段過于依賴真實標簽而產(chǎn)生曝光偏差,會導致誤差傳播,如何解決曝光偏差問題是接下來值得研究的問題。另外,基于雙仿射注意力機制構(gòu)建的分類矩陣存在標簽不平衡問題,解決標簽不平衡問題也是接下來模型改進的方向。

    猜你喜歡
    三元組嵌套實體
    基于語義增強雙編碼器的方面情感三元組提取
    軟件工程(2024年12期)2024-12-28 00:00:00
    例析“立幾”與“解幾”的嵌套問題
    基于帶噪聲數(shù)據(jù)集的強魯棒性隱含三元組質(zhì)檢算法*
    基于嵌套Logit模型的競爭性選址問題研究
    前海自貿(mào)區(qū):金融服務(wù)實體
    中國外匯(2019年18期)2019-11-25 01:41:54
    關(guān)于余撓三元組的periodic-模
    實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
    哲學評論(2017年1期)2017-07-31 18:04:00
    兩會進行時:緊扣實體經(jīng)濟“釘釘子”
    振興實體經(jīng)濟地方如何“釘釘子”
    三元組輻射場的建模與仿真
    亚洲第一区二区三区不卡| 亚洲精品久久午夜乱码| 春色校园在线视频观看| 国产福利在线免费观看视频| 久久精品国产亚洲av天美| 国产精品 欧美亚洲| 男女免费视频国产| 超碰97精品在线观看| 成人手机av| 久久久久久久国产电影| 多毛熟女@视频| 国产午夜精品一二区理论片| 久久青草综合色| 精品一区在线观看国产| 97在线视频观看| 丰满迷人的少妇在线观看| 99国产精品免费福利视频| av电影中文网址| 99热网站在线观看| 日本黄色日本黄色录像| 欧美xxⅹ黑人| 久久久久久久久久人人人人人人| 午夜福利网站1000一区二区三区| 亚洲熟女精品中文字幕| 在线观看三级黄色| 人妻人人澡人人爽人人| 国产精品国产三级国产专区5o| 免费黄网站久久成人精品| 一级爰片在线观看| 大陆偷拍与自拍| 久久久久久久久久人人人人人人| 制服丝袜香蕉在线| 亚洲国产av影院在线观看| 国产亚洲最大av| 久久 成人 亚洲| 最近的中文字幕免费完整| 熟妇人妻不卡中文字幕| 在线天堂中文资源库| h视频一区二区三区| 亚洲经典国产精华液单| 精品国产乱码久久久久久小说| 黑人猛操日本美女一级片| 91精品伊人久久大香线蕉| 日韩一区二区三区影片| 亚洲精品久久成人aⅴ小说| 久久久久久久久久人人人人人人| 日韩不卡一区二区三区视频在线| 亚洲,一卡二卡三卡| 一级a爱视频在线免费观看| 精品亚洲成a人片在线观看| 五月开心婷婷网| 久久99精品国语久久久| 黄色怎么调成土黄色| 一区二区三区激情视频| 十八禁网站网址无遮挡| 久久久久精品久久久久真实原创| 99久久综合免费| 狠狠精品人妻久久久久久综合| 不卡视频在线观看欧美| 少妇人妻 视频| 啦啦啦视频在线资源免费观看| 成人二区视频| 久久久久久久久久久免费av| 国产麻豆69| 在线观看免费高清a一片| 女人被躁到高潮嗷嗷叫费观| 成人免费观看视频高清| 中国三级夫妇交换| av女优亚洲男人天堂| 精品国产一区二区三区四区第35| 午夜福利网站1000一区二区三区| 一级片'在线观看视频| 精品国产国语对白av| 国产一级毛片在线| 99re6热这里在线精品视频| 欧美精品人与动牲交sv欧美| 亚洲内射少妇av| 欧美人与性动交α欧美软件| 国产深夜福利视频在线观看| 大香蕉久久网| 久久精品久久久久久噜噜老黄| 亚洲精品国产色婷婷电影| 欧美人与性动交α欧美软件| 天天躁狠狠躁夜夜躁狠狠躁| 美女脱内裤让男人舔精品视频| 如日韩欧美国产精品一区二区三区| 亚洲内射少妇av| 免费在线观看视频国产中文字幕亚洲 | 校园人妻丝袜中文字幕| 天堂俺去俺来也www色官网| 精品视频人人做人人爽| 欧美日韩一区二区视频在线观看视频在线| 国产精品国产三级专区第一集| 精品久久蜜臀av无| 我要看黄色一级片免费的| 自线自在国产av| 国产探花极品一区二区| 一区在线观看完整版| 中文字幕最新亚洲高清| 一级a爱视频在线免费观看| 久久国产精品男人的天堂亚洲| 成人亚洲精品一区在线观看| 搡女人真爽免费视频火全软件| 黄色怎么调成土黄色| 亚洲五月色婷婷综合| 亚洲第一av免费看| 国产福利在线免费观看视频| 久久久久视频综合| 亚洲 欧美一区二区三区| 久久精品久久久久久久性| 在线观看一区二区三区激情| 纯流量卡能插随身wifi吗| 精品99又大又爽又粗少妇毛片| 婷婷色av中文字幕| 欧美成人午夜免费资源| 丝袜喷水一区| 热99久久久久精品小说推荐| 久热这里只有精品99| 亚洲第一青青草原| 成人免费观看视频高清| 大话2 男鬼变身卡| 亚洲av中文av极速乱| 99香蕉大伊视频| 美女国产视频在线观看| 日本91视频免费播放| 乱人伦中国视频| 国产午夜精品一二区理论片| 中文字幕人妻丝袜一区二区 | a级毛片在线看网站| 亚洲av福利一区| 免费日韩欧美在线观看| 久久久精品免费免费高清| 狠狠婷婷综合久久久久久88av| av片东京热男人的天堂| 久久人人爽av亚洲精品天堂| 国产欧美日韩综合在线一区二区| 欧美精品高潮呻吟av久久| 丝瓜视频免费看黄片| 女人高潮潮喷娇喘18禁视频| 亚洲三区欧美一区| 少妇熟女欧美另类| 香蕉精品网在线| 老女人水多毛片| 久久精品aⅴ一区二区三区四区 | 另类亚洲欧美激情| 丝袜喷水一区| 久久久精品免费免费高清| 亚洲情色 制服丝袜| 国产av国产精品国产| 久久精品国产亚洲av天美| 在线天堂最新版资源| 自拍欧美九色日韩亚洲蝌蚪91| 777久久人妻少妇嫩草av网站| 蜜桃在线观看..| 国产 一区精品| 嫩草影院入口| a级片在线免费高清观看视频| 婷婷色综合大香蕉| 美女国产高潮福利片在线看| 久久久久精品人妻al黑| xxx大片免费视频| 国产黄色视频一区二区在线观看| 大香蕉久久网| 男女国产视频网站| 乱人伦中国视频| 欧美精品一区二区大全| 啦啦啦视频在线资源免费观看| 亚洲欧美色中文字幕在线| 亚洲精品视频女| 国产成人av激情在线播放| 亚洲美女搞黄在线观看| 日韩av不卡免费在线播放| 国产av国产精品国产| 午夜影院在线不卡| 美女主播在线视频| 国产老妇伦熟女老妇高清| 亚洲成av片中文字幕在线观看 | 午夜老司机福利剧场| 在线观看一区二区三区激情| 日本欧美视频一区| 最近中文字幕高清免费大全6| 亚洲欧美一区二区三区久久| 久久精品国产亚洲av天美| 日韩在线高清观看一区二区三区| av.在线天堂| 最近最新中文字幕免费大全7| 卡戴珊不雅视频在线播放| 老汉色∧v一级毛片| kizo精华| 伊人亚洲综合成人网| 2018国产大陆天天弄谢| 免费在线观看视频国产中文字幕亚洲 | 91精品伊人久久大香线蕉| 18禁观看日本| 午夜福利,免费看| 色网站视频免费| 少妇被粗大猛烈的视频| 中国国产av一级| 在线亚洲精品国产二区图片欧美| 国产精品 国内视频| 久久韩国三级中文字幕| 1024香蕉在线观看| 成人国语在线视频| 国产一级毛片在线| 久久久亚洲精品成人影院| 日日爽夜夜爽网站| 少妇被粗大的猛进出69影院| 一级毛片 在线播放| 侵犯人妻中文字幕一二三四区| 五月开心婷婷网| 亚洲精品国产一区二区精华液| 久久久久久人人人人人| freevideosex欧美| 久久久久网色| 伦理电影大哥的女人| 97在线视频观看| 久久人人97超碰香蕉20202| 久久精品国产亚洲av高清一级| 在线观看美女被高潮喷水网站| 在线观看人妻少妇| 日本午夜av视频| 在现免费观看毛片| 九草在线视频观看| 久久午夜综合久久蜜桃| www.自偷自拍.com| 在线观看免费日韩欧美大片| 国产片特级美女逼逼视频| 国产精品二区激情视频| 2018国产大陆天天弄谢| 在线观看人妻少妇| 国产精品秋霞免费鲁丝片| 国产黄色视频一区二区在线观看| 亚洲第一区二区三区不卡| 综合色丁香网| 亚洲精华国产精华液的使用体验| 在线观看三级黄色| 91成人精品电影| 男人操女人黄网站| 少妇人妻精品综合一区二区| 成年美女黄网站色视频大全免费| 一二三四中文在线观看免费高清| 欧美老熟妇乱子伦牲交| 熟女少妇亚洲综合色aaa.| 久久久久久久国产电影| 成人黄色视频免费在线看| 中文字幕精品免费在线观看视频| 女人久久www免费人成看片| √禁漫天堂资源中文www| 男人舔女人的私密视频| 国产精品成人在线| 777久久人妻少妇嫩草av网站| 不卡av一区二区三区| 国产午夜精品一二区理论片| 欧美日韩视频精品一区| 国产综合精华液| 国产片特级美女逼逼视频| 涩涩av久久男人的天堂| 黄频高清免费视频| av又黄又爽大尺度在线免费看| 国产老妇伦熟女老妇高清| 赤兔流量卡办理| 欧美精品一区二区免费开放| 91久久精品国产一区二区三区| 一级黄片播放器| 亚洲,欧美,日韩| 午夜av观看不卡| 国精品久久久久久国模美| 精品亚洲乱码少妇综合久久| av.在线天堂| 成人影院久久| 久久久久久久国产电影| 肉色欧美久久久久久久蜜桃| 亚洲av福利一区| 丰满少妇做爰视频| 亚洲国产精品国产精品| av有码第一页| 久久精品国产自在天天线| 久久99热这里只频精品6学生| 国产欧美日韩一区二区三区在线| 人人妻人人澡人人爽人人夜夜| 日本vs欧美在线观看视频| 超碰成人久久| 国产欧美亚洲国产| 中国三级夫妇交换| 国产精品免费视频内射| 亚洲成av片中文字幕在线观看 | 亚洲 欧美一区二区三区| 免费黄频网站在线观看国产| 伊人亚洲综合成人网| 黄片播放在线免费| 久久人人97超碰香蕉20202| 亚洲欧美精品自产自拍| 制服人妻中文乱码| 伊人久久国产一区二区| 精品国产一区二区三区久久久樱花| 国产一区亚洲一区在线观看| 十八禁高潮呻吟视频| 亚洲天堂av无毛| 精品少妇一区二区三区视频日本电影 | 人妻一区二区av| 一边亲一边摸免费视频| 巨乳人妻的诱惑在线观看| 日韩精品有码人妻一区| 久久久久久久国产电影| 亚洲精品,欧美精品| 一本大道久久a久久精品| 国产成人精品在线电影| 一边亲一边摸免费视频| 欧美成人午夜精品| 日韩在线高清观看一区二区三区| 日韩精品有码人妻一区| 91精品伊人久久大香线蕉| 国产又爽黄色视频| 日韩熟女老妇一区二区性免费视频| 久久久久久伊人网av| 久久久久精品性色| 国产毛片在线视频| 国产极品粉嫩免费观看在线| 亚洲av免费高清在线观看| 欧美老熟妇乱子伦牲交| 国产精品秋霞免费鲁丝片| 下体分泌物呈黄色| 亚洲,欧美,日韩| av免费在线看不卡| 狂野欧美激情性bbbbbb| 黄色配什么色好看| 777米奇影视久久| 亚洲欧美日韩另类电影网站| www.av在线官网国产| 2018国产大陆天天弄谢| 午夜精品国产一区二区电影| 免费女性裸体啪啪无遮挡网站| 国产成人av激情在线播放| 少妇被粗大的猛进出69影院| 欧美少妇被猛烈插入视频| 美女中出高潮动态图| 99热网站在线观看| 亚洲图色成人| 看非洲黑人一级黄片| 侵犯人妻中文字幕一二三四区| 交换朋友夫妻互换小说| a 毛片基地| 纵有疾风起免费观看全集完整版| 黄色视频在线播放观看不卡| 国产成人精品无人区| 一本久久精品| 在线看a的网站| 又黄又粗又硬又大视频| 黄频高清免费视频| 亚洲国产色片| 欧美精品人与动牲交sv欧美| 在线免费观看不下载黄p国产| 天天躁夜夜躁狠狠久久av| 久久久久网色| 日韩av在线免费看完整版不卡| 欧美精品亚洲一区二区| 亚洲激情五月婷婷啪啪| 97精品久久久久久久久久精品| 久久免费观看电影| 亚洲欧美日韩另类电影网站| 18在线观看网站| 国产精品嫩草影院av在线观看| 亚洲久久久国产精品| 国产一区二区在线观看av| 天天躁日日躁夜夜躁夜夜| 久久精品aⅴ一区二区三区四区 | 又粗又硬又长又爽又黄的视频| 春色校园在线视频观看| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 久久影院123| 亚洲少妇的诱惑av| 汤姆久久久久久久影院中文字幕| av国产久精品久网站免费入址| av视频免费观看在线观看| 美女国产视频在线观看| 另类精品久久| 欧美xxⅹ黑人| 美女福利国产在线| 宅男免费午夜| 日韩三级伦理在线观看| 国产精品久久久久久精品古装| 寂寞人妻少妇视频99o| 久久精品久久精品一区二区三区| 高清视频免费观看一区二区| 精品少妇久久久久久888优播| 不卡视频在线观看欧美| 99久久综合免费| 国产高清不卡午夜福利| 在现免费观看毛片| 亚洲一区二区三区欧美精品| 超碰97精品在线观看| 国产熟女午夜一区二区三区| 老熟女久久久| xxx大片免费视频| 日韩电影二区| 伦理电影免费视频| 伦精品一区二区三区| 免费观看性生交大片5| 国产一区二区三区综合在线观看| 少妇猛男粗大的猛烈进出视频| 国产一区二区激情短视频 | 交换朋友夫妻互换小说| 人妻系列 视频| 免费人妻精品一区二区三区视频| 蜜桃国产av成人99| 菩萨蛮人人尽说江南好唐韦庄| 亚洲国产精品国产精品| 自拍欧美九色日韩亚洲蝌蚪91| 在线观看免费视频网站a站| 精品一区在线观看国产| 少妇人妻 视频| 欧美成人午夜精品| 中文字幕人妻熟女乱码| 久久精品国产鲁丝片午夜精品| av片东京热男人的天堂| 成年动漫av网址| 国产精品欧美亚洲77777| 宅男免费午夜| 啦啦啦视频在线资源免费观看| 欧美最新免费一区二区三区| 老司机影院成人| 天天躁夜夜躁狠狠久久av| 麻豆乱淫一区二区| 26uuu在线亚洲综合色| 日韩制服丝袜自拍偷拍| 亚洲一级一片aⅴ在线观看| 精品一区二区三卡| 91久久精品国产一区二区三区| 国产不卡av网站在线观看| 成人漫画全彩无遮挡| 久久精品国产亚洲av涩爱| 午夜福利视频精品| 中文字幕人妻丝袜制服| 97精品久久久久久久久久精品| 成人手机av| 久久久久久人妻| 国产成人91sexporn| 国产免费又黄又爽又色| 国产亚洲最大av| 精品人妻熟女毛片av久久网站| 日日摸夜夜添夜夜爱| 老司机影院毛片| 中文字幕精品免费在线观看视频| 亚洲精品视频女| 欧美亚洲日本最大视频资源| 亚洲国产av新网站| 免费少妇av软件| 国产人伦9x9x在线观看 | 性色avwww在线观看| 午夜福利在线观看免费完整高清在| 曰老女人黄片| 黄片无遮挡物在线观看| 老熟女久久久| 麻豆av在线久日| 国产精品99久久99久久久不卡 | 日本爱情动作片www.在线观看| 伦理电影大哥的女人| 最近手机中文字幕大全| 这个男人来自地球电影免费观看 | 女人久久www免费人成看片| 亚洲综合精品二区| 日韩人妻精品一区2区三区| 久久精品久久久久久久性| 国产国语露脸激情在线看| 国产野战对白在线观看| 国产片内射在线| www.av在线官网国产| 一本大道久久a久久精品| 91午夜精品亚洲一区二区三区| 亚洲精品在线美女| 国产麻豆69| 国产淫语在线视频| 久久久久久久久免费视频了| 国产av精品麻豆| 黄色视频在线播放观看不卡| 观看av在线不卡| 免费黄频网站在线观看国产| 国产视频首页在线观看| 久久久久久久久久久免费av| 亚洲一区中文字幕在线| 男人操女人黄网站| 久久久久久久亚洲中文字幕| 亚洲情色 制服丝袜| 夫妻性生交免费视频一级片| 国产精品久久久久久精品电影小说| 成人手机av| 精品人妻一区二区三区麻豆| 激情五月婷婷亚洲| 黄色一级大片看看| 亚洲综合精品二区| 汤姆久久久久久久影院中文字幕| av线在线观看网站| 黑人猛操日本美女一级片| 国产欧美亚洲国产| 在线 av 中文字幕| 成人手机av| 涩涩av久久男人的天堂| 国产高清国产精品国产三级| 夫妻性生交免费视频一级片| 少妇 在线观看| 日韩中字成人| 国产日韩欧美在线精品| 成人漫画全彩无遮挡| 亚洲成av片中文字幕在线观看 | 99九九在线精品视频| 男女午夜视频在线观看| 十分钟在线观看高清视频www| 在线观看一区二区三区激情| 国产男人的电影天堂91| 亚洲欧美色中文字幕在线| 日韩三级伦理在线观看| 巨乳人妻的诱惑在线观看| www.精华液| 国产又色又爽无遮挡免| 天美传媒精品一区二区| 国产成人精品福利久久| 王馨瑶露胸无遮挡在线观看| 人体艺术视频欧美日本| 日本欧美国产在线视频| 男女下面插进去视频免费观看| 夜夜骑夜夜射夜夜干| 久久精品国产亚洲av高清一级| 热99国产精品久久久久久7| av.在线天堂| 免费日韩欧美在线观看| 满18在线观看网站| 丝袜脚勾引网站| 精品人妻偷拍中文字幕| 狂野欧美激情性bbbbbb| 超色免费av| 国产成人欧美| 免费在线观看黄色视频的| 韩国精品一区二区三区| 亚洲伊人久久精品综合| 丁香六月天网| 亚洲精品乱久久久久久| 男人添女人高潮全过程视频| 男女边吃奶边做爰视频| 日韩在线高清观看一区二区三区| 久久热在线av| 国产欧美亚洲国产| 精品卡一卡二卡四卡免费| 精品国产乱码久久久久久男人| 2021少妇久久久久久久久久久| 男女下面插进去视频免费观看| av女优亚洲男人天堂| 亚洲一区二区三区欧美精品| 热re99久久精品国产66热6| 免费观看a级毛片全部| 自线自在国产av| 久久久精品94久久精品| 大陆偷拍与自拍| 丰满饥渴人妻一区二区三| 可以免费在线观看a视频的电影网站 | 亚洲三级黄色毛片| 少妇猛男粗大的猛烈进出视频| a级毛片在线看网站| 亚洲伊人色综图| 亚洲精品国产色婷婷电影| 叶爱在线成人免费视频播放| 国产精品一二三区在线看| 日韩中文字幕视频在线看片| 亚洲久久久国产精品| www日本在线高清视频| 26uuu在线亚洲综合色| 赤兔流量卡办理| 一区二区三区乱码不卡18| 一区二区三区精品91| 国产日韩欧美在线精品| 黄色毛片三级朝国网站| 亚洲av国产av综合av卡| av在线app专区| 色视频在线一区二区三区| 国产女主播在线喷水免费视频网站| 免费黄网站久久成人精品| 中文字幕最新亚洲高清| 免费观看在线日韩| 亚洲精品国产av蜜桃| 国产精品三级大全| 久久精品国产亚洲av涩爱| 精品国产国语对白av| 中文天堂在线官网| 十八禁高潮呻吟视频| 久久久久久久久免费视频了| 亚洲人成77777在线视频| 亚洲,一卡二卡三卡| 一级片免费观看大全| videos熟女内射| 我的亚洲天堂| 天天躁夜夜躁狠狠久久av| 丁香六月天网| 久久97久久精品| 婷婷色麻豆天堂久久| 国产野战对白在线观看| 亚洲 欧美一区二区三区| 1024视频免费在线观看| 国产精品麻豆人妻色哟哟久久| 高清不卡的av网站| 国产极品天堂在线| 国产一区有黄有色的免费视频| 中文字幕av电影在线播放| 麻豆av在线久日| 一级爰片在线观看| 国产成人a∨麻豆精品| 街头女战士在线观看网站| 日韩视频在线欧美| 王馨瑶露胸无遮挡在线观看| 欧美日韩视频精品一区| 国产午夜精品一二区理论片| 超碰成人久久| 精品一区二区三区四区五区乱码 | 秋霞在线观看毛片| 亚洲成国产人片在线观看| 女人久久www免费人成看片| 亚洲三区欧美一区|