• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    注入圖情領(lǐng)域知識(shí)的命名實(shí)體識(shí)別模型*

    2023-08-08 09:32:04王志紅曹樹(shù)金
    圖書(shū)館論壇 2023年7期
    關(guān)鍵詞:圖情語(yǔ)料命名

    王 娟,王志紅,曹樹(shù)金

    0 引言

    人工智能正逐漸走向數(shù)據(jù)和知識(shí)雙驅(qū)動(dòng)的認(rèn)知智能[1]。命名實(shí)體作為基本信息元素,是正確理解文本的基礎(chǔ),也是實(shí)現(xiàn)認(rèn)知智能的知識(shí)引擎[2]。此外,隨著通用領(lǐng)域和特定領(lǐng)域網(wǎng)絡(luò)信息資源的豐富,從海量、非結(jié)構(gòu)化的文本中識(shí)別出相應(yīng)的命名實(shí)體,對(duì)網(wǎng)絡(luò)信息資源的序化和有效利用具有重要價(jià)值。相比于通用命名實(shí)體,領(lǐng)域命名實(shí)體的數(shù)據(jù)來(lái)源更偏向于垂直領(lǐng)域,語(yǔ)料的構(gòu)建也更加嚴(yán)密,這為實(shí)體識(shí)別帶來(lái)兩個(gè)挑戰(zhàn)。首先,領(lǐng)域命名實(shí)體的名稱、指代內(nèi)容及對(duì)應(yīng)的類別等會(huì)隨著技術(shù)的快速更新而不斷變化,很難快速有效地根據(jù)特定領(lǐng)域或任務(wù)場(chǎng)景設(shè)計(jì)相應(yīng)特征;其次,面向垂直領(lǐng)域的實(shí)體識(shí)別需要具有一定領(lǐng)域知識(shí)的人員進(jìn)行語(yǔ)料標(biāo)注,增加了語(yǔ)料構(gòu)建的難度和成本。圖情領(lǐng)域具有高度跨學(xué)科性[3],面向圖情領(lǐng)域的實(shí)體識(shí)別具有較好的代表性以及較大的難度。因此,為滿足在領(lǐng)域數(shù)據(jù)量小、人工標(biāo)注成本高的情況下提升實(shí)體識(shí)別效果的要求,本文提出基于ERNIE(Enhanced Representation through Knowledge Integration,知識(shí)增強(qiáng)的語(yǔ)義表示)[4]的LISERNIE模型,以及面向命名實(shí)體識(shí)別的LISERNIE+BiGRU(Bi-directional Gated Recurrent Unit,雙向門(mén)控循環(huán)單元)+CRF(Conditional Random Fields,條件隨機(jī)場(chǎng))模型。提出的LISERNIE 模型通過(guò)在ERNIE預(yù)訓(xùn)練階段注入圖情領(lǐng)域知識(shí),增強(qiáng)模型對(duì)領(lǐng)域文本的語(yǔ)義理解能力,從而解決通用預(yù)訓(xùn)練模型因缺乏下游特定領(lǐng)域知識(shí)而效果不佳的問(wèn)題[5]。在命名實(shí)體識(shí)別和開(kāi)放域關(guān)系抽取對(duì)比實(shí)驗(yàn)中,本文提出的LISERNIE+BiGRU+CRF模型的實(shí)驗(yàn)性能均優(yōu)于對(duì)比模型,驗(yàn)證了該模型的有效性和可行性,也為下游任務(wù)如知識(shí)圖譜構(gòu)建、語(yǔ)義檢索、問(wèn)答系統(tǒng)等提供可借鑒的思路。

    1 相關(guān)研究

    不同研究對(duì)實(shí)體的定義不同,主要體現(xiàn)在實(shí)體類型的粒度上,如醫(yī)療領(lǐng)域?qū)膊?、藥品、治療方法等的識(shí)別[6-7],軍事領(lǐng)域?qū)娐氒娿?、軍事裝備、軍用物資等的識(shí)別[8-9]。在圖情領(lǐng)域,現(xiàn)有研究[10-13]主要針對(duì)可公開(kāi)獲取的文摘或論文全文數(shù)據(jù)集上的情報(bào)分析方法和情報(bào)學(xué)研究方法等單一類別實(shí)體的識(shí)別;也有文獻(xiàn)[14-15]面向中文古籍構(gòu)建歷史事件實(shí)體的識(shí)別任務(wù)。實(shí)際上,圖情領(lǐng)域?qū)嶓w復(fù)雜多樣,圖書(shū)館、情報(bào)機(jī)構(gòu)配置或使用的設(shè)備、不同角色的人才組成、各種會(huì)議等都是很有價(jià)值的實(shí)體類別。因此,根據(jù)圖情領(lǐng)域的特點(diǎn),合理劃分命名實(shí)體的類別,并基于開(kāi)源數(shù)據(jù)構(gòu)建標(biāo)注語(yǔ)料,是實(shí)現(xiàn)圖情領(lǐng)域命名實(shí)體識(shí)別的關(guān)鍵步驟,也為進(jìn)一步構(gòu)建知識(shí)圖譜等提供數(shù)據(jù)支撐。

    由于中文命名實(shí)體結(jié)構(gòu)復(fù)雜、形式多樣,有效的實(shí)體識(shí)別方法仍然非常重要且具有挑戰(zhàn)性。隨著深度學(xué)習(xí)的興起,無(wú)需復(fù)雜特征工程的深度學(xué)習(xí)方法成為命名實(shí)體識(shí)別研究的主流。Huang等[16]提出將人工設(shè)計(jì)的拼寫(xiě)特征和BiLSTM(Bidirectional Long Short-Term Memory,雙向長(zhǎng)短期記憶網(wǎng)絡(luò))與CRF 融合起來(lái)進(jìn)行實(shí)體識(shí)別;李麗雙等[17]利用CNN(Convolutional Neural Network,卷積神經(jīng)網(wǎng)絡(luò))訓(xùn)練得到字符級(jí)向量,并輸入到BiLSTM+CRF 模型中進(jìn)行生物醫(yī)學(xué)命名實(shí)體識(shí)別;楊培等[18]結(jié)合注意力機(jī)制、BiLSTM 和CRF 來(lái)識(shí)別化學(xué)藥物命名實(shí)體。然而,這些方法主要采用傳統(tǒng)的Word2Vec[19-20]靜態(tài)詞向量來(lái)表示模型,對(duì)不同語(yǔ)境的適應(yīng)能力較差。2018 年Google 推出BERT 模型(Bidirectional Encoder Representations from Transformer,基于Transformer的雙向編碼器表示),隨后出現(xiàn)越來(lái)越多的動(dòng)態(tài)預(yù)訓(xùn)練語(yǔ)言模型(Pretrained Language Models,PLM),并逐漸得到廣泛應(yīng)用。這種動(dòng)態(tài)PLM利用大規(guī)模無(wú)標(biāo)注的文本語(yǔ)料進(jìn)行預(yù)訓(xùn)練以獲得通用特征表示,再通過(guò)微調(diào)將學(xué)習(xí)到的語(yǔ)義關(guān)系傳遞到下游任務(wù)中。但由于學(xué)習(xí)到的通用特征表示太泛化,導(dǎo)致模型往往在垂直領(lǐng)域表現(xiàn)不佳,尤其當(dāng)訓(xùn)練的源任務(wù)領(lǐng)域文本和目標(biāo)任務(wù)領(lǐng)域文本所對(duì)應(yīng)的領(lǐng)域不同時(shí),模型效果下降非常明顯[21]。為增強(qiáng)PLM在垂直領(lǐng)域的應(yīng)用效果,研究人員開(kāi)始對(duì)如何使用領(lǐng)域知識(shí)來(lái)增強(qiáng)PLM進(jìn)行探索[22-25]。結(jié)果表明,這種在預(yù)訓(xùn)練階段注入知識(shí)來(lái)提升PLM性能的方法具有有效性。

    目前圖情領(lǐng)域語(yǔ)料還十分稀少,因此如何為PLM注入領(lǐng)域知識(shí),增強(qiáng)模型在垂直領(lǐng)域的應(yīng)用效果是本文的研究重點(diǎn)。本文將根據(jù)圖情領(lǐng)域特征,對(duì)其實(shí)體分類、識(shí)別和應(yīng)用展開(kāi)一些基礎(chǔ)性研究,旨在通過(guò)同時(shí)利用知識(shí)、數(shù)據(jù)、算法和算力4個(gè)要素來(lái)構(gòu)造更強(qiáng)大的人工智能[26]。

    2 圖情領(lǐng)域?qū)嶓w分類

    不同領(lǐng)域文本具有不同的文本特征。為比較圖情領(lǐng)域文本和其他領(lǐng)域文本的差異性,本文選取3個(gè)特定領(lǐng)域語(yǔ)料庫(kù),分別是醫(yī)療、司法和金融領(lǐng)域的預(yù)訓(xùn)練數(shù)據(jù)集,如表1所示。圖情領(lǐng)域數(shù)據(jù)集是通過(guò)自主采集圖情領(lǐng)域相關(guān)的百科、新聞網(wǎng)、高校網(wǎng)、協(xié)會(huì)網(wǎng)以及博客整理得到的,其他3個(gè)領(lǐng)域的數(shù)據(jù)集均為網(wǎng)上公開(kāi)的實(shí)體識(shí)別數(shù)據(jù)集。

    表1 4個(gè)特定領(lǐng)域文本數(shù)據(jù)集說(shuō)明

    本文對(duì)這4個(gè)領(lǐng)域做了詞匯重疊度分析[21]:隨機(jī)抽取4個(gè)領(lǐng)域各1,000條數(shù)據(jù),使用Python的jieba庫(kù)對(duì)數(shù)據(jù)進(jìn)行分詞處理,并過(guò)濾掉停用詞,對(duì)各領(lǐng)域剩下的詞統(tǒng)計(jì)前500個(gè)高頻詞,然后進(jìn)行重合比對(duì)分析。從圖1可看出,圖情領(lǐng)域文本和其他3個(gè)領(lǐng)域的文本重合度不高,與醫(yī)療文本的領(lǐng)域相似度最低,只有0.033,與金融領(lǐng)域相似度稍高,達(dá)到0.26,這主要是因?yàn)閳D情和金融領(lǐng)域文本中都有一些比較通用的詞匯,如“公司”“傳統(tǒng)”“共同”“保障”。不同領(lǐng)域詞分布的不同會(huì)導(dǎo)致語(yǔ)言模型在相應(yīng)領(lǐng)域語(yǔ)料中獲取到的語(yǔ)言表征不同,因此,針對(duì)不同領(lǐng)域特點(diǎn)需要設(shè)計(jì)不同的命名實(shí)體分類和識(shí)別方法。

    圖1 不同領(lǐng)域間的詞匯重疊度

    領(lǐng)域命名實(shí)體的分類一般是利用標(biāo)注數(shù)據(jù)集中實(shí)體內(nèi)部的結(jié)構(gòu)特征[27]或者知識(shí)庫(kù)定義來(lái)描述類別[28-29]。對(duì)第一種方法,有學(xué)者[30]認(rèn)為實(shí)體的類別往往會(huì)以短詞的方式直接出現(xiàn)在實(shí)體的末尾,但本文通過(guò)統(tǒng)計(jì)清華大學(xué)推出的通用知識(shí)圖譜XLORE[31]中出現(xiàn)的圖情領(lǐng)域相關(guān)實(shí)體,發(fā)現(xiàn)這種依靠實(shí)體結(jié)構(gòu)特征來(lái)獲取實(shí)體類別的方法并不可行。如表2所示,在1,602個(gè)實(shí)體中,只有17.8%的實(shí)體內(nèi)部包含類別指示詞。據(jù)此,本文采用第二種方法,即基于知識(shí)圖譜定義的類別描述方法。具體而言,利用XLORE中高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)來(lái)擴(kuò)展圖情領(lǐng)域的命名實(shí)體類別。通過(guò)解析XLORE發(fā)現(xiàn),其層級(jí)結(jié)構(gòu)關(guān)系中主要包含實(shí)體和類目?jī)深惞?jié)點(diǎn),以及類目之間的上下位關(guān)系subclass-of 和實(shí)體、類目之間的從屬關(guān)系instance-of。由于一個(gè)節(jié)點(diǎn)可以包含多個(gè)上位節(jié)點(diǎn)和下位節(jié)點(diǎn),使得這個(gè)類別層級(jí)結(jié)構(gòu)不是嚴(yán)格意義的樹(shù)形結(jié)構(gòu)。為了把XLORE中圖情領(lǐng)域相關(guān)的實(shí)體節(jié)點(diǎn)及其對(duì)應(yīng)的類目節(jié)點(diǎn)一一聯(lián)系起來(lái),本文借鑒廣度優(yōu)先遍歷算法(Breadth First Search,BFS)的思想,指定類目節(jié)點(diǎn)“圖書(shū)資訊科學(xué)”作為類別路徑[32]的起始位置,并標(biāo)記為已訪問(wèn);然后從該節(jié)點(diǎn)出發(fā),沿著subclass-of和instance-of 這兩類關(guān)系,訪問(wèn)下位節(jié)點(diǎn)c1,c2,……和實(shí)體節(jié)點(diǎn)e1,e2,……,并均標(biāo)記為已訪問(wèn);再按c1,c2,……的次序,訪問(wèn)這些類目節(jié)點(diǎn)的所有未被訪問(wèn)的下位節(jié)點(diǎn)和實(shí)例節(jié)點(diǎn);如此循環(huán),直到所有與(其他)節(jié)點(diǎn)有路徑相通的節(jié)點(diǎn)均被訪問(wèn)為止。至此,一個(gè)沒(méi)有多余路徑和回路的類別層級(jí)結(jié)構(gòu)形成。該層級(jí)結(jié)構(gòu)共10層,包含75 個(gè)類目節(jié)點(diǎn)和1,584 個(gè)實(shí)體節(jié)點(diǎn),部分示例見(jiàn)圖2[1]。

    圖2 類別路徑示例(部分)

    表2 樣本數(shù)據(jù)中類別指示詞的統(tǒng)計(jì)結(jié)果

    在類別路徑構(gòu)建過(guò)程中,筆者發(fā)現(xiàn)部分實(shí)體和其上位詞的語(yǔ)義關(guān)系較弱。比如,實(shí)體“圖書(shū)館員”“儲(chǔ)存裝置”“博物館資訊交換聯(lián)盟”的上位詞是“圖書(shū)資訊科學(xué)”,“國(guó)際博物館日”的上位詞是“博物館學(xué)”,這些實(shí)體和其上位詞之間都沒(méi)有遵從嚴(yán)格的上下位語(yǔ)義關(guān)系,無(wú)法從中獲得實(shí)體所屬類別的有效信息。為了彌補(bǔ)在構(gòu)建嚴(yán)格意義的類別層級(jí)結(jié)構(gòu)時(shí)可能誤刪掉的與實(shí)體節(jié)點(diǎn)更相關(guān)的類目節(jié)點(diǎn),對(duì)類別路徑上的1,584個(gè)實(shí)體找出其在XLORE中所有的直接上位詞,共計(jì)3,005個(gè)。部分實(shí)體及其所有直接上位詞如表3所示。分析表3發(fā)現(xiàn),相對(duì)于類目“圖書(shū)資訊科學(xué)”和“博物館學(xué)”,類目“職業(yè)”與實(shí)體“圖書(shū)館員”、類目“國(guó)際紀(jì)念活動(dòng)”與實(shí)體“國(guó)際博物館日”更具有語(yǔ)義相關(guān)性。這樣,通過(guò)對(duì)3,005個(gè)類目進(jìn)行人工修改無(wú)效類目、合并相似類目,最終形成9大類圖情領(lǐng)域命名實(shí)體,分別是:人(Person,Per)、組織(Organization,Org)、圖書(shū)館(Library,Lib)、技術(shù)(Technology,Tec)、設(shè)備(Device,Dev)、文檔(Document,Doc)、職位(Job)、事件(Event,Eve)以及地點(diǎn)(Location,Loc)。這些實(shí)體類別在本文LISNER數(shù)據(jù)集的標(biāo)注如圖3所示。

    圖3 圖情領(lǐng)域命名實(shí)體類別示例

    表3 實(shí)體節(jié)點(diǎn)及其直接上位詞(部分)

    3 基于LISERNIE的命名實(shí)體識(shí)別模型

    動(dòng)態(tài)PLM一般被劃分為兩階段:第一階段的預(yù)訓(xùn)練過(guò)程主要包含遮蔽語(yǔ)言建模(Masked Language Modeling,MLM)和下一句預(yù)測(cè)(Next Sentence Prediction,NSP)兩個(gè)基本任務(wù);第二階段使用微調(diào)處理下游任務(wù)。ERNIE預(yù)訓(xùn)練的語(yǔ)料集主要來(lái)自中文百科類網(wǎng)站,這種基于通用語(yǔ)料上的預(yù)訓(xùn)練并不能很好地適配特定領(lǐng)域的NLP任務(wù)。為此,本文提出基于LISERNIE的命名實(shí)體識(shí)別模型,通過(guò)在ERNIE預(yù)訓(xùn)練階段注入圖情領(lǐng)域知識(shí),來(lái)提升ERNIE對(duì)圖情領(lǐng)域文本的語(yǔ)義理解能力。

    3.1 LISERNIE預(yù)訓(xùn)練模型

    總結(jié)已有模型在知識(shí)注入時(shí)所用策略,發(fā)現(xiàn)大部分模型或多或少修改了傳統(tǒng)PLM 的結(jié)構(gòu)。例如,K-BERT[22]在BERT 嵌入層增加可視層;ERNIE-THU[26]使用K-Encoder 模塊將字嵌入和來(lái)自知識(shí)圖譜的實(shí)體嵌入進(jìn)行融合。與上述模型不同,本文提出的LISERNIE模型不需要改變ERNIE原有結(jié)構(gòu),僅在預(yù)訓(xùn)練和微調(diào)之間引入一個(gè)中間階段,以便使用領(lǐng)域知識(shí)對(duì)ERNIE進(jìn)行繼續(xù)預(yù)訓(xùn)練。如圖4所示,PLM“預(yù)訓(xùn)練+微調(diào)”兩階段被調(diào)整為“基于通用語(yǔ)料的預(yù)訓(xùn)練+基于圖情領(lǐng)域知識(shí)的預(yù)訓(xùn)練+在命名實(shí)體識(shí)別任務(wù)上的微調(diào)”三階段。第一階段使用大量無(wú)標(biāo)注的通用文本語(yǔ)料進(jìn)行預(yù)訓(xùn)練,訓(xùn)練任務(wù)為MLM和NSP。第二階段直接加載第一階段預(yù)訓(xùn)練好的模型,基于圖情領(lǐng)域知識(shí)進(jìn)行無(wú)監(jiān)督訓(xùn)練,訓(xùn)練任務(wù)仍為MLM和NSP。第三階段利用自建的小規(guī)模標(biāo)注領(lǐng)域文本集,針對(duì)命名實(shí)體識(shí)別任務(wù)進(jìn)行微調(diào)。兩階段流程被調(diào)整為三階段流程,需要消耗一定的預(yù)訓(xùn)練資源,但獲得的知識(shí)是全局性的[33],能讓預(yù)訓(xùn)練模型更好地應(yīng)用于語(yǔ)義理解任務(wù)。

    圖4 基于LISERNIE的命名實(shí)體識(shí)別模型

    預(yù)訓(xùn)練模型主要從非結(jié)構(gòu)化的文本信息中獲取知識(shí),然而目前主流的知識(shí)注入方法是將知識(shí)圖譜信息注入PLM中。相對(duì)于非結(jié)構(gòu)化的文本信息,形如三元組或有向圖的知識(shí)圖譜所蘊(yùn)含的是結(jié)構(gòu)化的信息,需要對(duì)其進(jìn)行轉(zhuǎn)換以融入預(yù)訓(xùn)練模型中。如果無(wú)法進(jìn)行良好的融合,所融入的知識(shí)圖譜信息不僅不會(huì)提升性能,反而會(huì)降低預(yù)訓(xùn)練模型的效果?;诖?,本文選擇從CNKI下載圖情相關(guān)的期刊論文作為第二階段使用的圖情領(lǐng)域知識(shí)來(lái)源。學(xué)術(shù)期刊是科學(xué)知識(shí)的主要載體之一,蘊(yùn)含著大量專業(yè)知識(shí)且比較新穎,將特定領(lǐng)域文獻(xiàn)作為語(yǔ)料引入到預(yù)訓(xùn)練過(guò)程中也是最近的一個(gè)研究方向。SCIBERT的預(yù)訓(xùn)練語(yǔ)料來(lái)自Semantic Scholar上的110萬(wàn)篇文章[34],BioBERT則在PubMed摘要和PubMed Central全文文章上進(jìn)行預(yù)訓(xùn)練[5]。因此,本文使用易獲取的圖情相關(guān)文獻(xiàn)來(lái)進(jìn)行后續(xù)預(yù)訓(xùn)練。首先,在CNKI中檢索2007-2021年與“圖書(shū)情報(bào)”主題相關(guān)的中文期刊論文,并對(duì)結(jié)果中含有“HTML閱讀”的7,329篇論文的文本內(nèi)容進(jìn)行采集。然后,將作者、摘要、關(guān)鍵詞、參考文獻(xiàn)等信息剔除,只保留題名和全文文本內(nèi)容??紤]到訓(xùn)練代價(jià)大,本文僅隨機(jī)選取1,000篇進(jìn)行分句處理,共切分出114,513個(gè)句子組成二次預(yù)訓(xùn)練的數(shù)據(jù)集。由于注入的是與ERNIE訓(xùn)練數(shù)據(jù)形式相同的同構(gòu)知識(shí),不需要考慮外部知識(shí)與原有的非結(jié)構(gòu)化文本信息融合的問(wèn)題,使用起來(lái)比較便捷。

    3.2 面向命名實(shí)體識(shí)別任務(wù)的三層模型

    本文將實(shí)體識(shí)別作為一個(gè)序列標(biāo)注任務(wù),模型輸入字序列X={x1,x2…xn},其中n代表句子中包含的字?jǐn)?shù),xn表示第n個(gè)字,輸出為對(duì)應(yīng)的實(shí)體標(biāo)簽序列Y={y1,y2…yn}。整個(gè)命名實(shí)體識(shí)別模型由輸入表示層、上下文編碼層和輸出解碼層3 個(gè)模塊組成。字序列的輸入向量如圖5 所示,由字嵌入、句嵌入和位置嵌入3部分求和而成。

    圖5 模型輸入示例

    將相加后得到的嵌入表示E={e1,e2…en}輸入到LISERNIE層。LISERNIE層中最重要的結(jié)構(gòu)單元就是Transformer(Trm)編碼器。通過(guò)Trm編碼器計(jì)算得到的字的表征,既蘊(yùn)含字本身的含義,也蘊(yùn)含該字與其他字的關(guān)系,更具全局表達(dá)能力。為了進(jìn)一步提取文本的語(yǔ)義特征,可以在LISERNIE 層后接入RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))或者LSTM(Long Short-Term Memory,長(zhǎng)短期記憶網(wǎng)絡(luò))、GRU(Gated Recurrent Unit,門(mén)控循環(huán)單元)等RNN改進(jìn)模型。與LSTM相比,GRU具有更低的模型復(fù)雜度和更高的訓(xùn)練效率。因此,本文采用由前向和后向GRU組合得到的BiGRU獲取范圍更廣的上下文依賴特征。

    對(duì)于序列標(biāo)注問(wèn)題,需要在獲取文本特征后預(yù)測(cè)當(dāng)前輸入序列的標(biāo)簽。雖然BiGRU層也能預(yù)測(cè)當(dāng)前序列的標(biāo)簽,但它只考慮字詞自身特征,忽略了標(biāo)簽之間的約束關(guān)系。因此,本文在BiGRU的輸出后面接入CRF層,以有效約束預(yù)測(cè)標(biāo)簽之間的依賴關(guān)系,對(duì)標(biāo)簽序列進(jìn)行建模,從而獲取全局最優(yōu)序列。

    4 實(shí)驗(yàn)和結(jié)果分析

    4.1 小規(guī)模標(biāo)注數(shù)據(jù)集

    本文標(biāo)注數(shù)據(jù)來(lái)自自建的LISNER數(shù)據(jù)集中的228篇文檔,共7,537個(gè)句子。采用半自動(dòng)化標(biāo)注方法,首先通過(guò)文本標(biāo)注工具BRAT進(jìn)行標(biāo)注。由于本文采用BIO標(biāo)記法,對(duì)于每個(gè)實(shí)體,首個(gè)字標(biāo)記為“B-實(shí)體類別”,中間字或結(jié)尾字標(biāo)記為“I-實(shí)體類別”,其他非實(shí)體標(biāo)記為“O”,所以預(yù)處理標(biāo)注后的數(shù)據(jù)就被分成9 類實(shí)體19 種標(biāo)簽。然后,通過(guò)人工審查并修正標(biāo)注結(jié)果,生成實(shí)驗(yàn)用的小規(guī)模標(biāo)注數(shù)據(jù)集,部分?jǐn)?shù)據(jù)展示見(jiàn)表4。將數(shù)據(jù)集按“6∶2∶2”拆分成訓(xùn)練集、測(cè)試集和驗(yàn)證集,這些實(shí)體在評(píng)測(cè)數(shù)據(jù)上的分布見(jiàn)表5。

    表4 圖情領(lǐng)域的小規(guī)模標(biāo)注數(shù)據(jù)集

    表5 實(shí)體在評(píng)測(cè)數(shù)據(jù)中的分布

    4.2 模型搭建和參數(shù)設(shè)置

    實(shí)驗(yàn)采用Tesla V100 的GPU,32GB 的Video Mem,實(shí)驗(yàn)語(yǔ)言為Python3.7,實(shí)驗(yàn)?zāi)P筒捎肞addlePaddle2.1.2搭建。預(yù)訓(xùn)練階段,模型超參設(shè)置如下:LISERNIE隱藏層維度為768維,batch size為64,學(xué)習(xí)率采用自定義算法,范圍為[1×10-5,1×10-4],dropout設(shè)置為0.1,優(yōu)化算法使用AdamW[35]。微調(diào)階段,BiGRU隱藏層維度為256維,模型由15個(gè)Epoch進(jìn)行訓(xùn)練,學(xué)習(xí)率范圍設(shè)置為[6×10-5,1×10-4],其余參數(shù)的設(shè)置與預(yù)訓(xùn)練階段保持一致。

    4.3 評(píng)價(jià)指標(biāo)

    本文使用實(shí)體級(jí)別的準(zhǔn)確率(Precision,P)、召回率(Recall,R)及其調(diào)和平均數(shù)F1來(lái)評(píng)價(jià)模型效果,具體計(jì)算公式如下:

    4.4 實(shí)驗(yàn)設(shè)計(jì)與分析

    為了驗(yàn)證基于LISERNIE的圖情領(lǐng)域命名實(shí)體識(shí)別模型的有效性,本文設(shè)計(jì)了4組實(shí)驗(yàn)。第一組為使用不同PLM 的實(shí)體識(shí)別效果對(duì)比實(shí)驗(yàn),用來(lái)檢驗(yàn)注入領(lǐng)域知識(shí)的PLM相比其他PLM 是否取得更好的性能;第二組為不同類別的實(shí)體在不同規(guī)模數(shù)據(jù)集上的識(shí)別效果對(duì)比實(shí)驗(yàn),用來(lái)檢驗(yàn)本文模型在小規(guī)模標(biāo)注數(shù)據(jù)集上的性能是否穩(wěn)定;第三組為消融實(shí)驗(yàn),用來(lái)驗(yàn)證本文模型中各個(gè)模塊的有效性;第四組實(shí)驗(yàn)將模型應(yīng)用到實(shí)體關(guān)系抽取中,以驗(yàn)證模型的可行性。

    (1)不同PLM的對(duì)比實(shí)驗(yàn)。分別使用Word2Vec、BERT[36]、ERNIE、RoBERTa[37]、ALBERT[38]及本文的LISERNIE等PLM得到句子的語(yǔ)義表示向量,再接入BiGRU和CRF兩層,實(shí)體識(shí)別結(jié)果見(jiàn)表6。本文提出的基于LISERNIE的識(shí)別模型效果最好,F(xiàn)1 值達(dá)到75.46%,相較于基于ERNIE的模型,提高了1.08%,表明為預(yù)訓(xùn)練模型注入領(lǐng)域知識(shí)能夠提升實(shí)體識(shí)別效果。而ERNIE的F1值又略高于BERT,這是由于在預(yù)訓(xùn)練語(yǔ)料方面,ERNIE不僅使用百科類語(yǔ)料,還使用新聞資訊類、論壇對(duì)話類語(yǔ)料來(lái)訓(xùn)練模型;相比于BERT僅使用百科類語(yǔ)料,ERNIE可獲得更好的語(yǔ)言表征,也進(jìn)一步驗(yàn)證了注入外部知識(shí)有利于提高模型的語(yǔ)義表示能力?;趥鹘y(tǒng)Word2Vec 的效果最差,可見(jiàn)“預(yù)訓(xùn)練+微調(diào)”的動(dòng)態(tài)PLM比靜態(tài)PLM具有更大優(yōu)勢(shì)。此外,從運(yùn)行時(shí)間來(lái)看,各個(gè)模型相差不大,對(duì)于可以離線計(jì)算的任務(wù)而言是可接受的。

    表6 不同PLM的識(shí)別效果對(duì)比

    (2)不同類別的實(shí)體在不同規(guī)模語(yǔ)料(數(shù)據(jù)集)上的對(duì)比實(shí)驗(yàn)。將數(shù)據(jù)集規(guī)模劃分為四分之一、三分之一、二分之一、三分之二、四分之三和全部數(shù)據(jù)集,基于LISERNIE+BiGRU+CRF的命名實(shí)體識(shí)別模型在不同規(guī)模數(shù)據(jù)集上的識(shí)別效果如圖6所示??梢钥吹剑粋€(gè)模型對(duì)不同類別實(shí)體的識(shí)別效果也有一定的差距,但總體上,實(shí)體的F1值和數(shù)據(jù)集的規(guī)模呈現(xiàn)一定的正相關(guān)。隨著語(yǔ)料規(guī)模的減少,實(shí)體的識(shí)別效果下降較為平緩,說(shuō)明本文模型在小規(guī)模數(shù)據(jù)集上的性能比較穩(wěn)定。Person實(shí)體的F1值基本在85%以上,主要原因是對(duì)于Person這類通用命名實(shí)體,預(yù)訓(xùn)練階段已經(jīng)取得很好的效果,即使在標(biāo)注數(shù)據(jù)很少的情況下,識(shí)別性能也不會(huì)受到很大影響。但占比較少的Document、Device、Technology和Event這4類實(shí)體識(shí)別效果都出現(xiàn)急劇下降情況,說(shuō)明測(cè)試數(shù)據(jù)太少還是會(huì)導(dǎo)致深度學(xué)習(xí)模型難以有效學(xué)習(xí),識(shí)別效果大打折扣。

    圖6 不同類別實(shí)體在不同規(guī)模數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果

    (3)消融實(shí)驗(yàn)。為更好地分析模型各個(gè)部分的作用,本文還進(jìn)行了模型消融實(shí)驗(yàn),即在原始模型基礎(chǔ)上分別去掉BiGRU層、CRF層,以及同時(shí)去掉這兩層。另外,為了檢驗(yàn)BiGRU層的效果,還采用BiLSTM作為替換模型進(jìn)行了實(shí)驗(yàn)。觀察表7 可以看到,模型各個(gè)部分都起到了作用,模型1、2、3 的F1 值分別比本文模型低2.1%、1.19%和1.09%,說(shuō)明去掉BiGRU層和CRF層的任何一層都會(huì)造成性能下降,并且同時(shí)去掉BiGRU層和CRF層,比單獨(dú)去掉其中一層效果下降更加明顯。比較模型2和4以及本文模型和模型5,發(fā)現(xiàn)用BiGRU替換BiLSTM后的效果和運(yùn)行速度均有所提升??梢?jiàn),相對(duì)BiLSTM模型,BiGRU 模型參數(shù)更少、網(wǎng)絡(luò)結(jié)構(gòu)更加簡(jiǎn)單,使得整個(gè)模型計(jì)算速度更快,在小數(shù)據(jù)集上的泛化效果也更好。

    表7 不同模型的識(shí)別效果對(duì)比

    (4)基于LISERNIE的實(shí)體關(guān)系抽取實(shí)驗(yàn)。面向開(kāi)放域的關(guān)系抽取可以掙脫預(yù)定義關(guān)系的束縛,識(shí)別句子中實(shí)體與實(shí)體之間的關(guān)系,抽取出實(shí)體關(guān)系三元組。為分析LISERNIE模型對(duì)其他NLP 下游任務(wù)性能提升起到的積極作用,從LISNER數(shù)據(jù)集中隨機(jī)取出166個(gè)句子,將基于LISERNIE實(shí)現(xiàn)的關(guān)系抽取方法和現(xiàn)有的CORE(Chinese Open Relation Extraction,中文開(kāi)放關(guān)系抽取)[39]系統(tǒng)進(jìn)行對(duì)比。CORE系統(tǒng)共抽取出22個(gè)句子中的38個(gè)三元組,經(jīng)人工校對(duì),3個(gè)正確,準(zhǔn)確率為7.89%。本文方法共抽取出134個(gè)句子中的277個(gè)三元組,85個(gè)正確,準(zhǔn)確率為30.69%,部分抽取結(jié)果如表8所示。

    表8 抽取結(jié)果對(duì)比(部分)

    CORE系統(tǒng)采用基于依存句法分析的關(guān)系抽取方法,只抽取由動(dòng)詞或名詞引導(dǎo)的介導(dǎo)關(guān)系,大量有用的關(guān)系實(shí)例被過(guò)濾掉,導(dǎo)致準(zhǔn)確率大大降低。本文采用流水線方法,首先基于LISERNIE+BiGRU+CRF模型對(duì)句子中的實(shí)體進(jìn)行識(shí)別,接著過(guò)濾掉句中“實(shí)體數(shù)<2”的句子,最后抽取句子中實(shí)體對(duì)之間的文本作為關(guān)系。例如,句子“國(guó)家古籍保護(hù)中心在組織開(kāi)展古籍?dāng)?shù)字資源發(fā)布的同時(shí),全國(guó)古籍‘摸家底’工作也取得重要進(jìn)展?!苯?jīng)過(guò)模型識(shí)別出一個(gè)Org實(shí)體“國(guó)家古籍保護(hù)中心”,但因?yàn)榫渥又械摹皩?shí)體數(shù)<2”,該句被過(guò)濾掉。又如,表8中的句子1經(jīng)過(guò)本文模型識(shí)別出Eve實(shí)體“中華古籍保護(hù)計(jì)劃”、Tec實(shí)體“中華古籍資源庫(kù)”和“全國(guó)古籍普查登記基本數(shù)據(jù)庫(kù)”以及Lib實(shí)體“國(guó)家圖書(shū)館”,所以實(shí)體“中華古籍保護(hù)計(jì)劃”和實(shí)體“中華古籍資源庫(kù)”之間的文本被抽取出來(lái),形成三元組["中華古籍保護(hù)計(jì)劃","重要階段成果","中華古籍資源庫(kù)"]。這種抽取處理簡(jiǎn)單,不受限于限定模式,準(zhǔn)確率較CORE系統(tǒng)有較大的提高。

    當(dāng)然,本實(shí)驗(yàn)主要是為了驗(yàn)證LISERNIE+BiGRU+CRF模型在關(guān)系抽取中的可行性。實(shí)現(xiàn)方法僅是在Riedel等[40]假設(shè)的基礎(chǔ)上放松抽取限制,認(rèn)為如果實(shí)體對(duì)存在某種關(guān)系,那么存在該實(shí)體對(duì)的句子反映了該關(guān)系,并針對(duì)每一個(gè)實(shí)體對(duì)進(jìn)行關(guān)系抽取,這樣會(huì)造成大量信息冗余,降低準(zhǔn)確率。但本文方法無(wú)需預(yù)先定義實(shí)體關(guān)系類型,只需少量標(biāo)注實(shí)體的預(yù)訓(xùn)練語(yǔ)料,對(duì)于后續(xù)開(kāi)展開(kāi)放域的實(shí)體關(guān)系抽取研究具有一定的借鑒意義。

    5 結(jié)語(yǔ)

    針對(duì)圖情領(lǐng)域內(nèi)標(biāo)注數(shù)據(jù)少、相關(guān)知識(shí)庫(kù)缺失等問(wèn)題,本文利用知識(shí)圖譜中的實(shí)體節(jié)點(diǎn)及其類別層級(jí)結(jié)構(gòu),科學(xué)確定了圖情領(lǐng)域的實(shí)體類別,并構(gòu)建了一個(gè)基于領(lǐng)域知識(shí)注入的預(yù)訓(xùn)練語(yǔ)言模型LISERNIE。在隨后開(kāi)展的命名實(shí)體識(shí)別實(shí)驗(yàn)和開(kāi)放域關(guān)系抽取實(shí)驗(yàn)中,相比于基線模型,本文提出的基于LISERNIE+BiGRU+CRF的命名實(shí)體識(shí)別模型能更有效地識(shí)別出實(shí)體及其關(guān)系,可以更好地支撐后續(xù)諸如知識(shí)圖譜構(gòu)建、問(wèn)答系統(tǒng)、機(jī)器閱讀等自然語(yǔ)言應(yīng)用的開(kāi)展。未來(lái)可關(guān)注:一是在預(yù)訓(xùn)練階段,過(guò)多的知識(shí)注入可能帶來(lái)噪聲,造成模型損失,但注入的知識(shí)不足則對(duì)于提高模型對(duì)文本的語(yǔ)義理解力幫助不大,后續(xù)研究可探討把什么樣的知識(shí)以什么樣的方式注入預(yù)訓(xùn)練模型中,使模型在下游任務(wù)上有更好的表現(xiàn);二是采用流水線方法進(jìn)行開(kāi)放域關(guān)系抽取會(huì)產(chǎn)生大量冗余信息,今后可以嘗試結(jié)合語(yǔ)義、語(yǔ)法信息實(shí)現(xiàn)實(shí)體關(guān)系的有效抽取;三是將知識(shí)驅(qū)動(dòng)的人工智能和數(shù)據(jù)驅(qū)動(dòng)的人工智能兩種范式結(jié)合起來(lái),是人工智能發(fā)展的必經(jīng)之路[26],后續(xù)研究可以思考如何將數(shù)據(jù)和知識(shí)融合,以實(shí)現(xiàn)更好的效果。

    猜你喜歡
    圖情語(yǔ)料命名
    數(shù)字時(shí)代圖情檔學(xué)科教育的數(shù)據(jù)化創(chuàng)新
    命名——助力有機(jī)化學(xué)的學(xué)習(xí)
    新文科建設(shè)背景下的圖情檔學(xué)科建設(shè)(筆談)“新文科”呼喚圖情檔成為“硬”學(xué)科
    聚青年學(xué)者之睿智 窺圖情檔學(xué)科之未來(lái)
    ——寫(xiě)在《圖書(shū)與情報(bào)》“圖情檔青年學(xué)者專輯”出版之前
    有一種男人以“暖”命名
    東方女性(2018年3期)2018-04-16 15:30:02
    為一條河命名——在白河源
    基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
    中國(guó)盲人數(shù)字圖書(shū)館服務(wù)情況及展望
    華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
    《苗防備覽》中的湘西語(yǔ)料
    色综合婷婷激情| 国产精品女同一区二区软件 | 午夜免费成人在线视频| 国产毛片a区久久久久| 国产高清三级在线| 亚洲男人的天堂狠狠| 中文字幕精品亚洲无线码一区| 啪啪无遮挡十八禁网站| 欧美性猛交黑人性爽| 国产主播在线观看一区二区| 国产av在哪里看| 我的老师免费观看完整版| av天堂中文字幕网| 不卡av一区二区三区| 一本综合久久免费| 亚洲中文日韩欧美视频| 日韩欧美国产在线观看| 欧美一级毛片孕妇| 在线免费观看不下载黄p国产 | 噜噜噜噜噜久久久久久91| 欧美午夜高清在线| 久久亚洲精品不卡| 五月伊人婷婷丁香| 99国产极品粉嫩在线观看| 99久久久亚洲精品蜜臀av| 精品不卡国产一区二区三区| 天天一区二区日本电影三级| 午夜日韩欧美国产| 一级毛片女人18水好多| 国产精品 欧美亚洲| 欧美丝袜亚洲另类 | 99在线视频只有这里精品首页| 午夜免费激情av| 制服丝袜大香蕉在线| 我要搜黄色片| 国产精品av久久久久免费| 久久久久久国产a免费观看| 香蕉av资源在线| 午夜a级毛片| 国产一区在线观看成人免费| 日韩欧美精品v在线| 97碰自拍视频| 日韩免费av在线播放| 1000部很黄的大片| 国产一级毛片七仙女欲春2| 中文亚洲av片在线观看爽| 亚洲色图av天堂| 亚洲色图av天堂| 在线观看66精品国产| 免费av不卡在线播放| 成人国产综合亚洲| 少妇熟女aⅴ在线视频| 熟妇人妻久久中文字幕3abv| 色综合婷婷激情| 一区二区三区国产精品乱码| 看片在线看免费视频| 免费一级毛片在线播放高清视频| 国产高清三级在线| 最近最新中文字幕大全电影3| 亚洲avbb在线观看| 成人三级做爰电影| 色综合欧美亚洲国产小说| 亚洲国产中文字幕在线视频| 久9热在线精品视频| 成年人黄色毛片网站| 黄频高清免费视频| 日本免费a在线| 国产精品av久久久久免费| 国产精品自产拍在线观看55亚洲| 久久久精品欧美日韩精品| 俄罗斯特黄特色一大片| 我要搜黄色片| 夜夜爽天天搞| 国产精品久久视频播放| 男插女下体视频免费在线播放| 高清毛片免费观看视频网站| 久久天躁狠狠躁夜夜2o2o| 精品福利观看| 无限看片的www在线观看| 亚洲va日本ⅴa欧美va伊人久久| 国产熟女xx| 国产亚洲精品av在线| 国产亚洲精品一区二区www| 久久精品亚洲精品国产色婷小说| 国产伦在线观看视频一区| 中文字幕高清在线视频| 少妇的逼水好多| 国产伦在线观看视频一区| 国内精品一区二区在线观看| 国产伦一二天堂av在线观看| 国产伦在线观看视频一区| 欧美激情久久久久久爽电影| 国产毛片a区久久久久| 欧美精品啪啪一区二区三区| 国产精品99久久99久久久不卡| 亚洲专区国产一区二区| 熟女电影av网| 999久久久精品免费观看国产| 国产一区二区三区视频了| 成年女人看的毛片在线观看| 亚洲一区二区三区色噜噜| 黄色 视频免费看| 国产乱人视频| 波多野结衣高清无吗| 亚洲精品在线观看二区| 国产男靠女视频免费网站| 美女大奶头视频| 久久精品夜夜夜夜夜久久蜜豆| 九九久久精品国产亚洲av麻豆 | 亚洲狠狠婷婷综合久久图片| 国内毛片毛片毛片毛片毛片| 日本a在线网址| 一个人观看的视频www高清免费观看 | 99久久精品一区二区三区| 国产精品电影一区二区三区| 男女那种视频在线观看| 精品一区二区三区av网在线观看| 成人精品一区二区免费| 一本综合久久免费| 婷婷精品国产亚洲av| 日本黄大片高清| 又粗又爽又猛毛片免费看| 精品人妻1区二区| 2021天堂中文幕一二区在线观| 丁香欧美五月| 99久久精品热视频| 床上黄色一级片| 51午夜福利影视在线观看| 母亲3免费完整高清在线观看| 日本一二三区视频观看| 午夜精品久久久久久毛片777| xxxwww97欧美| 国产精品永久免费网站| 啦啦啦观看免费观看视频高清| 久久精品国产综合久久久| 熟妇人妻久久中文字幕3abv| 熟女电影av网| 久久精品人妻少妇| 国产精品久久久av美女十八| 国产精品av视频在线免费观看| 国产高清视频在线观看网站| 午夜福利免费观看在线| av视频在线观看入口| 亚洲五月婷婷丁香| 美女 人体艺术 gogo| 久久草成人影院| 高清在线国产一区| 色综合婷婷激情| 变态另类成人亚洲欧美熟女| 亚洲电影在线观看av| 男女午夜视频在线观看| 在线永久观看黄色视频| 欧美日韩中文字幕国产精品一区二区三区| 国内毛片毛片毛片毛片毛片| 亚洲精品久久国产高清桃花| 99精品久久久久人妻精品| e午夜精品久久久久久久| 99热这里只有精品一区 | 黄色日韩在线| 91字幕亚洲| 午夜福利欧美成人| 国产高清视频在线观看网站| 少妇裸体淫交视频免费看高清| 日本一二三区视频观看| 美女 人体艺术 gogo| 成人亚洲精品av一区二区| 日韩欧美国产在线观看| 人人妻人人看人人澡| 亚洲午夜精品一区,二区,三区| 夜夜看夜夜爽夜夜摸| 欧美日本亚洲视频在线播放| 国产精品久久久久久精品电影| 哪里可以看免费的av片| 黄频高清免费视频| 最近在线观看免费完整版| 又爽又黄无遮挡网站| 国产 一区 欧美 日韩| 亚洲国产日韩欧美精品在线观看 | 特级一级黄色大片| 精品一区二区三区视频在线观看免费| 婷婷精品国产亚洲av在线| 色噜噜av男人的天堂激情| 久久久久久久久久黄片| 免费看美女性在线毛片视频| 男插女下体视频免费在线播放| 欧美3d第一页| 真实男女啪啪啪动态图| 在线观看舔阴道视频| 一级黄色大片毛片| 婷婷精品国产亚洲av在线| 午夜免费观看网址| 一夜夜www| 18禁裸乳无遮挡免费网站照片| 欧美3d第一页| 在线观看舔阴道视频| 一个人看的www免费观看视频| 精品电影一区二区在线| 99re在线观看精品视频| 亚洲激情在线av| 久久久久久大精品| 久久久久国内视频| 国产成人av教育| 国内久久婷婷六月综合欲色啪| 国产精品电影一区二区三区| 国产精品99久久99久久久不卡| 此物有八面人人有两片| 亚洲精品在线观看二区| 99热只有精品国产| 90打野战视频偷拍视频| 久久天躁狠狠躁夜夜2o2o| 热99re8久久精品国产| 最新在线观看一区二区三区| 九色国产91popny在线| 搡老熟女国产l中国老女人| 在线观看免费视频日本深夜| 午夜影院日韩av| 99热只有精品国产| 69av精品久久久久久| 午夜精品久久久久久毛片777| 桃色一区二区三区在线观看| 91老司机精品| 精品福利观看| 国产av在哪里看| 一二三四社区在线视频社区8| 亚洲精品中文字幕一二三四区| 国产精品 国内视频| 午夜激情欧美在线| 两个人看的免费小视频| 亚洲一区二区三区不卡视频| 成人特级黄色片久久久久久久| 亚洲成人精品中文字幕电影| 国产黄a三级三级三级人| 亚洲精华国产精华精| 国产单亲对白刺激| 一级毛片女人18水好多| 精品不卡国产一区二区三区| 亚洲成人中文字幕在线播放| 久久精品综合一区二区三区| 亚洲五月天丁香| 国产v大片淫在线免费观看| 日本一本二区三区精品| 曰老女人黄片| 国产精品久久久久久亚洲av鲁大| 国产高清视频在线观看网站| 久久久久久久精品吃奶| 国产69精品久久久久777片 | 久久99热这里只有精品18| 国产精品爽爽va在线观看网站| tocl精华| 国产精品永久免费网站| 在线十欧美十亚洲十日本专区| 好男人电影高清在线观看| 亚洲国产欧洲综合997久久,| 亚洲中文av在线| 给我免费播放毛片高清在线观看| 亚洲avbb在线观看| 欧美绝顶高潮抽搐喷水| 999久久久精品免费观看国产| 国产免费av片在线观看野外av| 亚洲性夜色夜夜综合| 欧美日韩福利视频一区二区| 午夜成年电影在线免费观看| 免费在线观看视频国产中文字幕亚洲| 两个人的视频大全免费| 香蕉av资源在线| 亚洲av熟女| 美女高潮的动态| 看黄色毛片网站| 国产高清视频在线播放一区| 亚洲av成人av| 嫩草影院入口| 欧美一级毛片孕妇| 欧美日韩国产亚洲二区| 999久久久国产精品视频| 哪里可以看免费的av片| 美女cb高潮喷水在线观看 | 18禁黄网站禁片免费观看直播| 久久久久久久午夜电影| 一本一本综合久久| 国产 一区 欧美 日韩| 精品福利观看| 国产一区二区在线观看日韩 | 三级国产精品欧美在线观看 | 亚洲国产中文字幕在线视频| 搞女人的毛片| 亚洲欧美日韩无卡精品| 香蕉丝袜av| bbb黄色大片| 亚洲av成人精品一区久久| 欧美精品啪啪一区二区三区| 99国产极品粉嫩在线观看| 亚洲18禁久久av| 亚洲五月婷婷丁香| 丰满人妻熟妇乱又伦精品不卡| 欧美乱码精品一区二区三区| 免费在线观看影片大全网站| 久久中文看片网| 中亚洲国语对白在线视频| 色视频www国产| 精品国产乱子伦一区二区三区| 特级一级黄色大片| 亚洲av成人不卡在线观看播放网| 香蕉av资源在线| 一边摸一边抽搐一进一小说| 欧美一级毛片孕妇| 韩国av一区二区三区四区| 亚洲一区二区三区色噜噜| 国产精品免费一区二区三区在线| 欧美zozozo另类| 99久国产av精品| 欧美日韩国产亚洲二区| 伊人久久大香线蕉亚洲五| 亚洲精品国产精品久久久不卡| av福利片在线观看| 99久久精品热视频| 国产成人精品无人区| 在线看三级毛片| 91在线观看av| 久久久久久九九精品二区国产| 五月玫瑰六月丁香| a在线观看视频网站| 中出人妻视频一区二区| 国产亚洲精品综合一区在线观看| 一进一出抽搐gif免费好疼| 亚洲av美国av| 久久久久国内视频| 亚洲avbb在线观看| 国产毛片a区久久久久| 日本 av在线| 在线观看午夜福利视频| 黑人欧美特级aaaaaa片| 国产99白浆流出| 哪里可以看免费的av片| x7x7x7水蜜桃| 亚洲专区字幕在线| 色在线成人网| 国产高清有码在线观看视频| 精品日产1卡2卡| 色老头精品视频在线观看| 亚洲美女视频黄频| 免费看十八禁软件| 91老司机精品| 国内少妇人妻偷人精品xxx网站 | 这个男人来自地球电影免费观看| 桃色一区二区三区在线观看| 国产又黄又爽又无遮挡在线| 亚洲电影在线观看av| 变态另类丝袜制服| 精品一区二区三区四区五区乱码| netflix在线观看网站| 人人妻人人澡欧美一区二区| 国产成人精品无人区| 在线播放国产精品三级| 亚洲 欧美 日韩 在线 免费| 日本精品一区二区三区蜜桃| 亚洲人成电影免费在线| 在线观看舔阴道视频| 国产成人系列免费观看| 国产成人精品久久二区二区91| 高清在线国产一区| 国产一区二区三区视频了| 国产成人福利小说| 欧美丝袜亚洲另类 | 久久久久免费精品人妻一区二区| 国产野战对白在线观看| 搡老妇女老女人老熟妇| svipshipincom国产片| 亚洲国产高清在线一区二区三| 亚洲av成人av| 免费在线观看成人毛片| 99国产精品一区二区三区| 亚洲美女视频黄频| 毛片女人毛片| 丁香六月欧美| 精品久久久久久,| 99国产精品一区二区蜜桃av| 亚洲天堂国产精品一区在线| 国内少妇人妻偷人精品xxx网站 | 国产av麻豆久久久久久久| av中文乱码字幕在线| 久久久久久久精品吃奶| 国产又黄又爽又无遮挡在线| 伊人久久大香线蕉亚洲五| 日本免费a在线| 日本三级黄在线观看| 不卡一级毛片| 亚洲国产欧美人成| 性欧美人与动物交配| 国产精品国产高清国产av| 1024香蕉在线观看| 国产欧美日韩一区二区精品| 亚洲va日本ⅴa欧美va伊人久久| 午夜免费观看网址| 亚洲人成电影免费在线| 亚洲专区字幕在线| 久久99热这里只有精品18| 男人和女人高潮做爰伦理| 亚洲av中文字字幕乱码综合| 成人三级黄色视频| 丝袜人妻中文字幕| 国产av麻豆久久久久久久| 少妇人妻一区二区三区视频| 欧美xxxx黑人xx丫x性爽| 日日摸夜夜添夜夜添小说| 丁香欧美五月| 男插女下体视频免费在线播放| 亚洲中文日韩欧美视频| 久久精品夜夜夜夜夜久久蜜豆| 亚洲成av人片免费观看| 午夜日韩欧美国产| 午夜福利欧美成人| 青草久久国产| 少妇的逼水好多| 午夜a级毛片| 99精品久久久久人妻精品| 日本熟妇午夜| 美女黄网站色视频| 欧美黄色淫秽网站| 午夜两性在线视频| 久久久国产精品麻豆| 精品午夜福利视频在线观看一区| av天堂中文字幕网| 亚洲av电影在线进入| 美女扒开内裤让男人捅视频| 日韩欧美 国产精品| 黄频高清免费视频| 两个人看的免费小视频| 亚洲真实伦在线观看| 中亚洲国语对白在线视频| 国产av麻豆久久久久久久| 成人三级黄色视频| 久久九九热精品免费| 韩国av一区二区三区四区| 他把我摸到了高潮在线观看| 18禁黄网站禁片午夜丰满| 特级一级黄色大片| 久久久久久久久久黄片| 最新在线观看一区二区三区| 动漫黄色视频在线观看| 精品久久久久久久毛片微露脸| 国产精品 欧美亚洲| 成人国产一区最新在线观看| cao死你这个sao货| 精品国内亚洲2022精品成人| 波多野结衣高清无吗| 国模一区二区三区四区视频 | 久久久国产成人免费| 午夜久久久久精精品| 国产精品影院久久| 亚洲精品久久国产高清桃花| 9191精品国产免费久久| 久久精品国产清高在天天线| 国产视频内射| 成人特级黄色片久久久久久久| 免费大片18禁| 久久国产精品人妻蜜桃| 久久人人精品亚洲av| 丝袜人妻中文字幕| 亚洲无线观看免费| 在线免费观看的www视频| 国产单亲对白刺激| 亚洲成人久久性| 亚洲黑人精品在线| 中文字幕av在线有码专区| 在线永久观看黄色视频| 欧美丝袜亚洲另类 | 精品国产超薄肉色丝袜足j| 极品教师在线免费播放| 看免费av毛片| 男女下面进入的视频免费午夜| 中亚洲国语对白在线视频| 亚洲成av人片在线播放无| 在线免费观看的www视频| 免费看日本二区| 欧美一区二区精品小视频在线| 免费人成视频x8x8入口观看| 日韩欧美在线乱码| 亚洲精品色激情综合| 国产成人啪精品午夜网站| 此物有八面人人有两片| 日本一二三区视频观看| 国产精品乱码一区二三区的特点| 国产精品九九99| 国产av一区在线观看免费| 久久国产乱子伦精品免费另类| 欧美色视频一区免费| 757午夜福利合集在线观看| 久久久久久久午夜电影| 级片在线观看| 少妇人妻一区二区三区视频| 国产淫片久久久久久久久 | 成人三级黄色视频| 操出白浆在线播放| 亚洲专区国产一区二区| а√天堂www在线а√下载| 一级毛片精品| 久久中文看片网| 欧美极品一区二区三区四区| 亚洲精品一区av在线观看| 国产淫片久久久久久久久 | 久久婷婷人人爽人人干人人爱| 国产成人av教育| 国产一级毛片七仙女欲春2| 夜夜爽天天搞| 熟妇人妻久久中文字幕3abv| 国产精品日韩av在线免费观看| 中文在线观看免费www的网站| 欧美av亚洲av综合av国产av| 在线观看日韩欧美| 999久久久精品免费观看国产| 免费搜索国产男女视频| 一本综合久久免费| 久久香蕉国产精品| 观看免费一级毛片| 国产免费av片在线观看野外av| 国产69精品久久久久777片 | 国模一区二区三区四区视频 | 国产精品精品国产色婷婷| 九色国产91popny在线| 中文字幕人成人乱码亚洲影| 国产成人一区二区三区免费视频网站| 精品国产亚洲在线| 久久亚洲真实| 亚洲欧美日韩东京热| 国产精品自产拍在线观看55亚洲| 国内精品久久久久精免费| 丰满人妻一区二区三区视频av | 偷拍熟女少妇极品色| 看片在线看免费视频| 国产精品一区二区三区四区久久| 人妻久久中文字幕网| 午夜影院日韩av| aaaaa片日本免费| 老熟妇仑乱视频hdxx| 美女cb高潮喷水在线观看 | 国产精品女同一区二区软件 | 窝窝影院91人妻| 深夜精品福利| 高清在线国产一区| 五月伊人婷婷丁香| 亚洲精品456在线播放app | 午夜日韩欧美国产| 19禁男女啪啪无遮挡网站| 日韩欧美国产在线观看| 久久这里只有精品中国| 亚洲av电影不卡..在线观看| 国产男靠女视频免费网站| 女警被强在线播放| 国内少妇人妻偷人精品xxx网站 | 成年版毛片免费区| 亚洲aⅴ乱码一区二区在线播放| 好看av亚洲va欧美ⅴa在| 国产精品日韩av在线免费观看| 欧美一级a爱片免费观看看| 丰满人妻一区二区三区视频av | 久久久久久久精品吃奶| 特级一级黄色大片| 国产精品自产拍在线观看55亚洲| 亚洲成av人片在线播放无| 午夜福利免费观看在线| 99国产精品99久久久久| 久久久久久久午夜电影| 国产激情欧美一区二区| 欧美黑人欧美精品刺激| 国产在线精品亚洲第一网站| 国产成年人精品一区二区| 真实男女啪啪啪动态图| 亚洲激情在线av| 中文在线观看免费www的网站| 久久天堂一区二区三区四区| 亚洲avbb在线观看| 国产又色又爽无遮挡免费看| 欧美中文日本在线观看视频| 日韩欧美 国产精品| 美女 人体艺术 gogo| 久久精品人妻少妇| 美女 人体艺术 gogo| 日韩精品青青久久久久久| 成人av在线播放网站| 12—13女人毛片做爰片一| 99在线视频只有这里精品首页| 日韩欧美国产一区二区入口| 美女高潮的动态| 在线视频色国产色| 91麻豆av在线| 一区福利在线观看| www.熟女人妻精品国产| 免费av毛片视频| xxx96com| 丰满人妻一区二区三区视频av | 欧美成人一区二区免费高清观看 | 久久中文字幕人妻熟女| 黑人操中国人逼视频| 亚洲九九香蕉| 不卡av一区二区三区| 亚洲aⅴ乱码一区二区在线播放| 757午夜福利合集在线观看| 黄频高清免费视频| 色老头精品视频在线观看| 啪啪无遮挡十八禁网站| 国语自产精品视频在线第100页| 嫩草影院入口| 亚洲欧美精品综合一区二区三区| 日本 欧美在线| 亚洲人成网站在线播放欧美日韩| 免费观看的影片在线观看| 1000部很黄的大片| 黄色片一级片一级黄色片| 女人高潮潮喷娇喘18禁视频| 亚洲人与动物交配视频| 波多野结衣高清无吗| 精品无人区乱码1区二区| 国产三级在线视频| 久久久久国产一级毛片高清牌| 一a级毛片在线观看|