• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    命名實(shí)體識別方法研究綜述

    2022-09-15 10:27:24李冬梅羅斯斯張小平
    計(jì)算機(jī)與生活 2022年9期
    關(guān)鍵詞:監(jiān)督特征信息

    李冬梅,羅斯斯,張小平,許 福

    1.北京林業(yè)大學(xué) 信息學(xué)院,北京 100083

    2.國家林業(yè)和草原局林業(yè)智能信息處理工程技術(shù)研究中心,北京 100083

    3.中國中醫(yī)科學(xué)院 中醫(yī)藥信息研究所,北京 100700

    命名實(shí)體識別(named entity recognition,NER)是指識別出文本中具有特定意義的命名實(shí)體并將其分類為預(yù)先定義的實(shí)體類型,如人名、地名、機(jī)構(gòu)名、時(shí)間、貨幣等。在大數(shù)據(jù)時(shí)代,如何精準(zhǔn)并高效地從海量無結(jié)構(gòu)或半結(jié)構(gòu)數(shù)據(jù)中獲取到關(guān)鍵信息,這是自然語言處理(natural language processing,NLP)任務(wù)的重要基礎(chǔ)。命名實(shí)體通常包含豐富的語義,與數(shù)據(jù)中的關(guān)鍵信息有著密切的聯(lián)系,NER 任務(wù)可以用于解決互聯(lián)網(wǎng)文本數(shù)據(jù)的爆炸式信息過載問題,能有效獲取到關(guān)鍵信息,并廣泛應(yīng)用于關(guān)系抽取、機(jī)器翻譯以及知識圖譜構(gòu)建等領(lǐng)域。

    NER 歷經(jīng)了MUC(message understanding conference)、MET(multilingual entity task)、CoNLL(conference on computational natural language learning)、ACE(automatic content extraction)等,眾多研究者不斷深入研究,其理論和方法愈加完善。研究方法從最初需要人工設(shè)計(jì)規(guī)則,到后來借助傳統(tǒng)機(jī)器學(xué)習(xí)中的模型方法,目前已經(jīng)發(fā)展到利用各種深度學(xué)習(xí)。研究領(lǐng)域從一般領(lǐng)域到特定領(lǐng)域,研究語言從單一語言發(fā)展到多種語言,各種NER模型的性能隨著發(fā)展也在不斷提升。

    本文調(diào)研了NER 發(fā)展史上有代表性的綜述論文,孫鎮(zhèn)等綜述了NER 的方法,包括對基于規(guī)則和詞典的方法以及基于統(tǒng)計(jì)的方法的介紹。Li 等詳細(xì)總結(jié)和分析了NER 的深度學(xué)習(xí)方法。李猛等從遷移學(xué)習(xí)的角度,總結(jié)了NER 的遷移方法。趙山等調(diào)研了在不同神經(jīng)網(wǎng)絡(luò)架構(gòu)下最具代表性的晶格結(jié)構(gòu)的中文NER 模型。以上綜述都是對NER 的傳統(tǒng)方法或者深度學(xué)習(xí)的部分方法的闡述,沒有詳細(xì)地包含基于規(guī)則和詞典的NER 方法、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的NER 方法和基于深度學(xué)習(xí)的NER 方法這三者的介紹,且并未針對最新的基于提示學(xué)習(xí)的方法進(jìn)行總結(jié)。本文首先從基于規(guī)則和詞典、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)和基于深度學(xué)習(xí)的NER 方法這三方面對目前NER 研究工作進(jìn)行系統(tǒng)性梳理,歸納總結(jié)了每一種NER 方法的關(guān)鍵思路、優(yōu)缺點(diǎn)和具有代表性的模型。同時(shí)對基于提示學(xué)習(xí)的NER 方法進(jìn)行了比較分析。其次,擴(kuò)充了中文NER 的介紹,給出了中文NER 的特殊性,總結(jié)歸納中文NER 特有的數(shù)據(jù)集,對各個(gè)階段的主流方法均單獨(dú)進(jìn)行了綜述。

    1 NER 概述

    1.1 NER 定義

    最初在1991 年第7 屆IEEE 人工智能應(yīng)用會議上,Rau發(fā)表了一篇“從文本中抽取公司名稱”的論文,提出了一種從文本中提取公司名的方法,在文中需要識別的命名實(shí)體僅為公司名稱。在1996 年MUC-6 會議上,命名實(shí)體被定義為“實(shí)體的唯一標(biāo)識符”,需要識別的命名實(shí)體包含:人名、地名、機(jī)構(gòu)名、時(shí)間、日期、貨幣和百分比。

    NER 是對文本中的命名實(shí)體進(jìn)行定位和分類的過程。對給定文本的標(biāo)注序列=<,,…, w>,經(jīng)過NER 過程后得到三元組列表,如<,,>,每一個(gè)三元組都包含一個(gè)實(shí)體的信息。在三元組<,,>中,∈[1,],∈[1,],分別指代實(shí)體的開始索引和結(jié)束索引,是預(yù)定義類別集合中的實(shí)體類型。圖1 給出了一個(gè)標(biāo)注序列的樣例,在經(jīng)過NER 系統(tǒng)后得到了3 個(gè)三元組,根據(jù)三元組判斷得到:Zhang San 是Person 類實(shí)體,Beijing 和China 是Location 類實(shí)體。

    圖1 NER 任務(wù)的實(shí)例Fig.1 Example of NER task

    1.2 NER 的研究難點(diǎn)

    目前,針對NER 的研究仍存在一些通用難點(diǎn)。

    (1)未登錄詞。隨著時(shí)間的推移和各領(lǐng)域發(fā)展,會產(chǎn)生大量新實(shí)體,這些新產(chǎn)生的實(shí)體并沒有一個(gè)統(tǒng)一的命名規(guī)則,傳統(tǒng)的方法不再適用,此時(shí)要求NER 模型具有較強(qiáng)的上下文推理能力。

    (2)嵌套實(shí)體。嵌套實(shí)體是指該實(shí)體中存在其他命名實(shí)體。這類實(shí)體不僅需要識別外層實(shí)體,還要識別內(nèi)層實(shí)體,對模型來說具有很大的挑戰(zhàn),這也是目前NER 的一個(gè)研究熱點(diǎn)。

    (3)文本歧義。文本在某處為命名實(shí)體,而在另一處為普通名詞,或者為不同的實(shí)體類型,即文本類型是不明確的。因此,需要在NER 之前進(jìn)行額外的命名實(shí)體消歧任務(wù)。

    (4)非正式文本。隨著社交軟件的流行,如微博等社交媒體中含有大量的語料,但這些語料有著簡短、口語化、包含諧音等特點(diǎn),這使得NER 任務(wù)更加難于處理,可以使用注意力機(jī)制和遷移學(xué)習(xí)結(jié)合深度學(xué)習(xí)完成對非正式文本的識別。

    1.3 中文NER 的特殊性

    面向中文的NER 起步較晚,而且中文與英文等其他語言相差較大,由于其自身的語言特性,中文領(lǐng)域的NER 主要存在以下3 個(gè)特殊性。

    (1)中文詞語的邊界不明確。中文的單元詞匯邊界模糊,缺少英文文本中空格這樣明確的分隔符,也沒有明顯的詞形變換特征,因此容易造成許多邊界歧義,從而加大了NER 的難度。

    (2)中文NER 需要同中文分詞和語法分析相結(jié)合。只有準(zhǔn)確的中文分詞和語法分析才能正確劃分出命名實(shí)體,才能提升NER 的性能,這也額外增加了中文NER 的難度。

    (3)中文存在多義性、句式復(fù)雜表達(dá)靈活、多省略等特點(diǎn)。在不同領(lǐng)域的同一詞語所表示的含義并不相同,且同一語義也可能存在多種表達(dá)。此外,互聯(lián)網(wǎng)的迅速發(fā)展,尤其是網(wǎng)絡(luò)文本中的文字描述更加個(gè)性化和隨意化,這都使得實(shí)體的識別更加困難。

    1.4 NER 常用數(shù)據(jù)集

    常用于NER 的英文數(shù)據(jù)集有:MUC-6、MUC-7、CoNLL2002-2003、ACE2004-2005、GENIA、Onto-Notes5.0、BC5CDR、NCBI Disease、Few-NERD 等。中文數(shù)據(jù)集有:1998年人民日報(bào)數(shù)據(jù)集、MSRA、Onto-Notes5.0、BosonNLP NER、Weibo NER、Chinese Resume、CCKS2017-2020、CLUENER2020 等。以上數(shù)據(jù)集總結(jié)如表1 所示。

    表1 NER 數(shù)據(jù)集總結(jié)Table 1 Summary of NER datasets

    1.5 評估標(biāo)準(zhǔn)

    在NER 領(lǐng)域,通常使用準(zhǔn)確率(precision)、召回率(recall)和F1 值作為評估指標(biāo)。其中,準(zhǔn)確率是對于給定的測試數(shù)據(jù)集,分類器正確識別的實(shí)體樣本數(shù)與提取出來的全部實(shí)體樣本數(shù)之比;召回率則是對于給定的測試數(shù)據(jù)集,分類器正確識別測試集中的全部實(shí)體的百分比;而F1 值則是準(zhǔn)確率和召回率的調(diào)和平均值,可以對系統(tǒng)的性能進(jìn)行綜合性評價(jià)。準(zhǔn)確率、召回率和F1 值的計(jì)算公式如下:

    其中,表示將正例預(yù)測為正;表示將負(fù)例預(yù)測為正;表示將正例預(yù)測為負(fù)。

    2 NER 的方法

    根據(jù)NER 的發(fā)展歷程,主流的NER 方法可以分為3 類:基于規(guī)則和詞典的方法、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法。這3 類方法根據(jù)處理特點(diǎn)又細(xì)分為若干種不同的子方法。圖2 給出了NER 方法的詳細(xì)分類,后面的內(nèi)容圍繞該分類方法分別進(jìn)行詳細(xì)闡述。

    圖2 NER 方法的分類Fig.2 Classification of NER methods

    2.1 基于規(guī)則和詞典的NER 方法

    早期的NER 方法主要運(yùn)用由語言學(xué)專家根據(jù)語言知識特性手工構(gòu)造的規(guī)則模板,通過匹配的方式實(shí)現(xiàn)命名實(shí)體的識別。針對不同的數(shù)據(jù)集通常需要構(gòu)造特定的規(guī)則,一般根據(jù)特定統(tǒng)計(jì)信息、標(biāo)點(diǎn)符號、關(guān)鍵字、指示詞和方向詞、位置詞、中心詞等特征來構(gòu)造。Krupka提出了一個(gè)用于英文NER 的SRA系統(tǒng),系統(tǒng)包括NameTag 和HASTEN 兩個(gè)子系統(tǒng),HASTEN 根據(jù)文本的語義信息來構(gòu)造生成人名和地名規(guī)則模板,進(jìn)一步來識別。Shaalan 等利用文本的上下文特征構(gòu)造規(guī)則,并同時(shí)增加地名詞典來識別專業(yè)名詞。

    對于中文NER,最初的研究聚焦于專業(yè)名詞的研究,張小衡等根據(jù)機(jī)構(gòu)名稱的結(jié)構(gòu)規(guī)律和形態(tài)標(biāo)記等特點(diǎn)進(jìn)一步總結(jié)規(guī)則,從600 多萬的三地語料庫

    中識別高校名稱實(shí)體,正確率達(dá)到了97.3%。王寧等從專業(yè)名詞識別的角度,充分考慮金融領(lǐng)域的特征,利用規(guī)則的方法專門針對公司名的識別問題進(jìn)行了研究。該方法分析研究了金融新聞文本,總結(jié)了公司名的結(jié)構(gòu)特征以及上下文信息,歸納形成知識庫,并采取兩次掃描的策略進(jìn)行識別。在共1 336 篇真實(shí)金融新聞的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),其中在封閉測試環(huán)境中的準(zhǔn)確率和召回率分別為97.13%和89.13%,在開放測試環(huán)境中分別為62.18%和62.11%。

    表2 對上述提及到的方法進(jìn)行了總結(jié)?;谝?guī)則和詞典的方法可以利用相關(guān)語言特性或特定領(lǐng)域知識來制定規(guī)則,在特定的語料庫中該類方法具有較好的識別效果,但是該方法存在規(guī)則制定成本高、規(guī)則無法移植到其他語料等局限性。因此在其他大型語料中單純依靠這種方法較難獲得有效的識別結(jié)果。

    表2 基于規(guī)則和詞典的主流NER 方法總結(jié)Table 2 Summary of mainstream NER methods based on rules and dictionaries

    2.2 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的NER 方法

    隨著機(jī)器學(xué)習(xí)在NLP 領(lǐng)域的興起,研究者們借助機(jī)器學(xué)習(xí)的方法研究NER。這種方法可以在一定程度上克服基于規(guī)則和詞典的NER 方法的局限性,該類方法可以歸納為三種:有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。

    有監(jiān)督學(xué)習(xí)的NER 方法是將NER 任務(wù)轉(zhuǎn)換成分類問題,通過機(jī)器學(xué)習(xí)方法將已標(biāo)記的語料構(gòu)造為特征向量,以此建立分類模型來識別實(shí)體。基于特征的有監(jiān)督學(xué)習(xí)的NER 方法一般流程包括:(1)獲取實(shí)驗(yàn)原始數(shù)據(jù)。(2)對原始數(shù)據(jù)預(yù)處理。(3)根據(jù)數(shù)據(jù)的文本信息,選擇合適的特征。(4)給不同的特征設(shè)置不同的權(quán)重并選擇合適的分類器訓(xùn)練特征向量,得到NER 模型。(5)利用NER 模型進(jìn)行實(shí)體識別。(6)對結(jié)果進(jìn)行評估。

    采用有監(jiān)督機(jī)器學(xué)習(xí)的分類模型包括:HMM(hidden Markov models)、MEM(maximum entropy models)、SVM(support vector machines)和CRF(conditional random fields)等模型。

    (1)HMM

    基于HMM 的NER 方法利用維特比算法將可能的目標(biāo)序列分配給每個(gè)單詞序列,能夠捕捉現(xiàn)象的局部性,進(jìn)而提高了實(shí)體識別性能。Bikel 等基于大小寫、數(shù)字符號、句子首詞等特征,利用HMM 來計(jì)算某一單詞為某一實(shí)體類型的概率。但該模型仍然無法捕捉到遠(yuǎn)距離信息,還存在一些無法識別的實(shí)體。Zhou 等提出一種基于HMM 的組塊標(biāo)記器的NER 方法,在Bikel 的基礎(chǔ)上擴(kuò)充了內(nèi)部語義特征、內(nèi)部地名詞典特征以及外部上下文特征,對HMM 的傳統(tǒng)公式做了改進(jìn),以便能融合更多的上下文信息來確定當(dāng)前預(yù)測類型。

    對于中文NER,張華平等借助HMM 提出了基于角色標(biāo)注的中國人名自動(dòng)識別方法。該方法采取HMM 對分詞結(jié)果進(jìn)行角色標(biāo)注,通過對最佳角色序列的最大匹配來識別和分類命名實(shí)體,該方法解決了不具備明顯特征的姓名的丟失、內(nèi)部成詞以及上下文成詞的人名難召回的問題。俞鴻魁等提出一種基于層疊HMM 的中文NER 模型,該模型由三級HMM 構(gòu)成。在分詞后低層的HMM 識別普通無嵌套的人名、地名和機(jī)構(gòu)名等,高層的HMM 識別嵌套的人名、地名和機(jī)構(gòu)名。

    (2)MEM

    基于MEM 的NER 方法的主要思想是在已知部分知識的前提下選擇熵最大的概率分布,從而來確定某一實(shí)體的類型,MEM 能夠較好地融合多種特征信息進(jìn)行分類。Borthwick 等最早將MEM 用于英文NER 任務(wù),綜合考慮了首字母大小寫、句子的結(jié)尾信息以及文本是否為標(biāo)題等多種特征信息。Bender等在Borthwick 的基礎(chǔ)上進(jìn)行改進(jìn),模型結(jié)構(gòu)依次為輸入序列、預(yù)處理、全局搜索、后處理和序列標(biāo)注。

    對于中文NER,周雅倩等最早將MEM 應(yīng)用在中文名詞短語的識別上,將短語識別問題轉(zhuǎn)化為標(biāo)注問題。利用預(yù)定義的特征模板從語料中抽取候選特征,然后根據(jù)候選特征集識別名詞短語。但該模型未能將更多的語義、詞語共現(xiàn)等信息融合在模型中。因此,張玥杰等提出一種融合多特征的MEM中文NER 模型,該模型能集成局部與全局多種特征,將規(guī)則和機(jī)器學(xué)習(xí)的方法相結(jié)合,分別構(gòu)建了局部特征模板和全局特征模板,同時(shí)引入啟發(fā)式知識解決效率和空間問題。

    (3)SVM

    SVM 是定義為特征空間上的間隔最大的線性分類器。首先通過高維特征空間的轉(zhuǎn)化使分類問題轉(zhuǎn)換成線性可分問題,然后基于結(jié)構(gòu)風(fēng)險(xiǎn)最小理論構(gòu)建最優(yōu)分割超平面,使得分類器得到全局最優(yōu)化。該模型在NER 任務(wù)上被廣泛使用,Isozaki 等提出了一種基于SVM 的特征選擇方法以及有效的訓(xùn)練方法,能增加系統(tǒng)訓(xùn)練的速度。為了驗(yàn)證SVM 在不同領(lǐng)域的表現(xiàn)效果,Takeuchi等在MUC-6 評測語料與分子生物學(xué)領(lǐng)域語料使用SVM 進(jìn)行實(shí)體識別,發(fā)現(xiàn)SVM 在生物領(lǐng)域的NER 具有良好的表現(xiàn)。

    對于中文NER,李麗雙等提出一種基于SVM的中文地名的自動(dòng)識別的方法,結(jié)合地名的特點(diǎn)信息作為向量的特征。此外,面對訓(xùn)練數(shù)據(jù)不足的難點(diǎn),陳霄等針對中文組織機(jī)構(gòu)名的識別任務(wù),提出了一種基于SVM 的分布遞增式學(xué)習(xí)的方法,利用主動(dòng)學(xué)習(xí)的策略對訓(xùn)練樣本進(jìn)行選擇,逐步增加分類器訓(xùn)練樣本的規(guī)模,進(jìn)一步提高分類器的識別精度。

    (4)CRF

    CRF 模型統(tǒng)計(jì)了全局概率,不僅在局部進(jìn)行歸一化,且考慮了數(shù)據(jù)在全局的分布情況。CRF 具有表達(dá)長距離依賴性和交疊性的優(yōu)勢,能有效融入上下文信息以及領(lǐng)域知識,可以解決標(biāo)注偏置問題。即使CRF 具有時(shí)間復(fù)雜度高導(dǎo)致的訓(xùn)練難度大等問題,但仍十分廣泛地被用于NER。McCallum 等提出了一種基于CRF 的特征歸納的NER 方法,與傳統(tǒng)方法相比,自動(dòng)歸納特征既提高了準(zhǔn)確性,又顯著減少了特征數(shù)量。Krishnan 等提出了一種利用非局部依賴且基于兩個(gè)耦合的CRF 分類器的方法。第一層CRF 利用局部信息提取特征,第二層CRF 將局部信息和從第一層CRF 的輸出中提取的特征結(jié)合,在整個(gè)文檔中使用特征去捕捉非局部的依賴信息。

    對于中文NER,馮元勇等在CRF 框架中引入了小規(guī)模的常用尾字特征來降低特征集的規(guī)模,在提高模型訓(xùn)練速度同時(shí)保證識別準(zhǔn)確率。燕楊等針對中文電子病歷的NER 問題,提出一種層疊CRF,該模型在第二層中使用包含實(shí)體和詞性等特征的特征集,對疾病名稱和臨床癥狀兩類命名實(shí)體進(jìn)行識別。與無自定義組合特征的層疊CRF 相比,該模型的F1 值提高了約3 個(gè)百分點(diǎn),和單層CRF 相比,F(xiàn)1 值提高了約7 個(gè)百分點(diǎn)。

    綜上所述,以上幾種有監(jiān)督機(jī)器學(xué)習(xí)NER 方法各有所長,也各有所短。研究者充分利用各種算法的優(yōu)勢,進(jìn)一步提升實(shí)體識別的性能。上述幾種方法的相關(guān)比較如表3 所示。

    表3 基于有監(jiān)督機(jī)器學(xué)習(xí)NER 比較Table 3 Comparison of NER methods for supervised machine learning

    有監(jiān)督學(xué)習(xí)的方法需要專家手工標(biāo)注大量訓(xùn)練數(shù)據(jù),為了解決這一問題,學(xué)者開始研究利用少量的標(biāo)注語料進(jìn)行NER 任務(wù),因此,半監(jiān)督的NER 方法應(yīng)運(yùn)而生。該方法通過使用少量標(biāo)記和大量無標(biāo)記的語料庫進(jìn)行NER 的研究。半監(jiān)督學(xué)習(xí)NER 的一般流程:(1)人工構(gòu)造初始種子集合。(2)根據(jù)命名實(shí)體上下文信息生成相關(guān)聯(lián)的模式。(3)將生成的模式和測試數(shù)據(jù)匹配,標(biāo)識出新的命名實(shí)體,生成新的模式,便于促進(jìn)循環(huán)。(4)將新識別的命名實(shí)體添加到實(shí)體集合中。流程圖如圖3 所示。

    圖3 半監(jiān)督學(xué)習(xí)的NER 一般流程Fig.3 General process of NER based on semi-supervised learning

    半監(jiān)督學(xué)習(xí)的NER 方法主要采用自舉的方法,該方法利用少量的標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練,從而取得良好的實(shí)驗(yàn)結(jié)果。如Teixeira等提出一種基于CRF 的自舉訓(xùn)練方法,首先基于詞典對50 000 條新聞標(biāo)注人名,并使用標(biāo)注好人名的數(shù)據(jù)作為訓(xùn)練集建立基于CRF 的分類模型。然后使用CRF 分類模型對初始種子語料庫額外標(biāo)注,并將其用于訓(xùn)練新的分類模型。該模型經(jīng)過7 次自舉方法的迭代后,在HAREM數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)表現(xiàn)良好。此外,Thenmalar 等不僅在英文語料中使用半監(jiān)督的自舉方法,還增加了泰米爾文語料進(jìn)一步驗(yàn)證該方法的可行性。該方法利用少量訓(xùn)練數(shù)據(jù)中命名實(shí)體、單詞和上下文特征來定義模式,分別對英文和泰米爾文進(jìn)行NER,兩種語言的平均F1 值為75%。

    對于中文NER,針對結(jié)構(gòu)復(fù)雜的產(chǎn)品名的識別任務(wù),黃詩琳等提出一種半監(jiān)督學(xué)習(xí)方法,提取不同產(chǎn)品實(shí)體的結(jié)構(gòu)特征和相互關(guān)系,構(gòu)建一種三層半監(jiān)督學(xué)習(xí)框架。首層結(jié)合規(guī)則和詞典選取數(shù)據(jù)集中的候選數(shù)據(jù);第二層利用相似度算法,把與種子集上下文相似的候選詞加入正例中,這一步驟能解決數(shù)據(jù)稀疏問題;第三層是一個(gè)CRF 的分類器用于識別相似度較低的實(shí)體。但因產(chǎn)品名的表達(dá)方式多樣化,該方法與一般的NER 方法相比,性能還存在一定的差距。在醫(yī)學(xué)NER 任務(wù)上,Long 等提出一個(gè)基于自舉的NER 方法,在自舉訓(xùn)練過程中將命名實(shí)體特征集表示為類特征向量,候選命名實(shí)體的上下文信息表示為示例特征向量,這兩種特征向量的相似程度決定了候選實(shí)體是否為命名實(shí)體。此外,針對少數(shù)民族語言的NER 任務(wù),王路路等以CRF 為基本框架,通過引入詞法特征、詞典特征以及基于詞向量的無監(jiān)督學(xué)習(xí)特征,對比不同特征對識別結(jié)果的影響,進(jìn)而得到最優(yōu)模型。

    為了解決跨域和跨語言標(biāo)注文本的不足,學(xué)者們提出了NER 的無監(jiān)督學(xué)習(xí)技術(shù)。無監(jiān)督學(xué)習(xí)是不需要使用標(biāo)注數(shù)據(jù)的算法,該方法使用未標(biāo)注的數(shù)據(jù)來做出決策。無監(jiān)督學(xué)習(xí)旨在考慮數(shù)據(jù)的結(jié)構(gòu)和分布特征,從而發(fā)現(xiàn)更多關(guān)于數(shù)據(jù)的學(xué)習(xí)。

    早期,Etzioni 等提出了一個(gè)名為KnowwitAll的無監(jiān)督NER 系統(tǒng),該系統(tǒng)以無監(jiān)督和可擴(kuò)展的方式自動(dòng)地從網(wǎng)頁中提取大量命名實(shí)體。Nadeau 等在Etzioni 等的基礎(chǔ)上進(jìn)一步研究,該系統(tǒng)可以自動(dòng)構(gòu)建地名詞典以及消解命名實(shí)體歧義,將構(gòu)建的地名詞典與常用的地名詞典相結(jié)合。Han 等提出一個(gè)基于聚類主動(dòng)學(xué)習(xí)的生物醫(yī)學(xué)NER 系統(tǒng),該聚類方法通過使用底層分類器在文檔中查找候選命名實(shí)體來進(jìn)行聚類,因而更能反映命名實(shí)體的分布。

    綜上所述,無監(jiān)督學(xué)習(xí)的NER 方法既能解決有監(jiān)督學(xué)習(xí)中需要大量帶標(biāo)注的訓(xùn)練數(shù)據(jù)的問題,也不需要少量標(biāo)注的種子數(shù)據(jù),但是這種方法需要提前確定聚類閾值并且性能較低,仍需進(jìn)一步改善聚類方法。

    對基于有監(jiān)督、半監(jiān)督、無監(jiān)督的三種方法進(jìn)行了比較,如表4 所示,并對基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的各種主流NER 模型進(jìn)行了總結(jié),如表5 所示。

    表4 基于有監(jiān)督、半監(jiān)督、無監(jiān)督的NER 比較Table 4 Comparison of NER methods for supervised,semi-supervised and unsupervised

    表5 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的主流NER 模型總結(jié)Table 5 Summary of mainstream NER models for statistical machine learning

    2.3 基于深度學(xué)習(xí)的NER 方法

    基于深度學(xué)習(xí)的方法對處理NER 等序列標(biāo)注任務(wù)的處理流程是類似的。首先,將序列通過Word2Vec 等編碼方式轉(zhuǎn)換成分布式表示,隨后將句子的特征表示輸入到編碼器中,利用神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征,最后使用CRF 等解碼器來預(yù)測序列中詞對應(yīng)的標(biāo)簽。早期,研究者大多對基于有監(jiān)督和遠(yuǎn)程監(jiān)督兩種深度學(xué)習(xí)的NER 方法進(jìn)行深入研究。預(yù)訓(xùn)練模型BERT(bidirectional encoder representation from transformers)自2018 年提出以來,也備受研究者關(guān)注。最近,基于提示學(xué)習(xí)的方法也在NER 任務(wù)上得到了初步嘗試,并取得了成功。

    基于深度學(xué)習(xí)的NER 方法一般流程如圖4 所示,共分為4 步:(1)Sequence,預(yù)處理后的輸入序列。(2)Word embedding,將輸入序列轉(zhuǎn)換成固定長度的向量表示。(3)Context encoder,將詞嵌入進(jìn)行語義編碼。(4)Tag decoder,進(jìn)一步進(jìn)行標(biāo)簽解碼。

    圖4 基于深度學(xué)習(xí)的NER 一般流程Fig.4 General process of NER based on deep learning

    基于有監(jiān)督深度學(xué)習(xí)的方法目前主要分為CNN(convolutional neural network)、RNN(recurrent neural network)和GNN(graph neural network)等。

    (1)CNN

    早期,CNN 在計(jì)算機(jī)視覺領(lǐng)域取得突破性成果,后來也逐漸在NLP 領(lǐng)域被廣泛使用。2011 年,Collobert 等提出了一種基于CNN 的NLP 模型,能處理包含NER 等多種任務(wù)。該模型不需要利用人工輸入特征,而是基于大量未標(biāo)記的訓(xùn)練數(shù)據(jù)來學(xué)習(xí)內(nèi)部表示,在輸入時(shí)減少特征的預(yù)處理,使用以端到端方式訓(xùn)練的多層神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)。在Collobert 等的基礎(chǔ)上,Yao 等將CNN 應(yīng)用到生物醫(yī)學(xué)NER 上,模型具有多層結(jié)構(gòu),每層根據(jù)底層生成的特征提取特征。該模型具有良好準(zhǔn)確率,但并未充分利用CPU并行性,其計(jì)算效率不高,因此,Strubell 等提出了一種迭代擴(kuò)張卷積神經(jīng)網(wǎng)絡(luò)(ID-CNNs),與傳統(tǒng)的CNN 相比,該模型具有更好的上下文和結(jié)構(gòu)化預(yù)測能力并能大幅縮短訓(xùn)練時(shí)間。

    對于中文NER,2015 年Wu 等利用卷積層生成由多個(gè)全局隱藏節(jié)點(diǎn)表示的全局特征,然后利用局部特征和全局特征以識別臨床文本中的命名實(shí)體。Wu 等提出了一種CNN-LSTM-CRF,以獲取短距離和長距離內(nèi)容依賴,同時(shí)提出將NER 和分詞任務(wù)聯(lián)合學(xué)習(xí)以挖掘這兩個(gè)任務(wù)之間的內(nèi)在聯(lián)系,增強(qiáng)中文NER 模型識別實(shí)體邊界的能力,但該模型無法捕捉全局的上下文信息。因此,Kong 等提出一種融合多層次CNN 和注意力機(jī)制的中文臨床NER 方法。該方法既能捕捉短距離和長距離的上下文信息,且注意力機(jī)制還能獲取全局上下文信息,進(jìn)一步解決了LSTM 在句子較長時(shí)無法捕捉全局信息的問題。但該方法目前對稀有命名實(shí)體仍然存在難以識別的問題,因此,Gui 等將詞典信息融合到CNN 結(jié)構(gòu)中,解決稀有實(shí)體識別的問題。

    綜上所述,CNN 最大的特點(diǎn)是可以并行化,每個(gè)時(shí)間狀態(tài)不受上一時(shí)間狀態(tài)的影響,但其無法很好地提取序列信息。隨著RNN 的深入研究,CNN 和RNN 常?;旌鲜褂?。

    (2)RNN

    RNN 是基于深度學(xué)習(xí)的NER 方法中的主流模型,RNN 將語言視為序列數(shù)據(jù),能很好地處理序列數(shù)據(jù),解決了CNN 無法記憶上下文信息的問題。Huang 等在Collobert 等基礎(chǔ)上,提出了多種基于LSTM 的序列標(biāo)注模型,包括LSTM、Bi-LSTM 和Bi-LSTM-CRF 等。首次將Bi-LSTM-CRF 模型用于NER,該模型不僅可以同時(shí)利用上下文的信息,而且可以使用句子作為輸入。Gregoric 等在同一輸入端采用多個(gè)獨(dú)立的Bi-LSTM 單元,通過使用模型間正則化來促進(jìn)LSTM 單元之間的多樣性,能夠減少模型的參數(shù)。Li 等提出一個(gè)模塊化交互網(wǎng)絡(luò)模型用于NER,能同時(shí)利用段級信息和詞級依賴。Xu 等提出一種有監(jiān)督多頭自注意網(wǎng)絡(luò)的NER 模型,利用自我注意力機(jī)制獲取句子中詞與詞之間的關(guān)系,并引入一個(gè)多任務(wù)學(xué)習(xí)框架來捕捉實(shí)體邊界檢測和實(shí)體分類之間的依賴關(guān)系。

    對于中文NER,Zhang 等首次提出了基于混合字符和詞典的Lattice-LSTM 模型,通過門控單元,將詞匯信息嵌入到每個(gè)字符中,從而利用上下文中有用的詞匯提升NER 效果。但是由于詞匯的長度和數(shù)量無法確定,Lattice-LSTM 存在無法批量訓(xùn)練而導(dǎo)致模型訓(xùn)練較慢的問題。為了解決該問題,Liu 等提出了基于單詞的LSTM(WC-LSTM)。該方法在輸入的向量中融入最優(yōu)詞匯的信息,在正向LSTM 中融入基于該字開頭的詞匯信息,在反向LSTM 中融入基于該字結(jié)尾的詞匯信息。Ma 等也在Lattice-LSTM 模型基礎(chǔ)上做了改進(jìn),不修改LSTM 的內(nèi)部結(jié)構(gòu),只在輸入層進(jìn)行詞與所有匹配到的詞匯信息的融合,該方法還可以應(yīng)用到不同的序列模型框架中,如CNN和Transformer。

    (3)GNN

    近年來,GCN(graph convolutional network)和GGNN(gated graph neural network)在NER 任務(wù)中得到廣泛的關(guān)注。Cetoli 等率先在NER 任務(wù)中使用圖GCN 來解決實(shí)體識別問題,在傳統(tǒng)的Bi-LSTMCRF 模型的Bi-LSTM 層和CRF 層中間額外添加一層GCN 層。Bi-GCN 層利用句子的句法依存關(guān)系構(gòu)圖,通過GCN 將節(jié)點(diǎn)信息傳遞給最近的節(jié)點(diǎn),通過將層圖堆疊在一起,該網(wǎng)絡(luò)結(jié)構(gòu)可以傳播最多相距跳的節(jié)點(diǎn)特征。

    在中文領(lǐng)域,為了解決在NER 過程中使用詞典的最長匹配和最短匹配帶來的問題,Ding 等提出了一種基于GNN 并結(jié)合地名詞典的NER 方法,其目的使模型自動(dòng)學(xué)習(xí)詞典的特征。該模型首先根據(jù)地名詞典構(gòu)圖,然后依次通過GGNN 層、LSTM 層和CRF層進(jìn)行實(shí)體的識別。Gui等通過引入一個(gè)具有全局語義的基于詞典的GNN 模型來獲取全局信息。此外,Tang 等進(jìn)一步研究了如何將詞匯信息整合到基于字符的方法中,提出一種基于單詞-字符圖卷積網(wǎng)絡(luò)(WC-GCN),通過使用交叉GCN 塊同時(shí)處理兩個(gè)有向無環(huán)圖,并引入全局GCN 塊來學(xué)習(xí)全局上下文的節(jié)點(diǎn)表示。

    基于遠(yuǎn)程監(jiān)督深度學(xué)習(xí)的方法主要利用外部詞典或知識庫對無標(biāo)注數(shù)據(jù)進(jìn)行標(biāo)注,可以解決有監(jiān)督學(xué)習(xí)需要大量已標(biāo)注數(shù)據(jù)這一問題,其常采用的方式包括詞典匹配和詞典匹配與神經(jīng)網(wǎng)絡(luò)相融合兩種。Peng 等僅借助未標(biāo)記數(shù)據(jù)和命名實(shí)體詞典,提出了一種新的PU(positive-unlabeled)遠(yuǎn)程監(jiān)督NER模型,該模型不需要利用詞典標(biāo)記句子中的每個(gè)實(shí)體,能大幅度降低對詞典質(zhì)量的要求。此外,Yang等提出了一個(gè)基于部分標(biāo)注學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的遠(yuǎn)程監(jiān)督的NER 模型,不僅可以通過遠(yuǎn)程監(jiān)督自動(dòng)獲取到大規(guī)模的訓(xùn)練數(shù)據(jù),而且通過使用部分標(biāo)注學(xué)習(xí)和強(qiáng)化標(biāo)注學(xué)習(xí),解決了遠(yuǎn)程監(jiān)督方法產(chǎn)生的不完全標(biāo)注和噪音標(biāo)注的問題。

    對于中文NER,Zhang 等利用遠(yuǎn)程監(jiān)督的方法識別時(shí)間,提出了一種利用中文知識圖譜和百度百科生成的數(shù)據(jù)集進(jìn)行模型訓(xùn)練的方法,該方法不需要像手動(dòng)標(biāo)注數(shù)據(jù),且對不同類型的文本的適應(yīng)性良好。此外,邊俐菁基于深度學(xué)習(xí)和遠(yuǎn)程監(jiān)督的方法針對產(chǎn)品進(jìn)行實(shí)體識別,利用爬蟲整理得到的詞典高質(zhì)量地標(biāo)注數(shù)據(jù),按照詞典完全匹配、完全匹配+規(guī)則、核心詞匯+詞性擴(kuò)展+規(guī)則這三種方式進(jìn)行實(shí)體識別,該方法能大大減少手工標(biāo)注語料庫的工作量。

    遠(yuǎn)程監(jiān)督的方法相對于有監(jiān)督的方法極大地減少了人工成本,但遠(yuǎn)程監(jiān)督的方法會產(chǎn)生不完全標(biāo)注和噪音標(biāo)注,導(dǎo)致自動(dòng)標(biāo)注獲得的數(shù)據(jù)集準(zhǔn)確率較低,會影響整個(gè)NER 模型的性能。

    基于Transformer 方法典型代表是BERT 類的預(yù)訓(xùn)練模型。Souza 等在NER 任務(wù)上提出一種BERT-CRF 模型,將BERT 的傳輸能力與CRF 的結(jié)構(gòu)化預(yù)測相結(jié)合。Naseem 等提出一種針對生物醫(yī)學(xué)NER 的預(yù)訓(xùn)練語言模型BioALBERT,該模型在ALBERT 中使用自我監(jiān)督損失,能較好學(xué)習(xí)上下文相關(guān)的信息。Yang 等提出了一種分層的Transformer模型,應(yīng)用于嵌套的NER。實(shí)體表征學(xué)習(xí)結(jié)合了以自下而上和自上而下的方式聚集的相鄰序列的上下文信息。

    對于中文NER,李妮等提出了基于BERTIDCNN-CRF 的中文NER 模型,該模型通過BERT 預(yù)訓(xùn)練模型得到字的上下文表示,再將字向量序列輸入IDCNN-CRF 模型中進(jìn)行訓(xùn)練。Li等為解決大規(guī)模標(biāo)記的臨床數(shù)據(jù)匱乏問題,在未標(biāo)記的中國臨床電子病歷文本上利用BERT 模型進(jìn)行預(yù)訓(xùn)練,從而利用未標(biāo)記的領(lǐng)域特定知識,同時(shí)將詞典特征整合到模型中,利用漢字字根特征進(jìn)一步提高模型的性能。Wu 等在Li 等的基礎(chǔ)上,提出了一個(gè)基于RoBERTa 和字根特征的模型,使用RoBERTa 學(xué)習(xí)醫(yī)學(xué)特征,同時(shí)利用Bi-LSTM 提取偏旁部首特征和RoBERTa 學(xué)習(xí)到醫(yī)學(xué)特征向量做拼接,解碼層使用CRF 進(jìn)行標(biāo)簽解碼。Yao 等針對制造文本進(jìn)行細(xì)粒度實(shí)體識別,提出一種基于ALBERT-AttBiLSTMCRF 和遷移學(xué)習(xí)的模型,使用更輕量級的預(yù)訓(xùn)練模型ALBERT 對原始數(shù)據(jù)進(jìn)行詞嵌入,Bi-LSTM 提取詞嵌入的特征并獲取上下文的信息,解碼層使用CRF 進(jìn)行標(biāo)簽解碼。

    隨著NLP 技術(shù)的發(fā)展,近兩年有研究者在低資源任務(wù)中使用提示學(xué)習(xí)的方法來獲得良好的任務(wù)效果。提示學(xué)習(xí)通常不需要改變預(yù)訓(xùn)練語言模型的結(jié)構(gòu)和參數(shù),而是通過向輸入中添加一些提示信息,并修改下游任務(wù)來適應(yīng)預(yù)訓(xùn)練模型,進(jìn)而獲得更好的任務(wù)效果的一種方法。Brown 等首次在文本分類任務(wù)中使用提示學(xué)習(xí)的方法進(jìn)行了小樣本學(xué)習(xí)任務(wù)。在低資源的NER 任務(wù)中,沒有大規(guī)模的訓(xùn)練語料,大量依賴訓(xùn)練數(shù)據(jù)的模型都無法取得較好的效果。因此在低資源的NER 任務(wù)中使用提示學(xué)習(xí)是現(xiàn)在的一種新思路。Cui 等提出一種基于模板的NER 方法,再利用標(biāo)注實(shí)體填充的預(yù)定義模板提示對預(yù)訓(xùn)練模型BART(bidirectional and auto-regressive Transformers)微調(diào),該方法解決了小樣本NER 的問題。Chen 等受提示學(xué)習(xí)的啟發(fā),提出一種輕量級的低資源提示引導(dǎo)型注意生成框架,將連續(xù)的提示輸入到自我注意層中,來重新調(diào)節(jié)注意力并調(diào)整預(yù)先訓(xùn)練的權(quán)重。基于模板提示的方法需要枚舉所有可能的候選實(shí)體,存在較高的計(jì)算復(fù)雜度問題,因此,Ma 等提出一種在小樣本場景下無模板的提示微調(diào)方法,放棄模板構(gòu)建的枚舉思路,采用預(yù)訓(xùn)練任務(wù)中的掩碼預(yù)測任務(wù)的方式,將NER 任務(wù)轉(zhuǎn)化成將實(shí)體位置的詞預(yù)測為標(biāo)簽詞的任務(wù)。該方法能減少預(yù)訓(xùn)練和微調(diào)之間的差距并且解碼速度比基線方法快1 930.12 倍。此外,Liu 等提出一種帶有問答的提示學(xué)習(xí)NER 方法,將NER 問題轉(zhuǎn)換成問答任務(wù)。該方法在低資源的場景下具有更高的性能和更強(qiáng)的魯棒性??偟膩碚f,提示學(xué)習(xí)在低資源場景的NER任務(wù)上得到了初步嘗試,未來會有更多復(fù)雜的方法來增強(qiáng)提示,并應(yīng)用于低資源場景下的許多任務(wù)中。

    綜上所述,本文針對基于有監(jiān)督深度學(xué)習(xí)、基于遠(yuǎn)程監(jiān)督深度學(xué)習(xí)、基于Transformer 和基于提示學(xué)習(xí)的四種方法進(jìn)行了比較分析,具體如表6 所示。此外,本文還總結(jié)了一些經(jīng)典的基于深度學(xué)習(xí)的NER模型,具體如表7 所示。

    表6 基于深度學(xué)習(xí)的NER 方法比較Table 6 Comparison of NER methods for deep learning

    表7 基于深度學(xué)習(xí)的主流NER 模型總結(jié)Table 7 Summary of mainstream NER models for deep learning

    3 NER 的研究趨勢

    目前,NER 技術(shù)日漸成熟,但依然需要研究人員投入大量精力進(jìn)行不斷探索,通過對現(xiàn)有NER 研究工作進(jìn)行總結(jié),在以后的研究中可以從下面幾個(gè)方面展開相關(guān)的研究。

    (1)多任務(wù)聯(lián)合學(xué)習(xí)。傳統(tǒng)的pipeline 模型有一定的局限性,例如,NER 任務(wù)中的實(shí)體標(biāo)注錯(cuò)誤,將會進(jìn)一步導(dǎo)致后續(xù)任務(wù)的標(biāo)注錯(cuò)誤;同時(shí),多個(gè)任務(wù)之間會有一定信息共享,但是pipeline 模型是無法利用這些潛在的信息的。多任務(wù)的聯(lián)合學(xué)習(xí),能解決pipeline 模型局限,使得多任務(wù)學(xué)習(xí)之間相互影響,提高學(xué)習(xí)的性能,利用這種方法來進(jìn)一步研究NER 仍是未來的一個(gè)研究熱點(diǎn)。

    (2)基于提示學(xué)習(xí)的低資源NER 研究。在近些年的研究中,NER 任務(wù)在廣度上已經(jīng)延伸到跨領(lǐng)域、跨任務(wù)和跨語言等任務(wù)中。在一般領(lǐng)域,大多數(shù)最先進(jìn)的NER 模型需要依賴大量已標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練,這使得它們難以擴(kuò)展到新的、資源較少的語言中。隨著提示學(xué)習(xí)在低資源NER任務(wù)上的成功應(yīng)用,這種方法能在低資源和高資源之間架起橋梁,從而實(shí)現(xiàn)知識轉(zhuǎn)移。因此,探索更優(yōu)的提示學(xué)習(xí)方法來提升低資源的NER模型性能是該領(lǐng)域的重要研究方向。

    (3)中文嵌套NER 的研究。由于中文構(gòu)詞規(guī)則,中文信息文本中的實(shí)體嵌套更為明顯,此外中文詞語沒有明顯的邊界,使得中文的嵌套NER 具有一定挑戰(zhàn)。近年來,隨著深度學(xué)習(xí)的發(fā)展,中文嵌套NER方法出現(xiàn)新思路,如金彥亮等提出一種基于分層標(biāo)注的中文嵌套NER 的方法,能充分捕捉嵌套實(shí)體之前的邊界信息,有效地提高中文嵌套NER 的效果。因此,將各種神經(jīng)網(wǎng)絡(luò)、BERT、注意力機(jī)制等方法融合用于中文嵌套NER 仍然值得研究。

    猜你喜歡
    監(jiān)督特征信息
    突出“四個(gè)注重” 預(yù)算監(jiān)督顯實(shí)效
    如何表達(dá)“特征”
    不忠誠的四個(gè)特征
    抓住特征巧觀察
    監(jiān)督見成效 舊貌換新顏
    訂閱信息
    中華手工(2017年2期)2017-06-06 23:00:31
    夯實(shí)監(jiān)督之基
    展會信息
    中外會展(2014年4期)2014-11-27 07:46:46
    監(jiān)督宜“補(bǔ)”不宜“比”
    浙江人大(2014年4期)2014-03-20 16:20:16
    線性代數(shù)的應(yīng)用特征
    河南科技(2014年23期)2014-02-27 14:19:15
    亚洲成人手机| 高清在线视频一区二区三区| 国产不卡av网站在线观看| 叶爱在线成人免费视频播放| 少妇人妻久久综合中文| 王馨瑶露胸无遮挡在线观看| 亚洲国产精品国产精品| 90打野战视频偷拍视频| 成人国产麻豆网| 亚洲情色 制服丝袜| 午夜激情av网站| 国产一区有黄有色的免费视频| 亚洲av日韩精品久久久久久密 | 成人黄色视频免费在线看| 欧美日韩亚洲国产一区二区在线观看 | 亚洲伊人久久精品综合| 精品国产国语对白av| 日韩一区二区三区影片| 热99久久久久精品小说推荐| 免费高清在线观看视频在线观看| 久久久久人妻精品一区果冻| 老司机影院成人| 一个人免费看片子| 51午夜福利影视在线观看| 成年av动漫网址| 亚洲成人一二三区av| 亚洲精品久久成人aⅴ小说| 天堂中文最新版在线下载| 国产成人免费观看mmmm| 欧美国产精品va在线观看不卡| videos熟女内射| 国产免费现黄频在线看| 99精品久久久久人妻精品| 中国国产av一级| 免费日韩欧美在线观看| 一区福利在线观看| 这个男人来自地球电影免费观看 | avwww免费| 精品免费久久久久久久清纯 | 波多野结衣一区麻豆| 欧美精品一区二区免费开放| 青草久久国产| 哪个播放器可以免费观看大片| 男人操女人黄网站| 国产成人91sexporn| 国产欧美日韩综合在线一区二区| 亚洲熟女精品中文字幕| 又大又黄又爽视频免费| 十分钟在线观看高清视频www| 日本猛色少妇xxxxx猛交久久| 久久影院123| 久久99热这里只频精品6学生| 精品少妇内射三级| 最近手机中文字幕大全| 亚洲国产精品成人久久小说| 另类精品久久| 国产av一区二区精品久久| 中文天堂在线官网| 久久影院123| 亚洲欧美激情在线| 日韩,欧美,国产一区二区三区| 国产一区二区三区av在线| 久久久久久久久免费视频了| 丝袜在线中文字幕| 99精国产麻豆久久婷婷| 各种免费的搞黄视频| 欧美 亚洲 国产 日韩一| 久久精品国产a三级三级三级| 亚洲av电影在线进入| 日本wwww免费看| 午夜福利视频精品| 久久久久久人妻| 在线天堂中文资源库| 美女主播在线视频| 精品久久久精品久久久| videos熟女内射| 男女之事视频高清在线观看 | 国产亚洲最大av| 亚洲精品成人av观看孕妇| 免费看不卡的av| 日韩大码丰满熟妇| 观看美女的网站| 久久精品久久久久久久性| 亚洲,欧美,日韩| 制服诱惑二区| 久久 成人 亚洲| 亚洲国产成人一精品久久久| 1024香蕉在线观看| 成人午夜精彩视频在线观看| 一本色道久久久久久精品综合| 多毛熟女@视频| 午夜福利视频精品| 亚洲av综合色区一区| 国产精品国产av在线观看| 美女脱内裤让男人舔精品视频| 一级,二级,三级黄色视频| 一级毛片 在线播放| 久久久久久久久免费视频了| 91精品伊人久久大香线蕉| 国产精品熟女久久久久浪| 麻豆乱淫一区二区| 中文字幕亚洲精品专区| 亚洲激情五月婷婷啪啪| 久久这里只有精品19| 婷婷色综合大香蕉| 一级毛片 在线播放| 国精品久久久久久国模美| 久久精品亚洲熟妇少妇任你| 老司机靠b影院| 亚洲国产日韩一区二区| 成人国产av品久久久| 精品一品国产午夜福利视频| 午夜av观看不卡| 一区二区三区四区激情视频| 久久精品国产a三级三级三级| 丝袜美腿诱惑在线| 丰满乱子伦码专区| 男人舔女人的私密视频| 免费观看av网站的网址| 久久久精品94久久精品| 午夜精品国产一区二区电影| 最近最新中文字幕大全免费视频 | 在线免费观看不下载黄p国产| 宅男免费午夜| 人人妻人人澡人人看| 人妻人人澡人人爽人人| 久久久欧美国产精品| av在线观看视频网站免费| 啦啦啦中文免费视频观看日本| 韩国精品一区二区三区| 日韩人妻精品一区2区三区| 国产日韩一区二区三区精品不卡| 日日啪夜夜爽| 国产成人精品无人区| 成人18禁高潮啪啪吃奶动态图| 国产精品久久久久久久久免| 亚洲国产精品一区二区三区在线| 久久99热这里只频精品6学生| 亚洲伊人色综图| 国产成人精品无人区| 欧美精品av麻豆av| 伊人久久国产一区二区| 十八禁人妻一区二区| 一区二区三区四区激情视频| 久久婷婷青草| 最黄视频免费看| 亚洲国产欧美网| 国产免费又黄又爽又色| 别揉我奶头~嗯~啊~动态视频 | 久久97久久精品| 国产日韩欧美亚洲二区| 这个男人来自地球电影免费观看 | 亚洲欧美一区二区三区黑人| 午夜免费鲁丝| 男人添女人高潮全过程视频| 少妇被粗大猛烈的视频| 欧美精品亚洲一区二区| 成人免费观看视频高清| 亚洲欧洲精品一区二区精品久久久 | 精品视频人人做人人爽| bbb黄色大片| 在现免费观看毛片| 大香蕉久久网| 欧美另类一区| 国产亚洲av片在线观看秒播厂| 国产女主播在线喷水免费视频网站| 亚洲图色成人| av网站免费在线观看视频| 亚洲av福利一区| 免费女性裸体啪啪无遮挡网站| 交换朋友夫妻互换小说| √禁漫天堂资源中文www| 下体分泌物呈黄色| 性色av一级| 国产野战对白在线观看| 伦理电影大哥的女人| 日本午夜av视频| 成人影院久久| 侵犯人妻中文字幕一二三四区| 久久天堂一区二区三区四区| 精品久久久久久电影网| 在线观看www视频免费| 免费高清在线观看日韩| 久久人人爽av亚洲精品天堂| 亚洲欧美色中文字幕在线| 亚洲精品,欧美精品| av国产久精品久网站免费入址| 亚洲精品久久成人aⅴ小说| 69精品国产乱码久久久| 午夜激情av网站| 国产在线免费精品| 国产成人啪精品午夜网站| 久久久久久人人人人人| 天堂中文最新版在线下载| 欧美久久黑人一区二区| 久久精品熟女亚洲av麻豆精品| 男人操女人黄网站| 97精品久久久久久久久久精品| 国产在线免费精品| 久久久久人妻精品一区果冻| 欧美在线黄色| bbb黄色大片| 午夜激情av网站| 女人久久www免费人成看片| 久久久国产一区二区| 亚洲国产欧美日韩在线播放| 久久天躁狠狠躁夜夜2o2o | a 毛片基地| 九草在线视频观看| 国产精品一区二区在线不卡| 日韩视频在线欧美| 极品人妻少妇av视频| 一级a爱视频在线免费观看| 成人亚洲精品一区在线观看| 黑人欧美特级aaaaaa片| 欧美精品高潮呻吟av久久| 黄片无遮挡物在线观看| 亚洲国产精品成人久久小说| 欧美日韩综合久久久久久| 伦理电影免费视频| 亚洲第一av免费看| 国产一区二区在线观看av| 久久久久国产精品人妻一区二区| 欧美日韩一区二区视频在线观看视频在线| 观看美女的网站| 国产免费又黄又爽又色| 色婷婷av一区二区三区视频| 晚上一个人看的免费电影| 男女下面插进去视频免费观看| 一边亲一边摸免费视频| 亚洲精品国产av蜜桃| 人成视频在线观看免费观看| 国产免费视频播放在线视频| 亚洲,欧美精品.| 桃花免费在线播放| 免费黄网站久久成人精品| 久久久亚洲精品成人影院| 一区二区三区四区激情视频| 成年动漫av网址| 亚洲av成人精品一二三区| 亚洲精品第二区| 欧美日韩综合久久久久久| 青青草视频在线视频观看| 天天影视国产精品| 国产成人91sexporn| 国产精品一二三区在线看| 欧美日韩一区二区视频在线观看视频在线| 国精品久久久久久国模美| 成人午夜精彩视频在线观看| 又粗又硬又长又爽又黄的视频| 天天躁夜夜躁狠狠躁躁| 波多野结衣一区麻豆| 午夜激情av网站| 精品国产一区二区三区久久久樱花| 成人漫画全彩无遮挡| 国产成人系列免费观看| 日本vs欧美在线观看视频| 免费看av在线观看网站| 中文天堂在线官网| 五月天丁香电影| 人人妻人人澡人人爽人人夜夜| 青春草亚洲视频在线观看| 一个人免费看片子| 99久久精品国产亚洲精品| 妹子高潮喷水视频| a级毛片在线看网站| 欧美乱码精品一区二区三区| 色94色欧美一区二区| 久久人人爽av亚洲精品天堂| 亚洲精华国产精华液的使用体验| 夫妻午夜视频| 国产淫语在线视频| 777米奇影视久久| 成年av动漫网址| 大香蕉久久成人网| 一级黄片播放器| 51午夜福利影视在线观看| 少妇猛男粗大的猛烈进出视频| 久久久欧美国产精品| xxx大片免费视频| 亚洲美女搞黄在线观看| 最黄视频免费看| 国产日韩欧美视频二区| 亚洲一区二区三区欧美精品| 九色亚洲精品在线播放| 欧美在线一区亚洲| 亚洲欧美清纯卡通| 大陆偷拍与自拍| 久久97久久精品| 宅男免费午夜| 制服人妻中文乱码| 欧美变态另类bdsm刘玥| svipshipincom国产片| 极品少妇高潮喷水抽搐| 又大又黄又爽视频免费| 亚洲精品国产av蜜桃| 免费人妻精品一区二区三区视频| 一级a爱视频在线免费观看| 久久精品国产亚洲av高清一级| 午夜福利视频精品| 性高湖久久久久久久久免费观看| 久久97久久精品| 亚洲国产精品999| 亚洲欧洲日产国产| 在线观看免费视频网站a站| 亚洲免费av在线视频| 18禁观看日本| 少妇被粗大猛烈的视频| 久久久久久人人人人人| 免费在线观看黄色视频的| 国产精品国产三级国产专区5o| 国产精品久久久久久人妻精品电影 | 国产又色又爽无遮挡免| 久久久精品94久久精品| 国产精品国产av在线观看| 午夜激情久久久久久久| 国产一区有黄有色的免费视频| 日本wwww免费看| 在线亚洲精品国产二区图片欧美| 99香蕉大伊视频| 国产亚洲一区二区精品| 两性夫妻黄色片| 国产日韩欧美视频二区| 最新的欧美精品一区二区| 欧美精品亚洲一区二区| 亚洲激情五月婷婷啪啪| 国产黄色视频一区二区在线观看| 国产精品 国内视频| 国产老妇伦熟女老妇高清| 一级毛片黄色毛片免费观看视频| 美国免费a级毛片| 免费高清在线观看日韩| 欧美乱码精品一区二区三区| 香蕉丝袜av| 女人爽到高潮嗷嗷叫在线视频| 精品酒店卫生间| 精品少妇久久久久久888优播| 亚洲,欧美精品.| 亚洲欧洲精品一区二区精品久久久 | 男女下面插进去视频免费观看| 一本大道久久a久久精品| 天天添夜夜摸| xxxhd国产人妻xxx| 美女午夜性视频免费| 香蕉国产在线看| 美国免费a级毛片| 国产精品二区激情视频| 2018国产大陆天天弄谢| 高清欧美精品videossex| 亚洲欧美色中文字幕在线| 一区在线观看完整版| 一区二区三区乱码不卡18| 国产又爽黄色视频| 中文欧美无线码| 9191精品国产免费久久| 午夜精品国产一区二区电影| 午夜福利网站1000一区二区三区| 欧美久久黑人一区二区| 国产日韩欧美亚洲二区| 日韩大码丰满熟妇| 午夜91福利影院| 免费看不卡的av| 亚洲欧美成人综合另类久久久| 老司机深夜福利视频在线观看 | 日韩免费高清中文字幕av| 亚洲精华国产精华液的使用体验| 亚洲av男天堂| 建设人人有责人人尽责人人享有的| 男女免费视频国产| 欧美精品亚洲一区二区| 国产极品天堂在线| 亚洲熟女毛片儿| 91国产中文字幕| 妹子高潮喷水视频| 在线观看免费午夜福利视频| 免费黄网站久久成人精品| 日韩精品有码人妻一区| 亚洲av成人不卡在线观看播放网 | 如日韩欧美国产精品一区二区三区| 久久精品久久久久久久性| 91aial.com中文字幕在线观看| 免费看av在线观看网站| 免费在线观看黄色视频的| 熟妇人妻不卡中文字幕| 最新在线观看一区二区三区 | 欧美激情 高清一区二区三区| 久久久久人妻精品一区果冻| 老汉色av国产亚洲站长工具| 久久国产亚洲av麻豆专区| 中文字幕人妻丝袜一区二区 | 精品免费久久久久久久清纯 | 日韩欧美一区视频在线观看| 久久久久人妻精品一区果冻| 久久久久精品人妻al黑| 丝袜美足系列| 欧美xxⅹ黑人| 水蜜桃什么品种好| 久久性视频一级片| 成年av动漫网址| 精品久久久久久电影网| 国产日韩欧美在线精品| 多毛熟女@视频| 国产成人午夜福利电影在线观看| 国产成人av激情在线播放| 日本黄色日本黄色录像| av国产久精品久网站免费入址| 你懂的网址亚洲精品在线观看| 免费在线观看视频国产中文字幕亚洲 | 国产黄色免费在线视频| 青春草国产在线视频| 国产精品 国内视频| 亚洲四区av| 欧美老熟妇乱子伦牲交| 成年人免费黄色播放视频| 电影成人av| 国产成人a∨麻豆精品| 男女床上黄色一级片免费看| 亚洲国产欧美在线一区| www.自偷自拍.com| 亚洲精品自拍成人| 超碰成人久久| 久久鲁丝午夜福利片| 国产男女内射视频| 婷婷成人精品国产| 满18在线观看网站| 精品国产国语对白av| 久久精品国产亚洲av涩爱| 一区二区av电影网| 国产无遮挡羞羞视频在线观看| 亚洲av日韩在线播放| 嫩草影院入口| 亚洲成av片中文字幕在线观看| 午夜久久久在线观看| 国产亚洲精品第一综合不卡| 99香蕉大伊视频| 欧美成人午夜精品| 男女下面插进去视频免费观看| 精品国产国语对白av| 亚洲精品美女久久av网站| 久久久久精品国产欧美久久久 | 电影成人av| 国产精品久久久久成人av| 国产又爽黄色视频| 晚上一个人看的免费电影| 亚洲色图 男人天堂 中文字幕| 久久久精品区二区三区| 久久99精品国语久久久| 国产精品一二三区在线看| 亚洲人成电影观看| 一边摸一边做爽爽视频免费| 这个男人来自地球电影免费观看 | 天天添夜夜摸| 午夜日韩欧美国产| 国产精品二区激情视频| 精品第一国产精品| 午夜免费男女啪啪视频观看| 国产亚洲最大av| 久久毛片免费看一区二区三区| 日韩大片免费观看网站| 欧美成人午夜精品| 男女下面插进去视频免费观看| 天天躁日日躁夜夜躁夜夜| 亚洲av日韩精品久久久久久密 | 亚洲国产av影院在线观看| 亚洲国产欧美日韩在线播放| 青草久久国产| 日韩中文字幕欧美一区二区 | 最黄视频免费看| 亚洲av综合色区一区| 欧美日韩成人在线一区二区| 一级a爱视频在线免费观看| 最近最新中文字幕大全免费视频 | 精品少妇一区二区三区视频日本电影 | 最近最新中文字幕大全免费视频 | 亚洲熟女毛片儿| 汤姆久久久久久久影院中文字幕| 在线免费观看不下载黄p国产| 久久久久久久久久久久大奶| 亚洲精品日本国产第一区| 精品免费久久久久久久清纯 | 日本av手机在线免费观看| 久久亚洲国产成人精品v| 制服人妻中文乱码| 亚洲视频免费观看视频| 激情五月婷婷亚洲| 国产精品二区激情视频| 最近手机中文字幕大全| 国产极品天堂在线| 丝瓜视频免费看黄片| 成人三级做爰电影| 国产探花极品一区二区| 午夜福利影视在线免费观看| 亚洲av国产av综合av卡| 国产精品久久久久久久久免| 男人操女人黄网站| 啦啦啦啦在线视频资源| 国产极品天堂在线| av女优亚洲男人天堂| 你懂的网址亚洲精品在线观看| 欧美日韩国产mv在线观看视频| 国产一区二区激情短视频 | 亚洲国产日韩一区二区| 国产精品一区二区在线不卡| 男人添女人高潮全过程视频| 一级毛片 在线播放| 自线自在国产av| 免费高清在线观看日韩| 9191精品国产免费久久| 久久精品国产亚洲av高清一级| 亚洲一区中文字幕在线| 精品国产露脸久久av麻豆| 午夜日韩欧美国产| 国产成人精品在线电影| 午夜福利影视在线免费观看| 亚洲七黄色美女视频| 中文字幕精品免费在线观看视频| 美女脱内裤让男人舔精品视频| 色播在线永久视频| 少妇被粗大的猛进出69影院| 亚洲国产中文字幕在线视频| 亚洲欧美成人精品一区二区| 制服人妻中文乱码| 午夜福利,免费看| 亚洲精品久久午夜乱码| 久久毛片免费看一区二区三区| 国产亚洲欧美精品永久| 国产日韩欧美在线精品| 啦啦啦在线观看免费高清www| 在线观看一区二区三区激情| 大码成人一级视频| 成年动漫av网址| 国产片内射在线| 久久亚洲国产成人精品v| 两个人看的免费小视频| 黄片小视频在线播放| 人人妻人人添人人爽欧美一区卜| 国产探花极品一区二区| 亚洲,一卡二卡三卡| 国产免费现黄频在线看| 丰满少妇做爰视频| 人体艺术视频欧美日本| 亚洲精品国产av成人精品| 制服丝袜香蕉在线| 亚洲国产精品成人久久小说| 久久天躁狠狠躁夜夜2o2o | 国产精品久久久久久久久免| 99精品久久久久人妻精品| 亚洲图色成人| 国产精品亚洲av一区麻豆 | 多毛熟女@视频| 久久久久久久久久久免费av| 在线免费观看不下载黄p国产| 少妇人妻久久综合中文| 国产伦理片在线播放av一区| 午夜福利影视在线免费观看| 欧美日韩视频精品一区| 欧美在线黄色| 91精品国产国语对白视频| 精品福利永久在线观看| 午夜精品国产一区二区电影| 丰满乱子伦码专区| 99精国产麻豆久久婷婷| 免费看av在线观看网站| 大片电影免费在线观看免费| 只有这里有精品99| 无遮挡黄片免费观看| 黄色怎么调成土黄色| 欧美在线一区亚洲| 久久精品国产a三级三级三级| 制服人妻中文乱码| 精品免费久久久久久久清纯 | 日韩熟女老妇一区二区性免费视频| 亚洲欧美精品综合一区二区三区| 亚洲av男天堂| 亚洲久久久国产精品| 美女国产高潮福利片在线看| 亚洲美女视频黄频| 欧美激情 高清一区二区三区| av不卡在线播放| 欧美日韩福利视频一区二区| 久久毛片免费看一区二区三区| 一区二区三区乱码不卡18| 香蕉国产在线看| 国产精品香港三级国产av潘金莲 | 久久精品国产a三级三级三级| 亚洲av电影在线观看一区二区三区| 欧美xxⅹ黑人| 成年av动漫网址| 成人18禁高潮啪啪吃奶动态图| 亚洲欧美一区二区三区黑人| 欧美日韩亚洲高清精品| 丰满乱子伦码专区| 免费观看av网站的网址| 午夜精品国产一区二区电影| 成人影院久久| 制服丝袜香蕉在线| 自线自在国产av| 久久热在线av| 成人毛片60女人毛片免费| 黑人巨大精品欧美一区二区蜜桃| 久久ye,这里只有精品| 免费观看av网站的网址| 久久久久久久国产电影| 中国国产av一级| 国产福利在线免费观看视频| 国产在线一区二区三区精| 一级毛片电影观看| 黄频高清免费视频| 18禁观看日本| 久久热在线av| 欧美精品一区二区大全| 国产日韩欧美亚洲二区| av在线播放精品| 国产极品天堂在线| 久久狼人影院|