• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向食品安全事件新聞文本的實(shí)體關(guān)系抽取研究

    2020-07-24 07:29:20鄭麗敏齊珊珊田立軍
    關(guān)鍵詞:樣例安全事件分類器

    鄭麗敏 齊珊珊 田立軍 楊 璐

    (1.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.食品質(zhì)量與安全北京實(shí)驗室, 北京 100083)

    0 引言

    食品安全事件頻發(fā),注水肉、過期奶粉等事件嚴(yán)重影響了民眾的生活,造成了嚴(yán)重的后果[1]。網(wǎng)絡(luò)上各種新聞文本的數(shù)量迅猛增長,如何快速、準(zhǔn)確地獲取食品安全事件新聞文本,并理清其中的關(guān)系脈絡(luò)是一項耗時、耗力的工作。食品安全事件新聞文本的分析梳理對于消費(fèi)者和管理者均具有重要意義:消費(fèi)者能夠從雜亂冗余的大量數(shù)據(jù)中快速獲取事件的主要信息,對事件的發(fā)展走向有系統(tǒng)的認(rèn)知,提前做出正確的預(yù)防或應(yīng)對,減輕事件帶來的傷害;管理者利用梳理出來的信息快速決策,及時發(fā)布并通知、提醒各部門或消費(fèi)者采取相應(yīng)措施等。實(shí)體關(guān)系抽取能夠從半結(jié)構(gòu)化和非結(jié)構(gòu)化的信息源中抽取出實(shí)體及實(shí)體之間的語義關(guān)系,在數(shù)據(jù)挖掘、問答系統(tǒng)、知識圖譜構(gòu)建等研究中均扮演著重要角色,是實(shí)現(xiàn)分析梳理的基礎(chǔ),受到越來越多研究者的關(guān)注[2-4]。

    實(shí)體關(guān)系抽取方法有半監(jiān)督式、遠(yuǎn)程監(jiān)督式和無監(jiān)督式3種[3]。其中,半監(jiān)督式的實(shí)體關(guān)系抽取需要選取少量的種子,種子的品質(zhì)會直接影響抽取效果,且受人的主觀影響明顯[5];遠(yuǎn)程監(jiān)督式的實(shí)體關(guān)系抽取需要大規(guī)模知識庫的支撐,但適用于各領(lǐng)域的大規(guī)模知識庫很難找到,所以該方法并不適用于眾多領(lǐng)域[3,6-7];無監(jiān)督式的實(shí)體關(guān)系抽取無需任何人工標(biāo)注數(shù)據(jù)、預(yù)定義關(guān)系類型等,適用于開放領(lǐng)域的關(guān)系抽取[8-9]。目前,英文的實(shí)體關(guān)系抽取研究已經(jīng)達(dá)到較高的水平,由最初的開放式信息抽取系統(tǒng)TextRunner[10]發(fā)展到O-CRF[11]、ReVerb系統(tǒng)[12]、Ollie系統(tǒng)[13]等,性能不斷提高。中文實(shí)體關(guān)系抽取卻發(fā)展緩慢,主要是由于中文語法具有復(fù)雜多變、無標(biāo)準(zhǔn)句式、實(shí)體參數(shù)位置不固定等特點(diǎn),導(dǎo)致中文文本的實(shí)體關(guān)系抽取難度遠(yuǎn)遠(yuǎn)高于英文文本。文獻(xiàn)[14]提出第一個開放領(lǐng)域?qū)嶓w關(guān)系抽取系統(tǒng)ZORE,在語義層面進(jìn)行研究,具有有效性,但隨著召回率的提高,準(zhǔn)確率下降趨勢過于明顯。文獻(xiàn)[15]提出用于知識獲取的中文開放信息抽取的CORE系統(tǒng),證明了從中文語料庫中抽取關(guān)系而不向IE系統(tǒng)輸入任何預(yù)定義詞匯和關(guān)系的可行性,但并未在大規(guī)模的新聞文本數(shù)據(jù)集上進(jìn)行充分的實(shí)驗。之后針對不同的數(shù)據(jù)類型,在ZORE、CORE的基礎(chǔ)上出現(xiàn)了GCORE[16]、C-COERE[17]等系統(tǒng),性能得到了優(yōu)化。

    但是這些方法對所有的文本采取相同的處理方式,未充分考慮食品安全事件新聞文本的以下特性:發(fā)生主題、涉事食品、食品種類、涉事企業(yè)、企業(yè)負(fù)責(zé)人、涉事人員、發(fā)生時間、發(fā)生地點(diǎn)、發(fā)生原因、發(fā)生規(guī)模、導(dǎo)致結(jié)果、產(chǎn)生影響及危害等,無法對網(wǎng)絡(luò)上食品安全事件新聞及時預(yù)警,在一定程度上降低了事件時效性。針對這一問題,本文提出一種基于依存分析的食品安全事件新聞文本的實(shí)體關(guān)系抽取方法FSE_ERE,充分考慮中文新聞文本的語言特性,利用LTP工具[18]對句子進(jìn)行分詞、詞性標(biāo)注、命名實(shí)體識別處理后,對各個語言單位內(nèi)成分之間的依存關(guān)系進(jìn)行分析,揭示句子的句法結(jié)構(gòu)。再結(jié)合這些知識和構(gòu)建的實(shí)體關(guān)系抽取模型抽取出其中包含的實(shí)體關(guān)系三元組,實(shí)現(xiàn)中文新聞文本中實(shí)體和關(guān)系的自動抽取,無需任何人工干預(yù)。質(zhì)量高且類別明確的文本能有效提高抽取模型和依存分析結(jié)果的匹配度,從而提高抽取性能。因此在實(shí)體關(guān)系抽取過程中引入半監(jiān)督的PU學(xué)習(xí)分類方法,創(chuàng)造性地將文本相似度結(jié)合到PU學(xué)習(xí)分類方法中,通過改進(jìn)的特征選取與加權(quán)處理方法提高分類的精度,以節(jié)省時間和人力。

    1 FSE_ERE方法

    FSE_ERE方法主要包含兩部分內(nèi)容:①為了獲取更多高質(zhì)量的文本數(shù)據(jù),在大規(guī)模的新聞文本中利用基于PU學(xué)習(xí)的分類模型提取食品安全事件新聞文本。②在提取的文本的基礎(chǔ)上,利用基于依存分析的模型進(jìn)行實(shí)體關(guān)系抽取工作。

    1.1 分類模型描述

    分類問題是機(jī)器學(xué)習(xí)的一個重要組成部分,目前大多數(shù)分類方法是根據(jù)已知樣本的某些特征后判定新樣本的類別[19-20]。文本分類一般要經(jīng)過文本預(yù)處理、特征選擇、分類器訓(xùn)練和性能評估4個步驟[21-22]。本文主要解決的問題是在眾多互聯(lián)網(wǎng)文本中,在只含有積極樣例的情況下,快速地挑選出高質(zhì)量的食品安全事件類文本,以便進(jìn)行實(shí)體關(guān)系抽取工作。本文中出現(xiàn)的積極樣例是食品安全事件新聞文本,消極樣例是非食品安全事件的其他各個類別的新聞文本,未標(biāo)記樣例是大規(guī)模的網(wǎng)絡(luò)新聞文本。

    1.1.1關(guān)鍵特征

    在文本預(yù)處理過程中,分詞和去停用詞是主要步驟。由于目前的自然語言處理工具仍存在一定的缺陷,無法全面、準(zhǔn)確地識別出文本中存在的領(lǐng)域?qū)S忻~,尤其是食品安全事件領(lǐng)域中特有的食品名稱、發(fā)生原因(即引起食品安全事件發(fā)生的具體因素)等。例如,“毒雞蛋”是食品安全領(lǐng)域中出現(xiàn)的一種問題食品的名稱,分詞工具通常會將其分詞為“毒”和“雞蛋”兩部分。但是“雞蛋”只是普通食品的名稱,并不能作為食品安全事件的問題食品,這就造成食品安全事件的主體食品判定的錯誤,影響事件的分析研究。因此,領(lǐng)域詞典在分詞、詞性標(biāo)注、命名實(shí)體識別過程中發(fā)揮著重要作用,能夠輔助自然語言處理工具更全面地、更準(zhǔn)確地識別出文本中的重要信息,還能夠幫助選取重要特征,提高分類精度。

    通過對食品安全事件統(tǒng)計分析和對中文新聞文本表達(dá)特點(diǎn)進(jìn)行研究,發(fā)現(xiàn)與其他類型的新聞相比,不論食品安全事件新聞文本的完整程度如何,通常會包含以下特性:涉事食品、發(fā)生原因、涉事企業(yè)和發(fā)生地點(diǎn)4項,因此將這4項作為關(guān)鍵特征。為了保證它們的正確性,分別構(gòu)建了關(guān)于4項關(guān)鍵特征的領(lǐng)域詞典,并將這4個詞典稱為關(guān)鍵特征詞典。關(guān)鍵特征詞典中的詞匯是從國家藥品監(jiān)督管理局、食品伙伴網(wǎng)等網(wǎng)站的相關(guān)模塊中爬取的專有名詞,共273 709個,各個特征項對應(yīng)的領(lǐng)域詞典中包含詞的個數(shù)統(tǒng)計結(jié)果如表1所示。其中發(fā)生原因包括食品添加劑、真菌毒素、污染物、農(nóng)獸藥方面的專有詞匯;發(fā)生地點(diǎn)包括省級行政區(qū)、地級市、縣級市和縣。

    表1 各個特征項的領(lǐng)域詞典中包含的詞個數(shù)Tab.1 Number of words in domain dictionary of each feature item

    預(yù)處理時,對文本進(jìn)行清洗,包括去除鏈接、空格、無意義字符,并利用分詞工具對文本進(jìn)行分詞操作后,在分詞系統(tǒng)中引入上述關(guān)鍵特征詞典,能夠明顯提高分詞的準(zhǔn)確率。此外,在得到每個文本的分詞結(jié)果后,還需要進(jìn)行去停用詞處理,因為這些停用詞雖然詞頻高但是對文本分類貢獻(xiàn)小。則文檔集所有剩余的分詞結(jié)果構(gòu)成了一個詞典向量。該詞典向量與關(guān)鍵特征詞典中存在一些相同的詞匯,為了避免特征重復(fù),刪除詞典向量中這部分重復(fù)的詞匯。

    1.1.2特征模板生成

    TF-IDF算法是一種目前最為常用且非常有效的特征提取方法,根據(jù)計算的特征權(quán)重評估每個特征對文本的重要程度。本文采用TF-IDF方法計算所有特征詞在每篇文檔中的特征權(quán)重,但傳統(tǒng)的TF-IDF沒有考慮特征詞在類間分布狀況的影響。所以本文在TF-IDF中引入特征選擇效果較好的卡方統(tǒng)計量(Chi-square, CHI)方法進(jìn)行修正。

    CHI用于表示特征詞與類別之間的相關(guān)程度,CHI越高則表示相關(guān)程度越高,對應(yīng)的特征詞不僅更能代表某個類別,還具有更高的權(quán)重。CHI計算公式為[22-23]

    (1)

    式中VCHI——卡方統(tǒng)計量(CHI)

    tj——第j個一般特征詞

    Ci——第i個類別

    |X|——數(shù)據(jù)集中的文檔總數(shù)目

    其中A、B、C和D的含義如表2所示。

    表2 特征與類別關(guān)系Tab.2 Relationship between features and categories

    此外,文本關(guān)鍵特征也能夠明顯區(qū)分類別間的差異,對分類產(chǎn)生較好的影響。所以將涉事食品、發(fā)生原因、涉事企業(yè)、發(fā)生地點(diǎn)4項關(guān)鍵特征補(bǔ)充到選取的特征詞后面,生成特征模板。雖然關(guān)鍵特征對應(yīng)的詞匯集合與類別相關(guān)性最大,但是它們在文檔中出現(xiàn)的次數(shù)并不多,導(dǎo)致了其權(quán)重低。所以在改進(jìn)的關(guān)鍵特征權(quán)重計算方法的基礎(chǔ)上還引入了關(guān)鍵特征因子λ,以實(shí)現(xiàn)加權(quán)處理。λ是經(jīng)過大量實(shí)驗后得出的一個經(jīng)驗系數(shù),本文取值為3。

    計算關(guān)鍵特征的權(quán)重時,應(yīng)統(tǒng)計關(guān)鍵特征pg對應(yīng)的關(guān)鍵特征詞典中的詞匯在文檔xi中的頻率,并計算關(guān)鍵特征的逆文檔頻率(Inverse document frequency, IDF),最后計算出關(guān)鍵特征在文檔xi中的權(quán)重。計算公式為

    D(wpg)=λ(pg)TpgIpg

    (2)

    式中wpg——關(guān)鍵特征的權(quán)重

    D(wpg)——關(guān)鍵特征在文檔xi中的權(quán)重

    Tpg——關(guān)鍵特征的TF值

    Ipg——關(guān)鍵特征的IDF值

    Tpg的主要思想是:關(guān)鍵特征pg是一類特征的集合,如果pg在文本中出現(xiàn)的不同詞匯數(shù)多且頻次高,說明這篇文檔描述了很多關(guān)于pg的內(nèi)容,與pg相關(guān)程度高,則可以認(rèn)為文檔屬于pg相關(guān)的類別。Ipg的主要思想是:據(jù)統(tǒng)計分析,關(guān)鍵特征pg涉及的某些詞匯在大多數(shù)文檔中出現(xiàn)頻率都比較低,但這些特征詞對文本分類的作用卻十分明顯,它們對分類貢獻(xiàn)率高卻容易被忽略掉,所以Ipg被用于表示關(guān)鍵特征pg對于整個文檔集的重要程度,即當(dāng)包含pg的文檔數(shù)目越少時,pg對文本分類貢獻(xiàn)率會越高。Tpg和Ipg的計算方法分別為

    (3)

    (4)

    式中Dpg——pg對應(yīng)的關(guān)鍵特征詞典中的詞匯

    n(Dpg,xi)——Dpg在文檔xi中出現(xiàn)的頻次

    nk,xi——文檔xi中詞匯k出現(xiàn)的次數(shù)

    N(pg)——包含關(guān)鍵特征pg的文檔數(shù)目

    在式(4)中,分母項加1是對其進(jìn)行了平滑處理,防止該詞語不在語料庫中時導(dǎo)致的除數(shù)為零現(xiàn)象發(fā)生。

    最后,由于大多數(shù)文檔長度不一樣,TF-IDF算法會出現(xiàn)偏向于長文本的情況,所以需要對TF-IDF算法的計算結(jié)果作統(tǒng)一的歸一化處理。同時將特征詞的CHI進(jìn)行對數(shù)化處理,以解決權(quán)重不均衡問題。綜上所述,本文改進(jìn)后生成的特征模板中,一般特征權(quán)重計算公式為

    (5)

    關(guān)鍵特征的權(quán)重計算公式為

    (6)

    式中m1——一般特征詞的數(shù)目

    m2——關(guān)鍵特征的數(shù)目

    Ftj——第j個一般特征詞的詞頻

    Etj——第j個一般特征詞的逆文檔頻率指數(shù)

    利用向量空間模型(Vector space model, VSM)方法對文本進(jìn)行文本向量化表示,用于文本分類器的訓(xùn)練。對于一篇食品安全事件新聞文檔xi,其向量表示為

    xi=(w1,w2,…,wi,…,wm1,…,wj,…,wm1+m2)
    (1≤i≤m1≤j≤m1+m2)

    (7)

    式中wi——第i個特征對應(yīng)的特征權(quán)重

    wj——第j個特征對應(yīng)的特征權(quán)重

    1.1.3尋找消極樣例和建立分類器

    提出的PU學(xué)習(xí)分類模型采用兩步法實(shí)現(xiàn)。

    (1)尋找消極樣例

    第1步是在未標(biāo)記樣例中尋找一部分與積極樣例極其不同的樣例(反差大的樣例)作為消極樣例,詳細(xì)流程如圖1所示。首先將一部分積極樣例放入未標(biāo)記樣例中,然后對未標(biāo)記樣例集合進(jìn)行聚類。未標(biāo)記樣例集合經(jīng)聚類后形成大小不同的簇。去除包含間諜樣例的簇(認(rèn)為簇中不含有消極樣例),并對剩余簇內(nèi)的文本進(jìn)行相似度計算,刪除相似度高的文本。因為對于大規(guī)模的網(wǎng)絡(luò)食品安全事件新聞文本,同一篇新聞有很大概率在多個網(wǎng)站上被發(fā)布,或者即使不同新聞對同一事件的表述不完全一致但相似度也很高,這樣的新聞則對于信息挖掘、關(guān)系抽取意義不大,因此這種多余的相似文本應(yīng)該被去除。最后計算各個簇與積極樣例集合之間的距離,選出差異最大的簇,將該簇中的文本標(biāo)記為消極樣例。

    圖1 第1步的過程演示Fig.1 Process demonstration of the first step

    圖1中,采用K-means算法進(jìn)行聚類,由于傳統(tǒng)的K-means算法假設(shè)每個樣本對最終聚類結(jié)果的貢獻(xiàn)程度一樣,未考慮關(guān)鍵特征對于聚類過程的影響,導(dǎo)致聚類準(zhǔn)確率低。所以應(yīng)用上述特征加權(quán)處理改進(jìn)方法獲得的特征能夠有效解決這一問題。

    此外,還需要去除重復(fù)文本以提高分類效果和文本質(zhì)量,例如,對于同一事件不同描述的新聞文本,其文本相似度超過閾值時認(rèn)為不同文本描述了同一事件,只保留最近時間報道的且信息最豐富的新聞文本;對于同一涉事食品在不同地區(qū)發(fā)生的食品安全事件,根據(jù)文本的“發(fā)生地點(diǎn)”特征對應(yīng)的地點(diǎn)詞匯是否相同來判斷是否屬于同一個事件。所以刪除包含間諜樣例的簇后在剩下的各個簇中分別利用文本提取特征來計算文本相似度,得到的向量形式表示的文本之間以空間距離體現(xiàn)語義相似度[24]。對于向量化后的特征,采用最常用的余弦相似度計算方法,表示為

    (8)

    式中xj——第j個待計算文本的向量

    相似度越大,說明距離越小,文本越相似。

    (2)建立分類器

    第2步,根據(jù)積極樣例的集合P、消極樣例的集合N和未標(biāo)記樣例的集合U建立最終的分類器。具體過程如下:①將所有的間諜樣例S都放回到積極樣例集合P中。②給積極樣例集合P中的每個文檔xi都分配固定的類標(biāo)簽c1,即y(c1,xi)=1,且在每次迭代EM最大期望算法時,標(biāo)簽不再改變。③為消極樣例集合N中的每個文檔xj都分配初始類標(biāo)簽c2,即y(c2,xj)=0,且在每次迭代EM算法時,標(biāo)簽都會改變。④在未標(biāo)記樣例集合U中的每一個文檔xk都沒有被分配標(biāo)簽,但是在EM算法的第一次迭代后,將會分配給每個文檔一個概率標(biāo)簽。在隨后的迭代過程中,集合U將通過其新分配的概率類型參與EM算法,例如y(c1,xk)。⑤在集合P、N和U中重復(fù)運(yùn)行EM算法直至收斂。

    當(dāng)EM算法結(jié)束時,將生成最終的分類器。本文將用該分類器分類食品安全事件并進(jìn)行性能評估,用于后續(xù)的實(shí)體關(guān)系抽取工作。

    1.2 基于依存分析的實(shí)體關(guān)系抽取

    基于依存分析的食品安全事件實(shí)體關(guān)系抽取的目標(biāo)是從大規(guī)模的食品安全事件新聞文本中抽取出食品安全事件中的實(shí)體及實(shí)體之間(或?qū)嶓w與屬性值之間)的語義關(guān)系,其中實(shí)體涉及到涉事食品、涉事公司、涉事人員等;屬性包括產(chǎn)品規(guī)格、商標(biāo)形式等。面對復(fù)雜多變的中文新聞表達(dá)形式,關(guān)系抽取模型需要具有廣泛性和強(qiáng)的魯棒性才能夠達(dá)到好的抽取效果。

    (1)關(guān)系識別

    動詞及動詞短語、名詞及名詞短語和位于它們前面或后面相鄰的說明性修飾符均可作為關(guān)系詞或關(guān)系短語。關(guān)系可以位于句子中的任意位置[16,25],能夠根據(jù)模型和候選關(guān)系與句子其他成分之間的依存關(guān)系來確定元組關(guān)系。一般情況下,主語和謂語之間會通過依存關(guān)系“SBV”等來連接,謂語和賓語之間會通過依存關(guān)系“VOB”、“POB”等來連接。此外,還存在一種特殊的偏正結(jié)構(gòu),如“食藥監(jiān)局長×××”一句中,“局長”、“食藥監(jiān)”和“×××”均為名詞,“局長”作為“食藥監(jiān)”和“×××”之間的關(guān)系,與它們之間的依存關(guān)系均為“ATT”,可抽取出實(shí)體關(guān)系三元組(食藥監(jiān),局長,×××)。

    (2)實(shí)體和屬性識別

    實(shí)體和屬性識別是為了識別出每個待處理句子中的實(shí)體對(arg1,arg2),arg1和arg2參數(shù)分別表示主語和賓語,arg1為實(shí)體,arg2為與arg1之間存在關(guān)系的另一個實(shí)體或者arg1具有的某種屬性的屬性值[3]。本文應(yīng)用LTP工具分析待處理的文本,將所有句子依次進(jìn)行分詞、詞性標(biāo)注、命名實(shí)體識別和依存句法分析。還引入了涉事食品、發(fā)生原因、涉事企業(yè)和發(fā)生地點(diǎn)4個關(guān)鍵詞典輔助分詞,提高分詞準(zhǔn)確率和召回率,進(jìn)而提高整體抽取性能。其中命名實(shí)體識別能夠識別出句子中的所有可能實(shí)體,作為實(shí)體關(guān)系三元組的候選實(shí)體,依存句法分析對句子成分及各成分之間的語義關(guān)系進(jìn)行分析,確定三元組成分。

    接下來計算任意2個候選實(shí)體之間存在的實(shí)體數(shù)量和其他詞語的數(shù)量。文獻(xiàn)[14,26]經(jīng)過統(tǒng)計和實(shí)驗研究發(fā)現(xiàn),在候選實(shí)體組成實(shí)體對后,限定每個實(shí)體對之間存在的其他候選實(shí)體數(shù)目不超過4個,詞匯總數(shù)目不超過5個時,得到的三元組的準(zhǔn)確率達(dá)到最高。這是因為句子中2個實(shí)體距離越遠(yuǎn),兩者之間存在關(guān)系的可能性就越小。根據(jù)依存分析的結(jié)果,檢測關(guān)系詞或關(guān)系短語所依賴的實(shí)體。

    基于模型的實(shí)體關(guān)系抽取,是將句子的依存分析結(jié)果和基于中文語法規(guī)則的模型進(jìn)行匹配完成抽取工作的。本文依據(jù)大規(guī)模新聞文本的依存分析結(jié)果中所包含的語義特征提出了中文關(guān)系抽取模型ORE_Models,包含ORE_Model1、ORE_Model2、ORE_Model3,具體結(jié)構(gòu)如圖2所示,圖中各參數(shù)的含義如表3所示。

    表3 ORE_Models模型中參數(shù)含義Tab.3 Meaning of parameters in model ORE_Models

    圖2 中文關(guān)系抽取模型ORE_ModelsFig.2 Chinese relation extraction model ORE_Models

    在圖2中,關(guān)系抽取模型ORE_Model1多用于抽取以動詞作為關(guān)系和存在介賓關(guān)系時的句子形式;關(guān)系抽取模型ORE_Model2多用于抽取主語,或謂語,或賓語中存在一個或多個并列情況的句子形式,其中pred1和arg3 2個節(jié)點(diǎn)之間由有方向的實(shí)線和虛線表示的關(guān)系所連接,但實(shí)線和虛線有且僅有一種出現(xiàn),即在一個句子中不可同時存在;關(guān)系抽取模型ORE_Model3多用于抽取存在動補(bǔ)結(jié)構(gòu)、偏正結(jié)構(gòu)時的句子形式。每個待處理的中文句子的依存分析結(jié)果只要與模型的某一部分正確匹配且匹配成功的部分中存在可抽取的內(nèi)容,就會以實(shí)體關(guān)系三元組的形式輸出。其中節(jié)點(diǎn)及關(guān)系存在情況與可抽取出的實(shí)體關(guān)系三元組的情況如表4所示。為了便于展示,僅在表4的可抽取出的實(shí)體關(guān)系三元組中展示了實(shí)體和關(guān)系,但在實(shí)際抽取過程中還保存了與實(shí)體存在“ATT”等依存關(guān)系的實(shí)體修飾詞匯。

    表4中的“-”表示2個節(jié)點(diǎn)的連接組合,共同組成三元組的主語或者謂語,“/”和圖2中的“/”均表示“或者”的含義,即兩種情況均可能出現(xiàn)(但不可能同時出現(xiàn))。從表4中可以發(fā)現(xiàn)模型ORE_Models覆蓋了多種句子形式,能夠處理具有多變的語法表達(dá)方式的新聞文本。

    表4 ORE_Models中節(jié)點(diǎn)及關(guān)系存在情況不同時的可抽取的實(shí)體關(guān)系三元組Tab.4 Extractable entity relation triples with different nodes and relations in ORE_Models

    例如,句子“上海市食藥監(jiān)局查封了一批毒雞蛋”的依存分析結(jié)果如圖3所示。從圖3中可以得到候選實(shí)體有“上海市食藥監(jiān)局”(機(jī)構(gòu)名稱)、“毒雞蛋”,關(guān)系詞為“查封”,它們之間的依存關(guān)系符合模型ORE_Model1的分析,最后可抽取出實(shí)體關(guān)系三元組(上海食藥監(jiān),查封,一批毒雞蛋)。

    圖3 實(shí)例1的句子依存分析結(jié)果Fig.3 Sentence dependency parsing results of example 1

    再如句子“上海市食藥監(jiān)局發(fā)布最新一期食品安全抽檢信息,通報了5批次不合格的食用性農(nóng)產(chǎn)品。”的依存分析結(jié)果如圖4所示。從圖4中可以得到候選實(shí)體有“上海市食藥監(jiān)局”(機(jī)構(gòu)名稱)、“信息”和“農(nóng)產(chǎn)品”;關(guān)系詞為“發(fā)布”和“通報”,且在句子中是并列關(guān)系。“上海市食藥監(jiān)局”作為句子的主語分別通過“發(fā)布”和“通報”2個關(guān)系詞與作為句子賓語的“信息”和“農(nóng)產(chǎn)品”連接,“5批次”、“不合格”和“食用性農(nóng)產(chǎn)品”之間依次存在定中關(guān)系。實(shí)體和關(guān)系詞之間的依存關(guān)系符合模型ORE_Model1、ORE_Model2和ORE_Model3的分析,最后可抽取出實(shí)體關(guān)系三元組(上海市食藥監(jiān)局,發(fā)布,最新一期食品安全抽檢信息)、(上海市食藥監(jiān)局,通報,5批次不合格的食用性農(nóng)產(chǎn)品)和(5批次,不合格,食用性農(nóng)產(chǎn)品)。

    圖4 實(shí)例2的句子依存分析結(jié)果Fig.4 Sentence dependency parsing results of example 2

    上述2個句子均是關(guān)于“上海市食藥監(jiān)局”相關(guān)的信息,基于實(shí)體關(guān)系抽取模型ORE_Models從不同的描述文本中抽取出了不同的實(shí)體關(guān)系三元組,這些三元組共同表述了同一主體的信息且不同三元組之間也存在關(guān)聯(lián)關(guān)系。文本中一般包含較多數(shù)量的句子,能夠抽取出大量的實(shí)體關(guān)系三元組。這些三元組高度概括了文本的主要內(nèi)容且形式精煉,梳理后能幫助快速了解文本的知識脈絡(luò),得到目標(biāo)信息。

    2 結(jié)果與分析

    2.1 實(shí)驗設(shè)計

    實(shí)驗所用的數(shù)據(jù)是利用爬蟲技術(shù)爬取的近5年全國范圍內(nèi)各大新聞門戶網(wǎng)站(包括騰訊新聞中心、搜狗新聞中心、百度新聞中心和新浪新聞中心等多個網(wǎng)站)上與食品相關(guān)的中文新聞文本,共75 214篇。這些中文新聞文本包含食品安全事件、與食品相關(guān)的非事件性新聞文本和其他領(lǐng)域的各類新聞文本,共同構(gòu)成了新聞文本語料庫,且不同類型文本的數(shù)量統(tǒng)計結(jié)果為:食品安全事件新聞文本40 427篇,與食品相關(guān)的非事件性新聞文本31 086篇,其他領(lǐng)域的各類新聞文本3 701篇。

    (1)利用分類模型對語料庫中的所有文本進(jìn)行分類。雖然PU學(xué)習(xí)是在含少量標(biāo)記的積極樣例和大量未標(biāo)記樣例情況下訓(xùn)練分類器,但是為了與其他分類方法進(jìn)行比較,仍需要額外做如下標(biāo)記:手動標(biāo)注了1 000篇食品安全事件新聞文本和1 000篇非食品安全事件的其他混合類型的新聞文本,將這2 000篇已標(biāo)注的新聞文本作為數(shù)據(jù)集。隨機(jī)抽取其中的300篇食品安全事件新聞文本和300篇非食品安全事件新聞文本共600篇文本作為測試集,其余的1 400篇文本作為訓(xùn)練集來訓(xùn)練分類器。在測試過程中,更多關(guān)注的是準(zhǔn)確率,其計算公式為

    (9)

    式中pc——分類器的準(zhǔn)確率

    Nr——正確分類的文本數(shù)量

    Nclassifier——分類器分類的文本數(shù)量

    (2)從分類得到的食品安全事件類別中隨機(jī)抽取1 000篇文本,用于測試模型ORE_Models在食品安全事件新聞文本上的實(shí)體關(guān)系抽取性能。由于自然語言處理工具的處理對象是完整的句子,所以利用正則表達(dá)式方法[22]按照“。”、“?”、“!”、“……”、“:”、“;”6種標(biāo)點(diǎn)符號將這1 000篇文本分割成獨(dú)立的句子。

    (3)從分割1 000篇文本獲得的句子中隨機(jī)選擇1 000個句子作為數(shù)據(jù)集news_dataset1進(jìn)行實(shí)體關(guān)系抽取。注意,采用兩次隨機(jī)抽取,是為了在具有可操作性的數(shù)據(jù)量下降低新聞編輯者的語法習(xí)慣對抽取模型性能的影響,使結(jié)果具有更高的可靠性,從而更好的對食品安全事件進(jìn)行實(shí)體關(guān)系抽取,有效地解決難以快速獲取事件主要內(nèi)容、脈絡(luò)聯(lián)系不明確等問題。

    (4)再次從語料庫中隨機(jī)抽取1 000篇文本,這1 000篇文本中包含食品安全事件在內(nèi)的多種混合類型的新聞。采用與得到數(shù)據(jù)集news_dataset1同樣的方法得到包含1 000個句子的數(shù)據(jù)集news_dataset2,該數(shù)據(jù)集用來評估模型ORE_Models對開放領(lǐng)域混合類型的新聞文本的抽取性能,從而驗證模型ORE_Models的可移植性,使其能夠應(yīng)用于更多的研究領(lǐng)域。

    在本實(shí)驗中,由兩名專業(yè)人員根據(jù)文獻(xiàn)[12]的標(biāo)注策略分別標(biāo)注句子中的實(shí)體關(guān)系元組,然后經(jīng)過匯總、糾正后,最終確定數(shù)據(jù)集應(yīng)該被正確抽取的結(jié)果。本文的評估側(cè)重于句子級別的抽取,實(shí)驗后,將實(shí)驗抽取結(jié)果與手動標(biāo)注的結(jié)果進(jìn)行比較,并通過3個度量標(biāo)準(zhǔn)對實(shí)體關(guān)系抽取結(jié)果進(jìn)行評估,分別是準(zhǔn)確率(P)、召回率(R)和F值(F)。P、R、F的計算公式為

    (10)

    (11)

    (12)

    式中r——模型ORE_Models抽取出的正確元組的數(shù)量

    a——模型ORE_Models抽取出的所有元組的數(shù)量

    W——語料庫中實(shí)際存在的元組的數(shù)量

    2.2 結(jié)果及對比分析

    2.2.1食品安全事件新聞文本的分類結(jié)果

    為了驗證PU學(xué)習(xí)方法的食品安全事件新聞文本的分類結(jié)果,首先只保留訓(xùn)練集中的200個標(biāo)注的食品安全事件標(biāo)簽,其余數(shù)據(jù)的標(biāo)簽均隱藏(即相當(dāng)于未標(biāo)記數(shù)據(jù))。然后在訓(xùn)練集中訓(xùn)練分類模型。最后,將得到的分類模型在測試集中進(jìn)行測試,得到最終的分類結(jié)果。為了進(jìn)行實(shí)驗對比,在所有數(shù)據(jù)均保留了完整標(biāo)注的相同數(shù)據(jù)集下,分別采用支持向量機(jī)(SVM)、邏輯回歸算法(Logistic regression)、隨機(jī)森林(Random forest)[27-28]3種監(jiān)督分類方法進(jìn)行訓(xùn)練,將得到的結(jié)果進(jìn)行比較分析。實(shí)驗結(jié)果為:本文的分類器準(zhǔn)確率達(dá)到82.35%,SVM準(zhǔn)確率為75.94%,Logistic regression準(zhǔn)確率為82.88%,Random forest準(zhǔn)確率為83.49%。

    上述結(jié)果顯示SVM的準(zhǔn)確率在4個分類器中是最低的,Random forest分類器的準(zhǔn)確率是最高的,但是僅比本文的分類器高出1.14個百分點(diǎn)。其次是Logistic regression分類器,比本文的分類器高出0.53個百分點(diǎn)。從這些數(shù)據(jù)中可以發(fā)現(xiàn),本文構(gòu)建的分類器準(zhǔn)確率盡管不是最高的,但是達(dá)到了與其余3種監(jiān)督方法相似的效果,相比于這3種監(jiān)督方法需要完成的大量標(biāo)注所需要的人力、時間的損耗,且在將大規(guī)模網(wǎng)絡(luò)文本全部進(jìn)行手動標(biāo)注幾乎不可能實(shí)現(xiàn)的前提下,半監(jiān)督分類方法更能滿足大規(guī)模數(shù)據(jù)分類研究的需要,并且降低了監(jiān)督方法中由于人的主觀因素引起的誤差,因此更適合應(yīng)用于大規(guī)模網(wǎng)絡(luò)文本的食品安全事件的分類。

    將本文的分類器應(yīng)用于語料庫,共得到了37 901篇食品安全事件新聞文本。

    2.2.2實(shí)體關(guān)系抽取的性能評估

    從分類得到的37 901篇食品安全事件新聞文本隨機(jī)抽取1 000篇文本并分割成句子后,共得到24 015個完整句子。再按照2.1節(jié)中描述的步驟構(gòu)建數(shù)據(jù)集news_dataset1和news_dataset2。

    為了評估食品安全事件新聞文本的實(shí)體關(guān)系抽取結(jié)果和混合類型新聞文本的實(shí)體關(guān)系抽取結(jié)果的質(zhì)量,得到ORE_Models抽取數(shù)據(jù)集news_dataset1和news_dataset2時的性能如表5所示。

    表5 ORE_Models抽取不同數(shù)據(jù)集時的性能Tab.5 Performance of ORE_Models when extracting different datasets %

    從表5可以看出,ORE_Models模型的準(zhǔn)確率相對較高,很難有更大的改進(jìn)余地,但是獲得高準(zhǔn)確率的同時犧牲了部分召回率,使得召回率沒有達(dá)到與準(zhǔn)確率接近的性能。

    news_dataset1和news_dataset2數(shù)據(jù)集上的抽取性能相比,ORE_Models模型在食品安全事件新聞文本數(shù)據(jù)集news_dataset1上的準(zhǔn)確率、召回率、F值均高于混合類型新聞文本數(shù)據(jù)集news_dataset2上的值,這說明ORE_Models更適用于食品安全事件新聞文本的實(shí)體關(guān)系抽取。但是在混合類型的新聞文本上的抽取性能也達(dá)到了較高的水平,與在食品安全事件新聞文本相比僅在準(zhǔn)確率上降低了4.25個百分點(diǎn),召回率上降低了3.41個百分點(diǎn),F(xiàn)值上降低了3.79個百分點(diǎn),與食品安全事件新聞文本的抽取效果之間的差距控制在了5個百分點(diǎn)之內(nèi),均未出現(xiàn)較大差異,表明了ORE_Models也可以應(yīng)用于開放領(lǐng)域的新聞文本抽取。

    2.2.3實(shí)體關(guān)系抽取的性能對比

    為了驗證模型ORE_Models的性能能夠滿足新聞文本關(guān)系抽取的需要,設(shè)計2組對比實(shí)驗:①ZORE系統(tǒng)、CORE系統(tǒng)與ORE_Models同時處理數(shù)據(jù)集news_dataset1。②ZORE系統(tǒng)、CORE系統(tǒng)與ORE_Models同時處理數(shù)據(jù)集news_dataset2。2組實(shí)驗的評估均對照同一標(biāo)準(zhǔn)結(jié)果進(jìn)行判定。2組實(shí)驗結(jié)果如表6所示。

    表6 ZORE系統(tǒng)、CORE系統(tǒng)抽取news_dataset1和news_dataset2的性能Tab.6 Performance of ZORE system and CORE system to extract news_dataset1 and news_dataset2 %

    從表5和表6中可以看到,在數(shù)據(jù)集news_dataset1和news_dataset2上CORE系統(tǒng)的準(zhǔn)確率、召回率和F值均是最低的,其次是ZORE系統(tǒng),各個性能最好的是ORE_Models。在news_dataset1數(shù)據(jù)集上,ZORE系統(tǒng)和CORE系統(tǒng)的各個指標(biāo)均

    表現(xiàn)出了類似的性能,幾乎沒有差異,這說明這2個系統(tǒng)都未對食品安全事件進(jìn)行更加深入的抽取研究。雖然ZORE系統(tǒng)和CORE系統(tǒng)面向的是開放領(lǐng)域各類別的實(shí)體關(guān)系抽取,但是在news_dataset2數(shù)據(jù)集上,它們的性能仍低于ORE_Models,這表明ORE_Models雖然主要面向食品安全事件新聞文本,但是它同樣可以很好地處理開放領(lǐng)域的文本,體現(xiàn)了ORE_Models的有效性與可移植性。

    對于抽取過程中出現(xiàn)的抽取錯誤問題或者未抽取出句子中存在的元組問題,主要是由以下幾方面引起的:NLP工具在分詞、詞性標(biāo)注或者命名實(shí)體識別等過程中出現(xiàn)錯誤,存在未覆蓋的領(lǐng)域?qū)е聼o法正確處理句子,不能與模型匹配或匹配錯誤;新聞文本中存在復(fù)雜度很高或者口語化、不規(guī)范的句子,該類句子的依存解析在模型中未涉及到。

    3 結(jié)束語

    提出一種基于依存分析的食品安全事件新聞文本的實(shí)體關(guān)系抽取方法FSE_ERE,根據(jù)中文語法特性和句子的依存分析結(jié)果構(gòu)建了關(guān)系抽取模型,實(shí)現(xiàn)了無監(jiān)督的食品安全事件新聞文本的實(shí)體關(guān)系抽取。為了在高質(zhì)量的食品安全事件新聞文本上進(jìn)行抽取工作,引入結(jié)合文本相似度算法和改進(jìn)的特征加權(quán)方法的PU學(xué)習(xí)半監(jiān)督分類方法,對大規(guī)模網(wǎng)絡(luò)文本進(jìn)行分類,準(zhǔn)確率達(dá)到82.35%。FSE_ERE方法能夠從大規(guī)模的網(wǎng)絡(luò)文本中準(zhǔn)確得到食品安全事件類別的新聞文本,且無需標(biāo)記大量數(shù)據(jù)的類別;同時,實(shí)體關(guān)系抽取過程也打破了標(biāo)注語料庫、預(yù)先定義關(guān)系類型等限制,可快速準(zhǔn)確地抽取出文本中包含的各種信息,在食品安全事件新聞文本數(shù)據(jù)集上F值達(dá)到71.21%,在多類型混合新聞文本數(shù)據(jù)集上F值達(dá)到67.42%。FSE_ERE方法節(jié)省了大量的人力和時間,對于大規(guī)模網(wǎng)絡(luò)文本的信息統(tǒng)計分析具有重要意義,為中文的開放式實(shí)體關(guān)系抽取提供了新的思路。

    猜你喜歡
    樣例安全事件分類器
    樣例復(fù)雜度與學(xué)習(xí)形式對不同數(shù)量樣例學(xué)習(xí)的影響
    樣例呈現(xiàn)方式對概念訓(xùn)練類別表征的影響
    “樣例教學(xué)”在小學(xué)高年級數(shù)學(xué)中的應(yīng)用
    BP-GA光照分類器在車道線識別中的應(yīng)用
    電子測試(2018年1期)2018-04-18 11:52:35
    加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
    結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
    食品安全事件的價格沖擊效應(yīng)
    公交車公共安全事件調(diào)查
    基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識別
    2013卡巴斯基三大安全事件
    亚洲精品自拍成人| 国产av码专区亚洲av| 午夜免费观看性视频| 国产不卡av网站在线观看| 午夜福利一区二区在线看| 日韩在线高清观看一区二区三区| 91精品三级在线观看| 久久女婷五月综合色啪小说| 99精国产麻豆久久婷婷| 岛国毛片在线播放| 欧美激情高清一区二区三区 | 中文字幕人妻丝袜一区二区 | 日韩制服丝袜自拍偷拍| 黑人巨大精品欧美一区二区蜜桃| 一级爰片在线观看| 成年女人在线观看亚洲视频| 亚洲,欧美精品.| 在线天堂中文资源库| 老司机影院毛片| 亚洲精品自拍成人| 中文字幕人妻熟女乱码| 99热网站在线观看| 日本av免费视频播放| 国产精品秋霞免费鲁丝片| 国产熟女午夜一区二区三区| 免费在线观看黄色视频的| 久久久精品国产亚洲av高清涩受| xxx大片免费视频| 一级片'在线观看视频| 亚洲精品国产色婷婷电影| 久久精品久久精品一区二区三区| 夜夜骑夜夜射夜夜干| 精品少妇一区二区三区视频日本电影 | 免费女性裸体啪啪无遮挡网站| 香蕉丝袜av| 纵有疾风起免费观看全集完整版| 国产福利在线免费观看视频| 男的添女的下面高潮视频| 视频在线观看一区二区三区| 五月伊人婷婷丁香| 日日撸夜夜添| 黄片播放在线免费| 午夜福利视频精品| av电影中文网址| 国产一区二区激情短视频 | av有码第一页| 大话2 男鬼变身卡| 亚洲av中文av极速乱| 免费在线观看黄色视频的| 爱豆传媒免费全集在线观看| 亚洲av电影在线观看一区二区三区| 观看美女的网站| 99久久综合免费| 亚洲综合精品二区| 亚洲欧美中文字幕日韩二区| 亚洲欧美中文字幕日韩二区| 久久精品久久久久久久性| 丝瓜视频免费看黄片| 韩国精品一区二区三区| 日韩视频在线欧美| 欧美老熟妇乱子伦牲交| 国产一区二区激情短视频 | 国产一区二区三区综合在线观看| 肉色欧美久久久久久久蜜桃| 国产福利在线免费观看视频| 香蕉国产在线看| 免费在线观看黄色视频的| 久久久久国产一级毛片高清牌| 日韩中文字幕视频在线看片| 搡老乐熟女国产| 嫩草影院入口| 一个人免费看片子| 国产免费福利视频在线观看| av天堂久久9| 国产精品一二三区在线看| 欧美人与善性xxx| 国产精品一国产av| 亚洲国产欧美网| 久久精品国产鲁丝片午夜精品| 亚洲成人av在线免费| 国产成人91sexporn| 亚洲欧美一区二区三区久久| 91成人精品电影| 肉色欧美久久久久久久蜜桃| 国产视频首页在线观看| 自线自在国产av| 国产精品一区二区在线观看99| 久久久精品国产亚洲av高清涩受| av电影中文网址| 国产日韩欧美在线精品| 国产女主播在线喷水免费视频网站| 国产精品三级大全| 婷婷成人精品国产| videosex国产| 国产激情久久老熟女| 亚洲五月色婷婷综合| 国产精品不卡视频一区二区| 亚洲美女视频黄频| 国产老妇伦熟女老妇高清| 久久这里有精品视频免费| freevideosex欧美| 卡戴珊不雅视频在线播放| 女人高潮潮喷娇喘18禁视频| 美女大奶头黄色视频| 国产视频首页在线观看| 乱人伦中国视频| 熟女电影av网| 男女国产视频网站| 亚洲av综合色区一区| 岛国毛片在线播放| 大片电影免费在线观看免费| 韩国av在线不卡| 亚洲在久久综合| 日韩不卡一区二区三区视频在线| 婷婷色综合www| 欧美在线黄色| 街头女战士在线观看网站| 亚洲色图综合在线观看| 国产又爽黄色视频| 国产精品一国产av| 久久国内精品自在自线图片| 两个人免费观看高清视频| 91国产中文字幕| 啦啦啦在线免费观看视频4| 免费黄网站久久成人精品| 国产高清不卡午夜福利| 一级毛片电影观看| 欧美成人午夜免费资源| av.在线天堂| 97在线视频观看| 性色av一级| 伦理电影大哥的女人| 国产精品亚洲av一区麻豆 | 成人午夜精彩视频在线观看| 中文欧美无线码| 嫩草影院入口| 国产不卡av网站在线观看| 日韩中字成人| 国产 精品1| 午夜福利,免费看| 日韩不卡一区二区三区视频在线| 国产成人aa在线观看| 人妻一区二区av| 一区二区av电影网| 精品少妇一区二区三区视频日本电影 | 欧美97在线视频| 男女边摸边吃奶| 午夜免费鲁丝| 男女无遮挡免费网站观看| 免费人妻精品一区二区三区视频| 美女福利国产在线| 久久精品aⅴ一区二区三区四区 | 黄网站色视频无遮挡免费观看| 国产一区二区激情短视频 | 久久精品国产亚洲av涩爱| 免费播放大片免费观看视频在线观看| 免费日韩欧美在线观看| 久久av网站| 菩萨蛮人人尽说江南好唐韦庄| 久久久久网色| 伦理电影大哥的女人| 亚洲国产欧美在线一区| 激情视频va一区二区三区| 人人妻人人澡人人爽人人夜夜| 大码成人一级视频| 国产精品久久久久久久久免| 国产精品 国内视频| 黄色怎么调成土黄色| 97在线人人人人妻| 欧美日韩视频精品一区| 久久久久久久精品精品| 精品国产一区二区三区四区第35| 欧美人与性动交α欧美精品济南到 | 麻豆乱淫一区二区| 中文字幕另类日韩欧美亚洲嫩草| 在线观看美女被高潮喷水网站| 伊人久久国产一区二区| 成人手机av| 国产精品久久久久久av不卡| 午夜免费男女啪啪视频观看| 精品久久久久久电影网| 久久久精品区二区三区| 永久网站在线| 啦啦啦视频在线资源免费观看| 欧美97在线视频| 2022亚洲国产成人精品| 国产精品免费大片| 男女国产视频网站| 亚洲四区av| 国产免费又黄又爽又色| av.在线天堂| 在线观看免费日韩欧美大片| 亚洲国产av新网站| 午夜福利视频精品| 久久精品国产亚洲av天美| 国产免费现黄频在线看| 亚洲av成人精品一二三区| 啦啦啦在线免费观看视频4| 国产精品蜜桃在线观看| 久久鲁丝午夜福利片| 日韩中字成人| 成人漫画全彩无遮挡| 成人二区视频| 亚洲,欧美精品.| 大话2 男鬼变身卡| 日韩不卡一区二区三区视频在线| 国精品久久久久久国模美| 久久久久久久亚洲中文字幕| 欧美bdsm另类| 久久久久国产精品人妻一区二区| 午夜福利在线观看免费完整高清在| 成人漫画全彩无遮挡| 免费黄频网站在线观看国产| 国产一区二区三区av在线| 国产精品久久久久成人av| 亚洲,欧美,日韩| 中国三级夫妇交换| 自线自在国产av| 日韩一本色道免费dvd| 色播在线永久视频| 日本黄色日本黄色录像| 亚洲精品国产一区二区精华液| 热re99久久精品国产66热6| 丝袜美腿诱惑在线| 高清不卡的av网站| 午夜免费观看性视频| 国产精品秋霞免费鲁丝片| 久久人人爽人人片av| 老司机影院毛片| 丰满迷人的少妇在线观看| 久久久a久久爽久久v久久| 国产精品一国产av| 中文乱码字字幕精品一区二区三区| 精品人妻熟女毛片av久久网站| 久久久久国产一级毛片高清牌| 欧美成人精品欧美一级黄| 满18在线观看网站| 久久国产亚洲av麻豆专区| 赤兔流量卡办理| 99久久中文字幕三级久久日本| 成人二区视频| 欧美日韩成人在线一区二区| 亚洲一区中文字幕在线| 黄色配什么色好看| 欧美日韩视频高清一区二区三区二| 欧美av亚洲av综合av国产av | 久久久久人妻精品一区果冻| 免费黄频网站在线观看国产| 久久久久精品久久久久真实原创| 欧美亚洲日本最大视频资源| 久久久亚洲精品成人影院| 亚洲欧美一区二区三区久久| 久久精品国产亚洲av涩爱| 亚洲内射少妇av| 亚洲图色成人| 久久精品久久久久久噜噜老黄| 一二三四在线观看免费中文在| 丝袜美腿诱惑在线| 精品卡一卡二卡四卡免费| 国产精品不卡视频一区二区| 男女高潮啪啪啪动态图| 久久婷婷青草| 国产一区亚洲一区在线观看| 91成人精品电影| 观看av在线不卡| 在线免费观看不下载黄p国产| 欧美日韩一区二区视频在线观看视频在线| 午夜福利视频精品| 欧美激情极品国产一区二区三区| 校园人妻丝袜中文字幕| 国产成人一区二区在线| 国产人伦9x9x在线观看 | 制服人妻中文乱码| 国产又爽黄色视频| 日韩三级伦理在线观看| 99久久人妻综合| 亚洲激情五月婷婷啪啪| 亚洲精品国产av成人精品| 大香蕉久久网| 亚洲,一卡二卡三卡| 热99久久久久精品小说推荐| 免费av中文字幕在线| 国产亚洲精品第一综合不卡| 亚洲欧美成人综合另类久久久| 一边摸一边做爽爽视频免费| a级毛片在线看网站| 春色校园在线视频观看| 国产精品av久久久久免费| 精品少妇久久久久久888优播| 欧美变态另类bdsm刘玥| 亚洲欧洲日产国产| h视频一区二区三区| 日日撸夜夜添| 国产日韩欧美亚洲二区| 极品人妻少妇av视频| 如何舔出高潮| 五月伊人婷婷丁香| 晚上一个人看的免费电影| 日韩av在线免费看完整版不卡| 亚洲欧美清纯卡通| 亚洲中文av在线| 久久人人爽av亚洲精品天堂| 熟女av电影| 一级毛片电影观看| 亚洲人成网站在线观看播放| 久久久精品94久久精品| 两个人免费观看高清视频| 国产一区亚洲一区在线观看| 久久久国产欧美日韩av| 一级毛片 在线播放| 九九爱精品视频在线观看| 两性夫妻黄色片| 免费黄色在线免费观看| 这个男人来自地球电影免费观看 | 久久精品熟女亚洲av麻豆精品| 色婷婷av一区二区三区视频| 新久久久久国产一级毛片| 欧美日韩一级在线毛片| 国产亚洲一区二区精品| 视频在线观看一区二区三区| 久久人人爽人人片av| 男的添女的下面高潮视频| av不卡在线播放| 熟女电影av网| 欧美人与性动交α欧美软件| 欧美日韩一区二区视频在线观看视频在线| 国产在视频线精品| 欧美日韩一区二区视频在线观看视频在线| 高清欧美精品videossex| 久久精品人人爽人人爽视色| 国产精品久久久久久av不卡| 国产男女超爽视频在线观看| 精品卡一卡二卡四卡免费| 亚洲中文av在线| 啦啦啦中文免费视频观看日本| 人人妻人人爽人人添夜夜欢视频| 久久狼人影院| 一边亲一边摸免费视频| 久久婷婷青草| www.熟女人妻精品国产| 18+在线观看网站| 色哟哟·www| 成年女人在线观看亚洲视频| av网站在线播放免费| 在线观看一区二区三区激情| 777米奇影视久久| 久久久国产欧美日韩av| 精品午夜福利在线看| 少妇精品久久久久久久| 亚洲av福利一区| 国产成人精品一,二区| 亚洲精品乱久久久久久| 精品国产一区二区三区四区第35| 午夜久久久在线观看| 日韩视频在线欧美| √禁漫天堂资源中文www| 久久狼人影院| 男女高潮啪啪啪动态图| 黄片小视频在线播放| 91久久精品国产一区二区三区| 午夜免费观看性视频| 国产激情久久老熟女| 成年动漫av网址| 熟女少妇亚洲综合色aaa.| 久久国产精品男人的天堂亚洲| 在线观看三级黄色| 人妻 亚洲 视频| 国产精品 欧美亚洲| 人妻 亚洲 视频| 欧美少妇被猛烈插入视频| 成人午夜精彩视频在线观看| 国产日韩一区二区三区精品不卡| 99re6热这里在线精品视频| 丰满迷人的少妇在线观看| 久久亚洲国产成人精品v| 国产亚洲最大av| 国产午夜精品一二区理论片| 国产一区二区 视频在线| 亚洲,欧美精品.| 国产精品女同一区二区软件| www.av在线官网国产| 国产免费视频播放在线视频| 久久国产精品大桥未久av| 日韩欧美精品免费久久| 亚洲国产精品一区二区三区在线| 下体分泌物呈黄色| av在线观看视频网站免费| 国产亚洲一区二区精品| 久久精品国产自在天天线| 中文字幕亚洲精品专区| 少妇人妻久久综合中文| 巨乳人妻的诱惑在线观看| 大片电影免费在线观看免费| 国产成人午夜福利电影在线观看| 我的亚洲天堂| av有码第一页| 亚洲欧美清纯卡通| 美女大奶头黄色视频| 国产精品免费视频内射| av在线观看视频网站免费| 超碰97精品在线观看| 五月伊人婷婷丁香| 97在线人人人人妻| av网站在线播放免费| 日韩一区二区视频免费看| 欧美国产精品一级二级三级| 深夜精品福利| 啦啦啦视频在线资源免费观看| 90打野战视频偷拍视频| 欧美 亚洲 国产 日韩一| 国产福利在线免费观看视频| 亚洲精品第二区| 91国产中文字幕| 女的被弄到高潮叫床怎么办| 性少妇av在线| 美女午夜性视频免费| 97在线视频观看| 黄片小视频在线播放| 亚洲精品久久午夜乱码| 久久精品人人爽人人爽视色| 日本欧美国产在线视频| 男女啪啪激烈高潮av片| 美女视频免费永久观看网站| 美女国产视频在线观看| 国产色婷婷99| 亚洲国产精品一区三区| 日韩熟女老妇一区二区性免费视频| 亚洲欧美一区二区三区久久| 亚洲精品aⅴ在线观看| 欧美精品亚洲一区二区| 欧美日韩成人在线一区二区| 狠狠精品人妻久久久久久综合| 国产成人91sexporn| 国产精品久久久av美女十八| 一级毛片电影观看| 在线天堂中文资源库| 午夜91福利影院| 大话2 男鬼变身卡| 日韩中文字幕欧美一区二区 | 亚洲一区二区三区欧美精品| 国产精品久久久久久久久免| 七月丁香在线播放| 久久婷婷青草| 黄色怎么调成土黄色| 国产成人精品在线电影| 中文乱码字字幕精品一区二区三区| 午夜日本视频在线| 纯流量卡能插随身wifi吗| 99热网站在线观看| h视频一区二区三区| 美女xxoo啪啪120秒动态图| 国产欧美亚洲国产| 春色校园在线视频观看| 亚洲av中文av极速乱| 亚洲国产欧美日韩在线播放| 亚洲一区二区三区欧美精品| 性色av一级| 搡女人真爽免费视频火全软件| 精品亚洲成国产av| 丰满乱子伦码专区| 久久久久国产网址| 日本欧美国产在线视频| 一区二区三区精品91| 免费黄网站久久成人精品| 一本色道久久久久久精品综合| 久久精品aⅴ一区二区三区四区 | 国产不卡av网站在线观看| 看免费av毛片| 香蕉丝袜av| 久久久久国产精品人妻一区二区| 欧美bdsm另类| 精品一区二区三卡| 国产精品女同一区二区软件| 最近中文字幕2019免费版| 丝袜脚勾引网站| 亚洲精品,欧美精品| 日韩制服丝袜自拍偷拍| 熟女少妇亚洲综合色aaa.| 国产精品二区激情视频| 一本久久精品| 亚洲av国产av综合av卡| 国产欧美日韩一区二区三区在线| 亚洲国产欧美在线一区| 欧美人与善性xxx| 丰满少妇做爰视频| 视频在线观看一区二区三区| 九九爱精品视频在线观看| 中文精品一卡2卡3卡4更新| 亚洲国产精品999| 国产免费一区二区三区四区乱码| 天天躁夜夜躁狠狠久久av| 欧美 日韩 精品 国产| 各种免费的搞黄视频| 国产精品不卡视频一区二区| 9191精品国产免费久久| 美女大奶头黄色视频| 久热久热在线精品观看| 亚洲成国产人片在线观看| 18禁国产床啪视频网站| 久久午夜福利片| 亚洲av欧美aⅴ国产| 久久久久久免费高清国产稀缺| 日本vs欧美在线观看视频| 午夜福利乱码中文字幕| 中文字幕av电影在线播放| 在线看a的网站| 精品国产超薄肉色丝袜足j| av片东京热男人的天堂| 宅男免费午夜| 亚洲欧美一区二区三区久久| 2022亚洲国产成人精品| 亚洲少妇的诱惑av| 成人影院久久| 最近中文字幕2019免费版| 一级黄片播放器| 亚洲美女视频黄频| 少妇的逼水好多| 少妇猛男粗大的猛烈进出视频| 成人毛片60女人毛片免费| 丝袜在线中文字幕| 国产精品亚洲av一区麻豆 | 成人黄色视频免费在线看| 波多野结衣av一区二区av| 在线观看国产h片| 久久国产精品大桥未久av| 少妇 在线观看| 亚洲av成人精品一二三区| 久热这里只有精品99| 久久 成人 亚洲| 久久久久久久久久久久大奶| 伊人久久大香线蕉亚洲五| 大片电影免费在线观看免费| 黄色配什么色好看| 国产片特级美女逼逼视频| 男人操女人黄网站| 男人添女人高潮全过程视频| 啦啦啦中文免费视频观看日本| 满18在线观看网站| 亚洲精品国产av蜜桃| 日本猛色少妇xxxxx猛交久久| 精品酒店卫生间| 人妻少妇偷人精品九色| 亚洲美女视频黄频| 免费看不卡的av| 天天躁日日躁夜夜躁夜夜| 国产精品国产三级专区第一集| 新久久久久国产一级毛片| 多毛熟女@视频| 国产在线视频一区二区| 亚洲欧美中文字幕日韩二区| 日韩不卡一区二区三区视频在线| 少妇被粗大的猛进出69影院| 亚洲欧美一区二区三区久久| 91国产中文字幕| 亚洲欧美色中文字幕在线| xxxhd国产人妻xxx| 欧美精品人与动牲交sv欧美| 久久精品国产a三级三级三级| 亚洲精品国产色婷婷电影| 人体艺术视频欧美日本| 啦啦啦啦在线视频资源| 国产成人精品婷婷| 久久久久久久久久久免费av| 亚洲精品成人av观看孕妇| 一级毛片 在线播放| 欧美人与善性xxx| 中文乱码字字幕精品一区二区三区| 免费在线观看黄色视频的| 少妇被粗大的猛进出69影院| 咕卡用的链子| 国产 一区精品| 精品国产一区二区三区四区第35| 久久韩国三级中文字幕| 汤姆久久久久久久影院中文字幕| 久久久国产欧美日韩av| xxxhd国产人妻xxx| 久久久久久久久久久久大奶| 亚洲少妇的诱惑av| 天美传媒精品一区二区| 母亲3免费完整高清在线观看 | 亚洲美女黄色视频免费看| 亚洲欧美色中文字幕在线| 亚洲,一卡二卡三卡| 日韩av在线免费看完整版不卡| 国产亚洲精品第一综合不卡| 久久久久久久精品精品| 国产精品 国内视频| av在线app专区| 久久久久久久精品精品| 国产精品 国内视频| videos熟女内射| 最近中文字幕高清免费大全6| 一级片免费观看大全| 亚洲少妇的诱惑av| xxxhd国产人妻xxx| 91午夜精品亚洲一区二区三区| 高清在线视频一区二区三区| 国产成人av激情在线播放| 亚洲av欧美aⅴ国产| 国产日韩欧美亚洲二区| 啦啦啦中文免费视频观看日本| 麻豆av在线久日| 欧美精品高潮呻吟av久久| 高清不卡的av网站| 欧美日韩成人在线一区二区| 亚洲三级黄色毛片| videossex国产| 午夜av观看不卡| 国产av一区二区精品久久| 中文字幕精品免费在线观看视频| 26uuu在线亚洲综合色| 亚洲精华国产精华液的使用体验| 老司机亚洲免费影院| 精品一区二区三区四区五区乱码 | 中文字幕制服av|