• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    多特征融合的英文科技文獻(xiàn)增量式人名消歧應(yīng)用研究*

    2021-10-08 13:55:56阮光冊涂世文
    情報(bào)雜志 2021年9期

    阮光冊 涂世文 田 欣 張 莉

    (1.華東師范大學(xué)經(jīng)濟(jì)與管理學(xué)部信息管理系 上海 200241;2.上海科技發(fā)展有限公司 上海 200235)

    0 引 言

    準(zhǔn)確獲取指定作者的發(fā)文信息是文獻(xiàn)計(jì)量、科學(xué)計(jì)量、科學(xué)評價(jià)等領(lǐng)域研究的基礎(chǔ),也是情報(bào)學(xué)研究的重要問題。隨著世界科學(xué)研究的蓬勃發(fā)展,各類學(xué)術(shù)文獻(xiàn)數(shù)量正以驚人的速度增長。STM(Scientific Technical and Medical,簡稱STM,國際科學(xué)、技術(shù)和醫(yī)學(xué)出版商協(xié)會(huì))報(bào)告顯示[1],2018年,全球范圍內(nèi)的研究人員數(shù)量達(dá)到710萬,且每年以3%~4%的速度持續(xù)增長。在學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫中,作者的名稱屬性通常是識別和區(qū)分學(xué)術(shù)文獻(xiàn)實(shí)體最常用的標(biāo)識符,但相較于模糊匹配和邏輯檢索功能在文獻(xiàn)數(shù)據(jù)庫中的廣泛應(yīng)用,對英文數(shù)據(jù)庫的作者檢索則受到作者同名、重名以及人名處理標(biāo)準(zhǔn)不一致等問題的困擾,影響了檢索結(jié)果的精度。

    人名消歧屬于自然語言處理的研究范疇,科技文獻(xiàn)的人名消歧問題存在于各種語言中。就科技文獻(xiàn)的人名消歧來說,其目的是準(zhǔn)確獲取指定作者的發(fā)文信息,其核心問題是判斷出現(xiàn)在不同文獻(xiàn)中相同的作者名是否指向同一個(gè)人。解決該問題相對簡單的方法是為每一個(gè)科研工作者提供一個(gè)唯一的標(biāo)識符,如ORCID,但由于涉及隱私政策等原因,在網(wǎng)絡(luò)化和數(shù)字圖書館快速發(fā)展的今天,采用唯一標(biāo)識碼的方法已無法有效解決海量科技文獻(xiàn)數(shù)據(jù)增長的問題。利用自動(dòng)化方式進(jìn)行人名消歧是目前研究的方向,主要的做法是采用某種規(guī)則或者算法,將同名作者加以區(qū)分,將無歧義的信息呈現(xiàn)給用戶[2]。然而,在實(shí)際研究中,由于作者英文署名存在多種形式使得構(gòu)建的模型排歧精度不高、可擴(kuò)展性欠佳等諸多問題有待進(jìn)一步解決。

    為此,本文以學(xué)術(shù)文獻(xiàn)增量式人名消歧為研究對象,解決新增學(xué)術(shù)文獻(xiàn)論文歸屬問題。首先提取學(xué)術(shù)文獻(xiàn)中的多種特征數(shù)據(jù),借助語言模型BERT進(jìn)行語義特征抽取,將融合了文獻(xiàn)外部特征和文本內(nèi)部語義特征的數(shù)據(jù)輸入XGBoost集成模型進(jìn)行相似度匹配,通過計(jì)算,將新增文獻(xiàn)分配給同名作者中相似度最高的作者,完成學(xué)術(shù)文獻(xiàn)的增量消歧。最后,本文使用DBLP學(xué)術(shù)搜索平臺的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),獲得了較好的實(shí)驗(yàn)結(jié)果。

    1 研究現(xiàn)狀

    科技文獻(xiàn)作者同名消歧問題屬于命名實(shí)體消歧的范疇[3]。自從Bagga和Baldwin首次提出跨文本的同指消歧(Co-Reference)[4]之后,人名共指的研究逐漸引起了學(xué)界的關(guān)注。2001年,數(shù)字圖書館聯(lián)合會(huì)議就作者消歧問題展開討論,研究解決數(shù)字參考文獻(xiàn)檢索系統(tǒng)中作者同名問題。

    作者同名消歧本質(zhì)上是一個(gè)聚類或分類問題,一般包括特征抽取、相似度計(jì)算、消歧處理等步驟。

    基于文獻(xiàn)特征的人名消歧是最早被使用的研究方法,利用學(xué)術(shù)文獻(xiàn)的元數(shù)據(jù),將對同名作者有著較大區(qū)分度的特征提取出來,然后采用特征組合和構(gòu)造的方式,選擇并保留有效特征,借助模型實(shí)現(xiàn)對同名作者的分類,進(jìn)而實(shí)現(xiàn)消歧[2]。在特征提取時(shí),作者的個(gè)人信息或論文的題錄信息是常用的消歧特征。實(shí)踐研究表明,選擇有效的特征能準(zhǔn)確辨識作者的真實(shí)情況。如使用文獻(xiàn)的合作者信息進(jìn)行人名消歧[5],或?qū)⒆髡吆驼撐念}錄的多個(gè)概念特征進(jìn)行組合,作為消歧特征組,通過構(gòu)建相似度矩陣,借助聚類算法進(jìn)行消歧[6]。除了學(xué)術(shù)文獻(xiàn)基本元數(shù)據(jù)外,有學(xué)者[7]將論文的主題作為消歧特征提取,融合合作者信息、姓名關(guān)聯(lián)信息等多特征,實(shí)現(xiàn)人名消歧。

    根據(jù)對所使用特征處理方式的不同,人名消歧的方法又可以進(jìn)一步劃分為無監(jiān)督的消歧方法、有監(jiān)督的消歧方法和半監(jiān)督的消歧方法。無監(jiān)督的人名消歧基本思路為:將所選特征轉(zhuǎn)化為一組數(shù)值,通過計(jì)算,將相似度比對結(jié)果滿足閾值要求的論文歸屬為同一作者。采用的算法包括:K均值算法[8]、基于密度的聚類算法[9]、凝聚層次聚類算法(HAC)[10]以及各種改進(jìn)算法等等。由于無監(jiān)督方法使用非標(biāo)注的文獻(xiàn)數(shù)據(jù),借助選取的特征值計(jì)算各文獻(xiàn)間的相似度,面對大量文獻(xiàn)時(shí),運(yùn)算效率會(huì)有所下降,且聚類文獻(xiàn)與現(xiàn)實(shí)中作者的對應(yīng)關(guān)系也存在問題。雖有學(xué)者提出了多階段的聚類策略[11],一定程度上提高了無監(jiān)督聚類的準(zhǔn)確率,但實(shí)體對應(yīng)關(guān)系問題依然極大地限制了其使用場景。有監(jiān)督的方法利用標(biāo)注好的訓(xùn)練數(shù)據(jù)集來學(xué)習(xí)分類模型,其做法為:總結(jié)已知作者發(fā)文、所屬單位等特征,依據(jù)這些特征對新出現(xiàn)論文進(jìn)行判斷,決定歸屬。文獻(xiàn)[12]采用隨機(jī)森林和DBSCAN 聚類的方法,在USPTO專利數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),獲得了較好的人名消歧效果。有監(jiān)督方法效率與精度較高,不足的地方在于需要大量標(biāo)注好的樣本,有時(shí)需要專業(yè)人員耗費(fèi)大量的時(shí)間對數(shù)據(jù)進(jìn)行標(biāo)注,限制了其在大型數(shù)據(jù)庫中的應(yīng)用。結(jié)合非監(jiān)督和監(jiān)督算法的優(yōu)點(diǎn),研究人員開始嘗試采用將少量標(biāo)注數(shù)據(jù)與大量無標(biāo)注數(shù)據(jù)相結(jié)合[13],通過訓(xùn)練模型,進(jìn)行人名消歧。然而,半監(jiān)督的方法需要人工定義規(guī)則,以實(shí)現(xiàn)數(shù)據(jù)標(biāo)注[14],在處理大規(guī)模數(shù)據(jù)集的人名消歧任務(wù)時(shí),仍存在不足。

    考慮到學(xué)術(shù)文獻(xiàn)數(shù)據(jù)中可利用的信息有限,研究者嘗試整合外部的資源和知識來達(dá)到數(shù)據(jù)增強(qiáng)的效果。該類方法的一般思路是:結(jié)合外部公開的資源和知識庫,通過創(chuàng)建新的規(guī)則和類別,將待消歧的姓名與現(xiàn)實(shí)世界中人物信息中區(qū)分度較強(qiáng)且準(zhǔn)確的社會(huì)屬性建立聯(lián)系,從而獲得更豐富的人物特征,并基于這些社會(huì)屬性進(jìn)行分類,從而實(shí)現(xiàn)消歧的目的。文獻(xiàn)[15]通過獲取包含作者文章的Web網(wǎng)頁,判斷兩個(gè)待消歧作者的文獻(xiàn)是否同時(shí)出現(xiàn)在一篇Web文檔中,從而區(qū)分人名。然而,借助外部資源獲取額外的信息,客觀上會(huì)影響文獻(xiàn)檢索的效率,此外如何避免外部信息所帶來的噪音,也是該方法面臨的難題。

    目前,一些研究開始探討對學(xué)術(shù)論文所包含的語義特征進(jìn)行計(jì)算,對同一作者的研究成果進(jìn)行辨識,從而實(shí)現(xiàn)對著者姓名的消歧。如文獻(xiàn)[16]利用語義分析技術(shù)對機(jī)構(gòu)知識庫進(jìn)行作者人名消歧,而文獻(xiàn)[17]則使用生物神經(jīng)網(wǎng)絡(luò)層級時(shí)序記憶( Hierarchical Temporal Memory,HTM) 對論文摘要進(jìn)行信息表示,實(shí)現(xiàn)作者人名消歧。

    綜上所述,對于學(xué)術(shù)文獻(xiàn)作者姓名消歧問題,現(xiàn)有的多種研究方法均存在各自的優(yōu)勢與不足。本文以增量式人名消歧場景作為研究對象,將BERT預(yù)訓(xùn)練語言模型引入作者人名消歧的研究,借助深度學(xué)習(xí)強(qiáng)大的語義特征提取和表示能力,解決英文文獻(xiàn)作者消歧的問題。本文旨在探索深度學(xué)習(xí)方法在解決姓名歧義問題時(shí)的可用性并評價(jià)其消歧效果。

    2 方法設(shè)計(jì)

    人名增量消歧本質(zhì)上是一個(gè)分類問題。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的分類方法主要是通過將文本表示為特征向量,利用特征對文本進(jìn)行降維,選擇算法模型(如:SVM,樸素貝葉斯等)實(shí)現(xiàn)分類。這種基于詞袋模型的分類方法對特征工程的依賴度較高,在復(fù)雜任務(wù)及大數(shù)據(jù)量的情況下,從原始數(shù)據(jù)中自動(dòng)學(xué)習(xí)抽象的、高層次的全局特征的能力不強(qiáng),使得分類模型的泛化能力較差。相對于機(jī)器學(xué)習(xí)方法,深度學(xué)習(xí)方法能夠從大規(guī)模無標(biāo)注語料中學(xué)習(xí)詞的語義和句法信息,通過組合多個(gè)非線性模型,將文本數(shù)據(jù)轉(zhuǎn)化為更高層次的知識表示[18],在無需大量特征工程的情況下,從大數(shù)據(jù)中自動(dòng)學(xué)習(xí)文本特征并刻畫出文本的內(nèi)在信息,提高分類的效果。

    在學(xué)術(shù)文獻(xiàn)不斷動(dòng)態(tài)增長的情景下,無法依靠人工方式建立分類特征?;诖耍疚囊陨疃葘W(xué)習(xí)框架為核心,在較少的人工干預(yù)情況下,利用詞向量方法對特定應(yīng)用情境下的語義特征進(jìn)行提取,快速高效的從歷史數(shù)據(jù)中學(xué)習(xí)高層次知識表達(dá),實(shí)現(xiàn)科技文獻(xiàn)增量式人名消歧方法。

    2.1科技文獻(xiàn)的元數(shù)據(jù)特征分析科技文獻(xiàn)的元數(shù)據(jù)因類型不同而異,文獻(xiàn)[19]按照是否涉及文獻(xiàn)內(nèi)容將科技文獻(xiàn)元數(shù)據(jù)分為文獻(xiàn)的內(nèi)部特征和外部特征。基于這一分類方式,本文選擇進(jìn)行人名消歧的文獻(xiàn)元數(shù)據(jù)如表1所示。

    表1 用于作者名消歧的文獻(xiàn)元數(shù)據(jù)

    依據(jù)文獻(xiàn)[19],本文選擇作者、合作者、作者單位、期刊名、發(fā)表時(shí)間等元數(shù)據(jù)作為科技文獻(xiàn)外部特征進(jìn)行消歧計(jì)算。這些特征不涉及(或較少涉及)科技文獻(xiàn)的內(nèi)容,屬于文獻(xiàn)的外部標(biāo)識,在實(shí)踐應(yīng)用中,本文采用特征相似性匹配的分析方法,通過閾值,判斷學(xué)者與新增科技文獻(xiàn)之間的歸屬問題。相對應(yīng)的,關(guān)鍵詞、標(biāo)題和摘要等內(nèi)部特征,其具有較強(qiáng)的文本語義屬性,本文采用語義表征學(xué)習(xí)模型BERT對其進(jìn)行計(jì)算,構(gòu)建蘊(yùn)含文獻(xiàn)語義信息的特征向量,識別學(xué)者與待歸屬文獻(xiàn)之間的語義關(guān)聯(lián)。

    2.2融合多特征增量式人名消歧方法設(shè)計(jì)學(xué)術(shù)檢索平臺的科技文獻(xiàn)數(shù)量龐大,數(shù)據(jù)處于增量式更新狀態(tài),且新增文獻(xiàn)的規(guī)模以及更新時(shí)間無法確定。在數(shù)據(jù)不斷動(dòng)態(tài)增長的情景下,如果仍舊采用全局人名消歧的方法,不僅聚類計(jì)算的時(shí)間復(fù)雜度非常高,同時(shí)聚類也將耗費(fèi)大量的計(jì)算資源,為此,在性能和速度上往往讓人難以接受。

    在實(shí)踐應(yīng)用過程中,科技文獻(xiàn)作者人名增量消歧的過程,是在已經(jīng)擁有一批消歧文獻(xiàn)數(shù)據(jù)基礎(chǔ)上進(jìn)行的,其核心思路是快速、準(zhǔn)確的將新增學(xué)術(shù)文獻(xiàn)分配給已有作者。傳統(tǒng)上,圖書館或科研管理機(jī)構(gòu)在進(jìn)行作者人名規(guī)范時(shí),采用將人名與機(jī)構(gòu)名相結(jié)合的方式進(jìn)行作者分配,但受到機(jī)構(gòu)名變更、簡稱重名等問題的干擾,分配結(jié)果仍需要大量的人工進(jìn)行識別,使得這種方法不僅費(fèi)時(shí),準(zhǔn)確率也無法保障。

    為實(shí)現(xiàn)增量式人名消歧,本文首先構(gòu)建了兩個(gè)文獻(xiàn)集:現(xiàn)有作者檔案文獻(xiàn)集和新增學(xué)術(shù)文獻(xiàn)集。實(shí)驗(yàn)步驟為:通過機(jī)器學(xué)習(xí),從現(xiàn)有作者檔案文獻(xiàn)集中,計(jì)算出“作者—文獻(xiàn)”的特征向量模型,然后利用該模型對新增學(xué)術(shù)文獻(xiàn)進(jìn)行匹配計(jì)算,將符合閾值的文獻(xiàn)分配給已有作者。如果新增文獻(xiàn)的作者不在現(xiàn)有作者檔案文獻(xiàn)集中,則新建其檔案,加入現(xiàn)有作者檔案文獻(xiàn)集。

    本文提出的融合文獻(xiàn)內(nèi)容外部特征的人名增量式消歧方法實(shí)現(xiàn)流程如圖1所示。

    由圖1所示,本文的方法分成兩大過程,即:特征學(xué)習(xí)和增量式消歧。其中,特征學(xué)習(xí)是本文方法的核心,借助機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的方法,從現(xiàn)有作者檔案文獻(xiàn)集中學(xué)習(xí)一個(gè)特征向量模型,步驟為:構(gòu)建已明確作者歸屬的“作者-文獻(xiàn)”集,首先,生成正負(fù)樣本集,其中,正樣本集為正確歸屬文獻(xiàn)的數(shù)據(jù)集合,負(fù)樣本為非正確文獻(xiàn)歸屬的數(shù)據(jù)集合。對于負(fù)樣本集,本文以隨機(jī)方式,從現(xiàn)有已明確作者歸屬的文獻(xiàn)集中選取同名作者,并將作者對應(yīng)的歸屬文獻(xiàn)進(jìn)行隨機(jī)的錯(cuò)亂重排;隨后,抽取正負(fù)樣本集中文獻(xiàn)的外部特征(見表1),并對文獻(xiàn)內(nèi)部特征采用BERT模型計(jì)算向量;最后,將獲得的文獻(xiàn)外部特征與BERT獲得向量特征融合為一個(gè)特征序列,輸入XGBoost模型進(jìn)行訓(xùn)練。

    圖1 增量式人名消歧義方法流程圖

    對于增量式消歧部分,首先提取新增文獻(xiàn)的外部特征,并采用BERT模型對文獻(xiàn)內(nèi)部特征進(jìn)行向量計(jì)算,生成一個(gè)新增文獻(xiàn)特征序列,借助XGBoost訓(xùn)練好的模型對新增學(xué)術(shù)文獻(xiàn)的特征序列進(jìn)行分類計(jì)算,預(yù)測作者歸屬,將新增文獻(xiàn)分配給各種特征維度上最為相似的作者,進(jìn)而完成增量式人名消歧。

    2.3學(xué)術(shù)文獻(xiàn)內(nèi)部語義特征提取方法人名消歧方法常用論文的標(biāo)題、關(guān)鍵詞以及論文合作者等作為文獻(xiàn)作者的研究方向,進(jìn)而實(shí)現(xiàn)人名消歧[17]。關(guān)鍵詞和標(biāo)題雖然可以反映論文的主題信息,但受限于關(guān)鍵詞的規(guī)范性以及主題粒度大小不一的問題,仍然無法完整地表達(dá)論文的核心思想。目前,一些研究已經(jīng)開始使用摘要作為消歧特征之一,具體做法是通過對摘要進(jìn)行分詞和去停用詞等預(yù)處理后,抽取特征詞描述文獻(xiàn)的主題,其本質(zhì)是將長文本信息轉(zhuǎn)換為詞的形式[8-9],一定程度上損失了語義信息。為此,本文選擇BERT語言模型,借助該模型對句子級別文本的語義表示能力,最大限度的保留摘要文本的上下文語義信息。

    BERT(Bidirectional Encoder Representations from Transformers)模型[20]是Google AI團(tuán)隊(duì)在2018年開源的自然語言處理模型,該模型的主要特點(diǎn)是利用兩個(gè)方向的上下文信息獲得文本深層次的語義,是一種新的自然語言文本表征方法。相對于Word2Vec等其它廣泛使用的詞向量技術(shù),BERT模型通過遮蔽語言模型(Masked Language Model)和下一句預(yù)測兩個(gè)預(yù)訓(xùn)練任務(wù),在大規(guī)模的語料集上進(jìn)行無監(jiān)督的預(yù)訓(xùn)練,再以預(yù)訓(xùn)練模型為基礎(chǔ),通過模型微調(diào)(Fine-tuning)實(shí)現(xiàn)下游文本語義分析任務(wù)。BERT預(yù)訓(xùn)練模型在無監(jiān)督環(huán)境下,能夠?qū)W習(xí)到語料庫中的語言先驗(yàn)知識,可以在標(biāo)注語料稀缺的場景下完成訓(xùn)練任務(wù)。在預(yù)訓(xùn)練過程中,BERT結(jié)合了語料庫中的語言先驗(yàn)知識,使得模型在文本特征的提取和表示方面明顯具備優(yōu)勢。在解決一詞多義問題方面,BERT模型通過詞匯間上下文關(guān)系,記錄了文獻(xiàn)中詞匯的語義信息,可以較好的解決不同語境下的詞義問題。

    2.4基于XGBoost的文獻(xiàn)匹配增量消歧可以認(rèn)為是一個(gè)新增文獻(xiàn)與已有作者的匹配問題,其本質(zhì)上是一種分類問題。為了實(shí)現(xiàn)新增文獻(xiàn)與已有作者的匹配,首先需要提取已經(jīng)明確了文獻(xiàn)與作者匹配關(guān)系的數(shù)據(jù)集的特征,借助機(jī)器學(xué)習(xí)方法,構(gòu)建模型;隨后,提取新增文獻(xiàn)的特征,并將其輸入已構(gòu)建好的模型中,通過計(jì)算,實(shí)現(xiàn)新增文獻(xiàn)與已有作者的匹配。

    本文選擇極端梯度提升算法XGBoost[21]進(jìn)行特征計(jì)算,并構(gòu)建模型。XGBoost是基于CART回歸樹的一種boosting集成算法,其核心思想是通過建立多棵回歸樹,使樣本預(yù)測盡可能接近樣本的真實(shí)值,在實(shí)踐中,算法具有一定的泛化能力。XGBoost算法在訓(xùn)練大數(shù)量時(shí),可以通過同層節(jié)點(diǎn)的并行化計(jì)算方式,提高計(jì)算效率。

    科技文獻(xiàn)元數(shù)據(jù)會(huì)有一些缺失值,如摘要和關(guān)鍵詞等,這就使得數(shù)據(jù)具有稀疏性。XGBoost模型在訓(xùn)練數(shù)據(jù)時(shí),首先對沒有缺失值的數(shù)據(jù)進(jìn)行分裂,然后計(jì)算缺失值最佳的分裂方案,這使得該模型對缺失值并不敏感,具有較好地處理稀疏型數(shù)據(jù)的能力。

    為獲得更好的模型預(yù)測能力,本文在模型訓(xùn)練時(shí)采用交叉驗(yàn)證的形式提高消歧的效果。

    2.5方法評估本文使用加權(quán)F1 值 (weighted f1-score) 作為模型評估度量。

    對于單一作者的情況,模型的準(zhǔn)確率、召回率和F1 值的計(jì)算規(guī)則如下:

    對于有多個(gè)作者的情況,其準(zhǔn)確率為單一作者的準(zhǔn)確率乘以單個(gè)作者的F1值。同理,多個(gè)作者的召回率和F1值均為單個(gè)作者的F1值加權(quán)后的結(jié)果。其計(jì)算方式如下:

    WeightedF1=

    3 實(shí)驗(yàn)過程

    3.1樣本的構(gòu)建本文以DBLP(https://dblp.uni-trier.de/db/)學(xué)術(shù)搜索平臺中的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)集為實(shí)驗(yàn)數(shù)據(jù),首先獲取論文數(shù)據(jù),并對其進(jìn)行了預(yù)先的消歧和標(biāo)注,實(shí)現(xiàn)“作者-文獻(xiàn)”的關(guān)聯(lián),構(gòu)建現(xiàn)有作者檔案文獻(xiàn)集,為確保數(shù)據(jù)集的準(zhǔn)確性,本文選取帶有ORCID的作者,構(gòu)建“文獻(xiàn)-作者”數(shù)據(jù)集,作為學(xué)術(shù)文獻(xiàn)同名作者消歧的預(yù)訓(xùn)練和效果檢驗(yàn)。實(shí)驗(yàn)數(shù)據(jù)如表2所示。

    表2 數(shù)據(jù)集概覽

    通過檢索,文本共獲取實(shí)際作者11 420個(gè),共計(jì)107 002篇論文。由于存在同名情況,共獲得109個(gè)作者名。實(shí)驗(yàn)中,本文選擇了全部作者的101 797篇論文作為模型訓(xùn)練,并隨機(jī)選擇了1 542個(gè)實(shí)際作者的5 205篇論文作為測試集。

    如圖1所示,本文在模型訓(xùn)練時(shí),為提高模型的分類效果,將訓(xùn)練集劃分為正、負(fù)兩個(gè)樣本集合。其中負(fù)樣本集的作用是提高模型的分類效果,負(fù)樣本集的生成流程如下所示:

    (1)選取訓(xùn)練集中發(fā)表文獻(xiàn)數(shù)量大于6篇的作者,構(gòu)建“作者-文獻(xiàn)”集合;

    (2)在“作者-文獻(xiàn)”集合中,隨機(jī)選取若干個(gè)同名作者的集合,并隨機(jī)抽取集合中每位作者20%的文獻(xiàn),對這些文獻(xiàn)的作者與文獻(xiàn)隨機(jī)錯(cuò)亂重排,形成負(fù)樣本。

    3.2數(shù)據(jù)預(yù)處理本文選擇科技文獻(xiàn)的元數(shù)據(jù)包括作者名、合作者、作者單位、期刊(會(huì)議)名、論文標(biāo)題、發(fā)表時(shí)間、論文關(guān)鍵詞和摘要信息。由于科技文獻(xiàn)的來源不同,這些元數(shù)據(jù)的格式也不同,為此,在特征提取前,需要對其進(jìn)行專門的處理。具體處理思路如下所示:

    a.機(jī)構(gòu)名、期刊(會(huì)議)名。對于這些短文本數(shù)據(jù),本文采用常規(guī)的處理方法,首先去除文本中的特殊字符,并將所有內(nèi)容轉(zhuǎn)換為小寫格式。

    b.作者名。由于不同文獻(xiàn)對作者名的格式要求不同,使得文獻(xiàn)集合中作者名存在多種格式,如作者“Wang Ping”,會(huì)存在“Wang P”“Ping Zhang”“WANG PING”等多種形式,為此,需要對其進(jìn)行處理并統(tǒng)一格式。本文采用字典映射的方式對其進(jìn)行處理,首先構(gòu)建標(biāo)準(zhǔn)作者名格式,隨后將文獻(xiàn)中的作者名映射為標(biāo)準(zhǔn)格式。對于一些姓名前后顛倒的形式,本文采用統(tǒng)計(jì)字母個(gè)數(shù)的方式,對共現(xiàn)字符數(shù)相同的姓名進(jìn)行規(guī)范格式的映射。通過人為檢測,字典映射方法基本可以準(zhǔn)確的實(shí)現(xiàn)作者名的關(guān)聯(lián)。

    c.論文發(fā)表時(shí)間。發(fā)表時(shí)間預(yù)處理需要解決的問題是字段缺失和少量的錯(cuò)誤數(shù)據(jù)。由于人為的錯(cuò)誤,少數(shù)論文發(fā)表年份為錯(cuò)誤數(shù)據(jù),如“2030年”。對于缺失數(shù)據(jù)和錯(cuò)誤數(shù)據(jù),本文采用的策略是,如果該作者有多篇論文,則以該作者所有論文發(fā)表時(shí)間的中位數(shù)進(jìn)行填充,如果該作者僅有一篇論文,則使用數(shù)據(jù)集中所有論文發(fā)表時(shí)間的中位數(shù)進(jìn)行填充。

    d.論文標(biāo)題和摘要信息。預(yù)處理的目的是降低文本的維度,主要采用詞形歸一化處理,使用NLTK工具進(jìn)行了詞形還原。

    預(yù)處理完成后,每篇文獻(xiàn)形成如下數(shù)據(jù)表示:

    Article: {year, author, coauthor, orgs, title, venue, keywords, abstract}

    3.3文獻(xiàn)元數(shù)據(jù)的特征提取本文實(shí)現(xiàn)人名消歧,需要構(gòu)建文獻(xiàn)內(nèi)外部元數(shù)據(jù)的交叉特征集,具體的操作如下:

    a. 時(shí)間元數(shù)據(jù)的特征。時(shí)間是科技文獻(xiàn)的重要特征,可以反映作者的研究主題和特點(diǎn)??紤]到學(xué)者在一個(gè)連續(xù)時(shí)間內(nèi)的研究成果具有一定相似性的特征,消歧模型構(gòu)建時(shí),本文采用了多個(gè)時(shí)間統(tǒng)計(jì)策略,具體為:

    year:{yeareraly,yearnewest,yearmean,yearstd,yearmedien}

    上述的統(tǒng)計(jì)策略分別表示某位作者發(fā)表第一篇文獻(xiàn)的時(shí)間,最新論文發(fā)表的時(shí)間,發(fā)表論文時(shí)間的均值、標(biāo)準(zhǔn)差和中位數(shù)。對于新增文獻(xiàn),分別與同名作者的5個(gè)時(shí)間統(tǒng)計(jì)特征進(jìn)行比對,計(jì)算時(shí)間序列上匹配程度。

    b. 作者、單位、期刊名等元數(shù)據(jù)的特征。本文發(fā)現(xiàn)這一類特征采用簡單的匹配方式就可獲得較好的效果,為此,本文在實(shí)驗(yàn)中采用相等匹配和集合匹配兩種方法。

    相等匹配即為字符串完全相等。對于作者、期刊名等元數(shù)據(jù),通過規(guī)范化處理,對完全相同的元數(shù)據(jù)則認(rèn)為匹配成功。

    集合匹配主要針對作者所在單位。由于作者單位元數(shù)據(jù)存在格式不一致的問題,在實(shí)驗(yàn)中,本文發(fā)現(xiàn)有的作者單位是簡略的信息,而有些是非常完整的信息。如:簡略的形式為“*** University”,而完整的形式為“*** University *** Department,*** Street”。為此,實(shí)驗(yàn)中,首先對作者單位元數(shù)據(jù)按照空格分詞,形成詞匯集;在匹配時(shí),將新增文獻(xiàn)的作者單位與已有作者的單位進(jìn)行比對,計(jì)算兩個(gè)集合交集與最短集合長度之間的比值,如果達(dá)到一定的閾值,則認(rèn)為匹配成功。

    c. 文獻(xiàn)內(nèi)部元數(shù)據(jù)的特征。人名消歧選取的文獻(xiàn)內(nèi)部元數(shù)據(jù)包括:摘要、標(biāo)題和關(guān)鍵字。為了更好地獲取這些元數(shù)據(jù)的語義特征,本文借助BERT模型將文獻(xiàn)的這些元數(shù)據(jù)轉(zhuǎn)換成一個(gè)帶有語義信息的向量。假設(shè)文獻(xiàn)a={ abstract, title, keywords },使用BERT模型將a轉(zhuǎn)換為向量va,則某位作者的文獻(xiàn)向量集合即為{va1,va2,…van},其中n為該作者的發(fā)文總量。對于新增文獻(xiàn),其向量表示為vb,論文歸屬問題及轉(zhuǎn)換為vb和向量集合文獻(xiàn)的相似度計(jì)算。

    在構(gòu)建文獻(xiàn)內(nèi)部特征向量時(shí),使用PyTorch深度學(xué)習(xí)框架實(shí)現(xiàn)的BERT模型(https://pypi.org/project/sentence-transformers/)來進(jìn)行語義特征表示,實(shí)驗(yàn)中,將元數(shù)據(jù)轉(zhuǎn)換為一個(gè)768維的數(shù)值型向量表示。在匹配計(jì)算時(shí),關(guān)鍵字、標(biāo)題和摘要分別轉(zhuǎn)化為5個(gè)統(tǒng)計(jì)特征,即最小值、最大值、均值、標(biāo)準(zhǔn)差和中位數(shù)。以摘要為例,圖2顯示了文獻(xiàn)a和文獻(xiàn)b的摘要經(jīng)過BERT語義向量表示后的結(jié)果。

    圖2 學(xué)術(shù)文獻(xiàn)摘要BERT語義向量表示

    圖3顯示了文獻(xiàn)a和文獻(xiàn)b的摘要相似度計(jì)算結(jié)果。

    圖3 學(xué)術(shù)文獻(xiàn)摘要相似度特征

    最后,將外部特征和內(nèi)部特征融合后的結(jié)果輸入XGBoost進(jìn)行模型訓(xùn)練。

    3.4作者匹配根據(jù)上文對文獻(xiàn)內(nèi)外部特征提取完成后,基于構(gòu)建的正負(fù)樣本,本文使用XGBoost(https://pypi.org/project/xgboost/)模型完成特征的融合和作者匹配。

    具體匹配的步驟為,首先將樣本數(shù)據(jù)輸入XGBoost,通過調(diào)參,完成模型的訓(xùn)練;隨后,對于新增文獻(xiàn),先將新增文獻(xiàn)作者與現(xiàn)有作者進(jìn)行匹配,獲得一些列同名作者;隨后采用XGBoost對新增文獻(xiàn)的特征與同名作者的文獻(xiàn)特征進(jìn)行相似度計(jì)算;最后輸出匹配分?jǐn)?shù)最高的作者ID作為新增文獻(xiàn)的所屬作者。

    3.5結(jié)果對比為了評估模型的效果,本文對比了多組實(shí)驗(yàn)的結(jié)果,實(shí)驗(yàn)具體設(shè)置如下:

    a.BERT語義特征和學(xué)術(shù)文獻(xiàn)基本特征的方法,本文方法。

    b.Word2Vec(使用gensim包完成)特征的SVM分類方法,簡化表示為 Word2Vec + SVM。

    c.Word2Vec特征的XGBoost分類方法,簡化表示為 Word2Vec + XGBoosts。

    d.對比文獻(xiàn)[17]提出的基于SDR的人名消歧方法。

    具體的實(shí)驗(yàn)結(jié)果如表3所示。

    表3 增量消歧實(shí)驗(yàn)結(jié)果

    從表3中幾種方法在測試集上的指標(biāo)數(shù)值可見,本文提出的方法表現(xiàn)出較好的效果, F1取得了95.6%的分值,高于其他模型的性能表現(xiàn)。相比于基于Word2vec+XGBoost的方法,本文方法提高了約7%,相比于Word2vec+SVM的方案,本文方法提高了約6%。

    此外,對比文獻(xiàn)[17]的實(shí)驗(yàn)結(jié)果,雖然基于SDR方法的準(zhǔn)確值更高,但是召回率和F1值方面來看,本文的方法更優(yōu)。且文獻(xiàn)[17]采用的是數(shù)據(jù)量小(實(shí)驗(yàn)數(shù)據(jù)為19個(gè)作者的88篇論文),因此從總體上來看,本文方法具有一定的合理性。

    4 結(jié) 語

    增量消歧,需要快速且準(zhǔn)確地將文獻(xiàn)分配給系統(tǒng)中已有作者,這是學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫在進(jìn)行更新時(shí)最亟待解決的問題。本文提出了一種融合多特征的相似度匹配方法實(shí)現(xiàn)增量式人名消歧研究,借助BERT自然語言處理模型和XGBoost分類模型進(jìn)行相似度匹配,將新增文獻(xiàn)分配給相似度得分最高的作者。通過實(shí)驗(yàn)對比,本文方法獲得了較好的增量式人名消歧效果。

    然而,該文的研究也存在一些改進(jìn)的地方,如:

    a.本文選取了科技文獻(xiàn)的多個(gè)元數(shù)據(jù),形成了多特征融合的消歧模型,但在實(shí)際應(yīng)用中,如何設(shè)定每個(gè)特征的權(quán)重值,合理分配外部特征匹配和內(nèi)部語義特征所占的比重,進(jìn)一步提高模型的準(zhǔn)確率,是實(shí)踐應(yīng)用中需要解決的問題。

    b.本研究僅限于對英文語言的學(xué)術(shù)文獻(xiàn)作者同名消歧,對跨語言的同名作者消歧并未涉略。因?yàn)椴煌Z言之間的名字形式不一致,跨語言學(xué)術(shù)文獻(xiàn)同名作者消歧更具有挑戰(zhàn),同時(shí)也是進(jìn)行多來源學(xué)術(shù)文獻(xiàn)組織和管理的難題,今后會(huì)對這方面逐步開展研究。

    日韩一本色道免费dvd| 欧美最新免费一区二区三区| videos熟女内射| 欧美成人午夜免费资源| 丝瓜视频免费看黄片| 18禁观看日本| 精品99又大又爽又粗少妇毛片| 久久久久久久大尺度免费视频| 一边摸一边做爽爽视频免费| 一本大道久久a久久精品| 热99国产精品久久久久久7| av国产久精品久网站免费入址| 久久午夜福利片| 国语对白做爰xxxⅹ性视频网站| 亚洲精品av麻豆狂野| 亚洲国产最新在线播放| 美女内射精品一级片tv| 国产免费视频播放在线视频| 免费观看性生交大片5| 国产精品一区二区在线不卡| 精品少妇久久久久久888优播| 精品少妇内射三级| 国产精品熟女久久久久浪| 欧美人与性动交α欧美软件 | 亚洲欧美色中文字幕在线| h视频一区二区三区| 中国美白少妇内射xxxbb| 岛国毛片在线播放| 国产成人午夜福利电影在线观看| 成人午夜精彩视频在线观看| 欧美激情国产日韩精品一区| 波野结衣二区三区在线| 国产福利在线免费观看视频| 91午夜精品亚洲一区二区三区| 国产精品成人在线| 亚洲国产av新网站| 亚洲国产看品久久| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 亚洲欧美一区二区三区国产| 国产精品一二三区在线看| 麻豆精品久久久久久蜜桃| 女人被躁到高潮嗷嗷叫费观| 精品亚洲成a人片在线观看| 亚洲三级黄色毛片| 免费在线观看完整版高清| 国产白丝娇喘喷水9色精品| 免费女性裸体啪啪无遮挡网站| 亚洲精品乱码久久久久久按摩| 成人手机av| www.色视频.com| 在线观看三级黄色| 美女xxoo啪啪120秒动态图| 国产免费一区二区三区四区乱码| 大香蕉97超碰在线| 亚洲欧美日韩另类电影网站| 亚洲国产成人一精品久久久| 一级爰片在线观看| 91精品三级在线观看| 美女中出高潮动态图| 国产xxxxx性猛交| 国产伦理片在线播放av一区| 少妇高潮的动态图| 在线观看三级黄色| 亚洲精品,欧美精品| 大香蕉久久成人网| 日本午夜av视频| 爱豆传媒免费全集在线观看| 黑人欧美特级aaaaaa片| videossex国产| 曰老女人黄片| 婷婷成人精品国产| 日本91视频免费播放| 赤兔流量卡办理| videosex国产| 男女啪啪激烈高潮av片| 又大又黄又爽视频免费| 欧美另类一区| 一二三四中文在线观看免费高清| 亚洲四区av| 另类精品久久| 国产xxxxx性猛交| 看免费成人av毛片| 大话2 男鬼变身卡| 国产 一区精品| 国产精品人妻久久久影院| 欧美性感艳星| 国产精品嫩草影院av在线观看| 国产精品熟女久久久久浪| 亚洲国产欧美日韩在线播放| 免费黄频网站在线观看国产| 成年女人在线观看亚洲视频| 99国产精品免费福利视频| 精品国产露脸久久av麻豆| 国产黄色免费在线视频| 亚洲国产精品专区欧美| 国产精品一区二区在线不卡| 亚洲综合精品二区| 欧美丝袜亚洲另类| 国产高清三级在线| 亚洲精品美女久久久久99蜜臀 | 国产国语露脸激情在线看| 色哟哟·www| 国产免费一区二区三区四区乱码| 亚洲精品中文字幕在线视频| 80岁老熟妇乱子伦牲交| 成年人免费黄色播放视频| 亚洲av日韩在线播放| 中文字幕人妻熟女乱码| 激情五月婷婷亚洲| 成人无遮挡网站| 久久99热6这里只有精品| 丝袜喷水一区| 久久久久精品人妻al黑| 人成视频在线观看免费观看| 久久精品久久久久久噜噜老黄| 久久久精品94久久精品| 婷婷色综合www| 丝袜在线中文字幕| 日韩电影二区| 久久久国产精品麻豆| 视频在线观看一区二区三区| 99久久综合免费| 曰老女人黄片| 伊人久久国产一区二区| 99re6热这里在线精品视频| 精品福利永久在线观看| 亚洲欧洲国产日韩| av天堂久久9| 久久久久网色| 高清毛片免费看| a级片在线免费高清观看视频| 熟女电影av网| 制服诱惑二区| 中文字幕最新亚洲高清| 国产精品久久久久成人av| 欧美成人精品欧美一级黄| 午夜福利乱码中文字幕| 全区人妻精品视频| av免费观看日本| 久久人人爽人人爽人人片va| 日日爽夜夜爽网站| 亚洲五月色婷婷综合| 国产色爽女视频免费观看| 国产探花极品一区二区| 男的添女的下面高潮视频| 日韩制服骚丝袜av| 天堂8中文在线网| 亚洲欧美中文字幕日韩二区| 久久精品国产鲁丝片午夜精品| 97超碰精品成人国产| 狠狠婷婷综合久久久久久88av| 69精品国产乱码久久久| www.熟女人妻精品国产 | 欧美日韩一区二区视频在线观看视频在线| 69精品国产乱码久久久| 久久午夜综合久久蜜桃| 免费日韩欧美在线观看| 亚洲伊人色综图| 十八禁网站网址无遮挡| 一级,二级,三级黄色视频| 最近最新中文字幕免费大全7| 亚洲精品av麻豆狂野| 久久久精品区二区三区| 久久婷婷青草| 国产av码专区亚洲av| 婷婷色综合大香蕉| 自拍欧美九色日韩亚洲蝌蚪91| 日韩欧美精品免费久久| 亚洲图色成人| 成人免费观看视频高清| 午夜av观看不卡| 人人澡人人妻人| 国产精品国产三级国产专区5o| 亚洲丝袜综合中文字幕| 天堂中文最新版在线下载| 十分钟在线观看高清视频www| 少妇猛男粗大的猛烈进出视频| 如何舔出高潮| 国产毛片在线视频| 成人18禁高潮啪啪吃奶动态图| 亚洲,一卡二卡三卡| 啦啦啦啦在线视频资源| 熟女av电影| 欧美日韩成人在线一区二区| 国产亚洲午夜精品一区二区久久| av女优亚洲男人天堂| 国产高清三级在线| 一级毛片黄色毛片免费观看视频| 亚洲国产精品专区欧美| 精品国产国语对白av| 三上悠亚av全集在线观看| 欧美老熟妇乱子伦牲交| 一级,二级,三级黄色视频| 国产精品欧美亚洲77777| 女性被躁到高潮视频| 国产一区有黄有色的免费视频| 亚洲成人av在线免费| 最新中文字幕久久久久| 最近中文字幕高清免费大全6| 韩国av在线不卡| 免费看不卡的av| freevideosex欧美| 精品久久久久久电影网| 久久国产亚洲av麻豆专区| 在线免费观看不下载黄p国产| 巨乳人妻的诱惑在线观看| 国产有黄有色有爽视频| 国产一区二区在线观看av| 黄色毛片三级朝国网站| 国产69精品久久久久777片| 少妇精品久久久久久久| 国产探花极品一区二区| 一级,二级,三级黄色视频| 免费av中文字幕在线| 黄色视频在线播放观看不卡| 久久久精品免费免费高清| 美女大奶头黄色视频| 久久久精品94久久精品| 国产亚洲一区二区精品| 男女免费视频国产| 国产成人免费无遮挡视频| 亚洲第一av免费看| 最新中文字幕久久久久| 欧美丝袜亚洲另类| 久久免费观看电影| 亚洲欧美清纯卡通| 大香蕉久久网| 色视频在线一区二区三区| 免费少妇av软件| 日韩中字成人| 亚洲精品第二区| 插逼视频在线观看| 国产av国产精品国产| 日本欧美视频一区| 国产精品秋霞免费鲁丝片| 国产精品99久久99久久久不卡 | 18禁国产床啪视频网站| 一边亲一边摸免费视频| 丝袜喷水一区| 亚洲伊人久久精品综合| 丝袜在线中文字幕| 大香蕉久久成人网| 最近的中文字幕免费完整| 人人妻人人澡人人爽人人夜夜| 亚洲欧洲日产国产| 精品亚洲成国产av| 精品一区二区三区四区五区乱码 | 国产免费福利视频在线观看| 午夜91福利影院| 国产精品不卡视频一区二区| 精品久久国产蜜桃| 国产色爽女视频免费观看| 亚洲天堂av无毛| 午夜激情av网站| 欧美日韩综合久久久久久| 成人18禁高潮啪啪吃奶动态图| 国产精品久久久av美女十八| 精品国产一区二区久久| 婷婷成人精品国产| 国产精品偷伦视频观看了| 欧美国产精品va在线观看不卡| 亚洲国产日韩一区二区| 天堂8中文在线网| 日韩精品免费视频一区二区三区 | 日韩 亚洲 欧美在线| 最近中文字幕2019免费版| 美女xxoo啪啪120秒动态图| 国产免费又黄又爽又色| 亚洲精品乱久久久久久| 欧美亚洲 丝袜 人妻 在线| 精品少妇内射三级| 午夜福利,免费看| 久久久国产一区二区| 99久久人妻综合| 一区二区三区精品91| 国内精品宾馆在线| 大陆偷拍与自拍| 免费观看性生交大片5| 欧美变态另类bdsm刘玥| 日韩中文字幕视频在线看片| 狠狠精品人妻久久久久久综合| 免费高清在线观看视频在线观看| 狂野欧美激情性bbbbbb| 欧美精品人与动牲交sv欧美| 99久国产av精品国产电影| 日本黄色日本黄色录像| 欧美性感艳星| 亚洲三级黄色毛片| 欧美精品一区二区免费开放| 青春草亚洲视频在线观看| 在线免费观看不下载黄p国产| 赤兔流量卡办理| 欧美日韩成人在线一区二区| 免费观看无遮挡的男女| av在线app专区| 亚洲av日韩在线播放| 我的女老师完整版在线观看| 曰老女人黄片| 色5月婷婷丁香| 欧美bdsm另类| 美国免费a级毛片| 成人午夜精彩视频在线观看| 一区在线观看完整版| 一级毛片我不卡| 一区二区日韩欧美中文字幕 | 国产成人免费观看mmmm| 美国免费a级毛片| av黄色大香蕉| 最近最新中文字幕大全免费视频 | 99热全是精品| 亚洲,欧美精品.| 又大又黄又爽视频免费| 亚洲精品国产av成人精品| 精品视频人人做人人爽| 只有这里有精品99| 黄色毛片三级朝国网站| 精品一区二区三卡| 国产精品国产三级专区第一集| 日日爽夜夜爽网站| 久久国产精品男人的天堂亚洲 | 97人妻天天添夜夜摸| 在线观看一区二区三区激情| 午夜日本视频在线| 卡戴珊不雅视频在线播放| 男人添女人高潮全过程视频| 婷婷色麻豆天堂久久| 一区二区三区四区激情视频| 新久久久久国产一级毛片| 精品人妻偷拍中文字幕| 黄色怎么调成土黄色| 精品亚洲成a人片在线观看| 欧美精品人与动牲交sv欧美| 国产综合精华液| 国产在线一区二区三区精| 一级片免费观看大全| 亚洲欧美日韩卡通动漫| 国产一区有黄有色的免费视频| 蜜臀久久99精品久久宅男| 大片免费播放器 马上看| 日韩一区二区视频免费看| 国产 一区精品| 欧美人与性动交α欧美软件 | 国产亚洲最大av| 亚洲精品456在线播放app| 免费观看在线日韩| 国产精品女同一区二区软件| 在线观看人妻少妇| 亚洲精品乱码久久久久久按摩| 一二三四中文在线观看免费高清| 亚洲丝袜综合中文字幕| 69精品国产乱码久久久| 亚洲精品日本国产第一区| 久久久久国产网址| 爱豆传媒免费全集在线观看| 青春草国产在线视频| 亚洲人成77777在线视频| 午夜久久久在线观看| 妹子高潮喷水视频| 色网站视频免费| 久久久精品94久久精品| 国产深夜福利视频在线观看| 22中文网久久字幕| 91在线精品国自产拍蜜月| 成人综合一区亚洲| 中文字幕人妻熟女乱码| av女优亚洲男人天堂| 看免费成人av毛片| 一本—道久久a久久精品蜜桃钙片| 欧美xxxx性猛交bbbb| 十八禁网站网址无遮挡| xxx大片免费视频| 国产69精品久久久久777片| 永久网站在线| 一区二区三区四区激情视频| 国产免费又黄又爽又色| av免费观看日本| 丝袜脚勾引网站| videosex国产| 国产亚洲最大av| 久久久国产欧美日韩av| 超色免费av| 精品久久久精品久久久| 亚洲精品一二三| 日日撸夜夜添| 国产成人欧美| a级毛片在线看网站| 咕卡用的链子| 人妻一区二区av| 久久久久视频综合| 国产爽快片一区二区三区| 国产永久视频网站| 黄色毛片三级朝国网站| 80岁老熟妇乱子伦牲交| av片东京热男人的天堂| 啦啦啦啦在线视频资源| 久久99一区二区三区| 一区二区三区四区激情视频| av视频免费观看在线观看| 日韩精品有码人妻一区| 精品一区二区三区视频在线| 国产淫语在线视频| 日韩不卡一区二区三区视频在线| 免费黄色在线免费观看| 九九在线视频观看精品| 人人妻人人添人人爽欧美一区卜| av在线老鸭窝| 亚洲精品视频女| 欧美成人午夜精品| 美女主播在线视频| 国产亚洲精品第一综合不卡 | 国产又色又爽无遮挡免| 日本av手机在线免费观看| 亚洲精品美女久久av网站| 久久韩国三级中文字幕| 九九在线视频观看精品| 人妻少妇偷人精品九色| 欧美日韩成人在线一区二区| 纯流量卡能插随身wifi吗| 精品一区二区三区四区五区乱码 | 男人操女人黄网站| 曰老女人黄片| 国产av精品麻豆| 久久亚洲国产成人精品v| 欧美精品国产亚洲| 九九爱精品视频在线观看| 亚洲精品日韩在线中文字幕| 日本欧美国产在线视频| 在线精品无人区一区二区三| 久久人人爽人人爽人人片va| 夜夜爽夜夜爽视频| 有码 亚洲区| 亚洲精华国产精华液的使用体验| 校园人妻丝袜中文字幕| 亚洲经典国产精华液单| 在线 av 中文字幕| 国产黄色免费在线视频| 午夜精品国产一区二区电影| 一本—道久久a久久精品蜜桃钙片| 日韩电影二区| 国产综合精华液| 伦理电影大哥的女人| 99九九在线精品视频| 中文字幕另类日韩欧美亚洲嫩草| av女优亚洲男人天堂| 国产精品国产三级专区第一集| 如何舔出高潮| 一本—道久久a久久精品蜜桃钙片| 男女无遮挡免费网站观看| 丰满乱子伦码专区| 亚洲精品美女久久久久99蜜臀 | 国产成人精品无人区| 午夜老司机福利剧场| 女人久久www免费人成看片| 日韩大片免费观看网站| 韩国精品一区二区三区 | 蜜桃国产av成人99| 肉色欧美久久久久久久蜜桃| 国产精品久久久久久av不卡| 国产一区二区激情短视频 | 人人妻人人澡人人看| 日韩成人av中文字幕在线观看| 新久久久久国产一级毛片| 成人国产麻豆网| 黄色 视频免费看| 大香蕉久久成人网| 久久久久国产精品人妻一区二区| 狠狠婷婷综合久久久久久88av| av国产久精品久网站免费入址| 久久精品国产亚洲av涩爱| 久久久国产一区二区| 丁香六月天网| 又大又黄又爽视频免费| 丝袜在线中文字幕| 欧美精品一区二区免费开放| 99热全是精品| 1024视频免费在线观看| 国产 精品1| 永久免费av网站大全| 国语对白做爰xxxⅹ性视频网站| 久久久国产精品麻豆| 日日摸夜夜添夜夜爱| 亚洲性久久影院| 国产日韩一区二区三区精品不卡| 久久婷婷青草| 九色成人免费人妻av| 成人综合一区亚洲| 精品久久蜜臀av无| 久久国产精品男人的天堂亚洲 | 老女人水多毛片| 国产成人91sexporn| 黑人巨大精品欧美一区二区蜜桃 | 久久久久久人妻| 免费在线观看黄色视频的| 晚上一个人看的免费电影| 汤姆久久久久久久影院中文字幕| 黄色视频在线播放观看不卡| 亚洲av日韩在线播放| 亚洲四区av| 国产免费福利视频在线观看| 五月天丁香电影| 国产成人精品无人区| 热99国产精品久久久久久7| 中文字幕人妻丝袜制服| 久久99热这里只频精品6学生| 在线精品无人区一区二区三| 人人澡人人妻人| 伦精品一区二区三区| 久久综合国产亚洲精品| 97超碰精品成人国产| 在线观看国产h片| 亚洲人成网站在线观看播放| 97在线视频观看| 午夜福利乱码中文字幕| 国国产精品蜜臀av免费| 精品视频人人做人人爽| 亚洲内射少妇av| 精品一区二区三卡| 男女边吃奶边做爰视频| 成年女人在线观看亚洲视频| 一级a做视频免费观看| 日韩欧美一区视频在线观看| 多毛熟女@视频| 国产精品人妻久久久久久| 丰满乱子伦码专区| 久久毛片免费看一区二区三区| 国产片内射在线| 国产精品不卡视频一区二区| 美女xxoo啪啪120秒动态图| 国产成人一区二区在线| 免费大片18禁| 人人妻人人爽人人添夜夜欢视频| 人人澡人人妻人| 日韩,欧美,国产一区二区三区| 天美传媒精品一区二区| www.av在线官网国产| av卡一久久| 国产av码专区亚洲av| 午夜福利影视在线免费观看| 寂寞人妻少妇视频99o| 99久国产av精品国产电影| 交换朋友夫妻互换小说| 亚洲五月色婷婷综合| 只有这里有精品99| 成人二区视频| 精品国产乱码久久久久久小说| 精品99又大又爽又粗少妇毛片| 精品久久久久久电影网| av在线老鸭窝| 大片电影免费在线观看免费| 捣出白浆h1v1| 在现免费观看毛片| 日韩伦理黄色片| 两个人免费观看高清视频| 大片免费播放器 马上看| 婷婷色麻豆天堂久久| 男女午夜视频在线观看 | 免费高清在线观看日韩| 侵犯人妻中文字幕一二三四区| 亚洲伊人久久精品综合| 成人综合一区亚洲| 夫妻午夜视频| 少妇的逼水好多| 人人澡人人妻人| 性高湖久久久久久久久免费观看| 国产成人a∨麻豆精品| 国产精品一区二区在线观看99| 少妇猛男粗大的猛烈进出视频| 中文字幕亚洲精品专区| 成年人免费黄色播放视频| 一二三四中文在线观看免费高清| 亚洲国产日韩一区二区| 看免费av毛片| 国产免费现黄频在线看| 久久99热这里只频精品6学生| 18+在线观看网站| 国产精品欧美亚洲77777| 午夜免费观看性视频| 激情五月婷婷亚洲| 一本一本久久a久久精品综合妖精 国产伦在线观看视频一区 | 免费观看在线日韩| 欧美精品亚洲一区二区| 永久免费av网站大全| 蜜桃国产av成人99| 精品久久国产蜜桃| 最近中文字幕2019免费版| 麻豆精品久久久久久蜜桃| 大码成人一级视频| 欧美激情极品国产一区二区三区 | 制服丝袜香蕉在线| 国产成人欧美| 欧美国产精品一级二级三级| 九九在线视频观看精品| 飞空精品影院首页| 激情五月婷婷亚洲| 免费女性裸体啪啪无遮挡网站| 18禁动态无遮挡网站| 91久久精品国产一区二区三区| 精品国产一区二区三区久久久樱花| 建设人人有责人人尽责人人享有的| 一本—道久久a久久精品蜜桃钙片| 在线天堂中文资源库| 亚洲欧美日韩另类电影网站| 国产欧美另类精品又又久久亚洲欧美| 大香蕉久久网| 国产精品国产三级国产专区5o| 自拍欧美九色日韩亚洲蝌蚪91| 成人亚洲精品一区在线观看| 性色av一级| 男女边吃奶边做爰视频| 国产精品久久久久久久电影| 三上悠亚av全集在线观看| 中国国产av一级| 寂寞人妻少妇视频99o| 亚洲av在线观看美女高潮| 9色porny在线观看|