• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    子圖增強(qiáng)的實時同名消歧

    2024-03-26 02:39:16韓天翼程欣宇張帆進(jìn)
    中文信息學(xué)報 2024年1期
    關(guān)鍵詞:語義特征信息

    韓天翼,程欣宇,張帆進(jìn),陳 波

    (1.貴州大學(xué) 公共大數(shù)據(jù)國家重點實驗室,貴州 貴陽 550025;2.貴州大學(xué) 文本計算與認(rèn)知智能教育部工程研究中心,貴州 貴陽 550025;3.清華大學(xué) 計算機(jī)科學(xué)與技術(shù)系,北京 100084)

    0 引言

    同名消歧旨在確定文獻(xiàn)中具有歧義的作者姓名的具體指代對象。隨著科技與信息產(chǎn)業(yè)的高速發(fā)展,各個領(lǐng)域的研究論文與專利發(fā)表數(shù)量急劇增加,導(dǎo)致了大量作者同名問題以及指代不明的情況。因此,針對同名作者的消歧成為確保谷歌學(xué)術(shù)(1)https://scholar.google.com/、中國知網(wǎng)(2)https://www.cnki.net/、AMiner(3)https://www.aminer.cn/等在線學(xué)術(shù)平臺正常運行的關(guān)鍵環(huán)節(jié),消歧的準(zhǔn)確性對專家發(fā)現(xiàn)、學(xué)術(shù)評估等相關(guān)下游任務(wù)具有重要意義。同名消歧屬于命名實體消歧的范疇[1],其消歧對象為具有歧義的作者姓名。盡管同名消歧問題已經(jīng)研究了數(shù)十年[2-5],但目前還遠(yuǎn)沒有徹底解決。這導(dǎo)致部分學(xué)者需要時常地向谷歌學(xué)術(shù)反饋消歧有誤的論文(4)https://harzing.com/blog/2017/02/web-of-science-to-be-robbed-of-10-years-of-citations-in-one-week,否則論文的統(tǒng)計指標(biāo)(如被引用數(shù)等)會受到噪聲影響。

    以往的同名消歧相關(guān)研究主要聚焦在冷啟動問題,即如何將一批具有相同作者姓名的論文劃分為多個歸屬于不同作者的論文簇[3-4,6]。該問題通常用于從零構(gòu)建同名學(xué)者檔案。當(dāng)前學(xué)術(shù)平臺經(jīng)過長期運營已經(jīng)建立起大量學(xué)者檔案。截止2023年3月,在線學(xué)術(shù)平臺AMiner從多個數(shù)據(jù)源累計整合了超過1億名專家學(xué)者的檔案和3.3億篇文獻(xiàn),而且平均每個月約有75萬篇新論文入庫。學(xué)術(shù)平臺不僅需要收錄新增的論文,還需要將論文與現(xiàn)有平臺作者進(jìn)行匹配關(guān)聯(lián)。然而,相同的姓名并不能代表唯一的作者,一篇新增文獻(xiàn)中的作者姓名可能對應(yīng)到平臺中多位同名作者。如圖1所示,對于新論文中作者名“Yang Yang”,平臺已存在多位同名的作者檔案,實時同名消歧需要將新論文準(zhǔn)確地分配給眾多同名候選作者中的正確作者。圖中候選作者1的中文姓名為“楊洋”,候選作者2的中文姓名為“楊陽”,兩位候選作者的已發(fā)表論文均含關(guān)鍵詞“graph neural network”,其中候選作者1的論文機(jī)構(gòu)使用過“Zhejiang University”并與新論文的標(biāo)題具有共現(xiàn)詞匯“Robust”,候選作者2的論文曾出現(xiàn)新論文的共同作者名“Lei Chen”,可以看到兩位候選作者與新論文均有較多的匹配信息,即使通過人工也很難有把握消歧準(zhǔn)確。故如何充分利用論文與候選作者的信息以獲取更有判別力的消歧特征是一個難點。

    圖1 實時同名消歧

    隨著科研人數(shù)不斷增長,同名消歧問題變得越來越具有挑戰(zhàn)性。首先,像圖1中具有相同姓名且研究相同領(lǐng)域的作者逐漸增多,這將導(dǎo)致實時消歧任務(wù)變得愈發(fā)復(fù)雜。例如,AMiner中有超過6 000個名叫“Yang Yang”的學(xué)者,在清華大學(xué)就讀或就職過的名叫“楊洋”的學(xué)者已經(jīng)超過40個。這使得不同候選作者之間易混淆的相似屬性增多。其次,僅使用語義作為特征的實時消歧方法很容易將論文誤分。例如,待消歧論文可能與多名候選作者在文章內(nèi)容上語義相似度較高。在以往的實時同名消歧方法中普遍缺乏待消歧論文與候選作者間結(jié)構(gòu)信息的挖掘與利用。然而,論文和作者的結(jié)構(gòu)信息中可能蘊(yùn)含著更豐富的匹配信息。例如,同一作者的不同論文的引文網(wǎng)絡(luò)結(jié)構(gòu)可能類似。因此,本文嘗試通過引入子圖結(jié)構(gòu)信息來進(jìn)一步提升實時同名消歧任務(wù)的準(zhǔn)確度。

    傳統(tǒng)的同名消歧方法根據(jù)待消歧人名的屬性信息和文章內(nèi)容設(shè)定具體規(guī)則來區(qū)分不同作者實體;冷啟動同名消歧方法主要利用文章本身內(nèi)容與文章之間的共同作者、共同機(jī)構(gòu)等結(jié)構(gòu)信息將任務(wù)處理為聚類問題;而對于實時同名消歧,相關(guān)研究分為基于語義信息與基于結(jié)構(gòu)信息兩類方法。在基于語義信息的方法中,一類方法通過特征工程提取出待消歧論文與候選作者檔案在標(biāo)題、關(guān)鍵詞、機(jī)構(gòu)等多方面的共同信息來進(jìn)行消歧,另一類方法基于度量學(xué)習(xí)等有監(jiān)督方法來學(xué)習(xí)論文與作者的嵌入向量以用于消歧;在基于結(jié)構(gòu)信息的方法中,通常將所有候選作者及相關(guān)鄰居節(jié)點(如論文等)構(gòu)建一張大圖,對于每篇新增的論文節(jié)點,均需要重構(gòu)大圖并重新訓(xùn)練嵌入向量。已有的實時同名消歧方法獲取結(jié)構(gòu)信息的效率較低,所需要的計算開銷隨著大圖規(guī)模的擴(kuò)大而逐步增長。

    因此,本文旨在解決實時同名消歧任務(wù)中的兩個問題,一是如何設(shè)計一種高效的歸納式學(xué)習(xí)(Inductive Learning)的模型,能夠在每新增一篇待消歧論文時,直接獲得該文與各位同名候選學(xué)者之間的結(jié)構(gòu)特征,同時考慮到學(xué)者在不同階段所研究的領(lǐng)域以及所處的機(jī)構(gòu)可能存在的差異,要求模型能實現(xiàn)待消歧論文與候選學(xué)者之間的細(xì)粒度匹配;二是如何將語義與結(jié)構(gòu)兩方面信息進(jìn)行有效的融合,以實現(xiàn)對更復(fù)雜場景的實時消歧,并獲得更優(yōu)秀的消歧效果。本文提出了子圖結(jié)構(gòu)增強(qiáng)的實時同名消歧模型RND-all(Real-time Name Disambiguation Integrating All The Information),首先分別對待消歧論文和候選作者構(gòu)建自我中心網(wǎng)絡(luò)(Ego Network),利用圖注意力網(wǎng)絡(luò)對中心節(jié)點與鄰居節(jié)點特征進(jìn)行加權(quán)聚合來捕獲局部圖的結(jié)構(gòu)信息,然后對論文子圖與作者子圖進(jìn)行細(xì)粒度交互,并采用徑向基核函數(shù)(Radio Basis Function Kernel,RBF)計算待分配論文與候選作者的圖相關(guān)性特征,最后,通過集成學(xué)習(xí)的方法將結(jié)構(gòu)信息與語義信息進(jìn)行融合。本文所提模型在WhoIsWho實時同名消歧數(shù)據(jù)集中取得最好結(jié)果,相比最優(yōu)的基線方法CONNA[7]在HR@1、HR@3和MRR上分別提高3.99%、1.24%和2.5%。RND-all在同名消歧基準(zhǔn)WhoIsWho實時消歧任務(wù)測試集上效果目前排名第一(5)截至2023年3月25日,RND-all在WhoIsWho實時同名消歧子任務(wù)排行榜上排名第一已持續(xù)1個月。詳見http://whoiswho.biendata.xyz/#/。

    本文組織結(jié)構(gòu)安排如下: 第1節(jié)介紹同名消歧以及圖神經(jīng)網(wǎng)絡(luò)的相關(guān)工作;第2節(jié)提出實時同名消歧的相關(guān)定義;第3節(jié)和第4節(jié)介紹端到端提取結(jié)構(gòu)信息的框架和使用子圖增強(qiáng)的實時同名消歧模型;第5節(jié)為實驗結(jié)果分析;第6節(jié)總結(jié)全文。

    1 相關(guān)工作

    1.1 同名消歧研究

    同名消歧問題主要分為兩個子問題進(jìn)行研究,即冷啟動同名消歧與實時同名消歧。

    冷啟動同名消歧對應(yīng)于學(xué)術(shù)平臺創(chuàng)建初期,此時需要將收集的大量論文進(jìn)行劃分,使得劃分后同一組內(nèi)的論文屬于同一個現(xiàn)實作者,不同組的論文屬于不同的現(xiàn)實作者,故冷啟動消歧常定義為聚類問題。Huang等人[3]采用Blocking方法將具有同名作者的待消歧論文聚合為簇,之后使用支持向量機(jī)學(xué)習(xí)簇內(nèi)各論文間的距離關(guān)系,最終利用DBSCAN對簇內(nèi)論文進(jìn)行聚類。Louppe等人[4]基于論文之間的相似度采用半監(jiān)督的層次聚類進(jìn)行消歧。Tang等人[8]通過待消歧論文間引用關(guān)系、共同作者名、共同會議名等信息構(gòu)建五維消歧特征后利用隱馬爾可夫隨機(jī)域?qū)崿F(xiàn)對不同作者的區(qū)分。Zhang等人[9]構(gòu)建作者-作者、論文-作者、論文-論文三種圖,利用學(xué)習(xí)的圖嵌入向量進(jìn)行聚類。陳晨等人[10]使用譜聚類對社會網(wǎng)絡(luò)中的人名聚類,并引入模塊度閾值作為網(wǎng)絡(luò)停止劃分的條件。Subramanian等人[11]將8個主流同名消歧數(shù)據(jù)集整理為S2AND數(shù)據(jù)集,并發(fā)現(xiàn)在此數(shù)據(jù)集下訓(xùn)練的冷啟動同名消歧算法具有更好的泛化能力。

    當(dāng)前谷歌學(xué)術(shù)、AMiner等在線學(xué)術(shù)平臺已經(jīng)建立起大量學(xué)者檔案,所面臨的最大挑戰(zhàn)是如何將姓名上具有歧義的新論文準(zhǔn)確而又高效地分配給對應(yīng)作者,即實時同名消歧。此任務(wù)需要依據(jù)新入庫的待消歧論文與已有的各個同名候選作者的相關(guān)特征做出分配判斷。Zhang等人[6]通過度量學(xué)習(xí)的方式得到論文與作者的嵌入向量,通過論文與各作者向量在表征空間的距離來確定所要分配的作者。Dong等人[12]利用作者與待分配論文之間共同機(jī)構(gòu)、共同會議、共同作者等關(guān)系構(gòu)建異質(zhì)圖,并使用隨機(jī)游走將待消歧論文與候選作者表示為嵌入向量,Zhang等人[13]則預(yù)先使用門控循環(huán)單元(Gate Recurrent Unit,GRU)得到論文的語義嵌入向量,之后在論文與作者的關(guān)系網(wǎng)絡(luò)上使用隨機(jī)游走以捕獲結(jié)構(gòu)特征,最后將論文與作者表示為低維稠密的向量用于實時消歧任務(wù)。Zhao[14]在KDD Cup提出使用特征工程構(gòu)建文本特征搭配梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)的方法對論文做出分類預(yù)測。Chen等人[7]使用預(yù)訓(xùn)練模型BERT[15]對待消歧論文以及候選作者每篇論文在各屬性下進(jìn)行細(xì)粒度的相似度計算,將豐富的語義特征用于消歧。Li等人[16]則提出了統(tǒng)一冷啟動與實時消歧的方法,首先將共同作者名出現(xiàn)次數(shù)多的論文構(gòu)建出高精確率的論文簇,再根據(jù)新增論文與各論文簇的語義相關(guān)性,按照合并作者節(jié)點的方式進(jìn)行實時消歧。

    可見,解決同名消歧的方法主要分為基于文獻(xiàn)語義特征的同名消歧和基于文獻(xiàn)結(jié)構(gòu)特征的同名消歧。融合語義特征和結(jié)構(gòu)特征的同名消歧方法具有較優(yōu)的研究意義。

    1.2 圖神經(jīng)網(wǎng)絡(luò)

    圖神經(jīng)網(wǎng)絡(luò)(Graph Nerual Network,GNN)已被廣泛應(yīng)用于社交網(wǎng)絡(luò)、化學(xué)分子結(jié)構(gòu)、知識圖譜等拓?fù)浣Y(jié)構(gòu)的研究中,其核心思想是利用邊的信息對節(jié)點信息進(jìn)行聚合從而生成新的節(jié)點表示。Niepert等人[17]通過將圖中的節(jié)點組織為序列并使用卷積網(wǎng)絡(luò)以獲得具有結(jié)構(gòu)信息的節(jié)點表示,Kipf等人[18]基于空域與頻域的轉(zhuǎn)換關(guān)系提出圖卷積網(wǎng)絡(luò)(Graph Convolutional Networks,GCN),使用一階切比雪夫多項式實現(xiàn)空域卷積的效果。Velickovic等人[19]提出圖注意力網(wǎng)絡(luò)(Graph Attention Networks,GAT),采用注意力掩碼將注意力機(jī)制引入圖神經(jīng)網(wǎng)絡(luò)模型,使得模型能夠準(zhǔn)確靈活地計算鄰居節(jié)點之間的權(quán)重,并通過多頭的方式進(jìn)一步提升模型的泛化能力。

    本文針對實時同名消歧的特點,對待消歧論文與候選作者分別構(gòu)建自我中心網(wǎng)絡(luò),采用圖注意力網(wǎng)絡(luò)來聚合節(jié)點特征以獲取結(jié)構(gòu)層面的信息。

    2 相關(guān)概念與定義

    定義1 論文一篇論文p由多個屬性構(gòu)成,例如標(biāo)題、摘要、作者姓名等,即p={x1,…,xF},xf∈p代表論文中第f種屬性。F指論文中屬性的個數(shù)。

    定義2 作者一名作者a由該作者所發(fā)表的n篇論文組成,即a={p1,…,pn},其中所有論文均由多個屬性構(gòu)成。

    定義5 實時同名消歧給定一篇要對作者名na進(jìn)行消歧的論文pna以及姓名na對應(yīng)的候選作者集合Ana,假設(shè)pna中的作者名na所對應(yīng)的正確作者a+∈Ana,其余作者a-∈Ana。則該問題需要學(xué)習(xí)一個評分函數(shù)Ψ,滿足,如式(1)、式(2)所示。

    其中,函數(shù)Ψ的輸入為待消歧論文和任意候選作者,輸出一個實數(shù)的相似度得分,Ψ需滿足待消歧論文pna與正確作者的相似度得分大于pna與其他作者的相似度得分。最終會將待消歧論文分配給Ψ打分最高的作者。

    3 子圖結(jié)構(gòu)特征提取框架

    本文提出一種端到端的子圖結(jié)構(gòu)特征提取框架,用于計算待消歧論文與各候選作者的圖相關(guān)性特征??蚣苡砂幋a層、聚合層、交互層的子圖信息交互模塊和包含歸一化層和排序?qū)拥奶卣髟鰪?qiáng)模塊組成??蚣苋鐖D2所示,黑色實心箭頭為特征生成過程,空心箭頭為訓(xùn)練階段損失的傳播過程。

    圖2 子圖結(jié)構(gòu)特征提取框架

    3.1 子圖信息交互模塊

    子圖信息交互模塊用于獲取待消歧論文子圖與候選作者子圖之間的細(xì)粒度交互信息。此模塊首先通過編碼層對圖中各節(jié)點的特征進(jìn)行初始化,然后在聚合層對各節(jié)點特征進(jìn)行加權(quán)聚合與更新,最后在交互層獲取論文子圖與各作者子圖的相似度信息。

    如圖3所示,P、A、O分別指論文節(jié)點、作者節(jié)點以及機(jī)構(gòu)節(jié)點,圖中為待消歧論文p與一名候選作者a所構(gòu)建的論文子圖Gp與作者子圖Ga。對論文子圖Gp,p的一階鄰居為論文中待消歧作者的機(jī)構(gòu)名稱以及待消歧論文所引用的論文,考慮到無法假定p中其余作者姓名確定對應(yīng)的真實作者,故p的一階鄰居中不含其余共同作者信息。p的高階鄰居為引用論文的作者的論文以及其機(jī)構(gòu)名稱??紤]到距離待消歧論文越遠(yuǎn),數(shù)據(jù)噪聲越多,故最大擴(kuò)展到三階鄰居。對作者子圖Ga,使用候選作者a的已發(fā)表論文作為a的一階鄰居,若已發(fā)表論文存在其余已經(jīng)消歧完的共同作者,則該共同作者的論文和機(jī)構(gòu)信息作為作者a的高階鄰居,同理,最大擴(kuò)展到三階鄰居。子圖信息交互模塊通過對比待消歧論文子圖Gp與各個候選作者子圖集合GA={Ga1,Ga2,…,Gam}來捕捉待消歧論文與候選作者的結(jié)構(gòu)信息。

    圖3 待消歧論文子圖與候選作者子圖

    編碼層首先對包含待消歧論文子圖以及各個候選作者子圖的圖G內(nèi)各類節(jié)點特征進(jìn)行初始化。對于圖中的論文和機(jī)構(gòu)節(jié)點,模型提取各篇論文的標(biāo)題、摘要、關(guān)鍵詞拼接為字符串s,以及提取單獨的機(jī)構(gòu)名作為字符串o,兩類文本記作S=(s1,s2,…,sln)和O=(o1,o2,…,olm),隨后模塊利用學(xué)術(shù)論文預(yù)訓(xùn)練模型OAG-BERT[20]對兩類文本進(jìn)行編碼,得到嵌入向量矩陣XS=(xs1,xs2,…,xsln)和XO=(xo1,xo2,…,xolm),其中,ln、lm指圖G中論文與機(jī)構(gòu)的數(shù)量,x∈Rd,d為編碼后特征維度。對于作者a={p1,p2,…,pn},則直接使用該作者已發(fā)表論文的嵌入向量的平均作為作者節(jié)點初始特征。

    聚合層使用圖注意力網(wǎng)絡(luò)對待消歧論文子圖以及各個候選作者子圖進(jìn)行相鄰節(jié)點間注意力互相關(guān)系數(shù)的計算以及子圖節(jié)點特征的更新。節(jié)點特征先由可訓(xùn)練的共享權(quán)重矩陣W∈Rd×d進(jìn)行線性變換,然后經(jīng)θT∈R2d對自身與相鄰節(jié)點特征進(jìn)行自注意力操作,最后經(jīng)LeakyReLU計算出兩節(jié)點間的注意力相關(guān)性權(quán)重。為了便于不同節(jié)點間權(quán)重的比較與計算,使用softmax進(jìn)行權(quán)重歸一化,節(jié)點i與相鄰節(jié)點j的注意力互相關(guān)系數(shù)αij,計算如式(3)所示,其中,||表示拼接操作。

    (3)

    節(jié)點i的鄰居節(jié)點特征同樣使用共享權(quán)重W進(jìn)行變換,然后各節(jié)點根據(jù)對應(yīng)的注意力互相關(guān)系數(shù)進(jìn)行加權(quán)求和,通過非線性變換φ計算節(jié)點i的聚合特征,計算如式(4)所示。

    (4)

    GAT采用多頭注意力機(jī)制,通過集成多組參數(shù)下的聚合特征來增強(qiáng)模型表達(dá)的魯棒性。式(5)中Wk為第k組線性變換權(quán)重,αk代表第k組注意力互相關(guān)系數(shù)。

    (5)

    交互層對圖G中特征聚合后的論文子圖與各作者子圖進(jìn)行細(xì)粒度交互??紤]到一位學(xué)者在不同時期的研究領(lǐng)域以及所處機(jī)構(gòu)可能不同,則待消歧論文可能與正確作者僅有幾篇論文內(nèi)容相似,所以交互層應(yīng)該關(guān)注更細(xì)致的相似度匹配信息而不能將子圖粗化為一個向量。

    交互層的輸入為待消歧論文子圖Gp與候選作者子圖集合GA={Ga1,Ga2,…,Gam},輸出為Gp與各候選作者子圖的相似度矩陣。在交互層中論文子圖與各作者子圖在設(shè)定的交互范圍內(nèi)(如一階鄰域、全量節(jié)點)逐節(jié)點計算特征相似度。M表示Gp與其中一個作者子圖Ga的相似度矩陣,Mij為Gp第i個節(jié)點特征與Ga第j個節(jié)點特征的余弦相似度,若兩個節(jié)點特征信息相似,則相似度應(yīng)接近1,若特征信息無關(guān),相似度應(yīng)接近0,若特征信息相關(guān)且相反,相似度應(yīng)接近-1。圖4為待消歧論文子圖與正確作者及其他作者子圖的相似度矩陣,圖中取相似度矩陣的前15行和前15列的數(shù)據(jù)展示。發(fā)現(xiàn)在交互層中很少存在節(jié)點之間特征信息相關(guān)且相反的情況,圖4中最低的相似度為-0.02。白色代表相似度接近1,黑色代表相似度接近0,由圖可見,本文提出的子圖信息交互模塊能夠較準(zhǔn)確地區(qū)分正確與其他作者。

    圖4 待消歧論文子圖與正確作者子圖、其他作者子圖相似度矩陣

    3.2 特征增強(qiáng)模塊

    特征增強(qiáng)模塊的設(shè)計動機(jī)在于,各個候選作者子圖的交互節(jié)點數(shù)各不相同,故子圖信息交互模塊所返回的相似度矩陣的尺寸不同,模型難以直接利用待消歧論文與不同作者的交互信息。此模塊使用k組徑向基核函數(shù)將特征矩陣轉(zhuǎn)換為相同維度特征向量,同時還能夠?qū)μ卣骶仃囂N(yùn)含的信息進(jìn)行增強(qiáng)。最后,排序?qū)訉⒔?jīng)歸一化后的特征向量進(jìn)行打分排序,以實現(xiàn)將待消歧論文所對應(yīng)的正確作者與其他作者進(jìn)行有效區(qū)分。

    歸一化層的操作類似于信息檢索的核函數(shù)池化[21],Mi為相似度矩陣M第i行,表示Gp第i個節(jié)點與Ga中各個節(jié)點的特征相似度。在式(6)中,K(Mi)第k個元素Kk(Mi)表示對Mi使用式(7)中第k組核函數(shù)(均值μk,標(biāo)準(zhǔn)差σk)處理并進(jìn)行池化求和。

    歸一化層最終通過對Gp每個節(jié)點所對應(yīng)的K(Mi)進(jìn)行對數(shù)求和得到Gp與Ga的圖相關(guān)性特征φ(M),見式(8)。歸一化層所使用的徑向基核函數(shù)能夠配置多組超參數(shù)來捕捉到M中不同層次的匹配信息。例如,當(dāng)μ→1,σ→0函數(shù)關(guān)注M所包含的節(jié)點特征間完全匹配的信息,當(dāng)μ→0.5,σ→0函數(shù)則關(guān)注M中相似度近似為0.5的信息。該方式使歸一化層進(jìn)一步豐富了交互層所傳遞的信息。

    (8)

    排序?qū)踊谂判驅(qū)W習(xí)[21](Learn To Rank,LTR)的思想,使用待消歧論文與各候選作者的圖相關(guān)性特征來對整體框架進(jìn)行有監(jiān)督的訓(xùn)練。排序?qū)邮紫仁褂萌B接層將各個圖相關(guān)性特征轉(zhuǎn)換為匹配得分,然后以在表征空間中縮小論文與正確作者a+的距離、拉大與其余候選作者的距離作為目標(biāo)進(jìn)行訓(xùn)練。訓(xùn)練使用多負(fù)例排序損失作為損失函數(shù),相比三元組損失,該損失函數(shù)具有更大范圍的感受野,能對正確作者與其余作者實現(xiàn)更有效的區(qū)分。式(9)中Ai代表待消歧論文pi所對應(yīng)的候選作者集合。

    (9)

    4 融合語義特征與結(jié)構(gòu)特征的消歧模型

    4.1 特征介紹

    在語義信息方面,前人的工作已經(jīng)證明,基于抽取待消歧論文與候選作者共現(xiàn)信息的特征工程方法在同名消歧任務(wù)中取得了很好的效果[7,16]。此外,使用論文與作者的語義向量進(jìn)行相似度計算所求得的特征對消歧也有一定程度的幫助[7]。因此本文也集成了特征工程的方法,在作者名、題目、關(guān)鍵詞、機(jī)構(gòu)和會議5類屬性上進(jìn)行手工匹配特征的構(gòu)建,以作者為例,待消歧論文中除消歧姓名A以外有共同作者名B、C,候選作者的某些論文的作者名出現(xiàn)B則視B為共現(xiàn)作者,根據(jù)TF-IDF得到共現(xiàn)作者名字的分?jǐn)?shù)以及此分?jǐn)?shù)在所有名字TF-IDF總分?jǐn)?shù)下的比例;除作者名外的論文屬性還使用Jaro Winkler距離和Jaccard相似度等算法來提取論文與論文之間多維度的共現(xiàn)信息,最終構(gòu)建出36維手工匹配特征。隨后使用學(xué)術(shù)預(yù)訓(xùn)練模型OAG-BERT推理得到待消歧論文與候選作者各篇論文的嵌入向量,并基于文章間的相似度矩陣使用多組核函數(shù)池化得到41維嵌入匹配特征。

    在結(jié)構(gòu)信息方面,通過本文的結(jié)構(gòu)特征提取框架來獲取圖相關(guān)性特征,框架中的子圖信息交互模塊通過預(yù)訓(xùn)練模型初始化節(jié)點特征,采用訓(xùn)練過的圖注意力網(wǎng)絡(luò)分別對論文子圖與作者子圖中的節(jié)點特征進(jìn)行加權(quán)聚合,再以細(xì)粒度的交互方式得到論文與各候選作者的相似度矩陣,框架中的特征增強(qiáng)模塊使用徑向基核函數(shù)將多組相似度矩陣分別轉(zhuǎn)換為41維圖相關(guān)性特征。

    總的來說,在實時同名消歧任務(wù)中,以手工匹配特征與嵌入匹配特征來代表語義信息,以子圖結(jié)構(gòu)特征提取框架所推理的圖相關(guān)性特征代表結(jié)構(gòu)信息。

    4.2 集成學(xué)習(xí)框架

    本文首先通過子圖結(jié)構(gòu)特征提取框架、特征工程與文本嵌入的方式獲取待消歧論文與候選作者間的語義和結(jié)構(gòu)信息,然后使用集成學(xué)習(xí)來構(gòu)建子圖結(jié)構(gòu)增強(qiáng)的實時同名消歧模型RND-all,以實現(xiàn)對各類消歧信息的全面融合。RND-all對圖相關(guān)性特征、手工匹配特征、嵌入匹配特征均應(yīng)用三類GBDT模型作為基分類器,具體分別為XGBoost、CatBoost和LightGBM。模型框架如圖5所示。

    圖5 RND-all模型框架

    訓(xùn)練過程中將訓(xùn)練集分為5等份,其中4份作為訓(xùn)練集,1份作為驗證集?;贐agging的思想,每一類基分類器均通過5折交叉驗證的方式訓(xùn)練5個同分類器類別的子模型,并將子模型的平均預(yù)測概率作為基分類器的輸出以提高整體模型的泛化能力。在預(yù)測過程中各類特征下的候選作者預(yù)測分?jǐn)?shù)通過投票進(jìn)行集成,使語義與結(jié)構(gòu)特征一起參與作者的判定。

    5 方法評測與實驗結(jié)果

    5.1 數(shù)據(jù)集及實驗設(shè)

    數(shù)據(jù)集:本文基于百萬級人工標(biāo)注的同名消歧數(shù)據(jù)集WhoIsWho(6)https://www.aminer.cn/whoiswho進(jìn)行評測[7,22]。WhoIsWho數(shù)據(jù)集最新版本(v3.1)包括人工標(biāo)注的 2 459個姓名所關(guān)聯(lián)的 72 609個作者和 1 102 249篇論文,以及作者和論文之間的匹配關(guān)系。據(jù)統(tǒng)計,WhoIsWho中87%的姓名為消歧難度更大的中文姓名,數(shù)據(jù)集中的論文與作者涉及計算機(jī)、材料以及生物等十多種領(lǐng)域。WhoIsWho包括冷啟動消歧與實時消歧兩個子數(shù)據(jù)集,本文采用實時消歧數(shù)據(jù)集開展實驗并基于作者檔案以及論文的屬性信息進(jìn)行構(gòu)圖。由于部分作者或論文沒有子圖結(jié)構(gòu)信息,數(shù)據(jù)集預(yù)處理時采用WhoIsWho訓(xùn)練集作者檔案中的論文與候選同名作者列表構(gòu)建出30 000組樣本,并按照7∶3劃分訓(xùn)練集與驗證集,其中每組樣本由待消歧論文、正確作者以及9位同名不正確作者構(gòu)成;測試集為5 968篇待消歧論文,實驗中將每篇待消歧論文與消歧姓名對應(yīng)的所有同名作者構(gòu)成待預(yù)測樣本。

    參數(shù)設(shè)置與實驗環(huán)境:本文使用的具體參數(shù)設(shè)置如下: 節(jié)點特征維度d=768,圖注意力網(wǎng)絡(luò)層數(shù)l=2,每層注意力頭數(shù)量分別為4和1,訓(xùn)練使用Adam優(yōu)化器進(jìn)行參數(shù)優(yōu)化,初始學(xué)習(xí)率0.001,使用指數(shù)下降學(xué)習(xí)率調(diào)節(jié)器ExponentialLR,每一輪將學(xué)習(xí)率乘以0.9,一共訓(xùn)練30輪;集成學(xué)習(xí)中GBDT基分類器設(shè)置樹深度為10層,學(xué)習(xí)率0.05,迭代1 000輪;徑向基核函數(shù)配置41組超參數(shù),41組核函數(shù)的均值μ為從1到-1步長為0.05的遞減數(shù)列,方差σ除首位為0.001外其余均取0.1。實驗平臺環(huán)境為NVIDIA GeForce GTX2080Ti 顯卡(11 GB顯存),Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40 GHz,256 GB內(nèi)存的處理器。

    評估指標(biāo):實驗采用命中率HR@k和平均倒數(shù)排名MRR來評估實時同名消歧任務(wù)下不同模型的效果。HR@k計算正確作者排名在前k位的樣本占所有樣本的比例,MRR對所有樣本計算正確作者所在排名的倒數(shù)的平均值,這兩種指標(biāo)分別強(qiáng)調(diào)實時消歧模型預(yù)測的召回率與正確答案的排序位置,兩種指標(biāo)值越大代表模型效果越好。

    5.2 基線模型

    本文與多個實時同名消歧相關(guān)的基線模型進(jìn)行比較,主要包括:

    (1) CAMEL模型[13]首先將待消歧論文經(jīng)GRU編碼為論文的初始嵌入,之后基于作者與論文之間的結(jié)構(gòu)關(guān)系通過隨機(jī)游走的方式更新論文與作者的表示,最后直接將嵌入向量用于實時消歧。

    (2) GML模型[6]提出一種基于度量學(xué)習(xí)的消歧方法。首先使用預(yù)訓(xùn)練的Word2Vec獲取論文嵌入向量,然后通過作者已發(fā)表論文的平均嵌入來作為作者表示,在訓(xùn)練過程使用度量學(xué)習(xí)來拉近論文與正確作者的距離并推遠(yuǎn)與其余作者的距離,進(jìn)而優(yōu)化作者與論文嵌入中的語義信息。

    (3) IUAD模型[16]按照共同作者、研究領(lǐng)域與期刊會議三方面統(tǒng)計出待分配論文與候選作者的相關(guān)性特征,使用EM算法學(xué)習(xí)多組匹配分布的參數(shù)用于消歧。

    (4) CONNA模型[7]對待消歧論文與候選作者不同論文以及論文中的不同屬性利用預(yù)訓(xùn)練模型來計算細(xì)粒度的語義匹配特征,同時還使用了特征工程進(jìn)一步增強(qiáng)消歧特征的表達(dá)能力。

    5.3 實驗與分析

    5.3.1 基線模型對比結(jié)果

    表1為RND-all與各基線模型的對比結(jié)果。CAMEL通過隨機(jī)游走來學(xué)習(xí)作者嵌入向量,當(dāng)出現(xiàn)某些作者所發(fā)表論文非常少的情況時,這類作者的嵌入向量無法得到較有效的訓(xùn)練,該方法結(jié)果并不理想;GML通過所發(fā)表論文的平均嵌入向量來表示作者,在很大程度上緩解了CAMEL中特征稀疏的問題,但因為缺乏文本層面的直接匹配特征表現(xiàn)較為一般。除此之外,GML所使用平均嵌入向量的方式無法捕獲細(xì)粒度信息,忽視了待消歧論文僅與正確作者少量論文相關(guān)的情況;IUAD和CONNA均在通過文本嵌入向量進(jìn)行細(xì)粒度匹配的基礎(chǔ)上,進(jìn)一步使用特征工程在文本上獲取更細(xì)致豐富的直接匹配特征,兩種消歧方法在特征工程設(shè)計上有一定差異,但是實際結(jié)果差距較小。

    表1 不同消歧方法在實時消歧任務(wù)上的效果

    本文注意到IUAD和CONNA沒有利用消歧論文與候選作者之間固有的結(jié)構(gòu)信息,因此,所提出的RND-all模型,首先采用子圖結(jié)構(gòu)特征提取框架來獲取論文與候選作者之間的圖相關(guān)性特征;然后,通過特征工程和文本嵌入技術(shù)得到不同維度的語義特征;最終,通過集成學(xué)習(xí)方法實現(xiàn)了語義和結(jié)構(gòu)信息的有效融合。RND-all的HR@1、HR@3和MRR指標(biāo)均達(dá)到最高,分別為95.09%、99.69%和97.36%,相比CONNA分別提升3.99個百分點、1.24個百分點和2.5個百分點。

    5.3.2 RND-all應(yīng)用于WhoisWho同名消歧競賽

    WhoisWho是全球范圍內(nèi)首個考慮NIL(Not In List,NIL)問題的同名消歧競賽,WhoIsWho競賽已經(jīng)舉辦三屆,累計吸引了3 000余名研究者參賽。目前WhoIsWho競賽長期維護(hù)兩個同名消歧子任務(wù)的排行榜。本文在RND-all的基礎(chǔ)上適配此競賽,最終在實時同名消歧賽道取得第一名的成績。

    NIL問題指待消歧論文不應(yīng)該屬于數(shù)據(jù)集已有的任何作者,例如,平臺收錄了一名大學(xué)生發(fā)表的第一篇論文,但這篇論文不屬于平臺中任何與他同名的作者,因此實時消歧模型不僅需要根據(jù)待消歧論文的內(nèi)容在候選作者中發(fā)現(xiàn)正確作者,還要對論文是否為NIL做出判斷。該競賽使用weighted-F1來綜合衡量各參賽者的實時同名消歧算法的預(yù)測精度以及NIL的識別能力。為應(yīng)對NIL場景,本文構(gòu)造由論文與同名非正確作者組成的訓(xùn)練樣本來仿真NIL數(shù)據(jù),并在原RND-all的各基分類器的上面再疊加一層GBDT模型用于NIL數(shù)據(jù)的判定。上層所疊加的模型首先將基分類器下各作者的預(yù)測分?jǐn)?shù)進(jìn)行降序排列,然后取第一名作者得分、所有候選者平均得分、前兩名作者分?jǐn)?shù)差與第一名及最后一名分?jǐn)?shù)差的比值來構(gòu)造代表候選作者總體分布信息的特征向量,用于NIL的判定訓(xùn)練。最終,如圖6所示,本文所提的子圖結(jié)構(gòu)增強(qiáng)的RND-all獲得競賽冠軍,相比亞軍與季軍的方法,RND-all最大的區(qū)別就在于消歧特征中額外引入了待消歧論文與候選作者的結(jié)構(gòu)信息。

    圖6 WhoIsWho同名消歧競賽實時同名消歧子任務(wù)排行榜

    5.3.3 語義信息與結(jié)構(gòu)信息對性能的影響

    為探究語義信息與結(jié)構(gòu)信息對實時消歧任務(wù)的貢獻(xiàn),本文對兩類信息下的各個特征進(jìn)行消融實驗。語義信息上采用了手工匹配特征(簡記為Hand)以及基于OAG-BERT的嵌入匹配特征(簡記為Embedding),結(jié)構(gòu)信息上使用第三節(jié)框架所提取的圖相關(guān)性特征(簡記為Graph)。下面以一篇待消歧論文與一位同名候選作者來分析計算三類特征的時間復(fù)雜度,候選作者檔案中的論文數(shù)為N,論文或者機(jī)構(gòu)名所構(gòu)成字符序列的長度為S,預(yù)訓(xùn)練模型詞表大小為V,詞向量維度為H,預(yù)訓(xùn)練模型層數(shù)為L,圖中的邊數(shù)為E。計算手工匹配特征的時間復(fù)雜度為O(NS),計算嵌入匹配特征的時間復(fù)雜度為O(N((V+S)H+LH2)),計算圖相關(guān)性特征的時間復(fù)雜度為O(N((V+S)H+LH2)+EH)。

    使用不同特征的消歧效果如表2所示,模型1和3僅使用語義特征,模型3在模型1基礎(chǔ)上引入嵌入匹配特征后HR@1有所提高,說明使用更豐富的語義信息有一定作用。模型5相比模型1多融入了結(jié)構(gòu)信息,HR@1提升0.28個百分點,說明結(jié)構(gòu)特征能夠進(jìn)一步增強(qiáng)模型性能。其中,融合結(jié)構(gòu)信息與語義信息的模型6達(dá)到最佳效果,相比使用兩種語義特征的模型3,在HR@1提升0.3個百分點,再次證明結(jié)構(gòu)信息的有效性。

    表2 不同特征的消融實驗

    通過觀察引入結(jié)構(gòu)特征的模型相較于僅使用語義特征的模型所多分配正確的論文,本文發(fā)現(xiàn)這類待消歧論文存在兩個特點,一是論文與多位同名候選作者檔案均存在較多的共現(xiàn)信息,二是論文普遍為生物、化學(xué)相關(guān)領(lǐng)域,文中含有大量復(fù)雜的專業(yè)術(shù)語。在此類復(fù)雜實時消歧場景下僅使用語義特征較難發(fā)揮作用,而引入結(jié)構(gòu)特征能帶來的性能提升是因為圖模型能在較大的數(shù)據(jù)范圍上關(guān)注到相對突出的信息,更利于復(fù)雜場景下的實時消歧。

    另外,本文統(tǒng)計了各組模型在各個消歧姓名下待消歧論文的排序指標(biāo)。通過模型6的結(jié)果與其余模型結(jié)果使用Paired T-test進(jìn)行顯著性分析,模型6與其余模型的p-value均小于0.05,說明此模型與消融實驗中其余模型存在顯著差異。

    5.3.4 實例分析

    為直觀分析結(jié)構(gòu)信息對實時消歧算法性能帶來的提升,本文對僅用語義信息分配有誤而在引入結(jié)構(gòu)信息后分配正確的文章加以分析。

    以圖7中WhoIsWho中標(biāo)號為“bN3NQ9Tz”的待消歧論文為例,該文待消歧作者名為“Qing Chen”、機(jī)構(gòu)為“Southern Medical University”、論文關(guān)鍵詞為“Methylenetetrahydrofolate”和“Meta-analysis”中文分別譯為“亞甲基四氫葉酸”和“元分析”。兩名同名候選作者均在已發(fā)表論文的機(jī)構(gòu)出現(xiàn)過“Southern Medical University”,ID為“6D1dm9qQ”的學(xué)者主要開展基因相關(guān)研究,ID為“F204Rizj”的學(xué)者關(guān)注呼吸系統(tǒng)疾病的研究。通過查閱兩名作者的檔案,發(fā)現(xiàn)相關(guān)論文中均存在大量醫(yī)學(xué)相關(guān)的名詞以及許多復(fù)雜的化學(xué)物質(zhì)名稱。其中,ID為“F204Rizj”的作者較多論文出現(xiàn)含義更為寬泛的“Meta-analysis”關(guān)鍵詞,因此僅使用語義信息的模型更傾向分配給此作者。而RND-all通過圖注意力網(wǎng)絡(luò)對多跳信息進(jìn)行聚合,能夠捕捉結(jié)構(gòu)中更突出的信息,因此待消歧論文節(jié)點雖然與兩個候選作者子圖中的節(jié)點均具有共現(xiàn)詞,但是在節(jié)點之間的相似度上已有較大差異,如圖中相似度分別為0.77與0.51。

    圖7 實例分析

    通過本例可以觀察到,僅使用語義信息所導(dǎo)致的消歧錯誤往往是因為多位候選作者之間存在語義上易混淆的相似關(guān)鍵詞,并且待消歧的論文普遍為生物醫(yī)藥以及化工材料領(lǐng)域。因此,本文認(rèn)為結(jié)構(gòu)信息所帶來的效果提升源于以下兩點:

    (1) 部分待消歧論文所對應(yīng)的多位同名作者在機(jī)構(gòu)、研究領(lǐng)域上內(nèi)容相近,導(dǎo)致兩名學(xué)者在文章內(nèi)容上具有較多的共現(xiàn)詞匯,此時僅依賴語義信息很難進(jìn)行準(zhǔn)確地消歧,要進(jìn)一步通過構(gòu)建圖來從全局結(jié)構(gòu)上提取更突出的信息。

    (2) 在生物、化學(xué)等領(lǐng)域,文章標(biāo)題與關(guān)鍵詞中經(jīng)常出現(xiàn)復(fù)雜的專業(yè)名詞,手工匹配與嵌入匹配特征在這類信息上表達(dá)能力比較有限,進(jìn)而使用論文、作者、機(jī)構(gòu)在關(guān)聯(lián)結(jié)構(gòu)中表達(dá)出的信息對實時同名消歧任務(wù)更有幫助。

    5.3.5 不同范圍下子圖交互效果

    為觀察子圖結(jié)構(gòu)特征提取框架中交互層在不同范圍的交互效果,實驗對待消歧論文子圖Gp與候選作者子圖Ga采用一對一、一對多和多對多的方式進(jìn)行特征交互。一對一交互指僅對自我中心網(wǎng)絡(luò)Gp與Ga的中心節(jié)點進(jìn)行相似度計算;多對多交互分為兩種交互范圍,Gp與Ga全量節(jié)點之間的交互和Gp與Ga在中心節(jié)點一階鄰域的交互;類似的,一對多交互分為Gp中心節(jié)點與Ga全量節(jié)點的交互、Gp中心節(jié)點與Ga一階鄰域的交互。

    通過表3觀察到,僅使用Gp與Ga中心節(jié)點一對一交互的效果不佳,雖然中心節(jié)點通過鄰居進(jìn)行了特征聚合,但一對一的交互方式直接損失了子圖中大量的信息;使用多對多方式在Gp與Ga全量節(jié)點的交互相較前者在HR@1、HR@3、MRR上均有提高,反映出利用圖中豐富信息能有效提高模型消歧的能力,但在本身圖的構(gòu)建過程中高階鄰居節(jié)點不可避免地會引入噪聲,全量節(jié)點的交互過程中可能摻雜一定的錯誤信息,所以HR@1表現(xiàn)一般;多對多方式在一階鄰域交互后的模型在HR@1和MRR下取得最好效果,本文認(rèn)為論文與作者子圖的一階鄰域代表待消歧論文與候選作者最直接相關(guān)的內(nèi)容,其已經(jīng)蘊(yùn)含絕大部分有助于消歧的信息,同時此范圍交互能夠避免高階噪聲節(jié)點產(chǎn)生的誤導(dǎo)信息,該方法相較于前面的一對一和全量交互在HR@1上分別提高9.36個百分點和5.46個百分點。另外,從一對多交互的兩組實驗觀察到,Gp中心節(jié)點與Ga一階鄰域交互的HR@1、MRR要高于與Ga全量節(jié)點交互,而后者使用全量節(jié)點的方式在HR@3上優(yōu)于一階鄰域的交互,我們發(fā)現(xiàn),此現(xiàn)象同樣出現(xiàn)在兩組多對多實驗上,因此本文認(rèn)為全量匹配雖然損失一定的精度導(dǎo)致HR@1與MRR下降,但是引入更大范圍的信息有助于部分正確作者提升在整體排序中的名次,使得正確匹配作者更有機(jī)會進(jìn)入預(yù)測分?jǐn)?shù)最高的前三名,從而HR@3有所提升。

    表3 不同范圍下子圖交互效果

    6 總結(jié)

    本文提出子圖結(jié)構(gòu)增強(qiáng)的實時同名消歧模型RND-all,首先通過子圖結(jié)構(gòu)特征提取框架高效計算出論文與候選作者之間的結(jié)構(gòu)特征,然后采用特征工程與文本嵌入方法提取用于消歧的語義特征,最終使用集成學(xué)習(xí)實現(xiàn)語義信息與結(jié)構(gòu)信息融合。RND-all在WhoIsWho實時同名消歧數(shù)據(jù)集上各類指標(biāo)均達(dá)到最優(yōu),并且在WhoIsWho競賽實時消歧排行榜上排名第一,表現(xiàn)出語義特征與結(jié)構(gòu)特征融合的優(yōu)越性。在本文的消融實驗與實例分析中進(jìn)一步闡明了引入結(jié)構(gòu)特征的有效性。

    RND-all在結(jié)構(gòu)信息的提取上仍有幾個可能的改進(jìn)點,在初始化節(jié)點特征上未來可選用更強(qiáng)大的預(yù)訓(xùn)練模型進(jìn)行特征表示以提高節(jié)點的表達(dá)能力,圖神經(jīng)網(wǎng)絡(luò)模型方面可采用Graph Transformer[23]等新型模型增強(qiáng)特征聚合能力。此外,如何將結(jié)構(gòu)特征更有效地引入實時同名消歧任務(wù)也是今后值得關(guān)注的研究方向。

    猜你喜歡
    語義特征信息
    語言與語義
    如何表達(dá)“特征”
    不忠誠的四個特征
    抓住特征巧觀察
    訂閱信息
    中華手工(2017年2期)2017-06-06 23:00:31
    “上”與“下”語義的不對稱性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語義模糊
    展會信息
    中外會展(2014年4期)2014-11-27 07:46:46
    線性代數(shù)的應(yīng)用特征
    河南科技(2014年23期)2014-02-27 14:19:15
    語義分析與漢俄副名組合
    欧美极品一区二区三区四区| 久久久精品欧美日韩精品| av福利片在线观看| 婷婷丁香在线五月| 91国产中文字幕| 岛国视频午夜一区免费看| 午夜免费成人在线视频| 国产伦在线观看视频一区| 亚洲天堂国产精品一区在线| tocl精华| 国内毛片毛片毛片毛片毛片| 欧美黑人欧美精品刺激| 久久精品aⅴ一区二区三区四区| 神马国产精品三级电影在线观看 | 男人舔女人的私密视频| 欧美乱色亚洲激情| 成人精品一区二区免费| 伦理电影免费视频| 成人国语在线视频| 亚洲一卡2卡3卡4卡5卡精品中文| 搡老妇女老女人老熟妇| 欧美黄色片欧美黄色片| 老司机靠b影院| 在线a可以看的网站| 看黄色毛片网站| 人妻丰满熟妇av一区二区三区| 欧美日韩亚洲国产一区二区在线观看| 午夜老司机福利片| 男插女下体视频免费在线播放| 日韩欧美免费精品| 国产主播在线观看一区二区| 精品国产亚洲在线| 欧美不卡视频在线免费观看 | 脱女人内裤的视频| 国产aⅴ精品一区二区三区波| 亚洲欧美日韩高清在线视频| 中文字幕高清在线视频| 亚洲专区字幕在线| 变态另类成人亚洲欧美熟女| 妹子高潮喷水视频| 神马国产精品三级电影在线观看 | 成年女人毛片免费观看观看9| 黄色丝袜av网址大全| 日本一本二区三区精品| 人人妻人人看人人澡| 国产精品一区二区三区四区免费观看 | 国产精品免费一区二区三区在线| 一级黄色大片毛片| 国产探花在线观看一区二区| 桃色一区二区三区在线观看| 两性夫妻黄色片| 黄色视频,在线免费观看| 丰满的人妻完整版| 久久人人精品亚洲av| 999精品在线视频| 亚洲最大成人中文| 香蕉久久夜色| 国产1区2区3区精品| 99久久精品国产亚洲精品| 精品欧美国产一区二区三| 久久天躁狠狠躁夜夜2o2o| 久久中文字幕人妻熟女| 欧美最黄视频在线播放免费| 一进一出抽搐动态| 黄色视频,在线免费观看| 激情在线观看视频在线高清| 在线播放国产精品三级| 夜夜夜夜夜久久久久| 亚洲av熟女| 九色成人免费人妻av| 一卡2卡三卡四卡精品乱码亚洲| 亚洲国产欧美人成| 麻豆国产97在线/欧美 | 欧美国产日韩亚洲一区| 狂野欧美白嫩少妇大欣赏| 成年人黄色毛片网站| 国产成人影院久久av| 一边摸一边抽搐一进一小说| 天天躁狠狠躁夜夜躁狠狠躁| 神马国产精品三级电影在线观看 | 亚洲精品国产精品久久久不卡| 久久精品国产综合久久久| 中文字幕精品亚洲无线码一区| x7x7x7水蜜桃| 久久这里只有精品19| 又爽又黄无遮挡网站| 精品午夜福利视频在线观看一区| 欧美日韩中文字幕国产精品一区二区三区| ponron亚洲| 女人爽到高潮嗷嗷叫在线视频| 亚洲国产精品999在线| 亚洲成av人片在线播放无| 一卡2卡三卡四卡精品乱码亚洲| 国产精品自产拍在线观看55亚洲| 国产高清激情床上av| 免费看a级黄色片| 亚洲 欧美 日韩 在线 免费| 国产精品一区二区三区四区免费观看 | 69av精品久久久久久| 嫁个100分男人电影在线观看| 黄片大片在线免费观看| 亚洲人成伊人成综合网2020| 亚洲精品国产一区二区精华液| 中文字幕av在线有码专区| 在线观看免费视频日本深夜| 国内精品久久久久久久电影| 亚洲男人天堂网一区| cao死你这个sao货| 99久久国产精品久久久| 一卡2卡三卡四卡精品乱码亚洲| 亚洲五月婷婷丁香| 国产野战对白在线观看| 欧美精品啪啪一区二区三区| 成人高潮视频无遮挡免费网站| 色综合婷婷激情| 99精品在免费线老司机午夜| 亚洲国产欧美一区二区综合| 极品教师在线免费播放| 日韩成人在线观看一区二区三区| 日本黄大片高清| 特级一级黄色大片| 窝窝影院91人妻| 麻豆国产av国片精品| 久久香蕉国产精品| 亚洲精品在线观看二区| 精品一区二区三区视频在线观看免费| 在线观看66精品国产| 一二三四在线观看免费中文在| 老熟妇乱子伦视频在线观看| 亚洲va日本ⅴa欧美va伊人久久| 欧美精品啪啪一区二区三区| 中文字幕高清在线视频| 国产伦在线观看视频一区| netflix在线观看网站| 免费在线观看日本一区| 一级毛片精品| 久久精品91蜜桃| www.自偷自拍.com| 美女免费视频网站| 91成年电影在线观看| 国产精华一区二区三区| 久久天躁狠狠躁夜夜2o2o| 欧美丝袜亚洲另类 | 99精品欧美一区二区三区四区| 亚洲人成77777在线视频| 黄片大片在线免费观看| 欧美日韩亚洲国产一区二区在线观看| 国产亚洲精品av在线| 黄色 视频免费看| 国产欧美日韩一区二区三| 日韩av在线大香蕉| 久久久久久亚洲精品国产蜜桃av| 亚洲精品av麻豆狂野| 在线观看www视频免费| 久久亚洲精品不卡| 亚洲九九香蕉| aaaaa片日本免费| 国产99久久九九免费精品| 亚洲电影在线观看av| 久久婷婷人人爽人人干人人爱| 搡老妇女老女人老熟妇| 97超级碰碰碰精品色视频在线观看| 日日摸夜夜添夜夜添小说| av福利片在线观看| 亚洲成人中文字幕在线播放| 亚洲人成77777在线视频| 久99久视频精品免费| 国产在线精品亚洲第一网站| 亚洲专区国产一区二区| 亚洲欧美日韩无卡精品| 亚洲av日韩精品久久久久久密| 国产精品久久视频播放| 精品欧美一区二区三区在线| 香蕉久久夜色| 国产精品影院久久| 国产亚洲欧美在线一区二区| cao死你这个sao货| 精品欧美一区二区三区在线| 久久久久免费精品人妻一区二区| 每晚都被弄得嗷嗷叫到高潮| 精品乱码久久久久久99久播| 露出奶头的视频| 男插女下体视频免费在线播放| 精品久久蜜臀av无| 91九色精品人成在线观看| www.自偷自拍.com| 麻豆国产97在线/欧美 | 国产又黄又爽又无遮挡在线| 久久久久国产精品人妻aⅴ院| 国产三级在线视频| 亚洲精品美女久久久久99蜜臀| 午夜免费激情av| 中文字幕最新亚洲高清| 精品不卡国产一区二区三区| 可以在线观看毛片的网站| 狂野欧美激情性xxxx| 又黄又粗又硬又大视频| 国产亚洲精品第一综合不卡| 91成年电影在线观看| 精品无人区乱码1区二区| 色综合婷婷激情| 久久精品人妻少妇| 长腿黑丝高跟| 成年人黄色毛片网站| 啦啦啦观看免费观看视频高清| 夜夜看夜夜爽夜夜摸| 久久精品aⅴ一区二区三区四区| av视频在线观看入口| 18禁黄网站禁片午夜丰满| 日日摸夜夜添夜夜添小说| 成人av一区二区三区在线看| 岛国视频午夜一区免费看| 青草久久国产| 九色国产91popny在线| 亚洲成人免费电影在线观看| 久久中文看片网| 亚洲成av人片免费观看| 观看免费一级毛片| 一区二区三区激情视频| 国产欧美日韩一区二区三| 这个男人来自地球电影免费观看| 伦理电影免费视频| 亚洲熟女毛片儿| 色综合亚洲欧美另类图片| 日韩av在线大香蕉| 国产久久久一区二区三区| 亚洲av五月六月丁香网| 巨乳人妻的诱惑在线观看| 日本免费a在线| 首页视频小说图片口味搜索| 中文资源天堂在线| 久久国产乱子伦精品免费另类| 精品久久久久久久毛片微露脸| 午夜激情福利司机影院| 亚洲av中文字字幕乱码综合| 亚洲全国av大片| 欧美黄色片欧美黄色片| 午夜福利视频1000在线观看| 欧美另类亚洲清纯唯美| 久久久久国产精品人妻aⅴ院| 99re在线观看精品视频| 免费搜索国产男女视频| 亚洲国产中文字幕在线视频| 国产免费男女视频| 国产精品久久久av美女十八| 亚洲欧美一区二区三区黑人| 成熟少妇高潮喷水视频| 欧美绝顶高潮抽搐喷水| 亚洲欧美日韩无卡精品| 国产高清有码在线观看视频 | 97超级碰碰碰精品色视频在线观看| 国产99久久九九免费精品| 国产精品久久久久久久电影 | 成人欧美大片| 国产蜜桃级精品一区二区三区| 午夜老司机福利片| 精品国产亚洲在线| 又大又爽又粗| 成年版毛片免费区| 岛国在线免费视频观看| 国产成人精品久久二区二区免费| 国产精品一及| 亚洲精品国产一区二区精华液| 男人舔女人的私密视频| 别揉我奶头~嗯~啊~动态视频| 老熟妇乱子伦视频在线观看| 狠狠狠狠99中文字幕| 成人欧美大片| 美女黄网站色视频| 亚洲第一电影网av| 老司机靠b影院| 波多野结衣高清作品| 日本a在线网址| 桃色一区二区三区在线观看| 久久久久免费精品人妻一区二区| 亚洲全国av大片| 国产一区二区在线av高清观看| 好男人在线观看高清免费视频| 国内久久婷婷六月综合欲色啪| 久久精品91蜜桃| 国产av不卡久久| 狂野欧美白嫩少妇大欣赏| 欧美乱码精品一区二区三区| 最好的美女福利视频网| 久久久精品欧美日韩精品| 欧美3d第一页| 婷婷亚洲欧美| av欧美777| 久久性视频一级片| 啦啦啦韩国在线观看视频| 亚洲精品在线观看二区| av视频在线观看入口| 国产人伦9x9x在线观看| 两个人的视频大全免费| 久久精品综合一区二区三区| www国产在线视频色| 麻豆成人av在线观看| 床上黄色一级片| 国产69精品久久久久777片 | 国产亚洲av高清不卡| 国产高清视频在线观看网站| 免费在线观看黄色视频的| 国产亚洲精品av在线| 级片在线观看| 身体一侧抽搐| 俄罗斯特黄特色一大片| 欧美另类亚洲清纯唯美| 精品一区二区三区视频在线观看免费| 一个人免费在线观看的高清视频| 99热这里只有精品一区 | 又黄又粗又硬又大视频| 国内揄拍国产精品人妻在线| 成人手机av| 免费一级毛片在线播放高清视频| 国产男靠女视频免费网站| 大型av网站在线播放| 日本一本二区三区精品| 天天躁夜夜躁狠狠躁躁| 18禁美女被吸乳视频| 制服人妻中文乱码| 此物有八面人人有两片| cao死你这个sao货| 啦啦啦韩国在线观看视频| 天天躁狠狠躁夜夜躁狠狠躁| 在线观看午夜福利视频| 99精品在免费线老司机午夜| 国产av在哪里看| 中亚洲国语对白在线视频| 精品国产乱子伦一区二区三区| 成人国产一区最新在线观看| 两个人视频免费观看高清| 中文字幕最新亚洲高清| 波多野结衣高清无吗| 搡老妇女老女人老熟妇| 久久国产精品人妻蜜桃| 男人舔奶头视频| 老鸭窝网址在线观看| 窝窝影院91人妻| www日本黄色视频网| 亚洲成av人片免费观看| 久久久久免费精品人妻一区二区| 免费av毛片视频| 中文字幕精品亚洲无线码一区| 亚洲国产精品合色在线| 亚洲精品美女久久av网站| 国产单亲对白刺激| 在线观看66精品国产| 国产精品久久久人人做人人爽| 欧美人与性动交α欧美精品济南到| 黄色a级毛片大全视频| 每晚都被弄得嗷嗷叫到高潮| 免费看美女性在线毛片视频| 久久这里只有精品19| 欧美日韩国产亚洲二区| 一区福利在线观看| 91国产中文字幕| 亚洲午夜理论影院| 宅男免费午夜| 国产区一区二久久| 国产在线观看jvid| www国产在线视频色| 日韩欧美精品v在线| 欧美色欧美亚洲另类二区| 国产精品影院久久| 性欧美人与动物交配| 婷婷精品国产亚洲av在线| 国产麻豆成人av免费视频| 大型黄色视频在线免费观看| 99久久精品国产亚洲精品| 99国产极品粉嫩在线观看| 亚洲欧美激情综合另类| 少妇人妻一区二区三区视频| 中出人妻视频一区二区| 久久亚洲精品不卡| 国产又黄又爽又无遮挡在线| 免费高清视频大片| 一级毛片精品| 成在线人永久免费视频| 亚洲欧美日韩东京热| 日日干狠狠操夜夜爽| 亚洲国产精品合色在线| 午夜福利在线观看吧| 国产精品亚洲一级av第二区| 久久午夜亚洲精品久久| 大型黄色视频在线免费观看| e午夜精品久久久久久久| 亚洲乱码一区二区免费版| 性欧美人与动物交配| 97人妻精品一区二区三区麻豆| 成人国语在线视频| av欧美777| 丰满人妻熟妇乱又伦精品不卡| 亚洲美女视频黄频| 天堂影院成人在线观看| 日韩欧美国产一区二区入口| 午夜福利视频1000在线观看| 成人一区二区视频在线观看| 色在线成人网| 欧美成狂野欧美在线观看| 色老头精品视频在线观看| 九九热线精品视视频播放| 99热这里只有精品一区 | 亚洲精品一卡2卡三卡4卡5卡| 日本 欧美在线| 久久香蕉精品热| 久久久久九九精品影院| 国产高清视频在线播放一区| 非洲黑人性xxxx精品又粗又长| 亚洲av成人不卡在线观看播放网| 桃色一区二区三区在线观看| 一a级毛片在线观看| 一卡2卡三卡四卡精品乱码亚洲| 久久精品国产亚洲av香蕉五月| √禁漫天堂资源中文www| 国产精品av视频在线免费观看| 天堂影院成人在线观看| 亚洲熟妇熟女久久| 搡老熟女国产l中国老女人| 51午夜福利影视在线观看| 成人高潮视频无遮挡免费网站| 国产精品久久久久久人妻精品电影| 老司机在亚洲福利影院| 给我免费播放毛片高清在线观看| 午夜视频精品福利| aaaaa片日本免费| 美女大奶头视频| 法律面前人人平等表现在哪些方面| 亚洲激情在线av| 黄色a级毛片大全视频| 19禁男女啪啪无遮挡网站| 人人妻人人看人人澡| 日韩欧美免费精品| av福利片在线观看| 欧美人与性动交α欧美精品济南到| 此物有八面人人有两片| 最近最新中文字幕大全免费视频| 黄色a级毛片大全视频| 国产高清激情床上av| 桃色一区二区三区在线观看| ponron亚洲| 国产精华一区二区三区| 国产精品一区二区精品视频观看| 久久久精品欧美日韩精品| 天堂av国产一区二区熟女人妻 | 嫁个100分男人电影在线观看| 日韩精品中文字幕看吧| 久久中文字幕人妻熟女| 男男h啪啪无遮挡| 在线免费观看的www视频| 精品第一国产精品| 99re在线观看精品视频| 精品欧美一区二区三区在线| 亚洲自拍偷在线| xxxwww97欧美| 999久久久精品免费观看国产| 欧美在线一区亚洲| 亚洲国产精品合色在线| 搡老妇女老女人老熟妇| 日日摸夜夜添夜夜添小说| 丰满的人妻完整版| 久久久久国产一级毛片高清牌| ponron亚洲| 久99久视频精品免费| 国产99白浆流出| 久久九九热精品免费| 亚洲熟女毛片儿| 国产精品久久视频播放| 成人高潮视频无遮挡免费网站| 99国产综合亚洲精品| 精品高清国产在线一区| 床上黄色一级片| 午夜精品一区二区三区免费看| 欧美黑人精品巨大| 成人亚洲精品av一区二区| 午夜影院日韩av| 99久久精品国产亚洲精品| 午夜福利高清视频| 麻豆国产av国片精品| 国产99白浆流出| 久久九九热精品免费| 一区二区三区激情视频| 中国美女看黄片| 曰老女人黄片| 成人午夜高清在线视频| 天天一区二区日本电影三级| 我要搜黄色片| 国产伦在线观看视频一区| 黄色视频,在线免费观看| 看黄色毛片网站| 亚洲中文av在线| 丁香六月欧美| 国产一区二区在线av高清观看| 看免费av毛片| 亚洲男人天堂网一区| 久久国产精品人妻蜜桃| 丰满人妻一区二区三区视频av | 巨乳人妻的诱惑在线观看| 国产单亲对白刺激| 国产又黄又爽又无遮挡在线| 丰满的人妻完整版| 日韩欧美国产在线观看| 国产精品一及| 久久人妻av系列| 宅男免费午夜| 男女那种视频在线观看| 丰满人妻一区二区三区视频av | 久久婷婷人人爽人人干人人爱| 老司机福利观看| www日本黄色视频网| 精品午夜福利视频在线观看一区| 啦啦啦免费观看视频1| 成人三级做爰电影| 久久精品夜夜夜夜夜久久蜜豆 | 熟女电影av网| 色精品久久人妻99蜜桃| 国产精品一区二区精品视频观看| 天天添夜夜摸| 熟妇人妻久久中文字幕3abv| 日日干狠狠操夜夜爽| 老熟妇乱子伦视频在线观看| 免费搜索国产男女视频| 欧美精品啪啪一区二区三区| 久久精品影院6| 黄色毛片三级朝国网站| 视频区欧美日本亚洲| 亚洲成av人片在线播放无| 欧美日韩亚洲综合一区二区三区_| 国产亚洲精品av在线| 黄频高清免费视频| 香蕉久久夜色| 大型av网站在线播放| 国产精品一区二区精品视频观看| 亚洲精品久久国产高清桃花| 欧美三级亚洲精品| 国产精品久久久久久人妻精品电影| 国产精品一区二区精品视频观看| 18美女黄网站色大片免费观看| 国产免费男女视频| 黄色视频不卡| 中文字幕最新亚洲高清| 国产高清视频在线观看网站| 精品国内亚洲2022精品成人| 亚洲熟妇熟女久久| 看黄色毛片网站| 我要搜黄色片| 国内精品一区二区在线观看| 国产成人精品久久二区二区91| 超碰成人久久| 日日干狠狠操夜夜爽| 国产黄片美女视频| 国产精品久久久久久人妻精品电影| 婷婷精品国产亚洲av| 十八禁人妻一区二区| 亚洲 欧美 日韩 在线 免费| www.www免费av| 老汉色∧v一级毛片| 国产麻豆成人av免费视频| 亚洲真实伦在线观看| 成年免费大片在线观看| 99re在线观看精品视频| 在线播放国产精品三级| 亚洲精品色激情综合| 国产99久久九九免费精品| 久久天堂一区二区三区四区| 欧美+亚洲+日韩+国产| 99久久无色码亚洲精品果冻| 国产av麻豆久久久久久久| 在线观看66精品国产| 天堂√8在线中文| 日本三级黄在线观看| 久久久国产欧美日韩av| 给我免费播放毛片高清在线观看| 国内精品久久久久久久电影| 日本黄色视频三级网站网址| 国产精品久久视频播放| 日韩国内少妇激情av| 亚洲人成77777在线视频| 最新在线观看一区二区三区| 怎么达到女性高潮| 国产一区在线观看成人免费| tocl精华| 全区人妻精品视频| 亚洲aⅴ乱码一区二区在线播放 | 成人亚洲精品av一区二区| 色噜噜av男人的天堂激情| 亚洲免费av在线视频| 国产三级在线视频| 精品日产1卡2卡| 久久精品aⅴ一区二区三区四区| 伦理电影免费视频| 国产欧美日韩一区二区三| 日韩大尺度精品在线看网址| 亚洲狠狠婷婷综合久久图片| 久久久久免费精品人妻一区二区| 18禁美女被吸乳视频| 日本熟妇午夜| 丝袜人妻中文字幕| 午夜两性在线视频| 制服诱惑二区| 午夜视频精品福利| 午夜老司机福利片| 亚洲国产精品sss在线观看| 国产激情久久老熟女| 在线免费观看的www视频| 国产精品电影一区二区三区| 天天添夜夜摸| 亚洲va日本ⅴa欧美va伊人久久| 99久久无色码亚洲精品果冻| 日本黄色视频三级网站网址| 女警被强在线播放| 午夜影院日韩av| 国产精品久久电影中文字幕| 亚洲,欧美精品.| 日日摸夜夜添夜夜添小说| 欧美日韩亚洲综合一区二区三区_|