• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)研究

    2022-01-24 15:41:44任衛(wèi)強曹高輝
    情報學(xué)報 2022年1期
    關(guān)鍵詞:編碼器向量學(xué)術(shù)

    丁 恒,任衛(wèi)強,曹高輝

    (華中師范大學(xué)信息管理學(xué)院,武漢 430079)

    1 引言

    科學(xué)研究是人類認(rèn)知世界的手段,對社會、科技、經(jīng)濟、文化的發(fā)展具有重大的影響。學(xué)術(shù)文獻(xiàn)是科學(xué)研究活動的重要成果,也是科學(xué)工作者之間交流思想的主要工具。文獻(xiàn)計量學(xué)研究表明,學(xué)術(shù)文獻(xiàn)發(fā)表的數(shù)量以每年8%~9%的速度快速增長[1],展現(xiàn)著科研活動和學(xué)術(shù)交流的繁榮景象。然而,爆炸式增長的文獻(xiàn)數(shù)量也為科研活動帶來了負(fù)面影響,研究人員難以處理海量的學(xué)術(shù)文獻(xiàn),面臨著嚴(yán)重的信息過載問題?;诖耍杂嬎銠C信息處理技術(shù)為核心,面向海量學(xué)術(shù)大數(shù)據(jù)的信息服務(wù)(如Web of Science、Google Scholar、Mendeley等),已成為研究人員不可或缺的科研工具。

    如何從學(xué)術(shù)文獻(xiàn)中抽取重要的信息,將學(xué)術(shù)文獻(xiàn)表示成計算機算法更易處理的形式,是實現(xiàn)學(xué)術(shù)文獻(xiàn)的分類、組織、檢索和推薦的一個核心問題。傳統(tǒng)方法主要是依靠專家經(jīng)驗構(gòu)造人工特征對學(xué)術(shù)文獻(xiàn)進(jìn)行表示,例如,在學(xué)術(shù)信息檢索中以論文標(biāo)題和摘要文本構(gòu)建倒排索引,文獻(xiàn)分類和推薦系統(tǒng)中以詞袋模型、向量空間模型、主題模型構(gòu)建學(xué)術(shù)文獻(xiàn)表示向量[2-3]。

    近年來,基于深度學(xué)習(xí)的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)受到了廣泛關(guān)注。例如,文獻(xiàn)[4-6]采用神經(jīng)語言模型從大規(guī)模學(xué)術(shù)文獻(xiàn)語料庫中自動學(xué)習(xí)文獻(xiàn)的語義特征,將學(xué)術(shù)文獻(xiàn)表示成稠密向量,進(jìn)而實現(xiàn)分類、檢索和推薦,其主要缺點在于神經(jīng)語言模型僅考慮了學(xué)術(shù)文獻(xiàn)的文本語義信息,忽視了學(xué)術(shù)文獻(xiàn)之間的關(guān)系結(jié)構(gòu)信息。有鑒于此,文獻(xiàn)[7-9]提出用圖神經(jīng)網(wǎng)絡(luò)從文獻(xiàn)引文網(wǎng)絡(luò)中提取文獻(xiàn)間的關(guān)系結(jié)構(gòu)信息,并與文獻(xiàn)文本語義信息相融合,從而構(gòu)造學(xué)術(shù)文獻(xiàn)表示向量的思路。然而,現(xiàn)有研究大多采用有監(jiān)督圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)文獻(xiàn)特征表示,其存在兩個缺點:①有監(jiān)督圖神經(jīng)網(wǎng)絡(luò)需要針對具體的任務(wù)構(gòu)建大量的、高質(zhì)量的標(biāo)注數(shù)據(jù);②有監(jiān)督圖神經(jīng)網(wǎng)絡(luò)獲取的文獻(xiàn)特征表示與標(biāo)注數(shù)據(jù)集的任務(wù)高度耦合,難以直接遷移到其他任務(wù)上,導(dǎo)致特征表示的普適性較差。

    相較于有監(jiān)督圖神經(jīng)網(wǎng)絡(luò),無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)可直接從無標(biāo)注文獻(xiàn)網(wǎng)絡(luò)數(shù)據(jù)中學(xué)習(xí)通用的文獻(xiàn)特征表示,進(jìn)而應(yīng)用于文獻(xiàn)分類、學(xué)術(shù)檢索、論文推薦等不同的下游任務(wù),被認(rèn)為是一種更具優(yōu)勢的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)方法。然而,無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)上的效果尚不明確?;诖?,本文將無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于學(xué)術(shù)文獻(xiàn)的表示學(xué)習(xí),自動從不同類型的學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)中學(xué)習(xí)論文的特征表示向量,并且進(jìn)一步探討特征向量在文獻(xiàn)分類、學(xué)術(shù)檢索、論文推薦等下游任務(wù)的應(yīng)用情況。本文旨在通過系統(tǒng)性的模擬實驗回答以下三個研究問題,為構(gòu)建基于預(yù)訓(xùn)練文獻(xiàn)表示向量的學(xué)術(shù)大數(shù)據(jù)應(yīng)用提供有效參考依據(jù)。

    問題1:在文獻(xiàn)分類和論文推薦兩個下游任務(wù)場景中,哪種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)方法具有更好的效果?可能的內(nèi)在原因是什么?

    問題2:無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)特征表示維度變化對文獻(xiàn)分類和論文推薦任務(wù)的最終效果有何影響?

    問題3:哪種類型的學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)(引文網(wǎng)絡(luò)、共被引網(wǎng)絡(luò)和文獻(xiàn)耦合網(wǎng)絡(luò))更適合學(xué)習(xí)文獻(xiàn)的通用特征表示?

    2 相關(guān)研究

    2.1 表示學(xué)習(xí)研究

    機器學(xué)習(xí)應(yīng)用的效果很大程度上取決于特征表達(dá),即如何構(gòu)建樣本數(shù)據(jù)的特征表示。傳統(tǒng)的機器學(xué)習(xí)時代,特征表達(dá)主要依靠人類的先驗知識,通過人工分析提取樣本的重要信息,將其組織為特征向量,即所謂的特征工程[10]。然而,特征工程嚴(yán)重依賴專家知識且耗時耗力,因此,自動從原始數(shù)據(jù)中學(xué)習(xí)數(shù)據(jù)的有效表示(即表示學(xué)習(xí)研究)逐漸成為研究熱點[11]。近年來,深度學(xué)習(xí)技術(shù)使得表示學(xué)習(xí)在圖像識別、語音和信號處理以及自然語言處理等領(lǐng)域取得了顯著成果。例如,計算機視覺領(lǐng)域,相較于人工視覺特征,利用卷積神經(jīng)網(wǎng)絡(luò)的自動提取視覺特征大大地降低了圖像識別的錯誤率[12];語音識別應(yīng)用中,在傳統(tǒng)聲學(xué)特征梅爾倒譜系數(shù)(Mel-frequency cepstral coefficients,MFCC)的基礎(chǔ)上,通過神經(jīng)網(wǎng)絡(luò)增強特征表示能夠進(jìn)一步提升語音識別的最終效果[13];自然語言處理研究中,通過訓(xùn)練大規(guī)模預(yù)訓(xùn)練語言模型獲得文本的向量表示,例如,基于詞上下文預(yù)測的Word2Vec[14]、基于上下文Word Embedding雙向動態(tài)調(diào)整的ELMo[15]以及基于Transformer的雙向語言模型BERT(bidirectional encoder representation from transformers)[16-17]已成為當(dāng)前自然語言處理任務(wù)的標(biāo)準(zhǔn)基線。

    如何針對不同的具體任務(wù)構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),是基于深度學(xué)習(xí)的表示學(xué)習(xí)研究的一個重要問題。從已有的實證研究來看,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)、遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)和基于注意力機制的Transformer神經(jīng)網(wǎng)絡(luò)已成為圖像、音頻和文本數(shù)據(jù)表示學(xué)習(xí)的關(guān)鍵組件。實證研究表明[11],通過深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)特征,表示學(xué)習(xí)能夠具有較強的數(shù)據(jù)表征能力,可以不依賴于某一特定任務(wù),學(xué)習(xí)到更通用的先驗知識。因此,將表示學(xué)習(xí)引入學(xué)術(shù)數(shù)據(jù)處理和表征,對論文、作者、期刊、機構(gòu)、研究問題、方法、技術(shù)、數(shù)據(jù)集等學(xué)術(shù)實體的識別、分類、組織、檢索和推薦具有較大的潛在價值。

    2.2 圖嵌入研究

    圖結(jié)構(gòu)廣泛存在于現(xiàn)實場景中,如社交網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、分子結(jié)構(gòu)、引文網(wǎng)絡(luò)等,真實的圖數(shù)據(jù)具有高維度、難處理的特點,如何將高維圖轉(zhuǎn)化為低維向量表示,即圖嵌入研究(graph embedding)一直是學(xué)術(shù)研究的熱點[18]。目前,圖嵌入領(lǐng)域主要有基于因子分解的、基于隨機游走的和基于深度學(xué)習(xí)的三大類方法?;谝蜃臃纸獾膱D嵌入有局部線性嵌入[19]、拉普拉斯特征映射[20]、圖因子分解機[21]等方法,該系列方法以線性代數(shù)為理論基礎(chǔ),依靠特征值分解、奇異值分解等矩陣分解技術(shù),將原始高維向量轉(zhuǎn)換為低維特征向量,且保留原始矩陣中的重要信息?;陔S機游走的圖嵌入有DeepWalk[22]和Node2Vec[23]等,該系列方法受自然語言處理研究中的詞向量(Word2Vec)研究啟發(fā),以圖中任一節(jié)點為起始點,通過無偏或有偏隨機游走獲得節(jié)點序列,再使用Word2Vec算法學(xué)習(xí)節(jié)點的嵌入向量,嵌入向量能夠表征節(jié)點在圖中局部結(jié)構(gòu)信息?;谏疃葘W(xué)習(xí)的圖嵌入有基于自編碼器和鄰接矩陣的SDNE(structural deep network embedding)[24]、基于卷積神經(jīng)網(wǎng)絡(luò)的圖卷積神經(jīng)網(wǎng)絡(luò)GCN(graph convolutional network)[25]以及基于編碼器-解碼器結(jié)構(gòu)的圖自編碼器GAE(graph auto-encoder)[26]等,該系列方法能夠利用深度神經(jīng)網(wǎng)絡(luò)模擬高維非線性函數(shù),從而獲得更精準(zhǔn)的節(jié)點嵌入向量,具有更強的圖數(shù)據(jù)表示能力。

    在圖嵌入研究中,以圖自編碼器(GAE)為代表的無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)方法,不僅能夠編碼節(jié)點的網(wǎng)絡(luò)結(jié)構(gòu)信息,而且能夠利用節(jié)點的屬性信息,從多種角度學(xué)習(xí)到圖數(shù)據(jù)中蘊含的先驗知識。由于學(xué)術(shù)數(shù)據(jù)的先驗知識不僅存在于學(xué)術(shù)文獻(xiàn)的文本語義信息中,還蘊藏于學(xué)術(shù)文獻(xiàn)構(gòu)成的關(guān)系網(wǎng)絡(luò)里,且學(xué)術(shù)數(shù)據(jù)的表示可應(yīng)用的領(lǐng)域和任務(wù)較多,利用圖神經(jīng)網(wǎng)絡(luò)獲取學(xué)術(shù)數(shù)據(jù)的通用表示有利于促進(jìn)學(xué)術(shù)大數(shù)據(jù)的挖掘與應(yīng)用。

    3 基于圖的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)

    3.1 文獻(xiàn)關(guān)系網(wǎng)絡(luò)

    學(xué)術(shù)文獻(xiàn)往往并非孤立存在,而是通過相互聯(lián)系形成網(wǎng)絡(luò)結(jié)構(gòu),比如引文網(wǎng)絡(luò)、共被引網(wǎng)絡(luò)、文獻(xiàn)耦合網(wǎng)絡(luò)等。網(wǎng)絡(luò)在數(shù)據(jù)科學(xué)、計算機科學(xué)中又稱為圖,是一種常見的數(shù)據(jù)結(jié)構(gòu),一般用G=(V,E)表示。其中,V表示網(wǎng)絡(luò)中所有節(jié)點的集合;E表示網(wǎng)絡(luò)中所有邊的集合;vi∈V表示V中第i個節(jié)點;eij=(vi,vj)∈E表示節(jié)點vi和vj之間的邊。對于學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)G而言,vi表示一篇學(xué)術(shù)論文,eij表示論文vi和論文vj之間的引用、共被引或文獻(xiàn)耦合關(guān)系。在數(shù)學(xué)上,網(wǎng)絡(luò)G的結(jié)構(gòu)信息可用n×n的鄰接矩陣A表示,矩陣A的第i行第j列元素記為Aij,Aij=1表示節(jié)點vi與節(jié)點vj之間存在一條邊;反之,則Aij=0。網(wǎng)絡(luò)G中所有節(jié)點的屬性信息用屬性矩陣X∈Rn×d表示,矩陣X中一行xv∈Rd表示節(jié)點v的屬性向量。因此,具有節(jié)點屬性的圖又可以表示為G=(X,A)。在學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)中,屬性矩陣X代表著所有論文的文本語義信息,而A則代表學(xué)術(shù)文獻(xiàn)之間構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu)信息。

    學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí),是指利用神經(jīng)網(wǎng)絡(luò)從大規(guī)模、高維度學(xué)術(shù)文獻(xiàn)數(shù)據(jù)中自動地獲取文獻(xiàn)的低維向量表示,是表示學(xué)習(xí)研究在學(xué)術(shù)數(shù)據(jù)領(lǐng)域的具體應(yīng)用。目前,學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)主要有以下兩大類方法。

    (1)基于文本數(shù)據(jù)的文獻(xiàn)表示學(xué)習(xí)。主要利用神經(jīng)語言模型,將篇幅較大、詞項較多的論文的文本信息編碼成低維稠密實數(shù)向量,解決傳統(tǒng)詞袋模型下論文表示向量詞項空間過大的問題。

    (2)基于圖數(shù)據(jù)的文獻(xiàn)表示學(xué)習(xí)。主要利用圖神經(jīng)網(wǎng)絡(luò)模型,從文獻(xiàn)關(guān)系網(wǎng)絡(luò)中提取有效信息,進(jìn)而將論文編碼成低維向量,其核心思想是論文之間的關(guān)系結(jié)構(gòu)一定程度上能夠表達(dá)論文本身的特征。

    從數(shù)學(xué)形式上看,前者可記為f(X)→Z,只利用了論文的文本語義信息X;后者可記為f(X,A)→Z,不僅利用文本語義信息X,同時利用文獻(xiàn)網(wǎng)絡(luò)的結(jié)構(gòu)信息A。Z是神經(jīng)網(wǎng)絡(luò)f輸出的文獻(xiàn)特征表示矩陣,矩陣Z中任一行zv表示文獻(xiàn)v的特征表示向量,該向量可被應(yīng)用于文獻(xiàn)分類、學(xué)術(shù)檢索、論文推薦等下游任務(wù)中。模糊的學(xué)科邊界、高度交叉融合的學(xué)科體系,導(dǎo)致“一詞多義、一義多詞”的現(xiàn)象普遍存在于學(xué)術(shù)論文中,純粹基于文本語義信息的文獻(xiàn)表示學(xué)習(xí)方法具有先天的缺點,因此,本文主要探討以圖神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),可綜合利用兩種信息的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)方法。

    3.2 無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)

    目前,圖神經(jīng)網(wǎng)絡(luò)主要分為有監(jiān)督、半監(jiān)督和無監(jiān)督三大類型。其中,無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)不僅具備圖神經(jīng)網(wǎng)絡(luò)能夠同時編碼文獻(xiàn)文本語義信息和文獻(xiàn)關(guān)系結(jié)構(gòu)信息的能力,同時具有無需標(biāo)注數(shù)據(jù)的優(yōu)勢,且網(wǎng)絡(luò)訓(xùn)練過程與下游任務(wù)解耦,所學(xué)習(xí)到的文獻(xiàn)表示具有較強的通用性。因此,本文聚焦于多種代表性無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)方法在學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)上的應(yīng)用效果,選擇的代表性無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)有圖自編碼器(GAE[26])、變分圖自編碼器(variational graph auto-encoders,VGAE)[27]、對 抗正則化變分圖自編碼器(adversarially regularized variational graph autoencoder,ARVGA)[27]和深度互信息圖神經(jīng)網(wǎng)絡(luò)(deep graph infomax,DGI)[28]。

    無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)主要由編碼器、解碼器以及學(xué)習(xí)目標(biāo)三個部分構(gòu)成。

    (1)編碼器。以文獻(xiàn)網(wǎng)絡(luò)的鄰接矩陣A和文獻(xiàn)文本語義信息矩陣X為輸入,通過編碼函數(shù)f獲得文獻(xiàn)特征表示矩陣Z,記為f(X,A)→Z。

    (2)解碼器。在文獻(xiàn)特征表示矩陣Z的基礎(chǔ)上,通過解碼函數(shù)獲得重構(gòu)鄰接矩陣記為

    (3)學(xué)習(xí)目標(biāo)。在文獻(xiàn)網(wǎng)絡(luò)的鄰接矩陣A、重構(gòu)鄰接矩陣A^、文獻(xiàn)特征表示矩陣Z等的基礎(chǔ)上,根據(jù)目標(biāo)函數(shù)評估、優(yōu)化文獻(xiàn)特征表示矩陣Z的表達(dá)能力。

    表1 列舉了四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)各部分的差異。

    表1 四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)差異分析表

    在編碼器部分,四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)都采用了圖卷積神經(jīng)網(wǎng)絡(luò)GCN,圖卷積神經(jīng)網(wǎng)絡(luò)的計算公式為

    其中,GCN表示圖卷積神經(jīng)網(wǎng)絡(luò);D表示鄰接矩陣A對應(yīng)的度矩陣;ReLU為線性整流函數(shù);W0和W1為圖卷積神經(jīng)網(wǎng)絡(luò)待學(xué)習(xí)的參數(shù)。圖自編碼器通過1個圖卷積神經(jīng)網(wǎng)絡(luò)GCN輸出文獻(xiàn)特征表示矩陣Z。變分圖自編碼器則和對抗正則化變分圖自編碼器用GCNμ(X,A)和GCNσ(X,A)輸出文獻(xiàn)特征表示矩陣Z,且GCNμ(X,A)和GCNσ(X,A)是W0相同、W1不同的兩個圖卷積神經(jīng)網(wǎng)絡(luò),分別捕獲文獻(xiàn)特征表示的均值μ和文獻(xiàn)特征表示的方差σ,且不僅生成文獻(xiàn)特征表示矩陣Z,還通過標(biāo)準(zhǔn)正態(tài)分布N(z v|0,1)采樣獲得的先驗表示矩陣深度互信息圖神經(jīng)網(wǎng)絡(luò)則用圖卷積神經(jīng)網(wǎng)絡(luò)編碼隨機擾動矩陣從而輸出噪聲特征表示矩陣在解碼器部分,圖自編碼器、變分圖自編碼器和對抗正則化變分圖自編碼器都采用內(nèi)積運算θ(ZZT)獲取重構(gòu)鄰接矩陣其中,ZT表示Z的轉(zhuǎn)置矩陣,θ表示Sigmoid函數(shù)。深度互信息圖神經(jīng)網(wǎng)絡(luò)則通過矩陣運算θ(ZWs→T)和輸出重構(gòu)矩陣A′和其中,θ表示Sigmoid函數(shù),W是一個大小為d×d可學(xué)習(xí)的參數(shù)矩陣,s→表示文獻(xiàn)全局特征表示向量,具體計算公式為

    其中,z v是文獻(xiàn)特征表示矩陣Z的其中一行,代表文獻(xiàn)v的特征表示向量,大小為1×d;表示向量的轉(zhuǎn)置。注意,與前三種神經(jīng)網(wǎng)絡(luò)不同,深度互信息圖神經(jīng)網(wǎng)絡(luò)解碼器輸出的重構(gòu)矩陣時,不僅考慮了各個文獻(xiàn)的特征表示,而且考慮了整體特征表示s→的信息。

    在學(xué)習(xí)目標(biāo)部分,四種圖神經(jīng)網(wǎng)絡(luò)采用了不同的損失函數(shù)作為網(wǎng)絡(luò)學(xué)習(xí)優(yōu)化目標(biāo)。涉及的損失函數(shù)有LCE交叉熵?fù)p失函數(shù)、KL相對熵?fù)p失函數(shù)和JS散度損失函數(shù)。交叉熵的計算公式為

    其中,n表示文獻(xiàn)網(wǎng)絡(luò)中論文數(shù)量;Aij為原始鄰接矩陣A的第i行第j列;為重構(gòu)鄰接矩陣的第i行第j列;LCE(A^,A)實質(zhì)上衡量了矩陣A和矩陣的差異。

    KL相對熵的計算公式為

    min||·||和max||·||分別表示最小化和最大化目標(biāo)函數(shù),因此,四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)目標(biāo)及含義分別為:

    對抗正則化變分圖自編碼器中判別器D(Z)的計算公式為

    其中,D是一個三層的多層感知機,以文獻(xiàn)特征表示矩陣Z為輸入時,判別器可輸出一個n×1的矩陣D(Z);W0、W1和W2為多層感知機中待學(xué)習(xí)的參數(shù)。同理,以先驗表示矩陣為輸入時,判別器也將輸出一個n×1的矩陣

    3.3 特征學(xué)習(xí)算法與過程

    學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)的根本目標(biāo)是獲得一個具有較強特征表達(dá)能力的文獻(xiàn)特征表示矩陣Z。在基于無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)框架下,文獻(xiàn)特征表示矩陣Z是由編碼器輸出而得,即f W(X,A)→Z,其中,f代表編碼器中的圖卷積神經(jīng)網(wǎng)絡(luò),W表示圖卷積神經(jīng)網(wǎng)絡(luò)中所有可學(xué)習(xí)的參數(shù)。算法1描述了學(xué)術(shù)文獻(xiàn)特征表示矩陣Z的學(xué)習(xí)過程,學(xué)習(xí)到的文獻(xiàn)表示向量zv可作為特征向量應(yīng)用于下游任務(wù);迭代次數(shù)T為250,特征維度d的取值范圍為[32,64,128,256,512]。

    算法1:基于無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)算法

    輸入:文獻(xiàn)關(guān)系網(wǎng)絡(luò)G=(X,A),訓(xùn)練的迭代次數(shù)T,特征維度大小d。

    Step1.隨機初始化編碼器參數(shù)W;

    Step2.編碼器進(jìn)行運算,輸出文獻(xiàn)特征表示矩陣Z;

    Step4.根據(jù)學(xué)習(xí)目標(biāo)計算損失函數(shù);

    Step5.采用隨機梯度下降更新編碼器參數(shù)W;

    Step6.反復(fù)執(zhí)行Step1~Step5T次;

    Step7.輸出Z作為最終學(xué)習(xí)到的文獻(xiàn)特征表示矩陣,文獻(xiàn)v的表示向量為zv∈Rd。

    4 實驗構(gòu)建

    4.1 任務(wù)場景設(shè)計

    本文選擇文獻(xiàn)分類和論文推薦為下游任務(wù)場景,從而分析學(xué)習(xí)到的學(xué)術(shù)文獻(xiàn)特征表示的有效性。具體而言,在文獻(xiàn)分類任務(wù)中,實驗執(zhí)行以下4個步驟:①文獻(xiàn)表示學(xué)習(xí),將文獻(xiàn)網(wǎng)絡(luò)G=(X,A)輸入無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)獲取文獻(xiàn)特征表示Z;②數(shù)據(jù)集切分,將文獻(xiàn)網(wǎng)絡(luò)G中的所有文獻(xiàn)切分為兩個訓(xùn)練集Z1:v={z1,…,zv}和測試集Zv:n={zv+1,…,zn},樣本比例分別為70%和30%;③分類模型訓(xùn)練,將訓(xùn)練集數(shù)據(jù)輸入邏輯回歸分類器訓(xùn)練分類模型;④評價指標(biāo)計算,將訓(xùn)練好的分類模型運用到測試集上,獲取MarcoF1(宏平均F1值)和MicroF1(微平均F1值)兩個評價指標(biāo)。

    在論文推薦任務(wù)中,實驗執(zhí)行以下5個步驟:①文獻(xiàn)表示學(xué)習(xí),將學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)G=(X,A)輸入無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)獲取文獻(xiàn)特征表示Z;②測試文獻(xiàn)采樣,從文獻(xiàn)網(wǎng)絡(luò)G中隨機抽取30個文獻(xiàn),作為論文推薦任務(wù)的測試文獻(xiàn);③推薦列表獲取,依次從文獻(xiàn)特征表示矩陣Z中取出測試文獻(xiàn)對應(yīng)的特征向量z v,利用余弦相似度公式計算其與學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)G中所有其他文獻(xiàn)的相似性,并篩選相似性最大的前20篇文獻(xiàn)為候選推薦列表;④相關(guān)性標(biāo)注,兩位標(biāo)注專家查看測試文獻(xiàn)和推薦列表候選文獻(xiàn)標(biāo)題和摘要的內(nèi)容,判斷測試文獻(xiàn)與推薦列表中每個文獻(xiàn)之間的相關(guān)性大小并進(jìn)行打分,分值為1~5;⑤評價指標(biāo)計算,在相關(guān)性標(biāo)注的基礎(chǔ)上計算Hit@K和Ndcg@K指標(biāo),K的取值為[5,10]。

    4.2 數(shù)據(jù)集處理

    基于無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)術(shù)文獻(xiàn)表示學(xué)習(xí)算法,必須執(zhí)行在既包含文獻(xiàn)網(wǎng)絡(luò)關(guān)系又包含文獻(xiàn)文本語義特征的數(shù)據(jù)集上,因此,本文以三個大小不同的學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)數(shù)據(jù)集Cora、CiteSeer和DBLP(database systems and logic programming)為基礎(chǔ),針對文獻(xiàn)分類和論文推薦兩個任務(wù)進(jìn)行預(yù)處理,從而構(gòu)建了實驗數(shù)據(jù)集。表2列舉了處理后數(shù)據(jù)集的具體信息。

    表2 三個學(xué)術(shù)文獻(xiàn)數(shù)據(jù)集的具體信息

    具體而言,Cora原始數(shù)據(jù)集共包含2708篇文獻(xiàn),每篇文獻(xiàn)的文本特征為1433維的one-hot向量,文獻(xiàn)引文網(wǎng)絡(luò)的邊數(shù)為5429。本文根據(jù)Cora原始引文網(wǎng)絡(luò)抽取出共被引關(guān)系5687條和文獻(xiàn)耦合關(guān)系39596條,從而構(gòu)建了Cora數(shù)據(jù)集的共被引網(wǎng)絡(luò)和文獻(xiàn)耦合網(wǎng)絡(luò),且從此網(wǎng)站①https://people.cs.umass.edu/~mccallum/data/獲取到Cora數(shù)據(jù)集中每篇文獻(xiàn)對應(yīng)的標(biāo)題和摘要。CiteSeer原始數(shù)據(jù)集共包含3327篇文獻(xiàn),每篇文獻(xiàn)的文本特征為3703維的one-hot向量,文獻(xiàn)引文網(wǎng)絡(luò)的邊數(shù)為4732,共被引網(wǎng)絡(luò)邊5959條、文獻(xiàn)耦合網(wǎng)絡(luò)邊16898條。本文從原始DBLP數(shù)據(jù)中隨機采樣出86592篇文獻(xiàn)及其對應(yīng)的引文關(guān)系968589條,共被引關(guān)系23561659條,文獻(xiàn)耦合關(guān)系10419860條,每篇文獻(xiàn)的文本語義特征向量通過Spacy中的Word2Vec模型獲?、趆ttps://spacy.io/,文獻(xiàn)的文本語義向量為文獻(xiàn)標(biāo)題中所有詞的詞向量的均值向量。。為了提升實驗結(jié)論的可拓展性,本文對每個下游任務(wù)都采用兩個數(shù)據(jù)集進(jìn)行實驗,具體信息如表3所示。

    表3 任務(wù)數(shù)據(jù)集選擇及其說明

    4.3 實驗組設(shè)置③https://scholarbank.nus.edu.sg/handle/10635/146027

    為了回答在第1節(jié)中提出的三個研究問題,本文共設(shè)計了兩組實驗,相關(guān)設(shè)置如下。

    實驗組1:以三個數(shù)據(jù)集的文獻(xiàn)引文網(wǎng)絡(luò)為輸入鄰接矩陣,依次采用四種無監(jiān)督神經(jīng)網(wǎng)絡(luò),選擇不同大小的特征維度d,執(zhí)行文獻(xiàn)分類和論文推薦任務(wù)獲取評價指標(biāo),并以深度隨機游走(Deep-Walk)[22]、Doc2Vec[29]、Paper2Vec[30]的結(jié)果作為對比基線。該實驗組在固定文獻(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)的條件下,通過改變無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和文獻(xiàn)特征表示維度大小獲取實驗結(jié)果,以期回答問題1和問題2。

    實驗組2:以Cora數(shù)據(jù)集的引文網(wǎng)絡(luò)、共被引網(wǎng)絡(luò)、文獻(xiàn)耦合網(wǎng)絡(luò)為輸入鄰接矩陣,以固定的無監(jiān)督圖神經(jīng)網(wǎng)絡(luò),通過貪心算法選擇最優(yōu)特征維度d,執(zhí)行文獻(xiàn)分類和論文推薦任務(wù)獲取評價指標(biāo)。該實驗組在固定任務(wù)和確定無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)模型的條件下,通過改變輸入網(wǎng)絡(luò)的結(jié)構(gòu)獲取實驗結(jié)果,以期回答問題3。

    5 實驗結(jié)果分析

    5.1 學(xué)習(xí)方法比較分析

    表4 顯示了三種基線方法和四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在Cora和CiteSeer兩個數(shù)據(jù)集上執(zhí)行文獻(xiàn)分類實驗的最優(yōu)結(jié)果。由研究結(jié)果可知,在文獻(xiàn)分類任務(wù)上,無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)全面優(yōu)于深度隨機游走,表明在文獻(xiàn)關(guān)系結(jié)構(gòu)信息之上,融合文獻(xiàn)文本語義信息能夠有效提升文獻(xiàn)特征表示能力。深度互信息圖神經(jīng)網(wǎng)絡(luò)在兩個數(shù)據(jù)集中均獲得了最高評價指標(biāo),在Cora數(shù)據(jù)集上,宏平均F1和微平均F1值分別為0.808和0.820;在CiteSeer數(shù)據(jù)集上,宏平均F1和微平均F1值分別為0.657和0.692。變分圖自編碼器僅次于深度互信息圖神經(jīng)網(wǎng)絡(luò),在兩個數(shù)據(jù)集的多項指標(biāo)上均獲得了較好的結(jié)果。圖自編碼器和對抗正則化變分圖自編碼器則表現(xiàn)相當(dāng),在不同數(shù)據(jù)集的不同指標(biāo)上互有勝負(fù)。

    表4 三種基線方法和四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在文獻(xiàn)分類任務(wù)上的最優(yōu)結(jié)果

    表5 顯示了三種基線方法和四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在Cora和DBLP兩個數(shù)據(jù)集上執(zhí)行論文推薦實驗的最優(yōu)結(jié)果。在Cora數(shù)據(jù)集上,對抗正則化變分圖自編碼器表現(xiàn)最好,其Ndcg@5、Ndcg@10、Hit@5、Hit@10分別為0.596、0.646、0.571、0.660。在Hit@10指標(biāo)上,深度互信息圖神經(jīng)網(wǎng)絡(luò)的表現(xiàn)最優(yōu),而其他三個圖神經(jīng)網(wǎng)絡(luò)則表現(xiàn)相當(dāng)。在Ndcg@5和Ndcg@10指標(biāo)上,對抗正則化變分圖自編碼器遠(yuǎn)高于其他三個神經(jīng)網(wǎng)絡(luò),圖自編碼器則表現(xiàn)優(yōu)于變分圖自編碼器和深度互信息圖神經(jīng)網(wǎng)絡(luò)。在DBLP數(shù)據(jù)集上,對抗正則化變分圖自編碼器在Ndcg@5、Ndcg@10、Hit@5和Hit@10上都得分最高,其他三個神經(jīng)網(wǎng)絡(luò)表現(xiàn)則相差不大。盡管深度互信息圖神經(jīng)網(wǎng)絡(luò)和對抗正則化變分圖自編碼器的Hit@5指標(biāo)均為0.457,但是對抗正則化變分圖自編碼器的Ndcg@5得分為0.573,相比于深度互信息圖神經(jīng)網(wǎng)絡(luò)提高了6.5%,這說明對抗正則化變分圖自編碼器能夠?qū)⑾嚓P(guān)性更高的文獻(xiàn)排在推薦列表頂部。

    表5 三種基線方法和四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在論文推薦任務(wù)上的最優(yōu)結(jié)果

    上述實驗結(jié)果表明,相較于其他圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的特征表示,深度互信息圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到的文獻(xiàn)特征表示具有更強的文獻(xiàn)差異區(qū)分能力。這可能是由于深度互信息圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標(biāo)是最大化局部文獻(xiàn)特征表示和全局文獻(xiàn)特征表示的互信息,即學(xué)習(xí)到更能夠表示每一篇文獻(xiàn)獨特性的特征向量,因此,其特別適合于文獻(xiàn)分類這種下游任務(wù)。而其他三種圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)均希望使得重構(gòu)鄰接矩陣和原始鄰接矩陣的相接近,實質(zhì)上是讓文獻(xiàn)網(wǎng)絡(luò)中具有關(guān)聯(lián)關(guān)系的文獻(xiàn)具有更相近的特征表示向量。從這個角度來看,理論上圖自編碼器、變分圖自編碼器和對抗正則化變分圖自編碼器學(xué)習(xí)到的文獻(xiàn)特征表示更適合于論文推薦任務(wù)。然而,在Cora和DBLP兩個數(shù)據(jù)集上,深度互信息圖神經(jīng)網(wǎng)絡(luò)表現(xiàn)并非最差,與圖自編碼器和變分圖自編碼器表現(xiàn)相當(dāng)。本文認(rèn)為,這可能與Cora和DBLP兩個數(shù)據(jù)集包含的所有文獻(xiàn)皆屬于計算機領(lǐng)域有關(guān)。正是由于Cora和DBLP數(shù)據(jù)集中文獻(xiàn)都屬于同一領(lǐng)域,執(zhí)行論文推薦任務(wù)時深度互信息圖神經(jīng)網(wǎng)絡(luò)捕捉到的細(xì)節(jié)差異,有利于從主題領(lǐng)域相似的小文獻(xiàn)集合中找到更相關(guān)的推薦文獻(xiàn)。

    5.2 特征維度影響分析

    圖1 顯示了采用不同大小的特征維度d時,四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的文獻(xiàn)特征表示在文獻(xiàn)分類任務(wù)上的效果變化。由圖1可知,對于深度互信息圖神經(jīng)網(wǎng)絡(luò)而言,當(dāng)特征維度增大時,文獻(xiàn)分類各指標(biāo)均呈現(xiàn)遞增的趨勢。而對另外三種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)來說,特征維度的增大反而使得文獻(xiàn)分類各指標(biāo)呈現(xiàn)波動或降低的趨勢。理論上看,更大的特征維度能夠存儲更多的細(xì)節(jié)信息,從而使得學(xué)習(xí)到的文獻(xiàn)特征能夠刻畫文獻(xiàn)之間更細(xì)節(jié)的差異。正如第5.1節(jié)分析所述,深度互信息圖神經(jīng)網(wǎng)絡(luò)通過最大化局部文獻(xiàn)特征表示和全局文獻(xiàn)特征表示的互信息,使得每篇文獻(xiàn)自身獨特的信息能夠保留在學(xué)習(xí)到的文獻(xiàn)特征表示向量中,因此,文獻(xiàn)分類結(jié)果受益于更大的特征維度。然而,圖自編碼器、變分圖自編碼器和對抗正則化變分圖自編碼器的學(xué)習(xí)目標(biāo)并不能更有效地區(qū)分不同文獻(xiàn)之間的差異,只能讓文獻(xiàn)網(wǎng)絡(luò)中相連接的文獻(xiàn)具有更相似的表示向量,因此,分類任務(wù)上這三種圖神經(jīng)網(wǎng)絡(luò)不能受益于更大的特征維度。

    圖1 特征維度變化對文獻(xiàn)分類任務(wù)的影響

    圖2 顯示了采用不同特征維度大小d時,四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)的文獻(xiàn)特征表示在論文推薦任務(wù)上的效果變化。在DBLP數(shù)據(jù)集上,深度互信息圖神經(jīng)網(wǎng)絡(luò)各指標(biāo)均呈現(xiàn)先增后減的趨勢,且在d=128附近得到最大得分。圖自編碼器和變分圖自編碼器在各指標(biāo)上呈現(xiàn)增減波動,沒有穩(wěn)定提高或降低的趨勢。對抗正則化變分圖自編碼器各指標(biāo)最小值均出現(xiàn)在d=64或d=128時且形成上凹拋弧線。在Cora數(shù)據(jù)集上,除圖自編碼器外的三種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)在d=32處已取得最優(yōu)指標(biāo)。深度互信息圖神經(jīng)網(wǎng)絡(luò)各指標(biāo)形成S形波動,其他三種圖神經(jīng)網(wǎng)絡(luò)指標(biāo)變化較平緩??偟膩碚f,特征維度的增大不能夠給論文推薦結(jié)果指標(biāo)帶來提升,本文認(rèn)為,這代表四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)都無益于論文推薦任務(wù)。

    圖2 特征維度變化對論文推薦任務(wù)的影響

    5.3 網(wǎng)絡(luò)類型影響分析

    由于CiteSeer數(shù)據(jù)集只提供了文獻(xiàn)onehot文本特征,缺乏文獻(xiàn)的原始文本數(shù)據(jù),而DBLP數(shù)據(jù)集沒有提供文獻(xiàn)分類標(biāo)簽,故僅有Cora數(shù)據(jù)集可同時執(zhí)行文獻(xiàn)分類和論文推薦兩個任務(wù)。圖3中的每個子圖都顯示了同一個數(shù)據(jù)集下(Cora數(shù)據(jù)集),采用同一種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)時,以三種不同文獻(xiàn)網(wǎng)絡(luò)為輸入而獲得的6個任務(wù)指標(biāo)(包括文獻(xiàn)分類2個和論文推薦4個)的數(shù)值得分。由圖3可知,無論是文獻(xiàn)分類還是論文推薦任務(wù)場景,在其他條件相同時,相比于其他兩個文獻(xiàn)網(wǎng)絡(luò),引文網(wǎng)絡(luò)似乎更適合學(xué)習(xí)文獻(xiàn)的通用特征表示,并且文獻(xiàn)耦合網(wǎng)絡(luò)在絕大多數(shù)情況下比共被引網(wǎng)絡(luò)更好。

    圖3 文獻(xiàn)網(wǎng)絡(luò)類型變化對文獻(xiàn)分類和論文推薦指標(biāo)的影響

    為了進(jìn)一步解釋文獻(xiàn)網(wǎng)絡(luò)類型變化而導(dǎo)致文獻(xiàn)分類任務(wù)效果的差異,本文統(tǒng)計了三種文獻(xiàn)網(wǎng)絡(luò)中不同類型邊的數(shù)量,具體如表6所示。其中,同類文獻(xiàn)節(jié)點間邊的數(shù)量是指文獻(xiàn)網(wǎng)絡(luò)中邊兩側(cè)的文獻(xiàn)節(jié)點屬于同一類別文獻(xiàn)時邊的總數(shù),非同類文獻(xiàn)節(jié)點間邊的數(shù)量是指文獻(xiàn)網(wǎng)絡(luò)中邊兩側(cè)的文獻(xiàn)節(jié)點不屬于同類別文獻(xiàn)時邊的總數(shù)。由表6可知,Cora數(shù)據(jù)集引文網(wǎng)絡(luò)中一共有5429條邊,其中連接同類文獻(xiàn)節(jié)點的邊的數(shù)量占81.4%,非同類文獻(xiàn)節(jié)點的邊的數(shù)量占18.6%。從引文網(wǎng)絡(luò)構(gòu)造共被引網(wǎng)絡(luò)后,共被引網(wǎng)絡(luò)中同類文獻(xiàn)節(jié)點間邊的數(shù)量占比下降到73.6%,非同類文獻(xiàn)節(jié)點間邊的數(shù)量占比上升到26.4%。這表明從引文網(wǎng)絡(luò)構(gòu)建共被引網(wǎng)絡(luò)時,網(wǎng)絡(luò)中不同類型文獻(xiàn)節(jié)點間的聯(lián)系(邊的數(shù)量)密度增大,本來不屬于同一類型的文獻(xiàn)節(jié)點被連接起來,從而弱化了從網(wǎng)絡(luò)中學(xué)習(xí)到的文獻(xiàn)表示向量的類別區(qū)分能力。同理,在文獻(xiàn)耦合網(wǎng)絡(luò)中,同類文獻(xiàn)節(jié)點間邊的數(shù)量占75.8%,非同類文獻(xiàn)節(jié)點間邊的數(shù)量占24.2%,低于引文網(wǎng)絡(luò)但略高于共被引網(wǎng)絡(luò),因此,其在文獻(xiàn)分類任務(wù)上的效果排名第二(圖3)。

    表6 Cora數(shù)據(jù)集三種文獻(xiàn)網(wǎng)絡(luò)中邊類型統(tǒng)計數(shù)據(jù)表

    為了洞察文獻(xiàn)網(wǎng)絡(luò)類型導(dǎo)致論文推薦任務(wù)效果差異的原因,本文從Cora數(shù)據(jù)集中隨機選擇了3個文獻(xiàn)節(jié)點,并人工統(tǒng)計了這些節(jié)點在不同類型文獻(xiàn)網(wǎng)絡(luò)中鄰居節(jié)點相關(guān)性得分的平均值,結(jié)果如表7所示。由表7可知,對于同一個文獻(xiàn)節(jié)點,其在引文網(wǎng)絡(luò)中的鄰居節(jié)點的相關(guān)性得分平均值高于其他兩個文獻(xiàn)網(wǎng)絡(luò)。這表明相較于其他兩個文獻(xiàn)網(wǎng)絡(luò),引文網(wǎng)絡(luò)中由邊相連的節(jié)點之間可能具有更強的關(guān)聯(lián)性,更利于圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)文獻(xiàn)間的相似性,從而有利于論文的推薦任務(wù)。

    表7 鄰居節(jié)點相關(guān)性得分統(tǒng)計數(shù)據(jù)表

    6 結(jié) 語

    學(xué)術(shù)文獻(xiàn)的表示學(xué)習(xí)是優(yōu)化學(xué)術(shù)文獻(xiàn)搜索、學(xué)術(shù)文獻(xiàn)分類組織、學(xué)術(shù)文獻(xiàn)個性化推薦等學(xué)術(shù)大數(shù)據(jù)服務(wù)的基礎(chǔ)。本文將自編碼器、變分圖自編碼器、對抗正則化變分圖自編碼器和深度互信息圖神經(jīng)網(wǎng)絡(luò)這四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)方法引入學(xué)術(shù)文獻(xiàn)的表示學(xué)習(xí)研究,以文獻(xiàn)分類和論文推薦為下游任務(wù)進(jìn)行了相關(guān)實驗。本文的主要貢獻(xiàn):①分析了四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的差異,提出了以“編碼器-解碼器-學(xué)習(xí)目標(biāo)”為核心的、基于無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的文獻(xiàn)表示學(xué)習(xí)框架(見表1),并梳理出四種圖神經(jīng)網(wǎng)絡(luò)的矩陣表達(dá)形式;②通過實驗發(fā)現(xiàn)深度互信息圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)更適合于文獻(xiàn)分類任務(wù),而對抗正則化變分圖自編碼器更適合于論文推薦任務(wù);③實驗發(fā)現(xiàn)特征維度的增大能夠有效提升深度互信息圖神經(jīng)網(wǎng)絡(luò)的文獻(xiàn)類別差異表征能力,而四種無監(jiān)督圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo)似乎都無益于論文推薦任務(wù);④Cora數(shù)據(jù)集上的實驗表明,相較于共被引網(wǎng)絡(luò)和文獻(xiàn)耦合網(wǎng)絡(luò),引文網(wǎng)絡(luò)更適合于學(xué)習(xí)通用的文獻(xiàn)表示向量。

    盡管本文選用了Cora、CiteSeer和DBLP等多個數(shù)據(jù)集進(jìn)行了實驗,然而這些數(shù)據(jù)集都僅只是從真實學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)中抽樣的部分?jǐn)?shù)據(jù)。從理論上看,通過圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)文獻(xiàn)的表示向量會受到文獻(xiàn)鄰居節(jié)點文獻(xiàn)的影響,因此,采樣部分文獻(xiàn)數(shù)據(jù)可能會學(xué)習(xí)到有偏的文獻(xiàn)表示,即文獻(xiàn)最終的表示向量由采樣到的鄰居節(jié)點決定,而不是真實學(xué)術(shù)網(wǎng)絡(luò)中所有鄰居節(jié)點決定。未來將分析不同的采樣策略如何影響文獻(xiàn)表示學(xué)習(xí)和相應(yīng)的下游任務(wù)指標(biāo),這是一個有趣且值得研究的問題。

    猜你喜歡
    編碼器向量學(xué)術(shù)
    向量的分解
    聚焦“向量與三角”創(chuàng)新題
    如何理解“Curator”:一個由翻譯引發(fā)的學(xué)術(shù)思考
    中國博物館(2019年2期)2019-12-07 05:40:44
    對學(xué)術(shù)造假重拳出擊
    商周刊(2019年2期)2019-02-20 01:14:22
    基于FPGA的同步機軸角編碼器
    基于PRBS檢測的8B/IOB編碼器設(shè)計
    向量垂直在解析幾何中的應(yīng)用
    JESD204B接口協(xié)議中的8B10B編碼器設(shè)計
    電子器件(2015年5期)2015-12-29 08:42:24
    向量五種“變身” 玩轉(zhuǎn)圓錐曲線
    多總線式光電編碼器的設(shè)計與應(yīng)用
    亚洲精品色激情综合| 中文字幕制服av| 99久久精品一区二区三区| 老司机影院毛片| av国产免费在线观看| 亚洲国产欧美人成| 51国产日韩欧美| 国产在视频线在精品| www.av在线官网国产| 亚洲av中文av极速乱| 中文精品一卡2卡3卡4更新| 日韩av在线大香蕉| 国产精品久久电影中文字幕| 九草在线视频观看| 亚洲美女视频黄频| 一个人观看的视频www高清免费观看| 欧美3d第一页| 18+在线观看网站| 午夜福利高清视频| 色综合亚洲欧美另类图片| 嫩草影院新地址| 韩国高清视频一区二区三区| 国产午夜精品论理片| 男人舔奶头视频| 99在线人妻在线中文字幕| 男人的好看免费观看在线视频| 九九爱精品视频在线观看| 不卡视频在线观看欧美| 少妇被粗大猛烈的视频| 嫩草影院入口| 乱码一卡2卡4卡精品| 国语自产精品视频在线第100页| av免费观看日本| 在线观看美女被高潮喷水网站| 少妇熟女欧美另类| 国产成人一区二区在线| www日本黄色视频网| 我要搜黄色片| 精品久久久久久成人av| 最近中文字幕2019免费版| 国产精品av视频在线免费观看| 女人十人毛片免费观看3o分钟| 欧美3d第一页| 色综合色国产| 色综合亚洲欧美另类图片| 亚洲高清免费不卡视频| 最近最新中文字幕大全电影3| 在线观看66精品国产| 亚洲欧美成人综合另类久久久 | 亚洲av成人精品一区久久| 欧美日韩综合久久久久久| 久久婷婷人人爽人人干人人爱| 99久久无色码亚洲精品果冻| 最近最新中文字幕大全电影3| 国产精品久久久久久久电影| 国国产精品蜜臀av免费| 建设人人有责人人尽责人人享有的 | 精品酒店卫生间| 五月伊人婷婷丁香| 好男人视频免费观看在线| 直男gayav资源| 人妻制服诱惑在线中文字幕| 国产精品av视频在线免费观看| 性插视频无遮挡在线免费观看| 99热这里只有精品一区| 亚洲国产高清在线一区二区三| 欧美3d第一页| 别揉我奶头 嗯啊视频| 人人妻人人澡人人爽人人夜夜 | 爱豆传媒免费全集在线观看| 毛片女人毛片| 国产成人午夜福利电影在线观看| 亚洲成人精品中文字幕电影| 一个人免费在线观看电影| 又爽又黄无遮挡网站| 国产在线男女| 日本午夜av视频| 国产高清有码在线观看视频| 中文在线观看免费www的网站| 美女脱内裤让男人舔精品视频| 日日撸夜夜添| 男插女下体视频免费在线播放| 青青草视频在线视频观看| 久久精品国产亚洲网站| 麻豆成人av视频| av播播在线观看一区| 日本免费a在线| 嘟嘟电影网在线观看| 日本熟妇午夜| 久久这里只有精品中国| 国产精品嫩草影院av在线观看| 欧美一级a爱片免费观看看| 国内精品美女久久久久久| 欧美精品国产亚洲| 韩国av在线不卡| 欧美日韩国产亚洲二区| 亚洲综合色惰| 欧美xxxx性猛交bbbb| 午夜免费男女啪啪视频观看| 国产不卡一卡二| 六月丁香七月| 国产精品电影一区二区三区| 国产 一区精品| 两个人视频免费观看高清| 内地一区二区视频在线| 九九在线视频观看精品| 久久久久久大精品| 欧美高清性xxxxhd video| 亚洲成人av在线免费| 黑人高潮一二区| 国产片特级美女逼逼视频| 午夜视频国产福利| 美女大奶头视频| 91久久精品国产一区二区成人| 国产精品永久免费网站| 精品人妻偷拍中文字幕| 免费观看性生交大片5| 欧美高清性xxxxhd video| 精品不卡国产一区二区三区| 91久久精品国产一区二区三区| 久久精品久久久久久久性| 伊人久久精品亚洲午夜| 精品久久久久久电影网 | 日韩一本色道免费dvd| 青春草亚洲视频在线观看| 极品教师在线视频| 亚洲欧美精品自产自拍| 国产精品三级大全| 午夜精品国产一区二区电影 | 久久精品国产鲁丝片午夜精品| av.在线天堂| 精品久久久久久久久av| 国产乱来视频区| 国产探花极品一区二区| 国产欧美另类精品又又久久亚洲欧美| 三级毛片av免费| 伦精品一区二区三区| 国产不卡一卡二| 亚洲精品国产av成人精品| 免费观看精品视频网站| 欧美日韩精品成人综合77777| 嫩草影院入口| 午夜免费男女啪啪视频观看| 国产精品久久久久久精品电影| 国产老妇伦熟女老妇高清| 国产精品人妻久久久久久| 免费观看a级毛片全部| 好男人视频免费观看在线| 日韩视频在线欧美| 少妇被粗大猛烈的视频| 国产成人aa在线观看| 国产伦一二天堂av在线观看| av免费在线看不卡| 国产美女午夜福利| www.av在线官网国产| 美女黄网站色视频| 狂野欧美白嫩少妇大欣赏| 熟妇人妻久久中文字幕3abv| 国产成年人精品一区二区| 国产麻豆成人av免费视频| 久久精品国产亚洲av涩爱| 菩萨蛮人人尽说江南好唐韦庄 | 亚洲成人av在线免费| 少妇的逼好多水| 桃色一区二区三区在线观看| 亚洲第一区二区三区不卡| 欧美一区二区国产精品久久精品| 国产精品永久免费网站| 只有这里有精品99| 国产亚洲av嫩草精品影院| 中文字幕av在线有码专区| 日本色播在线视频| 成人性生交大片免费视频hd| 国产精品一区二区在线观看99 | 偷拍熟女少妇极品色| 成年av动漫网址| 日本黄大片高清| 成人漫画全彩无遮挡| 别揉我奶头 嗯啊视频| 国产高潮美女av| 日本免费a在线| 国产亚洲av片在线观看秒播厂 | 一个人看的www免费观看视频| 天天躁夜夜躁狠狠久久av| 久久人妻av系列| 日韩欧美 国产精品| 亚洲精品乱久久久久久| 男人和女人高潮做爰伦理| 真实男女啪啪啪动态图| 日韩,欧美,国产一区二区三区 | 久久久亚洲精品成人影院| 亚洲欧洲国产日韩| 欧美性猛交黑人性爽| 少妇猛男粗大的猛烈进出视频 | 爱豆传媒免费全集在线观看| 日韩亚洲欧美综合| 人人妻人人澡人人爽人人夜夜 | 一区二区三区四区激情视频| 午夜视频国产福利| 黑人高潮一二区| 久久99热6这里只有精品| 国产老妇女一区| 狂野欧美激情性xxxx在线观看| 99久久人妻综合| 天天躁夜夜躁狠狠久久av| 99久久无色码亚洲精品果冻| 精品久久久久久久人妻蜜臀av| 精品久久久久久久久亚洲| 成人无遮挡网站| 少妇的逼水好多| 亚洲美女视频黄频| 国产精品伦人一区二区| 最近中文字幕2019免费版| 噜噜噜噜噜久久久久久91| 日本三级黄在线观看| 22中文网久久字幕| 亚洲综合精品二区| 亚洲无线观看免费| 亚洲国产欧美人成| 国产日韩欧美在线精品| 天堂影院成人在线观看| 男人舔奶头视频| 一区二区三区免费毛片| 亚洲最大成人中文| 国产成人精品婷婷| 尤物成人国产欧美一区二区三区| 亚洲真实伦在线观看| 性色avwww在线观看| 欧美日韩国产亚洲二区| 欧美一区二区国产精品久久精品| 天堂网av新在线| 免费观看a级毛片全部| 亚洲国产色片| 成年女人看的毛片在线观看| 99久久无色码亚洲精品果冻| 国产探花极品一区二区| 一级毛片电影观看 | 中文欧美无线码| 大香蕉97超碰在线| 黄色配什么色好看| 青青草视频在线视频观看| 成人综合一区亚洲| 亚洲欧美成人综合另类久久久 | 精品国产三级普通话版| 麻豆av噜噜一区二区三区| 日本免费在线观看一区| 精品久久久久久久末码| 亚洲国产日韩欧美精品在线观看| 有码 亚洲区| 国产av一区在线观看免费| 亚洲乱码一区二区免费版| 午夜精品在线福利| 精品不卡国产一区二区三区| 一个人观看的视频www高清免费观看| 中文字幕av在线有码专区| 国产精品,欧美在线| 超碰97精品在线观看| 1000部很黄的大片| 春色校园在线视频观看| www.av在线官网国产| 国产视频首页在线观看| 日韩视频在线欧美| 亚洲精品色激情综合| 精品99又大又爽又粗少妇毛片| 国产精品久久视频播放| 亚洲欧美日韩高清专用| 人体艺术视频欧美日本| 国产成人a∨麻豆精品| 亚洲成av人片在线播放无| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 少妇的逼好多水| 亚洲国产精品久久男人天堂| 91av网一区二区| 久99久视频精品免费| 亚洲伊人久久精品综合 | 免费av不卡在线播放| 国产一区二区在线观看日韩| 亚洲成人久久爱视频| 亚洲中文字幕日韩| 日韩高清综合在线| 黄色日韩在线| 精品免费久久久久久久清纯| 亚洲性久久影院| 99热网站在线观看| 亚洲国产精品国产精品| 免费播放大片免费观看视频在线观看 | 在线播放国产精品三级| 国产 一区精品| 三级毛片av免费| 免费观看在线日韩| 一级毛片我不卡| 少妇熟女aⅴ在线视频| 色综合站精品国产| 国产精品野战在线观看| 亚洲av成人av| 亚洲在线观看片| 菩萨蛮人人尽说江南好唐韦庄 | 日韩av在线免费看完整版不卡| 春色校园在线视频观看| 中文亚洲av片在线观看爽| 女人十人毛片免费观看3o分钟| 亚洲国产日韩欧美精品在线观看| 亚洲最大成人av| 夜夜爽夜夜爽视频| 亚洲av福利一区| 国产精品永久免费网站| 日本wwww免费看| 久久久国产成人精品二区| 日韩人妻高清精品专区| 精品人妻熟女av久视频| 91久久精品电影网| 男人的好看免费观看在线视频| 国语自产精品视频在线第100页| 综合色丁香网| 不卡视频在线观看欧美| 免费观看性生交大片5| 欧美日本视频| av在线天堂中文字幕| 国产欧美日韩精品一区二区| 亚洲欧洲日产国产| 波多野结衣巨乳人妻| 国产国拍精品亚洲av在线观看| 国产在线一区二区三区精 | 国产精品国产三级国产专区5o | 18禁动态无遮挡网站| 中文欧美无线码| 少妇熟女欧美另类| 国产亚洲5aaaaa淫片| 最近的中文字幕免费完整| 日本黄大片高清| 国产在视频线精品| 亚洲丝袜综合中文字幕| 麻豆国产97在线/欧美| 亚洲在线自拍视频| 亚洲国产欧美在线一区| 成人美女网站在线观看视频| 亚洲av成人av| 亚洲丝袜综合中文字幕| 国产精品日韩av在线免费观看| 国产色婷婷99| 有码 亚洲区| 啦啦啦观看免费观看视频高清| 亚州av有码| 尤物成人国产欧美一区二区三区| 99久久中文字幕三级久久日本| 色尼玛亚洲综合影院| 五月伊人婷婷丁香| 亚洲人成网站在线播| 日本午夜av视频| 超碰97精品在线观看| 久久99蜜桃精品久久| 精品无人区乱码1区二区| 日韩一本色道免费dvd| 精品人妻熟女av久视频| 久久欧美精品欧美久久欧美| 三级国产精品片| 男人舔奶头视频| 久久精品夜色国产| 人人妻人人澡欧美一区二区| 国产单亲对白刺激| 黄片wwwwww| 国产精品国产三级国产专区5o | 亚洲国产精品久久男人天堂| 久久久久久伊人网av| 亚洲精品一区蜜桃| 国产精品国产三级国产av玫瑰| 中文在线观看免费www的网站| 久久久久久伊人网av| 国产av一区在线观看免费| 亚洲伊人久久精品综合 | 日本色播在线视频| 一卡2卡三卡四卡精品乱码亚洲| 黄片wwwwww| 中文字幕免费在线视频6| 在线观看一区二区三区| 国产精品永久免费网站| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 蜜桃久久精品国产亚洲av| 久久精品久久久久久噜噜老黄 | 亚洲熟妇中文字幕五十中出| 可以在线观看毛片的网站| 长腿黑丝高跟| 欧美变态另类bdsm刘玥| 久久综合国产亚洲精品| 大香蕉久久网| 最后的刺客免费高清国语| 人体艺术视频欧美日本| 亚洲欧美日韩高清专用| 日韩av在线免费看完整版不卡| 少妇人妻精品综合一区二区| 只有这里有精品99| 老司机福利观看| 看非洲黑人一级黄片| 中文字幕免费在线视频6| 亚洲av成人精品一二三区| 国产精品永久免费网站| 日韩三级伦理在线观看| 免费一级毛片在线播放高清视频| 国产视频首页在线观看| 久久精品国产亚洲av涩爱| 两个人视频免费观看高清| 国产精品.久久久| 性插视频无遮挡在线免费观看| 国产高清不卡午夜福利| 禁无遮挡网站| 国产精品乱码一区二三区的特点| 国产国拍精品亚洲av在线观看| 又粗又硬又长又爽又黄的视频| 免费搜索国产男女视频| 美女被艹到高潮喷水动态| 少妇丰满av| 国产精品一区www在线观看| 亚洲欧美成人精品一区二区| 国产成人91sexporn| 人妻系列 视频| 国产精品1区2区在线观看.| 最近视频中文字幕2019在线8| 一级爰片在线观看| 国产午夜精品久久久久久一区二区三区| 男女视频在线观看网站免费| 成人一区二区视频在线观看| 亚洲欧洲国产日韩| 久久精品夜色国产| 日本黄色视频三级网站网址| 亚洲av熟女| 亚洲人成网站在线观看播放| 久久久成人免费电影| 国产视频内射| 1000部很黄的大片| 天天躁日日操中文字幕| 中国美白少妇内射xxxbb| 久久精品影院6| 国产av一区在线观看免费| av国产免费在线观看| 日韩 亚洲 欧美在线| 亚洲真实伦在线观看| 如何舔出高潮| 国产精品,欧美在线| 99热精品在线国产| 国产精品女同一区二区软件| 欧美不卡视频在线免费观看| 亚洲综合精品二区| 男女啪啪激烈高潮av片| 91精品国产九色| 亚洲欧洲国产日韩| 夜夜爽夜夜爽视频| 偷拍熟女少妇极品色| 女人久久www免费人成看片 | 国产老妇女一区| 在现免费观看毛片| 久久久午夜欧美精品| 蜜桃亚洲精品一区二区三区| 日本wwww免费看| 欧美一级a爱片免费观看看| 综合色av麻豆| 寂寞人妻少妇视频99o| 国产免费视频播放在线视频 | 国产私拍福利视频在线观看| 国产激情偷乱视频一区二区| 91在线精品国自产拍蜜月| 在线观看66精品国产| 日本欧美国产在线视频| 亚洲精品久久久久久婷婷小说 | 久久久午夜欧美精品| 女的被弄到高潮叫床怎么办| 日韩大片免费观看网站 | 日韩制服骚丝袜av| 青春草视频在线免费观看| 国产高清国产精品国产三级 | 一级毛片我不卡| 人妻夜夜爽99麻豆av| 麻豆精品久久久久久蜜桃| 少妇被粗大猛烈的视频| 成人美女网站在线观看视频| 成人漫画全彩无遮挡| 白带黄色成豆腐渣| 1024手机看黄色片| 黄片无遮挡物在线观看| 欧美成人午夜免费资源| 麻豆国产97在线/欧美| 国产免费男女视频| 春色校园在线视频观看| 亚洲真实伦在线观看| 亚洲不卡免费看| 国产高清视频在线观看网站| 国产伦一二天堂av在线观看| 插阴视频在线观看视频| 久久久午夜欧美精品| 亚洲人成网站在线播| 亚洲av福利一区| 色5月婷婷丁香| 嫩草影院入口| 22中文网久久字幕| 久久久久久久国产电影| 国产精品一区二区三区四区久久| 日韩成人伦理影院| videossex国产| 日韩人妻高清精品专区| 精品99又大又爽又粗少妇毛片| 精品午夜福利在线看| 欧美高清成人免费视频www| 国产免费视频播放在线视频 | 国产一区二区在线av高清观看| 国产探花极品一区二区| 99久国产av精品国产电影| 日产精品乱码卡一卡2卡三| 91在线精品国自产拍蜜月| 欧美三级亚洲精品| 麻豆乱淫一区二区| 日本wwww免费看| 国产激情偷乱视频一区二区| 色播亚洲综合网| 国产精品一区二区性色av| 欧美3d第一页| 亚洲av免费在线观看| 中文资源天堂在线| 性色avwww在线观看| 午夜福利在线在线| 精品人妻一区二区三区麻豆| 激情 狠狠 欧美| 久久久久久久久久久免费av| 午夜爱爱视频在线播放| 日韩精品有码人妻一区| 免费人成在线观看视频色| 国产高清有码在线观看视频| 午夜福利网站1000一区二区三区| 一级av片app| 亚州av有码| 伦精品一区二区三区| 日本一二三区视频观看| 免费看a级黄色片| videos熟女内射| 国产精品爽爽va在线观看网站| 国产精品一区二区在线观看99 | 欧美另类亚洲清纯唯美| 又粗又硬又长又爽又黄的视频| 一个人看视频在线观看www免费| 久久国内精品自在自线图片| 成人三级黄色视频| 十八禁国产超污无遮挡网站| 国产精品女同一区二区软件| 国产午夜福利久久久久久| 啦啦啦啦在线视频资源| 亚洲av不卡在线观看| 久久这里只有精品中国| 看黄色毛片网站| 天天躁日日操中文字幕| 神马国产精品三级电影在线观看| 天堂影院成人在线观看| 久久综合国产亚洲精品| 国产极品精品免费视频能看的| 国产69精品久久久久777片| 免费电影在线观看免费观看| 中文资源天堂在线| 国产亚洲精品久久久com| 国产 一区精品| 亚洲三级黄色毛片| 久久6这里有精品| 日本免费一区二区三区高清不卡| 精品久久久久久成人av| 久久久精品94久久精品| 精品不卡国产一区二区三区| 国产69精品久久久久777片| 五月玫瑰六月丁香| 国产精品一区二区三区四区免费观看| 国产淫片久久久久久久久| 免费播放大片免费观看视频在线观看 | 精品国产露脸久久av麻豆 | 国产在视频线在精品| 深爱激情五月婷婷| 日本-黄色视频高清免费观看| 亚洲精品456在线播放app| 99在线人妻在线中文字幕| 网址你懂的国产日韩在线| 99热6这里只有精品| 丰满人妻一区二区三区视频av| 国产探花极品一区二区| 人妻少妇偷人精品九色| 精品一区二区免费观看| 久久亚洲国产成人精品v| 99久国产av精品国产电影| 黄片wwwwww| 午夜视频国产福利| 插阴视频在线观看视频| 日本午夜av视频| 波多野结衣巨乳人妻| 插阴视频在线观看视频| 97人妻精品一区二区三区麻豆| 国产欧美日韩精品一区二区| 国模一区二区三区四区视频| 国产一区二区三区av在线| 联通29元200g的流量卡| 嫩草影院入口| 久久99蜜桃精品久久| 国产淫语在线视频| 好男人视频免费观看在线| 黄片无遮挡物在线观看| 国产精品电影一区二区三区| 一边摸一边抽搐一进一小说| 成人三级黄色视频| 国产在线男女| 午夜福利视频1000在线观看| av免费观看日本| 久久久欧美国产精品| 99久久精品国产国产毛片| 久久精品久久久久久噜噜老黄 | 好男人视频免费观看在线| av播播在线观看一区| 国产精品电影一区二区三区| 一边摸一边抽搐一进一小说| 亚洲精品日韩av片在线观看| 午夜视频国产福利| 毛片女人毛片| 国产精品av视频在线免费观看| 欧美日韩国产亚洲二区|