• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    在線社交網(wǎng)絡(luò)個(gè)體影響力算法測(cè)試與性能評(píng)估

    2018-11-30 05:58:12全擁賈焰張良朱爭(zhēng)周斌方濱興
    通信學(xué)報(bào) 2018年10期
    關(guān)鍵詞:用戶

    全擁,賈焰,張良,朱爭(zhēng),周斌,方濱興

    ?

    在線社交網(wǎng)絡(luò)個(gè)體影響力算法測(cè)試與性能評(píng)估

    全擁1,賈焰1,張良1,朱爭(zhēng)1,周斌1,方濱興2

    (1. 國防科技大學(xué)計(jì)算機(jī)學(xué)院,湖南 長(zhǎng)沙 410073;2. 北京郵電大學(xué)計(jì)算機(jī)學(xué)院,北京 100876)

    社交影響力是驅(qū)動(dòng)信息傳播的關(guān)鍵因素,基于在線社交網(wǎng)絡(luò)數(shù)據(jù),可以對(duì)社交影響力進(jìn)行建模和分析。針對(duì)一種經(jīng)典的個(gè)體影響力計(jì)算方法,介紹了該算法的2種并行化實(shí)現(xiàn),并在真實(shí)大規(guī)模在線社交網(wǎng)絡(luò)數(shù)據(jù)集上進(jìn)行了性能測(cè)試。結(jié)果表明,借助現(xiàn)有的大數(shù)據(jù)處理框架,顯著提高了個(gè)體影響力計(jì)算方法在海量數(shù)據(jù)集中的計(jì)算效率,同時(shí)也給該類算法的研究和優(yōu)化提供了實(shí)證依據(jù)。

    性能測(cè)試;社交影響力;分布式計(jì)算;在線社交網(wǎng)絡(luò)

    1 引言

    隨著Web 2.0技術(shù)的進(jìn)一步完善以及移動(dòng)智能終端的大量使用,在線社交網(wǎng)絡(luò)蓬勃發(fā)展。以新浪微博和Facebook為代表的在線社交網(wǎng)絡(luò)平臺(tái)逐漸成為網(wǎng)絡(luò)應(yīng)用的主流,并改變了人們生活和交流的方式。在線社交網(wǎng)絡(luò)中用戶之間的交互行為,使網(wǎng)絡(luò)世界與現(xiàn)實(shí)世界相互影響,特別是快速傳播擴(kuò)散的網(wǎng)絡(luò)信息能夠迅速形成社會(huì)輿論,對(duì)現(xiàn)實(shí)世界人們的行為產(chǎn)生直接影響[1]。社交影響力是用戶交互行為的內(nèi)在誘因,而交互行為是社交影響力的外在表現(xiàn),從而對(duì)信息的傳播產(chǎn)生直接影響。社交影響力是社會(huì)影響力在線社交網(wǎng)絡(luò)中的自然延伸,而社會(huì)影響力被認(rèn)為是個(gè)人行為能夠直接或間接地影響他人的想法、感情以及行動(dòng)[2]。因此,社交影響力可以通過用戶之間的社交活動(dòng)體現(xiàn)出來,表現(xiàn)為在線社交網(wǎng)絡(luò)中用戶的行為和思想等受他人影響發(fā)生改變的現(xiàn)象[3]。

    影響力分析是在線社交網(wǎng)絡(luò)分析的重要內(nèi)容,在輿情引導(dǎo)與社會(huì)運(yùn)作中起著重要作用,具有廣泛應(yīng)用,例如信息推薦[4]、專家發(fā)現(xiàn)[5]、影響極大化[6]、病毒式營銷[7]等。作為社交影響力分析的主要內(nèi)容,個(gè)體影響力度量一直是學(xué)術(shù)界的研究熱點(diǎn)問題,主要是定量計(jì)算個(gè)體的影響力大小,通過排名技術(shù)發(fā)現(xiàn)在線社交網(wǎng)絡(luò)中的影響力個(gè)體。影響力個(gè)體在不同應(yīng)用中又可被稱為意見領(lǐng)袖[8]、領(lǐng)域?qū)<襕5]等。最初,相關(guān)學(xué)者在社會(huì)網(wǎng)絡(luò)中發(fā)現(xiàn)了人們的影響力存在差異性,即具有廣泛影響力的個(gè)體更容易將自己的觀點(diǎn)傳達(dá)給其他人。同樣,在線社交網(wǎng)絡(luò)中的影響力用戶發(fā)布或評(píng)論的信息,更容易引發(fā)大量用戶的轉(zhuǎn)發(fā)和閱讀,如新浪微博中的大V用戶。因此,在線社交網(wǎng)絡(luò)中的影響力個(gè)體在創(chuàng)新采用、網(wǎng)絡(luò)群體聚集、信息傳播與導(dǎo)向等方面發(fā)揮著重要作用。但是,由于理論模型和實(shí)驗(yàn)方法的限制,早期工作只能從小樣本數(shù)據(jù)集上定性地分析個(gè)體影響力,驗(yàn)證了社會(huì)系統(tǒng)中個(gè)體影響力的存在性。在線社交網(wǎng)絡(luò)提供了豐富可用的實(shí)驗(yàn)數(shù)據(jù),研究者可以對(duì)用戶本身體現(xiàn)出來的影響力進(jìn)行建模和量化計(jì)算[9-11]。

    實(shí)際上,由在線社交網(wǎng)絡(luò)數(shù)據(jù)構(gòu)建的圖結(jié)構(gòu)模型相當(dāng)復(fù)雜,一般包含上億個(gè)用戶節(jié)點(diǎn)、用戶之間關(guān)系構(gòu)成的成百上千億條邊以及他們產(chǎn)生的海量網(wǎng)絡(luò)信息,如截至2017年6月底,新浪微博的活躍用戶數(shù)已達(dá)3.65億。這對(duì)個(gè)體影響力計(jì)算方法提出了新的挑戰(zhàn),難以在如此超大規(guī)模圖上高效度量在線社交網(wǎng)絡(luò)用戶的影響力。但是,不同類別大數(shù)據(jù)處理框架的出現(xiàn)使高效分析上述海量數(shù)據(jù)成為可能。首先,基于采用的小樣本數(shù)據(jù)集或子圖結(jié)構(gòu),對(duì)個(gè)體影響力度量模型進(jìn)行分析和驗(yàn)證。然后,結(jié)合具體的大數(shù)據(jù)處理框架,對(duì)個(gè)體影響力度量模型進(jìn)行并行化實(shí)現(xiàn)。最后,在集群環(huán)境中部署個(gè)體影響力并行化算法,高效地計(jì)算在線社交網(wǎng)絡(luò)用戶的影響力[12-14]。當(dāng)前,Apache基金會(huì)開發(fā)的一種開源的分布式基礎(chǔ)框架Hadoop應(yīng)用比較廣泛,它實(shí)現(xiàn)了一個(gè)用于存儲(chǔ)海量數(shù)據(jù)的分布式文件系統(tǒng)(HDFS)。基于Hadoop平臺(tái),本文選取MapReduce和Spark兩種并行計(jì)算模型來說明大數(shù)據(jù)處理框架對(duì)個(gè)體影響力度量算法的性能影響。針對(duì)真實(shí)的大規(guī)模在線社交網(wǎng)絡(luò)數(shù)據(jù)和不同的大數(shù)據(jù)處理框架下,實(shí)驗(yàn)利用上述并行編程模型分別實(shí)現(xiàn)了一類經(jīng)典的個(gè)體影響力度量算法,并對(duì)不同規(guī)模數(shù)據(jù)集以及不同集群之間的算法性能進(jìn)行了比較。

    2 個(gè)體影響力計(jì)算方法

    在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法主要從網(wǎng)絡(luò)結(jié)構(gòu)、用戶行為、交互信息等方面對(duì)用戶自身表現(xiàn)出的社交影響力進(jìn)行建模分析及量化計(jì)算。一般地,在線社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)可由圖={,}表示,其中,是用戶集合,是用戶之間的關(guān)系構(gòu)成邊的集合。實(shí)際應(yīng)用中,當(dāng)用戶之間的關(guān)系是有向的,那么是有向圖,如轉(zhuǎn)發(fā)關(guān)系;當(dāng)用戶之間的關(guān)系是無向的,那么是無向圖,如好友關(guān)系。也可以是帶權(quán)圖,表示用戶和用戶之間形成邊的權(quán)重,如轉(zhuǎn)發(fā)頻率和好友親密度等。早期的個(gè)體影響力計(jì)算方法主要在拓?fù)浣Y(jié)構(gòu)圖中利用復(fù)雜網(wǎng)絡(luò)的相關(guān)概念來定量計(jì)算在線社交網(wǎng)絡(luò)中用戶的影響力,如圖中節(jié)點(diǎn)的出度與入度、度中心度[15]、接近中心度[16]、介數(shù)中心度[17]、?殼[18]等。這些方法表達(dá)的意義比較直觀,被廣泛應(yīng)用于在線社交網(wǎng)絡(luò)中用戶影響力的分析。例如,節(jié)點(diǎn)的出度與入度直接衡量了用戶對(duì)其鄰居用戶的影響力;度中心度衡量了用戶對(duì)其鄰居用戶的平均影響力;接近中心度衡量用戶對(duì)其他用戶的間接影響力;介數(shù)中心度和?殼都衡量了用戶在信息傳播擴(kuò)散過程中的影響力。但是這類基于網(wǎng)絡(luò)結(jié)構(gòu)的方法也有其局限性,沒有充分考慮用戶自身行為或用戶之間的交互信息等數(shù)據(jù),導(dǎo)致最終計(jì)算的用戶影響力結(jié)果不夠精確。

    為了準(zhǔn)確度量在線社交網(wǎng)絡(luò)中用戶的社交影響力,相關(guān)學(xué)者借鑒了經(jīng)典的網(wǎng)頁排名模型PageRank算法[19],通過融合用戶屬性和網(wǎng)絡(luò)信息等因素,設(shè)計(jì)了多種個(gè)體影響力度量算法。PageRank算法最初被應(yīng)用于Google的搜索引擎中,是一種基于反向鏈接和正向鏈接分析的網(wǎng)頁排名算法。該算法利用一種基于馬爾可夫的隨機(jī)游走思想來模擬用戶瀏覽網(wǎng)頁的行為,并認(rèn)為一個(gè)網(wǎng)頁的重要性由所有鏈向它網(wǎng)頁的重要性決定。假設(shè)={,}是由互聯(lián)網(wǎng)中所有的網(wǎng)頁及其鏈接關(guān)系構(gòu)成的圖結(jié)構(gòu),為網(wǎng)頁得分組成的向量,是由鏈接關(guān)系產(chǎn)生的轉(zhuǎn)移概率矩陣,則PageRank算法可用矩陣乘積的形式為

    =MT+(1)

    其中,為正則化因子,是修正項(xiàng)。最初的PageRank算法沒有修正項(xiàng),是T的特征向量,網(wǎng)頁排名的過程等同于求解主特征向量的過程。不難看出,式(1)是一個(gè)迭代算法,其時(shí)間復(fù)雜度為(||2)。在實(shí)際應(yīng)用中,為了保證算法的收斂性,可令=,是元素全為1的向量,是調(diào)節(jié)因子。

    3 算法并行化實(shí)現(xiàn)

    大數(shù)據(jù)處理框架為處理和分析在線社交網(wǎng)絡(luò)大規(guī)模數(shù)據(jù)提供了技術(shù)支持,研究人員可以將已有的在線社交網(wǎng)絡(luò)個(gè)體影響力算法與具體的大數(shù)據(jù)并行計(jì)算框架相結(jié)合,用于分析用戶的影響力??梢钥闯?,上述PageRank算法及其改進(jìn)算法的時(shí)間復(fù)雜度依然是(||2)。針對(duì)在線社交網(wǎng)絡(luò)用戶及其關(guān)系構(gòu)成的海量數(shù)據(jù)時(shí),傳統(tǒng)的單機(jī)串行算法使內(nèi)存、CPU、I/O 等硬件資源無法滿足需要。通過MapReduce 和Spark兩種并行計(jì)算框架對(duì)改進(jìn)的PageRank 算法實(shí)現(xiàn)并行化編程,提高算法的執(zhí)行效率。

    3.1 基于MapReduce并行框架

    MapReduce是由Google公司提出的一種面向大規(guī)模數(shù)據(jù)處理的并行計(jì)算框架。它被分為map處理階段和reduce處理階段,并且每個(gè)階段的輸入和輸出都可以自定義數(shù)據(jù)類型的鍵值對(duì)格式。實(shí)際應(yīng)用中,開發(fā)人員需要指定map函數(shù)和reduce函數(shù)來實(shí)現(xiàn)相應(yīng)算法的不同功能,而不需要關(guān)注分布式底層實(shí)現(xiàn)機(jī)制。MapReduce程序執(zhí)行時(shí),每個(gè)map操作都是并行運(yùn)行且相互獨(dú)立的,但可能會(huì)受到數(shù)據(jù)源和CPU等硬件資源的影響。同樣地,多個(gè)reduce操作執(zhí)行時(shí),所有具有相同鍵值的map輸出會(huì)聚集到同一個(gè)reduce中。在執(zhí)行map操作之前,大數(shù)據(jù)將會(huì)被分割成若干小數(shù)據(jù)塊,通過map函數(shù)處理完后會(huì)產(chǎn)生一系列鍵值對(duì)。這些鍵值對(duì)按鍵值進(jìn)行排序和合并,接著把整理好的數(shù)據(jù)輸入到多個(gè)reduce中,每個(gè)reduce操作對(duì)已經(jīng)排好序的并且?guī)в邢嗤I值的輸入數(shù)據(jù)進(jìn)行迭代計(jì)算,最后把結(jié)果輸出到HDFS中。MapReduce并行框架的另一個(gè)特點(diǎn)是并行處理時(shí)可以提供部分容錯(cuò)和出錯(cuò)恢復(fù)的功能,如當(dāng)一個(gè)map操作或reduce操作失效時(shí),作業(yè)會(huì)被重新安排,從而保證作業(yè)連續(xù)執(zhí)行。

    本文基于MapReduce計(jì)算框架對(duì)式(1)實(shí)現(xiàn)了并行化編程,主要是重寫map函數(shù)和reduce函數(shù),偽代碼如算法1所示。顯然,該并行算法是迭代算法,當(dāng)不滿足迭代終止條件時(shí),算法每一次的迭代操作都相同:map操作負(fù)責(zé)將每個(gè)用戶的影響力按權(quán)重比傳播給其他相關(guān)用戶,而reduce操作負(fù)責(zé)搜集各影響力分量并根據(jù)式(1)更新當(dāng)前用戶的影響力值。

    算法1 基于MapReduce的個(gè)體影響力度量算法

    輸入 帶權(quán)重的在線社交網(wǎng)絡(luò)結(jié)構(gòu)圖= {,,},正則化因子

    輸出 在線社交網(wǎng)絡(luò)用戶的社交影響力值

    1) 計(jì)算轉(zhuǎn)移概率矩陣= {m};

    3) repeat:

    4) map:

    5) for each?do

    6) for each(,)?do

    7) 計(jì)算影響力傳播分量P?=m′();

    8) end

    9) end

    10) reduce:

    11) for each?do

    12)() = 0;

    13) for each (,)?do

    14) 影響力分量線性加權(quán)'()=()+P?;

    15) end

    17) end

    18) untilconvergence;

    19) for each?do

    20) 輸出已收斂的用戶影響力值();

    21) end

    3.2 基于Spark并行框架

    Spark是由加州大學(xué)伯克利分校AMP實(shí)驗(yàn)室開發(fā)的通用內(nèi)存并行計(jì)算框架。它的主要思想是通過一種新的作業(yè)和數(shù)據(jù)容錯(cuò)方式來減少磁盤和網(wǎng)絡(luò)的I/O,從而提高海量數(shù)據(jù)的處理效率。彈性分布式數(shù)據(jù)集RDD是Spark的核心技術(shù),表示已被分片、不可變地被并行操作的數(shù)據(jù)集合。RDD是對(duì)計(jì)算和數(shù)據(jù)的抽象,擁有方便重建的容錯(cuò)機(jī)制并提供了轉(zhuǎn)換和動(dòng)作兩大類算子。轉(zhuǎn)換算子負(fù)責(zé)將一個(gè)或多個(gè)RDD轉(zhuǎn)換成新的RDD,動(dòng)作算子則根據(jù)生成的RDD產(chǎn)生最終的計(jì)算結(jié)果。Spark應(yīng)用提交后,外部數(shù)據(jù)經(jīng)過一系列轉(zhuǎn)換算子形成RDD;動(dòng)作算子觸發(fā)作業(yè)提交,根據(jù)RDD之間的依賴關(guān)系創(chuàng)建有關(guān)所有操作的有向無環(huán)圖DAG計(jì)算模型;DAGScheduler解析DAG圖并將構(gòu)建不同的Stage,由任務(wù)調(diào)度器將Stage分解的任務(wù)集提交到集群節(jié)點(diǎn)中運(yùn)行。

    基于內(nèi)存計(jì)算的Spark并行框架適用于迭代算法,它的運(yùn)行模式有多種,不同運(yùn)行模式具有相似的運(yùn)行流程,只是資源分配模式和任務(wù)調(diào)度模塊有所不同。本文結(jié)合Spark并行計(jì)算框架并行化實(shí)現(xiàn)了式(1),并在Yarn運(yùn)行模式進(jìn)行測(cè)試,偽代碼如算法2所示。類似于算法1,算法2也是迭代算法,每一次迭代的操作都相同:將在線社交網(wǎng)絡(luò)圖結(jié)構(gòu)等數(shù)據(jù)轉(zhuǎn)化成RDD格式數(shù)據(jù)集,flatmap()算子負(fù)責(zé)擴(kuò)散用戶的影響力,reducebykey()算子累加各影響力分量,map()算子依照式(1)更新當(dāng)前用戶的影響力值。

    算法2 基于Spark的個(gè)體影響力度量算法

    輸入 帶權(quán)重的在線社交網(wǎng)絡(luò)結(jié)構(gòu)圖{,,},正則化因子

    輸出 在線社交網(wǎng)絡(luò)用戶的社交影響力值

    1) 計(jì)算轉(zhuǎn)移概率矩陣= {m};

    3) RDD (,,):= SparkContext (,). SparkOperator;

    4) repeat:

    5) for each?do

    6) for each (,)?do

    7) 計(jì)算影響力傳播分量RDD(,P?): RDD(,,). flatmap(lamda:P?=m′());

    9) end

    10) end

    11) untilconvergence;

    12) for each?do

    13) 輸出已收斂的用戶影響力值();

    14) end

    4 實(shí)驗(yàn)結(jié)果與分析

    為了測(cè)試大數(shù)據(jù)處理框架對(duì)在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法性能的影響,本文通過編程實(shí)現(xiàn)了上述兩種并行算法,并在真實(shí)大規(guī)模數(shù)據(jù)集上對(duì)比分析了算法的相關(guān)性能。

    4.1 實(shí)驗(yàn)數(shù)據(jù)及預(yù)處理

    實(shí)驗(yàn)數(shù)據(jù)集是通過湖南蟻坊軟件股份有限公司的爬蟲系統(tǒng)獲取的,主要利用新浪微博API接口搜集了新浪微博平臺(tái)注冊(cè)用戶在2016年11月2日至2017年6月26日期間產(chǎn)生的真實(shí)博文數(shù)據(jù)。每條博文數(shù)據(jù)是一個(gè)文本記錄,包括5個(gè)字段:時(shí)間戳、用戶ID、博文ID、轉(zhuǎn)發(fā)用戶ID、轉(zhuǎn)發(fā)博文ID。當(dāng)用戶發(fā)布某條原創(chuàng)博文時(shí),該博文數(shù)據(jù)的轉(zhuǎn)發(fā)用戶ID和轉(zhuǎn)發(fā)博文ID字段就都為null。該數(shù)據(jù)集共涉及在線社交網(wǎng)絡(luò)平臺(tái)116 147 966位用戶產(chǎn)生的4 586 584 659條博文,其中,原創(chuàng)博文1 079 801 756條,轉(zhuǎn)發(fā)博文3 506 782 903條,具體統(tǒng)計(jì)信息如表1所示。

    表1 實(shí)驗(yàn)數(shù)據(jù)集統(tǒng)計(jì)信息

    可以看出,不足10%的原創(chuàng)博文被其他用戶轉(zhuǎn)發(fā),且只有約0.2%的原創(chuàng)博文被轉(zhuǎn)發(fā)超過500次,這說明在線社交網(wǎng)絡(luò)中少量用戶產(chǎn)生并控制著大量信息的傳播。圖1展示了上述數(shù)據(jù)集中原創(chuàng)博文被轉(zhuǎn)發(fā)次數(shù)的概率分布。該分布具有明顯的無標(biāo)度特性,符合指數(shù)為2.13的冪律分布,即少量原創(chuàng)博文存在較多的轉(zhuǎn)發(fā)次數(shù)。

    圖1 原創(chuàng)博文轉(zhuǎn)發(fā)次數(shù)概率分布

    個(gè)體影響力度量需要以特定的網(wǎng)絡(luò)結(jié)構(gòu)為基礎(chǔ)進(jìn)行計(jì)算,本文通過提取上述數(shù)據(jù)集中用戶之間的轉(zhuǎn)發(fā)關(guān)系來構(gòu)建帶權(quán)重的在線社交網(wǎng)絡(luò)結(jié)構(gòu)圖。具體操作如下:首先,針對(duì)任何一條博文數(shù)據(jù),抽取用戶ID和轉(zhuǎn)發(fā)用戶ID兩個(gè)字段數(shù)據(jù);然后,刪除其中轉(zhuǎn)發(fā)用戶ID為null的轉(zhuǎn)發(fā)關(guān)系數(shù)據(jù);最后,合并具有相同轉(zhuǎn)發(fā)關(guān)系的數(shù)據(jù),得到具有轉(zhuǎn)發(fā)頻次的三元組轉(zhuǎn)發(fā)關(guān)系數(shù)據(jù)集,即<用戶ID, 轉(zhuǎn)發(fā)用戶ID, 頻次>。為了保護(hù)新浪微博用戶的隱私,需要對(duì)用戶ID進(jìn)行去隱私化處理,最終得到約59 GB的轉(zhuǎn)發(fā)關(guān)系數(shù)據(jù)集。若在數(shù)據(jù)集中存在三元組<,,f>,則表示用戶在樣本數(shù)據(jù)集中轉(zhuǎn)發(fā)用戶的相關(guān)博文共計(jì)f次。數(shù)據(jù)集共包含3 504 379 868個(gè)轉(zhuǎn)發(fā)關(guān)系三元組,涉及115 205 577位用戶,存儲(chǔ)在塊大小為128 MB的HDFS文件系統(tǒng)中。

    基于轉(zhuǎn)發(fā)關(guān)系數(shù)據(jù)集,可以構(gòu)建在線社交網(wǎng)絡(luò)轉(zhuǎn)發(fā)關(guān)系結(jié)構(gòu)圖= {,,}。其中,表示用戶集合,表示用戶之間轉(zhuǎn)發(fā)關(guān)系構(gòu)成的邊集合,代表相應(yīng)的邊權(quán)重矩陣。在本實(shí)驗(yàn)中,|| = 115 205 577,|| = 3 504 379 868。針對(duì)數(shù)據(jù)集中的任意三元組<,,f>,存在(,)?,且w,u=f

    圖2左邊是由用戶轉(zhuǎn)發(fā)關(guān)系三元組數(shù)據(jù)子集構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu)圖示例,節(jié)點(diǎn)代表不同的用戶,邊的方向代表了博文轉(zhuǎn)發(fā)路徑,邊的權(quán)值代表用戶之間的轉(zhuǎn)發(fā)頻次。如用戶2共w1,u2=4次轉(zhuǎn)發(fā)過用戶1的博文。在線社交網(wǎng)絡(luò)用戶的個(gè)體影響力以博文信息為載體,沿著轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)進(jìn)行擴(kuò)散。因此,個(gè)體影響力的擴(kuò)散路徑和概率可以由帶權(quán)重的用戶轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)圖計(jì)算得到,即對(duì)任意的邊(,)?,存在從用戶到用戶影響力擴(kuò)散路徑,且擴(kuò)散概率為

    圖2右邊所示是基于在線社交網(wǎng)絡(luò)用戶轉(zhuǎn)發(fā)關(guān)系網(wǎng)絡(luò)圖計(jì)算影響力擴(kuò)散概率的示例,虛線表示影響力擴(kuò)散路徑,邊上的概率值是對(duì)應(yīng)的影響力擴(kuò)散概率。實(shí)際應(yīng)用中,通過式(2)可以計(jì)算出算法1和算法2中所需的轉(zhuǎn)移概率矩陣。

    4.2 實(shí)驗(yàn)環(huán)境

    本實(shí)驗(yàn)中,算法1和算法2兩種并行算法及對(duì)數(shù)據(jù)的預(yù)處理都是通過Java語言編程實(shí)現(xiàn),使用的開發(fā)工具包是JDK1.8。實(shí)現(xiàn)的并行算法程序運(yùn)行在由騰訊云服務(wù)器搭建的Hadoop分布式集群環(huán)境中,Hadoop版本為2.7.4,Spark版本為1.6.2。該集群共由128個(gè)獨(dú)立的內(nèi)存型M2服務(wù)器節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)的硬件配置如下:8核CPU,64 GB內(nèi)存,500 GB硬盤,1 Mbit/s帶寬,預(yù)裝系統(tǒng)版本為Ubuntu Server 14.04.1 LTS 64位。為了對(duì)比算法在不在規(guī)模集群上的性能,本實(shí)驗(yàn)分別搭建了6種不同規(guī)模的集群環(huán)境,其唯一區(qū)別是具有不同的服務(wù)器節(jié)點(diǎn)數(shù)目,分別是4、8、16、32、64、128。在不同集群環(huán)境中,其中,只有一臺(tái)服務(wù)器作為主節(jié)點(diǎn),其他服務(wù)器均是數(shù)據(jù)節(jié)點(diǎn)或計(jì)算節(jié)點(diǎn)。本文實(shí)現(xiàn)并在單機(jī)環(huán)境下運(yùn)行了在線社交網(wǎng)絡(luò)個(gè)體影響力測(cè)試算法,其使用的機(jī)器也是騰訊云提供的內(nèi)存型M2服務(wù)器。

    圖2 影響力擴(kuò)散示例

    4.3 性能指標(biāo)與測(cè)試參數(shù)

    針對(duì)在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法,本實(shí)驗(yàn)主要從準(zhǔn)確度和運(yùn)行時(shí)間等指標(biāo)對(duì)基于式(1)的并行化算法1和算法2在真實(shí)數(shù)據(jù)上進(jìn)行相關(guān)性能測(cè)試。

    準(zhǔn)確度方面。由于缺少針對(duì)大規(guī)模用戶影響力值計(jì)算的標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集,本實(shí)驗(yàn)主要從算法收斂情況對(duì)準(zhǔn)確度進(jìn)行測(cè)試。式(1)本質(zhì)上是冪迭代算法,因此算法1和算法2在實(shí)際運(yùn)行過程中需要預(yù)先設(shè)置終止條件。當(dāng)程序運(yùn)行達(dá)到終止條件時(shí),算法迭代結(jié)束,實(shí)驗(yàn)將會(huì)記錄此時(shí)的迭代次數(shù)和迭代條件變化情況,具體地給定第次迭代后計(jì)算的用戶影響力值向量,當(dāng)式(3)成立時(shí),程序終止,算法收斂。

    其中,表示實(shí)驗(yàn)數(shù)據(jù)集中的用戶數(shù),誤差限=10?8。||×||1表示向量的1?范數(shù),即向量所有元素的絕對(duì)值之和。當(dāng)= 0時(shí),0表示初始化的用戶影響力值。式(3)認(rèn)為平均每個(gè)用戶的影響力數(shù)值誤差不超過10?8時(shí),計(jì)算結(jié)果趨于穩(wěn)定,算法已收斂。

    運(yùn)行時(shí)間方面。通過設(shè)置不同參數(shù),實(shí)驗(yàn)將記錄算法在不同數(shù)據(jù)集以及不同分布式集群上的運(yùn)行時(shí)間和加速比。基于式(1)的在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法只需設(shè)置一個(gè)參數(shù),它是正則化因子,也稱為跳轉(zhuǎn)因子。在進(jìn)行大規(guī)模網(wǎng)頁排名計(jì)算時(shí),通常取值為0.85,表示上網(wǎng)者按照鏈接瀏覽網(wǎng)頁的概率為0.85,隨機(jī)跳轉(zhuǎn)到一個(gè)新網(wǎng)頁的概率為0.15。在線社交網(wǎng)絡(luò)用戶的轉(zhuǎn)發(fā)行為不同于上網(wǎng)者隨機(jī)點(diǎn)擊頁面的過程,因此本實(shí)驗(yàn)測(cè)試了并行算法在a值分別為0.5、0.7、0.85和0.95時(shí)的性能。

    并行化算法在不同數(shù)據(jù)集上的性能存在差異,為了探究大數(shù)據(jù)處理框架在不同數(shù)據(jù)集上的加速效果,本實(shí)驗(yàn)基于數(shù)據(jù)集劃分了不同規(guī)模的數(shù)據(jù)子集D1、D2、D3、D4、D5,具體描述如表2所示。這些數(shù)據(jù)集涉及的在線社交網(wǎng)絡(luò)用戶規(guī)模從十萬級(jí)至億級(jí)遞增,用戶之間形成的轉(zhuǎn)發(fā)關(guān)系數(shù)也相應(yīng)增加,最多達(dá)到十億級(jí)規(guī)模。

    表2 實(shí)驗(yàn)數(shù)據(jù)集子集描述

    在線社交網(wǎng)絡(luò)密度用于刻畫中節(jié)點(diǎn)間連邊的密集程度,定義為圖= {,,}的鄰接矩陣中非零元素所占比例,在此又稱稠密度。具有相同用戶數(shù)的在線社交網(wǎng)絡(luò)數(shù)據(jù)集,拓?fù)鋱D的稠密度也會(huì)由于用戶之間轉(zhuǎn)發(fā)關(guān)系數(shù)的不同而有所差異。本實(shí)驗(yàn)以數(shù)據(jù)子集D1為樣本,通過隨機(jī)采樣增加或減少節(jié)點(diǎn)間邊的方法構(gòu)造了具有不同稠密度的數(shù)據(jù)子集D1_A、D1_B、D2_A、D2_B、D2_C,如表2所示。通過對(duì)上述數(shù)據(jù)子集進(jìn)行實(shí)驗(yàn),可以探究稠密度對(duì)算法性能的影響。

    4.4 結(jié)果與分析

    本文依照上節(jié)中指標(biāo)要求和參數(shù)設(shè)置,在不同真實(shí)數(shù)據(jù)子集上對(duì)在線社交網(wǎng)絡(luò)個(gè)體影響力并行化算法1和算法2進(jìn)行了相關(guān)性能測(cè)試。由于目前不存在針對(duì)在線社交網(wǎng)絡(luò)用戶影響力計(jì)算的標(biāo)準(zhǔn)測(cè)試數(shù)據(jù),所以從收斂性和計(jì)算效率兩方面對(duì)本實(shí)驗(yàn)結(jié)果進(jìn)行分析,具體實(shí)驗(yàn)結(jié)果及其對(duì)比情況如下所述。

    4.4.1 收斂性分析

    由于算法1和算法2都是基于式(1)的并行化實(shí)現(xiàn),因此在不同的大數(shù)據(jù)處理框架下算法具有相同的收斂情況。本節(jié)將以基于Spark的并行化算法2為例,在不同參數(shù)配置環(huán)境中闡述算法在不同數(shù)據(jù)子集上的收斂性能,基于MapReduce的并行化算法1的情況類似。

    實(shí)驗(yàn)結(jié)果表明,給定值,同一數(shù)據(jù)子集在不同規(guī)模集群上的收斂情況相同,數(shù)據(jù)子集D1、D2、D3、D4、D5第一次滿足收斂條件(=10?8)時(shí),算法的迭代次數(shù)分別是83、84、84、84、85。這是因?yàn)榧阂?guī)模的變化只會(huì)引發(fā)計(jì)算資源的變化,不會(huì)改變算法的運(yùn)行原理。圖3是在16節(jié)點(diǎn)集群下,=0.85時(shí)算法2在不同數(shù)據(jù)子集中的收斂趨勢(shì)變化。在迭代初期,收斂速度較快,隨著程序運(yùn)行,收斂速度逐漸變慢。當(dāng)收斂條件相同時(shí),基于式(1)的在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法的收斂速度與用戶規(guī)模無關(guān)。

    圖3 算法1在不同數(shù)據(jù)子集中的收斂變化情況

    在64節(jié)點(diǎn)集群上,基于不同值的算法2在數(shù)據(jù)子集D4上的收斂變化情況如圖4所示??梢钥闯?,隨著a值的增加,算法2的收斂速度變慢。當(dāng)取值依次為0.5、0.7、0.85時(shí),算法2收斂所需迭代次數(shù)分別是25、44、84。當(dāng)=0.95時(shí),算法2迭代第212次時(shí)的收斂誤差為2.2×10?8,此時(shí)仍未滿足收斂條件。由此可見,在線社交網(wǎng)絡(luò)用戶傾向于轉(zhuǎn)發(fā)好友的博文時(shí),取值偏高,個(gè)體影響力度量算法的收斂速度越慢。在實(shí)際應(yīng)用中,算法應(yīng)根據(jù)具體的在線社交網(wǎng)絡(luò)平臺(tái)用戶行為特征,設(shè)置合理的跳轉(zhuǎn)因子參數(shù)進(jìn)行計(jì)算。

    圖4 算法2在不同a值時(shí)的收斂變化情況

    基于不同稠密度的數(shù)據(jù)子集D1、D1_A、D1_B,在8節(jié)點(diǎn)集群上,圖5展示了算法2在=0.85時(shí)收斂情況。當(dāng)滿足收斂條件(=10?8)時(shí),算法的迭代次數(shù)分別為83、79、70。這說明在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法的收斂速度與用戶之間關(guān)系構(gòu)成的圖稠密度有關(guān),通過構(gòu)建具有不同稠密度的概率轉(zhuǎn)移矩陣,基于式(1)的個(gè)體影響力計(jì)算方法的收斂性能會(huì)有所差異。

    圖5 算法2在不同稠密度數(shù)據(jù)子集中的收斂變化情況

    4.4.2 效率分析

    大數(shù)據(jù)處理框架的特點(diǎn)是可以提高算法處理數(shù)據(jù)的能力,基于大數(shù)據(jù)處理框架的并行化算法在不同參數(shù)配置環(huán)境下具有不同的計(jì)算效率。由于在擁有少量服務(wù)器節(jié)點(diǎn)的集群環(huán)境中,處理大規(guī)模數(shù)據(jù)集所需時(shí)間較長(zhǎng),因此在進(jìn)行效率分析時(shí),算法的終止條件是迭代達(dá)到預(yù)設(shè)次數(shù),而不是收斂誤差小于預(yù)設(shè)閾值。接下來,本文將從多個(gè)角度對(duì)比分析基于Spark和MapReduce框架并行化程序的運(yùn)行效率。

    一般采用加速比衡量并行化程序的性能和效果,它是指同一個(gè)任務(wù)在單處理器系統(tǒng)和并行處理器系統(tǒng)中運(yùn)行消耗時(shí)間的比率。圖6顯示了當(dāng)=0.85時(shí),算法1和算法2在具有不同服務(wù)器節(jié)點(diǎn)數(shù)目集群中的加速比情況,其中,程序在數(shù)據(jù)子集D1、D2、D3、D4、D5中的運(yùn)行迭代次數(shù)分別設(shè)置為50、40、30、20、20??傮w而言,在相同情況下,基于Spark框架的并行化算法的加速比要高于基于MapReduce框架的并行化算法。這是因?yàn)镾park是基于內(nèi)存進(jìn)行的迭代計(jì)算,其帶來的性能提升更大。當(dāng)然,集群中服務(wù)器節(jié)點(diǎn)數(shù)目的增多對(duì)于兩種并行化算法都具有一定的加速作用,且在大規(guī)模數(shù)據(jù)子集上效果更明顯。這是因?yàn)殡S著服務(wù)器節(jié)點(diǎn)數(shù)目增多,可用的計(jì)算資源越多,算法運(yùn)行效率越高;隨著數(shù)據(jù)子集規(guī)模增大,計(jì)算資源利用更充分,帶來的加速效果更明顯。

    但在有些情形下,當(dāng)集群節(jié)點(diǎn)數(shù)目繼續(xù)增多時(shí),并行化算法的加速比反而減小。如圖6(b)所示,算法2在每個(gè)數(shù)據(jù)子集中都有一個(gè)最高加速比,其對(duì)應(yīng)的集群節(jié)點(diǎn)數(shù)目分別是8、32、32、64、64。這些集群節(jié)點(diǎn)數(shù)目又稱為算法在該數(shù)據(jù)子集下加速比曲線的性能拐點(diǎn)。當(dāng)集群中節(jié)點(diǎn)數(shù)目超過其拐點(diǎn)時(shí),由于并行化模型的限制和大數(shù)據(jù)處理框架的特征,算法的加速性能不會(huì)隨著集群節(jié)點(diǎn)的增多而繼續(xù)提高。圖6(a)展示了算法1在數(shù)據(jù)子集D1、D2中的性能拐點(diǎn)分別是8、32,而在其他數(shù)據(jù)子集中并未出現(xiàn)性能拐點(diǎn)。這說明通過增加集群中服務(wù)器節(jié)點(diǎn)數(shù)量,算法1在數(shù)據(jù)子集D3、D4、D5中獲得的加速比會(huì)持續(xù)增大。此外,算法1在數(shù)據(jù)子集D1中的加速比均小于1。由于該數(shù)據(jù)子集規(guī)模小,分布式環(huán)境中服務(wù)器節(jié)點(diǎn)間的通信、子任務(wù)的創(chuàng)建、數(shù)據(jù)塊分發(fā)等消耗的時(shí)間大于算法1相較于串行算法節(jié)省的運(yùn)行時(shí)間。

    圖6 不同規(guī)模集群環(huán)境中算法的加速比

    在128服務(wù)器節(jié)點(diǎn)集群環(huán)境中,當(dāng)收斂條件都滿足式(3)且=10?8、=0.85時(shí),圖7顯示了算法1和算法2在不同規(guī)模數(shù)據(jù)子集中的運(yùn)行時(shí)間。

    圖7 算法在不同規(guī)模數(shù)據(jù)子集中的運(yùn)行時(shí)間

    顯然,隨著數(shù)據(jù)集規(guī)模的增長(zhǎng),算法1和算法2的運(yùn)行時(shí)間都呈現(xiàn)遞增趨勢(shì),且在不同數(shù)據(jù)子集中,算法2的執(zhí)行時(shí)間顯著少于算法1的執(zhí)行時(shí)間。此外,結(jié)合上述分析,當(dāng)性能拐點(diǎn)出現(xiàn)后,兩種并行化算法的運(yùn)行時(shí)間之差逐漸縮小。

    以數(shù)據(jù)子集D3為例,圖8所示是算法1和算法2在不同規(guī)模集群環(huán)境中迭代運(yùn)行30次的單次平均迭代時(shí)間及其方差,此時(shí)= 0.85。可以看出,隨著集群節(jié)點(diǎn)數(shù)目的增多,算法單次迭代所需時(shí)間更少,這與圖6中結(jié)果一致。當(dāng)算法2出現(xiàn)性能拐點(diǎn)(集群節(jié)點(diǎn)數(shù)目32)后,其單次迭代時(shí)間開始增長(zhǎng)。算法1單次迭代時(shí)間的方差要大于算法2,這說明該實(shí)驗(yàn)中Spark并行框架的計(jì)算效率更穩(wěn)定。

    圖8 不同規(guī)模集群環(huán)境中算法迭代一次的時(shí)間

    在具有64節(jié)點(diǎn)服務(wù)器的集群環(huán)境中,圖9展示了當(dāng)取不同值時(shí),兩種并行化算法在數(shù)據(jù)子集D4上迭代計(jì)算20次的單次平均迭代時(shí)間及其方差??梢钥闯?,算法1完成一次迭代計(jì)算所需時(shí)間更長(zhǎng)。當(dāng)=0.95時(shí),算法1和算法2的單次迭代所需時(shí)間最長(zhǎng),而當(dāng)=0.85時(shí),算法1和算法2的單次迭代所需時(shí)間最短。這說明值的選取對(duì)基于式(1)的在線社交網(wǎng)絡(luò)個(gè)體影響力度量算法的計(jì)算效率具有直接影響。

    圖10是在16節(jié)點(diǎn)集群環(huán)境中,算法1和算法2針對(duì)具有相同規(guī)模不同稠密度的數(shù)據(jù)子集D2、D2_A、D2_B、D2_C,迭代運(yùn)行40次的單次平均迭代時(shí)間及其方差,此時(shí),=0.85。不難看出,隨著相同規(guī)模數(shù)據(jù)子集稠密度的增加,算法1和算法2完成單次迭代所需時(shí)間更長(zhǎng),且它們的方差也在變大。這說明在計(jì)算在線社交網(wǎng)絡(luò)用戶的個(gè)體影響力時(shí),不僅用戶數(shù)規(guī)模會(huì)直接影響算法的效率,而且用戶間關(guān)系構(gòu)建的網(wǎng)絡(luò)圖密度也會(huì)影響算法的計(jì)算效率。

    圖9 不同a值時(shí)算法迭代一次的時(shí)間

    圖10 算法在不同稠密度數(shù)據(jù)子集中迭代一次的時(shí)間

    5 結(jié)束語

    本文主要基于一種經(jīng)典的在線社交網(wǎng)絡(luò)個(gè)體影響力算法,結(jié)合MapReduce和Spark兩種并行計(jì)算框架,在真實(shí)大規(guī)模新浪微博數(shù)據(jù)集上進(jìn)行了性能測(cè)試。實(shí)驗(yàn)結(jié)果表明,大數(shù)據(jù)處理框架能夠?qū)υ诰€社交網(wǎng)絡(luò)個(gè)體影響力算法的效率產(chǎn)生顯著影響。MapReduce和Spark由于內(nèi)在并行機(jī)制的差異,導(dǎo)致算法處理大數(shù)據(jù)集時(shí)的性能也會(huì)存在差別。在實(shí)際使用過程中,多種參數(shù)的設(shè)置和實(shí)驗(yàn)數(shù)據(jù)集的特征對(duì)算法的收斂性和計(jì)算效率有直接影響。由于數(shù)據(jù)集規(guī)模的不同,大數(shù)據(jù)處理框架對(duì)算法在集群計(jì)算過程中帶來的加速性能不同。在線社交網(wǎng)絡(luò)用戶之間關(guān)系構(gòu)建的圖結(jié)構(gòu)越稠密,其計(jì)算復(fù)雜度越高,算法迭代次數(shù)和運(yùn)行時(shí)間會(huì)更多。

    本文只對(duì)個(gè)體影響力度量算法進(jìn)行了簡(jiǎn)單的并行化實(shí)現(xiàn),在實(shí)驗(yàn)過程中大數(shù)據(jù)處理框架相關(guān)參數(shù)采用默認(rèn)配置,主要是為了測(cè)試文中算法在大規(guī)模社交網(wǎng)絡(luò)數(shù)據(jù)中的性能,以及對(duì)后續(xù)個(gè)體影響力算法的設(shè)計(jì)和并行化實(shí)現(xiàn)提供實(shí)證參考依據(jù)。因此,進(jìn)一步工作可以通過優(yōu)化大數(shù)據(jù)處理框架的相關(guān)參數(shù)提高在線社交網(wǎng)絡(luò)個(gè)體影響力并行化算法的性能。

    [1] 方濱興, 許進(jìn), 李建華. 在線社交網(wǎng)絡(luò)分析[M]. 北京: 電子工業(yè)出版社, 2014.

    FANG B X, XU J, LI J H. Online social network analysis[M]. Beijing: Publishing House of Electronics Industry, 2014.

    [2] CIALDINI R B. Influence: science and practice[M]. Boston: Allyn and Bacon, 2003.

    [3] 吳信東, 李毅, 李磊. 在線社交網(wǎng)絡(luò)影響力分析[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37(4):735-752.

    WU X D, LI Y, LI L. Influence analysis of online social networks[J]. Chinese Journal of Computers, 2014, 37(4):735-752.

    [4] TING I H, CHANGP S, WANG S L. Understanding microblog users for social recommendation based on social networks analysis[J]. Journal of Universal Computer Science, 2012, 18(4):554-576.

    [5] LI N, GILLET D. Identifying influential scholars in academic social media platforms[C]//The 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining. 2013: 608-614.

    [6] VEGA-OLIVEROS D A, BERTON L, LOPES A D A, et al. Influence maximization based on the least in-fluential spreaders[C]//The 1st International Conference on Social Influence Analysis. 2015: 3-8.

    [7] DINH T N, ZHANG H, NGUYEN D T, et al. Cost-effective viral marketing for time-critical campaigns in large-scale social networks[J]. IEEE/ACM Transactions on Networking, 2014, 22(6):2001-2011.

    [8] KATZ E, LAZARSFELD P. Personal influence: the part played by people in the flow of mass communica-tions[M]. New Jersey: Transaction Publishers, 1966.

    [9] CHA M, HADDADI H, BENEVENUTO F, et al. Measuring user influence in twitter: the million follower fallacy[C]//International Conference on Weblogs and Social Media.2010: 10-17.

    [10] DING Z, JIA Y, ZHOU B, et al. Mining topical influencers based on the multi-relational network in microblogging sites[J]. China Communications, 2013, 10(1):93-104.

    [11] WENG J, LIM E P, JIANG J, et al. TwitterRank: finding topic-sensitive influential twitterers[C]//The third ACM International Conference on Web Search and Data Mining. 2010: 261-270.

    [12] TANG J, SUN J, WANG C,et al. Social influence anal-ysis in large-scale networks[C]//The 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2009: 807-816.

    [13] LIU X, LI M, LI S, et al. IMGPU: GPU-accelerated influence maximization in large-scale social networks[J]. IEEE Transactions on Parallel and distributed Systems, 2014, 25(1):136-145.

    [14] 平宇, 向陽, 張波, 等. 基于MapReduce的并行PageRank算法實(shí)現(xiàn)[J]. 計(jì)算機(jī)工程, 2014, 40(2):31-34.

    PING Y, XIANG Y, ZHANG B, et al. Implementation of parallel PageRank algorithm[J]. Computer Engineering Based on MapReduce, 2014, 40(2):31-34.

    [15] FREEMAN L C. Centrality in social networks conceptual clarification[J]. Social Networks, 1978, 1(3):215-239.

    [16] NEWMAN M E J. A measure of betweenness centrality based on random walks[J]. Social Networks, 2005, 27(1):39-54.

    [17] NEWMAN M E J. The structure and function of complex networks[J]. SIAM Review, 2003, 45(2):167-256.

    [18] KITSAK M, GALLOS L K, HAVLIN S, et al. Identification of influential spreaders in complex networks[J]. Nature Physics, 2010, 6(11): 888-893.

    [19] PAGE L, BRIN S, MOTWANI R, et al. The pagerank citation ranking: bringing order to the web[J]. Stanford Digital Libraries Working Paper, 1998, 9(1):1-14.

    [20] EFRON M. Information search and retrieval in microblogs[J]. Journal of the American Society for Information Science and Technology, 2011, 62(6): 996-1008.

    [21] HAVELIWALA T, KAMVAR A, JEH G. An analytical comparison of approaches to personalizing pagerank[R]. Palo Alto: Stanford University, 2003.

    [22] SONG X, CHI Y, HINO K, et al. Identifying opinion leaders in the blogosphere[C]//The 6th ACM Conference on Information and Knowledge Management. 2007: 971-974.

    Performance analysis and testing of personal influence algorithmin online social networks

    QUAN Yong1, JIA Yan1, ZHANG Liang1, ZHU Zheng1, ZHOU Bin1, FANG Binxing2

    1. College of Computer, National University of Defense Technology, Changsha 410073, China 2. College of Computer, Beijing University of Posts and Telecommunications, Beijing 100876, China

    Social influence is the key factor to drive information propagation in online social networks and can be modeled and analyzed with social networking data. As a kind of classical personal influence algorithm, two parallel implementation versions of a PageRank based method were introduced. Furthermore, extensive experiments were conducted on a large-scale real dataset to test the performance of these parallel methods in a distributed environment. The results demonstrate that the computational efficiency of the personal influence algorithm can be improved significantly in massive data sets by virtue of existing big data processing framework, and provide an empirical reference for the future research and optimization of the algorithm as well.

    performance testing, social influence, distributed computing, online social networks

    TP391

    A

    10.11959/j.issn.1000?436x.2018217

    全擁(1988?),男,湖南常德人,國防科技大學(xué)博士生,主要研究方向?yàn)樵诰€社交網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘。

    賈焰(1960?),女,四川成都人,博士,國防科技大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)閿?shù)據(jù)挖掘、大數(shù)據(jù)分析、信息安全等。

    張良(1989?),男,江西九江人,國防科技大學(xué)博士生,主要研究方向?yàn)樵诰€社交網(wǎng)絡(luò)分析、數(shù)據(jù)挖掘。

    朱爭(zhēng)(1993?),男,四川攀枝花人,國防科技大學(xué)碩士生,主要研究方向?yàn)樾畔踩?/p>

    周斌(1971?),男,江西吉安人,博士,國防科技大學(xué)研究員、博士生導(dǎo)師,主要研究方向?yàn)閿?shù)據(jù)挖掘、信息安全。

    方濱興(1960?),男,江西上饒人,博士,中國工程院院士,北京郵電大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)、信息安全、并行計(jì)算等。

    2017?11?21;

    2018?08?22

    全擁,qy8801@nudt.edu.cn

    國家重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2017YFB0803303);國家自然科學(xué)基金資助項(xiàng)目(No.61502517);湖南省重點(diǎn)研發(fā)計(jì)劃資助項(xiàng)目(No.2018GK2056)

    The National Key Research and Development Program of China (No.2017YFB0803303),The National Natural Science Foundation of China (No.61502517), The Key Research and Development Project of Hunan Province (No.2018GK2056)

    猜你喜歡
    用戶
    雅閣國內(nèi)用戶交付突破300萬輛
    車主之友(2022年4期)2022-08-27 00:58:26
    您撥打的用戶已戀愛,請(qǐng)稍后再哭
    關(guān)注用戶
    商用汽車(2016年11期)2016-12-19 01:20:16
    關(guān)注用戶
    商用汽車(2016年5期)2016-11-28 09:55:15
    兩新黨建新媒體用戶與全網(wǎng)新媒體用戶之間有何差別
    關(guān)注用戶
    商用汽車(2016年6期)2016-06-29 09:18:54
    關(guān)注用戶
    商用汽車(2016年4期)2016-05-09 01:23:12
    挖掘用戶需求尖端科技應(yīng)用
    Camera360:拍出5億用戶
    100萬用戶
    日韩 欧美 亚洲 中文字幕| 欧美性长视频在线观看| 91麻豆av在线| 99热6这里只有精品| 满18在线观看网站| 亚洲精品国产精品久久久不卡| 久久中文看片网| 久久久久久免费高清国产稀缺| 国产精品98久久久久久宅男小说| 精品福利观看| 国产精品乱码一区二三区的特点| 不卡av一区二区三区| 超碰成人久久| 久久久久国产精品人妻aⅴ院| 91在线观看av| 精品久久久久久久久久免费视频| 男女那种视频在线观看| 亚洲欧洲精品一区二区精品久久久| 国产视频内射| 久久久国产成人精品二区| 99热6这里只有精品| 成人三级做爰电影| 在线av久久热| 国产精品 欧美亚洲| 九色国产91popny在线| 怎么达到女性高潮| 国产1区2区3区精品| 日日摸夜夜添夜夜添小说| 精品久久久久久久人妻蜜臀av| 人人妻人人看人人澡| 国产成+人综合+亚洲专区| 一本综合久久免费| 国产伦在线观看视频一区| 日韩国内少妇激情av| 国产精品99久久99久久久不卡| 在线十欧美十亚洲十日本专区| 日韩国内少妇激情av| 国产免费男女视频| 精品高清国产在线一区| 国产99久久九九免费精品| 国内精品久久久久精免费| 99精品在免费线老司机午夜| 一级毛片女人18水好多| 日韩大尺度精品在线看网址| 欧美最黄视频在线播放免费| 可以在线观看毛片的网站| 麻豆一二三区av精品| 男男h啪啪无遮挡| 精品久久久久久久人妻蜜臀av| 一区二区三区国产精品乱码| 韩国av一区二区三区四区| 一本综合久久免费| 熟妇人妻久久中文字幕3abv| 欧美激情久久久久久爽电影| 国产精品乱码一区二三区的特点| 少妇熟女aⅴ在线视频| 亚洲最大成人中文| 在线国产一区二区在线| 国产成+人综合+亚洲专区| 天天一区二区日本电影三级| 一本综合久久免费| www日本在线高清视频| 成人国产综合亚洲| 久久香蕉精品热| 日本黄色视频三级网站网址| 精品国产超薄肉色丝袜足j| 亚洲精品一卡2卡三卡4卡5卡| 国产伦在线观看视频一区| 白带黄色成豆腐渣| 一边摸一边做爽爽视频免费| 亚洲中文字幕日韩| 国产爱豆传媒在线观看 | 国产欧美日韩一区二区精品| 后天国语完整版免费观看| 国产日本99.免费观看| 欧美丝袜亚洲另类 | 看黄色毛片网站| 黑人操中国人逼视频| 手机成人av网站| 欧美 亚洲 国产 日韩一| 天天一区二区日本电影三级| 亚洲人成网站在线播放欧美日韩| 12—13女人毛片做爰片一| 久久久久久九九精品二区国产 | 亚洲专区中文字幕在线| 国产亚洲精品第一综合不卡| 搡老岳熟女国产| 香蕉av资源在线| 亚洲国产欧洲综合997久久, | 欧美大码av| 91老司机精品| 9191精品国产免费久久| 天天一区二区日本电影三级| 一二三四在线观看免费中文在| 不卡一级毛片| 国产男靠女视频免费网站| 久久精品国产清高在天天线| 久久香蕉国产精品| 免费看美女性在线毛片视频| 午夜免费激情av| 国产麻豆成人av免费视频| 亚洲第一欧美日韩一区二区三区| 欧美成人午夜精品| 777久久人妻少妇嫩草av网站| 一区二区三区激情视频| 日韩欧美 国产精品| 搡老岳熟女国产| 在线免费观看的www视频| av在线天堂中文字幕| 欧美日韩亚洲综合一区二区三区_| 日本a在线网址| 亚洲精品久久国产高清桃花| 精品无人区乱码1区二区| 国产成人啪精品午夜网站| 麻豆一二三区av精品| 色老头精品视频在线观看| 自线自在国产av| 一区福利在线观看| 亚洲av成人av| 狠狠狠狠99中文字幕| 1024视频免费在线观看| 99热6这里只有精品| 高清在线国产一区| 免费一级毛片在线播放高清视频| www日本在线高清视频| 亚洲一区二区三区色噜噜| 亚洲国产毛片av蜜桃av| 欧美午夜高清在线| 色综合站精品国产| 亚洲av熟女| 日本一区二区免费在线视频| 成年女人毛片免费观看观看9| 欧美久久黑人一区二区| 亚洲最大成人中文| 欧美+亚洲+日韩+国产| 欧美黑人欧美精品刺激| av视频在线观看入口| 黄色片一级片一级黄色片| 国产成人av激情在线播放| 一二三四在线观看免费中文在| 日韩成人在线观看一区二区三区| 国产黄a三级三级三级人| a级毛片在线看网站| 日本撒尿小便嘘嘘汇集6| 人妻丰满熟妇av一区二区三区| 757午夜福利合集在线观看| 黄色 视频免费看| 欧美激情 高清一区二区三区| or卡值多少钱| 一本久久中文字幕| 亚洲成人久久爱视频| 99久久精品国产亚洲精品| 国产又黄又爽又无遮挡在线| 免费在线观看视频国产中文字幕亚洲| 老汉色∧v一级毛片| 久久婷婷人人爽人人干人人爱| 日韩欧美免费精品| 午夜免费激情av| 91麻豆av在线| 国产激情偷乱视频一区二区| 不卡av一区二区三区| 一进一出抽搐gif免费好疼| 国产精品香港三级国产av潘金莲| 在线天堂中文资源库| 午夜福利在线观看吧| 日本一区二区免费在线视频| 校园春色视频在线观看| 丁香六月欧美| 日韩国内少妇激情av| 91字幕亚洲| 黄片小视频在线播放| 国产高清有码在线观看视频 | 亚洲av电影在线进入| 欧美日韩福利视频一区二区| 国产精品 欧美亚洲| 亚洲专区字幕在线| 18禁观看日本| 亚洲成人国产一区在线观看| 欧美成人性av电影在线观看| 国产亚洲欧美98| 亚洲欧美日韩高清在线视频| 在线观看舔阴道视频| 999精品在线视频| 国内揄拍国产精品人妻在线 | 国产欧美日韩一区二区精品| 国产精品永久免费网站| 波多野结衣巨乳人妻| 老熟妇仑乱视频hdxx| 两个人免费观看高清视频| 性色av乱码一区二区三区2| 国产成人一区二区三区免费视频网站| 制服人妻中文乱码| 99国产精品一区二区三区| 97碰自拍视频| 亚洲精品色激情综合| 黄频高清免费视频| 久久这里只有精品19| 日韩大尺度精品在线看网址| 免费在线观看视频国产中文字幕亚洲| 久久久久久九九精品二区国产 | 亚洲中文av在线| 这个男人来自地球电影免费观看| 久久草成人影院| 在线国产一区二区在线| 一边摸一边做爽爽视频免费| 日韩精品免费视频一区二区三区| 欧美性猛交╳xxx乱大交人| 国产av又大| 日本一本二区三区精品| 少妇 在线观看| 国产又爽黄色视频| 美女高潮到喷水免费观看| 欧美成狂野欧美在线观看| 日韩欧美国产在线观看| 色老头精品视频在线观看| 神马国产精品三级电影在线观看 | 一级毛片精品| 人人妻,人人澡人人爽秒播| 丝袜美腿诱惑在线| 欧美中文日本在线观看视频| 真人做人爱边吃奶动态| 国产精品久久久久久亚洲av鲁大| 天堂√8在线中文| 亚洲成人久久爱视频| 99国产精品99久久久久| 亚洲人成网站在线播放欧美日韩| 他把我摸到了高潮在线观看| 亚洲国产欧美一区二区综合| 色综合欧美亚洲国产小说| 看黄色毛片网站| 久久精品人妻少妇| 久久久久久久久久黄片| 给我免费播放毛片高清在线观看| 午夜免费鲁丝| 久久国产精品影院| 午夜福利18| 亚洲一码二码三码区别大吗| 国产视频内射| 99久久99久久久精品蜜桃| 亚洲全国av大片| 女生性感内裤真人,穿戴方法视频| 99在线视频只有这里精品首页| 制服人妻中文乱码| 一级a爱视频在线免费观看| 国产午夜福利久久久久久| 一进一出抽搐gif免费好疼| 国产欧美日韩一区二区三| 欧美成人一区二区免费高清观看 | 岛国视频午夜一区免费看| 久久性视频一级片| 精品久久久久久久久久久久久 | 少妇被粗大的猛进出69影院| 精品免费久久久久久久清纯| 首页视频小说图片口味搜索| 国产亚洲精品一区二区www| av中文乱码字幕在线| 久久久久久久午夜电影| 可以在线观看的亚洲视频| 看免费av毛片| 国产午夜福利久久久久久| 老汉色av国产亚洲站长工具| 欧美乱妇无乱码| 精品国产乱子伦一区二区三区| 变态另类成人亚洲欧美熟女| 色综合亚洲欧美另类图片| 高清毛片免费观看视频网站| 久久青草综合色| 精品电影一区二区在线| 99在线人妻在线中文字幕| 午夜激情福利司机影院| 欧美最黄视频在线播放免费| 久久久久国产精品人妻aⅴ院| 亚洲国产精品999在线| 18禁美女被吸乳视频| 免费在线观看亚洲国产| 中文字幕av电影在线播放| 国产99白浆流出| 亚洲国产欧洲综合997久久, | 久久久久久久久免费视频了| 手机成人av网站| 男人舔女人的私密视频| 琪琪午夜伦伦电影理论片6080| 一进一出抽搐动态| 搡老熟女国产l中国老女人| 国产av在哪里看| 啦啦啦 在线观看视频| 久久这里只有精品19| 一级毛片女人18水好多| 999久久久国产精品视频| 免费高清在线观看日韩| 亚洲成国产人片在线观看| 99国产精品一区二区三区| av欧美777| 日韩av在线大香蕉| 亚洲精品国产一区二区精华液| 99国产精品一区二区三区| 国产不卡一卡二| 最近最新免费中文字幕在线| 国产在线精品亚洲第一网站| 一区二区三区高清视频在线| 黄色视频不卡| 久久久精品国产亚洲av高清涩受| 女人爽到高潮嗷嗷叫在线视频| 波多野结衣av一区二区av| 中亚洲国语对白在线视频| 中文字幕最新亚洲高清| 夜夜看夜夜爽夜夜摸| 久久香蕉国产精品| 无人区码免费观看不卡| 色婷婷久久久亚洲欧美| 日韩欧美一区二区三区在线观看| 又大又爽又粗| 黄片播放在线免费| 悠悠久久av| 免费看美女性在线毛片视频| 国产精品久久电影中文字幕| 熟女电影av网| 女生性感内裤真人,穿戴方法视频| 国产视频内射| 国产黄片美女视频| www.999成人在线观看| 三级毛片av免费| 在线十欧美十亚洲十日本专区| 精品乱码久久久久久99久播| 午夜精品久久久久久毛片777| 午夜成年电影在线免费观看| 一级a爱视频在线免费观看| 97人妻精品一区二区三区麻豆 | 一区二区三区高清视频在线| 熟妇人妻久久中文字幕3abv| 九色国产91popny在线| 99精品久久久久人妻精品| 国产精品一区二区三区四区久久 | АⅤ资源中文在线天堂| 日本精品一区二区三区蜜桃| 成人手机av| 看黄色毛片网站| 丰满的人妻完整版| 亚洲成av人片免费观看| 人人妻人人看人人澡| 巨乳人妻的诱惑在线观看| 这个男人来自地球电影免费观看| 久久久久久久久免费视频了| 日韩精品青青久久久久久| 一个人观看的视频www高清免费观看 | 欧美激情高清一区二区三区| 日本在线视频免费播放| 999精品在线视频| 亚洲av电影在线进入| 亚洲欧美精品综合久久99| 少妇 在线观看| 亚洲男人天堂网一区| 热99re8久久精品国产| 久久久久国产精品人妻aⅴ院| 精品乱码久久久久久99久播| 麻豆国产av国片精品| 99久久99久久久精品蜜桃| 巨乳人妻的诱惑在线观看| 久久中文字幕一级| www.熟女人妻精品国产| 少妇粗大呻吟视频| 叶爱在线成人免费视频播放| 成人三级做爰电影| 亚洲人成网站在线播放欧美日韩| 亚洲男人天堂网一区| 桃色一区二区三区在线观看| 国语自产精品视频在线第100页| 久久中文看片网| 欧美色视频一区免费| 黑人操中国人逼视频| 波多野结衣高清无吗| 俄罗斯特黄特色一大片| 成熟少妇高潮喷水视频| 国产一级毛片七仙女欲春2 | 真人做人爱边吃奶动态| 国产成人系列免费观看| 国产精华一区二区三区| 91九色精品人成在线观看| 午夜免费观看网址| 热99re8久久精品国产| 曰老女人黄片| 波多野结衣高清作品| 亚洲一区高清亚洲精品| 国产精品99久久99久久久不卡| 亚洲中文av在线| 特大巨黑吊av在线直播 | 亚洲国产欧美一区二区综合| 一级毛片高清免费大全| 午夜福利欧美成人| 日韩有码中文字幕| 亚洲色图av天堂| 亚洲熟妇熟女久久| 国产成人啪精品午夜网站| 亚洲真实伦在线观看| 高清毛片免费观看视频网站| netflix在线观看网站| 国产高清激情床上av| 99精品久久久久人妻精品| 又黄又爽又免费观看的视频| 亚洲成av片中文字幕在线观看| 性欧美人与动物交配| 一二三四在线观看免费中文在| 国产欧美日韩精品亚洲av| 色综合欧美亚洲国产小说| 97碰自拍视频| 久久精品91无色码中文字幕| 欧美国产日韩亚洲一区| 日韩欧美 国产精品| 母亲3免费完整高清在线观看| 人人妻人人看人人澡| 午夜福利一区二区在线看| 黄色片一级片一级黄色片| 在线观看66精品国产| 淫秽高清视频在线观看| 亚洲天堂国产精品一区在线| 国产亚洲精品第一综合不卡| 午夜精品在线福利| 少妇熟女aⅴ在线视频| 久久精品影院6| 美女扒开内裤让男人捅视频| ponron亚洲| 免费搜索国产男女视频| 午夜日韩欧美国产| 深夜精品福利| 精品午夜福利视频在线观看一区| 一区二区三区高清视频在线| 老鸭窝网址在线观看| 精品久久久久久久人妻蜜臀av| 他把我摸到了高潮在线观看| 日本撒尿小便嘘嘘汇集6| 亚洲成人免费电影在线观看| 搡老妇女老女人老熟妇| 精品久久久久久久人妻蜜臀av| 日韩欧美一区二区三区在线观看| 欧美黄色淫秽网站| 日韩免费av在线播放| 亚洲精品久久国产高清桃花| 看黄色毛片网站| 日本精品一区二区三区蜜桃| 国产精品久久电影中文字幕| 久久欧美精品欧美久久欧美| 香蕉国产在线看| 岛国在线观看网站| 看黄色毛片网站| 黄片小视频在线播放| 午夜福利成人在线免费观看| 精品电影一区二区在线| 日韩大码丰满熟妇| 99国产精品一区二区三区| 久久久久久久午夜电影| 91大片在线观看| 欧美在线黄色| 三级毛片av免费| 亚洲三区欧美一区| 亚洲狠狠婷婷综合久久图片| 天堂影院成人在线观看| www日本黄色视频网| 精品一区二区三区四区五区乱码| 999久久久精品免费观看国产| 亚洲黑人精品在线| 搡老熟女国产l中国老女人| 国产一区二区在线av高清观看| 国产精品永久免费网站| 波多野结衣av一区二区av| 18禁黄网站禁片午夜丰满| 身体一侧抽搐| 免费看十八禁软件| 人人妻人人看人人澡| 国产精品九九99| 中文字幕久久专区| 免费在线观看完整版高清| 国产成人啪精品午夜网站| 在线视频色国产色| 国产成人av教育| 每晚都被弄得嗷嗷叫到高潮| 又大又爽又粗| 亚洲av五月六月丁香网| 免费观看人在逋| 国产亚洲精品综合一区在线观看 | 男人舔女人下体高潮全视频| 最新在线观看一区二区三区| 欧美+亚洲+日韩+国产| 十八禁人妻一区二区| 国语自产精品视频在线第100页| 18禁美女被吸乳视频| 久久精品国产综合久久久| 亚洲精品美女久久av网站| 亚洲天堂国产精品一区在线| 日韩 欧美 亚洲 中文字幕| 久久久久久亚洲精品国产蜜桃av| ponron亚洲| 欧美乱妇无乱码| 亚洲国产高清在线一区二区三 | 特大巨黑吊av在线直播 | 97超级碰碰碰精品色视频在线观看| 亚洲 国产 在线| 免费在线观看黄色视频的| 精品国产亚洲在线| 一级片免费观看大全| 日本熟妇午夜| 制服丝袜大香蕉在线| 黑人操中国人逼视频| 久久久久久大精品| 午夜免费鲁丝| 精品乱码久久久久久99久播| 午夜久久久久精精品| 久热这里只有精品99| 一卡2卡三卡四卡精品乱码亚洲| 久久久国产欧美日韩av| 国产成人一区二区三区免费视频网站| 999久久久精品免费观看国产| 嫁个100分男人电影在线观看| 成年版毛片免费区| 日日干狠狠操夜夜爽| 又黄又粗又硬又大视频| 制服丝袜大香蕉在线| 国产成+人综合+亚洲专区| 亚洲九九香蕉| 亚洲国产日韩欧美精品在线观看 | 欧美在线一区亚洲| www日本在线高清视频| 日本a在线网址| 欧美精品啪啪一区二区三区| 18禁美女被吸乳视频| 欧美国产精品va在线观看不卡| 人成视频在线观看免费观看| 亚洲午夜精品一区,二区,三区| 国产亚洲精品久久久久5区| 无限看片的www在线观看| 嫩草影院精品99| 在线观看舔阴道视频| 成人亚洲精品一区在线观看| 亚洲av中文字字幕乱码综合 | 日本一本二区三区精品| 色综合亚洲欧美另类图片| 精品无人区乱码1区二区| 99久久久亚洲精品蜜臀av| 国产欧美日韩一区二区精品| 欧美日韩瑟瑟在线播放| av视频在线观看入口| 欧美激情久久久久久爽电影| av视频在线观看入口| 久久精品国产综合久久久| 国产亚洲欧美在线一区二区| 亚洲 欧美一区二区三区| 日韩欧美一区二区三区在线观看| 成人国语在线视频| 婷婷精品国产亚洲av在线| 18禁黄网站禁片午夜丰满| 黄色 视频免费看| 国产精华一区二区三区| 黄网站色视频无遮挡免费观看| 成人手机av| 一进一出抽搐gif免费好疼| 国产真实乱freesex| 国产爱豆传媒在线观看 | 最近最新免费中文字幕在线| 欧美精品亚洲一区二区| 亚洲五月天丁香| 精品不卡国产一区二区三区| 久久性视频一级片| 久久婷婷成人综合色麻豆| 欧美日韩一级在线毛片| 欧美日韩瑟瑟在线播放| 亚洲五月天丁香| 一区二区三区激情视频| 久久午夜亚洲精品久久| 国产午夜福利久久久久久| 欧美乱妇无乱码| 伊人久久大香线蕉亚洲五| 国内精品久久久久久久电影| 亚洲成人精品中文字幕电影| 成人三级做爰电影| 久久精品国产亚洲av香蕉五月| 日韩欧美在线二视频| 一进一出好大好爽视频| 日本在线视频免费播放| 午夜免费观看网址| 免费观看精品视频网站| 亚洲无线在线观看| 成人永久免费在线观看视频| 1024视频免费在线观看| 老司机深夜福利视频在线观看| 成人午夜高清在线视频 | 久久中文字幕人妻熟女| 欧美日韩瑟瑟在线播放| 男女视频在线观看网站免费 | 久久久久久人人人人人| 国产成人一区二区三区免费视频网站| 亚洲av成人不卡在线观看播放网| 夜夜夜夜夜久久久久| 搡老岳熟女国产| 丰满人妻熟妇乱又伦精品不卡| 99精品欧美一区二区三区四区| 日日爽夜夜爽网站| 国产午夜精品久久久久久| 中文资源天堂在线| 长腿黑丝高跟| 黄片播放在线免费| 国产av不卡久久| 在线观看舔阴道视频| 欧美zozozo另类| 欧美成人午夜精品| 欧美色视频一区免费| 99国产极品粉嫩在线观看| 亚洲成国产人片在线观看| 国产主播在线观看一区二区| 久久久久久久久免费视频了| 亚洲精品国产精品久久久不卡| 亚洲午夜理论影院| 亚洲av熟女| 国产视频一区二区在线看| 精品欧美国产一区二区三| www.自偷自拍.com| 欧美日韩亚洲国产一区二区在线观看|