• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于結(jié)構(gòu)相似度的大規(guī)模社交網(wǎng)絡(luò)聚類算法

    2015-07-18 12:04:46陳季夢陳佳俊劉黃亞樓王嫄馮
    電子與信息學報 2015年2期
    關(guān)鍵詞:復(fù)雜度標簽聚類

    陳季夢陳佳俊劉 杰*黃亞樓王 嫄馮 霞

    ①(南開大學計算機與控制工程學院 天津 300071)

    ②(南開大學軟件學院 天津 300071)

    ③(中國民航大學民航信息技術(shù)科研基地 天津 300300)

    基于結(jié)構(gòu)相似度的大規(guī)模社交網(wǎng)絡(luò)聚類算法

    陳季夢①陳佳?、趧?杰*①黃亞樓②王 嫄①馮 霞③

    ①(南開大學計算機與控制工程學院 天津 300071)

    ②(南開大學軟件學院 天津 300071)

    ③(中國民航大學民航信息技術(shù)科研基地 天津 300300)

    針對社交網(wǎng)絡(luò)的有向交互性和大規(guī)模特性,該文提出一種基于結(jié)構(gòu)相似度的有向網(wǎng)絡(luò)聚類算法(DirSCAN),以及相應(yīng)的分布式并行算法(PDirSCAN)??紤]社交網(wǎng)絡(luò)中節(jié)點間的有向交互性,將行為結(jié)構(gòu)相似的節(jié)點聚集起來,并進行節(jié)點功能分析。針對社交網(wǎng)絡(luò)規(guī)模巨大的特點,提出MapReduce框架下的分布式并行聚類算法,在確保聚類結(jié)果一致的前提下,提高處理性能。大量真實數(shù)據(jù)集上的實驗結(jié)果表明,DirSCAN比無向網(wǎng)絡(luò)聚類算法(SCAN)在F1上可提高2.34%的性能,并行算法PDirSCAN比DirSCAN運行速度提升1.67倍,能夠有效處理大規(guī)模的有向網(wǎng)絡(luò)聚類問題。

    社交網(wǎng)絡(luò);有向網(wǎng)絡(luò)聚類;并行算法;MapReduce

    1 引言

    隨著博客、微博等社交媒體的興起,以用戶為節(jié)點、以用戶關(guān)系為邊的社交網(wǎng)絡(luò)迅猛增長。用戶的興趣、行為、功能等關(guān)系使社交網(wǎng)絡(luò)中存在多個社區(qū)或簇。為了發(fā)現(xiàn)網(wǎng)絡(luò)中隱藏的簇結(jié)構(gòu),傳統(tǒng)的網(wǎng)絡(luò)聚類方法主要基于鏈接的稠密度(linkdensity),使得簇內(nèi)節(jié)點距離較近,簇間節(jié)點距離較遠,如經(jīng)典的Newman快速算法[1]和Kernighan-Lin算法[2]。然而,以上算法忽略了社交網(wǎng)絡(luò)有向交互性和節(jié)點具有不同功能。一方面,社交網(wǎng)絡(luò)中的節(jié)點關(guān)系是有向的,如微博中的關(guān)注關(guān)系,不同方向表明了不同的興趣信息。另一方面,社交網(wǎng)絡(luò)中節(jié)點具有不同功能,如連接多個簇的樞紐節(jié)點具有跨簇傳播功能;孤立的離群節(jié)點在噪音檢測、流失客戶檢測等任務(wù)中有重要作用。這兩個結(jié)構(gòu)特點對社交網(wǎng)絡(luò)的理解和功能發(fā)現(xiàn)有重要的意義。

    當前的社交網(wǎng)絡(luò)聚類方法除了傳統(tǒng)基于鏈接稠密度的方法[1-3]外,還包括考慮節(jié)點功能特性、網(wǎng)絡(luò)的有向性等社交特性的聚類方法。另外,面向大規(guī)模社交網(wǎng)絡(luò)的并行聚類方法也是目前重要研究方向之一。

    文獻[4]在鏈接稠密度的基礎(chǔ)上,同時考慮結(jié)構(gòu)相似度,提出SCAN算法,并分析節(jié)點功能。然而,該算法僅針對無向網(wǎng)絡(luò)聚類,未考慮社交網(wǎng)絡(luò)的有向性??紤]社交網(wǎng)絡(luò)中的關(guān)系存在有向性,文獻[5]將有向邊轉(zhuǎn)換為無向邊,再使用傳統(tǒng)的無向網(wǎng)絡(luò)聚類方法聚類,然而該無向化方法損失了社交網(wǎng)絡(luò)的有向結(jié)構(gòu)特性。文獻[6]將有向網(wǎng)絡(luò)聚類問題轉(zhuǎn)化成對有向圖進行加權(quán)切割的優(yōu)化問題進行解決。但是文獻[5,6]算法并未區(qū)分網(wǎng)絡(luò)中的節(jié)點功能。因此,本文基于SCAN提出有向網(wǎng)絡(luò)聚類算法(DirSCAN)。

    近年來,大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的快速增長促進了動態(tài)增量和分布式并行聚類算法的研究。文獻[7]提出一種隨機游走與動態(tài)增量相關(guān)節(jié)點結(jié)合的網(wǎng)絡(luò)聚類算法挖掘社區(qū)。文獻[8]在MapReduce系統(tǒng)上設(shè)計了大數(shù)據(jù)并行聚類算法,采用抽樣來減小數(shù)據(jù)。文獻[9]提出一種基于社交關(guān)系的模糊聚類算法,輔助數(shù)據(jù)分布式存儲,提升數(shù)據(jù)訪問效率。然而,此類方法存在信息丟失,無法得到與原算法一致的結(jié)果。本文前期工作提出了并行的SCAN算法PSCAN[10],可得與原算法等價的結(jié)果,與文獻[11]類似。

    本文創(chuàng)新點在于,考慮上述兩方面,在識別簇與節(jié)點功能的SCAN(Structural Clustering Algorithm for Networks)[4]算法基礎(chǔ)上,設(shè)計了基于結(jié)構(gòu)相似度的有向網(wǎng)絡(luò)聚類算法DirSCAN (Structural Clustering Algorithm for Directed Networks)。此外,近幾年社交網(wǎng)絡(luò)發(fā)展迅猛,海量節(jié)點及復(fù)雜關(guān)系的分析對單機串行方法是一個巨大的挑戰(zhàn)。針對這種用戶數(shù)上億、關(guān)系復(fù)雜的大規(guī)模社交網(wǎng)絡(luò),本文基于MapReduce[12]分布式并行架構(gòu)將DirSCAN并行化,提出PDirSCAN(Parallel DirSCAN),在聚類結(jié)果一致下提高運行速度。

    2 有向網(wǎng)絡(luò)聚類算法DirSCAN

    在社交網(wǎng)絡(luò)中,由節(jié)點主動發(fā)起的關(guān)聯(lián)與節(jié)點本身的興趣、行為直接相關(guān),而節(jié)點被動接收的關(guān)聯(lián)則表明了其他節(jié)點對該節(jié)點的興趣,而非直接表明節(jié)點本身特性。如微博中用戶A關(guān)注其感興趣的用戶B,而B未關(guān)注A,則A的興趣偏好由B直接體現(xiàn),而B則無法用A直接描述。在這種情況下,節(jié)點的出邊較之入邊更能反映節(jié)點信息。因此本文重點考慮節(jié)點的出邊,提出結(jié)構(gòu)相似度假設(shè):若兩個節(jié)點所能到達的節(jié)點越相似,則兩節(jié)點屬于同一簇的可能性越大。

    2.1 DirSCAN算法的基本定義

    給定一個有向網(wǎng)絡(luò)G={V,E},V為節(jié)點集合,E為連接節(jié)點的有向邊集合。從節(jié)點v到節(jié)點w的有向邊記為<v,w>,其中v,w∈V。節(jié)點v的結(jié)構(gòu)定義為從v出發(fā)一步到達的節(jié)點集合及其本身,記為Γ(v)。

    根據(jù)結(jié)構(gòu)相似度假設(shè),兩節(jié)點的到達節(jié)點重合越多則越相似,因此,兩點之間的結(jié)構(gòu)相似度定義為

    在社交網(wǎng)絡(luò)中,如果用戶A與用戶B共同關(guān)注了一群相同的人,那么可認為A與B興趣相似,我們將網(wǎng)絡(luò)中興趣相似的節(jié)點定義為到達鄰居,如式(3)所示。

    其中,ε是用于劃分鄰居與非鄰居的相似度閾值。若ε=0,則所有到達節(jié)點均為鄰居節(jié)點。

    當一個節(jié)點擁有較多的到達鄰居節(jié)點,我們認為其足夠活躍,將其定義為核節(jié)點,用于擴大簇。

    定義1 核節(jié)點。若節(jié)點v的到達鄰居節(jié)點個數(shù)超過某一臨界值,則v為核節(jié)點,定義為

    其中,μ(μ>0)是活躍節(jié)點的到達鄰居臨界參數(shù),用于判定核節(jié)點。

    擴大簇的過程如定義2所示。

    定義2 直接結(jié)構(gòu)可達。若一個節(jié)點w是一個核節(jié)點v的到達鄰居節(jié)點,則w也應(yīng)該與v屬于同一個簇。我們將這一過程定義為v直接結(jié)構(gòu)可達w,即核節(jié)點與其到達鄰居節(jié)點應(yīng)屬于同一簇,如式(5)所示。

    2.2 DirSCAN算法流程

    接下來,介紹DirSCAN算法是如何工作的,包括如何實現(xiàn)簇的搜索以及如何分析節(jié)點的功能,樞紐和離群。第1步,將所有節(jié)點初始化為未分簇點;第2步,遍歷所有核節(jié)點,并尋找核節(jié)點的直接結(jié)構(gòu)可達節(jié)點,將它們合并為一個簇,根據(jù)簇中的核節(jié)點重復(fù)第2步再次擴展簇,直到?jīng)]有新節(jié)點加入;第3步,遍歷所有的未分簇節(jié)點,根據(jù)與其相鄰的簇的數(shù)目將其分為樞紐點或離群點,有多個相鄰簇的是樞紐節(jié)點,至多只有1個相鄰簇的即為離群節(jié)點。具體算法如表1所示。

    需要注意的是,DirSCAN的最終分類結(jié)果對節(jié)點處理順序不敏感。DirSCAN算法與SCAN算法的不同之處在于兩方面。一方面,DirSCAN的結(jié)構(gòu)相似度考慮了節(jié)點的到達鄰居,即節(jié)點的出邊這一有向傳播特性;另一方面,由于DirSCAN采用有向邊來定義直接結(jié)構(gòu)可達性,因此該特性不可逆。這兩方面的考慮使得本文所計算的結(jié)構(gòu)相似度更能反映真實社交網(wǎng)絡(luò)的情況。

    表1 有向網(wǎng)絡(luò)聚類算法DirSCAN

    2.3 DirSCAN算法的復(fù)雜度分析

    DirSCAN算法僅需遍歷有限次節(jié)點和邊,一次遍歷即可獲得節(jié)點的到達鄰居、判斷核節(jié)點,從而以核節(jié)點進行簇擴展。因此若網(wǎng)絡(luò)中存在n個節(jié)點,遍歷節(jié)點的復(fù)雜度為O(n)。在遍歷邊時,需要計算節(jié)點的每條出邊是否為到達鄰居關(guān)系,最差情況為所有節(jié)點都相連,復(fù)雜度為O(n(n-1))。由于實際社交網(wǎng)絡(luò)通常為稀疏網(wǎng)絡(luò)[4],遍歷邊的次數(shù)可近似為遍歷節(jié)點的次數(shù)。因此DirSCAN算法的時間復(fù)雜度近似為O(n)。

    3 并行有向網(wǎng)絡(luò)聚類算法PDirSCAN

    為了適應(yīng)大規(guī)模社交網(wǎng)絡(luò)的聚類,本節(jié)將在MapReduce并行平臺上設(shè)計并行化算法PDirSCAN。

    通過分析發(fā)現(xiàn),DirSCAN算法對節(jié)點的操作主要分為兩個步驟:識別到達鄰居與核節(jié)點;擴充簇以完成聚類。第1步中,每個節(jié)點都可以獨立計算到達鄰居和節(jié)點間的結(jié)構(gòu)相似度。第2步中,每個核節(jié)點可獨立將其標簽傳遞給其到達鄰居。可見,DirSCAN算法并行化是可行的。

    MapReduce的并行數(shù)據(jù)處理過程可分為兩個步驟:Map和Reduce。Map將輸入的<key, value>對映射到新的<key, value>對上,用來將數(shù)據(jù)打散成多組子數(shù)據(jù)。Reduce獨立并行地處理各組子數(shù)據(jù)。MapReduce自身提供了很好的容錯性,使得整個任務(wù)不會因為某個處理節(jié)點的癱瘓而整體崩潰。

    3.1 PDirSCAN中識別到達鄰居的并行化

    并行識別節(jié)點到達鄰居這一步驟由兩個MapReduce任務(wù)來實現(xiàn)。第1個MapReduce任務(wù)并行計算每個節(jié)點與其臨近點之間的到達鄰居關(guān)系,如圖1(a)~1(d)所示。其中Map函數(shù)將網(wǎng)絡(luò)隨機切分成若干份,然后復(fù)制多個副本,將其兩兩合并形成對,假設(shè)網(wǎng)絡(luò)被分割成4份,則需要6次合并。Reduce函數(shù)在本地計算每個節(jié)點的到達鄰居。第2個MapReduce任務(wù)對每個節(jié)點的所有到達鄰居進行匯總,僅進行Reduce步驟,如圖1(e)所示。其中Reduce函數(shù)將所有中間數(shù)據(jù)進行排序,排序后可依次將含同一節(jié)點的數(shù)據(jù)聚合。

    3.2 PDirSCAN中簇擴展的并行化

    當獲得了所有節(jié)點的到達鄰居之后,可判斷該節(jié)點是否為核節(jié)點,隨后進行簇擴展。在這一過程中,通過核節(jié)點來傳播簇標簽以獲得最終的結(jié)果,可由兩個MapReduce任務(wù)完成。第1個任務(wù)將數(shù)據(jù)隨機劃分為若干份(如圖1(a)所示,其中粗邊節(jié)點是核節(jié)點),將多個副本進行兩兩合并,擴展簇標簽(如圖1(b)~1(d)所示,節(jié)點右下角為節(jié)點所屬的簇標簽,其中“-1”為處理過但未分配簇的節(jié)點)。第2個任務(wù)將所有聚類后的簇標簽合并,實現(xiàn)標簽的全局傳播及聚類,如圖1(e)~1(f)所示。由于相同簇節(jié)點在不同機器上聚類的簇標簽不一致,如圖1(e)所示,同簇中的節(jié)點曾被聚為2, 4, 6, 8, 10簇,因此本文將簇標簽索引列表中的最小標簽作為該簇的標簽完成標簽一致化,如圖1(f),其中簇標簽索引列表記錄相同簇中所有節(jié)點曾標記過的簇標簽。最后,獲得最終的簇集合。那些無簇標簽的節(jié)點則根據(jù)其到達鄰居的簇類別數(shù)標記為樞紐點或離群點。

    圖1 聚類并行過程細節(jié)

    3.3 PDirSCAN的算法復(fù)雜度分析

    假設(shè)有向網(wǎng)絡(luò)中,有n個節(jié)點,被p臺機器劃分成m份。由DirSCAN的算法復(fù)雜度可知串行計算的時間復(fù)雜度為Ts=O(n),則并行后數(shù)據(jù)處理時間復(fù)雜度為O(n/p)。假設(shè)通信之前的同步用時為T0,由于每個節(jié)點都需要至少傳送到其他節(jié)點一次,因此并行時通信用時為Tc=T0+O(n(m -1)/2)。綜上所述,PDirSCAN總復(fù)雜度為,Tp=T0+ O(n(m-1)/2)+O(n/p)。若通信用時Tc小于串行計算用時Ts,則并行計算時間復(fù)雜度優(yōu)于串行計算。由于社交網(wǎng)絡(luò)大都是稀疏網(wǎng)絡(luò),因此通信用時較少,并行算法存在速度優(yōu)勢。

    4 實驗與分析

    4.1 實驗數(shù)據(jù)集

    本文在兩個真實網(wǎng)絡(luò)數(shù)據(jù)集上進行實驗。在網(wǎng)絡(luò)數(shù)據(jù)集WebKB[13]上,進行有向網(wǎng)絡(luò)聚類的準確性實驗,對比分析DirSCAN與SCAN。在大規(guī)模的社交網(wǎng)絡(luò)數(shù)據(jù)集Pokec[14]上,進行PDirSCAN的并行效率實驗。

    WebKB數(shù)據(jù)集包含了Texas, Washington, Cornell, Wisconsin這4所大學網(wǎng)頁之間的鏈接情況,包含877個節(jié)點和1608個有向邊。這些網(wǎng)頁可分為5類:課程,教師,員工,學生以及項目。

    Pokec大規(guī)模社交網(wǎng)站數(shù)據(jù)集記錄了斯洛伐克的好友關(guān)注關(guān)系網(wǎng)絡(luò),包含1632803個節(jié)點和30622564條有向邊,平均節(jié)點出度為18.8。Pokec沒有真實分類,因此僅用于測試并行實驗中的效率。

    4.2 評價指標介紹

    準確性實驗采用聚類常用的評價指標準確率(Precision, P)、召回率(Recall, R)、F1值和邊緣索引 (Rand Index, RI)來評價聚類結(jié)果的準確程度。真實情況下將同類兩個節(jié)點聚為一簇,為一個正確的聚類結(jié)果。這3個評價指標的值越大表明聚類結(jié)果與真實情況越相似,聚類效果越好。

    在并行效率實驗中,我們采用并行實驗中的常用評價指標加速比(speedup)、規(guī)模增長性(sizeup)和可擴展性(scaleup)進行度量。加速比指串行與并行處理最短用時之比,加速比越大說明并行用時越短。規(guī)模增長性是指并行計算m倍數(shù)據(jù)量與單倍數(shù)據(jù)量的時間比,該指標越小說明數(shù)據(jù)增多用時增長慢。可擴展性是指在單機上處理單倍數(shù)據(jù)量與在m臺機器上處理m倍數(shù)據(jù)量的時間比,該指標越大表明可擴展性越好。

    4.3 實驗設(shè)置

    本文采用SCAN作為對比算法。SCAN只適用于無向網(wǎng)絡(luò)聚類,因此先將有向網(wǎng)絡(luò)轉(zhuǎn)換為無向網(wǎng)絡(luò)。算法中的參數(shù)ε將遍歷[0,1]中步長為0.1的數(shù)值來進行優(yōu)化,μ將遍歷[1,10]中步長為1的數(shù)值來進行優(yōu)化。

    4.4 實驗結(jié)果及分析

    4.4.1 DirSCAN聚類算法的準確性實驗結(jié)果 在WebKB, Texas, Washington數(shù)據(jù)集上的聚類準確率實驗結(jié)果如表2所示。結(jié)果顯示,考慮了網(wǎng)絡(luò)有向性的DirSCAN算法,在準確率P、召回率R、F1值和RI上都優(yōu)于無向圖聚類算法SCAN,分別提高0.39%, 8.83%, 2.34%和0.88%。其中,召回率R和F1值提升最明顯。在WebKB各大學的子數(shù)據(jù)集上也有相似結(jié)果,Texas子數(shù)據(jù)集中DirSCAN在召回率R、F1值上分別提升16.98%, 7.05%, Washington子數(shù)據(jù)集中DirSCAN在召回率R、F1值上分別提升11.44%, 3.05%,可見,考慮網(wǎng)絡(luò)有向性對聚類有效。

    4.4.2 PDirSCAN并行化算法的效率實驗結(jié)果 為了驗證PDirSCAN的并行效率,本文在4臺計算機上進行實驗。每一臺機器的處理器都為2.59 GHz AMD Phenom(tm) II X4 810, 3G內(nèi)存。本文將Reduce任務(wù)的數(shù)目設(shè)置成與集群的機器數(shù)目相同,即每一臺機器處理至多一個Reduce任務(wù)。在所有并行實驗中,數(shù)據(jù)集都被分成24份,保證所需要合并的次數(shù)相同。多次實驗驗證,并行實驗結(jié)果與串行一致[11]。

    在Pokec數(shù)據(jù)集上的并行效率實驗結(jié)果如圖2所示。實驗表明,(1)當節(jié)點數(shù)量不變時,加速比隨機器數(shù)目增多而提高,說明所需的處理時間減少了;當節(jié)點數(shù)增加時,加速比增加更顯著,在8×105節(jié)點4臺機器,比單機處理速度提高了1.67倍,見圖2(a)。(2)單機處理節(jié)點時,規(guī)模增長性提升較快,即節(jié)點增加使處理時間增長(8×105節(jié)點比1×105節(jié)點耗時多了1.87倍),而當機器數(shù)增加時,規(guī)模增長性提升緩慢,即時間消耗無顯著增加,使用4臺機器時,8×105節(jié)點比1×105節(jié)點耗時僅多了1.28倍,比單機快了0.59倍,見圖2(b)。(3)當機器數(shù)目與數(shù)據(jù)量等比增加時,可擴展性提高至1.1,即若單機處理1×105節(jié)點需費t時,4臺機器采用PDirSCAN可僅用0.9t的時間處理4×105節(jié)點,見圖2(c)。

    綜上所述,PDirSCAN在聚類結(jié)果與DirSCAN一致下,提高了處理速度,有較高的實際應(yīng)用價值。

    5 結(jié)束語

    本文針對社交網(wǎng)絡(luò)的有向交互性,提出基于結(jié)構(gòu)相似度的有向網(wǎng)絡(luò)聚類方法DirSCAN來檢測社區(qū),F(xiàn)1值可提升2.34%。針對真實網(wǎng)絡(luò)大規(guī)模特性,本文提出基于MapReduce的并行化算法PDirSCAN提高算法速度1.67倍。實驗結(jié)果表明本文算法提高了網(wǎng)絡(luò)聚類的效率和速度,具有較大的實用價值。

    表2 兩種算法在WebKB, Texas, Washington數(shù)據(jù)集上的聚類結(jié)果(%)

    圖2 PDirSCAN在Pokec數(shù)據(jù)集上的并行結(jié)果

    [1] Newman M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E, 2004, 69(6): 066133-1-066133-5.

    [2] Lancichinetti A, Fortunato S, and Kertész J. Detecting the overlapping and hierarchical community structure in complex networks[J]. New Journal of Physics, 2009, 11(3): 033015-1-033015-18.

    [3] Fallani F D V, Nicosia V, Latora V, et al.. Nonparametric resampling of random walks for spectral network clustering[J].Physical Review E, 2014, 89(1): 012802-1-012802-5.

    [4] Xu Xiao-wei, Yuruk N, Feng Zhi-dan, et al.. SCAN: a structural clustering algorithm for networks[C]. Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Jose, 2007: 824-833.

    [5] Zhou Deng-yong, Huang Jia-yuan, and Sch?lkopf B. Learning from labeled and unlabeled data on a directed graph[C]. Proceedings of the 22nd International Conference on Machine Learning, Bonn, 2005: 1036-1043.

    [6] Meila M and Pentney W. Clustering by weighted cuts in directed graphs[C]. Proceedings of the 7th SIAM International Conference on Data Mining, Minneapolis, 2007: 135-144.

    [7] 肖杰斌, 張紹武. 基于隨機游走和增量相關(guān)節(jié)點的動態(tài)網(wǎng)絡(luò)社團挖掘算法[J]. 電子與信息學報, 2013, 35(4): 977-981. Xiao Jie-bin and Zhang Shao-wu. An algorithm of integrating random walk and increment correlative vertexes for mining community of dynamic networks[J]. Journal of Electronics & Information Technology, 2013, 35(4): 977-981.

    [8] Ene A, Im S, and Moseley B. Fast clustering using MapReduce[C]. Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego, 2011: 681-689.

    [9] Cao Yan, Cao Jian, and Li Ming-lu. Distributed data distribution mechanism in social network based on fuzzy clustering[J]. Foundations and Applications of Intelligent Systems, 2014, 213: 603-620.

    [10] Chen Jia-jun, Chen Ji-meng, Liu Jie, et al.. PSCAN: a parallel structural clustering algorithm for networks[C]. Proceedings of the 2013 International Conference on Machine Learning and Cybernetics, Tianjin, 2013: 839-844.

    [11] Zhao Wei-zhong, Venkataswamy M, and Xu Xiao-wei. PSCAN: a parallel structural clustering algorithm for big networks in mapReduce[C]. Proceedings of the 2013 IEEE 27th International Conference on Advanced Information Networking and Applications, Washington DC, 2013: 862-869.

    [12] Dean J and Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM, 2008, 51(1): 107-113.

    [13] Craven M, DiPasquo D, Freitag D, et al.. Learning to extract symbolic knowledge from the world wide web[C]. Proceedings of the 15th National Conference on Artificial Intelligence (AAAI-98), Madison, 1998: 509-516.

    [14] Takac L and Zabovsky M. Data analysis in public social networks[C]. Proceedings of International Scientific Conference & International Workshop Present Day Trends of Innovations, Lomza, 2012: 1-6.

    陳季夢: 女,1987年生,博士生,研究方向為數(shù)據(jù)挖掘.

    陳佳?。?男,1988年生,碩士,研究方向為并行與分布式計算.

    劉 杰: 男,1979年生,博士,副教授,研究方向為機器學習.

    Clustering Algorithms for Large-scale Social Networks Based on Structural Similarity

    Chen Ji-meng①Chen Jia-jun②Liu Jie①Huang Ya-lou②Wang Yuan①Feng Xia③

    ①(College of Computer and Control Engineering, Nankai University, Tianjin 300071, China)
    ②(College of Software, Nankai University, Tianjin 300071, China)
    ③(Information Technology Research Base of CAAC, Civil Aviation University of China, Tianjin 300300, China)

    To cluster the directed and large-scale social networks, a Structural Clustering Algorithm for Directed Networks (DirSCAN) and a corresponding Parallel algorithm (PDirSCAN) are proposed. Considering oriented behavioral relation between two vertices, DirSCAN is constructed based on action structural similarity and function analysis. To meet the need of large-scale social network analysis, a lossless PDirSCAN based on MapReduce distributed parallel architecture is designed to improve the processing performance. A large number of experimental results on real-world network datasets show that DirSCAN improves performance of SCAN up to 2.34% on F1, PDirSCAN runs 1.67 times faster than DirSCAN.

    Social networks; Directed network clustering; Parallel algorithm; MapReduce

    TP393

    A

    1009-5896(2015)02-0449-06

    10.11999/JEIT140512

    2014-04-22收到,2014-08-27改回

    國家自然科學基金(61105049, 61300166),中國民航信息技術(shù)科研基地開放課題基金(CAAC-ITRB-201303, CAAC-ITRB-201204),天津市科技計劃項目(13ZCZDGX01098)和天津市自然科學基金(14JCQNJC00600)資助課題

    *通信作者:劉杰 jliu@nankai.edu.cn

    猜你喜歡
    復(fù)雜度標簽聚類
    一種低復(fù)雜度的慣性/GNSS矢量深組合方法
    無懼標簽 Alfa Romeo Giulia 200HP
    車迷(2018年11期)2018-08-30 03:20:32
    不害怕撕掉標簽的人,都活出了真正的漂亮
    海峽姐妹(2018年3期)2018-05-09 08:21:02
    基于DBSACN聚類算法的XML文檔聚類
    電子測試(2017年15期)2017-12-18 07:19:27
    求圖上廣探樹的時間復(fù)雜度
    標簽化傷害了誰
    某雷達導51 頭中心控制軟件圈復(fù)雜度分析與改進
    基于改進的遺傳算法的模糊聚類算法
    基于多進制查詢樹的多標簽識別方法
    計算機工程(2015年8期)2015-07-03 12:20:27
    出口技術(shù)復(fù)雜度研究回顧與評述
    人体艺术视频欧美日本| 久久精品夜色国产| 久久午夜综合久久蜜桃| 精品国产一区二区久久| 满18在线观看网站| 亚洲人成网站在线观看播放| 欧美 日韩 精品 国产| 美女内射精品一级片tv| 美女国产视频在线观看| 91午夜精品亚洲一区二区三区| 国产精品人妻久久久久久| 亚洲不卡免费看| 人妻人人澡人人爽人人| av天堂久久9| 十分钟在线观看高清视频www| 久久99蜜桃精品久久| 成年美女黄网站色视频大全免费 | kizo精华| 亚洲av在线观看美女高潮| 亚洲国产色片| 卡戴珊不雅视频在线播放| 春色校园在线视频观看| 一边亲一边摸免费视频| 国产男人的电影天堂91| av一本久久久久| 国产亚洲欧美精品永久| 国产一区二区在线观看av| 国产 一区精品| 欧美日韩在线观看h| 国产免费一级a男人的天堂| av有码第一页| 亚洲欧美成人精品一区二区| 免费看光身美女| 国产av精品麻豆| 纵有疾风起免费观看全集完整版| 午夜激情久久久久久久| 国内精品宾馆在线| 新久久久久国产一级毛片| 亚洲精品美女久久av网站| 日韩av不卡免费在线播放| xxx大片免费视频| 亚洲国产最新在线播放| 精品亚洲乱码少妇综合久久| 久久亚洲国产成人精品v| 这个男人来自地球电影免费观看 | 亚洲丝袜综合中文字幕| 国产精品久久久久久久电影| 色吧在线观看| 久久午夜福利片| 自线自在国产av| 欧美激情极品国产一区二区三区 | 日本av手机在线免费观看| 免费观看无遮挡的男女| 三上悠亚av全集在线观看| 色5月婷婷丁香| 国产成人精品无人区| 国产午夜精品久久久久久一区二区三区| 亚洲国产av影院在线观看| 多毛熟女@视频| av国产精品久久久久影院| 国产精品久久久久久精品古装| 国产伦理片在线播放av一区| 婷婷色麻豆天堂久久| 亚洲欧洲日产国产| 麻豆精品久久久久久蜜桃| 亚洲人成网站在线观看播放| av免费观看日本| 综合色丁香网| 九九爱精品视频在线观看| av有码第一页| 久久久久视频综合| 日韩亚洲欧美综合| 熟女av电影| 2022亚洲国产成人精品| 91在线精品国自产拍蜜月| 国产一级毛片在线| 欧美最新免费一区二区三区| 一本—道久久a久久精品蜜桃钙片| 性色avwww在线观看| 涩涩av久久男人的天堂| 天天操日日干夜夜撸| 欧美精品国产亚洲| 五月天丁香电影| 国产免费又黄又爽又色| 午夜福利网站1000一区二区三区| 欧美另类一区| 91精品国产九色| 日韩,欧美,国产一区二区三区| 成人黄色视频免费在线看| 国产高清有码在线观看视频| 国产日韩欧美亚洲二区| 欧美精品人与动牲交sv欧美| 国产成人av激情在线播放 | 亚洲精品aⅴ在线观看| 日本猛色少妇xxxxx猛交久久| 成年人午夜在线观看视频| 亚洲丝袜综合中文字幕| 欧美精品一区二区免费开放| 在线观看免费高清a一片| 自线自在国产av| 人体艺术视频欧美日本| 男女边吃奶边做爰视频| 亚洲成人一二三区av| 十八禁网站网址无遮挡| 精品一区二区免费观看| 亚洲成人手机| 天天影视国产精品| 欧美日韩成人在线一区二区| xxxhd国产人妻xxx| 新久久久久国产一级毛片| 国产免费福利视频在线观看| 色哟哟·www| 少妇人妻精品综合一区二区| 国产精品人妻久久久久久| 国产精品无大码| 久久精品久久精品一区二区三区| 99热这里只有精品一区| 国产成人精品无人区| 国产亚洲午夜精品一区二区久久| 秋霞在线观看毛片| 看十八女毛片水多多多| 我的女老师完整版在线观看| 日韩免费高清中文字幕av| 少妇精品久久久久久久| 天天操日日干夜夜撸| 精品久久久久久久久av| 国产亚洲一区二区精品| 欧美人与善性xxx| 五月伊人婷婷丁香| av不卡在线播放| 精品视频人人做人人爽| av福利片在线| 夜夜骑夜夜射夜夜干| 精品一品国产午夜福利视频| 亚洲色图 男人天堂 中文字幕 | 久久午夜福利片| 亚洲欧美色中文字幕在线| 精品人妻偷拍中文字幕| 久久青草综合色| 亚洲精品乱码久久久v下载方式| 99国产综合亚洲精品| 2018国产大陆天天弄谢| 韩国高清视频一区二区三区| 九草在线视频观看| 18禁裸乳无遮挡动漫免费视频| 国产 精品1| 久久精品国产a三级三级三级| 天堂中文最新版在线下载| 有码 亚洲区| 人妻系列 视频| 国产在线视频一区二区| 爱豆传媒免费全集在线观看| 久久精品国产亚洲网站| 人体艺术视频欧美日本| 成人漫画全彩无遮挡| 欧美成人精品欧美一级黄| 成人亚洲欧美一区二区av| xxx大片免费视频| 韩国av在线不卡| 国产精品一区二区三区四区免费观看| 久久久久视频综合| 亚洲欧美一区二区三区国产| 岛国毛片在线播放| 国国产精品蜜臀av免费| 99热这里只有精品一区| 婷婷色麻豆天堂久久| 一区二区三区四区激情视频| 极品少妇高潮喷水抽搐| 免费高清在线观看视频在线观看| 99九九在线精品视频| 日韩视频在线欧美| 精品国产乱码久久久久久小说| 中文字幕精品免费在线观看视频 | 边亲边吃奶的免费视频| 国产综合精华液| 亚洲精品一区蜜桃| 汤姆久久久久久久影院中文字幕| 最近手机中文字幕大全| 麻豆成人av视频| 少妇人妻久久综合中文| 麻豆乱淫一区二区| 国产有黄有色有爽视频| 黑人欧美特级aaaaaa片| 男人添女人高潮全过程视频| av福利片在线| 成年人午夜在线观看视频| 精品少妇黑人巨大在线播放| 中文精品一卡2卡3卡4更新| 免费黄色在线免费观看| 色网站视频免费| 少妇的逼好多水| a级毛色黄片| 国产男女超爽视频在线观看| av一本久久久久| 中文字幕亚洲精品专区| 国产精品 国内视频| 黑人欧美特级aaaaaa片| 丁香六月天网| 国产黄色免费在线视频| 夜夜骑夜夜射夜夜干| 亚洲人成网站在线观看播放| 草草在线视频免费看| 精品久久久精品久久久| 国产又色又爽无遮挡免| 国产精品一国产av| 亚洲欧美中文字幕日韩二区| 欧美激情极品国产一区二区三区 | 精品国产国语对白av| 精品一品国产午夜福利视频| 3wmmmm亚洲av在线观看| 老司机亚洲免费影院| 久久av网站| 视频区图区小说| 女性被躁到高潮视频| 久久久久久久久久成人| 日韩制服骚丝袜av| 麻豆乱淫一区二区| 夫妻性生交免费视频一级片| 丰满乱子伦码专区| 久久久a久久爽久久v久久| 日韩av在线免费看完整版不卡| 亚洲欧美日韩卡通动漫| tube8黄色片| 婷婷色麻豆天堂久久| 黄色毛片三级朝国网站| 另类亚洲欧美激情| 99久久中文字幕三级久久日本| 亚洲欧美一区二区三区国产| 国产有黄有色有爽视频| 国产高清有码在线观看视频| 少妇被粗大的猛进出69影院 | 久久久久精品久久久久真实原创| 秋霞在线观看毛片| 寂寞人妻少妇视频99o| 免费大片18禁| 精品一区二区三卡| 日韩不卡一区二区三区视频在线| 国产视频内射| 天天操日日干夜夜撸| 少妇猛男粗大的猛烈进出视频| 欧美97在线视频| 五月伊人婷婷丁香| 天堂俺去俺来也www色官网| 在线天堂最新版资源| 中国国产av一级| 国产精品麻豆人妻色哟哟久久| 汤姆久久久久久久影院中文字幕| 亚洲国产精品成人久久小说| av.在线天堂| 人人妻人人添人人爽欧美一区卜| 久热这里只有精品99| 欧美bdsm另类| 国产精品一二三区在线看| 99视频精品全部免费 在线| 在线观看国产h片| 18禁观看日本| 中文欧美无线码| 一级毛片我不卡| 熟女av电影| 亚洲av.av天堂| 麻豆乱淫一区二区| 天天操日日干夜夜撸| 91在线精品国自产拍蜜月| 国产淫语在线视频| 桃花免费在线播放| 免费黄网站久久成人精品| 伊人亚洲综合成人网| 免费观看无遮挡的男女| 午夜免费男女啪啪视频观看| av又黄又爽大尺度在线免费看| 亚洲国产欧美日韩在线播放| 只有这里有精品99| 中文乱码字字幕精品一区二区三区| 女性生殖器流出的白浆| 久久综合国产亚洲精品| 亚洲精品一二三| 国产男人的电影天堂91| 一个人免费看片子| 七月丁香在线播放| 久久久久久久久久久丰满| 欧美日韩在线观看h| 久久久久精品性色| 欧美三级亚洲精品| 91精品国产国语对白视频| 黄色欧美视频在线观看| 久久久久久伊人网av| 亚洲精品456在线播放app| 国产高清不卡午夜福利| av卡一久久| 91精品三级在线观看| 久久久久视频综合| 免费黄频网站在线观看国产| 亚洲综合色惰| 18禁动态无遮挡网站| a级毛片在线看网站| 99九九在线精品视频| 精品人妻熟女毛片av久久网站| 久久久精品94久久精品| 亚洲第一av免费看| 精品国产一区二区久久| 秋霞在线观看毛片| 永久免费av网站大全| 性色avwww在线观看| 久久亚洲国产成人精品v| 欧美日韩在线观看h| 99久国产av精品国产电影| 伦理电影免费视频| 成年女人在线观看亚洲视频| 午夜激情久久久久久久| 国产高清三级在线| 久久久久久伊人网av| 三上悠亚av全集在线观看| 亚洲精品久久久久久婷婷小说| 日韩欧美精品免费久久| 色94色欧美一区二区| 在线观看美女被高潮喷水网站| 考比视频在线观看| √禁漫天堂资源中文www| 亚洲欧美色中文字幕在线| 菩萨蛮人人尽说江南好唐韦庄| 特大巨黑吊av在线直播| 欧美日韩精品成人综合77777| 免费黄色在线免费观看| 亚洲精品视频女| 国产精品熟女久久久久浪| 国产av精品麻豆| 久久国产亚洲av麻豆专区| 亚洲无线观看免费| 欧美少妇被猛烈插入视频| 亚洲欧美色中文字幕在线| 美女国产视频在线观看| 新久久久久国产一级毛片| 国产欧美日韩综合在线一区二区| 18禁观看日本| 亚洲欧洲国产日韩| 中文字幕免费在线视频6| 国产 一区精品| 久久99热6这里只有精品| 久久久亚洲精品成人影院| 久久国内精品自在自线图片| 午夜福利在线观看免费完整高清在| 毛片一级片免费看久久久久| 九草在线视频观看| 91精品伊人久久大香线蕉| 亚洲国产日韩一区二区| 日日摸夜夜添夜夜爱| 国产精品99久久久久久久久| 久久综合国产亚洲精品| 亚洲在久久综合| 免费大片18禁| 国产成人freesex在线| 9色porny在线观看| 精品人妻熟女毛片av久久网站| 美女xxoo啪啪120秒动态图| 国产又色又爽无遮挡免| 在线观看国产h片| 久久久欧美国产精品| 97在线视频观看| 欧美97在线视频| 亚洲av福利一区| 亚洲av成人精品一区久久| 亚洲伊人久久精品综合| 久久久国产欧美日韩av| 精品午夜福利在线看| 涩涩av久久男人的天堂| 亚洲精品色激情综合| 亚洲图色成人| 亚洲综合色惰| 久久久久久久亚洲中文字幕| 亚洲精品色激情综合| 国产精品麻豆人妻色哟哟久久| 亚洲一级一片aⅴ在线观看| 亚洲av在线观看美女高潮| 日本wwww免费看| 久久久久久人妻| 久久精品久久久久久噜噜老黄| 中文字幕亚洲精品专区| 国产伦精品一区二区三区视频9| 国产一级毛片在线| 视频区图区小说| 九九爱精品视频在线观看| 亚洲欧洲国产日韩| 在线观看人妻少妇| 国产欧美另类精品又又久久亚洲欧美| 美女中出高潮动态图| 亚洲内射少妇av| 久久精品熟女亚洲av麻豆精品| 精品一区二区免费观看| 久久久久久久亚洲中文字幕| 精品久久久久久久久av| kizo精华| xxxhd国产人妻xxx| 亚洲经典国产精华液单| 日韩免费高清中文字幕av| 中文字幕人妻丝袜制服| 久久久久精品性色| 国产极品天堂在线| 国产69精品久久久久777片| 欧美日韩成人在线一区二区| 免费黄色在线免费观看| 国产一区二区三区av在线| 91精品国产九色| 少妇被粗大猛烈的视频| 老熟女久久久| xxx大片免费视频| 日韩视频在线欧美| 色哟哟·www| 亚洲人成网站在线观看播放| 成人漫画全彩无遮挡| 日日摸夜夜添夜夜添av毛片| 美女xxoo啪啪120秒动态图| 国产伦理片在线播放av一区| av国产精品久久久久影院| 国产精品.久久久| 大片免费播放器 马上看| 日韩熟女老妇一区二区性免费视频| 久久韩国三级中文字幕| 高清午夜精品一区二区三区| 简卡轻食公司| 久久99蜜桃精品久久| 国产无遮挡羞羞视频在线观看| 日本午夜av视频| 女的被弄到高潮叫床怎么办| 亚洲国产精品专区欧美| 男人添女人高潮全过程视频| 久久ye,这里只有精品| 高清视频免费观看一区二区| av在线播放精品| 亚洲av二区三区四区| 精品国产国语对白av| 免费观看av网站的网址| 亚洲欧美一区二区三区国产| 国产午夜精品久久久久久一区二区三区| 亚洲国产欧美日韩在线播放| 久久久久久久久大av| 午夜福利视频在线观看免费| 国产国拍精品亚洲av在线观看| 国产午夜精品一二区理论片| xxxhd国产人妻xxx| 国产精品一区二区三区四区免费观看| 最近手机中文字幕大全| 肉色欧美久久久久久久蜜桃| 最近的中文字幕免费完整| 免费高清在线观看视频在线观看| 久热久热在线精品观看| 观看av在线不卡| 免费看av在线观看网站| 亚洲欧美成人综合另类久久久| 丁香六月天网| 国产精品免费大片| 日日摸夜夜添夜夜添av毛片| 美女福利国产在线| 九九在线视频观看精品| 亚洲欧美一区二区三区国产| av免费观看日本| 国产乱人偷精品视频| 国产成人免费观看mmmm| 欧美97在线视频| 成人亚洲欧美一区二区av| 日韩欧美精品免费久久| 两个人的视频大全免费| 韩国av在线不卡| 69精品国产乱码久久久| 乱人伦中国视频| 一级片'在线观看视频| 日韩在线高清观看一区二区三区| 在线观看美女被高潮喷水网站| 少妇的逼水好多| 日本av手机在线免费观看| 欧美最新免费一区二区三区| 中文乱码字字幕精品一区二区三区| 久久久午夜欧美精品| 亚洲精品456在线播放app| www.色视频.com| 国产淫语在线视频| 校园人妻丝袜中文字幕| 国产一区二区三区综合在线观看 | 欧美成人午夜免费资源| 国产精品秋霞免费鲁丝片| 国产高清三级在线| 久久久久人妻精品一区果冻| 国产在线免费精品| 日韩亚洲欧美综合| 国产精品无大码| 国产在线一区二区三区精| 国产国拍精品亚洲av在线观看| 中国美白少妇内射xxxbb| 国产精品久久久久久av不卡| 亚洲精品aⅴ在线观看| 欧美丝袜亚洲另类| 一级毛片 在线播放| 国产av一区二区精品久久| 啦啦啦中文免费视频观看日本| 熟女电影av网| 韩国av在线不卡| 免费播放大片免费观看视频在线观看| 欧美精品高潮呻吟av久久| 伦理电影免费视频| 亚洲经典国产精华液单| 国产精品久久久久久精品电影小说| 国产精品无大码| 涩涩av久久男人的天堂| 男女高潮啪啪啪动态图| 久久久久久久久久久免费av| 成人18禁高潮啪啪吃奶动态图 | 国产高清国产精品国产三级| 亚洲av二区三区四区| av女优亚洲男人天堂| 日本av免费视频播放| 精品亚洲乱码少妇综合久久| 男女高潮啪啪啪动态图| 久久久国产精品麻豆| 国产精品熟女久久久久浪| 一区二区三区精品91| 十八禁高潮呻吟视频| 日本猛色少妇xxxxx猛交久久| 亚洲久久久国产精品| 一本久久精品| 久久99精品国语久久久| 国产亚洲精品第一综合不卡 | a 毛片基地| 最黄视频免费看| 成人综合一区亚洲| 国产高清有码在线观看视频| 人妻夜夜爽99麻豆av| 丝袜在线中文字幕| 人人妻人人澡人人看| 国产淫语在线视频| 久久人人爽av亚洲精品天堂| 日本免费在线观看一区| 欧美丝袜亚洲另类| 爱豆传媒免费全集在线观看| 国产精品99久久久久久久久| av不卡在线播放| 日本av免费视频播放| 少妇精品久久久久久久| 色视频在线一区二区三区| 精品国产一区二区三区久久久樱花| 丝袜脚勾引网站| 久久热精品热| 狠狠精品人妻久久久久久综合| 高清av免费在线| 九草在线视频观看| 简卡轻食公司| 成人国产麻豆网| 久久精品熟女亚洲av麻豆精品| 国精品久久久久久国模美| 国产女主播在线喷水免费视频网站| 亚洲av综合色区一区| 在线观看三级黄色| 国产在线视频一区二区| 亚洲国产色片| 视频区图区小说| 赤兔流量卡办理| 午夜91福利影院| 亚洲av国产av综合av卡| 精品亚洲成a人片在线观看| 99九九线精品视频在线观看视频| 国产精品久久久久久久电影| 亚洲成人一二三区av| 精品午夜福利在线看| 十八禁网站网址无遮挡| 亚洲国产精品成人久久小说| 成人国产麻豆网| 久久毛片免费看一区二区三区| 好男人视频免费观看在线| 最新的欧美精品一区二区| 丁香六月天网| 久久久久久久精品精品| 人成视频在线观看免费观看| 黑人巨大精品欧美一区二区蜜桃 | 熟女人妻精品中文字幕| 九九久久精品国产亚洲av麻豆| 97超碰精品成人国产| 婷婷色综合www| 制服诱惑二区| 久久精品熟女亚洲av麻豆精品| 久久国产亚洲av麻豆专区| 亚洲精品亚洲一区二区| 精品亚洲成a人片在线观看| 天堂8中文在线网| 天堂中文最新版在线下载| 欧美日韩亚洲高清精品| 国国产精品蜜臀av免费| 欧美日韩综合久久久久久| 日韩一区二区三区影片| 亚洲精品色激情综合| 国产欧美亚洲国产| 最近2019中文字幕mv第一页| 七月丁香在线播放| 十八禁网站网址无遮挡| 熟女人妻精品中文字幕| 久久久久久伊人网av| 久久久久久久久久成人| 亚洲国产色片| 菩萨蛮人人尽说江南好唐韦庄| 亚洲国产精品999| 国产老妇伦熟女老妇高清| 少妇人妻 视频| 少妇的逼水好多| 春色校园在线视频观看| 少妇被粗大猛烈的视频| 国产成人午夜福利电影在线观看| 国模一区二区三区四区视频| 国产精品偷伦视频观看了| 中文字幕久久专区| 好男人视频免费观看在线| 亚洲精品亚洲一区二区| 国产高清三级在线| 日日摸夜夜添夜夜爱| 亚洲精品久久久久久婷婷小说| 天天影视国产精品| 免费观看无遮挡的男女| 蜜臀久久99精品久久宅男| 成人综合一区亚洲|