◆劉 巖 顧益軍 張大瀚
(中國(guó)人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院 北京 102623)
基于節(jié)點(diǎn)相似度的個(gè)人網(wǎng)絡(luò)社交圈發(fā)現(xiàn)算法改進(jìn)研究
◆劉 巖 顧益軍 張大瀚
(中國(guó)人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院 北京 102623)
隨著互聯(lián)網(wǎng)和在線社交平臺(tái)的飛速發(fā)展,社會(huì)網(wǎng)絡(luò)開始發(fā)展壯大起來,針對(duì)社會(huì)網(wǎng)絡(luò)的研究也變得越來越熱門。特別是在大數(shù)據(jù)時(shí)代,社會(huì)網(wǎng)絡(luò)研究的價(jià)值和意義也將越來越大。個(gè)人網(wǎng)絡(luò)是一種特殊的社會(huì)網(wǎng)絡(luò),針對(duì)個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法研究意義重大。各種社交平臺(tái)基本都允許用戶將其朋友手動(dòng)劃分到不同的社交圈中,但是對(duì)個(gè)人網(wǎng)絡(luò)社交圈進(jìn)行自動(dòng)劃分的方法研究十分稀少,不斷變龐大、變復(fù)雜的個(gè)人網(wǎng)絡(luò)致使對(duì)其社交圈發(fā)現(xiàn)算法研究的難度也在不斷提高。Julian等人于2012年首先提出了基于概率模型的個(gè)人網(wǎng)絡(luò)社交圈發(fā)現(xiàn)算法(DSCEN算法),實(shí)驗(yàn)證明該算法可以有效發(fā)現(xiàn)個(gè)人網(wǎng)絡(luò)中的社交圈,并允許社交圈存在重疊、嵌套。本文在研究DSCEN算法的基礎(chǔ)上,加入節(jié)點(diǎn)相似度因素對(duì)算法進(jìn)行改進(jìn),并同時(shí)考慮屬性相似度和拓?fù)湎嗨贫缺WC節(jié)點(diǎn)相似度的準(zhǔn)確性。通過實(shí)驗(yàn)驗(yàn)證,改進(jìn)后的算法具有更好的效果。
個(gè)人網(wǎng)絡(luò);社交圈發(fā)現(xiàn);DSCEN算法;節(jié)點(diǎn)相似度
在現(xiàn)實(shí)生活中,人與人之間進(jìn)行著各種各樣的活動(dòng),產(chǎn)生多種多樣的聯(lián)系,并且通過這些活動(dòng)和聯(lián)系形成了復(fù)雜多樣的社交網(wǎng)絡(luò)。我們將社會(huì)個(gè)體通過活動(dòng)和聯(lián)系形成的相對(duì)穩(wěn)定的網(wǎng)絡(luò)稱為社會(huì)網(wǎng)絡(luò)[1]。隨著互聯(lián)網(wǎng)的發(fā)展,特別是以Facebook、Twitter、QQ、微博、微信等為代表的在線社交平臺(tái)的興起,使得社會(huì)網(wǎng)絡(luò)變得復(fù)雜多變,動(dòng)輒成千上萬的網(wǎng)絡(luò)節(jié)點(diǎn)和連接給社會(huì)網(wǎng)絡(luò)的分析帶來了巨大的挑戰(zhàn)[2]。
圖1 個(gè)人網(wǎng)絡(luò)示意圖
個(gè)人網(wǎng)絡(luò)是指以一個(gè)獨(dú)立的節(jié)點(diǎn)(即個(gè)人)為中心,包含其所有相鄰節(jié)點(diǎn)和他們之間的連接,由此形成的網(wǎng)絡(luò)為個(gè)人網(wǎng)絡(luò)。個(gè)人網(wǎng)絡(luò)的特點(diǎn)就是在網(wǎng)絡(luò)中有一個(gè)節(jié)點(diǎn)為中心,網(wǎng)絡(luò)中的其他所有節(jié)點(diǎn)都與該節(jié)點(diǎn)存在連接,如圖1所示即為一個(gè)個(gè)人網(wǎng)絡(luò)(其中698號(hào)節(jié)點(diǎn)為中心節(jié)點(diǎn))?,F(xiàn)實(shí)社會(huì)中,每個(gè)人都不是一個(gè)孤立的個(gè)體,而是總會(huì)與其他人保持關(guān)聯(lián),這樣每個(gè)人都會(huì)有自己的社交網(wǎng)絡(luò),并且隨著人類活動(dòng)的推進(jìn),個(gè)人網(wǎng)絡(luò)也在時(shí)刻發(fā)生著改變。特別是在互聯(lián)網(wǎng)已經(jīng)深入到人類生活方方面面的信息時(shí)代,隨著各種在線社交平臺(tái)的興起、壯大,傳統(tǒng)的社交模式正經(jīng)歷著翻天覆地式的變革,個(gè)人網(wǎng)絡(luò)開始變得越來越復(fù)雜。
雖然各種在線社交平臺(tái)基本都會(huì)提供社交圈的劃分功能,對(duì)用戶維護(hù)自己的社交圈和個(gè)人網(wǎng)絡(luò)起到了巨大的作用。但其社交圈的劃分基本上是由用戶手工劃定,費(fèi)時(shí)費(fèi)力,并且在個(gè)人網(wǎng)絡(luò)不斷變化的同時(shí),社交圈的劃分不能做到及時(shí)自動(dòng)更新。同時(shí),個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)具有很大的研究?jī)r(jià)值,主要有以下幾點(diǎn):[3]
(1)有助于用戶對(duì)自己的社交圈和個(gè)人網(wǎng)絡(luò)的維護(hù)和及時(shí)更新;
(2)有助于深入理解個(gè)人網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和本質(zhì),發(fā)現(xiàn)其中的隱藏規(guī)律,預(yù)測(cè)網(wǎng)絡(luò)行為,分析網(wǎng)絡(luò)的發(fā)展過程,從而對(duì)個(gè)人網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)有更深刻直觀的了解;
(3)有助于深入探索個(gè)人網(wǎng)絡(luò)中節(jié)點(diǎn)之間的邏輯關(guān)系,展現(xiàn)網(wǎng)絡(luò)中節(jié)點(diǎn)的聚集情況;
(4)公安機(jī)關(guān)對(duì)個(gè)人網(wǎng)絡(luò)中社交圈的分析和發(fā)現(xiàn)可以充分準(zhǔn)確的挖掘社會(huì)個(gè)體尤其是犯罪嫌疑人的個(gè)人信息和社交網(wǎng)絡(luò),進(jìn)而發(fā)現(xiàn)犯罪團(tuán)伙的組織架構(gòu),給破案帶來極大的幫助。
為此,本文將在前人的研究基礎(chǔ)上,提出一種針對(duì)個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法,并利用該算法有效的得到個(gè)人網(wǎng)絡(luò)中的各個(gè)社交圈。該算法發(fā)現(xiàn)的社交圈模型應(yīng)具有以下三點(diǎn)性質(zhì):[4]
(1)同一社交圈內(nèi)的各個(gè)節(jié)點(diǎn)必須有相似的性質(zhì)或?qū)傩裕?/p>
(2)不同社交圈應(yīng)該是由不同的性質(zhì)或?qū)傩孕纬傻模?/p>
(3)社交圈應(yīng)該允許重疊、嵌套現(xiàn)象發(fā)生。
目前,社區(qū)發(fā)現(xiàn)算法的研究比較多,但針對(duì)個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法研究相對(duì)較少,個(gè)人網(wǎng)絡(luò)是一種特殊的社會(huì)網(wǎng)絡(luò),有著其特有的性質(zhì),在社交圈發(fā)現(xiàn)過程中需要進(jìn)行特定的研究。Julian等人于2012年提出了個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法(DSCEN算法)[4],首先關(guān)注并研究了個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法。2014年,Julian等人采用MCMC方法對(duì)DSCEN算法進(jìn)行改進(jìn),提出MCMCS_SCD算法[5],大大降低了時(shí)間復(fù)雜度。黃佳鑫等人在MCMCS_SCD算法的基礎(chǔ)上提出SCD_MCMCS_LCD算法[6],加入局部模塊度和節(jié)點(diǎn)間緊密度因素,降低了算法時(shí)間復(fù)雜度的同時(shí)也提高了算法的準(zhǔn)確度。本文將著重研究DSCEN算法,在該算法的基礎(chǔ)上加入節(jié)點(diǎn)相似度因素,提高算法的準(zhǔn)確度。
在DSCEN算法中,首先定義個(gè)人網(wǎng)絡(luò)),(EVG=,其中V指節(jié)點(diǎn)的集合,E指邊的集合。接著定義G中任意兩個(gè)節(jié)點(diǎn)x、y之間存在連接的概率,公式如下:
其中kθ表示社交圈kC的特征向量,),(yxφ表示節(jié)點(diǎn)x、y之間的屬性向量。由公式(1),可得到在社交圈集為C情況下關(guān)于G的對(duì)數(shù)似然函數(shù),即公式(2):
該算法的最終目的是使公式(2)最大,這樣就可以保證劃分的社交圈集C最優(yōu)。從而將個(gè)人網(wǎng)絡(luò)G的社交圈識(shí)別問題轉(zhuǎn)化為求對(duì)數(shù)似然函數(shù)即公式(2)的最大值問題。
在社交圈識(shí)別過程中,為了求得公式(2)的最優(yōu)值,通常在給定社交圈集kCC(即除kC外的其他社交圈集)條件下,求kC的最優(yōu)值,公式如下:
在對(duì)社交圈kC的kα值和特征向量kθ進(jìn)行優(yōu)化時(shí)采用了L-BFGS算法,這是一種典型的擬牛頓法[10],分別對(duì)kθ和kα進(jìn)行求偏導(dǎo),公式如下:
在DSCEN算法中,根據(jù)公式(1)我們可以看出,在定義G中兩個(gè)節(jié)點(diǎn)間存在邊的概率時(shí),僅考慮了G的社交圈劃分以及節(jié)點(diǎn)間的屬性向量、社交圈的特征向量三方面的因素,而對(duì)兩個(gè)節(jié)點(diǎn)間的其他屬性考慮較少,特別是對(duì)節(jié)點(diǎn)間存在邊的概率影響較大的節(jié)點(diǎn)相似度因素并未考慮在內(nèi)。
在社會(huì)網(wǎng)絡(luò)分析中,節(jié)點(diǎn)相似度是用來衡量節(jié)點(diǎn)與節(jié)點(diǎn)之間相似程度一個(gè)重要指標(biāo),我們認(rèn)為,兩個(gè)節(jié)點(diǎn)的相似度越高,節(jié)點(diǎn)之間存在連接的可能性也就越大,即節(jié)點(diǎn)間存在連接的概率應(yīng)與節(jié)點(diǎn)相似度成正比[11]。所以公式(1)可以進(jìn)行如下改進(jìn):
其中,),(yxs表示節(jié)點(diǎn)x與節(jié)點(diǎn)y的相似度。在社會(huì)網(wǎng)絡(luò)分析中,兩節(jié)點(diǎn)的相似度不僅與這兩個(gè)節(jié)點(diǎn)的屬性相關(guān),還與這兩個(gè)節(jié)點(diǎn)所處的局部網(wǎng)絡(luò)環(huán)境相關(guān),因此,在分析兩個(gè)節(jié)點(diǎn)的相似度時(shí),不能單一地考慮節(jié)點(diǎn)屬性或節(jié)點(diǎn)所處的環(huán)境因素,而應(yīng)該將能影響節(jié)點(diǎn)相似度的因素進(jìn)行綜合考慮,這樣得出的節(jié)點(diǎn)相似度才能越接近真實(shí)值。根據(jù)節(jié)點(diǎn)屬性和局部網(wǎng)絡(luò)環(huán)境因素,定義公式如下:
其中),(yxfs表示節(jié)點(diǎn)x和y之間的屬性相似度,),(yxts表示節(jié)點(diǎn)x和y的拓?fù)湎嗨贫萚12]。在計(jì)算兩節(jié)點(diǎn)的屬性相似度時(shí),用余弦相似度來計(jì)算[13]。在計(jì)算兩個(gè)節(jié)點(diǎn)之間的拓?fù)湎嗨贫葧r(shí),用Jaccard相似度來計(jì)算[14]。
其中N(x)和N(y)表示節(jié)點(diǎn)x和y的鄰居節(jié)點(diǎn),Jaccard相似度表明,當(dāng)兩個(gè)節(jié)點(diǎn)擁有的共同鄰居在兩節(jié)點(diǎn)所有鄰居中所占的比重越大時(shí),這兩個(gè)節(jié)點(diǎn)的相似度就越高[15]。通常情況下,節(jié)點(diǎn)x的鄰居節(jié)點(diǎn)不包含節(jié)點(diǎn)本身x,這就導(dǎo)致那些相連但沒有公共鄰居節(jié)點(diǎn)的節(jié)點(diǎn)相似度為0,可以將節(jié)點(diǎn)本身包括在它們的鄰居節(jié)點(diǎn)中來進(jìn)行糾正。
由以上的分析,可推導(dǎo)出在DSCEN算法中公式(2)改進(jìn)如下:
公式(4)、(5)可改進(jìn)如下:
公式(3)改進(jìn)如下:
對(duì)公式(6)、(7)的改進(jìn)如下:
3.1 算法的評(píng)估指標(biāo)
在DSCEN算法中,用平衡誤差率[4](Balanced Error Rate,BER)和1F分?jǐn)?shù)[4]作為指標(biāo)來評(píng)估算法的準(zhǔn)確度,當(dāng)算法預(yù)測(cè)的社交圈集為,真實(shí)社交圈集為時(shí),平衡誤差率和1F分?jǐn)?shù)的公式分別如下:
由于預(yù)測(cè)的社交圈個(gè)數(shù)與真實(shí)的社交圈個(gè)數(shù)之間可能存在差異,在進(jìn)行實(shí)驗(yàn)評(píng)估時(shí),首先需要對(duì)預(yù)測(cè)的社交圈和真實(shí)的社交圈進(jìn)行線性匹配,找到預(yù)測(cè)社交圈集C和真實(shí)社交圈集的一個(gè)映射f,通過公式(20)和公式(21)來分別計(jì)算預(yù)測(cè)社交圈集C和真實(shí)社交圈集的(1-BER)值和F1分?jǐn)?shù)。
3.2 實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)數(shù)據(jù)采用斯坦福大學(xué)SNAP(Stanford Network Analysis Project)小組提供的Facebook數(shù)據(jù)集,該數(shù)據(jù)集共包含了10個(gè)用戶的個(gè)人網(wǎng)絡(luò),總共4039個(gè)用戶和193個(gè)社交圈,平均每個(gè)用戶擁有19個(gè)社交圈,每個(gè)社交圈平均有22個(gè)好友。本文中的實(shí)驗(yàn)選取了其中4個(gè)規(guī)模不同的個(gè)人網(wǎng)絡(luò),其中1號(hào)個(gè)人網(wǎng)絡(luò)中有348個(gè)用戶節(jié)點(diǎn),2號(hào)個(gè)人網(wǎng)絡(luò)中有228個(gè)用戶節(jié)點(diǎn),3號(hào)個(gè)人網(wǎng)絡(luò)中有160個(gè)用戶節(jié)點(diǎn),4號(hào)個(gè)人網(wǎng)絡(luò)中有171個(gè)用戶節(jié)點(diǎn)。
3.3 實(shí)驗(yàn)方案
本論文將采取對(duì)比實(shí)驗(yàn)的方法。實(shí)驗(yàn)中,首先進(jìn)行兩組對(duì)比實(shí)驗(yàn),用以確定相似度公式中參數(shù)β的值。這兩組實(shí)驗(yàn)分別設(shè)置K=3和K=5,然后取}1,75.0,5.0,25.0,0{=β這五個(gè)數(shù)值進(jìn)行實(shí)驗(yàn),比較各組實(shí)驗(yàn)結(jié)果,確定最優(yōu)β值。
在確定β值后,接下來就需要進(jìn)行實(shí)驗(yàn)分析改進(jìn)后的DSCEN算法的效果。對(duì)這4個(gè)不同的個(gè)人網(wǎng)絡(luò),分別取}15,10,3{=K進(jìn)行實(shí)驗(yàn),將改進(jìn)后算法的實(shí)驗(yàn)結(jié)果與原DSCEN算法的實(shí)驗(yàn)結(jié)果進(jìn)行分析比較。在實(shí)驗(yàn)中,除進(jìn)行對(duì)比分析需要修改的實(shí)驗(yàn)參數(shù)外,其他的實(shí)驗(yàn)參數(shù)均采用原DSCEN算法中的推薦參數(shù)。
3.4 實(shí)驗(yàn)結(jié)果和分析
圖2和圖3是當(dāng)K=3,β取不同值時(shí),對(duì)不同的個(gè)人網(wǎng)絡(luò)進(jìn)行社交圈識(shí)別后的1F分?jǐn)?shù)和(1-BER)的結(jié)果。圖4和圖5是當(dāng)K=5,β取不同值時(shí),各網(wǎng)絡(luò)的1F分?jǐn)?shù)和(1-BER)的結(jié)果。從這四個(gè)圖中,可以明顯地看出當(dāng)β取不同值時(shí)對(duì)實(shí)驗(yàn)結(jié)果將產(chǎn)生重要的影響,并且對(duì)于不同的個(gè)人網(wǎng)絡(luò),不同的β值對(duì)算法準(zhǔn)確性的影響也是各不相同的。例如當(dāng)K=5時(shí),對(duì)于3號(hào)個(gè)人網(wǎng)絡(luò)來說,β=0.75時(shí)算法的準(zhǔn)確性更高,而對(duì)于4號(hào)個(gè)人網(wǎng)絡(luò)而言β=0.25時(shí)算法準(zhǔn)確性更高。
綜合考慮實(shí)驗(yàn)中不同的個(gè)人網(wǎng)絡(luò),計(jì)算各個(gè)網(wǎng)絡(luò)的平均1F分?jǐn)?shù)和平均(1-BER)值,可以發(fā)現(xiàn):對(duì)于K=3和K=5這兩組實(shí)驗(yàn),當(dāng)β=0.25或0.75時(shí),實(shí)驗(yàn)結(jié)果中的平均1F分?jǐn)?shù)和(1-BER)都比較高,即算法的準(zhǔn)確性更高。需要注意的是,這并不是肯定的結(jié)果,由于個(gè)人網(wǎng)絡(luò)千差萬別,針對(duì)特定個(gè)人網(wǎng)絡(luò)的社交圈劃分,都應(yīng)有一個(gè)最優(yōu)的β值,這里采取平均效果較好的β=0.25和0.75進(jìn)行接下來的對(duì)比實(shí)驗(yàn)。
圖2 β取不同值時(shí)1F分?jǐn)?shù)比較(K=3)
圖3 β取不同值時(shí)(1-BER)比較(K=3)
圖4 β取不同值時(shí)1F分?jǐn)?shù)比較(K=5)
圖5 β取不同值時(shí)(1-BER)比較(K=5)
確定了β值后,接下來需要進(jìn)行實(shí)驗(yàn)比較分析改進(jìn)后的DSCEN算法的性能。根據(jù)實(shí)驗(yàn)方案,分別取}15,10,3{=K,進(jìn)行實(shí)驗(yàn),將改進(jìn)后算法的實(shí)驗(yàn)結(jié)果與原DSCEN算法的實(shí)驗(yàn)結(jié)果進(jìn)行比較。圖6、圖7、圖8為實(shí)驗(yàn)結(jié)果圖。從圖中,可以明顯地觀察到對(duì)于大部分的個(gè)人網(wǎng)絡(luò)而言,改進(jìn)后的算法的不論是在1F分?jǐn)?shù)還是在(1-BER)上都有了一定的提升,但由于改進(jìn)后的算法準(zhǔn)確度很大程度上需要依賴于β值的設(shè)置和優(yōu)化。同時(shí)由于考慮到個(gè)人隱私問題,用戶在社交平臺(tái)上注冊(cè)的屬性信息往往是不完整并存在虛假信息情況,致使在計(jì)算節(jié)點(diǎn)的屬性相似度時(shí)存在誤差,進(jìn)而影響了整個(gè)算法的準(zhǔn)確度。所以,在個(gè)別網(wǎng)絡(luò)中也存在改進(jìn)后的算法準(zhǔn)確度低于原算法的情況。但是從總體上來看,即從平均結(jié)果來看,改進(jìn)后的算法準(zhǔn)確度較原算法還是有一定提升的。
圖6 K=3時(shí)改進(jìn)后算法與DSCEN算法的性能比較
圖7 K=10時(shí)改進(jìn)后算法與DSCEN算法的性能比較
圖8 K=15時(shí)改進(jìn)后算法與DSCEN算法的性能比較
隨著互聯(lián)網(wǎng)的快速發(fā)展,在線社交平臺(tái)的不斷壯大,個(gè)人網(wǎng)絡(luò)已經(jīng)發(fā)生了翻天覆地的變化,從線下到線上,個(gè)人網(wǎng)絡(luò)變得越來越龐大,也越來越復(fù)雜,但是針對(duì)個(gè)人網(wǎng)絡(luò)的研究甚少,尤其是對(duì)個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)的研究更少。
本文主要研究了針對(duì)個(gè)人網(wǎng)絡(luò)的社交圈發(fā)現(xiàn)算法——DSCEN算法,并在此基礎(chǔ)上提出了改進(jìn)方案,綜合考慮了節(jié)點(diǎn)間的相似度因素。通過實(shí)驗(yàn),驗(yàn)證了改進(jìn)后的算法在社交圈發(fā)現(xiàn)的準(zhǔn)確性上比原算法有所提高。
在實(shí)驗(yàn)中,改進(jìn)后的算法準(zhǔn)確度很大程度上依賴于β的取值情況,而對(duì)于不同的個(gè)人網(wǎng)絡(luò),最優(yōu)β值往往又是不相同的,以后還需要對(duì)最優(yōu)β值的確定做進(jìn)一步的研究討論。
[1]劉軍.社會(huì)網(wǎng)絡(luò)分析導(dǎo)論[M].社會(huì)科學(xué)文獻(xiàn)出版社,2004.
[2]孫迎友.復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)的狀態(tài)估計(jì)方法研究[D].南京郵電大學(xué),2014.
[3]辛佰惠.基于MMSB的加權(quán)社交網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)算法研究[D].電子科技大學(xué),2014.
[4]McAuley J J,Leskovec J.Learning to Discover Social Circles in Ego Networks[C]//NIPS,2012.
[5]Mcauley J,Leskovec J.Discovering social circles in egonetworks[J].ACM Transactions on Knowledge Discovery from Data(TKDD),2014.
[6]黃佳鑫,郭紅,郭昆.基于影響簇選擇模型和 MCMC采樣的社交圈子識(shí)別算法[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2015.
[7]班艷麗,柴喬林,王琛.基于能量均衡的 ZigBee 網(wǎng)絡(luò)樹路由算法[J].計(jì)算機(jī)應(yīng)用,2008.
[8]Kolmogorov V,Rother C.Minimizing nonsubmodular functions with graph cuts-a review[J].Pattern Analysis and Ma chine Intelligence,IEEE Transactions on,2007.
[9]Boros E,Hammer P L.Pseudo-boolean optimization[J].Discrete applied mathematics,2002.
[10]Nocedal J.Updating quasi-Newton matrices with limit ed storage[J].Mathematics of computation,1980.
[11]張健沛,姜延良.一種基于節(jié)點(diǎn)相似性的鏈接預(yù)測(cè)算法[J].中國(guó)科技論文,2013.
[12]王玙,高琳.基于社交圈的在線社交網(wǎng)絡(luò)朋友推薦算法[J].計(jì)算機(jī)學(xué)報(bào),2014.
[13]張滬寅,溫春艷,劉道波,等.改進(jìn)的基于本體的語義相似度計(jì)算[J].計(jì)算機(jī)工程與設(shè)計(jì),2015.
[14]王林澍.社會(huì)網(wǎng)絡(luò)中的鏈接分析與預(yù)測(cè)研究[D].哈爾濱工程大學(xué),2013.
[15]張宏志.社會(huì)網(wǎng)絡(luò)中社團(tuán)發(fā)現(xiàn)算法研究[D].湘潭大學(xué),2013.
[16]趙一甲.社會(huì)網(wǎng)絡(luò)中社團(tuán)發(fā)現(xiàn)算法研究[D].電子科技大學(xué),2013.