方 倩,竇永香,王幫金
(西安電子科技大學 信息管理系,陜西 西安 710071)
基于Web of Science的社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)研究綜述
方 倩,竇永香,王幫金
(西安電子科技大學 信息管理系,陜西 西安 710071)
社會化媒體是一種新型在線媒體,發(fā)現(xiàn)并研究其中的社區(qū)有利于揭示社會化媒體環(huán)境下信息傳播與共享的特點和規(guī)律。該文基于Web of Science檢索得到的文獻數(shù)據,使用CiteSpace、SATI、UCINET等科學知識圖譜軟件,從共被引文獻、關鍵詞及突現(xiàn)詞等角度構建了社會化媒體環(huán)境下有關社區(qū)發(fā)現(xiàn)的科學知識圖譜,并對該領域的研究現(xiàn)狀、知識演進過程、研究熱點和研究前沿進行了可視化分析。
社會化媒體;社區(qū)發(fā)現(xiàn);科學知識圖譜;Web of Science
以博客、微博、多媒體共享網站等為代表的社會化媒體(social media)近年來受到廣泛關注和應用,較之傳統(tǒng)媒體,它具有參與性、公開性、交互性、社區(qū)化和連通性等特點。人們在使用社會化媒體的過程中形成了種種關系,例如,微博中的關注關系、社交網絡中的好友關系、在線商店中因共同購買或評論產品結成的共同興趣關系等。社會化媒體網絡中的社會關聯(lián)關系普遍存在著群集特性,可以形成不同的群組,同一個群組內部的個體之間關系相對密切,不同群組的個體之間關系相對較弱。在社會網絡分析中,把個體看作節(jié)點,關系看作邊,群組視為社區(qū)(community)[1]。發(fā)現(xiàn)這些潛在的社區(qū)對于信息傳播規(guī)律的研究、精準營銷、信息推薦、網絡輿情監(jiān)測等應用領域具有十分重要的意義。因此,如何在大規(guī)模社會網絡中挖掘出社區(qū)結構就成為一個熱門的研究課題,吸引了眾多學者的關注。
本文利用Web of Science數(shù)據庫中有關社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)的文獻數(shù)據,以CiteSpace、SATI、UCINET作為工具,通過聚類視圖(cluster views)和時區(qū)視圖(time-zone views)、關鍵詞共現(xiàn)的知識圖譜,對該研究領域的研究國家和機構、理論演進路徑、研究熱點和前沿等進行了可視化分析。
以Web of Science中有關社會化媒體中社區(qū)發(fā)現(xiàn)的引文索引作為數(shù)據來源,檢索式為: (TS=((social media)AND(communit*AND(discover*OR decet* OR identif*)))),文獻類型為Article,語言為English,時間跨度為1995年到2014年,檢索日期為2014年5月15日,共檢索到574篇相關英文文獻記錄,包括題目、摘要和被引文獻等。每條文獻記錄代表一篇引文,每條記錄中的參考文獻稱為被引文獻。將題錄數(shù)據導入CiteSpace,選擇時間為2004年到2014年(檢索到的文獻最早發(fā)表于2004年),時間間隔為兩年;引文數(shù)量、共引頻次和共引系數(shù)(C,CC,CCV)閾值分別設置為(2,2,20)、(4,3,20)、(3,3,20);修剪(PRUNING)項選擇(Pathfinder) 將合并的網絡進行精簡。
顯示一個學科或知識領域在一定時期發(fā)展的趨勢與動向可借助陳超美博士開發(fā)的信息可視化軟件CiteSpaceII,其獨到的創(chuàng)新之處在于用其繪制的科學知識圖譜,能夠顯示一個學科或知識領域在一定時期發(fā)展的趨勢與動向,形成若干研究前沿領域的演進歷程[2]。一個領域的研究熱點問題可借助浙江大學劉啟元開發(fā)的文獻題錄信息分析工具(SATI)[3]。新近發(fā)表的文章雖然沒有足夠的引文,而CiteSpaceII中的Kleinberg突變檢測算法卻可以識別出突然涌現(xiàn)出的專業(yè)術語(burst terms),依據詞頻的變動趨勢來確定該領域的研究前沿。因此,借助科學知識圖譜軟件旨在對社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)研究的知識演進過程、研究熱點與前沿進行定量考察和可視化分析,通過繪制科學知識圖譜來分析該領域的研究現(xiàn)狀。
3.1 時間分布
在2004年到2014年間,社會化媒體領域有關社區(qū)發(fā)現(xiàn)研究的論文數(shù)量變化趨勢如圖1所示,該領域發(fā)表的文獻在2007年之前相對來說較少,基本上為個位數(shù),從2008年開始有了較大幅度的增長, 2010年之后增長迅速,從整體上看呈現(xiàn)出穩(wěn)步增加的趨勢,并且在2013年達到所有考察年份最高(136篇)??梢酝茢嘣擃I域的研究已經受到相關學者的重視,且發(fā)展勢頭良好。
圖1 2004-2014年Web of Science中社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)領域文獻數(shù)量分布
3.2 空間地域分布
通過繪制本領域研究國家和機構圖譜,分析各國及機構在該領域的實力分布以及國家、機構之間的相互關系。將數(shù)據集導入到CiteSpace中,并將節(jié)點類型(Node Types)設置為國家(Country)和機構 (Institution),進行聚類分析得到一個由173個節(jié)點和151條邊構成本領域的研究國家及機構圖譜,如圖2所示[只顯示了發(fā)文頻次排名前十的國家(地區(qū))和機構名稱],并在表1中列出了網絡中發(fā)文頻次排名前十的國家(地區(qū))及機構。
圖2 社會化媒體中社區(qū)發(fā)現(xiàn)研究的國家(地區(qū))及機構圖譜
圖2顯示了進行社會化媒體中社區(qū)發(fā)現(xiàn)研究的主要國家(地區(qū))和機構,圖中帶有圓圈的節(jié)點是中間中心性較大的節(jié)點。從圖中節(jié)點中間中心性可以看出美國、中國、意大利、德國、法國、西班牙中間中心性均大于0.1且依次降低,說明在整個網絡中美國、中國、意大利是該領域研究成果最具有影響力的國家,其次是英格蘭、德國、法國、西班牙。從發(fā)文頻次上看,美國、中國對整個領域貢獻相對突出,也是研究最活躍的國家。其中美國和意大利起步最早,中國、英格蘭、法國、加拿大和西班牙相對較晚。在整個國家及機構網絡中發(fā)文頻次最多的機構是西安電子科技大學、中國科學院、英國劍橋大學等。
表1 社會化媒體中社區(qū)發(fā)現(xiàn)研究的高產國家及機構分布(Frequence≥13)
關鍵節(jié)點是共被引文獻網絡中連接兩個以上聚類簇、具有橋梁作用的節(jié)點,其點度中心性較高。從知識理論的角度看,關鍵節(jié)點文獻通常是在該領域中提出重大理論或是創(chuàng)新概念的文獻,也是最容易引起新的研究前沿熱點的關鍵文獻。通過對共被引文獻進行知識圖譜分析,可以尋找某學科或研究領域的關鍵經典文獻及演化動力[4]。將CiteSpace中節(jié)點類型為被引文獻(Cited Reference)和突現(xiàn)詞(Burst Terms),得到一個由共被引文獻和突現(xiàn)詞構成的混合時區(qū)網絡圖(圖3)。通過共被引頻數(shù)和中心性大小從網絡中識別出該研究的關鍵文獻。
從圖3中找出中心性大于0.1的節(jié)點,關鍵節(jié)點文獻信息見表2。
圖3 共被引文獻和突現(xiàn)詞圖譜(時區(qū)視圖)
表2 關鍵節(jié)點文獻信息列表(按中心性排序,中心性≥0.1)
續(xù)表
通過對文獻信息分析,關鍵節(jié)點均是對社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)研究領域的發(fā)展起到關鍵作用的人物及其代表文獻。從年代順序上分析這十篇關鍵節(jié)點文獻,可梳理出代表該領域研究的知識基礎和核心理論演進路徑。
利用社會網絡圖分析社區(qū)結構的思想最早來源于1994年Wasserman等學者的著作Socialnetworkanalysis:methodsandapplications,書中對社會網絡分析方法進行了詳細闡述,并將社區(qū)結構視為一張人際關系網絡,其中“節(jié)點”(node)代表代表人,“連線”(line)代表人與人之間的關系[1],以社會網絡分析方法來分析社區(qū)結構特征,這一觀點也為學者們研究社會化媒體環(huán)境下進行社區(qū)發(fā)現(xiàn)奠定了基礎。
20世紀90年代以來,以Internet為代表的信息技術的迅猛發(fā)展使人類社會大步邁入了網絡時代。美國康奈爾大學理論和應用力學系的博士生Watts及其導師、非線性動力學專家Strogatz教授于1998年6月在Nature雜志上發(fā)表“‘小世界’網絡的集體動力學”揭示了復雜網絡具有較短的平均最短路徑長度和較高的聚類系數(shù),并建立了介于規(guī)則網絡和隨機網絡之間的一種小世界網絡模型[5]。美國Notre Dame大學物理系Barabasi教授及其博士生Albert于1999年10月在Science雜志上發(fā)表的題為“隨機網絡中標度的涌現(xiàn)”,揭示了復雜網絡的無標度性質[6],并提出了無標度網絡模型。這兩篇開創(chuàng)性的文章可以看作是復雜網絡研究新紀元開始的標志。這兩篇文章經Google學術搜索分別被引用超過 22 974、20 138余次(檢索于2014-7-1),其理論的重要價值可見一斑。這些復雜網絡代表性模型的提出,對進入新世紀的社會化媒體網絡的研究發(fā)展有重要意義。社區(qū)屬于復雜網絡的一部分,具有復雜網絡所擁有的“小世界”和“無標度”特征,小世界現(xiàn)象揭示的稀疏隨機長連接伴隨豐富的局部連接的網絡結構特征,本質上就是社區(qū)結構的一種闡釋,而清晰的社區(qū)結構可能是小世界現(xiàn)象產生的條件之一。
1999年由美國Albert,Jeong和Barabasi教授共同在Nature雜志上發(fā)表文章“萬維網的直徑”,描述了萬維網這樣一個大規(guī)模的網絡結構,并構建了萬維網拓撲模型[7],這篇文章彌補了網絡拓撲結構研究的空白。社區(qū)結構也是整個網絡拓撲結構的一部分,這篇文章為學者們研究大規(guī)模網絡的社區(qū)結構提供了重要的參考。
美國密歇根大學物理系教授Newman M. E. J.多年致力于利用分析、實證以及計算機模擬相結合的方法研究網絡的結構和功能, 特別是社會網絡和信息網絡的研究。他于2001年發(fā)表在美國國家科學院院刊上的“科研合作網絡的結構”,提出科研合作網絡也呈現(xiàn)出“小世界”特性,并證明該網絡服從冪律分布[8]。隨著對網絡性質的物理意義和數(shù)學特性的深入研究,人們發(fā)現(xiàn)許多實際網絡都具有一個共同性質——社團結構。2002年,Girvan和Newman在PNAS上發(fā)表的文章研究了社會網絡和生物網絡中的社區(qū)結構,從而拉開了網絡社區(qū)結構研究的序幕。這篇文獻首次把網絡社區(qū)結構作為網絡普遍具有的拓撲特征提出,并提出了一種基于邊介數(shù)(edge betweenness)的分裂式層次聚類算法(G-N算法)來識別網絡的社區(qū)結構[9]。2004年,Newman和Girvan提出了著名的模塊度(modularity)函數(shù)作為衡量網絡劃分的質量標準,并揭示了網絡中的社團結構,認為整個網絡是由若干個“群(group)”或“團(cluster)”構成的。群內節(jié)點之間的連接相對緊密,而各個群之間的連接卻相對比較稀疏,這一論斷對于了解社區(qū)結構和分析社區(qū)特性具有極為重要的意義[10]。模塊度的提出大大推動了社區(qū)結構的研究,并為研究者們提供了一個目標函數(shù),用于衡量網絡劃分的效果,使模塊度優(yōu)化很快成為社區(qū)發(fā)現(xiàn)算法的主流。
針對現(xiàn)有社區(qū)發(fā)現(xiàn)算法均未對社區(qū)進行定量定義問題,Radicchi等人于2004年在PNAS上的一篇論文中用強社區(qū)和弱社區(qū)兩種方式對社區(qū)進行了定義,從而為確定社區(qū)結構提供了一種衡量標準[11]。Newman對現(xiàn)有的社區(qū)發(fā)現(xiàn)算法已經取得的進展進行了總結概括[12],對傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法(如譜平分法、K-L算法、基于相似度的層次聚類算法等),以及現(xiàn)有的一些新算法(如G-N算法和模塊度最大化算法等)的優(yōu)點和缺點進行了對比分析,對后續(xù)學者在進行社區(qū)發(fā)現(xiàn)算法選擇時提供了重要依據。
2005年,匈牙利科學院Palla等人發(fā)現(xiàn),在真實社區(qū)結構之間普遍存在重疊節(jié)點,這些節(jié)點在不同社區(qū)間起著橋梁作用,是社區(qū)間信息擴散的媒介和社區(qū)演化的推手。而傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法中,每個節(jié)點屬于且僅屬于一個社區(qū),社區(qū)之間不允許重疊。鑒于上述問題,他在Nature提出了一種派系過濾(CPM)重疊社區(qū)發(fā)現(xiàn)算法[13]。隨后,社區(qū)間的重疊現(xiàn)象才逐漸受到關注。截至目前,該算法仍然是重疊社區(qū)發(fā)現(xiàn)方法中應用最廣泛的方法之一,被廣泛應用到生物、信息、社會等網絡上。
通過上述關鍵節(jié)點文獻分析可以了解到有關社區(qū)發(fā)現(xiàn)研究的歷史演進過程,可以看出,社會化媒體環(huán)境下的社區(qū)發(fā)現(xiàn)最早使用的是社會網絡分析方法,理論基礎源于復雜網絡的“小世界模型”和“無標度模型”,并將復雜網絡理論和方法延伸和應用到社會化媒體的大規(guī)模網絡環(huán)境中。隨著研究的深入,改進算法不斷被提出,社區(qū)重疊現(xiàn)象被發(fā)現(xiàn),這些現(xiàn)象表明社區(qū)發(fā)現(xiàn)研究一直受到研究者們的廣泛關注,而且被不斷地改進和完善。
5.1 研究熱點分析
文獻的關鍵詞是文章的核心與精髓,是作者對文章主題的高度概括和凝練,有很強的代表性。利用SATI對檢索到的文章的關鍵詞的共現(xiàn)情況進行統(tǒng)計分析,然后結合UCINET將文獻間關鍵詞共現(xiàn)關系轉化為關系矩陣,生成可視化的網絡關系圖,再對各點進行中心性分析,每一個節(jié)點代表一個關鍵詞,共現(xiàn)頻次高的節(jié)點在網絡中的中心性越大,在網絡中的重要性也越高,從而能較為直觀的顯示該領域的研究熱點。
使用SATI軟件在574篇文獻中抽取出154個共現(xiàn)關鍵詞,并對其進行共現(xiàn)頻次統(tǒng)計。表3列出了頻次大于6的16個高頻關鍵詞,從表3中可以明顯看出目前社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)領域出現(xiàn)頻次最高的是社交網絡(Social network(s)),出現(xiàn)頻率高達113次。除社交網絡外,主要熱點詞匯還有社會網絡分析(social network analysis)、動態(tài)網絡(dynamic network)、復雜網絡(complex network(s))、重疊社區(qū)(overlapping community(s))、數(shù)據挖掘(data mining)、在線社交網絡(online social network(s))等。從關鍵詞知識圖譜和高頻詞匯列表可以發(fā)現(xiàn)并推斷該領域的研究熱點。
表3 高頻關鍵詞
由于頻次小于4的關鍵詞較多,代表性相對較低,去除了頻次小于4的關鍵詞,選取了頻次大于4的47個關鍵字,利用SATI工具構建47×47的高頻關鍵詞共現(xiàn)矩陣,并將該矩陣導入UCINET的NETDRAW中,利用Centrality measures分析得到該領域高頻關鍵詞共現(xiàn)圖譜(圖4)。圖4中每一個節(jié)點表示一個關鍵詞,節(jié)點越大表示該點的中心性越大,節(jié)點的大小表示該關鍵詞在網絡中的重要程度。
從圖4可以看到,節(jié)點的大小與表3中的關鍵詞貢獻次數(shù)呈現(xiàn)正相關關系,處于圖譜中間的關鍵詞是目前研究較熱也較成熟的研究熱點,如在社交網絡中進行社區(qū)發(fā)現(xiàn)、動態(tài)網絡中的社區(qū)發(fā)現(xiàn)及演化、用社會網絡分析方法進行社區(qū)發(fā)現(xiàn)、引用復雜網絡進行社區(qū)發(fā)現(xiàn)等。而處于圖譜邊緣的節(jié)點則是目前學者們正在關注的研究熱點,但還不是很成熟,如在線社交網絡(如Micro-blog、Twitter等)中的社區(qū)發(fā)現(xiàn)、社區(qū)演化、在社區(qū)中研究信息傳播的規(guī)律,以及對節(jié)點進行排名、新的社區(qū)發(fā)現(xiàn)算法的提出、多模網絡中的社區(qū)發(fā)現(xiàn)等。
圖4 社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)高頻關鍵詞共現(xiàn)圖譜
5.2 研究前沿分析
對社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)研究的關鍵詞共現(xiàn)情況進行分析可以得到目前該領域的研究熱點,研究前沿被定義為一組突現(xiàn)概念及其潛在問題的研究現(xiàn)狀。新近發(fā)表的文章由于沒有足夠的引文而不能充分體現(xiàn)在關鍵詞共現(xiàn)圖譜中,因此確定一個領域的研究前沿就不能只依據關鍵詞的共現(xiàn)頻次。CiteSpace應用Kleinberg的突變檢測算法可以用于檢測一個學科內研究興趣的突然增長,不管文章被引用多少次,都能夠從中識別出突然涌現(xiàn)出的專業(yè)術語。因此,一個新的研究前沿,即使還沒有吸引足夠的引文,也能被識別出來。在CiteSpace中研究前沿是基于題目、摘要、系索詞(指標引文獻主題的單元詞或詞組)和文獻記錄的標識符中提取出的突變詞(burst terms)而確定的: 通過考察詞頻的時間分布,將其中頻次變化率高的詞檢測出來,依據詞頻的變動趨勢來確定該領域的研究前沿[14]。通過對突現(xiàn)詞進行聚類,得到突現(xiàn)詞時區(qū)聚類知識圖譜,見圖3,并統(tǒng)計前十個突現(xiàn)率最高的詞,見表4。
表4 突現(xiàn)詞列表
結合圖3和表4,得到目前該領域的研究前沿詞匯有: 重要節(jié)點(important role)、社區(qū)結構(community structure)、重疊節(jié)點(overlapping nodes)、推薦系統(tǒng)(recommend system)、實時社區(qū)發(fā)現(xiàn)(real time community detection)等。通過突現(xiàn)詞Burst值大小、快速增長的時間并結合共被引文獻圖譜中節(jié)點文獻進行分析,可以把社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)的研究前沿總結為以下幾類: (1)社會化媒體環(huán)境下包含重疊節(jié)點(overlapping nodes)的重疊社區(qū)發(fā)現(xiàn),如2013年第六屆國際研討會中討論了動態(tài)社交網絡中的重疊社區(qū)發(fā)現(xiàn)[15],以及根據社交網絡提供的位置信息來發(fā)現(xiàn)重疊社區(qū)[16];(2)移動社交網絡(mobile social networks)和在線社交網絡(online social networks)環(huán)境下的社區(qū)發(fā)現(xiàn)[17-18];(3)在大規(guī)模網絡中進行社區(qū)發(fā)現(xiàn)時,對現(xiàn)有社區(qū)算法的改進以及新算法(new algorithm)的提出,如標簽傳播算法等[19-20];(4)對社區(qū)進行實時檢測(real time community detection)及演化研究[21];(5)將社區(qū)發(fā)現(xiàn)和信息傳播、重要節(jié)點(important role)、推薦系統(tǒng)(recommend system)等應用結合起來,通過識別出個體所屬的社區(qū)進一步發(fā)現(xiàn)信息傳播的規(guī)律,對節(jié)點進行重要性或影響力排序,利用社區(qū)進行推薦服務等。這表明學者們開始關注社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)的應用價值。
本文基于Web of Science,通過使用CiteSpace、SATI、UCINET等軟件對社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)的研究進行了可視化分析,得到如下結論。
(1) 通過對該領域的研究國家(地區(qū))及機構進行分析,發(fā)現(xiàn)美國、中國、意大利是該領域研究成果最具有影響力的國家;美國、中國、英格蘭對整個領域貢獻較突出,是研究最活躍的國家,其中美國和意大利起步最早。對該領域貢獻最多的機構是西安電子科技大學、中國科學院、英國劍橋大學等。
(2) 通過對共被引文獻進行知識圖譜分析,找到該領域關鍵文獻,并對其理論基礎和演進歷程進行了分析,社會化媒體環(huán)境下社區(qū)發(fā)現(xiàn)最早使用的是社會網絡分析方法,理論基礎源于復雜網絡?,F(xiàn)有的算法基本思想多源于幾類經典社區(qū)發(fā)現(xiàn)算法,并在新環(huán)境下進行不斷改進。
(3) 對文章的關鍵詞進行分析,發(fā)現(xiàn)在社交網絡中進行社區(qū)發(fā)現(xiàn)是目前社會化媒體環(huán)境下的一個研究熱點,且除社交網絡外,目前在動態(tài)網絡中的實時社區(qū)發(fā)現(xiàn)及演化、用社會網絡分析方法進行社區(qū)發(fā)現(xiàn)、引用復雜網絡中算法進行社區(qū)發(fā)現(xiàn)研究等也是目前的研究熱點。
(4) 通過突現(xiàn)詞的時間分布和burst值結合對圖譜中的節(jié)點文獻進行分析,社會化媒體環(huán)境下的社區(qū)發(fā)現(xiàn)未來會關注: 考慮重疊節(jié)點、節(jié)點動態(tài)性的社區(qū)發(fā)現(xiàn);在社交網站、在線社交網絡和移動社交網絡環(huán)境下進行社區(qū)發(fā)現(xiàn);在大規(guī)模的網絡中進行社區(qū)發(fā)現(xiàn)及新的社區(qū)發(fā)現(xiàn)算法的研究。一些學者開始將社區(qū)發(fā)現(xiàn)和實際應用結合起來,關注社區(qū)發(fā)現(xiàn)的應用價值。
[1] Stanley Wasserman. Social network analysis: Methods and applications [M]. Structural analysis of the social sciences,1994: 249-290.
[2] 陳超美, 陳悅, 侯劍華, 等. CiteSpaceⅡ: 科學文獻中新趨勢與新動態(tài)的識別與可視化[J]. 情報學報, 2009,(3): 401-421.
[3] 劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現(xiàn): 以中外圖書情報學為例[J].信息資源管理學報,2012, (01): 50-58.
[4] 劉則淵. 科學知識圖譜: 方法與應用[G]//遼寧省哲學社會科學獲獎成果匯編[2007-2008年度], 2010: 4.
[5] Watts D J, Strogatz S H. Collective dynamics of “small-world” networks[J]. Nature, 1998, 393(6684): 440-442.
[6] Barabbas A L, Albert R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439): 509-512.
[7] Albert R, Jeong H, Barabási A L. Internet: diameter of the world-wide web[J]. Nature, 1999, 401(6749): 130-131.
[8] Newman M E J.The structure of scientific collaboration networks[J]. Proceedings of the National Academy of Sciences, 2001, 98(2): 404-409.
[9] Girvan M, Newman M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences, 2002, 99(12): 7821-7826.
[10] Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical review E, 2004, 69(2): 026113.
[11] Radicchi F, Castellano C, Cecconi F, et al. Defining and identifying communities in networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(9): 2658-2663.
[12] Newman M E J. Detecting community structure in networks[J]. The European Physical JournalB-Condensed Matter and Complex Systems, 2004, 38(2): 321-330.
[13] Palla G, Derényi I, Farkas I, et al. Uncovering the overlapping community structure of complex networks in nature and society[J]. Nature, 2005, 435(7043): 814-818.
[14] 侯海燕,劉澤淵,陳悅,等.當代國際科學學研究熱點演進趨勢知識圖譜[J].科研管理,2006(03): 90-96.
[15] Xu B, Deng L, Jia Y, et al. Overlapping Community Detection on Dynamic Social Network[C]//Computational Intelligence and Design (ISCID), 2013 Sixth International Symposium on. IEEE, 2013, 2: 321-326.
[16] Wang Z, Zhang D, Zhou X, et al. Discovering and Profiling Overlapping Communities in Location-Based Social Networks[J]. IEEE Transactions on Systems Man & Cybernetics Systems, 2014,44(4): 499-509.
[17] Bu Z, Zhang C, Xia Z, et al. A fast parallel modularity optimization algorithm (FPMQA) for community detection in online social network[J]. Knowledge-Based Systems, 2013, 50: 246-259.
[18] Xu H, Hu Y, Wang Z, et al. Core-Based Dynamic Community Detection in Mobile Social Networks[J]. Entropy, 2013, 15(12): 5419-5438.
[19] Lancichinetti A, Kivel? M, Saram?ki J, et al. Characterizing the Community Structure of Complex Networks[J]. Plos One, 2012, 5(8): e11976.
[20] Capocci A, Servedio V D P, Colaiori F, et al. Preferential attachment in the growth of social networks: The internet encyclopedia Wikipedia[J]. Physical Review E, 2006, 74(3): 036116.
[21] Greene D, Doyle D, Cunningham P. Tracking the Evolution of Communities in Dynamic Social Networks[C]//Proceedings of International Conference on Advances in Social Networks Analysis and Mining, Asonam 2010, Odense, Denmark, August. DBLP, 2010: 76-183.
OverviewofCommunityDetectinginSocialMediaBasedonWebofScience
FANG Qian, DOU Yongxiang, WANG Bangjin
(Department of Information Management, Xidian University, Xi’an, Shaanxi 710071, China)
Social media is becoming a new online media, the detection and study of the community in which will contribute to the discovery of the pattern and characteristic of information transmission and sharing. In this paper, the knowledge map which focus on community detection in social media was built by some tools such as CiteSpace, SATI and UCINET based on the data from Web of Science. From the perspective of cited references, key words and burst terms, the research status, knowledge evolution process, research hotspot and front were also be analyzed using visual charts.
social media; community detection; scientific knowledge map; Web of Science
方倩(1989—),碩士研究生,主要研究領域為信息管理、知識管理。
竇永香(1976—),博士,教授,主要研究領域為信息檢索、知識工程與管理。
王幫金(1988—),碩士研究生,主要研究領域為物流信息系統(tǒng)、企業(yè)信息管理。
1003-0077(2017)03-0001-08
2014-09-10定稿日期: 2015-03-20
國家自然科學基金(71003080);中央高校基本科研業(yè)務費專項資金(BDY241413)
TP391
: A