陳 亮 謝洪明 朱卓越
(1 浙江工業(yè)大學管理學院,杭州 310023;2 廣州大學工商管理學院,廣州 510006;3 浙江金融職業(yè)學院工商管理學院,杭州 310018)
復雜網(wǎng)絡是復雜性科學的一個重要分支[1]。隨著復雜網(wǎng)絡理論及其應用研究范圍的拓展,在復雜網(wǎng)絡的形成機制、演化規(guī)律和動力學上吸引了大量的研究,形成了復雜性研究的交叉學派、系統(tǒng)動力學派、混沌理論學派、自適應系統(tǒng)學派和結構學派。國際上也組成了以Barabasi;Watts、Dodds;Arthur、Newman、Strogatza等學者為代表的研究團隊,涵蓋了社會網(wǎng)絡分析問題及國際貿(mào)易網(wǎng)絡、跨國并購行為等領域。較好地解釋了“復雜網(wǎng)絡與現(xiàn)實的邏輯關系”“復雜網(wǎng)絡的作用機制”和“復雜網(wǎng)絡對實踐的指導”等一系列問題。
復雜網(wǎng)絡應用屬于典型的跨學科研究,現(xiàn)有研究中仍存在一些不足。首先,復雜網(wǎng)絡與各學科的交叉融合產(chǎn)生了大量研究,但仍缺少以時間為節(jié)點對文獻進行系統(tǒng)性梳理和挖掘,從而在研究過程中容易忽略復雜網(wǎng)絡與其他要素之間的互動關系。其次,各種網(wǎng)絡和系統(tǒng)的不斷演化以及涌現(xiàn)對傳統(tǒng)基于新結構的認知模式提出了新的挑戰(zhàn)。這就引起了對復雜網(wǎng)絡研究軌跡的思考,以此來了解復雜網(wǎng)絡的研究熱點和發(fā)展趨勢。
通過對文獻進行科學篩選、統(tǒng)計和整理,采用文獻計量分析方法,繪制知識圖譜,從整體上把握所選主題的研究動態(tài),并在此基礎上考察相應文獻出現(xiàn)的前后邏輯關系,詮釋復雜網(wǎng)絡研究的演進情況和前沿熱點,是對開展復雜網(wǎng)絡研究的補充。
文獻檢索采用Web of Science數(shù)據(jù)庫平臺核心合集。檢索主題詞為“complex network”,檢索時間段為2000—2018年,設定為“全記錄并且包含所引用的參考文獻”進行輸出,文獻類別包括管理、經(jīng)濟、商業(yè)領域,初步檢索為903篇。在應用Citespace進行分析前先進行數(shù)據(jù)清洗以保證數(shù)據(jù)的可靠性,對檢索結果去重、整理,刪除期刊會議征稿、書評以及無關鍵詞等信息的條目,剔除明顯偏離研究主題的文章,最終得到676篇相關文獻,作為文獻知識圖譜分析的原始數(shù)據(jù)。
1.2.1 年度發(fā)文量分析
特定領域的年度文獻數(shù)量可以反映其研究熱度。復雜網(wǎng)絡研究的文獻在2000年后,如圖1所示。2000—2006年仍處于研究探索期,文獻數(shù)量較少且緩慢增長。2006—2011年為平穩(wěn)增長期,文獻有了小幅度增長,學者的群體開始擴大,研究內容也開始拓展,但總體增速較慢。2012—2018年為快速增長期,復雜網(wǎng)絡成為學術研究熱點,大量文獻開始涌現(xiàn),發(fā)文量占比81.8%。對每年的發(fā)文量采用指數(shù)函數(shù)進行擬合,研究增長曲線擬合度高,研究量級呈指數(shù)型增長??傮w來看,其間發(fā)文數(shù)量雖然出現(xiàn)過小幅度回落,但始終保持上升趨勢,這樣的時間演化趨勢也符合事物發(fā)展的一般規(guī)律。
圖1 2000—2018年復雜網(wǎng)絡研究樣本文獻統(tǒng)計圖
1.2.2 國家(地區(qū))發(fā)文統(tǒng)計
從全球范圍內對某一內容的研究情況進行分析,有利于拓寬國際視野和把握前沿脈絡。根據(jù)作者的國(地區(qū))籍進行地域劃分,選擇排名前10的國家(地區(qū))進行分析,如表1所示。發(fā)文數(shù)量上中美兩國遠遠領先于其他國家,占總發(fā)文量的57%,兩國對復雜網(wǎng)絡的關注度較高。但中國的文獻中心度相對美國較低,缺乏具有重要影響力的國際性論文,研究水平和影響力亟須進一步提高。同時,世界各國間也應加強學術間的交流與合作,提升復雜網(wǎng)絡在各領域研究與應用的整體水平。圖2為復雜網(wǎng)絡國家圖譜。顏色從深到淺表示時間從遠到近的變化,節(jié)點的半徑與該節(jié)點的出現(xiàn)頻次呈正比,節(jié)點間連線的粗細程度代表合作網(wǎng)絡的關聯(lián)強度。國家間的合作網(wǎng)絡由32個節(jié)點、115條連接邊形成,密度達到0.151 2,各國之間的存在學術合作。但是節(jié)點間的連接線比較細,國家間的合作還沒有形成比較固定的集中趨勢,這與復雜網(wǎng)絡的應用范圍廣有一定的關系。
1.2.3 關鍵詞的圖譜分析:熱點與趨勢
關鍵詞是文章主體的高度概括和凝練,的核心和精髓,因此對相關研究領域文獻的關鍵詞進行分析,有助于挖掘和發(fā)現(xiàn)該領域的研究熱點。采用被引頻次、中心度和突現(xiàn)值來分析研究熱點及前沿。
是文章表1 國家(地區(qū))發(fā)文量前10及中心性
圖2 復雜網(wǎng)絡研究的國家圖譜
根據(jù)閾值設置顯示了排名靠前的文獻關鍵詞共現(xiàn)網(wǎng)絡,節(jié)點的大小與關鍵詞出現(xiàn)的頻次成正比,節(jié)點之間的連線表示關鍵詞之間的共現(xiàn)關系,線條的顏色和粗細程度分別代表共現(xiàn)的時間先后以及關聯(lián)強度。從圖3中可見,“complex network”與其他關鍵詞之間的關系最為緊密,出現(xiàn)的頻率最高,這說明復雜網(wǎng)絡不僅是從研究視角還是研究方法上都占據(jù)著相當重要的地位,是學術界關注的熱門研究領域。
圖3 復雜網(wǎng)絡研究關鍵詞共現(xiàn)網(wǎng)絡
在關鍵詞共現(xiàn)網(wǎng)絡中用中心度來表示對整個研究網(wǎng)絡中的重要性,較好的規(guī)避了低頻但重要關鍵詞的忽略問題,如表2顯示頻次和中心度前10關鍵詞的對比。中心度排名前10的關鍵詞都達到了0.15以上,“transmission”和“complex network”的中心度最高,在整個復雜網(wǎng)絡的研究中處于核心位置,對于維系整個研究網(wǎng)絡的穩(wěn)定具有非常重要的作用,但是“transmission”的頻率在網(wǎng)絡中只有9,說明對復雜網(wǎng)絡的傳輸動力學研究很重要但是現(xiàn)有的研究成果還相對缺乏。通過對比高頻和高中心度關鍵詞,50%重疊率說明復雜網(wǎng)絡的研究內容同時也是研究熱點。
表2 復雜網(wǎng)絡研究文獻高頻和高中心度前10關鍵詞比較
突變是用于檢測一個學科研究內在短期時間內發(fā)生的變化程度,反映了該領域的研究前沿。表3顯示了復雜網(wǎng)絡研究中具有最強引用突變值的關鍵詞,并根據(jù)突變開始的年份由遠及近從上到下進行排序,色塊表示關鍵詞突變強度較高的年份,越靠近下方的研究主題就越前沿。三個高頻突現(xiàn)詞按照時間順序聯(lián)結并且有重疊,代表了復雜網(wǎng)絡的研究在相應年份里的熱點轉向,也反映了復雜網(wǎng)絡研究在整體時段內的成長趨勢。但是這3個關鍵詞的突變沒有延續(xù),表明目前復雜網(wǎng)絡的研究遇到一定瓶頸或研究熱點逐漸分散。
關鍵詞聚類以共詞分析形成的矩陣為基礎,通過聚類原理采用相應算法對高頻關鍵詞間的關聯(lián)進行整合,對主題聚類進行整理匯總,有助于識別復雜網(wǎng)絡研究領域中代表性的子群。聚類模塊值(Modularity Q)和聚類平均輪廓值(Mean Silhouette)是反映聚類邊界清晰度和聚類規(guī)模的兩個指標。圖4中聚類模塊值為0.601 9,表明復雜網(wǎng)絡各研究主題間界限清楚,領域分化比較顯著,但聚類平均輪廓值為0.400 3,稍低于合理值0.5,這是因為復雜網(wǎng)絡的研究角度多樣,與不同學科間形成交叉,研究的范式差異較大,從而導致了眾多小聚類的出現(xiàn)。其中一些聚類持續(xù)的時間相對較短,也許是由于該主題深入研究的價值不足或是在研究過程中出現(xiàn)了新的理論和方法而轉向了另一研究主題。為更清晰顯示主要聚類,設置“Filter out small clusters”,最終結果如圖4所示,并對前3個聚類進行分析。
圖4 復雜網(wǎng)絡研究關鍵詞聚類知識圖譜
#0聚類:該聚類提取的標簽有complex network(復雜網(wǎng)絡);social network(社會網(wǎng)絡);viral marketing(病毒式營銷);network dynamics(網(wǎng)絡動力學)等。社會學家最早將復雜系統(tǒng)看作網(wǎng)絡進行研究,這也是二者研究的有力結合點。社會網(wǎng)絡和復雜網(wǎng)絡的研究都起源于數(shù)學中的圖論,二者在研究思路、研究角度和研究方法上存在很大的交集,呈現(xiàn)出較多的關聯(lián)性[2]。
結構決定功能是系統(tǒng)科學的基本觀點,復雜網(wǎng)絡研究中最首要也是最基礎的就是結構問題。社會網(wǎng)絡分析中利用核心中心性等靜態(tài)幾何量及多層次網(wǎng)絡等分析方法形成復雜網(wǎng)絡研究的基礎,復雜網(wǎng)絡側重從各種實際網(wǎng)絡的現(xiàn)象之上抽象出一般的網(wǎng)絡拓撲性質,并用這些性質來指導更多實際網(wǎng)絡的研究,進而發(fā)展網(wǎng)絡模型的一般方法,最后討論網(wǎng)絡本身的形成機制。需要指出的是,復雜網(wǎng)絡的統(tǒng)計特征也會隨著研究的深入產(chǎn)生新的問題。借鑒龐加萊的“剖分”思想,從圈結構的視角出發(fā),把網(wǎng)絡分解為全齊性子網(wǎng)絡,并提出向量空間作為表示網(wǎng)絡的新方法。無標度特性作為復雜網(wǎng)絡的一個重要特征,冪律分布又是唯一滿足無標度條件的概率分布函數(shù)。但目前學術界對無標度網(wǎng)絡的定義本身和相關結論產(chǎn)生了更多的爭議,一些學者質疑無標度屬性的普遍性,并反駁社會網(wǎng)絡或互聯(lián)網(wǎng)是無標度的假設,其中一個原因就是異質性和低維度的視角還不足以完全理解復雜網(wǎng)絡結構和行為。但可以肯定的是,沒有學者對復雜網(wǎng)絡研究的重要性提出質疑,只是提出了對某些方法的關注。
表3 復雜網(wǎng)絡研究中的3個主要突變詞
#1聚類:該聚類提取的標簽有complex network(復雜網(wǎng)絡);network topology(網(wǎng)絡拓撲);maritime transport(海運);social capital(社會資本);modeling(建模)等。網(wǎng)絡是嵌入在特定的幾何結構中,網(wǎng)絡節(jié)點同時存在于可視網(wǎng)絡和隱藏于網(wǎng)絡可視拓撲之下的幾何空間中。除了定性的描述外,更多的學者致力于定量的方法來計算各種系統(tǒng)的復雜程度,從而比較不同系統(tǒng)復雜程度的大小。目前比較成熟的包括規(guī)則網(wǎng)絡、隨機網(wǎng)絡、小世界網(wǎng)絡和無標度網(wǎng)絡,另外層級網(wǎng)絡模型和確定性網(wǎng)絡模型也成為研究熱點。
在傳統(tǒng)研究模型的基礎上,Newman提出的網(wǎng)絡模塊更加形象地描述了網(wǎng)絡節(jié)點間的拓撲關系以及網(wǎng)絡的功能結構。在網(wǎng)絡模塊的研究中,一個非常關鍵的問題是如何評價網(wǎng)絡模塊劃分結果。聚類模塊被認為是經(jīng)典的模塊結構度量標準,但隨著研究的深入,其定義方式造成的固有局限性引起了廣泛關注,學者們因此提出了全新的度量方法,包括Fitness度量標準[3]和Benchmark模型[4]等。這些度量方式各有優(yōu)劣勢,但尚未存在一個完全公認的最好的方法,這也是這一研究方向受到關注的原因之一。
#2聚類:該聚類提取的標簽有complex network(復雜網(wǎng)絡);airport network(航空網(wǎng)絡);network structure(網(wǎng)絡結構);stock returns(股票收益)。復雜網(wǎng)絡理論所具備的復雜結構、鏈接多樣性、網(wǎng)絡演化、動力學復雜性等融合的特點均可映射到現(xiàn)實網(wǎng)絡的結構上,而網(wǎng)絡結構對于信息的傳播又具有決定性作用。研究復雜網(wǎng)絡的最終目標是理解網(wǎng)絡拓撲結構對其上的動力學過程的影響,需要建立一個緊密聯(lián)系其拓撲結構與傳輸功能的機制,應用于流行病傳播、輿論傳播、交通控制等研究,重點考察網(wǎng)絡的可靠性、穩(wěn)健性、傳播性和同步性,所以拓撲結構也就必然成為復雜網(wǎng)絡研究的基礎。
復雜網(wǎng)絡的跨學科研究以及知識的交叉融合使得研究主題越來越多元化,這為后續(xù)的研究工作帶來了空間。借助可視化軟件,通過對搜集的文獻進行研讀和計量分析發(fā)現(xiàn),研究力量主要分布在中美兩國,但是中國的文獻影響力還相對欠缺,研究熱點主要聚焦于網(wǎng)絡拓撲特征及網(wǎng)絡結構、網(wǎng)絡模型和動力學研究。在此基礎上,構建了復雜網(wǎng)絡應用研究的基本框架,如圖5所示。從研究方法、數(shù)學模型、網(wǎng)絡演化等方面更加精確和完整地描述復雜系統(tǒng),對微觀到宏觀網(wǎng)絡結構的演化、網(wǎng)絡信息的挖掘和預測以及時空網(wǎng)絡的演化研究上相對比較缺乏[5],這將成為復雜系統(tǒng)研究的最大挑戰(zhàn)。因此,本文也提出復雜網(wǎng)絡的研究展望,未來的研究工作可以集中在以下幾個方面展開,如圖5中斜體部分所示。
圖5 復雜網(wǎng)絡應用研究基本框架
隨著大數(shù)據(jù)及網(wǎng)絡科學的發(fā)展,在不同領域復雜網(wǎng)絡新的特征向量必然還會有新的發(fā)現(xiàn),一些融合網(wǎng)絡拓撲及動力學特征的中心性定義方法也被逐漸提出,如通過節(jié)點的信息、物質或能量流量來評估節(jié)點的重要程度。但這些變量能否全面反映真實網(wǎng)絡的復雜性?描述普遍的復雜網(wǎng)絡需要多少獨立的統(tǒng)計參量?是否還有更加重要的統(tǒng)計性質尚未發(fā)現(xiàn)?通過局部網(wǎng)絡的研究能否正確反映整個網(wǎng)絡的特性還需要進一步來實證。同時,也可以對多個統(tǒng)計向量之間的函數(shù)關系進行研究,這在當前的研究中還是比較缺乏的。
為什么社會網(wǎng)絡、技術網(wǎng)絡和生物網(wǎng)絡的拓撲特性很不一樣?網(wǎng)絡中發(fā)生的動力學過程怎樣影響網(wǎng)絡的拓撲結構?在現(xiàn)有統(tǒng)計描述的基礎上,還需要物理和信息等更多的描述,發(fā)展定性與定量結合的分析方法,開展更廣泛的實證研究,通過充分必要條件和門檻值來加強對網(wǎng)絡結構的辨識,這將有助于刻畫復雜網(wǎng)絡的主要特征和加深對復雜網(wǎng)絡的理解。
復雜網(wǎng)絡理論與實際網(wǎng)絡結合分析的過程中也出現(xiàn)了許多困難,如超大規(guī)模的網(wǎng)絡、物聯(lián)網(wǎng)等還無法通過精確的復雜網(wǎng)絡模型來分析。研究復雜網(wǎng)絡的拓撲性質、網(wǎng)絡的形成機制、演化的統(tǒng)計規(guī)律以及網(wǎng)絡上的模型性質,構建與之匹配的現(xiàn)實網(wǎng)絡演化模型,這也將成為未來復雜網(wǎng)絡研究的核心任務。隨著網(wǎng)絡科學理論研究的不斷深入,網(wǎng)絡科學應用研究也將圍繞更好地服務人類、提升人類生活質量這一核心來展開,未來在生命科學研究和基于互聯(lián)網(wǎng)的社會科學領域復雜網(wǎng)絡將有更大的研究空間。
根據(jù)現(xiàn)有的研究來看,直接從微觀節(jié)點到全網(wǎng)宏觀的結構把握是比較困難的,需要從中找到一個中間過渡的模塊結構。對具有較強模塊結構和模塊結構不太明顯的網(wǎng)絡而言,網(wǎng)絡上的動力學過程所表現(xiàn)出來的性質是不同的,需要重點關注復雜網(wǎng)絡模塊特性對網(wǎng)絡病毒傳播和網(wǎng)絡魯棒性的深層影響以及在知識發(fā)現(xiàn)和數(shù)據(jù)挖掘方面的應用。這些中間尺度結構的分布、在動力學過程中的作用,包括相同和不同的節(jié)點動力學下,分叉、混沌、陣發(fā)混沌及各種廣義同步的產(chǎn)生機制分析、控制和同步等問題。以及從微觀到中觀、從中觀到宏觀的演化和涌現(xiàn)過程,在復雜網(wǎng)絡中的動力學普適性和差異性問題還需要進一步研究。