黃麗亞 霍宥良 王青 成謝鋒
(南京郵電大學(xué),電子與光學(xué)工程學(xué)院,微電子學(xué)院,南京 210023)
(2018年7月19日收到;2018年11月8日收到修改稿)
結(jié)構(gòu)熵可以考察復(fù)雜網(wǎng)絡(luò)的異構(gòu)性.為了彌補(bǔ)傳統(tǒng)結(jié)構(gòu)熵在綜合刻畫網(wǎng)絡(luò)全局以及局部特性能力上的不足,本文依據(jù)網(wǎng)絡(luò)節(jié)點在K步內(nèi)可達(dá)的節(jié)點總數(shù)定義了K-階結(jié)構(gòu)熵,可從結(jié)構(gòu)熵隨K值的變化規(guī)律、最大K值下的結(jié)構(gòu)熵以及網(wǎng)絡(luò)能夠達(dá)到的最小結(jié)構(gòu)熵三個方面來評價網(wǎng)絡(luò)的異構(gòu)性.利用K-階結(jié)構(gòu)熵對規(guī)則網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、Watts-Strogatz小世界網(wǎng)絡(luò)、Barabási-Albert無標(biāo)度網(wǎng)絡(luò)以及星型網(wǎng)絡(luò)進(jìn)行了理論研究與仿真實驗,結(jié)果表明上述網(wǎng)絡(luò)的異構(gòu)性依次增強(qiáng).其中K-階結(jié)構(gòu)熵能夠較好地依據(jù)小世界屬性來刻畫小世界網(wǎng)絡(luò)的異構(gòu)性,且對星型網(wǎng)絡(luò)異構(gòu)性隨其規(guī)模演化規(guī)律的解釋也更為合理.此外,K-階結(jié)構(gòu)熵認(rèn)為在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點的網(wǎng)絡(luò)的異構(gòu)性弱于未添加孤立節(jié)點的規(guī)則結(jié)構(gòu),但強(qiáng)于同節(jié)點數(shù)的規(guī)則網(wǎng)絡(luò).本文利用美國西部電網(wǎng)進(jìn)一步論證了K-階結(jié)構(gòu)熵的有效性.
大量系統(tǒng)都可以使用復(fù)雜網(wǎng)絡(luò)進(jìn)行抽象的表達(dá)[1].復(fù)雜網(wǎng)絡(luò)各部分之間雖相互聯(lián)系,但通常存在著功能結(jié)構(gòu)上的差異[2,3].因此,對網(wǎng)絡(luò)異構(gòu)性的研究是分析節(jié)點重要性排序[4,5]、社區(qū)結(jié)構(gòu)劃分[6,7]以及網(wǎng)絡(luò)傳播效率、同步能力等[8,9]內(nèi)容的重要基礎(chǔ).通常,網(wǎng)絡(luò)異構(gòu)性是從拓?fù)浣Y(jié)構(gòu)的角度出發(fā),通過定義結(jié)構(gòu)熵予以定量評價.結(jié)構(gòu)熵越小,意味著網(wǎng)絡(luò)各部分間的差異越大,異構(gòu)性越強(qiáng);反之意味著網(wǎng)絡(luò)結(jié)構(gòu)越趨于均衡,異構(gòu)性越弱.目前,已有諸多研究[10-15]各自從不同的角度定義了網(wǎng)絡(luò)結(jié)構(gòu)熵.
Wu熵[10]以節(jié)點為主體,試圖通過分析網(wǎng)絡(luò)節(jié)點所擁有的邊的條數(shù),即各節(jié)點度值之間的差異來反映網(wǎng)絡(luò)的異構(gòu)性.而度分布結(jié)構(gòu)熵[11](下文簡稱DD熵)則以度值為主體,依據(jù)擁有不同度值的節(jié)點數(shù)量之間的差異,對網(wǎng)絡(luò)的異構(gòu)性進(jìn)行了刻畫.可見,以上兩種方法僅將鄰居節(jié)點納入評價體系,未考慮非鄰居節(jié)點的影響,因而刻畫網(wǎng)絡(luò)全局特性的能力較弱,且對“橋”連接節(jié)點的重視程度不足.此外,Wu熵難以充分地解釋網(wǎng)絡(luò)中出現(xiàn)孤立節(jié)點的情況.蔡萌等[12]提出了一種基于點和邊差異性的網(wǎng)絡(luò)結(jié)構(gòu)熵(下文簡稱SD熵),雖然將“點差異性”與“邊差異性”進(jìn)行加權(quán)求和,但其本質(zhì)仍是從網(wǎng)絡(luò)局部特性的角度出發(fā),且加權(quán)系數(shù)是人為設(shè)置的,結(jié)果較為主觀;此外,SD熵在計算節(jié)點相對重要性時,人為地引入了?項,缺少理論解釋.為了充分利用網(wǎng)絡(luò)的全局特性,文獻(xiàn)[13,14]以節(jié)點介數(shù)以及邊介數(shù)為判據(jù),定量地評價了網(wǎng)絡(luò)的異構(gòu)性(下文簡稱節(jié)點介數(shù)熵為NB熵;邊介數(shù)熵為EB熵).介數(shù)雖然突出了橋節(jié)點的重要性,但對網(wǎng)絡(luò)拓?fù)渲邪协h(huán)型或星型結(jié)構(gòu)的部分解釋不足.為了綜合評估網(wǎng)絡(luò)的局部以及全局特性,蔡萌等[15]又提出了一種基于最大流的網(wǎng)絡(luò)結(jié)構(gòu)熵,該方法使用網(wǎng)絡(luò)流量變化和節(jié)點度值的加權(quán)平均來計算網(wǎng)絡(luò)的異構(gòu)性,但仍存在權(quán)重的選擇較為主觀、對?項的解釋不足等問題;且當(dāng)網(wǎng)絡(luò)規(guī)模較大時,最大流矩陣的計算也十分復(fù)雜.此外,若網(wǎng)絡(luò)流量變化與節(jié)點度值量級不同,最終結(jié)果易受量級較大部分的影響.因此,尋找一種能夠綜合考查網(wǎng)絡(luò)全局以及局部特性的方便有效的異構(gòu)性評價方法是本研究的目的所在.
文獻(xiàn)[16,17]將網(wǎng)絡(luò)視為節(jié)點間相互作用的系統(tǒng),每個節(jié)點均處于其他所有節(jié)點產(chǎn)生的勢場之中.該方法假設(shè)網(wǎng)絡(luò)拓?fù)錇槎坛虉?并基于高斯勢函數(shù)定義了網(wǎng)絡(luò)拓?fù)鋭莺瘮?shù),通過比較各個節(jié)點所處位置勢場值的大小研究了節(jié)點重要性、社區(qū)劃分等網(wǎng)絡(luò)特性.但網(wǎng)絡(luò)勢程的長短以及勢函數(shù)的形式應(yīng)依網(wǎng)絡(luò)所代表的實際意義而各有不同,短程場以及高斯勢函數(shù)的假設(shè)均具有一定的局限性.
本研究試圖摒棄勢程長短、勢函數(shù)等額外假設(shè),僅利用網(wǎng)絡(luò)的結(jié)構(gòu)特性提出了一種K-階結(jié)構(gòu)熵模型,并對規(guī)則網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、WS(Watts-Strogatz)小世界網(wǎng)絡(luò)、BA(Barabási-Albert)無標(biāo)度網(wǎng)絡(luò)、星型網(wǎng)絡(luò)、在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點的網(wǎng)絡(luò)以及美國西部電網(wǎng)進(jìn)行了理論研究與仿真分析,以證明該結(jié)構(gòu)熵可以較好地反映不同網(wǎng)絡(luò)的異構(gòu)性.
首先給定無權(quán)無向網(wǎng)絡(luò)圖G(V,E),其中V={v1,v2,···,vn}為節(jié)點集,共n個節(jié)點,E為邊集,并假設(shè)lij為節(jié)點vi到vj的最短路徑長度.為了避免網(wǎng)絡(luò)有無自環(huán)在分析上造成的差異,本文假設(shè)節(jié)點0步即可到達(dá)該節(jié)點本身,定義節(jié)點的K-階鄰居數(shù)為
其中I(·)為指示函數(shù),即當(dāng)節(jié)點vi與vj之間的最短路徑長度lij6K時I(·)=1,否則I(·)=0. 由(1)式可知,對于任意節(jié)點有=1.
K-階鄰居數(shù)衡量了網(wǎng)絡(luò)節(jié)點在K步內(nèi)可達(dá)的節(jié)點總數(shù),本文將K值命名為影響力尺度.由于本文研究的網(wǎng)絡(luò)大小是有限的,顯然當(dāng)K大于網(wǎng)絡(luò)最大連通部分的直徑d時,各節(jié)點的K-階鄰居數(shù)均不再隨K值的變化而變化.因此K∈{0,1,···,d},并將d命名為最大影響力尺度.
若某節(jié)點的K-階鄰居數(shù)越多,可認(rèn)為該節(jié)點在尺度K下所影響的節(jié)點越多,節(jié)點則越重要.為了衡量網(wǎng)絡(luò)在尺度K下各節(jié)點影響力或重要性的差異,即網(wǎng)絡(luò)的異構(gòu)性,可將所有節(jié)點的K-階鄰居數(shù)加總代入到信息熵公式,從而得到K-階結(jié)構(gòu)熵為
由隨機(jī)矩陣?yán)碚摽芍?網(wǎng)絡(luò)鄰接矩陣A的k次冪Ak中的第i行、第j列元素表示從節(jié)點vi到vj通過k條邊連接的路徑數(shù)目.因此,(1)式可以改寫為
其中為矩陣Ak中的第i行、第j列元素.此處A0=E為單位陣,恰對應(yīng)于前文節(jié)點零步可達(dá)該節(jié)點自身這一假設(shè).
事實上,(3)式表示的是矩陣多項式A0+A1+中第i行或列向量(無向圖的鄰接矩陣A為對稱陣,則其多項式亦對稱)中非零元素的個數(shù),即L0范數(shù).于是(3)式可以改寫為
HK值越小,證明網(wǎng)絡(luò)在影響力尺度K下的異構(gòu)性越強(qiáng),反之越弱.
由前文可知,K的取值是有限的,因此在分析網(wǎng)絡(luò)異構(gòu)性時僅需研究K-階結(jié)構(gòu)熵序列{H0,H1,···,Hd}即可. 對任意網(wǎng)絡(luò)而言, 當(dāng)K=0時,各節(jié)點0步內(nèi)只可到達(dá)其本身,因此有H0=log(n);當(dāng)K=1時,各節(jié)點1步內(nèi)可達(dá)該節(jié)點本身及其鄰居節(jié)點,因此H1按各節(jié)點“度值加一”代入信息熵公式進(jìn)行計算,與Wu熵相似卻存在差異.若網(wǎng)絡(luò)是連通的,各節(jié)點在d步內(nèi)均可到達(dá)網(wǎng)絡(luò)任意節(jié)點,因此Hd=log(n);若網(wǎng)絡(luò)是非連通的,Hd將依網(wǎng)絡(luò)結(jié)構(gòu)而各不相同.此外,由于結(jié)構(gòu)熵序列是可列有限的,其最小值minH=min{H0,H1,···,Hd}可被認(rèn)為表征了網(wǎng)絡(luò)能夠達(dá)到的最強(qiáng)異構(gòu)性.綜上所述,在應(yīng)用K-階結(jié)構(gòu)熵模型研究網(wǎng)絡(luò)的異構(gòu)性時,應(yīng)綜合考察結(jié)構(gòu)熵序列隨K值的變化規(guī)律、Hd以及minH.
當(dāng)網(wǎng)絡(luò)為有向網(wǎng)絡(luò)時,可將上述K-階結(jié)構(gòu)熵演變?yōu)镵-階發(fā)送以及接收結(jié)構(gòu)熵兩部分進(jìn)行討論.此時,可以將由某節(jié)點出發(fā)、K步內(nèi)可達(dá)的節(jié)點總數(shù)(包含其自身)記為該節(jié)點的K-階發(fā)送節(jié)點數(shù),依此得到K-階發(fā)送結(jié)構(gòu)熵;同理可以計算出K-階接收結(jié)構(gòu)熵.顯然,K-階發(fā)送以及接收結(jié)構(gòu)熵分別衡量了網(wǎng)絡(luò)發(fā)、收能力的異構(gòu)性,分析時均應(yīng)予以考慮.當(dāng)網(wǎng)絡(luò)為有權(quán)網(wǎng)絡(luò)時,若網(wǎng)絡(luò)邊權(quán)表示節(jié)點間的路徑長度,在計算節(jié)點的K-階鄰居數(shù)時,只需按有權(quán)網(wǎng)絡(luò)路徑長度的方法進(jìn)行計算即可;若網(wǎng)絡(luò)權(quán)值表示節(jié)點間連接的強(qiáng)度時,則可選定某一閾值或者采用多閾值的方法將網(wǎng)絡(luò)進(jìn)行二值化處理,再利用上述方法進(jìn)行研究.
為了驗證K-階結(jié)構(gòu)熵評價網(wǎng)絡(luò)異構(gòu)性的能力,本文對規(guī)則網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)、星型網(wǎng)絡(luò)、在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點的網(wǎng)絡(luò)以及美國西部電網(wǎng)進(jìn)行了仿真分析.以下所有仿真結(jié)果均取500次實驗的平均值.
小世界網(wǎng)絡(luò)是指具有較大平均聚類系數(shù)以及較短特征路徑長度的一類網(wǎng)絡(luò)結(jié)構(gòu).Watts與Strogatz[18]最先提出了一種構(gòu)造小世界網(wǎng)絡(luò)的方法,即將最近鄰耦合網(wǎng)絡(luò)每條邊的一個端點保持不變,另外一個端點依概率p隨機(jī)改連至其他節(jié)點,通常將生成的網(wǎng)絡(luò)稱為WS小世界網(wǎng)絡(luò).當(dāng)p=0時,網(wǎng)絡(luò)為規(guī)則結(jié)構(gòu),其異構(gòu)性應(yīng)當(dāng)最弱;當(dāng)p=1時,網(wǎng)絡(luò)中任意兩節(jié)點依一定概率隨機(jī)連接,其網(wǎng)絡(luò)異構(gòu)性應(yīng)強(qiáng)于規(guī)則網(wǎng)絡(luò).值得注意的是,WS小世界網(wǎng)絡(luò)雖為規(guī)則與隨機(jī)網(wǎng)絡(luò)之間的過渡形式,其“主體”保持著最近鄰耦合結(jié)構(gòu),而個別節(jié)點卻擁有“長程”連接.但正是由于這些特殊節(jié)點的存在,使得網(wǎng)絡(luò)的特征路徑長度大大減少,起到了“橋”的作用.由此可見,WS小世界網(wǎng)絡(luò)中個別節(jié)點存在著連接上的突出優(yōu)勢,而隨機(jī)網(wǎng)絡(luò)各節(jié)點的連接狀態(tài)是相似的,因此可認(rèn)為WS小世界網(wǎng)絡(luò)的異構(gòu)性強(qiáng)于隨機(jī)網(wǎng)絡(luò).
下面基于K-階結(jié)構(gòu)熵模型從結(jié)構(gòu)熵隨K值的變化規(guī)律、網(wǎng)絡(luò)最強(qiáng)異構(gòu)性minH等角度對WS小世界網(wǎng)絡(luò)進(jìn)行考察.本文約定網(wǎng)絡(luò)隨機(jī)重連后不能有自環(huán)、重邊且仍為連通圖,易證Hd=H0=log(n).接下來,圖1和圖2分別仿真了50和200節(jié)點最近鄰耦合網(wǎng)絡(luò)在不同重連概率p下所生成網(wǎng)絡(luò)的結(jié)構(gòu)熵隨K值的變化規(guī)律,其中該最近鄰耦合網(wǎng)絡(luò)每個節(jié)點與其左右各2個鄰居節(jié)點相連.
顯然,最近鄰耦合網(wǎng)絡(luò)的結(jié)構(gòu)是對稱的,節(jié)點數(shù)為n的最近鄰耦合網(wǎng)絡(luò)的K-階結(jié)構(gòu)熵恒等于log(n),如圖1(a)和圖2(a)所示.由于隨機(jī)重連打破了網(wǎng)絡(luò)結(jié)構(gòu)的對稱性,在50及200節(jié)點網(wǎng)絡(luò)中均可觀察到,在任意重連概率p下,網(wǎng)絡(luò)結(jié)構(gòu)熵隨K值的增加先下降再上升,且結(jié)構(gòu)熵最小值minH所對應(yīng)的K值隨p的增大而逐漸減小.但值得注意的是,當(dāng)節(jié)點個數(shù)為50時,minH隨p的增加而減小;但當(dāng)節(jié)點個數(shù)為200時,minH隨p的增加先減小,如圖2(a)—(f),后又略有增大,如圖2(f)—(h).有理由認(rèn)為,minH不僅與網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)有關(guān),更與網(wǎng)絡(luò)的規(guī)模有著密切的聯(lián)系.因此,圖3仿真了網(wǎng)絡(luò)minH與小世界指數(shù)σ隨網(wǎng)絡(luò)節(jié)點數(shù)n以及重連概率p的變化曲線,其中對minH進(jìn)行了歸一化處理.參照有關(guān)文獻(xiàn)[19,20],本文所使用的小世界指數(shù)定義為
其中,C和L分別為網(wǎng)絡(luò)的平均聚類系數(shù)與特征路徑長度,Cn與Ln分別為同節(jié)點數(shù)最近鄰耦合網(wǎng)絡(luò)的平均聚類系數(shù)與特征路徑長度.顯然,當(dāng)網(wǎng)絡(luò)為最近鄰耦合網(wǎng)絡(luò)時,σ=1;由于小世界網(wǎng)絡(luò)擁有較高的平均聚類系數(shù),與最近鄰耦合網(wǎng)絡(luò)相近,即C≈Cn;但其特征路徑長度較短,遠(yuǎn)小于最近鄰耦合網(wǎng)絡(luò),與同規(guī)模隨機(jī)網(wǎng)絡(luò)相近,即L?Ln.因此可認(rèn)為σ值越大,網(wǎng)絡(luò)的小世界性越顯著;由圖3所示,從某p值開始,σ隨p的增加而下降.這是由于隨著重連概率的增加,網(wǎng)絡(luò)將同時具有較短的特征路徑長度以及較小的平均聚類系數(shù),逐漸呈現(xiàn)出隨機(jī)網(wǎng)絡(luò)的特性.
圖1 50節(jié)點最近鄰耦合網(wǎng)絡(luò)在不同重連概率p及影響力尺度K下的結(jié)構(gòu)熵 (a)p=0;(b)p=0.001;(c)p=0.002;(d)p=0.005;(e)p=0.01;(f)p=0.05;(g)p=0.1;(h)p=0.5;(i)p=1Fig.1.K-order structure entropy at in fluence scale K in graphs generated by randomly rewiring a 50 nodes nearest-neighbor coupled network based on different probability p:(a)p=0;(b)p=0.001;(c)p=0.002;(d)p=0.005;(e)p=0.01;(f)p=0.05;(g)p=0.1;(h)p=0.5;(i)p=1.
圖2 200節(jié)點最近鄰耦合網(wǎng)絡(luò)在不同重連概率p及影響力尺度K下的結(jié)構(gòu)熵 (a)p=0;(b)p=0.001;(c)p=0.002;(d)p=0.005;(e)p=0.01;(f)p=0.05;(g)p=0.1;(h)p=0.5;(i)p=1Fig.2.K-order structure entropy at in fluence scale K in graphs generated by randomly rewiring a 200 nodes nearestneighbor coupled network based on different probability p:(a)p=0;(b)p=0.001;(c)p=0.002;(d)p=0.005;(e)p=0.01;(f)p=0.05;(g)p=0.1;(h)p=0.5;(i)p=1.
圖3 不同網(wǎng)絡(luò)規(guī)模n及重連概率p下的minH和小世界指數(shù)σ (a)n=10;(b)n=25;(c)n=50;(d)n=75;(e)n=100;(f)n=150;(g)n=200;(h)n=250;(i)n=300Fig.3.The minimum structure entropy minH and small-world coefficient σ at different network size n and rewiring probability p:(a)n=10;(b)n=25;(c)n=50;(d)n=75;(e)n=100;(f)n=150;(g)n=200;(h)n=250;(i)n=300.
圖4 不同網(wǎng)絡(luò)規(guī)模n及重連概率p下的小世界指數(shù)σ,DD熵、Wu熵、SD熵、NB熵以及EB熵 (a)n=10;(b)n=25;(c)n=50;(d)n=75;(e)n=100;(f)n=150;(g)n=200;(h)n=250;(i)n=300Fig.4.Small-world coefficientσ,degree distribution entropy(DD entropy),Wu entropy(Wu entropy),node and edge difference entropy(SD entropy),node betweenness entropy(NB entropy),edge betweenness entropy(EB entropy)at different network size n and rewiring probability p:(a)n=10;(b)n=25;(c)n=50;(d)n=75;(e)n=100;(f)n=150;(g)n=200;(h)n=250;(i)n=300.
由圖3可知,當(dāng)網(wǎng)絡(luò)規(guī)模較小時,網(wǎng)絡(luò)的小世界性不明顯,minH隨p的增加單調(diào)下降;當(dāng)網(wǎng)絡(luò)規(guī)模較大且p較小時,網(wǎng)絡(luò)具有顯著的小世界性,此時minH隨重連概率先下降再上升.因此,K-階結(jié)構(gòu)熵認(rèn)為最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)以及WS小世界網(wǎng)絡(luò)的異構(gòu)性依次增強(qiáng),且網(wǎng)絡(luò)的小世界性越強(qiáng),其異構(gòu)性則越強(qiáng).可見,K-階結(jié)構(gòu)熵模型能夠較好地依據(jù)小世界屬性來反映網(wǎng)絡(luò)的異構(gòu)性.
為了進(jìn)一步驗證K-階結(jié)構(gòu)熵的性能,圖4繪制了小世界指數(shù)σ與DD熵、Wu熵、SD熵、NB熵以及EB熵隨網(wǎng)絡(luò)節(jié)點數(shù)n以及重連概率p的變化曲線.
由圖4可見,在任意網(wǎng)絡(luò)規(guī)模下,DD熵隨p單調(diào)遞增,而Wu熵隨p單調(diào)遞減,可見DD熵與Wu熵均難以表征小世界網(wǎng)絡(luò)的異構(gòu)性;此外,DD熵認(rèn)為隨機(jī)網(wǎng)絡(luò)的異構(gòu)性弱于規(guī)則網(wǎng)絡(luò),與通常理解存在偏差;當(dāng)網(wǎng)絡(luò)規(guī)模較小時,SD熵認(rèn)為最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)以及WS小世界網(wǎng)絡(luò)的異構(gòu)性依次增強(qiáng),與本文結(jié)論相似.但當(dāng)網(wǎng)絡(luò)規(guī)模較大時,SD熵隨p的增加迅速上升,隨之保持在隨機(jī)網(wǎng)絡(luò)的異構(gòu)性水平不變,但此時網(wǎng)絡(luò)仍具有較強(qiáng)的小世界性;EB熵在網(wǎng)絡(luò)小世界性較強(qiáng)時認(rèn)為WS小世界網(wǎng)絡(luò)的異構(gòu)性最強(qiáng),但卻認(rèn)為隨機(jī)網(wǎng)絡(luò)的異構(gòu)性弱于最近鄰耦合網(wǎng)絡(luò),這一結(jié)論同樣與普遍理解存在偏差.只有NB熵與本文結(jié)論相似.
BA無標(biāo)度網(wǎng)絡(luò)依據(jù)增長和擇優(yōu)機(jī)理而構(gòu)建[21],所生成的網(wǎng)絡(luò)度分布符合γ=3的冪律形式,網(wǎng)絡(luò)中少數(shù)節(jié)點擁有極多的連接,而大多數(shù)節(jié)點只有少量的連接,通常認(rèn)為無標(biāo)度網(wǎng)絡(luò)具有較強(qiáng)的異構(gòu)性[22,23].星型網(wǎng)絡(luò)是指以中央節(jié)點為中心,其余節(jié)點均只與中央節(jié)點相連的拓?fù)浣Y(jié)構(gòu),通常可被看作是無標(biāo)度網(wǎng)絡(luò)的極端形式,其異構(gòu)性要強(qiáng)于一般的無標(biāo)度網(wǎng)絡(luò).下面基于K-階結(jié)構(gòu)熵對二者的異構(gòu)性進(jìn)行考察.文中規(guī)定BA無標(biāo)度網(wǎng)絡(luò)與星型網(wǎng)絡(luò)均為連通圖,同樣有Hd=H0=log(n).
圖5仿真了在不同網(wǎng)絡(luò)規(guī)模下,BA無標(biāo)度網(wǎng)絡(luò)與星型網(wǎng)絡(luò)歸一化后的K-階結(jié)構(gòu)熵隨K的變化規(guī)律.
圖5 BA無標(biāo)度網(wǎng)絡(luò)及星型網(wǎng)絡(luò)在不同網(wǎng)絡(luò)規(guī)模n及影響力尺度K下的結(jié)構(gòu)熵 (a)BA無標(biāo)度網(wǎng)絡(luò);(b)星型網(wǎng)絡(luò)Fig.5.K-order structure entropy of BA scale-free networks and star networks at different in fluence scale K and the network size n:(a)BA scale-free network;(b)star network.
由圖5可見,在任意網(wǎng)絡(luò)規(guī)模下,BA無標(biāo)度網(wǎng)絡(luò)與星型網(wǎng)絡(luò)的結(jié)構(gòu)熵均隨K的增加先下降再上升.此外,BA無標(biāo)度網(wǎng)絡(luò)minH所對應(yīng)的K值隨網(wǎng)絡(luò)規(guī)模的增加逐漸增大,而星型網(wǎng)絡(luò)minH所對應(yīng)的K值與網(wǎng)絡(luò)規(guī)模無關(guān),即K=1時達(dá)到最小.這是由于在任意網(wǎng)絡(luò)規(guī)模下,星型網(wǎng)絡(luò)的節(jié)點均可在二步內(nèi)到達(dá)其余節(jié)點.圖6仿真了最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)以及星型網(wǎng)絡(luò)等不同結(jié)構(gòu)的minH,DD熵、Wu熵、SD熵、NB熵和EB熵隨網(wǎng)絡(luò)節(jié)點數(shù)n的變化情況.
由圖6可見,minH與Wu熵認(rèn)為,在任意網(wǎng)絡(luò)規(guī)模下,最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)以及星型網(wǎng)絡(luò)的異構(gòu)性依次增強(qiáng);且隨著網(wǎng)絡(luò)規(guī)模的增加,以上拓?fù)浣Y(jié)構(gòu)的minH與Wu熵均呈上升趨勢.在此觀點下,星型網(wǎng)絡(luò)的異構(gòu)性隨網(wǎng)絡(luò)規(guī)模的增加而減弱,這可以解釋為在任意網(wǎng)絡(luò)規(guī)模下,星型網(wǎng)絡(luò)只擁有一個中心節(jié)點,其余節(jié)點均是度1節(jié)點.隨著網(wǎng)絡(luò)規(guī)模的增加,重要性相同的度1節(jié)點的數(shù)量顯著增加,這導(dǎo)致了網(wǎng)絡(luò)的異構(gòu)性有所減弱.此結(jié)論比SD熵和DD熵認(rèn)為的星型網(wǎng)絡(luò)的異構(gòu)性隨其規(guī)模的增大略有增強(qiáng)后保持不變的解釋更為合理;此外,DD熵區(qū)分隨機(jī)網(wǎng)絡(luò)與BA無標(biāo)度網(wǎng)絡(luò)的能力不足,且無法充分反映最近鄰耦合網(wǎng)絡(luò)異構(gòu)性隨其網(wǎng)絡(luò)規(guī)模的演化規(guī)律;NB熵對最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)以及BA無標(biāo)度網(wǎng)絡(luò)異構(gòu)性隨其網(wǎng)絡(luò)規(guī)模演化規(guī)律的解釋與K-階結(jié)構(gòu)熵相同,但卻無法充分反映星型網(wǎng)絡(luò)的異構(gòu)性;EB熵認(rèn)為隨機(jī)網(wǎng)絡(luò)與BA無標(biāo)度網(wǎng)絡(luò)的異構(gòu)性弱于最近鄰耦合網(wǎng)絡(luò),與通常解釋存在偏差.
圖6 最近鄰耦合網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)、星型網(wǎng)絡(luò)在不同網(wǎng)絡(luò)規(guī)模n下的minH,DD熵、Wu熵、SD熵、NB熵以及EB熵 (a)minH;(b)DD熵;(c)Wu熵;(d)SD熵;(e)NB熵;(f)EB熵Fig.6.The minH,DD entropy,Wu entropy,SD entropy,NB entropy,EB entropy of nearest-neighbor coupled networks,random networks,BA scale-free networks and star networks at different network size n:(a)minH;(b)DD entropy;(c)Wu entropy;(d)SD entropy;(e)NB entropy;(f)EB entropy.
由于最近鄰耦合網(wǎng)絡(luò)、全連接網(wǎng)絡(luò)和環(huán)型網(wǎng)絡(luò)等規(guī)則網(wǎng)絡(luò)的結(jié)構(gòu)是對稱的,因此其異構(gòu)性應(yīng)當(dāng)較弱.現(xiàn)假設(shè)在規(guī)則網(wǎng)絡(luò)結(jié)構(gòu)之外再新增若干個孤立節(jié)點,由于孤立節(jié)點在網(wǎng)絡(luò)中的結(jié)構(gòu)與作用是固定不變的,它們只影響其自身,不與原規(guī)則部分中的任何節(jié)點發(fā)生作用,即孤立節(jié)點的存在增加了網(wǎng)絡(luò)的無序程度,因此該網(wǎng)絡(luò)的異構(gòu)性應(yīng)弱于原規(guī)則結(jié)構(gòu);但由于孤立節(jié)點與原規(guī)則部分的節(jié)點存在著結(jié)構(gòu)上的差異,因此在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點的網(wǎng)絡(luò)的異構(gòu)性應(yīng)強(qiáng)于同節(jié)點數(shù)的規(guī)則網(wǎng)絡(luò).
不失一般性,以下內(nèi)容以最近鄰耦合網(wǎng)絡(luò)為例進(jìn)行分析.由前文可知,當(dāng)最近鄰耦合網(wǎng)絡(luò)未新增孤立節(jié)點時,K-階結(jié)構(gòu)熵在任意影響力尺度K下均為log(n);現(xiàn)假設(shè)最近鄰耦合網(wǎng)絡(luò)的節(jié)點數(shù)為n,額外新增的孤立節(jié)點數(shù)為i,在任意影響力尺度K下,易證原最近鄰耦合部分各節(jié)點的K-階鄰居數(shù)相同,記為
而各孤立節(jié)點的K階鄰居數(shù)始終為1.因此,得到該網(wǎng)絡(luò)結(jié)構(gòu)的K-階結(jié)構(gòu)熵為
若假設(shè)n和i不變,由(8)式易證HK將隨著K的增加單調(diào)減少,因此有Hd6H0,即Hd6 log(n+i);且最大影響力尺度d下的結(jié)構(gòu)熵Hd與最小結(jié)構(gòu)熵minH相等.在最大影響力尺度d下,對于原最近鄰耦合網(wǎng)絡(luò)部分的節(jié)點有Nd=n,因此網(wǎng)絡(luò)的Hd即minH為
由(9)式易證log(n)6Hd.綜上有l(wèi)og(n)6Hd6 log(n+i),即可認(rèn)為在n節(jié)點最近鄰耦合網(wǎng)絡(luò)外新增i個孤立節(jié)點后,其網(wǎng)絡(luò)異構(gòu)性介于n與n+i節(jié)點最近鄰耦合網(wǎng)絡(luò)之間,與前文討論相符.事實上,節(jié)點為n的任意連通圖額外新增i個孤立節(jié)點后,其最大影響力尺度d下的異構(gòu)性Hd均符合(9)式的結(jié)果,但網(wǎng)絡(luò)最小結(jié)構(gòu)熵minH未必等于Hd.此外,隨著孤立節(jié)點的增多,當(dāng)i?n2時,(9)式可近似為log(i),這可認(rèn)為當(dāng)孤立節(jié)點的數(shù)量遠(yuǎn)超原網(wǎng)絡(luò)(任意連通圖)的規(guī)模時,其網(wǎng)絡(luò)異構(gòu)性將更多地受到孤立節(jié)點的影響,也是符合實際的.值得注意的是,任意連通圖的Hd始終為log(n).因此只有當(dāng)網(wǎng)絡(luò)非連通時,Hd的討論才有意義.
圖7 在20節(jié)點最近鄰耦合網(wǎng)絡(luò)外新增i個孤立節(jié)點后的網(wǎng)絡(luò)在不同K值下的結(jié)構(gòu)熵Fig.7.K-order structure entropy at different in fluence scale K of different networks generated by adding isolated nodes to a 20 nodes nearest-neighbor coupled network,where the number of isolated nodes is i.
圖7 仿真了20節(jié)點最近鄰耦合網(wǎng)絡(luò)新增i個孤立節(jié)點后,其K-階結(jié)構(gòu)熵隨K值的變化規(guī)律.圖8則繪制了20節(jié)點最近鄰耦合網(wǎng)絡(luò)新增i個孤立節(jié)點后,其Hd(minH),DD熵、Wu熵、SD熵、NB熵以及EB熵隨i的變化規(guī)律.
如圖8所示,Wu熵、SD熵、NB熵以及EB熵均認(rèn)為n節(jié)點最近鄰耦合網(wǎng)絡(luò)新增i個孤立節(jié)點后,其網(wǎng)絡(luò)異構(gòu)性要強(qiáng)于n+i節(jié)點最近鄰耦合網(wǎng)絡(luò);但Wu熵、NB熵以及EB熵卻認(rèn)為n節(jié)點最近鄰耦合網(wǎng)絡(luò)增添孤立節(jié)點前后的網(wǎng)絡(luò)異構(gòu)性不發(fā)生變化,這一結(jié)論忽略了孤立節(jié)點對網(wǎng)絡(luò)結(jié)構(gòu)的影響;而SD熵認(rèn)為與原n節(jié)點最近鄰耦合網(wǎng)絡(luò)相比,網(wǎng)絡(luò)異構(gòu)性隨增添孤立節(jié)點個數(shù)的增加先增大后減少,目前對于這一結(jié)論缺乏合理的解釋;DD熵認(rèn)為n節(jié)點最近鄰耦合網(wǎng)絡(luò)增添i個孤立節(jié)點后,其網(wǎng)絡(luò)異構(gòu)性要比n和n+i節(jié)點最近鄰耦合網(wǎng)絡(luò)都弱,與前文討論不一致.由此可見,K-階結(jié)構(gòu)熵對最近鄰耦合網(wǎng)絡(luò)新增孤立節(jié)點后的網(wǎng)絡(luò)異構(gòu)性的解釋更為合理.其實,K-階結(jié)構(gòu)熵與Wu熵類似,均將節(jié)點作為基本單元來評價網(wǎng)絡(luò)的異構(gòu)性,但本文將節(jié)點自身納入影響力范圍,從而避免了Wu熵中由于孤立節(jié)點度值為0所造成的分析上的不便.
綜上所述,K-階結(jié)構(gòu)熵能夠較好地刻畫并區(qū)分規(guī)則網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)以及星型網(wǎng)絡(luò)的異構(gòu)性,認(rèn)為以上網(wǎng)絡(luò)的異構(gòu)性依次增強(qiáng),與文獻(xiàn)[24]的理論研究保持一致.其中,K-階結(jié)構(gòu)熵能夠較好地依據(jù)小世界屬性來刻畫WS小世界網(wǎng)絡(luò)的異構(gòu)性,且對星型網(wǎng)絡(luò)異構(gòu)性隨其規(guī)模演化規(guī)律的解釋也更為合理.此外,本文還分析了在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點后的網(wǎng)絡(luò)的異構(gòu)性,認(rèn)為n節(jié)點規(guī)則網(wǎng)絡(luò)增添i個孤立節(jié)點后,其異構(gòu)性介于n和n+i節(jié)點規(guī)則網(wǎng)絡(luò)之間,并初步探索了minH和Hd之間的關(guān)系.
圖8 在20節(jié)點最近鄰耦合網(wǎng)絡(luò)外新增i個孤立節(jié)點后的網(wǎng)絡(luò)與20+i節(jié)點最近鄰耦合網(wǎng)絡(luò)的Hd(minH),DD熵、Wu熵、SD熵、NB熵以及EB熵 (a)Hd(minH);(b)DD熵;(c)Wu熵;(d)SD熵;(e)NB熵;(f)EB熵Fig.8.The Hd(minH),DD entropy,Wu entropy,SD entropy,NB entropy,EB entropy of(20+i)nodes nearestneighbor coupled networks and graphs generated by adding i isolated nodes to 20 nodes nearest-neighbor coupled networks:(a)Hd(minH);(b)DD entropy;(c)Wu entropy;(d)SD entropy;(e)NB entropy;(f)EB entropy.
為了進(jìn)一步闡述K-階結(jié)構(gòu)熵評估網(wǎng)絡(luò)異構(gòu)性的能力,本文以某一公用數(shù)據(jù)集為例進(jìn)行說明.該數(shù)據(jù)集為美國西部電網(wǎng)[18],描述了美國西部高壓輸電網(wǎng)的拓?fù)浣Y(jié)構(gòu),共有4941個節(jié)點,代表發(fā)電廠、變電站以及中間電氣連接點等場所;網(wǎng)絡(luò)共有6594條邊,代表輸電線和變壓器支路.該網(wǎng)絡(luò)規(guī)定各節(jié)點無差別,且忽略輸電線的物理構(gòu)造及電氣參數(shù)差異,即認(rèn)為各邊無差異,且無向無權(quán).
Watts和Strogatz首次揭示了美國西部電網(wǎng)的小世界性,認(rèn)為該網(wǎng)絡(luò)同時具有近似于同規(guī)模隨機(jī)網(wǎng)絡(luò)的較短的特征路徑長度,以及遠(yuǎn)大于隨機(jī)網(wǎng)絡(luò)的平均聚類系數(shù)[18].表1列出了美國西部電網(wǎng)與同規(guī)模隨機(jī)網(wǎng)絡(luò)的平均聚類系數(shù)、特征路徑長度等參數(shù).
表1 美國西部電網(wǎng)及同規(guī)模隨機(jī)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)Table 1.Network features of the Western Power Grid of the United States and random networks.
由表1可知,美國西部電網(wǎng)的特征路徑長度僅為隨機(jī)網(wǎng)絡(luò)的2.33倍,而平均聚類系數(shù)是隨機(jī)網(wǎng)絡(luò)的510倍,以文獻(xiàn)[18]的觀點可認(rèn)為美國西部電網(wǎng)是具有小世界性的.下面將基于K-階結(jié)構(gòu)熵對美國西部電網(wǎng)進(jìn)行考察.
圖9仿真了美國西部電網(wǎng)以及同規(guī)模最近鄰耦合網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)和BA無標(biāo)度網(wǎng)絡(luò)在不同影響力尺度K下的結(jié)構(gòu)熵.由圖9可見,美國西部電網(wǎng)的結(jié)構(gòu)熵隨K先減少后增加,其minH約為11.95,與p=0.01下的WS小世界網(wǎng)絡(luò)最為接近(minH=11.997),遠(yuǎn)大于BA無標(biāo)度網(wǎng)絡(luò)(minH=11.544),且小于隨機(jī)網(wǎng)絡(luò)(minH=12.187).因此,從最強(qiáng)異構(gòu)性minH的角度出發(fā),可認(rèn)為美國西部電網(wǎng)的異構(gòu)性與小世界網(wǎng)絡(luò)相似,與前文平均聚類系數(shù)、特征路徑長度等特性的分析結(jié)果以及相關(guān)文獻(xiàn)[18,25-27]的研究均保持一致.
圖9 美國西部電網(wǎng)、最近鄰耦合網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)以及BA無標(biāo)度網(wǎng)絡(luò)在不同影響力尺度K下的結(jié)構(gòu)熵Fig.9.K-order structure entropy at different in fluence scale K of the Western Power Grid of the United States,nearest-neighbor coupled networks,WS small-world networks,random networks and BA scale-free networks.
前文指出,網(wǎng)絡(luò)的異構(gòu)性還應(yīng)從結(jié)構(gòu)熵隨K值的變化規(guī)律等方面予以考察.然而,美國西部電網(wǎng)的結(jié)構(gòu)熵HK隨K的變化曲線卻與WS小世界網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)等模型存在較大的差異.其中,該電網(wǎng)minH所對應(yīng)的K值為5,遠(yuǎn)小于p=0.01下的WS小世界網(wǎng)絡(luò)(K=27),與隨機(jī)網(wǎng)絡(luò)(K=3)和BA無標(biāo)度網(wǎng)絡(luò)(K=2)更為接近.事實上,Barabási和Albert等以美國西部電網(wǎng)為研究對象時指出,該電力網(wǎng)絡(luò)的度分布符合γ≈4的冪率形式,具有一定的無標(biāo)度性[21],而WS小世界模型的度分布卻為泊松形式.此外,BA無標(biāo)度模型的度分布雖為冪率形式,但其冪指數(shù)γ=3,與美國西部電網(wǎng)比較也存在差異;且BA無標(biāo)度模型的聚類系數(shù)較小,無法體現(xiàn)美國西部電網(wǎng)的小世界性.
可見,若從minH的角度出發(fā),可認(rèn)為美國西部電網(wǎng)的異構(gòu)性與小世界網(wǎng)絡(luò)相似,但若從K-階結(jié)構(gòu)熵隨K值的變化規(guī)律的角度出發(fā),美國西部電網(wǎng)的異構(gòu)性又與隨機(jī)網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)均不相同.目前,本文未能定量地給出HK隨K值的變化規(guī)律與網(wǎng)絡(luò)特性之間的關(guān)系,不能確定美國西部電網(wǎng)的全部性質(zhì),且美國西部電網(wǎng)也十分復(fù)雜,并不完全符合WS小世界、BA無標(biāo)度等傳統(tǒng)的理論模型.因此,深入探尋結(jié)構(gòu)熵隨K值的變化規(guī)律與網(wǎng)絡(luò)特性之間的關(guān)系、探尋冪指數(shù)與minH等指標(biāo)的關(guān)系、提出更符合諸如美國西部電網(wǎng)等實際網(wǎng)絡(luò)的模型,均為未來的工作提出了新的要求.
值得注意的是,本文是通過定義K-階鄰居數(shù)來計算K-階結(jié)構(gòu)熵的,K-階鄰居數(shù)表征了某節(jié)點在K步內(nèi)可達(dá)的節(jié)點總數(shù),在一定程度上反映了節(jié)點的重要性,而節(jié)點重要性排序是研究網(wǎng)絡(luò)傳播效率等網(wǎng)絡(luò)功能的重要前提.顯然,節(jié)點重要性的排序?qū)⒁繩值的選擇而有所不同.依前文所述,當(dāng)網(wǎng)絡(luò)具有最強(qiáng)的異構(gòu)性時,各節(jié)點重要性分化達(dá)到最大限度.因此,選擇minH所對應(yīng)的K值作為節(jié)點重要性排序的參數(shù)是最為合理的.此外,K-階鄰居數(shù)還可以作為社區(qū)結(jié)構(gòu)劃分以及研究網(wǎng)絡(luò)傳播效率的依據(jù).以社區(qū)結(jié)構(gòu)劃分為例,由于社區(qū)內(nèi)部節(jié)點間的連接較為密集,而社區(qū)之間的連接則相對稀疏,因此社區(qū)中心節(jié)點的K-階鄰居數(shù)往往較多,而社區(qū)邊界節(jié)點的K-階鄰居數(shù)則相對較少.由此,通過尋找被邊緣節(jié)點所分割的中心節(jié)點,便可實現(xiàn)網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的自然劃分.這里仍可將minH所對應(yīng)的K值作為社區(qū)結(jié)構(gòu)劃分的參數(shù)選擇.而基于K-階鄰居數(shù)的節(jié)點重要性排序、社區(qū)結(jié)構(gòu)劃分及網(wǎng)絡(luò)傳播等其他研究的具體過程本文不再展開敘述.
本文依據(jù)網(wǎng)絡(luò)節(jié)點在不同影響力尺度下的K-階鄰居數(shù)提出了一種K-階結(jié)構(gòu)熵模型來評價網(wǎng)絡(luò)的異構(gòu)性.K-階結(jié)構(gòu)熵不是依據(jù)單一指標(biāo)對網(wǎng)絡(luò)進(jìn)行分析,而是基于不同的影響力尺度K對網(wǎng)絡(luò)的異構(gòu)性進(jìn)行多角度的討論.研究發(fā)現(xiàn),K-階結(jié)構(gòu)熵隨K的變化規(guī)律、最大影響力尺度d下的異構(gòu)性Hd以及網(wǎng)絡(luò)能夠達(dá)到的最強(qiáng)異構(gòu)性minH均可以從不同的角度反映網(wǎng)絡(luò)的異構(gòu)性.通過對規(guī)則網(wǎng)絡(luò)、隨機(jī)網(wǎng)絡(luò)、WS小世界網(wǎng)絡(luò)、BA無標(biāo)度網(wǎng)絡(luò)和星型網(wǎng)絡(luò)的理論研究和仿真分析發(fā)現(xiàn),K-階結(jié)構(gòu)熵模型能夠克服DD熵、Wu熵、SD熵、EB熵?zé)o法充分依據(jù)小世界屬性來反映網(wǎng)絡(luò)異構(gòu)性的缺陷,并彌補(bǔ)了DD熵以及NB熵對星型網(wǎng)絡(luò)解釋的不足,且K-階結(jié)構(gòu)熵對在規(guī)則結(jié)構(gòu)外新增孤立節(jié)點的網(wǎng)絡(luò)異構(gòu)性的解釋也優(yōu)于其他結(jié)構(gòu)熵.此外,本文還基于K-階結(jié)構(gòu)熵對美國西部電網(wǎng)進(jìn)行了討論.由于本文的主要工作集中于提出新的網(wǎng)絡(luò)結(jié)構(gòu)熵模型以及利用經(jīng)典的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行實驗分析,對于網(wǎng)絡(luò)結(jié)構(gòu)熵的定量計算、結(jié)構(gòu)熵隨K值的變化規(guī)律與網(wǎng)絡(luò)結(jié)構(gòu)特性之間的關(guān)系、基于K-階結(jié)構(gòu)熵的節(jié)點重要性排序、社區(qū)結(jié)構(gòu)劃分等其他應(yīng)用將會是后續(xù)研究的重點.值得注意的是,本研究僅探索了在規(guī)則結(jié)構(gòu)外新添孤立節(jié)點的特殊情況,對其他拓?fù)浣Y(jié)構(gòu)添加孤立節(jié)點后,結(jié)構(gòu)熵隨K的變化規(guī)律、Hd與minH之間的關(guān)系等問題也仍需進(jìn)一步探索.