劉曉霞,王衛(wèi)華
(武漢理工大學理學院,湖北 武漢 430070)
自然界中大量的復雜系統(tǒng)可以用網(wǎng)絡來抽象和描述[1]。為了通過對復雜網(wǎng)絡的研究抽象出大量復雜系統(tǒng)所具有的共同特性,科學家們引入了很多概念和理論,其中最基本的3個概念為網(wǎng)絡的特征路徑長度、聚類系數(shù)和網(wǎng)絡的度分布。并以此3個概念為度量標準研究發(fā)現(xiàn),大量的復雜網(wǎng)絡具有小世界特性[2-4]。此外,隨著人們對復雜網(wǎng)絡進行深入廣泛的研究,發(fā)現(xiàn) Internet網(wǎng)[5]、廣義合作網(wǎng)[6]等在具有小世界特性的同時還具有無標度特性,即節(jié)點度分布可以用冪率形式大致描述。
證券市場作為一個復雜的經(jīng)濟系統(tǒng),可以用復雜網(wǎng)絡來抽象和描述。復雜網(wǎng)絡理論是研究股票市場內(nèi)在結構和功能的有力工具,股票關聯(lián)網(wǎng)絡的拓撲性質(zhì)和聚類結構對于理解網(wǎng)絡的形成機制、發(fā)生在網(wǎng)絡上的動力學行為具有重要意義。黃瑋強等研究了中國股票網(wǎng)絡的拓撲性質(zhì)并對聚類結構進行了分析[7]。
由于現(xiàn)實世界的很多系統(tǒng)可以用復雜網(wǎng)絡來描述,證券市場作為經(jīng)濟系統(tǒng)也不例外,可將網(wǎng)絡的節(jié)點作為證券市場的股票,網(wǎng)絡的連邊為股票價格波動的相關性。此外運用復雜網(wǎng)絡的理論來研究該網(wǎng)絡的拓撲性質(zhì),經(jīng)過實證研究發(fā)現(xiàn)該網(wǎng)絡與現(xiàn)實世界的大量復雜網(wǎng)絡一樣具有小世界特性和無標度特性。
網(wǎng)絡的節(jié)點集合為在上海證券市場上市的股票,對于取定的閾值θ,如果兩個節(jié)點i和j的價格波動相關系數(shù)cij>θ,則使兩個節(jié)點之間連邊,否則不連邊。并且構造的網(wǎng)絡為無向網(wǎng)絡,即若節(jié)點i與j之間有邊相連則節(jié)點j與i之間也有邊相連,并且不考慮連邊的權重大小,將其均視為1。故最終將股票網(wǎng)絡初始化為無向無權的網(wǎng)絡。
假定xi(t)為公司t時刻的股票收盤價格,則股票的對數(shù)收益率定義為:
其中,Δt為1 天,i=1,2,…,N。為避免外部經(jīng)濟環(huán)境如利率、匯率和通貨膨脹等對股價收益率互相關系數(shù)的影響,做如下處理:
其中,Ci(t)為在t時刻股票i對所有N個公司股票收益率均值的相對收益,進一步,可以計算出股票收益率的互相關系數(shù)為:
其中,<·>表示取時間平均,wij為股票i與股票j之間的連接權重。
筆者選用的數(shù)據(jù)節(jié)點為2000—2011年在上海證券交易所持續(xù)上市的股票,共884個,用股票的周收盤價格來計算對數(shù)收益率。數(shù)據(jù)的處理方式為以每一只股票的周收盤價格在2000年初的價格為基點進行后項除權,共收集了180個股票收盤價格(選用的數(shù)據(jù)來自雅虎財經(jīng))。
經(jīng)Matlab仿真研究,根據(jù)上述數(shù)據(jù)得到相關系數(shù)概率分布圖如圖1所示。
圖1 上海證券市場股票相關系數(shù)概率分布
在復雜網(wǎng)絡中,連接兩個節(jié)點的最短路徑(即經(jīng)過的邊數(shù)最少)的邊的數(shù)目稱為兩個節(jié)點i與j之間的距離dij。最短路徑定義為所有連通(i,j)的通路中,所經(jīng)過其他頂點最少的一條(或幾條)路徑。網(wǎng)絡的平均路徑長度 L為網(wǎng)絡中任意一對頂點的最短路徑長度的平均值,即:
其中,N為網(wǎng)絡的節(jié)點個數(shù)。它描述了網(wǎng)絡中分離任意兩個頂點所需的平均步數(shù)。網(wǎng)絡的平均路徑長度也稱為網(wǎng)絡的特征路徑長度。
在人際關系網(wǎng)絡中,某一個人的兩個朋友很可能彼此也是朋友,將人際關系網(wǎng)絡的這種特性描述為聚類性[8]。一般地,假設網(wǎng)絡中的某一個節(jié)點i有ki條邊與它相連,則對應相連的這ki個節(jié)點均稱為它的鄰居節(jié)點。顯然,在這ki個節(jié)點之間最多只可能有ki(ki-1)/2條邊,而這ki個節(jié)點之間實際存在的邊數(shù)Ei與總的可能的邊數(shù)ki(ki-1)/2的比值定義為節(jié)點i的聚類系數(shù)Ci,即:
同理,整個網(wǎng)絡的聚集系數(shù)C定義為所有節(jié)點的聚集系數(shù)Ci的平均值。
節(jié)點i的度用ki表示,定義為與節(jié)點i相連的其他節(jié)點的個數(shù)。一個節(jié)點的度值越大意味著與它相連的邊的數(shù)目越多,它在網(wǎng)絡中越重要。如果該節(jié)點受到攻擊,網(wǎng)絡更容易陷入癱瘓狀態(tài)。
在一個無向的網(wǎng)絡中,網(wǎng)絡的平均度被定義為所有節(jié)點的度取平均值,用<k>表示。網(wǎng)絡中節(jié)點的度分布函數(shù)用p(k)來表示,它被定義為從網(wǎng)絡中任意取一個節(jié)點其度值恰好為k的概率。
平均路徑長度L的定義如上所述。在不同的網(wǎng)絡中,平均路徑長度有其不同的含義,例如在文獻[4]的小世界實驗中,平均路徑長度表示可以最少通過幾個人將網(wǎng)絡中的所有人相連接,通過研究發(fā)現(xiàn),地球上任意兩個人的平均距離為6,這就是著名的六度分離理論(six degrees of separation)。如果一個復雜網(wǎng)絡的規(guī)模很大,節(jié)點數(shù)目很多,但網(wǎng)絡的平均路徑長度卻很小,就稱該網(wǎng)絡具有小世界效應,用定性的語言可以描述為:對一定的節(jié)點平均度<k>,網(wǎng)絡的平均路徑長度L的增長速度至多與網(wǎng)絡節(jié)點數(shù)N的對數(shù)成正比。
刻畫小世界特性的另一個度量指標是聚類系數(shù),聚集系數(shù)C用來描述網(wǎng)絡中節(jié)點的聚集情況,即網(wǎng)絡有多緊密。若研究網(wǎng)絡具有較小的特征路徑長度和較大的聚類系數(shù),則認為該網(wǎng)絡為小世界網(wǎng)絡。這里的較小、較大比較均以隨機網(wǎng)絡為參照對象。
Lrandom為隨機網(wǎng)絡的特征路徑長度當量;Crandom為隨機網(wǎng)絡的聚類系數(shù)。若隨機網(wǎng)絡與所研究的網(wǎng)絡具有相同數(shù)目的節(jié)點和邊。一般可以表示為:
式中:k為網(wǎng)絡的平均度,取2Q/n(Q為網(wǎng)絡的邊數(shù))。
由于所關心的是股票之間的強影響,而對于那些聯(lián)系不是很緊密的股票可以忽略它們之間的關聯(lián),故在根據(jù)以上數(shù)據(jù)得到的鄰接矩陣中取閾值為較大的值,忽略網(wǎng)絡中關聯(lián)較小的一些節(jié)點,得到的對應閾值、平均路徑長度和群聚類系數(shù)如表1所示,平均最短路徑的計算采用圖論中的dikstra 算法[9]。
表1 不同閾值下股票網(wǎng)絡的拓撲特征
對應具有相同數(shù)目節(jié)點和邊的隨機網(wǎng)絡的平均路徑長度Lrandom,群聚類系數(shù)Crandom的對應數(shù)值如表2所示。
表2 與股票網(wǎng)絡具有相同數(shù)目節(jié)點和邊的隨機網(wǎng)絡的拓撲特征
由于股票網(wǎng)絡的平均路徑長度與同等規(guī)模的隨機網(wǎng)絡相當,而聚類系數(shù)又比同等規(guī)模的大得多,從表1和表2中的數(shù)據(jù)可以很明顯地發(fā)現(xiàn),股票網(wǎng)絡是一個小世界網(wǎng)絡,該網(wǎng)絡的平均路徑長度比較小,其實際意義表明網(wǎng)絡中的任意兩只股票可以很方便地連接。由于網(wǎng)絡的連邊表示股票價格波動的相關性,因此在該股票網(wǎng)絡中,如果一只股票的價格發(fā)生變化,網(wǎng)絡中的其余股票很容易受到影響。表1和表2中的數(shù)據(jù)還表明網(wǎng)絡有比較大的聚類系數(shù),說明股票價格的波動在某只股票的鄰居集團內(nèi)更加容易傳播,并且影響的程度會更大。
度分布是描述網(wǎng)絡性質(zhì)的一個重要統(tǒng)計量,定義為隨機選擇一個節(jié)點,度恰好為 k的概率[10]。科學家們通過大量的實證研究發(fā)現(xiàn),很多現(xiàn)實世界中網(wǎng)絡的節(jié)點度可以近似用冪率分布來描述,即p(k)近似為冪函數(shù)。在直角坐標系下,冪函數(shù)的圖像下降相對緩慢,這就意味著度值很大的節(jié)點在網(wǎng)絡中也是存在的,稱其為網(wǎng)絡的Hub節(jié)點,在無標度網(wǎng)絡中,Hub節(jié)點起著至關重要的作用,它們常常左右著網(wǎng)絡能否正常運作。無標度網(wǎng)絡的度分布函數(shù)在雙對數(shù)坐標系下可以近似用一條直線來擬合。
為驗證股票網(wǎng)絡的無標度特性,這里設定網(wǎng)絡的閾值為0.58,研究上海證券市場股票網(wǎng)絡節(jié)點的度分布情況。從圖2可以看出,經(jīng)過Matlab仿真在雙對數(shù)直角坐標系下,其度分布曲線大致在一條直線的附近,直線的斜率為-0.87445,表明該網(wǎng)絡在閾值θ=0.58時節(jié)點度服從冪率分布,且冪指數(shù)為0.87445。因此,上海證券市場網(wǎng)絡在閾值θ=0.58時為無標度網(wǎng)絡。也就是說上海證券市場股票網(wǎng)絡連接遵循擇優(yōu)連接的“馬太效應”。一只新上市股票的價格波動更容易受到在網(wǎng)絡中具有很多連接的Hub節(jié)點的影響。
圖2 閾值為0.58時網(wǎng)絡的度分布雙對數(shù)分布曲線
實際網(wǎng)絡的冪指數(shù)一般在(2,3)之間,股票網(wǎng)絡具有比實際網(wǎng)絡較小的冪指數(shù),但這也是有其實際意義的,這是因為證券市場股票網(wǎng)絡本身就是一個虛擬的網(wǎng)絡,網(wǎng)絡中節(jié)點的連接不會受到現(xiàn)實中技術資源的影響和限制,不需要高昂的構造費用。此外股票網(wǎng)絡是一個無標度網(wǎng)絡且冪率指數(shù)相對較小,表明在給定的閾值下,證券市場股票網(wǎng)絡起關鍵作用的Hub節(jié)點較多,在股市上的交易過程中有很大一部分的股票都具有較強的影響力,它們價格的波動會對當日股市整個行情的穩(wěn)定起著非常大的影響作用。
筆者對上海證券市場股票網(wǎng)絡從網(wǎng)絡拓撲特征上進行了分析,分別計算了其在不同閾值下對應的平均路徑長度和聚類系數(shù),并和與其具有相同數(shù)目節(jié)點和邊的隨機網(wǎng)絡進行比較,得出股票網(wǎng)絡具有明顯的小世界特性,繼而研究了其度分布,發(fā)現(xiàn)度分布服從冪率分布,在雙對數(shù)坐標系下可以近似地用一條直線來擬合,且冪指數(shù)為0.87445,說明股票網(wǎng)絡同時為無標度網(wǎng)絡。
[1]ALBERT R,BARABSI A L.Statistical mechanics of complex networks[J].Rev Mod Phys,2002,74(1):47 - 97.
[2]WATTS D J,STROGATZ S H.Collective dynamics of"small world"network[J].Nature,1998,393(5):440 -442.
[3]NEWMAN M E J.The structure and function of complex networks[J].SIAM Review,2003,45(2):167 -256.
[4]MILGRAM S.The small world problem [J].Psychology Today,1967,2(1):60 - 67.
[5]SIGANOS G,F(xiàn)ALOUTSOSOS M,F(xiàn)ALOUTSOSOS C,et al.Power laws and the AS level internet topology[J].IEEE/ACM Transactions on the Networking,2003,11(4):514 -524.
[6]張培培,何閱,周濤,等.一個描述合作網(wǎng)絡頂點度分布的模型[J].物理學報,2006(55):60-67.
[7]黃瑋強,莊新田,姚爽.中國股票關聯(lián)網(wǎng)絡拓撲性質(zhì)與聚類結構分析[J].管理科學,2008,21(3):94 -103.
[8]閔志鋒.中國證券市場的復雜網(wǎng)絡特性研究[D].沈陽:東北大學圖書館,2007.
[9]BUCKLEY F,LEWINTER M.圖論簡明教程[M].李慧霸,王鳳芹,譯.北京:清華大學出版社,2005:32-89.
[10]張娜.復雜網(wǎng)絡社區(qū)結構劃分算法研究[D].大連:大連理工大學圖書館,2009.