王光斌 楊菊英
摘 要: 通過(guò)對(duì)互聯(lián)網(wǎng)實(shí)際數(shù)據(jù)的分析,中國(guó)互聯(lián)網(wǎng)網(wǎng)站數(shù)量眾多,在復(fù)雜的網(wǎng)絡(luò)中真正有效的鏈接經(jīng)過(guò)試驗(yàn)調(diào)查分析卻非常有限,本文進(jìn)一步通過(guò)算法設(shè)計(jì)和計(jì)算機(jī)仿真,對(duì)中國(guó)互聯(lián)網(wǎng)的資源整合提出看法,旨在對(duì)互聯(lián)網(wǎng)資源的整合有較強(qiáng)的實(shí)用價(jià)值。
關(guān)鍵詞: 小世界網(wǎng)絡(luò) 互聯(lián)網(wǎng)資源 影響
1.引言
根據(jù)中國(guó)互聯(lián)網(wǎng)中心CNNIC發(fā)表的實(shí)測(cè)數(shù)據(jù)顯示,中國(guó)互聯(lián)網(wǎng)的網(wǎng)站數(shù)量已經(jīng)超過(guò)60多萬(wàn),而且數(shù)目在迅速增加,但是每一個(gè)網(wǎng)站的有效連接差別非常巨大。在這龐大復(fù)雜的信息網(wǎng)絡(luò)中,如何讓人們享受到更高的有價(jià)值信息?李德毅院士認(rèn)為,當(dāng)前的迫切目標(biāo)是讓“適當(dāng)?shù)娜嗽谶m當(dāng)?shù)臅r(shí)候享用適當(dāng)?shù)男畔ⅰ?。有用的信息未必都是每一個(gè)人需要的信息,李國(guó)杰院士指出:“信息取精是關(guān)鍵?!崩钣灼皆菏拷柚鷥绱味商岢龅幕ヂ?lián)網(wǎng)信息資源一分為二,對(duì)信息資源進(jìn)行整合。
2.計(jì)算方法
網(wǎng)絡(luò)(Network)在數(shù)學(xué)上以圖(Graph)表示,圖的研究最早起源于18世紀(jì)瑞士著名數(shù)學(xué)家Euler的哥尼斯堡七橋問(wèn)題。復(fù)雜網(wǎng)絡(luò)可以借助圖論的語(yǔ)言和符號(hào)精確簡(jiǎn)潔地描述對(duì)復(fù)雜網(wǎng)絡(luò)研究進(jìn)行研究過(guò)程中,人們提出許多概念和度量方法,用以表示復(fù)雜網(wǎng)絡(luò)的結(jié)構(gòu)特性。
表1 變量及說(shuō)明
度分布(Degree Distribution),是網(wǎng)絡(luò)的一個(gè)重要統(tǒng)計(jì)特征。這里的度(Degree)也稱(chēng)為連通度(Connectivity),節(jié)點(diǎn)的度指的是與該節(jié)點(diǎn)連接的邊數(shù),度分布則表示節(jié)點(diǎn)度的概率分布函數(shù)P(x),指的是節(jié)點(diǎn)有條邊連接的概率(見(jiàn)表1)。
平均路徑長(zhǎng)度(Average Path Length,APL)。平均路徑長(zhǎng)度是網(wǎng)絡(luò)中另一個(gè)重要的特征度量,是指網(wǎng)絡(luò)中所有節(jié)點(diǎn)對(duì)之間的平均最短距離,即節(jié)點(diǎn)之間經(jīng)歷的邊的最小數(shù)目,其中所有節(jié)點(diǎn)之間的最大距離稱(chēng)為網(wǎng)絡(luò)的直徑(Diameter),其都是影響網(wǎng)絡(luò)的傳輸性能與效率的重要參數(shù)。
3.模型分析
表2 互聯(lián)網(wǎng)連接數(shù)目調(diào)查報(bào)告
通過(guò)表2可以看出,連接數(shù)量超過(guò)50家以上的網(wǎng)站,所占比例不到總網(wǎng)站的2.7%,超過(guò)97%的網(wǎng)站的連接數(shù)目少于50個(gè),只有極少數(shù)網(wǎng)站才擁有穩(wěn)定的連接:
A照馬衛(wèi)東的對(duì)中國(guó)互聯(lián)網(wǎng)資源研究得知,目前中國(guó)的互聯(lián)網(wǎng)是一種無(wú)尺度網(wǎng)絡(luò),并求出冪值數(shù)為2.124。并通過(guò)計(jì)算機(jī)的模擬仿真結(jié)果顯示節(jié)點(diǎn)間距離和服務(wù)器數(shù)目之間的關(guān)系所示,度分布的計(jì)算為:
假如服務(wù)器數(shù)目假設(shè)達(dá)到3000,隨著服務(wù)器數(shù)目的增加,節(jié)點(diǎn)間的平均距離在縮短,說(shuō)明網(wǎng)絡(luò)世界小世界網(wǎng)絡(luò)存在,并且差異極大,當(dāng)服務(wù)器的數(shù)目接近2000個(gè)網(wǎng)站是中心,節(jié)點(diǎn)的距離出現(xiàn)反彈,當(dāng)超過(guò)2000這個(gè)數(shù)目的時(shí)候,平均距離又開(kāi)始降低,這個(gè)數(shù)目的網(wǎng)站,在互聯(lián)網(wǎng)中的數(shù)量是適當(dāng)?shù)模Ч彩禽^佳的。
但是并不是意味著服務(wù)器的數(shù)目越少,效果更佳,通過(guò)大連理工大學(xué)劉建國(guó)和中國(guó)科技大學(xué)的王文旭的研究實(shí)驗(yàn)結(jié)果如下圖發(fā)現(xiàn),當(dāng)代互聯(lián)網(wǎng)絡(luò)的用戶數(shù)目在2000左右的時(shí)候,對(duì)數(shù)據(jù)訪問(wèn)的效果情況是:
圖 萬(wàn)維網(wǎng)的r隨s的變化
r的數(shù)值開(kāi)始趨近于-1,小于2000這個(gè)數(shù)值,r會(huì)逐步減少,網(wǎng)絡(luò)有效連接反而提高,畢竟人能夠接受的生理連接是有限度的,說(shuō)明這個(gè)時(shí)候正是一個(gè)結(jié)點(diǎn),超過(guò)這個(gè)數(shù)值,小世界網(wǎng)路越明顯,網(wǎng)絡(luò)越復(fù)雜,人們開(kāi)始獲取信息的難度開(kāi)始增加,在2000附近的時(shí)候,人們獲取信息資源的渠道較多,獲取信息資源的難度也比較適中。如何整合主流的網(wǎng)站,網(wǎng)站的數(shù)量需要不斷整合,并且控制有效的連接數(shù)量,是互聯(lián)網(wǎng)絡(luò)資源整合的重點(diǎn)。
4.結(jié)語(yǔ)
經(jīng)過(guò)計(jì)算結(jié)果發(fā)現(xiàn):網(wǎng)絡(luò)直徑有明顯的下降表明萬(wàn)維網(wǎng)的小世界性質(zhì)增強(qiáng),但是網(wǎng)站的數(shù)量與客戶端的連接數(shù)m的增加卻是下降的,也就是說(shuō)人們獲取信息的難度隨之增加。因此,只要整合兩三千個(gè)網(wǎng)站作為主流資源,就可以在很大的程度上滿足網(wǎng)民的日常需求。
參考文獻(xiàn):
[1]Li Xiang,Chen G R.A local-world evolving network model[J].Physical A,2003,328:274-286.
[2]朱濤.改進(jìn)的加權(quán)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)重要度評(píng)估的收縮方法.系統(tǒng)工程與電子技術(shù),2009.8.
[3]席運(yùn)江,黨延忠.基于知識(shí)網(wǎng)絡(luò)的專(zhuān)家領(lǐng)域知識(shí)發(fā)現(xiàn)及表示方法.系統(tǒng)工程,2005,23(8):110-115.
[4]李幼平.和諧互補(bǔ)的文化傳播體系.中國(guó)傳媒科技,2008.4.
[5]李幼平.雙結(jié)構(gòu)互補(bǔ)網(wǎng)絡(luò)的研究.西南科技大學(xué)學(xué)報(bào),2006.3.
[6]章忠志.BA網(wǎng)絡(luò)的一個(gè)等價(jià)演化模型.系統(tǒng)工程,2005.2.