高波,王昌偉,段虎
(1.深圳信息職業(yè)技術(shù)學院信息技術(shù)研究所,廣東 深圳 518172;2.深圳信息職業(yè)技術(shù)學院計算機學院,廣東 深圳 518172)
【信息技術(shù)理論研究】
基于趨同性及ON/OFF的網(wǎng)絡流量建模研究
高波1,王昌偉1,段虎2
(1.深圳信息職業(yè)技術(shù)學院信息技術(shù)研究所,廣東 深圳 518172;2.深圳信息職業(yè)技術(shù)學院計算機學院,廣東 深圳 518172)
基于網(wǎng)絡行為趨同性及ON/OFF模型,提出了一種改進的數(shù)據(jù)網(wǎng)絡流量模型C-ON/OFF。通過理論分析及仿真實驗,研究了C-ON/OFF模型中兩個具有物理意義的參數(shù)(N和n)與生成流量歸一化自協(xié)方差之間的關(guān)系。相比于其他模型,C-ON/OFF模型具有結(jié)構(gòu)簡單、計算復雜度低、物理意義明確等優(yōu)點。
趨同性;長相關(guān)性;網(wǎng)絡流量建模
網(wǎng)絡流量融合了網(wǎng)絡運營時所有的信息,是最基礎也是最關(guān)鍵的測量數(shù)據(jù),因此對網(wǎng)絡流量數(shù)據(jù)的分析與研究格外重要。隨著物聯(lián)網(wǎng)、泛在網(wǎng)絡等概念的提出,下一代互聯(lián)網(wǎng)骨干網(wǎng)各節(jié)點之間、局域網(wǎng)各節(jié)點之間的網(wǎng)絡流量數(shù)據(jù)將呈現(xiàn)大幅度增長,互聯(lián)網(wǎng)流量已邁入大數(shù)據(jù)時代。在大數(shù)據(jù)流量背景下,網(wǎng)絡業(yè)務類別的急劇增加導致網(wǎng)絡流量性質(zhì)發(fā)生改變,傳統(tǒng)的流量模型已不適用于當今乃至下一代互聯(lián)網(wǎng)流量的分析與預測,因此對網(wǎng)絡流量建模的研究勢在必行。
20世紀90年代以前,數(shù)據(jù)網(wǎng)絡的用戶數(shù)量相比于傳統(tǒng)電話網(wǎng)絡的用戶數(shù)量幾乎可以忽略不計,數(shù)據(jù)網(wǎng)絡的流量性質(zhì)并未得到運營商、電信公司以及科研人員的關(guān)注,大多數(shù)人認為數(shù)據(jù)網(wǎng)絡與傳統(tǒng)電話網(wǎng)絡的流量性質(zhì)是一致的。但在1994年,Leland[1]等人指出,數(shù)據(jù)網(wǎng)絡流量的特性與傳統(tǒng)電話網(wǎng)絡流量的特性有很大的差異——傳統(tǒng)電話網(wǎng)絡流量的自相關(guān)函數(shù)隨時間間隔的增大呈負指數(shù)衰減,而數(shù)據(jù)網(wǎng)絡流量的自相關(guān)函數(shù)的衰減速度明顯慢于傳統(tǒng)電話網(wǎng)絡,與雙曲函數(shù)的衰減速度類似。流量數(shù)據(jù)自相關(guān)函數(shù)的過慢衰減導致數(shù)據(jù)網(wǎng)絡流量不同時間點的流量值之間的時間相關(guān)性始終存在,即使時間間隔足夠大,這種相關(guān)性也不可忽略。這種特殊性質(zhì)造成了如下后果:數(shù)據(jù)網(wǎng)絡排隊隊列長度的衰減速度比按照Poisson模型和Markov模型估計出的結(jié)果慢得多,導致緩沖區(qū)溢出現(xiàn)象明顯。這意味著,按照Poisson模型或Markov模型設計的數(shù)據(jù)網(wǎng)絡,當用戶數(shù)量達到一定規(guī)模后,在實際運營中會出現(xiàn)丟包率上升、時延增大的現(xiàn)象,嚴重惡化網(wǎng)絡服務質(zhì)量。
傳統(tǒng)電話網(wǎng)絡流量數(shù)據(jù)自相關(guān)函數(shù)的快速衰減特性被稱為短時相關(guān)性(又稱短相關(guān),Short Range Dependence,SRD),而數(shù)據(jù)網(wǎng)絡流量數(shù)據(jù)自相關(guān)函數(shù)的慢衰減現(xiàn)象被稱為流量的長程相關(guān)性(又稱長相關(guān)性,Long Range Dependence,LRD)。給出短相關(guān)隨機過程和長相關(guān)隨機過程的數(shù)學定義:某均值為零的隨機過程,若其自相關(guān)函數(shù)r(k)滿足式(1),則稱該隨機過程為短相關(guān)過程;若其自相關(guān)函數(shù)滿足式(2),則稱該隨機過程為長相關(guān)過程。
其中,k代表時間間隔。聯(lián)系到前文的自相關(guān)函數(shù)衰減現(xiàn)象,式(1)中r(k)的絕對收斂表明短相關(guān)過程的r(k)衰減速度應快于負指數(shù)函數(shù)的f(k)=k-1衰減速度;同理,式(2)代表的長相關(guān)過程r(k)的衰減速度應等于或慢于f(k)=k-1的衰減速度。因此,本文通過比較r(k)的衰減速度來判斷流量數(shù)據(jù)是否具有長相關(guān)性。
另一種判斷LRD的方式依靠Hurst參數(shù)值[2]。若某隨機過程的Hurst參數(shù)值位于區(qū)間(0.5,1)時,則該隨機過程具有長相關(guān)性;若其Hurst參數(shù)值位于區(qū)間(0,0.5)時,則該隨機過程是短相關(guān)的。
20世紀末期,大多數(shù)網(wǎng)絡流量建模的思路主要集中于找到刻畫長相關(guān)性的數(shù)學工具,由此出現(xiàn)了很多長相關(guān)模型,例如FBM模型[2]、基于重尾分布的ON/OFF模型[3-5]、FARIMA模型[6,7]等;進入21世紀后,一些學者將人工神經(jīng)網(wǎng)絡[8,9]用于網(wǎng)絡流量的建模,依靠智能算法強大的非線性能力來擬合長相關(guān)流量數(shù)據(jù);目前,研究人員又將目光聚焦于混合模型[10,11]的建立,即將以上模型中的兩種(甚至更多)結(jié)合在一起,優(yōu)勢互補,調(diào)和模型復雜度與準確度之間的矛盾。這些模型對于長相關(guān)性質(zhì)的描述能力基本相當,不足之處在于:模型建立的時間成本較高(高計算復雜度)。
除以上方法外,將短相關(guān)模型加以改進,使之能夠擬合長相關(guān)性質(zhì)的流量模型開始涌現(xiàn),例如文獻[12]給出了一種新的擬合算法,將經(jīng)典短相關(guān)模型ARMA轉(zhuǎn)化為長相關(guān)模型,不但降低了系統(tǒng)復雜度,而且為長相關(guān)流量模型的研究開辟了新思路。但該系統(tǒng)模型參數(shù)僅能憑經(jīng)驗設置(參數(shù)不具備物理意義),模型的普適性較差。
綜上所述,為適應大數(shù)據(jù)背景下的Internet骨干網(wǎng)流量特性,為網(wǎng)絡的設計、管理、運營、計費提供技術(shù)參考和模擬數(shù)據(jù),建立一個結(jié)構(gòu)簡單、計算復雜度低、具備一定物理意義的網(wǎng)絡流量模型是十分必要的。
隨著Internet網(wǎng)絡的普及、網(wǎng)絡多媒體業(yè)務的快速增長、社交類網(wǎng)絡的興起,出現(xiàn)了這樣的情形:年齡、興趣、職業(yè)等等方面相近的人們對相同的熱點事件或熱門新聞的關(guān)注程度具有一致性,并且這些人對事件、新聞的關(guān)注會持續(xù)較長時間,直到下一個值得關(guān)注的事件或新聞的出現(xiàn)。這種特殊現(xiàn)象就是在當前各領域中經(jīng)常提及的趨同性:一些互相協(xié)作的個體為了完成某個任務或者達到某種共同的目的,需要在某個都感興趣的問題上達成一致。上文提到的“人們”就是這些互相協(xié)作的個體,這些個體的興趣在于對新鮮事物的好奇,在于對事件的關(guān)注和評論,在于對新聞的傳播和分享等等。趨同性現(xiàn)象已存在于自然界和很多應用研究領域,例如分布式計算[13],協(xié)同控制[14]等等。
在網(wǎng)絡研究領域,同一局域網(wǎng)內(nèi)的用戶(例如在某住宅小區(qū)、某所大學、某家企業(yè)居住、求學、工作的人們),他們的網(wǎng)絡行為相似甚至相同,使得趨同性的現(xiàn)象更加明顯,并且經(jīng)常發(fā)生這樣的情形:眾多用戶近乎同時的突然做出相同的網(wǎng)絡行為。這些因素導致了局域網(wǎng)的網(wǎng)絡業(yè)務流量之間產(chǎn)生了較大的相關(guān)性和較大的突發(fā)性。因此,以往的ON/OFF模型中對于各個ON/OFF源之間獨立同分布的假設變得不切實際,導致ON/OFF模型生成流量的合成流量的自相關(guān)函數(shù)并不滿足實際網(wǎng)絡流量的長相關(guān)特性。雖然研究人員在ON周期持續(xù)時間的概率分布上做了一些改變(將輕尾分布變成重尾分布),但是實驗結(jié)果仍然不盡如人意,存在著合成流量Hurst參數(shù)偏小的問題,即合成流量的長相關(guān)特性與實際網(wǎng)絡流量的長相關(guān)特性相比不夠顯著。針對這一問題,有必要對ON/OFF模型之間不獨立的情況進行研究,考察合成流量的性質(zhì)與ON/OFF模型各源之間相關(guān)性的關(guān)系,根據(jù)研究結(jié)果,對ON/OFF模型加以改進,使之成為符合網(wǎng)絡流量長相關(guān)特性的新模型。后文將以網(wǎng)絡趨同性現(xiàn)象為基礎,從理論和仿真實驗兩方面論證新模型生成流量的長相關(guān)性質(zhì)。
3.1 理論分析
首先給出ON/OFF模型的結(jié)構(gòu)圖及其周期示意圖,分別如圖(1)、圖(2)所示。每個ON/OFF源在各自的ON周期內(nèi)隨機發(fā)送數(shù)據(jù)包,在OFF周期內(nèi)停止發(fā)送(ON周期和OFF周期的持續(xù)時間服從某種隨機分布),以此來模擬數(shù)據(jù)網(wǎng)絡中各終端用戶產(chǎn)生的流量,最終匯聚成輸出總流量,代表骨干網(wǎng)鏈路上的流量。
假設ON/OFF模型中有N個ON/OFF源,每個ON/ OFF源產(chǎn)生的流量分別是X1(m)、X2(m)、……、XN(m),其中m為整數(shù)離散時間,m≥0。這N個源生成流量的合成流量X(m)為:
設n為時間間隔,n為大于等于零的整數(shù),那么,X(m)的自相關(guān)函數(shù)為:
將上式展開,有:
圖1 ON/OFF模型Fig.1 ON/OFF model
圖2 ON/OFF模型的周期Fig.2 Period of ON/OFF model
當{Xi(m),m=0,1,2…}滿足獨立同分布條件時(i=1,2,3,…,N),令Mi=a,根據(jù)自協(xié)方差函數(shù)與自相關(guān)函數(shù)的關(guān)系:
有下式成立:
把上式第二項中的 拆為,則有如下結(jié)果:
設每個Xi(m)的自協(xié)方差函數(shù)為ci(n),則:
至此,本文得出了N個獨立同分布ON/OFF源的合成流量的自協(xié)方差函數(shù)與每個源流量自協(xié)方差函數(shù)的關(guān)系。V.Paxson等人[15]指出,ON周期或OFF周期的持續(xù)時間具有輕尾分布的ON/OFF模型在獨立同分布條件下產(chǎn)生的合成流量是短相關(guān)流量,所以,當每個ON/OFF源的ON、OFF周期的持續(xù)時間都被預先設置為輕尾分布時(如指數(shù)分布),合成流量的自協(xié)方差函數(shù)c(n)是可加的(在連續(xù)條件下即可積的),也就是說:
那么,當N為有限值時,必有:
上式說明,當ON/OFF結(jié)構(gòu)模型滿足獨立同分布、ON周期或OFF周期持續(xù)時間呈輕尾分布時,單個源產(chǎn)生的流量具有短相關(guān)性質(zhì)。
接下來考察另外一種情況,即:ON/OFF模型各個源的ON周期或OFF周期持續(xù)時間不獨立。
仍然假設各個源的ON周期或OFF周期持續(xù)時間分布的期望均為a,根據(jù)式(4)、式(5)、式(6),有:
式(13)的第一項與第二項恰好分別是各個源產(chǎn)生流量的自協(xié)方差函數(shù)與互協(xié)方差函數(shù),即:
由于之前的假設中,各源之間不獨立,具有一定的相關(guān)性,因此式(14)中的互協(xié)方差函數(shù)必然不為零。那么,在計算c(n)的可加性時,必須對各源產(chǎn)生的流量之間的互相關(guān)性加以考慮。與前一步的假設條件相比,僅僅更改了獨立性這個條件,而ON周期或OFF周期的持續(xù)時間的概率分布函數(shù)依舊保持為指數(shù)分布,也就是說,單個源生成流量的自協(xié)方差函數(shù)仍然可加。這意味著,單個流量之間的互協(xié)方差是否可加將直接決定聚合流量自協(xié)方差函數(shù)是否可加,即各源生成流量之間的互相關(guān)性的強弱決定了合成流量自協(xié)方差的可加性。
另外,當ON/OFF模型各源ON周期或OFF周期持續(xù)時間呈重尾分布時,根據(jù)文獻[17]的結(jié)論:如果各源生成流量之間獨立同分布,那么合成流量將具有長相關(guān)性質(zhì)。那么,令ON/OFF模型只有一個流量生成源,則合成流量(即此唯一的ON/OFF源生成的流量)也是長相關(guān)流量。這就是說,只要滿足獨立同重尾分布這個條件,無論單個流量還是合成流量都是長相關(guān)流量。如果各源之間不獨立,具有一定相關(guān)性,那么,對于重尾分布來說,合成流量必然長相關(guān)。這是由于在式(14)中,第一項在重尾分布的條件下已經(jīng)不可加,第二項只可能增強合成流量自協(xié)方差函數(shù)的不可加性,所以c(n)必然不可加。
3.2 流量性質(zhì)的驗證
為了驗證以上結(jié)論,本節(jié)將仿真實驗分為四組進行對比。實驗中采用歸一化自協(xié)方差函數(shù)和Hurst參數(shù)做為衡量實驗結(jié)果的評價標準,根據(jù)歸一化自協(xié)方差函數(shù)的衰減速度和Hurst參數(shù)估計值來判斷合成流量是否長相關(guān)。歸一化自協(xié)方差函數(shù)定義如下:設k表示時間間隔變量,c(k)為某隨機過程的自協(xié)方差函數(shù),隨機過程的方差是2σ,那么,這個隨機變量的歸一化自協(xié)方差函數(shù)R(k)是:
歸一化自協(xié)方差R(k)又稱為自相關(guān)系數(shù)。
Hurst參數(shù)的估計方法有很多,本文采用方差時間法和R/S圖法來估計仿真實驗中合成流量的Hurst參數(shù)。
第一組實驗的條件設置如下:ON/OFF模型各源的ON、OFF狀態(tài)周期均呈輕尾分布(為了讓實驗具有可比性,一致選取指數(shù)分布作為輕尾分布的代表),且各源之間相互獨立。從圖3可以發(fā)現(xiàn),互相獨立呈輕尾分布的ON/OFF模型生成流量的合成流量的歸一化自協(xié)方差函數(shù)衰減很快,在時間間隔之后,便在縱軸零點附近震蕩,根據(jù)短相關(guān)過程自相關(guān)函數(shù)快速收斂為零的特點,容易判斷第一組實驗數(shù)據(jù)是短相關(guān)數(shù)據(jù)。
圖3 合成流量歸一化自協(xié)方差函數(shù)對比Fig.3 Contrast of normalized autocovariance functions of aggregation traffic
第二組實驗的條件設置如下:ON/OFF模型各源的ON、OFF狀態(tài)周期均呈輕尾分布(指數(shù)分布),但各源之間不獨立,具有一定相關(guān)性。從圖3可以發(fā)現(xiàn),與第一組實驗結(jié)果相比,第二組實驗的歸一化自協(xié)方差函數(shù)衰減十分緩慢,直到時間間隔 仍然沒有衰減為零,而且在時間間隔 時出現(xiàn)了一個“尖峰”,說明在這樣的設置條件下,數(shù)據(jù)的歸一化自協(xié)方差函數(shù)存在一定的起伏,這是ON/ OFF模型各源之間的相關(guān)性較大所導致。
第三組實驗的條件設置如下:ON/OFF模型各源的ON、OFF狀態(tài)周期均呈重尾分布(選取Pareto分布作為重尾分布的代表),且各源之間相互獨立。實驗結(jié)果符合文獻[13]的研究結(jié)果,第三組實驗數(shù)據(jù)具有長相關(guān)性。與第二組實驗結(jié)果比較之后發(fā)現(xiàn),兩組的歸一化自協(xié)方差函數(shù)衰減速度相近,所以第二組實驗數(shù)據(jù)也具有長相關(guān)性。
第四組實驗的條件設置如下:ON/OFF模型各源的ON、OFF狀態(tài)周期均呈重尾分布(Pareto分布),各源之間不獨立,具有一定相關(guān)性。從圖3可以看出,第四組的衰減速度比第三組要緩慢得多,這說明ON/OFF模型各源之間的相關(guān)性增加了長相關(guān)性的程度,使得歸一化自協(xié)方差函數(shù)的衰減更慢,合成流量的長相關(guān)性更顯著。
這四組實驗數(shù)據(jù)的Hurst參數(shù)值分別采用方差時間法和R/S圖法兩種方法估計,估計結(jié)果見表1。如表1所示,各組實驗的Hurst參數(shù)值表征了各組數(shù)據(jù)的長相關(guān)性,其中:各源之間獨立同輕尾分布的ON/OFF模型合成流量Hurst參數(shù)值小于0.5,是短相關(guān)的;其余三種類型的ON/OFF模型合成流量Hurst參數(shù)值均大于0.5,因此都是長相關(guān)流量。從表1還可以發(fā)現(xiàn),各源之間不獨立的輕尾分布ON/OFF模型合成流量與各源之間獨立同重尾分布的ON/OFF模型合成流量的Hurst參數(shù)值相差不大,自相似程度相近;而各源之間不獨立、重尾分布的ON/OFF模型合成流量的Hurst參數(shù)值較大,更接近于1。這說明,在各源之間增加相關(guān)性,即使ON/OFF模型的ON周期和OFF周期持續(xù)時間呈輕尾分布,也可使合成流量具有自相似性;假如ON周期和OFF周期持續(xù)時間呈重尾分布,那么各源之間的相關(guān)性將加劇合成流量的自相似程度,增大Hurst參數(shù)值。
通過自相關(guān)函數(shù)衰減速度的對比和Hurst參數(shù)的估計,兩種方法得到的結(jié)論基本一致。將本節(jié)得出的結(jié)論整理于表2,“單個源”是指只有一個ON/ OFF源產(chǎn)生流量數(shù)據(jù),“多個源獨立”是指存在多個獨立同分布的ON/OFF源,“多個源相關(guān)”是指存在多個互相相關(guān)的ON/OFF源。
表1 不同類型ON/OFF模型的Hurst參數(shù)估計結(jié)果Tab.1 Estimated results of Hurst values with ON/OFF models
表2 不同條件下流量相關(guān)性的結(jié)果Tab.2 Results of traffic correlation on different conditions
根據(jù)前一節(jié)的討論可知,當ON/OFF模型各源之間存在相關(guān)性時,可以增加合成流量的長相關(guān)特性,特別是當ON/OFF模型各源的ON周期持續(xù)時間概率分布為重尾分布時,合成流量的長相關(guān)特性進一步增強。對于ON/OFF模型這種建立在網(wǎng)絡流量匯聚過程模仿的物理模型來說,明確的物理意義和符合實際網(wǎng)絡模式的特性就變得尤為重要,這是物理模型建模的根本。所以,要對現(xiàn)有的ON/OFF模型進行改進,根據(jù)第2節(jié)所提到的趨同性,考慮各ON/OFF源之間的趨同因素,把各源間的互相關(guān)性加入到新的模型當中,使之成為切合實際、符合需要的網(wǎng)絡流量模型。
根據(jù)用戶的網(wǎng)絡行為趨同性,可以合理的假設各終端產(chǎn)生的流量波形大致相同、僅存在一定延時。根據(jù)這個假設條件,結(jié)合圖1中ON/OFF模型的結(jié)構(gòu),可將某一ON/OFF源的生成流量分別延遲0、n、2n、3n、……、Nn個時間單位(n、N均為大于等于1的整數(shù)),每次延遲后的流量相當于一個終端生成的流量,將原始流量與延遲流量疊加,得到最終的匯聚流量。這些延遲流量相當于圖1中其他ON/OFF源的生成流量,由于原始流量與延遲流量之間存在的差異僅是時間上的延遲,所以彼此之間具有一定的相關(guān)性,這就改變了經(jīng)典ON/OFF模型中各源獨立的特征,可基于“不獨立”的新特征對經(jīng)典ON/OFF模型進行改進。在此,將改進后的ON/ OFF模型命名為C-ON/OFF。
圖4是C-ON/OFF模型的結(jié)構(gòu)圖,在一個ON/ OFF源后加入N個延遲單元,其中每個延遲單元的延遲時間相同,均為n個時間單位,將得到的 個流量疊加,獲得最終的生成流量。在這里,N可以視為用戶數(shù)量,即經(jīng)典ON/OFF模型中ON/OFF源的個數(shù),n可以看作用戶網(wǎng)絡行為在趨于一致過程中的反應時間,N和n都是具有實際意義的參數(shù)。
對C-ON/OFF模型生成流量性質(zhì)的驗證,本文采用流量數(shù)據(jù)的歸一化自協(xié)方差作為評價指標,這是由于:網(wǎng)絡流量模型的優(yōu)劣在于模型是否能夠刻畫網(wǎng)絡流量長相關(guān)特性,而非捕捉流量數(shù)據(jù)的幅度、均值、方差等統(tǒng)計性質(zhì),因此,網(wǎng)絡流量長相關(guān)性質(zhì)所特有的歸一化自協(xié)方差函數(shù)慢衰減現(xiàn)象是否明顯將決定網(wǎng)絡流量模型的有效性和實用性。
為研究參數(shù)N和n對模型生成流量性質(zhì)的影響,分別進行如下兩組實驗:
(1)固定n,觀察C-ON/OFF模型生成流量的歸一化自協(xié)方差隨N值的變化情況;
(2)固定N,觀察C-ON/OFF模型生成流量的歸一化自協(xié)方差隨n值的變化情況。
將兩組實驗的實驗結(jié)果與延遲單元之前的單個ON/OFF源的生成流量進行比較,觀察流量匯聚前后的差異。實驗(1)和實驗(2)中,延遲單元之前的單個ON/OFF源的ON周期和OFF周期的概率分布均設置為輕尾分布(本文中選取的輕尾分布為指數(shù)分布)。
圖4 C-ON/OFF模型結(jié)構(gòu)Fig.4 Structure of C-ON/OFF model
圖5 C-ON/OFF模型生成流量的歸一化自協(xié)方差隨N值變化關(guān)系Fig.5 Variation of C-ON/OFF model generating traffic's normalized autocovariance related to parameter N
圖5和圖6分別為實驗(1)和實驗(2)的仿真結(jié)果,其中,參數(shù)值為“n=0,N=1”時的曲線代表延遲單元之前的單個ON/OFF源生成流量的歸一化自協(xié)方差。與上一節(jié)的研究結(jié)果相同:由于事先將ON/OFF源的ON周期和OFF周期的概率分布設置為指數(shù)分布,所以該曲線表現(xiàn)出短相關(guān)性質(zhì),衰減速度很快,當橫軸的時間間隔大于1之后,曲線幾乎始終在縱軸零點附近游蕩。這兩幅圖中的其余曲線,代表不同參數(shù)設置下的C-ON/OFF模型生成流量的歸一化自協(xié)方差,可以明顯看出,這些曲線的衰減速度很慢,在橫軸的時間間隔大于2之后,幾乎看不出明顯的下降趨勢,這與長相關(guān)流量的性質(zhì)極為相似。
圖5中,當n值固定時,歸一化自協(xié)方差的衰減速度隨N的增大而趨緩,并且當圖中各曲線的參數(shù)N相差為5時,衰減速度的差異十分顯著,但在N=30和N=25時,兩條曲線差別較小,這說明歸一化自協(xié)方差隨N值的變化有上界,當N值達到并超過這個上界時,N值對歸一化自協(xié)方差的影響幾乎不存在。在C-ON/OFF模型的使用中,N值應在10和25之間的整數(shù)中選取。N可做為模型的粗調(diào)參數(shù),用于選擇所需生成流量的歸一化自協(xié)方差的大致衰減速度。
圖6中,當N值固定時,歸一化自協(xié)方差的衰減速度隨n的增大而逐漸趨緩,但在某些時間間隔上,又出現(xiàn)了n值較小但歸一化自協(xié)方差較大的現(xiàn)象,這說明當N值固定時,生成流量的歸一化自協(xié)方差隨n值的變化不太明顯,在C-ON/OFF模型中,適合做為精調(diào)參數(shù),在N值選定的基礎上,對生成流量的歸一化自協(xié)方差衰減速度進行細微調(diào)整以求達到要求。
圖6 C-ON/OFF模型生成流量的歸一化自協(xié)方差隨n值變化關(guān)系Fig.6 Variation of C-ON/OFF model generating traffic's normalized autocovariance related to parameter n
為進一步量化參數(shù)N和n與生成流量歸一化自協(xié)方差的關(guān)系,計算了實驗(1)與實驗(2)中相應生成流量的Hurst參數(shù)值以及相應歸一化自協(xié)方差的均值(除去歸一化自協(xié)方差在零點的值),分別將計算結(jié)果列于表3和表4。歸一化自協(xié)方差的均值可以表征其衰減速度,對于長相關(guān)流量的歸一化自協(xié)方差函數(shù)來說,均值越大表明衰減速度越慢,而衰減速度越慢則說明生成流量的長相關(guān)性質(zhì)越顯著,相應生成流量的Hurst參數(shù)值證明了這一點。表3和表4的最后一行為單個ON/OFF源在指數(shù)分布條件下的生成流量性質(zhì),可以看出該流量的歸一化自協(xié)方差的均值近似為零,說明其衰減速度極快,迅速衰減為零,該流量具有明顯的短相關(guān)性,Hurst參數(shù)值0.1943(小于0.5)也表明其短相關(guān)性。
在表3和表4中,隨著N值(或n值)的逐漸減小,Hurst參數(shù)值不斷降低,但始終大于0.5,這說明生成流量均為長相關(guān)流量。此外,與Hurst參數(shù)值的下降趨勢相同,歸一化自協(xié)方差的均值也隨著N值(或n值)的減小而降低。
表3 不同參數(shù)條件下生成流量的統(tǒng)計結(jié)果及Hurst參數(shù)值(I)Tab.3 Statistic results and Hurst values of generating traffic's normalized autocovariance with different parameters (I)
如果把圖4所示的C-ON/OFF模型中ON/OFF源的ON周期的概率分布設置為Pareto分布,那么,根據(jù)Pareto分布的方差無窮特點,ON/OFF源的ON周期持續(xù)時間的長度將具有極高的可變性,對于在ON周期以恒定速率生成數(shù)據(jù)包的ON/OFF源來說,其生成的數(shù)據(jù)包數(shù)量也將具有極高的可變性,在流量波形上則表現(xiàn)為流量數(shù)據(jù)的高突發(fā)性。因此,C-ON/ OFF模型生成具有極高突發(fā)性的流量,需要設置的參數(shù)如表5所示,其中符號“√”表示需要設置,符號“×”表示模型中不存在該參數(shù)、無需設置。
表4 不同參數(shù)條件下生成流量歸一化自協(xié)方差的統(tǒng)計結(jié)果及Hurst參數(shù)值(II)Tab.4 Statistic results and Hurst values of generating traffic's normalized autocovariance with different parameters (II)
表6列舉了幾種常見的網(wǎng)絡流量模型,從流量是否長相關(guān)、模型是否具有物理意義以及模型復雜度等方面與C-ON/OFF模型進行了對比。從表6可以看出,在建立具有長相關(guān)特性的網(wǎng)絡流量模型時,C-ON/OFF模型在以上三個方面均占有優(yōu)勢。
表5 C-ONOFF模型的參數(shù)Tab.5 Parameters of C-ON/OFF model
表6 幾種常見模型的對比Tab.6 Comparison of some familiar models
本文提出了Internet網(wǎng)絡中用戶網(wǎng)絡行為的趨同性現(xiàn)象,并依此為依據(jù)對經(jīng)典ON/OFF模型進行了改進。首先研究了經(jīng)典ON/OFF模型與改進的ON/ OFF模型的生成流量的性質(zhì),通過理論分析證明了如下結(jié)論:在經(jīng)典ON/OFF模型的基礎上加入各ON/ OFF源之間的時間相關(guān)性,可以在ON周期和OFF周期持續(xù)時間分布為輕尾分布的條件下產(chǎn)生長相關(guān)性質(zhì)的流量;然后對上述結(jié)論進行了仿真驗證,仿真結(jié)果表明:在ON/OFF模型各源之間增加相關(guān)性之后,即使ON/OFF模型的ON周期和OFF周期持續(xù)時間呈輕尾分布,合成流量依然具有長相關(guān)性,若ON周期和OFF周期持續(xù)時間呈重尾分布,那么各源之間的相關(guān)性將加劇合成流量的自相似程度,表現(xiàn)為Hurst參數(shù)值的增加;依據(jù)以上研究結(jié)果,建立了一種改進的ON/OFF模型:C-ON/OFF模型,對該模型生成流量的歸一化自協(xié)方差性質(zhì)進行了定量分析之后,深入討論了C-ON/OFF模型中兩個具有物理意義的參數(shù)(N和n)與生成流量歸一化自協(xié)方差之間的關(guān)系。在C-ON/OFF模型與其他常見網(wǎng)絡流量模型比較之后發(fā)現(xiàn),C-ON/OFF模型具有結(jié)構(gòu)簡單、計算復雜度低、物理意義明確等優(yōu)點。
(References)
[1]Leland W E,Taqqu M S,Willinger W,et al.On self-similar nature of ethernet traffic (extended version)[J].IEEE/ACM Transactions on Net-working,1994,2(1):1-15.
[2]Norros I.On use of fractional Brownian motion in theory of connectionless networks[J].IEEE Journal of Selected Areas in Communications,1995,13(6):953-962.
[3]Willinger W,Taqqu M S,Sherman R,et al.Self-similarity through high-variability:statistical analysis of Ethernet LAN traffic at the source level[J].IEEE/ACM Transactions on Networking,1997,5(1):71-86.
[4]馬曉艷.網(wǎng)絡流量模型化與擁塞控制研究[D].北京:北京化工大學,2012.MA Xiaoyan.Studies on Modeling and Congestion Control of Network Traffic[D].Beijing:Beijing University of Chemmical Technology,2012.(in Chinese)
[5]吳啟武.基于分形理論的物聯(lián)網(wǎng)分層業(yè)務模型與性能分析[J].北京郵電大學學報,2012,35(4):38-41.WU Qiwu.Fractal-theory-based layered traffic model used in Internet of Things[J].Journal of Beijing University of Posts and Telecommunications,2012,35 (4):38-41.(in Chinese)
[6]Beran J,Sherman R,Taqqu M S,et al.Long-range dependence in variable-bit-rate video traffic[J].IEEE Transactions on Communications,1995,43 (234):1566-1579.
[7]蘇占波.基于FARIMA模型的網(wǎng)絡流量建模與預測[D].成都:電子科技大學,2010.SU Zhanbo.Network Traffic Modeling and Predicting Based on FARIMA[D].Chengdu:University of Electronic Science and Technology of China,2010.(in Chinese)
[8]Gowrishankar,Satyanarayana P S.Neural-network-based traffic prediction for wireless data networks[J].International Journal of Computational Intelligence Systems,2008,1(4):379-389.
[9]Park D C.Structure optimization of bilinear recurrent neural networks and its application to Ethernet Network traffic prediction[J].Information Sciences,2009,10(5):1-11.
[10]馮興杰,潘文欣,盧楠.基于小波包的RBF神經(jīng)網(wǎng)絡網(wǎng)絡流量混沌預測[J].計算機工程與設計,2012,33(5):1681-1686.FENG Xingjie,PAN Wenxin,LU Nan.Chaotic prediction of network traffic based on wavelet packet[J].Computer Engineering and Design,2012,33(5):1681-1686.(in Chinese)
[11]Alarcon-Aquino V,Barria J A.Multi-resolution FIR neural-network-based learning algorithm applied to network traffic prediction[J].Applications and Reviews,2006,36(2):208-220.
[12]Markus L.,Philipp S.,Markus R..Parsimonious fitting of long-range dependent network traffic using ARMA models[J].IEEE Communications Letters,2013,17(12):2368-2371
[13]Dutta P,Guerraoui R,Pochon B.Time-complexity of local decision in distributed agreement[J].SIAM Journal on Computing,2007,37(3):722-756.
[14]Wei R,Beard R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies[J].IEEE Transactions on Auto-matic Control,2005,50(5):655-661.
[15]Paxson V,Floyd S.Wide area traffic:failure of poison modeling[J].IEEE/ACM Transactions on Networking,1995,3(3):226-244.
[16]張賓,楊家海,吳建平.Internet流量模型分析與評述[J].軟件學報,2011,22(1):115-131.ZHANG Bin,YANG Jiahai,WU Jianping.Survey and analysis on Internet traffic model[J].Journal of Software,2011,22(1):115-131.(in Chinese)
Network traffic modeling based on homogeneity and ON/OFF
GAO Bo1,WANG Changwei1,DUAN Hu2
(1.Institute of Information Technology,Shenzhen Institute of Information Technology,Shenzhen 518172,P.R.China;2.School of Computer Shenzhen Institute of Information Technology,Shenzhen 518172,P.R.China)
A modified network traffic model named C-ON/OFF is established after research of ON/OFF model's characteristics and Internet users’ behavior homogeneity.By analyzing and simulating,the correlation between C-ON/OFF model's two meaningful parameters (N and n) and its traffic normalized autocovariance function is identified.Compared to other models,C-ON/OFF has such advantages as simple structure,low computational complexity and clear physical meaning.
homogeneity;long range dependence (LRD);network traffic modeling
TP393.06
:A
1672-6332(2014)01-0001-09
【責任編輯:楊立衡】
2014-1-10
廣東省自然科學基金資助項目(S2013010012669);深圳市科技計劃資助項目(JC201105190829A,JC201006020811A,JCYJ20130401095947233)
高波(1982-),男(漢),黑龍江哈爾濱人,講師,博士,主要研究方向:網(wǎng)絡流量建模與預測、圖像及視頻處理;E-mail:gaob@sziit.edu.cn