許 朝,謝人超,黃 韜,劉 江,張?jiān)朴?/p>
(1.北京未來(lái)網(wǎng)絡(luò)科技高精尖創(chuàng)新中心,北京 100124;2.北京郵電大學(xué) 網(wǎng)絡(luò)與交換國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876;3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司研究院,北京 100032)
移動(dòng)流量特征模型研究與分析
許 朝1,2,謝人超1,2,黃 韜1,2,劉 江1,2,張?jiān)朴?
(1.北京未來(lái)網(wǎng)絡(luò)科技高精尖創(chuàng)新中心,北京 100124;2.北京郵電大學(xué) 網(wǎng)絡(luò)與交換國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876;3.中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司研究院,北京 100032)
不斷增加的移動(dòng)數(shù)據(jù)流量給運(yùn)營(yíng)商的網(wǎng)絡(luò)帶來(lái)了前所未有的挑戰(zhàn),因此,準(zhǔn)確地表示網(wǎng)絡(luò)流量特征對(duì)于合理規(guī)劃網(wǎng)絡(luò)結(jié)構(gòu)和配置網(wǎng)絡(luò)資源有著重要意義。主要介紹移動(dòng)網(wǎng)絡(luò)流量特征模型,并對(duì)現(xiàn)網(wǎng)數(shù)據(jù)進(jìn)行分析,得出網(wǎng)絡(luò)流量概率密度服從對(duì)數(shù)正態(tài)分布,在未來(lái)網(wǎng)絡(luò)架構(gòu)的設(shè)計(jì)中可作為數(shù)據(jù)輸入模型,用于網(wǎng)絡(luò)進(jìn)行仿真和性能驗(yàn)證。
移動(dòng)網(wǎng)絡(luò);流量分布;流量模型;流量概率密度
隨著通信技術(shù)的發(fā)展和用戶需求的不斷提高,越來(lái)越多的移動(dòng)業(yè)務(wù)和應(yīng)用場(chǎng)景不斷涌現(xiàn),使得移動(dòng)網(wǎng)絡(luò)流量呈現(xiàn)出爆炸式的增長(zhǎng)。同時(shí),智能終端的普及以及可穿戴設(shè)備、智慧城市、智慧家居、數(shù)字健康、機(jī)器通信(Machine-to-Machine,M2M)等業(yè)務(wù)的出現(xiàn),也加劇了網(wǎng)絡(luò)流量增長(zhǎng)。Cisco公司的統(tǒng)計(jì)預(yù)測(cè)數(shù)據(jù)表明,預(yù)計(jì)到2020年,智能手機(jī)流量將超過(guò)PC端流量,占總流量的30%;電視、平板電腦、智能手機(jī)和M2M(machine-to-machine)產(chǎn)生的流量將分別以17%、39%、58%和44%的年復(fù)合增長(zhǎng)率增長(zhǎng);Wi-Fi和移動(dòng)設(shè)備產(chǎn)生的IP流量將占總流量的66%[1]。
網(wǎng)絡(luò)流量的增長(zhǎng)速度,特別是視頻流量的增長(zhǎng),遠(yuǎn)遠(yuǎn)超過(guò)了摩爾定律和路由性能提升的速度,為應(yīng)對(duì)這種情況,各個(gè)組織、地區(qū)與國(guó)家已經(jīng)啟動(dòng)了第五代移動(dòng)通信(5G)網(wǎng)絡(luò)的研究,諸如歐盟的METIS項(xiàng)目與5GPPP合作研究項(xiàng)目、中國(guó)IMT-2020(5G)推進(jìn)組,國(guó)際電信聯(lián)盟的ITU-R2020工作組以及韓國(guó)的5G論壇等。同時(shí),中國(guó)移動(dòng)、西班牙電信、AT&T、華為、愛(ài)立信與阿爾卡特朗訊等運(yùn)營(yíng)商與設(shè)備商也先后發(fā)布了5G白皮書和技術(shù)研究報(bào)告,業(yè)界關(guān)注的重點(diǎn)主要從網(wǎng)絡(luò)架構(gòu)、技術(shù)創(chuàng)新以及業(yè)務(wù)應(yīng)用場(chǎng)景等方面開(kāi)展研究。
無(wú)論是工業(yè)界還是學(xué)術(shù)界的研究人員都越來(lái)越意識(shí)到現(xiàn)網(wǎng)數(shù)據(jù)分析的重要性,并將數(shù)據(jù)的建模和分析結(jié)果用于網(wǎng)絡(luò)優(yōu)化和下一代網(wǎng)絡(luò)的設(shè)計(jì)當(dāng)中[2]。因此,對(duì)于移動(dòng)網(wǎng)絡(luò)流量特征的提取和分析成為網(wǎng)絡(luò)規(guī)劃和設(shè)計(jì)中的重要參考因素。本文將重點(diǎn)介紹當(dāng)前主要的移動(dòng)網(wǎng)絡(luò)流量特征模型,并對(duì)現(xiàn)網(wǎng)流量進(jìn)行分析,驗(yàn)證符合實(shí)際網(wǎng)絡(luò)流量的特征模型,最后對(duì)研究?jī)?nèi)容做簡(jiǎn)單總結(jié)。
不斷增加的移動(dòng)數(shù)據(jù)流量給運(yùn)營(yíng)商的網(wǎng)絡(luò)帶來(lái)了巨大的挑戰(zhàn),因此,準(zhǔn)確地表示網(wǎng)絡(luò)流量特征對(duì)于合理規(guī)劃網(wǎng)絡(luò)結(jié)構(gòu)和配置網(wǎng)絡(luò)資源有著重要意義。目前,流量特征模型包括空間泊松點(diǎn)過(guò)程模型、對(duì)數(shù)正態(tài)分布模型、指數(shù)分布模型、高斯分布模型以及離散余弦變換模型等。本節(jié)將主要介紹以上幾種模型。
1.1 空間泊松點(diǎn)過(guò)程模型(Spatial Poisson Point Process,SPPP)
SPPP主要應(yīng)用于基站的位置建模和分析用戶位置的隨機(jī)特性,其中,均勻SPPP模型是蜂窩網(wǎng)絡(luò)分析中常見(jiàn)的隨機(jī)幾何模型,該模型中用戶分布服從均勻分布,是最簡(jiǎn)單而且在仿真研究中使用最為廣泛的模型之一。均勻SPPP模型能夠很好地反映相互獨(dú)立條件下隨機(jī)點(diǎn)的分布情況。
假設(shè)SPPP強(qiáng)度為λ,B={B1,B2…Bk}是互不相交的Borel集,N(B)={N(B1),N(B2)…N(Bk)}是獨(dú)立隨機(jī)變量,用來(lái)表示在任何有界的Borel集B中點(diǎn)的數(shù)量。某個(gè)區(qū)域中用戶數(shù)量可表示為:
(1)
式中,A(B)表示區(qū)域,在區(qū)域A(B)中N(B)服從強(qiáng)度為λA(B)的泊松分布。在Borel集B中存在k個(gè)點(diǎn)的概率可表示為:
(2)
由于實(shí)際用戶分布并不服從均勻分布,均勻SPPP分布無(wú)法表示用戶分布的隨機(jī)性。與均勻SPPP不同,非均勻SPPP用來(lái)描述某個(gè)區(qū)域的聚集現(xiàn)象,在Borel集B中存在k個(gè)點(diǎn)的概率可表示為:
(3)
為表示用戶的非均勻分布,文獻(xiàn)[3]基于均勻SPPP分布提出了修正的Matern模型,在該模型中,首先生成一個(gè)均勻SPPP分布的集群中心,然后以集群中心的每個(gè)點(diǎn)為圓心,以預(yù)設(shè)值r為半徑的范圍內(nèi)生成用戶位置,這些用戶分布服從均勻SPPP分布。其中,預(yù)設(shè)值r以及每個(gè)集群中平均用戶數(shù)需要預(yù)先確定以保證整體的用戶密度和均勻分布中一致。
在小區(qū)非空閑狀態(tài),均勻用戶分布概率(PH)可用式(4)表示,非均勻用戶分布概率(PI)可用式(5)表示:
(4)
PI≈1-e-(1-e-ρR2π),
(5)
式中,R為小區(qū)的半徑,r為集群中心的預(yù)設(shè)半徑,ρ為用戶密度。
此外,文獻(xiàn)[4]分別對(duì)密集城區(qū)、普通城區(qū)以及郊區(qū)3個(gè)地區(qū)做了研究,結(jié)論表明SPPP模型只適用于普通城區(qū)和郊區(qū),而密集城區(qū)則用Matern模型更為合適。
1.2 對(duì)數(shù)正態(tài)分布模型(LogNormalDistributionModel)
如果隨機(jī)變量的對(duì)數(shù)服從正態(tài)分布,那么隨機(jī)變量就服從對(duì)數(shù)正態(tài)分布。文獻(xiàn)[5]通過(guò)對(duì)現(xiàn)網(wǎng)數(shù)據(jù)的測(cè)量和分析表明:流量密度可用對(duì)數(shù)正態(tài)分布近似表示。由于流量分布在時(shí)間和空間上的不固定性,文獻(xiàn)還分析了流量在空間上的相關(guān)性,并結(jié)合對(duì)數(shù)正態(tài)分布提出了一種空間流量模型。
該模型中,區(qū)域被劃分為M×N個(gè)像素區(qū)域,給定像素區(qū)域gm,n(m=1,2…M,n=1,2…N)的流量密度為ρm,n/(bytes/km2),假設(shè)ρ=(ρm,n)m-1…M;n-1…N表示流量密度矩陣,xm,n,ym,n為二維笛卡爾坐標(biāo),生成高斯隨機(jī)分布矩陣:
(6)
式中,和il、jl為(0,ωmax)之間的均勻隨機(jī)變量,ωmax用來(lái)決定隨機(jī)波動(dòng)率,φl(shuí)、ψl為(0,2π)之間的均勻隨機(jī)變量。得到式(6)之后,可根據(jù)式(7)生成對(duì)數(shù)正態(tài)分布矩陣。通過(guò)控制σ、μ可調(diào)節(jié)ρ的大小,使之與特定區(qū)域的流量密度相符。
(7)
此外,文獻(xiàn)[6]對(duì)E-Plus在德國(guó)某個(gè)城市的流量數(shù)據(jù)分析之后指出,這些數(shù)據(jù)得到的流量密度并不服從均勻分布。Gotzner和Michalopoulou的研究表明,在一段特定的時(shí)間內(nèi),不同2G小區(qū)中的語(yǔ)音業(yè)務(wù)量可以用對(duì)數(shù)正態(tài)分布來(lái)描述[6],并且在不同小區(qū)中GPRS和EDGE的數(shù)據(jù)流量可以用混合的對(duì)數(shù)正態(tài)分布來(lái)近似表示[7]。
1.3 指數(shù)分布模型(Exponential Distribution Model)
文獻(xiàn)[8]對(duì)不同地區(qū)蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)進(jìn)行了分析結(jié)果表明,隨著與市區(qū)中心距離的增大,流量密度以指數(shù)形式遞減。對(duì)市中心流量密度經(jīng)行歸一化之后,流量密度可表示為:
p(d)=e-d/k,
(8)
式中,d為距離市中心距離,單位為km,k為遞減參數(shù),且隨著地理位置的不同而不同。但需要注意的是,指數(shù)模型只適用于城區(qū),并不具有普適性,無(wú)法反應(yīng)流量密度與距離的關(guān)系。因此,在流量的空間分布上,文獻(xiàn)[8]使用了指數(shù)線性模型式(9)和分段線性模型式(10)對(duì)不同地區(qū)的流量密度進(jìn)行了研究,結(jié)果表明,這2種模型相對(duì)于指數(shù)模型來(lái)說(shuō)更能反應(yīng)流量密度與距離的關(guān)系,其中C和D為常數(shù)。
(9)
(10)
1.4 高斯分布模型(Gaussian distribution model)
二維高斯分布模型可近似表示移動(dòng)蜂窩網(wǎng)絡(luò)中用戶的分布情況,用戶密度可表示為:
(11)
式中,(x,y)為用戶位置,η可通過(guò)對(duì)比實(shí)驗(yàn)仿真結(jié)果來(lái)確定,根據(jù)每個(gè)小區(qū),可動(dòng)態(tài)調(diào)整均值μ1、μ2和標(biāo)準(zhǔn)差σ1、σ2,生成包括均勻分布和非均勻分在內(nèi)的適用范圍更廣的分布模型。
文獻(xiàn)[9]使用二維高斯分布模型模擬移動(dòng)網(wǎng)絡(luò)中的用戶分布情況,研究了各個(gè)參數(shù)取不同值時(shí)對(duì)網(wǎng)絡(luò)容量的影響。通過(guò)文獻(xiàn)[10]中的方法計(jì)算小區(qū)間的平均干擾和反向鏈路容量,并與文獻(xiàn)[11]中的模型進(jìn)行了對(duì)比,結(jié)果表明使用高斯分布模型對(duì)于大型WCDMA網(wǎng)絡(luò)的規(guī)劃速度更快,準(zhǔn)確度更高。
1.5 離散余弦變換模型(DiscreteCosineTransformModel)
文獻(xiàn)[12]對(duì)國(guó)內(nèi)某地區(qū)一周的的現(xiàn)網(wǎng)流量做了研究,通過(guò)對(duì)密集城區(qū)、普通城區(qū)和郊區(qū)三種區(qū)域流量特征的分析提出了截?cái)喽S離散余弦變換模型,其表達(dá)式如下:
(12)
具體參數(shù)含義如表1所示。
表1 截?cái)喽S離散余弦變換模型參數(shù)含義
1.6 模型對(duì)比
從前文的介紹可以看出不同的模型具有不同的適用范圍和特征,具體區(qū)別如表2所示。
表2 流量特征模型對(duì)比
本文采集了國(guó)內(nèi)某運(yùn)營(yíng)商在某市一周的移動(dòng)網(wǎng)絡(luò)流量數(shù)據(jù),地理位置涵蓋整個(gè)城市,包括67 610個(gè)基站的流量數(shù)據(jù)及經(jīng)緯度地理坐標(biāo)。采用網(wǎng)格化的方法將所在地區(qū)分為面積相等的小網(wǎng)格,每個(gè)網(wǎng)格的面積是0.009 550 8 km2,同一區(qū)域中的各個(gè)基站流量大小相加作為本區(qū)域整體的流量大小,并假設(shè)網(wǎng)格內(nèi)流量均勻分布。由于地理分布上不是一個(gè)規(guī)則的矩形,本文用MATLAB中的nonzeros函數(shù)來(lái)去除掉無(wú)效區(qū)域,得到圖1所示的網(wǎng)絡(luò)流量概率密度分布圖,該圖描繪了平均流量密度的分布情況。
圖1 整體網(wǎng)絡(luò)流量密度概率分布
結(jié)果顯示對(duì)數(shù)正態(tài)分布與數(shù)據(jù)最為吻合,擬合函數(shù)如下:
(13)
擬合函數(shù)中SSE(方差和)取值為0.000 017 38,接近于0;相關(guān)系數(shù)為0.999 9,接近于1,整體擬合效果較為理想,擬合參數(shù)如表3所示。
表3 擬合參數(shù)
在對(duì)該地區(qū)選取的住宅區(qū)、商業(yè)區(qū)和辦公區(qū)3個(gè)區(qū)域進(jìn)行同樣的分析之后得到圖2、圖3和圖4的結(jié)果。
仿真分析表明這3個(gè)地區(qū)流量概率密度均服從對(duì)數(shù)正態(tài)分布。因此,無(wú)論是整體流量密度還是局部流量密度均可用式(14)表示,通過(guò)調(diào)節(jié)N可得到不同的流量特征。
(14)
圖2 住宅區(qū)流量密度概率分布
圖3 商業(yè)區(qū)流量密度概率分布
圖4 辦公區(qū)流量密度概率分布
本文主要對(duì)主要的移動(dòng)網(wǎng)絡(luò)流量特征模型做了簡(jiǎn)單介紹,并對(duì)不同模型的適用范圍和缺點(diǎn)作了總結(jié)和對(duì)比。通過(guò)對(duì)現(xiàn)網(wǎng)數(shù)據(jù)的處理和分析,得到了符合實(shí)際的移動(dòng)網(wǎng)絡(luò)流量特征模型。
結(jié)果表明,無(wú)論是整體流量概率密度還是局部流量概率密度,均服從對(duì)數(shù)正態(tài)分布。因此在未來(lái)網(wǎng)絡(luò)設(shè)計(jì)中進(jìn)行數(shù)據(jù)驗(yàn)證時(shí)可采用對(duì)數(shù)正態(tài)分布模型模擬網(wǎng)絡(luò)流量,從而驗(yàn)證網(wǎng)絡(luò)相關(guān)性能是否滿足設(shè)計(jì)要求,對(duì)于未來(lái)網(wǎng)絡(luò)的規(guī)劃和設(shè)計(jì)都具有重要意義。
[1] Cisco Visual Networking Index: Forecast and Methodology,2015-2020.[DB/OL].http:∥www.cisco.com/c/dam/en/us/solutions/collateral/service-provider/visual-networking-index-vni/complete-white-paper-c11-481360.pdf.
[2] 周 軒.下一代移動(dòng)通信網(wǎng)絡(luò)中的業(yè)務(wù)特征認(rèn)知及服務(wù)機(jī)制研究[D].杭州:浙江大學(xué),2015.
[3] Vidacs A,Godor I.Power Saving Potential in Heterogeneous Cellular Mobile Networks[C]∥Personal,Indoor and Mobile Radio Communications(PIMRC).IEEE,2011:2412-2414.
[4] Zhang J,Wang W,Zhang X,et al.Base Stations from Current Mobile Cellular Networks: Measurement,Spatial Modeling and Analysis[C]∥Wireless Communications and Networking Conference Workshops (WCNCW).IEEE,2013:1-5.
[5] Lee D,Zhou S,Zhong X,et al.Spatial Modeling of the Traffic Density in Cellular Networks[J].IEEE Wireless Communications,2014,21(1): 80-88.
[6] Gotzner U,Rathgeber R.Spatial Traffic Distribution in Cellular Networks[C]∥Proc.VTC,1998,3(5):1994-1998.
[7] Michalopoulou M,Riihijarv J,Mahonen P.Towards Characterizing Primary Usage in Cellular Networks: A Traffic-based Study[C]∥New Frontiers in Dynamic Spectrum Access Networks(DySPAN).2011 IEEE Symposium,2011: 652-655.[8]AlmeidaS,QueijoJ,CorreiaLM.SpatialandTemporalTrafficDistributionModelsforGSM[C]∥Proc.IEEEVTS50thVehicularTechnologyConference,1999,1(9):131-135.
[9]SonN,RobertA.ApproximatingUserDistributionsinWCDMANetworksUsing2-DGaussian[C]∥InternationalConferenceonComputing,CommunicationsandControlTechnologies,2005:1-5.
[10]AklR,HegdeM,Naraghi-PourM,etal.Multi-cellCDMANetworkDesign[C]∥IEEETransVehTechnol,2001,50(5):711-722.
[11]AklR,ParvezA.ImpactofInterferenceModelonCapacityinCDMACellularNetworks[C]∥ProceedingsofSCI04:CommunicationandNetworkSystems,TechnologiesandApplications,2004,3(7):404-408.
[12]GuanL,ZhangX,LiuZ,etal.SpatialModelingandAnalysisofTrafficDistributionBasedonRealDatafromCurrentMobileCellularNetworks[C]∥IEEE,2013:135-138.
Research and Analysis of Mobile Traffic Model
XU Chao1,2,XIE Ren-chao1,2,HUANG Tao1,2,LIU Jiang1,2,ZHANG Yun-yong3
(1.Beijing Advanced Innovation Center for Future Internet Technology,Beijing 100124;2.Beijing University of Posts and Telecommunications,Beijing 100876;3.China Unicom Research Institute,Beijing 100032)
Increasing mobile traffic has brought great challenges to the operators’ network.It is significant to describe the features of traffic accurately fornetwork structure design and network resources configuration.In this paper,several mobile spatial traffic modelsare introduced and real network traffic data is analyzed.Result shows that the traffic probability density follows lognormal distribution which can be used as the input data model in future network designfornetwork simulation and performance validation.
mobile network;traffic distribution;traffic model;traffic probability density
10.3969/j.issn.1003-3114.2017.01.02
許 朝,謝人超,黃 韜,等.移動(dòng)流量特征模型研究與分析[J].無(wú)線電通信技術(shù),2017,43(1):07-10,22.
2016-09-02
國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)項(xiàng)目(2015AA016101);國(guó)家自然科學(xué)基金項(xiàng)目(61501042);北京市科技新星計(jì)劃項(xiàng)目(Z151100000315078);北京郵電大學(xué)青年科研創(chuàng)新計(jì)劃專項(xiàng)(2015RC10)
許 朝(1993—),男,碩士研究生,主要研究方向:未來(lái)網(wǎng)絡(luò)關(guān)鍵技術(shù)、內(nèi)容中心網(wǎng)絡(luò)、網(wǎng)絡(luò)緩存等。張?jiān)朴?1976—),男,博士后,中國(guó)聯(lián)通研究院副院長(zhǎng),北京郵電大學(xué)兼職教授,主要研究方向:云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、融合網(wǎng)絡(luò)技術(shù)等。
TN915
A
1003-3114(2017)01-07-4