吳 旭,魏利勝
(安徽工程大學(xué)電氣工程學(xué)院,安徽蕪湖 241000)
網(wǎng)絡(luò)時延數(shù)據(jù)的統(tǒng)計特性分析
吳 旭,魏利勝?
(安徽工程大學(xué)電氣工程學(xué)院,安徽蕪湖 241000)
研究了網(wǎng)絡(luò)時延數(shù)據(jù)序列的統(tǒng)計特性.分析過程中,分別采用基于譜密度構(gòu)造統(tǒng)計量方法、周期圖法、JB檢驗方法研究了網(wǎng)絡(luò)時延數(shù)據(jù)序列的平穩(wěn)性、周期性、正態(tài)性.最后,基于校園網(wǎng)應(yīng)用層獲得時延數(shù)據(jù)并通過MATLAB仿真.結(jié)果表明,網(wǎng)絡(luò)時延數(shù)據(jù)是平穩(wěn)的、不含有周期項,且呈反正態(tài)性的.
譜密度;周期圖法;JB檢驗法
隨著網(wǎng)絡(luò)控制系統(tǒng)被廣泛應(yīng)用于各個領(lǐng)域,網(wǎng)絡(luò)時延所帶來的問題不容忽視,它不僅使控制系統(tǒng)傳遞信息滯后,同時也降低了系統(tǒng)的性能甚至影響其穩(wěn)定性[1-2].研究網(wǎng)絡(luò)時延,分析其統(tǒng)計特性,有利于我們對不同條件下的網(wǎng)絡(luò)時延建立更適當(dāng)?shù)臄?shù)學(xué)模型,提高時延預(yù)測的準(zhǔn)確性,這對未來網(wǎng)絡(luò)化系統(tǒng)的普及具有十分重要的意義.
目前,對于有關(guān)網(wǎng)絡(luò)時延問題,主要采用確定延時的方法[2],但時延通常是時變的,這種方法浪費資源,甚至有時不具有可行性.針對時變時延,主要采用不確定系統(tǒng)法[3]、時滯系統(tǒng)法[4]等方法進行處理,這些方法都具有較大的保守性,不能依據(jù)網(wǎng)絡(luò)時延的實際情況進行分析和建模.
本文基于時間序列的方法詳細地研究了網(wǎng)絡(luò)時延數(shù)據(jù)的統(tǒng)計特性.分別采用基于譜密度構(gòu)造統(tǒng)計量的方法[5]、周期圖法[6]及JB檢驗法[7]分析其平穩(wěn)性、周期性和正態(tài)性,為以后在不同的實際情況下建立適合的時延模型奠定基礎(chǔ).
數(shù)據(jù)統(tǒng)計性分析的首要問題是平穩(wěn)性分析,而進行平穩(wěn)性檢驗是為了判別數(shù)據(jù)序列是否具有不隨時間原點的推移而變化的特征.如果數(shù)據(jù)序列是平穩(wěn)的,且各態(tài)歷經(jīng),則該數(shù)據(jù)序列就可用單個樣本平均替代總體平均來表示各種統(tǒng)計特性,這極大地方便了我們進一步處理數(shù)據(jù).通常情況下,無法直接判斷出數(shù)據(jù)序列是否具有平穩(wěn)性,所以需要選用適當(dāng)?shù)姆椒ㄟM行判斷.
對于網(wǎng)絡(luò)時延數(shù)據(jù)序列,假設(shè)x1,x2,…,xn是其一個長度為N的樣本,N足夠大,將該序列分成s個子序列,每個子序列的長度均為M,且足夠的大.記為:
式中,xij=x((i-1)·M+j);i=1,2,…,s;j=1,2,…,M;N=s·M.
目前,檢驗過程平穩(wěn)性的方法即為檢驗均值的平穩(wěn)性,而檢驗均值的平穩(wěn)性主要是檢驗數(shù)據(jù){Xi}的均值函數(shù)是否為常數(shù),那么,檢驗網(wǎng)絡(luò)時延數(shù)據(jù)序列是否具有平穩(wěn)性就可轉(zhuǎn)化為檢驗其均值函數(shù)是否是常數(shù).對于平穩(wěn)序列的p階AR模型可以表示如下:
式中,系數(shù)?i,i=1,2,…,p若是絕對可和的,且條件和不等于0,則當(dāng)N→∞時2πg(shù)(0))[8].其中,g(0)表示數(shù)據(jù)序列在0點的譜密度,即:
通過式(2)計算得到的g(0)估計量是易變不相合的,為了得到其一個漸近無偏相合估計,可采用加窗周期圖的譜估計,即:
式中,f(k)表示時窗函數(shù).
根據(jù)3σ檢驗法則:
根據(jù)德莫佛-拉普拉斯中心極限定理,有p~N(a,a(1-a)/s),其中,p表示的頻率.于是可構(gòu)造出檢驗統(tǒng)計量:
綜上所述,網(wǎng)絡(luò)時延數(shù)據(jù)平穩(wěn)性檢驗的具體步驟為:①提出檢驗假設(shè)H0:網(wǎng)絡(luò)時延數(shù)據(jù)序列具有平穩(wěn)性;②構(gòu)造并計算統(tǒng)計量,即用網(wǎng)絡(luò)時延數(shù)據(jù)計算式(4)的值;③給定一個顯著性水平:α=0.05,查表得其一側(cè)分位點:uα=1.96;④比較|U|,uα大小,若|U|>uα,則拒絕假設(shè)H0,否則接受假設(shè)H0.
進行周期性檢驗是為了判別平穩(wěn)數(shù)據(jù)序列中除了隨機量外是否還具有周期分量的統(tǒng)計特征.首先,可以直接觀察網(wǎng)絡(luò)數(shù)據(jù)時延數(shù)據(jù)序列的功率譜密度函數(shù),判斷出該序列是否含有周期分量.若序列有隱含周期項,再用周期圖法對該序列進行分析.現(xiàn)假設(shè)網(wǎng)絡(luò)數(shù)據(jù)時延數(shù)據(jù)具有隱含周期項,其函數(shù)可表示為:
式中,A1表示振幅;ω1表示頻率;φ1表示相位.
則網(wǎng)絡(luò)時延數(shù)據(jù)函數(shù)可表示為:
式中,w(n)表示隨機噪聲序列,均值為零,方差為δ2w;其自相關(guān)序列可用式ΦW=δ2wI表示,I表示N階單位矩陣.
將s(n)、y(n)和w(n)分別用矢量表示,如下:
式中,Ac1表示正弦波的復(fù)數(shù)振幅:Ac1=A1exp(jφ1);e1表示信號矢量:e1=[1,exp(jω1),…,exp(jω1)].
假設(shè)s(n)已知,w(n)是復(fù)高斯白噪聲,Y的概率密度函數(shù)可表示為:
式中,H表示共軛轉(zhuǎn)置.
為估計出隱含周期項的A1、ω1和φ1值,需對這些參數(shù)進行最大似然估計(MLE),即求式(6)中A1、ω1和φ1最大化解,也就是求式L=(Y-S)H(Y-S)相對于A1和ω1最小化解.
在數(shù)據(jù)序列的周期圖中,縱軸最大值對應(yīng)到橫軸上的頻率值即為ω1的最大似然估計值,記為1,代入式L=(Y-S)H(Y-S)中并進行最小化求解可得:
進行正態(tài)性檢驗是為了檢驗多數(shù)實驗數(shù)據(jù)是否具有正態(tài)分布的統(tǒng)計特性.因為網(wǎng)絡(luò)時延數(shù)據(jù)是復(fù)雜的、隨機的,且受到多種因素的影響,所以在分析網(wǎng)絡(luò)時延數(shù)據(jù)正態(tài)特性時需要判斷它的概率分布.一般情況下,我們不可能知道網(wǎng)絡(luò)時延數(shù)據(jù)真實的概率分布,所以需要估計和檢驗網(wǎng)絡(luò)時延數(shù)據(jù)的分布.目前,正態(tài)檢驗的方法很多,其中JB檢驗(Jarque-Bera檢驗)應(yīng)用最為廣泛,它是一種基于偏度和峰度統(tǒng)計量的綜合檢驗法.
對于隨機變量X,設(shè)其期望為μ,方差為σ2,它的k階中心距可表示為:
式中,p(x)表示概率密度函數(shù);k表示大于1的整數(shù).
那么,它的k階標(biāo)準(zhǔn)矩可表示為:
利用變量X的標(biāo)準(zhǔn)矩定義偏度和峰度.偏度即是變量X的3階標(biāo)準(zhǔn)矩距,峰度即是變量X的4階標(biāo)準(zhǔn)矩,可分別表示為:
偏度和峰度分別度量了隨機變量X以均值為中心分布的對稱性和尖銳性.當(dāng)序列漸進服從標(biāo)準(zhǔn)正態(tài)分布時,有:S=0,K=3.
對于不含疏失誤差項的網(wǎng)絡(luò)時延數(shù)據(jù),為了檢驗其是否具有正態(tài)性,給出對應(yīng)形式的偏度和峰度,分別為:
當(dāng)n→∞時,可以求得:E(S)=0,Var(S)=6,E(K)=3,Var(K)=24,于是構(gòu)造出JB統(tǒng)計量如下所示:
由上可知,若網(wǎng)絡(luò)時延數(shù)據(jù)序列的JB統(tǒng)計量漸進服從自由度為2的卡方分布,則其是正態(tài)分布的;反之,則是反正態(tài)的.
綜上所述,網(wǎng)絡(luò)時延數(shù)據(jù)正態(tài)性檢驗的具體步驟為:①提出檢驗假設(shè)H0:網(wǎng)絡(luò)時延數(shù)據(jù)正態(tài)分布;②構(gòu)造并計算JB統(tǒng)計量,即用網(wǎng)絡(luò)時延數(shù)據(jù)計算式(15);③查找卡方分布表,得出臨界值:χ2(2)=5.991;④比較JB統(tǒng)計量與臨界值的大小,若χ2>χ2(2),則拒絕假設(shè)H0,否則接受假設(shè)H0.
4.1 網(wǎng)絡(luò)時延數(shù)據(jù)的測量
為了分析網(wǎng)絡(luò)時延數(shù)據(jù)的統(tǒng)計特性,首先必須獲得網(wǎng)絡(luò)時延數(shù)據(jù).建立一個基于校園網(wǎng)應(yīng)用層的測試平臺如圖1所示,并從該平臺上測得足夠多的時延數(shù)據(jù).
選用校園網(wǎng)公用以太網(wǎng),采用TCP/IP協(xié)議檢驗系統(tǒng)的延時特性,并在具有較大的負載時測量.由圖1可知,T1、T1′分別表示客戶機發(fā)送和接收數(shù)據(jù)延時;T2、T2′分別表示服務(wù)器發(fā)送和接收數(shù)據(jù)延時;T3表示TCP/IP協(xié)議執(zhí)行延時;T4和T5分別表示客戶機發(fā)送和接收時以太網(wǎng)的延時.網(wǎng)絡(luò)數(shù)據(jù)延時則可表示為:T=T1+T2+T1′+T2′+4T3+T4+T5.
在實驗中,客戶機和服務(wù)器分別采用時間和事件驅(qū)動.客戶機每0.5 s發(fā)送長度為36字節(jié)的數(shù)據(jù)包.為了降低軟件延時的影響,服務(wù)器收到該數(shù)據(jù)包后不予任何處理即返回.因為數(shù)據(jù)包中存在時間標(biāo)簽,當(dāng)返回的數(shù)據(jù)包被客戶機收到后,將數(shù)據(jù)包中的時間標(biāo)簽與當(dāng)前時間相比較,即可計算出數(shù)據(jù)包延時.
為保證測量獲得準(zhǔn)確的數(shù)據(jù),在客戶端的VC程序中調(diào)用Query Performance Frequency()函數(shù)可以獲得計算機內(nèi)部的時鐘頻率f,然后調(diào)用Query Performance Counter()函數(shù),獲得數(shù)據(jù)發(fā)送前的計數(shù)值n1,當(dāng)客戶機接收到返回的數(shù)據(jù)后,再次調(diào)用Query Performance Counter()函數(shù),獲得當(dāng)前的計數(shù)值n2.此時,網(wǎng)絡(luò)數(shù)據(jù)延時則可表示為:T=f(n2-n1).
4.2 網(wǎng)絡(luò)時延數(shù)據(jù)的仿真
通過校園網(wǎng)應(yīng)用層的測試平臺獲得了足夠多的網(wǎng)絡(luò)時延數(shù)據(jù),在MATLAB中進行編程,具體時延測量結(jié)果如圖2所示.由圖2可知,測量數(shù)據(jù)主要分布在0~20 ms之間,極少數(shù)的測量數(shù)據(jù)超出該范圍.這些數(shù)據(jù)可能是由于某些原因造成的誤差,所以我們假設(shè)大于20 ms的測量數(shù)據(jù)為疏失誤差,將其剔除后獲得新的網(wǎng)絡(luò)時延數(shù)據(jù)序列如圖3所示.
對于剔除疏失誤差項的網(wǎng)絡(luò)時延數(shù)據(jù)序列平穩(wěn)性的檢驗,先將該數(shù)據(jù)分為10個子序列,每個子序列的長度均為150.再在顯著性水平α=0.05下,采用三角窗時窗函數(shù),計算式(4),得到:|U|=≈1.923 3<1.96,所以接受原假設(shè).最后可得到結(jié)論:網(wǎng)絡(luò)時延數(shù)據(jù)序列是平穩(wěn)的.
周期性檢驗時,首先繪出剔除誤差項的網(wǎng)絡(luò)時延數(shù)據(jù)的功率譜密度函數(shù),觀察它的功率譜密度圖.如果功率譜圖中出現(xiàn)明顯的尖峰現(xiàn)象,表明數(shù)據(jù)中含有很強的周期分量,反之則沒有.校園網(wǎng)絡(luò)的時延數(shù)據(jù)功率譜密度如圖4所示.由圖4可知,除ω=0點外,網(wǎng)絡(luò)時延數(shù)據(jù)的功率譜密度函數(shù)未出現(xiàn)明顯的尖峰現(xiàn)象,那么,我們認為網(wǎng)絡(luò)時延數(shù)據(jù)序列中不含有周期分量,則不用再對數(shù)據(jù)進行去周期項處理.
最后,利用JB檢驗法對網(wǎng)絡(luò)延時數(shù)據(jù)的正態(tài)性進行檢驗.仿真獲得該延時數(shù)據(jù)的偏度約為1.351,峰度約為6.716,χ2≈1 319.299?5.991.比較卡方表獲得結(jié)論:網(wǎng)絡(luò)時延數(shù)據(jù)不具有正態(tài)分布的統(tǒng)計特性.
為了驗證本文正態(tài)檢驗的有效性,繪出原始網(wǎng)絡(luò)延時數(shù)據(jù)分布直方圖如圖5所示.由圖5可知,原始的網(wǎng)絡(luò)時延數(shù)據(jù)主要分布在0~10 ms之間,約85%,其中,分布在0~2 ms、2~4 ms、4~6 ms、6~8 ms分別約為19%、21%、22%、23%,呈現(xiàn)出緩慢上升的趨勢;約14%的數(shù)據(jù)分布在10~16 ms之間,6~8 ms間的數(shù)據(jù)是8~10 ms間的數(shù)據(jù)一倍多;分布在10~12 ms、12~14 ms、14~16 ms間的數(shù)據(jù)分別約為3%、2%、1%,這部分呈現(xiàn)下降的趨勢;剩余的測量數(shù)據(jù)僅約為1%.從整體上看,圖5所示的直方圖呈不對稱分布,不符合正態(tài)性對稱分布的特征.由此,不難發(fā)現(xiàn)網(wǎng)絡(luò)時延數(shù)據(jù)不呈正態(tài)分布,證明了JB檢驗法檢驗結(jié)果的正確性.
對照時間序列的分析方法,分析了網(wǎng)絡(luò)時延數(shù)據(jù)的數(shù)學(xué)統(tǒng)計特性.對網(wǎng)絡(luò)時延數(shù)據(jù)序列平穩(wěn)性的分析采用基于譜密度的方法.比較自相關(guān)函數(shù)、偏相關(guān)函數(shù)等平穩(wěn)性判別法,該方法比較客觀;比較單位根等檢驗法,該方法的計算量較?。畬W(wǎng)絡(luò)時延數(shù)據(jù)序列周期性的分析采用周期圖的方法.與常用的相關(guān)分析等方法相比,周期圖法不需要計算序列的自相關(guān)函數(shù),運算效率得到了很大提升,且能識別出數(shù)據(jù)序列中的隱含周期函數(shù)項的周期、幅值與相位.對網(wǎng)絡(luò)時延數(shù)據(jù)序列正態(tài)性的分析采用JB檢驗法.對于大樣本檢驗,JB檢驗法具有客觀、運算簡單、檢驗結(jié)果精確的優(yōu)點.仿真結(jié)果表明,網(wǎng)絡(luò)時延數(shù)據(jù)是平穩(wěn)的、不含有周期項的、反正態(tài)的.同時,文章所述檢驗方法也適用于檢驗其他大樣本序列.
[1] 郭詩朦.基于時間序列方法的網(wǎng)絡(luò)時延預(yù)測與改進型廣義預(yù)測控制算法在網(wǎng)絡(luò)控制系統(tǒng)中的應(yīng)用[D].北京:北京交通大學(xué),2013.
[2] 孔金生,趙靜.網(wǎng)絡(luò)延時對網(wǎng)絡(luò)控制系統(tǒng)的影響及其控制對策[J].河南理工大學(xué)學(xué)報,2006,25(4):310-312.
[3] W A Zhang,L Yu.BIBO stability and stabilization of networked control systems with short time-varing delays[J].Int.J.Robust and Nonlinear Control,2011,21(3):295-308.
[4] H J Gao,T W Chen,J Lam.A new delay system approach to network-based control[J].Automatica,2008,44(1):39-52.
[5] 唐誠,陶敏.基于譜分析下的時間序列的平穩(wěn)性檢驗[J].南京郵電大學(xué)學(xué)報,2009,29(2):31-34.
[6] 何銳,陳拴發(fā),段冰.基于周期圖法的路面不平度隨機過程數(shù)值分析[J].鄭州大學(xué)學(xué)報,2011,32(4):35-37.
[7] 田禹.基于偏度和峰度的正態(tài)性檢驗[D].上海:上海交通大學(xué),2012.
[8] P Hall,C C Heyde.M artingale Lim it Theory and Its A pplication[M].New York:Academic Press,1980.
Statistical characteristics of network delay analysis
WU Xu,WEI Li-sheng?
(College of Electrical Engineering,Anhui Polytechnic University,Wuhu 241000,China)
The statistical characteristics of the network delay is researched.In the process of analysis,its stability,periodicity and normality are analysized respectively by the method of constructing statistic based on spectral density,the cycle diagram method and the JB test method.Finally,the delay data is obtained based on the application layer of the campus network.Simulation results show that the data of the network delay is smooth,aperiodic but not in normal distribution.
spectral density;cycle diagram method;JB test
TP273
A
1672-2477(2015)04-0043-06
2015-02-02
國家自然科學(xué)基金資助項目(61203033);安徽省自然科學(xué)基金資助項目(1208085QF124);國家大學(xué)生創(chuàng)新創(chuàng)業(yè)基金資助項目(3110201204)
吳 旭(1990-),男,江蘇儀征人,碩士研究生.
魏利勝(1978-),男,安徽廬江人,副教授,碩導(dǎo).