張 琪,李興華,姜 華
(1.北京交通大學 電子信息工程學院,北京 100044;2.工業(yè)和信息化部電信研究院 信息網絡部,北京 100037)
互聯網是當代信息社會的重要基礎設施,通過對互聯網進行測量和分析,可以使行業(yè)管理者了解網絡運行狀況,及時發(fā)現和處理網絡重大安全事件,對網間的互聯互通方案進行設計和評價。
本文根據工業(yè)和信息化部電信研究院互聯網優(yōu)化平臺項目所測量的相關數據,通過對大量網絡性能數據的統(tǒng)計分析,發(fā)現了網絡時延的性能特征和不同運營商的性能差異,以及網絡互聯互通存在的問題。
當數據包到達一個路由器,經過路由器的處理并發(fā)送到下一個路由器時,數據包經歷的時延由具體的4部分組成[1]:傳輸時延,傳播時延,處理時延,排隊時延。
當相同時間間隔發(fā)送數據包時,在目的端收到數據包會出現不同時間間隔,即為時延抖動。時延抖動受很多因素影響,由于網絡中的路由擁塞,并且瞬間擁塞的時間和長度變化,導致各分組數據包的處理時延不同[2],TCP窗口行為的變化,時延抖動也是反映網絡負載特征的重要指標,網絡中存在的平均網絡負載周期性和非周期性變化會引起時延抖動,另外,路由更新也會引起時延抖動,即當路徑發(fā)生變化并收斂到新的路由路徑過程中,時延增加,會有大量的丟包,并伴隨劇烈的時延抖動。
評估時延抖動有多個方法[3],有前后參考,首包參考,平均值參考。平均值參考不具有實時性,是在一段時間測量結束后計算完成,但是平均值參考使用簡單,具有一定的代表性和普遍性。本文采用平均參考結合方差的計算,通過測得的往返時延,平均每6 h計算時延抖動。
本文實驗的測量從全國范圍內的11個監(jiān)測點向93個分布在各省的運營商Ping和Traceroute,從測量數據中選取24552條往返時延和路由跳數,再根據時延值計算時延抖動。對于自治域的統(tǒng)計信息是,位于各省市的11個監(jiān)測點分別屬于AS4808,AS9808,AS23724,AS24400,AS17621,AS4812。我國向外公告196個AS,實驗能夠統(tǒng)計65個AS。
2.2.1 往返時延統(tǒng)計分析
Baek-Young Choi[4]等通過對Sprint US IP骨干網的點到點時延分析發(fā)現,數據包經歷的最大時延并不能代表網絡的性能;對經常發(fā)生路徑變化和負載均衡的骨干網,時延的平均值和中值并不能很好的表示這方面的性能;最小時延在較小的時間內很穩(wěn)定,最小時延的變化能夠表示最短路徑的變化。將時延統(tǒng)計數據做概率統(tǒng)計圖如圖1,并將時延指標值制表如表1。
圖1 往返時延概率分布圖
表1 往返時延指標值統(tǒng)計表(續(xù))
從圖中可以看出,網絡時延狀況較好,大多集中在40 ms~70 ms之間,只有一小部分時延超過150 ms,對于時延值超過200 ms~300 ms 之間的路由,經過對逐條路由分析發(fā)現,這些路由多數發(fā)生在跨網,并且目的節(jié)點在西藏和新疆地區(qū),這2地區(qū)的時延明顯大于其他地區(qū),原因是由于我國西部的網絡狀況較其他地區(qū)差,實驗的監(jiān)測點設置相對西部地區(qū)較遠。
由上表可以看出,各ISP內部的路由時延明顯小于各ISP之間的路由時延,A網和B網之間的路由時延表現尤為明顯,這2個ISP之間的時延方差值為63.34,時延波動較大,均值和中值分別為98.88 ms和78.83 ms,較其他跨網的時延指標值大。
2.2.2 跳數的分析
端到端的跳數是指測量的數據包從源點出發(fā),到達目的地的過程中所經過的路由器個數[5]。跳數在一定程度上體現了某一路徑的路由效率和傳輸質量。跳數的大小和路由選擇策略以及物理距離有關,通常將跳數作為源點和目的點距離的一種體現。從測量數據中選擇24552個跳數數據。將其進行跳數概率分布統(tǒng)計如圖2。圖的橫坐標是跳數,縱坐標是跳數所占的比重概率。
圖2 ISP網內跳數概率分布對比圖
由于監(jiān)測的目的點是分布在各省市的節(jié)點,因此ISP跳數之間的比較不存在距離遠近的問題,由圖2可知,最為Tier-1的A網和B網的選路策略較好,路由跳數集中在9跳和10跳,而C網內的路由跳數分布稍向后移,進一步對逐條路由分析發(fā)現,某些C網內的路由要經過A網或B網的骨干網節(jié)點進行傳輸,比如由上海C網監(jiān)測點到北京C網目的點,中間需要經過B網骨干網節(jié)點進行轉發(fā)。從網內和網間的角度分析,在ISP內部的路由選擇策略較好,跳數集中在9跳~11跳,而在ISP之間的跳數則顯著增加,集中在12跳~14跳。同樣的,ISP內部和ISP之間的比較不存在物理距離的遠近,那么影響跳數整體變大的原因是路由選擇策略。對網絡跳數進行整體統(tǒng)計可以看出,對跳數分布的影響主要來自ISP之間,因此,對于提高全國網絡性能應加強各ISP之間的互聯互通,優(yōu)化跨網的路由選擇策略。
2.2.3 跳數與時延相關性分析
路由是指數據包在網絡傳輸過程中經過的網絡節(jié)點的有序排列。路徑是數據包從源點到目的點的所有路由的集合。通常用跳數來衡量源端和目的端的距離,跳數大的一般情況下物理距離也大,延遲也會相應變化。Aiguo Fei[6]等人通過對UCLA的主機隨機選擇3000遍布全世界的主機進行測量往返延遲和跳數分析,實驗結果表明US內超過90%跳數是在18跳以內,90%的往返延遲小于153 ms,但是研究表明跳數和延遲之間沒有很強的相關性,盡管是平均時延大小會隨著跳數增加而增加。時延和跳數對比如圖3。
圖3 時延和跳數對比圖
圖3中的橫坐標是路由跳數,縱坐標是某一跳數的時延分布,從圖中可以看出,隨著跳數的增加,時延會變大,但并不是很強的相關性,在11跳到15跳之間,時延呈現很大的分布。圖中的紅點表示固定跳數時延的中位值,從16跳開始,中位值不再呈單調上升趨勢。基于以上2點不能單純的由給定跳數來預測時延大小,時延大小不僅僅由跳數決定,還會依賴很多其他因素,包括物理距離,到骨干網的距離,鏈路容量和當時某一鏈路的流量狀況,這也體現了網絡的復雜性。
分析目的是AS間路徑時延對整體時延的影響,由于平臺使用的工具是Traceroute,返回的數值是往返時延,因此,采用的數據是鏈路往返時延。將每條鏈路時延比重算出,做出概率分布圖如圖4。
圖4 AS間鏈路時延比重CDF圖(intra-ISP)
對于出現在intra-ISP的跨域鏈路時延比重,C網和B網的AS間鏈路時延比重并沒有占很多,在所有的路徑往返時延中,C網90%的跨域鏈路只占其所在路徑時延的不到10%,B網80%的跨域鏈路只占其所在路徑時延的不到10%,對這2個ISP,占整條路徑的大部分時延出現在自治域內部,逐條對路徑時延分析發(fā)現,路徑時延的主導時延鏈路大部分只有一條,也即端到端路徑中大部分只存在一條瓶頸鏈路,根據上述分析結論,可以推斷出瓶頸鏈路出現在AS內部。這符合過去的研究結論。對于A網,跨域的鏈路所占時延比重CDF圖近似為一條直線,表明跨域間鏈路和域內鏈路的時延貢獻值差不多,瓶頸鏈路不能武斷的判斷在AS內部[7]還是外部。
統(tǒng)計只采用8點和14點的時延抖動值做比較,8點的時延抖動是從2~8點的往返時延方差值,14點的時延抖動是從8~14點的往返時延方差值,2個IPDV都非常有代表性。通過3天取值來得到平均值,統(tǒng)計結果如圖5。
由圖5可知,從時間上,8點比14點的IPDV要明顯小的多,這表明凌晨2點到上午8點的網絡負載較輕,時延變化不大,比較穩(wěn)定,符合網絡的實際情況。而上午8點到下午14點的時延抖動值明顯變大,這時網絡負載較重,數據包往返時延不穩(wěn)定,會經歷排隊時延,所以時延出現較大的波動。
圖5 8點-14點時延抖動比較
通過對不同運營商的網絡時延性能進行分析,從網內網間以及組成的整體性能等不同角度,對運營商之間的性能差異進行了評估。通過對時延性能進行深入的挖掘,發(fā)現和驗證了時延的一些特性,證明了互聯網發(fā)展的地域不平衡性。
[1]Jun-ya Kato, Atsuo Shimizu, Shigeki Goto. Active Measurement and Analysis of Delay Time in the Internet [C]. ICPP '99 Proceedings of the 1999 International Workshops on Parallel Processing, 1999.
[2]Pucha H, Zhang Y, Mao Z M, et al. understanding network delay changes caused by routing events [C]. In proceedings of the 2007 ACM SIGMETRICS international conference on measurement and modeling of computer systems, 2007.
[3]黎文偉,王俊峰,謝高崗,張大方. 基于包對采樣的IP網絡時延變化測量方法[J]. 計算機研究與發(fā)展,2004,41(8):1352-1359.
[4]Baek-Young Choi, Sue Moon, Rene Cruz, Zhi-Li Zhang, Christophe Diot. Practical Delay Monitoring for ISPs [C]. Proceeding 2005 ACM Conference on Emerging network Experiment and Technology, Toulouse, France, Oct. 2005.
[5]馬建國,席明賢,等. 中國Internet路由級跳數測量與分析[J]. 計算機應用研究,2008, 25(7):2112-2115.
[6]Aiguo Fei, Guangyu Pei, et al. Measurement on delay and hop-count of the internet[C]. IEEE GLOBECOM'98 - Internet Mini-Conference. 1998.
[7]畢經平,吳 起,李忠誠. Internet延遲瓶頸的測量與分析[J]. 計算機學報,2003,26(4):406-416.