尹 浩 李 峰
1(清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室(籌) 北京 100084)
2 (清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系 北京 100084)
(lifeng13@mails.tsinghua.edu.cn)
?
互聯(lián)網(wǎng)性能測(cè)量技術(shù)發(fā)展研究
尹浩1李峰2
1(清華信息科學(xué)與技術(shù)國(guó)家實(shí)驗(yàn)室(籌)北京100084)
2(清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系北京100084)
(lifeng13@mails.tsinghua.edu.cn)
Research on the Development of the Internet Performance Measurement Technologies
Yin Hao1and Li Feng2
1(TsinghuaNationalLaboratoryforInformationScienceandTechnology,Beijing100084)2(DepartmentofComputerScienceandTechnology,TsinghuaUniversity,Beijing100084)
AbstractNowadays, the Internet network has grown into a super-complex system from a small network in a laboratory, and its performance has been of great concern. The network performance is an important indicator of evaluating the network service performance, which can be widely used in service selection, congestion control, routing selection, network performance optimization, future network system architecture design, and so on. Many Internet performance measurement technologies are developed for these application requirements.In this paper, we systematically summarize the development of the existing network performance measurement technologies: first of all, the network performance measurement technologies is classified into different models, and the advantages and disadvantages of performance measurement technologies are well studied from different points of view; and then, the network performance measurement technologies can be divided into three stages: the measurement based on “what you see is what you get”, the large-scale distributed measurement based on path composition, and the big data driven QoE measurement, so the development and evolution of performance measurement technologies are well understood; finally, the challenges of network performance measurement technologies are deeply analyzed, and with the rapid development of the Internet network applications, the content which is needed to be studied in the future is pointed out, as well as the direction of development.
Key wordsnetwork performance measurement; path composition; quality of service(QoS); quality of experience(QoE); machine learning
摘要互聯(lián)網(wǎng)從一個(gè)實(shí)驗(yàn)網(wǎng)絡(luò)成長(zhǎng)為如今的超復(fù)雜系統(tǒng),其服務(wù)性能一直備受關(guān)注.網(wǎng)絡(luò)性能作為衡量網(wǎng)絡(luò)服務(wù)的重要指標(biāo),廣泛地應(yīng)用于服務(wù)選擇、擁塞控制、路由選擇、網(wǎng)絡(luò)性能優(yōu)化、未來(lái)網(wǎng)絡(luò)體系架構(gòu)設(shè)計(jì)等方面.針對(duì)這些應(yīng)用需求,學(xué)術(shù)界提出了眾多的網(wǎng)絡(luò)性能測(cè)量技術(shù).互聯(lián)網(wǎng)性能測(cè)量技術(shù)經(jīng)過(guò)長(zhǎng)期的發(fā)展與演變,其測(cè)量范圍從小規(guī)模網(wǎng)絡(luò)發(fā)展到覆蓋全球,測(cè)量目標(biāo)從點(diǎn)到點(diǎn)測(cè)量發(fā)展成大規(guī)模分布式P2P測(cè)量,測(cè)量對(duì)象從QoS轉(zhuǎn)變到基于用戶感受的QoE,其發(fā)展過(guò)程可分為3個(gè)階段:傳統(tǒng)的“所見(jiàn)即所得”測(cè)量、路徑擬合的大規(guī)模分布式測(cè)量以及大數(shù)據(jù)驅(qū)動(dòng)的QoE測(cè)量,每個(gè)階段都具有獨(dú)特的測(cè)量技術(shù).最后,分析了互聯(lián)網(wǎng)和網(wǎng)絡(luò)應(yīng)用的高速發(fā)展對(duì)網(wǎng)絡(luò)性能測(cè)量技術(shù)帶來(lái)的挑戰(zhàn),指出了未來(lái)需要研究的內(nèi)容和發(fā)展方向.
關(guān)鍵詞網(wǎng)絡(luò)性能測(cè)量;路徑擬合;QoS;QoE;機(jī)器學(xué)習(xí)
Fig. 1 Development and evolution of network performance measurement.圖1 網(wǎng)絡(luò)性能測(cè)量發(fā)展與演變
隨著網(wǎng)絡(luò)的出現(xiàn)并逐步發(fā)展成覆蓋全球的互聯(lián)網(wǎng),互聯(lián)網(wǎng)的網(wǎng)絡(luò)性能成了用戶、管理人員及開(kāi)發(fā)人員等各方面關(guān)注的重點(diǎn),其測(cè)量技術(shù)和工具也成了重要的研究領(lǐng)域.網(wǎng)絡(luò)性能測(cè)量技術(shù)的發(fā)展一直是隨著網(wǎng)絡(luò)技術(shù)的發(fā)展而進(jìn)化,并隨著網(wǎng)絡(luò)規(guī)模的爆發(fā)式增長(zhǎng)和網(wǎng)絡(luò)應(yīng)用尤其是分布式應(yīng)用的快速增加而日漸重要.
從簡(jiǎn)單的網(wǎng)絡(luò)文件下載,到服務(wù)選擇、路由選擇、擁塞控制等,網(wǎng)絡(luò)性能都是重要的決策因素.性能測(cè)量技術(shù)最早被用于網(wǎng)絡(luò)監(jiān)控與管理工具中,幫助人們了解網(wǎng)絡(luò)的使用情況,解決網(wǎng)絡(luò)中出現(xiàn)的問(wèn)題,然后逐步擴(kuò)展到網(wǎng)絡(luò)協(xié)議研究與改進(jìn),P2P,CDN等分布式系統(tǒng)的構(gòu)建與優(yōu)化,應(yīng)用性能的提高等方面.
網(wǎng)絡(luò)性能測(cè)量技術(shù)分為被動(dòng)測(cè)量技術(shù)和主動(dòng)測(cè)量技術(shù)2大類,其主要區(qū)別在于測(cè)量者是否主動(dòng)向被測(cè)目標(biāo)網(wǎng)絡(luò)發(fā)送探測(cè)報(bào)文.被動(dòng)和主動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù)各有優(yōu)劣,近年來(lái)出現(xiàn)不少采用2種測(cè)量技術(shù)的協(xié)作模式進(jìn)行綜合測(cè)量的研究工作.不少研究人員已經(jīng)從技術(shù)特征、性能優(yōu)劣、測(cè)量代價(jià)等方面對(duì)網(wǎng)絡(luò)性能測(cè)量進(jìn)行了分析比較.本文試圖從歷史發(fā)展脈絡(luò)的角度理清網(wǎng)絡(luò)性能技術(shù)的發(fā)展特征,并重點(diǎn)分析進(jìn)入到大數(shù)據(jù)時(shí)代后,大數(shù)據(jù)處理分析技術(shù)、用戶體驗(yàn)研究等方面帶給網(wǎng)絡(luò)性能測(cè)量的改變與發(fā)展.按照測(cè)量范圍、測(cè)量目標(biāo)、技術(shù)特征等,網(wǎng)絡(luò)性能測(cè)量的發(fā)展與演變可劃分為3個(gè)階段,如圖1所示.
階段1. “所見(jiàn)即所得”測(cè)量.網(wǎng)絡(luò)發(fā)展初期規(guī)模較小,其上層應(yīng)用主要是點(diǎn)對(duì)點(diǎn)服務(wù),這個(gè)時(shí)期網(wǎng)絡(luò)性能測(cè)量目標(biāo)主要是點(diǎn)到點(diǎn)鏈路和端到端路徑,一般在路徑的一端或兩端直接發(fā)起測(cè)量.網(wǎng)絡(luò)性能測(cè)量早在20世紀(jì)80年代就已經(jīng)開(kāi)始,90年代中后期開(kāi)始引起越來(lái)越多研究人員的關(guān)注,并在21世紀(jì)初進(jìn)入一個(gè)高峰,很多網(wǎng)絡(luò)性能測(cè)量技術(shù)和工具在期間被提出并實(shí)現(xiàn)了,不少一直延用至今.
階段2. 路徑擬合的大規(guī)模分布式測(cè)量.隨著互聯(lián)網(wǎng)的發(fā)展,尤其是大規(guī)模分布式應(yīng)用的興起,越來(lái)越多的網(wǎng)絡(luò)應(yīng)用面向全球用戶提供P2P服務(wù),網(wǎng)絡(luò)性能的測(cè)量目標(biāo)也逐漸擴(kuò)張到整個(gè)互聯(lián)網(wǎng).人們希望了解互聯(lián)網(wǎng)范圍中任意兩個(gè)或多個(gè)終端之間的網(wǎng)絡(luò)性能,傳統(tǒng)的測(cè)量技術(shù)無(wú)法滿足這種規(guī)模的需求,因?yàn)榫W(wǎng)絡(luò)無(wú)法忍受如此大的侵入測(cè)量,并行測(cè)量也會(huì)導(dǎo)致測(cè)量技術(shù)的失效.基于路徑擬合的網(wǎng)絡(luò)測(cè)量技術(shù)因此被提出了,可利用分段路徑擬合端到端路徑,由分段路徑屬性估計(jì)端到端路徑屬性,可以減少網(wǎng)絡(luò)測(cè)量代價(jià),提高測(cè)量準(zhǔn)確性.
階段3. 大數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)QoE(quality of experience)測(cè)量.傳統(tǒng)的QoS(quality of service)網(wǎng)絡(luò)性能度量獲取的網(wǎng)絡(luò)狀態(tài),沒(méi)有考慮用戶感受,其測(cè)量的網(wǎng)絡(luò)性能往往不能真實(shí)反映用戶感受到的網(wǎng)絡(luò)服務(wù)水平,因此,學(xué)術(shù)界提出了基于用戶體驗(yàn)的QoE測(cè)量.但是,用戶的主觀感受是難以測(cè)量和量化的,傳統(tǒng)的QoE技術(shù)很難方便有效地獲得準(zhǔn)確結(jié)果.海量近客戶端測(cè)量的興起使獲取的網(wǎng)絡(luò)性能數(shù)據(jù)變得更巨量、更廣泛、更精細(xì)、更實(shí)時(shí),大數(shù)據(jù)已經(jīng)成為科學(xué)研究的基本范式,正在推動(dòng)著網(wǎng)絡(luò)和計(jì)算的融合,提供新的網(wǎng)絡(luò)數(shù)據(jù)問(wèn)題解決方式.基于大數(shù)據(jù)的QoE解決方法,可通過(guò)海量數(shù)據(jù)攜帶的信息,利用機(jī)器學(xué)習(xí)方式學(xué)習(xí)分析用戶對(duì)網(wǎng)絡(luò)服務(wù)的體驗(yàn).
本文先給出了各國(guó)際標(biāo)準(zhǔn)化組織的性能測(cè)量度量定義;然后按照技術(shù)發(fā)展特征分3個(gè)階段介紹互聯(lián)網(wǎng)性能測(cè)量技術(shù),重點(diǎn)討論了每個(gè)階段測(cè)量目標(biāo)的變化和技術(shù)革新;最后,總結(jié)互聯(lián)網(wǎng)性能測(cè)量技術(shù)存在的挑戰(zhàn),并指出進(jìn)一步的工作方向.
1性能度量定義
國(guó)際電信聯(lián)盟ITU-T、互聯(lián)網(wǎng)工程任務(wù)組IETF、第三代合作伙伴計(jì)劃3GPP等組織都成立了網(wǎng)絡(luò)性能相關(guān)的工作組,促進(jìn)網(wǎng)絡(luò)性能研究工作發(fā)展,并頒布了一系列的標(biāo)準(zhǔn)化建議.
1.1ITU-T
ITU-T技術(shù)研究小組SG9,SG12作了大量網(wǎng)絡(luò)性能的研究,研究范圍從電信網(wǎng)絡(luò)逐步擴(kuò)展到IP網(wǎng)絡(luò),發(fā)布了一系列的標(biāo)準(zhǔn)和建議,如ITU-T E.800-E.899系列,建立了比較完整的網(wǎng)絡(luò)QoS體系結(jié)構(gòu)和技術(shù)指標(biāo).E.800[1]建議定義服務(wù)質(zhì)量QoS為一種電信業(yè)務(wù)的特性總和,表明其滿足明示和暗示業(yè)務(wù)用戶需求的能力.I.350[2]建議定義的網(wǎng)絡(luò)性能是一系列對(duì)于運(yùn)營(yíng)商有意義的,并可用于系統(tǒng)設(shè)計(jì)、配置、操作和維護(hù)的參數(shù)進(jìn)行測(cè)量所得到的結(jié)果,性能測(cè)量的定義獨(dú)立于用戶終端性能及用戶動(dòng)作.Y.1540(原I.380)[3]詳細(xì)定義網(wǎng)絡(luò)性能參數(shù),詳細(xì)情況如表1所示.
ITU對(duì)電話、IPTV、網(wǎng)絡(luò)視頻等各種媒體的QoS都制定了比較詳細(xì)的QoS,具體內(nèi)容可以查看相關(guān)建議,如G.1000,G.1010,Y.1291,Y.1541等.
Table 1 Network Performance Metrics Definition of ITU-T and IETF
1.2IETF
IETF專門成立了IP性能度量工作組(IP per-formance metrics working group, IPPMWG),制定了幾十個(gè)意見(jiàn)和草案,涉及網(wǎng)絡(luò)性能管理、性能參數(shù)及測(cè)量框架.其中,RFC2330[4]定義了IP性能度量的框架和基本度量,包括連通性、延遲、丟包率等,并在相關(guān)的RFC中詳細(xì)規(guī)范了每個(gè)度量.
如表1所示,基礎(chǔ)的網(wǎng)絡(luò)性能度量可劃分成服務(wù)能力、延遲、包錯(cuò)誤、傳輸能力4大類,ITU-T和IETF在這4個(gè)方面都進(jìn)行了比較詳細(xì)的研究,定義不少性能度量.總體上,2個(gè)組織的基本度量是一致的,只有一些小區(qū)別.ITU-T區(qū)分了延遲的平均值、最小值和中值,而IETF區(qū)分了單路延遲和回路延遲;ITU-T區(qū)分了丟包和錯(cuò)包、重復(fù)包和復(fù)制包,而IETF區(qū)分了單路丟包率和回路丟包率,兩者都同時(shí)關(guān)注了錯(cuò)誤發(fā)生的時(shí)間影響,但是定義了不同的度量;ITU-T把網(wǎng)絡(luò)性能度量目標(biāo)劃分成端和路徑2類,并關(guān)注了網(wǎng)絡(luò)帶寬的抖動(dòng),而IETF則劃分成鏈路和路徑2類,兩者都區(qū)分了網(wǎng)絡(luò)傳輸能力和上層傳輸能力的不同.從2個(gè)組織定義標(biāo)準(zhǔn)的歷史發(fā)展進(jìn)程來(lái)看,對(duì)因特網(wǎng)性能測(cè)量的理解是逐步加深細(xì)化的,而且2個(gè)組織也在互相學(xué)習(xí).
IPPMWG還定義了單路主動(dòng)測(cè)量協(xié)議OWAMP和雙路主動(dòng)測(cè)量協(xié)議TWAMP,解決測(cè)量中出現(xiàn)的非對(duì)稱路徑問(wèn)題,其控制與測(cè)量相分離,用更小的測(cè)量報(bào)文來(lái)獲取更高的安全性.
移動(dòng)通信網(wǎng)絡(luò)已經(jīng)走過(guò)幾代標(biāo)準(zhǔn),GSM,GPRS,UMTS,HSPA,LTE,越來(lái)越注重用戶通信質(zhì)量保障.3GPP的TS23.107[5]和TS23.207[6]定義了移動(dòng)網(wǎng)絡(luò)的QoS及體系框架,為了滿足各類業(yè)務(wù)QoS,還詳細(xì)制定了通信規(guī)程、控制信令.移動(dòng)網(wǎng)絡(luò)的性能參數(shù)很多和有線網(wǎng)絡(luò)相同,但網(wǎng)絡(luò)通信媒介的不同和網(wǎng)絡(luò)結(jié)構(gòu)的差異導(dǎo)致了不少獨(dú)有度量的產(chǎn)生.每一代移動(dòng)通信標(biāo)準(zhǔn)對(duì)網(wǎng)絡(luò)性能參數(shù)都有明確的規(guī)定,一些最新移動(dòng)網(wǎng)絡(luò)的QoS參數(shù)要求如表2所示:
Table 2 QoS Parameters of Mobile Network
2“所見(jiàn)即所得”的網(wǎng)絡(luò)性能測(cè)量
早在互聯(lián)網(wǎng)成立之初,網(wǎng)絡(luò)研究人員就開(kāi)始利用一些工具測(cè)量網(wǎng)絡(luò)性能,如TTCP[7].到20世紀(jì)90年代中后期,陸續(xù)發(fā)布了不少網(wǎng)絡(luò)性能測(cè)量工具.21世紀(jì)初,本領(lǐng)域的第1個(gè)高潮出現(xiàn)了,涌現(xiàn)了許多基于不同技術(shù)的針對(duì)不同目標(biāo)的網(wǎng)絡(luò)性能測(cè)量工具,同時(shí)對(duì)測(cè)量工具的準(zhǔn)確性、測(cè)量時(shí)間、侵入性、適用性等進(jìn)行了深入細(xì)致地研究.這個(gè)階段的網(wǎng)絡(luò)性能測(cè)量技術(shù)主要用于測(cè)量點(diǎn)到點(diǎn)鏈路或端到端路徑的屬性,可以看成是“所見(jiàn)即所得”測(cè)量,即需要獲取哪個(gè)目標(biāo)的網(wǎng)絡(luò)性能屬性,就對(duì)哪個(gè)被測(cè)目標(biāo)發(fā)起測(cè)量.
被動(dòng)測(cè)量技術(shù)與主動(dòng)測(cè)量技術(shù)的測(cè)量節(jié)點(diǎn)、測(cè)量數(shù)據(jù)、測(cè)量過(guò)程等都不相同.被動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù),通過(guò)截取網(wǎng)絡(luò)中的各種信息推測(cè)網(wǎng)絡(luò)性能.如圖2中虛線所示,想獲取終端P1到P2的網(wǎng)絡(luò)性能,可以在P1與P2之間的路徑上某一位置截取網(wǎng)絡(luò)數(shù)據(jù),截取數(shù)據(jù)設(shè)備M1可以直接接入鏈路,或者接入點(diǎn)對(duì)點(diǎn)鏈路的終端路由器上,或者直接復(fù)制物理信號(hào).同樣測(cè)量P1與P2之間的帶寬,主動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù)需要控制P1向P2發(fā)送探測(cè)報(bào)文,如圖2中實(shí)線所示.這個(gè)階段的技術(shù)研究經(jīng)歷了很長(zhǎng)的發(fā)展時(shí)間,并且還在一直深化,其豐富的成果也是后續(xù)2個(gè)階段的研究基礎(chǔ)和技術(shù)組成部分,本節(jié)將先從被動(dòng)和主動(dòng)測(cè)量2個(gè)方面進(jìn)行介紹.
Fig. 2 System architecture of passive and active measurement.圖2 被動(dòng)測(cè)量和主動(dòng)測(cè)量系統(tǒng)架構(gòu)
2.1被動(dòng)測(cè)量技術(shù)
被動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù),在根據(jù)目標(biāo)選擇的特定位置上,抽取或復(fù)制網(wǎng)絡(luò)流量數(shù)據(jù),并按照不同粒度水平記錄和處理,獲取網(wǎng)絡(luò)性能數(shù)據(jù),可以快速地檢測(cè)到網(wǎng)絡(luò)錯(cuò)誤和網(wǎng)絡(luò)失效,了解節(jié)點(diǎn)報(bào)文處理結(jié)果,計(jì)算網(wǎng)絡(luò)傳輸能力及其變化情況.
被動(dòng)測(cè)量可以記錄測(cè)量節(jié)點(diǎn)最完整的信息,包括從物理層一直到應(yīng)用層的協(xié)議數(shù)據(jù).其流量記錄粒度按照從粗到細(xì)大致可以分為4級(jí):簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議SNMP記錄的統(tǒng)計(jì)信息、網(wǎng)絡(luò)流記錄、網(wǎng)絡(luò)報(bào)文記錄、完整網(wǎng)絡(luò)報(bào)文記錄[8].高速鏈路的完整記錄需要消耗大量資源,需要高效的記錄方法,如NetFlow,文獻(xiàn)[9]提出了基于對(duì)象和應(yīng)用流量特征統(tǒng)計(jì)描述周期性導(dǎo)出流量特征的方法,減少了傳輸和存儲(chǔ)的數(shù)據(jù)量.文獻(xiàn)[10]提出了一種基于支持向量機(jī)的流量分類算法,具有良好的準(zhǔn)確性和穩(wěn)定性.文獻(xiàn)[11]可以在線識(shí)別和淘汰小流,提取大流,可為性能分析提供很好的數(shù)據(jù)基礎(chǔ).由于上層協(xié)議數(shù)據(jù)涉及隱私,物理層、鏈路層數(shù)據(jù)格式多變且只有本地信息,對(duì)網(wǎng)絡(luò)性能研究主要集中在網(wǎng)絡(luò)層和傳輸層.
按照測(cè)量設(shè)備,可以劃分成基于軟件的測(cè)量方法和基于硬件的測(cè)量方法[8].使用軟件測(cè)量網(wǎng)絡(luò),可以直接調(diào)用某些系統(tǒng)接口,或者通過(guò)修改系統(tǒng)和設(shè)備驅(qū)動(dòng)獲取數(shù)據(jù)報(bào)文.軟件測(cè)量工具可以部署在現(xiàn)有的通用平臺(tái)上,實(shí)施方便、代價(jià)小、可擴(kuò)展性好.使用專用硬件設(shè)備,可以從物理層開(kāi)始抓取網(wǎng)絡(luò)數(shù)據(jù),通過(guò)分光器、網(wǎng)絡(luò)接口(鏡像路由接口)等方式,獲取最完整信息.專門為測(cè)量開(kāi)發(fā)的硬件設(shè)施,性能強(qiáng),可用于現(xiàn)在的高速及超高速網(wǎng)絡(luò),但其開(kāi)發(fā)、部署成本要遠(yuǎn)高于軟件模式.
已經(jīng)有不少研究人員在這方面進(jìn)行了探索,如文獻(xiàn)[12]構(gòu)建了一個(gè)被動(dòng)測(cè)量系統(tǒng)原型SPAND,通過(guò)大量用戶的共享式被動(dòng)測(cè)量,提供準(zhǔn)確及時(shí)的網(wǎng)絡(luò)特征預(yù)測(cè),包括吞吐量、時(shí)間、響應(yīng)準(zhǔn)確性等.文獻(xiàn)[13]提出一種研究TCP連接特征的被動(dòng)測(cè)量技術(shù),可以跟蹤和推斷發(fā)送者的擁塞窗口及RTT等參數(shù).文獻(xiàn)[14]通過(guò)被動(dòng)收集的流記錄,建造吞吐量索引,估計(jì)不同位置不同時(shí)間的下載速度.
被動(dòng)網(wǎng)絡(luò)性能測(cè)量不需要向網(wǎng)絡(luò)發(fā)送探測(cè)報(bào)文,不改變已經(jīng)存在的網(wǎng)絡(luò)流量,對(duì)網(wǎng)絡(luò)是非侵入性的.但由于互聯(lián)網(wǎng)的層次性結(jié)構(gòu),被劃分成國(guó)家或地區(qū)、ISP、自治域等不同級(jí)別區(qū)域,一個(gè)測(cè)量節(jié)點(diǎn)抓取的網(wǎng)絡(luò)數(shù)據(jù),只能反映一部分網(wǎng)絡(luò)的信息,無(wú)法獲取整個(gè)互聯(lián)網(wǎng)或端到端的信息.因此,被動(dòng)網(wǎng)絡(luò)測(cè)量一般基于分布式多節(jié)點(diǎn)部署,而這又帶來(lái)了任務(wù)協(xié)作與分配、數(shù)據(jù)存儲(chǔ)、匯聚、管理等分布式處理問(wèn)題.其第2個(gè)問(wèn)題是被動(dòng)測(cè)量的測(cè)量節(jié)點(diǎn)需要部署在非常廣泛的區(qū)域,可能需要部署到很多國(guó)家的不同ISP的內(nèi)部節(jié)點(diǎn),由于商業(yè)、政策等因素的影響,這在實(shí)際當(dāng)中幾乎是不能實(shí)現(xiàn)的.最后一個(gè)是關(guān)于法律和道德的問(wèn)題,由于數(shù)據(jù)涉及大量用戶的隱私,如何做到既消除大眾的顧慮,又能滿足研究的需求,需要制定法律和指導(dǎo)方針,并嚴(yán)格執(zhí)行數(shù)據(jù)管理、使用等方面的規(guī)定.
2.2主動(dòng)測(cè)量技術(shù)
主動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù)構(gòu)造各種結(jié)構(gòu)的探測(cè)報(bào)文序列,發(fā)送到被測(cè)目標(biāo)網(wǎng)絡(luò)中,利用被測(cè)目標(biāo)的響應(yīng)信息,或者探測(cè)報(bào)文序列傳輸經(jīng)過(guò)目標(biāo)網(wǎng)絡(luò)后攜帶的目標(biāo)網(wǎng)絡(luò)信息來(lái)推測(cè)網(wǎng)絡(luò)性能.主動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù)比被動(dòng)技術(shù)能更好地理解端到端的路徑,其測(cè)量節(jié)點(diǎn)只需要部署在一個(gè)或一些終端設(shè)備中,不需要部署到互聯(lián)網(wǎng)的核心設(shè)備,無(wú)需涉及用戶隱私數(shù)據(jù)、部署方便、成本小.當(dāng)測(cè)量節(jié)點(diǎn)擴(kuò)張到足夠數(shù)量,并部署到合理的位置時(shí),主動(dòng)網(wǎng)絡(luò)性能測(cè)量技術(shù)能獲取對(duì)互聯(lián)網(wǎng)的整體理解,這對(duì)被動(dòng)測(cè)量技術(shù)是十分困難的.
經(jīng)過(guò)多年發(fā)展,學(xué)術(shù)界提出并實(shí)現(xiàn)了大量各種類型的主動(dòng)測(cè)量工具,為了更清晰地了解目前主動(dòng)測(cè)量技術(shù)的發(fā)展,可以按照不同方式進(jìn)行分類研究.按照是否需要被測(cè)網(wǎng)絡(luò)中設(shè)備協(xié)作發(fā)送響應(yīng)信息,可以分為終端用戶獨(dú)立的測(cè)量方式和基于網(wǎng)絡(luò)設(shè)備響應(yīng)信息的測(cè)量方式;按照測(cè)量是否造成被測(cè)網(wǎng)絡(luò)擁塞,可以分為擁塞測(cè)量方法和非擁塞測(cè)量方法[15];按照測(cè)量所使用探測(cè)報(bào)文的發(fā)送序列格式,可以分為變長(zhǎng)分組[16-17]、分組對(duì)、分組隊(duì)列[18]、四重分組[19]、自加載周期性序列[20]、變速探測(cè)包序列[21]、分組追尾隊(duì)列[22]等;按照測(cè)量所使用探測(cè)報(bào)文協(xié)議不同,可以分為ICMP,UDP,TCP,HTTP;按照測(cè)量所依據(jù)的信息度量不同,可以分為包間隔模型、包速度模型;還有按照時(shí)域和頻域方式的劃分方法等.
為了解決測(cè)量中出現(xiàn)的問(wèn)題,文獻(xiàn)[23]提出分析包間隔時(shí)延的光譜學(xué)方法,基于量子化的數(shù)據(jù)周期、頻率、時(shí)延等信息進(jìn)行受限條件下的帶寬估計(jì).文獻(xiàn)[24]提出借鑒通信網(wǎng)絡(luò)的頻譜分析方法來(lái)分析網(wǎng)絡(luò)路徑屬性,利用周期性包列產(chǎn)生IP網(wǎng)絡(luò)的頻域信號(hào),通過(guò)復(fù)用的頻域信號(hào)之間的交叉干擾現(xiàn)象檢測(cè)共享存儲(chǔ)轉(zhuǎn)發(fā)設(shè)備、網(wǎng)絡(luò)瓶頸鏈路屬性等.文獻(xiàn)[25]理論證明三角不等式產(chǎn)生于網(wǎng)絡(luò)核心,而接入網(wǎng)絡(luò)使用可以減輕其數(shù)目.最小時(shí)延和方法(minimum delay SUM, MDSUM)[26]和最小時(shí)延差方法(minimum delay DIFference, MDDIF)[27],可用來(lái)過(guò)濾測(cè)量中背景流量的影響.文獻(xiàn)[28]提出了一種基于蒙特卡洛隨機(jī)抽樣思想的新探測(cè)理論,隨機(jī)發(fā)送單個(gè)小探測(cè)報(bào)文,測(cè)量計(jì)算路徑可用帶寬及各鏈路容量和空閑率,進(jìn)而獲取各路由節(jié)點(diǎn)的流量變化和各鏈路背景流的分布情況.文獻(xiàn)[29]利用硬件產(chǎn)生時(shí)間戳,基于預(yù)測(cè)的時(shí)鐘同步算法獲得了相當(dāng)GPS精度的時(shí)間戳.
表3列出了被動(dòng)與主動(dòng)測(cè)量技術(shù)的優(yōu)點(diǎn)與缺點(diǎn).很多研究工作對(duì)各種測(cè)量工具在不同應(yīng)用場(chǎng)景下的準(zhǔn)確性、侵入性、測(cè)量時(shí)間、負(fù)載等參數(shù)進(jìn)行過(guò)詳細(xì)的對(duì)比分析,發(fā)現(xiàn)測(cè)量工具很難同時(shí)滿足各種應(yīng)用的需求[30-33].不同測(cè)量方法各有優(yōu)劣,需要根據(jù)網(wǎng)絡(luò)目標(biāo)、應(yīng)用場(chǎng)景、性能參數(shù)等選擇測(cè)量技術(shù),文獻(xiàn)[34]同時(shí)采用被動(dòng)和主動(dòng)測(cè)量技術(shù)進(jìn)行網(wǎng)絡(luò)性能測(cè)量.這種方式綜合被動(dòng)測(cè)量和主動(dòng)測(cè)量技術(shù)的優(yōu)缺點(diǎn),可合理部署測(cè)量節(jié)點(diǎn),減少測(cè)量的代價(jià)及測(cè)量對(duì)互聯(lián)網(wǎng)的影響,提高測(cè)量的準(zhǔn)確性和完整性,獲取最大的數(shù)據(jù)經(jīng)濟(jì)密度.
Table 3 Advantages and Disadvantages of Passive and Active Measurement
3基于路徑擬合的大規(guī)模分布式測(cè)量
互聯(lián)網(wǎng)擴(kuò)展到全球范圍,其終端高達(dá)幾十億;當(dāng)分布式和P2P應(yīng)用大量出現(xiàn)并服務(wù)于全球用戶時(shí),測(cè)量的對(duì)象也從點(diǎn)到點(diǎn)變成了P2P,互聯(lián)網(wǎng)性能測(cè)量也進(jìn)入了一個(gè)新的大規(guī)模分布式測(cè)量階段.
傳統(tǒng)的性能測(cè)量方法很難測(cè)量互聯(lián)網(wǎng)范圍內(nèi)任意節(jié)點(diǎn)之間的網(wǎng)絡(luò)性能,即使在技術(shù)上可以達(dá)到測(cè)量目標(biāo),其測(cè)量的代價(jià)、侵入性、準(zhǔn)確性、實(shí)時(shí)性等方面的問(wèn)題也造成技術(shù)無(wú)法實(shí)用.
Fig. 3 Network path composition.圖3 網(wǎng)絡(luò)路徑擬合
被動(dòng)網(wǎng)絡(luò)性能測(cè)量方式,需要在全球范圍內(nèi)部署測(cè)量節(jié)點(diǎn),其部署成本會(huì)高到無(wú)法實(shí)現(xiàn),同時(shí)很多測(cè)量節(jié)點(diǎn)要部署到某些網(wǎng)絡(luò)內(nèi)部,基于商業(yè)、政策等方面的因素,這是無(wú)法實(shí)現(xiàn)的.采用主動(dòng)測(cè)量方式,可能造成測(cè)量結(jié)果失效,其測(cè)量代價(jià)也是網(wǎng)絡(luò)無(wú)法忍受的.如圖3所示,終端P1要獲取到終端P2的帶寬,測(cè)量數(shù)據(jù)只需要在P1和P2之間的路徑上進(jìn)行傳輸,如圖3中粗虛線所示.如果某個(gè)應(yīng)用系統(tǒng)含有N個(gè)終端節(jié)點(diǎn),P1要從其余N-1個(gè)節(jié)點(diǎn)中選擇一條帶寬最大的,只需發(fā)起N-1次測(cè)量.而對(duì)P2P等應(yīng)用,測(cè)量任意2個(gè)節(jié)點(diǎn)之間的帶寬,假設(shè)線路都是對(duì)稱線路,同一時(shí)刻出現(xiàn)的測(cè)量可達(dá)N2個(gè),其測(cè)量次數(shù)隨N指數(shù)增加.互聯(lián)網(wǎng)級(jí)的網(wǎng)絡(luò)測(cè)量,需要部署大規(guī)模分布式測(cè)量網(wǎng)絡(luò),會(huì)遇到很多端到端測(cè)量時(shí)沒(méi)有出現(xiàn)的問(wèn)題.文獻(xiàn)[35]指出,在單獨(dú)使用時(shí)性能良好的測(cè)量工具在大規(guī)模分布式系統(tǒng)中無(wú)法工作,因?yàn)槎鄠€(gè)測(cè)量會(huì)造成嚴(yán)重的互相影響,導(dǎo)致測(cè)量結(jié)果出現(xiàn)很大的誤差,并提出了需要考慮的因素,如盡量利用現(xiàn)有數(shù)據(jù)攜帶測(cè)量、采用整形后影響更小的平滑流量,及直接測(cè)量或者減少迭代.文獻(xiàn)[36]量化分析了共享測(cè)量的一些影響因素,包括相互干擾影響、總負(fù)載影響、測(cè)量過(guò)程的侵入性等.文獻(xiàn)[37]形式化地描述了分布式環(huán)境中的帶寬決定問(wèn)題,設(shè)計(jì)了高效的分布式算法,并給出了在2種模型中協(xié)作帶寬測(cè)量算法時(shí)間復(fù)雜度的下限.文獻(xiàn)[38]把互聯(lián)網(wǎng)看成一個(gè)樹度量空間,在此基礎(chǔ)上建造了一個(gè)非中心化的、準(zhǔn)確的、低代價(jià)的系統(tǒng),可以預(yù)測(cè)終端用戶之間的雙向帶寬,并提出3個(gè)新的啟發(fā)式分布式算法,可以利用不準(zhǔn)確的輸入數(shù)據(jù)預(yù)測(cè)帶寬.
為了克服這些困難,iplane[39-40]提出了一個(gè)系統(tǒng)的解決方案,利用互聯(lián)網(wǎng)路由及拓?fù)湫畔?gòu)建的一個(gè)互聯(lián)網(wǎng)地圖集,可基于路徑擬合技術(shù)估計(jì)互聯(lián)網(wǎng)中任意2個(gè)終端用戶之間的路徑帶寬.路徑擬合技術(shù),就是利用構(gòu)建的互聯(lián)網(wǎng)地圖集中某些分段路徑,合成替換2個(gè)終端用戶之間的真實(shí)路徑,利用合成路徑的屬性來(lái)估計(jì)終端用戶之間的路徑屬性.iplane Nano[41]根據(jù)互聯(lián)網(wǎng)的路由信息和路由策略,剔除了實(shí)際網(wǎng)絡(luò)中路由策略不提供的路徑,利用網(wǎng)絡(luò)鏈路構(gòu)建了一個(gè)更加精煉的互聯(lián)網(wǎng)地圖,測(cè)量速度更快,代價(jià)更小.
如圖3所示的簡(jiǎn)單網(wǎng)絡(luò)中,P為需要測(cè)量的網(wǎng)絡(luò)終端,數(shù)量為N;V是部署的測(cè)量節(jié)點(diǎn)集,可以發(fā)起測(cè)量,數(shù)量為M;D是為了獲取網(wǎng)絡(luò)路徑而選取的目的節(jié)點(diǎn)集,數(shù)量為L(zhǎng).則P1與P2之間的路徑為
Path1(P1,P2)={P1,R1,R2,
在測(cè)量節(jié)點(diǎn)V發(fā)起主動(dòng)測(cè)量,可以測(cè)量獲取M條到P2的網(wǎng)絡(luò)路徑,P1測(cè)量獲取L條到目的節(jié)點(diǎn)集的網(wǎng)絡(luò)路徑,當(dāng)V,D選取的數(shù)量足夠并位于合理的位置,這些路徑會(huì)和Path(P1,P2)具有較多的重合,選取重合路徑最多并且交叉節(jié)點(diǎn)離原路徑最近的一條路徑,就是擬合的路徑,如:
Path2(P1,P2)={P1,R1,R2,R7,
Path(P1,R7)+Path(R7,P2).
路徑擬合就是利用Path(P1,R7)和Path(R7,P2)擬合成Path2(P1,P2),再替換Path1(P1,P2),然后由這2段路徑的帶寬估計(jì)P1,P2之間的帶寬.同理,任意2點(diǎn)之間的路徑帶寬都可以采用此方式.路徑擬合方式測(cè)量需要N(M+L)次,當(dāng)系統(tǒng)達(dá)到互聯(lián)網(wǎng)規(guī)模時(shí),M+L?N,測(cè)量次數(shù)只需要O(N),遠(yuǎn)遠(yuǎn)小于傳統(tǒng)方式的O(N2),同一時(shí)刻的并行測(cè)量也大大減少,降低了對(duì)測(cè)量節(jié)點(diǎn)的設(shè)備能力要求,一條鏈路同時(shí)發(fā)生多個(gè)測(cè)量的概率也降低很多,減少了測(cè)量相互影響導(dǎo)致的錯(cuò)誤結(jié)果.
基于路徑擬合的網(wǎng)絡(luò)測(cè)量模式,把互聯(lián)網(wǎng)規(guī)模的端到端測(cè)量問(wèn)題做了指數(shù)級(jí)的降低,把一個(gè)不可能完成的任務(wù)變成了一個(gè)可實(shí)現(xiàn)的方案,通過(guò)部署良好的測(cè)量節(jié)點(diǎn),利用現(xiàn)有的網(wǎng)絡(luò)測(cè)量技術(shù),在稍微降低一點(diǎn)測(cè)量精度的代價(jià)下,達(dá)到了快速準(zhǔn)確的性能測(cè)量,并將對(duì)網(wǎng)絡(luò)侵入性控制在可以忍受的范圍中.
4大數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)QoE測(cè)量
網(wǎng)絡(luò)服務(wù)的最終目標(biāo)是供用戶使用,并提供用戶滿意的服務(wù)質(zhì)量.當(dāng)技術(shù)發(fā)展到一定階段,往往用戶體驗(yàn)更能決定成敗.文獻(xiàn)[42]表明,面對(duì)低QoE無(wú)線網(wǎng)絡(luò),65%的用戶會(huì)嘗試改變接入網(wǎng)絡(luò),22%的用戶會(huì)放棄接入,僅剩13%的用戶會(huì)嘗試再次接入此網(wǎng)絡(luò).
QoE包含人的主觀因素,很難進(jìn)行測(cè)量和量化,并獲取完整的影響因素及因果關(guān)系.客戶端測(cè)量的興起,提供了大量的網(wǎng)絡(luò)測(cè)量節(jié)點(diǎn),包括電腦終端、家庭網(wǎng)關(guān)、移動(dòng)終端,各類測(cè)量終端獲取了海量的關(guān)于網(wǎng)絡(luò)性能不同側(cè)面的數(shù)據(jù)[43].大數(shù)據(jù)處理技術(shù)的發(fā)展,可以通過(guò)分析海量數(shù)據(jù)的相關(guān)性,形成基于大數(shù)據(jù)的網(wǎng)絡(luò)QoE測(cè)量方法.
4.1QoE
對(duì)于研究人員或技術(shù)人員來(lái)說(shuō),基于數(shù)值的QoS參數(shù)就是網(wǎng)絡(luò)服務(wù)能力最準(zhǔn)確的描述,但是非專業(yè)人員或普通用戶可能并不明白也不關(guān)心QoS參數(shù)的具體意義,他們真正關(guān)心的不是某個(gè)參數(shù)準(zhǔn)確數(shù)值大小,而是他所享受的上網(wǎng)、視頻、IP電話、游戲、文件傳輸?shù)染W(wǎng)絡(luò)服務(wù)是否滿足要求.
這種以用戶認(rèn)可程度為評(píng)價(jià)標(biāo)準(zhǔn)的業(yè)務(wù)服務(wù)質(zhì)量,稱為用戶體驗(yàn)質(zhì)量,區(qū)別于目前采用最廣泛的服務(wù)質(zhì)量QoS.國(guó)際電信聯(lián)盟定義QoE為終端用戶對(duì)應(yīng)用或者服務(wù)的整體主觀可接受程度[44].QoE從用戶主觀感受的角度研究服務(wù)質(zhì)量,其影響因素包含服務(wù)、用戶、環(huán)境3個(gè)層面.服務(wù)層面涉及OSI模型中網(wǎng)絡(luò)層、傳輸層、會(huì)話層、表示層、應(yīng)用層中各類參數(shù);用戶層面涉及用戶的年齡、性別、教育程度、身心狀態(tài)、期望等;環(huán)境層面包括自然環(huán)境、人文與社會(huì)環(huán)境、服務(wù)運(yùn)行環(huán)境等[45-46].
QoE的核心問(wèn)題是研究QoE與其影響因素之間的映射關(guān)系.QoE涉及很多主客觀因素,主觀影響因素很難進(jìn)行量化測(cè)量,每個(gè)因素對(duì)最終用戶體驗(yàn)的重要程度也難以確認(rèn),各因素之間還有復(fù)雜的相互影響,這些都給QoE的研究帶來(lái)了非常大的挑戰(zhàn).
QoE評(píng)價(jià)方法可以劃分成主觀評(píng)價(jià)法、客觀評(píng)價(jià)法,關(guān)鍵看是否讓用戶參與評(píng)價(jià)所使用的業(yè)務(wù).主觀評(píng)價(jià)方法,準(zhǔn)確性較高,但是代價(jià)大、可移植性差、不具有實(shí)時(shí)性,一般只是作為其他方法的評(píng)價(jià)標(biāo)準(zhǔn).
用戶滿意度隨業(yè)務(wù)性能增長(zhǎng)而增長(zhǎng),但增長(zhǎng)比例是下降的,滿意度越高,增長(zhǎng)越困難,其關(guān)系類似上凸曲線.通過(guò)分析用戶對(duì)網(wǎng)絡(luò)服務(wù)滿意度,可用最小的代價(jià)提供給用戶最高的滿意度,獲取最大經(jīng)濟(jì)價(jià)值.
4.2網(wǎng)絡(luò)流媒體業(yè)務(wù)QoE
從業(yè)務(wù)對(duì)網(wǎng)絡(luò)資源的需求程度,可以將網(wǎng)絡(luò)業(yè)務(wù)簡(jiǎn)單劃分成流媒體業(yè)務(wù)、非流媒體業(yè)務(wù).IPTV、視頻點(diǎn)播、網(wǎng)絡(luò)直播等網(wǎng)絡(luò)流媒體服務(wù)在互聯(lián)網(wǎng)中占據(jù)了越來(lái)越重要的地位,對(duì)帶寬、時(shí)延、抖動(dòng)等提出了更高的需求.
流媒體業(yè)務(wù)QoE研究工作開(kāi)展比較早,也比較多.文獻(xiàn)[47]使用Narus公司的語(yǔ)義流量分析建立QoS與QoE之間的關(guān)系,主要研究了Web應(yīng)用中響應(yīng)時(shí)間、有效帶寬、交付時(shí)間等QoS參數(shù)的影響.但是只分析了一對(duì)一的QoE與QoS關(guān)系,沒(méi)有建立整體用戶QoE.文獻(xiàn)[48]提出用戶滿意度索引USI方法研究Skype等VOIP業(yè)務(wù)的QoE,通過(guò)被動(dòng)和主動(dòng)方式相結(jié)合采集的數(shù)據(jù),采用回歸分析建立通話時(shí)間與比特率、延遲抖動(dòng)、丟包率、網(wǎng)絡(luò)延時(shí)等QoS參數(shù)的關(guān)系,可在線計(jì)算,滿足實(shí)時(shí)應(yīng)用.文獻(xiàn)[49]提出一個(gè)眾包框架測(cè)試平臺(tái),用成對(duì)比較法定量分析QoE,與MOS方法比較,參與度高、用戶范圍廣、數(shù)據(jù)可以系統(tǒng)校驗(yàn),用低代價(jià)獲得了高水平的參與密度.文獻(xiàn)[50]研究視頻質(zhì)量與用戶參與度的關(guān)系,利用客戶端設(shè)備測(cè)量短VoD、長(zhǎng)VoD、直播等視頻質(zhì)量度量,發(fā)現(xiàn)最大的影響因素是緩沖.文獻(xiàn)[51]建立視頻質(zhì)量與用戶行為之間的因果關(guān)系,超出了純粹的相關(guān)性研究.為了建立因果關(guān)系,本文采用了準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)研究用戶放棄和重復(fù)的行為,研究了時(shí)延、緩沖時(shí)間、失敗訪問(wèn)等參數(shù).
QoE的研究工作開(kāi)始于音視頻業(yè)務(wù),基于這些流媒體業(yè)務(wù)提出了不少基于主客觀評(píng)價(jià)方法,或者基于統(tǒng)計(jì)學(xué)、心理學(xué)等學(xué)科的QoE評(píng)價(jià)方法.
4.3非流媒體業(yè)務(wù)QoE
現(xiàn)有對(duì)非流媒體業(yè)務(wù)QoE相關(guān)研究工作涉及的范圍比較廣,有關(guān)于具體一種業(yè)務(wù),也有關(guān)于整個(gè)系統(tǒng)的全面研究,其評(píng)價(jià)方法包括主客觀評(píng)價(jià)方法,但研究還不夠深入,方法的準(zhǔn)確性、適應(yīng)性、完整性等方面還存在問(wèn)題.
文獻(xiàn)[52]分析在線游戲的QoE,建立了用戶游戲時(shí)間與網(wǎng)絡(luò)時(shí)延、時(shí)延抖動(dòng)、丟包率之間的關(guān)聯(lián)公式,可以預(yù)測(cè)用戶游戲時(shí)間.文獻(xiàn)[53]通過(guò)構(gòu)建本地測(cè)試床研究云游戲的QoE,利用主觀用戶實(shí)驗(yàn)和MOS,分析對(duì)稱網(wǎng)絡(luò)環(huán)境下和非對(duì)稱網(wǎng)絡(luò)環(huán)境下時(shí)延和丟包率及丟包發(fā)生的方向與QoE的關(guān)系.文獻(xiàn)[54]提出一個(gè)新的基于QoE的云應(yīng)用分類機(jī)制,并研究服務(wù)遷移到云后在QoE分析和管理等方面出現(xiàn)的挑戰(zhàn).文獻(xiàn)[55]基于模糊層次分析法FAHP建立了短信服務(wù)OoE的層次化評(píng)價(jià)體系結(jié)構(gòu),把OoE評(píng)價(jià)指標(biāo)分成可訪問(wèn)性、即時(shí)性、完整性、內(nèi)容質(zhì)量及可持續(xù)性,再關(guān)聯(lián)到不同QoS參數(shù).此方法需要先驗(yàn)信息確定參數(shù)權(quán)重,無(wú)法描述同層參數(shù)之間的關(guān)系.
一個(gè)通信系統(tǒng)包括很多領(lǐng)域,技術(shù)方面、商業(yè)模式、用戶行為、內(nèi)容,各領(lǐng)域都建立了獨(dú)特的QoE模型,文獻(xiàn)[56]在綜合各領(lǐng)域不同QoE模型的基礎(chǔ)上,建立了通信系統(tǒng)整體QoE的高級(jí)模型.
文獻(xiàn)[57]提出了一個(gè)基于瀏覽器的Web性能測(cè)量工具,文獻(xiàn)[58]從客戶端的角度分析不同設(shè)備、操作系統(tǒng)、瀏覽器對(duì)網(wǎng)頁(yè)瀏覽的影響,都沒(méi)有從客戶體驗(yàn)的角度總體分析.非流媒體網(wǎng)絡(luò)業(yè)務(wù)的QoE研究主要集中在在線游戲、短消息業(yè)務(wù)等方面,而對(duì)現(xiàn)在用戶較多的一些網(wǎng)絡(luò)業(yè)務(wù)研究較少,如網(wǎng)頁(yè)瀏覽、實(shí)時(shí)通信等.
4.4QoE的大數(shù)據(jù)解決思想
隨著互聯(lián)網(wǎng)規(guī)模的高速增長(zhǎng),對(duì)互聯(lián)網(wǎng)的網(wǎng)絡(luò)測(cè)量規(guī)模也越來(lái)越大,產(chǎn)生了海量的測(cè)量數(shù)據(jù).如UCSD的Telescope項(xiàng)目已經(jīng)獲取的數(shù)據(jù)壓縮后仍然超過(guò)150 TB,并且還在以每個(gè)月4.5 TB的速度增長(zhǎng).異構(gòu)的通信網(wǎng)絡(luò)、多種多樣的網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)設(shè)備、網(wǎng)絡(luò)鏈路造成網(wǎng)絡(luò)測(cè)量數(shù)據(jù)的豐富,包括各種結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù).互聯(lián)網(wǎng)是一個(gè)長(zhǎng)期演變的過(guò)程,測(cè)量數(shù)據(jù)具有時(shí)效性,需要測(cè)量、保存、處理長(zhǎng)時(shí)間的數(shù)據(jù).互聯(lián)網(wǎng)也是動(dòng)態(tài)變化、相互影響的,某個(gè)設(shè)備或某條鏈路的快速短暫變化,就可能對(duì)整個(gè)互聯(lián)網(wǎng)造成影響,需要網(wǎng)絡(luò)測(cè)量具有實(shí)時(shí)性,甚至達(dá)到毫秒級(jí)的測(cè)量精度,同時(shí)動(dòng)態(tài)的變化也產(chǎn)生了海量數(shù)據(jù).同時(shí),網(wǎng)絡(luò)測(cè)量存在的這些困難致使到現(xiàn)在仍然無(wú)法得到完整、準(zhǔn)確的互聯(lián)網(wǎng)測(cè)量結(jié)果.
統(tǒng)計(jì)學(xué)的QoE評(píng)價(jià)方法,可以分析多QoE指標(biāo)之間的相關(guān)性及其與總QoE之間的關(guān)系,可利用因子分析等方法降維數(shù)據(jù),簡(jiǎn)化問(wèn)題.心理學(xué)方法研究外在客觀物理刺激和人內(nèi)在主觀感受之間的關(guān)系,韋伯-費(fèi)希納定律、視覺(jué)掩蓋效應(yīng)等規(guī)律可以更好理解人體自身認(rèn)知方法.層次分析法AHP和模糊層次分析法FAHP,把QoE分成多個(gè)QoE指標(biāo),再把每個(gè)QoE指標(biāo)關(guān)聯(lián)多個(gè)QoS參數(shù),建立多層指標(biāo)體系,但其需要專家知識(shí),同層的多個(gè)指標(biāo)必須是獨(dú)立的.這些評(píng)價(jià)方法獲得的QoE映射準(zhǔn)確性不高.
大數(shù)據(jù)思想將NP-Hard復(fù)雜度的因果關(guān)系推導(dǎo)問(wèn)題轉(zhuǎn)變成線性復(fù)雜度的相關(guān)關(guān)系分析,對(duì)于這種無(wú)法直接確認(rèn)因果關(guān)系的問(wèn)題,利用數(shù)據(jù)的內(nèi)在關(guān)聯(lián)進(jìn)行求解.文獻(xiàn)[59]給出了用決策樹、支持向量機(jī)解決視頻業(yè)務(wù)QoE評(píng)價(jià)問(wèn)題的方法,并獲得了較高的準(zhǔn)確率,它將時(shí)間信息、空間信息、比特率以及幀頻率作為視頻業(yè)務(wù)的QoE評(píng)價(jià)指標(biāo),得到了視頻業(yè)務(wù)的QoE評(píng)價(jià)模型.文獻(xiàn)[60]利用決策樹學(xué)習(xí)了互聯(lián)網(wǎng)視頻系統(tǒng)中用戶觀看視頻的時(shí)間比例與5個(gè)QoS參數(shù)的關(guān)系,包括加入時(shí)間、緩沖比例、切換率、緩沖的頻率、平均比特率.
大數(shù)據(jù)的解決方案的基礎(chǔ)是海量數(shù)據(jù),通過(guò)良好定義的QoE,QoS參數(shù),利用信息增益、相關(guān)系數(shù)、線性回歸等方法分析各參數(shù)相關(guān)性,再使用機(jī)器學(xué)習(xí)算法確定QoE與QoS的函數(shù)模型,獲取QoE指標(biāo).
正因?yàn)榫W(wǎng)絡(luò)是一個(gè)復(fù)雜巨系統(tǒng),其面臨的問(wèn)題的解決也是復(fù)雜的、動(dòng)態(tài)的、系統(tǒng)的,傳統(tǒng)的模式已經(jīng)無(wú)法獲得完好的解決方案.對(duì)于網(wǎng)絡(luò)性能優(yōu)化、協(xié)議設(shè)計(jì)、未來(lái)網(wǎng)絡(luò)體系架構(gòu)研究等方面,提出了不少基于大數(shù)據(jù)的解決方案,如數(shù)據(jù)驅(qū)動(dòng)的下一代互聯(lián)網(wǎng)體系架構(gòu)DDN[61].利用大數(shù)據(jù)方法能幫助解決原來(lái)不能解決的問(wèn)題,獲取更加完整、更加準(zhǔn)確的結(jié)果,提供更好的綜合性能.
5總結(jié)
互聯(lián)網(wǎng)性能測(cè)量技術(shù)可以廣泛應(yīng)用到各類場(chǎng)景中,如網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)、網(wǎng)絡(luò)運(yùn)行狀況監(jiān)控、網(wǎng)絡(luò)協(xié)議改進(jìn)、網(wǎng)絡(luò)技術(shù)應(yīng)用、未來(lái)網(wǎng)絡(luò)構(gòu)架設(shè)計(jì)等.互聯(lián)網(wǎng)性能測(cè)量具有很長(zhǎng)的歷史,在帶寬、時(shí)延、丟包率、流量、網(wǎng)絡(luò)錯(cuò)誤、用戶體驗(yàn)等方面獲得很多成果,但仍存在不少問(wèn)題,測(cè)量結(jié)果的完整性、準(zhǔn)確性、實(shí)時(shí)性等無(wú)法達(dá)到人們預(yù)期目的.
本文在現(xiàn)有文獻(xiàn)的基礎(chǔ)上,理清了互聯(lián)網(wǎng)性能測(cè)量技術(shù)發(fā)展與演變的歷史脈絡(luò),分析互聯(lián)網(wǎng)不同時(shí)期測(cè)量范圍、測(cè)量目標(biāo)等方面的改變引起的需求變化及技術(shù)革新,按照這些特點(diǎn)分成“所見(jiàn)即所得”的測(cè)量、基于路徑擬合的大規(guī)模分布式測(cè)量、大數(shù)據(jù)驅(qū)動(dòng)的網(wǎng)絡(luò)QoE測(cè)量3個(gè)階段,并詳細(xì)介紹了各階段技術(shù)特征,如表4所示:
Table 4 Three Development Stages of the Internet Measurement Technologies
互聯(lián)網(wǎng)作為超復(fù)雜系統(tǒng),迄今為止還沒(méi)有類似通信網(wǎng)絡(luò)中信息論一樣的基礎(chǔ)理論,其研究缺乏科學(xué)基本理論指導(dǎo),指導(dǎo)政策的缺乏也導(dǎo)致了較低的社會(huì)合法性認(rèn)可,還需進(jìn)一步解決4個(gè)難題:1)缺乏基準(zhǔn)數(shù)據(jù)及數(shù)據(jù)共享標(biāo)準(zhǔn)[62-63];2)吉爾德定律指出,主干網(wǎng)帶寬的增長(zhǎng)速度至少是運(yùn)算性能增長(zhǎng)速度的3倍,高速網(wǎng)絡(luò)的發(fā)展必然帶來(lái)更加嚴(yán)重的測(cè)量軟硬件能力問(wèn)題;3)不同的接入網(wǎng)絡(luò)體系架構(gòu),導(dǎo)致終端用戶尤其是家庭用戶測(cè)量困難,結(jié)果不準(zhǔn)確;4)人的主觀因素如何影響QoE、和QoE關(guān)聯(lián)的多種因素如何互相影響并最終體現(xiàn)到QoE中,都是需要進(jìn)一步研究與探索的.
參考文獻(xiàn)
[1]ITU-T. Rec E. 800: Terms and definitions related to quality of service and network performance including dependability[EBOL]. 1994[2015-08-10]. https:www.itu.intrecT-REC-E.800en
[2]ITU-T. Rec I. 350: General aspects of quality of service and network performance in digital network, including ISDN[EBOL]. 1993[2015-08-10]. https:www.itu.intrecT-REC-I.350en
[3]ITU-T. Rec Y. 1540: Internet protocol data communication service-IP packet transfer and availability performance parameters[EBOL]. 2011[2015-08-10]. https:www.itu.intrecT-REC-Y.1540en
[4]Paxson V, Almes G, Mahdavi J, et al. RFC 2330: Framework for IP performance metrics[EBOL]. 1998[2015-08-10]. https:tools.ietf.orghtmlrfc2330
[5]Janne R. End-to-end quality of service (QoS) concept and architecture (release 12): 3GPP TS 23.107 V12.0.0[EBOL]. 2014[2015-08-10]. http:www.3gpp.orgDynaReport23107.htm
[6]Johnson O. End-to-end quality of service (QoS) concept and architecture (release 12): 3GPP TS 23.207 V12.0.0[EBOL]. 2014[2015-08-10]. http:www.3gpp.orgDynaReport23207.htm
[7]Muuss M. The TTCP Program[EBOL]. 2000[2015-08-10]. http:ftp.arl.milftppubttcp
[8]John W, Tafvelin S, Olovsson T. Passive Internet measurement: Overview and guidelines based on experiences[J]. Computer Communications, 2010, 33(5): 533-550
[9]Zhang Guangxing, Qiu Feng, Xie Gaogang, et al. An efficient representation of network flow record[J]. Journal of Computer Research and Development, 2013, 50(4): 722-730 (in Chinese)(張廣興, 邱峰, 謝高崗, 等. 一種高效的網(wǎng)絡(luò)流記錄表示方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(4): 722-730)
[10]Xu Peng, Liu Qiong, Lin Sen. Internet traffic classification using support vector machine[J]. Journal of Computer Research and Development, 2009, 46(3): 407-414 (in Chinese)(徐鵬, 劉瓊, 林森. 基于支持向量機(jī)的Internet流量分類研究[J]. 計(jì)算機(jī)研究與發(fā)展, 2009, 46(3): 407-414)
[11]Wang Fengyu, Guo Shanqing, Li Liangxiong, et al. A method of extracting heavy-hitter flows efficiently[J]. Journal of Computer Research and Development, 2013, 50(4): 731-740 (in Chinese)(王風(fēng)宇, 郭山清, 李亮雄, 等. 一種高效率的大流提取方法[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(4): 731-740)
[12]Seshan S, Stemm M, Katz R H. SPAND: Shared passive network performance discovery[C]Proc of USENIX Symp on Internet Technologies and Systems. Berkeley, CA: USENIX Association, 1997: 1-18
[13]Jaiswal S, Iannaccone G, Diot C, et al. Inferring TCP connection characteristics through passive measurements[C]Proc of the 23rd Annual Joint Conf of the IEEE Computer and Communications Societies (INFOCOM 2004). Piscataway, NJ: IEEE, 2004: 1582-1592
[14]Gerber A, Pang J, Spatscheck O, et al. Speed testing without speed tests: Estimating achievable download speed from passive measurements[C]Proc of the 10th ACM SIGCOMM Conf on Internet Measurement. New York: ACM, 2010: 424-430
[15]Huang Guowei, Wu Gongyi, Xu Jingdong. End-to-end available bandwidth measurement based on queueing analysis[J]. Journal of Computer Research and Development, 2015, 52(1): 85-91 (in Chinese)(黃國(guó)偉, 吳功宜, 徐敬東. 基于排隊(duì)分析的端到端路徑可用帶寬的測(cè)量[J]. 計(jì)算機(jī)研究與發(fā)展, 2015, 52(1): 85-91)
[16]Bellovin S M. A best-case network performance model[EBOL]. 1992[2015-08-10]. https:www.cs.columbia.edu~smbpapersnetmeas.ps
[17]Jacobson V. Pathchar: A tool to infer characteristics of Internet paths[EBOL]. 1997[2015-08-10]. ftp:ftp.ee.lbl.govpathchar
[18]Dovrolis C, Ramanathan P, Moore D. Packet-dispersion techniques and a capacity-estimation methodology[J]. IEEEACM Trans on Networking, 2004, 12(6): 963-977
[19]Pásztor A, Veitch D. Active probing using packet quartets[C]Proc of the 2nd ACM SIGCOMM Workshop on Internet Measurement. New York: ACM, 2002: 293-305
[20]Jain M, Dovrolis C. End-to-end available bandwidth: Measurement methodology, dynamics, and relation with TCP throughput[C]Proc of ACM SIGCOMM Computer Communication Review. New York: ACM, 2002: 295-308
[21]Melander B, Bjorkman M, Gunningberg P. Regression-based available bandwidth measurements[C]Proc of Int Symp on Performance Evaluation of Computer and Telecommunications Systems. Piscataway, NJ: IEEE, 2002: 14-19
[22]Lai K, Baker M. Measuring link bandwidths using a deterministic model of packet delay[C]Proc of ACM SIGCOMM Computer Communication Review. New York: ACM, 2000: 283-294
[23]Broido A, King R, Nemeth E, et al. Radon spectroscopy of inter-packet delay[COL]Proc of High Speed Networking Workshop (HSN 2003). Piscataway, NJ: IEEE, 2003 [2015-06-10]. http:www.caida.orgpublicationspapers2003RAD-fullrad-full.pdf
[24]Kanuparthy P, Dovrolis C, Ammar M. Spectral probing, crosstalk and frequency multiplexing in Internet paths[C]Proc of the 8th ACM SIGCOMM Conf on Internet Measurement. New York: ACM, 2008: 291-304
[25]Wang Zhanfeng, Chen Ming, Xing Changyou, et al. TIV and access delay in the Internet delay space[J]. Journal of Computer Research and Development, 2013, 50(3): 509-516 (in Chinese)(王占豐, 陳鳴, 邢長(zhǎng)友, 等. 因特網(wǎng)時(shí)延空間中TIV與接入時(shí)延的研究[J]. 計(jì)算機(jī)研究與發(fā)展, 2013, 50(3): 509-516)
[26]Kapoor R, Chen L J, Lao L, et al. CapProbe: A simple and accurate capacity estimation technique[C]Proc of ACM SIGCOMM Computer Communication Review. New York: ACM, 2004: 67-78
[27]Chan E W W, Luo Xiapu, Chang R K C. A minimum-delay-difference method for mitigating cross-traffic impact on capacity measurement[C]Proc of the 5th Int Conf on Emerging Networking Experiments and Technologies. New York: ACM, 2009: 205-216
[28]Liu Min, Li Zhongcheng, Guo Xiaobing, et al. An end-to-end available bandwidth estimation methodology[J]. Journal of Software, 2006, 17(1): 108-116 (in Chinese)(劉敏, 李忠誠(chéng), 過(guò)曉冰, 等. 端到端的可用帶寬測(cè)量方法[J]. 軟件學(xué)報(bào), 2006, 17(1): 108-116)
[29]Xie Yingke, Wang Jiandong, Zhu Chao, et al. High precision timestamps in network measurement[J]. Journal of Computer Research and Development, 2010, 47(12): 2049-2058 (in Chinese)(謝應(yīng)科, 王建東, 祝超, 等. 網(wǎng)絡(luò)測(cè)量中高精度時(shí)間戳研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)研究與發(fā)展, 2010, 47(12): 2049-2058)
[30]Shriram A, Murray M, Hyun Y, et al. Comparison of public end-to-end bandwidth estimation tools on high-speed links[G]Passive and Active Network Measurement. Berlin: Springer, 2005: 306-320
[31]Shriram A, Kaur J. Empirical evaluation of techniques for measuring available bandwidth[C]Proc of the 26th IEEE Int Conf on Computer Communications (INFOCOM 2007). Piscataway, NJ: IEEE, 2007: 2162-2170
[32]Guerrero C D, Labrador M A. On the applicability of available bandwidth estimation techniques and tools[J]. Computer Communications, 2010, 33(1): 11-22
[33]Goldoni E, Schivi M. End-to-end available bandwidth estimation tools, an experimental comparison[G]Traffic Monitoring and Analysis. Berlin: Springer, 2010: 171-182
[34]Zangrilli M, Lowekamp B B. Applying principles of active available bandwidth algorithms to passive TCP traces[G]Passive and Active Network Measurement. Berlin: Springer, 2005: 333-336
[35]Croce D, Mellia M, Leonardi E. The quest for bandwidth estimation techniques for large-scale distributed systems[J]. ACM SIGMETRICS Performance Evaluation Review, 2010, 37(3): 20-25
[36]Croce D, Leonardi E, Mellia M. Large-scale available bandwidth measurements: Interference in current techniques[J]. IEEE Trans on Network and Service Management, 2011, 8(4): 361-374
[37]Douceur J R, Mickens J, Moscibroda T, et al. Collaborative measurements of upload speeds in P2P systems[C]Proc of the 29th IEEE Int Conf on Computer Communications (IEEE INFOCOM 2010). Piscataway, NJ: IEEE, 2010: 1-9
[38]Song S, Keleher P, Bhattacharjee B, et al. Decentralized, accurate, and low-cost network bandwidth prediction[C]Proc of the 30th IEEE Int Conf on Computer Communications (IEEE INFOCOM 2011). Piscataway, NJ: IEEE, 2011: 6-10
[39]Madhyastha H V. An Information Plane for Internet Applications[M]. Washington, DC: ProQuest, 2008
[40]Madhyastha H V, Isdal T, Piatek M, et al. iPlane: An information plane for distributed services[C]Proc of the 7th Symp on Operating Systems Design and Implementation. Berkeley, CA: USENIX Association, 2006: 367-380
[41]Madhyastha H V, Katz-Bassett E, Anderson T E, et al. iPlane Nano: Path prediction for Peer-to-Peer applications[C]Proc of Symp on Network System Design and Implementation (NSDI 2009). Berkeley, CA: USENIX Association, 2009: 137-152
[42]ODEDRA A. Global standards role in strategic planning for next generation networks & migration[R]. New Delhi, India: ITU, 2007
[43]Sundaresan S, De Donato W, Feamster N, et al. Broadband Internet performance: A view from the gateway[C]Proc of ACM SIGCOMM Computer Communication Review. New York: ACM, 2011: 134-145
[44]Dvorak C. Definition of quality of experience (QoE): TD 109rev2 (PLEN12)[EBOL]. [2015-08-10]. https:www.itu.intmdT05-FG.IPTV-IL-0050en
[45]Lin Chuang, Hu Jie, Kong Xiangzhen. Survey on models and evaluation of quality of experience[J]. Chinese Journal of Computers, 2012, 35(1): 1-15 (in Chinese)(林闖, 胡杰, 孔祥震. 用戶體驗(yàn)質(zhì)量(QoE)的模型與評(píng)價(jià)方法綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2012, 35(1): 1-15)
[46]Kim H J, Choi S G. A study on a QoSQoE correlation model for QoE evaluation on IPTV service[C]Proc of the 12th Int Conf on Advanced Communication Technology (ICACT 2010). Piscataway, NJ: IEEE, 2010: 1377-1382
[47]Khirman S, Henriksen P. Relationship between quality-of-service and quality-of-experience for public internet service[COL]Proc of the 3rd Workshop on Passive and Active Measurement. Berlin: Springer, 2002[2015-06-10]. http:www-v1.icir.org2002Relationship_Between_QoS_and_QoE.pdf
[48]Chen K T, Huang C Y, Huang P, et al. Quantifying Skype user satisfaction[C]Proc of ACM SIGCOMM Computer Communication Review. New York: ACM, 2006: 399-410
[49]Chen K T, Wu C C, Chang Y C, et al. A crowdsourceable QoE evaluation framework for multimedia content[C]Proc of the 17th ACM Int Conf on Multimedia. New York: ACM, 2009: 491-500
[50]Dobrian F, Awan A, Joseph D, et al. Understanding the impact of video quality on user engagement[J]. Communications of the ACM, 2013, 56(3): 91-99
[51]Krishnan S S, Sitaraman R K. Video stream quality impacts viewer behavior: Inferring causality using quasi-experimental designs[J]. IEEEACM Trans on Networking, 2013, 21(6): 2001-2014
[52]Chen K T, Huang P, Lei C L. How sensitive are online gamers to network quality?[J]. Communications of the ACM, 2006, 49(11): 34-38
[53]Jarschel M, Schlosser D, Scheuring S, et al. An evaluation of QoE in cloud gaming based on subjective tests[C]Proc of the 15th Int Conf on Innovative Mobile and Internet Services in Ubiquitous Computing (IMIS 2011). Piscataway, NJ: IEEE, 2011: 330-335
[54]Hobfeld T, Schatz R, Varela M, et al. Challenges of QoE management for cloud applications[J]. IEEE Communications Magazine, 2012, 50(4): 28-36
[55]Du Yu, Zhou Wen’an, Chen Baofu. A QoE based evaluation of service quality in wireless communication network[C]Proc of 2009 Int Conf on New Trends in Information and Service Science (NISS’09). Piscataway, NJ: IEEE, 2009: 552-557
[56]Laghari K U R, Connelly K. Toward total quality of experience: A QoE model in a communication ecosystem[J]. IEEE Communications Magazine, 2012, 50(4): 58-65
[57]Dhawan M, Samuel J, Teixeira R, et al. Fathom: A browser-based network measurement platform[C]Proc of the 2012 ACM Conf on Internet Measurement. New York: ACM, 2012: 73-86
[58]Sanders S, Kaur J. On the variation in Web page download traffic across different client types[C]Proc of the 22nd IEEE Int Conf on Network Protocols (ICNP 2014). Los Alamitos, CA: IEEE Computer Society, 2014: 495-497
[59]Menkovski V, Oredope A, Liotta A, et al. Predicting quality of experience in multimedia streaming[C]Proc of the 7th Int Conf on Advances in Mobile Computing and Multimedia. New York: ACM, 2009: 52-59
[60]Balachandran A, Sekar V, Akella A, et al. Developing a predictive model of quality of experience for Internet video[C]Proc of the 2013 ACM SIGCOMM Int Conf on the Applications, Technologies, Architectures, and Protocols for Computer Communication. New York: ACM, 2013: 339-350
[61]Yin Hao, Jiang Yong, Lin Chuang, et al. Big data: Transforming the design philosophy of future Internet[J]. IEEE Network, 2014, 28(4): 14-19
[62]Jain M, Dovrolis C. Ten fallacies and pitfalls on end-to-end available bandwidth estimation[C]Proc of the 4th ACM SIGCOMM Conf on Internet Measurement. New York: ACM, 2004: 272-277
[63]Prasad R, Dovrolis C, Murray M, et al. Bandwidth estimation: Metrics, measurement techniques, and tools[J]. IEEE Network, 2003, 17(6): 27-35
Yin Hao, born in 1974. PhD, professor, PhD supervisor. His main research interests include architecture, algorithm design and system implementation of large-scale media delivery platform, etc (h-yin@mail.tsinghua.edu.cn).
Li Feng, born in 1982. PhD candidate and engineer. His main research interests include network measurement and big data.
中圖法分類號(hào)TP3931
基金項(xiàng)目:國(guó)家“九七三”重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃基金項(xiàng)目(2012CB315800);國(guó)家自然科學(xué)基金項(xiàng)目(61170290,61222213)
收稿日期:2015-07-15;修回日期:2015-10-16
This work was supported by the National Basic Research Program of China (973 Program) (2012CB315800) and the National Natural Science Foundation of China (61170290,61222213).