謝海華
(江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司鹽城分公司,江蘇 鹽城 224001)
有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè)與運(yùn)用研究
謝海華
(江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司鹽城分公司,江蘇 鹽城 224001)
建設(shè)可運(yùn)營、可管理的寬帶IP城域網(wǎng)的運(yùn)營已成為有線電視運(yùn)營商網(wǎng)絡(luò)建設(shè)的重點。文章主要介紹了如何建設(shè)一套可視化的網(wǎng)絡(luò)質(zhì)量監(jiān)控系統(tǒng),來實現(xiàn)對有線IP城域網(wǎng)運(yùn)行質(zhì)量進(jìn)行長時間監(jiān)控,并幫助運(yùn)營商感知用戶的使用體驗、快速實現(xiàn)故障定位、提升服務(wù)質(zhì)量。
IP城域網(wǎng);可視化;質(zhì)量監(jiān)控;關(guān)鍵業(yè)績指標(biāo);關(guān)鍵質(zhì)量指標(biāo)
隨著國家“三網(wǎng)融合”政策的推進(jìn)以及有線網(wǎng)絡(luò)自身發(fā)展的需要,近年來各級有線網(wǎng)絡(luò)都先后建成了自己的寬帶城域網(wǎng)并投入了實際運(yùn)營,在網(wǎng)的專網(wǎng)用戶、寬帶用戶、互動用戶數(shù)量急劇增加,與此同時,用戶的報修與投訴也有了很大幅度的增長,有線IP城域網(wǎng)絡(luò)的運(yùn)營管理面臨前所未有的挑戰(zhàn)[1]。因此,如何使IP網(wǎng)絡(luò)運(yùn)行質(zhì)量直觀化、可視化,如何實時監(jiān)控并及時為有效提升IP網(wǎng)絡(luò)承載的可靠性提供事實依據(jù),已成為眾多有線網(wǎng)絡(luò)運(yùn)營者關(guān)注的焦點。
目前有線IP城域網(wǎng)的維護(hù)工作主要是由各維護(hù)站人員進(jìn)行,而問題多發(fā)在接入側(cè),如入戶線或網(wǎng)絡(luò)路由問題、用戶反應(yīng)上網(wǎng)慢等,主要的處理方法或是遠(yuǎn)程電話指導(dǎo)用戶操作,或派人現(xiàn)場處理,不僅溝通與時間成本高、對現(xiàn)場人員要求高,而且對接入、承載、出口、不同網(wǎng)段也缺乏快速界定的手段,用戶網(wǎng)絡(luò)恢復(fù)經(jīng)常需要較長時間,從而影響用戶使用,導(dǎo)致抱怨頻頻。
目前對網(wǎng)絡(luò)的有效監(jiān)控和管理更多地集中在從匯聚到出口的網(wǎng)絡(luò),而沒有端到端的質(zhì)量評估手段,對用戶實際使用體驗關(guān)注較少,容易出現(xiàn)匯聚到出口的網(wǎng)絡(luò)很好,但是可能由于應(yīng)用層面的域名系統(tǒng)(Domain Name System,DNS)或超文本傳輸協(xié)議(HyperText Transfer Protocol,HTTP)響應(yīng)慢、網(wǎng)內(nèi)網(wǎng)間時延大、帶寬利用率低等問題導(dǎo)致用戶上網(wǎng)質(zhì)量下降、用戶體驗很差。
目前對網(wǎng)絡(luò)的管理主要通過網(wǎng)管軟件進(jìn)行,網(wǎng)管軟件主要是對網(wǎng)絡(luò)的拓?fù)?、告警、配置進(jìn)行管理,更多的關(guān)注是網(wǎng)絡(luò)是否此時出現(xiàn)異常。對階段性的指標(biāo),沒有考量手段,對網(wǎng)絡(luò)整體的質(zhì)量水平?jīng)]有數(shù)據(jù)進(jìn)行評定和支撐,無法對網(wǎng)絡(luò)層面和應(yīng)用層面質(zhì)量進(jìn)行度量。
許多網(wǎng)絡(luò)問題經(jīng)常是在用戶投訴后才得以發(fā)現(xiàn),從而嚴(yán)重影響了廣電網(wǎng)絡(luò)的服務(wù)品質(zhì)。隨著互動、流媒體等新業(yè)務(wù)的不斷開展,對運(yùn)維的要求也更高,特別是流媒體業(yè)務(wù)對網(wǎng)絡(luò)質(zhì)量的變化非常敏感,這就更需要對用戶體驗、對網(wǎng)絡(luò)質(zhì)量進(jìn)行長期實施監(jiān)控,對趨勢發(fā)展進(jìn)行分析、提前預(yù)防問題發(fā)生,做到主動運(yùn)維。
很多地市以下級有線IP城域網(wǎng)絡(luò)主要直接面向用戶,與直接面向出口的上級數(shù)據(jù)網(wǎng)絡(luò)之間由于管理權(quán)限限制,由上而下不透明、無法及時把握上級網(wǎng)絡(luò)設(shè)備及總互聯(lián)網(wǎng)出口的運(yùn)行狀況。許多時候雖懷疑某些故障與省級網(wǎng)絡(luò)或出口有關(guān)系,但缺乏相應(yīng)的手段和數(shù)據(jù)支撐[2]。
有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè)目標(biāo),是要實時、不間斷對IP城域網(wǎng)網(wǎng)絡(luò)質(zhì)量和互聯(lián)網(wǎng)業(yè)務(wù)質(zhì)量、互動電視頁面服務(wù)質(zhì)量進(jìn)行測試與評估,通過部署在網(wǎng)絡(luò)中的軟件、硬件探針實時采集網(wǎng)絡(luò)及業(yè)務(wù)性能數(shù)據(jù),并將網(wǎng)絡(luò)和業(yè)務(wù)性能數(shù)據(jù)和測試結(jié)果運(yùn)算成相應(yīng)的關(guān)鍵業(yè)績指標(biāo)(Key Performance Indicator,KPI)和關(guān)鍵質(zhì)量指標(biāo)(Key Quality Indicators,KQI),并以豐富的圖表形式在客戶端展現(xiàn)指標(biāo)的運(yùn)算結(jié)果,便于運(yùn)維人員直觀識別網(wǎng)絡(luò)性能的劣化、可快速判斷出網(wǎng)絡(luò)故障并為進(jìn)一步的網(wǎng)絡(luò)優(yōu)化與擴(kuò)容提供依據(jù)。
因此,建成后有線IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng),將主要包括以下幾個功能模塊:(1)網(wǎng)絡(luò)質(zhì)量長期監(jiān)控。能夠?qū)}城IP城域骨干網(wǎng)絡(luò)的運(yùn)行狀況進(jìn)行實時、長期的監(jiān)控,對網(wǎng)絡(luò)質(zhì)量(時延、抖動、丟包率)作出準(zhǔn)確的評估。(2)業(yè)務(wù)質(zhì)量長期監(jiān)控。能夠?qū)}城IP城域骨干網(wǎng)絡(luò)提供的寬帶和互動電視業(yè)務(wù)的質(zhì)量進(jìn)行實時、長期的監(jiān)控,及時發(fā)現(xiàn)問題,為客戶改善業(yè)務(wù)質(zhì)量提供依據(jù)。(3)故障定界。當(dāng)鹽城IP城域骨干網(wǎng)絡(luò)或業(yè)務(wù)出現(xiàn)問題時,通過運(yùn)維軟探針可以做到對故障進(jìn)行快速定界,方便網(wǎng)絡(luò)運(yùn)維人員定位解決問題。(4)圖形化展示。以豐富的圖表形式將采集的網(wǎng)絡(luò)和業(yè)務(wù)性能數(shù)據(jù)和測試結(jié)果(KPI,KQI)在客戶端展現(xiàn)出來,便于運(yùn)維人員直觀識別網(wǎng)絡(luò)性能的優(yōu)劣狀態(tài)[3]。
某地市有線IP城域網(wǎng)的核心路由器、交換機(jī)等全部采用華為系列中高端產(chǎn)品,均內(nèi)置網(wǎng)絡(luò)質(zhì)量分析(Network Quality Analyzer,NQA)功能與數(shù)據(jù)外聯(lián)接口,通過定制開發(fā)的可視化質(zhì)量監(jiān)測系統(tǒng),可以很方便地完成從S9300交換機(jī)到地市出口路由器間每一段網(wǎng)絡(luò)鏈路質(zhì)量的長期監(jiān)控與統(tǒng)計(包括時延、抖動、丟包等指標(biāo))、建立指標(biāo)告警閾值、對指標(biāo)異常進(jìn)行預(yù)警并呈現(xiàn)出直觀的網(wǎng)絡(luò)質(zhì)量拓?fù)鋱D,網(wǎng)絡(luò)的主動運(yùn)維和故障定界。
同時配套部署內(nèi)置運(yùn)維軟探針(探測系統(tǒng)客戶端,安裝在用戶電腦或運(yùn)維人員便攜機(jī)上)或外置硬探針(專用探測硬件+軟件一體機(jī),安裝在各節(jié)點機(jī)房),用來對網(wǎng)絡(luò)路徑連通性、對網(wǎng)絡(luò)質(zhì)量、對HSI(高速上網(wǎng)業(yè)務(wù))指標(biāo)(如DNS解析時延、HTTP首包到達(dá)、下載時延、下載速度等)進(jìn)行檢測。通過網(wǎng)絡(luò)層及業(yè)務(wù)層各項指標(biāo)的檢測,實現(xiàn)對問題進(jìn)行分界分責(zé)、提高故障定位效率。
完成IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)部署的有線IP城域網(wǎng)拓?fù)鋱D及探測示意如圖1所示,根據(jù)現(xiàn)狀網(wǎng)絡(luò)拓?fù)?,分別部署內(nèi)置探針(路由器及交換機(jī)啟用NQA)、外置硬探針、內(nèi)置運(yùn)維軟探針。虛線路徑為終端用戶到互聯(lián)網(wǎng)路徑和終端到互動電視路徑,可分應(yīng)用層和網(wǎng)絡(luò)層面進(jìn)行質(zhì)量評估和監(jiān)控。帶箭頭實線路徑為NQA之間網(wǎng)絡(luò)鏈路路徑,用以對業(yè)務(wù)承載網(wǎng)絡(luò)進(jìn)行質(zhì)量評估和監(jiān)控。系統(tǒng)支持對多種業(yè)務(wù)的監(jiān)測,如上網(wǎng)業(yè)務(wù)、VOIP業(yè)務(wù)、流媒體業(yè)務(wù)(騰訊視頻、愛奇藝等)、VPN業(yè)務(wù)、互動電視業(yè)務(wù)等,可充分滿足日后業(yè)務(wù)發(fā)展需求。只需要網(wǎng)絡(luò)和探針可達(dá),IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)就可通過帶內(nèi)或帶外方式集中管理各種類型的探針、集中呈現(xiàn)數(shù)據(jù)結(jié)果、下發(fā)管理策略。
利用現(xiàn)有匯聚層到出口側(cè)設(shè)備內(nèi)置的NQA功能與定制的監(jiān)測系統(tǒng)軟件,IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)能夠集中對IP網(wǎng)絡(luò)業(yè)務(wù)層面和網(wǎng)絡(luò)層面的質(zhì)量指標(biāo)進(jìn)行長期監(jiān)控,實現(xiàn)網(wǎng)絡(luò)路徑的拓?fù)淇梢?、網(wǎng)絡(luò)性能告警可視,清晰掌握匯聚到互聯(lián)網(wǎng)出口每段網(wǎng)絡(luò)質(zhì)量。
網(wǎng)絡(luò)質(zhì)量長期監(jiān)測支持端到端性能監(jiān)控,主要測試指標(biāo)為UDP測試(包括UDP時延、UDP抖動、UDP丟包率等,主要用于內(nèi)置NQA功能的有線骨干網(wǎng)絡(luò)部分長期監(jiān)測)、ICMP測試(平均往返時延、丟包率等,主要用于沒有NQA功能的接入側(cè)EPON與ONU等網(wǎng)元部分監(jiān)測,以及不在當(dāng)?shù)毓芾矸秶鷥?nèi)的核心路由器以上部分的監(jiān)測如出口路由器等),監(jiān)測結(jié)果可以日、周、月、年為單位,并綜合成KPI性能指標(biāo)并形成波形圖、矩陣圖等,同時通過閾值的設(shè)定實時反映各項KPI指標(biāo)的越限情況并進(jìn)行告警,達(dá)到質(zhì)量可視、服務(wù)滿足度可視。這樣通過自下而上的層層匯聚,管理人員便可以直觀了解網(wǎng)絡(luò)和應(yīng)用質(zhì)量,如果發(fā)現(xiàn)問題再由上而下進(jìn)行分析。以直觀的波形圖方式展示,供運(yùn)維人員分析。
圖1 IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)部署與探測流程示意
業(yè)務(wù)質(zhì)量的長期監(jiān)控主要通過外置探針完成。在外置探針上,以服務(wù)等級協(xié)議(Service-Level Agreement,SLA)方式下發(fā)HTTP測試?yán)龑τ脩羰褂幂^多或反映問題較多的網(wǎng)站、互動電視首頁等進(jìn)行實時的、長期的監(jiān)測,或同樣以SLA方式下發(fā)Flash視頻測試?yán)龑σ曨l網(wǎng)站進(jìn)行實時監(jiān)控,通過對比分析不同網(wǎng)站或同一網(wǎng)站不同時間監(jiān)測獲得數(shù)據(jù)的對比、分析,即可快速判斷出終端用戶在上某個網(wǎng)站或觀看視頻時的用戶體驗效果、發(fā)現(xiàn)網(wǎng)際互聯(lián)的瓶頸所在以便有針對性地向出口供應(yīng)商提出改善要求等。業(yè)務(wù)質(zhì)量長期監(jiān)控的測試指標(biāo)主要包括HTTP測試指標(biāo)(包括DNS解析時間、HTTP首包到達(dá)時間、HTTP文本頁面下載時長、HTTP完整頁面下載時長、HTTP下載速度等)、Flash測試指標(biāo)(如Flash首包到達(dá)時間、Flash播放速度與下載速率匹配度等)。
在本項目中,出口側(cè)共部署硬件探針2個,分別監(jiān)測寬帶業(yè)務(wù)和互動電視業(yè)務(wù),均可在應(yīng)用層和網(wǎng)絡(luò)層面進(jìn)行質(zhì)量評估和長期監(jiān)控,同時還可作測試高速互聯(lián)網(wǎng)訪問(High Speed Internet access,HSI)及網(wǎng)絡(luò)質(zhì)量的內(nèi)部參考點、協(xié)助故障定界、定位。
拓?fù)涓婢梢曅Ч鐖D2所示。
圖2 IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)監(jiān)測效果示意
通過對安裝在用戶或運(yùn)維人員電腦中的軟探針、安裝在中心機(jī)房的2個外置探針以及部分設(shè)備中的內(nèi)置探針NQA配合使用,我們以測試套的方式下發(fā)測試?yán)?,起到對網(wǎng)絡(luò)故障分段定界的作用?;与娨晿I(yè)務(wù)通過互動電視接入側(cè)的運(yùn)維軟探針,進(jìn)行互動電視首頁連接質(zhì)量檢測,掌握用戶訪問互動電視首頁連接速度。寬帶接入業(yè)務(wù)與終端通過在運(yùn)維人員的筆記本或用戶的電腦上安裝運(yùn)維軟探針,可靈活地對網(wǎng)絡(luò)路徑連通性進(jìn)行檢測,對網(wǎng)絡(luò)質(zhì)量、HSI高速上網(wǎng)業(yè)務(wù)指標(biāo)等進(jìn)行檢測,并配合故障定界,協(xié)助故障定位。
如當(dāng)用戶投訴訪問某個HTTP資源時體驗很差,首先通過查看部署在地市路由器出口的硬件探針監(jiān)控看該測試點的KPI指標(biāo)是否有明顯劣化,若有明顯劣化(比如測試失敗、完整頁面下載時長過長等),則問題為地市出口問題(可能互聯(lián)帶寬出現(xiàn)資源擁塞所導(dǎo)致)或者地市出口之上的問題。若在此點的KPI指標(biāo)沒有明顯劣化,則在接入層引入運(yùn)維軟探針(安裝在用戶電腦或運(yùn)維人員便攜機(jī)上),對網(wǎng)絡(luò)路徑連通性進(jìn)行檢測,對網(wǎng)絡(luò)質(zhì)量、HSI高速上網(wǎng)業(yè)務(wù)進(jìn)行檢測,把軟探針上的測試指標(biāo)和出口路由器處硬探針的測試指標(biāo)進(jìn)行對比,若軟探針的測試結(jié)果較差,則說明是接入層到核心路由器之間的網(wǎng)絡(luò)有問題,然后再結(jié)合NQA網(wǎng)絡(luò)分段測試指標(biāo),最終找到出問題的網(wǎng)段。其流程示意圖如圖3所示。
通過IP城域網(wǎng)絡(luò)可視化質(zhì)量監(jiān)控系統(tǒng)的建設(shè),有線網(wǎng)絡(luò)運(yùn)營商可以實現(xiàn)對IP網(wǎng)絡(luò)和業(yè)務(wù)端到端可視化運(yùn)維,運(yùn)維人員周期性地收集網(wǎng)絡(luò)性能和業(yè)務(wù)品質(zhì)數(shù)據(jù),可有效支撐IP網(wǎng)絡(luò)評估優(yōu)化,滿足網(wǎng)絡(luò)運(yùn)維未來演進(jìn)的需要。通過對數(shù)據(jù)的分析,運(yùn)維人員還可將其中的趨勢內(nèi)容挖掘出來,對潛在的故障點和薄弱環(huán)節(jié)進(jìn)行預(yù)判斷,使運(yùn)維人員可以提前感知終端用戶的業(yè)務(wù)體驗程度,預(yù)先判斷業(yè)務(wù)是否會發(fā)生劣化,并提前解決由此帶來的一系列問題,從而提高運(yùn)營效率,減少終端用戶投訴,提高客戶忠誠度,并降低運(yùn)維成本,增強(qiáng)市場的競爭力。
圖3 HIS問題排查示意
[1] 胡治國,田春岐,杜亮,等.IP網(wǎng)絡(luò)性能測量研究現(xiàn)狀和進(jìn)展[J].軟件學(xué)報,2017(1):105-134.
[2] 林義勇,盧艷.IP網(wǎng)絡(luò)狀態(tài)參數(shù)可視化與質(zhì)量評估系統(tǒng)設(shè)計與實現(xiàn)[C].襄陽:全國信號和智能信息處理與應(yīng)用學(xué)術(shù)會議???,2016.
[3] 王健.一種IP網(wǎng)絡(luò)鏈路質(zhì)量監(jiān)測定位的設(shè)計方案[J].山東通信技術(shù),2014(4):23-25.
Study on construction and application of visual quality monitoring system for CATV’s IP metropolitan area network
Xie Haihua
(Jiangsu Broadcasting Cable Information Network Co., Ltd., Yancheng Branch, Yancheng 224001, China)
The construction of operational and manageable broadband IP metropolitan area network has become the key point of CATV operators’ network construction. This paper introduces how to construct a visual quality monitoring system for CATV’s IP metropolitan area network, to realize the long time monitoring of the network’s running quality, and help the CATV operators to perceive the user experience, rapidly realize the fault location and improve the quality of service.
IP metropolitan area network; visual; quality monitor; key performance indicator; key quality indicators
謝海華(1975— ),男,江蘇濱海人,高級工程師,碩士;研究方向:計算機(jī)網(wǎng)絡(luò)技術(shù),數(shù)字電視技術(shù)。