摘 要:中山供電局綜合數(shù)據(jù)網(wǎng)用于承載電力生產(chǎn)、管理的信息網(wǎng)絡(luò)支持,具有業(yè)務(wù)種類多,組網(wǎng)規(guī)模大,流量突發(fā)性等特點,通過網(wǎng)管接口獲取設(shè)備信息進(jìn)行的傳統(tǒng)管理方式已經(jīng)完全不能滿足網(wǎng)絡(luò)及業(yè)務(wù)統(tǒng)計、流向分析、異常流量(例如病毒流量,黑客攻擊流量等)等的監(jiān)測需求。通過部署綜合監(jiān)測系統(tǒng),提高中山供電局綜合數(shù)據(jù)網(wǎng)承載業(yè)務(wù)質(zhì)量的監(jiān)控能力,以實現(xiàn)主動對數(shù)據(jù)通信網(wǎng)的時延、丟包率、分布式業(yè)務(wù)路由、域名系統(tǒng)(Domain Name System,DNS)解析測量、HTTP仿真測量、網(wǎng)絡(luò)帶寬等網(wǎng)絡(luò)性能的監(jiān)控和測量。
關(guān)鍵詞:綜合數(shù)據(jù)網(wǎng);網(wǎng)絡(luò)運維;探針;撥測;綜合監(jiān)測
1 中山供電局綜合數(shù)據(jù)網(wǎng)概況
中山供電局綜合數(shù)據(jù)網(wǎng)分核心層、匯聚層、接入層三層結(jié)構(gòu)組網(wǎng),覆蓋公司本部、二級生產(chǎn)部門、供電分公司、各電壓等級變電站,共170臺思科交換機(jī)路由器設(shè)備,主要用于電力生產(chǎn)、管理的信息網(wǎng)絡(luò)支持,充分整合電力系統(tǒng)的各種業(yè)務(wù)和硬件資源。采用MPLS VPN技術(shù)組網(wǎng),通過VPN來隔離和承載業(yè)務(wù)主要包括電力營銷系統(tǒng)(RMIS)、財務(wù)管理系統(tǒng)(FMIS)、生產(chǎn)運行管理系統(tǒng)(PMIS)、人力資源管理(HR)、辦公自動化(OA)、企業(yè)網(wǎng)站、語音和多媒體業(yè)務(wù)等業(yè)務(wù)系統(tǒng)。
雖然有其安全、靈活等諸多技術(shù)優(yōu)勢,但是在其開通、運行、管理及優(yōu)化方面面臨著諸多新的挑戰(zhàn),主要包括:
(1)MPLS VPN涉及的設(shè)備和資源眾多,缺少保證端到端的傳輸及業(yè)務(wù)質(zhì)量的手段,現(xiàn)有的網(wǎng)管系統(tǒng)提供了網(wǎng)絡(luò)網(wǎng)元設(shè)備性能及鏈路通斷的監(jiān)測和管理,但是無法提供傳輸及業(yè)務(wù)質(zhì)量的監(jiān)測與管理。
(2)現(xiàn)有網(wǎng)管系統(tǒng)實現(xiàn)了被動的監(jiān)測,但無法提供網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量的主動監(jiān)測和事故預(yù)警。
(3)承載語音、數(shù)據(jù)和視頻等多種業(yè)務(wù),不同業(yè)務(wù)對網(wǎng)絡(luò)性能的要求不同,如何保證不同應(yīng)用的質(zhì)量指標(biāo)要求,以及建立業(yè)務(wù)質(zhì)量的評估體系,是綜合數(shù)據(jù)網(wǎng)運維服務(wù)的新挑戰(zhàn)。
因此,需要選擇一種基于業(yè)務(wù)流仿真的網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量主動測試系統(tǒng),提高綜合數(shù)據(jù)網(wǎng)絡(luò)的運行服務(wù)水平和應(yīng)用系統(tǒng)使用部門的感知體驗,在故障出現(xiàn)之前就可以對網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量有一個全面的主動式的判斷,迅速評估和糾正導(dǎo)致網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量下降的原因,降低運維風(fēng)險,確保綜合數(shù)據(jù)網(wǎng)絡(luò)運行的安全性和可用性。同時還可以滿足基于不同網(wǎng)絡(luò)層面的其他測試中山供電局綜合數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量監(jiān)測系統(tǒng)。
2 主要技術(shù)介紹
2.1 硬件探針
數(shù)據(jù)采集探針是專門用于獲取網(wǎng)絡(luò)鏈路流量數(shù)據(jù)的硬件設(shè)備。按實現(xiàn)方式可分為軟件架構(gòu)和硬件架構(gòu)。
使用時通過分光分路設(shè)備、交換機(jī)流量鏡像端口或直接將其串接在待觀測的鏈路上,對鏈路上所有的數(shù)據(jù)報文進(jìn)行處理,提取流量監(jiān)測所需的協(xié)議字段甚至全部報文內(nèi)容。
流量探針可以實時對流量數(shù)據(jù)進(jìn)行采集記錄,經(jīng)過匯聚和預(yù)處理將流量信息發(fā)送到后端數(shù)據(jù)庫。通過分析軟件可進(jìn)行實時監(jiān)視,圖表顯示分析統(tǒng)計結(jié)果或輸出報表文件。經(jīng)條件設(shè)置還能夠利用流量探針的數(shù)據(jù)捕獲功能對網(wǎng)絡(luò)流量進(jìn)行實時采集或流量鏡像,進(jìn)行報文的協(xié)議分析。
硬件架構(gòu)的數(shù)據(jù)采集探針不影響原有設(shè)備的傳輸和性能,流量采集過程不需要現(xiàn)網(wǎng)設(shè)備的參與。探針技術(shù)不依賴于設(shè)備本身的流量統(tǒng)計功能,就能夠精確記錄所有報文的流量信息,還可根據(jù)用戶要求定制靈活高效的數(shù)據(jù)采集策略,最終滿足用戶對流量監(jiān)測的需求。
流量探針適合部署在匯聚層、骨干層或某些網(wǎng)間互連的重要或關(guān)鍵鏈路。也可以根據(jù)建設(shè)需要部署在接入層到匯聚層的邊緣。一個探針同時只能監(jiān)測一條或幾條鏈路。硬件探針能提供最精確最強(qiáng)有力的網(wǎng)絡(luò)性能統(tǒng)計數(shù)據(jù),達(dá)到對網(wǎng)絡(luò)任何時間任何地點的可視性控制。
2.2 撥測系統(tǒng)
撥測技術(shù)可以作為監(jiān)控、理解和認(rèn)識網(wǎng)絡(luò)行為特征和性能表現(xiàn)的重要手段,不僅可以對影響網(wǎng)絡(luò)的性能指標(biāo)(例如:時延、丟包率以及錯誤率)進(jìn)行監(jiān)測,同時還可在此基礎(chǔ)上進(jìn)而優(yōu)化和重新規(guī)劃網(wǎng)絡(luò)結(jié)構(gòu)以便改善網(wǎng)絡(luò)服務(wù)質(zhì)量。時延撥測可以幫助其更好的了解網(wǎng)絡(luò)底層傳輸情況,改善性能網(wǎng)絡(luò)應(yīng)用、提高網(wǎng)絡(luò)服務(wù)質(zhì)量。丟包率撥測可以更好的了解網(wǎng)絡(luò)通道的數(shù)據(jù)傳輸通暢情況,間接反映網(wǎng)絡(luò)通道的帶寬使用情況。錯誤率撥測可以幫助更好的了解業(yè)務(wù)系統(tǒng)的交互質(zhì)量情況,直接反映出業(yè)務(wù)的響應(yīng)失敗情況,并可以找出業(yè)務(wù)響應(yīng)失敗的緣由。
撥測系統(tǒng)評測規(guī)范涵蓋了綜合數(shù)據(jù)通信網(wǎng),通過采集IP網(wǎng)絡(luò)HTTP、FTP、PING、DNS、TRACE等常見網(wǎng)絡(luò)協(xié)議性能,綜合分析評估網(wǎng)絡(luò)感知質(zhì)量,從而為網(wǎng)絡(luò)的高效運行維護(hù)提供有力數(shù)據(jù)依據(jù),形成統(tǒng)一的感知監(jiān)測平臺。
2.3 管理平臺
管理平臺通過實時性和歷史性的監(jiān)控、預(yù)防性的故障排除、VoIP電話監(jiān)控、容量計劃及自動化報表生成等功能來幫助優(yōu)化網(wǎng)絡(luò)性能。管理平臺從各種RMON數(shù)據(jù)源收集統(tǒng)計數(shù)據(jù),提供對網(wǎng)絡(luò)和應(yīng)用系統(tǒng)性能全面的可視性,有以下主要功能:
2.3.1 實時異常流量監(jiān)測和故障排除
管理平臺同安置在網(wǎng)絡(luò)中的硬件探針一起持續(xù)不斷地監(jiān)測網(wǎng)絡(luò)性能并主動地提供告警從而使網(wǎng)管員能及時迅速解決問題,避免對業(yè)務(wù)產(chǎn)生影響。管理平臺實時地顯示哪些應(yīng)用和哪些用戶在影響網(wǎng)絡(luò)性能。對于比較復(fù)雜的問題,可以進(jìn)行基于WEB的數(shù)據(jù)包捕捉和解碼。管理平臺能同時監(jiān)測整個網(wǎng)絡(luò),單個的網(wǎng)段或一組網(wǎng)段減少花在診斷上的時間。
2.3.2 容量計劃和報告
管理平臺提供有數(shù)量依據(jù)的信息來支持容量計劃方面的決定。管理平臺幫助網(wǎng)管員把握什么是網(wǎng)絡(luò)的“正?!本W(wǎng)流來優(yōu)化網(wǎng)絡(luò)資源。它同時幫助預(yù)防性地管理和規(guī)劃網(wǎng)絡(luò)增長,防止瓶頸,減少費用。通過提供對消耗寶貴的網(wǎng)絡(luò)資源的應(yīng)用系統(tǒng)的可視性,對增長趨勢和使用模式的細(xì)致分析,可以調(diào)整活動時間,重新將信息流分配給不同的網(wǎng)段,或者制定新的使用規(guī)章制度,并為制定增長的方針提供依據(jù)。管理平臺提供從為高層領(lǐng)導(dǎo)提供的總結(jié)到網(wǎng)段的具體細(xì)節(jié)情況的各種類型的報表。
3 具體部署方案
3.1 MPLS/VPN數(shù)據(jù)網(wǎng)絡(luò)性能測試引擎(數(shù)據(jù)包捕獲式流量采
集系統(tǒng))
在中山局主站配置一套數(shù)據(jù)包捕獲式流量采集設(shè)備,該設(shè)備通過端口鏡像方式連接至中山局兩臺核心交換機(jī)上,對中山地區(qū)綜合數(shù)據(jù)網(wǎng)核心交換機(jī)和IDC核心交換機(jī)之間、綜合數(shù)據(jù)網(wǎng)核心交換機(jī)和局域網(wǎng)核心交換機(jī)之間的鏈路進(jìn)行監(jiān)控。利用數(shù)據(jù)包捕獲式流量采集設(shè)備進(jìn)行真實數(shù)據(jù)包捕獲并分析,從而獲得最深入詳細(xì)的數(shù)據(jù)流量信息。
3.2 骨干核心節(jié)點測試頭端設(shè)備/匯接接點頭端設(shè)備(撥測系
統(tǒng))
在中山局主站配一臺核心點撥測設(shè)備、其他匯聚層設(shè)備配3臺遠(yuǎn)端測試單元。利用撥測設(shè)備進(jìn)行網(wǎng)絡(luò)層質(zhì)量和應(yīng)用層質(zhì)量的測試,通過發(fā)送數(shù)據(jù)包的形式進(jìn)行測試及診斷。如圖1所示。
3.3 網(wǎng)絡(luò)傳輸及業(yè)務(wù)質(zhì)量監(jiān)測數(shù)據(jù)呈現(xiàn)及流程報告界面平臺軟件(綜合管理平臺軟件)
即開發(fā)“網(wǎng)絡(luò)傳輸及業(yè)務(wù)質(zhì)量監(jiān)測數(shù)據(jù)呈現(xiàn)及流程報告界面平臺軟件”,對上述部署的數(shù)據(jù)包捕獲式流量采集設(shè)備和撥測設(shè)備進(jìn)行統(tǒng)一展示和管理控制,同時可生成定制化報中山供電局綜合數(shù)據(jù)網(wǎng)網(wǎng)絡(luò)性能及業(yè)務(wù)質(zhì)量監(jiān)測系統(tǒng)。
4 結(jié)束語
為了解決中山供電局綜合數(shù)據(jù)網(wǎng)網(wǎng)管在設(shè)備監(jiān)控、運行保障等方面的局限性,文章提出一種數(shù)據(jù)網(wǎng)綜合監(jiān)測系統(tǒng)的部署方法。根據(jù)中山供電局綜合數(shù)據(jù)網(wǎng)的運行特點、承載業(yè)務(wù)的特定需求,利用探針、撥測系統(tǒng)等測量技術(shù)提高中山供電局綜合數(shù)據(jù)網(wǎng)業(yè)務(wù)質(zhì)量的監(jiān)控能力。經(jīng)實際測試,該系統(tǒng)達(dá)到了預(yù)期效果,為中山供電局綜合數(shù)據(jù)網(wǎng)網(wǎng)管理系統(tǒng)提供技術(shù)基礎(chǔ)和實現(xiàn)依據(jù)。
參考文獻(xiàn)
[1]邢寧哲,紀(jì)雨彤.基于分布式探針的電力數(shù)據(jù)通信網(wǎng)綜合監(jiān)測方法[J].電力信息與通信技術(shù),2016,14(1).
[2]王繼龍,吳建平.大規(guī)模計算機(jī)網(wǎng)絡(luò)性能監(jiān)控模型的設(shè)計與實現(xiàn)[J].計算機(jī)研究與發(fā)展,2000,37(4):443-452.
[3]張文杰,錢德沛,張然,等.互聯(lián)網(wǎng)應(yīng)用性能測量系統(tǒng)的研究實現(xiàn)[J].計算機(jī)研究與發(fā)展,2003,40(1):60-67.
作者簡介:吳浩輝(1984-),男,廣東中山人,工程師,從事電力通信運維工作。