中國移動(dòng)通信集團(tuán)內(nèi)蒙古有限公司 焦 芳 張朝熙
隨著全球互聯(lián)網(wǎng)的迅速發(fā)展,互聯(lián)網(wǎng)已經(jīng)遍布世界,互聯(lián)網(wǎng)數(shù)據(jù)中心存在的意義已經(jīng)由之前的只對(duì)大型主機(jī)進(jìn)行維護(hù)和管理,演變成全方位智能化的管理方式。國內(nèi)互聯(lián)網(wǎng)數(shù)據(jù)中心的規(guī)模以及質(zhì)量都是其他ICP無法超越的,被稱為現(xiàn)代社會(huì)的“數(shù)字大廈”。但伴隨著發(fā)展存在的問題也是客觀存在的,國內(nèi)互聯(lián)網(wǎng)數(shù)據(jù)中心尚處于發(fā)展進(jìn)步階段,并未真正成熟起來,數(shù)據(jù)中心缺乏對(duì)網(wǎng)絡(luò)業(yè)務(wù)質(zhì)量和IDC故障定界等監(jiān)測(cè)手段,無法評(píng)估IDC資源引入、資源調(diào)度情況,無法為托管客戶提供全面的SLA質(zhì)量分析報(bào)告等問題,因此應(yīng)當(dāng)對(duì)客觀問題進(jìn)行客觀對(duì)待,認(rèn)真尋求當(dāng)前數(shù)據(jù)中心所存在問題的解決策略。
為解決這些問題,通過建設(shè)自動(dòng)撥測(cè)系統(tǒng),實(shí)現(xiàn)對(duì)內(nèi)蒙移動(dòng)數(shù)據(jù)中心(IDC)的鏈路質(zhì)量、ICP內(nèi)容平臺(tái)調(diào)度及業(yè)務(wù)質(zhì)量的監(jiān)測(cè)和管理。
在內(nèi)蒙移動(dòng)云計(jì)算數(shù)據(jù)中心建設(shè)一套獨(dú)立的自動(dòng)撥測(cè)系統(tǒng),在IDC網(wǎng)絡(luò)各層級(jí)部署監(jiān)控探針進(jìn)行主動(dòng)撥測(cè)和爬蟲測(cè)試,實(shí)現(xiàn)IDC內(nèi)容資源管理、網(wǎng)絡(luò)業(yè)務(wù)質(zhì)量監(jiān)控、構(gòu)建IDC評(píng)估與監(jiān)測(cè)管理體系、網(wǎng)絡(luò)業(yè)務(wù)質(zhì)量告警、SLA質(zhì)量報(bào)告生成等功能。
通過上層網(wǎng)絡(luò)與IDC核心路由器鏈接,實(shí)現(xiàn)對(duì)業(yè)務(wù)鏈路端到端的路徑監(jiān)測(cè)和分析。
在IDC核心路由器側(cè)部署硬件測(cè)試探針,通過鏈路方式接到兩臺(tái)路由器上,實(shí)現(xiàn)從出口向IDC內(nèi)部的網(wǎng)元和服務(wù)器發(fā)起鏈路測(cè)試和業(yè)務(wù)測(cè)試。
在IDC區(qū)核心出口側(cè)部署爬蟲探針,通過鏈路與路由器旁掛方式組網(wǎng),實(shí)現(xiàn)對(duì)熱門網(wǎng)站、熱門視頻等進(jìn)行爬測(cè),以及IDC的ICP資源的資源引入率統(tǒng)計(jì)和調(diào)度策略分析等功能。
在IDC區(qū)核心交換機(jī)側(cè)部署硬件測(cè)試探針,通過鏈路方式連接到核心交換機(jī)上,實(shí)現(xiàn)從匯聚層從IDC內(nèi)部的網(wǎng)元和服務(wù)器發(fā)起鏈路測(cè)試和業(yè)務(wù)測(cè)試,可以與接入層探針和IDC核心層探針配合進(jìn)行故障分段定位。
在接入層交換機(jī)上部署便攜式探針,實(shí)現(xiàn)從接入層向IDC內(nèi)部的網(wǎng)元和服務(wù)器發(fā)起鏈路測(cè)試和業(yè)務(wù)測(cè)試,可以與接入層探針和IDC核心層探針配合進(jìn)行故障分段定位。
在私有云虛擬化接入交換機(jī)上部署硬件探針,通過鏈接到虛擬化交換機(jī),實(shí)現(xiàn)用于從私有云出口向私有云內(nèi)部的虛擬化服務(wù)器發(fā)起網(wǎng)絡(luò)和業(yè)務(wù)測(cè)試。
系統(tǒng)可對(duì)數(shù)據(jù)中心引入資源的主站進(jìn)行1-4級(jí)域名進(jìn)行爬蟲分析,可給出網(wǎng)站域名、元素的分布位置,運(yùn)營商,緩存類型(Cache或CDN),以及訪問性能等指標(biāo),對(duì)視頻網(wǎng)站所有頻道以及頻道下的視頻文件進(jìn)行自動(dòng)爬蟲分析,并給出此視頻文件的分布位置,運(yùn)營商,緩存類型(Cache或CDN),支持視頻、音頻類網(wǎng)站進(jìn)行識(shí)別分析。
通過模擬用戶的播放行為,獲得視頻所有分片的實(shí)際URL、分片大小、清晰度,實(shí)際播放頁地址、分享地址。同時(shí),能夠支持將價(jià)值的內(nèi)容屬性采集下來,比如視頻或音頻的名稱、頻道、集數(shù)等。系統(tǒng)分析資源歸屬時(shí),可以明確主流運(yùn)營商的一些分布情況,可以區(qū)分出資源屬于省內(nèi)IDC、省內(nèi)cache、省內(nèi)CDN、省外、網(wǎng)外等。主流運(yùn)營商包括:中國移動(dòng)、中國電信、中國聯(lián)通等,系統(tǒng)支持基于表格、地圖的資源分布監(jiān)控報(bào)表和視圖。實(shí)時(shí)監(jiān)控資源歸屬變化,分析入網(wǎng)和出網(wǎng)數(shù)量。
數(shù)據(jù)中心資源全景化分析基于資源評(píng)估探測(cè)功能和基礎(chǔ)資源信息庫構(gòu)建IDC內(nèi)容資源視圖。提供本省IDC資源信息分析,對(duì)IDC引入資源的熱點(diǎn)匹配度、引入深度和資源質(zhì)量進(jìn)行分析。全景化分析視圖呈現(xiàn)如圖1所示。
圖1 全景化分析示意圖
系統(tǒng)能夠分析IDC內(nèi)容資源的分布情況,并通過視圖呈現(xiàn)。同時(shí)系統(tǒng)可以鉆取同一個(gè)資源站點(diǎn)的不同歸屬地,并進(jìn)行重點(diǎn)標(biāo)注,然后支持批量導(dǎo)出。
系統(tǒng)能夠通過不同資源視圖的對(duì)比分析,輸出建議本省IDC引入資源清單、網(wǎng)內(nèi)外質(zhì)差資源緩存加速清單。
系統(tǒng)能夠記錄一段時(shí)間內(nèi)IDC資源視圖變化情況,并根據(jù)IDC網(wǎng)內(nèi)資源占比、本省資源占比指標(biāo)變化超出門限值,以郵件、短信等自動(dòng)化方式告知內(nèi)容優(yōu)化人員。
通過部署在核心層、匯聚層和業(yè)務(wù)接入層探針進(jìn)行不同層級(jí)網(wǎng)絡(luò)的質(zhì)量撥測(cè),并對(duì)撥測(cè)數(shù)據(jù)進(jìn)行分析,主要功能包括Ping測(cè)試、傳輸層TCP測(cè)試、傳輸層UDP測(cè)試、TWAMP測(cè)試、網(wǎng)絡(luò)帶寬測(cè)試。
通過部署在核心層、匯聚層和業(yè)務(wù)接入層探針進(jìn)行不同層級(jí)網(wǎng)絡(luò)的業(yè)務(wù)質(zhì)量撥測(cè),用于分析在網(wǎng)絡(luò)不同層面的應(yīng)用業(yè)務(wù)感知,業(yè)務(wù)類型包括:WEB網(wǎng)頁和互聯(lián)網(wǎng)視頻等應(yīng)用等,主要功能包括:
(1)Web質(zhì)量監(jiān)測(cè)
系統(tǒng)可以對(duì)Web頁面加載過程中的多個(gè)指標(biāo)進(jìn)行統(tǒng)計(jì),包括DNS解析時(shí)間,服務(wù)器響應(yīng)時(shí)間,頁面下載速度,首頁面時(shí)長等。通過這些指標(biāo),可以分析ICP客戶的Web業(yè)務(wù)在不同區(qū)域和不同時(shí)間的性能變化情況。
(2)互聯(lián)網(wǎng)視頻質(zhì)量監(jiān)測(cè)
系統(tǒng)為提供互聯(lián)網(wǎng)視頻內(nèi)容服務(wù)的ICP客戶提供了從網(wǎng)絡(luò)各個(gè)節(jié)點(diǎn)評(píng)估視頻業(yè)務(wù)質(zhì)量的手段,可以對(duì)視頻的緩沖,下載速度,卡頓等指標(biāo)做出測(cè)量和分析。
視頻能否快速加載,與視頻調(diào)度策略及調(diào)度服務(wù)器性能有直接關(guān)系。系統(tǒng)可對(duì)視頻調(diào)度信息進(jìn)行詳細(xì)統(tǒng)計(jì),包括調(diào)度服務(wù)器URL、調(diào)度主機(jī)IP、調(diào)度主機(jī)地址、調(diào)度下載速率,調(diào)度下載時(shí)間等信息。
實(shí)現(xiàn)的測(cè)試功能和采集指標(biāo)的基礎(chǔ)通過一套業(yè)務(wù)質(zhì)量評(píng)估模型對(duì)各種業(yè)務(wù)維度進(jìn)行用戶感知評(píng)估的量化(QoE),各種業(yè)務(wù)類型的用戶感知(QoE)評(píng)分,得出綜合用戶感受值,直觀反應(yīng)網(wǎng)絡(luò)的用戶體驗(yàn)質(zhì)量;同時(shí)該體系可根據(jù)網(wǎng)絡(luò)發(fā)展和用戶需求,靈活調(diào)整各種指標(biāo)權(quán)重,也可根據(jù)各種權(quán)威標(biāo)準(zhǔn)進(jìn)行配置;系統(tǒng)可支持配置多套感知評(píng)估模板。
系統(tǒng)支持靈活配置告警參數(shù),當(dāng)指標(biāo)達(dá)到某個(gè)設(shè)定的閥值時(shí),產(chǎn)生告警。并可以通過郵件、短信等發(fā)送告警。告警功能可以對(duì)測(cè)試的單一指標(biāo)進(jìn)行告警、也可以基于多指標(biāo)的組合產(chǎn)生告警。可以對(duì)鏈路進(jìn)行告警,也可以對(duì)節(jié)點(diǎn)進(jìn)行告警??梢詫?duì)網(wǎng)元進(jìn)行監(jiān)測(cè)告警、也可以對(duì)IDC的服務(wù)器設(shè)備進(jìn)行告警。系統(tǒng)可以對(duì)網(wǎng)絡(luò)測(cè)試指標(biāo)進(jìn)行告警,也可以對(duì)引入的ICP內(nèi)容資源平臺(tái)的業(yè)務(wù)質(zhì)量進(jìn)行告警。
系統(tǒng)可以對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行分類或綜合的分析。可以形成IDC網(wǎng)絡(luò)鏈路質(zhì)量分析報(bào)表、服務(wù)器端口連通性分析報(bào)表和內(nèi)容資源系統(tǒng)的業(yè)務(wù)質(zhì)量分析報(bào)表。系統(tǒng)分析報(bào)表支持自動(dòng)生成,報(bào)表數(shù)據(jù)自動(dòng)定時(shí)更新。同時(shí)可形成每個(gè)ICP的SLA可視化報(bào)表??赏ㄟ^界面定制化設(shè)計(jì),支持大屏運(yùn)維顯示。
系統(tǒng)還可以基于每種測(cè)試類型、每個(gè)測(cè)試自定義制定周期性統(tǒng)計(jì)報(bào)表、不同粒度的趨勢(shì)報(bào)表、排名報(bào)表等;報(bào)表基于源/目節(jié)點(diǎn)的聚合或獨(dú)立顯示,可自定義或系統(tǒng)內(nèi)置的小時(shí)、日、周、月、年區(qū)間查詢,提供查詢粒度及各項(xiàng)指豐富的篩選條件,可根據(jù)需要選擇曲線、柱狀、餅狀、表格等顯示方式,所有常見的篩選條件可保存為模板,以方便重復(fù)查詢。支持查詢每次測(cè)試結(jié)果和某個(gè)時(shí)間的所有測(cè)試結(jié)果。支持基于對(duì)節(jié)點(diǎn)和鏈路的各項(xiàng)測(cè)試數(shù)值進(jìn)行排序、對(duì)比,支持輸出EXCL、HTML等報(bào)表和圖片。
通過對(duì)數(shù)據(jù)中心建設(shè)獨(dú)立的網(wǎng)絡(luò)質(zhì)量自動(dòng)撥測(cè)系統(tǒng),改變了移動(dòng)運(yùn)營商數(shù)據(jù)中心的業(yè)務(wù)保障流程,填補(bǔ)了移動(dòng)運(yùn)營商在此方而的空白。各運(yùn)營商建設(shè)自動(dòng)程度高、管理完善的業(yè)務(wù)自動(dòng)撥測(cè)系統(tǒng),可以將現(xiàn)有繁瑣、低效的人工操作改變?yōu)橹悄艿淖詣?dòng)化操作,提高通信網(wǎng)絡(luò)的運(yùn)行維護(hù)水平,提高發(fā)現(xiàn)問題和處理問題的能力,有效改善移動(dòng)運(yùn)營商的工作效率及服務(wù)質(zhì)量,同時(shí)也可為移動(dòng)運(yùn)營商贏得社會(huì)效益和經(jīng)濟(jì)效益。