牟克璠(中國(guó)移動(dòng)通信集團(tuán)甘肅有限公司,甘肅蘭州 730070)
互聯(lián)網(wǎng)電視是運(yùn)營(yíng)商數(shù)字家庭市場(chǎng)戰(zhàn)略的基礎(chǔ)業(yè)務(wù),相對(duì)于其他視頻業(yè)務(wù)和基礎(chǔ)網(wǎng)絡(luò)業(yè)務(wù),電視用戶對(duì)于業(yè)務(wù)體驗(yàn)質(zhì)量的敏感性更高,對(duì)網(wǎng)絡(luò)質(zhì)量的容忍度更低,使質(zhì)量保障難度更大。由于流程長(zhǎng)、碼率高、并發(fā)量大,互聯(lián)網(wǎng)電視業(yè)務(wù)遠(yuǎn)未達(dá)到高品質(zhì)要求,質(zhì)量保障和優(yōu)化面臨較大挑戰(zhàn)。
受國(guó)家政策影響,互聯(lián)網(wǎng)電視逐漸過(guò)渡到IPTV業(yè)務(wù),直播業(yè)務(wù)采用組播承載,業(yè)務(wù)信令及點(diǎn)播業(yè)務(wù)用單播承載。組播對(duì)網(wǎng)絡(luò)的要求很高,丟包大于0.03%或時(shí)延大于40 ms 就會(huì)產(chǎn)生花屏,對(duì)用戶體驗(yàn)造成影響,而現(xiàn)網(wǎng)大部分網(wǎng)管系統(tǒng)配置的告警預(yù)警閾值不足以觸發(fā)如此細(xì)微的問(wèn)題。
本方案的主要思路是基于軟硬探針結(jié)合、聚類告警和自動(dòng)化工具?,F(xiàn)網(wǎng)機(jī)頂盒出廠就集成軟探針APK,軟探針會(huì)采集所有用戶的收視行為,通過(guò)關(guān)聯(lián)數(shù)據(jù)的聚類分析,產(chǎn)生預(yù)告警信息預(yù)判。硬探針拉流部署二次驗(yàn)證預(yù)告警信息,進(jìn)行故障定位定界,最終生成告警工單,派發(fā)維護(hù)人員。智能告警監(jiān)控是主動(dòng)發(fā)現(xiàn)故障、保障業(yè)務(wù)質(zhì)量的重要手段,建立電視業(yè)務(wù)的匯聚告警體系,可以幫助運(yùn)維人員更快速、敏銳地發(fā)現(xiàn)故障點(diǎn),提升故障處理時(shí)效,保障用戶感知體驗(yàn),提高運(yùn)營(yíng)商互聯(lián)網(wǎng)電視業(yè)務(wù)的用戶滿意度。
軟探針內(nèi)置在用戶機(jī)頂盒中,硬探針?lè)謩e部署在地(市)CR、CDN 側(cè)節(jié)目視頻源入流和出流,具體如圖1所示。
圖1 軟硬探針部署圖
軟探針從底層播放器、網(wǎng)絡(luò)口和系統(tǒng)采集數(shù)據(jù),進(jìn)行預(yù)處理后,根據(jù)觸發(fā)上報(bào)的條件向軟探針監(jiān)測(cè)平臺(tái)上報(bào)數(shù)據(jù)。
目前軟探針與監(jiān)測(cè)平臺(tái)的接口如圖2 所示,具體功能如表1所示。
表1 軟探針與監(jiān)測(cè)平臺(tái)的接口
圖2 軟探針與監(jiān)測(cè)平臺(tái)接口框圖
軟探針采集功能如下。
a)感知采集、行為分析、運(yùn)營(yíng)分析。
b)共性聚合、故障預(yù)警。
c)單用戶診斷、投訴處理、提供可視化工具。
硬探針采集功能如下。
a)全省層面、整個(gè)地(市)高實(shí)時(shí)性監(jiān)控。
b)補(bǔ)充軟探針能力:解碼、調(diào)度等。
c)主要用于分段排障定位、割接測(cè)試。
數(shù)據(jù)采集層主要通過(guò)各種方式(系統(tǒng)接口、監(jiān)測(cè)設(shè)備、網(wǎng)絡(luò)探針等)獲取質(zhì)量監(jiān)控能力層所需要的數(shù)據(jù),實(shí)現(xiàn)對(duì)數(shù)據(jù)模型、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量的統(tǒng)一管理,同時(shí)實(shí)現(xiàn)數(shù)據(jù)的對(duì)象化,面向上層能力層模塊提供面向?qū)ο蟮臄?shù)據(jù)訪問(wèn)能力。
數(shù)據(jù)采集層的數(shù)據(jù)主要來(lái)源于以下幾個(gè)系統(tǒng)。
資管系統(tǒng):寬帶用戶相關(guān)的網(wǎng)絡(luò)拓?fù)湫畔?,包括用戶關(guān)聯(lián)的PON 口、OLT、交換機(jī)、BRAS 等網(wǎng)元關(guān)聯(lián)信息。
DHCP 系統(tǒng):包括用戶IP 地址獲取、上下線行為、Option 82字段。
機(jī)頂盒軟探針:終端側(cè)采集的收視行為、KPI 和KQI相關(guān)指標(biāo)(見(jiàn)圖2)。
網(wǎng)絡(luò)硬探針:內(nèi)容源、EPG、CDN、網(wǎng)絡(luò)鏈路等端到端組成環(huán)節(jié)的撥測(cè)性能數(shù)據(jù)。
CDN:中心/邊緣節(jié)點(diǎn)的調(diào)度服務(wù)器、流服務(wù)器日志、業(yè)務(wù)話單日志、用戶調(diào)度信息。
網(wǎng)管/OMC:CMNET、城域網(wǎng)、接入網(wǎng)等設(shè)備的性能數(shù)據(jù)指標(biāo)及告警信息。
可視化運(yùn)維系統(tǒng):可實(shí)現(xiàn)從機(jī)頂盒-ONU-OLTBRAS-CR-BR-平臺(tái)IPTV 全路徑、端口級(jí)的業(yè)務(wù)故障定位。
系統(tǒng)能力層主要包含質(zhì)量監(jiān)控、質(zhì)差告警、故障定位、拉流探針撥測(cè)、報(bào)表支撐等模塊,對(duì)數(shù)據(jù)共享層獲取的數(shù)據(jù)進(jìn)行與業(yè)務(wù)緊密相關(guān)的數(shù)據(jù)處理,封裝成業(yè)務(wù)能力,并以微服務(wù)的形式供上層應(yīng)用層調(diào)用,系統(tǒng)基礎(chǔ)能力包括以下幾方面。
質(zhì)量監(jiān)控能力:包括業(yè)務(wù)量和業(yè)務(wù)質(zhì)量監(jiān)控,輸出互聯(lián)網(wǎng)電視在線用戶數(shù)、收視用戶數(shù)點(diǎn)播直播收視情況、網(wǎng)絡(luò)性能指標(biāo)、業(yè)務(wù)質(zhì)量指標(biāo)、業(yè)務(wù)質(zhì)量告警等數(shù)據(jù)。
質(zhì)差告警能力:根據(jù)質(zhì)量監(jiān)控指標(biāo)輸出地(市)、區(qū)縣、CDN、BRAS、OLT 等維度的質(zhì)量告警,告警可包括在線用戶數(shù)突變、業(yè)務(wù)質(zhì)量劣化、錯(cuò)誤碼激增、網(wǎng)絡(luò)性能劣化等信息。
故障定位能力:可通過(guò)對(duì)不同時(shí)間、地區(qū)、EPG、CDN 節(jié)點(diǎn)、BRAS、OLT、PON 口等多維度的匯聚分析,結(jié)合關(guān)聯(lián)節(jié)點(diǎn)的相關(guān)KPI 指標(biāo),判定業(yè)務(wù)劣化發(fā)生的時(shí)間、影響范圍、定界根因,輸出質(zhì)差分析定界能力。
報(bào)表支撐能力:可輸出不同時(shí)間、區(qū)域維度的基礎(chǔ)性能指標(biāo)報(bào)表,可輸出針對(duì)機(jī)頂盒、EPG、CDN、BRAS、OLT、直播碼率、質(zhì)差小區(qū)的專項(xiàng)質(zhì)量分析報(bào)表。
該保障系統(tǒng)可以匯聚出地理、網(wǎng)絡(luò)、業(yè)務(wù)、終端4個(gè)維度的分級(jí)質(zhì)量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,結(jié)合各地(市)BRAS、CR 及業(yè)務(wù)中心出入流部署的硬件探針的測(cè)試結(jié)果,提高聚類告警準(zhǔn)確性、實(shí)時(shí)性。
主動(dòng)監(jiān)控能力采用“硬探針+軟探針聚類”方式,按網(wǎng)絡(luò)架構(gòu)分為播控平臺(tái)、業(yè)務(wù)平臺(tái)及CDN、承載網(wǎng)、接入網(wǎng)、終端等5個(gè)層次實(shí)現(xiàn)端到端故障監(jiān)控。
硬探針部署全量頻道拉流數(shù)據(jù),根據(jù)監(jiān)測(cè)到的不同頻道質(zhì)量對(duì)應(yīng)不同鏈路質(zhì)量。
該可視化保障系統(tǒng)實(shí)現(xiàn)從機(jī)頂盒-ONU-OLTBRAS-CR-BR-平臺(tái)IPTV 全路徑、端口級(jí)的業(yè)務(wù)故障定位。對(duì)接CMNET 獲取三層網(wǎng)絡(luò)組播路由表,獲取機(jī)頂盒到IPTV 平臺(tái)的端到端全路徑。基于機(jī)頂盒軟探針+硬探針獲取精確到鏈路級(jí)、端口級(jí)拓?fù)渎窂桨l(fā)現(xiàn)及質(zhì)量呈現(xiàn),解決組播流多鏈路中需要大量人工排查問(wèn)題,極大提高故障定位效率。基于SQM 聚類查詢自動(dòng)輸出全路徑鏈路級(jí)、端口級(jí)質(zhì)量、告警數(shù)據(jù)。
該系統(tǒng)上線以來(lái),互聯(lián)網(wǎng)電視監(jiān)測(cè)機(jī)制更加完善,故障定位定界有了手段,視頻服務(wù)質(zhì)量進(jìn)一步提升,通過(guò)規(guī)范互聯(lián)網(wǎng)電視端到端環(huán)節(jié),明確職責(zé),完善制度,將牌照方與終端納入管控,建立了有效的電視運(yùn)維管理體系,積極賦能一線。互聯(lián)網(wǎng)電視業(yè)務(wù)問(wèn)題平均處理時(shí)長(zhǎng)降低約30%,用戶投訴較之前下降47%,用戶滿意度提升13%,增值業(yè)務(wù)訂購(gòu)提升19%。
本文介紹了基于軟硬探針相結(jié)合的IPTV 可視化運(yùn)維保障方案,首次提出基于軟硬探針相結(jié)合的保障系統(tǒng),此系統(tǒng)極大提高了保障效率,有效支撐維護(hù)人員對(duì)故障定位定界。