段立鴻,劉三偉,張 勝,楊 健
(1.中國移動通信集團河南有限公司,鄭州 450000;2.鄭州能通網(wǎng)絡(luò)技術(shù)有限公司,鄭州 450000)
隨著互聯(lián)網(wǎng)業(yè)務(wù)的快速發(fā)展和電信業(yè)務(wù)IP化進程的不斷深入,與互聯(lián)網(wǎng)相關(guān)業(yè)務(wù)種類、用戶數(shù)量都呈不斷增長的態(tài)勢,用戶對網(wǎng)絡(luò)質(zhì)量提出了更高的要求,急需提升運維保障和故障處理能力。本文針對當(dāng)前互聯(lián)網(wǎng)故障處理現(xiàn)狀,提出了通過軟件進行一鍵抓包,一鍵分析,同時生成數(shù)據(jù)格式文件,測試完成后軟件實時解析數(shù)據(jù),并分類輸出測試結(jié)果,相比傳統(tǒng)的故障處理分析方法上有了極大改善。
當(dāng)前的互聯(lián)網(wǎng)絡(luò)故障和故障處理面臨如下挑戰(zhàn):
(1)投訴量劇增,人員相對不足,故障處理能力和處理效率不能滿足日益發(fā)展的運維需求。
(2)故障信息采集環(huán)節(jié)多,相應(yīng)處理工具分散,不利于跨專業(yè)、跨部門之間協(xié)同處理和故障判斷,缺乏專業(yè)的自動化工具整合及支撐,故障采集和診斷的完整性、準確性因維護人員的技術(shù)能力、對各類軟件的使用熟悉度而差次不齊。
(3)主要依靠人工進行數(shù)據(jù)查詢和預(yù)處理,預(yù)處理效率較低且信息準確性、規(guī)范性、處理效率有待提升。
測試系統(tǒng)由省中心服務(wù)器+客戶端兩層架構(gòu)組成。
(1)中心服務(wù)器平臺:提供信息預(yù)置(如DNS、路由信息)、用戶及權(quán)限管理、客戶端管理及版本管理、測試任務(wù)定制、測試數(shù)據(jù)的整理分析和呈現(xiàn)、外部接口管理。
(2)客戶端:完成各類測試及數(shù)據(jù)報表生成、測試報告上傳至中心平臺。
3.2.1 故障數(shù)據(jù)一鍵獲取
(1)環(huán)境檢測,檢測主機網(wǎng)絡(luò)連接情況,自動識別本地dns和網(wǎng)關(guān)并且檢測主機到dns和網(wǎng)關(guān)鏈路情況,分析出目標(biāo)域名/IP所屬的區(qū)域和運營商。
(2)Ping測試客戶網(wǎng)絡(luò)環(huán)境到目的主機鏈路情況是否正常以及訪問站點服務(wù)器端口是否正常,便于確認是訪問站點服務(wù)器問題,還是鏈路問題。
(3)路徑跟蹤,當(dāng)Ping測結(jié)果為鏈路問題的時候,做tracert查看路由走向,并分別對tracert的每一跳做ping測,獲取對應(yīng)的延遲,丟包指標(biāo),并結(jié)合IP歸屬表檢查來定位Ip歸屬于那個網(wǎng)絡(luò)位置,查找最優(yōu)鏈路及質(zhì)差影響點。
(4)業(yè)務(wù)檢查,終端通過服務(wù)器端登獲取預(yù)置的路由信息,查詢目標(biāo)域名或地址的路由疏導(dǎo)情況;自動登域名檢測系統(tǒng),自動進行各類域名驗證。
(5)HTTPWATCH網(wǎng)頁抓包:獲取網(wǎng)頁抓包,并對抓包文件進行深度分析。
(6)WIRESHARK數(shù)據(jù)抓包:抓包并對內(nèi)外網(wǎng)占比、重傳次數(shù)等作深度分析。
3.2.2 故障數(shù)據(jù)智能分析
(1)按預(yù)置門限對環(huán)境檢測數(shù)據(jù)、ping測、tracert測試數(shù)據(jù)分析,預(yù)置DNS解析數(shù)據(jù)、判斷是否存在故障告警,并提供各項測試的結(jié)果分析。
(2)智能分析是否存在域名和IP異常。
(3)對網(wǎng)頁抓包和數(shù)據(jù)抓包數(shù)據(jù)作分析。
3.2.3 數(shù)據(jù)報告自動輸出
輸出標(biāo)準、規(guī)范的互聯(lián)網(wǎng)投訴預(yù)處理工單,提供測試結(jié)論,為后續(xù)故障判斷提供參考和判斷依據(jù)。
(1)集成度高:集成各類工具及測試環(huán)節(jié),一鍵完成故障數(shù)據(jù)采集,測試數(shù)據(jù)智能分析。特別針對故障投訴比例最大的網(wǎng)頁類故障,可實現(xiàn)快速測試和診斷。
(2)采集方便:測試信息準確完整,避免現(xiàn)場反復(fù)采集、利于精準分析故障原因,給出預(yù)處理結(jié)論。
(3)數(shù)據(jù)處理快:測試過程數(shù)據(jù)自動采集和分析,預(yù)處理效率高,每單預(yù)處理完成時間小于10分鐘。
(4)異網(wǎng)測試便捷:通過服務(wù)器遠程向異網(wǎng)測試機下發(fā)任務(wù),異網(wǎng)對比測試方式更靈活,快捷。
互聯(lián)網(wǎng)業(yè)務(wù)故障自動定位工具的應(yīng)用,實現(xiàn)了傳統(tǒng)故障采集中多項分散采集環(huán)節(jié)的整合和智能判定,自動實現(xiàn)測試數(shù)據(jù)采集、測試結(jié)果判定,降低維護人員技術(shù)要求,準確定位故障,同時也實現(xiàn)了故障測試過程中故障診斷報告的統(tǒng)一管理,為后續(xù)故障測試的閉環(huán)管理建立良好基礎(chǔ)。
[1] 鄒進.大型網(wǎng)絡(luò)的故障快速定位和互聯(lián)網(wǎng)配套解決方案[J].中國金融電腦,2017(07):64-65.
[2] 張弼華.互聯(lián)網(wǎng)用戶信息管理和故障自動探測[D].內(nèi)蒙古大學(xué),2014.