【摘 要】利用PRTG網(wǎng)管系統(tǒng),預(yù)警網(wǎng)絡(luò)隱患,發(fā)現(xiàn)并分析網(wǎng)絡(luò)沖擊成因,保護(hù)網(wǎng)絡(luò)運(yùn)行安全。
【關(guān)鍵詞】PRTG 分析工具 排除 NGN 隱患
一、軟交換網(wǎng)絡(luò)結(jié)構(gòu)
NGN軟交換網(wǎng)絡(luò)核心側(cè)采用阿爾卡特朗訊公司的A5020MGC及7510TG設(shè)備。這套設(shè)備現(xiàn)為雙平面業(yè)務(wù)分擔(dān)模式 ,共承擔(dān)四十余萬語音用戶。
PRTG網(wǎng)管
PRTG網(wǎng)管系統(tǒng)配置了PRTG主服務(wù)器和探針服務(wù)器兩臺(tái)設(shè)備。
探針服務(wù)器放置在NGN核心網(wǎng)內(nèi)部,主要用于使用SNMP、WMI等方式定時(shí)采集各節(jié)點(diǎn)設(shè)備數(shù)據(jù),再將采集到的數(shù)據(jù)發(fā)送PRTG主服務(wù)器。
PRTG主服務(wù)器放置在DCN網(wǎng)內(nèi)部,負(fù)責(zé)接收存儲(chǔ)探針服務(wù)器傳來的數(shù)據(jù)并加以分析處理,最終通過HTTPS、app等方式將網(wǎng)管界面呈現(xiàn)給維護(hù)人員,可以提供數(shù)據(jù)報(bào)表、分析對(duì)比、告警通知等多項(xiàng)功能。
應(yīng)用案例
7月23日登陸PRTG網(wǎng)管時(shí)發(fā)現(xiàn)多條傳感器異常告警,其中一條為“NGN-2950-2至A5020MGC-IPACC流量異常高于上周平均值”,此條告警提示: NGN第二平面C2950-2交換機(jī)至MGC的端口流量大幅增加。
點(diǎn)擊C2950端口傳感器,查看30天流量數(shù)據(jù),發(fā)現(xiàn)從7月19日開始,C2950交換機(jī)至NGN MGC IPACC端口的流量值明顯增大,合計(jì)流量峰值從日常的700KB/S驟升為7000KB/S以上。此端口主要用來傳送用戶語音網(wǎng)關(guān)與MGC間的控制消息,也就是說PON網(wǎng)關(guān)與NGN的信令數(shù)據(jù)包交互流量上升了十倍。
NGN第二平面使用NetScreen208防火墻來隔離城域網(wǎng)接入側(cè)和軟交換核心側(cè),C2950控制消息流量上升的同時(shí)NS208的端口流量也從1800KB/S上升為9000KB/S,cpu占用率從12%上升為35%,接近危險(xiǎn)值。
登陸NGN OAM,追蹤PON接入側(cè)與NGN MGC間的H.248消息,發(fā)現(xiàn)了大量504及410錯(cuò)誤,每秒鐘達(dá)數(shù)千次之多。
檢索出錯(cuò)誤消息的具體交互內(nèi)容如下圖,IP地址10.237.166.26的語音網(wǎng)關(guān)向NGN MGC發(fā)起注冊(cè),MGC認(rèn)為此語音網(wǎng)關(guān)鑒權(quán)失敗,向語音網(wǎng)關(guān)發(fā)送504錯(cuò)誤,而語音網(wǎng)關(guān)在收到504錯(cuò)誤后向MGC大量回送410錯(cuò)誤,MGC在收到語音網(wǎng)關(guān)的410錯(cuò)誤后,繼續(xù)向語音網(wǎng)關(guān)發(fā)送504錯(cuò)誤,由此形成大量消息循環(huán),對(duì)NGN網(wǎng)絡(luò)造成了嚴(yán)重沖擊。
故障原因分析:
NGN網(wǎng)絡(luò)中的語音網(wǎng)關(guān)應(yīng)采用[domainAddress]方式在MGC中注冊(cè),但此語音網(wǎng)關(guān)錯(cuò)誤的配置成以