梁亞雄 徐進軍 張煜輝
摘要:對分散的多機型的交換機告警信息集中采集和處理功能進行了研究,系統(tǒng)具有告警故障監(jiān)視、告警故障設置、告警信息統(tǒng)計和查詢等功能??梢钥s短設備故障歷時,也可以通過分析和預處理查找故障隱患,將故障消除在萌芽狀態(tài),從而有效地提高維護人員的工作效率和網絡的運行質量,為企業(yè)創(chuàng)造良好的經濟效益和社會效益。
關鍵詞:網管系統(tǒng) 功能設計 數據拆包 故障采集和處理
近年來,隨著電信網絡用戶的增加和新型交換設備的引入,建立功能齊全、使用方便的網絡管理系統(tǒng)對各種交換設備進行集中管理和集中維護,提高電信網絡的運行質量和效率十分必要。
1.交換機的傳統(tǒng)網管系統(tǒng)存在的問題
目前,電信網中主要有AXE10, EWSD, NEAR-61, SIGMA, SESS和華為CC08等交換機機型[1]。由于交換機告警故障信息的原始報告類型和定義復雜,不同交換機型的告警原始報告的格式和內容差異較大,甚至是同一種交換機機型,不同軟件版本的告警原始報告也有差異,傳統(tǒng)網管系統(tǒng)[2-3]為了準確分析和處理各種機型的告警原始報告,在網管接口機上開發(fā)多個告警分析處理模塊,分別處理一種特定的交換機機型的告警原始報告。告警分析處理模塊的功能包括:實時接收告警原始報告;提取告警原始報告中的告警時間、告警交換局、告警關鍵字、告警內容等信息;把處理后的告警信息保存在數據庫;同時通過Socket連接發(fā)送到前臺工作站。這種方式使系統(tǒng)具有結構清晰、數據結構簡單、開發(fā)過程簡單的優(yōu)點。但是對于新增機型和新版機型的告警原始報告,只要告警原始報告的格式發(fā)生變化,程序員必須對告警分析處理模塊進行相應的程序修改;完全依賴程序員對交換機告警原始報告進行分析,歸類,再轉化為計算機語言,對于缺乏交換機專業(yè)知識的程序員來說是一個艱巨的過程;在時間上也不適應東莞目前多交換機接入和版本頻繁升級的現狀。
2.告警信息集中采集和處理
某電信本地網12個NEC交換機局點、7個朗訊5ESS交換局點、10個C&C08交換機局點共200萬門的容量的交換設備,網管系統(tǒng)需要收集和處理的數據量巨大,如何保證告警故障信息集中采集和處理的高實時性將直接影響到整個系統(tǒng)的總體性能。在系統(tǒng)的開發(fā)過程中采取了許多措施來解決該問題。
1)所有只能提供串口交換機設備的端口首先都通過10LAN進行協(xié)議轉換,將RS232轉換為TCP/IP方式再通過網絡交換機接入到拆包服務器,提供網口方式的交換機直接通過網絡交換機接入到拆包服務器進行拆包處理,這種布局方式有利于大數據流的快速傳輸。
2)采用快速、穩(wěn)定的TCP/IP網絡。拆包服務器處理告警信息后必須通過TCP/IP網絡把告警信息送到前臺工作站,拆包服務器和網管監(jiān)控室(24小時有專人值班)的計算機設備采用性能較高的3COM 100M網片,并且把所有拆包服務器與網管監(jiān)控室的前臺工作站接入同一個CI SCO 100M網絡交換機上,提高網絡傳輸速率,縮短告警信息在TCP/IP網絡上的傳輸時延。
3)提高拆包服務器的硬件配置,使拆包服務器擁有強大的處理能力,提高告警信息的處理速度。拆包服務器采用HP LH3000 PC服務器,P4 2G CPU,高速SCSI硬盤,內存擴展為2G。
4)拆包服務器的系統(tǒng)拆包模塊在處理告警小報告時,每個交換機都有一個線程專門負責把重要告警信息通過SOCKET連接發(fā)送到前臺工作站告警監(jiān)視程序,產生告警;另一個線程專門負責把告警信息錄入告警數據庫中。兩個線程并行運作,不通過數據庫提供告警信息,避免了由于數據庫故障而丟失告警信息的危險和錄入、查詢告警數據庫而產生的時延。新網管系統(tǒng)通過SOCKET實時連接到交換機告警端口,并發(fā)送一定的連接信息保持端口的長時間連接,如果發(fā)現端口中斷(由于網絡原因,或交換機重新啟動原因),接收程序立即(1分鐘內)對這個端口進行重連,重連三次(次數和重連開始時間可以通過配置文件由用戶設置)。重連三次如果發(fā)現這個端口還沒有連接上,系統(tǒng)進入等待狀態(tài),等待下次重新連接(如三分鐘后),這樣循環(huán)嘗試,直到連接正常。同時將接收程序所有與端口有關的動作記錄到日志中,必要時可以查看接收程序的運行情況。
5)拆包服務器采用熱備份的機制,盡可能提高系統(tǒng)的安全性,防止告警信息的大量丟失。系統(tǒng)設有專門拆包服務器健康偵察進程,如發(fā)現有拆包服務器停止工作時間達到設定時間,該拆包服務器上連接的交換機將自動接入事先在數據庫中設定的單臺或多臺備用拆包服務器,由備用拆包服務器負責故障拆包服務器所接入交換機的信息處理,直到故障拆包服務器恢復為止。
6)完善前臺工作站告警監(jiān)視程序語音告警功能,保證以最快的速度準確把告警信息通知用戶。前臺工作站告警監(jiān)視程序能夠按照設定的告警等級和告警過濾條件,把過濾后的告警信息由重要到次要的順序產生語音告警,使重大故障的告警信息能夠最快的送到網管中心。
3.系統(tǒng)的顯示部分
對采集到的各類告警,系統(tǒng)實時地以聲音和圖形界面提供給維護人員。具體顯示方式有告警監(jiān)視總圖和各種告警列表。用戶可以自由決定某一類(根據告警類型、告警級別等)告警的到來是否需要聲音指示。在以地圖為背景的全局監(jiān)視圖中,顯示全網所有交換局點的位置。
1)顯示多種告警源:設備告警、性能告警、網管系統(tǒng)自身告警,從各局點可方便瀏覽到該局點目前各級別告警的統(tǒng)計信息,并可切換到設備告警列表,同時設備告警列表自動以該局作為過濾條件以進一步查詢該局點當前所有設備告警
2)系統(tǒng)收到告警發(fā)出相應級別的告警音,同時用相應告警級別的顏色進行直觀的閃爍指示,用戶可自定義告警級別、告警聲音和告警顏色?;顒痈婢玫酱_認后或者接收到對應告警的消除報告后,停止聲音指示并轉變?yōu)樾菝吒婢?。提供聲?閃爍開關控制功能?!?/p>
參考文獻:
[1] 陳榕 徐昌華. 電力通信網綜合網管系統(tǒng)實施策略[J]. 電力系統(tǒng)通信. 2004.25(9)
[2] 匡紅陽. 初探電信網絡管理系統(tǒng)的現狀和發(fā)展趨勢[J]. 計算機系統(tǒng)應用. 2003.3
[3] 周德澤等.計算機智能監(jiān)測控制系統(tǒng)的設計及應用[M].北京:清華大學出版社,2002