王能輝
(寶雞文理學院陜西寶雞721013)
網絡管理是保障網絡可靠運行的最重要手段,隨著學校信息化建設的不斷深入,網絡管理系統在日常運維中發(fā)揮著越來越重要的作用。國外,網絡設備管理系統應用較早且發(fā)展較快,在諸多領域中具有廣泛的發(fā)展空間。目前主流的通用型網絡管理解決方案有四種,AT-SNMPc7.0解決方案、惠普公司的HP OpenView方案、CA公司的CA Unicenter方案、IBM Tivoli NetView方案。AT-SNMPcD的特色在于提供兩個SNMP服務器,兩個服務器之間可以相互備份,提高網絡管理系統的安全性[1]。HP OpenView是一套功能非常完善的網絡設備管理系統,集成了網絡管理和系統管理的優(yōu)點,能夠及時告知網絡管理人員故障發(fā)生及故障發(fā)生的原因,從而輕松而順利地實現網絡運作從被動無序到主動控制的過渡,幫助網絡運行部及時了解整個網絡當前的真實狀況,掌握主動控制[2]。Unicenter是CA的旗艦產品,其支持所有主流平臺,功能完整。IBM Tivoli NetView獨有的的新的位置敏感性拓撲(Location Sensitive Topology)特性可讓網管人員通過簡單的配置自動生成一些與管理人員對網絡的直觀認識更加貼近的拓撲視圖[3]。國內,也有學者就網管系統展開研究,并取得了一定的成效。唐學文等設計并實現了可用于IPv6網絡的網絡管理系統[4];肖雁鵬根據Visibroker的C++開發(fā)方法實現了SDH網管系統北向接口[5];步園明設計并實現了一個基于Web技術且支持SNMP協議的網絡管理系統[6];孟起勝等介紹了一種以基于已經部署的DOCSIS網絡管理系統管理EPON網絡的一種網絡架構方案[7];崔雯雯提出基于嵌入式代理、采用集中管理與分層管理兩種模式結合的HiNoC網絡管理方案,基于此方案,實現了HiNoC網管系統[8];孔祥云等提出了一種基于主成分分析的網絡數據挖掘方法,并通過對實際網絡數據的分析、比較,驗證了該方法的有效性[9];陳家雄等給出了MSTP網管系統北向接口的設計與實現方案,闡明了北向接口的總體架構、交互機制和功能規(guī)劃等方面的設計思路[10];馬青青提出一種基于Ext JS 4.2.1的嵌入式網絡管理系統設計方案,并完成系統的設計[11]。我?,F有網絡管理系統是2006年開發(fā)的,只支持有線設備的管理,不支持無線AP的管理,而且現有網絡管理系統功能過于簡單,只能判斷網絡設備通斷,無法直接查看網絡設備運行的信息。對服務器或主機進行管理的系統是另外一套管理系統,這套管理系統不能同時監(jiān)控所有的服務器設備,只能監(jiān)控同廠家的服務器。針對現有網絡管理系統存在的不足,本研究設計并實現了一套多節(jié)點網絡設備管理系統,此系統可實現對所有網絡設備實時監(jiān)控和異常告警,網絡管理人員可以實時查看網絡設備運行信息和告警信息,及時發(fā)現并解決網絡問題。
從系統架構上,分多節(jié)點網絡設備管理系統可分為5層,包括基礎實施層,指的是網絡設備資源;感知層,用于網絡設備運行信息的獲??;傳輸層,采集節(jié)點將采集數據發(fā)送到總控節(jié)點所采用的傳輸協議;服務層,總控節(jié)點啟用WebService服務將獲取的信息發(fā)布出去,應用層,用戶獲取信息的處理和應用。本研究采用分層的思想設計分多節(jié)點網絡設備管理系統,具體架構如圖1所示。
圖1 系統架構圖
為了幫助網絡管理人員簡單、直觀、有效的掌握網絡設備的運行狀態(tài)和健康水平,了解網絡設備動態(tài)變化趨勢,及時發(fā)現可能對業(yè)務及用戶造成的威脅,快速查明導致業(yè)務中斷和網絡設備異常的問題源,協助網絡維護人員及時對網絡故障響應處理,降低學校運營風險,文章設計了多節(jié)點網絡設備管理系統。此系統主要包括網絡拓撲管理、網絡設備管理、網絡設備告警管理、統計報表等4大模塊,其具體功能框架如圖2所示。
圖2 系統功能框架圖
網絡拓撲管理:此功能可快速、有效的的實現二、三層網絡拓撲的自動發(fā)現,并通過拓撲圖和網絡設備的運行狀態(tài)、設備信息、流量信息數據相關聯,幫助網絡管理人員快速發(fā)現網絡運維中的各種問題,輕松實現網管。網絡拓撲管理包含功能有網絡拓撲的發(fā)現和網絡拓撲的維護。
網絡設備管理:主要對網絡設備各種參數的實時監(jiān)控,包括網絡設備的指標管理、網絡設備的性能管理和網絡設備的流量管理。
網絡設備告警管理:網絡設備運行異常時,會通過此功能將網絡管理人員定制的告警信息發(fā)送給網絡管理人員。此功能包括:告警信息定制、告警信息查看、告警信息處理。
統計報表功能:統計網絡設備運行時產生的各項信息,方便用戶查看。此功能包括:報表定制和報表查看。
開發(fā)多節(jié)點網絡設備管理系統,需要搭建兩個服務器:Web服務器和數據庫服務器[12]。Web服務器提供網頁供網絡管理人員登錄和瀏覽;數據庫服務器則存儲和管理網絡管理系統中拓撲、網絡設備參數、告警等信息??梢赃x擇的Web服務器軟件有很多,如 BEA WebLogic 、IBM WebSphere Server、Apache Tomcat等[13],本研究選用 Apache Tomcat服務器作為Web服務器,數據庫服務器選擇微軟公司的SQL Server 2008。
文章中的網絡設備管理系統系統采用JDK(Java Developer Kit,Java開發(fā)工具包)和 JSP代碼編輯工具開發(fā)。目前功能強大的JSP編輯開發(fā)工具,如 Jbuilder、Eclipse、IBM Rational等,鑒于 Eclipse是一個基于Java的、開源的可擴展平臺且有豐富的插件集,文章選用Eclipse開發(fā)平臺[14]。
考慮到實現大規(guī)模網絡設備的監(jiān)控,基于分布式架構的思想,搭建若干個采集節(jié)點采集網絡設備運行數據,然后通過TCP協議上傳至主控節(jié)點。用戶不需要與采集節(jié)點直接交互,不需要關心具體由哪個采集節(jié)點來完成數據采集的工作,就可以實現具體業(yè)務數據的采集。采集節(jié)點上安裝采集SNMP工具來獲取網絡設備運行信息,具體流程圖如圖3所示。
圖3 分布式采集流程圖
在網絡拓撲結構的自動發(fā)現的實現過程中,先使用SNMP協議搜索路由表信息構造網絡主拓撲,然后使用ARP協議或者ICMP協議發(fā)現子網中的終端設備,以實現子拓撲的構建[15],最終可實現網絡拓撲的發(fā)現。
用戶發(fā)起SNMP請求后,主控節(jié)點通過Web服務接收到該請求,然后下發(fā)該請求給采集節(jié)點,采集節(jié)點通過SNMP協議可獲取網絡設備指標信息。用戶可以通過Web的方式查看監(jiān)控的網絡設備具體信息,可查看的信息一般有設備信息指標和設備性能指標[16]。設備信息指標包括:型號、MAC地址、電源類型、連續(xù)運行時間。設備性能指標有總流量、所有接口發(fā)送丟包數、CPU利用率、總接收吞吐量、廣播包速率、內存利用率、Ping時延、總發(fā)送吞吐量、所有接口接收丟包數、發(fā)送廣播包數、丟包速率、ICMP包速率[17]。以我??萍紭嵌?設備為例,該設備信息指標如圖4所示。
圖4 網絡設備信息指標圖
本系統可通過TELNET(或者SSH)到網絡管理人員想要管理的網絡設備,然后通過FTP協議或SNMP協議下載該網絡設備的配置。變更后根據需要可保存到網絡設備管理系統或將變更后的配置上傳至原來的網絡設備。
設置SNMP輪巡時間,通過SNMP輪巡,一旦發(fā)現某接口故障,可產生告警信息。網絡管理人員可利用設備告警功能,及時發(fā)現設備故障,快速響應,以縮短故障處理時間。
通過查詢數據庫可統計一定時間內設備指標報表、告警統計報表、告警授理報表、端口流量報表、流量統計報表[18]。
利用上述多節(jié)點網絡設備管理系統在寶雞文理學院網絡管理中心進行試驗,對學生公寓匯聚交換機RG-S5750(IP地址:10.100.32.1)進行 24 小時監(jiān)控(2017年04月20日),實時CPU利用率、內存利用率、Ping時延、丟包速率、總流量等網絡設備指標信息,利用網絡管理系統統計報表功能導出測試數據如表1所示。從表1可以看出,在24小時內,通過多節(jié)點網絡設備管理系統可以實時獲取實時CPU利用率、內存利用率、ICMP包速率、Ping時延、丟包速率、總發(fā)送吞吐量、總接收吞吐量、總流量等網絡設備指標信息。24小時均能采集到設備運行信息,體現了該網絡設備管理系統的穩(wěn)定性。通過瀏覽器訪問主控服務器查看網絡拓撲的平均時間在2 s以內,完全達到了實際使用的要求。
表1 網絡設備指標測試數據
網絡設備管理系統作為網絡運維支撐的重要手段,在日常網絡維護中發(fā)揮著重要作用。針對現有的基于單點采集的網絡設備管理系統的不足,文章設計并實現了一種多節(jié)點網絡設備管理系統。該系統已經在項目中得到具體應用,對大規(guī)模網絡設備的管理提供了一種新的思路,對現有的基于SNMP協議的網絡設備管理系統改造有一定的參考意義。通過實際部署發(fā)現,該系統運行穩(wěn)定,能實現大規(guī)模網絡設備的管理,能實現網絡管理軟件應有的功能,能滿足網絡管理人員的需求。