文/王健
在我國現(xiàn)階段,隨著信息化技術(shù)水平的不斷提高,我國各大企業(yè)對于信息化技術(shù)的應(yīng)用也越來越重視,其中,信息管理系統(tǒng)就得到了廣泛的應(yīng)用與推廣。對于企業(yè)來說,其各項業(yè)務(wù)的高效運作均離不開信息管理系統(tǒng)的支持與推動,因此,在這種形勢下,企業(yè)要想實現(xiàn)更好更快的發(fā)展,首先就要充分重視信息化產(chǎn)業(yè)的發(fā)展,不斷提升自身的信息化服務(wù)水平。特別是在人力資源較為緊缺的情況下,加強系統(tǒng)與設(shè)備運行狀況的實時化動態(tài)監(jiān)控是十分重要的,同時也是企業(yè)實現(xiàn)信息化管理過程中主要面臨的問題之一。
目前,我國比較常見的開放網(wǎng)絡(luò)協(xié)議主要被分別三種,分別為存儲管理接口規(guī)范SMI-S協(xié)議、簡單網(wǎng)絡(luò)管理SNMP協(xié)議和以及Windows管理規(guī)范WMI協(xié)議。
(1)WMI是我國當前可以對Windows系統(tǒng)進行描述的一種可用資源組件,其在操作系統(tǒng)服務(wù)包中就已經(jīng)被封裝。WMI的開發(fā)是由微軟公司負責(zé)的,同時也被廣泛的投入市場,其表現(xiàn)出最為突出的優(yōu)勢就可以更加穩(wěn)定的支持Windows系列系統(tǒng),同時也可以通過該組件來收集與獲得Windows系統(tǒng)管理下的多種設(shè)備參數(shù),例如,軟件執(zhí)行效率、硬件運行狀態(tài)以及資源占用比等。
(2)在現(xiàn)代計算機網(wǎng)絡(luò)體系中,SNMP作為一種通信協(xié)議,可以專用于網(wǎng)絡(luò)設(shè)備管理當中,其不僅可以負責(zé)抓取各種網(wǎng)絡(luò)設(shè)備運行中的狀態(tài)信息,同時也能夠?qū)ζ涫占c抓取的狀態(tài)信息進行管理與統(tǒng)一格式的封裝,從而在互聯(lián)網(wǎng)平臺的基礎(chǔ)上進一步實現(xiàn)了遠距離的傳輸。在一般情況下,網(wǎng)絡(luò)通信設(shè)備是該種協(xié)議主要的管理對象,例如,網(wǎng)關(guān)、路由器以及交換機。
(3)SMI-S是我國目前最常用到的一組標準規(guī)范,其主要管理與監(jiān)控的是網(wǎng)絡(luò)中的存儲設(shè)備,通過應(yīng)用該規(guī)范下的統(tǒng)一接口,不僅可以對網(wǎng)絡(luò)存儲設(shè)備性能進行實時的監(jiān)控,同時也能夠?qū)⑵湎嚓P(guān)信息完整的傳送到遠端的控制主機當中。SMI-S標準最突出的優(yōu)勢就是可以有效解決多種存儲設(shè)備之間不兼容的問題,而SMI-S這一接口標準的應(yīng)用,可以有效避免硬件設(shè)備自身的運行機制對管理系統(tǒng)實施監(jiān)控與管理的影響。
圖1為本次設(shè)計研究中監(jiān)控系統(tǒng)的整體結(jié)構(gòu),根據(jù)圖1可知,該系統(tǒng)的基本框架主要由兩臺高性能服務(wù)器共同組成,一臺為存儲數(shù)據(jù)庫,另外一臺為數(shù)據(jù)處理分析設(shè)備,通過這兩臺設(shè)備互聯(lián)網(wǎng)就可以對各種監(jiān)控設(shè)備進行遠程管理。
由于監(jiān)控系統(tǒng)中所涉及的對象較多,例如,被管理對象、數(shù)據(jù)庫、APP展示界面、Agent服務(wù)器、采集到的數(shù)據(jù)、報警信息、命令及配置信息以及管理員等,因此就要對其工作流程進行合理的優(yōu)化與設(shè)計:
(1)若被管理端的整體運行狀況被監(jiān)控系統(tǒng)發(fā)起輪詢,輪詢時間的間隔就要根據(jù)企業(yè)的具體需求來進行設(shè)定,對于整體運行情況較為穩(wěn)定的設(shè)備來說,其輪詢間隔的時間就可以適當延長,以此來有效節(jié)省不必要的網(wǎng)絡(luò)通信資源浪費。
(2)要實時抓取管理端與被監(jiān)控對象的相關(guān)性能參數(shù),并根據(jù)網(wǎng)絡(luò)開放協(xié)議的具體要求的格式來對其實時預(yù)處理;
(3)要把已經(jīng)處理完的數(shù)據(jù)及時存儲到相應(yīng)的數(shù)據(jù)庫中,以便其接受輪詢時能夠?qū)⑵浼皶r發(fā)送到控制臺進行全面、系統(tǒng)的展示。
(4)控制臺要將接受到的采集數(shù)據(jù)進行全面的分析與準確的計算,一旦發(fā)現(xiàn)信息中存有告警數(shù)據(jù),就要通過短信或者是郵件的形式將其及時的發(fā)送給管理人員進行報警處理;
(5)在報警信號發(fā)出的同時,相關(guān)監(jiān)測信息要及時、準確的顯示在監(jiān)控主機的WEB頁面上。
目前,在監(jiān)控系統(tǒng)具體工作流程的基礎(chǔ)上,相關(guān)人員已經(jīng)將其系統(tǒng)的設(shè)計詳細的劃分成了多個模塊,其中主要包括信息采集模塊、展示模塊、設(shè)備添加配置模塊、數(shù)據(jù)分析模塊、存儲模塊、告警模塊以及輪詢模塊等,具體模塊設(shè)計如圖2所示。
圖1:監(jiān)控系統(tǒng)結(jié)構(gòu)
圖2:監(jiān)控系統(tǒng)模塊設(shè)計
在實際應(yīng)用的過程中,由于Windows系統(tǒng)與WMI協(xié)議可以從根本上實現(xiàn)真正的無縫式管理,因此其二者的支持度最高。為此,各大企業(yè)在一般情況下均會應(yīng)用此協(xié)議來實現(xiàn)從控制機A到被監(jiān)控機B的遠程訪問。與此同時,要想構(gòu)建有效的訪問,首先就要構(gòu)建由A到B的COM連接;其次,在B上需要開啟WMI協(xié)議,以此來為A提供有使用價值的管理員賬號,A在這一信息基礎(chǔ)上登錄B,并及時抓取有用的信息,例如,內(nèi)存容量和使用率、CPU占用率、磁盤IO信息以及磁盤空間和利用率等多種信息與操作系統(tǒng)的各種參數(shù)。
根據(jù)上述內(nèi)容可知,網(wǎng)絡(luò)設(shè)備的監(jiān)控在大多數(shù)情況下都應(yīng)用的是SNMP協(xié)議。在其實際應(yīng)用過程中,首先要求被監(jiān)控的網(wǎng)絡(luò)設(shè)備能夠支持與開啟SNMP服務(wù),合理設(shè)置安全系數(shù)較高的用于訪問連接的團體字符串。團體字符串不僅是監(jiān)控期間輪詢環(huán)節(jié)的標識符,同時也是監(jiān)控機對被監(jiān)控設(shè)備進行訪問的有效憑證。SNMP協(xié)議主要監(jiān)控的是網(wǎng)絡(luò)通信數(shù)據(jù),例如,數(shù)據(jù)包丟棄率、網(wǎng)絡(luò)接口流量、數(shù)據(jù)包碎片數(shù)以及超大數(shù)據(jù)包比例等相關(guān)參數(shù)。
根據(jù)目前的情況來看,不同的產(chǎn)生廠商針對于存儲存儲設(shè)備的監(jiān)控提供了不同的監(jiān)控方式,但其最底層的通訊卻遵循著相同的存儲服務(wù)協(xié)議——SMI-S標準。在該系統(tǒng)中,與EMC存儲系列相關(guān)的產(chǎn)品均可以實現(xiàn)相關(guān)數(shù)據(jù)的存儲。在其具體監(jiān)控的過程中,首先可以利用EMC低端來對網(wǎng)絡(luò)中的中EMC存儲信息進行收集與存儲,并通過統(tǒng)一接口標準SMI-S將EMC存儲信息發(fā)送到指定的監(jiān)控平臺中,再由該平臺對其數(shù)據(jù)進行分析與過濾處理,以此來將最終的結(jié)果通過圖形化界面充分的展示給相關(guān)用戶。
與低端存儲的監(jiān)控方式當時相比,EMC高端存儲系列存在著較大的不同,EMC高端存儲系列在收取存儲信息的過程中需要通過EMC公司為其專門定制Provider。對于該系統(tǒng)來說,應(yīng)該為其配置一臺利用光纖交換機來連接被監(jiān)控存儲的主機,其中,被監(jiān)控存儲設(shè)備要空出部分空間留給此主機,并將EMC SMI-S Provider安裝在主機上。該主機在Provider的基礎(chǔ)上不僅可以實現(xiàn)信息的收集與存儲,同時也能夠?qū)⑿畔⒓皶r發(fā)送給相應(yīng)的監(jiān)控平臺。另外,SMI-S協(xié)議還可以獲取與存儲設(shè)備相關(guān)的大量性能參數(shù),例如,磁盤容量和LUN信息、控制器信息、存儲卷信息、RAID卡信息以及存儲卷所映射的主機等。
監(jiān)控系統(tǒng)在開放網(wǎng)絡(luò)協(xié)議的基礎(chǔ)上充分結(jié)合了WMI協(xié)議,SNMP協(xié)議與SMI-S標準,這不僅看可以對網(wǎng)絡(luò)存儲設(shè)備與通信設(shè)備實際運行過程中的相關(guān)參數(shù)進行實時的監(jiān)控,同時也能夠?qū)⒃O(shè)備運行過程中出現(xiàn)的異常情況及時的反映給相關(guān)的管理人員,確保設(shè)備系統(tǒng)運行故障可以在發(fā)生的第一時間就得到及時有效的解決,以此來進一步提升系統(tǒng)維修效率,提高公司信息基礎(chǔ)設(shè)施運行的安全性、可靠性與連續(xù)性。