楊明光
摘要;數(shù)據(jù)中心場地環(huán)境監(jiān)控系統(tǒng)設(shè)計是對各個監(jiān)控子系統(tǒng)的有機(jī)結(jié)合,通過整體架構(gòu)優(yōu)化設(shè)計,使系統(tǒng)可靠、可擴(kuò)展以及易維護(hù)。本系統(tǒng)主要用于數(shù)據(jù)中心場地環(huán)境監(jiān)測,數(shù)據(jù)中心管理員可以通過瀏覽器遠(yuǎn)程對機(jī)房內(nèi)的設(shè)備進(jìn)行管理,同時還可以查看設(shè)備的實時監(jiān)測和歷史數(shù)據(jù),便于用戶隨時了解機(jī)房動態(tài)。用戶通過B/S查看機(jī)房環(huán)境和設(shè)備的運行情況,免去了機(jī)房嘈雜的環(huán)境,過強(qiáng)的輻射對人員身體造成的傷害。
關(guān)鍵詞:數(shù)據(jù)中心;監(jiān)控平臺;動力環(huán)境
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)07-0206-03
1引言
目前,出于安全、保密等因素的考慮,企業(yè)均建有自己的數(shù)據(jù)中心,運行著非常重要的業(yè)務(wù)系統(tǒng),存儲著企業(yè)的核心數(shù)據(jù)。隨著企業(yè)的不斷發(fā)展,數(shù)據(jù)中心的規(guī)模與日俱增,隨之配套的場地環(huán)境設(shè)備的數(shù)量、種類也急劇增加,用于計算機(jī)、存儲等設(shè)備安全穩(wěn)定的運行。因此,減少場地環(huán)境設(shè)備故障是數(shù)據(jù)中心其他計算相關(guān)設(shè)備的可靠性的有力保障。但是有限的人力,往往無法通過人工巡檢的方式保障如此的場地環(huán)境設(shè)備的不間斷運行。
正式為了避免上述問題,需要一套7×24X 365全面集中的數(shù)據(jù)中心場地環(huán)境監(jiān)測系統(tǒng),能夠使數(shù)據(jù)中心管理人員能夠?qū)崟r了解到機(jī)房全面的情況,并能進(jìn)行有效控制和管理,及時地發(fā)現(xiàn)并處理事故隱患,必要時還可實施無人值守的遠(yuǎn)程管理。
2系統(tǒng)監(jiān)控范圍、內(nèi)容
2.1監(jiān)控范圍
系統(tǒng)監(jiān)控范圍涉及三個部分,一是環(huán)境部分,涉及溫濕度探測器和精密空調(diào);二是動力部分,涉及UPS電源、UPS蓄電池以及市電電量儀;三是安保部分,主要是視頻攝像頭的監(jiān)控。
2.2監(jiān)控內(nèi)容
根據(jù)2.1節(jié)所述的監(jiān)控范圍,具體監(jiān)控內(nèi)容,如表1所示。
3系統(tǒng)設(shè)計與實現(xiàn)
3.1系統(tǒng)總體架構(gòu)
本系統(tǒng)基于B/S架構(gòu),對各類設(shè)備的監(jiān)控采用分布式的模式,即對每一類場地環(huán)境設(shè)備,根據(jù)其特點,開放的接口、場地環(huán)境條件等因素,分別部署與之相匹配的監(jiān)控方案;而對各類監(jiān)控數(shù)據(jù)的管理則集中管理,即將采集到的數(shù)據(jù)統(tǒng)一通過IE瀏覽器的方式進(jìn)行實時瀏覽、并統(tǒng)一進(jìn)行存儲,用于日后的歷史數(shù)據(jù)的展示與分析。
數(shù)據(jù)中心各機(jī)房內(nèi)配置一臺串口服務(wù)器,使用串口服務(wù)器把溫濕度、UPS、空調(diào)等串口通訊設(shè)備直接聯(lián)入TCP/IP網(wǎng)絡(luò),中心機(jī)房監(jiān)控主機(jī)通過網(wǎng)絡(luò)同設(shè)備建立通訊連接,實現(xiàn)本地工業(yè)通訊網(wǎng)絡(luò)的功能。這樣,通過公司系統(tǒng)既有的辦公網(wǎng)絡(luò),多個區(qū)域的機(jī)房可以用同一套軟件進(jìn)行集中監(jiān)控管理。系統(tǒng)架構(gòu)圖,如圖1所示。
3.2系統(tǒng)功能設(shè)計及實現(xiàn)方式
3.2.1精密空調(diào)監(jiān)控
精密空調(diào)的監(jiān)控,實現(xiàn)如下功能;
監(jiān)測功能:通過精密空調(diào)廠家提供的智能通訊接口及通訊協(xié)議,實時地監(jiān)視精密空調(diào)的回風(fēng)溫度、回風(fēng)濕度、濾網(wǎng)狀態(tài)、壓縮機(jī)狀態(tài)等信息。(注:監(jiān)測內(nèi)容由廠家協(xié)議決定,不同品牌、型號精密空調(diào)可能監(jiān)測到的內(nèi)容不同。)
報警功能:系統(tǒng)支持短信和郵件告警,并對發(fā)送人員名單可配置,支持抄送功能。
歷史曲線功能:對于重要的參數(shù),可作曲線記錄,系統(tǒng)可查詢一年內(nèi)相應(yīng)參數(shù)的運行曲線,并可顯示查詢選定具體時間相應(yīng)時間的參數(shù)值,及時地發(fā)現(xiàn)并解決精密空調(diào)運行中出現(xiàn)的各種問題。
控制功能:系統(tǒng)可遠(yuǎn)程對精密空調(diào)進(jìn)行開關(guān)機(jī)、溫度調(diào)節(jié)、模式設(shè)置等操作。
精密空調(diào)的監(jiān)控,實現(xiàn)方式如表2所示。
3.2.2溫濕度探測器監(jiān)測
溫濕度探測器的監(jiān)測,實現(xiàn)的功能如下:
監(jiān)測功能:能夠?qū)C(jī)房中所有的溫濕度探測器的溫濕度,進(jìn)行實時數(shù)據(jù)采集。
報警功能:根據(jù)設(shè)定的溫濕度閾值,當(dāng)監(jiān)測的實時溫濕度數(shù)據(jù)超過預(yù)定的閥值時,自動發(fā)送短信和郵件告警。
歷史曲線功能:機(jī)房內(nèi)的溫濕度的參數(shù)可作曲線記錄,系統(tǒng)可查詢相應(yīng)參數(shù)的運行曲線,并可顯示查詢所選時間的參數(shù)值,當(dāng)天該參數(shù)的最大值、最小值,方便管理員全面了解機(jī)房環(huán)境的溫濕度狀況。
溫濕度探測器的監(jiān)測,實現(xiàn)方式如表3所示。
3.2.3 UPs電源監(jiān)測
UPS電源的監(jiān)測,實現(xiàn)的功能如下:
監(jiān)測功能:監(jiān)測UPS電源所有關(guān)鍵指標(biāo),如負(fù)載情況、旁路情況、逆變器等。
報警功能:故障分兩類,一類是數(shù)值類,支持閥值設(shè)定,當(dāng)數(shù)據(jù)超過閾值,短信或郵件告警;一類是狀態(tài)類,當(dāng)出現(xiàn)故障或狀態(tài)轉(zhuǎn)換時,短信或郵件告警。
歷史曲線功能:對于重要的參數(shù),可作曲線記錄,系統(tǒng)可查詢一年內(nèi)相應(yīng)參數(shù)的運行曲線,并可顯示查詢選定具體時間相應(yīng)時間的參數(shù)值,當(dāng)天(以天為單位)該參數(shù)的最大值,最小值,方便管理員全面了解UPS的運行狀況,及時地發(fā)現(xiàn)并解決UPS運行中出現(xiàn)的各種問題。
UPS電源的監(jiān)測,實現(xiàn)方式如表4所示。
3.2.4UPS電池監(jiān)測
UPS電池的監(jiān)測,實現(xiàn)的功能如下:
監(jiān)測功能:電池的監(jiān)測主要是監(jiān)測電池的電流、電壓,以及電池監(jiān)測模塊的本身狀態(tài)。
報警功能:對監(jiān)測模塊的狀態(tài),進(jìn)行故障報警;對超出預(yù)定的閾值,進(jìn)行故障預(yù)警。均已郵件和短信的方式進(jìn)行發(fā)送。
歷史曲線功能:歷史數(shù)據(jù)不僅僅是電池電流電壓的歷史采集數(shù)據(jù)簡單曲線的描繪,還涉及故障告警的歷史情況,用于運維管理人員的統(tǒng)計分析。
UPS電池的監(jiān)測,實現(xiàn)方式如表5所示。
3.2.5視頻攝像頭監(jiān)控
視頻攝像頭的監(jiān)控,實現(xiàn)的功能如下:
監(jiān)視功能:對機(jī)房內(nèi)各重要地點進(jìn)行全天候視頻監(jiān)視。
視頻存儲:提供7×24小時的錄像,采用動態(tài)監(jiān)測錄像,避免視頻數(shù)據(jù)量過大。
檢索功能:根據(jù)視頻錄像機(jī)廠家提供的API,支持視頻的檢索和回放功能,便于出現(xiàn)問題的影像還原。
報警功能:系統(tǒng)可在視頻信號丟失時自動報警;設(shè)置移動偵測后,系統(tǒng)監(jiān)測到畫面變化時自動報警等報警功能。
控制功能:系統(tǒng)可遠(yuǎn)程控制一體化球機(jī)的云臺轉(zhuǎn)動、攝像機(jī)變焦等操作。
視頻攝像頭的監(jiān)控,實現(xiàn)方式如表6所示。
3.2.6系統(tǒng)效果展示
系統(tǒng)最終實現(xiàn)圖,如圖2所示。
4結(jié)論
通過一段時間的運行,本系統(tǒng)切實能夠解決數(shù)據(jù)中心運維人員在對機(jī)房場地環(huán)境設(shè)備運維過程中的難點,能夠協(xié)助其快速發(fā)現(xiàn)問題、定位故障并及時解決故障,有效保障了場地環(huán)境設(shè)備的不間斷運行的同時,還減輕了運維人員的負(fù)擔(dān),進(jìn)而為數(shù)據(jù)中心其他計算設(shè)備的穩(wěn)定運行提供了基礎(chǔ)保障。