■文/曹舒揚
廣播電視機房運行監(jiān)控與管理系統(tǒng)設計與實現
■文/曹舒揚
為更好地對機房設備進行監(jiān)控和管理,對數據中心機房及機房內所有設備、線纜進行三維可視化建模,采集機房網絡、電力、環(huán)境、設備數據等信息,利用三維虛實聯動、智能管控等技術設計及實現了機房運行監(jiān)控與管理系統(tǒng)。
機房管理;機房監(jiān)控;三維可視化;虛實聯動
數據中心機房設備種類多樣繁雜,對于故障需要準確定位,快速處理,及時發(fā)現。實時了解數據機房環(huán)境控制、設備運維情況、線纜通斷狀況、電力能源消耗情況,對機房的運維具有重要意義和作用。傳統(tǒng)設備運維模式在設備數量眾多、運維環(huán)境復雜的情況下存在效率低下、數據關聯度低等缺點,無法對事件進行快速定位和有效調度相關資源。本文設計與實現的機房運行監(jiān)控與管理系統(tǒng)利用三維仿真、虛實聯動等技術對機房20余個業(yè)務、技術系統(tǒng),數千臺設備,萬余條線纜情況進行實時建模、監(jiān)控及管理。實現在三維仿真虛擬現實環(huán)境中對機房進行監(jiān)控,實現快速定位、報警聯動等功能,可以有效地提高運維人員的工作效率,是數據中心機房各業(yè)務、技術系統(tǒng)高效運行的重要保障。
機房運行監(jiān)控與管理系統(tǒng)需對數據中心機房及機房內所有設備進行建模,包括集中存儲設備、核心網絡、安全設備、核心數據庫設備、業(yè)務、技術系統(tǒng)的服務器等設備;整合網管、電力等監(jiān)測監(jiān)管數據,對機房內所有設備的運行狀態(tài)進行可視化監(jiān)控與管理,對機房內的線纜分布和走向實現可視化管理,可以實時監(jiān)控機房的溫濕度信息、電力監(jiān)控數據、網絡監(jiān)管信息、服務器監(jiān)管信息等。
1.1 機房及機房設備的三維建模與數據采集
需對機房所有機柜、設備、及環(huán)境設備進行1:1真實坐標系三維仿真建模,包括設備機柜和電力機柜;機柜內所含的集中存儲設備、核心網絡、安全設備、核心數據庫設備、業(yè)務、技術系統(tǒng)服務器等所有硬件設備;機房環(huán)境組態(tài)設備如精密空調、機房組態(tài)監(jiān)控設備等。其模型的相應參數必須與真實設備一致。對機房的網絡系統(tǒng)數據、電力數據、服務器運行狀態(tài)數據、環(huán)境系統(tǒng)數據、安全系統(tǒng)數據、數據庫系統(tǒng)數據、編目系統(tǒng)數據等技術、業(yè)務系統(tǒng)數據進行采集并在模型中實時展現。實現機房可用性動態(tài)統(tǒng)計,包括空間可用性、用電量分布、溫濕度分布、網絡流量等情況統(tǒng)計。
1.2 線纜分布和走向可視化管理
對機房所有可監(jiān)測、可理線的線纜進行1:1真實坐標系三維仿真建模,包括光纖、網線、電纜、控制線、音視頻信號線等,可以按照機房網絡電力管線等方式進行圖層的分類管理,使隱蔽的管線可視化。支持網絡連接、電力連接等在機房場景中的快速定位和屬性顯示,設備或線纜報警時,相應線纜在機房場景中高亮標紅顯示,并顯示相應圖標信息。
1.3 運行狀態(tài)可視化監(jiān)控與管理
根據設備的實際物理連接,對機房的溫濕度信息、電力監(jiān)控數據、網絡監(jiān)管信息、服務器監(jiān)管信息進行匯總、校對、處理, 以機房三維模型為基礎,可以對機房采集到的環(huán)境監(jiān)控信息、網絡監(jiān)管信息、網絡安全信息進行綜合監(jiān)控、管理和告警,并結合動態(tài)數據圖標、統(tǒng)計圖表和報警信息進行機房的可視化管理。機房三維模型具有機房漫游、視點管理、設備部署、標注管理、動態(tài)圖表、報警聯動等功能。
1.4 系統(tǒng)管理
系統(tǒng)應具有各類系統(tǒng)管理功能,主要包括用戶管理、設備管理、聯動管理、權限管理、日志管理等。
2.1 系統(tǒng)總體結構設計
機房運行監(jiān)控與管理系統(tǒng)通過對機房及機房內所有設備的建模,基于虛實聯動三維仿真驅動引擎進行綜合集成,完成對機房內設備的三維可視化,配合獲取的機房溫濕度信息、電力監(jiān)控數據、網絡監(jiān)管信息、服務器監(jiān)管信息,完成對機房運行狀態(tài)的監(jiān)控和管理。系統(tǒng)總體結構如圖1所示。
系統(tǒng)平臺主要由四層架構組成:
接入層:接入層主要由共享同步數據庫、定制互聯接口等相關模塊組成,提供對于機房設備或各業(yè)務、技術系統(tǒng)的數據采集、控制和管理等功能;
支撐層:基于二級業(yè)務數據庫提取、篩選、整理的匯聚數據,通過適配性接入,實現對平臺應用提供基礎支撐;
管理層:管理層主要是系統(tǒng)功能的實現,主要包括設備及線纜管理、實時告警、聯動策略、三維仿真展現、智能集中監(jiān)管、統(tǒng)計分析等功能,為實現上述應用功能,系統(tǒng)還需提供數據處理引擎、規(guī)則引擎、系統(tǒng)管理等相關系統(tǒng)級功能;
圖1 機房運行監(jiān)控與管理系統(tǒng)總體結構
展現層:所有應用功能的實現均通過三維界面和智能人機交互管理控制臺進行查看、查詢、管理、控制等。展現層是管理者和系統(tǒng)進行交互的界面,具有友好、智能、簡潔、便捷等特點。
通過三維集成平臺的構建實現機房布局、報警點及有關設備三維空間全景顯示及漫游,集成機房設備管理、實時告警、信息展示等相關數據,構建聯動機制,實現數據相關區(qū)域的實景展示,實現實時監(jiān)控、報警處理等功能。在收到各系統(tǒng)報警信號時,可第一時間顯示報警區(qū)域空間信息,并將實時信息通過已有的短信平臺推送給相關責任人。
2.2 機房三維仿真
2.2.1 機房及設備建模
完成對機房及機房設備內的建模,所有模型的參數與真實設備相一致,基于統(tǒng)一坐標系(包括三維空間坐標、時間坐標、系統(tǒng)設備樹坐標等)實現整體系統(tǒng)的直觀管理,并且可進行三維部署和仿真展示,以進行事件處置和預警發(fā)布。
機房及機柜模型:根據機房CAD建筑圖、實景照片,進行機房1:1真實坐標系三維仿真建模。對所有設備機柜和電力機柜進行1:1真實坐標系三維仿真建模,包括100多個設備機柜和十多個電力列頭柜、配電柜。
機柜設備模型:對機房所有機柜設備進行1:1真實坐標系三維仿真建模,包括集中存儲設備、核心網絡、安全設備、核心數據庫設備、各業(yè)務系統(tǒng)的服務器等。
環(huán)境組態(tài)設備模型:對機房所有環(huán)境組態(tài)設備進行1:1真實坐標系三維仿真建模,包括精密空調、機房組態(tài)監(jiān)控設備等。
2.2.2 線纜分布和走向可視化管理
對機房所有可監(jiān)測、可理線的線纜進行1:1真實坐標系三維仿真建模,包括光纖、網線、電纜、控制線、音視頻信號線等??梢园凑諜C房網絡電力管線等方式進行圖層的分類管理,使隱蔽的管線可視化。支持網絡連接、電力連接等在機房場景中的快速定位和屬性顯示,可以實現設備及線纜的報警。
2.3 機房數據采集
2.3.1 網管系統(tǒng)數據采集
與現有的網絡管理系統(tǒng)數據建立協議接口,對機房路由器、交換機、交互設備參數進行監(jiān)控,采集數據包括告警數據、業(yè)務發(fā)放數據、性能數據、診斷測試數據等。
2.3.2 機房電力綜合管理數據采集
完成智能電表設備數據協議接口,實現實時電力參量數據、報警數據的接收、處理及展現。對機房的10多列機柜每列的A、B列頭柜各安裝1臺多路多功能智能數字電表,實時監(jiān)測每臺機柜的電力參數
建立電力監(jiān)控系統(tǒng)數據交換接口,采集機房電力設備數據。實時監(jiān)測機房的整體供電情況和每個機柜的精細供電情況,實時電力數據包括電流、電壓、功率因數、頻率等,并具備多層級耗電度數計量功能,包括每臺機柜耗電量度數。采集機房UPS、列頭柜、精密空調等設備的監(jiān)控信息,并對上述信息與系統(tǒng)進行集成。
2.3.3 服務器運行狀態(tài)監(jiān)控數據采集
完成服務器設備實時數據和報警數據的接收、處理及展現。對機房應用服務器、數據庫服務器、存儲服務器等設備運行狀態(tài)實時監(jiān)控,包括響應時間、連通率、CPU利用率、內存利用率、磁盤利用率、設備硬件狀態(tài)等。
2.3.4 機房環(huán)境監(jiān)控數據采集
對機房的環(huán)境監(jiān)控數據進行采集,建立機房環(huán)境資源信息及傳感器實時數據(溫濕度), 可以對機房溫濕度、冷通道、微環(huán)境數據進行實時推送。
2.3.5 技術、業(yè)務系統(tǒng)嵌入
完成與現有的網絡安全、存儲、數據庫等技術、業(yè)務系統(tǒng)的接口協議,實現系統(tǒng)的實時關聯調取。
圖2 機房運行監(jiān)控與管理架構圖
2.4 運行狀態(tài)可視化監(jiān)控及管理設計
系統(tǒng)以機房三維模型為基礎,結合動態(tài)數據圖標、統(tǒng)計圖表和報警信息進行機房的可視化管理。機房建模場景中具有機房漫游、視點管理、設備部署、標注管理、動態(tài)圖表、報警聯動等功能。在機房場景中應按設備的實際安裝位置顯示相應連接和相應參數,根據設備的實際物理連接,對機房的溫濕度信息、電力監(jiān)控數據、網絡監(jiān)管信息、服務器監(jiān)管信息進行匯總、處理。當系統(tǒng)接收到報警時,機房場景能自動定位報警點位置,并在場景用進行醒目標識,以提醒運維人員對報警事件關注和處理。系統(tǒng)具體架構如圖2所示。
2.5 系統(tǒng)的開發(fā)與實現
系統(tǒng)是在Windows操作系統(tǒng)下開發(fā)和實現,使用的工具和軟件見下表。
Java/JEE核心組件:
Web前端類組件:
服務器中間件 Tomcat 6數據庫 Oracle Jdk Jdk 6
機房運行監(jiān)控與管理系統(tǒng)應用于數據中心機房,對可視化數據中心機房設備的運行情況,進行運維數據采集、處理,實現報警聯動,很好地提高了運維人員的工作質量及工作效率,有效地減少了值班人員及巡檢人員的工作量。該系統(tǒng)在日常工作及重保期間發(fā)揮了重要作用。
[1]楊彬,張泉,韓悅文,吳輝.基于三維可視化技術的機房建模與數據展示 .湖北電力,2016(A01): 38-40.
[2]王志紅,基于三維可視化的機房建模和數據顯示.環(huán)球市場信息導報(理論),2014(11):154.
(作者單位:國家新聞出版廣電總局監(jiān)管中心)
TN94
A
1671-0134(2017)07-079-03
10.19483/j.cnki.11-4653/n.2017.07.025