張祖剛, 項 顥, 賈 琨, 張振國
(中國電子工程設(shè)計院有限公司,北京 100142)
信息化建設(shè)的規(guī)模不斷擴大,數(shù)據(jù)中心作為支撐信息化建設(shè)的組成部分,發(fā)揮著越來越大的作用。越來越多的企業(yè)開始建設(shè)自己的數(shù)據(jù)中心以支撐其業(yè)務(wù)的持續(xù)發(fā)展。隨著數(shù)據(jù)中心規(guī)模擴大,設(shè)備類型增多,需要關(guān)注的監(jiān)測指標也增多。作為業(yè)務(wù)系統(tǒng)的核心之一,基礎(chǔ)設(shè)施一旦出現(xiàn)故障,就會立刻影響IT系統(tǒng)的運行,對數(shù)據(jù)傳輸、存儲的可靠性、安全性構(gòu)成威脅。目前許多數(shù)據(jù)中心均引入智能運維平臺,對數(shù)據(jù)中心基礎(chǔ)設(shè)施進行統(tǒng)一運維管理,實現(xiàn)基礎(chǔ)設(shè)施的科學(xué)有效管理。
在數(shù)據(jù)中心智能運維平臺數(shù)據(jù)采集網(wǎng)關(guān)的設(shè)計過程中,不僅需要考慮與一般的工業(yè)網(wǎng)關(guān)設(shè)計的共通性,即數(shù)據(jù)接入的各種通信方式、數(shù)據(jù)采集與傳輸能力、遠程控制及報警功能、可配置功能等,還要考慮到數(shù)據(jù)中心運維平臺的安全性,是關(guān)系到運維對數(shù)據(jù)中心監(jiān)控數(shù)據(jù)采集和故障預(yù)測的實時性、準確性和可靠性的關(guān)鍵點,在數(shù)據(jù)采集網(wǎng)關(guān)設(shè)計中,更加需要注重數(shù)據(jù)的安全防護,做到內(nèi)外網(wǎng)安全隔離,在網(wǎng)關(guān)中增加數(shù)據(jù)加密及安全通信芯片。本文針對開發(fā)的數(shù)據(jù)中心智能運維平臺,設(shè)計了與之配套的數(shù)據(jù)采集網(wǎng)關(guān),實現(xiàn)運維平臺與基礎(chǔ)設(shè)施之間的數(shù)據(jù)采集與傳輸,為智能運維平臺提供了硬件支持和數(shù)據(jù)支撐。
數(shù)據(jù)采集網(wǎng)關(guān)是智能運維平臺服務(wù)器與數(shù)據(jù)中心基礎(chǔ)設(shè)施之間的橋梁,為智能運維平臺完成基礎(chǔ)設(shè)施數(shù)據(jù)的采集和接收,并經(jīng)過解析、重組、加密等處理,將采集到的原始數(shù)據(jù),處理成智能運維平臺規(guī)定的數(shù)據(jù)格式,再傳輸給智能運維平臺服務(wù)器,為智能運維平臺提供數(shù)據(jù)源。其在智能運維應(yīng)用系統(tǒng)中的位置如圖1所示。
圖1 數(shù)據(jù)中心智能運維應(yīng)用系統(tǒng)
數(shù)據(jù)采集網(wǎng)關(guān)由設(shè)備硬件和嵌入式軟件系統(tǒng)組成,是設(shè)備接入及組網(wǎng)、第三方系統(tǒng)集成、執(zhí)行控制命令并與運維平臺服務(wù)器進行雙向通信的硬件設(shè)備。主要功能包括:(1)數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備數(shù)據(jù)接入及組網(wǎng)功能。(2)數(shù)據(jù)通信功能。通過設(shè)備驅(qū)動庫,實現(xiàn)數(shù)據(jù)中心基礎(chǔ)設(shè)施的數(shù)據(jù)采集,驅(qū)動庫內(nèi)置主流的數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備驅(qū)動,與上層智能運維平臺雙向通信,上傳數(shù)據(jù)和下發(fā)命令。(3)數(shù)據(jù)建模和數(shù)據(jù)挖掘支持。為數(shù)據(jù)中心智能運維平臺及應(yīng)用終端的數(shù)據(jù)建模、數(shù)據(jù)挖掘提供基礎(chǔ)信息支持。(4)設(shè)備仿真模擬功能??蛇M行數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備的運行仿真和工作狀態(tài)模擬,用于數(shù)據(jù)中心智能運維平臺及應(yīng)用終端的演示和演練,在仿真模擬時,屏蔽對現(xiàn)場基礎(chǔ)設(shè)施設(shè)備的控制。(5)遠程支持功能??蛇h程配置和維護數(shù)據(jù)采集網(wǎng)關(guān)參數(shù),以及嵌入式軟件的升級和更新。
數(shù)據(jù)采集網(wǎng)關(guān)硬件由中央處理器(CPU)、以太網(wǎng)端口模塊、RS485通信模塊、數(shù)據(jù)存儲模塊、視頻接口模塊、音頻接口模塊、電源模塊、狀態(tài)指示模塊、數(shù)據(jù)加密芯片、安全通信芯片等組成,硬件示意框架如圖2所示。
圖2 數(shù)據(jù)采集網(wǎng)關(guān)硬件框架
數(shù)據(jù)采集網(wǎng)關(guān),通過RS485、RS232、RJ45等通信端口采集各種類型(包括標準通信協(xié)議或私有通信協(xié)議)的數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備相關(guān)數(shù)據(jù),通過音頻、視頻接口采集音頻、視頻信號,完成采集和接收外部設(shè)備數(shù)據(jù),并經(jīng)過數(shù)據(jù)解析、轉(zhuǎn)換、加密等處理,將采集到的數(shù)據(jù)處理成運維平臺規(guī)定的數(shù)據(jù)格式,實現(xiàn)數(shù)據(jù)采集網(wǎng)關(guān)對數(shù)據(jù)中心基礎(chǔ)設(shè)施相關(guān)數(shù)據(jù)信息的采集。通過網(wǎng)絡(luò)與數(shù)據(jù)中心智能運維平臺連接,實現(xiàn)數(shù)據(jù)中心智能運維數(shù)據(jù)采集網(wǎng)關(guān)與智能運維平臺的通信。
數(shù)據(jù)中心智能運維平臺數(shù)據(jù)采集網(wǎng)關(guān)的嵌入式軟件由ARM OS、開源軟件體系框架、智能運維數(shù)據(jù)處理單元等三部分組成。系統(tǒng)結(jié)構(gòu)如圖3所示。
圖3 嵌入式軟件系統(tǒng)結(jié)構(gòu)
(1)ARM OS:支持ARM的嵌入式操作系統(tǒng)。
(2)開源軟件體系框架移植到嵌入式操作系統(tǒng)下,根據(jù)數(shù)據(jù)采集網(wǎng)關(guān)板卡接口,開發(fā)對應(yīng)的驅(qū)動控制方法。其中組件分為三層:1)初始化組件,完成數(shù)據(jù)采集網(wǎng)關(guān)開機自檢、全局配置等功能,自檢功能主要包括:各個接口的檢測,如ETHERNETRS2324G5G,電源的自檢等;2)基礎(chǔ)組件層,完成以太網(wǎng)口、串口等輸入輸出端口的數(shù)據(jù)雙向傳輸控制,以及與數(shù)據(jù)處理單元模塊的通信控制;3)功能組件層,完成數(shù)據(jù)采集網(wǎng)關(guān)側(cè)的業(yè)務(wù)功能。
(3)智能運維數(shù)據(jù)處理單元,為平臺服務(wù)器及應(yīng)用層提供數(shù)據(jù)來源,屏蔽數(shù)據(jù)中心基礎(chǔ)設(shè)施數(shù)據(jù)采集細節(jié)。從功能上可劃分為數(shù)據(jù)接收、數(shù)據(jù)解析、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)加密、數(shù)據(jù)發(fā)送等幾大功能模塊。其中數(shù)據(jù)接收模塊提供數(shù)據(jù)采集和驅(qū)動等處理;數(shù)據(jù)解析模塊提供對接收到的數(shù)據(jù)信息進行解析處理;數(shù)據(jù)轉(zhuǎn)換模塊提供將數(shù)據(jù)信息轉(zhuǎn)換成運維平臺規(guī)定的數(shù)據(jù)格式;數(shù)據(jù)加密模塊提供對數(shù)據(jù)的加密處理;數(shù)據(jù)發(fā)送模塊提供將數(shù)據(jù)發(fā)送給平臺服務(wù)器或應(yīng)用終端的處理。另外智能運維數(shù)據(jù)處理單元還提供多種通信接口、數(shù)據(jù)接口及傳輸能力的支持。數(shù)據(jù)處理單元系統(tǒng)結(jié)構(gòu)如圖4所示。
圖4 數(shù)據(jù)處理單元系統(tǒng)結(jié)構(gòu)
驅(qū)動管理,通過加載開發(fā)的設(shè)備驅(qū)動,實現(xiàn)數(shù)據(jù)中心基礎(chǔ)設(shè)施各種設(shè)備數(shù)據(jù)格式的處理;設(shè)備接入,根據(jù)數(shù)據(jù)采集類型,數(shù)據(jù)處理單元支持多種類型設(shè)備的接入,包括主動上報類設(shè)備、輪詢類設(shè)備和網(wǎng)管類設(shè)備等;數(shù)據(jù)緩存,在因異常導(dǎo)致數(shù)據(jù)轉(zhuǎn)發(fā)失敗后,緩存解析后的數(shù)據(jù),并根據(jù)后續(xù)需求進行處理;日志系統(tǒng),數(shù)據(jù)處理單元記錄包括運行日志、調(diào)試日志、故障日志等三類。