李明江(中國(guó)移動(dòng)國(guó)際信息港建設(shè)中心,北京 102206)
DCIM系統(tǒng)在數(shù)據(jù)中心部署中存在的問題探討
李明江
(中國(guó)移動(dòng)國(guó)際信息港建設(shè)中心,北京 102206)
探討了目前大型數(shù)據(jù)中心在部署DCIM過程中遇到的問題,結(jié)合運(yùn)維管理的需求和運(yùn)維經(jīng)驗(yàn)提出對(duì)DCIM部署的一些建議。指出DCIM在國(guó)內(nèi)數(shù)據(jù)中心行業(yè)的應(yīng)用尚處于起步階段,但隨著數(shù)據(jù)中心運(yùn)維管理人員對(duì)降低能耗和提高運(yùn)營(yíng)效率的關(guān)注度不斷提高,必將推動(dòng)DCIM在數(shù)據(jù)中心的發(fā)展。
數(shù)據(jù)中心;DCIM;運(yùn)維管理;用戶需求
李明江(1978-),男,工程師,從事數(shù)據(jù)中心基礎(chǔ)設(shè)施運(yùn)維管理、節(jié)能技術(shù)應(yīng)用方面的工作。
數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(Data Center Infrastructure Management,DCIM)結(jié)合信息技術(shù)和設(shè)備管理,對(duì)數(shù)據(jù)中心關(guān)鍵設(shè)備進(jìn)行集中監(jiān)控、容量規(guī)劃等集中管理。通過軟件、硬件和傳感器等,DCIM提供一個(gè)獨(dú)立的管理平臺(tái),對(duì)數(shù)據(jù)中心IT設(shè)備和基礎(chǔ)設(shè)施進(jìn)行實(shí)時(shí)監(jiān)控和管理。DCIM是數(shù)據(jù)中心運(yùn)維管理方面的一個(gè)較新應(yīng)用,隨著近期國(guó)內(nèi)數(shù)據(jù)中心建設(shè)的高速發(fā)展,DCIM理念在數(shù)據(jù)中心行業(yè)得到廣泛認(rèn)可。
本文結(jié)合DCIM在實(shí)際部署中遇到的問題,從運(yùn)維管理角度探討對(duì)DCIM的認(rèn)識(shí)和了解,并提出一些解決問題的建議。
目前,國(guó)際主流DCIM供應(yīng)商在國(guó)外數(shù)據(jù)中心行業(yè)取得了較好的業(yè)績(jī)。近年來隨著國(guó)內(nèi)數(shù)據(jù)中心建設(shè)的高速增長(zhǎng),國(guó)外廠商紛紛進(jìn)入國(guó)內(nèi)數(shù)據(jù)中心市場(chǎng),與國(guó)內(nèi)廠商進(jìn)行市場(chǎng)角逐。國(guó)內(nèi)外DCIM廠商對(duì)DCIM的理解主要存在以下差異。
1.1 對(duì)DCIM概念的理解
國(guó)際主流廠商認(rèn)為DCIM是橫跨傳統(tǒng)不間斷電源(Uninterruptible Power Supply,UPS)、空調(diào)等關(guān)鍵基礎(chǔ)架構(gòu)管理及IT設(shè)施管理的綜合管理平臺(tái),實(shí)現(xiàn)對(duì)數(shù)據(jù)中心的資產(chǎn)和資源管理及關(guān)鍵基礎(chǔ)設(shè)施與IT設(shè)施運(yùn)營(yíng)的緊密結(jié)合?;A(chǔ)設(shè)施涵蓋數(shù)據(jù)中心配電、制冷等關(guān)鍵基礎(chǔ)設(shè)施及服務(wù)器等IT設(shè)施,并包括綜合布線、空間資源等管理。
國(guó)內(nèi)DCIM廠商通常認(rèn)為基礎(chǔ)設(shè)施是指電源和空調(diào)等關(guān)鍵基礎(chǔ)設(shè)施,多不涉及IT設(shè)施的管理,因此其提供的DCIM產(chǎn)品功能也多不包括IT設(shè)施的管理。
1.2 功能定位
DCIM主要目的是通過統(tǒng)一平臺(tái)實(shí)時(shí)收集資產(chǎn)信息、資源使用情況及各個(gè)組件的運(yùn)行狀態(tài),對(duì)這些信息進(jìn)行分類、聚合和分析,并加以應(yīng)用,從而提升數(shù)據(jù)中心運(yùn)營(yíng)管理的效率和水平。DCIM的價(jià)值不僅在于設(shè)備動(dòng)態(tài)維護(hù),同時(shí)包括設(shè)備的靜態(tài)資產(chǎn)管理、機(jī)房資源管理和設(shè)備連接管理,并涵蓋系統(tǒng)影響分析及設(shè)備管理、變更規(guī)劃管理和運(yùn)營(yíng)流程管理范疇。
目前,國(guó)內(nèi)市場(chǎng)上的DCIM仍以傳統(tǒng)動(dòng)環(huán)監(jiān)控功能(監(jiān)控和報(bào)表)為主,在數(shù)據(jù)中心的資產(chǎn)管理和資源管理等方面,與國(guó)際成熟產(chǎn)品還存在較大的差距。
近年來,DCIM在國(guó)內(nèi)數(shù)據(jù)中心行業(yè)的認(rèn)可度和關(guān)注度得到穩(wěn)步提升,但目前仍缺乏大型數(shù)據(jù)中心成功部署的案例,一些在中、小型數(shù)據(jù)中心取得良好業(yè)績(jī)的廠商在實(shí)施大型數(shù)據(jù)中心DCIM時(shí)卻遇到很多困難。
2.1 系統(tǒng)組網(wǎng)結(jié)構(gòu)
DCIM產(chǎn)品的網(wǎng)絡(luò)結(jié)構(gòu)以三層居多,即數(shù)據(jù)采集層(對(duì)高低壓配電設(shè)備、柴油發(fā)電機(jī)組、冷水機(jī)組、冷卻塔、水泵、UPS、蓄電池、空調(diào)和智能電表等進(jìn)行數(shù)據(jù)采集)、聚合層(包括變配電子系統(tǒng)、動(dòng)環(huán)子系統(tǒng)、冷機(jī)群控子系統(tǒng)、樓控子系統(tǒng)等)、服務(wù)層(數(shù)據(jù)庫(kù)、存儲(chǔ)設(shè)備和呈現(xiàn)等)和顯示層(用戶界面、監(jiān)控大屏)。在數(shù)據(jù)采集層,通常采用Modbus協(xié)議或RS-485總線通過輪巡的方式對(duì)總線上的所有末端智能設(shè)備進(jìn)行數(shù)據(jù)采集,并將輪詢結(jié)果按照標(biāo)準(zhǔn)協(xié)議上報(bào)給數(shù)據(jù)庫(kù)。
對(duì)采集設(shè)備逐個(gè)輪巡需要一定的時(shí)間周期,在中、小型數(shù)據(jù)中心應(yīng)用效果良好的DCIM產(chǎn)品,在大型數(shù)據(jù)中心部署時(shí)如仍按在中、小數(shù)據(jù)中心部署實(shí)施的網(wǎng)絡(luò)架構(gòu)進(jìn)行設(shè)計(jì),會(huì)由于系統(tǒng)規(guī)模的增大、輪巡方式造成系統(tǒng)反應(yīng)遲鈍等問題而變得非常突出,甚至嚴(yán)重影響監(jiān)控的使用功能。因此,在部署大型DCIM系統(tǒng)時(shí),應(yīng)對(duì)網(wǎng)絡(luò)架構(gòu)及通信方式充分論證,并進(jìn)行嚴(yán)格的測(cè)試。
因此,設(shè)計(jì)和部署大型數(shù)據(jù)中心的DCIM時(shí)需要充分評(píng)估系統(tǒng)的規(guī)模,特別是數(shù)據(jù)采集周期。DCIM的網(wǎng)絡(luò)架構(gòu)一旦構(gòu)建完成,后期再做改動(dòng)困難極大,不僅需付出數(shù)倍時(shí)間,造成資金的浪費(fèi),甚至可能嚴(yán)重?fù)p害產(chǎn)品聲譽(yù)。
2.2 缺乏對(duì)用戶需求的了解
DCIM開發(fā)人員多數(shù)并不具備數(shù)據(jù)中心的運(yùn)維管理經(jīng)驗(yàn),對(duì)DCIM最終用戶的實(shí)際需求缺乏深入的了解,往往造成所開發(fā)的功能與用戶需求存在巨大差距,甚至完全脫節(jié)。一旦與需求脫節(jié)不僅影響項(xiàng)目如期交付,而且后期如要更改困難更大。
每個(gè)數(shù)據(jù)中心的管理模式、安全保障等級(jí)、承載業(yè)務(wù)類型和設(shè)備選型等都不相同,因此每個(gè)數(shù)據(jù)中心運(yùn)維管理部門對(duì)DCIM功能的需求、使用習(xí)慣等差異很大,每個(gè)DCIM產(chǎn)品都應(yīng)當(dāng)是個(gè)性化平臺(tái)。以蓄電池監(jiān)控功能為例,大型數(shù)據(jù)中心蓄電池?cái)?shù)量非常龐大,蓄電池性能的監(jiān)控依賴于DCIM系統(tǒng)提供的數(shù)據(jù),同時(shí)受限于每個(gè)數(shù)據(jù)中心供電系統(tǒng)架構(gòu)、蓄電池后備時(shí)間和產(chǎn)品選型等因素,DCIM系統(tǒng)中針對(duì)蓄電池的告警閾值、放電終止電壓、蓄電池采樣周期等要求也不同。DCIM開發(fā)人員如果對(duì)此類個(gè)性化維護(hù)需求了解不明確,往往造成開發(fā)的功能與使用需求脫節(jié),影響用戶的滿意度。
2.3 產(chǎn)品缺乏標(biāo)準(zhǔn)化、規(guī)范化
大型數(shù)據(jù)中心的基礎(chǔ)設(shè)施規(guī)模龐大,設(shè)備種類、品牌、型號(hào)多樣,且在建設(shè)變配電、制冷系統(tǒng)和樓宇自動(dòng)控制等系統(tǒng)時(shí),業(yè)主方往往會(huì)在采購(gòu)硬件設(shè)備時(shí)采購(gòu)相應(yīng)的軟件系統(tǒng),例如冷機(jī)群控系統(tǒng)、變配電系統(tǒng)、樓控系統(tǒng)等子系統(tǒng)(供應(yīng)商都是整個(gè)系統(tǒng)供應(yīng)的)。由于行業(yè)規(guī)范對(duì)各子系統(tǒng)的通信協(xié)議標(biāo)準(zhǔn)制約不夠,DCIM提供商需針對(duì)每個(gè)子系統(tǒng)專門開發(fā)接口,在DCIM部署過程中DCIM廠商也很難協(xié)調(diào)第三方子系統(tǒng)供應(yīng)商按照統(tǒng)一標(biāo)準(zhǔn)提供數(shù)據(jù)接口,造成DCIM實(shí)際連接困難。DCIM的建設(shè)除實(shí)現(xiàn)對(duì)硬件設(shè)備直接進(jìn)行數(shù)據(jù)采集外,還需對(duì)第三方軟件子系統(tǒng)進(jìn)行個(gè)性化集成。
數(shù)據(jù)中心基礎(chǔ)設(shè)施的差異性造成各DCIM系統(tǒng)的個(gè)性化,這是DCIM遲遲無法實(shí)現(xiàn)標(biāo)準(zhǔn)化的原因之一。由于缺乏統(tǒng)一標(biāo)準(zhǔn)和規(guī)范,數(shù)據(jù)中心在部署DCIM時(shí)需要解決以下幾方面問題。
(1)設(shè)備信息命名標(biāo)準(zhǔn)化:設(shè)備信息包括被監(jiān)控設(shè)備的開關(guān)量、模擬量、告警名稱等信息。需要對(duì)不同品牌、不同型號(hào)的同類設(shè)備和同類監(jiān)控信息的命名進(jìn)行規(guī)范和統(tǒng)一,以提高監(jiān)控識(shí)別率。
(2)告警分級(jí)標(biāo)準(zhǔn)化:按照數(shù)據(jù)中心業(yè)務(wù)重要性,應(yīng)對(duì)所有被監(jiān)控設(shè)備的告警進(jìn)行分級(jí),以便監(jiān)控人員及時(shí)發(fā)現(xiàn)問題。另外,蓄電池、環(huán)境溫/濕度等監(jiān)控信息還應(yīng)實(shí)現(xiàn)多級(jí)告警。
(3)采樣周期標(biāo)準(zhǔn)化:針對(duì)被監(jiān)控設(shè)備的特性對(duì)采集周期進(jìn)行分類,在系統(tǒng)建設(shè)初期應(yīng)充分評(píng)估擬采用的網(wǎng)絡(luò)架構(gòu)和預(yù)期的采樣周期和刷新頻率,明確各類設(shè)備的采樣周期,避免后期產(chǎn)生爭(zhēng)議。例如,蓄電池在正常浮充狀態(tài)下可適當(dāng)延長(zhǎng)采集周期,以顯著降低傳輸數(shù)據(jù)量,提高系統(tǒng)響應(yīng)速度;當(dāng)蓄電池處于放電階段時(shí)則觸發(fā)短延時(shí),確保放電過程準(zhǔn)確記錄。通過對(duì)設(shè)備分類和優(yōu)化數(shù)據(jù)采集頻率,可顯著降低數(shù)據(jù)采集量和存儲(chǔ)量。
(4)數(shù)據(jù)存儲(chǔ)機(jī)制標(biāo)準(zhǔn)化:大型數(shù)據(jù)中心DCIM系統(tǒng)采集的數(shù)據(jù)量非常龐大,缺乏良好的數(shù)據(jù)存儲(chǔ)機(jī)制不僅增加初期硬件投資,還會(huì)造成系統(tǒng)穩(wěn)定性下降。通過優(yōu)化存儲(chǔ)機(jī)制,可減少入庫(kù)數(shù)據(jù)量,對(duì)大型數(shù)據(jù)中心部署DCIM具有重要的意義。
(5)功能需求明確化:在DCIM部署前,與需求部門深入溝通數(shù)據(jù)容量管理、能耗管理和流程管理等功能需求,在部署中定期溝通開發(fā)情況,避免功能與需求脫節(jié),以減少開發(fā)成本和壓縮開發(fā)周期。
2.4 與ITIL理念的融合
將IT基礎(chǔ)架構(gòu)庫(kù)(IT Infrastructure Library,ITIL)的流程化管理理念融合到數(shù)據(jù)中心基礎(chǔ)設(shè)施的運(yùn)維管理中受到了行業(yè)的認(rèn)可,目前推出DCIM平臺(tái)的流程化運(yùn)維管理基本參考ITIL制定的。不同數(shù)據(jù)中心管理體系不同,造成流程需求的差異化,因此DCIM系統(tǒng)中的運(yùn)維流程應(yīng)具備靈活的配置和調(diào)整功能,以滿足不同客戶需求。
2.5 管理功能不完善
DCIM優(yōu)勢(shì)在于其管理功能,通過系統(tǒng)的容量管理、資產(chǎn)管理和空間管理等管理功能,幫助最終用戶提高數(shù)據(jù)中心的運(yùn)行效率。管理功能的實(shí)現(xiàn)需要很復(fù)雜的采集、統(tǒng)計(jì)和算法,因此DCIM作為數(shù)據(jù)中心行業(yè)的新技術(shù)、新應(yīng)用,參考的成功案例較少。目前,多數(shù)產(chǎn)品在管理功能方面還處于概念化層面,能幫助客戶提高數(shù)據(jù)中心運(yùn)行效率的功能還較少。
從國(guó)內(nèi)數(shù)據(jù)中心行業(yè)發(fā)展來看,金融、互聯(lián)及第三方數(shù)據(jù)中心對(duì)DCIM的需求迫切性相對(duì)較高,金融行業(yè)的IT管理成熟度最高,且要求提供的服務(wù)等級(jí)最高;互聯(lián)網(wǎng)和第三方數(shù)據(jù)中心發(fā)展速度快,對(duì)能源消耗及新技術(shù)關(guān)注度最高。傳統(tǒng)電信運(yùn)營(yíng)商經(jīng)過多年建設(shè)目前基本已建成較為成熟的動(dòng)環(huán)監(jiān)控系統(tǒng),從傳統(tǒng)動(dòng)環(huán)監(jiān)控改造到DCIM的成本壓力大,需求驅(qū)動(dòng)不足以及公司管理架構(gòu)都影響了DCIM的推廣和應(yīng)用。隨著目前三大運(yùn)營(yíng)商已啟動(dòng)的超大規(guī)模數(shù)據(jù)中心建設(shè)以及市場(chǎng)競(jìng)爭(zhēng)壓力的加大,運(yùn)營(yíng)管理人員正逐步提升對(duì)DCIM的關(guān)注。
隨著數(shù)據(jù)中心行業(yè)的發(fā)展,從降低運(yùn)營(yíng)成本及社會(huì)責(zé)任的考量,數(shù)據(jù)中心運(yùn)維管理人員對(duì)降低能耗和提高運(yùn)營(yíng)效率的關(guān)注度必將進(jìn)一步提高,這些都將成為DCIM發(fā)展的驅(qū)動(dòng)力。
本文結(jié)合實(shí)際工作經(jīng)驗(yàn),討論了DCIM部署中注意的問題,并提出了相應(yīng)的建議。雖然DCIM在國(guó)內(nèi)數(shù)據(jù)中心行業(yè)的應(yīng)用尚處于起步階段,且面臨著建設(shè)標(biāo)準(zhǔn)缺失、成功案例匱乏的困境,但數(shù)據(jù)中心行業(yè)建設(shè)的爆發(fā)性增長(zhǎng)和強(qiáng)勁的需求必將推動(dòng)DCIM在數(shù)據(jù)中心市場(chǎng)的蓬勃發(fā)展。
[1] 黃鍇.數(shù)據(jù)中心基礎(chǔ)設(shè)施管理DCIM綜述[J].智能建筑與城市信息,2012(192):39-42.
[2] 宗鏑.智能基礎(chǔ)設(shè)施管理系統(tǒng)在數(shù)據(jù)中心中的應(yīng)用功能[J].智能建筑與城市信息,2013(197):61-63.
[3] 連雄偉.數(shù)據(jù)中心基礎(chǔ)設(shè)施能效管理系統(tǒng)關(guān)鍵模塊設(shè)計(jì)與實(shí)現(xiàn)[D].北京:中國(guó)科學(xué)院大學(xué),2014.
Discussion about Problem s of DCIM System in Data Center Deploym ent
LIMingjiang
(Construction Center of International Information Port,China Mobile,Beijing 102206,China)
The problems encountered in the construction of DCIM for large-scale data centerwas discussed and the suggestions on the dep loyment of DCIM were put forward,based on the demands of data center and experience of operation and maintenancemanagement.It is pointed out that the application of DCIM in the domestic data center is still in early stages.As the operation and maintenance managers continuously enhance the attentions of energy-consuming reduction and operational efficiency improvement,the development of DCIM will be surely pushed in the data center.
data center;DCIM;operation and maintenancemanagement;user demand
TU 244.5
B
1674-8417(2015)09-0018-03
2015 09 07