[摘 要] 在IT數(shù)據(jù)中心24小時不間斷運(yùn)行工作模式的要求下,IT數(shù)據(jù)中心運(yùn)維的重要性就更加突出。本文主要對數(shù)據(jù)中心在實(shí)際運(yùn)維中容易被忽視,而又不可或缺的內(nèi)容加以闡述,為打造國際先進(jìn)水平的數(shù)據(jù)中心提供參考。
[關(guān)鍵詞] 數(shù)據(jù)中心;IT設(shè)備運(yùn)維;動力環(huán)境運(yùn)維
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 03. 026
[中圖分類號] F270.7;TP307 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2014)03- 0054- 02
0 引 言
近年來,隨著信息化技術(shù)的不斷發(fā)展,信息化應(yīng)用的領(lǐng)域已經(jīng)遍布各行各業(yè)。中國石油把加快信息化建設(shè)作為提高生產(chǎn)經(jīng)營水平、提高決策質(zhì)量與效率的重要手段,建設(shè)了大批重要的信息系統(tǒng),進(jìn)而建設(shè)了大規(guī)模的企業(yè)數(shù)據(jù)中心。吉林石化公司數(shù)據(jù)中心承擔(dān)著包括中國石油ERP和加油站等系統(tǒng)在內(nèi)的核心業(yè)務(wù)和管理信息系統(tǒng)運(yùn)行中心的職能。大型IT數(shù)據(jù)中心管理及維護(hù)的質(zhì)量與效果,對信息化建設(shè)水平具有決定性作用。
數(shù)據(jù)中心運(yùn)維工作主要分為IT設(shè)備運(yùn)維和動力環(huán)境運(yùn)維,二者相輔相成,互為支撐。IT設(shè)備運(yùn)維體現(xiàn)數(shù)據(jù)中心工作重心和業(yè)務(wù)方向;動力環(huán)境運(yùn)維承載數(shù)據(jù)中心綠色、安全理念,同時也是IT設(shè)備運(yùn)維的基礎(chǔ)保障。
1 IT設(shè)備運(yùn)維
除了包含網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、存儲設(shè)備等數(shù)據(jù)設(shè)備的配置、維護(hù)及管理之外,為滿足大型IT數(shù)據(jù)中心安全運(yùn)行的需要,綜合的數(shù)據(jù)中心IT設(shè)備運(yùn)維還應(yīng)包括以下工作。
1.1 完善的綜合布線出圖、歸檔制度
建立完善的綜合布線出圖、歸檔制度是數(shù)據(jù)中心IT運(yùn)維的重中之重,沒有完備的綜合布線圖,機(jī)房IT設(shè)備的運(yùn)維就如同大海撈針,數(shù)以千計(jì)的各類總線、跳線在數(shù)據(jù)機(jī)房內(nèi)起著設(shè)備“輸血管”的作用,沒有圖示說明,運(yùn)維人員很難從中確定目標(biāo)。目前,有些數(shù)據(jù)中心在機(jī)房建設(shè)初期已經(jīng)把綜合布線工作完成,有利也有弊。利在于后續(xù)施工簡單、綜合布線圖容易制作保存;弊在于綜合布線針對性差、浪費(fèi)極大,綜合布線初期投資過大,而且很難保證后續(xù)設(shè)備運(yùn)行時不涉及二次施工,一旦發(fā)生綜合布線的二次施工,原有綜合布線圖也同樣需要校準(zhǔn)更改。
1.2 規(guī)范的綜合布線標(biāo)簽和機(jī)柜編號制度
建立規(guī)范的綜合布線標(biāo)簽是對綜合布線圖的細(xì)化,也是綜合布線系統(tǒng)的身份認(rèn)證系統(tǒng),雜亂的布線從此有據(jù)可依。制定適合自身需求的標(biāo)簽規(guī)范,并要求綜合布線施工人員及本體運(yùn)維人員依據(jù)規(guī)范嚴(yán)格執(zhí)行標(biāo)簽的張貼制度,可以使運(yùn)維人員在后續(xù)的IT設(shè)備運(yùn)維工作中不再以大海撈針的方式查找,而是可以直接將精確度提高到端點(diǎn)級。規(guī)范的機(jī)柜標(biāo)號不但可以將機(jī)柜與強(qiáng)電列頭柜內(nèi)控制斷路器一一對應(yīng),還有利于數(shù)據(jù)設(shè)備的遷入遷出操作,方便運(yùn)維人員日常操作及匯報說明。
1.3 完善的IT數(shù)據(jù)中心機(jī)房平面圖制度
詳盡的機(jī)房平面圖可以清晰展現(xiàn)機(jī)房內(nèi)部設(shè)備擺放、強(qiáng)弱電走向、冷熱通道區(qū)分、制冷設(shè)備分布、機(jī)房總面積等信息,有利于對機(jī)房內(nèi)數(shù)據(jù)機(jī)柜編號查找,定位設(shè)備位置,對新設(shè)備的遷入也可做到一目了然。機(jī)房平面圖的完整對數(shù)據(jù)中心內(nèi)部運(yùn)維及對外展示都有極大好處。
1.4 完善的設(shè)備遷入遷出登記制度
信息化項(xiàng)目建設(shè)往往不是一蹴而就的,而是經(jīng)過反復(fù)的設(shè)備投入、試運(yùn)行、更換、返修、遷入、遷出等工作才保持信息化項(xiàng)目運(yùn)行的相對平衡穩(wěn)定。對遷入遷出機(jī)房的IT設(shè)備實(shí)行嚴(yán)格的登記制度,更有利于數(shù)據(jù)中心管理者及運(yùn)維人員掌控機(jī)房內(nèi)信息化項(xiàng)目運(yùn)作狀態(tài)、設(shè)備運(yùn)行狀態(tài)以及了解IT建設(shè)與運(yùn)行需求,從而調(diào)整數(shù)據(jù)中心相應(yīng)輔助設(shè)施的運(yùn)行狀態(tài)。
1.5 可靠的監(jiān)控及巡檢制度
數(shù)據(jù)中心的運(yùn)行要求是24小時不間斷的,IT設(shè)備的不間斷運(yùn)行才能保證信息化項(xiàng)目的不間斷運(yùn)轉(zhuǎn),才能保證相對應(yīng)的服務(wù)內(nèi)容的連續(xù)性??煽康谋O(jiān)控及巡檢制度是保證IT設(shè)備運(yùn)行安全的最有效手段。經(jīng)驗(yàn)表明,80%以上的隱患是在監(jiān)控及巡檢過程中發(fā)現(xiàn)并處理的,同樣,80%的故障發(fā)生是由于日常的監(jiān)控及巡檢不力而使隱患未被發(fā)現(xiàn),才導(dǎo)致最終釀成事故的。
2 數(shù)據(jù)中心動力環(huán)境運(yùn)維
IT設(shè)備是整個數(shù)據(jù)中心的業(yè)務(wù)構(gòu)成,動力環(huán)境設(shè)備是這些業(yè)務(wù)的支撐。配電系統(tǒng)是數(shù)據(jù)中心的心臟,而空調(diào)系統(tǒng)、UPS系統(tǒng)也絕對可稱為數(shù)據(jù)中心的脊梁。對IT數(shù)據(jù)中心動力環(huán)境系統(tǒng)的維護(hù)更是絲毫不得懈怠。實(shí)踐證明,一個成功運(yùn)行的數(shù)據(jù)中心,其在動力環(huán)境方面投入的管理和運(yùn)維力量相對機(jī)房內(nèi)的數(shù)據(jù)設(shè)備的投入是相當(dāng)重視、完備的。只有這樣,這個數(shù)據(jù)中心才是可靠的,也才有安全、綠色可言。
2.1 建設(shè)冗余量充足的綜合性數(shù)據(jù)中心
數(shù)據(jù)中心在建設(shè)初期就應(yīng)該設(shè)計(jì)并建設(shè)一個電力、空調(diào)、備用設(shè)備冗余量充足的動力環(huán)境系統(tǒng),高可靠性的保障絕不是空泛之談,沒有高冗余、高可靠性的保證,數(shù)據(jù)中心的運(yùn)行如同站在懸崖邊,根本沒有安全性,這樣的數(shù)據(jù)中心只能算作是一個運(yùn)行安全性極低的機(jī)房,這與安全、穩(wěn)定、綠色、環(huán)保的數(shù)據(jù)中心建設(shè)及運(yùn)行宗旨是相違背的。對于高冗余的投入也絕對不是白白浪費(fèi)資金。將冗余設(shè)備、后備設(shè)備做到可用、可靠,這樣的數(shù)據(jù)中心才是安全的、可靠的。
2.2 完善的動力環(huán)境設(shè)備維修保養(yǎng)制度
動力環(huán)境設(shè)備是數(shù)據(jù)中心最基本的保障設(shè)施,也是IT設(shè)備穩(wěn)定運(yùn)行的可靠保障。一個安全、穩(wěn)定、綠色、環(huán)保的數(shù)據(jù)中心的管理者及運(yùn)維人員不應(yīng)該在設(shè)備的保養(yǎng)及維修上吝嗇,可靠完善的維修保養(yǎng)制度的制定和執(zhí)行,可以對保障數(shù)據(jù)中心運(yùn)行安全性起到至關(guān)重要的作用。無論是動力方面還是環(huán)境方面,哪一個設(shè)備的故障都將引起連鎖反應(yīng),處理不當(dāng)最終將導(dǎo)致IT設(shè)備的癱瘓宕機(jī),后果不堪設(shè)想,建立完善的維修保養(yǎng)制度,邀請專業(yè)技術(shù)人員參加維修保養(yǎng)工作是避免設(shè)備出現(xiàn)不良后果的最直接有效的保證措施。
2.3 完善的環(huán)境設(shè)備監(jiān)控、巡檢制度
對動力環(huán)境設(shè)備的巡檢與IT設(shè)備監(jiān)控、巡檢同樣重要,而且對動力環(huán)境設(shè)備的巡檢更直觀更具體。實(shí)行實(shí)時監(jiān)控與專業(yè)人員現(xiàn)場定時及不定時巡檢并舉的制度,為設(shè)備安全運(yùn)行提供最有力的保障。同時加強(qiáng)巡檢記錄的規(guī)范填寫記錄也是判定設(shè)備故障方向及原因的有效手段。
2.4 建立PUE值監(jiān)控記錄制度
綠色數(shù)據(jù)中心最重要的指標(biāo)就是PUE(Power Usage Effectiveness)指標(biāo),即數(shù)據(jù)中心總耗電量與IT設(shè)備耗電量的比值。無論數(shù)據(jù)中心的規(guī)模大小,PUE值都可以直觀地反映出數(shù)據(jù)中心運(yùn)行用電分配的合理性及能耗情況。IT數(shù)據(jù)中心運(yùn)行的耗電量之大,是行業(yè)以外人員不可想象的。一個容量為400個標(biāo)準(zhǔn)機(jī)柜規(guī)模的數(shù)據(jù)中心,其年用電繳費(fèi)就可以達(dá)到1 000萬元。因此,數(shù)據(jù)中心能耗狀況是業(yè)內(nèi)最重視的內(nèi)容之一,PUE值正是數(shù)據(jù)中心能耗情況的最直接的反映。目前,國內(nèi)的數(shù)據(jù)中心PUE值普遍在1.6~2.2之間,而國際上最先進(jìn)的數(shù)據(jù)中心的PUE值已經(jīng)接近1。建立PUE值監(jiān)控記錄制度,可以做好本數(shù)據(jù)中心的能耗管理,也可作為與其他數(shù)據(jù)中心的橫向比較值。這樣既可以使數(shù)據(jù)中心管理者重視應(yīng)用新技術(shù)、降低能耗,同時也可以使其掌握數(shù)據(jù)中心運(yùn)維人員工作狀態(tài)及設(shè)備的運(yùn)行情況。
2.5 嚴(yán)格機(jī)房人員進(jìn)出登記制度
數(shù)據(jù)機(jī)房內(nèi),信息化項(xiàng)目往往并不單一,每一個項(xiàng)目都會有自己的項(xiàng)目運(yùn)維人員、設(shè)備廠商人員等各種業(yè)務(wù)及技術(shù)人員,這些人都需要在機(jī)房內(nèi)出入。這就對數(shù)據(jù)中心機(jī)房管理造成了很多困難,因此對需要進(jìn)出機(jī)房的人員進(jìn)行登記許可制及進(jìn)行必要的安全、保密、內(nèi)部規(guī)定的培訓(xùn)就顯得格外重要。每一個數(shù)據(jù)中心都應(yīng)嚴(yán)格執(zhí)行機(jī)房人員進(jìn)出登記制度,以加強(qiáng)機(jī)房管理,保障機(jī)房內(nèi)各種設(shè)備設(shè)施的運(yùn)行安全。
2.6 細(xì)致的機(jī)房環(huán)境衛(wèi)生管理?xiàng)l例
機(jī)房衛(wèi)生往往是被管理者和運(yùn)維人員忽略的部分,而機(jī)房衛(wèi)生狀況不僅僅會對機(jī)房內(nèi)的數(shù)據(jù)設(shè)備運(yùn)行構(gòu)成威脅,還會對空調(diào)系統(tǒng)、加濕系統(tǒng)產(chǎn)生不良影響。機(jī)房環(huán)境相對封閉,衛(wèi)生條件惡劣,也會對在其中工作的運(yùn)維人員的身心健康造成損害。另外,整潔的機(jī)房環(huán)境也助于數(shù)據(jù)中心樹立良好的形象。
在IT數(shù)據(jù)中心的運(yùn)維中,除重視高端技術(shù)人才的引進(jìn)外,更應(yīng)依靠普通工程技術(shù)人員的日常運(yùn)維和巡檢工作,因此更應(yīng)該重視普通工程技術(shù)人員技術(shù)能力及工作責(zé)任心的培養(yǎng)強(qiáng)化。更重要的是在日常運(yùn)維中消除不安全隱患及故障苗頭,而不是在發(fā)生安全事故后再由高端技術(shù)專家與人才去處理解決。
其他如確定數(shù)據(jù)中心管理組織結(jié)構(gòu)、確定工作任務(wù)分工、建立健全數(shù)據(jù)中心各類應(yīng)急預(yù)案、制訂應(yīng)急演練計(jì)劃、建立設(shè)備操作指導(dǎo)說明、規(guī)范監(jiān)控及操作范圍值等基礎(chǔ)性工作也是IT數(shù)據(jù)中心運(yùn)維工作中的重點(diǎn)工作,但這些已經(jīng)普遍引起數(shù)據(jù)中心相關(guān)管理及運(yùn)維工作人員的足夠重視,故不贅述。
3 結(jié)束語
數(shù)據(jù)中心是一個綜合性極強(qiáng)的生產(chǎn)運(yùn)維系統(tǒng),在信息化時代大潮的影響下,其責(zé)任之重,維護(hù)任務(wù)之重是其他生產(chǎn)單位所不及的,其運(yùn)維工作涵蓋了網(wǎng)絡(luò)、數(shù)據(jù)設(shè)備、電力系統(tǒng)、制冷系統(tǒng)、監(jiān)控系統(tǒng)等多個領(lǐng)域的內(nèi)容。不間斷運(yùn)行的工作方式?jīng)Q定了其系統(tǒng)內(nèi)各個子系統(tǒng)的連鎖性極強(qiáng)。在實(shí)際的運(yùn)維管理中,通過上述管理細(xì)節(jié)的具體實(shí)施,抓住全面,堅(jiān)持吉林石化數(shù)據(jù)中心安全、穩(wěn)定、綠色、環(huán)保的運(yùn)營理念。今后將通過不斷完善運(yùn)維內(nèi)容,使其符合ISO 20000(技術(shù)服務(wù)管理標(biāo)準(zhǔn))及ISO 27001(信息安全管理標(biāo)準(zhǔn))的基本要求,使數(shù)據(jù)中心的運(yùn)維工作真正達(dá)到國際水平。
主要參考文獻(xiàn)
[1]蔡維克.淺談信息中心基礎(chǔ)設(shè)施運(yùn)維管理系統(tǒng)(CDIM)[C]//2011年現(xiàn)代數(shù)據(jù)中心基礎(chǔ)設(shè)施建設(shè)技術(shù)年會論文集,2011.
[2]任義麗,王賢,朱建力,等.中國石油數(shù)據(jù)中心(勘探院)ITIL落地探索與實(shí)踐[J].信息系統(tǒng)工程,2011(11).
[3]柴群.工作站機(jī)房綠色運(yùn)維探討[J].中國信息界,2011(7).
[4]王慶霞.淺談IT運(yùn)維管理的應(yīng)用與實(shí)踐[J].信息安全與技術(shù),2012(11).