呂 磊 / 新疆維吾爾自治區(qū)重要信息系統(tǒng)災難備份中心
試析數(shù)據(jù)中心運行管理
呂 磊 / 新疆維吾爾自治區(qū)重要信息系統(tǒng)災難備份中心
進入21世紀以來,我國加快了國民經(jīng)濟與社會信息化建設(shè)的步伐,將其作為提升政府執(zhí)政能力、改善民生、推動社會與經(jīng)濟發(fā)展的重要手段。數(shù)據(jù)中心作為信息化的重要基礎(chǔ)建設(shè),是信息處理的樞紐,是信息交流的總匯。
數(shù)據(jù)中心;運行;管理
隨著數(shù)據(jù)中心建設(shè)與應用在國內(nèi)的蓬勃發(fā)展,數(shù)據(jù)中心運維管理問題越來越得到業(yè)內(nèi)的廣泛重視。數(shù)據(jù)顯示,2012年中國數(shù)據(jù)中心運維市場規(guī)模達62億元,2013年中國數(shù)據(jù)中心運維市場規(guī)模達到77億元,增長率為24.2%;2014年中國數(shù)據(jù)中心運維市場規(guī)模達到94億元,增長率為22.1%;預計后續(xù)幾年,數(shù)據(jù)中心運維服務(wù)的年增長率持續(xù)在22%以上。由于用戶對數(shù)據(jù)中心運維管理服務(wù)于業(yè)務(wù)價值的進一步解析,運維管理服務(wù)在企業(yè)發(fā)展生命周期中得到了前所未有的高度重視。為做好數(shù)據(jù)中心的運維管理工作,探索并奠定科學先進的運維管理理論和技術(shù)基礎(chǔ),逐步建立完善高效、規(guī)范的數(shù)據(jù)中心運維管理制度體系,確保數(shù)據(jù)中心安全、可靠、持續(xù)與高效運行,為業(yè)務(wù)信息系統(tǒng)穩(wěn)定運行和信息資源綜合利用提供堅實的基礎(chǔ)支持,本文就數(shù)據(jù)中心運維管理的主要內(nèi)容進行了初步研究。
隨著互聯(lián)網(wǎng)基礎(chǔ)設(shè)施和技術(shù)的發(fā)展,特別是WEB技術(shù)的成熟和應用,應用軟件系統(tǒng)從文件/個人桌面體系結(jié)構(gòu)和客戶/服務(wù)器體系結(jié)構(gòu)發(fā)展為瀏覽器/服務(wù)器體系結(jié)構(gòu)。只要網(wǎng)絡(luò)具有足夠的帶寬,桌面用戶就可以從不需要安裝任何前段軟件情況下,通過瀏覽器調(diào)用存放在任何地理位置上的服務(wù)器中的應用軟件系統(tǒng),這就給應用服務(wù)器提供商(ASP)模式的出現(xiàn)奠定了技術(shù)基礎(chǔ)。
與此同時,互聯(lián)網(wǎng)時代的IT技術(shù)以前所未有的速度快速發(fā)展,使得最終用戶用于硬件設(shè)備、通信線路、操作軟件和人員培訓上的投資和成本不斷增加。各方開始尋求新的經(jīng)營模式以減輕IT一次性投資壓力,降低一次性投資風險及運營成本,建立自己的核心價值,這就使得ASP模式的出現(xiàn)和廣泛應用成為必然。在某種程度上,這種模式是由第二個發(fā)展時期----Web Hosting時期演化而來。但在主機托管模式中,用戶只是將Web頁面交由ISP服務(wù)商托管,而在ASP模式中,各經(jīng)濟組織則是將基于Web技術(shù)的應用交由ASP運營商托管,通常將這個時期稱為應用委托時期,這個時期,比較成熟的IDC模式正式出現(xiàn)。其中,1998年以主機托管為主營業(yè)務(wù)的美國Exodus通信公司的建立標志著IDC模式的正式出現(xiàn)。
而對于普通機構(gòu)來說,隨著信息化應用的不斷拓展和深入,對應用系統(tǒng)數(shù)據(jù)集中的要求也越來越高。目前,數(shù)據(jù)集中技術(shù)已完全成熟,它已經(jīng)成為應用系統(tǒng)必然的應用模式。伴隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)中心的內(nèi)涵也越發(fā)豐富。
新疆發(fā)展大數(shù)據(jù)產(chǎn)業(yè),具有很多優(yōu)勢。一是在國家“一帶一路”戰(zhàn)略中,新疆是絲綢之路經(jīng)濟帶核心區(qū),目前正在打造絲綢之路經(jīng)濟帶重要的區(qū)域交通樞紐中心、商貿(mào)物流中心、金融中心、文化科教中心、醫(yī)療服務(wù)中心,以及國家大型油氣生產(chǎn)加工和儲備基地、大型煤炭煤電煤化工基地、大型風電和光伏發(fā)電基地,國家能源、交通、通信等綜合大通道。這些產(chǎn)業(yè)都是數(shù)據(jù)密集產(chǎn)業(yè),同時也需要進行海量的數(shù)據(jù)交換,可以為大數(shù)據(jù)產(chǎn)業(yè)發(fā)展提供廣闊的馳聘空間。二是大數(shù)據(jù)服務(wù)器耗電量大,維護成本高,新疆的能源優(yōu)勢能夠為大數(shù)據(jù)企業(yè)提供廉價、穩(wěn)定的電力資源,降低企業(yè)運行成本。
在自治區(qū)第八次黨代會上,自治區(qū)黨委明確提出,“加快數(shù)據(jù)中心基地建設(shè),推進云計算產(chǎn)業(yè)發(fā)展,加快國際通信建設(shè),提高社會信息化水平,努力構(gòu)筑向西開放的國際通信和信息傳輸大通道”。
2011年新疆啟動“天山云計劃”,計劃在未來10年把新疆打造成我國乃至中西南亞的云計算數(shù)據(jù)之都。通過前期培育、產(chǎn)業(yè)集群發(fā)展、產(chǎn)業(yè)價值升值3個階段,在2020年建成烏魯木齊、克拉瑪依兩個云計算產(chǎn)業(yè)基地,兩大數(shù)據(jù)基地投資規(guī)模將不少于500億元,實現(xiàn)云服務(wù)產(chǎn)值100億元以上。
要確保數(shù)據(jù)中心安全、可靠、持續(xù)、低耗與高效地運行,必須做好運行管理工作。要做好運行管理工作,必須盡快建立高效、規(guī)范的運維體系。只有將規(guī)范和流程引入到混亂的運行環(huán)境中,讓每個運維技術(shù)人員一絲不茍地按規(guī)范做,讓經(jīng)常做的事情制度化,讓制度化的事情標準化,讓標準化的事情規(guī)范化,才能構(gòu)建完善規(guī)范的運維體系,提升運維管理水平。在建立健全運維體系的過程中,要不斷引入運行管理的新理念、新技術(shù)與新方法,實現(xiàn)節(jié)能、高效、簡化管理的目的,改善系統(tǒng)的運維質(zhì)量,保證數(shù)據(jù)中心安全穩(wěn)定運行。
1.管理的目標、任務(wù)和內(nèi)容。
運行管理的目標就是通過強化與規(guī)范運行管理工作,確保數(shù)據(jù)中心安全穩(wěn)定運行,為數(shù)據(jù)中心的IT關(guān)鍵設(shè)備運營管理和數(shù)據(jù)信息安全,提供可持續(xù)的有利保障;為實現(xiàn)信息資源存儲、保護和應用,以及核心運行提供高可用性、持續(xù)可靠的服務(wù)支撐。
數(shù)據(jù)中心進入使用階段后,主要任務(wù)就是對數(shù)據(jù)中心進行管理和維護,包括對基礎(chǔ)設(shè)施、業(yè)務(wù)系統(tǒng)、數(shù)據(jù)庫及業(yè)務(wù)系統(tǒng)運行狀態(tài)的監(jiān)視監(jiān)測,及時發(fā)現(xiàn)與處理問題;對應用系統(tǒng)的運行進行實時控制,記錄其運行狀態(tài),進行必要的修改與功能擴充,以便使應用系統(tǒng)真正符合管理決策的需要,為管理決策者服務(wù),是數(shù)據(jù)中心真正發(fā)揮作用。
高效的數(shù)據(jù)中心,如果管理不規(guī)范,缺乏科學地組織與管理,數(shù)據(jù)中心的作用就不能充分發(fā)揮,本身也會陷入混亂。管理是多方面的,即包括數(shù)據(jù)中心日常的規(guī)章制度及規(guī)章制度的執(zhí)行程度,還包括對數(shù)據(jù)中心中各系統(tǒng)運行的可靠管理。
(3)pH條件優(yōu)化。進行不同pH值條件下(pH值分別為2、3、4、5、6)的小試實驗,控制雙氧水加藥量均為1.5%,反應時間均為1.5 h進行實驗,反應完全后調(diào)節(jié)pH至8~9靜置沉淀30 min后取上清液測COD。
在數(shù)據(jù)中心運維過程中,人員因素應該是首要考慮的因素。無論多么先進的設(shè)備和技術(shù),如果沒有人進行管理是不能很好發(fā)揮作用的。因此數(shù)據(jù)中心在建設(shè)過程中必須考慮運維隊伍建設(shè)問題,如果等數(shù)據(jù)中心從“建設(shè)期”轉(zhuǎn)入“維護期”才考慮隊伍建設(shè),那就不利于提高運行管理效率。
同時,加強應急管理、提高系統(tǒng)可用率。建立完善的運行管理專項應急預案,明確運維人員在技術(shù)、管理、業(yè)務(wù)、安全等方面的職責,把責任落實到崗、落實到人;定期進行預案演練,并根據(jù)演練結(jié)果及時更新預案;配備核心應用和關(guān)鍵設(shè)備的備品備件,以備出現(xiàn)突發(fā)事件時盡快更換,及時修復,縮小影響,減少停運事件,提高可用率。
2.數(shù)據(jù)中心管理制度的建立與實施。
完善的管理制度是數(shù)據(jù)中心運行管理的保障。數(shù)據(jù)中心的基本規(guī)章制度包括三方面:管理規(guī)范、技術(shù)規(guī)范、操作指南。
管理規(guī)范:是從規(guī)范管理人員及用戶行為出發(fā)的各種制度、規(guī)定、辦法與獎懲措施。
技術(shù)規(guī)范:是規(guī)范運維人員在運行維護過程中各種行為的規(guī)定、規(guī)范與工作流程,例如《應用服務(wù)管理規(guī)定》《機房管理規(guī)定》《信息系統(tǒng)運行管理規(guī)程》《數(shù)據(jù)備份策略》。
操作指南:指導運行管理人員及用戶管理使用各種網(wǎng)絡(luò)與信息系統(tǒng)的操作指南與用戶手冊,如《網(wǎng)站簡易維護指南》《信息門戶使用指南》《OA系統(tǒng)安裝使用手冊》《生產(chǎn)MIS作業(yè)指導書》《服務(wù)器安裝手冊》等。
可以看出,在信息化發(fā)展到一定階段,數(shù)據(jù)中心的建設(shè)重點應該要從系統(tǒng)實施轉(zhuǎn)向以應用運維提升為主,運維質(zhì)量保障、安全機制變得重要起來,這時除了技術(shù)保障外,制度保障顯得越發(fā)重要。
作為數(shù)據(jù)中心主管人員,應首先是一位管理專家,其次才是技術(shù)專家。由此,建立完善的運維制度是最主要的工作內(nèi)容。可從以下幾個方面,使數(shù)據(jù)中心運行管理制度化。
①轉(zhuǎn)變運維觀念,樹立規(guī)范化意識。只有樹立制度化的IT運維意識,才能在日常繁雜瑣碎的工作中有效地區(qū)分任務(wù)的優(yōu)先級,將有限的資源投入到最能滿足需求的工作中。
②建立事件處理流程,強化規(guī)范執(zhí)行力度。流程是最重要的,因為流程是IT管理的基礎(chǔ),在IT管理的過程中,針對同一問題的具體實施步驟可能不同,但流程是不會改變的。
③設(shè)立ITIL服務(wù)臺,引入優(yōu)先處理原則。設(shè)立服務(wù)臺以確定服務(wù)要求和IT運維目標,ITIL指南要求數(shù)據(jù)中心管理者定義服務(wù)臺的關(guān)鍵流程,不僅僅定義流程是什么,還包括它們是如何運作的,并指出每個流程的影響和意義。
對于一個良好運營的數(shù)據(jù)中心,其生命周期經(jīng)歷了從咨詢規(guī)劃、布局建設(shè)、使用維護、升級優(yōu)化等多個階段。在這漫長的過程中,“運維”是其中最重要、也是最長久的環(huán)節(jié)。在運維工程中,安全、架構(gòu)、自動化、預警、虛擬化、流程、工具、培訓等等無不貫穿于其中。因此,做好數(shù)據(jù)中心運行管理工作,對提高數(shù)據(jù)中心效率、節(jié)能降耗、安全穩(wěn)定運行具有重要意義。