◆王輝傳
?
淺談IT運維管理系統(tǒng)在企業(yè)單位中的應用
◆王輝傳
(廣東省信息工程有限公司 廣東 510530)
信息系統(tǒng)是信息化的基礎和重要內(nèi)容,在社會信息化快速發(fā)展的今天,各類信息系統(tǒng)應運而生,為了使系統(tǒng)處于良好運行狀態(tài),充分發(fā)揮其工作效能,就必須要加強系統(tǒng)的運行維護管理,IT運維管理系統(tǒng)就是基于ITIL運維服務體系框架作為指導進行開發(fā),使得內(nèi)部的運維工作以及運維相關工作都能夠在一個系統(tǒng)中完成,減少繁瑣的工作。
IT運維管理系統(tǒng);ITIL運維
隨著業(yè)務系統(tǒng)領域的應用系統(tǒng)數(shù)量越來越多,支撐的業(yè)務種類越來越廣泛,業(yè)務功能越來越復雜和關鍵,用戶對系統(tǒng)依賴程度和要求不斷提高,因此相應的信息化治理與維護工作的難度與壓力也與日俱增。需要建立統(tǒng)一的監(jiān)控管理平臺對整個信息系統(tǒng)基礎架構(gòu)進行統(tǒng)一監(jiān)管,為各業(yè)務系統(tǒng)提供可靠的信息系統(tǒng)基礎架構(gòu)服務,并且實現(xiàn)對用戶信息系統(tǒng)的軟件和硬件資源的管理。同時,引用ITIL理念,幫助用戶建立并完善運維服務管理流程。
IT運維管理系統(tǒng)主要功能是將網(wǎng)絡、硬件、系統(tǒng)、存儲、應用的監(jiān)測整合在一個平臺中,并且將日常任務、業(yè)務流程與前者通過CMDB統(tǒng)一整合在一個平臺中。其運維管理理念:以知識管理為目的,以IT服務為對象,以持續(xù)改進為手段,建、管、用全生命周期管理方法論。
某互聯(lián)網(wǎng)新媒體公司主營業(yè)務包括IPTV、互聯(lián)網(wǎng)電視以及有線電視網(wǎng)絡增值服務等業(yè)務,沿著當前互聯(lián)網(wǎng)新興業(yè)務的風口,該企業(yè)發(fā)展勢頭迅猛,信息系統(tǒng)也日益龐大起來。目前該企業(yè)的信息系統(tǒng)有兩個發(fā)展趨勢,一是業(yè)務應用系統(tǒng)不斷增多,信息系統(tǒng)的復雜度越來越高,由此,帶來了運行維護工作難度的增加;二是業(yè)務對信息化的依賴程度不斷提高,帶來了信息系統(tǒng)本身的運行維護壓力。
因此,在技術工具上需要的是一套具有ITIL管理理念,技術上能夠?qū)崿F(xiàn)集中監(jiān)測的統(tǒng)一管理平臺。技術與管理并重的原則,需要有ITIL管理的咨詢服務能力,能夠幫助企業(yè)用戶建立運維服務管理體系。
IT運維管理系統(tǒng)實現(xiàn)的就是一個管理體系的落地,在管理體系中能夠使得各個流程和管理機制之間相互銜接、相互補充、相互制約,形成一個有機的整體。并使得工作記錄之間形成派生關系的銜接,達到一票到底,前后貫通的記錄。
流程描述了事務演變的方式,而體系描述了流程的連接方式。沒有體系,服務管理就只是一堆散亂的觀察結(jié)果、實踐和相互沖突的目標。
運行維護管理的邏輯主線:“需求”中描述一個“應用系統(tǒng)”的保障需求,包括“可用性”和“容量”兩個方面。根據(jù)“需求”量化“應用系統(tǒng)”的保障的目標。根據(jù)目標設計了集群或熱備份的可用性設計方案,以及資源的容量分配方案,同時界定了可能的“典型故障”并設計了相對應的流程。隨即,產(chǎn)生“變更”,隨即派生“發(fā)布”任務。此后,是對以上線的系統(tǒng)進行持續(xù)“監(jiān)測”,以便早期察覺異常和故障。定期進行評價,需求以及目標是否還適用,是否達成,是否有需要改進的環(huán)節(jié)。通過定期評價,找到改進環(huán)節(jié),提出改進建議以及新的需求。
需求和服務請求的邏輯主線:“需求”可能產(chǎn)生“變更”,而“變更”可能會派生“發(fā)布”。發(fā)布可能會帶來版本的更替。而因此,帶來新的日?!胺照埱蟆?,還有因此而產(chǎn)生新的“問題”,及相應的知識和培訓。而在這些日常的“服務請求”中,還蘊藏著新的“需求”。
建立一套統(tǒng)一的信息化管理系統(tǒng),能夠涵蓋對各類信息化資源,各類信息化工作事務的統(tǒng)一管理,從而規(guī)范日常運維工作,逐步提高運維效率和質(zhì)量。
IT運維管理系統(tǒng)主要通過以下四個維度實現(xiàn)整個管理體系的落地:
運維系統(tǒng)實現(xiàn)的是管理機制與監(jiān)測技術手段的結(jié)合,能夠利用對信息系統(tǒng)監(jiān)測的技術手段發(fā)現(xiàn)信息系統(tǒng)的異常跡象和變化跡象,同時將跡象形成工單并與既有的管理機制結(jié)合,例如、異常事態(tài)管理和變更管理。
整體運維系統(tǒng)分為四個邏輯層次以及23個功能模塊。圖1為運維系統(tǒng)整體架構(gòu)圖。
圖1 運維系統(tǒng)整體架構(gòu)圖
①數(shù)據(jù)采集層:通過代理以及標準協(xié)議的方式,對信息系統(tǒng)內(nèi)的各類軟件和硬件的運行狀態(tài)進行自動化集中監(jiān)測,從而達到通過這些數(shù)據(jù)體現(xiàn)信息系統(tǒng)運行狀態(tài)的目的。
②數(shù)據(jù)接入層:主要實現(xiàn)對數(shù)據(jù)的實時接收、過濾、標識(標簽化)、數(shù)據(jù)增強和數(shù)據(jù)存儲功能。運維系統(tǒng)通過對收集到的數(shù)據(jù)進行與預先設定的閥值和優(yōu)先級進行匹配,并設置數(shù)據(jù)之間依賴關系,將數(shù)據(jù)加工為各種一目了然的狀態(tài)信息反饋給用戶。
③數(shù)據(jù)處理層:主要實現(xiàn)對接入數(shù)據(jù)的分析,實現(xiàn)近實時/定時定制統(tǒng)計,實現(xiàn)預/告警策略的定義、觸發(fā)、存儲、標識(標簽化)和多方式消息發(fā)送支持。運維系統(tǒng)將信息化軟件和硬件運行數(shù)據(jù),與信息化部門各個崗位的人員職責,以及業(yè)務應用系統(tǒng)之間關聯(lián),實現(xiàn)多維度的數(shù)據(jù)分析。
④數(shù)據(jù)展現(xiàn)層:主要實現(xiàn)對數(shù)據(jù)處理層的產(chǎn)生結(jié)果的展現(xiàn),運維系統(tǒng)能夠定制展現(xiàn)的模版和策略。
(4)信息化服務管理體系的四個功能中心
①配置管理數(shù)據(jù)庫作為邏輯的基礎:所有信息化服務管理的流程都與配置管理數(shù)據(jù)庫集成;
②變更管理流程作為全過程的貫穿:所有信息化服務管理的流程都與變更管理集成;
③知識庫作為經(jīng)驗和知識的沉淀:所有信息化服務管理的流程都與問題管理及知識庫集成;
④測量管理作為整體測量的集中:測量管理與所有信息化服務管理的流程集成。
IT運維管理系統(tǒng)的意義在于建設一套面向服務、流程清晰、科學規(guī)范、高效運營的運維管理系統(tǒng),改進運維作業(yè)流程,該系統(tǒng)的應用將極大提高運維管理效率與管理水平,降低運維維護成本,為運維戰(zhàn)略發(fā)展目標提供有力的保障與支持。
[1]吳濤,馬軍,沈宏.信息技術基礎架構(gòu)庫(ITIL)理念在搭建學科群系統(tǒng)中的運用[J].科技通報,2013.
[2]佚名.項目管理知識體系[J].管理觀察,2014.
[3]本社.GB/T50326-2006建設工程項目管理規(guī)范[M].中國建筑工業(yè)出版社,2006.
[4]游靜.IT項目管理與知識管理[M].武漢大學出版社, 2010.
[5]王慶棟.一種IT運維管理系統(tǒng)中關鍵組件的設計與實現(xiàn)[D].北京大學,2013.