溫國梁
淺談提升企業(yè)IT運維支持能力
溫國梁
針對企業(yè)信息系統(tǒng)運維管理存在的問題,提出了如何提升IT運維服務(wù)能力的方案與對策,最后詳細闡述了服務(wù)臺建設(shè)的目的、架構(gòu)以及具體的操作流程等。
隨著信息技術(shù)的不斷發(fā)展,企業(yè)信息化建設(shè)步入了一個嶄新的階段,企業(yè)信息化建設(shè)逐漸擴展到了企業(yè)生產(chǎn)經(jīng)營的各個方面,不斷深入企業(yè)的核心業(yè)務(wù),成為企業(yè)確保業(yè)務(wù)穩(wěn)定、可靠、快速、有效開展的不可或缺的支撐。業(yè)務(wù)信息系統(tǒng)越來越復(fù)雜,逐漸形成了多層次、多元化的技術(shù)架構(gòu)。但是,IT資源整體運維的管理水平卻相對滯后,如何打破被動局面,從單純的技術(shù)管理向服務(wù)管理的轉(zhuǎn)變,是目前面臨的一個難題。IT運維的目的不僅是確保信息系統(tǒng)安全、穩(wěn)定、可靠運行,更重要的是保證日常業(yè)務(wù)的有效、可持續(xù)地開展,為管理層提供有力的決策支持。
(1)在IT運維工作中,缺乏量化考核工具,無法對IT運維人員的工作績效、服務(wù)質(zhì)量進行有效考核和實時監(jiān)督。
(2)由于IT運維人員在日常的工作中缺少協(xié)作機制,而一般的IT故障往往都不是單一環(huán)節(jié)的問題,需要相關(guān)專業(yè)部門的通力合作,共同分析,才能解決,這些容易造成職責不清、工作推諉的問題。
(3)IT資產(chǎn)管理缺少工具系統(tǒng)支撐,硬件設(shè)備和軟件系統(tǒng)大多采用人工管理,不能達到有效管理的目的。例如,目前仍采用人工方式對硬件設(shè)備進行排查、巡檢,不能及時發(fā)現(xiàn)設(shè)備問題;IT設(shè)備臺帳不能及時更新,對設(shè)備維修工作不能及時記錄;不能有效管理硬件、軟件的升級、變更等工作,配置記錄與實際不相符合等。
(4)在信息化建設(shè)中,往往重視硬件投資,而管理制度流程建設(shè)跟不上,或者貫徹落實不到位,造成客戶滿意度低,這樣不但降低了信息系統(tǒng)在業(yè)務(wù)經(jīng)營中的支撐作用,也嚴重打擊了IT運維人員的積極性。
面對著包括人員、網(wǎng)絡(luò)、主機、存儲設(shè)備、安全設(shè)備、數(shù)據(jù)庫、中間件及應(yīng)用軟件等多種IT資源,如何有效管理、充分利用?是待解決的首要問題。技術(shù)管理考慮如何把IT資源“管好”,而服務(wù)管理則考慮如何把IT資源“用好”。通過建立規(guī)范的服務(wù)程序,搭建IT部門與業(yè)務(wù)部門溝通的平臺,為日常運行維護工作(或外包業(yè)務(wù))提供一個管理架構(gòu)。 實現(xiàn)IT資源的全面監(jiān)控,促進IT運維工作向服務(wù)管理方式的轉(zhuǎn)變,提高企業(yè)信息化整體工作水平。
IT運維的難題是運維服務(wù)管理能力不足造成的,可從以下幾個方面提高IT運維服務(wù)能力。
(1)建立xxxx服務(wù)臺,合理安排各專業(yè)崗位人員,明確各專業(yè)崗位職責,充分利用運維資源,避免各專業(yè)部門間的互相推諉。保證故障的快速解決,及時恢復(fù)業(yè)務(wù)系統(tǒng)運行。
(2)建立統(tǒng)一的監(jiān)控平臺,實現(xiàn)信息資源的統(tǒng)一管理、集中展示,使運維管理人員能實時監(jiān)控各軟硬件系統(tǒng)的運行狀態(tài),快速定位故障點,有效縮短故障排查時間。應(yīng)對網(wǎng)絡(luò)監(jiān)控系統(tǒng)、日志審計系統(tǒng)等進行集成,建立統(tǒng)一的管理平臺,實現(xiàn)實時監(jiān)控、實時分析、實時報警,充分發(fā)揮其應(yīng)有的技術(shù)支撐作用。
(3)“三分技術(shù)、七分管理”,通過制定高效、合理、切實可行的管理制度、工作流程,使運維過程更加明確、可控,歷史數(shù)據(jù)和處理過程可追溯,提升各專業(yè)部門間的協(xié)調(diào)性,提高運維工作效率。相關(guān)的工作流程包括:故障管理流程、問題管理流程、變更管理流程、配置管理流程等。
(4)落實全生命周期的資產(chǎn)管理,通過提供準確完整的設(shè)備臺帳及運行、維檢修記錄,可以使管理者及時了解硬件設(shè)備所處的運行狀態(tài),適時維修、報廢、更新設(shè)備,降低運營成本。另外,通過一些歷史數(shù)據(jù)的分析,也可以加快故障原因的確定,提高運維工作的效率。
(5)建立知識庫,實現(xiàn)知識轉(zhuǎn)化,通過運維知識庫的建設(shè),促進隱性知識向顯性知識的轉(zhuǎn)化。共享IT運維工作中的實際經(jīng)驗和專業(yè)知識,降低個人依賴度。提高每個IT運維人員的工作效率和解決問題的能力。
(6)實現(xiàn)IT運維工作的量化績效考核,根據(jù)工作實際制定運維考核標準,通過分析IT運維人員的響應(yīng)時間、問題解決時間等數(shù)據(jù),逐步提高服務(wù)水平和服務(wù)質(zhì)量。
通過有針對性地落實改進措施,有效提高IT運維管理能力,不僅可降低IT運維人員工作量,同時可以提高工作效率,進而提高整體IT運維能力,提高客戶滿意度。
提升IT運維服務(wù)能力,可將服務(wù)臺建設(shè)作為突破口,建立對外溝通平臺,對IT運維工作,進行統(tǒng)一調(diào)度、協(xié)調(diào),監(jiān)管,提高信息運維工作的效率。
(1)服務(wù)臺建設(shè)目的
服務(wù)臺主要功能,是盡快解決信息系統(tǒng)在日常運行中出現(xiàn)的問題,保障業(yè)務(wù)支撐系統(tǒng)的穩(wěn)定運行,保證企業(yè)生產(chǎn)經(jīng)營業(yè)務(wù)的正常開展。
(2)體系架構(gòu)
服務(wù)臺體系架構(gòu)由組織人員、流程制度、技術(shù)工具、信息管控四個方面組成。 組織人員指的是服務(wù)臺建設(shè)的人員、組織保障,包括組織職能、組織架構(gòu)、崗位職責、人員構(gòu)成等內(nèi)容。 流程制度指相關(guān)的各類管理流程和保障其落實的管理制度。 技術(shù)工具指支撐服務(wù)臺正常運行的各類信息化系統(tǒng)。 信息管控指支撐服務(wù)臺運行所要求的各項管理數(shù)據(jù),包括資源信息、考核指標、管理報告等內(nèi)容。
(3)服務(wù)臺流程
當用戶通過電話或其他方式提交了一個故障申請,服務(wù)臺工作人員對故障進行詳細記錄,生成工單,并進行初步解決,如果解決不了,就將工單派發(fā)給一線工作人員,由一線工作人員進行解決,一般為現(xiàn)場支持,一線支持人員在規(guī)定的時間內(nèi)不能解決問題的,應(yīng)及時通知服務(wù)臺進行資源調(diào)配,或申請二三線技術(shù)人員的支持。如果三線支持人員,不能解決問題,服務(wù)臺工作人員應(yīng)及時上報相關(guān)管理人員進行協(xié)調(diào)處理。故障處理完成后,服務(wù)臺工作人員進行記錄用戶評價及關(guān)閉工單的工作。
圖1 服務(wù)臺體系架構(gòu)
管理人員通過數(shù)據(jù)分析,比如故障平均響應(yīng)時間、平均解決時間、各級支持人員的故障解決率等數(shù)據(jù),可以對運維人員進行工作能力,工作態(tài)度進行量化考核。為了更好地落實服務(wù)臺流程,建立支撐服務(wù)臺正常運行的各類信息化系統(tǒng)是必不可少的工作。運維服務(wù)支撐系統(tǒng)包括自動化監(jiān)控系統(tǒng)、運維服務(wù)管理系統(tǒng)等,例如:呼叫中心、IT服務(wù)管理系統(tǒng)、運維人員GPS定位系統(tǒng)、網(wǎng)絡(luò)監(jiān)控系統(tǒng)等。
在IT運維管理中,管理人員有兩個途徑可以及時地獲知系統(tǒng)的運行狀態(tài)并進行相應(yīng)的處理:一是通過監(jiān)控系統(tǒng),二是通過服務(wù)臺。通過服務(wù)臺建設(shè),確保了IT 運維人員能及時發(fā)現(xiàn)各監(jiān)控端的狀況、故障,從而及時進行相應(yīng)的維護、修復(fù)處理,并能將故障的狀況及修復(fù)的結(jié)果等信息由服務(wù)臺進行發(fā)布。通過服務(wù)臺建設(shè),打破行政界限,建立統(tǒng)一運維模式,提升整體運維能力,為集成化運維中心的建設(shè)打下良好的基礎(chǔ)。
10.3969/j.issn.1001-8972.2015.21.047