摘 要:本人結(jié)合中國南車株洲電力機車研究所有限公司(文中簡稱:株洲所)IT服務(wù)管理體系設(shè)計與實現(xiàn)的解決方案,重點闡述了事件管理流程設(shè)計,為企業(yè)構(gòu)建IT服務(wù)管理體系方案提供了方法和思路;
關(guān)鍵詞:ITIL;事件管理;服務(wù)管理;IT服務(wù)
中圖分類號:TP393
1 概述和定義
隨著國家信息化建議的發(fā)展,為了滿足株洲所高速的業(yè)務(wù)發(fā)展和擴張業(yè)務(wù)需求,配合公司的總體發(fā)展戰(zhàn)略,公司在IT服務(wù)管理體系建議方面做了系統(tǒng)和深入的工作;
ITIL(Information Technology Infrastructure Library):是英國政府部門在1987年制定的有關(guān)IT服務(wù)管理的方法論,現(xiàn)已成為事件上的IT管理標(biāo)準(zhǔn);
服務(wù)臺(Service Desk):用戶和IT部門的唯一接口;根本目的是提供初始支持、并通過變通方法、解決方案或升級一線、二線、三線等手段幫助用戶恢復(fù)到正常工作狀態(tài);
事件(Incident):是指會造成或可能造成服務(wù)中斷或服務(wù)質(zhì)量的下降,不屬于IT服務(wù)標(biāo)準(zhǔn)操作的活動;
事件管理流程:ITIL流程之一,負(fù)責(zé)解決所有的IT事件、問題和用戶請求。它的目的在于不影響業(yè)務(wù)的情況下,盡可能快速的恢復(fù)服務(wù),從而保證最佳的效率和服務(wù)的可持續(xù)性。規(guī)范IT事件管理的相關(guān)策略及活動,確保IT事件管理流程的執(zhí)行質(zhì)量和執(zhí)行有效性。事件管理流程的建立包括將事件分類,確定事件的優(yōu)先級和建立事件的升級機制。
2 IT服務(wù)臺運營模式概要描述
株洲所IT服務(wù)管理團隊采用集中式的IT服務(wù)臺模式。IT服務(wù)臺作為IT服務(wù)管理團隊和IT用戶的單一聯(lián)系點,統(tǒng)一接收來自IT用戶上報的IT事件(其中包括故障、服務(wù)請求、咨詢(非強制要求)、新業(yè)務(wù)需求等)。IT服務(wù)臺工程師提供IT事件初步支持,現(xiàn)場工程師提供現(xiàn)場支持,二線IT支持人員按支持組提供專業(yè)支持。IT事件的三線支持由外部服務(wù)支持團隊提供。
3 IT事件管理流程概要設(shè)計描述
3.1 流程基本原則
(1)所有IT用戶通過IT服務(wù)熱線或請求者控制臺提交的IT服務(wù)請求,都須被完整準(zhǔn)確的記錄下來,記錄的信息須足夠詳細,包括IT事件處理交互過程,詳細的解決方案和相關(guān)的附件等。
(2)株洲所IT服務(wù)管理團隊服務(wù)支持體系是由IT服務(wù)臺/現(xiàn)場工程師/二線IT支持人員/三線支持共同組成的,IT事件的處理過程中必須加強相互溝通,溝通的方式優(yōu)先使用工具(株洲所ITSM系統(tǒng)),在需要的時候可輔助電話、短信、郵件等手段。具體角色構(gòu)成,參見《株洲所IT服務(wù)管理角色與職責(zé)說明》。
(3)IT事件處理過程中,由供應(yīng)商作為三線支持參與IT事件的解決時,該IT事件的當(dāng)前處理責(zé)任人仍為相關(guān)的IT支持人員。
(4)所有IT支持人員優(yōu)先處理優(yōu)先級較高的IT事件。優(yōu)先級最高(P1)的IT事件也稱為重大IT事件。重大IT事件按IT事件管理流程處理完畢后,由IT支持組負(fù)責(zé)人提交《株洲所重大IT事件處理報告單》,經(jīng)IT事件流程經(jīng)理審核后,上報IT服務(wù)組織負(fù)責(zé)人及IT服務(wù)管理體系負(fù)責(zé)人。
(5)定期產(chǎn)生IT事件管理報表,分析服務(wù)質(zhì)量,IT事件流程經(jīng)理在流程月報中,須對沒有成功解決的IT事件、重復(fù)發(fā)生的IT事件或者利用變通方法解決的IT事件,根據(jù)需要提交給IT問題管理流程進行IT問題定義分析和解決。
3.2 流程概要設(shè)計描述
(1)IT事件識別和記錄:本環(huán)節(jié)是IT事件管理流程的起點。所有IT支持人員發(fā)現(xiàn)和IT用戶報告的IT事件必須由此步驟開始。此步驟的目的是在IT事件發(fā)生時快速準(zhǔn)確地發(fā)現(xiàn)與記錄,以協(xié)助IT事件的診斷和解決并通知相關(guān)人員。在此步驟中將會收集創(chuàng)建IT事件記錄所需的信息。該環(huán)節(jié)的關(guān)鍵是信息的準(zhǔn)確性和完整性。
(2)調(diào)查和診斷:若IT支持人員無法利用現(xiàn)有方案解決IT事件,可運用自身技能、診斷工具等進行更加深入的分析以找到恢復(fù)的臨時措施,必要時可調(diào)用多名IT支持人員以尋求解決措施。
(3)解決和恢復(fù):IT支持人員實施IT事件的解決方案,并將解決完畢的IT事件轉(zhuǎn)回IT服務(wù)臺。由IT服務(wù)臺通知IT用戶解決的結(jié)果,并由IT用戶填寫IT事件滿意度調(diào)查。
(4)IT事件關(guān)閉:當(dāng)IT用戶反饋滿意度調(diào)查信息,確認(rèn)IT事件解決后,由IT服務(wù)臺關(guān)閉該IT事件。
(5)IT事件已關(guān)閉:事件單關(guān)閉后,事件單狀態(tài)更改為已關(guān)閉狀態(tài),事件單信息不能再做修改。
4 IT事件管理流程詳細設(shè)計描述
4.1 服務(wù)臺
(1)服務(wù)臺定位及職能。株洲所IT服務(wù)臺目前定位為技能型服務(wù)臺,主要職能如下:1)統(tǒng)一受理IT事件。IT服務(wù)臺作為信息部門與IT用戶之間的唯一接口,對IT用戶上報的IT事件進行統(tǒng)一受理。服務(wù)臺以服務(wù)目錄作為基本參考,對不屬于服務(wù)范圍的IT事件進行過濾;對屬于服務(wù)范圍的IT事件,須收集相關(guān)信息并記錄;2)嘗試快速解決IT事件。服務(wù)臺須參考知識庫等相關(guān)工具,對IT事件進行嘗試快速處理,對需現(xiàn)場/二線支持的IT事件進行分派;3)監(jiān)控、協(xié)調(diào)IT事件處理過程。服務(wù)臺工程師須對其受理的IT事件進行全生命周期的跟蹤;4)確認(rèn)IT事件處理結(jié)果。服務(wù)臺在確保IT用戶業(yè)務(wù)完全恢復(fù)且對解決結(jié)果認(rèn)可后,對IT事件進行關(guān)閉。
(2)服務(wù)臺工作模式。服務(wù)臺向外提供以下電話和Web方式供IT用戶上報故障和服務(wù)請求。
4.2 IT事件管理流程核心節(jié)點詳細設(shè)計描述
(1)流程執(zhí)行原則:責(zé)任制原則、 IT事件分派原則、IT事件重分派原則、重復(fù)IT事件原則、IT事件關(guān)閉原則、 IT事件待決原則、IT事件升級原則、重大IT事件處理原則。
(2)流程相關(guān)定義:事件單信息、事件來源、事件性質(zhì)、事件分類、事件優(yōu)先級、服務(wù)方式、事件時限、事件狀態(tài)、事件關(guān)閉代碼、事件分配次數(shù)、SLM狀態(tài)、流程角色和職責(zé)。
(3)流程詳細描述:IT事件標(biāo)識與記錄;IT事件調(diào)查與診斷;IT事件解決與恢復(fù);T事件關(guān)閉;事件關(guān)閉處理;IT事件已關(guān)閉。
例舉:“IT事件調(diào)查與診斷”中“事件受理和分析”結(jié)點來進行流程詳細設(shè)計描述。
表1 事件受理和分析(現(xiàn)場/二線)
編號INC-2-5名稱事件受理和分析
角色現(xiàn)場/二線工程師
流程輸入INC-2-3 服務(wù)臺指派的事件單
INC-2-7 事件經(jīng)理指派的事件單
操作輸入提供解決方案/變通方法
詳細描述①現(xiàn)場/二線工程師根據(jù)經(jīng)驗和查找知識庫,進行事件分析。②完善事件單信息 ③如果找到處理方案,提供解決方案/變通方法
輸出①提供解決方案/變通方法 ②進入“INC-2-6 找到解決方案/變通方法”
這個流程階段的目標(biāo)是進行深入的調(diào)查,以解決事件。各個技術(shù)水平的事件分析員將會參與尋找一個解決方案或變通方案。如果還是不能解決事件,可能需要問題管理流程也參與進來進行更加深入的分析研究。(如圖1)
圖1 IT事件調(diào)查和診斷
5 IT事件管理流程應(yīng)用效果
通過平臺應(yīng)用,株洲所IT服務(wù)管理事件管理流程在多個方面對業(yè)務(wù)產(chǎn)生積極作用,具體表現(xiàn)在以下幾個方面:(1)單一聯(lián)系點:通過建立集中的服務(wù)臺,作為與用戶溝通聯(lián)系的單一聯(lián)系點。對用戶方發(fā)生的故障及用戶上報的服務(wù)請求進行快速響應(yīng)和統(tǒng)一管理,對內(nèi)部服務(wù)支持資源進行合理協(xié)調(diào)和調(diào)配。同時,服務(wù)臺作為IT服務(wù)窗口,也進一步維護和加強了與用戶的關(guān)系,為提高用戶體驗和滿意度起到了重要作用。(2)用戶業(yè)務(wù)盡快恢復(fù):通過合理調(diào)配資源,使用知識庫等相關(guān)支持工具,對不同級別事件選擇各自的解決時限,對用戶被中斷或受影響的業(yè)務(wù)進行快速響應(yīng)和恢復(fù)。(3)內(nèi)部團隊協(xié)作加強:為IT支持團隊成員分配角色,并清晰界定職責(zé)。通過事件管理流程將團隊成員進行有效的連接,加強內(nèi)部團隊協(xié)作和溝通的有效性和工作效率。(4)服務(wù)質(zhì)量控制和改進:通過定期提交流程相關(guān)指標(biāo)和報表至管理層,以實現(xiàn)對流程的監(jiān)控和管理,同時為服務(wù)質(zhì)量的改進奠定基礎(chǔ)。
參考文獻:
[1]ISO/IEC 20000-1:2005服務(wù)管理規(guī)范[Z].
[2]ISO/IEC 20000-2:2005服務(wù)管理實施指南[Z].
[3]南車株洲電力機車研究所有限公司IT服務(wù)管理手冊[Z].
作者簡介:劉宇杰(1984-),湖南益陽人,運營支持部部長,研究方向:IT運營。
作者單位:株洲南車時代電氣股份有限公司,湖南株洲 412001