唐雨 孟壇魁 梁藝軍
(中國人民大學網(wǎng)絡與教育技術中心)
IT服務流程設計和執(zhí)行
唐雨 孟壇魁 梁藝軍
(中國人民大學網(wǎng)絡與教育技術中心)
中國人民大學網(wǎng)絡與教育技術中心作為學校的信息化建設職能部門,其角色正在由IT技術提供者向IT服務提供者轉變,本文總結以ISO20000標準化體系為指導的IT服務管理體系在中國人民大學的具體實踐并著重介紹IT服務管理體系落地過程中的流程設計和執(zhí)行要點。
ISO/IEC 20000是由國際標準化組織ISO發(fā)布的信息業(yè)服務標準,由BS15000轉變而來,而BS15000則是由英國標準協(xié)會(BSI)以ITIL為核心發(fā)布的。ISO/IEC 20000是一個針對管理流程系統(tǒng)的標準,適合IT服務的提供者,既適用于企事業(yè)單位內部的IT部門,也適用于外部的服務提供商。通過ISO/IEC 20000的認證,意味著提供服務的IT組織,對ISO/IEC 20000中定義的管理流程,具有足夠好的管理控制力,圖1為ISO20000 標準化體系的框架結構圖。
由圖1可見,ISO20000的體系框架包含了5大流程,即服務交付流程、控制流程、發(fā)布流程、解決流程和關系流程,其中又細分為13個具體的管理流程,分別是服務報告、能力管理、服務持續(xù)性與可用性管理、信息安全管理 、IT 服務預算編制與會計核算、配置管理、變更管理、發(fā)布管理、事件管理、問題管理、業(yè)務關系管理和供應商管理。
我們在學校內部建設IT服務管理體系的宗旨是:通過使工作可記錄、可管理、可控制的規(guī)范化流程,對技術手段進行整合、轉換和提升,最終向用戶提供優(yōu)質服務。
流程執(zhí)行的過程,有工作階段的轉移,有工作、審批主體的轉移,有對其它流程的啟動,還有流程間的信息共享。比如,事件管理中,有一線人員向二線人員遞交;需審批時可向相關領導遞交,批復后遞交回來;還可在事件管理流程中啟動問題管理流程;問題管理流程又啟動變更、發(fā)布管理流程;變更管理流程中啟動配置管理流程。
圖 ISO20000 IT服務管理體系框架
事件管理、問題管理、配置管理、變更管理和發(fā)布管理是ISO 20000服務管理體系中的5個核心管理流程,也是我們在日常的運維和服務中使用頻率最高的流程。
事件管理
事件管理以解決用戶的具體服務請求為目的,當發(fā)現(xiàn)故障或收到用戶的服務請求時,就進入事件管理流程。我們在實踐中堅持使用IT服務管理平臺,進行事件處理,以便達到可記錄、可回溯、可控制的要求。
事件管理流程依據(jù)部門的崗位劃分,是一個逐步升級的過程,直至最終解決用戶的服務請求。大多數(shù)事件通過服務臺的電話指導就可以解決,服務臺不能立即解決的問題逐步交由現(xiàn)場一線工程師、二線工程師進行解決。對于影響較大,需要部門或學校領導進行決策才能解決的事件,稱為重大事件,對此我們制訂了詳細的“重大事件列表”。
關鍵績效指標KPI:單位時段事件數(shù)量、事件關閉率、滿意率。
問題管理
當事件沒有得到根本解決,或同類事件較多時,進入問題管理流程。問題指事件背后未知的原因。
問題一般由二線工程師發(fā)起,從事件處理流程發(fā)起,或根據(jù)監(jiān)控數(shù)據(jù)的分析獨立發(fā)起。
在實踐中,我們以業(yè)務科室作為問題管理的第一責任人,業(yè)務科室認為需要跨部門處理的問題,再上升至中心層面處理。
問題處理的結果是找到問題所在。通過系統(tǒng),可記錄問題分析和解決方案,包括觸發(fā)的變更、發(fā)布過程。同時,可把整個處理中獲得的經驗,記錄為知識庫中知識條目。
關鍵績效指標KPI:單位時段問題數(shù)量、解決率、問題解決后的事件下降率、知識條目數(shù)量、知識庫有效使用率。
配置管理
對運維管理的對象,在管理系統(tǒng)中有信息記錄,記錄其支持運維工作所需信息,稱為配置項。配置項集合即設備、系統(tǒng)的臺帳。
在事件管理、問題管理、變更管理、發(fā)布管理流程中,將使用這些信息。
在事件、問題處理中,需要對設備、系統(tǒng)的配置進行更改,進入變更流程。完成變更后,應進入配置管理流程,修改配置項內容,以與實際情況保持一致。
凡是需要對其變更進行記錄的設備或系統(tǒng),應建立相應配置項,以便做好運維工作,如空調、電源,網(wǎng)絡交換機、配線架、重要系統(tǒng)所在的服務器、應用系統(tǒng)等。
對變更沒有風險,不需通過流程控制的常規(guī)性設備、系統(tǒng)變更,可不進入變更流程,而只做配置管理。
關鍵績效指標KPI:配置項數(shù)量、配置項符合率。
變更管理
變更管理,是在事件、問題處理中,或用戶對軟件系統(tǒng)的需求變動、增加時,對系統(tǒng)、設備的軟硬配置或程序進行改變。
變更管理流程的目的是記錄和控制變更的過程,避免風險,并提供從不成功變更狀態(tài)恢復所需信息。
當變更的影響廣泛,風險高時,需要進行重大變更流程控制,需要審批變更方案,提交危機處理預案,事前要進行備份處理等,為此我們制訂了詳細的“重大變更列表”。
在時間緊急情況下,可簡化流程,進行緊急變更流程控制。關鍵績效指標KPI:變更數(shù)量、成功率。
發(fā)布管理
變更管理中,涉及把信息部署在多個實際運行環(huán)境的系統(tǒng)組件中,或用戶需要知道情況,需要改變使用方式,需要得到資源和指導培訓時,進入發(fā)布管理。
由于影響面廣,所以在變更管理基礎上,要進行進一步的控制,如事前評審,以控制風險。要記錄發(fā)布信息,以便回溯。發(fā)布之后,要驗證,并為用戶提供需要的信息、資源和培訓。
關鍵績效指標KPI:發(fā)布數(shù)量、成功率。
上述5大核心管理流程之外的流程稱為其他流程。這些流程比前面流程要宏觀,不是日常的,但應定期執(zhí)行,以提高IT服務管理水平。這類工作有時容易被忽略。
業(yè)務關系管理、服務級別管理和服務報告
A.業(yè)務關系管理
業(yè)務關系管理的對象是用戶,目的是保持與用戶的良好關系,這些用戶包括學校各部門和個人用戶兩種類型,主要手段是溝通。
針對部門用戶,我們在各單位均已設置專兼職信息員,負責與中心聯(lián)系;定期召開全校信息員會議,報告服務、建設情況,收集意見和建議,進行培訓;通過信息員會議,了解用戶的業(yè)務和需求。
針對個人用戶,中心提供了滿意度回訪和用戶投訴渠道,以進行良好的溝通。
B.服務級別管理
公布服務目錄提供服務范圍,服務等級協(xié)議(SLAs)來定義服務要求。服務等級協(xié)議的起點是中心根據(jù)各系統(tǒng)資源、運行狀況做出的服務承諾,之后可通過全校信息員會議,協(xié)商修訂。
C.服務報告
服務報告主要報告履行服務承諾的情況,報告可對改進IT服務工作提供指標性信息,可包括事件處理統(tǒng)計數(shù)據(jù),可用性、可持續(xù)性統(tǒng)計數(shù)據(jù),還有運維中的帶寬、速率等檢測數(shù)據(jù),每學期向信息員會議報告。中心每年度向學校信息化領導小組提交報告。
容量、持續(xù)性、可用性管理
A.容量管理流程關心系統(tǒng)的容量是否夠用。
如各關鍵系統(tǒng)的CPU利用率,內存使用率,存儲空間,授權用戶數(shù);主要網(wǎng)絡節(jié)點的上聯(lián)鏈路帶寬及高峰使用率,數(shù)據(jù)交換能力等。
我們對核心機房空調、電源、網(wǎng)絡主干、重要應用系統(tǒng)進行不間斷自動監(jiān)測;在重點時段對電子校務系統(tǒng)、校園卡卡系統(tǒng)等進行特別檢測。每年提交一次容量分析報告和改進容量狀況的管理報告。
關鍵績效指標KPI:資源使用率。
B.持續(xù)性管理,強調從中斷中恢復的能力。
把重要的系統(tǒng)納入持續(xù)性管理。服務恢復、系統(tǒng)修復工作在事件管理流程中,有時涉及問題管理流程。體系規(guī)定,對納入持續(xù)性管理的系統(tǒng),要有數(shù)據(jù)故障恢復計劃。
每遇到中斷事故要進行持續(xù)性記錄,并在匯總表中記錄。每年度,可結合項目申報和規(guī)劃做一次分析和改進持續(xù)性狀況的規(guī)劃報告。
特別是,對重要系統(tǒng),要提供冗余備份設備、配件,對數(shù)據(jù)進行備份。體系規(guī)定,對納入持續(xù)性管理的系統(tǒng),要有數(shù)據(jù)備份計劃。通過流程執(zhí)行,可保證數(shù)據(jù)備份的按計劃進行。
關鍵績效指標KPI:年度服務中斷次數(shù),年度累計中斷時間,本年度最長持續(xù)服務時間。
C.可用性管理,主要關心可用率,比如網(wǎng)絡主干的可用率。利用事件記錄信息,對關鍵系統(tǒng)、設備進行定期考察,每年制定一次分析和改進可用性狀況的《可用性管理報告》。
關鍵績效指標KPI:可用率、5年以上和高故障設備數(shù)量、比例。
信息安全管理
日常工作中,中心對一般信息安全事件進行記錄和處理;對安全系統(tǒng)進行運維;提供安全服務和資源;進行安全培訓。
安全方針和組織機構建設。中心制訂和監(jiān)督執(zhí)行安全制度、策略,其中包括網(wǎng)絡與信息安全等級劃分和保護。中心會同相關部門制訂、修訂安全緊急處理預案。重大安全事件來臨時,需要協(xié)調網(wǎng)絡、系統(tǒng)和應用等部門及相關用戶進行處理。
定期通過安全事件分析安全趨勢,對信息資產進行風險評估,采取改善措施,消除各系統(tǒng)的安全隱患。
在其它系統(tǒng)的流程執(zhí)行過程中,考慮安全因素,比如,安全部門可通過變更流程記錄、檢查督促重要系統(tǒng)的密碼變更。
關鍵績效指標KPI:安全事件發(fā)生數(shù)量、安全事件解決率、安全隱患排除數(shù)量。
財務管理
財務管理的目的是提高中心員工的成本意識,平衡成本、用戶需求和質量的關系。
流程規(guī)定除執(zhí)行國家、學校的規(guī)章制度,執(zhí)行已審批國家、學校項目外,對中心支配資金執(zhí)行審批制度和按月做財務報告制度。
新項目應為用戶增加有價值的服務,或對系統(tǒng)的容量、可用性、可持續(xù)性提升起重要作用。學校應依據(jù)各流程提供的報告,進行資金使用方向的決策。
定期統(tǒng)計全中心的項目和內部財務支出的總體數(shù)額和結構,結合項目完成后的驗收、總結,記錄、評估各項目的成本和完成目標的效果。
供應商管理
記錄供應商的聯(lián)系方式,了解其產品、服務內容。
對招標過程和合同簽訂過程進行記錄,進行情況通報,由申報者、技術委員會和行政領導參與審議和審批等流程控制。
保管合同等資料。
組織相關科室進行工程驗收。沒有驗收的系統(tǒng)和樓宇布線系統(tǒng),如果納入正常運維工作,將由中心負擔施工方應負擔的質量成本。
根據(jù)配置管理中包含的購置時間、合同號等資產信息,申請維修、培訓、升級等服務,必要時根據(jù)合同與供應商進行商務、法律交涉。
通過對以往工作的總結,評價、記錄服務商實際提供服務、產品的質量。
[1] 《ITIL白皮書》 左天祖 主編
[2] 《ISO20000-2實施指南 中文版》 劉青 譯
[3]《實施IT治理:方法論、模型、全球最佳實踐》,Gad J Selig著,中治研國際信息技術研究院譯 中國經濟出版社