陳 煉
(中國鐵通集團(tuán)有限公司 廣 東分公司網(wǎng)絡(luò)支撐中心,廣州 5 10080)
隨著電信市場競爭日益白熱化和電信多元化格局價(jià)值圈的形成,運(yùn)營支撐系統(tǒng)在電信統(tǒng)一管理、集中監(jiān)控、精細(xì)化經(jīng)營的發(fā)展中發(fā)揮著越來越重要的作用。隨著網(wǎng)絡(luò)規(guī)模日益擴(kuò)大,網(wǎng)絡(luò)環(huán)境日趨復(fù)雜,電信運(yùn)營支撐系統(tǒng)管理產(chǎn)生了許多新的需求,同時(shí)也不可避免地帶來許多問題。本文結(jié)合自身實(shí)際工作及國內(nèi)電信運(yùn)營商發(fā)展情況,圍繞IT基礎(chǔ)架構(gòu)庫(ITIL)在電信運(yùn)維中的應(yīng)用,總結(jié)提出幾點(diǎn)認(rèn)識(shí)體會(huì)。
電信行業(yè)通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施規(guī)模龐大,設(shè)備復(fù)雜多樣、彼此關(guān)聯(lián),跨區(qū)域、跨地域的特征十分顯著,形成了一個(gè)復(fù)雜的通信網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)設(shè)備故障、網(wǎng)絡(luò)系統(tǒng)性能不足等問題都會(huì)給電信行業(yè)運(yùn)維帶來嚴(yán)峻的挑戰(zhàn)。同時(shí),由于各種管理IT基礎(chǔ)架構(gòu)和業(yè)務(wù)信息系統(tǒng)建設(shè)相對分散,維護(hù)單位分散,信息不全面,系統(tǒng)間信息共享和有效整合難度較大。電信運(yùn)維管理需要對通信網(wǎng)絡(luò)設(shè)備、主機(jī)服務(wù)器、數(shù)據(jù)庫及存儲(chǔ)設(shè)備、IT網(wǎng)絡(luò)交換設(shè)備、各種業(yè)務(wù)和應(yīng)用進(jìn)行集中的、一站式的統(tǒng)一管理與實(shí)時(shí)監(jiān)控,對電信運(yùn)營商各種業(yè)務(wù)系統(tǒng)、相關(guān)基礎(chǔ)設(shè)施和設(shè)備、各種業(yè)務(wù)應(yīng)用的數(shù)據(jù)進(jìn)行集中采集、解析、匯總及統(tǒng)一展現(xiàn)處理,方便運(yùn)維管理人員對網(wǎng)絡(luò)的統(tǒng)一管理、分析和監(jiān)控,快速應(yīng)對突發(fā)性的網(wǎng)絡(luò)安全事故,及時(shí)保障各種通信服務(wù)的持續(xù)、安全穩(wěn)妥運(yùn)行和開展。
隨著電信行業(yè)迅猛發(fā)展,各大電信運(yùn)營商都在不斷擴(kuò)建網(wǎng)絡(luò)、增加基站、拓展業(yè)務(wù),積極地進(jìn)行運(yùn)營支撐系統(tǒng)的建設(shè),已建立起業(yè)務(wù)支撐、網(wǎng)絡(luò)運(yùn)維管理、企業(yè)信息化、財(cái)務(wù)等各類IT系統(tǒng),發(fā)揮了積極的作用。由于電信企業(yè)的IT系統(tǒng)的規(guī)模不斷擴(kuò)大,種類日益龐雜,電信企業(yè)自身的IT運(yùn)維部門人力、技術(shù)有限,給系統(tǒng)的日常維護(hù)和管理帶來相當(dāng)大的困難。隨著新技術(shù)發(fā)展、新業(yè)務(wù)系統(tǒng)推出和用戶不斷增多,陸續(xù)建設(shè)的電信網(wǎng)絡(luò)和支撐管理系統(tǒng)逐漸暴露出一些問題,主要表現(xiàn)在[1~2]:
各個(gè)信息系統(tǒng)都是分頭開發(fā)、分開運(yùn)維的,這種運(yùn)行維護(hù)模式會(huì)造成主要信息系統(tǒng)均各自擁有龐大的運(yùn)行維護(hù)體系和維護(hù)隊(duì)伍。由于每個(gè)隊(duì)伍從事的事務(wù)有相當(dāng)部分是相同的,組織管理體系的職能設(shè)置及價(jià)值配置沒有得到優(yōu)化,水平協(xié)作及垂直管控能力較弱,跨部門的職責(zé)界定不清,實(shí)施上缺乏清晰的流程支持。
由于各系統(tǒng)運(yùn)維歸屬部門不同,規(guī)章制度也不同,因此各信息系統(tǒng)的維護(hù)工作缺乏統(tǒng)一的維護(hù)流程和制度,更別說制定在此之上的SLA協(xié)議了。在目前“救火式”的系統(tǒng)管理維護(hù)模式下,管理人員很難有效地進(jìn)行服務(wù)管理,無法保證IT服務(wù)的有效性和一致性,IT管理往往處于無序狀態(tài)。在問題集中發(fā)生時(shí),沒有合理設(shè)定優(yōu)先級,延誤了重要故障解決時(shí)間。
缺乏流程管理的電子化、自動(dòng)化,導(dǎo)致無法跟蹤故障情況,不能有效利用歷史故障的發(fā)生頻率、發(fā)生類型、處理情況、解決辦法等知識(shí)和經(jīng)驗(yàn),無法進(jìn)行效率評估和考核。技術(shù)人員忙于應(yīng)付突發(fā)事件和處理同類問題,管理人員無法判斷將要發(fā)生的故障,甚至不能及時(shí)發(fā)現(xiàn)已經(jīng)發(fā)生的故障,無法對網(wǎng)絡(luò)、主機(jī)等網(wǎng)管系統(tǒng)進(jìn)行全面的性能統(tǒng)計(jì)分析,也就無法全面了解網(wǎng)管系統(tǒng)的整體運(yùn)行情況。
缺乏整體規(guī)劃,各個(gè)不同廠商的管理工具或軟件不能對資產(chǎn)和資源進(jìn)行有效地管理,對這些管理工具的整合也非常困難,無法統(tǒng)一管理和調(diào)度資源,難以有效地分析資產(chǎn)成本效益和資源使用情況,難以同時(shí)對分散的各網(wǎng)管系統(tǒng)和主機(jī)等設(shè)備進(jìn)行監(jiān)控。
因此,我們需要引入以流程為導(dǎo)向,以客戶滿意和服務(wù)品質(zhì)為核心的ITIL理論來對系統(tǒng)和設(shè)備等進(jìn)行全面、集中、有效的監(jiān)控和管理,進(jìn)一步完善管理手段,規(guī)范管理流程,實(shí)現(xiàn)運(yùn)維工作的電子化、流程化,提高整個(gè)計(jì)算機(jī)系統(tǒng)的穩(wěn)定性和高可用性,保證各業(yè)務(wù)系統(tǒng)平穩(wěn)、健康地運(yùn)行。
在“提高IT服務(wù)質(zhì)量”這個(gè)大方向下,英國于80 年代中期開發(fā)了一套針對IT行業(yè)的服務(wù)管理最佳實(shí)施經(jīng)驗(yàn)庫,稱為IT基礎(chǔ)架構(gòu)庫(Information Technology Infrastructure Library, ITIL)。它以流程為導(dǎo)向,以客戶為中心,通過整合IT服務(wù)與企業(yè)業(yè)務(wù),提高企業(yè)的IT服務(wù)提供和服務(wù)支持的能力與水平。
ITIL為企業(yè)的IT服務(wù)管理實(shí)踐提供了一個(gè)客觀、嚴(yán)謹(jǐn)、可量化的標(biāo)準(zhǔn)規(guī)范,企業(yè)的IT部門和最終用戶可以根據(jù)自己的能力和需求定義自己所要求的不同服務(wù)水平,參考ITIL來規(guī)劃和制定其IT基礎(chǔ)架構(gòu)及服務(wù)管理,從而讓既有的信息化資源發(fā)揮更大的效能,確保IT服務(wù)管理能為企業(yè)的業(yè)務(wù)運(yùn)作提供更好的支持。
在它的2.0版中,ITIL主要包括6個(gè)模塊,即業(yè)務(wù)管理、服務(wù)管理、ICT基礎(chǔ)架構(gòu)管理、IT服務(wù)管理規(guī)劃與實(shí)施、應(yīng)用管理和安全管理。ITIL結(jié)構(gòu)示意如圖1 。
圖1 ITIL結(jié)構(gòu)示意圖
ITIL的核心模塊是“服務(wù)管理”,這個(gè)模塊一共包括了10個(gè)流程和1項(xiàng)職能,這些流程和職能又被歸結(jié)為“服務(wù)提供”和“服務(wù)支持”2大流程組。前者關(guān)注IT服務(wù)的規(guī)劃和實(shí)現(xiàn),歸納了與IT管理相關(guān)的5個(gè)戰(zhàn)術(shù)級流程,即服務(wù)級別管理、IT服務(wù)財(cái)務(wù)管理、能力管理、IT服務(wù)持續(xù)性管理和可用性管理。后者則側(cè)重在IT服務(wù)的日常運(yùn)作任務(wù)上,歸納了與IT管理相關(guān)的1項(xiàng)管理職能—服務(wù)臺(tái)及5個(gè)運(yùn)營級流程,即事件管理、問題管理、配置管理、變更管理和發(fā)布管理,屬于執(zhí)行層的工作。
ITIL是一套通用框架體系,在ITIL中定義了適合于各種IT組織的各流程目標(biāo)、活動(dòng)、輸入以及輸出等。該框架體系可以指導(dǎo)我們規(guī)劃流程、定義角色、職責(zé)和各流程間的關(guān)系等。然而,由于組織的差異性,ITIL并沒有給出每個(gè)流程活動(dòng)該如何實(shí)施的詳細(xì)信息,而僅僅給出在實(shí)踐中被證明的統(tǒng)一方法,并且由于環(huán)境和條件的不同,這些方法往往以不同的方式實(shí)施。
因此,每個(gè)組織必須根據(jù)ITIL原則和自身實(shí)際來設(shè)計(jì)適合該組織自己的流程。對于IT運(yùn)維服務(wù)管理來說,其最主要業(yè)務(wù)目標(biāo)是保證IT基礎(chǔ)架構(gòu)的系統(tǒng)正常、安全可靠、穩(wěn)定高效地運(yùn)行,為業(yè)務(wù)部門提供運(yùn)營支撐、優(yōu)質(zhì)服務(wù)和技術(shù)保障。目前我們擁有的各類網(wǎng)管系統(tǒng)、業(yè)務(wù)支撐系統(tǒng)、OA、財(cái)務(wù)系統(tǒng)、CRM等IT系統(tǒng),只保證了服務(wù)的質(zhì)量和效率,標(biāo)準(zhǔn)流程則負(fù)責(zé)監(jiān)控IT服務(wù)的運(yùn)行狀況、人員素質(zhì)關(guān)系到服務(wù)質(zhì)量的高低。應(yīng)針對IT管理的不同應(yīng)用環(huán)境及企業(yè)自身的需求,按照ITIL方法論的指導(dǎo),從技術(shù)、人員、流程3方面入手,建設(shè)ITIL服務(wù)管理體系。
(1)技術(shù)方面要以業(yè)務(wù)驅(qū)動(dòng),設(shè)計(jì)以ITIL為核心的IT系統(tǒng)體系架構(gòu),推動(dòng)技術(shù)支持人員技能的全面和精深。
(2)人員方面進(jìn)行IT組織結(jié)構(gòu)、人員角色及職責(zé)設(shè)計(jì),確保關(guān)鍵業(yè)務(wù)的服務(wù)質(zhì)量,并能使之不斷改善。
(3)流程方面以“端到端的服務(wù)保障”為目標(biāo),搭建服務(wù)流程的框架,細(xì)化流程步驟,賦予崗位相應(yīng)的職責(zé)。
這3個(gè)要素互相關(guān)聯(lián)、互相制約,共同決定組織業(yè)務(wù)運(yùn)作的成效。ITIL強(qiáng)調(diào)的就是技術(shù)、人員和流程等要素的有機(jī)結(jié)合。
另一方面,由于ITIL核心流程眾多,對希望實(shí)施IT服務(wù)管理的組織而言,都面臨一個(gè)問題:如何合理有效地選擇和利用IT服務(wù)管理理論,以及由多家公司提供的功能千差萬別的工具來提高自己的IT管理水平,使其支持公司目前和以后的業(yè)務(wù)運(yùn)營?
經(jīng)驗(yàn)表明,那些抱有過高期望、不分析現(xiàn)狀和實(shí)際需求、沒有全面規(guī)劃項(xiàng)目實(shí)施的組織往往會(huì)遇到一系列問題,如缺少計(jì)劃、費(fèi)用太高、阻力太大等,難于成功實(shí)施IT服務(wù)管理實(shí)現(xiàn)預(yù)期目標(biāo),甚至使本來混亂的IT管理更加混亂。因此,必須站在公司和組織的高度,從整體上考慮IT服務(wù)管理的實(shí)施問題。
實(shí)施ITIL并不是要全部照搬、不加選擇的一股腦都上,應(yīng)根據(jù)業(yè)務(wù)需要和特點(diǎn)選擇重點(diǎn)實(shí)施,先把目光放在那些易于達(dá)成的目標(biāo)上(即能通過ITIL實(shí)施獲取最大價(jià)值的地方),結(jié)合戴明PDCA的環(huán)思想,不斷加以改進(jìn)和提高。
某電信運(yùn)營企業(yè)省級網(wǎng)絡(luò)支撐中心,管理著遍布全省的傳輸、程控、互聯(lián)網(wǎng)設(shè)備和幾乎全部的業(yè)務(wù)支撐系統(tǒng),如省級DWDM環(huán)路,省干網(wǎng)、地市分公司IP城域網(wǎng)核心設(shè)備;客服系統(tǒng)、辦公OA、運(yùn)維OA、建設(shè)項(xiàng)目審批系統(tǒng)、物資管理系統(tǒng)、DNS系統(tǒng)、寬窄帶認(rèn)證計(jì)費(fèi)系統(tǒng)與營帳系統(tǒng)、固話計(jì)費(fèi)系統(tǒng)和營業(yè)系統(tǒng)、大客戶系統(tǒng)、號(hào)線系統(tǒng)、公司門戶網(wǎng)站和郵件系統(tǒng)、互聯(lián)網(wǎng)、信令網(wǎng)、交換網(wǎng)網(wǎng)管系統(tǒng)等。負(fù)責(zé)實(shí)時(shí)監(jiān)控和維護(hù)全省范圍內(nèi)骨干網(wǎng)絡(luò)運(yùn)行情況和互聯(lián)網(wǎng)出口質(zhì)量情況,及時(shí)組織處理各類故障與問題,對省內(nèi)干線基礎(chǔ)通信資源進(jìn)行調(diào)配,配置省干網(wǎng)、地市分公司IP城域網(wǎng)核心設(shè)備數(shù)據(jù),統(tǒng)計(jì)網(wǎng)絡(luò)流量及時(shí)向上級主管部門提出網(wǎng)絡(luò)優(yōu)化、擴(kuò)容建議。
隨著公司業(yè)務(wù)規(guī)模的快速擴(kuò)大,業(yè)務(wù)種類多樣化,前端各部門對運(yùn)維部門工作質(zhì)量的要求越來越高。網(wǎng)絡(luò)資源是電信業(yè)務(wù)開展、爭取客戶資源的基礎(chǔ)和保障,其工作的效率和質(zhì)量是電信企業(yè)綜合實(shí)力的體現(xiàn),其質(zhì)量的好壞直接關(guān)系著服務(wù)質(zhì)量。如何提高資源的有效利用率,協(xié)調(diào)省分公司的網(wǎng)絡(luò)維護(hù)工作等是運(yùn)維工作首要考慮和解決的問題[3]。該電信運(yùn)營企業(yè)運(yùn)用ITIL思想、先進(jìn)實(shí)用的技術(shù)手段,整合運(yùn)維生產(chǎn)的各類業(yè)務(wù)流程,構(gòu)建出高效、全面、安全與可靠的運(yùn)維信息系統(tǒng),實(shí)現(xiàn)運(yùn)維工作的制度化、流程化、規(guī)范化、電子化和高效化管理,重點(diǎn)在以下幾個(gè)方面進(jìn)行了實(shí)施:
嚴(yán)格按照標(biāo)準(zhǔn)機(jī)房要求,建立了各種制度,包括:值班制度、交接班制度、崗位責(zé)任制度、外來人員入室制度、機(jī)房安全制度、維護(hù)工作紀(jì)律、故障管理制度、技術(shù)資料管理制度、備件工具儀表管理制度、工單執(zhí)行管理制度、保密制度以及二線值班制度等,將重要制度在機(jī)房、值班室內(nèi)上墻,所有制度均打印放在值班室備查,并堅(jiān)持按照制度嚴(yán)格執(zhí)行。
按照緊急程度不同,分緊急、重大故障、個(gè)別用戶上報(bào)3種故障級別,明確故障處理流程、操作步驟和處理時(shí)限要求,明確省網(wǎng)管中心和地市維護(hù)中心的職責(zé)分工。對于發(fā)現(xiàn)的問題,由10050客服中心統(tǒng)一受理,系統(tǒng)形成故障處理工單并下發(fā)到相關(guān)部門,按照5清要求記錄故障處理時(shí)間、地點(diǎn)、過程、原因、影響范圍,返回故障發(fā)現(xiàn)方確認(rèn),形成閉環(huán)電子記錄。在故障跟蹤上,采取周報(bào)和月報(bào)結(jié)合公布的方法,如每周統(tǒng)計(jì)每個(gè)分公司當(dāng)周的故障申告率、處理完成率和處理及時(shí)率,以及“三率”的環(huán)比,每月統(tǒng)計(jì)并公布各地市分公司故障工單超時(shí)率和重復(fù)率情況,納入考核工作。
對省網(wǎng)管中心負(fù)責(zé)的核心交換機(jī)、路由器等設(shè)備的路由數(shù)據(jù)、策略數(shù)據(jù)、接口數(shù)據(jù)、地址池?cái)?shù)據(jù)、設(shè)備管理權(quán)限數(shù)據(jù)、認(rèn)證數(shù)據(jù)、vlan劃分?jǐn)?shù)據(jù)、互聯(lián)網(wǎng)出口的流量調(diào)整數(shù)據(jù),各類小型機(jī)、服務(wù)器的硬件參數(shù)、各類系統(tǒng)的用戶數(shù)據(jù)、系統(tǒng)數(shù)據(jù)進(jìn)行統(tǒng)一管理,構(gòu)架了IT基礎(chǔ)設(shè)施清晰又彼此關(guān)聯(lián)的資產(chǎn)臺(tái)賬。
對省互聯(lián)網(wǎng)省級中心管理范圍的網(wǎng)絡(luò)運(yùn)行情況集中監(jiān)控:包括監(jiān)控省干網(wǎng)、城域網(wǎng)設(shè)備的狀態(tài)、端口狀態(tài)、鏈路狀態(tài),做好設(shè)備性能監(jiān)控、端口流量監(jiān)控、設(shè)備日志監(jiān)控,異常流量監(jiān)控,互聯(lián)網(wǎng)自租出口的流量監(jiān)控與出口擁塞程度監(jiān)控;對DNS系統(tǒng)解釋成功率,解釋時(shí)延進(jìn)行監(jiān)控,對寬窄帶認(rèn)證計(jì)費(fèi)系統(tǒng)與營帳系統(tǒng)的認(rèn)證,業(yè)務(wù)受理功能和系統(tǒng)服務(wù)器的狀態(tài)、性能、存儲(chǔ)空間進(jìn)行監(jiān)控。
每日對自租出口進(jìn)行測速,對于由于流量擁塞引起的質(zhì)量下降,及時(shí)進(jìn)行流量調(diào)整。每日對網(wǎng)絡(luò)流量成份進(jìn)行統(tǒng)計(jì),分析流量波動(dòng)超過10%的原因。每月對系統(tǒng)的用戶到達(dá)數(shù),曾經(jīng)上線數(shù)、用戶上網(wǎng)時(shí)長、平均用戶上網(wǎng)流量等數(shù)據(jù)進(jìn)行分析,對比用戶行為的變化趨勢。每周對地市城域網(wǎng)省干上行鏈路帶寬利用率進(jìn)行分析,如果上行鏈路出現(xiàn)鏈路連續(xù)3天利用率超過70%就提出預(yù)警,超過80%就提出向資源調(diào)度部門擴(kuò)容申請。
使用ADSL端口速率達(dá)標(biāo)率和IP城域網(wǎng)網(wǎng)絡(luò)時(shí)延合格率2個(gè)指標(biāo),進(jìn)行監(jiān)測寬帶用戶接入質(zhì)量。采取進(jìn)出口測試和隨機(jī)測試相結(jié)合的方式,加強(qiáng)面向用戶感知的端到端質(zhì)量管理。通過精細(xì)化路由策略,優(yōu)先指向骨干網(wǎng)出口;采取流量分時(shí)段流控,實(shí)現(xiàn)削峰填谷,提高合理業(yè)務(wù)用戶的上網(wǎng)感知度;在出口流控設(shè)備上采集用戶行為分析報(bào)表,積累歷史數(shù)據(jù),為今后的流量分析、流量調(diào)整和流控策略優(yōu)化提供依據(jù)。策略應(yīng)用前后端口流量對比如圖2。
圖2 策略應(yīng)用前后端口流量對比效果圖
通過實(shí)施IT服務(wù)管理,公司節(jié)約了運(yùn)維成本,提高了工作效率,促進(jìn)了運(yùn)維管理結(jié)構(gòu)的變化,提高了網(wǎng)絡(luò)調(diào)度開通、故障處理等的效率,取得較好的效果。統(tǒng)計(jì)數(shù)據(jù)顯示,運(yùn)維成本逐漸降低,而運(yùn)維質(zhì)量在逐年提升。
目前,我國電信運(yùn)營商間一味拼覆蓋、比放號(hào)的時(shí)代即將過去,“服務(wù)競爭”的時(shí)代已經(jīng)來臨。電信行業(yè)應(yīng)站在整個(gè)行業(yè)組織的戰(zhàn)略高度,基于其業(yè)務(wù)特性,引入IT 服務(wù)管理的方法論,基于整個(gè)組織的IT運(yùn)維管理,有針對性地提出具體改進(jìn)方法與實(shí)踐。這是一個(gè)長期的系統(tǒng)化的優(yōu)化改善過程,只有各方共同聯(lián)手,ITIL的最佳實(shí)踐方法才能最終生產(chǎn)出豐厚的果實(shí)。
[1]孫 強(qiáng),左天祖,劉 偉. IT服務(wù)管理[M]. 北京:機(jī)械工業(yè)出版社,2004.
[2]陳 龍,張春紅,云 亮,等.電信運(yùn)營支撐系統(tǒng)[M]. 北京:人民郵電出版社,2005.
[3]柳向前. 在電信運(yùn)營商的運(yùn)行維護(hù)系統(tǒng)中應(yīng)用ITIL[J]. 現(xiàn)代電信科技,2005(4):63-67.