許云飛
(中移鐵通吉林分公司,吉林 長春 130012)
提升傳輸系統(tǒng)故障工單壓縮比
許云飛
(中移鐵通吉林分公司,吉林 長春 130012)
隨著傳輸系統(tǒng)故障集中化管理的不斷推進(jìn),如何提升傳輸系統(tǒng)故障工單壓縮比,從而提升傳輸維護(hù)人員故障處理的效率,這成為了傳輸故障集中化管理的第一課題。提升傳輸系統(tǒng)故障工單壓縮比是傳輸系統(tǒng)集中化故障管理的關(guān)鍵因素,主要論述通過對(duì)傳輸系統(tǒng)的告警進(jìn)行統(tǒng)計(jì)和分析,制訂了方案,以提升傳輸系統(tǒng)故障工單壓縮比。
閉環(huán)處理;故障工單;傳輸系統(tǒng);維護(hù)系統(tǒng)
2013年,吉林移動(dòng)全面推進(jìn)集中化故障管理改革,全部傳輸系統(tǒng)告警由省網(wǎng)管中心監(jiān)控室以故障工單形式派發(fā)至各地市一線維護(hù)班組進(jìn)行閉環(huán)處理。隨著傳輸系統(tǒng)故障集中化管理的不斷推進(jìn),如何提升傳輸系統(tǒng)故障工單壓縮比,從而提升傳輸維護(hù)人員故障處理的效率,成為了傳輸故障集中化管理的第一課題。
告警(Alarm),是指對(duì)于網(wǎng)絡(luò)設(shè)備、系統(tǒng)資源等出現(xiàn)異常的情況進(jìn)行報(bào)告。故障工單是吉林移動(dòng)特有的辦公自動(dòng)化系統(tǒng)之一,主要輔助維護(hù)人員對(duì)故障、投訴的閉環(huán)處理。
傳輸系統(tǒng)故障工單壓縮比的計(jì)算方式為:(傳輸系統(tǒng)告警觸發(fā)工單數(shù)-實(shí)際派發(fā)傳輸故障工單數(shù))/傳輸系統(tǒng)告警觸發(fā)工單數(shù)。
2016年,平均每月傳輸系統(tǒng)告警觸發(fā)工單數(shù)為35 151.90個(gè)、實(shí)際派發(fā)傳輸故障工單數(shù)為22 670.40個(gè),傳輸系統(tǒng)故障工單壓縮比為35.58%.
通過《電子運(yùn)行維護(hù)系統(tǒng)》采集數(shù)據(jù)分析的方法,對(duì)影響我省傳輸系統(tǒng)故障工單壓縮比的因素進(jìn)行統(tǒng)計(jì),影響因素所占比例依次為:電力原因占30.76%、光纜故障占18.80%、用戶原因占18%、無效告警占17.3%、工程割接占8.16%、人為原因占3.13%、支撐手段不到位占2.81%、其他原因占1.04%.最終定位影響傳輸系統(tǒng)故障工單壓縮比的主要原因?yàn)殡娏υ?、光纜故障、用戶原因、無效告警。通過數(shù)據(jù)統(tǒng)計(jì),實(shí)現(xiàn)傳輸、動(dòng)環(huán)專業(yè)跨專業(yè)成功率為20%,成功率較低,確定缺少跨專業(yè)派單規(guī)則是電力原因影響工單壓縮比的主要原因。經(jīng)統(tǒng)計(jì),傳輸專業(yè)故障工單中,同一故障導(dǎo)致工單關(guān)聯(lián)率低于20%,確定缺少智能衍生規(guī)則是光纜故障影響工單壓縮比的要因。經(jīng)確認(rèn)發(fā)現(xiàn),80%的故障工單為用戶側(cè)斷電引起的無效工單,有效工單占20%.按照日粒度統(tǒng)計(jì)傳輸現(xiàn)網(wǎng)告警統(tǒng)計(jì)結(jié)果發(fā)現(xiàn),四維告警所占比例均大于50%,確定四維告警所占比例大是無效告警影響工單壓縮比的主要原因。
由于電力原因造成傳輸線路上報(bào)大量告警,產(chǎn)生了大量傳輸故障工單。因此,小組編寫了跨專業(yè)告警關(guān)聯(lián)規(guī)則,將動(dòng)環(huán)、傳輸專業(yè)的不同告警有機(jī)聯(lián)系在一起,并關(guān)聯(lián)生成一張根源工單,通過省內(nèi)動(dòng)環(huán)、傳輸專業(yè)告警資源來搭建跨專業(yè)告警關(guān)聯(lián)派單模型,有效提升了跨專業(yè)告警關(guān)聯(lián)故障定位的準(zhǔn)確性、及時(shí)性。
電力停電因素導(dǎo)致的月均工單量為6 974張,實(shí)施跨專業(yè)關(guān)聯(lián)規(guī)則的手段以后,工單量減少至3 843張,工單量大幅度壓縮,傳輸故障工單壓縮比由35.58%提升至44.41%.
當(dāng)傳輸線路中斷時(shí),除了產(chǎn)生主要告警外,還會(huì)產(chǎn)生大量衍生告警,產(chǎn)生大量故障工單,影響了傳輸工單壓縮比。因此,應(yīng)制訂傳輸環(huán)一點(diǎn)中斷衍生規(guī)則、傳輸同環(huán)多網(wǎng)元中斷衍生規(guī)則。規(guī)則上線前,因光纜故障因素導(dǎo)致的月均工單量為4 262張,實(shí)施智能衍生規(guī)則手段以后,工單量減少至2 288張,工單量得到大幅度壓縮,傳輸系統(tǒng)故障工單壓縮比由44.41%提升至50.25%.
原有的家寬告警標(biāo)準(zhǔn)化字段缺少故障設(shè)備與場(chǎng)景、小區(qū)、用戶的關(guān)聯(lián)信息,工單只能體現(xiàn)出故障網(wǎng)元的類型、端口、板卡等一些基本信息,維護(hù)人員無法從故障工單中判斷出設(shè)備場(chǎng)景、用戶類型及影響范圍等關(guān)鍵信息,且用戶側(cè)斷電導(dǎo)致PON口類大量工單的派發(fā),維護(hù)人員難以判定導(dǎo)致PON口故障的真實(shí)原因,耗費(fèi)了大量的人力、物力來判斷故障產(chǎn)生的真實(shí)原因,導(dǎo)致一線維護(hù)工作量大,影響了維護(hù)人員對(duì)重點(diǎn)區(qū)域、重點(diǎn)故障的快速響應(yīng)。
通過對(duì)工單的分類分析,由于小區(qū)停電、用戶側(cè)斷電導(dǎo)致的PON口中斷類工單占55%以上。針對(duì)這一現(xiàn)狀,小組成員重點(diǎn)對(duì)PON口中斷類故障進(jìn)行了深入分析發(fā)現(xiàn),對(duì)判斷PON口中斷類故障有效的關(guān)鍵字段為“告警原因”“附加信息”。引起PON口中斷的原因?yàn)樾^(qū)停電、光纜中斷等。因此,對(duì)不同因素導(dǎo)致的PON口故障進(jìn)行了分類處理。
規(guī)則原理為:利用ONU掉線前回傳給OLT其下線原因的能力,判斷PON口中斷的根本原因,PON專業(yè)網(wǎng)管通過“告警原因”“附加信息”字段呈現(xiàn)出來,故障管理系統(tǒng)通過對(duì)該字段的自動(dòng)解析,抑制由于用戶側(cè)斷電類故障產(chǎn)生的工單。上述措施實(shí)施前,因用戶側(cè)因素導(dǎo)致的月均工單量為4 080張,實(shí)施增加家寬關(guān)聯(lián)告警字段手段以后,工單量減少至1 810張,工單量得到大幅度壓縮,鐵通代維故障工單壓縮比由50.25%提升至56.71%.
告警是判斷網(wǎng)絡(luò)是否異常的重要標(biāo)準(zhǔn),每日大量的過量、過頻、過長、過短告警存在于網(wǎng)絡(luò)中,甚至個(gè)別網(wǎng)元每日會(huì)產(chǎn)生超過千條的告警,大量工單堆積,難于判斷出根本原因,導(dǎo)致傳輸工單量飆升,造成傳輸網(wǎng)絡(luò)存在大量的安全隱患不能被及時(shí)處理。通過分析四維告警、數(shù)據(jù)統(tǒng)計(jì)、分析定位、處理建議等措施,實(shí)現(xiàn)了故障定位,進(jìn)而提高了人工預(yù)處理的效率,保障了網(wǎng)絡(luò)的健康、穩(wěn)定運(yùn)行。對(duì)全省傳輸網(wǎng)絡(luò)過頻告警top3告警及網(wǎng)元進(jìn)行了統(tǒng)計(jì),傳輸PTN網(wǎng)絡(luò)中的ETH_LOS告警量尤為突出,小組成員通過對(duì)告警產(chǎn)生的原因分析,提出了合理化的解決方案,具體如圖1所示。
對(duì)傳輸網(wǎng)絡(luò)中過長、過短告警及網(wǎng)元進(jìn)行了統(tǒng)計(jì),查找到了主要原因,并制定了解決方案,如圖2所示。
按照統(tǒng)計(jì)傳輸現(xiàn)網(wǎng)告警,小組經(jīng)過告警溯源分析,確定了產(chǎn)生過量、過頻、過長、過短告警的原因,對(duì)各地市進(jìn)行了告警跟蹤,通過維護(hù)人員進(jìn)站維修、屏蔽無效告警、規(guī)范流程等,告警整治工作效果顯著。上述措施實(shí)施前,因無效告警因素導(dǎo)致的月均工單量為3 923張,實(shí)施策略后,告警量及工單量得到大幅度縮減,工單量下降至2 288張,傳輸系統(tǒng)故障工單壓縮比由56.71%提升至61.36%.
圖1 合理化的解決方案
圖2 解決方案
在實(shí)施完所有措施后,對(duì)工單壓縮比進(jìn)行了檢查,針對(duì)2017-01—2017-03傳輸故障工單壓縮比進(jìn)行了統(tǒng)計(jì),電力原因所占比例由30.76%下降至28.29%、光纜故障所占比例由18.80%下降至16.28%、用戶原因所占比例由18%下降至13.33%、無效告警所占比例由17.3%下降至16.84%,故障工單壓縮比從35.58%提升至61.36%.
通過采取對(duì)策,降低了無效告警量,減少了無效工單的派發(fā),為傳輸維護(hù)工作節(jié)約了大量的人力、物力成本,提升了故障處理效率及維護(hù)成本。
U284.92
A
10.15913/j.cnki.kjycx.2017.20.107
2095-6835(2017)20-0107-02
〔編輯:張思楠〕