余艷 張炳 易鳴 中國(guó)電信股份有限公司江西分公司無(wú)線網(wǎng)絡(luò)優(yōu)化中心 南昌市 330046
關(guān)鍵字:故障自動(dòng)定位 集約化 市縣環(huán)網(wǎng)
長(zhǎng)期以來(lái),傳輸故障工單都是基于告警派發(fā),一線人員收到工單后,需要根據(jù)不同網(wǎng)元、單板、端口上報(bào)的告警信息人工分析故障原因和段落。自傳輸故障工單集約化管理后,各廠家網(wǎng)管發(fā)現(xiàn)的告警不再經(jīng)各級(jí)監(jiān)控中心轉(zhuǎn)派,而是上報(bào)給服保系統(tǒng)直接派到各處理工位,節(jié)省中間轉(zhuǎn)派環(huán)節(jié)時(shí)長(zhǎng),將故障處理時(shí)間更多的留給一線,但此舉同時(shí)弱化了省、市相關(guān)專業(yè)管控條線對(duì)市縣、縣縣網(wǎng)絡(luò)中斷故障的管控,長(zhǎng)時(shí)間沒(méi)人搶修、沒(méi)有對(duì)故障進(jìn)行應(yīng)急調(diào)度,極易導(dǎo)致環(huán)網(wǎng)節(jié)點(diǎn)脫網(wǎng),嚴(yán)重時(shí)還會(huì)導(dǎo)致整個(gè)縣局幾萬(wàn)甚至上十萬(wàn)用戶業(yè)務(wù)全部中斷,嚴(yán)重影響客戶感知。
為提高故障處理效率,縮短故障判斷時(shí)長(zhǎng),江西電信通過(guò)2年的迭代創(chuàng)新,開(kāi)發(fā)出了系統(tǒng)故障自動(dòng)定位系統(tǒng),可同步監(jiān)控不同廠家設(shè)備類型的網(wǎng)絡(luò)故障,及時(shí)督促地市及時(shí)搶修,有計(jì)劃的對(duì)其進(jìn)行應(yīng)急調(diào)度,確保市縣節(jié)點(diǎn)不脫網(wǎng),進(jìn)一步打造高質(zhì)量的網(wǎng)絡(luò),提升客戶服務(wù)能力和水平,助力企業(yè)高質(zhì)量跨越式發(fā)展。
因省內(nèi)使用的傳輸設(shè)備和網(wǎng)管涵蓋不同廠商設(shè)備,需在第三方網(wǎng)管上實(shí)時(shí)采集廠商網(wǎng)管的告警數(shù)據(jù)并加以分析,從而實(shí)現(xiàn)故障的自動(dòng)定位。整個(gè)系統(tǒng)架構(gòu)包括:廠家網(wǎng)管、采集控制層、數(shù)據(jù)適配層、綜合網(wǎng)管數(shù)據(jù)中心。
(1)廠家網(wǎng)管:華為、中興、烽火等廠家網(wǎng)管。
(2)采集控制層:通過(guò)接口對(duì)各廠家網(wǎng)管或者其他外部系統(tǒng)接入的配置、告警、性能、消息、日志、操作指令等數(shù)據(jù)進(jìn)行采集。
(3)數(shù)據(jù)適配層:由于各廠家的數(shù)據(jù)格式不一樣,需要根據(jù)采集同步到數(shù)據(jù)進(jìn)行適配整合成傳輸綜合網(wǎng)管系統(tǒng)能識(shí)別的數(shù)據(jù)格式。
(4)綜合網(wǎng)管數(shù)據(jù)中心:對(duì)適配后的數(shù)據(jù)進(jìn)行故障分析,將故障結(jié)果按照模板展示出來(lái)并通過(guò)短信平臺(tái)發(fā)送出去。
圖1 系統(tǒng)架構(gòu)模型圖
本系統(tǒng)主要通過(guò)對(duì)網(wǎng)管基礎(chǔ)數(shù)據(jù)采集適配,實(shí)現(xiàn)了基礎(chǔ)數(shù)據(jù)的還原,根據(jù)采集同步到的告警信息進(jìn)行自動(dòng)判斷和定位。
各廠商網(wǎng)管與綜合網(wǎng)管之間的接口采取了集團(tuán)規(guī)范的I2接口,I2接口相比對(duì)corba接口增加了南向的內(nèi)容,但同時(shí)也簡(jiǎn)化了corba接口的部分北向內(nèi)容,因此需要由傳輸綜合網(wǎng)管配置適配程序?qū)ν降降呐渲脭?shù)據(jù)進(jìn)行適配轉(zhuǎn)換,形成傳輸系統(tǒng)的資源格式。
圖2 基礎(chǔ)數(shù)據(jù)還原流程圖
(1)對(duì)鏈型組網(wǎng)和環(huán)形組網(wǎng)的OTN網(wǎng)絡(luò),傳輸綜合網(wǎng)管通過(guò)I2接口查詢廠家網(wǎng)管拓?fù)渥泳W(wǎng)、OMS通道,OTS通道信息,并分別還原出傳輸OTN環(huán)網(wǎng)、傳輸復(fù)用段、傳輸系統(tǒng)段等內(nèi)容。
圖3 還原出的OTN環(huán)網(wǎng)圖
(2)對(duì)鏈形、相交環(huán)、相切環(huán)、疊加環(huán)、環(huán)帶鏈等各種復(fù)雜組網(wǎng)方式的SDH網(wǎng)絡(luò),通過(guò)查詢廠家網(wǎng)管的所有光纖連接信息、纖纜連接的A端和Z端端口、保護(hù)組保護(hù)關(guān)系(工作端口和保護(hù)端口),保存在傳輸綜合網(wǎng)管數(shù)據(jù)庫(kù)中,形成一個(gè)自有的資源池,在資源池的基礎(chǔ)上制定判斷邏輯進(jìn)行反復(fù)搜尋和判斷。
圖4 還原出的SDH環(huán)網(wǎng)圖
通過(guò)以上邏輯和方法判斷形成的傳輸環(huán)網(wǎng)、復(fù)用段、系統(tǒng)段數(shù)據(jù),增量更新資源池平臺(tái),并將還原出的傳輸環(huán)網(wǎng)與專業(yè)網(wǎng)管的網(wǎng)元、拓?fù)溥B接形成關(guān)聯(lián)數(shù)據(jù),用于傳輸環(huán)網(wǎng)故障定位分析。
基于還原出來(lái)的OTN、SDH傳輸環(huán)網(wǎng)、復(fù)用段、系統(tǒng)段數(shù)據(jù),制定了故障定位總體流程,并對(duì)故障告警定位判斷規(guī)則進(jìn)行了分類細(xì)化。
(1)故障定位分析總體流程如下:
圖5 故障定位分析總體流程
(2)故障告警定位判斷規(guī)則如下:
當(dāng)系統(tǒng)出現(xiàn)中斷類的告警時(shí),按照以下規(guī)則進(jìn)行分析:
圖6 復(fù)用段示意圖
分析的中斷類告警對(duì)象:OSC信號(hào)丟失,輸入合路信號(hào)丟失,光線路信號(hào)丟失。
判斷規(guī)則:
I:OSC信號(hào)丟失出現(xiàn)的段落為故障段落。
II:非OSC信號(hào)丟失的告警,互收告警的段落為故障段落,如A收B,且B收A。
III:非OSC信號(hào)丟失的告警,最靠近發(fā)端的段落為故障段落。
實(shí)現(xiàn)方式:首先,判斷是否是中斷類告警,若是,執(zhí)行規(guī)則I,輸出故障段落;若不是OSC信號(hào)丟失,執(zhí)行規(guī)則II,再判斷,是否輸入故障段落;若未執(zhí)行規(guī)則一和規(guī)則二,則執(zhí)行規(guī)則三,對(duì)規(guī)則三的執(zhí)行需要每次都進(jìn)行追溯,直至找到最終段落。
(1)2019年在江西電信全省傳輸網(wǎng)絡(luò)實(shí)施,目前主要用于市-縣、縣-縣的傳輸故障及段落自動(dòng)定位。2019年全省市縣環(huán)網(wǎng)節(jié)點(diǎn)0脫網(wǎng)。實(shí)時(shí)中斷情況及段落提示如下:
圖7 綜合網(wǎng)管故障定位結(jié)果圖
(2)C3環(huán)網(wǎng)中斷光纜故障時(shí)間達(dá)到考核要求,通過(guò)2019年10-12月數(shù)據(jù)分析發(fā)現(xiàn),在創(chuàng)新C3傳輸環(huán)網(wǎng)故障快速定位手段后,C3光纜中斷修復(fù)時(shí)長(zhǎng)平均為311分鐘,低于360分鐘的考核修復(fù)時(shí)長(zhǎng)。
圖8 故障自動(dòng)定位后修復(fù)時(shí)長(zhǎng)對(duì)比圖
我們將傳輸專業(yè)的基礎(chǔ)數(shù)據(jù)還原方法推廣到OLT雙上聯(lián)隱患排查行動(dòng)中,助力企業(yè)2019年兩千戶OLT全部完成雙上行隱患改造、千戶OLT雙上行隱患改造完成率達(dá)99.62%,順利完成中國(guó)電信集團(tuán)的考核指標(biāo)。
圖9 OLT雙上聯(lián)整治率圖
江西電信為推進(jìn)傳輸集約化維護(hù),基于傳輸綜合網(wǎng)管開(kāi)發(fā)了故障自動(dòng)定位系統(tǒng),首次實(shí)現(xiàn)了跨廠家故障的統(tǒng)一智能分析和快速定位,有效的指導(dǎo)一線精準(zhǔn)維護(hù),進(jìn)一步提高了傳輸基礎(chǔ)網(wǎng)絡(luò)的健壯性,更好的為客戶提供高質(zhì)量的服務(wù)。