陸 震 蔣永西 張正鍇 莊 靜
1.中郵建技術(shù)有限公司;2.南京科通通信工程技術(shù)服務(wù)有限公司
在人工智能的共識(shí)下,新世紀(jì)的通信運(yùn)營(yíng)商深刻認(rèn)識(shí)到在行業(yè)新常態(tài)下面對(duì)這樣的新挑戰(zhàn),需要不斷提升業(yè)務(wù)水平和服務(wù)能力,滿(mǎn)足移動(dòng)互聯(lián)時(shí)代快速響應(yīng)和端到端服務(wù)的巨大需求,確保為客戶(hù)提供最優(yōu)質(zhì)的服務(wù)體驗(yàn)。而滿(mǎn)足客戶(hù)需求和提供優(yōu)質(zhì)服務(wù)的一個(gè)重要前提是將人工智能的思維形態(tài)和維護(hù)模式作為現(xiàn)階段通信運(yùn)營(yíng)商實(shí)現(xiàn)新發(fā)展、獲得新成就的核心引擎。
通信維護(hù),作為整個(gè)通信生態(tài)至關(guān)重要的一環(huán),對(duì)通信網(wǎng)絡(luò)的正常運(yùn)營(yíng)和客戶(hù)的使用感知,都有著直接和廣泛的影響。目前,通信設(shè)備維護(hù)量巨大,人均維護(hù)設(shè)備數(shù)量提升超過(guò)50%,而且隨著用戶(hù)數(shù)量的增加不斷增多,在基本實(shí)現(xiàn)集約增效的前提下,迫切需要深入貫徹人工智能思維,進(jìn)一步利用智能化工具深度優(yōu)化維護(hù)工作,顯著提升客戶(hù)感知和業(yè)務(wù)效率,完善通信運(yùn)營(yíng)商的集約維護(hù)運(yùn)營(yíng)體系。
1.1.1 網(wǎng)絡(luò)演進(jìn)
隨著百兆寬帶、高清ITV及LTE業(yè)務(wù)的部署和發(fā)展,通信網(wǎng)絡(luò)中的設(shè)備種類(lèi)多樣性越發(fā)顯著,集中化趨勢(shì)越來(lái)越明顯,設(shè)備的集中化帶來(lái)監(jiān)控集約化,分散式交換演變?yōu)镮MS,數(shù)據(jù)專(zhuān)業(yè)扁平化,平臺(tái)專(zhuān)業(yè)云化。需要更先進(jìn)的維護(hù)手段才能滿(mǎn)足集中化網(wǎng)絡(luò)。
網(wǎng)絡(luò)集中化后,大量設(shè)備使得現(xiàn)網(wǎng)的復(fù)雜程度和網(wǎng)絡(luò)容量成級(jí)數(shù)倍的上升,現(xiàn)網(wǎng)的網(wǎng)絡(luò)管理需要一種更加精細(xì)化和智慧化的網(wǎng)絡(luò)監(jiān)控手段。
以某省一家通信運(yùn)營(yíng)商為例,日均告警量已達(dá)140萬(wàn)條,需要預(yù)處理的告警5700條,工單2633張,監(jiān)控人員預(yù)處理人員只有33人,人均工作超負(fù)荷,預(yù)處理及時(shí)率和準(zhǔn)確率無(wú)法保證,故障告警預(yù)處理人員需掌握不同廠(chǎng)家設(shè)備處理方法,難以深入處理。
這就需要集中監(jiān)控和集約化維護(hù)向智慧監(jiān)控轉(zhuǎn)變,傳統(tǒng)的網(wǎng)絡(luò)運(yùn)維管理方式已經(jīng)無(wú)法滿(mǎn)足“面向端到端業(yè)務(wù),面向客戶(hù)管理”的業(yè)務(wù)需求。為了建立與全業(yè)務(wù)發(fā)展相適應(yīng)的新運(yùn)維故障管理體系,網(wǎng)絡(luò)故障管理應(yīng)該從被動(dòng)的告警監(jiān)控向更智慧的層面上轉(zhuǎn)變。
1.1.2 網(wǎng)絡(luò)監(jiān)控的要求
網(wǎng)絡(luò)集中監(jiān)控以后,省集中監(jiān)控中心不僅是全省網(wǎng)絡(luò)監(jiān)控的第一責(zé)任人,同時(shí)也成為全省網(wǎng)絡(luò)安全運(yùn)行第一責(zé)任人,承擔(dān)全省集中監(jiān)控、網(wǎng)絡(luò)分析、通信保障、客服支撐、設(shè)備資源管理等工作的第一責(zé)任人職責(zé)。在監(jiān)控人員變少,網(wǎng)絡(luò)設(shè)備復(fù)雜的情況下,原有的監(jiān)控模式面臨如下四個(gè)挑戰(zhàn):
(1)發(fā)現(xiàn)和分析挑戰(zhàn)。集中化程度高,集約化、跨專(zhuān)業(yè)影響面大,障礙原因復(fù)雜且難以查找,對(duì)如何發(fā)現(xiàn)定位障礙提出了新的挑戰(zhàn),所以我們要更智慧地發(fā)現(xiàn)和分析,從網(wǎng)絡(luò)告警監(jiān)控向用戶(hù)感知轉(zhuǎn)變:及時(shí)發(fā)現(xiàn)、提前預(yù)警、智能預(yù)處理。
(2)人工調(diào)度,個(gè)性化多。多家分公司維護(hù)人員數(shù)以千計(jì),各分公司網(wǎng)絡(luò)業(yè)務(wù)規(guī)模千差萬(wàn)別,維護(hù)人員業(yè)務(wù)水平參差不齊,造成了人工調(diào)度工單效率低,無(wú)法滿(mǎn)足各分公司個(gè)性化需求。
(3)設(shè)備管理越來(lái)越智能化、集約化后,對(duì)故障遠(yuǎn)程處理和終結(jié)的要求也越來(lái)越高。從現(xiàn)場(chǎng)處理到遠(yuǎn)程處理的轉(zhuǎn)變要求故障處理更加智能化,對(duì)監(jiān)控人員遠(yuǎn)程處理技能相應(yīng)提出了更高的要求。各廠(chǎng)家網(wǎng)管各不同,需要監(jiān)控人員掌握不同廠(chǎng)家設(shè)備處理方法,對(duì)監(jiān)控人員要求高,培訓(xùn)時(shí)間長(zhǎng)。
(4)集中化-集約化-智慧監(jiān)控。網(wǎng)絡(luò)監(jiān)控從集中化到集約化再到智慧監(jiān)控演進(jìn)的過(guò)程中,網(wǎng)絡(luò)越來(lái)越復(fù)雜,設(shè)備越來(lái)越多,傳統(tǒng)的監(jiān)控模式捉襟見(jiàn)肘,無(wú)法適應(yīng)新集約化模式。
工業(yè)4.0人工智能的普及。工業(yè)4.0是德國(guó)政府《德國(guó)2020高技術(shù)戰(zhàn)略》中所提出的十大未來(lái)項(xiàng)目之一。該項(xiàng)目由德國(guó)聯(lián)邦教育局及研究部和聯(lián)邦經(jīng)濟(jì)技術(shù)部聯(lián)合資助,投資預(yù)計(jì)達(dá)2億歐元。旨在提升制造業(yè)的智能化水平,建立具有適應(yīng)性、資源效率及基因工程學(xué)的智慧工廠(chǎng),在商業(yè)流程及價(jià)值流程中整合客戶(hù)及商業(yè)伙伴。其技術(shù)基礎(chǔ)是網(wǎng)絡(luò)實(shí)體系統(tǒng)及物聯(lián)網(wǎng)。人工智能(Artificial Intelligence),英文縮寫(xiě)為AI。它是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。
為解決網(wǎng)絡(luò)集中監(jiān)控后出現(xiàn)的種種挑戰(zhàn),需要從智慧監(jiān)控方面入手,一一解決難題。主要分為四個(gè)方面:智慧發(fā)現(xiàn)、智慧分析、智慧調(diào)度、智慧處理。
2.1.1 跨專(zhuān)業(yè)群障定位
隨著通信運(yùn)營(yíng)商集約化維護(hù)的深入推進(jìn),部分運(yùn)營(yíng)商已實(shí)現(xiàn)了網(wǎng)絡(luò)設(shè)備與客戶(hù)的省級(jí)集中監(jiān)控,以及公眾客戶(hù)申告的集中支撐處理。但跨專(zhuān)業(yè)群障一直是集中監(jiān)控后突破的難點(diǎn),其主要面臨以下困難:涉及面廣、定位滯后、升級(jí)規(guī)范亂、業(yè)務(wù)影響大。解決跨專(zhuān)業(yè)定位和升級(jí)規(guī)范的問(wèn)題,對(duì)集中監(jiān)控質(zhì)量的提升有著重要意義。
某省運(yùn)營(yíng)商通過(guò)應(yīng)用群發(fā)障礙綜合定位平臺(tái)系統(tǒng)發(fā)現(xiàn)跨專(zhuān)業(yè)障礙,采取全省統(tǒng)一跨專(zhuān)業(yè)障礙升級(jí)規(guī)范,解決了長(zhǎng)久以來(lái)集中監(jiān)控面臨的跨專(zhuān)業(yè)障礙發(fā)現(xiàn)難、升級(jí)與交互工作復(fù)雜的問(wèn)題。群發(fā)障礙綜合定位平臺(tái)實(shí)現(xiàn)了集中監(jiān)控過(guò)程中跨專(zhuān)業(yè)、大面積故障快速定位,增強(qiáng)了智能處理手段,提高了障礙處理效率,實(shí)現(xiàn)了以下四大定位:
(1)定位光纜障礙
通過(guò)完善光纜資料,補(bǔ)錄光纜兩端設(shè)備端口信息,實(shí)現(xiàn)光纜與設(shè)備相關(guān)聯(lián),根據(jù)資源系統(tǒng)的數(shù)據(jù)源生成ONU-OLT的鏈路及OLT-BRAS/SR之間的鏈路與纜段的關(guān)系,根據(jù)告警信息查詢(xún)資源可定位到具體光纜。維護(hù)人員不用盲目查找原因,迅速定位障礙點(diǎn),為恢復(fù)障礙贏(yíng)得寶貴時(shí)間。如圖1所示。
圖1 光纜故障與設(shè)備資源關(guān)聯(lián)
(2)定位故障設(shè)備
根據(jù)資源系統(tǒng)的數(shù)據(jù)源生成從ONU到OLT到BRAS/SR的拓?fù)浣Y(jié)構(gòu),根據(jù)具體的告警信息可定位到具體的設(shè)備及其上下聯(lián)設(shè)備以及具體的鏈路信息。例如BRAS下多個(gè)OLT中斷,同時(shí)上聯(lián)的同一BRAS端口有告警,則定位到BRAS端口問(wèn)題。
(3)定位障礙區(qū)域
根據(jù)網(wǎng)元地址、局向信息、光纜信息進(jìn)行定位。例如多個(gè)ONU故障定位到同一條光纜上,或多個(gè)DSLAM故障定位到同一條光纜上。
(4)定位群障申告量
將用戶(hù)資料與網(wǎng)絡(luò)資源關(guān)聯(lián),群障發(fā)生后,通過(guò)調(diào)用資源查詢(xún)?cè)撊赫嫌绊懙乃杏脩?hù),呈現(xiàn)用戶(hù)申告的詳細(xì)信息。從而解決用戶(hù)申告與群障相關(guān)聯(lián)的難題,強(qiáng)化了對(duì)群障影響范圍及申告的掌控。
2.1.2 智能預(yù)警
(1)機(jī)房環(huán)境網(wǎng)絡(luò)智能預(yù)警
主要從以下幾個(gè)方面實(shí)現(xiàn)機(jī)房環(huán)境網(wǎng)絡(luò)智能預(yù)警:1)實(shí)時(shí)發(fā)現(xiàn)機(jī)房電壓、溫度異常,強(qiáng)化性能告警監(jiān)控;2)業(yè)務(wù)中斷前及時(shí)觸發(fā)網(wǎng)絡(luò)預(yù)警;3)根據(jù)關(guān)聯(lián)影響風(fēng)險(xiǎn)的上層業(yè)務(wù)設(shè)備清單自動(dòng)觸發(fā)預(yù)警;4)依據(jù)設(shè)備類(lèi)型分類(lèi),分析影響范圍,實(shí)現(xiàn)從物理底層到應(yīng)用層的全面監(jiān)控。如圖2所示。
圖2 機(jī)房環(huán)境智能預(yù)警
(2)光纜群障智能發(fā)現(xiàn)和預(yù)警
主要有以下幾個(gè)方面(見(jiàn)圖3):
1)智能關(guān)聯(lián)多專(zhuān)業(yè)的告警信息,及時(shí)發(fā)現(xiàn)光纜障礙;2)自動(dòng)預(yù)警受影響范圍和用戶(hù)數(shù),實(shí)現(xiàn)網(wǎng)絡(luò)與上層業(yè)務(wù)的故障關(guān)聯(lián);3)預(yù)警存在風(fēng)險(xiǎn)的業(yè)務(wù),加強(qiáng)巡視備用線(xiàn)路。
圖3 光纜群障智能分析
資源管理支撐智能監(jiān)控精準(zhǔn)定位。包括以下幾個(gè)方面:
(1)開(kāi)發(fā)工具支撐定位異常分析。開(kāi)發(fā)光纜信息查詢(xún)、光纜設(shè)備告警一鍵關(guān)聯(lián)、未歸并光纜關(guān)聯(lián)分析三個(gè)小工具,支撐光纜和光路關(guān)聯(lián)場(chǎng)景歸并定位異常分析。
(2)開(kāi)發(fā)告警定位模擬器支撐定位異常分析。異常定位故障導(dǎo)入案例庫(kù),可調(diào)整告警時(shí)間、告警等級(jí)、處理時(shí)間重新模擬;自動(dòng)提示不符合預(yù)期定位具體判斷規(guī)則,便于告警定位異常分析。
(3)充分利用資源數(shù)據(jù)優(yōu)化規(guī)則。利用資源數(shù)據(jù)做好告警關(guān)聯(lián)歸并,同一故障告警不遺漏;優(yōu)化規(guī)則,充分利用資源關(guān)聯(lián),實(shí)現(xiàn)部分障礙無(wú)告警定位,例如板卡故障無(wú)告警定位。如圖4所示。
圖4 告警關(guān)聯(lián)歸并
2.3.1 建設(shè)“應(yīng)急保障統(tǒng)一溝通平臺(tái)”,提升障礙處理溝通效率
(1)當(dāng)前問(wèn)題與解決辦法
當(dāng)前問(wèn)題:應(yīng)急保障時(shí)多為電話(huà)、點(diǎn)對(duì)點(diǎn)QQ溝通,溝通效率低。
解決辦法:建設(shè)“應(yīng)急保障統(tǒng)一溝通平臺(tái)”。
(2)實(shí)現(xiàn)方法
建設(shè)應(yīng)急保障一鍵召集操作場(chǎng)景,嵌入工單系統(tǒng)。
1)通過(guò)人員姓名、賬號(hào)方式選擇人員,快速新建討論組;2)配置常用維護(hù)組人員模板,實(shí)現(xiàn)一鍵創(chuàng)建討論組;3)支持應(yīng)急保障期間的總結(jié)文檔、過(guò)程記錄等文件留檔;4)實(shí)現(xiàn)網(wǎng)絡(luò)故障工單鏈接分享,方便維護(hù)人員快速了解故障詳情。如圖5所示。
圖5 應(yīng)急保障統(tǒng)一溝通平臺(tái)
2.3.2 利用智慧調(diào)度,實(shí)現(xiàn)接入層監(jiān)控的自動(dòng)化、智能化
(1)工單系統(tǒng)。1)實(shí)現(xiàn)接入層工單自動(dòng)轉(zhuǎn)派、追派、掛起的功能,減輕集中監(jiān)控崗工作量,提升一線(xiàn)人員故障處理效率;2)開(kāi)發(fā)異常工單管控箱、升級(jí)策略等功能,實(shí)現(xiàn)對(duì)乒乓單的人工管控,并對(duì)疑難工單實(shí)行自動(dòng)升級(jí)。如圖6所示。
(2)智慧監(jiān)控管理系統(tǒng)。利用系統(tǒng)將集中實(shí)現(xiàn)轉(zhuǎn)派、追派、掛起規(guī)則的配置。
圖6 異常工單轉(zhuǎn)人工審核
2.4.1 處理能力集中配置、集中呈現(xiàn),提升障礙處理效率
(1)在工單系統(tǒng)的工單內(nèi)容呈現(xiàn)上,增加“智能預(yù)處理”模塊,包括性能、業(yè)務(wù)、定位、指導(dǎo)四大功能,并提供主動(dòng)查詢(xún)按鈕。
(2)將現(xiàn)有預(yù)處理能力以“原子能力”的方式集中管理與呈現(xiàn)。
(3)模塊界面由“智慧監(jiān)控管理系統(tǒng)”集中實(shí)現(xiàn),嵌入工單系統(tǒng)中。
2.4.2 打造集中管理、統(tǒng)一配置的“智慧監(jiān)控管理系統(tǒng)”
(1)新建“智慧監(jiān)控管理系統(tǒng)”,集中配置,統(tǒng)一管理,監(jiān)控日常使用的配置場(chǎng)景集中管理,包括網(wǎng)管配置、告警配置、派單配置、群障配置、預(yù)處理配置等場(chǎng)景。如圖7所示。
(2)與告警系統(tǒng)、工單系統(tǒng)對(duì)接,同步現(xiàn)有的配置能力。
(3)采用“互聯(lián)網(wǎng)+”的設(shè)計(jì)理念,提升用戶(hù)友好性。1)借鑒“淘寶”、“京東”等頁(yè)面的設(shè)計(jì)思路,打破傳統(tǒng)生產(chǎn)系統(tǒng)的配置模式,引入“互聯(lián)網(wǎng)+”的設(shè)計(jì)風(fēng)格;2)關(guān)注用戶(hù)體驗(yàn):頁(yè)面簡(jiǎn)潔大方,交互性強(qiáng),快速配置。
2.4.3 提升配置的靈活性,做到好用、易用
在智慧監(jiān)控管理系統(tǒng)實(shí)現(xiàn)靈活配置:配置元素、條件、結(jié)果進(jìn)行抽象歸類(lèi),實(shí)現(xiàn)組合配置,增加了配置的靈活性。
圖7 策略配置
通過(guò)智慧監(jiān)控,不僅減輕了一線(xiàn)維護(hù)人員的工作壓力,而且提升了故障處理效率??鐚?zhuān)業(yè)分析和故障定位,減少了派發(fā)崗位,以及非處理故障崗位的工單量;智慧分析,能減少用戶(hù)申告,提升客戶(hù)感知度,總體上節(jié)約了維護(hù)的人員。