王林
摘要:中國的發(fā)展正高歌猛進,信息時代的到來也迎來了信息通訊,甚至發(fā)展到了通訊網(wǎng)絡告警。網(wǎng)絡上的信息通訊給人們在生活上、學習上、工作上都帶來了許多的便利,但是凡是都有優(yōu)缺點,萬事都有利弊面。信息通訊網(wǎng)絡告警帶給人們便利的同時,也給人們帶來了告警信息量大而針對告警的有效解決措施低下的問題。為此,本文章在大數(shù)據(jù)分析的基礎(chǔ)上對通信網(wǎng)絡告警存在的一系列問題提出了優(yōu)化的策略。
關(guān)鍵詞:告警;通信網(wǎng)絡告警;閃斷震蕩;大數(shù)據(jù)分析;優(yōu)化;
引言:隨著通訊網(wǎng)絡的產(chǎn)生,告警系統(tǒng)也面世了。為了更好地去管理告警系統(tǒng)并幫助大眾,發(fā)現(xiàn)通信網(wǎng)絡告警存在的一系列問題。據(jù)報道,某省15年加上寬帶、傳輸?shù)绕渌O(shè)備,網(wǎng)絡的規(guī)模空前龐大而且LET基站數(shù)已經(jīng)上升到10萬以上。根據(jù)網(wǎng)絡的拓撲結(jié)構(gòu)來看,一個節(jié)點發(fā)生故障可能會影響多個節(jié)點,這時候告警就受到了影響。這樣的情況會致使:一、有用的網(wǎng)絡信息會被大量的告警風暴埋沒;二、這不僅讓告警信息更加繁瑣還增加了挑選甄別的工作量;三、一條告警信息不能反映多條告警信息之間的邏輯性,沒有辦法對故障進行快速的定位;四、同時或者長時間的上報告警信息,會導致信息堆積,系統(tǒng)癱瘓。
所以,針對上面的大量問題,不能只是對業(yè)務人員的工作能力進行提高,也不能僅僅去優(yōu)化智能監(jiān)控系統(tǒng),而是從根源上遏制住告警風暴的“咽喉”并且提高告警風暴的工作能力及其眾多告警信息之間的邏輯關(guān)系。
一、告警的概念、分類及層次
(一)告警的概念
當設(shè)備故障時,監(jiān)控系統(tǒng)將此故障情況發(fā)出告警信號。所有的故障都有聲光告警和文字提醒。告警的時候,監(jiān)控單元的紅色警告燈會亮,蜂鳴器會發(fā)聲,并且遠端的系統(tǒng)監(jiān)控中心會收到告警的信息。
(二)告警的分類
告警系統(tǒng)一般按照故障嚴重與否分為緊急告警和非緊急告警這兩大類,其中還包括其他的告警,比如空調(diào)設(shè)備告警、電力室設(shè)備告警、無人值守局開門告警、外線電纜故障告警等等。
(三)告警的層次
告警的層級分為列架告警、總告警、機架(柜)告警三大層級。如圖:
二、通信網(wǎng)絡的概念及其網(wǎng)絡結(jié)構(gòu)
(一)通信網(wǎng)絡的概念
通信是人與人之間通過多媒體進行的信息的交流與溝通的傳遞。網(wǎng)絡是用物理連接將一個個個獨立的工作站點或主機連在一起,組成的數(shù)據(jù)鏈路。通信網(wǎng)絡是指將各個獨立的設(shè)備進行物理連接,實現(xiàn)人與計算機、計算機與計算機、人與人之間進行信息交換的方法,從而達到交流通信和資源共享的目的。
(二)通信網(wǎng)絡的網(wǎng)絡結(jié)構(gòu)
根據(jù)計算機基礎(chǔ)課程,可以知道這些網(wǎng)絡拓撲結(jié)構(gòu)就像是串聯(lián)的小燈泡一樣,一個壞掉,其他的也都不能通電。所以這個告警信息就很有必要解決定位的問題,當發(fā)生故障時,告警信息可以定位到故障來源于那個網(wǎng)源,這樣解決起故障來就又省去了不少的麻煩。
三、通訊網(wǎng)絡告警優(yōu)化策略
實施通信警告優(yōu)化策略的三個層級有:綜合網(wǎng)管側(cè)、網(wǎng)源設(shè)備側(cè)、和廠家網(wǎng)管側(cè)。為優(yōu)化綜合網(wǎng)管側(cè),對異構(gòu)多元的告警進行標準處理,并且進行跨廠家、跨專業(yè)的告警工作的優(yōu)化;為優(yōu)化網(wǎng)源設(shè)備側(cè),告警優(yōu)化工作想從上報機制和告警處罰機制的研究著手;為了優(yōu)化廠家網(wǎng)管側(cè),告警優(yōu)化工作針對告警相關(guān)聯(lián)機制作出跨網(wǎng)源的細粒度的工作。摘要中提到,要優(yōu)化通訊網(wǎng)絡告警整個系統(tǒng),不僅要從業(yè)務人員著手,也要對系統(tǒng)本身進行優(yōu)化。首先,為了從硬件上防止告警工作產(chǎn)生故障和問題,為避免通訊網(wǎng)絡告警系統(tǒng)出現(xiàn)問題,工作人員要及時排查維修。其次,網(wǎng)管和業(yè)務人員要嚴格遵守自己的工作,嚴守自己的崗位,對收到的告警信息進行排查病解決各種故障,這要求通訊網(wǎng)絡告警系統(tǒng)的工作人員業(yè)務水平要高,對自己的工作負責人;再者,為了從“軟件”上避免網(wǎng)絡告警系統(tǒng)出現(xiàn)問題,文章提出以下解決方案。
(一)屏蔽無需關(guān)注的告警
在通信網(wǎng)絡告警系統(tǒng)的工作中,系統(tǒng)不能保證發(fā)出的每一個告警信號和接收到的每一個告警信息都是有用的而且會讓整個系統(tǒng)的執(zhí)行性提高,系統(tǒng)不能辨別哪些告警信息比較重要,需要優(yōu)先上報;又或者哪些告警信息比較無用,對于網(wǎng)管來說,幾乎可以忽略。為了防止告警風暴致使整個系統(tǒng)中的信息堆積和系統(tǒng)癱瘓以及重要的告警信息被淹沒在海量的垃圾信息中,針對于沒有必要去關(guān)注的告警信息,進行屏蔽。
通過正確嚴謹?shù)呐袛嗪驮u估,甄選其中的垃圾告警直接屏蔽。告警屏蔽的屏蔽規(guī)則如下:若在綜合網(wǎng)管側(cè)屏蔽告警信息,對于其告警工作并沒有任何的優(yōu)化,所以選擇方案時要珍重;若在網(wǎng)源設(shè)備側(cè)屏蔽告警信息,不會有日志記錄,之后也無法再查看;若在廠家網(wǎng)管側(cè)屏蔽告警信息降低網(wǎng)管的工作量的同時還能減少無用告警的上報。
(二)延遲或抑制閃斷震蕩類的告警
閃斷告警就是這個告警持續(xù)的時間很短,亮紅燈的時間和蜂鳴聲響起的時間都非常的短。震蕩告警就是這個告警信號持續(xù)時間很長。
延遲或抑制閃斷震蕩類的告警的規(guī)則就是:根據(jù)一個告警信號延續(xù)的時間長短判斷是否延遲或者抑制。例如有一些網(wǎng)源的網(wǎng)絡連接出現(xiàn)了問題,網(wǎng)絡變差,進不了網(wǎng)站,而通信網(wǎng)絡系統(tǒng)檢測到一些小故障,正上報發(fā)出告警信號的時候,電腦系統(tǒng)自動修理了該障礙,那么這樣的狀況就不需要再麻煩業(yè)務人員,而告警信號已經(jīng)送出去,只是紅色信號燈也沒有亮很久,就轉(zhuǎn)瞬間亮了一下,蜂鳴器也沒有響很久,那樣的話,通信網(wǎng)絡告警系統(tǒng)就可以自動將這種信息延遲,等到業(yè)務員把重要的告警信息處理完再來看看這個故障是因為什么出現(xiàn)的,或者直接屏蔽掉不需要業(yè)務員花費時間來修理一臺正常的通信網(wǎng)絡機器。
對于震蕩類的告警信息,也需要系統(tǒng)去自動監(jiān)測,這個震蕩類信息值不值得業(yè)務員專門去查看修理,然后上報信息。
(三)對各個網(wǎng)源采取智能的連接手段進行告警優(yōu)化
上文中提到了通信網(wǎng)絡的拓撲結(jié)構(gòu)的分類,有總線型網(wǎng)狀的拓撲結(jié)構(gòu)、環(huán)形網(wǎng)狀的拓撲結(jié)構(gòu)、星型網(wǎng)狀的拓撲結(jié)構(gòu)。見下圖:
上圖為通信網(wǎng)絡拓撲結(jié)構(gòu)的三種結(jié)構(gòu)。
由圖可見,若把這每個網(wǎng)絡拓撲結(jié)構(gòu)的圖都看成是一個電路的話,不難看出每張圖都是一個串聯(lián)電路,大家都知道串聯(lián)電路的特點,那么無論是哪一種網(wǎng)絡的拓撲結(jié)構(gòu)都是不允許任何一個網(wǎng)源出故障的,只要有其中一個網(wǎng)源出了故障,其他的網(wǎng)源也不能正常的工作,接著,所有的節(jié)點都會發(fā)出告警信號上報網(wǎng)管,這就導致短時間內(nèi)告警信息增多且量大,這時候,如果只有故障的網(wǎng)源發(fā)送告警信息不僅能夠避免告警風暴的發(fā)生,而且還可以對發(fā)生故障的網(wǎng)源進行定位,業(yè)務工作人員、監(jiān)督人員以及網(wǎng)管都能夠第一時間鎖定故障機器去修理。
所以這第三個通信網(wǎng)絡告警優(yōu)化策略就是設(shè)計一種智能連接的系統(tǒng),給所有的網(wǎng)源系統(tǒng)都安裝上,當一個節(jié)點出現(xiàn)故障的時候,發(fā)送一條告警信息。
(四)針對告警風暴進行的優(yōu)化策略
告警,是網(wǎng)管最關(guān)注的工作。網(wǎng)絡管理員要通過告警來對故障進行運維。有一種極端的告警現(xiàn)象,就是由于不能確定的各種原因,系統(tǒng)同時并且長時間的向網(wǎng)管告警,這會導致告警風暴的發(fā)生。容易致使信息堆積,系統(tǒng)癱瘓。
為了防止告警風暴的發(fā)生,并且在告警風暴發(fā)生時,系統(tǒng)可以及時的作出反應,將風暴帶來的危害降到最低。系統(tǒng)可以有多個網(wǎng)管來對告警信息進行整合處理,當然這不是最佳的解決方案,但卻是最笨的。當然,在國外也有許多公司機構(gòu)專門研究出了一些系統(tǒng),針對屏蔽,延遲,抑制告警信息來減少告警量。
四、結(jié)束語
隨著通信網(wǎng)絡的發(fā)展,告警成為運營網(wǎng)絡管理必不可少的工具。并且在今后的發(fā)展中,網(wǎng)絡規(guī)模越來越大,隨之而來的告警量也今非昔比。為了讓通信網(wǎng)絡更加快速的發(fā)展,為了減輕監(jiān)控以及網(wǎng)管的壓力,必然要研究探討如何處理告警量越來越大的問題。這篇文章介紹了什么是告警,什么是通信網(wǎng)絡以及其三大拓撲結(jié)構(gòu),更重要的是針對通信網(wǎng)絡告警優(yōu)化提出了很多方法,例如如何去處理大量的告警信息的同時預防通信網(wǎng)絡告警帶來的“大風暴”,以及如何提高告警信息的有用性,如何篩選更加值得運維和網(wǎng)絡管理員關(guān)注的信息以及屏蔽、延遲、抑制一些垃圾告警信息,并且明確了如何處理風暴告警對故障源頭的定位,方便運維快速找到故障源并進行修理,以便系統(tǒng)能夠持續(xù)提供服務。
參考文獻:
[1] 袁靜,李大偉,陸紹雯,等.智能監(jiān)控應用平臺告警關(guān)聯(lián)大數(shù)據(jù)分析算法研究[J].電信工程技術(shù)與標準化,2019,032(005):80-84.
[2] 林斌,王磊.試論大數(shù)據(jù)分析在移動通信網(wǎng)絡優(yōu)化中的應用[J].黑龍江科技信息,2018,000(018):78-79.
[3] 高楊.試論大數(shù)據(jù)分析在移動通信網(wǎng)絡優(yōu)化中的應用[J].通訊世界,2018,341(10):113-114.
[4] 沈維捷,卞龍江,張行建,等.基于大數(shù)據(jù)技術(shù)的質(zhì)量信息分析評價及電商化采購質(zhì)量管控策略應用研究[J].現(xiàn)代管理,2019,9(5):6.