(國(guó)網(wǎng)江蘇省電力公司信息通信分公司 南京 210024)
近年來(lái),電力行業(yè)信息化、智能化水平的持續(xù)提高,作為承載眾多電網(wǎng)業(yè)務(wù)的電力通信系統(tǒng),其在總體規(guī)模、網(wǎng)絡(luò)容量、網(wǎng)架結(jié)構(gòu)、覆蓋范圍和承載能力等各個(gè)方面均得到長(zhǎng)足的發(fā)展。電力通信在智能電網(wǎng)體系中的基礎(chǔ)性技術(shù)支撐作用越發(fā)突顯,這對(duì)大規(guī)模通信網(wǎng)絡(luò)的整體管控和風(fēng)險(xiǎn)防范提出了更高運(yùn)維管理要求。然而電力通信網(wǎng)絡(luò)復(fù)雜、異質(zhì)的特性決定了通信運(yùn)行維護(hù)人員在告警監(jiān)視的實(shí)時(shí)性與故障處置的及時(shí)性方面始終面臨著極大的挑戰(zhàn)[1]。
在一個(gè)現(xiàn)實(shí)的電力通信網(wǎng)絡(luò)中,通常包含著多個(gè)設(shè)備廠家、不同技術(shù)體制的系統(tǒng)和設(shè)備,這些系統(tǒng)和設(shè)備會(huì)以光、電方式通過(guò)各種物理介質(zhì)連接起來(lái),相互之間存在著復(fù)雜的關(guān)聯(lián)關(guān)系。在運(yùn)行中的通信網(wǎng)絡(luò)中,一個(gè)故障往往會(huì)引發(fā)不同系統(tǒng)/設(shè)備之間,以及同一設(shè)備不同層次的多個(gè)告警事件,而且告警事件的種類和原因各不相同。這些眾多的告警信息錯(cuò)綜疊加,使得發(fā)生故障的真正根原因告警被掩蓋掉了,運(yùn)維人員不得不花費(fèi)大量時(shí)間與精力來(lái)診斷故障原因,造成運(yùn)行維護(hù)效率低下,現(xiàn)場(chǎng)故障處置緩慢等問(wèn)題。目前針對(duì)電力通信告警關(guān)聯(lián)分析的方法主要有基于規(guī)則(Rule-Based)、基于事例推理(Case-Based Reasoning)、基于因果關(guān)系(Casual-Model Approach),以及基于模型(Mod?el-Based)等分析方法[2~5]。這些分析方法通常需要借助專家經(jīng)驗(yàn)構(gòu)建出相應(yīng)的分析模型或甄別規(guī)則,具有針對(duì)性強(qiáng)、處理準(zhǔn)確性高等優(yōu)點(diǎn)。但隨著網(wǎng)絡(luò)結(jié)構(gòu)的日趨復(fù)雜,告警發(fā)生機(jī)制以及告警之間關(guān)聯(lián)關(guān)系的不斷變化,純粹依賴于專家經(jīng)驗(yàn)很難真正構(gòu)建出跨系統(tǒng)、跨廠家的動(dòng)態(tài)關(guān)聯(lián)分析模型。因此,利用數(shù)據(jù)挖掘分析海量告警,從中挖掘出告警之間的關(guān)聯(lián)關(guān)系已成為一種發(fā)展趨勢(shì)。
本文在系統(tǒng)分析電力通信告警關(guān)聯(lián)特點(diǎn)的基本上,深入研究了泛化序列模式GSP(Generalized Sequential Pattern)算法原理,在此基礎(chǔ)上構(gòu)建了通信網(wǎng)絡(luò)分層模型作為網(wǎng)絡(luò)拓?fù)浼s束,通過(guò)兩者結(jié)合實(shí)現(xiàn)了改進(jìn)的GSP告警關(guān)聯(lián)挖掘。經(jīng)過(guò)算例分析表明,本方法對(duì)電力通信告警關(guān)聯(lián)分析具有較好的適用性。
在電力通信網(wǎng)中,設(shè)備網(wǎng)元之間是相互關(guān)聯(lián)、相互影響的關(guān)系。通常某一設(shè)備網(wǎng)元發(fā)生故障或異常,會(huì)引發(fā)同一拓?fù)潢P(guān)系圖內(nèi)多個(gè)相關(guān)設(shè)備網(wǎng)元或承載業(yè)務(wù)的告警,這種情況稱之為告警傳播。告警傳播的路徑可以是縱向的,即從物理層面向上層邏輯層面和業(yè)務(wù)層面擴(kuò)散;也可以是橫向的,即向周邊的網(wǎng)元或系統(tǒng)擴(kuò)散。因此,告警關(guān)聯(lián)需要發(fā)現(xiàn)這些原始告警信息之間的關(guān)聯(lián)關(guān)系,進(jìn)而定位出發(fā)生故障的實(shí)際根原因告警。其形式化定義為:告警事件a和告警事件集合{a1,a2,…,an}有相關(guān)性,則a ?{a1,a2,…,an}表示a為根原因告警,由其引發(fā)了一系列告警事件集合[6~9]。
告警的關(guān)聯(lián)關(guān)系一般分成主次告警關(guān)系和衍生告警關(guān)系。而其中衍生告警關(guān)系又可細(xì)分為閾值觸發(fā)告警關(guān)系和同源關(guān)聯(lián)告警關(guān)系,如圖1所示。
主次告警關(guān)系表示存在著由主要告警引發(fā)一系列次要告警的因果關(guān)系,在實(shí)際操作中可屏蔽掉次要告警,只對(duì)主要告警進(jìn)行展示與操作即可。閾值觸發(fā)告警關(guān)系表示在某一劃定區(qū)域和時(shí)域范圍內(nèi),多次發(fā)生的同類型告警超過(guò)了指定數(shù)量或比例的門限閾值后,衍生出一條新的告警信息。同源關(guān)聯(lián)告警關(guān)系表示對(duì)同一資源拓?fù)潢P(guān)系內(nèi)無(wú)明顯因果關(guān)系的一批告警信息進(jìn)行歸并,衍生出一條新的告警信息。
圖1 告警關(guān)聯(lián)分類圖
因此,電力通信網(wǎng)絡(luò)中的告警關(guān)聯(lián)挖掘需要從海量原始告警信息中找出各類告警信息之間直接或間接存在的關(guān)聯(lián)關(guān)系規(guī)律,從而提升告警定位的準(zhǔn)確性。這種關(guān)聯(lián)關(guān)系規(guī)律一般是從頻繁出現(xiàn)的告警信息集合中找出集合內(nèi)告警之間的內(nèi)在關(guān)系,所以告警關(guān)聯(lián)挖掘可間接轉(zhuǎn)變?yōu)榘l(fā)現(xiàn)具有頻繁模式特性的告警信息集合。
GSP引入了滑動(dòng)時(shí)間窗口、時(shí)間約束、分類層次等約束條件,比較適合通信網(wǎng)絡(luò)中告警數(shù)據(jù)的頻繁模式挖掘[11~16]。其主要算法過(guò)程如下。
1)設(shè)定原始序列集為S,最小支持度為Supmin;
2)設(shè)定i=1,遍歷原始序列集S,生成長(zhǎng)度Length=i=1,滿足最小支持度Supmin的初始頻繁序列集Li=1;
3)遍歷長(zhǎng)度Length=i的頻繁序列集Li,通過(guò)連接操作和剪枝操作生成長(zhǎng)度Length=i+1的候選序列集C_Li+1;
連接操作:若長(zhǎng)度Length=n的兩個(gè)頻繁序列S1={s1,s2,…,sn}和,滿足條件S1=,則S1和S2可通過(guò)連接生成長(zhǎng)度Length=n+1的候選序列Ci+1=
4)遍歷原始序列集S,計(jì)算候選序列集C_Li+1中每個(gè)候選序列的支持度,若支持度滿足最小支持度Supmin,則將其放入Length=i+1的頻繁序列集Li+1;
5)若Length=i+1的頻繁序列集Li+1為空,表示無(wú)新的頻繁序列產(chǎn)生,則算法結(jié)束;否則令i=i+1,重復(fù)步驟3)。
在通信網(wǎng)絡(luò)中告警的傳播必然是沿著拓?fù)溥B接進(jìn)行上下左右的擴(kuò)散,因此將網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)作為GSP算法的額外約束條件可以提高告警挖掘的針對(duì)性和有效性。
SDH傳輸網(wǎng)絡(luò)作為電力通信的核心骨干層,是日常運(yùn)行維護(hù)的重點(diǎn)監(jiān)視對(duì)象。SDH傳輸網(wǎng)絡(luò)中的實(shí)體類型主要有分插復(fù)用器(ADM)、同步數(shù)字交叉連接設(shè)備(DXC)、終端復(fù)用器(TM)、再生中繼器(REG)以及傳輸線路(Trans Link)等。SDH傳輸網(wǎng)絡(luò)中對(duì)數(shù)據(jù)信息的放大、復(fù)用和再生等操作,以及支路之間的交叉連接實(shí)現(xiàn)可通過(guò)這些傳輸設(shè)備來(lái)實(shí)現(xiàn)。在TM與TM之間物理鏈路上承載的是端到端業(yè)務(wù)通道。通過(guò)對(duì)SDH傳輸網(wǎng)絡(luò)進(jìn)行抽象,建立SDH的拓?fù)淠P蛨D,從而能夠直觀、明晰地反映網(wǎng)絡(luò)中各組成部分之間的物理與邏輯關(guān)系,其可抽象為如圖2所示的分層模型圖。
圖2 SDH網(wǎng)絡(luò)分層模型示意圖
通過(guò)采集SDH網(wǎng)管系統(tǒng)北向接口的配置信息,依據(jù)圖2的分層模型構(gòu)建相關(guān)的網(wǎng)絡(luò)拓?fù)浼s束關(guān)系,在傳統(tǒng)GSP序列模式算法中引入網(wǎng)絡(luò)拓?fù)浼s束關(guān)系,可以有效降低噪音和數(shù)據(jù)缺失帶來(lái)的不利影響,過(guò)濾掉可能存在邏輯錯(cuò)誤的頻繁序列,進(jìn)而有效提高挖掘的效率與正確性。
在具體實(shí)現(xiàn)過(guò)程中,利用電力通信網(wǎng)絡(luò)收集到的海量原始?xì)v史告警數(shù)據(jù),通過(guò)對(duì)告警的壓縮、布爾化和歸一化等預(yù)處理,消除數(shù)據(jù)冗余和不一致性。從網(wǎng)絡(luò)拓?fù)鋽?shù)據(jù)庫(kù)中分析網(wǎng)元設(shè)備之間的拓?fù)潢P(guān)系,生成網(wǎng)絡(luò)拓?fù)淠P汀T谶M(jìn)行告警關(guān)聯(lián)規(guī)則挖掘和告警序列模式挖掘時(shí),訪問(wèn)網(wǎng)絡(luò)拓?fù)淠P汀H艉蜻x序列不在網(wǎng)絡(luò)拓?fù)淠P椭?,則說(shuō)明候選序列中的設(shè)備網(wǎng)元之間不存在告警傳輸路徑,可以過(guò)濾掉該候選序列。經(jīng)過(guò)剪枝后的候選序列集可作為告警關(guān)聯(lián)規(guī)則與序列經(jīng)驗(yàn)庫(kù)。從而為后續(xù)實(shí)時(shí)告警的相似性分析提供科學(xué)依據(jù),最終實(shí)現(xiàn)根告警的準(zhǔn)確定位。其告警關(guān)聯(lián)挖掘過(guò)程如圖3所示。
圖3 告警關(guān)聯(lián)挖掘過(guò)程圖
從某省傳輸網(wǎng)中獲取一月內(nèi)產(chǎn)生的原始告警信息65714個(gè),分別采用傳統(tǒng)GSP與改進(jìn)GSP進(jìn)行關(guān)聯(lián)頻繁序列的數(shù)據(jù)挖掘。在傳統(tǒng)GSP算法中滑動(dòng)步長(zhǎng)采用定長(zhǎng)時(shí)間,設(shè)定時(shí)間窗口大小為1600s,定長(zhǎng)時(shí)間為940s,從而確保鄰近的原始告警信息能夠劃分到同一個(gè)事務(wù)中。在改進(jìn)GSP算法中以網(wǎng)絡(luò)拓?fù)浼s束動(dòng)態(tài)調(diào)整時(shí)間窗口的大小,盡量避免具有相關(guān)性的原始告警劃分到不同的事務(wù)中。選擇不同的最小支持度Supmin={0.7,0.6,0.5,0.4}分別對(duì)傳統(tǒng)GSP和改進(jìn)GSP進(jìn)行測(cè)試。其測(cè)試對(duì)比結(jié)果如表1所示。
測(cè)試對(duì)比結(jié)果表明,在最小支持度Supmin=0.5時(shí),改進(jìn)GSP算法執(zhí)行時(shí)間只是傳統(tǒng)GSP算法執(zhí)行時(shí)間的1/3,改進(jìn)GSP挖掘出的頻繁序列模式數(shù)量也只是傳統(tǒng)GSP挖掘出的頻繁序列模式數(shù)量的1.3%。可見網(wǎng)絡(luò)拓?fù)浼s束的引入,從根源上能夠有效過(guò)濾掉大量不符合網(wǎng)絡(luò)實(shí)際拓?fù)涞臒o(wú)用頻繁序列模式,從而使得改進(jìn)GSP在數(shù)據(jù)挖掘算法的速度與精度上均明顯優(yōu)于傳統(tǒng)GSP。
表1 原始告警數(shù)據(jù)測(cè)試對(duì)比表
告警監(jiān)視是電力通信調(diào)度管理的重點(diǎn)要工作,也是運(yùn)行檢修的主要依據(jù)。在復(fù)雜、異質(zhì)的電力通信網(wǎng)絡(luò)結(jié)構(gòu)中,各個(gè)設(shè)備網(wǎng)元之間相互影響。一旦網(wǎng)絡(luò)出現(xiàn)故障,運(yùn)行維護(hù)人員很容易淹沒(méi)在一系列突發(fā)、海量的告警風(fēng)暴中,從而延誤了故障排除的時(shí)間。在實(shí)際電力通信網(wǎng)絡(luò)中傳統(tǒng)的通信告警關(guān)聯(lián)挖掘方法由于其自身的局限性或多或少存在著缺陷,難以實(shí)現(xiàn)實(shí)用化。本文以電力通信網(wǎng)絡(luò)的原始告警信息為研究對(duì)象,結(jié)合電力通信網(wǎng)絡(luò)自身的拓?fù)浣Y(jié)構(gòu)特點(diǎn),將網(wǎng)絡(luò)拓?fù)浼s束引入到傳統(tǒng)的序列模式挖掘中,大大減少了無(wú)用頻繁序列模式的輸出,有效提高了序列模式挖掘算法的速度與精度,保證了最終輸出結(jié)果具有實(shí)際的指導(dǎo)價(jià)值。
采用通信告警實(shí)驗(yàn)數(shù)據(jù)對(duì)傳統(tǒng)GSP與改進(jìn)GSP進(jìn)行告警關(guān)聯(lián)的數(shù)據(jù)挖掘,測(cè)試結(jié)果表明改進(jìn)的GSP在電力通信網(wǎng)絡(luò)的關(guān)聯(lián)分析中具有較好的適用性,為進(jìn)一步研究通信告警關(guān)聯(lián)挖掘奠定了一定的工程實(shí)踐基礎(chǔ)。后續(xù)工作中,將繼續(xù)完善電力通信網(wǎng)絡(luò)的分層模型,使得網(wǎng)絡(luò)拓?fù)浼s束能夠真實(shí)反映復(fù)雜網(wǎng)絡(luò)環(huán)境下不同設(shè)備網(wǎng)元之間的真實(shí)連接關(guān)系,同時(shí)加大對(duì)原始告警信息的數(shù)據(jù)挖掘范圍與深度,確保改進(jìn)GSP算法能夠指導(dǎo)實(shí)際的通信網(wǎng)絡(luò)運(yùn)行維護(hù)工作。