• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于APRIORI-貝葉斯優(yōu)化XGBoost的電力通信網(wǎng)根告警預(yù)測(cè)

      2022-01-12 08:39:54程路明樓平諸駿豪李凌雁崔曉昱孫毅
      電力建設(shè) 2022年1期
      關(guān)鍵詞:通信網(wǎng)項(xiàng)集貝葉斯

      程路明,樓平,諸駿豪,李凌雁,崔曉昱,孫毅

      (1.國(guó)網(wǎng)浙江省電力有限公司湖州供電公司,浙江省湖州市 313000;2.華北電力大學(xué)電氣與電子工程學(xué)院,北京市 102206)

      0 引 言

      電力通信傳輸網(wǎng)作為電力系統(tǒng)智能化調(diào)度和現(xiàn)代化管理的樞紐,承載著支撐電網(wǎng)安全可靠運(yùn)行的調(diào)度管理業(yè)務(wù)[1]。當(dāng)前,以數(shù)據(jù)為驅(qū)動(dòng)的新興業(yè)務(wù)正處于迅猛發(fā)展的階段,電力通信網(wǎng)的安全可靠是海量數(shù)據(jù)高效傳輸?shù)幕A(chǔ)和關(guān)鍵。而針對(duì)大量且復(fù)雜的電力通信網(wǎng)運(yùn)行原始數(shù)據(jù)和告警數(shù)據(jù),如何篩選關(guān)鍵信息進(jìn)而對(duì)通信網(wǎng)告警進(jìn)行預(yù)測(cè),避免規(guī)模性電力通信網(wǎng)故障是保障通信網(wǎng)穩(wěn)定運(yùn)行的有效途徑之一。

      電力通信網(wǎng)告警數(shù)據(jù)通常只反映因網(wǎng)絡(luò)故障引起的系統(tǒng)相關(guān)部件的狀態(tài)變化,但是由于網(wǎng)絡(luò)節(jié)點(diǎn)和設(shè)備之間存在鏈接,告警信息可能會(huì)沿著網(wǎng)絡(luò)鏈接傳播到與其相連的多個(gè)站點(diǎn),從而產(chǎn)生衍生告警信息[2]。面對(duì)繁復(fù)的原始冗余數(shù)據(jù),難以從中提取根源性告警信息,即故障根本原因,這不僅影響故障排查的精確性和搶修的實(shí)時(shí)性,也消耗大量的人力物力。目前,多省已開(kāi)展電力通信網(wǎng)資源信息集中監(jiān)視平臺(tái)建設(shè),重點(diǎn)突破根告警預(yù)測(cè)定位技術(shù),提高網(wǎng)絡(luò)質(zhì)量,業(yè)務(wù)通信通道平均中斷時(shí)間降低了98.8%,實(shí)現(xiàn)告警壓縮率0.04%[3]。根告警預(yù)測(cè)能夠協(xié)助運(yùn)維人員預(yù)知網(wǎng)絡(luò)風(fēng)險(xiǎn),提前聚焦高風(fēng)險(xiǎn)點(diǎn),及時(shí)定位網(wǎng)絡(luò)可能出現(xiàn)的故障,從根源上排查網(wǎng)絡(luò)故障,進(jìn)而提高電力通信網(wǎng)的可靠性,降低區(qū)域性衍生告警概率及運(yùn)維成本損耗[4]。其中設(shè)備屬性是產(chǎn)生根源性告警的主要因素之一,且其預(yù)測(cè)技術(shù)存在預(yù)測(cè)精度不高的問(wèn)題,仍是目前亟待解決的工程難題。因此,如何基于歷史告警數(shù)據(jù)對(duì)設(shè)備屬性造成的根源性告警實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè),是本文解決的重點(diǎn)問(wèn)題。

      現(xiàn)有的網(wǎng)絡(luò)告警預(yù)測(cè)研究雖然已經(jīng)取得了較好的成果,但鮮少區(qū)分根源性告警和衍生告警,無(wú)差別式修復(fù)所有告警信息不僅降低排查效率,增加運(yùn)維成本,同時(shí)可能出現(xiàn)由于未及時(shí)排查到根源性告警導(dǎo)致仍然產(chǎn)生大量衍生告警的情況。文獻(xiàn)[4-5]提出臟數(shù)據(jù)預(yù)處理(dirty-data-based alarm prediction,DAP)的預(yù)測(cè)算法,提升數(shù)據(jù)集精度和機(jī)器學(xué)習(xí)性能;文獻(xiàn)[6-7]提出加權(quán)告警分析方法和加權(quán)增量關(guān)聯(lián)規(guī)則挖掘重要告警序列模式,提高通信網(wǎng)絡(luò)告警預(yù)測(cè)的精度和效率;文獻(xiàn)[8]對(duì)通信網(wǎng)絡(luò)進(jìn)行狀態(tài)估計(jì),排除錯(cuò)誤告警;文獻(xiàn)[9-10]利用聚類算法壓縮告警事務(wù)集,提高告警關(guān)聯(lián)規(guī)則的準(zhǔn)確度;文獻(xiàn)[11]使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)組合算法實(shí)現(xiàn)光傳輸網(wǎng)絡(luò)的告警分析和故障預(yù)測(cè);文獻(xiàn)[12]提出了一種基于自學(xué)習(xí)數(shù)據(jù)增強(qiáng)的機(jī)器學(xué)習(xí)的告警預(yù)測(cè)方法;文獻(xiàn)[13]采用貝葉斯線性回歸分類預(yù)測(cè)告警順序模式達(dá)到提高預(yù)測(cè)性能目的;文獻(xiàn)[14]采用基于跨層人工智能架構(gòu)的預(yù)測(cè)算法,數(shù)據(jù)量相對(duì)較少。

      上述預(yù)測(cè)算法對(duì)告警影響因素關(guān)聯(lián)性挖掘不足,導(dǎo)致數(shù)據(jù)的冗余性較大,價(jià)值密度低,預(yù)測(cè)誤差增大,也增加了模型計(jì)算的復(fù)雜度、運(yùn)維人員排查故障的難度和成本。同時(shí),現(xiàn)有的機(jī)器學(xué)習(xí)預(yù)測(cè)算法缺乏對(duì)模型復(fù)雜度的控制和優(yōu)化模型的泛化能力,算法訓(xùn)練時(shí)間長(zhǎng)。

      針對(duì)上述存在的根源性告警技術(shù)研究較少、告警預(yù)測(cè)精度不足和模型效率不高的問(wèn)題,本文提出一種基于關(guān)聯(lián)規(guī)則挖掘的通信網(wǎng)根告警預(yù)測(cè)算法,結(jié)合根源性告警關(guān)鍵影響因素對(duì)根源性告警進(jìn)行精準(zhǔn)預(yù)測(cè),有效提升預(yù)測(cè)精度和時(shí)效性,并通過(guò)實(shí)際光通信網(wǎng)數(shù)據(jù)驗(yàn)證該方法的有效性,為管理維護(hù)人員進(jìn)行電力通信網(wǎng)根源性故障高效精準(zhǔn)運(yùn)維提供參考。其中,本文的創(chuàng)新點(diǎn)和貢獻(xiàn)主要在于:1)針對(duì)大量原始告警信息,采用APRIORI算法挖掘根告警關(guān)聯(lián)規(guī)則,利用概率函數(shù)轉(zhuǎn)化提取關(guān)鍵影響因素,降低貝葉斯優(yōu)化XGBoost模型中輸入數(shù)據(jù)的冗余度,提高輸入數(shù)據(jù)價(jià)值密度,避免無(wú)效數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的擾動(dòng);2)建立基于APRIORI-貝葉斯優(yōu)化XGBoost的通信網(wǎng)根告警預(yù)測(cè)模型,利用貝葉斯尋找XGBoost參數(shù)最優(yōu)解,簡(jiǎn)化模型尋優(yōu)過(guò)程,進(jìn)而提升模型效率和告警預(yù)測(cè)精度。

      1 基于APRIORI根告警關(guān)聯(lián)因素分析

      1.1 數(shù)據(jù)預(yù)處理

      本文采用廣西省電力通信網(wǎng)實(shí)際告警信息記錄表作為原始數(shù)據(jù)集,共13 401條記錄,但存在以下缺陷:

      1)重復(fù)告警。一個(gè)設(shè)備發(fā)生故障時(shí)可能會(huì)導(dǎo)致其他相關(guān)設(shè)備發(fā)生故障,出現(xiàn)告警傳播現(xiàn)象,同時(shí)間歇性發(fā)生的故障也可能會(huì)導(dǎo)致大量的重復(fù)告警。

      2)屬性冗余。原始數(shù)據(jù)集共包含23個(gè)屬性,如所屬?gòu)S家、告警級(jí)別、告警對(duì)象、確認(rèn)人、確認(rèn)時(shí)間、設(shè)備編碼等,但多數(shù)屬性與告警預(yù)測(cè)相關(guān)性較弱。

      3)信息缺失。某些環(huán)境或者人為因素會(huì)導(dǎo)致告警信息丟失,如網(wǎng)絡(luò)通道發(fā)生故障造成的告警信息無(wú)法傳送。

      4)信息噪聲。錯(cuò)誤告警可視為信息噪聲,將嚴(yán)重影響關(guān)聯(lián)挖掘結(jié)果的可靠性。

      因此,本文首先對(duì)原始數(shù)據(jù)集進(jìn)行了預(yù)處理,包括對(duì)數(shù)據(jù)進(jìn)行去冗、去噪、標(biāo)準(zhǔn)化處理,過(guò)濾數(shù)值嚴(yán)重缺失的記錄,對(duì)僅有部分缺失的數(shù)據(jù)暫時(shí)保留。預(yù)處理后的數(shù)據(jù)集中每一屬性對(duì)應(yīng)元素如表1所示,其中依據(jù)不同區(qū)域?qū)V西省電力通信傳輸網(wǎng)絡(luò)進(jìn)行劃分,包括IT監(jiān)視二區(qū)、IT監(jiān)視三區(qū)、烽火光傳輸網(wǎng)、華為光傳輸網(wǎng)、省光傳輸網(wǎng)A、省光傳輸網(wǎng)I和中調(diào)動(dòng)力環(huán)境7類。

      1.2 根告警關(guān)聯(lián)因素分析流程

      APRIORI算法具有消除數(shù)據(jù)冗余、簡(jiǎn)化數(shù)據(jù)和關(guān)聯(lián)規(guī)則結(jié)果全面的功能[15],因此,本文選取APRIORI算法對(duì)根告警預(yù)測(cè)影響因子進(jìn)行關(guān)聯(lián)挖掘。同時(shí),由于APRIORI算法屬于布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集挖掘算法,只能處理離散型變量,不能處理數(shù)值型變量,故本文對(duì)預(yù)處理數(shù)據(jù)拆分離散化,形成離散型樣本集。為進(jìn)一步詳細(xì)說(shuō)明算法流程,本文以樣本集中10條數(shù)據(jù)的7個(gè)屬性作為APRIORI頻繁項(xiàng)集生成的應(yīng)用示例,抽取數(shù)據(jù)及屬性如表2所示。抽取數(shù)據(jù)分析僅作為APRIORI算法流程說(shuō)明,具體根告警關(guān)聯(lián)規(guī)則挖掘結(jié)果見(jiàn)仿真分析。

      表1 不同屬性及其對(duì)應(yīng)元素Table 1 Different attributes and their corresponding elements

      表2中10條記錄代表10個(gè)事務(wù),記為T1~T10,z為0-1變量,z=1表示“事務(wù)為根告警”,z=0表示“事務(wù)不是根告警”,對(duì)選取的指標(biāo)依次由a~g進(jìn)行編號(hào)。X={a,b,…,g}是影響根告警的因子集合,即項(xiàng)的集合;T={T1,T2,…,T10}是根告警的集合,即事務(wù)集。每個(gè)事務(wù)Ti都是項(xiàng)的集合,即Ti?X。

      表2 隨機(jī)抽取數(shù)據(jù)及元素Table 2 Randomly extracted data and elements

      頻集的產(chǎn)生需設(shè)定最小支持度閾值,項(xiàng)集X的支持度S(X)計(jì)算公式為:

      S(X)=P(X)

      (1)

      式中:P(X)代表數(shù)據(jù)集中項(xiàng)集X的支持?jǐn)?shù)在事務(wù)集T中所占的比例,設(shè)定最小支持度為50%,APRIORI關(guān)聯(lián)規(guī)則生成過(guò)程如下:

      1)掃描事務(wù)集,生成1-項(xiàng)候選集C1,并計(jì)算對(duì)應(yīng)項(xiàng)集支持度,選擇滿足閾值條件的項(xiàng)集組成頻繁1-項(xiàng)集L1,如表3所示。

      表3 頻繁1-項(xiàng)集L1Table 3 Frequent 1-item set L1

      2)根據(jù)表2產(chǎn)生2-項(xiàng)候選集C2,計(jì)算對(duì)應(yīng)項(xiàng)集支持度,選擇滿足閾值條件的項(xiàng)集組成頻繁2-項(xiàng)集L2,如表4所示。

      表4 頻繁2-項(xiàng)集L2Table 4 Frequent 2-item set L2

      3)根據(jù)表3產(chǎn)生3-項(xiàng)候選集C3,計(jì)算對(duì)應(yīng)項(xiàng)集支持度,選擇滿足閾值條件的項(xiàng)集組成頻繁3-項(xiàng)集L3,如表5所示。

      表5 頻繁3-項(xiàng)集L3Table 5 Frequent 3-item set L3

      由于L3無(wú)法繼續(xù)構(gòu)成候選集C4,算法結(jié)束迭代,最終得到的頻繁項(xiàng)集為L(zhǎng)1、L2、L3。

      4)同時(shí)滿足設(shè)定的最小支持度和最小置信度閾值輸出為強(qiáng)關(guān)聯(lián)規(guī)則,據(jù)此生成根告警關(guān)聯(lián)規(guī)則X?Y,其中X為前項(xiàng),Y為后項(xiàng),支持度S(X?Y)和置信度C(X?Y)計(jì)算公式如式(2)所示:

      (2)

      式中:P(X∪Y)為事務(wù)集T中X、Y兩個(gè)項(xiàng)集同時(shí)出現(xiàn)的概率;P(Y|X)為出現(xiàn)項(xiàng)集X的事務(wù)集T中,項(xiàng)集Y也同時(shí)出現(xiàn)的概率,其中X、Y均為包含于T的項(xiàng)集,且X∩Y=?。本文中的支持度指的是表1所列26類元素中若干項(xiàng)存在導(dǎo)致根告警出現(xiàn)的概率,而置信度表現(xiàn)為若干項(xiàng)屬性存在導(dǎo)致根告警出現(xiàn)的可能性大小。規(guī)定最小支持度為15%,最小置信度為80%,生成的強(qiáng)關(guān)聯(lián)規(guī)則如表6所示。由表6可知,所有規(guī)則均符合最小置信度閾值要求,輸出為強(qiáng)關(guān)聯(lián)規(guī)則。

      表6 強(qiáng)關(guān)聯(lián)規(guī)則挖掘結(jié)果分析Table 6 Analysis of mining results of strong association rules %

      2 基于APRIORI-貝葉斯網(wǎng)絡(luò)的通信網(wǎng)根告警預(yù)測(cè)模型

      2.1 關(guān)聯(lián)規(guī)則概率化

      利用關(guān)聯(lián)規(guī)則概率化確定影響因子的關(guān)聯(lián)度,對(duì)APRIORI關(guān)聯(lián)因素分析結(jié)果進(jìn)行轉(zhuǎn)換作為預(yù)測(cè)模型的樣本集,用Ri表示某個(gè)影響因子的關(guān)聯(lián)度,反映該影響因子和其他影響因子的關(guān)聯(lián)程度及該影響因子和是否為根告警之間的關(guān)聯(lián)程度,Ri計(jì)算值較大時(shí)代表關(guān)聯(lián)度較強(qiáng),反之相反。具體關(guān)聯(lián)度概率化計(jì)算如式(3)所示:

      (3)

      2.2 貝葉斯優(yōu)化XGBoost預(yù)測(cè)模型

      貝葉斯優(yōu)化XGBoost預(yù)測(cè)模型以關(guān)聯(lián)規(guī)則概率化后篩選的影響因素作為模型的輸入樣本集,將貝葉斯優(yōu)化應(yīng)用于超參數(shù)尋優(yōu)中,得到光傳輸網(wǎng)的根告警預(yù)測(cè)結(jié)果。

      2.2.1 XGBoost模型

      XGBoost是在梯度提升樹(shù)的基礎(chǔ)上對(duì)boosting算法進(jìn)行的改進(jìn),將弱分類器集成為一個(gè)強(qiáng)分類器,利用分類與回歸樹(shù)模型(classification and regression tree,CART)進(jìn)行預(yù)測(cè),第k棵樹(shù)的預(yù)測(cè)函數(shù)為:

      (4)

      XGBoost算法每輪優(yōu)化的目標(biāo)函數(shù)κ和回歸樹(shù)復(fù)雜度函數(shù)Ω(fk)分別為:

      (5)

      將式(4)代入目標(biāo)函數(shù)中,在XGBoost模型訓(xùn)練過(guò)程中,每一輪迭代都在現(xiàn)有樹(shù)的基礎(chǔ)上增加1棵樹(shù)擬合前面樹(shù)的預(yù)測(cè)結(jié)果與真實(shí)值之間的殘差,因此第t輪優(yōu)化的目標(biāo)函數(shù)變?yōu)椋?/p>

      (6)

      (7)

      式中:Gm、Hm分別代表一階導(dǎo)數(shù)和二階導(dǎo)數(shù);Im代表葉子節(jié)點(diǎn)m的集合。

      2.2.2 貝葉斯優(yōu)化

      貝葉斯優(yōu)化算法用于結(jié)合歷史數(shù)據(jù)的全局優(yōu)化,算法核心為概率代理模型與采集函數(shù)。由于本文構(gòu)建的預(yù)測(cè)模型分布未知,無(wú)法根據(jù)經(jīng)驗(yàn)選擇最優(yōu)的模型,因此在仿真過(guò)程中概率代理模型使用高斯過(guò)程回歸模型[16-19],采集函數(shù)使用改進(jìn)概率(probability of improvement,PI)方法。貝葉斯優(yōu)化超參數(shù)的目標(biāo)函數(shù)為:

      (8)

      式中:X是實(shí)驗(yàn)樣本集;x*是目標(biāo)函數(shù)達(dá)到最優(yōu)的一組集合。

      貝葉斯優(yōu)化XGBoost算法的實(shí)現(xiàn)步驟為:

      1)初始化XGBoost模型參數(shù)以及超參數(shù)取值范圍,生成隨機(jī)初始化點(diǎn),將APRIORI算法處理后的告警數(shù)據(jù)樣本集和初始化參數(shù)作為貝葉斯優(yōu)化中高斯模型和根告警預(yù)測(cè)模型的輸入變量,得出根告警的預(yù)測(cè)結(jié)果,修正參數(shù)改進(jìn)高斯模型,使其輸出結(jié)果更接近真實(shí)值;

      2)在修正后的高斯模型選取待評(píng)估的參數(shù)組合點(diǎn),使得采集函數(shù)達(dá)到最優(yōu),同時(shí)高斯模型比其余參數(shù)組合點(diǎn)更逼近目標(biāo)函數(shù)的真實(shí)分布,得到最優(yōu)參數(shù)組合;

      3)將全局最優(yōu)參數(shù)組合輸入XGBoost模型中進(jìn)行訓(xùn)練,如果選取的參數(shù)組合的誤差低于預(yù)先設(shè)置的閾值,則算法結(jié)束,輸出對(duì)應(yīng)的參數(shù)組合以及模型的預(yù)測(cè)誤差(xi,f(xi));

      4)如果f(xi)不滿足閾值要求,則將(xi,f(xi))輸入到高斯模型中,對(duì)高斯模型進(jìn)行修正,返回步驟2),直至低于預(yù)先設(shè)置的閾值。

      基于APRIORI-貝葉斯優(yōu)化XGBoost預(yù)測(cè)模型的具體流程如圖1所示。

      隨著電力通信網(wǎng)中的網(wǎng)絡(luò)參數(shù)和拓?fù)浣Y(jié)構(gòu)不斷發(fā)生變化,樣本數(shù)據(jù)集隨之更新,本文所提算法可通過(guò)調(diào)整XGBoost模型中的葉子節(jié)點(diǎn)個(gè)數(shù)、樹(shù)的深度、葉子節(jié)點(diǎn)3個(gè)參數(shù)重新訓(xùn)練預(yù)測(cè)模型來(lái)適應(yīng)新出現(xiàn)的樣本數(shù)據(jù),同時(shí)通過(guò)調(diào)整目標(biāo)函數(shù)中的正則項(xiàng)控制預(yù)測(cè)模型的復(fù)雜程度,防止出現(xiàn)過(guò)擬合的現(xiàn)象,保證模型的預(yù)測(cè)精度和復(fù)雜度。

      3 仿真分析

      3.1 參數(shù)設(shè)置

      本文的實(shí)驗(yàn)運(yùn)行環(huán)境為64位Windows10操作系統(tǒng),處理器為Intel(R)Core(TM)i7-7500U CPU @ 2.70 GHz 2.90 GHz。本文采用隨機(jī)抽取原則抽取不同量級(jí)數(shù)據(jù),但在每一量級(jí)下控制根告警與非根告警的樣本比例為1∶4。

      圖1 基于APRIORI-貝葉斯優(yōu)化XGBoost的根告警預(yù)測(cè)流程圖Fig.1 Flowchart of root alarm prediction based on APRIORI-Bayesian optimization of XGBoost

      貝葉斯優(yōu)化XGBoost模型預(yù)先設(shè)置相關(guān)仿真參數(shù)取值范圍及含義如表7所示。

      表7 XGBoost參數(shù)范圍及含義Table 7 Range and meaning of XGBoost parameters

      3.2 根告警關(guān)聯(lián)分析結(jié)果

      為避免關(guān)聯(lián)規(guī)則的冗余性,重復(fù)對(duì)比多次實(shí)驗(yàn)結(jié)果后選取前項(xiàng)最大項(xiàng)目數(shù)為3,最小支持度為15%,最小置信度為80%,對(duì)結(jié)果進(jìn)行整合排序后如表8所示,其中規(guī)則ID指的是利用APRIORI算法生成的所有關(guān)聯(lián)規(guī)則的編號(hào)。

      由表8數(shù)據(jù)可得下列結(jié)論:1)規(guī)則ID17、13、16顯示,所屬專業(yè)因素中傳輸專業(yè)導(dǎo)致通信網(wǎng)根告警的支持度最高(94.493%),其次是所屬?gòu)S家因素中烽火(82.351%)和傳輸網(wǎng)絡(luò)因素中烽火光傳輸網(wǎng)(82.351%),這3個(gè)因素在很大程度上影響著電力通信網(wǎng)根源性告警;相比之下告警對(duì)象類型影響較小,如規(guī)則ID8、4所示;2)多個(gè)因素同時(shí)出現(xiàn)時(shí)也很可能會(huì)導(dǎo)致通信網(wǎng)根告警的產(chǎn)生,如規(guī)則ID35、34和55。

      表8 根告警關(guān)聯(lián)規(guī)則挖掘結(jié)果分析Table 8 Analysis of the mining results of root alarm association rules

      3.3 APRIORI-貝葉斯優(yōu)化XGBoost預(yù)測(cè)結(jié)果

      對(duì)上節(jié)關(guān)聯(lián)規(guī)則挖掘結(jié)果進(jìn)行概率化提取的特征包括傳輸網(wǎng)絡(luò)、所屬?gòu)S家、所屬專業(yè)、告警對(duì)象類型和告警級(jí)別5個(gè)。本文以準(zhǔn)確率A、召回率R、F-值作為算法性能評(píng)價(jià)指標(biāo),選取了如下3種算法仿真對(duì)比通信告警預(yù)測(cè)的準(zhǔn)確率:

      對(duì)比算法1:序列模式挖掘算法[20];

      對(duì)比算法2:基于netica API的貝葉斯推理算法[21];

      對(duì)比算法3:基于主成分分析優(yōu)化隨機(jī)森林算法[22]。

      其中,對(duì)比指標(biāo)計(jì)算公式如下:

      (9)

      式中:TP代表實(shí)際為根告警并且被預(yù)測(cè)為根告警的數(shù)據(jù);FN代表實(shí)際為根告警但未被預(yù)測(cè)為根告警的數(shù)據(jù);FP代表實(shí)際為非根告警但被預(yù)測(cè)為根告警的數(shù)據(jù);TN代表實(shí)際為非根告警并且被預(yù)測(cè)為非根告警的數(shù)據(jù);α代表A和R的權(quán)重比值,本文計(jì)算選取α=1。F越高表示實(shí)驗(yàn)方法越有效。

      3.3.1 關(guān)聯(lián)因素挖掘?qū)︻A(yù)測(cè)精度影響分析

      為分析APRIORI對(duì)本文算法預(yù)測(cè)性能的影響,選取最佳支持度,首先對(duì)比分析不同告警數(shù)據(jù)量下有無(wú)APRIORI以及采用FP-growth關(guān)聯(lián)規(guī)則挖掘的算法預(yù)測(cè)準(zhǔn)確率。如表9和圖2所示,在預(yù)測(cè)模型中增加APRIORI算法遴選關(guān)鍵因素,利用APRIORI算法挖掘關(guān)聯(lián)規(guī)則的準(zhǔn)確率高于FP-growth,3種算法的最高準(zhǔn)確率分別為0.855 2,0.847 1和0.831 9,隨著數(shù)據(jù)量的增多,3種算法的準(zhǔn)確率都呈現(xiàn)先增大后減少的趨勢(shì),這是由于告警數(shù)據(jù)量增多會(huì)造成貝葉斯優(yōu)化XGBoost預(yù)測(cè)模型過(guò)擬合,導(dǎo)致樣本數(shù)據(jù)繼續(xù)增加時(shí),模型預(yù)測(cè)準(zhǔn)確率下降。

      表9 不同算法的根告警預(yù)測(cè)性能分析Table 9 Analysis of root alarm prediction performance of different algorithms

      圖2 關(guān)聯(lián)因素挖掘?qū)︻A(yù)測(cè)精度影響對(duì)比Fig.2 Comparison of the impact of correlation factor mining on prediction accuracy

      3.3.2 不同算法預(yù)測(cè)精度對(duì)比分析

      在同樣場(chǎng)景和參數(shù)設(shè)置下,如圖3所示,APRIORI-貝葉斯優(yōu)化XGBoost算法的預(yù)測(cè)準(zhǔn)確率、召回率、F-值3個(gè)評(píng)價(jià)指標(biāo)均有明顯提升,各項(xiàng)指標(biāo)均達(dá)到80%以上,本文算法的準(zhǔn)確率為85.14%,比序列模式挖掘、貝葉斯網(wǎng)絡(luò)和優(yōu)化隨機(jī)森林算法分別提高4%。

      圖3 4種算法預(yù)測(cè)結(jié)果對(duì)比Fig.3 Comparison of prediction results of 4 algorithms

      為驗(yàn)證算法的高效性,本文選取算法執(zhí)行時(shí)間作為反映算法復(fù)雜度的指標(biāo)[20-22],對(duì)不同告警數(shù)據(jù)量下的4種算法執(zhí)行時(shí)間進(jìn)行了仿真對(duì)比。如圖4所示,本文算法的執(zhí)行時(shí)間整體最短,同時(shí)隨著數(shù)據(jù)量的增多,本文算法執(zhí)行時(shí)間的增長(zhǎng)速率變緩,在較大的數(shù)據(jù)樣本下仍能維持較短的執(zhí)行時(shí)間,在數(shù)據(jù)量達(dá)到10 000時(shí),本文算法的執(zhí)行時(shí)間相比于序列模式挖掘算法、貝葉斯網(wǎng)絡(luò)及優(yōu)化隨機(jī)森林分別降低18%、19%及12%。在未來(lái)感知互聯(lián)的通信網(wǎng)絡(luò)中,面向海量的網(wǎng)絡(luò)數(shù)據(jù),顯然本文方法具有更好的預(yù)測(cè)效果,能夠在較短的時(shí)間內(nèi)快速獲取有效信息,及時(shí)排查和定位網(wǎng)絡(luò)故障,降低資源投入和網(wǎng)絡(luò)風(fēng)險(xiǎn)。

      圖4 不同告警數(shù)據(jù)量下算法執(zhí)行時(shí)間Fig.4 Algorithm execution time under different alarm data volume

      3.3.3 不同支持度對(duì)預(yù)測(cè)精度影響分析

      本文設(shè)置支持度從10%至50% 變化,分析在不同支持度下算法的預(yù)測(cè)性能。仿真結(jié)果如圖5所示。

      圖5 不同支持度下告警預(yù)測(cè)性能Fig.5 Alarm prediction performance under different support levels

      由圖5可知,隨著支持度的減小,告警預(yù)測(cè)的準(zhǔn)確率和F-值先增大后減小,這是因?yàn)殡S著支持度的減小,挖掘出的告警關(guān)聯(lián)規(guī)則增多,將小概率的關(guān)聯(lián)規(guī)則納入預(yù)測(cè)模型的先驗(yàn)知識(shí),能夠提升預(yù)測(cè)精度,然而過(guò)多的關(guān)聯(lián)規(guī)則會(huì)導(dǎo)致降低有效關(guān)聯(lián)規(guī)則的占比,對(duì)預(yù)測(cè)精度造成影響。因此,由仿真結(jié)果分析可知在支持度為15%時(shí)算法整體性能達(dá)到最優(yōu),因此本文在關(guān)聯(lián)規(guī)則挖掘時(shí)設(shè)定最小支持度為15%。

      4 結(jié) 論

      為及時(shí)排查和預(yù)測(cè)電力光傳輸網(wǎng)絡(luò)的根源性告警,本文提出一種基于APRIORI-貝葉斯優(yōu)化XGBoost的根告警預(yù)測(cè)方法,利用電力通信光傳輸網(wǎng)的告警數(shù)據(jù)關(guān)聯(lián)分析精準(zhǔn)預(yù)測(cè)高風(fēng)險(xiǎn)根源性告警,為運(yùn)維人員提供必要的數(shù)據(jù)信息,進(jìn)而高效快速定位高風(fēng)險(xiǎn)點(diǎn),及時(shí)排查故障,降低網(wǎng)絡(luò)風(fēng)險(xiǎn)概率和運(yùn)維成本。仿真實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的告警預(yù)測(cè)方法相比,本文所提方法能在多方面提升預(yù)測(cè)精確度和整體性能,具有較好的可行性和優(yōu)越性。

      在今后的研究中將重點(diǎn)研究頻繁模式樹(shù)、泛化序列模式、關(guān)聯(lián)分類算法等改進(jìn)關(guān)聯(lián)分析算法,進(jìn)一步提升數(shù)據(jù)挖掘效率,實(shí)現(xiàn)挖掘效率和預(yù)測(cè)準(zhǔn)確率的高效優(yōu)化。

      猜你喜歡
      通信網(wǎng)項(xiàng)集貝葉斯
      基于SDN-MEC配用電通信網(wǎng)任務(wù)遷移策略
      電子制作(2019年24期)2019-02-23 13:22:28
      GSM-R通信網(wǎng)多徑干擾解決案例
      PTN在電力通信網(wǎng)中的工程應(yīng)用
      貝葉斯公式及其應(yīng)用
      基于貝葉斯估計(jì)的軌道占用識(shí)別方法
      電力通信網(wǎng)引入ASON技術(shù)探討
      一種基于貝葉斯壓縮感知的說(shuō)話人識(shí)別方法
      電子器件(2015年5期)2015-12-29 08:43:15
      關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
      卷宗(2014年5期)2014-07-15 07:47:08
      IIRCT下負(fù)二項(xiàng)分布參數(shù)多變點(diǎn)的貝葉斯估計(jì)
      一種頻繁核心項(xiàng)集的快速挖掘算法
      双流县| 金华市| 江安县| 桦甸市| 襄城县| 阿尔山市| 宁远县| 通化市| 新密市| 白银市| 济阳县| 蚌埠市| 彭泽县| 新津县| 黄冈市| 清原| 思茅市| 云南省| 海口市| 仲巴县| 合江县| 嫩江县| 涞水县| 托克逊县| 伊川县| 北流市| 洪雅县| 临武县| 尉氏县| 右玉县| 台江县| 斗六市| 淮安市| 巴南区| 临朐县| 峨山| 唐海县| 仪陇县| 芮城县| 宁阳县| 永登县|