郝成亮 呂洪波 馬旭東
(國網(wǎng)吉林省電力有限公司信息通信公司,吉林 長春130021)
信息通信技術(shù)的支撐在其中扮演著舉足輕重的角色,信息通信運(yùn)維質(zhì)量的提升已成為電網(wǎng)信息通信運(yùn)行過程中一項(xiàng)重要的工作。
隨著電網(wǎng)信息通信系統(tǒng)規(guī)模的不斷增大。在電力公司信息通信系統(tǒng)運(yùn)行的過程中,系統(tǒng)應(yīng)用以及系統(tǒng)本身都會產(chǎn)生各類日志來記錄系統(tǒng)的狀態(tài)、重要的運(yùn)行事件和網(wǎng)絡(luò)流量,因此日志包含系統(tǒng)運(yùn)行的動態(tài)信息[1]。通過對電網(wǎng)信息通信系統(tǒng)的日志進(jìn)行分析,提取出體現(xiàn)信息通信運(yùn)維質(zhì)量的相關(guān)指標(biāo),所以實(shí)現(xiàn)信息通信運(yùn)行過程各種日志的綜合評價與管控能夠有效提升信息通信運(yùn)維質(zhì)量[2]。
在運(yùn)維質(zhì)量評價工作中,由于電力信息通信系統(tǒng)中的組件繁雜,各組件的狀態(tài)都會對系統(tǒng)運(yùn)維質(zhì)量產(chǎn)生影響。因此,需要建立一個完整的指標(biāo)體系進(jìn)行綜合評價。在構(gòu)建指標(biāo)體系的過程中,評價指標(biāo)的選取工作是重中之重[3]。
通過將系統(tǒng)組件數(shù)據(jù)庫、服務(wù)器以及中間件的日志進(jìn)行聚類分析,進(jìn)而進(jìn)行指標(biāo)抽取,在將指標(biāo)數(shù)據(jù)經(jīng)過歸一化和無綱量化預(yù)處理后,需要對指標(biāo)進(jìn)行相關(guān)性分析,進(jìn)行相關(guān)性分析后能夠讓最后的評價結(jié)果更準(zhǔn)確。最后指標(biāo)體系如圖1 所示。
隨機(jī)森林是機(jī)器學(xué)習(xí)中的一種典型分類算法,通過將若干個決策樹組合在一起來進(jìn)行分類,因此叫“森林”。給定訓(xùn)練集,包含k 個決策樹的隨機(jī)森林的構(gòu)建過程如下:
輸入:原始數(shù)據(jù)集,隨機(jī)森林中決策樹個數(shù),分類數(shù)
輸出:分類結(jié)果
步驟1:抽樣:對原始數(shù)據(jù)集進(jìn)行有放回的抽樣,得到若干個訓(xùn)練集。
步驟2:構(gòu)建決策樹:利用若干個訓(xùn)練集構(gòu)建決策樹。在構(gòu)建過程中,對于每一個節(jié)點(diǎn),候選屬性。最后得到?jīng)Q策樹,并將該決策樹加入隨機(jī)森林模型。
步驟3:最終得到的隨機(jī)森林包含k 個決策樹(M1,M2...MK)。給定一個待分類的樣本,F(xiàn) 中每個決策樹Mi 都會得出一個分類結(jié)果,總共得到k 個結(jié)果(即k 個類標(biāo)號)。最后采用多數(shù)表決法進(jìn)行投票,票數(shù)最多的類標(biāo)號作為該樣本的分類結(jié)果。
本文將電力信息通信系統(tǒng)運(yùn)維質(zhì)量分為優(yōu)、良、中、及、差五個等級,通過對第一章構(gòu)建的指標(biāo)體系中的指標(biāo)進(jìn)行訓(xùn)練,將其分為五類。即構(gòu)建的隨機(jī)森林分類模型輸出為五個質(zhì)量等級。具體步驟如下:
(1)日志指標(biāo)評價數(shù)據(jù)集D 樣本輸入;
(2)評價運(yùn)維質(zhì)量等級分為等:優(yōu)、良、中、及、差,為了方便模型構(gòu)建,用1、2、3、4、5 表示。
(3)分割原始數(shù)據(jù)集,70%作為訓(xùn)練集,30%作為測試集。
(4)從D 中利用Bootstrap 采樣隨機(jī)選取k 個子訓(xùn)練樣本集D1,D2,...,Dk,并預(yù)建k 棵分類樹。
(5)在分類樹的每個節(jié)點(diǎn)上隨機(jī)地從5 個指標(biāo)中選取,選取最優(yōu)分割指標(biāo)進(jìn)行分類。
本文選取東北區(qū)域某信通公司數(shù)據(jù)進(jìn)行信息通信系統(tǒng)綜合評價,通過對該系統(tǒng)中各組件的日志文件進(jìn)行第一章的指標(biāo)體系構(gòu)建后,可使用第二章中得模型構(gòu)建步驟進(jìn)行綜合評價。通過本文隨機(jī)森林模型,得出該系統(tǒng)的運(yùn)維質(zhì)量,處于優(yōu)和良水平之間。并將本文所提模型與神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了幾項(xiàng)分類精度、召回率以及F1 分?jǐn)?shù)上的對比,如表1 所示。
從表中可以看出本文所提模型在優(yōu)、良、中、及、差五個指標(biāo)等級的訓(xùn)練結(jié)果中,分類精度、召回率以及F1 分?jǐn)?shù)都是要優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的。
表1 評價結(jié)果對比
本文通過對電力信息通信系統(tǒng)中各組件的日志進(jìn)行分析,從日志中提取出能夠體現(xiàn)系統(tǒng)運(yùn)維質(zhì)量的指標(biāo)體系,從一個新的角度對系統(tǒng)運(yùn)維質(zhì)量進(jìn)行了綜合評價,并且提出了機(jī)器學(xué)習(xí)的方法來進(jìn)行綜合評價,彌補(bǔ)了傳統(tǒng)綜合評價方法的一些不足之處。在接下來的研究中,將擴(kuò)大指標(biāo)提取范圍,從信息通信設(shè)備中提取指標(biāo),為信息通信系統(tǒng)做更全面的評價工作。