吉蘭芳
摘要:在電力專網(wǎng)系統(tǒng)中,基礎(chǔ)設(shè)施安全、業(yè)務(wù)系統(tǒng)安全是網(wǎng)絡(luò)安全防護(hù)的重點(diǎn)。隨著大數(shù)據(jù)、大集中、智能化電網(wǎng)的發(fā)展,數(shù)據(jù)挖掘技術(shù)在電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)中的應(yīng)用越來(lái)越廣泛。本文以數(shù)據(jù)挖掘技術(shù)中的聚類算法為例,以電力專網(wǎng)業(yè)務(wù)系統(tǒng)中網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類分析為研究背景,闡述了聚類算法在電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)中的作用,提出了一種基于聚類算法的電力專網(wǎng)業(yè)務(wù)系統(tǒng)防護(hù)漏洞聚類分析模型。
關(guān)鍵詞:數(shù)據(jù)挖掘;智能電網(wǎng);電力監(jiān)控;網(wǎng)絡(luò)安全
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)30-0030-03
1 研究背景
目前電力系統(tǒng)的網(wǎng)絡(luò)安全防護(hù)還有許多問(wèn)題:比較突出的問(wèn)題是安全防護(hù)實(shí)時(shí)性弱、入侵防御能力差、預(yù)警準(zhǔn)確度低、效率不高?,F(xiàn)階段,多數(shù)電力公司都建設(shè)了電力專網(wǎng)業(yè)務(wù)系統(tǒng)。在電力專網(wǎng)業(yè)務(wù)系統(tǒng)中,傳感器技術(shù)、通信技術(shù)、互聯(lián)網(wǎng)技術(shù)等多種技術(shù)融為一體,最終實(shí)現(xiàn)智能電網(wǎng)的監(jiān)測(cè)和遠(yuǎn)程控制功能。電力專網(wǎng)業(yè)務(wù)系統(tǒng)和普通模式中的人工監(jiān)控進(jìn)行比較,電力監(jiān)控效率更高、更簡(jiǎn)單。該系統(tǒng)可以對(duì)沒(méi)有人值守的生產(chǎn)管理部門(mén)進(jìn)行信號(hào)提取和傳輸工作,將電力公司的智能管理和實(shí)時(shí)監(jiān)控水平提高到了一個(gè)新的高度。
信息安全防范措施的進(jìn)步讓社會(huì)大多數(shù)成員輕松跨越到信息爆炸的時(shí)代,信息安全不穩(wěn)定的弊端暴露無(wú)疑,也就是說(shuō),計(jì)算機(jī)安全技術(shù)的研究作為世界級(jí)課題存在。這種風(fēng)險(xiǎn)能夠潛伏在任何一臺(tái)電子設(shè)備、任何一個(gè)網(wǎng)絡(luò)中?;ヂ?lián)網(wǎng)出現(xiàn)之后,信息安全不可控的弊端就無(wú)處不在,泄密、信息被破壞、記錄被清空、設(shè)備被攻擊等現(xiàn)象屢見(jiàn)不鮮?!跋@镟]件門(mén)”“棱鏡事件”、烏克蘭“黑暗力量”事件等一次又一次地給社會(huì)成員敲響了網(wǎng)絡(luò)安全的警鐘。在國(guó)內(nèi)信息安全不可控的事件也持續(xù)地出現(xiàn),以至于政府網(wǎng)站數(shù)據(jù)也被有預(yù)謀地處理,后果很嚴(yán)重,這就迫使社會(huì)上大多數(shù)人越來(lái)越重視信息安全的問(wèn)題。
2 電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全的關(guān)鍵問(wèn)題
2.1 基礎(chǔ)設(shè)施安全
基礎(chǔ)設(shè)施安全主要指業(yè)務(wù)系統(tǒng)的服務(wù)器、存儲(chǔ)、核心路由器、客戶端等設(shè)備的安全防護(hù)。此類防護(hù)既包括臺(tái)風(fēng)、地震、洪水等自然災(zāi)害,又包括火災(zāi)、蓄意破壞、非法使用竊聽(tīng)或設(shè)備缺陷等人為因素。
2.2 業(yè)務(wù)系統(tǒng)安全
在業(yè)務(wù)系統(tǒng)安全方面重點(diǎn)要從“攻擊”“防御”“監(jiān)測(cè)”“防控”“評(píng)價(jià)”等角度入手,研究完善電力行業(yè)內(nèi)部網(wǎng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施。不過(guò),由于多年信息化建設(shè)側(cè)重點(diǎn)的因素,電力專網(wǎng)業(yè)務(wù)系統(tǒng)中的應(yīng)用安全方面的建設(shè)還比較薄弱。特別是在電力專網(wǎng)業(yè)務(wù)系統(tǒng)各自為政的情況下,統(tǒng)一規(guī)劃和安全思維管理方式還有待提高。同時(shí),電網(wǎng)專網(wǎng)建設(shè)過(guò)程中安全方面的資金支持力度也不是特別足。雖然電力專網(wǎng)業(yè)務(wù)系統(tǒng)已經(jīng)將電力監(jiān)控工作由人工方式變?yōu)樽詣?dòng)化監(jiān)控,但是電力監(jiān)控?cái)?shù)據(jù)的處理能力并沒(méi)有與采集能力保持同步的增長(zhǎng)。
3 數(shù)據(jù)挖掘技術(shù)在電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)中的應(yīng)用
3.1 聚類算法在網(wǎng)絡(luò)安全防護(hù)中的應(yīng)用
在網(wǎng)絡(luò)安全防護(hù)過(guò)程中,數(shù)據(jù)挖掘技術(shù)就是基于事件關(guān)聯(lián)分析模塊對(duì)網(wǎng)絡(luò)平臺(tái)安全事件、性能事件內(nèi)的數(shù)據(jù)挖掘,并發(fā)現(xiàn)這些事件中隱含的有價(jià)值信息。事件關(guān)聯(lián)分析模塊所針對(duì)的網(wǎng)絡(luò)平臺(tái)上的安全事件及性能事件,可以通過(guò)數(shù)據(jù)挖掘來(lái)發(fā)現(xiàn)事件中隱含的有價(jià)值信息。比如說(shuō),數(shù)據(jù)挖掘技術(shù)中的聚類算法、分類算法,迫切需要一種行之有效的機(jī)制來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)安全防護(hù)原始數(shù)據(jù)的清洗工作。在此系統(tǒng)中,數(shù)據(jù)清洗存在的時(shí)間節(jié)點(diǎn)往往集中在數(shù)據(jù)傳輸表單之時(shí)。電力監(jiān)控網(wǎng)絡(luò)安全防護(hù)中數(shù)據(jù)清洗的目標(biāo)是對(duì)發(fā)生錯(cuò)誤的數(shù)據(jù)庫(kù)實(shí)例進(jìn)行適當(dāng)?shù)奶幚怼@?,隨電力專網(wǎng)業(yè)務(wù)系統(tǒng)數(shù)據(jù)傳輸表單自動(dòng)下載的圖形文件和頁(yè)面樣式文件;文件類型為gif、jpeg、jpg、map、css、cgi等文件,網(wǎng)絡(luò)安全防護(hù)設(shè)備中數(shù)據(jù)庫(kù)提取出來(lái)的相關(guān)實(shí)例;電力專網(wǎng)業(yè)務(wù)系統(tǒng)請(qǐng)求方法為POST 和 HEAD的數(shù)據(jù)庫(kù)實(shí)例等等。
3.2 電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全應(yīng)用的聚類算法概述
3.2.1 聚類要素的數(shù)據(jù)處理
在聚類分析中,常用的聚類要素的數(shù)據(jù)處理方法有如下幾種。
由公式(3)可以知道,在不同量綱、不同取值范圍的約束下,數(shù)據(jù)能夠放在一起比較,通常需要對(duì)數(shù)據(jù)進(jìn)行變換處理。變換后的數(shù)據(jù),每個(gè)變量的樣本均值為0,極差為1,且[x*ij<1],在以后的分析計(jì)算中可以減少誤差的產(chǎn)生;同時(shí)變換后的數(shù)據(jù)也是無(wú)量綱的量。
公式(5)經(jīng)過(guò)這種標(biāo)準(zhǔn)化所得的新數(shù)據(jù),各要素的極大值為1,極小值為0,其余的數(shù)值均在0與1之間。
3.2.2 樣品間的距離和相似系數(shù)
3.2.2.1 距離的計(jì)算
公式(10)選擇不同的距離,聚類結(jié)果會(huì)有所差異。在地理分區(qū)和分類研究中,往往采用幾種距離進(jìn)行計(jì)算、對(duì)比,選擇一種較為合適的距離進(jìn)行聚類。
3.2.2.2 相似系數(shù)
1)夾角余角
2)相關(guān)系數(shù)
相關(guān)系數(shù)經(jīng)常用來(lái)試題變量間的相似性.變量[Xi]與[Xj]的相關(guān)系數(shù)定義為公式(12)。
在實(shí)際問(wèn)題中,對(duì)樣品分類常用距離,對(duì)變量分類常用相似系數(shù),即[Q]型聚類分析常用距離,[R]型聚類分析常用相似系數(shù)。
3.2.3聚類分析方法
1)系統(tǒng)聚類法
系統(tǒng)聚類分析方法方法包括最短距離法、最長(zhǎng)聚類法、類平均法、重心法、ward法等八種不同的方法。
2)[K]-均值
將給定的樣本劃分為[K]類,[K]預(yù)先指定,基于使聚類性能指標(biāo)最小化,所用的聚類準(zhǔn)則函數(shù)是聚類集中每一個(gè)樣本點(diǎn)到該類中心的距離平方之和,并使其最小化。
4 基于聚類算法的防護(hù)漏洞聚類分析模型構(gòu)建
4.1 電力專網(wǎng)業(yè)務(wù)系統(tǒng)非法用戶聚類分析流程
在如上圖1的電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類分析過(guò)程中,首先通過(guò)標(biāo)準(zhǔn)化的方法將網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)學(xué)映射和實(shí)現(xiàn)數(shù)據(jù)的離散化。與此同時(shí),將各個(gè)原始數(shù)據(jù)的性質(zhì)、量綱通過(guò)數(shù)學(xué)方法變?yōu)橥粋€(gè)等級(jí)下的量化值,保證數(shù)據(jù)的一致性。
4.2 電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)數(shù)據(jù)標(biāo)準(zhǔn)化
4.3 電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類過(guò)程
輸入:電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類個(gè)數(shù)K,以及標(biāo)準(zhǔn)化了的n個(gè)數(shù)據(jù)對(duì)象。
輸出:滿足方差最小標(biāo)準(zhǔn)的K個(gè)聚類。
Step1 任選K個(gè)作為電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類中心(簇的質(zhì)心);
Step2 迭代計(jì)算電力專網(wǎng)業(yè)務(wù)系統(tǒng)網(wǎng)絡(luò)安全防護(hù)薄弱點(diǎn)聚類中心(簇的質(zhì)心);
Step3 做循環(huán)計(jì)算與中心的距離;
Step4 存儲(chǔ)d的最小值;
Step5 根據(jù)最小值重新劃分聚類中心(簇質(zhì)心);
Step6 當(dāng)簇質(zhì)心不再變化迭代結(jié)束。
參考文獻(xiàn):
[1] 楊建林,房嶺鋒,余濤,肖明衛(wèi),費(fèi)斐,羅鳳章.考慮網(wǎng)絡(luò)安全約束的電力直接交易仿真方法[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2017,29(7):61-67.
[2] 金鑫,李龍威,蘇國(guó)華,劉曉蕾,季佳男.基于Spark框架和PSO優(yōu)化算法的電力通信網(wǎng)絡(luò)安全態(tài)勢(shì)預(yù)測(cè)[J].計(jì)算機(jī)科學(xué),2017,44(S1):366-371.
[3] 高昆侖,王志皓,安寧鈺,趙保華.基于可信計(jì)算技術(shù)構(gòu)建電力監(jiān)測(cè)控制系統(tǒng)網(wǎng)絡(luò)安全免疫系統(tǒng)[J].工程科學(xué)與技術(shù),2017,49(2):28-35.
【通聯(lián)編輯:張薇】