王磊,朱皓,黃力,張宏俊
(貴州電網(wǎng)有限責(zé)任公司六盤水供電局,貴州 六盤水,550001)
隨著電力行業(yè)不斷地向信息化發(fā)展,電力信息系統(tǒng)已經(jīng)成為我們工作中重要的組成部分[1]。電力信息系統(tǒng)可以實(shí)現(xiàn)信息共享,但在給人們帶來便利的同時(shí),也面臨著電力運(yùn)行數(shù)據(jù)泄露的風(fēng)險(xiǎn)。在電力信息系統(tǒng)數(shù)據(jù)庫中存儲(chǔ)著大量的數(shù)據(jù),對(duì)企業(yè)和個(gè)人來說,這些數(shù)據(jù)可能是絕密的,如果不能保證電力運(yùn)行數(shù)據(jù)的安全,不僅影響人們的生活,甚至?xí)斐韶?cái)產(chǎn)的重大損失[2]。電力運(yùn)行數(shù)據(jù)泄露的風(fēng)險(xiǎn)來源主要有兩個(gè)方面,一是來自電力信息系統(tǒng)外網(wǎng),來自外網(wǎng)的泄露風(fēng)險(xiǎn)更引起相關(guān)領(lǐng)域的關(guān)注;二是來自電力信息系統(tǒng)網(wǎng)絡(luò)內(nèi)部的泄露風(fēng)險(xiǎn),也得到了相關(guān)領(lǐng)域的重視。因此,對(duì)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法的研究,成為電力信息系統(tǒng)領(lǐng)域關(guān)注的焦點(diǎn)[3]。
劉科研等人[4]提出了一種基于數(shù)據(jù)挖掘的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法,首先采集電力運(yùn)行數(shù)據(jù)泄露信息,對(duì)采集的信息進(jìn)行去冗,再利用改進(jìn)的有限元方程算法對(duì)電力運(yùn)行泄露數(shù)據(jù)進(jìn)行分析計(jì)算,得到泄露信息的特征集,利用數(shù)據(jù)挖掘系統(tǒng)對(duì)特征集進(jìn)行風(fēng)險(xiǎn)預(yù)警。實(shí)驗(yàn)結(jié)果表明,基于數(shù)據(jù)挖掘的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法,可有效地提高電力信息系統(tǒng)的風(fēng)險(xiǎn)預(yù)警準(zhǔn)確性。李敏等人[5]為了保證電力運(yùn)行數(shù)據(jù)的安全,提出了一種基于信息聚類融合處理的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法。構(gòu)建電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)評(píng)估仿真模型,采集電力信息系統(tǒng)運(yùn)行狀態(tài)下的數(shù)據(jù)信息,利用模糊自適應(yīng)C聚類算法對(duì)運(yùn)行狀態(tài)下的電力數(shù)據(jù)進(jìn)行狀態(tài)評(píng)估,選取電力信息系統(tǒng)運(yùn)行狀態(tài)下風(fēng)險(xiǎn)特征量子,利用信息追蹤反饋技術(shù)對(duì)風(fēng)險(xiǎn)特征量子進(jìn)行預(yù)警。仿真試驗(yàn)結(jié)果證明,基于信息聚類融合處理的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法,可對(duì)運(yùn)行的電力數(shù)據(jù)風(fēng)險(xiǎn)信息進(jìn)行實(shí)時(shí)預(yù)警,有效地保證了電力運(yùn)行數(shù)據(jù)的安全。
針對(duì)上述分析可知,雖然現(xiàn)有方法可以有效地進(jìn)行實(shí)施預(yù)警,但是存在很多電力運(yùn)行數(shù)據(jù)泄露都無法追蹤到具體的路徑,使相關(guān)領(lǐng)域?qū)τ陔娏\(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法研究舉步維艱。因此,本文基于SOM聚類,對(duì)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法進(jìn)行研究,以期為實(shí)現(xiàn)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警的實(shí)施提供幫助。
在電力信息系統(tǒng)運(yùn)行過程中,當(dāng)運(yùn)行數(shù)據(jù)發(fā)生變化時(shí),其變化值超過目標(biāo)值時(shí),表明發(fā)生了數(shù)據(jù)泄露,需要對(duì)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)進(jìn)行檢測(cè)。利用電力運(yùn)行數(shù)據(jù)的信息特征量結(jié)合動(dòng)態(tài)目標(biāo)值[6-7],對(duì)泄露節(jié)點(diǎn)進(jìn)行預(yù)警。這種檢測(cè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的方法,可以根據(jù)電力運(yùn)行數(shù)據(jù)的歷史目標(biāo)值變化,調(diào)整相應(yīng)的目標(biāo)閾值,再通過對(duì)泄露節(jié)點(diǎn)的信息值與調(diào)整后的目標(biāo)閾值進(jìn)行對(duì)比分析[8],通過分析結(jié)果判斷電力運(yùn)行數(shù)據(jù)是否存在泄露節(jié)點(diǎn)。具體操作如下:
Step1:在時(shí)間t內(nèi)對(duì)電力信息系統(tǒng)的電力運(yùn)行數(shù)據(jù)進(jìn)行信息采集,并對(duì)采集到的數(shù)據(jù)進(jìn)行分析;
Step2:計(jì)算時(shí)間t內(nèi),計(jì)算出每一個(gè)電力運(yùn)行數(shù)據(jù)的特征量值E,根據(jù)特征量值使運(yùn)行數(shù)據(jù)信息進(jìn)行矩陣排列:
(1)
上述公式中,N為在時(shí)間T內(nèi),電力信息系統(tǒng)不同節(jié)點(diǎn)出現(xiàn)的電力運(yùn)行數(shù)據(jù)信息的數(shù)量值,Q為第i個(gè)節(jié)點(diǎn)電力運(yùn)行數(shù)據(jù)占總電力運(yùn)行數(shù)據(jù)的百分比。
Step3:計(jì)算電力信息系統(tǒng)正常運(yùn)行情況下,電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的時(shí)刻檢測(cè)閾值ω[9-10],以及與平均目標(biāo)閾值的差值。如果兩個(gè)電力運(yùn)行數(shù)據(jù)信息節(jié)點(diǎn)的閾值差小于k*D,表明電力信息系統(tǒng)運(yùn)行正常[11]。如果兩個(gè)電力運(yùn)行數(shù)據(jù)信息節(jié)點(diǎn)的閾值差大于k*D,則表明存在泄露節(jié)點(diǎn)。A為檢測(cè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的時(shí)刻檢測(cè)閾值ω的平均值,D為平均閾值A(chǔ)與ω之間存在的偏導(dǎo)系數(shù);k為電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的最大偏導(dǎo)系數(shù),該指數(shù)直接影響檢測(cè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的準(zhǔn)確性。計(jì)算公式如下:
(2)
(3)
如果電力信息系統(tǒng)沒有電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn),可以在上述的矩陣中通過計(jì)算得到目標(biāo)閾值,并根據(jù)公式(3)對(duì)各個(gè)電力運(yùn)行數(shù)據(jù)節(jié)點(diǎn)進(jìn)行目標(biāo)閾值更新,以方便下一輪的電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)檢測(cè)。
如果電力信息系統(tǒng)存在電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn),則更新各個(gè)電力運(yùn)行數(shù)據(jù)節(jié)點(diǎn)的目標(biāo)閾值[12]。直接對(duì)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)檢測(cè),保證檢測(cè)數(shù)據(jù)的實(shí)時(shí)性與準(zhǔn)確性。
為了有效地對(duì)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)進(jìn)行提前預(yù)警,采用自適應(yīng)SOM聚類的方法[13-14],根據(jù)電力信息系統(tǒng)正常運(yùn)行情況下泄露節(jié)點(diǎn)的特征量,確定基于自適應(yīng)SOM聚類的電力運(yùn)行數(shù)據(jù)樣本數(shù),操作過程如下:
首先,設(shè)電力信息系統(tǒng)正常運(yùn)行下電力運(yùn)行數(shù)據(jù)的泄露節(jié)點(diǎn)集合為X=x1,x2,……,xN,各個(gè)泄露節(jié)點(diǎn)的電力運(yùn)行數(shù)據(jù)和為目標(biāo)集合A(L),B(L)為電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的種類,L為電力信息系統(tǒng)運(yùn)行情況下電力運(yùn)行數(shù)據(jù)樣本的自適應(yīng)分類。
其次,以第一個(gè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)作為起點(diǎn),確定自適應(yīng)聚類中心為泄露節(jié)點(diǎn)的樣本點(diǎn),規(guī)定數(shù)據(jù)信息的密度集為xi,并將密度集作為自適應(yīng)聚類中心的核心節(jié)點(diǎn)[15],當(dāng)A(1)=xi,B(1)=1時(shí),電力運(yùn)行數(shù)據(jù)樣本的密度指數(shù)如下:
(4)
上述公式中,d1為電力型數(shù)據(jù)的樣本點(diǎn),xi為聚類中心的半徑。
然后,計(jì)算出每一個(gè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的樣本點(diǎn)xj與聚類中心的距離r,設(shè)自適應(yīng)聚類閾值為d2。當(dāng)r小于或等于d2時(shí),將電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的樣本點(diǎn)歸入自適應(yīng)聚類中心中,當(dāng)r大于d2時(shí),樣本點(diǎn)暫不做歸類處理。把上述已歸類的樣本點(diǎn)重新做自適應(yīng)分析處理,得到樣本集合X′,重復(fù)上述操作,設(shè)定一個(gè)閾值為M,最終使r≤d2。綜上所述,得到電力運(yùn)行數(shù)據(jù)樣本自適應(yīng)分類L。
利用下述公式計(jì)算,求得每一個(gè)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)樣本的類別A(i),ci為隱藏樣本的原始數(shù)據(jù)。
(5)
上述公式中,i=1,2,3,……,L。
通過上述公式得到隱藏樣本的聚類中心,再利用下面公式求得聚類函數(shù)的擴(kuò)展度[16-17]。
(6)
上述公式中,cmax為原始數(shù)據(jù)中心點(diǎn)與聚類中心的距離。利用聚類函數(shù)[18],實(shí)現(xiàn)電力運(yùn)行數(shù)據(jù)樣本的自適應(yīng)分類,則得出:
(7)
綜上所述,通過對(duì)電力信息系統(tǒng)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)的樣本進(jìn)行自適應(yīng)聚類,增加其聚類函數(shù)的擴(kuò)展度,最終實(shí)現(xiàn)電力運(yùn)行數(shù)據(jù)樣本的自適應(yīng)分類。
本文基于SOM聚類分析,對(duì)電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)進(jìn)行采集篩查,并通過自適應(yīng)分類[19],最終構(gòu)建電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警模型。
設(shè)H為電力運(yùn)行數(shù)據(jù)W的信息合集,Y為電力運(yùn)行數(shù)據(jù)的特征量,O為每個(gè)節(jié)點(diǎn)電力運(yùn)行數(shù)據(jù)的抽樣的樣本,得到電力信息系統(tǒng)的電力運(yùn)行數(shù)據(jù)泄露時(shí)刻特征量為:
W=(H,Y,O)
(8)
設(shè)O為電力信息系統(tǒng)運(yùn)行過程某個(gè)隱蔽的電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn)[20-21],那么O就是n個(gè)泄露節(jié)點(diǎn)內(nèi)的一個(gè)泄露風(fēng)險(xiǎn)信息,那么用下述方程表示電力運(yùn)行數(shù)據(jù)泄露信息O:
∑ωa1a2……amxa1xa2……+b0……0
(9)
上述方程中,無法確定的電力運(yùn)輸數(shù)據(jù)泄露風(fēng)險(xiǎn)信息為ωa1a2……am,電力運(yùn)行數(shù)據(jù)信息泄露點(diǎn)合集為a=1,2,3,……,r,當(dāng)隱藏泄露點(diǎn)信息量為x=xa1,xa2,……,aam,結(jié)合公式(9)可得到相應(yīng)的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)信息為:
(10)
用以下公式表示,當(dāng)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)信息進(jìn)入監(jiān)控區(qū)域時(shí),對(duì)泄露風(fēng)險(xiǎn)信息進(jìn)行聚類分析[22-23],然后通過聚類樣本的動(dòng)態(tài)閾值確定準(zhǔn)確的泄露風(fēng)險(xiǎn)節(jié)點(diǎn)。
(11)
假如,G為電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)信息的橫向函數(shù)差,則電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)函數(shù)為:
(12)
假如,電力運(yùn)行數(shù)據(jù)信息的輸入樣本l的泄露風(fēng)險(xiǎn)信息為xl,k為電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)信息的樣本因子,ck代表聚類樣本信息重點(diǎn),ωkj為各個(gè)電力運(yùn)輸數(shù)據(jù)節(jié)點(diǎn)的連接值,m和yj為電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)信息的函數(shù)數(shù)目與種類,那么得到電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警函數(shù)公式為:
(13)
根據(jù)電力運(yùn)行數(shù)據(jù)方程,計(jì)算了電力運(yùn)行數(shù)據(jù)的具體數(shù)值,利用電力運(yùn)行數(shù)據(jù)的轉(zhuǎn)入函數(shù),構(gòu)建了電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警模型,實(shí)現(xiàn)了電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)的預(yù)警。
為了證明基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在實(shí)際應(yīng)用中可以達(dá)到一種可觀的效果,將此次預(yù)警方法應(yīng)用于某電網(wǎng)實(shí)時(shí)運(yùn)行風(fēng)險(xiǎn)管控系統(tǒng)中進(jìn)行驗(yàn)證。
該電網(wǎng)實(shí)時(shí)運(yùn)行風(fēng)險(xiǎn)管控系統(tǒng)的數(shù)據(jù)傳輸與發(fā)送主要表現(xiàn)在電網(wǎng)能量管理模塊,該模塊包括主站、生產(chǎn)管理系統(tǒng)以及調(diào)度操作執(zhí)行下發(fā)系統(tǒng)三部分,其中主站每5分鐘向總系統(tǒng)發(fā)布最新的電網(wǎng)運(yùn)行數(shù)據(jù)信息,提供其必需的電網(wǎng)運(yùn)行負(fù)荷等基本參數(shù)。生產(chǎn)管理系統(tǒng)則作為存儲(chǔ)和管理預(yù)設(shè)數(shù)據(jù)的來源,向其提供預(yù)設(shè)數(shù)據(jù)信息。調(diào)度操作執(zhí)行下發(fā)系統(tǒng)由調(diào)度員定期發(fā)送調(diào)度操作指令,供風(fēng)險(xiǎn)管控系統(tǒng)分析決策。基于此分析,設(shè)置了如表1所示的仿真環(huán)境參數(shù)。
表1 仿真環(huán)境參數(shù)Tab.1 Simulation environment parameters
在表1仿真環(huán)境參數(shù)設(shè)置完成后,確定此次仿真分析的評(píng)級(jí)指標(biāo)??紤]到電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警需要具備實(shí)時(shí)性、高精度等特點(diǎn),因此設(shè)定預(yù)警精度、查全率以及查全率和風(fēng)險(xiǎn)預(yù)警精度的調(diào)和均值為此次仿真分析的三個(gè)評(píng)價(jià)指標(biāo)。評(píng)價(jià)指標(biāo)參數(shù)的結(jié)果解釋如表2所示。
表2 評(píng)價(jià)指標(biāo)參數(shù)的結(jié)果解釋Tab.2 Result interpretation of evaluation index parameters
假設(shè)precision表示電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警精度,recall為查全率,F(xiàn)-measure表示查全率和風(fēng)險(xiǎn)預(yù)警精度的調(diào)和均值,計(jì)算公式為:
(14)
(15)
(16)
分別引入傳統(tǒng)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法、文獻(xiàn)[4]的數(shù)據(jù)挖掘方法和文獻(xiàn)[5]的信息聚類融合處理方法,與基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法形成對(duì)比進(jìn)行仿真分析,在2000組~9000組不同規(guī)模測(cè)試組內(nèi)進(jìn)行仿真分析,結(jié)果如下。
四種風(fēng)險(xiǎn)預(yù)警方法的準(zhǔn)確率對(duì)比結(jié)果如圖1所示。
圖1 預(yù)警準(zhǔn)確率對(duì)比結(jié)果Fig.1 Comparison results of early warning accuracy
從圖1的結(jié)果可以看出,與其他三種電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法相比,基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法獲取到的預(yù)警準(zhǔn)確率在70%以上,并且始終沒有出現(xiàn)比較大的波形。原因是本文設(shè)計(jì)的風(fēng)險(xiǎn)預(yù)警方法采用SOM聚類的方法首先檢測(cè)了電力運(yùn)行數(shù)據(jù)泄露節(jié)點(diǎn),減少了電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)在預(yù)警的最后階段產(chǎn)生的干擾信息,大大提高了電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)的預(yù)警準(zhǔn)確率。
為了驗(yàn)證基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在應(yīng)用時(shí)的性能,測(cè)試了四種電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法的F-measure值,結(jié)果如圖2所示。
圖2 F-measure值對(duì)比結(jié)果Fig.2 F-measure value comparison results
從圖2的結(jié)果可以看出,隨著迭代次數(shù)的增加,基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在預(yù)警電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)時(shí)的性能是最好的,F(xiàn)-measure值最高時(shí)為迭代20次時(shí)的0.8。原因是本文設(shè)計(jì)的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法可以通過對(duì)電力運(yùn)行數(shù)據(jù)樣本進(jìn)行自適應(yīng)分類,計(jì)算出可能出現(xiàn)泄露風(fēng)險(xiǎn)的節(jié)點(diǎn),大大降低了電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警的計(jì)算量,還可以有效提高查全率,最終獲得的預(yù)警結(jié)果具有更高的可信度。
基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在實(shí)際應(yīng)用過程中幅度波動(dòng)率測(cè)試結(jié)果如圖3所示。
圖3 幅度波動(dòng)率測(cè)試結(jié)果Fig.3 Range volatility test results
電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警幅度波動(dòng)率可以反映出風(fēng)險(xiǎn)預(yù)警模型的預(yù)警結(jié)果是否穩(wěn)定,判斷出外界環(huán)境因素是否會(huì)影響預(yù)警效果。從圖3的結(jié)果可以看出,基于SOM聚類的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在應(yīng)用過程中預(yù)警的幅度波動(dòng)率保持在[50,-50]之間,說明本文設(shè)計(jì)的風(fēng)險(xiǎn)預(yù)警模型在外界環(huán)境干擾的條件下,也可以獲得更加準(zhǔn)確的風(fēng)險(xiǎn)預(yù)警效果,適合在多種環(huán)境中應(yīng)用。
為了有效緩解電力系統(tǒng)中電力運(yùn)行數(shù)據(jù)的泄露問題,采用SOM聚類方法對(duì)電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法進(jìn)行改善,結(jié)果顯示,本文設(shè)計(jì)的電力運(yùn)行數(shù)據(jù)泄露風(fēng)險(xiǎn)預(yù)警方法在實(shí)際應(yīng)用中具有更好的預(yù)警效果,預(yù)警準(zhǔn)確率在70%以上,查全率和風(fēng)險(xiǎn)預(yù)警精度的調(diào)和均值最高時(shí)為迭代20次時(shí)的0.8,預(yù)警的幅度波動(dòng)率保持在[50,-50]。由于本文參考的文獻(xiàn)資料有限,雖然可以檢測(cè)出電力運(yùn)行數(shù)據(jù)的泄露節(jié)點(diǎn),但是無法確定泄露路徑,仍然無法從根本上解決電力運(yùn)行數(shù)據(jù)的泄露問題,在今后的研究中要考慮到這一因素。