林志超
(廣東電網(wǎng)有限責(zé)任公司惠州供電局,惠州 516001)
二次設(shè)備基礎(chǔ)數(shù)據(jù)挖掘系統(tǒng)的設(shè)計與實現(xiàn)
林志超
(廣東電網(wǎng)有限責(zé)任公司惠州供電局,惠州516001)
南方電網(wǎng)科技項目(No.K-GD2013-0706)
隨著電力系統(tǒng)自動化和信息化的發(fā)展,數(shù)字化電子設(shè)備不斷增多,各類相互獨立的監(jiān)控系統(tǒng)、地理信息系統(tǒng)和管理信息系統(tǒng)的投運,電力系統(tǒng)中產(chǎn)生的數(shù)據(jù)正在以指數(shù)速度增長[1]。隨著不同時期建立的各類信息系統(tǒng)之間的交互變得復(fù)雜,信息和設(shè)備等安全風(fēng)險日益加劇,電力二次系統(tǒng)安全面臨前所未有的挑戰(zhàn)[2-3],調(diào)度操作人員也面臨著越來越大的決策壓力。
近年來,數(shù)據(jù)挖掘技術(shù)已經(jīng)在電力系統(tǒng)中得到越來越多的應(yīng)用[4],包括電力系統(tǒng)安全評估、電網(wǎng)經(jīng)濟調(diào)度、負(fù)荷預(yù)測、故障診斷等方面[5]。這些研究主要集中在電力一次系統(tǒng)。在電網(wǎng)安全風(fēng)險方面,電力一次系統(tǒng)的風(fēng)險評已經(jīng)得到了比較深入的研究[6],而對二次系統(tǒng)安全風(fēng)險研究主要包括從安全防御角度提出構(gòu)想[7],從運維及安全管理角度進行系統(tǒng)設(shè)計[8],或者關(guān)注二次設(shè)備系統(tǒng)狀態(tài)監(jiān)測[9],數(shù)據(jù)分析與挖掘的研究尚較缺乏。
電力二次系統(tǒng)是指各級電力監(jiān)控系統(tǒng)和調(diào)度數(shù)據(jù)網(wǎng)絡(luò)以及各級管理信息系統(tǒng)和電力數(shù)據(jù)通信網(wǎng)絡(luò)構(gòu)成的大系統(tǒng)[6],可實現(xiàn)人與一次系統(tǒng)的聯(lián)系監(jiān)視、控制,確保一次系統(tǒng)能安全經(jīng)濟地運行,因而是電力系統(tǒng)不可缺少的重要組成部分。包括控制和信號器具、測量儀表、繼電保護裝置、自動裝置、遠(yuǎn)動裝置、操作電源及二次電纜等的電網(wǎng)二次設(shè)備成為了電力系統(tǒng)設(shè)備可靠性研究的重要組成部分[6]。本文從惠州供電局的二次設(shè)備數(shù)據(jù)管理的現(xiàn)狀及需求出發(fā),設(shè)計和實現(xiàn)了供電局二次設(shè)備基礎(chǔ)數(shù)據(jù)挖掘系統(tǒng),為降低電力二次系統(tǒng)安全風(fēng)險整體水平,確保電力系統(tǒng)的安全高效運行提供決策支持。
系統(tǒng)總體技術(shù)框架如圖1所示。
在各異構(gòu)數(shù)據(jù)源匯集到業(yè)務(wù)應(yīng)用系統(tǒng)操作平臺的基礎(chǔ)上,二次設(shè)備基礎(chǔ)數(shù)據(jù)挖掘系統(tǒng)的數(shù)據(jù)處理與分析主要包括以下環(huán)節(jié):
(1)數(shù)據(jù)預(yù)處理
通過分析業(yè)務(wù)系統(tǒng)中的數(shù)據(jù),選取合適的數(shù)據(jù),并通過ETL(抽取、轉(zhuǎn)換、加載)得到提供給數(shù)據(jù)挖掘的完整和一致的綜合數(shù)據(jù)集。
(2)基礎(chǔ)統(tǒng)計
基礎(chǔ)統(tǒng)計提供基本的數(shù)理統(tǒng)計,一方面支持對數(shù)據(jù)的淺層分析,另一方面也可以作為后續(xù)特征分析或數(shù)據(jù)挖掘的預(yù)分析階段。
(3)特征分析
通過對特征進行描述性數(shù)據(jù)分析,選取合適的特征以及合適的特征生成參數(shù),如聚合粒度。
(4)數(shù)據(jù)挖掘
通過對業(yè)務(wù)需求的深入分析,選定開展的數(shù)據(jù)挖掘方法,開展數(shù)據(jù)挖掘工作[10]。主要的數(shù)據(jù)挖掘方法包括聚類方法、關(guān)聯(lián)分析、分類與預(yù)測等。
(5)知識表達
根據(jù)數(shù)據(jù)挖掘的結(jié)果,轉(zhuǎn)換為合適的知識表達,并進行初步評估,然后交給業(yè)務(wù)部門供決策支持用。
圖1 系統(tǒng)總體技術(shù)框架
2.1供電局二次設(shè)備數(shù)據(jù)分析
惠州供電局目前的二次設(shè)備數(shù)據(jù)管理的現(xiàn)狀是,雖然已經(jīng)有統(tǒng)一安裝實現(xiàn)的生產(chǎn)MIS系統(tǒng),但缺乏在其基礎(chǔ)上通過對二次設(shè)備數(shù)據(jù)的整合與挖掘,實現(xiàn)二次數(shù)據(jù)微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,為二次設(shè)備的運維管理工作提供指導(dǎo)和決策參考;通過對數(shù)據(jù)分析,發(fā)現(xiàn)事件間的相互關(guān)聯(lián),利用已有的數(shù)據(jù)對未來二次設(shè)備的狀態(tài)、定值、潛在缺陷等內(nèi)容進行預(yù)測。
通過業(yè)務(wù)需求分析,初步確定待分析的數(shù)據(jù)有:EMS系統(tǒng)告警信息、變電站信息、設(shè)備信息、告警類型信息、生產(chǎn)系統(tǒng)缺陷信息等,告警信息又分為:遙信變位、二次遙信告警、事故、遙測越限、遙控操作、遙信操作、遙測操作、SOE等數(shù)據(jù)。這些數(shù)據(jù)的關(guān)系如圖2所示。
圖2 待分析的二次設(shè)備數(shù)據(jù)
2.2系統(tǒng)主要功能模塊
系統(tǒng)的功能主要包括基礎(chǔ)數(shù)據(jù)管理、基礎(chǔ)統(tǒng)計和數(shù)據(jù)挖掘三個方面。如圖3所示。
圖3 系統(tǒng)功能結(jié)構(gòu)圖
(1)基礎(chǔ)數(shù)據(jù)管理
主要包括用戶管理、變電站管理以及系統(tǒng)日志三個子模塊。用于設(shè)定統(tǒng)計分析范圍及數(shù)據(jù)挖掘的訪問權(quán)限控制與保留歷史操作痕跡。
(2)基礎(chǔ)統(tǒng)計
主要包括了對變電站告警信息不同范圍以及不同時間粒度的統(tǒng)計,可以按變電站、饋線進行統(tǒng)計,也支持年、月、日、時等不同時間粒度的統(tǒng)計。并且還包括了對SOE告警的延時統(tǒng)計,以及遙信抖動的統(tǒng)計。
(3)數(shù)據(jù)挖掘
關(guān)聯(lián)規(guī)則分析:采用經(jīng)典的Apriori算法挖掘告警信息流中的頻繁模式。得到在選定觀測時期內(nèi)特定觀測窗口時間粒度的滿足設(shè)定的最小支持度閾值(min_sup)頻繁告警組合。在頻繁模式挖掘的基礎(chǔ)上進行關(guān)聯(lián)規(guī)則提取,分析同時滿足最小支持度閾值(min_sup)和最小置信度閾值(min_conf)的規(guī)則,得到關(guān)聯(lián)的告警。
聚類分析:采用經(jīng)典的K-mean聚類算法,基于告警統(tǒng)計信息,進行變電站告警狀況聚類,分離出不同種類的變電站。對聚類的結(jié)果進行進一步的類內(nèi)分析(Intra-Cluster),配合專業(yè)人員的解讀,給出不同聚類群體的分析結(jié)論。
未來計劃繼續(xù)增加時間序列分析和分類預(yù)測等挖掘業(yè)務(wù)。
系統(tǒng)采用J2EE企業(yè)開發(fā)標(biāo)準(zhǔn),使用SSH框架作為基本開發(fā)構(gòu)建,使用可以擴展MVC經(jīng)典模式。MVC是一種使用Model View Controller(模型-視圖-控制器)設(shè)計創(chuàng)建Web應(yīng)用程序的模式,在本系統(tǒng)中Model(模型)層對告警數(shù)據(jù)源進行抽取、轉(zhuǎn)換,并通過統(tǒng)計方法和數(shù)據(jù)挖掘算法建立數(shù)據(jù)分析模型,View(視圖)層以網(wǎng)頁方式把挖掘分析結(jié)果以各種圖表方式進行知識表達,建立用戶交互界面,Controller(控制器)層連通底層數(shù)據(jù)模型與用戶交互界面,為知識表達與數(shù)據(jù)分析模型之間提供傳輸通道。系統(tǒng)采用B/S結(jié)構(gòu)進行開發(fā)。主界面如圖4所示,左邊是功能模塊欄目,右邊是信息展示窗口。
數(shù)據(jù)挖掘還支持過程數(shù)據(jù)展示,方便分析人員查閱數(shù)據(jù)挖掘過程的一些中間處理結(jié)果。如關(guān)聯(lián)規(guī)則分析,圖5所示,可以查看選定變電站每天的告警信息,還可以查閱選定事務(wù)窗口(步長)后的數(shù)據(jù)準(zhǔn)備結(jié)果,并且可以提供刪除相似告警模式的功能。
數(shù)據(jù)挖掘的結(jié)果以方便提供輔助決策的知識展示,如關(guān)聯(lián)規(guī)則分析的結(jié)果包括帶支持度的頻繁項集,以及帶支持度和置信度的關(guān)聯(lián)規(guī)則,如圖6所示。
圖4 系統(tǒng)主界面
圖5 關(guān)聯(lián)規(guī)則分析挖據(jù)過程
圖6 關(guān)聯(lián)規(guī)則分析挖據(jù)結(jié)果展示
本文探討了面向二次系統(tǒng)安全風(fēng)險控制的二次設(shè)備基礎(chǔ)數(shù)據(jù)管理與分析問題。從惠州供電局的二次設(shè)備數(shù)據(jù)管理的現(xiàn)狀和需求出發(fā),設(shè)計和實現(xiàn)了包含基礎(chǔ)統(tǒng)計和數(shù)據(jù)挖掘的決策支持系統(tǒng),可預(yù)期能為降低電力二次系統(tǒng)安全風(fēng)險整體水平,確保電力系統(tǒng)的安全高效運行提供輔助決策。
[1]廖志偉,孫雅明.數(shù)據(jù)挖掘技術(shù)及其在電力系統(tǒng)中的應(yīng)用[J].電力系統(tǒng)自動化,2011,25(11):62-66
[2]帥軍慶.特大型電網(wǎng)高級調(diào)度中心關(guān)鍵技術(shù)[M].北京:中國電力出版社,2010:220-224.
[3]Pearson ILG.Smart Grid Cyber Security for Europe[J].Energy Policy,2011,39(9):5211-5218.
[4]陳星鶯,張曉花,瞿峰,等.數(shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用綜述[J].電力科學(xué)與技術(shù)學(xué)報,2007,22(3):51-56.
[5]Mori H.State-of-Art Overview on Data Mining in Power Systems[C].IEEE Power Engineering Society General Meeting,Canada,2006.
[6]郭創(chuàng)新,陸海波,俞斌,等.電力二次系統(tǒng)安全風(fēng)險評估研究綜述[J].電網(wǎng)技術(shù),2013,37(1):112-118.
[7]胡炎,辛耀中,韓英鐸.二次系統(tǒng)安全體系結(jié)構(gòu)化設(shè)計方法[J].電力系統(tǒng)自動化,2003,27(21):63-68.
[8]徐展強,陳家桐.電力二次系統(tǒng)運維及安全管理系統(tǒng)設(shè)計[J].電力信息化,2012,10(11):87-91
[9]袁浩,屈剛,莊衛(wèi)金,等.電網(wǎng)二次設(shè)備狀態(tài)監(jiān)測內(nèi)容探討[J].電力系統(tǒng)自動化,2014,38(12):100-106.
[10]韓家煒,Micheline Kamber,裴健.數(shù)據(jù)挖掘概念與技術(shù)(第三版)[J].北京:機械工業(yè)出版社,2012.
Design and Implementation of Basic Data Mining System of Secondary Equipment
LIN Zhi-chao
(Huizhou Power Supply Bureau,Guangdong Power Grid Co.,Ltd.,Huizhou 516001)
林志超(1972-),男,惠州人,碩士,高級工程師,研究方向為繼電保護
2015-11-19
給出面向二次系統(tǒng)輔助決策的供電局二次設(shè)備基礎(chǔ)數(shù)據(jù)挖掘系統(tǒng)的技術(shù)框架,并從惠州供電局二次設(shè)備數(shù)據(jù)管理的現(xiàn)狀及需求出發(fā),設(shè)計數(shù)據(jù)挖掘系統(tǒng)的主要功能模塊,主要的數(shù)據(jù)分析功能包括基礎(chǔ)統(tǒng)計及關(guān)聯(lián)規(guī)則、聚類分析等數(shù)據(jù)挖掘方法。最后介紹系統(tǒng)實現(xiàn)。
二次設(shè)備;告警分析;數(shù)據(jù)挖掘
Presents the technical framework of the secondary equipment data mining system of Power Supply Bureau,which is designed for the decision support of the secondary system in power grid.The main system functional modules are designed based on the analysis of the current situation and requirement of secondary equipment data management in Huizhou Power Supply Bureau.Main data analysis methods include basic statistics,association rules,clustering analysis and other data mining methods.Finally,the implementation of the system is introduced.