郭曉利,韓 嘯
(東北電力大學信息工程學院,吉林吉林132012)
針對目前現有電網生產各應用系統都是基于本業(yè)務或本部門的需求,存在不同的平臺、不同的應用系統、不同的數據格式,難以從整個電網公司生產全流程的角度來考慮數據的使用,這導致電力公司內部不同的系統信息資源分散[1],橫向不能共享,上下級間縱向貫通困難。電力企業(yè)要提高電網知識創(chuàng)新的速度和效率,就需要通過協同的方式加強電網知識的共享、交互與激活,并通過發(fā)現電網知識資源之間的關聯進行知識整合。
針對上述電網知識資源存在的問題,本文提出一種基于雙庫協同理論的電網知識協同發(fā)現策略,意在為解決這些系統雖然有豐富的數據資源,卻形成了以縱向層次多、橫向系統多為主要特征[2]的“電網信息孤島”的問題提供一種新的思路。
電網知識協同發(fā)現策略模型是利用雙庫協同機制[3]構建了電網數據庫與電網知識庫的內在聯系通道,利用電網基礎知識庫去制約和驅動電網知識的挖掘過程,從而改變電網知識發(fā)現的固有的運行機制[4],在結構與功能上形成了相對傳統電網知識發(fā)現而言的一個開放的、優(yōu)化的擴體。
電網知識協同發(fā)現策略邏輯模型圖如圖1所示。
其主要構成如下:
(1)真實電網數據庫:包括當前各系統存儲的,可以被發(fā)現使用的歷史電網數據和實時電網數據。
圖1 電網知識協同發(fā)現策略模型
(2)基礎電網知識庫:存儲著用科學的形式對電網建設進程中運行、管理、控制及生產等方面中的各環(huán)節(jié)出現的有價值意義的電網經驗信息,其中包括電力安全規(guī)程、電力設備操作規(guī)則、調度員的經驗、領域專家知識等。
(3)驅動電網知識庫:由電網安全穩(wěn)定運行的各類方法和實例結構構成,此庫中的內容均可以叫做電網的驅動知識。
(4)電網知識協同發(fā)現策略集:主要功能是由電網領域專家出做的一些客觀判斷;根據電網領域專家的個人習慣及對電網知識發(fā)現預測結果的初始討論,參考各電網安全穩(wěn)定運行各個環(huán)節(jié)的模型的自身的誤差研究,對新發(fā)現的電網知識是否可以完全接受使用進行可行性評價;依賴各個電網領域專家對電網知識的不同興趣點,對有待進行更深層次研究的“電網知識節(jié)點”進行綜合研究和討論。
(5)衍生電網知識庫:由電網知識協同發(fā)現策略集發(fā)現得到的新的電網知識構成,主要是電網工作人員做出的決策是經過定性和定量分析而得到的有價值的參考。
(6)電網可視化交互接口:通過運用匹配電網知識發(fā)現進程中的方式方法,實現電網智能化的人機互動,使電網領域專家深入的參與電網知識協同發(fā)現的整個進程中,通過多種方式顯示發(fā)現的新電網知識,有利于電網領域專家的研究、對比及分析。
將當前電網中各個數據庫的資源按照挖掘層次劃分成電網數據和電網知識兩部分,并突破現有的電網數據存儲方式,提出將電網知識獨立存儲于基礎電網知識庫中。
在電網知識發(fā)現進程中的“聚焦”和“知識評價”階段[5]調用電網知識協調發(fā)現策略集,實現對電網知識的全面評價,并在評價的基礎之上,實現對電網知識更高層次的提升。其中,電網知識協同發(fā)現策略集中的兩個重要工具為啟發(fā)型電網知識協調器和維護型電網知識協調器。
(1)啟發(fā)型電網知識協調器:主要功能是在以屬性為基礎的電網知識庫建立原則下,通過搜索電網知識庫中“電網知識節(jié)點”的不關聯,以發(fā)現“電網知識短缺”[6],產生“電網知識創(chuàng)新意向”,從而啟發(fā)與激活電網真實數據庫中相應的“電網數據子類”,以產生“定向挖掘進程”。通過規(guī)定電網規(guī)則優(yōu)先級,以定向挖掘較可信與關聯性強的待定規(guī)則來防止“海量電網數據定向挖掘”現象的產生。
(2)維護型電網知識協調器:主要功能是當從電網真實數據庫的大量電網數據經驗中經聚焦而生成感興趣的與具有一定可信度的電網規(guī)則(電網知識)后,使電網知識發(fā)現進程產生中斷,從而去定向搜索電網知識庫中有無此生成電網規(guī)則的重復、冗余與矛盾[7]。若有重復或冗余,則取消該生成電網規(guī)則或冗余規(guī)則而返回電網知識發(fā)現進程的“始端”;若無,則繼續(xù)電網知識發(fā)現的進程。對于矛盾的處理,可采用電網知識屬性約束規(guī)則的條件[8]及根據電網知識的可信度或與電網知識的關聯強度來裁決等方法。
電網知識庫的結構并非僅僅由領域專家和電力工作者等人為因素所決定,而是參照電網數據庫中的真實電網數據客觀的、量化的決定[9],且伴隨電網數據庫中的數據資源的累積,電網知識庫的結果也隨之動態(tài)變化。
2000年至2005年河北省月售電量的曲線圖,如圖2所示。
一年的十二個月份,由于季節(jié)的變化,每個月的售電量存在一定的周期性變化,從圖2可以看出,月度售電量基本屬于波浪式上升;且如圖3所示,各年份月度售電量也存在一定的相似性。
通過分析圖3,每年的最大用電量基本上出現在4、7、8三個月份。可根據歷年的月度售電量變化趨勢總結出一年各個月售電量的大體變化趨勢圖(一般存放于驅動電網知識庫),進而根據趨勢圖與新的月度售電量預測值進行對比分析,在個別月份售電量比例出現明顯偏差時(調用電網知識協同發(fā)現策略集)進行一定的調整。具體流程如下:
圖2 2000年至2005年河北省月售電量的曲線圖
圖3 2000年至2005年月售電量曲線對比
(1)首先進行歸一化處理,通過在真實電網數據庫中得到的河北省2000至2005年月售電量數據分析出整體月度售電量呈現波浪式上升的趨勢,通過基礎電網知識庫中的電網知識可知構建各月售電量比例趨勢圖只關心各月比例變化,而不關心售電量的大小,因此需要對月度售電量進行歸一化處理,如公式(1)所示:
(2)然后調用驅動電網知識庫可知,需求取標準比例線L*=[l1,l2,…,l12]T,其中:
以2000年至2005年度的售電量數據求得的標準比例線,如圖5所示。
圖4 歸一化后的月度售電量曲線圖
圖5 標準比例線
其中,e*越小說明預測結果與標準比例線越貼近,預測結果可信度越高,進而可以參照與標準比例線進行對比分析,對明顯偏離的預測結果調用調用電網知識協同發(fā)現策略集進行進一步的分析,對預測模型和預測方法進行調整后在進行預測,最終對預測結果進行微調,在此過程中獲得的新電網知識存入到衍生電網知識庫中。
(3)得到各月的預測結果后,按公式(3)計算與標準比例線的偏離程度:
本文提出了一種電網知識協同發(fā)現策略,通過該策略的邏輯模型為傳統電網數據挖掘方法提供了一個新的思路,電網知識協同發(fā)現策略邏輯模型通過將電網數據資源進行層次劃分,將傳統電網數據資源劃分成真實電網數據庫、基礎電網知識庫、驅動電網知識庫,并建立電網知識協同發(fā)現策略集、衍生電網知識庫及電網可視化交互接口。通過協同發(fā)現策略集中的電網維護型協調器和電網啟發(fā)型協調器實現領域專家驅動電網知識和數據驅動電網知識的融合,以及對電網知識的全面評價和動態(tài)更新。在電力需求預測實例中,對的預測結果進行了評價,并對電網需求預測模型和結果的調整提供了理論依據,進而驗證了電網知識協同發(fā)現策略的可行性及實用價值。
[1]丁道齊,祁維武.中國智能電網的實現:挑戰(zhàn)、問題和行動[J].中國電力,2011,44(11):1-7.
[2]胡學浩.智能電網—未來電網的發(fā)展態(tài)勢[J].電網技術,2009,33(14):1-5.
[3]Ohira M,Ohsugi N,Ohoka T,Matsumoto K.Accelerating Cross-project Knowledge Collaboration Using Collaborative Filtering And Social Networks[C].International Workshop on Mining Software Repositories(MSR2005),St.Louis,MO,2005,May,111-115.
[4]Robin V,Rose B,Girard P.Modelling collaborative knowledge to support engineering design project manager[J].Computers in Industry 2007,58(2):188-198.
[5]郇嘉嘉,王鋼,李海鋒,汪隆君,李平.電網停電綜合管理與分析決策系統的研究與開發(fā)[J].電力系統保護與控制2012,40(8):140-150.
[6]陳亮,陳雨果.多目標發(fā)電調度策略與方法[J].電力系統自動化.2012,36(9):104-108.
[7]馮慶東,李立理,梁永亮.基于Agent的智能電網集成優(yōu)化控制策略[J].中國電力.2011,40(7):36-39.
[8]劉奕,周琦,蘇國鋒,劉軒,劉樂民.基于Multi-Agent的突發(fā)事件多部門協同應對建模與分析[J].清華大學學報:自然科學版,2010,50(2):165-169.
[9]郭曉利,曲朝陽,李曉棟,等.基于SOM聚類的電網可視化數據挖掘模型[J].情報科學.2012,30(2):206-209,225.