彭翠紅
(咸陽師范學(xué)院,陜西 咸陽 712000)
在經(jīng)濟建設(shè)中,電力一直是一種最基礎(chǔ)、最必要的能源,人類生活與工業(yè)生產(chǎn)中提供的所有服務(wù)都離不開電力,它支撐著社會的穩(wěn)定與國家經(jīng)濟的發(fā)展。構(gòu)建智能電網(wǎng)能夠加速開發(fā)清潔能源,優(yōu)化調(diào)整能源消費結(jié)構(gòu)。當(dāng)前世界各國都在建設(shè)、發(fā)展智能電網(wǎng),我國也已經(jīng)啟動了構(gòu)建智能電網(wǎng)的項目。隨著智能電網(wǎng)建設(shè)中信息化、自動化等方面的推進,電網(wǎng)的服務(wù)和運行模式都將發(fā)生很多重大改變。其中隨著大量控制、計算、通信、傳感設(shè)備的接入,電力系統(tǒng)逐漸發(fā)展為電力信息物理系統(tǒng)。要構(gòu)建智能電網(wǎng),最基礎(chǔ)的就是做好電力信息物理系統(tǒng)的安全工作。其中電力信息物理系統(tǒng)的安全態(tài)勢預(yù)測問題就是一個重點研究項目。通過對電力信息物理系統(tǒng)的安全態(tài)勢預(yù)測問題進行研究,能夠提升電力信息物理系統(tǒng)對電力網(wǎng)絡(luò)的監(jiān)控能力。各國都將電力安全態(tài)勢預(yù)測問題作為電力領(lǐng)域中的重點研究問題,進行了大量研究。其中于群、李浩、屈玉清在電網(wǎng)安全態(tài)勢感知問題的研究中,通過深度學(xué)習(xí)模型實現(xiàn)了電網(wǎng)安全態(tài)勢預(yù)測[1]。
本文在此電力信息物理系統(tǒng)的控制中心上,設(shè)計了一種基于多源數(shù)據(jù)分析的電力信息物理系統(tǒng)安全態(tài)勢預(yù)測方法,對系統(tǒng)采集的設(shè)備參數(shù)進行分析,以此預(yù)測系統(tǒng)的運行安全態(tài)勢,為電力系統(tǒng)的穩(wěn)定運行提供幫助。
電力信息物理系統(tǒng)是通過通信技術(shù)、計算機控制技術(shù)等有機融合而成的,能夠通過數(shù)據(jù)共享、數(shù)據(jù)分析、設(shè)備控制等,實現(xiàn)電網(wǎng)的快速感知、智能控制、實時調(diào)度等功能。系統(tǒng)主要由通信網(wǎng)絡(luò)、分布式計算設(shè)備、控制中心、電源和電荷、輸配電網(wǎng)絡(luò)等構(gòu)成。電力信息物理系統(tǒng)的組成如圖1所示。
圖1 電力信息物理系統(tǒng)Fig.1 Power information physical system
在通信網(wǎng)絡(luò)中,主要由專用網(wǎng)絡(luò)、有線網(wǎng)絡(luò)和無線網(wǎng)絡(luò)三類組成,在非關(guān)鍵設(shè)備的連接中應(yīng)用普通有線網(wǎng)絡(luò),在關(guān)鍵設(shè)備中應(yīng)用專用的有線網(wǎng)絡(luò),降低傳輸時延,無線設(shè)備如傳感器等應(yīng)用無線網(wǎng)絡(luò)。為提高系統(tǒng)的算力,應(yīng)用基于云計算等技術(shù)的分布式計算設(shè)備,實現(xiàn)強大的存儲和計算功能。控制中心是系統(tǒng)的核心,其可實現(xiàn)信息采集、修正系統(tǒng)模型、仿真計算分析、發(fā)布控制指令等。
電力信息物理系統(tǒng)依賴于電力網(wǎng)絡(luò)能量信息及網(wǎng)絡(luò)信息的交互體系。在物理層的網(wǎng)絡(luò)中接入了各類用電設(shè)備,如電鍋爐、電轉(zhuǎn)氣等,在信息層網(wǎng)絡(luò)中通過采集各設(shè)備的關(guān)鍵參數(shù)、處理并分析相關(guān)數(shù)據(jù),發(fā)出對物理層設(shè)備的控制指令,以此實現(xiàn)對電力信息物理設(shè)備的調(diào)度。在電力信息物理系統(tǒng)運行時,根據(jù)采集的設(shè)備參數(shù),分析系統(tǒng)的運行狀態(tài),當(dāng)部分參數(shù)不能滿足安全運行的條件時,即由正常狀態(tài)運行轉(zhuǎn)換為緊急狀態(tài)運行,此時,系統(tǒng)發(fā)出指令,切除發(fā)生故障的能源設(shè)備,或調(diào)整多個能源設(shè)備的協(xié)調(diào)供電,維持電力系統(tǒng)的穩(wěn)定。
對電力信息物理系統(tǒng)態(tài)勢安全進行預(yù)測,就是通過采集電力系統(tǒng)中多設(shè)備的運行狀態(tài)參數(shù),如電網(wǎng)電壓、電網(wǎng)頻率、信息網(wǎng)數(shù)據(jù)延時等,對參數(shù)進行分析,判定系統(tǒng)的運行狀態(tài),當(dāng)參數(shù)出現(xiàn)異常時,可預(yù)測到系統(tǒng)出現(xiàn)安全威脅。電力信息物理系統(tǒng)安全運行主要受到電網(wǎng)、多類型負荷及關(guān)鍵設(shè)備運行狀態(tài)的影響,例如,連接的熱力系統(tǒng)或燃氣系統(tǒng)等,出現(xiàn)能源供應(yīng)設(shè)備故障、供需不平衡或信息傳輸設(shè)備故障時,整個電力信息物理系統(tǒng)的運行狀態(tài)e會發(fā)生相應(yīng)的變化,如果協(xié)調(diào)恢復(fù)能力不足,可能面對系統(tǒng)進入緊急狀態(tài)甚至失控。
根據(jù)深度學(xué)習(xí)、最大均值差異算法和遷移學(xué)習(xí),構(gòu)建電力信息物理系統(tǒng)安全態(tài)勢數(shù)據(jù)挖掘網(wǎng)絡(luò),實施安全態(tài)勢數(shù)據(jù)的挖掘[2]。在電力信息物理系統(tǒng)安全態(tài)勢數(shù)據(jù)挖掘網(wǎng)絡(luò)的構(gòu)建中,首先構(gòu)建安全態(tài)勢數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)挖掘模型,并通過安全態(tài)勢源域數(shù)據(jù)對模型進行訓(xùn)練,將訓(xùn)練結(jié)果作為安全態(tài)勢源域分類[3]。通過最大均值差異算法分析安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域和源領(lǐng)域之間的數(shù)據(jù)分布差異,獲取對應(yīng)的數(shù)據(jù)分布距離。接著通過最大均值差異算法調(diào)整深度神經(jīng)網(wǎng)絡(luò)挖掘模型的原始網(wǎng)絡(luò)結(jié)構(gòu),獲取新的目標(biāo)領(lǐng)域網(wǎng)絡(luò),并選擇性遷移原始網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練所獲得的參數(shù)[4]。當(dāng)數(shù)據(jù)分布距離低于所設(shè)置的閾值a,表明安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域和源領(lǐng)域之間的數(shù)據(jù)分布較為相近,此時不需要調(diào)整網(wǎng)絡(luò),可以直接利用該目標(biāo)領(lǐng)域網(wǎng)絡(luò)。當(dāng)數(shù)據(jù)分布距離高于所設(shè)置的閾值a,但低于設(shè)置的另一個閾值b,在目標(biāo)領(lǐng)域網(wǎng)絡(luò)中加入新的隱藏層,或?qū)εf的隱藏層進行替換,使目標(biāo)領(lǐng)域模型能夠?qū)π轮R進行學(xué)習(xí)。當(dāng)數(shù)據(jù)分布距離高于所設(shè)置的閾值b,表明安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域與源領(lǐng)域之間的數(shù)據(jù)分布差異太大,這種情況下會出現(xiàn)負遷移現(xiàn)象,表明需要對目標(biāo)領(lǐng)域網(wǎng)絡(luò)進行更換[5]。其中兩個閾值的設(shè)定需要根據(jù)實際挖掘經(jīng)驗來決定。在電力信息物理系統(tǒng)安全態(tài)勢數(shù)據(jù)挖掘網(wǎng)絡(luò)的構(gòu)建中,知識遷移的過程具體如圖2所示[6]。
圖2 知識遷移的過程Fig.2 Process of knowledge transfer
通過最大均值差異算法分析安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域和源領(lǐng)域之間的數(shù)據(jù)分布差異時,使用的公式具體如下:
MMD(X,Y,Z)=
(1)
式中,MMD(X,Y,Z)為這一再生核希爾伯特空間中安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域Y和源領(lǐng)域Z的距離即數(shù)據(jù)分布差異;m為安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域數(shù)據(jù)集大??;n為安全態(tài)勢數(shù)據(jù)源領(lǐng)域數(shù)據(jù)集大??;k(xi,yi)為xi這一目標(biāo)領(lǐng)域數(shù)據(jù)與yi這一源領(lǐng)域數(shù)據(jù)的內(nèi)積,也就是二者的徑向基核函數(shù);k(xj,yj)為這一目標(biāo)領(lǐng)域數(shù)據(jù)與這一源領(lǐng)域數(shù)據(jù)的內(nèi)積;k(xi,yj)為這一目標(biāo)領(lǐng)域數(shù)據(jù)與這一源領(lǐng)域數(shù)據(jù)的內(nèi)積[7]。
就此實現(xiàn)安全態(tài)勢數(shù)據(jù)目標(biāo)領(lǐng)域和源領(lǐng)域之間數(shù)據(jù)分布差異的計算。
挖掘的電力信息物理系統(tǒng)安全態(tài)勢數(shù)據(jù)是一種多源數(shù)據(jù),因此基于多源數(shù)據(jù)分析技術(shù)中的多源數(shù)據(jù)預(yù)處理技術(shù)實施安全態(tài)勢數(shù)據(jù)的預(yù)處理,以實現(xiàn)安全態(tài)勢數(shù)據(jù)的多源數(shù)據(jù)變換、異構(gòu)數(shù)據(jù)集成[8]。其中多源數(shù)據(jù)變換的處理方式包括多源數(shù)據(jù)平滑、多源數(shù)據(jù)縮放、多源數(shù)據(jù)泛化[9]。多源數(shù)據(jù)平滑能夠清除安全態(tài)勢多源數(shù)據(jù)中無關(guān)緊要的數(shù)據(jù)和噪聲數(shù)據(jù),使用的處理方法為Vondrak多源數(shù)據(jù)平滑方法,具體公式如下:
(2)
式中,yi為第i個安全態(tài)勢源數(shù)據(jù);yi為第i個安全態(tài)勢源數(shù)據(jù)平滑值;aij為第i個安全態(tài)勢源數(shù)據(jù)和第j個安全態(tài)勢源數(shù)據(jù)的平滑度;bij為第i個安全態(tài)勢源數(shù)據(jù)和第j個安全態(tài)勢源數(shù)據(jù)的逼近度;n為正整數(shù)[10]。
分別對各數(shù)據(jù)進行平滑處理,剔除處理后與大部分數(shù)據(jù)偏差較大的數(shù)據(jù),即可完成多源數(shù)據(jù)平滑處理。多源數(shù)據(jù)縮放主要是對范圍較大的同一屬性值進行處理,使其落到一個特定的、較小的區(qū)間,具體公式如下:
(3)
式中,Xscaled為數(shù)據(jù)縮放結(jié)果;Xsta為數(shù)據(jù)指定縮放范圍;Xmax為安全態(tài)勢某屬性數(shù)據(jù)的最大值;Xmin為安全態(tài)勢某屬性數(shù)據(jù)的最小值。
多源數(shù)據(jù)泛化能夠?qū)δ硨傩詳?shù)據(jù)原始概念層中的細節(jié)信息進行抽象,將其提升到較高的概念層。具體數(shù)據(jù)泛化過程如下:①輸入安全態(tài)勢某屬性數(shù)據(jù)的數(shù)據(jù)表;②設(shè)置泛化參數(shù)ω;③對數(shù)據(jù)表的隱私保護閾值T進行計算;④枚舉數(shù)據(jù)表中的全部策略,在策略的枚舉中將策略值大于閾值T的策略直接過濾,生成剩余策略的策略空間;⑤對于生成的策略空間,通過ω-近似Skyline實施過濾,獲取候選策略空間;⑥實施候選策略空間的Skyline,獲取推薦策略集;⑦輸出推薦策略集及其對應(yīng)的泛化。
異構(gòu)數(shù)據(jù)集成主要是對安全態(tài)勢數(shù)據(jù)的文本數(shù)據(jù)、XML數(shù)據(jù)、CSV數(shù)據(jù)、Hbase數(shù)據(jù)等實施數(shù)據(jù)集成處理,使用的工具為bigdata。
通過bagging和支持向量機集成構(gòu)建一種電力信息物理系統(tǒng)安全態(tài)勢預(yù)測模型,通過2個步驟實現(xiàn)安全態(tài)勢預(yù)測,訓(xùn)練樣本集構(gòu)造和通過模型實施預(yù)測。使用滑動窗口對訓(xùn)練樣本集進行構(gòu)造,使離散的多源安全態(tài)勢數(shù)據(jù)集變得線性相關(guān)。訓(xùn)練樣本集構(gòu)造的具體過程如圖3所示。
圖3 訓(xùn)練樣本集構(gòu)造的具體過程Fig.3 Specific process of training sample set construction
將圖中每次訓(xùn)練預(yù)測的結(jié)果作為一個訓(xùn)練樣本集,從而獲得多個訓(xùn)練樣本集。通過bagging和支持向量機集成構(gòu)建電力信息物理系統(tǒng)安全態(tài)勢預(yù)測模型,該模型由10個并列的v-SVMv-SVM子模型構(gòu)成。利用該模型進行安全態(tài)勢預(yù)測,具體步驟如下。
(1)將bagging算法的迭代最大次數(shù)設(shè)為10。
(2)將v-SVM選定為弱學(xué)習(xí)算法。
(3)通過bagging算法構(gòu)建v-SVM預(yù)測子模型。
(4)對v-SVM預(yù)測子模型序列集合參數(shù)實施初始化處理,用下式表示預(yù)測子模型序列集合為A=(A1,A2,A3,…,A10),A10是第10個預(yù)測子模型的序列。初始化的集合參數(shù)包括子模型的核函數(shù)參數(shù)與序列參數(shù)。
(5)在訓(xùn)練樣本集中有放回的、重復(fù)、隨機抽取一半訓(xùn)練樣本,將抽取樣本作為10個預(yù)測子模型的對應(yīng)預(yù)測樣本實施訓(xùn)練。
(6)通過訓(xùn)練獲取10個預(yù)測子模型的新序列集合為:B=(B1,B2,B3,…,B10),B10是第10個預(yù)測子模型的新序列。
(8)整合10個安全態(tài)勢預(yù)測值,整合后的結(jié)果即為集成預(yù)測模型的安全態(tài)勢預(yù)測結(jié)果。整合方式為取10個結(jié)果的平均值作為最終安全態(tài)勢預(yù)測結(jié)果,公式具體如下:
(4)
式中,X′為10個結(jié)果的平均值。
通過以上步驟實現(xiàn)電力信息物理系統(tǒng)安全態(tài)勢預(yù)測。
某電力公司的電力信息物理系統(tǒng)安全態(tài)勢數(shù)據(jù)作為數(shù)據(jù)集,采集該電力公司連續(xù)9周的電力信息物理系統(tǒng)網(wǎng)絡(luò)連接數(shù)據(jù),數(shù)據(jù)條數(shù)為52 638條數(shù)據(jù)。數(shù)據(jù)中具體包括4種類型的網(wǎng)絡(luò)攻擊,分別為非法進入攻擊、特權(quán)非法獲取攻擊、漏洞掃描檢測攻擊、拒絕服務(wù)攻擊。各種攻擊類型的具體攻擊方式見表1。挖掘的每條數(shù)據(jù)中共包括35個特征屬性,在每條數(shù)據(jù)中加入一個類型標(biāo)記屬性,使每條數(shù)據(jù)擁有36個特征屬性。對挖掘的實驗數(shù)據(jù)集實施預(yù)處理,將其作為測試本文方法性能的實驗數(shù)據(jù)。
表1 各種攻擊類型的具體攻擊方式Tab.1 Specific attack modes of various attack types
分別對本文方法的3種指標(biāo)進行測試,3種指標(biāo)具體如下:均方根誤差、均方誤差、平均絕對誤差,3種指標(biāo)的值越小,表示本文方法的電力信息物理系統(tǒng)安全態(tài)勢預(yù)測結(jié)果越準(zhǔn)確。
應(yīng)用本文方法對該電力公司電力信息物理系統(tǒng)未來1周、未來1個月、未來3個月進行安全態(tài)勢預(yù)測,預(yù)測結(jié)果的均方根誤差數(shù)據(jù)、均方誤差數(shù)據(jù)以及平均絕對誤差數(shù)據(jù)具體見表2—表4。
表2 均方根誤差數(shù)據(jù)Tab.2 Root mean square error data
表3 均方誤差數(shù)據(jù)Tab.3 Mean square error data
表4 平均絕對誤差數(shù)據(jù)Tab.4 Average absolute error data
測試結(jié)果表明,利用本文方法進行安全態(tài)勢預(yù)測后,未來1周安全態(tài)勢預(yù)測值的均方根誤差、均方誤差、平均絕對誤差數(shù)據(jù)最??;未來1個月安全態(tài)勢預(yù)測值的3種測試數(shù)據(jù)居中;未來3個月安全態(tài)勢預(yù)測值的3種測試數(shù)據(jù)最大。但3種數(shù)據(jù)整體差異較小,且整體安全態(tài)勢預(yù)測值的均方根誤差、均方誤差、平均絕對誤差均較小,表明本文方法的安全態(tài)勢預(yù)測結(jié)果較為精準(zhǔn)。
為驗證本文方法應(yīng)用后的性能,以電力信息物理系統(tǒng)發(fā)生安全威脅后的響應(yīng)時間為指標(biāo),將應(yīng)用本文方法前與應(yīng)用本文方法后的系統(tǒng)作為實驗對象進行測試,重復(fù)進行5組,每組10次,得到結(jié)果見表5。
表5 應(yīng)用前后的系統(tǒng)響應(yīng)時間Tab.5 System response time before and after application ms
由表5可知,應(yīng)用本文方法前,系統(tǒng)的響應(yīng)時間平均為1 399.2 ms,而應(yīng)用本文方法后,系統(tǒng)的響應(yīng)時間平均為516.2 ms,這表明本文方法能夠快速運算確定系統(tǒng)的安全態(tài)勢,并及時地發(fā)出控制指令,能夠提升系統(tǒng)控制的實時性。
當(dāng)今的電力信息物理系統(tǒng)安全問題頻發(fā),其安全態(tài)勢預(yù)測問題引發(fā)了全球的關(guān)注,掀起了一股熱潮。在該問題的研究中,應(yīng)用了多源數(shù)據(jù)分析技術(shù)對電力信息物理系統(tǒng)安全態(tài)勢多源數(shù)據(jù)進行了預(yù)處理,并設(shè)計了一種集成化的安全態(tài)勢預(yù)測模型,實現(xiàn)了較為精準(zhǔn)的電力信息物理系統(tǒng)安全態(tài)勢預(yù)測。研究結(jié)果對智能電網(wǎng)的構(gòu)建有一定意義。