張 鑫,龐 詔
(國網(wǎng)寶雞供電公司,陜西 寶雞 721000)
電力無線通信網(wǎng)絡(luò)指在電力信息生成、傳輸、消耗等環(huán)節(jié)中,利用智能化設(shè)備,將電力信息進(jìn)行可靠性傳輸。利用電力無線通信網(wǎng)絡(luò),能夠?qū)崿F(xiàn)電網(wǎng)異常信號采集、通信等目標(biāo),對于智能電網(wǎng)的建設(shè)具有重要作用。目前,電力通信網(wǎng)絡(luò)信息數(shù)據(jù)呈爆炸式增長,網(wǎng)絡(luò)信息中的異常數(shù)據(jù)也隨之增加,影響了電力網(wǎng)絡(luò)信息的高質(zhì)量傳輸。針對此類問題,研究人員設(shè)計(jì)了多種異常值檢測方法。其中,基于信息熵的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法,與基于深度學(xué)習(xí)的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法的應(yīng)用較為廣泛。
基于信息熵的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法,主要是利用熵理論推斷電力網(wǎng)絡(luò)異常情況,根據(jù)熵的估算量,確定網(wǎng)絡(luò)信息熵的取值范圍,從而檢測出網(wǎng)絡(luò)信息異常值[1]?;谏疃葘W(xué)習(xí)的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法,主要是結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)與長短期記憶(Long Short Term Memory,LSTM)的混合檢測方法,通過識別電力信息網(wǎng)絡(luò)存在的異常值,分析檢測模型中不同異常值的檢測平衡性,從而提高檢測準(zhǔn)確率[2]。這2 種方法均能檢測電力網(wǎng)絡(luò)異常值,但是具體使用過程中更傾向于在靜態(tài)網(wǎng)絡(luò)的理想環(huán)境中進(jìn)行檢測,在動態(tài)網(wǎng)絡(luò)環(huán)境中存在一定的檢測誤差[3]。因此,設(shè)計(jì)了一種在動態(tài)網(wǎng)絡(luò)環(huán)境下的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法。
電力通信網(wǎng)絡(luò)中存在配電、用電業(yè)務(wù),受到電網(wǎng)規(guī)模的影響,網(wǎng)絡(luò)異常信息文本特征提取較為困難,存在較多的重復(fù)信息,影響異常信息檢測效果[4]。因此,文章將網(wǎng)絡(luò)信息中的異常關(guān)鍵詞進(jìn)行量化,剔除重復(fù)無意義的異常文本特征。在電力無線通信網(wǎng)絡(luò)中,以聚合系數(shù)與特征路徑長度來衡量異常值。在異常信息文本向量中,文本由異常信息特征組成,每一個(gè)異常信息特征對應(yīng)一個(gè)權(quán)重值[5]。文章將信息特征與權(quán)重值一一對應(yīng),避免出現(xiàn)重復(fù)信息特征提取的問題。異常信息文本特征權(quán)重的計(jì)算公式為
式中:Iq為異常信息文本特征權(quán)重;N為網(wǎng)絡(luò)異常信息出現(xiàn)在全部文本中的次數(shù);n為包含異常信息特征文本的數(shù)量。
當(dāng)電力通信網(wǎng)絡(luò)信息中出現(xiàn)2 個(gè)相似的文本時(shí),將二者合并,避免特征重復(fù)提取。異常信息相似度的計(jì)算公式為
式中:d(I1,I2)為I1、I2這2 個(gè)異常信息的檢測相似度;xi、yi為I1、I2這2 個(gè)異常信息的歐式距離。
I1、I2這2 個(gè)異常信息的特征向量在距離上越近,相似度越高。將相似度較高的信息合并,可以更好地通過文本特征區(qū)分網(wǎng)絡(luò)信息異常值。
動態(tài)網(wǎng)絡(luò)是從電力信息的實(shí)際出發(fā),評估異常信息的異常特性,不但可以解決未知的不確定性,還能夠客觀地反映網(wǎng)絡(luò)當(dāng)前面臨的異常威脅。從現(xiàn)實(shí)意義來看,動態(tài)網(wǎng)絡(luò)能夠彌補(bǔ)靜態(tài)網(wǎng)絡(luò)的異常威脅防御空白。文章在動態(tài)網(wǎng)絡(luò)環(huán)境中對網(wǎng)絡(luò)信息異常情況進(jìn)行網(wǎng)絡(luò)層面的分析,電力信息網(wǎng)絡(luò)節(jié)點(diǎn)的異常因子關(guān)系如圖1 所示。
圖1 電力信息網(wǎng)絡(luò)節(jié)點(diǎn)異常因子關(guān)系
如圖1 所示,在電力信息網(wǎng)絡(luò)中,節(jié)點(diǎn)異常因子包括網(wǎng)絡(luò)節(jié)點(diǎn)配置脆弱性、節(jié)點(diǎn)資產(chǎn)異常威脅等異常值。其中,節(jié)點(diǎn)資產(chǎn)所在位置為網(wǎng)絡(luò)核心層;網(wǎng)絡(luò)節(jié)點(diǎn)配置脆弱性所在位置為接入層;異常所在位置為匯聚層。通過檢測電力信息網(wǎng)絡(luò)節(jié)點(diǎn)異常因子所在位置,確定異常值檢測的動態(tài)評估閾值。在動態(tài)網(wǎng)絡(luò)環(huán)境中,將已知的異常信息文本與正常信息文本進(jìn)行同時(shí)檢測訓(xùn)練,結(jié)合動態(tài)評估閾值,構(gòu)造出閾值函數(shù),表達(dá)式為
式中:D為閾值函數(shù)的表達(dá)式;ε(Iq,Iz)為實(shí)際檢測到的異常值修正函數(shù);Iz為正常信息文本的特征權(quán)重;Rt為異常值動態(tài)評估的最大閾值;St為異常值動態(tài)評估的最小值。在ε(Iq,Iz)確定的情況下,滿足Rt與St之間的關(guān)系,即可確保動態(tài)網(wǎng)絡(luò)異常檢測閾值的有效性。
文章動態(tài)評估網(wǎng)絡(luò)的安全環(huán)境,通過設(shè)定網(wǎng)絡(luò)異常值的檢測閾值,提升網(wǎng)絡(luò)信息安全。根據(jù)隱變量的條件概率,計(jì)算異常信息對數(shù)似然函數(shù)的條件期望,形成電力無線通信網(wǎng)絡(luò)信息異常值快速檢測模型,表達(dá)式為
式中:Q為電力無線通信網(wǎng)絡(luò)信息異常值快速檢測模型;p為條件概率;γ為檢測模型的觀測參量;θ為動態(tài)網(wǎng)絡(luò)環(huán)境響應(yīng)度。
完整的異常值數(shù)據(jù)通過對數(shù)似然函數(shù)的條件期望得到,條件期望被最大化時(shí),θ為最大狀態(tài),能夠在異常值出現(xiàn)的瞬間進(jìn)行檢測,異常值檢測時(shí)間較短,能夠?qū)崿F(xiàn)異常值的快速檢測[9]。此時(shí),動態(tài)網(wǎng)絡(luò)中的電力異常信息轉(zhuǎn)入模型后進(jìn)行細(xì)化,根據(jù)歷史檢測的異常問題特征,獲取異常節(jié)點(diǎn)的位置,從而確保異常值檢測精準(zhǔn)度。
在動態(tài)網(wǎng)絡(luò)環(huán)境下,將電力無線通信網(wǎng)絡(luò)信息采樣節(jié)點(diǎn)隨機(jī)化,檢測節(jié)點(diǎn)被通信網(wǎng)絡(luò)完全覆蓋。將檢測節(jié)點(diǎn)進(jìn)行前驅(qū)、后繼、后備等處理,使其處于周期性變化形式[10]。在隨機(jī)節(jié)點(diǎn)變化的狀態(tài)下,均勻隨機(jī)地檢測網(wǎng)絡(luò)中的任意節(jié)點(diǎn),從而避免漏檢、錯(cuò)檢等問題。電力無線通信網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖2 所示。
圖2 電力無線通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
如圖2 所示,黑色圓點(diǎn)為正常網(wǎng)絡(luò)信息節(jié)點(diǎn),白色圓點(diǎn)為異常網(wǎng)絡(luò)信息節(jié)點(diǎn)。異常節(jié)點(diǎn)根據(jù)當(dāng)前覆蓋網(wǎng)的覆蓋情況,將骨干覆蓋網(wǎng)中的正常節(jié)點(diǎn)替換為簇覆蓋網(wǎng)中的正常節(jié)點(diǎn)。2 個(gè)覆蓋網(wǎng)的正常節(jié)點(diǎn)一一對應(yīng),增強(qiáng)網(wǎng)絡(luò)信息檢測的健壯性。此時(shí),將簇覆蓋網(wǎng)中的異常節(jié)點(diǎn)與正常節(jié)點(diǎn)順序打亂,隨機(jī)選擇覆蓋網(wǎng)中的采樣節(jié)點(diǎn)進(jìn)行檢測,確保電力無線通信網(wǎng)絡(luò)的異常檢測隨機(jī)均勻性,從而完成均衡網(wǎng)絡(luò)負(fù)載的任務(wù)。
為了驗(yàn)證本文設(shè)計(jì)的網(wǎng)絡(luò)信息異常值檢測方法是否滿足準(zhǔn)確性需求,對文章設(shè)計(jì)方法進(jìn)行了實(shí)驗(yàn)分析。最終的實(shí)驗(yàn)結(jié)果以文獻(xiàn)[1]中基于信息熵的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法、文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法,以及本文設(shè)計(jì)的動態(tài)網(wǎng)絡(luò)環(huán)境下的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法進(jìn)行對比的形式呈現(xiàn)。
本次實(shí)驗(yàn)的數(shù)據(jù)準(zhǔn)備階段中,包括了數(shù)據(jù)采集與數(shù)據(jù)標(biāo)準(zhǔn)化2 個(gè)步驟。在數(shù)據(jù)采集階段,直接選擇了UCI 數(shù)據(jù)集中的數(shù)據(jù),包括KDDCUP99、duration、service、urget 等子集。本次實(shí)驗(yàn)對3 個(gè)數(shù)據(jù)子集的50 000 條數(shù)據(jù)進(jìn)行分析,利用Weka 自帶的unsupervised_attribute_Normalize 方法對異常值與正常值的屬性進(jìn)行歸一化處理,使網(wǎng)絡(luò)信息異常值與正常值均在動態(tài)網(wǎng)絡(luò)環(huán)境的隨機(jī)區(qū)域,確保實(shí)驗(yàn)的有效性。在數(shù)據(jù)采集與處理完成之后,對異常值檢測準(zhǔn)確率Pc、異常值檢測召回率Rc、調(diào)整蘭德指數(shù)ARI 進(jìn)行計(jì)算。
異常值檢測準(zhǔn)確率Pc的計(jì)算公式為
式中:TP為正確檢測的網(wǎng)絡(luò)信息樣本數(shù)量;FP為異常值被錯(cuò)誤檢測為正常網(wǎng)絡(luò)信息樣本的數(shù)量。
召回率Rc的計(jì)算公式為
式中:Rc為異常值檢測召回率;TTP為正常網(wǎng)絡(luò)信息樣本被錯(cuò)誤檢測為異常值的數(shù)量;FN為漏檢網(wǎng)絡(luò)信息樣本數(shù)量。
調(diào)整蘭德指數(shù)ARI 計(jì)算公式為
式中:ARI 為調(diào)整蘭德指數(shù);RI為蘭德指數(shù);E(RI)為RI的檢測閾值。調(diào)整蘭德指數(shù)可以衡量網(wǎng)絡(luò)信息異常值分布的吻合情況。該指數(shù)越大,異常值檢測結(jié)果與真實(shí)情況越吻合。
Pc、Rc、ARI 都是判斷網(wǎng)絡(luò)信息異常值快速檢測的關(guān)鍵指標(biāo),這些指標(biāo)越大,異常值檢測效果越精準(zhǔn)。
文章隨機(jī)選取出duration、service、urget 共3 種網(wǎng)絡(luò)信息數(shù)據(jù)集。數(shù)據(jù)集中的網(wǎng)絡(luò)信息正常值與異常值雜亂無章,可以確保實(shí)驗(yàn)的真實(shí)有效性。以Pc、Rc、ARI 為異常值檢測效果判定指標(biāo),并將文獻(xiàn)[1]中基于信息熵的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法的性能指標(biāo)、文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法的性能指標(biāo),以及本文設(shè)計(jì)的動態(tài)網(wǎng)絡(luò)環(huán)境下的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法的性能指標(biāo)進(jìn)行對比。實(shí)驗(yàn)結(jié)果如表1 所示。
使用文獻(xiàn)[1]中基于信息熵的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法之后,Pc在0.73 ~0.86波動;Rc在0.82 ~0.84 波動;ARI 在0.75 ~0.79 波動。由此可見,使用該方法之后,異常值檢測存在一定程度的誤差,很難將全部的信息異常值檢測出來,影響電力網(wǎng)絡(luò)的正常通信。
使用文獻(xiàn)[2]中基于深度學(xué)習(xí)的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法之后,Pc、Rc、ARI 在0.85 ~0.91 變化,較之文獻(xiàn)[1]的檢測方法存在大幅度的提升,但與網(wǎng)絡(luò)檢測需求存在較大的差異,急需進(jìn)一步優(yōu)化。
使用本文設(shè)計(jì)的動態(tài)網(wǎng)絡(luò)環(huán)境下的電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法之后,Pc、Rc、ARI均超過了0.95,趨近于1。由此可見,使用本文設(shè)計(jì)的方法較之文獻(xiàn)[1]、文獻(xiàn)[2]中的方法均存在不同程度的提升,異常值檢測效果更佳,符合研究目的。
隨著智能電網(wǎng)的建設(shè),配電自動化系統(tǒng)趨向網(wǎng)際互連協(xié)議化,網(wǎng)絡(luò)信息管理難以適應(yīng)數(shù)據(jù)增長需求,出現(xiàn)了較多的網(wǎng)絡(luò)信息異常值。文章在動態(tài)網(wǎng)絡(luò)環(huán)境下,設(shè)計(jì)了電力無線通信網(wǎng)絡(luò)信息異常值快速檢測方法。從信息異常特征、檢測模型、負(fù)載均衡等方面,分析與檢測電力網(wǎng)絡(luò)的通信信息異常情況,為電網(wǎng)終端運(yùn)行提供了業(yè)務(wù)保障。
表1 實(shí)驗(yàn)結(jié)果