付強(qiáng), 董成, 馬文浩
(1. 國網(wǎng)固原供電公司, 寧夏, 固原 756000; 2. 武漢國電武儀電氣股份有限公司, 湖北, 武漢 430074)
為了滿足人們用電需要、提高供電服務(wù)質(zhì)量,泛網(wǎng)智能變電站正在逐漸取代傳統(tǒng)的變電站進(jìn)行供電。智能變電站最大的特點(diǎn)是遠(yuǎn)程控制,通過光纖以太網(wǎng)實(shí)現(xiàn)智能變電站內(nèi)各智能設(shè)備間的通信,因此一旦光纖以太網(wǎng)鏈路出現(xiàn)問題,智能變電站的運(yùn)行可靠性就會(huì)大大降低,甚至消失[1]。為此,提前感知光纖鏈路健康程度對于保證光纖鏈路正常運(yùn)行具有重要的現(xiàn)實(shí)意義。為解決上述問題,泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)被設(shè)計(jì)出來了,該系統(tǒng)工作原理是利用變電站運(yùn)行大數(shù)據(jù)和設(shè)備臺(tái)賬信息,智能分析出虛回路所在光纖通道健康情況,然后智能感知運(yùn)維數(shù)據(jù)并自動(dòng)生成安全措施票工作票,并指導(dǎo)二次運(yùn)維人員更高效地處理泛網(wǎng)智能變電站光纖回路的相關(guān)缺陷[2]。
在泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)當(dāng)中,質(zhì)量監(jiān)管模塊是其中最關(guān)鍵的部分,它是利用一種智能算法判斷光纖鏈路是否存在異常情況。關(guān)于光纖鏈路異常監(jiān)測中智能算法的選擇有很多,如王紅霞等過一種小波分析和改進(jìn)支持向量機(jī)的算法進(jìn)行光纖鏈路異常檢測;牛詠梅通過構(gòu)建正交基神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)光纖網(wǎng)絡(luò)異常檢測;許鵬等將光纖網(wǎng)絡(luò)異常數(shù)據(jù)檢測的問題轉(zhuǎn)換成求取最優(yōu)解的問題,采用改進(jìn)遺傳算法實(shí)現(xiàn)了對光纖網(wǎng)絡(luò)異常檢測。
基于前人研究,本文進(jìn)行泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)質(zhì)量。本研究中以變電站運(yùn)行大數(shù)據(jù)和設(shè)備臺(tái)賬信息為基礎(chǔ),通過數(shù)據(jù)挖掘算法實(shí)現(xiàn)對光纖鏈路的質(zhì)量監(jiān)管,以期為變電站運(yùn)維提供技術(shù)支撐,并為智能電網(wǎng)其他系統(tǒng)提供服務(wù)和大數(shù)據(jù)支持。
泛網(wǎng)智能變電站站內(nèi)光纜光纖智能設(shè)備光口和對時(shí)裝置的可靠性是變電站網(wǎng)絡(luò)正常運(yùn)行的基礎(chǔ)。由于站內(nèi)眾多的光跳線使用,基于站內(nèi)光纜的基本特性,在變電站內(nèi)環(huán)境變化和人員施工的情況下,可能對光纖造成彎曲、擠壓;另外鼠類啃咬等傷害也不容忽視,因此監(jiān)測光纜和尾纖的運(yùn)行情況和智能設(shè)備光口穩(wěn)定性是當(dāng)前一個(gè)十分必要和迫切的問題[3]。為此,泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)質(zhì)量監(jiān)管模塊的重要任務(wù)之一就是對光纖鏈路及其相關(guān)設(shè)備的健康狀況進(jìn)行識別和判斷。
光纖鏈路中存在2個(gè)時(shí)鐘系統(tǒng),即發(fā)送時(shí)鐘和接收時(shí)鐘,這些時(shí)鐘中包含了變電站運(yùn)行大數(shù)據(jù)和設(shè)備臺(tái)賬信息,一旦光纖鏈路存在異常,這些數(shù)據(jù)和信息也會(huì)出現(xiàn)異常變化,因此可以通過這些數(shù)據(jù)來判斷光纖鏈路是否存在異常問題,具體過程如圖1所示[4]。
圖1 泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)質(zhì)量監(jiān)管模塊設(shè)計(jì)流程
歷史數(shù)據(jù)信息采集與分析是進(jìn)行泛網(wǎng)智能變電站站內(nèi)光纜質(zhì)量分析的基礎(chǔ)。在本文中,歷史數(shù)據(jù)信息主要包括變電站運(yùn)行大數(shù)據(jù)和設(shè)備臺(tái)賬信息2種,前者主要為變電站運(yùn)行時(shí)產(chǎn)生的相關(guān)數(shù)據(jù),后者主要為變電站中光纖衰減和光功率數(shù)據(jù)[5]。以上這些歷史數(shù)據(jù)需要經(jīng)過進(jìn)一步處理才能滿足后續(xù)分析需要,包括數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)降維、數(shù)據(jù)離散化。下面進(jìn)行具體分析。
(1) 數(shù)據(jù)標(biāo)準(zhǔn)化
采集到歷史數(shù)據(jù)量綱不同,在后續(xù)無法進(jìn)行比較分析,因此需要消除數(shù)據(jù)的不同量綱,進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化。目前,標(biāo)準(zhǔn)化方法主要有3種,即Min-Max標(biāo)準(zhǔn)化、正規(guī)化方法和log函數(shù)轉(zhuǎn)換法,如表1所示[6]。
表1 數(shù)據(jù)標(biāo)準(zhǔn)化方法對比表
(2) 數(shù)據(jù)降維
采集到的歷史數(shù)據(jù)來自不同的數(shù)據(jù)庫,因此存在多個(gè)特征變量。多個(gè)特征變量雖然會(huì)提供豐富信息,但是也會(huì)增加計(jì)算量和計(jì)算難度,因此需要進(jìn)行降維,在減少特征變量同時(shí),盡量保證信息完整性[7]。數(shù)據(jù)降維方法主要有線性映射和非線性映射方法兩大類。在這里采用主成分分析方法進(jìn)行降維。
步驟1:假設(shè)待降維數(shù)據(jù)是一個(gè)包含m個(gè)樣本的n維數(shù)據(jù)集。
步驟2:將數(shù)據(jù)集按照m行n列重新排列,組成矩陣。
步驟3:按列對數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,組成標(biāo)準(zhǔn)化矩陣。
步驟4:計(jì)算標(biāo)準(zhǔn)化矩陣中每列數(shù)據(jù)的協(xié)方差,組成協(xié)方差矩陣。
步驟5:用雅克比方法解協(xié)方差矩陣的特征方程,得到特征值和特征向量。
步驟6:將特征值從大到小排列,選取前k個(gè)特征值對應(yīng)的特征向量,并組成特征向量P。
步驟7:計(jì)算特征向量的累計(jì)貢獻(xiàn)率,選擇超過85%貢獻(xiàn)率的特征向量作為主成分。
步驟8:主成分就是降維后歷史數(shù)據(jù)[8]。
(3) 數(shù)據(jù)離散化
在異常分析中很少將連續(xù)值作為識別模型的特征輸入,而是將連續(xù)特征離散化為一系列01特征,然后輸入到異常識別模型當(dāng)中。以上這一過程就是數(shù)據(jù)離散化過程[9]。在這里引入信息熵理論,進(jìn)行數(shù)據(jù)離散。具體過程如下。
步驟1:假設(shè)待離散數(shù)據(jù)是一個(gè)包含m個(gè)連續(xù)屬性s個(gè)類別的數(shù)據(jù)集。
步驟2:計(jì)算數(shù)據(jù)集的一致性水平Y(jié)1。
步驟3:按照從小到大的順序排列屬性值。其中需要注意的是,相同的屬性值,視為一個(gè)區(qū)間。
步驟4:計(jì)算所有屬性相鄰區(qū)間的合并標(biāo)準(zhǔn)值IMC,該值就被視為一個(gè)斷點(diǎn)。
步驟5:合并最小IMC值的兩個(gè)區(qū)間,即兩個(gè)斷點(diǎn)構(gòu)成一個(gè)區(qū)間。
步驟6:再次計(jì)算當(dāng)前數(shù)據(jù)的一致性水平Y(jié)2。
步驟7:判斷Y1和Y2之間的差值是否小于數(shù)據(jù)可容忍的信息丟失率。若大于,則結(jié)束離散化操作;若小于,則回到步驟5。迭代地合并相鄰區(qū)間,在最小化信息丟失的情況下,將連續(xù)屬性值域轉(zhuǎn)換成小數(shù)目有限的區(qū)間,直至滿足上述迭代終止條件[10]。
歷史數(shù)據(jù)特征提取是建立關(guān)聯(lián)規(guī)則庫的關(guān)鍵。數(shù)據(jù)特征是進(jìn)行后續(xù)匹配識別的基礎(chǔ)。歷史數(shù)據(jù)特征提取思路是從樣本數(shù)據(jù)中提取出潛在的異常行為模式,產(chǎn)生相應(yīng)的關(guān)聯(lián)規(guī)則,并轉(zhuǎn)換成符合Snort規(guī)則語法的入侵檢測規(guī)則,添加到規(guī)則庫中[11]。在該模塊中,采用遺傳算法進(jìn)行數(shù)據(jù)特征提取,具體過程如下。
步驟1:輸入樣本數(shù)據(jù)庫,隨機(jī)從中選擇一個(gè)特征,并計(jì)算其信息熵。
步驟2:判斷信息熵值是否大于等于設(shè)定的閾值。若超過閾值,則選擇該特征,記為第一個(gè)有效特征x,否則回到步驟1重新進(jìn)行一個(gè)特征,直到信息熵值大于等于設(shè)定的閾值s1[12]。
步驟3:再次從樣本數(shù)據(jù)庫隨機(jī)選擇第二個(gè)特征記為y,并計(jì)算x與y之間的互信息值。
步驟4:判斷x與y之間的互信息值是否大于等于預(yù)定閾值s2。若大于等于預(yù)定閾值s2,則選擇y作為第二個(gè)有效特征,否則回到步驟3重新進(jìn)行選擇,直到選出第二個(gè)有效特征為止。
步驟5:組合x與y構(gòu)成一個(gè)類別C,并計(jì)算其中每個(gè)特征與樣本之間的相關(guān)性,去除其中的不相關(guān)特征和冗余特征,構(gòu)成有效特征集L。
步驟6:對特征集L進(jìn)行偏F檢驗(yàn),得出L1。
步驟7:以L1構(gòu)建初始群體,并進(jìn)行染色體編碼。
步驟8:計(jì)算每個(gè)個(gè)體的適用度值并排序,選擇適用度值前k個(gè)個(gè)體組成新的群體G。
步驟9:根據(jù)適用度值,進(jìn)行選擇、交叉和變異操作。
步驟10:判斷當(dāng)前個(gè)體適用度值是否達(dá)到最大進(jìn)化代數(shù),若滿足上述迭代終止條件,則輸出最優(yōu)解;否則回到步驟9,繼續(xù)遺傳操作[13]。
步驟11:根據(jù)輸出的最優(yōu)解選出編碼為“1”的特征構(gòu)成特征集。
數(shù)據(jù)挖掘的作用是從大數(shù)據(jù)集中發(fā)現(xiàn)目標(biāo)信息。目前數(shù)據(jù)挖掘主要分為五大類,即分類分析、關(guān)聯(lián)規(guī)則分析、序列模式分析、離群點(diǎn)分析和聚類分析。其中,聚類分析是最常用的,典型算法包括密度聚類算法、分層聚類算法、網(wǎng)格聚類算法、k-means算法、模糊聚類算法等。在本章節(jié)選擇k-means算法進(jìn)行光纖鏈路健康狀況判斷,其基本思路是計(jì)算測試樣本與各類特征之間的相似度來判斷,具體過程如圖2所示。
圖2 基于k-means算法的光纖鏈路健康狀況判斷流程
計(jì)算測試樣本X=(x1,x2,…,xn)與各類特征集Y=(y1,y2,…,yn)之間的相似度是k-means算法的關(guān)鍵。目前計(jì)算公式主要有以下幾種。
(1) 歐幾里得距離:
(4)
(2) 曼哈頓距離:
(5)
(3) 明可夫斯基距離:
(6)
式中,p≥1是一個(gè)變量值。
為測試所研究的泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)質(zhì)量監(jiān)管模塊設(shè)計(jì)的有效性,以引言中前人研究的3種方法作為對比項(xiàng),即基于小波分析和改進(jìn)支持向量機(jī)的檢測方法、正交基神經(jīng)網(wǎng)絡(luò)模型檢測方法和改進(jìn)遺傳算法的檢測方法,在CPU 為 Intel pentium G630 2.7 GHz,內(nèi)存為 2 GB,操作系統(tǒng)為 Windows XP 的計(jì)算機(jī)中進(jìn)行仿真測試。選擇型號為T5100-S型號的智能時(shí)鐘同步系統(tǒng),結(jié)合泛網(wǎng)智能變電站數(shù)據(jù)和衛(wèi)星信號,由光纖秒脈沖方式進(jìn)行時(shí)鐘同步,設(shè)置同步精度要求在1 μs/h,ANNONCE報(bào)文每2 s發(fā)送一次,SYNC報(bào)文每500 ms發(fā)送一次。
光纖鏈路數(shù)據(jù)分布情況如表2所示。
表2 光纖鏈路數(shù)據(jù)分布情況
按照表2,提取數(shù)據(jù)特征,生成關(guān)聯(lián)規(guī)則庫,具體如表3所示。
表3 關(guān)聯(lián)規(guī)則庫(部分)
為獲取測試樣本需要搭建測試環(huán)境。該測試環(huán)境搭建需要光纖線纜、內(nèi)部總線控制卡、內(nèi)部總線底板、測控板卡和運(yùn)動(dòng)控制卡等幾部分,如圖3所示。
圖3 仿真實(shí)驗(yàn)測試環(huán)境
圖3仿真實(shí)驗(yàn)測試環(huán)境的參數(shù)設(shè)置情況如表4所示。
表4 仿真參數(shù)設(shè)置
運(yùn)行圖3仿真實(shí)驗(yàn)測試環(huán)境,采集到的測試數(shù)據(jù)分布情況如表5所示。
表5 樣本分布情況 單位:bit
將數(shù)據(jù)輸入計(jì)算機(jī),運(yùn)行所研究的光纖鏈路健康狀況判斷方法,然后輸出結(jié)果。結(jié)果顯示界面如圖4所示。
圖4 光纖鏈路健康狀況判斷結(jié)果顯示界面
相同仿真條件下,對比3種已有的方法進(jìn)行光纖鏈路質(zhì)量判斷,然后統(tǒng)計(jì)所有判斷結(jié)果的漏報(bào)率和誤報(bào)率結(jié)果如表6所示。
表6 光纖鏈路質(zhì)量監(jiān)管質(zhì)量判斷結(jié)果
從表6中可以看出,與3種前人研究的方法相比較,本文所研究方法應(yīng)用下漏報(bào)率和誤報(bào)率都較低,說明所設(shè)計(jì)的質(zhì)量監(jiān)管模塊是有效的。
泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)質(zhì)量監(jiān)控管理模塊的設(shè)計(jì)旨在基于電力物聯(lián)網(wǎng)技術(shù)、對象組件技術(shù)及相關(guān)國家標(biāo)準(zhǔn)等,以全面統(tǒng)一規(guī)劃的技術(shù)架構(gòu),實(shí)現(xiàn)智能變電站中信息空間和物理空間的無縫連接,提高電網(wǎng)運(yùn)行效率和可靠性,提高效率和經(jīng)濟(jì)效益。為此,針對該模塊的關(guān)鍵,即光纖鏈路健康狀況判斷進(jìn)行研究。經(jīng)測試,證明了本文所研究內(nèi)容的有效性,為泛網(wǎng)智能變電站時(shí)鐘系統(tǒng)中質(zhì)量監(jiān)控管理模塊的完善提供了參考和借鑒。