王書領(lǐng),邵其專,滕偉業(yè)
(云南電力調(diào)度控制中心,云南昆明 650000)
電力設(shè)備故障對智能電網(wǎng)的安全運行起著重要作用,電力系統(tǒng)中的設(shè)備運行時間越長,設(shè)備出現(xiàn)故障的可能性越大[1]。為了保證電力設(shè)備的安全運行,降低損失,必須對電力設(shè)備進行狀態(tài)監(jiān)測與故障診斷,以便及早發(fā)現(xiàn)設(shè)備出現(xiàn)的各種故障,避免災(zāi)害、事故的發(fā)生[2]。傳統(tǒng)的數(shù)據(jù)降維方法主要通過主成分分析(PCA)實現(xiàn),但在智能電網(wǎng)環(huán)境下,可靠性和實時性較差。在極端惡劣的環(huán)境下,電力設(shè)備經(jīng)常由于監(jiān)測值超標而向監(jiān)測中心發(fā)送報警數(shù)據(jù),造成監(jiān)測中心在極端惡劣的情況下,出現(xiàn)井噴現(xiàn)象;使用基于混合神經(jīng)網(wǎng)絡(luò)的電網(wǎng)故障診斷算法,不能滿足實際數(shù)據(jù)實時接收和處理的需求,造成數(shù)據(jù)丟失和覆蓋。因此,提出了基于大數(shù)據(jù)分析的實時在線診斷方法,在大數(shù)據(jù)平臺上部署電網(wǎng)數(shù)據(jù),以實現(xiàn)電網(wǎng)特征數(shù)據(jù)的并行故障診斷。
當電力系統(tǒng)運行時,電力特征量隨系統(tǒng)運行狀態(tài)而變化。在有故障源的情況下,通過特征參數(shù)顯示故障信息[3]。將此信息作為故障測度,可以對系統(tǒng)狀態(tài)進行診斷。電網(wǎng)多數(shù)據(jù)源的信息通過系統(tǒng)特征和狀態(tài)來傳遞,若信息來源只發(fā)出一種狀態(tài),即為確定量信息,則信息的特征不帶任何資訊,所以信息必然包含未知和不確定性[4-6]。電網(wǎng)多數(shù)據(jù)來源的不確定性與電網(wǎng)每一狀態(tài)發(fā)生的概率有關(guān)[7]。
設(shè)電網(wǎng)出現(xiàn)故障的數(shù)據(jù)集為x(x1,x2,…,xn),每種故障狀態(tài)出現(xiàn)的概率為P(xi),則一個數(shù)據(jù)源可以用一個概率空間描述,即:
在上述公式中,各個狀態(tài)空間相互獨立,因此,可得到電網(wǎng)多數(shù)據(jù)源特征為:
1)不確定度是指數(shù)據(jù)源的狀態(tài)數(shù)和其在概率空間的概率分布;
2)在數(shù)據(jù)源的概率空間為等概率分布時,不確定度較大;
3)當分布相等時,不確定度與可能狀態(tài)數(shù)或相應(yīng)概率有關(guān)。隨著狀態(tài)數(shù)的增加,不確定度增大,相應(yīng)概率減?。?/p>
4)通過數(shù)據(jù)源概率倒數(shù)的對數(shù)度量表示數(shù)據(jù)源不確定度,即:
式(3)中,k表示度量數(shù)據(jù)量。該公式用來衡量數(shù)據(jù)量,數(shù)據(jù)量與接收數(shù)據(jù)前后不確定度關(guān)系有關(guān),數(shù)據(jù)量降低,說明電網(wǎng)接收信息前后,概率空間概率分布發(fā)生變化[8-10]。為此,假定以y表示收到的信息,則不確定度可表示為:
式(4)中,P(x/y)表示接收到的電網(wǎng)信息后驗分布概率;E(x/y)表示異常信息熵,表示電網(wǎng)故障狀態(tài)處于不確定的程度,由此得到的信息量為:
診斷方案的拓撲實現(xiàn)包含兩部分,首先是模型構(gòu)建,然后匹配相關(guān)數(shù)據(jù),結(jié)合數(shù)據(jù)流處理過程和聚類過程,設(shè)計在線診斷流程。診斷方案的拓撲實現(xiàn)過程如圖1 所示。
圖1 診斷方案的拓撲實現(xiàn)過程
采用歷史數(shù)據(jù)模擬在線數(shù)據(jù),實時監(jiān)測數(shù)據(jù)源,以便實現(xiàn)電網(wǎng)多數(shù)據(jù)源的在線學習與診斷[11-13]。
結(jié)合電網(wǎng)多數(shù)據(jù)源特征,構(gòu)建了電網(wǎng)多數(shù)據(jù)源診斷的大數(shù)據(jù)多維模型,如圖2 所示。
圖2 大數(shù)據(jù)多維診斷模型
由圖2 可知,電網(wǎng)故障診斷采用多維存儲節(jié)點數(shù)據(jù),通過大數(shù)據(jù)關(guān)聯(lián)將相同數(shù)據(jù)維度的節(jié)點連接起來。對于多維大網(wǎng)絡(luò),當一個數(shù)據(jù)節(jié)點被成功觸發(fā)時,對應(yīng)的電力系統(tǒng)診斷數(shù)據(jù)會被激活,從而得到相應(yīng)的診斷結(jié)果[14]。
匹配維是觸發(fā)維和大數(shù)據(jù)多維之間的橋梁,匹配維大數(shù)據(jù)節(jié)點的設(shè)計至關(guān)重要。基于觸發(fā)器大小數(shù)據(jù),匹配相同大小的大數(shù)據(jù)節(jié)點,具有相同的故障類別、電壓等級和接線方式[15]。與維度匹配的大數(shù)據(jù)節(jié)點主要生成大數(shù)據(jù)多維共有部分,如圖3 所示。
圖3 觸發(fā)多維大數(shù)據(jù)節(jié)點
由圖3 可知,大數(shù)據(jù)節(jié)點代表線路電流差動保護及重合動作,而與大數(shù)據(jù)節(jié)點相同的部分,則是觸發(fā)維度節(jié)點成功匹配時激活的匹配維度。與數(shù)據(jù)多維相同,每個匹配維度都有一個匹配維度的大數(shù)據(jù)與之關(guān)聯(lián),能夠提高節(jié)點匹配效率。
電網(wǎng)特征向量數(shù)據(jù)為無間隔數(shù)據(jù)流,通過向匹配維連續(xù)發(fā)送數(shù)據(jù),構(gòu)成待處理數(shù)據(jù)流。為便于對診斷結(jié)果的后續(xù)處理,保證元組處理順序一致,每個發(fā)送的元組對每個元組中相應(yīng)的數(shù)據(jù)集進行唯一標識,并將電網(wǎng)多維數(shù)據(jù)源多維診斷模型,按ID 排序相關(guān)計算結(jié)果進行匯總[16]。
為使元組樣本數(shù)據(jù)規(guī)范化,采用了電網(wǎng)設(shè)備特征向量數(shù)據(jù),每一個數(shù)據(jù)都有多維性特征。通過迭代更新聚類中心,計算每個聚類中心所有樣本點的向量均值,聚類過程為:
步驟1:隨機選擇n個樣本數(shù)據(jù)中的k個不同樣本作為初始聚類中心。
步驟2:對樣本集和各聚類中心之間的矢量距進行計算,選擇矢量距最小的樣本進行分類。K-均值算法一般是用歐氏距離來劃分樣本,公式為:
式(6)中,dij表示大數(shù)據(jù)多維節(jié)點m和n之間的歐式距離,其中mi多維節(jié)點坐標為(mi1,mi2,mi3,…min),nj多維節(jié)點坐標為(nj1,nj2,nj3,…njn)。
步驟3:更新簇中心,計算每一個類中所有樣本數(shù)據(jù)的平均數(shù),并以這些平均數(shù)為新的簇中心。
步驟4:重復步驟2 和步驟3,直到新的聚類中心不再改變,聚類停止,由此完成數(shù)據(jù)處理。
依據(jù)數(shù)據(jù)處理結(jié)果,對電網(wǎng)多數(shù)據(jù)源異常情況進行診斷,流程如下:
步驟1:在大數(shù)據(jù)多維節(jié)點中,通過大數(shù)據(jù)分析方法,獲取電網(wǎng)多數(shù)據(jù)源處理隊列,并對節(jié)點進行聚類。
步驟2:實時檢測數(shù)據(jù),得到的各個參量處理隊列,依據(jù)該隊列及時判斷不同時間節(jié)點數(shù)據(jù)是否屬于同一聚類中心。
步驟3:判斷電網(wǎng)多數(shù)據(jù)源處理隊列中是否存在異常數(shù)據(jù),如果存在,則各個數(shù)據(jù)流中的節(jié)點數(shù)據(jù)屬于正常數(shù)據(jù)。
步驟4:判斷電網(wǎng)多數(shù)據(jù)源處理隊列中是否存在少數(shù)異常數(shù)據(jù),如果存在,則各個數(shù)據(jù)流中的節(jié)點數(shù)據(jù)既存在正常數(shù)據(jù),也存在異常數(shù)據(jù)。
步驟5:判斷電網(wǎng)多數(shù)據(jù)源處理隊列中異常數(shù)據(jù)是否超過數(shù)據(jù)總量的1/2,如果是,則各個數(shù)據(jù)流中的節(jié)點異常數(shù)據(jù)比正常數(shù)據(jù)多。
通過上述內(nèi)容,可實現(xiàn)基于大數(shù)據(jù)分析的電網(wǎng)多數(shù)據(jù)源實時在線診斷,這樣可以使計算量達到最小,縮短診斷時間。
為了驗證基于大數(shù)據(jù)分析的電網(wǎng)多數(shù)據(jù)源實時在線診斷的實時性和有效性,進行了實驗驗證分析。
實驗室建立了一個Storm 云平臺,包括一個主節(jié)點和8 個從節(jié)點,使用了5 臺服務(wù)器形成物理集群,伺服器通過千兆開關(guān)連接,虛擬軟件XenServer 安裝在每個服務(wù)器上。9 個節(jié)點被虛擬化,每個節(jié)點分配兩個CPU 內(nèi)核。Storm 系統(tǒng)被配置為9 個虛擬機。虛擬機①為主要控制節(jié)點,其余8 個虛擬機②為工作節(jié)點,表1 為平臺配置信息。
表1 Storm云平臺信息
部署與系統(tǒng)相關(guān)的外部環(huán)境,在每個工作節(jié)點中分配4 個工作點,每個節(jié)點最多運行4 個進程,通過不同交換機連接實現(xiàn)節(jié)點間通信,由此構(gòu)造一個內(nèi)部網(wǎng)段。
3.2.1 吞吐量測試
吞吐量指在單位時間內(nèi)電網(wǎng)處理的數(shù)據(jù)量,通過測試集群工作節(jié)點,分析吞吐量變化情況。保持集群節(jié)點數(shù)不變,改變組件并發(fā)數(shù),設(shè)進程數(shù)為5個,不同組件并發(fā)數(shù)下的吞吐量如表2 所示。
表2 不同組件并發(fā)數(shù)下的吞吐量
基于此,分別使用主成分分析法、混合神經(jīng)網(wǎng)絡(luò)算法和基于大數(shù)據(jù)分析方法,分析不同組件并發(fā)數(shù)下的吞吐量,對比結(jié)果如圖4 所示。
圖4 不同方法吞吐量診斷結(jié)果對比分析
由圖4 可知,使用主成分分析法、混合神經(jīng)網(wǎng)絡(luò)算法在不同進程下,與實際值存在一定偏差。其中,使用主成分分析法在進程4 下,與實際值偏差最大,相差200 個并發(fā)數(shù)。使用混合神經(jīng)網(wǎng)絡(luò)算法在進程1 下,與實際值偏差最大,相差300 個并發(fā)數(shù)。而使用基于大數(shù)據(jù)分析方法與實際值一致,誤差為0。
3.2.2 數(shù)據(jù)延遲測試
數(shù)據(jù)延遲指在Storm 架構(gòu)中,數(shù)據(jù)被發(fā)送到其被完全處理的時間,不同元數(shù)據(jù)序號下,預期延遲處理時間如表3 所示。
表3 不同元數(shù)據(jù)序號下預期延遲處理時間
基于此,分別使用主成分分析法、混合神經(jīng)網(wǎng)絡(luò)算法和基于大數(shù)據(jù)分析方法,分析不同元數(shù)據(jù)序號下預期延遲處理時間,對比結(jié)果如圖5 所示。
圖5 不同方法延遲處理時間診斷結(jié)果對比
由圖5 可知,使用主成分分析法、混合神經(jīng)網(wǎng)絡(luò)算法延遲處理時間比實際時間要長,而使用基于大數(shù)據(jù)分析方法與實際時間一致。
針對傳統(tǒng)診斷方法實時性不足的問題,研究了基于大數(shù)據(jù)分析的電網(wǎng)多數(shù)據(jù)源實時在線診斷方法。實驗表明,基于大數(shù)據(jù)分析的電網(wǎng)多數(shù)據(jù)源實時在線診斷方法能夠滿足電網(wǎng)快速診斷數(shù)據(jù)需求。然而,由于實驗環(huán)境的限制,只能并行診斷電網(wǎng)數(shù)據(jù),實踐中應(yīng)考慮多種不同因素,引入復雜事件,采用面向服務(wù)的思想,對多源信息實時處理。