徐敏銳,李 云,盧樹峰,竇曉波,陳 剛,郭家豪
(1. 國網(wǎng)江蘇省電力有限公司 營銷服務(wù)中心,江蘇 南京 210096;2. 東南大學(xué) 網(wǎng)絡(luò)空間安全學(xué)院,江蘇 南京 211189;3. 東南大學(xué) 電氣工程學(xué)院,江蘇 南京 210096)
電力設(shè)備(如氣體絕緣金屬封閉開關(guān)設(shè)備、電力電纜等)在長期運行過程中,其絕緣性能會逐步弱化,該過程中會發(fā)生不同模式的局部放電PD(Partial Discharge)[1],通過檢測電力設(shè)備的局部放電模式可以判斷電力設(shè)備的運行狀態(tài),這對于電力設(shè)備的運行維護具有重要的作用。
目前,已有方法通常是基于相位信息的局部放電PRPD(Phase Resolved Partial Discharge)譜圖進行局部放電模式的識別。PRPD 譜圖是局部放電數(shù)據(jù)的放電相位、放電幅值、放電次數(shù)的二維圖像體現(xiàn),可以直觀反映局部放電情況。通過脈沖特征法、矩特征法、小波分析法等提取反映局部放電模式的數(shù)據(jù)特征[2],采用機器學(xué)習(xí)方法建立局部放電模式識別模型。比較常用機器學(xué)習(xí)方法有反向傳播BP(Back Propagation)算法、支持向量機SVM(Support Vector Machine)、極限學(xué)習(xí)機、概率神經(jīng)網(wǎng)絡(luò)等。文獻[3]首先提取PRPD 譜圖中的統(tǒng)計特征,然后利用概率神經(jīng)網(wǎng)絡(luò)對統(tǒng)計特征進行分析;文獻[4]基于PRPD譜圖的統(tǒng)計特征組成不同的特征子集,通過概率神經(jīng)網(wǎng)絡(luò)算法剔除冗余特征,這2 種方法對局部放電類型的識別準確率約為90%。文獻[5]利用計算得到的PRPD 譜圖的相關(guān)參數(shù)(如灰度重心、矩特征參數(shù)等)識別局部放電模式。文獻[6]通過提取的尖銳度、信息熵、稀疏度等特征識別局部放電模式。由于PRPD 譜圖直觀上以圖像的形式呈現(xiàn),文獻[7]提取局部放電的時頻分布圖像特征,將其輸入SVM中進行分類,但這種提取圖像特征的方法需要人為進行各類變換,嚴重影響了局部放電模式識別的效率。近年來,圖像識別技術(shù)越來越成熟,因此在圖像分析領(lǐng)域中有顯著效果的卷積神經(jīng)網(wǎng)絡(luò)(CNN)也被應(yīng)用于局部放電模式的識別中。文獻[8]采用CNN自動提取PRPD 譜圖中的圖像特征,并通過分類器進行分類,實現(xiàn)了對PRPD 譜圖的圖像識別。但是,單一PRPD 譜圖的數(shù)據(jù)統(tǒng)計特征或圖像特征都存在缺陷:相似圖像的外形輪廓接近,將嚴重影響局部放電模式識別的準確率,此時利用數(shù)據(jù)統(tǒng)計特征可以修正單一利用相似圖像進行局部放電模式識別的結(jié)果;對于非常接近的數(shù)據(jù)統(tǒng)計特征參數(shù)值,單一的分析很難準確識別出局部放電模式,引入圖像分析可以很好地解決這個問題。因此,對PRPD 譜圖的數(shù)據(jù)統(tǒng)計特征和圖像特征進行融合分析,可以更好地識別局部放電模式。
D-S 證據(jù)組合規(guī)則是一種無需先驗知識的不確定推理方法,常被用于數(shù)據(jù)融合領(lǐng)域。文獻[9]將深度置信網(wǎng)絡(luò)與D-S 證據(jù)組合規(guī)則結(jié)合,通過深度信念網(wǎng)絡(luò)訓(xùn)練得到2 級變壓器故障診斷模型,并采用D-S 證據(jù)組合規(guī)則融合2 級的診斷結(jié)果得到最終的診斷結(jié)果。文獻[10]中通過D-S 證據(jù)組合規(guī)則將局部放電的灰度紋理特征、統(tǒng)計特征和油氣特征進行兩兩融合后輸入SVM 中進行訓(xùn)練,從而得到油紙絕緣老化評估模型。因此,D-S 證據(jù)組合規(guī)則適用于PRPD譜圖的數(shù)據(jù)統(tǒng)計特征和圖像特征的融合分析。但是D-S 證據(jù)組合規(guī)則在處理高度沖突或完全沖突的證據(jù)時,會產(chǎn)生與常理相悖的結(jié)果。
綜上所述,本文提出了一種基于D-S 證據(jù)組合規(guī)則的雙模型融合局部放電模式識別方法:提取典型的PRPD 譜圖數(shù)據(jù)統(tǒng)計特征,采用BP 神經(jīng)網(wǎng)絡(luò)進行建模,剔除冗余特征,建立局部放電模式的BP 識別模型;按照放電次數(shù)將PRPD 譜圖數(shù)據(jù)映射為灰度圖,采用CNN 提取PRPD 譜圖數(shù)據(jù)的圖像特征,建立局部放電模型的CNN 識別模型;為綜合PRPD 譜圖的數(shù)據(jù)統(tǒng)計特征和圖像特征分析的優(yōu)勢,采用基于信息熵改進的D-S 證據(jù)組合規(guī)則對2 個識別模型的輸出結(jié)果進行融合,避免了常見的悖論問題,且該規(guī)則與貝葉斯概率論相比,需滿足的條件更弱。
本文方法的整體流程如圖1 所示。本文針對PRPD 譜圖的統(tǒng)計數(shù)據(jù)分析和圖像數(shù)據(jù)分析分別建立了BP 識別模型和CNN 識別模型,2 個模型的沖突性并不高,因此本文采用基于信息熵改進的D-S 證據(jù)組合規(guī)則對2 個模型的結(jié)果進行融合,最終得到局部放電模式判定模型(簡稱判定模型)。每個模型的輸出為4 種局部放電模式,而每個模型針對每種放電模式的識別準確率各不相同,對2 個識別模型的輸出結(jié)果進行融合可以修正單一模型的識別結(jié)果。
圖1 基于D-S證據(jù)組合規(guī)則的雙模型融合局部放電模式識別整體流程圖Fig.1 Overall flowchart of PD pattern recognition based on double models fusion with D-S evidence combination rule
PRPD 譜圖是基于放電脈沖的相位、幅值、次數(shù)建立的二維圖像,其可以直觀地反映局部放電情況。根據(jù)超寬帶高頻脈沖電流傳感器HFCT(High Frequency Pulse Current Sensor)實測交聯(lián)聚乙烯電纜局部放電數(shù)據(jù)[11],4 種局部放電模式的相位-幅值圖見附錄A 圖A1。根據(jù)PRPD 譜圖提取以下典型的統(tǒng)計特征參數(shù)。
1)偏斜度Sk:反映譜圖正、負半周期(本文中將相位0°~180°作為正半周期,相位180°~360°作為負半周期)的放電次數(shù)和放電量的分布相對于正態(tài)分布的偏斜程度[12]。
式中:xi為二維譜圖第i個相位小區(qū)間的相位中值;σ為半個周期內(nèi)相位分布的標準差;μ為半個周期內(nèi)放電相位的均值;N為相位正、負半周期內(nèi)相位小區(qū)間的個數(shù)。
2)陡峭度Ku:反映譜圖形狀相對于正態(tài)分布的陡峭程度。
將上述統(tǒng)計特征依次存入數(shù)組中構(gòu)成統(tǒng)計特征集{Sk,Ku,Qc}。
統(tǒng)計特征中存在的冗余信息會降低機器學(xué)習(xí)模型的局部放電模式識別準確率[13],剔除這些冗余信息尤為必要。由于本文提取的統(tǒng)計特征較少,因此首先將數(shù)組中的所有統(tǒng)計特征數(shù)據(jù)集作為輸入進行機器學(xué)習(xí)訓(xùn)練,例如第1 次輸入的統(tǒng)計特征集為{F1,F(xiàn)2,F(xiàn)3},然后再剔除其中一個統(tǒng)計特征進行機器學(xué)習(xí)訓(xùn)練(即選擇的特征集為{F1,F(xiàn)2}、{F1,F(xiàn)3}或{F2,F(xiàn)3},下一次訓(xùn)練再剔除1 個統(tǒng)計特征,如果局部放電模式識別準確率不再變化,則選擇識別準確率最高的統(tǒng)計特征組合作為機器學(xué)習(xí)的輸入特征。BP 神經(jīng)網(wǎng)絡(luò)是機器學(xué)習(xí)中常用的一種結(jié)構(gòu)簡單的神經(jīng)網(wǎng)絡(luò),其由輸入層、隱藏層、輸出層組成,采用全連接方式[14],具有較強的非線性能力、泛化能力、自學(xué)習(xí)能力和自適應(yīng)能力,以及一定的容錯能力,常用于解決分類問題和線性回歸問題。本文利用BP 神經(jīng)網(wǎng)絡(luò)(隱藏層數(shù)為1,隱藏層含有10 個節(jié)點)建立BP 識別模型,通過不斷地反饋更替權(quán)值矩陣和偏置矩陣來調(diào)整網(wǎng)絡(luò)參數(shù),當損失函數(shù)達到一定閾值時退出訓(xùn)練,完成模型建立。
PRPD譜圖直觀上也是一種圖像,因此圖像分析的方法同樣適用于PRPD 譜圖的圖像數(shù)據(jù)分析。CNN 可以共享卷積核,適用于高維數(shù)據(jù)處理,同時,CNN 對數(shù)據(jù)具有位移、縮放、扭曲不變性,更有利于對圖像數(shù)據(jù)的處理,因此在圖像領(lǐng)域得到了廣泛的應(yīng)用。CNN 結(jié)構(gòu)包括輸入層、卷積層、池化層、全連接層、輸出層[15],其中,卷積層、池化層通過不斷地卷積與池化,得到最終的特征輸入;全連接層連接著CNN 提取的特征輸入與輸出。本文建立的CNN 模型包含2 個卷積層、2 個池化層、1 個全連接層,全連接層采用的神經(jīng)網(wǎng)絡(luò)算法同BP神經(jīng)網(wǎng)絡(luò),輸出層采用式(4)所示的Sf函數(shù)輸出最終結(jié)果。
式中:zj為第j個神經(jīng)元的輸出;K為神經(jīng)元總數(shù)。
基于PRPD 譜圖,以相位ψ為橫軸數(shù)據(jù)、放電幅值q為縱軸數(shù)據(jù)、放電次數(shù)nd為像素點,構(gòu)建二維圖形輸入。由于單個相位可能存在多個放電次數(shù),因此取平均放電次數(shù)-nd作為像素點,根據(jù)最大放電次數(shù)ndmax將像素點的值映射到0~255 范圍內(nèi),以便輸入CNN 進行計算[16]。利用式(5)將PRPD 譜圖圖像數(shù)據(jù)映射為灰度圖,結(jié)果如附錄A圖A2所示。
式中:G為灰度值。
識別框架θ可表示為包含n個元素的集合θ={A1,A2,…,An},在該識別框架下,如果存在一個函數(shù)m滿足:
則m為該識別框架下的基本概率分配函數(shù)(也稱為mass 函數(shù)),該函數(shù)反映在識別框架θ下對集合中的元素的支持程度。由mass 函數(shù)引出信任函數(shù)Bl和以及似然函數(shù)Pl分別如式(7)和式(8)所示。
本文中的θ有2 個子集,即2 個局部放電模式識別模型,其基本概率分配函數(shù)分別為m1、m2,其元素為各識別模型下對4 種局部放電模式(電暈放電、懸浮放電、內(nèi)部放電、沿面放電)的識別準確率,分別為A1—A4和B1—B4,則融合后的結(jié)果如式(9)所示。
式中:m(A)為融合后的基本概率分配函數(shù);k為沖突系數(shù)[17-18]。采用D-S 證據(jù)組合規(guī)則融合2 個識別模型得到的結(jié)果,可以更加準確地識別局部放電模式。
D-S 證據(jù)組合規(guī)則在處理高度沖突或完全沖突的證據(jù)時,會產(chǎn)生與常理相悖的結(jié)果,例如2 個識別模型在局部模式識別結(jié)果上的差別可能會引起誤判。因此,需要對D-S 證據(jù)組合規(guī)則進行改進。目前針對D-S 證據(jù)組合規(guī)則的改進方法主要分為修改證據(jù)理論合成規(guī)則和修改證據(jù)源2 類。本文根據(jù)信息熵的大小賦給證據(jù)體相應(yīng)的權(quán)重,以此來修改證據(jù)源,從而避免在融合高度沖突的數(shù)據(jù)時出現(xiàn)悖論問題。
信息熵反映了信息量的多少,證據(jù)體的信息熵越小,其所攜帶的有用信息越少,穩(wěn)定性越高,在融合時所占的權(quán)重也就越大。信息熵H(X)的定義為:
式中:X為信息源;p(xi)為第i個信息xi出現(xiàn)的概率。
2 個識別模型對每種局部放電模式的識別準確率反映了測試集中該局部放電模式被正確識別的概率,即可看作是所攜帶的有用信息的概率。因此,可將2 個識別模型對每種局部放電模式的識別準確率作為信息概率值,計算出各個模型中證據(jù)體的信息熵。各模型中的證據(jù)體即為局部放電模式,依據(jù)證據(jù)體的信息熵占比設(shè)置證據(jù)體的權(quán)重wi,如式(12)所示。
式中:H(xi)為證據(jù)體的信息熵;n為證據(jù)體數(shù)量。根據(jù)證據(jù)體的權(quán)重修正證據(jù)源,得到修正后的結(jié)果如式(14)所示。
根據(jù)修正證據(jù)源后的結(jié)果,按照D-S 證據(jù)組合規(guī)則,對2 個識別模型的結(jié)果進行融合,從而得到判定模型。
根據(jù)BP、CNN 識別模型的局部放電模式識別結(jié)果,按照未改進和基于信息熵的改進D-S 證據(jù)組合規(guī)則得到的概率分配函數(shù)分別如式(15)和式(16)所示。
由式(16)可見,當某個識別模型能夠更加準確地識別某種局部放電模式時,該局部放電模式的信息熵更小,其mass 函數(shù)的權(quán)重更大,則式(16)的分子增大、分母減小,所以式(16)的值增大。因此基于信息熵改進后的D-S 證據(jù)組合規(guī)則進行模型融合時,將更加信賴識別準確率高的模型。
本文采集了電暈放電、懸浮放電、內(nèi)部放電、沿面放電這4種局部放電模式的數(shù)據(jù),每種模式有100組樣本數(shù)據(jù),共400 組樣本數(shù)據(jù)。為模擬實際情況并提高模型的泛化性能,在采集的數(shù)據(jù)中加入均值為0、標準差為5[19]的高斯噪聲,以電暈放電數(shù)據(jù)為例,加入高斯噪聲后的數(shù)據(jù)見附錄B 圖B1。在每種局部放電模式的每組樣本數(shù)據(jù)中分別加入4 次高斯噪聲,則可將4 種局部放電模式的數(shù)據(jù)樣本數(shù)據(jù)擴充至6 400 組。對數(shù)據(jù)的分配見附錄B 表B1。在訓(xùn)練模型時采用五折交叉驗證法。
為便于敘述,下文的圖表中將電暈放電、懸浮放電、內(nèi)部放電、沿面放電分別記為模式1—4。根據(jù)2.2節(jié)中的統(tǒng)計特征篩選方法,為消除統(tǒng)計特征之間的冗余度,需提取易于分類的特征組合,具體流程為:將偏斜度Sk、陡峭度Ku,放電量因數(shù)Qc分別記為特征F1、F2、F3,4 種局部放電模式的特征參數(shù)如圖2所 示;分 別 以 多 個 特 征 組 合{F1,F(xiàn)2,F(xiàn)3}、{F1,F(xiàn)2}、{F1,F(xiàn)3}、{F2,F(xiàn)3}以及單個特征F1、F2、F3建立BP 識別模型并進行訓(xùn)練,根據(jù)各特征組合作為輸入時的損失函數(shù)值擇優(yōu)選擇特征組合。傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)收斂速度慢,容易陷入局部最小值。因此,本文采用小批量梯度下降法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),同時加入自適應(yīng)學(xué)習(xí)率。BP 識別模型采用歸一化指數(shù)函數(shù)作為激活函數(shù),采用均方誤差函數(shù)作為損失函數(shù),采用梯度下降算法作為優(yōu)化策略,每批次設(shè)置輸入量為10。BP識別模型訓(xùn)練過程如圖3所示。根據(jù)訓(xùn)練結(jié)果可知,選擇特征組合{F1,F(xiàn)3}作為輸入可以消除{F1,F(xiàn)2,F(xiàn)3}中的統(tǒng)計特征間的冗余度。按照前文的參數(shù)設(shè)置,建立以{F1,F(xiàn)3}為特征輸入的BP 識別模型并進行訓(xùn)練。
圖2 4種局部放電模式的統(tǒng)計特征參數(shù)Fig.2 Statistical characteristic parameters of four PD modes
圖3 不同統(tǒng)計特征組合下的BP識別模型訓(xùn)練過程Fig.3 Training process of BP recognition model under different statistical characteristic combinations
CNN識別模型采用歸一化指數(shù)函數(shù)作為激活函數(shù),采用交叉熵作為損失函數(shù),采用自適應(yīng)梯度算法作為優(yōu)化策略,每批次設(shè)置輸入量為10。根據(jù)6400組樣本數(shù)據(jù)以及附錄B 表B1 所示的分配方式訓(xùn)練CNN 識別模型。CNN 識別模型在訓(xùn)練過程中的損失函數(shù)值如圖4所示。當CNN 識別模型保持穩(wěn)定且損失函數(shù)值達到閾值時即完成訓(xùn)練。
圖4 CNN識別模型在訓(xùn)練過程中的損失函數(shù)值Fig.4 Loss function value of CNN recognition model during training process
利用BP 識別模型和CNN 識別模型檢測測試樣本,結(jié)果如表1所示。
表1 BP和CNN識別模型的測試準確率Table 1 Test accuracy of BP and CNN recognition models
根據(jù)4.2 節(jié)中的方法計算BP、CNN 識別模型中各類局部放電模式的權(quán)重。以BP識別模型為例,根據(jù)BP識別模型的局部放電模式識別準確率,可獲得BP 模型下電暈放電、懸浮放電、內(nèi)部放電、沿面放電模式的信息熵分別為0.162、0.175、0.143、0.153,從而計算得到各局部放電模式的權(quán)重見附錄B 表B2。得到各局部放電模式的權(quán)重后,對BP、CNN 識別模型輸出的結(jié)果進行融合,得到最終的判定模型。
局部放電測試樣本識別流程為:對每種局部放電模式測試樣本分別采用BP、CNN 識別模型進行模式識別,按照(BP 識別模型識別結(jié)果,CNN 識別模型識別結(jié)果)的方式記錄模型輸出結(jié)果,例如(1,3)表示BP、CNN 識別模型輸出的結(jié)果分別為電暈放電、內(nèi)部放電模式。2 個識別模型對各類局部放電測試樣本的識別結(jié)果如表2所示。
表2 BP和CNN識別模型對各類局部放電測試樣本的識別結(jié)果Table 2 Recognition results of various PD test samples by BP and CNN recognition models
利用未改進的D-S 證據(jù)組合規(guī)則融合BP、CNN識別模型的識別結(jié)果時,計算得到的基本概率分配函數(shù)值如表3所示。D-S證據(jù)組合規(guī)則中,基本概率分配函數(shù)值越大的證據(jù),其可靠性越大。例如在對電暈放電和內(nèi)部放電測試樣本進行識別時,均輸出了結(jié)果(1,3)(如表3 中下劃線所示),但是電暈放電模式對應(yīng)的基本概率分配函數(shù)值更大,因此最終判定結(jié)果為電暈放電模式。
表3 基于未改進的D-S證據(jù)組合規(guī)則進行模型融合后的mass函數(shù)值Table 3 Values of mass function after model fusion with original D-S evidence combination
根據(jù)基于信息熵改進的D-S 證據(jù)組合規(guī)則融合BP和CNN識別模型的輸出結(jié)果后,計算得到的基本概率分配函數(shù)值如表4 所示,雙模型融合后的判定模型輸出的結(jié)果如表5 所示。可見,經(jīng)過信息熵改進的D-S 證據(jù)組合規(guī)則在進行模型融合時,將輸出(1,3)對應(yīng)的識別結(jié)果判定為內(nèi)部放電模式,從而解決了未改進的D-S 證據(jù)組合規(guī)則在模型融合時存在的悖論問題。利用該判定模型對測試樣本進行檢測,結(jié)果如表6所示。
表4 基于改進的D-S證據(jù)組合規(guī)則進行模型融合后的mass函數(shù)值Table 4 Values of mass function after model fusion with improved D-S evidence combination
表5 基于改進的D-S證據(jù)組合規(guī)則進行模型融合后的判定結(jié)果Table 5 Decision results after model fusion with improved D-S evidence combination
表6 基于改進的D-S證據(jù)組合規(guī)則進行模型融合后的模型測試結(jié)果Table 6 Test results after model fusion with improved D-S evidence combination
利用式(17)所示的召回率Rrecall反映識別模型的穩(wěn)定性,結(jié)果如圖5 所示。召回率越大,模型越穩(wěn)定。由圖5可知,采用基于信息熵改進的D-S證據(jù)組合規(guī)則進行雙模型融合后,可以修正單一模型識別的結(jié)果,對局部放電模型的識別更加穩(wěn)定、準確。
圖5 各模型的召回率Fig.5 Recall rate of each model
式中:TP、FN分別為某種放電模式被預(yù)測正確、錯誤的個數(shù)。
本文提取了2 種不同類別的PRPD 譜圖數(shù)據(jù)特征,分別采用BP 神經(jīng)網(wǎng)絡(luò)和CNN 建立局部放電模式識別模型,通過基于信息熵改進的D-S 證據(jù)組合規(guī)則對2種識別模型進行融合,解決了D-S證據(jù)組合規(guī)則常見的悖論問題,能夠更加全面地包含PRPD譜圖數(shù)據(jù)反映的局部放電類型的特征。實驗結(jié)果表明,本文方法的識別結(jié)果更加穩(wěn)定、準確。本文工作為局部放電模式識別提供了可借鑒的方法,今后將在電力設(shè)備運行狀態(tài)評估及設(shè)備運維等方面做進一步研究。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。