何 柳,張 梅
(安徽理工大學 電氣與信息工程學院,安徽 淮南 232001)
電力變壓器是電力系統(tǒng)重要的組成部分,若變壓器發(fā)生故障,將給電力系統(tǒng)造成巨大經(jīng)濟損失,所以準確預測變壓器故障是至關重要的[1]。油中溶解氣分析(dissolved gas analysis, DGA)是目前常用的故障診斷方法之一,可以通過分析這些氣體的情況來判斷電力變壓器的情況[2]。
目前,大批算法應用在電力變壓器故障診斷方面,常用的算法包括極限學習機(Extreme Learning Machines, ELM)、隨機森林(Random forest, RF)、貝葉斯(Bayesian Neural Networks,BNN)和神經(jīng)網(wǎng)絡BP等,有優(yōu)點也有一些缺點[3-7]。何寧輝等人先建立核極限學習機模型,再優(yōu)化混合核函數(shù)的參數(shù),提高ELM的學習能力和泛化能力,以提高診斷精度,但ELM學習速度緩慢,并且易陷入局部最小值[8]。徐新等人利用蝗蟲優(yōu)化對BP神經(jīng)網(wǎng)絡的某些參數(shù)進行優(yōu)化,提升它的速度和搜索能力,但它的網(wǎng)絡性能較差,學習率不穩(wěn)定[9]。安國慶等人先提出隨機森林的特征優(yōu)選,然后結合鯨魚算法優(yōu)化支持向量機[10]的故障診斷模型。謝國民等人構建了改進SSA優(yōu)化MDS-SVM的變壓器故障診斷方法[11]。這兩篇通過對比實驗體現(xiàn)出優(yōu)化后SVM(support vector machine),故障診斷模型較好,可以很好地應用在變壓器故障診斷方面。
支持向量機(SVM)是一種機器學習算法,可解決分類或者回歸難題。SVM模型有兩個非常重要的參數(shù)c與g,懲罰參數(shù)c和核函數(shù)參數(shù)g的選擇與模型的分類效果密切相關,所以需要選擇合適的優(yōu)化參數(shù)是非常的重要。
灰狼優(yōu)化算法(Grey Wolf Optimizer,GWO)是灰狼算法是根據(jù)灰狼群體的捕獵行動而提出的優(yōu)化算法,其算法流程和步驟非常簡單,數(shù)學模型也非常的優(yōu)美,能夠在局部尋優(yōu)與全局搜索之間實現(xiàn)平衡。改進的灰狼算法(Differential evolution Grey Wolf Optimizer,DEGWO)在原本GEO算法基礎上增加了差分進化,提高了魯棒性和全局尋優(yōu)能力,在電力變壓器故障診斷方面,提升了求解精度和收斂速度方面。
本文提出了一種基于DEGWO-SVM的電力變壓器故障診斷模型,首先對DGA數(shù)據(jù)進行特征提取、歸一化等處理,歸一化處理使其具有相同的度量尺度;然后使用DEGWO算法對SVM模型進行參數(shù)尋優(yōu),再將處理好的數(shù)據(jù)輸入SVM模型中進行訓練,同時得到最優(yōu)模型,最后用得到的模型進行電力變壓器故障診斷,輸出故障診斷模型[12]。
SVM模型的核心思想是最大化超平面的間隔,因此建立相應的目標函數(shù)與約束條件。
假設有m個樣本訓練集{xi,yi},xi和yi分別為樣本和輸出類型,設最優(yōu)超平面表達式如式(1)所示。
wφ(x)+b=0
(1)
式(1)中,w為權值系數(shù),b為偏值系數(shù)。
要求超平面對應于公式滿足條件如式(2)所示。
yi[wφ(x)+b]≥1yi∈[-1,1]
(2)
超平面的目標函數(shù)和約束條件如式(3)所示。
(3)
式(3)中,C為懲罰因子;εi和ε為松弛變量。
為約束最優(yōu)化問題的解,引入拉格朗日函數(shù),使之轉(zhuǎn)化成對偶問題[13],α為拉格朗日乘子,表達式如式(4)所示。
(4)
最優(yōu)超平面函數(shù)表達式如式(5)所示。
(5)
式(5)中,K(xi,xj)為核函數(shù)。
本文中選徑向基核函數(shù)RBF,即表達式如式(6)所示。
(6)
式(6)中,?為徑向基函數(shù)參數(shù)。
灰狼算法的提出是受灰狼在大自然捕食活動的啟發(fā)的一種優(yōu)化算法[13]。該種群一般分為四個等級。最高層是第一等級,主要是在狼群中負責決策地位;第二等級主要是負責協(xié)助第一等級進行決策;第三等級聽從第一等級和第二等級的決策命令,主要是負責偵查、放哨等事務;金字塔底層是第四等級,主要負責種群內(nèi)部關系的平衡[14]。
灰狼算法主要是以下步驟:
(1)跟蹤、追逐和接近獵物;
(2)追捕、包圍和騷擾獵物,直到它停止移動;
(3)攻擊獵物。
差分進化算法(DE)具有尋優(yōu)能力強和收斂速度快的優(yōu)點,DE算法的全局優(yōu)化搜索能力經(jīng)常被用來提高算法的優(yōu)化能力,該算法分為三步進行操作,分別是變異、交叉和選擇。
1.3.1 變異
變異操作是DE算法中的核心步驟,對于種群中每個個體,差分進化算法的變異向量為V,表達式如式(7)所示,差分進化算法的變異向量按照下面的方式產(chǎn)生。
Vi(t+1)=Xa(t)+F[Xb(t)-Xc(t)]
(7)
式(7)中,a、b和c為隨機數(shù),F為縮放數(shù),t為當前迭代次數(shù)。
1.3.2 交叉
交叉操作是為了增強種群多樣性,表達式如式(8)所示。
(8)
式(8)中,rand(j)∈[0,1]為第j維分量對應的隨機數(shù),j為0,1,…,n,k為隨機在[0,n]中選擇的索引,CR為交叉算子,取值為[0,1]。
1.3.3 選擇
選擇操作會選擇貪婪操作,是為了判斷Xi(t+1)是否是下一代的成員,所以用實驗向量和目標向量對比,f為構造的適應函數(shù),表達式如式(9)所示。選擇更加優(yōu)秀的個體進行最新種群。
(9)
融合差分進化算法改進灰狼搜索算法流程如下:
(1)將DGA樣本數(shù)據(jù)用KPCA特征提取和歸一化等處理,并且劃分為測試集和訓練集;
(2)初始化灰狼種群以及各種參數(shù);
(3)計算灰狼種群的適應度;
(4)更新每個狼群位置;
(5)進行差分進化操作,結束后選擇優(yōu)秀的灰狼個體進行后續(xù)操作[15];
(6)更新灰狼算法參數(shù);
(7)判斷是否達到迭代要求,若是就輸出最優(yōu)c和g參數(shù),否將返回初始化步驟;
(8)將得到的數(shù)據(jù)輸入優(yōu)化好的SVM模型中測試和訓練;
(9)輸出故障診斷結果。
為了實現(xiàn)更高精度的變壓器故障診斷,以SVM作為基礎分類模型,利用DEGWO算法優(yōu)化SVM模型。如圖1所示,文中構建DEGWO-SVM變壓器故障診斷模型。
圖1 基于DEGWO-SVM的電力變壓器故障模型圖
基于DEGWO-SVM的電力變壓器故障診斷模型主要由數(shù)據(jù)預處理、DEGWO優(yōu)化和故障診斷三個部分組成。數(shù)據(jù)預處理首先利用KPCA將數(shù)據(jù)映射到高維空間,再進行歸一化處理,并將其進行序列劃分;優(yōu)化部分是利用DEGWO算法對SVM模型的參數(shù)c和g進行尋優(yōu),得到最優(yōu)參數(shù)[17];故障診斷部分是利用構建出的最優(yōu)模型對測試數(shù)據(jù)進行故障診斷,且文中準備多組對比實驗來論證所提方法的優(yōu)越性。
數(shù)據(jù)由國家電網(wǎng)公司某電網(wǎng)提供,選取H2、CH4、C2H6、C2H4、C2H2五種屬性進行操作,圖2是DGA數(shù)據(jù)的樣本,訓練集樣本和測試集樣本的比例分別為8:2[17],將低溫過熱、中溫過熱、高溫過熱、局部放電、低能放電、高能放電和正常運行七種故障類型作為電力變壓器故障診斷的輸出特征[18]。
若使用原始數(shù)據(jù)集里所有特征數(shù)據(jù)進行故障分類,工作數(shù)據(jù)量大,勢必會影響模型的運行速度,且分類精度低,檢測效果不理想。因此在故障模型訓練前,需對原始樣本進行預處理操作。
圖2 DGA數(shù)據(jù)樣本圖
由于DGA數(shù)據(jù)存在冗余特征,一些無關變量會影響實驗的效果,本文采取非線性主元分析法(kernel principal component analysis,KPCA)來進行數(shù)據(jù)降維,從而提高模型的收斂速度及診斷精度。
KPCA的核心思想是將數(shù)據(jù)投射到更高維的空間,然后在高維空間進行數(shù)據(jù)處理。如圖3所示,當數(shù)據(jù)維度是四維的時候,它的貢獻度已經(jīng)高于96%,所以將數(shù)據(jù)維度降至四維,從而可以有效除去冗余特征。
圖3 KPCA特征提取累積貢獻度圖
本文采用區(qū)間值化法對數(shù)據(jù)進行歸一化處理,使特征具有相同的度量尺度,數(shù)據(jù)按照一定比例進行縮放操作,表達式如式(10)所示。
(10)
式(10)中,X是歸一化處理之前的數(shù)據(jù),Xi是歸一化處理之后的數(shù)據(jù),maxX是樣本中最大的值,minX為樣本中最小的值。如圖4所示,是進行歸一化后的數(shù)據(jù)圖。
圖4 歸一化后的數(shù)據(jù)圖
本文將樣本數(shù)據(jù)分為訓練樣本和測試樣本,按照8:2的比例,然后利用訓練樣本對優(yōu)化后的模型進行訓練,然后再將訓練好的模型對測試集進行故障診斷分析,得到的基于DEGWO-SVM的變壓器故障診斷結果,如圖5所示。
圖5 基于DEGWO-SVM故障診斷結果圖
由圖5可知,基于DEGWO-SVM模型的故障診斷準確率為93.3333%,具有較好的變壓器故障分類效果,診斷效果優(yōu)良,在電力變壓器故障診斷上具有一定的現(xiàn)實意義[19]。
為了驗證本文所提出的變壓器故障診斷模型的優(yōu)越性,文中進行多項實驗。
實驗一:驗證SVM模型故障診斷優(yōu)越性
分別采用充電樁故障診斷常用的分類模型:極限學習機(Extreme learning machine, ELM)和徑向基函數(shù)SVM主流分類器對數(shù)據(jù)進行診斷。對比實驗結果,驗證模型的優(yōu)越性。
實驗二:驗證尋優(yōu)DEGWO算法優(yōu)越性
針對SVM模型,分別采用灰狼算法(GWO)、粒子群算法(Particle Swarm Optimization, PSO)、蝙蝠算法(Bat Algorithm, BA)、DEGWO算法進行優(yōu)化,驗證DEGWO優(yōu)化算法的優(yōu)越性。
3.5.1 多模型診斷結果對比
本文中先使用KPCA算法對樣本數(shù)據(jù)進行預處理操作,再將處理過的數(shù)據(jù)作為輸入量輸入分類模型,這里選取用ELM模型和SVM模型進行訓練集和測試集結果對比,對比效果如圖6和圖7所示。
(a)訓練集樣本編號圖
(a)訓練集樣本編號圖
由圖6和圖7可知,SVM模型比ELM模型診斷效果好,準確率可高達88.8889%,SVM性能好一點,所以本文中選用SVM分類模型進行操作。
3.5.2 參數(shù)尋優(yōu)
本文中把DEGWO算法和BA算法、PSO算法、GWO優(yōu)化算法進行比較。
為了驗證DEGWO-SVM算法的優(yōu)越性,設置算法的種群數(shù)量為30,迭代次數(shù)為100。把數(shù)據(jù)樣本的訓練集5折交叉驗證的方式,即將數(shù)據(jù)樣本隨機分為五份,其中四份為訓練樣本,一份為驗證樣本,將訓練完的SVM模型對驗證樣本進行故障診斷,以驗證樣本的分類結果準確率為適應度函數(shù),如圖8所示,比較各優(yōu)化算法的適應度函數(shù)收斂情況。
圖8 適應度曲線圖
DEGWO算法的適應度最高,尋優(yōu)效果最好;其次是GWO算法,PSO算法尋優(yōu)效果最差,收斂速度最慢,即搜索能力較弱。說明DEGWO算法比其他三種尋優(yōu)算法效果更好,具有更好的全局搜索能力。
3.5.3 各算法尋優(yōu)對比
為了驗證DEGWO-SVM算法的優(yōu)越性,采用蝙蝠算法(BA)、GWO、PSO與優(yōu)化過的灰狼算法作對比,用以上算法做故障診斷模型,各優(yōu)化算法模型的準確率如表1所示。
表1 各算法對比準確率表
本文中使用的DEGWO-SVM的預測準確率93.3333%比GWO-SVM的預測準確率88.8889%、BA-SVM的預測準確率84.4444%和PSO-SVM的預測準確率77.778%都高,效果最好,所以本文中所使用的DEGWO-SVM方法效果最佳。
由于傳統(tǒng)電力變壓器故障診斷精度低對電力系統(tǒng)造成巨大損失,本文提出一種基于DEGWO-SVM模型的故障診斷方法,對該模型進行訓練和測試,結論如下。
(1)在對比ELM分類模型和SVM分類模型中,SVM模型的準確率更高,效果更好,準確率可高達88.8889%。
(2)在優(yōu)化SVM模型時,DEGWO、GWO、BA和PSO算法的準確率對比,DEGWO算法效果最好,準確率到達93.3333%。
綜上所述,本文提出的電力變壓器故障診斷方法在準確率有明顯優(yōu)勢,具有一定的應用前景和市場。