鄭業(yè)爽,李世春,魯玲
(1.三峽大學(xué)科技學(xué)院,湖北宜昌 443002;2.三峽大學(xué)電氣與新能源學(xué)院,湖北宜昌 443002)
變壓器作為電力系統(tǒng)中的重要設(shè)備,如果出現(xiàn)故障將會嚴(yán)重影響電力系統(tǒng)的穩(wěn)定運行,因此對變壓器進(jìn)行快速準(zhǔn)確的故障診斷具有重要的意義[1-3]。
當(dāng)變壓器出現(xiàn)故障時,內(nèi)部的絕緣油會受熱分解,產(chǎn)生氫氣和低分子烴類氣體,因此采用油中氣體溶解分析(Dissolved Gas-in-oil Analysis,DGA)數(shù)據(jù)對變壓器故障進(jìn)行診斷效果較好[4]。目前基于DGA 的變壓器故障診斷主要分為傳統(tǒng)方法與人工智能方法[5]。傳統(tǒng)方法存在編碼不全,過于依賴人工經(jīng)驗的缺陷,無法對變壓器故障進(jìn)行高效準(zhǔn)確的診斷[6-7]。因此隨著人工智能方法的發(fā)展,基于人工智能方法的變壓器故障診斷技術(shù)也逐漸步入人們的視野,例如神經(jīng)網(wǎng)絡(luò)[8]、深度學(xué)習(xí)[9]、專家系統(tǒng)[10]、支持向量機(jī)(Support Vector Machine,SVM)[11-12]等。近年來應(yīng)用于變壓器故障診斷的人工智能主流方法為神經(jīng)網(wǎng)絡(luò)與SVM。但神經(jīng)網(wǎng)絡(luò)模型復(fù)雜性較高,且存在需要較大的樣本集、收斂速度慢等缺點,對于樣本量少的DGA 數(shù)據(jù)診斷效果較差[13]。而SVM 憑借泛化性較強(qiáng),適用于非線性、小樣本數(shù)據(jù)的優(yōu)勢被廣泛應(yīng)用于故障診斷領(lǐng)域[14-16]。但SVM 的分類精度依賴于參數(shù)設(shè)置,僅憑人工經(jīng)驗無法達(dá)到診斷模型性能最大化,因此部分學(xué)者通過尋找SVM 的最優(yōu)參數(shù)來構(gòu)建最優(yōu)故障診斷模型。文獻(xiàn)[17]使用量子行為粒子群對SVM 參數(shù)進(jìn)行尋優(yōu)以提升故障診斷模型的性能。文獻(xiàn)[18]利用合成少數(shù)類過采樣技術(shù)和基于最近鄰規(guī)則的欠采樣方法對變壓器故障數(shù)據(jù)進(jìn)行采樣,使故障診斷模型的分類精度最大化。文獻(xiàn)[19]基于類重疊度構(gòu)造二分類模糊SVM,提出一種基于類重疊特征的變壓器分層故障診斷方法,其優(yōu)點是診斷性能較強(qiáng)。文獻(xiàn)[20]采用混合特征法對DGA 數(shù)據(jù)進(jìn)行處理,提出采用遺傳算法優(yōu)化SVM的故障診斷模型,其優(yōu)點是可提升故障診斷的準(zhǔn)確率。綜合分析文獻(xiàn)[17-20]可知,基于SVM 進(jìn)行故障診斷的模型存在著參數(shù)需依靠人為經(jīng)驗設(shè)定的缺點,同時傳統(tǒng)的元啟發(fā)式算法也存在易陷入局部尋優(yōu)的缺陷,從而導(dǎo)致模型診斷精度較低、有效性較差。
綜上所述,本文為解決由SVM 參數(shù)難以確定而導(dǎo)致的變壓器故障診斷精度低及海鷗優(yōu)化算法(Seagull Optimization Algorithm,SOA)易陷入局部尋優(yōu)的問題,提出一種多策略改進(jìn)海鷗優(yōu)化算法(Improved Seagull Optimization Algorithm,ISOA)優(yōu)化SVM 的變壓器故障診斷方法。該方法的創(chuàng)新之處在于利用非線性慣性權(quán)重、Logistic 映射隨機(jī)性的變異擾動及種群精英化策略對SOA 進(jìn)行改進(jìn),所建立的ISOA-SVM 故障診斷模型較傳統(tǒng)方法具有計算精度更高的優(yōu)點。
SVM 是基于統(tǒng)計理論的一種傳統(tǒng)的機(jī)器學(xué)習(xí)方法,其原理是在空間中構(gòu)造最優(yōu)超平面,對樣本數(shù)據(jù)進(jìn)行分類處理。使用核技巧將DGA 數(shù)據(jù)樣本集中的輸入向量xi從輸n維的輸入空間Zn變換到特征空間H,得到特征向量φ(xi)。再將數(shù)據(jù)升至高維空間,以φ(xi)代替xi構(gòu)造最優(yōu)超平面[21-22]。數(shù)據(jù)分類的決策函數(shù)f(x)為:
式中:i為特征量號;ω為法向量;b為分類閾值。
引入松弛變量ξi,構(gòu)造SVM 針對非線性數(shù)據(jù)的最大間隔分類器表達(dá)式為:
式中:C為懲罰參數(shù);N為每個樣本中特征量的集合;yi為分類標(biāo)記,yi∈{-1,1}。
引入拉格朗日乘子λi,并根據(jù)KKT(Karush-Kuhn-Tucker)條件,得到最優(yōu)ω與b帶入式(1),可得最終決策函數(shù)f(x)為:
式中:K(xi,xj)為核函數(shù);xj為高斯核函數(shù)中心向量;j為核函數(shù)中變量號。
K(xi,xj)的表達(dá)式為:
式中:σ為核函數(shù)參數(shù)。
通過分析可以看出,SVM 的最優(yōu)超平面與懲罰參數(shù)C和核函數(shù)參數(shù)σ有關(guān)。本文使用ISOA 對參數(shù)C與σ進(jìn)行尋優(yōu),并結(jié)合核主成分分析(Kernel Principal Component Analysis,KPCA)對數(shù)據(jù)進(jìn)行處理,以達(dá)到建立一個快速準(zhǔn)確的變壓器診斷模型的目的。
SOA 是 由Gaurav Dhiman 和Vijay Kumar 于2018 年提出的一種新式的元啟發(fā)算法[23-24]。其基本思想是模擬海鷗種群的遷徙和覓食行為,通過種群間不斷迭代更新最優(yōu)解。本文提出使用SOA 對SVM 的超參數(shù)進(jìn)行尋優(yōu),同時針對SOA 初始種群位置較差、容易陷入局部優(yōu)化的缺陷進(jìn)行研究。為改善SOA 存在的各種不足,主要針對非線性慣性權(quán)重、Logistic 映射隨機(jī)性的變異擾動及種群精英化3個方面,提出一種多策略的改進(jìn)方法來全方面提升SOA 的尋優(yōu)性能。
1.2.1 非線性慣性權(quán)重
在SOA 中,參數(shù)線性慣性權(quán)重A會控制海鷗在給定搜索空間中的運動行為,可以避免海鷗種群在遷徙過程中發(fā)生碰撞,影響海鷗種群的全局搜索行為。但A存在無法隨著海鷗種群更新而靈活改變的缺陷,因此對其進(jìn)行改進(jìn)研究并提出一種非線性慣性權(quán)重公式,使A的衰減過程更為平滑。改進(jìn)后A的表達(dá)式為:
式中:t為當(dāng)前迭代次數(shù);tmax為最大迭代次數(shù)。
設(shè)tmax=500 次,則改進(jìn)前后的慣性權(quán)重曲線如圖1 所示。
圖1 慣性權(quán)重曲線Fig.1 Curves for inertia weight before and after improvement
由圖1 可知,A>1 時,海鷗種群將進(jìn)行全局搜索;A<1 時,海鷗種群將進(jìn)行局部搜索。所提非線性慣性權(quán)重縮減了海鷗在迭代前中期的全局搜索行為,在迭代中后期A衰減緩慢,SOA 則可進(jìn)行精細(xì)的局部搜索以提升SOA 的尋優(yōu)性能。
1.2.2 Logistic映射隨機(jī)性的變異擾動
針對SOA 在迭代過程中容易陷入局部尋優(yōu)的缺點,提出一種隨機(jī)變異公式,使海鷗在尋優(yōu)過程中獲得小幅度的擾動。當(dāng)海鷗種群陷入局部尋優(yōu)時,該擾動將幫助其跳出局部尋優(yōu),當(dāng)前海鷗位置表達(dá)式為:
每一次迭代中R均會隨機(jī)變換,一般在[-0.5,0.5]之間;變異系數(shù)V一般設(shè)置為1。同時為了保證隨機(jī)數(shù)生成的遍歷性與隨機(jī)性,提出使用Logistic 混沌映射生成R,Logistic 混沌映射表達(dá)式為:
式中:Rt為第t次迭代的擾動系數(shù);Rt-1為第t-1次迭代的擾動系數(shù);μ為控制變量。
為了保證映射得到的Rt始終位于區(qū)間[-0.5,0.5]內(nèi),μ的取值區(qū)間為(0,4],當(dāng)μ屬于(3.569 9,4]之間時Logistic 映射處于混沌狀態(tài),本文選擇設(shè)置μ為4。為證明所提Logistic 映射的有效性,本文利用生成隨機(jī)數(shù)的Rand 函數(shù)和Logistic 混沌映射2 種方法迭代3×105次后的混沌序列分布如圖2 所示。其中,對生成的所有隨機(jī)數(shù)進(jìn)行統(tǒng)計,統(tǒng)計范圍為[-0.5,-0.4],[-0.4,-0.3],…,[0.4,0.5]共10 個區(qū)間。
圖2 混沌序列分布Fig.2 Chaotic sequence distribution
由圖2 可知,Logistic 映射生成的隨機(jī)數(shù)分別聚集于[-0.5,-0.4]與[0.4,0.5]這2 個區(qū)間時,結(jié)合式(6)可以看出海鷗種群將進(jìn)行大變異,可對海鷗種群陷入局部優(yōu)化的缺陷進(jìn)行深度改進(jìn);Logistic 映射生成的隨機(jī)數(shù)分別聚集于[-0.1,0]與[0,0.1]這2 個區(qū)間時,表示海鷗種群幾乎沒有變異,可保留一部分海鷗種群尋優(yōu)的優(yōu)勢;分布在其余區(qū)間內(nèi)的隨機(jī)數(shù)則在迭代過程中對海鷗種群進(jìn)行不同程度上的擾動。由于基于Rand 函數(shù)生成的隨機(jī)數(shù)的范圍近似相等,無法對海鷗種群進(jìn)行針對性的變異,因此本文使用Logistic 混沌映射生成擾動系數(shù)R。
通過給定變異概率p進(jìn)行變異判定,若符合p=0.3,則使用變異公式將SOA 原有的位置更新公式進(jìn)行替換,則當(dāng)前海鷗位置為:
SOA 通過式(8)進(jìn)行更新迭代,可以有效幫助陷入局部尋優(yōu)的海鷗種群快速跳出,在增加算法尋優(yōu)精度的同時也可以提升其收斂速度。
1.2.3 種群精英化
海鷗種群在每次迭代后會存在幾個較差個體,從而影響SOA 的尋優(yōu)精度和收斂速度,因此本文提出一種種群精英化策略對其進(jìn)行改進(jìn),種群位置表達(dá)式為:
式中:M為種群數(shù);m為精英化過程中所選個體組成的集合,一般設(shè)為10%M;Hran為范圍[1,2,...,m]中的隨機(jī)整數(shù);index(M)為種群中適應(yīng)度值排在第M名的個體;index(M-1)為種群中適應(yīng)度值排在第(M-1)名的個體;index(M-m)為種群中適應(yīng)度值排在第(M-m)名的個體。
在每一次迭代結(jié)束后會選擇種群中10%的最差海鷗個體進(jìn)行精英化,將它們的位置重新更新,以大幅提升海鷗種群的尋優(yōu)能力。
基于ISOA-SVM 的變壓器故障診斷流程如圖3 所示。該流程包含ISOA 尋優(yōu)與SVM 故障診斷2 部分。
圖3 基于ISOA-SVM的變壓器故障診斷流程Fig.3 Fault diagnosis process of transformer based on ISOA-SVM
ISOA 尋優(yōu)流程具體如下:
1)參數(shù)初始化。初始化最大迭代次數(shù)、維度、慣性權(quán)重及SOA 種群大小等參數(shù)的值。
2)種群初始化。通過算法的初始化進(jìn)程,隨機(jī)產(chǎn)生海鷗初始種群及個體。計算海鷗個體與種群的初始適應(yīng)度值。通過對適應(yīng)度值進(jìn)行比較,找出最優(yōu)個體。
3)遷徙行為。SOA 進(jìn)行遷徙行為時,利用式(5)使用非線性慣性權(quán)重替代線性慣性權(quán)重A。
4)覓食行為。用隨機(jī)性變異公式(8)代替?zhèn)鹘y(tǒng)覓食公式,使海鷗種群進(jìn)行隨機(jī)性強(qiáng)且精度更高的覓食行為。
5)種群選擇并進(jìn)行精英化策略。SOA 迭代完成后進(jìn)行種群選擇,將具有最優(yōu)的種群位置與個體位置作為下一代適應(yīng)度。使用式(9)精英化迭代后的種群。
6)判斷是否滿足終止條件。若迭代次數(shù)達(dá)最大值,算法運行結(jié)束,輸出尋優(yōu)結(jié)果;否則,轉(zhuǎn)到步驟4。
為驗證所提ISOA 的優(yōu)越性,選取Ackley 函數(shù)與Quartic 函數(shù)對粒子群算法(Particle Swarm Optimization,PSO)、SOA 和ISOA 3 種算法的尋優(yōu)性能進(jìn)行對比測試。
Ackley 基準(zhǔn)測試函數(shù)區(qū)間為[-32,32],函數(shù)的最優(yōu)解為0,Ackley 基準(zhǔn)測試函數(shù)表達(dá)式為:
式中:F1(x)為Ackley 基準(zhǔn)測試函數(shù);xk為測試函數(shù)的輸入變量;k為求和變量;q為變量總數(shù)。
Quartic 基準(zhǔn)測試函數(shù)區(qū)間為[-1.28,1.28],函數(shù)的最優(yōu)解為0,Quartic 基準(zhǔn)測試函數(shù)表達(dá)式為:
式中:F2(x)為Quartic 基準(zhǔn)測試函數(shù);Wran為區(qū)間[0,1)中的隨機(jī)數(shù)。
假設(shè)PSO,SOA,ISOA 3 種算法迭代次數(shù)為500次,種群為50 個。對Ackley 和Quartic 2 種函數(shù)各取10 次測試結(jié)果,適應(yīng)度變化曲線如圖4 所示。
圖4 適應(yīng)度變化曲線Fig.4 Fitness curves
由圖4(a)可知,通過適應(yīng)度值來評定3 種算法尋優(yōu)過程中個體的優(yōu)劣程度,ISOA 算法在收斂性和全局尋優(yōu)性能2 方面較PSO,SOA 都表現(xiàn)更優(yōu),在多峰函數(shù)中ISOA 可在保證其收斂速度的同時,尋找到比SOA 與PSO 更優(yōu)的尋優(yōu)值。由圖4(b)可知,ISOA 算法在收斂性和全局尋優(yōu)性能2 方面較PSO,SOA 依然表現(xiàn)更優(yōu),在單峰函數(shù)中ISOA 擁有較快的收斂速度且尋優(yōu)精度也更佳。因為隨機(jī)變異公式被應(yīng)用于ISOA 算法,所以ISOA 可以頻繁跳出局部尋優(yōu),而SOA 與PSO 則易陷入局部尋優(yōu)且尋優(yōu)值較低。
綜上,與其他2 種優(yōu)化算法相比,本文所提ISOA 算法無論在收斂性方面還是在全局尋優(yōu)性能方面,都表現(xiàn)出較好的優(yōu)化效果。因此,本文使用ISOA 對參數(shù)C與σ進(jìn)行尋優(yōu),通過快速準(zhǔn)確找到SVM 的最優(yōu)參數(shù),建立基于SVM 的最優(yōu)故障診斷模型。
在實際應(yīng)用中,特征氣體往往會攜帶變壓器的故障信息,本文所提變壓器故障診斷方法以DGA數(shù)據(jù)作為特征量進(jìn)行故障診斷。所使用的DGA 數(shù)據(jù)是從湖北省某電網(wǎng)公司與文獻(xiàn)[25]中獲得的500組故障數(shù)據(jù)。數(shù)據(jù)存在5 種特征量分別為H2,CH4,C2H6,C2H4及C2H2的含量;6 種故障類型分別為中低溫過熱(T1)、高溫過熱(T2)、局部放電(PD)、低能放電(D1)、高能放電(D2)及正常狀態(tài)(NC)。6 種故障類型編號如表1 所示。
表1 6種故障類型編號Table 1 Numbering for six kinds of fault types
由于DGA 特征量存在偏差與冗余問題,因此使用比值法將DGA 特征量進(jìn)行擴(kuò)充。其中,TH 為低分子烴類氣體之和(TH=CH4+C2H6+C2H4+C2H2),9種故障特征量分別為CH4/C2H6,CH4/C2H4,CH4/C2H2,C2H6/C2H4,C2H4/C2H2,H2/(TH+H2),C2H6/TH,C2H4/TH,C2H2/TH對應(yīng)的9 組比值。
為解決因DGA 數(shù)據(jù)冗雜影響診斷精度的問題,提出適用于非線性數(shù)據(jù)特征提取的KPCA 方法對DGA 數(shù)據(jù)進(jìn)行處理。KPCA 先通過核函數(shù)把DGA 數(shù)據(jù)映射到高維空間,再在高維空間下將其映射到另1 個低維空間以進(jìn)行特征提取。將數(shù)據(jù)劃分為測試集與訓(xùn)練集,選擇其中的330 組數(shù)據(jù)為訓(xùn)練集,170 組數(shù)據(jù)為測試集。以帕累托圖的形式給出故障特征量主成分貢獻(xiàn)率如圖5 所示。其中,KPCA 中核寬度選擇為8。
圖5 故障特征量主成分貢獻(xiàn)率Fig.5 Contribution rate of principal component of fault features
由圖5 可知,為有效表現(xiàn)故障數(shù)據(jù)集的故障特征,本文要求故障特征量主成分累計貢獻(xiàn)率須達(dá)90%。前4 個故障特征量主成分的累計貢獻(xiàn)率為90.70%,已達(dá)到本文要求的90%,因此選取前4 個故障特征量主成分可有效表現(xiàn)故障數(shù)據(jù)集的故障特征。本文犧牲貢獻(xiàn)率小的故障特征量主成分,將DGA 故障特征量由圖5 中的10 維降低到4 維,進(jìn)而達(dá)到提高模型計算效率的效果。
對500 組數(shù)據(jù)進(jìn)行故障診斷,訓(xùn)練集與測試集的數(shù)據(jù)分組如表2 所示,分組比例為2:1。
表2 數(shù)據(jù)分組Table 2 Data grouping
由圖3 可得,基于ISOA-SVM 的變壓器故障診斷模型流程為:
1)數(shù)據(jù)預(yù)處理。載入數(shù)據(jù),其中訓(xùn)練集為330組,測試集為170 組,對數(shù)據(jù)進(jìn)行歸一化處理,將所有數(shù)據(jù)歸算到(0,1)之間。
2)KPCA 特征提取。使用KPCA 對DGA 數(shù)據(jù)進(jìn)行特征提取,按總貢獻(xiàn)率90%的標(biāo)準(zhǔn)對主成分特征量進(jìn)行提取作為故障數(shù)據(jù)。
3)基于最優(yōu)參數(shù)建立診斷模型。使用測試完成的優(yōu)化算法ISOA 對SVM 的參數(shù)C與σ進(jìn)行尋優(yōu)。
4)故障診斷。SVM 使用最優(yōu)參數(shù)C與σ進(jìn)行故障診斷。
5)輸出診斷結(jié)果。輸出診斷結(jié)果,包括:故障診斷分類情況、測試集準(zhǔn)確率、訓(xùn)練集準(zhǔn)確率、錯分個數(shù)情況等。
本文在MATLAB 仿真平臺上使用PSO-SVM,SOA-SVM 以及ISOA-SVM 3 種模型對基于KPCA特征提取后的DGA 數(shù)據(jù)進(jìn)行故障診斷,結(jié)果如圖6所示。
圖6 PSO-SVM、SOA-SVM、ISOA-SVM 3種模型故障診斷結(jié)果Fig.6 Fault diagnosis results with PSO-SVM,SOASVM and ISAO-SVM
圖6 中,藍(lán)色圓圈表示實際故障,紅色星號表示故障診斷模型的診斷故障。若圓圈與星號未重合,則表示該次診斷屬于錯判。
由圖6(a)可知,PSO-SVM 模型對于高能放電存在大量錯判情況,其中8 個情況錯判為低能放電;對于局部放電存在4 個錯判;對于低能放電存在6 個錯判;對于其余3 種故障類型一共存在7 個錯判。對于電故障的診斷效果較差,總準(zhǔn)確率為85.29%,模型性能一般。由圖6(b)可知,SOA-SVM模型對于低能放電與高能放電均存在6 個錯判情況;對于局部放電存在4 個錯判;對于中低溫過熱存在4 個錯判;對于高溫過熱無錯判;對于正常狀態(tài)僅存在1 個錯判??倻?zhǔn)確率為87.65%,模型性能優(yōu)于PSO-SVM。由圖6(c)可知,使用ISOA 對SVM 的參數(shù)進(jìn)行尋優(yōu),從而使故障診斷模型的泛化性能與診斷性能得到提升。對于低能放電存在6個錯判;對于高能放電存在3 個錯判;對于局部放電存在1 個錯判;對于中低溫過熱存在2 個錯判;對于高溫過熱無錯判;對于正常狀態(tài)存在1 個錯判??倻?zhǔn)確率為92.35%,模型性能相比較PSOSVM 與SOA-SVM 為最優(yōu)。
3 種模型故障診斷準(zhǔn)確率如表3 所示。
表3 3種模型故障診斷準(zhǔn)確率Table 3 Fault diagnosis accuracy of three models %
由表3 可知,為考慮故障診斷模型的有效性,采用三折交叉驗證法對3 種故障診斷模型的有效性進(jìn)行驗證,其中ISOA-SVM,PSO-SVM 以及SOA-SVM 的準(zhǔn)確率分別為91.96%,83.73%和86.67%,較其總準(zhǔn)確率分別減少0.39%,1.56%和0.98%,證明ISOA-SVM 模型的有效性較高。
針對SVM 參數(shù)難以確定導(dǎo)致變壓器故障診斷精度低及SOA 易陷入局部尋優(yōu)的問題,提出一種多策略改進(jìn)方法以提升SOA 的尋優(yōu)精度與收斂速度,并使用基準(zhǔn)測試函數(shù)對ISOA 的性能進(jìn)行測試,表明其尋優(yōu)性能良好。實例分析結(jié)果表明,ISOASVM 有效性較強(qiáng),且具有較高的故障診斷精度。同時也證明ISOA-SVM 具有一定的優(yōu)越性,在后續(xù)研究中可以用來解決更多的分類問題。