王士彬, 李多, 趙娜, 謝文龍, 黃偉, 季鴻宇
(1. 國(guó)網(wǎng)重慶市電力公司市南供電分公司, 重慶 401336;2. 重慶理工大學(xué)電氣與電子工程學(xué)院, 重慶 400054)
油浸式電力變壓器作為輸變電系統(tǒng)中的核心設(shè)備之一[1], 發(fā)生故障時(shí)會(huì)導(dǎo)致電網(wǎng)正常供電受影響, 及時(shí)發(fā)現(xiàn)變壓器潛在故障并準(zhǔn)確識(shí)別故障類型對(duì)確保電網(wǎng)穩(wěn)定可靠供電具有重要意義。 目前, 油中溶解氣體分析(dissolved gas analysis, DGA) 技術(shù)已被廣泛應(yīng)用于工程實(shí)踐中[2], 特征氣體法將油中溶解氣體H2、 CH4、 C2H4、 C2H2、 C2H6等作為特征氣體, 通過(guò)分析特征氣體含量識(shí)別故障類型, 國(guó)內(nèi)外學(xué)者基于DGA 數(shù)據(jù)將特征氣體比值作為特征量提出Dornenburg 比值法[3]、 IEC 三比值法[4]、 Rogers 四比值法等診斷方法。 由于油中溶解氣體含量與變壓器故障類型之間復(fù)雜的映射關(guān)系,特征氣體法和比值法無(wú)法精確識(shí)別變壓器故障類型, 已逐漸成為一種輔助方式。
近年來(lái), 將智能算法與DGA 技術(shù)相結(jié)合已成為提升變壓器故障診斷準(zhǔn)確率和可靠性的重要方法, 例如神經(jīng)網(wǎng)絡(luò)[5-6]、 支持向量機(jī)[7-8]、 模糊理論[9]等。 上述方法有效提升了診斷準(zhǔn)確率, 但由于算法本身的局限性仍存在不足: 神經(jīng)網(wǎng)絡(luò)所需訓(xùn)練樣本過(guò)大, 收斂速度過(guò)慢, 效率較低; 支持向量機(jī)分類性能受核參數(shù)和懲罰因子的值影響; 模糊理論對(duì)于樣本數(shù)據(jù)完整性要求較高, 且存在學(xué)習(xí)能力不足的問(wèn)題。 核極限學(xué)習(xí)機(jī) (kernel extreme learning machine, KELM)[10]在極限學(xué)習(xí)機(jī)(extreme learning machine, ELM) 的基礎(chǔ)上引入核函數(shù)思想, 有效解決了ELM 因隨機(jī)生成初始權(quán)值和閾值而導(dǎo)致分類效果差的問(wèn)題, 但單一核函數(shù)難以同時(shí)保證學(xué)習(xí)精度和泛化性。
針對(duì)上述問(wèn)題, 提出一種基于改進(jìn)北方蒼鷹算法(improved northern goshawk optimization algorithm,INGO) 優(yōu)化HKELM 的變壓器故障診斷方法。首先利用ReliefF 算法進(jìn)行特征優(yōu)選, 然后引入Logistic-tent 混沌映射、 柯西變異和非線性遞增權(quán)重改進(jìn)北方蒼鷹優(yōu)化算法, 提高北方蒼鷹算法(northern goshawk optimization, NGO) 的尋優(yōu)能力和收斂精度, 同時(shí)將多種核函數(shù)加權(quán)構(gòu)成HKELM;再使用改進(jìn)后的INGO 算法對(duì)HKELM 模型參數(shù)進(jìn)行優(yōu)化; 最后與不同診斷模型的診斷效果進(jìn)行對(duì)比, 驗(yàn)證所提方法的有效性和可靠性。
北方蒼鷹優(yōu)化算法 ( northern goshawk optimization, NGO) 是由Mohammad Dehghani 等人于2021 年提出的一種新型群智能優(yōu)化算法[11]。 該算法模擬北方蒼鷹的狩獵行為, 結(jié)構(gòu)簡(jiǎn)單、 性能優(yōu)良。 北方蒼鷹的捕獵過(guò)程可分為兩個(gè)階段: 獵物識(shí)別階段、 追擊和逃逸階段。
1.1.1 獵物識(shí)別階段
北方蒼鷹在此階段會(huì)隨機(jī)選擇一個(gè)獵物并攻擊, 數(shù)學(xué)表達(dá)式如下:
式中,Pi表示第i只北方蒼鷹所選獵物的位置;FPi是目標(biāo)函數(shù)值;Fi為第i個(gè)解的目標(biāo)函數(shù)值;k為[1,N] 的自然數(shù);Xi,new,P1表示第i只北方蒼鷹在此階段的新?tīng)顟B(tài);xi,j,new,P1表示第i只北方蒼鷹在j維的新?tīng)顟B(tài);Fi,new,P1是其對(duì)應(yīng)的目標(biāo)函數(shù)值;r為[0, 1] 的隨機(jī)數(shù);I的值為1 或2。
1.1.2 追擊和逃逸階段
在對(duì)獵物發(fā)起攻擊后, 獵物會(huì)試圖逃跑, 北方蒼鷹會(huì)對(duì)獵物發(fā)起追擊, 此階段數(shù)學(xué)表達(dá)式如下:
式中,R表示狩獵半徑;t為當(dāng)前迭代次數(shù);T為最大迭代次數(shù);Xi,new,P2是在第二階段第i只北方蒼鷹的新?tīng)顟B(tài);xi,j,new,P2為此階段第i只北方蒼鷹在第j維的新?tīng)顟B(tài);Fi,new,P2為對(duì)應(yīng)的目標(biāo)函數(shù)值。
標(biāo)準(zhǔn)的NGO 算法雖具有良好的穩(wěn)定性及較高的收斂精度, 但同大多數(shù)傳統(tǒng)群智能算法一樣, 種群初始化仍采用隨機(jī)分布的方式, 從而導(dǎo)致初始解分布不均勻。 其次, 在標(biāo)準(zhǔn)NGO 算法的第二階段,北方蒼鷹追捕獵物的速度非??? 會(huì)導(dǎo)致算法搜索速度加快, 易陷入局部最優(yōu)解的情況。
為進(jìn)一步提升NGO 算法的性能, 從以下三個(gè)方面對(duì)NGO 算法進(jìn)行改進(jìn): 引入Logistic-tent 混沌映射初始化種群, 提升求解效率; 引入柯西變異策略對(duì)最優(yōu)蒼鷹個(gè)體的位置進(jìn)行擾動(dòng), 避免算法陷入局部最優(yōu); 引入非線性遞增權(quán)重, 平衡全局搜索和局部開(kāi)發(fā)的能力。 改進(jìn)后的INGO 算法流程如圖1所示。
圖1 INGO 算法流程
1.2.1 Logistic-tent 混沌映射初始化種群
初始種群直接影響算法的收斂速度和尋優(yōu)效果, 在標(biāo)準(zhǔn)NGO 算法初始化時(shí), 北方蒼鷹初始位置分布不均, 造成部分初始解局部聚集, 因此引入Logistic-tent 混沌映射初始化種群, 使初始種群在解空間中分布更加均勻, 提升算法的尋優(yōu)速度。 其表達(dá)式如下:
式中,γ為控制參數(shù), 取值范圍 (0, 4) ;Xn∈[0, 1] ;n為迭代次數(shù); modl 表示對(duì)該式進(jìn)行取模運(yùn)算。
1.2.2 柯西變異策略
標(biāo)準(zhǔn)NGO 算法在尋優(yōu)時(shí)所有蒼鷹個(gè)體均向最優(yōu)個(gè)體聚集, 在算法后期, 種群多樣性會(huì)隨之降低, 導(dǎo)致算法易陷入局部最優(yōu)的情況。 為降低局部最優(yōu)對(duì)算法尋優(yōu)能力的影響, 引入柯西變異策略對(duì)當(dāng)前最優(yōu)個(gè)體進(jìn)行擾動(dòng), 以確保算法能順利跳出局部極值區(qū)。 柯西變異源自于柯西分布, 柯西分布函數(shù)表達(dá)式如下:
將柯西變異算子引入NGO 算法中, 充分利用其擾動(dòng)能力調(diào)整最優(yōu)蒼鷹個(gè)體的目標(biāo)函數(shù)值, 表達(dá)式如下:
式中,Cauchy(0, 1) 為標(biāo)準(zhǔn)柯西分布函數(shù);Xbest表示最優(yōu)蒼鷹個(gè)體的目標(biāo)函數(shù)值。
1.2.3 引入非線性遞增權(quán)重
為降低NGO 算法迭代后期最優(yōu)個(gè)體對(duì)種群中其他個(gè)體的吸引力[12], 引入一種非線性遞增權(quán)重β, 如式(10) 所示。 在迭代初期, 較小的β能提升算法的全局搜索能力。 而在迭代后期, 較大的β能加快算法的收斂速度。 新的位置更新公式如式(11) 所示:
式中,T為最大迭代次數(shù)。
為驗(yàn)證INGO 算法的有效性, 選取Schwefel 函數(shù)和Rastrigin 函數(shù)作為測(cè)試函數(shù)進(jìn)行性能測(cè)試, 并與粒子群優(yōu)化算法 (particle swarm optimization,PSO)、 灰狼優(yōu)化算法 (grey wolf optimization,GWO)、 鯨魚(yú)優(yōu)化算法 ( whale optimization algorithm, WOA) 和標(biāo)準(zhǔn)NGO 算法進(jìn)行對(duì)比。Schwefel 函數(shù)為單峰值函數(shù), 有唯一最小值0, 但存在很多局部極小值, 通常用來(lái)測(cè)試算法跳出局部最優(yōu)的能力, 表達(dá)式為:
Rastrigin 函數(shù)為多峰值函數(shù), 同樣具有很多局部極小值, 有唯一最小值0, 可用來(lái)測(cè)試算法的全局開(kāi)發(fā)能力, 表達(dá)式如式(13) 所示:
對(duì)這兩個(gè)測(cè)試函數(shù)進(jìn)行尋優(yōu)測(cè)試, 最大迭代次數(shù)Tmax=1 000, 維數(shù)d=30, 測(cè)試結(jié)果如圖2、 圖3和表1 所示。
表1 五種優(yōu)化算法尋優(yōu)結(jié)果比較
圖2 f1 (x ) 尋優(yōu)過(guò)程
圖3 f2 (x ) 尋優(yōu)過(guò)程
由圖2、 圖3 和表1 可知, 對(duì)于測(cè)試函數(shù)f1(x) , 改進(jìn)后的INGO 算法迭代74 次找到最優(yōu)值0, 其余4 種算法均未達(dá)到最優(yōu)值; 對(duì)于測(cè)試函數(shù)f2(x) , INGO 算法僅用4 次迭代尋找到最優(yōu)值0,明顯快于其余4 種算法。 以上結(jié)果表明改進(jìn)后的INGO 算法相對(duì)于其他4 種算法在收斂速度、 收斂精度和尋優(yōu)能力上表現(xiàn)最佳, 驗(yàn)證了改進(jìn)策略的有效性。
極限學(xué)習(xí)機(jī)(extreme learning machine, ELM)以單隱層前向神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)改進(jìn)而來(lái), 結(jié)構(gòu)相較于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更加簡(jiǎn)易, 有效地提升了算法性能[13]。 ELM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖4 ELM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
假設(shè)有n個(gè)訓(xùn)練樣本(xi,yi), 其中xi為輸入,yi為輸出,i=1, 2, 3, …,n。 對(duì)于一個(gè)隱含層節(jié)點(diǎn)數(shù)為K, 激活函數(shù)為g(x) 的ELM 神經(jīng)網(wǎng)絡(luò), 其矩陣表述為:
式中,H為ELM 隱含層輸出矩陣;T為訓(xùn)練樣本真實(shí)值所構(gòu)成的矩陣;β為隱含層節(jié)點(diǎn)與輸出層之間的權(quán)值矩陣;ωi為第i個(gè)隱含層節(jié)點(diǎn)與輸入層節(jié)點(diǎn)之間的權(quán)值;bi為第i個(gè)隱含層節(jié)點(diǎn)的閾值。
通過(guò)求解式(13) 的最小范數(shù)最小二乘解,可得到最優(yōu)權(quán)值β*。 最優(yōu)權(quán)值求解公式為:
式中,H+為矩陣H的Moore-Penrose 廣義逆變換。
為進(jìn)一步提升ELM 的學(xué)習(xí)能力和泛化性,Huang 等人將核函數(shù)思想引入ELM, 構(gòu)造出一種新的核極限學(xué)習(xí)機(jī)(KELM)。 核函數(shù)由于具有良好的非線性映射能力, 使得KELM 性能更加穩(wěn)定且泛化能力更加出色[14]。 基于Mercer's 條件定義可得:
式中, 由核函數(shù)矩陣ΩELM替代ELM 中的隨機(jī)矩陣HHT;h(x) 為ELM 神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)輸出函數(shù);K(xi,xj) 為核函數(shù), 合適的核函數(shù)對(duì)于KELM 的性能有著極大的提升, 常用的核函數(shù)有徑向基(radial basis function, RBF) 核函數(shù)、 多項(xiàng)式核(polynomial, Poly) 函數(shù)和線性核函數(shù)等。 RBF 作為典型的局部型核函數(shù)具有較強(qiáng)的學(xué)習(xí)能力, 但泛化能力較弱; 多項(xiàng)式核函數(shù)為全局型核函數(shù), 學(xué)習(xí)能力較弱但泛化能力強(qiáng)[15]。 為進(jìn)一步提升KELM的學(xué)習(xí)能力和泛化性, 將RBF 和Poly 核函數(shù)加權(quán)組合成混合核函數(shù)[16], 表達(dá)式為:
式中,σ為RBF 核函數(shù)的寬度參數(shù);c和d為Poly核函數(shù)的核參數(shù);μ為兩個(gè)核函數(shù)間的權(quán)重系數(shù)。
將單位矩陣E和正則化系數(shù)C加入ELM 神經(jīng)網(wǎng)絡(luò)的隨機(jī)矩陣HHT的主對(duì)角線元素上, 此時(shí)ELM 神經(jīng)網(wǎng)絡(luò)輸出權(quán)值β*計(jì)算公式為:
基于式 (17)、 (18) 可求得HKELM 的輸出為:
由于HKELM 模型中參數(shù)較多, 為避免人工設(shè)置初始參數(shù)誤差大, 利用INGO 對(duì)HKELM 模型的正則化系數(shù)C、 混合核函數(shù)參數(shù)σ、c、d和μ進(jìn)行優(yōu)化。
為提高HKELM 的分類性能, 利用INGO 算法對(duì)HKELM 模型的初始參數(shù)進(jìn)行尋優(yōu), 以得到更加準(zhǔn)確可靠的變壓器故障診斷結(jié)果。 INGO-HKELM變壓器故障診斷模型流程如圖5 所示。
圖5 基于INGO-HKELM 的變壓器故障診斷流程
該流程主要分為以下4 個(gè)步驟:
1) 收集以H2、 CH4、 C2H4、 C2H2、 C2H6體積分?jǐn)?shù)作為特征量的變壓器故障樣本數(shù)據(jù)集, 根據(jù)以上氣體之間的相對(duì)比值構(gòu)建候選特征集, 對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理, 劃分測(cè)試集和訓(xùn)練集。
2) 利用ReliefF 算法計(jì)算各候選特征的權(quán)重值并排序, 選擇出最優(yōu)輸入特征集。
3) 利用改進(jìn)后的INGO 算法對(duì)HKELM 模型的初始參數(shù)進(jìn)行優(yōu)化。
4) 將步驟2) 中所選特征作為INGO-HKELM模型的輸入進(jìn)行故障診斷。
按照DL/T 722—2014 《變壓器油中溶解氣體分析和判斷導(dǎo)則》, 將變壓器運(yùn)行狀態(tài)分為低溫過(guò)熱、 中溫過(guò)熱、 高溫過(guò)熱、 局部放電、 低能放電、高能放電和正常這7 種類型, 類別編號(hào)為1—7。文中試驗(yàn)所用數(shù)據(jù)來(lái)源于文獻(xiàn)[17] 和[18], 共計(jì)248 組變壓器DGA 數(shù)據(jù), 按照7 ∶3 的比例劃分為訓(xùn)練集和測(cè)試集。 變壓器運(yùn)行狀態(tài)編號(hào)及樣本分布見(jiàn)表2。
表2 運(yùn)行狀態(tài)編號(hào)及樣本分布
目前, 大部分變壓器故障診斷方法都是采用H2、 CH4、 C2H4、 C2H2、 C2H6等主要特征氣體或部分氣體之間的相對(duì)比值作為輸入特征量。 由于變壓器故障類型與特征氣體濃度之間映射關(guān)系極其復(fù)雜, 為進(jìn)一步挖掘故障表征與故障類型之間的聯(lián)系, 本文以上述5 種氣體為基礎(chǔ), 參照文獻(xiàn)[19]、 [20] 構(gòu)建變壓故障特征集, 見(jiàn)表3, 其中C1 =CH4+C2H4+C2H2+C2H6, C2 =CH4+C2H4+C2H2, ALL=H2+CH4+C2H4+C2H2+C2H6。
表3 變壓器故障候選特征及編號(hào)
合理的輸入特征能極大地提升診斷準(zhǔn)確率, 為獲取包含信息豐富、 冗余度小和維度低的輸入特征集, 選用ReliefF 算法進(jìn)行輸入特征子集的選擇。ReliefF 是一種快速高效的過(guò)濾式特征選擇算法,通過(guò)計(jì)算每個(gè)特征的權(quán)重表示特征對(duì)于分類的作用, 如圖6 所示, 權(quán)重值越大, 對(duì)于分類作用越大。
圖6 特征權(quán)重柱狀圖
將權(quán)重值由大到小排序并選取前m個(gè)最大特征作為輸入特征,m值與分類正確率的關(guān)系如圖7所示。 由圖7 可知, 當(dāng)m為7 時(shí)(輸入特征編號(hào)為11、 17、 10、 8、 19、 13、 12), 故障診斷率最高為86.34%, 故選取前7 維特征作為輸入特征。
圖7 不同m 取值的故障診斷模型正確率對(duì)比圖
求取INGO-HKELM 模型對(duì)測(cè)試集診斷結(jié)果的準(zhǔn)確率, 圖8 為診斷結(jié)果的混淆矩陣, 表4 給出了INGO-HKELM 故障診斷模型的評(píng)價(jià)指標(biāo)。 由圖8和表4 可知, 所提INGO-HKELM 模型對(duì)變壓器7種運(yùn)行狀態(tài)的查全率和查準(zhǔn)率均在80%以上; 經(jīng)計(jì)算, 故障診斷準(zhǔn)確率為93.2%, 表明所提模型具有良好的診斷性能。
表4 INGO-HKELM 模型評(píng)價(jià)指標(biāo)%
圖8 INGO-KHELM 故障診斷結(jié)果
將經(jīng)過(guò)ReliefF 篩選后的特征作為輸入特征,以分類準(zhǔn)確率為目標(biāo)函數(shù), 利用INGO、 NGO 和PSO 算法對(duì)HKELM 的初始參數(shù)進(jìn)行優(yōu)化, 得到最優(yōu)參數(shù)。 此外, 為驗(yàn)證INGO-HKELM 故障診斷模型的優(yōu)越性, 選取GWO-KELM、 SMA-SVM、PSO-DELM 三種優(yōu)化型診斷模型進(jìn)行對(duì)比, 上述模型診斷結(jié)果見(jiàn)表5。 上述所有模型迭代次數(shù)均為50 次, 初始種群為30。
表5 不同診斷模型故障診斷結(jié)果對(duì)比
由表5 可知, 文中所提INGO 優(yōu)化HKELM 模型相較于PSO 和NGO 優(yōu)化HKELM 模型具有更高的診斷準(zhǔn)確率和更快的收斂速度; 與GWO -KELM、 SMA-SVM、 PSO-DELM 三種優(yōu)化型診斷模型相比, 文中所提出的INGO-HKELM 模型同樣具有更高的診斷準(zhǔn)確率和更快的收斂速度, 表明所提出的INGO-HKELM 變壓器故障診斷模型收斂速度快、 診斷精度高, 具有一定的優(yōu)勢(shì)。
為說(shuō)明文中所提變壓器故障診斷模型的優(yōu)越性, 與基于DGA 的IEC 三比值法進(jìn)行診斷結(jié)果對(duì)比, 對(duì)同一測(cè)試集進(jìn)行故障診斷, 診斷結(jié)果見(jiàn)表6。 由本文所提方法的故障診斷正確率為93.2%,IEC 三比值法診斷正確率為70%, 但I(xiàn)EC 三比值法對(duì)于高溫過(guò)熱狀態(tài)的識(shí)別優(yōu)于文中所提方法, 其余運(yùn)行狀態(tài)的識(shí)別文中所提方法均優(yōu)于IEC 三比值法。 綜合來(lái)看, 文中所提出的變壓器故障診斷模型相較于IEC 三比值法具有更好的診斷性能。
表6 不同方法診斷準(zhǔn)確率對(duì)比%
對(duì)文獻(xiàn)[21] 所提供實(shí)例進(jìn)行分析, 某變電站500 kV 主變壓器發(fā)生故障, 油色譜數(shù)據(jù)見(jiàn)表7。
表7 某500 kV 主變油色譜數(shù)據(jù)μL/L
利用文中所提出的INGO-HKELM 變壓器故障診斷模型對(duì)表7 數(shù)據(jù)進(jìn)行故障識(shí)別, 得出該主變壓器發(fā)生高溫過(guò)熱故障的結(jié)論, 與實(shí)際故障相符, 驗(yàn)證了INGO-HKELM 模型的準(zhǔn)確性。
本文提出基于INGO-HKELM 的變壓器故障診斷方法, 通過(guò)對(duì)比分析, 得出如下結(jié)論:
1) 在標(biāo)準(zhǔn)北方蒼鷹算法的基礎(chǔ)上引入混沌映射、 柯西變異策略和非線性特征權(quán)重三種策略對(duì)其進(jìn)行改進(jìn), 結(jié)果表明, 改進(jìn)策略有效提升了算法的收斂速度和精度, 證明改進(jìn)方法的有效性。
2) 利用ReliefF 算法對(duì)變壓器故障數(shù)據(jù)進(jìn)行特征優(yōu)選, 去除了冗余信息。 使用改進(jìn)后的北方蒼鷹算法優(yōu)化HKELM 的參數(shù), 提高了HKELM 的診斷準(zhǔn)確率和泛化能力。
3) 通過(guò)變壓器實(shí)際故障數(shù)據(jù)驗(yàn)證表明, 文中所提出的INGO-HKELM 模型相較于其他故障診斷模型具有更高的診斷準(zhǔn)確率和收斂速度。
本文所提出的INGO-HKELM 模型有效提高了故障診斷準(zhǔn)確率, 但在輸入特征的選擇方面仍有改進(jìn)的空間, 后續(xù)可研究CO、 CO2對(duì)故障診斷的影響。