郭 林,唐 晶,唐黎哲,詹彥豪,李 飛
(1.國(guó)家能源投資集團(tuán) 朔黃鐵路發(fā)展有限責(zé)任公司,河北 肅寧 062350;2.株洲中車時(shí)代電氣股份有限公司,湖南 株洲 412001)
牽引變壓器是機(jī)車電力系統(tǒng)電力變換及傳輸?shù)闹匾O(shè)備之一。及時(shí)有效地排查、定位及診斷牽引變壓器故障,對(duì)于機(jī)車的安全運(yùn)行至關(guān)重要[1]。然而在長(zhǎng)期使用過(guò)程中,變壓器由于其自身耦合結(jié)構(gòu)且受電、熱及外界復(fù)雜環(huán)境的影響,很可能會(huì)導(dǎo)致故障診斷結(jié)果的準(zhǔn)確程度達(dá)不到工程要求。因此,如何對(duì)變壓器進(jìn)行故障診斷與健康管理受到相關(guān)學(xué)者及工程技術(shù)人員的廣泛關(guān)注。
牽引變壓器在運(yùn)行過(guò)程中會(huì)受到多種因素影響,包括內(nèi)部高溫循環(huán)、高能輻射、電磁耦合及機(jī)械振動(dòng)等,這些因素會(huì)導(dǎo)致變壓器油裂解,產(chǎn)生H2, CH4,C2H6, C2H4及C2H2等多種氣體。根據(jù)油中不同氣體含量,可以判斷變壓器的故障類別、故障位置及故障程度。目前一般采用油中溶解氣體分析(dissolved gas analysis, DGA)技術(shù)[2-3]對(duì)變壓器內(nèi)部潛在故障或已出現(xiàn)的故障進(jìn)行診斷。大量實(shí)驗(yàn)及研究表明,目前工程應(yīng)用中基于DGA技術(shù)形成的三比值法[4]、Rogers法[5]等傳統(tǒng)方法具有編碼不全、編碼邊界過(guò)于絕對(duì)及故障診斷不全等缺點(diǎn),因此難以診斷變壓器故障的確切類型。
隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展及普及應(yīng)用,將該技術(shù)運(yùn)用于變壓器故障類型診斷中也漸漸成為研究與應(yīng)用重點(diǎn)[6-7]。文獻(xiàn)[8]對(duì)傳統(tǒng)的反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)優(yōu)設(shè)計(jì),并將其運(yùn)用到工業(yè)遙感測(cè)控裝備變頻器故障診斷場(chǎng)景中,結(jié)果表明文中模型能夠提高故障類型診斷的準(zhǔn)確率,并在較小數(shù)量樣本范圍內(nèi)取得了較好的效果。文獻(xiàn)[9]采用可隨訓(xùn)練過(guò)程變化的學(xué)習(xí)率以提高算法穩(wěn)定性,剔除訓(xùn)練中較大網(wǎng)絡(luò)誤差對(duì)應(yīng)的參數(shù)學(xué)習(xí)輪次以解決網(wǎng)絡(luò)振蕩過(guò)大的問(wèn)題,并結(jié)合多種優(yōu)化方法,在一定程度上解決了反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network, BPNN)局部最優(yōu)、收斂較慢問(wèn)題,對(duì)比不同智能算法的診斷結(jié)果表明,文中改進(jìn)的BP算法精度更高。文獻(xiàn)[10]將傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行并行化實(shí)現(xiàn),利用相關(guān)量值方法及距離函數(shù)并結(jié)合插值方法選取并擴(kuò)充訓(xùn)練樣本,最后采用spark分布式集群對(duì)不同訓(xùn)練集進(jìn)行并行訓(xùn)練,結(jié)果表明,該算法在效率及效果方面更佳。文獻(xiàn)[11]為了解決目前卷積神經(jīng)網(wǎng)絡(luò)對(duì)于電主軸軸承故障診斷過(guò)擬合問(wèn)題,在傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,引入Dropout思想,對(duì)軸承數(shù)據(jù)進(jìn)行降維處理,從而使模型能學(xué)習(xí)到數(shù)據(jù)內(nèi)在更具代表性的特征,并解決了深度神經(jīng)網(wǎng)絡(luò)可能出現(xiàn)的過(guò)擬合問(wèn)題,結(jié)果表明,相比基于BPNN、卷積神經(jīng)網(wǎng)絡(luò) (convolutional neural networks,CNN)及CNN疊加L2正則化(CNN+L2)模型,該方法的診斷結(jié)果更優(yōu)。文獻(xiàn)[12]采用傳統(tǒng)三比值方法對(duì)變壓器實(shí)驗(yàn)數(shù)據(jù)進(jìn)行編碼及特征建立,分別采用BPNN 及 FNN(factorization machine supported neural network)對(duì)電力變壓器常見(jiàn)故障進(jìn)行診斷,結(jié)果表明,相比于傳統(tǒng)的診斷方法,文中的方法具有更優(yōu)越的性能。文獻(xiàn)[13]提出當(dāng)傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型達(dá)到一定深度時(shí),模型會(huì)出現(xiàn)過(guò)擬合現(xiàn)象,即模型性能隨深度的增加而降低,為此,在增加神經(jīng)網(wǎng)絡(luò)深度的同時(shí)采用堆疊多個(gè)殘差網(wǎng)絡(luò)模塊的方法,將恒等映射轉(zhuǎn)化為殘差映射,從而提升了診斷準(zhǔn)確率。文獻(xiàn)[14]對(duì)氣體特征信息進(jìn)行融合,并在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上嵌入支持向量機(jī)(support vector machine, SVM)模型對(duì)故障進(jìn)行分類,結(jié)果表明,相較于BPNN,該模型診斷準(zhǔn)確率有較大提升。
為實(shí)現(xiàn)對(duì)變壓器高精度、智能化的故障診斷,本文以某型機(jī)車牽引變壓器中不同狀態(tài)下油氣成分?jǐn)?shù)據(jù)為依據(jù),提出了一種基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的牽引變壓器故障診斷模型。其對(duì)變壓器中油氣特征信息進(jìn)行多重融合,并在傳統(tǒng)BPNN的基礎(chǔ)上,在深層隱藏層中嵌入SVM分類器,以提取較深層隱藏層的特征向量作為SVM分類器的訓(xùn)練集;并引入殘差網(wǎng)絡(luò)Resnet思想,在加深神經(jīng)網(wǎng)絡(luò)層數(shù)的同時(shí)疊加多個(gè)殘差塊。與傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)相比,該模型層數(shù)雖更深但不會(huì)引起過(guò)擬合,因此能處理更大規(guī)模的數(shù)據(jù),且大大提升了牽引變壓器故障診斷的準(zhǔn)確率。
改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型是在傳統(tǒng)BPNN基礎(chǔ)上,引入ResNet殘差網(wǎng)絡(luò)模塊思想,并在第Ⅳ和第Ⅴ殘差模塊中嵌入SVM分類器,其從權(quán)重角度篩選對(duì)診斷結(jié)果準(zhǔn)確率更具影響的特征向量。
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,網(wǎng)絡(luò)越關(guān)注輸入數(shù)據(jù)的“關(guān)鍵信息”,越能區(qū)分重要數(shù)據(jù)和非重要數(shù)據(jù),網(wǎng)絡(luò)的性能也就越優(yōu)。在神經(jīng)網(wǎng)絡(luò)中,各個(gè)特征向量的權(quán)重值一方面能體現(xiàn)特征向量對(duì)輸出結(jié)果的影響,另一方面,權(quán)重值也代表著特征向量對(duì)輸出結(jié)果與標(biāo)簽結(jié)果誤差減小的重要程度(即權(quán)重值越大,表示網(wǎng)絡(luò)學(xué)習(xí)該特征的信息越能幫助減小輸出值與標(biāo)簽值的誤差,權(quán)重值越小,表明該特征向量的影響越?。?,需要花費(fèi)更多的資源進(jìn)行網(wǎng)絡(luò)訓(xùn)練。因此,如何讓網(wǎng)絡(luò)能夠關(guān)注到這些權(quán)重值更大的特征也尤為重要。本文主要采用SVM分類器提取不同特征向量的特征值。
SVM的主要思想是找到使數(shù)據(jù)集正反例之間隔離邊緣最大的超平面作為決策平面,兩點(diǎn)集的邊緣點(diǎn)距離此平面距離最大。定義決策平面為
式中:w——權(quán)重向量;b——偏置向量;x——數(shù)據(jù)點(diǎn)。
SVM實(shí)質(zhì)上是解決如下優(yōu)化問(wèn)題:
再通過(guò)拉格朗日公式和KKT條件等數(shù)學(xué)運(yùn)算得到
式中:XT——待測(cè)實(shí)例向量轉(zhuǎn)置;a0,b0——求解出的固定值。
當(dāng)神經(jīng)網(wǎng)絡(luò)模型達(dá)到一定深度時(shí),模型的診斷性能會(huì)趨于飽和而無(wú)法進(jìn)一步提升,甚至?xí)霈F(xiàn)診斷性能隨網(wǎng)絡(luò)層數(shù)的增加而降低的現(xiàn)象。殘差網(wǎng)絡(luò)(圖1)可以將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的恒等映射轉(zhuǎn)換為殘差學(xué)習(xí),這樣能很好地解決因網(wǎng)絡(luò)層數(shù)增加而帶來(lái)的梯度消失、梯度爆炸等問(wèn)題。
圖1 殘差網(wǎng)絡(luò)模塊Fig.1 ResNet module
第一層殘差網(wǎng)絡(luò)首先對(duì)其輸入數(shù)據(jù)x進(jìn)行加權(quán)、偏置及ReLu激活函數(shù)計(jì)算,獲得輸出F1(x),則第二層殘差網(wǎng)絡(luò)輸出F2(x)如下:
式中:w2——第二層網(wǎng)絡(luò)權(quán)重;b2——第二層網(wǎng)絡(luò)偏置。
殘差網(wǎng)絡(luò)通過(guò)加上前一層殘差網(wǎng)絡(luò)的輸入數(shù)據(jù),使當(dāng)前層能獲取未經(jīng)前一層網(wǎng)絡(luò)處理的數(shù)據(jù)原始特征,實(shí)現(xiàn)殘差學(xué)習(xí),進(jìn)而保證模型能更好地提取特征信息。
訓(xùn)練集D={X,Y}={(x1,y1), …, (xm,ym)},xi∈Rh,yi∈Rf,i∈{1, 2, 3, …,m}。其中,訓(xùn)練集樣本的特征屬性維度為h,輸出向量維度為f,i表示訓(xùn)練集中訓(xùn)練樣本組序號(hào)。
設(shè)wjk,l表示從第(l-1)層的第k個(gè)神經(jīng)元到第l層的第j個(gè)神經(jīng)元的連接權(quán)重;bj,1表示在第l層的第j個(gè)神經(jīng)元的偏置;aj,l表示在第l層的第j個(gè)神經(jīng)元的激活值;σ為ReLu激活函數(shù)。訓(xùn)練集共被分成f類,具體操作步驟如下:
(1)隱藏層第l層的第j個(gè)神經(jīng)元的輸出為
式中:S——隱藏層第(l-1)層神經(jīng)元的個(gè)數(shù);al——隱藏層中第l層輸出的特征向量。
以殘差網(wǎng)絡(luò)模塊Ⅴ和Ⅵ為例,當(dāng)兩個(gè)隱藏層在同一殘差網(wǎng)絡(luò)模塊中時(shí),輸出的特征向量al為F2,5(x);當(dāng)兩個(gè)隱藏層在不同的網(wǎng)絡(luò)模塊中時(shí),經(jīng)過(guò)式(4)計(jì)算得到輸出的特征向量al=R[w3·F3,5(x)+b5+F4(x)],即為模塊的輸出 [w3,F3,5(x)+b5]加上模塊的輸入F4(x)。
圖2 改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的模型Fig.2 Improved BP neural network module
誤差的反向傳播過(guò)程如式(6)所示,根據(jù)隨機(jī)梯度下降法更新w和b。
(2)提取改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)中第Ⅴ模塊和第Ⅵ模塊的特征向量a11,a12及其對(duì)應(yīng)的類別標(biāo)簽組成新的訓(xùn)練集 (a11,Y), (a12,Y)。
(3)使用步驟(2)中組成的新的訓(xùn)練集分別訓(xùn)練模型TSVM1和TSVM2,訓(xùn)練完成的模型為SVM1和SVM2。
(4)將驗(yàn)證集數(shù)據(jù)(Xval,Yval)輸入到網(wǎng)絡(luò)中分別提取第Ⅴ殘差模塊和第Ⅵ殘差模塊的特征向量va11和va12,然后分別使用SVM1和SVM2對(duì)特征向量va11和va12進(jìn)行診斷,輸出對(duì)應(yīng)的準(zhǔn)確率P11和P12。
(5)若P11>P12,根據(jù)式(7)計(jì)算出特征向量的權(quán)重。
式中:w11,w12——表示準(zhǔn)確率,分別為P11及P12的特征向量權(quán)重;μ——對(duì)應(yīng)平均值;σ2——方差。
(6)根據(jù)步驟(5)得到的新權(quán)重w′11和w′12,將步驟(2)中第Ⅴ和第Ⅵ模塊的特征向量a11,a12更新為w′11a11和w′12a12。
(7)根據(jù)輸出層的第i組樣本預(yù)測(cè)輸出zi與第i組樣本期望輸出yi,計(jì)算誤差ε,見(jiàn)式(8)。
本文所提出的變壓器故障診斷方法主要基于1.3節(jié)改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型,并通過(guò)插值方法對(duì)訓(xùn)練集、測(cè)試集中的正負(fù)樣本進(jìn)行擴(kuò)容及采用Euler距離及Pearson系數(shù)及數(shù)據(jù)隨機(jī)抽樣分塊緩解了不平衡數(shù)據(jù)帶來(lái)的問(wèn)題,最后在分布式平臺(tái)進(jìn)行并行化訓(xùn)練后獲得的不同性能的子分類器進(jìn)行投票決策,實(shí)現(xiàn)變壓器故障診斷。
當(dāng)變壓器存在潛在性故障甚至出現(xiàn)故障現(xiàn)象時(shí),隨著變壓器內(nèi)油溫升高,變壓器內(nèi)釋放的氣體種類會(huì)增多,油中溶解的各類氣體含量會(huì)有明顯變化,導(dǎo)致不同的溶解氣體含量存在很大差異。因此,直接從現(xiàn)場(chǎng)獲取數(shù)據(jù)中同一種氣體濃度的波動(dòng)范圍較大,不同種氣體的濃度分散性較大。為了解決該問(wèn)題,本文在故障特征選取方面,不僅僅包含5種氣體(即 H2, CH4, C2H6, C2H4, C2H2)含量原始特征,而且還結(jié)合傳統(tǒng)DGA方法(IEC法、Royers法和Duval法),在原始特征的基礎(chǔ)上,新增重新構(gòu)造6種比值型特征向量,氣體量比值型涉及CH4/H2,C2H2/C2H4, C2H4/C2H6, C2H6/CH4, C2H2/( C2H2+ C2H4+CH4), C2H4/( C2H2+ C2H4+CH4)。比值型特征值,一方面能讓神經(jīng)網(wǎng)絡(luò)模型學(xué)習(xí)到更多、更深層次的故障特征信息;另一方面,結(jié)合后續(xù)的數(shù)據(jù)歸一化方法,能夠緩解數(shù)據(jù)差異性較大的問(wèn)題。
為了減小不同特征氣體含量差別,對(duì)特征氣體含量值及特征氣體含量比值進(jìn)行歸一化處理:
式中:xi為氣體含量值或氣體含量比值的原始量,i∈{1, 2, 3. …,n};xmax,i,xmin,i分別為訓(xùn)練集中氣體含量或含量比值的最大值和最小值;xnew,i為歸一化處理后的值。需注意的是,測(cè)試集數(shù)據(jù)同樣需要進(jìn)行歸一化處理。
變壓器運(yùn)行狀態(tài)主要分為以下6種:正常(NC)、低能放電(LE)、高能放電(HE)、中低溫過(guò)熱(LT)、高溫過(guò)熱(HT)以及局部放電(LA)。為了方便結(jié)果診斷,對(duì)6種狀態(tài)分別進(jìn)行獨(dú)熱編碼,如表1所示。
表1 變壓器狀態(tài)編碼Tab. 1 Codes of transformer state
神經(jīng)網(wǎng)絡(luò)最終的分類能力與許多因素有關(guān),但在其他因素相同的情況下,可靠的訓(xùn)練數(shù)據(jù)能提升分類器的判斷能力。為了進(jìn)一步減小不同氣體含量值數(shù)據(jù)差異,分別采用Euler距離和Pearson系數(shù)兩種度量指標(biāo)選取訓(xùn)練數(shù)據(jù)。
(1)Euler距離為常用量度,用來(lái)計(jì)算向量之間的自然長(zhǎng)度,其計(jì)算公式如下:
式中:rED(xi,xj)代表第k維向量xik與xjk的歐氏距離;xi及xj表示數(shù)據(jù)點(diǎn);m是向量的維度;
(2) Pearson系數(shù)為形態(tài)相似量,解決了協(xié)方差受量綱影響的問(wèn)題,其取值范圍為[0, 2],計(jì)算公式如下:
式中:rPCCs(xi,xj)代表第k維向量xik與xjk的Pearson系數(shù)。
按照式(10)和式(11)分別計(jì)算訓(xùn)練數(shù)據(jù)的Euler距離及Pearson系數(shù),取兩類指標(biāo)都為最小值的數(shù)據(jù)作為該類的訓(xùn)練數(shù)據(jù)。
在神經(jīng)網(wǎng)絡(luò)分布式訓(xùn)練時(shí),需要將不同的訓(xùn)練集分配到各個(gè)子分類器中。本文分別采用3次Hermita多項(xiàng)式插值方法對(duì)原始數(shù)據(jù)進(jìn)行插值擴(kuò)容。圖3示出3次Hermita多項(xiàng)式插值后的數(shù)據(jù)。
圖3 3次Hermita多項(xiàng)式插值Fig.3 Cubic Hermita polynomial interpolation
采用隨機(jī)抽樣的方法,將插值擴(kuò)容后訓(xùn)練樣本分為3個(gè)訓(xùn)練子樣本,全部的驗(yàn)證集需要放入每個(gè)子樣本中,并按照