童 旸, 黃文禮, 李 磊, 晏雨晴
(安徽南瑞繼遠(yuǎn)電網(wǎng)技術(shù)有限公司,安徽 合肥 230088)
電力變壓器在輸電、變電和配電過程中扮演著至關(guān)重要的角色,確保其正常運(yùn)行是保障電力傳輸與供給安全的關(guān)鍵環(huán)節(jié)[1-4]。隨著變壓器運(yùn)行時(shí)間的增長(zhǎng),由于運(yùn)行負(fù)荷、設(shè)備老化以及絕緣油渾濁等因素的影響,變壓器的工況不可避免地受到影響,可能出現(xiàn)鐵心松動(dòng)、繞組變形、匝間短路、直流偏磁和異常放電等故障[2,4-5]。其中,異常放電是變壓器常見故障中危險(xiǎn)系數(shù)較高的情況之一。多種異常因素,如過負(fù)荷、絕緣油污染、繞組故障和散熱器故障等,都可能導(dǎo)致異常放電的發(fā)生[5-7]。異常放電初期局部持續(xù)發(fā)生,隨著放電次數(shù)的增多,產(chǎn)生大量熱能,導(dǎo)致介質(zhì)溫度升高,甚至局部碳化,可能引發(fā)熱擊穿風(fēng)險(xiǎn),導(dǎo)致變壓器損壞等嚴(yán)重后果[6-7]。因此,及時(shí)準(zhǔn)確地檢測(cè)異常放電對(duì)于變壓器的安全運(yùn)行和整個(gè)電力系統(tǒng)的正常運(yùn)作至關(guān)重要。
傳統(tǒng)的變壓器異常放電監(jiān)測(cè)主要依賴于油色譜的變化觀察,盡管該技術(shù)準(zhǔn)確性較高,但微小的異常放電很難產(chǎn)生足夠觀測(cè)到的化學(xué)性質(zhì)變化,使得該方法難以發(fā)現(xiàn)異常放電的早期跡象。近年來,基于聲紋的變壓器工況異常實(shí)時(shí)監(jiān)測(cè)方法迅速發(fā)展,得益于語音識(shí)別技術(shù)的成熟,利用變壓器在運(yùn)行時(shí)產(chǎn)生的物理振動(dòng)聲音來判斷其工作狀態(tài)成為可能[3,5,8-9]。
目前,大量研究已通過提取采集到的聲音信號(hào)特征來判斷變壓器中存在的各類故障。在特征提取方面,主流研究分為時(shí)域與頻域兩種信號(hào)特征提取方法:基于時(shí)域的提取方式主要包括包絡(luò)曲線與過零率信息[10-11],用于判斷聲音信號(hào)瞬間能量或頻率的變化;基于頻域的提取方式首先使用傅里葉變換[8],將時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào)。由于變壓器正常工作及常見異常缺陷可能發(fā)生的頻帶非常寬,最高甚至可以達(dá)到超聲頻率。因此頻域信號(hào)維度非常大,直接分析將占用大量計(jì)算資源,必須進(jìn)行關(guān)鍵頻率提取與降維操作,一般通過諸如梅爾倒譜系數(shù)(Mel-Frequency Cepstrum Coefficient, MFCC)、線性預(yù)測(cè)系數(shù)(Linear Prediction Coefficient, LPC)以及線性預(yù)測(cè)倒譜系數(shù)(Linear Prediction Cepstrum Coefficient, LPCC)等方式實(shí)現(xiàn)關(guān)鍵聲紋信息提取[12-13]。最后,設(shè)計(jì)聲紋分析算法實(shí)現(xiàn)異常故障聲紋的檢測(cè)與識(shí)別功能。傳統(tǒng)的基于信號(hào)處理與機(jī)器學(xué)習(xí)的分析方法包括支持向量機(jī)(Support Vector Machine, SVM)、隱馬爾可夫模型(Hidden Markov Model, HMM)以及高斯混合模型(Gaussian Mixture Model, GMM)等[14-16]。隨著神經(jīng)網(wǎng)絡(luò)的出現(xiàn)與發(fā)展,后向傳播網(wǎng)絡(luò)(Back Propagation, BP)和深度學(xué)習(xí)網(wǎng)絡(luò)(Deep Neural Network, DNN)也被引入到變壓器分析領(lǐng)域[2,7,17],并取得較好的成果。
目前,常見的變壓器異常故障聲紋如鐵心松動(dòng)、繞組變形等已經(jīng)被證明可以通過聲紋分析獲得較好的檢測(cè)能力[18]。然而,異常放電故障,尤其是準(zhǔn)確識(shí)別輕微的異常放電現(xiàn)象,依然是富有挑戰(zhàn)的課題,其主要原因有如下兩點(diǎn)。首先,異常放電發(fā)生速度極快,通常小于10毫秒,而普遍的變壓器聲紋信號(hào)處理需要進(jìn)行加窗分幀操作,窗體長(zhǎng)度通常選取100毫秒到500毫秒,再對(duì)每幀進(jìn)行快速傅里葉變換獲得頻域信號(hào)。然而,為了捕捉到迅速的異常放電,窗體需要進(jìn)一步縮小到20至50毫秒,這極大增加了需要分析的聲紋幀數(shù)的數(shù)量,而諸如隱馬爾可夫鏈、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)都是時(shí)序處理網(wǎng)絡(luò)[19-20],幀數(shù)的增加必然造成計(jì)算時(shí)間的增加。其次,由于初期的異常放電聲音極易被變壓器本體振動(dòng)聲音淹沒,僅表現(xiàn)為頻域上的微弱變化。目前常見的梅爾倒譜系數(shù)、線性預(yù)測(cè)系數(shù)缺乏對(duì)變壓器實(shí)際工作的聲紋頻率的優(yōu)化,同時(shí)當(dāng)前以循環(huán)神經(jīng)網(wǎng)絡(luò)為代表的異常故障檢測(cè)方法難以兼顧瞬時(shí)微弱變化。因此,我們不僅需要對(duì)異常放電表現(xiàn)特性進(jìn)行有針對(duì)性的特征提取方法設(shè)計(jì),還需要研究一種高精度高敏感度的聲紋特征變化感知分析方法。
本文首先針對(duì)變壓器異常放電的特點(diǎn),即其信號(hào)弱且發(fā)生迅速,結(jié)合關(guān)鍵頻率提取與梅爾系數(shù)提取思想,設(shè)計(jì)了一種基于二維化的關(guān)鍵聲紋特征提取方法。該方法在保留變壓器工頻本征特性的基礎(chǔ)上,實(shí)現(xiàn)了對(duì)微弱異常放電的有效提取,并通過高倍率特征維度壓縮。其次,本文設(shè)計(jì)了一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)[21-22]與視覺轉(zhuǎn)換器(Vision-Transformer,ViT)[23]的混合神經(jīng)網(wǎng)絡(luò)架構(gòu)。該網(wǎng)絡(luò)結(jié)合了CNN的特征提取能力和ViT的自注意力機(jī)制,實(shí)現(xiàn)了對(duì)微弱異常放電的高精度發(fā)現(xiàn)與識(shí)別。最后,本文結(jié)合110 kV變壓器在無載調(diào)壓試驗(yàn)中的實(shí)際放電數(shù)據(jù)進(jìn)行了試驗(yàn)及分析,確定了最佳的變壓器特征提取方法和識(shí)別模型參數(shù)。通過這一綜合方法,本研究為解決變壓器異常放電的弱、快特性提供了有效的解決方案,并在真實(shí)數(shù)據(jù)上取得了令人滿意的試驗(yàn)結(jié)果。
本文采用了接觸式拾音器,該拾音器通過磁吸方式附著于110 kV三相三繞組變壓器外殼,利用變壓器外殼傳導(dǎo)變壓器內(nèi)部振動(dòng)產(chǎn)生的聲紋信號(hào)。相較于非接觸式的槍體麥克風(fēng),該方法的優(yōu)勢(shì)在于省略了變壓器外殼到麥克風(fēng)之間的空氣介質(zhì)傳導(dǎo)過程。這一設(shè)計(jì)不僅避免了空氣介質(zhì)對(duì)微弱聲紋信號(hào)的削弱現(xiàn)象,同時(shí)減少了環(huán)境噪音對(duì)聲音信號(hào)的干擾,從而提升了聲紋拾音器對(duì)微弱信號(hào)的感知能力。
為了證明接觸式拾音器的有效性,分別使用兩種拾音器進(jìn)行信號(hào)采集并進(jìn)行對(duì)比。兩種拾音器的聲紋信號(hào)采樣率同為44.1 kHz,接觸式部署于變壓器放電試驗(yàn)的近端側(cè)與遠(yuǎn)端測(cè)外殼上,分別位于1米和2米的高度。非接觸式部署于距離變壓器0.5米與1米位置。接觸式與非接觸式拾音器在跳閘前后的對(duì)比聲紋時(shí)譜圖如圖2所示。對(duì)比可知,接觸式拾音器在近端1米高度的信號(hào)(a)包絡(luò)最平穩(wěn),2米高度的信號(hào)(b)雖然保持了較高的信號(hào)強(qiáng)度,但是包絡(luò)上出現(xiàn)小幅度的波動(dòng),這可能與靠近變壓器箱體上部,導(dǎo)致采集到了套管等部件的雜音有關(guān)。在變壓器跳閘前,非接觸式拾音器(c)相比接觸式信號(hào)強(qiáng)度明顯更小且包絡(luò)波動(dòng)更大;當(dāng)發(fā)生跳閘之后,接觸式拾音器獲取的信號(hào)(a)強(qiáng)度下降最迅速, 而非接觸式拾音器(d)甚至出現(xiàn)瞬間信號(hào)強(qiáng)度大于跳閘前的情況。這是由于跳閘產(chǎn)生的巨大聲響在封閉場(chǎng)地環(huán)境的空氣介質(zhì)中形成了持久響亮的回聲,并被非接觸式拾音器持續(xù)接收,進(jìn)一步證明了非接觸式變壓器更容易受到周圍環(huán)境的影響。由此,該試驗(yàn)以接觸式拾音器近端1米高度采集到的數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)進(jìn)行分析。
圖1 變壓器拾音器部署圖:右上為接觸式拾音器,右下為非接觸式拾音器Fig.1 Tansformer voice sensor deployment: contact type-the upper right, non-contact-lower right
圖2 不同部署位置下拾音器采集的聲紋對(duì)比Fig.2 Comparison of voiceprints collected by pickups at different deployment positions
本試驗(yàn)數(shù)據(jù)基于110 kV三相三繞組變壓器無載調(diào)壓試驗(yàn)。隨著電壓爬升過程,記錄變壓器內(nèi)部產(chǎn)生的聲紋信號(hào)。圖3展示了隨著電壓的爬升,總體聲音逐漸增大的現(xiàn)象;圖4展示了伴隨的放電頻率逐漸上升的情況。
圖3 電壓爬升變壓器聲紋時(shí)頻譜圖變化趨勢(shì)Fig.3 Spectrum trend when voltage climbs
圖4 電壓爬升過程中異常放電發(fā)生變化趨勢(shì)Fig.4 Discharge occurrence trend when voltage climbs
為了對(duì)采集到的聲紋信號(hào)進(jìn)行量化分析,本文采用了一系列預(yù)處理步驟,包括切分、分幀、加窗以及離散傅里葉變換。處理的輸出將被傳遞到后續(xù)的特征提取模塊,流程圖如圖5所示。在本文中,監(jiān)測(cè)的聲紋信號(hào)每5秒進(jìn)行一次切分,采用交疊分段法進(jìn)行分幀,幀長(zhǎng)設(shè)置為25毫秒,幀移(步長(zhǎng))為0.5幀長(zhǎng),因此每幀約包含1100采樣點(diǎn),幀移為550采樣點(diǎn)。這一處理流程有助于更好地對(duì)聲紋信號(hào)進(jìn)行分析和提取有用的特征。
圖5 變壓器聲紋樣本預(yù)處理流程框圖Fig.5 Block diagram of sample preprocessing flow
為了減少由于分幀對(duì)聲紋信號(hào)的切分而產(chǎn)生的截?cái)嘈?yīng),減輕傅里葉變換時(shí)可能出現(xiàn)的頻率泄露問題,通常會(huì)使用漢明窗函數(shù)進(jìn)行幀的加窗操作。漢明窗的表達(dá)式如下:
(1)
式中:w(n)為窗函數(shù)在第n個(gè)采樣點(diǎn)的取值;L為窗長(zhǎng)。
在進(jìn)行每幀數(shù)據(jù)的快速傅里葉變換(Fast Fourier Transform,FFT)操作后,將時(shí)域信號(hào)轉(zhuǎn)換為頻域信號(hào)。如果將獲得的每一幀頻域信號(hào)視為一個(gè)多維特征向量,對(duì)全部向量進(jìn)行拼接操作,就能夠得到一個(gè)[F,T]的二維特征矩陣,其中F為頻域維度,T為總幀數(shù)。在本試驗(yàn)中,5秒的聲紋數(shù)據(jù),采樣率為44.1 kHz,步長(zhǎng)為12.5毫秒。因此,此時(shí)二維特征矩陣的尺度為22 000×400。由于直接計(jì)算將會(huì)消耗大量計(jì)算資源,因此需要進(jìn)一步優(yōu)化特征提取方法,以降低頻率特征維度。
聲紋分析目前最常用的特征提取方法是梅爾頻率提取法。該方法首先將頻域信號(hào)轉(zhuǎn)換為梅爾頻域,然后劃分成等寬的梅爾頻帶。這一特征提取方法模擬了人耳對(duì)于低頻和高頻的分辨能力,體現(xiàn)了人耳對(duì)于頻率的非線性響應(yīng)。
頻率f向梅爾m的轉(zhuǎn)換計(jì)算式如下:
(2)
式中:Mel(f)為頻率f轉(zhuǎn)換為對(duì)應(yīng)的梅爾頻率的變換函數(shù)。
從梅爾頻率m向頻域轉(zhuǎn)換計(jì)算式如下:
Mel-1(m)=700×(10m/2 595-1)
(3)
式中:Mel-1(m)為梅爾頻率m重新轉(zhuǎn)換成對(duì)應(yīng)的頻率的逆變換函數(shù)。
然而,變壓器的工作頻率主要集中在1 000 Hz以下的50 Hz倍頻。變壓器大部分異常缺陷發(fā)生都會(huì)引起這些頻率的明顯變化,因此在頻率提取中保留該頻帶的分辨率尤為重要。如表1所示,梅爾濾波器組的峰值頻率很難與50 Hz倍頻對(duì)齊,因此使用梅爾濾波器組可能導(dǎo)致1 000 Hz以下關(guān)鍵頻率特征的損失。
表1 不同數(shù)量的三角濾波器峰值頻率(Hz)Tab.1 Peak frequencies of triangular filters with different amounts (Hz)
因此,本文提出將梅爾頻率與關(guān)鍵頻率提取相結(jié)合的方法:
(1) 計(jì)算使用400個(gè)三角濾波器的梅爾濾波器組覆蓋聲紋信號(hào)全頻率時(shí)每個(gè)濾波器峰值頻率;(2)僅計(jì)算峰值在1 000 Hz以上的梅爾濾波器組特征值;(3)對(duì)1 000 Hz及以下頻段使用20 Hz頻帶交疊最大值采樣法,即從1 Hz起,每20 Hz頻帶取其最大值作為采樣特征,頻帶間交疊1/2,共獲得100維特征向量;(4)該100維特征與獲得的梅爾頻率特征拼接,從而得到一個(gè)混合頻率特征。
由(1)獲得的濾波器組中第85個(gè)濾波器峰值為985.3 Hz,第86個(gè)濾波器峰值為1 002.8 Hz,則(2)中僅計(jì)算第86至第400共315個(gè)三角濾波器的梅爾頻率特征值。(3)中獲得1 000 Hz以下100維特征值,(4)中可知,5秒聲紋信號(hào)經(jīng)過該方法可獲得尺度為415×400的二維特征矩陣。該混合特征提取方法在保證變壓器工頻分辨率同時(shí),極大壓縮了頻率維度,提升了后續(xù)計(jì)算資源利用效率。
異常放電與變壓器工作振動(dòng)相比能量較輕微,經(jīng)常不能在時(shí)域譜線中表現(xiàn)出來。傳統(tǒng)的包絡(luò)突變檢測(cè)等方法難以保證檢測(cè)的召回率。同時(shí),異常放電發(fā)生的時(shí)間較短,存在突發(fā)性,與時(shí)序上下文信號(hào)關(guān)聯(lián)性較少。因此,常見的基于時(shí)序的識(shí)別方法,如HMM、RNN和LSTM等,往往不能很好地發(fā)現(xiàn)異常放電現(xiàn)象的發(fā)生。此外,時(shí)序分析方法處理時(shí)間與聲紋樣本切片長(zhǎng)度呈正相關(guān),并呈現(xiàn)指數(shù)上升趨勢(shì),不適合分析較長(zhǎng)的聲紋樣本切片。相反,對(duì)聲紋樣本進(jìn)行二維化分析既兼顧了瞬時(shí)頻率表征與時(shí)序之間的關(guān)系,又得益于卷積神經(jīng)網(wǎng)絡(luò)對(duì)于特征矩陣的出色處理能力,實(shí)現(xiàn)了高效的特征語義提取。Transformer架構(gòu)的識(shí)別網(wǎng)絡(luò)相較于傳統(tǒng)的直接使用全連接層分類網(wǎng)絡(luò)獲得可學(xué)習(xí)分類權(quán)重的方法,使用了一種級(jí)聯(lián)多個(gè)編碼器模塊結(jié)構(gòu)完成對(duì)語義特征進(jìn)一步分析。其中,每個(gè)編碼器模塊中包含一個(gè)多頭注意力模塊,利用自注意力機(jī)制學(xué)習(xí)語義特征中各個(gè)序列化的局部特征與全局語義之間的關(guān)聯(lián)程度。這進(jìn)一步實(shí)現(xiàn)了在較為稀疏的二維特征矩陣中定位到微弱的異常放電特征,從而實(shí)現(xiàn)了高精度的識(shí)別表現(xiàn)。完整網(wǎng)絡(luò)架構(gòu)圖如圖6所示。
圖6 混合網(wǎng)絡(luò)架構(gòu)圖Fig.6 Hybrid network structure
首先,需要對(duì)聲紋特征提取階段獲得的二維特征矩陣進(jìn)行尺度變換,將矩陣的長(zhǎng)寬從415×400擴(kuò)充為448×448,然后轉(zhuǎn)換為可應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)的三維特征張量448×448×1。在設(shè)計(jì)特征語義提取網(wǎng)絡(luò)時(shí),需要解決梯度消失和梯度爆炸的問題,同時(shí)防止微弱的異常放電視覺特征隨著卷積層數(shù)的增加而消失。考慮到這些問題,可采用殘差網(wǎng)絡(luò)架構(gòu)。鑒于整體運(yùn)算速度的考慮,可以選擇使用ResNet18網(wǎng)絡(luò)作為特征語義提取網(wǎng)絡(luò)。該網(wǎng)絡(luò)架構(gòu)如圖7所示。
圖7 修改后的ResNet18網(wǎng)絡(luò)Fig.7 Modified ResNet18 network
首先,ResNet18的特征輸入通道數(shù)從3改為1,以適配二維聲紋特征的通道數(shù)。之后,遵循原版ViT代碼中的ResNet50搭建細(xì)節(jié)(https:∥github.com/google-research/vision_transformer),對(duì)ResNet18進(jìn)行相應(yīng)修改,包括:(1)將原版ResNet18中全部的BatchNorm操作替換為GroupNorm操作;(2)網(wǎng)絡(luò)中所有卷積層使用PyTorch中的標(biāo)準(zhǔn)化權(quán)重的二維卷積(nn.StdConv2d)替換為普通二維卷積(nn.Conv2d)。經(jīng)過ResNet18網(wǎng)絡(luò)后,將得到一個(gè)14×14×512的特征圖,作為后續(xù)Vision-Transformer的輸入。
由于變壓器的異常放電通常會(huì)影響頻譜信息的多個(gè)頻段,即放電語義與特征圖中的多個(gè)局部區(qū)域存在較強(qiáng)的關(guān)聯(lián)性,且不同程度的放電影響力也不盡相同。因此,相較于直接使用全連接層設(shè)計(jì)分類器, Vision-Transformer的自注意力機(jī)制能夠有效實(shí)現(xiàn)語義與特征圖序列的關(guān)聯(lián)對(duì)應(yīng),從而有效提升識(shí)別效果。
CNN+ViT混合網(wǎng)絡(luò)架構(gòu)如圖8所示??紤]到變壓器聲紋特征相對(duì)簡(jiǎn)單,且需要盡可能減少網(wǎng)絡(luò)參數(shù)量以提高處理速度,將ViT網(wǎng)絡(luò)中的編碼器模塊的層數(shù)從原文Base結(jié)構(gòu)的12層縮減到6層。在3.3節(jié)中,我們進(jìn)行了縮減層數(shù)前后的網(wǎng)絡(luò)識(shí)別效果對(duì)比,試驗(yàn)證明該策略能夠有效減少神經(jīng)網(wǎng)絡(luò)收斂所需的時(shí)間,并且保留ViT網(wǎng)絡(luò)在自注意力上的優(yōu)勢(shì)。
圖8 異常放電樣本時(shí)域頻域譜圖:(a)時(shí)域頻域均有明顯變化,(b)時(shí)域無明顯變化頻域有明顯變化,(c)時(shí)域頻域均無明顯變化Fig.8 The time-domain and frequency-domain spectrum of abnormal discharge samples: (a) significant changes in the time-domain and frequency-domain, (b) no obvious changes in the time-domain and obvious changes in the frequency-domain, (c) no obvious changes in the time-domain and frequency- domain
本文的試驗(yàn)數(shù)據(jù)來源于110 kV三相三繞組變壓器無載調(diào)壓放電試驗(yàn)中多路拾音器采集的數(shù)據(jù)。人工從數(shù)據(jù)中篩選出了240條放電樣本和1 200條未放電樣本,其中80%被隨機(jī)選取作為訓(xùn)練樣本,剩余20%作為測(cè)試樣本。每個(gè)樣本的長(zhǎng)度為5秒,采樣頻率為44.1 kHz,經(jīng)過快速傅里葉變換后,頻域信號(hào)僅保留前22 kHz用于后續(xù)分析。圖8展示了三種不同放電強(qiáng)度案例的部分典型樣本。在時(shí)域中,(b)與(c)并沒有明顯的包絡(luò)變化,而(c)在時(shí)頻譜線中也僅出現(xiàn)了幾乎難以察覺的變化,即放電信號(hào)所攜帶的能量極低。因此,當(dāng)放電瞬間的信號(hào)能量與非放電瞬間信號(hào)能量比例越相近時(shí),該異常放電現(xiàn)象越微弱。
本次試驗(yàn)平臺(tái)使用Linux 18.04操作系統(tǒng),CPU型號(hào)Intel i9 9900X, 內(nèi)存32 GB,GPU NVIDIA RTX Titan 24 GB。
為了選取最佳的聲紋特征提取方法,本部分使用了多種不同的聲紋特征提取方法進(jìn)行比較,包括梅爾頻率系數(shù)以及本文提出的二維聲紋特征提取方法。為了找到最佳的二維聲紋特征提取方法,分別使用了不同數(shù)量的梅爾濾波器組進(jìn)行試驗(yàn)。在該試驗(yàn)中,所有單幀特征都會(huì)通過時(shí)序合并的方式轉(zhuǎn)換為二維聲紋特征。為了保證使用統(tǒng)一結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),所有二維聲紋特征都將被縮放為尺度為448×448×1的特征張量,作為識(shí)別神經(jīng)網(wǎng)絡(luò)的輸入。
本次試驗(yàn)的識(shí)別對(duì)比結(jié)果如表2所示。通過識(shí)別率的比較可以發(fā)現(xiàn),所提出的混合特征提取方法整體上要優(yōu)于直接使用梅爾頻率系數(shù)進(jìn)行特征提取方法。同時(shí),無論是梅爾頻率系數(shù)還是所提特征提取方法,增加濾波器組數(shù)量時(shí)都會(huì)提升效果,但濾波器組的增加明顯會(huì)增加運(yùn)算時(shí)間,因此需要在濾波器組數(shù)量與識(shí)別表現(xiàn)之間取得平衡。相較于傳統(tǒng)梅爾頻率特征提取方法,識(shí)別率提升約8.3%。相較于全頻段50 Hz最大值特征提取,識(shí)別用時(shí)減少約0.18秒/樣本。
表2 不同特征提取方法識(shí)別用時(shí)及識(shí)別率對(duì)比Tab.2 Comparison of recognition time and accuracy of different feature extraction methods
為了對(duì)比不同識(shí)別方法對(duì)異常放電聲紋信號(hào)的識(shí)別表現(xiàn),本部分使用多種常見識(shí)別方法進(jìn)行識(shí)別結(jié)果比較,其中包括LSTM、ResNet18、ResNet50以及本文提出的CNN+ViT方法。特征提取方法使用本文所提混合特征提取方法,識(shí)別結(jié)果對(duì)比如表3所示。
表3 不同識(shí)別方法識(shí)別用時(shí)與識(shí)別率對(duì)比Tab.3 Comparison of recognition time and accuracy of different recognition methods
由表3可知,所提方法相較于LSTM網(wǎng)絡(luò),不僅在識(shí)別用時(shí)上減少295秒(約1.02秒/樣本),而且在識(shí)別率上提升18.4%,這說明異常放電與時(shí)序上下文關(guān)聯(lián)度不高,以LSTM為代表的時(shí)序識(shí)別網(wǎng)絡(luò)不適合于該任務(wù)。使用ResNet18與ResNet50網(wǎng)絡(luò)后,識(shí)別率上明顯提升。而單純使用ViT網(wǎng)絡(luò),由于缺乏深度卷積神經(jīng)網(wǎng)絡(luò)的語義提取能力,其提升效果極其有限。所提的CNN+ViT方法識(shí)別率表現(xiàn)得到進(jìn)一步提升,相較于ResNet50識(shí)別用時(shí)僅增加46秒(約0.16秒/樣本),識(shí)別效果提升約4.5%,相較于ViT網(wǎng)絡(luò)識(shí)別效果提升約4.2%,證明基于CNN網(wǎng)絡(luò)的語義特征提取能夠較好的獲取二維化特征中的異常放電特征。
為進(jìn)一步說明2.2節(jié)中本方法模型構(gòu)建時(shí)減少編碼器模塊層數(shù)帶來的效果提升,本部分進(jìn)行了修改前后的模型表現(xiàn)對(duì)比,對(duì)比結(jié)果如表4所示。
表4 編碼器模塊層數(shù)縮減前后模型表現(xiàn)對(duì)比Tab.4 Comparison of the performance of the model before and after the reduction of the number of encoder module
由上表可知,使用6層編碼器模塊的模型在第10次迭代時(shí)達(dá)到了最佳效果,而使用12層編碼器模塊的模型需要到第16次迭代才能達(dá)到相似的識(shí)別率。由此可見,在本任務(wù)中,適當(dāng)減少編碼器層數(shù)不僅能夠減少模型的計(jì)算參數(shù)量,還有助于提高模型達(dá)到最佳效果的收斂速度。需要指出的是,兩個(gè)模型在達(dá)到最佳表現(xiàn)后均出現(xiàn)了下降的趨勢(shì),這可以理解為由于數(shù)據(jù)總量及數(shù)據(jù)特征豐富度的局限性導(dǎo)致的過擬合現(xiàn)象。
本文通過對(duì)采集的110 kV三相三繞組變壓器無載調(diào)壓過程中異常放電聲紋數(shù)據(jù)進(jìn)行分析,提出了一種優(yōu)化的二維聲紋特征提取方式,并構(gòu)建了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)與Transformer架構(gòu)網(wǎng)絡(luò)的混合異常放電特征識(shí)別方法。通過與現(xiàn)有特征提取方法及識(shí)別方法在識(shí)別用時(shí)與識(shí)別率上的對(duì)比,所提出的混合特征提取方法相較于傳統(tǒng)梅爾頻率特征提取方法,識(shí)別率提升約8.3%。與時(shí)序神經(jīng)網(wǎng)絡(luò)LSTM相比,在識(shí)別用時(shí)及識(shí)別率上分別提升1.02秒/樣本和18.2%。相對(duì)于卷積神經(jīng)網(wǎng)絡(luò)ResNet50,識(shí)別率提升4.5%,比ViT網(wǎng)絡(luò)識(shí)別率提升4.2%。試驗(yàn)證明所提出的特征提取方法與識(shí)別方法在保證識(shí)別速度的同時(shí),提高了異常放電聲紋的識(shí)別準(zhǔn)確性。