于達,張瑋,王輝
(1.齊魯工業(yè)大學(山東省科學院)電氣工程與自動化學院,濟南 250353;2.山東大學電氣工程學院,濟南 250061)
在電力系統(tǒng)中,電力變壓器是最重要的設(shè)備之一,電力變壓器的運行狀態(tài)可以直接影響電力系統(tǒng)的供電與安全。據(jù)不完全統(tǒng)計,目前我國在運110 kV及以上的電力變壓器已經(jīng)達到30 000 余臺,總?cè)萘窟_到了3 400 000 MVA[1]。因此變壓器監(jiān)測與故障檢測技術(shù)對電網(wǎng)預防故障的能力與安全穩(wěn)定的運行有著十分重要的意義。
電力變壓器發(fā)生的故障主要以絕緣故障為主,有些非絕緣的原發(fā)故障能夠轉(zhuǎn)變成絕緣故障,導致變壓器發(fā)生絕緣劣化的因素是由多種因素造成的[2-4]。研究顯示,局部放電的異常狀態(tài)是絕緣劣化主要的原因,而且也是絕緣劣化的先兆及顯現(xiàn)的形式[5],所以針對于電力變壓器異常狀態(tài)診斷就顯得極其重要。目前針對變壓器異常與故障診斷的方法主要有油色譜診斷,振動診斷,紅外熱成像診斷,聲學診斷以及光譜診斷[6]。在這些診斷方式中,聲學診斷相較于其他診斷方式擁有裝配方便、診斷速度快、不與設(shè)備直接接觸等優(yōu)點。運用聲音進行異常以及故障診斷的方法大多都是靠有經(jīng)驗的人通過人耳去聽,然后進行診斷。但這種方法人為影響偏大,僅僅適用于比較明顯的故障發(fā)生的狀況。因此運用聲紋自動診斷技術(shù)監(jiān)測變壓器的運行狀態(tài),能夠?qū)⒙曇粼\斷方式的優(yōu)勢充分發(fā)揮出來。目前對于變壓器聲學故障診斷的方法大多都是建立模型、特征提取等方法上,對于將聲音與深度學習相結(jié)合進行識別的方法研究較少,但是這種方法在其他領(lǐng)域取得了優(yōu)異的診斷效果。黎煊等人運用深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)建立模型,并應(yīng)用于識別豬的咳嗽聲,提取聲音的梅爾頻率倒譜系數(shù)(Mel-frequency Cepstral Coefficients,MFCC)與短時能量結(jié)合成1030 維的特征數(shù)據(jù),將此特征數(shù)據(jù)通過DBN 進行學習,通過五折交叉驗證得到的識別的準確率可以達到90%左右[7]。楊豪鴿通過聲音的預處理抽取出MFCC 參數(shù)與伽瑪通頻率倒譜系數(shù)(Gammatone Frequency Cepstrum Coefficient,GFCC)特征組成聲音的特征矢量在Tensorflow 框架下與卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)以及前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Networks,F(xiàn)NN)相結(jié)合,識別平均準確率達到了95%,并擁有較優(yōu)異的魯棒性[8]。戚敏惠采用三元組損失與CNN網(wǎng)絡(luò)結(jié)合提出了基于SE 注意力機制的深度卷積網(wǎng)絡(luò)(Squeeze-and-Excitation Convolutional Neural Network,SECNN)模型和注意力機制的深度卷積網(wǎng)絡(luò)模型(Attentive Convolutional Neural Network,Attentive CNN)模型,并在不同的數(shù)據(jù)集上進行訓練與測試,將訓練好的模型對說話人身份進行識別,并取得了優(yōu)異的成果[9]。
本文針對變壓器異常狀態(tài)的聲學診斷,提出了一種采用變壓器的聲音與深度學習相結(jié)合的變壓器異常狀態(tài)在線監(jiān)測診斷的深度學習方法,運用變壓器正常運行以及發(fā)生異常時(以過載和放電為例)的聲音,通過梅爾倒譜系數(shù)與長短期記憶網(wǎng)絡(luò)(Long-short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)相結(jié)合,對變壓器是否發(fā)生放電及過載進行精準識別。
變壓器在正常狀態(tài)下運轉(zhuǎn),交流電流經(jīng)繞組會生成交變磁通,這種磁通具有周期性會引起鐵芯發(fā)生周期性振動,使變壓器發(fā)出“嗡嗡”的聲音[10],由聲音波形圖(圖1)可知這種聲音是有規(guī)律的,如果變壓器發(fā)生放電的情況則發(fā)動機運行的聲音中會夾雜“噼啪”的聲音,聲音的規(guī)律性沒有正常狀態(tài)下的明顯,如圖2 所示。發(fā)生過載時,則發(fā)動機的嗡鳴聲較正常運行時的聲音更大[11],如圖3 所示。
圖1 正常狀態(tài)聲音波形Fig.1 Sound waveform in normal status
圖2 放電狀態(tài)聲音波形Fig.2 Sound waveform in discharge status
圖3 過載狀態(tài)聲音波形Fig.3 Sound waveform in overload status
本文針對這3 種聲音的差異性,以110 kV 油浸式主變壓器為例提出了一種監(jiān)測方案,為了保證采集聲音樣本的統(tǒng)一性,采集時均采用同一設(shè)備采集,采集頻率為44 100 Hz,單聲道,以10 s 為一個采集樣本,錄制格式均為WAV 格式,所采集的正常運行、放電及過載的聲音數(shù)據(jù)來源于變電站的110 kV油浸式主變壓器。
聲音檢測的整體流程為將采集到的變壓器正常運行的聲音與放電聲音先進行數(shù)據(jù)的預處理并劃分成訓練樣本及測試樣本,運用MFCC 與一階、二階差分將聲音特征提取,將訓練樣本的聲音特征輸入到LSTM 網(wǎng)絡(luò)模型中學習訓練;同時輸入測試樣本對模型進行測試,模型訓練好后,將模型運用到監(jiān)測系統(tǒng)中,開始實施對變壓器運行狀態(tài)的實時診斷。監(jiān)測方案如圖4 所示。
圖4 變壓器異常聲紋監(jiān)測方案流程圖Fig.4 Flow chart of abnormal voiceprint monitoring scheme for transformer
將聲音通過預加重、歸一化、分幀和加窗等處理方法消除采集聲音信號的設(shè)備所產(chǎn)生的混疊、高次諧波失真、高頻等問題對聲音信號能量及頻率的影響[12]。盡量使之后的聲音處理獲取的聲音信號更加均勻、平順,為下一步的特征提取輸入高質(zhì)量的參數(shù),提升聲音信號特征提取的效果。
由于變壓器運行時發(fā)出的聲音,低頻段幅度較大而高頻段幅度較小,所以為了平衡頻譜,改善聲音信號的信噪比(Signal-to-Noise Ratio,SNR),式(1)的一階濾波器將預加重濾波器應(yīng)用于信號x。
式中:y(t)為預加重濾波器的輸出值;x(t)為聲音信號;α為濾波器系數(shù),取0.97。
雖然采集樣本使用的是同一個設(shè)備,但是由于各種因素的影響,采集到的個體聲音樣本之間也存在很多差別,比如某一時刻會有環(huán)境的雜音等。這些問題均會對采集的聲音樣本的質(zhì)量造成一定的影響,所以在預加重之后,運用歸一化方法對聲音信號進行處理,使聲音數(shù)據(jù)都有統(tǒng)一的形式,這樣不僅方便計算,而且還降低了不同樣本間因采集因素所造成的差異[13]。因此使用線性歸一化方法對信號進行歸一化,如式(2)所示:
式中:Ynom為歸一化后的聲音能量;X為經(jīng)過預加重處理的聲音信號;Xmin,Xmax為聲音信號的最小值、最大值
聲音信號是一種時變信號,通過時間軸顯現(xiàn)出非平穩(wěn)的特征,但是能夠看作在很短的時間內(nèi)(一般為10~30 ms)聲音信號幾乎沒有變化,因此聲音信號擁有短時平穩(wěn)性[14]。通過這一特性就能把聲音信號劃分為一系列短段(稱為分析幀)并進行后續(xù)的處理。為了獲取平穩(wěn)的信號,則要通過分幀加窗的方式對聲音進行處理。但是聲音具有連續(xù)性與關(guān)聯(lián)性,不能單純地對聲音進行連續(xù)分段的處理,需要運用交疊分段的方式,即上一幀的幀尾要與下一幀的幀頭有一定的重疊,目的是使幀與幀之間平滑過渡,保持其連續(xù)性。上一幀和下一幀重疊的部分叫做幀移,幀移和幀長的比值通常為0~0.5 之間,本文根據(jù)實際情況取幀長為0.025,幀移為0.01。將聲音信號切分成短幀后,為了減少頻譜泄露,需要在每一幀加上一個窗口函數(shù),本文選用的是漢明窗。漢明窗是一種余弦窗,它的主瓣寬、旁瓣低,不僅有效地減少了頻譜的泄露,還可使低通特性更加平滑。式(3)為漢明窗表達式:
式中:w(n)為樣本索引n處的窗口系數(shù);n為樣本索引,0<=n<=G-1;G為窗長。
在聲音信號中,包含有大量的特征參數(shù),其中的每個特征向量分別代表著各自的物理意義和聲學意義。特征提取的作用是通過選出和縮減聲音信號中與識別沒有直接聯(lián)系的信息影響,縮小之后識別階段需要處理的信息量,選擇合適的特征參數(shù)有利于改善識別率。常見的聲音特征參數(shù)有線性預測倒譜系數(shù)(Linear Predictive Cepstral Coefficient,LPCC)和MFCC[15]。LPCC 參數(shù)是基于聲道模型生成的特征參數(shù),大多應(yīng)用在聲道響應(yīng)方面。MFCC 參數(shù)是通過人類聽覺特征并運用聽覺的臨界帶效應(yīng),在梅爾標度的頻率范圍內(nèi)抽取出的倒譜特征參數(shù),是基于人類聽覺系統(tǒng)的特性去模擬人耳對各頻段聲音的感知[16]。
本文采用MFCC 算法與一階、二階相結(jié)合提取聲音中的特征向量。特征提取的流程如圖5 所示。
圖5 特征提取的流程Fig.5 Process of feature extraction
通常信號在時域上的變換很難看出信號的特性,所以在大多數(shù)情況下將它通過快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)轉(zhuǎn)化成頻域上的能量分布進行特性觀察。通過乘上漢明窗,每幀須運用離散傅里葉變換來獲取頻譜上的能量分布[17]??焖俑道锶~變換計算公式如式(4)所示:
式中:Xa(k)為幅度譜;Y(n)為經(jīng)過預加重與歸一化以及分幀與加窗的聲音信號;N為傅里葉的變換點數(shù),取512;k為頻率。
通過對Xa(k)取模得到信號功率譜。將FFT 的結(jié)果輸入到梅爾尺度濾波器組,各濾波器的頻率范圍隨中心頻率增大而增大(如圖6 所示),頻率響應(yīng)為:
圖6 Mel濾波器組頻響特性曲線Fig.6 Frequency response characteristic curve of Mel filter bank
式中:f(m)為濾波器中心頻率;m代表濾波器的順序;Hm(k)為三角濾波器的頻率響應(yīng)。
其中濾波器并不是均勻分布在頻率坐標軸上,在低頻段濾波器分布較密集個數(shù)也較多,在高頻段,分布較稀疏而且個數(shù)也很少,因此通過梅爾譜會使低頻信號被精密的顯示,而高頻信號則會被粗略顯示。這是因為人的耳朵對頻率這種標度單位并不是線性感知關(guān)系的,即人耳對低頻的聲音感知較靈敏,對于高頻段的聲音人耳的感知是很遲鈍的[18]。所以人耳對頻率的關(guān)系用log 這種非線性關(guān)系更好描述,各個濾波器組輸出的對數(shù)能量為:
式中:s(m)為第m個濾波器輸出的對數(shù)能量;M為三角濾波器個數(shù)。
然后把所求得的對數(shù)能量采用離散余弦變換(Discrete Conine Transform,DCT)進行去相關(guān)濾波器組系數(shù)并產(chǎn)生濾波器組的壓縮表示,并求出L階的Melscale Cepstrum 參數(shù)。DCT 變換如式(7)所示:
式中:L為MFCC 系數(shù)階數(shù)。
針對自動語音識別(Automatic Speech Recognition,ASR),所得到的倒譜系數(shù)2 至13 保存,其他系數(shù)表示濾波器組系數(shù)的變化比較快,并且這些細節(jié)不會有助于ASR,所以被去掉。這樣就得到了一個13 維的MFCC 參數(shù)。因為聲音信號在時域上具有連續(xù)的特性,每幀的MFCC 特征僅僅反映了本幀聲音的特征,為了進一步體現(xiàn)聲音特征的關(guān)聯(lián)性與變化率,將13 維的MFCC 參數(shù)進行一二階差分,將差分結(jié)果合并到MFCC 參數(shù)中,將特征擴充為39 維,這樣就獲取了一個39 維的特征向量,即每幀聲音數(shù)據(jù)有39 個特征。
圖7—9 為變壓器正常運行、放電及過載時的語譜圖。語譜圖是聲音的時頻域表示,相比單一時域波形圖,其可綜合表征時間方向上的頻率和語音能量信息,表達出更為深層的聲紋特征,有利于模型的充分學習[19]。語譜圖的顏色代表在某一頻率與時刻下聲音的能量,由于對聲音數(shù)據(jù)進行了歸一化,所以聲音能量范圍在0 到1 之間,黃色代表聲音能量高,綠色代表聲音能量低,從3 個維度表現(xiàn)出頻譜的構(gòu)成方式。因此,語譜圖兼具聲音數(shù)據(jù)表征和圖像形式處理的特點,采用二維圖像表述三維信息。
圖7 變壓器正常運行時語譜圖Fig.7 Speech spectrogram for transformer during normal operation
圖8 變壓器放電時的語譜圖Fig.8 Speech spectrogram for transformer when discharging
圖9 變壓器過載時的語譜圖Fig.9 Speech spectrogram for transformer overloading
從圖7—9 可以看出,變壓器正常運行時的聲音主要集中在低頻段,而變壓器放電時的聲音的頻率范圍覆蓋到了高頻段,當變壓器過載時,可以看出在全頻段范圍內(nèi),聲音的強度都要大于正常運行時的聲音強度。
RNN 為一種通常用來解決帶有時序數(shù)據(jù)問題的神經(jīng)網(wǎng)絡(luò),RNN 的輸入為時序數(shù)據(jù),在計算單元中,前t時刻數(shù)據(jù)xt與t-1 時刻輸出生成的ht-1作為輸入,輸出輸出層的值yt并且生成ht,ht將被傳入下一時刻進行計算[20],LSTM 是一種特殊的RNN 模型,它能夠避免長期依賴問題,相較于RNN,LSTM 在輸出時增加了遺忘門,LSTM 結(jié)構(gòu)如圖10 所示。
圖10 LSTM單元結(jié)構(gòu)Fig.10 LSTM unit structure
LSTM 單元結(jié)構(gòu)中含有遺忘門、記憶門、輸出門3 個門。遺忘門含有1 個sigmoid 神經(jīng)網(wǎng)絡(luò)層,如圖11 所示,其作用是對前一單元的信息進行選擇性遺忘如式(8),將t時刻輸入信號xt與t-1 時刻輸出信號ht-1相結(jié)合,一并輸入進sigmoid 神經(jīng)網(wǎng)絡(luò)層中,輸出一個數(shù)值大小為0~1 的輸出信號ft,此值為保留傳遞信息的百分比。
圖11 LSTM單元中的遺忘門Fig.11 Forget gate in LSTM unit
式中:Wf為遺忘門的權(quán)重矩陣;[ ]ht-1,xt為2 個向量連接成更長的向量;bf為遺忘門的偏置項;σ為sigmoid 函數(shù)。
記憶門包含2 個部分:1 個sigmoid 神經(jīng)網(wǎng)絡(luò)層和1 個tanh 神經(jīng)網(wǎng)絡(luò)層,如圖12 所示,其作用是決定輸入信號中哪些信息將被保留。sigmoid 神經(jīng)網(wǎng)絡(luò)層的作用與遺忘門一樣,接受輸入信號,輸出一個0 到1 的數(shù)值it,決定哪些信息需要被更新,如式(9)所示。tanh 神經(jīng)網(wǎng)絡(luò)層的功能是將輸入的xt和ht-1整合,通過一個tanh 神經(jīng)網(wǎng)絡(luò)層創(chuàng)造一個新的狀態(tài)候選向量Ct0,其值的范圍在-1~1 之間。輸出時通過it與Ct0相乘篩選哪些信息將被加入到t時刻細胞狀態(tài)Ct中。
圖12 LSTM單元中的記憶門Fig.12 Memory gate in LSTM unit
式中:Wi和Wc為記憶門的權(quán)重矩陣;bi與bc為記憶門的偏置項。
輸出門就是將t-1 時刻傳遞過來經(jīng)過遺忘門與記憶門選擇后的細胞狀態(tài)Ct-1與xt,ht-1通過式(11)與式(12)整合到一起作為輸出信號,同時作為下一時刻的輸入,如圖13 所示。輸出門的計算公式如式(11)所示。
圖13 LSTM單元中的輸出門Fig.13 Output gate in LSTM unit
式中:ot為輸出門;WO為輸出門的權(quán)重矩陣;bO為輸出門的偏置項。
目前用于聲紋識別的神經(jīng)網(wǎng)絡(luò)模型主要有RNN 網(wǎng)絡(luò)、CNN 網(wǎng)絡(luò)、BP 神經(jīng)網(wǎng)絡(luò)和LSTM 神經(jīng)網(wǎng)絡(luò)等[21]。傳統(tǒng)的RNN 神經(jīng)網(wǎng)絡(luò)對信息沒有挑選能力,它會將所有的信息都保存下來,而且它沒有細胞狀態(tài),激活函數(shù)只有tanh,當步數(shù)較多時有可能會發(fā)生梯度消失和梯度下降,所以只能處理短期依賴問題。LSTM 是一種特殊的RNN 神經(jīng)網(wǎng)絡(luò),相較于傳統(tǒng)的RNN 神經(jīng)網(wǎng)絡(luò),其增加了門控裝置,可以通過細胞狀態(tài)來記憶信息,而且LSTM 通過其三個門控引入sigmod 函數(shù)并與tanh 函數(shù)相結(jié)合,增加求和的步驟,縮減梯度消失和梯度爆炸的可能性,既能解決短期依賴的問題又能解決長期依賴問題[22-25]。傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)與RNN 網(wǎng)絡(luò)有著相似的問題,不能處理過長的序列,因為過長的數(shù)據(jù)在傳遞過程中會被不斷縮減,到最后幾乎不能造成對輸出的影響,若一段序列的重要部分就在這前面一段,那么處理的結(jié)果就會極不理想。CNN 在圖像識別上具有優(yōu)異的效果,但是在處理聲音信號等時序數(shù)據(jù)時,識別效果會下降很多,因為時序信號中的前一幀與后一幀有著很大的關(guān)聯(lián)性,而卷積網(wǎng)絡(luò)中因為卷積核大小的制約無法捕捉長時的關(guān)系,只能解決一些簡單的時序問題。聲音是一種長時序信號,因此使用LSTM 神經(jīng)網(wǎng)絡(luò)進行訓練并進行識別的效果會比上述幾種網(wǎng)絡(luò)更有優(yōu)勢。為了進一步對比,本文在實驗階段會對BP 神經(jīng)網(wǎng)絡(luò)、CNN 網(wǎng)絡(luò)與LSTM 神經(jīng)網(wǎng)絡(luò)分別進行訓練,并通過結(jié)果比較它們的準確性。
本文采用雙向傳輸?shù)腖STM 結(jié)構(gòu),每層隱藏單元的個數(shù)為120,與全連接層連接,實現(xiàn)網(wǎng)絡(luò)分類,激活函數(shù)選用RULE 函數(shù),模型采用有監(jiān)督學習,輸入聲音的MFCC 及一、二階差分組合的特征與聲音標簽,網(wǎng)絡(luò)的損失函數(shù)采用交叉熵損失函數(shù),優(yōu)化方法采用梯度下降,運用大量的數(shù)據(jù)迭代,實現(xiàn)網(wǎng)絡(luò)模型的訓練。本文所構(gòu)建的網(wǎng)絡(luò)模型為:第一二層為LSTM 層,輸入維度為199×39,第三層為全連接層,第四層為分類層,對正常運行、放電以及過載3 種狀態(tài)進行分類。
將10 s 的聲音樣本進行2 s 的切分,將1 個樣本切分成3 個樣本,將安靜環(huán)境下的樣本和嘈雜環(huán)境下的樣本打亂順序進行隨機排序,然后依次放入模型中進行訓練,以8∶2 的比例隨機劃分訓練數(shù)據(jù)與測試數(shù)據(jù)。各種情況下的樣本如表1 所示。
表1 110 kV變壓器各情況聲音樣本數(shù)量Table 1 Number of sound samples of 110 kV transformer in two environments個
本文的性能評價指標是識別正確率,即識別正確的語音數(shù)量與測試集中語音總數(shù)的比值。圖14給出了訓練集與測試集上的實驗結(jié)果曲線,可以看出訓練集的準確率(train_acc)與測試集的準確度(test_acc)在迭代300 之后開始收斂并趨于穩(wěn)定,且訓練集準確度達到了100%,測試集的最佳準確度達到了99.30%。測試結(jié)果如表2 所示。
表2 LSTM神經(jīng)網(wǎng)絡(luò)的識別準確率Table 2 Recognition accuracy of LSTM neural network %
圖14 中,train_loss 為訓練集的損失,val_loss 為驗證集的損失,val_acc 為驗證集的準確率。
圖14 LSTM神經(jīng)網(wǎng)絡(luò)訓練集與測試集的準確率與損失函數(shù)曲線Fig.14 Accuracy and loss function curves of LSTM neural network training set and test set
從表2 中能發(fā)現(xiàn),采用LSTM 神經(jīng)網(wǎng)絡(luò)對變壓器3 種工況的識別準確率都達到了99%以上,為了進一步對比,在原聲音數(shù)據(jù)不變的情況下,將LSTM模型更換為傳統(tǒng)CNN 神經(jīng)網(wǎng)絡(luò)模型進行訓練識別,模型訓練結(jié)果如圖15 所示,CNN 神經(jīng)網(wǎng)絡(luò)在迭代400 次時逐漸達到穩(wěn)定狀態(tài),雖然訓練集的準確度達到了100%,但是測試集的準確度只達到了94%,采用相同的測試樣本進行對模型的驗證,測試結(jié)果如表3 所示。
圖15 CNN神經(jīng)網(wǎng)絡(luò)訓練集與測試集的準確率與損失函數(shù)曲線Fig.15 Accuracy and loss function curves of CNN neural network training set and test set
從表3 可以看出,CNN 神經(jīng)網(wǎng)絡(luò)識別的準確率能達到95%左右,將網(wǎng)絡(luò)模型換成傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò),用相同的樣本對BP 神經(jīng)網(wǎng)絡(luò)進行訓練與驗證,測試結(jié)果如表4 所示。
表3 CNN神經(jīng)網(wǎng)絡(luò)的識別準確率Table 3 Recognition accuracy of CNN neural network %
表4 BP神經(jīng)網(wǎng)絡(luò)的識別準確率Table 4 Recognition accuracy of BP neural network %
從表4 可知傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)對3 種狀態(tài)識別的準確率為87.53%。經(jīng)以上3 種典型的神經(jīng)網(wǎng)絡(luò)對變壓器3 種狀態(tài)下識別準確率的比較可得知,LSTM 網(wǎng)絡(luò)模型的識別率較傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)提升了11.77%,較CNN 網(wǎng)絡(luò)提升了5.3%。
實驗結(jié)果印證了本文對聲紋特征提取和聲紋識別方法的論述,將LSTM 神經(jīng)網(wǎng)絡(luò)與MFCC 特征有效結(jié)合,實現(xiàn)對變壓器正常運行以及兩種異常狀態(tài)的高正確率聲紋識別。
在進入大數(shù)據(jù)時代之后,生產(chǎn)生活過程中會產(chǎn)生大量數(shù)據(jù),為了保證工作效率,神經(jīng)網(wǎng)絡(luò)和人工智能在設(shè)備監(jiān)測中得以應(yīng)用,有效地減少了人力資源的投入,并改善了設(shè)備診斷的精確度[26]。聲音作為設(shè)備運行的最主要的特征之一,包含了設(shè)備運行時的大量信息,本文通過采集的真實場景下變壓器的聲音,并結(jié)合深度學習在聲紋領(lǐng)域中的研究,提出了一種基于LSTM 神經(jīng)網(wǎng)絡(luò)的變壓器異常診斷的方法,輸入聲音樣本的特征向量,通過LSTM 神經(jīng)網(wǎng)絡(luò)進行特征學習訓練,并取得了高準確度,因此將聲音與深度學習相結(jié)合對設(shè)備運行狀態(tài)進行監(jiān)測,或?qū)⒊蔀槁暭y識別領(lǐng)域未來的研究方向。