李俊卿,陳雅婷,李斯璇
(華北電力大學電氣與電子工程學院,保定 071003)
電力產業(yè)作為經濟發(fā)展的支撐,隨著各類產業(yè)的不斷發(fā)展,其電網結構也日漸趨向擴大化和復雜化,這種發(fā)展趨勢對電網的自愈性和穩(wěn)定性提出了更高的要求[1-4]。在復雜的電網結構中,電氣設備類型多樣且每種電氣設備的工作環(huán)境不同,因此導致設備的故障原因也不盡相同,常見的原因有發(fā)電設備長時間帶過負荷、設備的絕緣老化、設備長期在潮濕、塵埃及化學活性介質的場所運行等[5-6]。而每一個電氣設備的故障都可能引起連鎖反應,進而影響整個系統(tǒng)的運行,造成無法挽回的后果,因此,電氣設備的及時預警及診斷在電網自愈方面起到了十分重要的作用[7]。
然而,智能電網的時變非線性、隨機不確定性和局部可觀測性,使建模分析方法難以全面反映新形態(tài)下電力系統(tǒng)的穩(wěn)態(tài)和暫態(tài)特征。因此為提高電網規(guī)劃設計將人工智能算法引入智能電網[8-11]。其中,機器學習方法作為人工智能算法的重要組成部分,越來越受到了人們的重視[12]。目前,主要應用于電氣設備故障預警的思想方法是:通過獲得現場監(jiān)測電氣設備的電氣量或非電氣量數據,傳輸到數據處理平臺,在建立好的數學模型下輸入多個自變量數據得到因變量的結果,即想要預測的數據。根據預測數據,觀察數據的發(fā)展趨勢進而判定被監(jiān)測的電氣設備是否發(fā)生故障,實現對設備故障的預判。而電氣設備的故障診斷與智能算法的結合,同樣是通過建立數學模型完成的,將測得的電氣量數據或非電氣量數據經過一定的數據處理,提取特征值,進而實現對故障種類的分類。經大量實驗證明,機器學習算法在故障預警及診斷時往往有著較高的準確率。
機器學習(machine learning,ML)的發(fā)展是隨著人工智能(artificial intelligence,AI)的發(fā)展而展開的,在人工智能領域占據了重要地位,其發(fā)展歷程參如表1所示。
表1 機器算法發(fā)展歷程Table 1 The development of machine algorithm
從龐大的歷史數據中,挖掘出數據之間難以直觀得到的聯(lián)系和規(guī)律的算法被稱為機器學習。機器學習的主要思想是通過對已有樣本數據的訓練,構造出一個可以實現對新樣本數據進行預測或分類的函數(流程如圖1所示)。該函數不僅要在訓練樣本中有良好的表現,在新樣本處理上也要有很好的適應性,這種被構造的函數適用于新樣本的能力稱為泛化能力。機器學習一般分為以下三步。
(1)根據待解決的問題選擇合適的模型,如分類問題常用的模型有貝葉斯分類模型、支持向量機等;回歸問題常用的模型有神經網絡模型,卡爾曼濾波預測模型等。模型的實質為一組函數的集合。
(2)擬定一個判斷模型精確程度的衡量標準,即損失函數。不同的損失函數在不同的數學模型中表現不同,如歐氏距離和交叉熵代價函數分別適用于對回歸問題和分類問題的評價。為了實現衡量標準的最優(yōu)化,因根據實際模型靈活選取損失函數。
(3) 確定函數的最優(yōu)參數。函數參數的選擇是整個模型建立中最關鍵的一步,為了在盡可能短的時間內找到最優(yōu)的參數,常用選用一定的優(yōu)化算法,如梯度下降法。用新樣本數據對選定的最優(yōu)參數進行測試,達到要求的精確度后說明模型建立完成。
依據不一樣的分類方式,機器學習可劃分為不同的類別,分類圖如圖2所示。
圖1 機器學習訓練過程Fig.1 Machine learning training process
圖2 機器學習概述Fig.2 Machine learning overview
2.1.1 BP神經網絡及其改進
BP神經網絡是將誤差逆向傳播算法應用于訓練過程,以提高訓練速度和精度的多層前饋網絡(圖3),是目前在電氣設備故障預警及診斷領域應用的最多的方法之一。
圖3 BP神經網絡模型圖Fig.3 BP neural network model diagram
周福來[21]、李朕玥[22]和余鋒等[23]采用BP神經網絡算法分別對齒輪設備、油浸式變壓器和高壓斷路器中存在的故障進行診斷,均呈現出比較準確的診斷結果。王賀[24]采用BP神經網絡實現了對風電機組的故障預警。BP神經網絡的優(yōu)點在于其結構簡單易于構造,但存在在訓練過程中收斂速度不穩(wěn)定、易收斂至局部極值,訓練完成后模型難以推廣應用等問題。對此,學者們提出了很多針對BP神經網絡的改進方案。Sun等[25]、曲婧華[26]引入動量因子,改善了網絡的學習率,構造了一種適應神經網絡,使得BP神經網絡的收斂速度不穩(wěn)定和易收斂至局部極值的問題得到改善。李升健等[27]以改進粒子群優(yōu)化神經網絡算法實現對故障線路的選擇和故障位置的確定,網絡的精確性和魯棒性在混沌優(yōu)化算法和粒子群優(yōu)化算法相結合的方式下可達到要求,且可解決傳統(tǒng)神經網絡易收斂至局部最優(yōu)解的問題。張智偉等[28]將遺傳算法(genetic algorithm,GA)與BP神經網絡相融合用于檢測定子繞組匝間短路故障,GA的引入使神經網絡的權值和閾值得以優(yōu)化且減少了訓練時間,提高了網絡的精確度。這些改進算法通過優(yōu)化BP神經網絡的訓練方式,都在很大程度上解決了BP網絡中存在的問題。
除對網絡的訓練過程進行優(yōu)化外,還可以對網絡本身的激活函數進行改造。吳建萍等[29]提出小波變換與神經網絡相結合,將前者嵌入后者可以提高原網絡的容錯能力和自適應分辨率,避免陷入局部極值和收斂速度過于緩慢的問題,實現了小波神經網絡對異步電機故障的診斷。賈亦敏等[30]提出用粒子化的人工魚群算法對小波神經網絡進行優(yōu)化,以提高小波神經網絡的故障診斷速率和準確率。該算法可對小波神經元的伸縮平移系數和輸入輸出節(jié)點權重進行修正。
BP神經網絡還可以與其他系統(tǒng)相結合,達到互補的效果,如基于網絡的自適應模糊推理系統(tǒng)(adaptive network-based fuzzy inference system,ANFIS)。該系統(tǒng)采用神經網絡的學習機制并結合了模糊系統(tǒng)推理能力強的優(yōu)勢,具有便捷高效的特點。馬繼昌等[31]以汽車的發(fā)動機故障為研究對象,將實驗采集的故障信號以小波變換的方式除噪,并利用提取出的故障信號特征值訓練和測試ANFIS網絡,完成故障診斷模型的搭建。在文獻[32]中,ANFIS被用來學習提取的風電機組齒輪箱故障特征的狀態(tài)轉移函數,粒子濾波算法根據學習狀態(tài)轉換函數和故障特征的新信息預測齒輪箱的剩余使用壽命。王婉娜等[33]將記憶單元加入自適應模糊神經網絡的模糊層節(jié)點,將上一時刻包含的信息用于下一時刻的預測上,提高了對于齒輪箱剩余使用壽命預測的準確性。
2.1.2 支持向量機
經典的SVM可以解決二分類問題,其實質是一個凸二次規(guī)劃的求解問題。當求解多分類問題時,需要重新構造分類器。其核心思想是尋找一個超平面,以分割間隔最大化為原則,將初始樣本劃分到分割面的兩側,模型如圖4所示。
M、b為超平面參數圖4 支持向量機模型Fig.4 Support vector machine model
周建平等[34]、鐘書輝等[35]利用主分量分析法對獲取數據的特征矩陣進行降維處理,構建SVM的訓練樣本集,分別實現了對斷路器運行狀態(tài)和無刷直流電機的多類故障診斷。Mittal等[36]以氣體溶解分析的最優(yōu)子集作為SVM 的訓練樣本對變壓器的故障進行診斷。由于經典SVM存在難以對大數據樣本進行訓練,且對于多分類問題存在一定困難,因此,為了克服經典SVM中存在的缺陷,往往將SVM與其他深度學習算法相結合,或對SVM進行優(yōu)化。Qu等[37]提出一種以多徑向基函數為核函數的支持向量機算法用于對變壓器的故障診斷,實驗證明該方法具有更高的診斷準率和更出色的泛化能力。Salahshoor等[38]將自適應模糊神經系統(tǒng)和SVM相結合用于對汽輪機的故障檢測和診斷,并通過仿真證明二者結合后的診斷效果優(yōu)于自適應模糊神經系統(tǒng)或SVM單獨診斷時的效果。Huang等[39]以高壓斷路器的機械故障為研究對象,提出了一種基于GA的SVM模型,該模型能夠以極高的準確度和泛化能力確定SVM的最優(yōu)參數。
將SVM進行優(yōu)化改造或與其他系統(tǒng)相結合可以構成預測模型,實現對故障的提前預警。王建華等[40]將灰色預測模型與SVM結合,利用灰色模型預測數據,SVM對預測的數據分類達到對滾動軸承故障預測的目的。吳坤等[41]綜合全局性核函數和局部性核函數的映射特性,對核函數進行復合處理,提出一種新型的SVM預測模型,極大的改善傳統(tǒng)單核SVM的性能。Yang等[42]提出了一種基于粒子群優(yōu)化算法的最小二乘SVM方法來預測火電廠一次風扇的振動進而預測潛在故障,該方法有著更高的精度和更低的復雜性。為了對SVM 預測模型參數進行優(yōu)化,李寶晨等[43]提出了一種基于細菌覓食特性的改進粒子群算法優(yōu)化,具有更好的尋優(yōu)性能,解決了SVM模型參數在進化后期易循環(huán)在局部極值的問題。Xiao等[44]采用人工蜂群和經驗模式分解方法對SVM的模型參數進行優(yōu)化,提高了診斷和預測精度,并將其應用于對風電機組的故障預警。
深度學習是機器學習中神經網絡的延伸,以人腦的工作原理為基準,用于對數據的挖掘和解釋。深度學習強大的數據分析、預測、分類能力契合智能電網中大數據應用的需求。常用的深度學習模型遞歸神經網絡有:生成式對抗網絡(generative adversarial nets,GAN)、遞歸神經網絡(recurrent neural network,RNN)、卷積神經網絡、深度信念網絡等。
2.2.1 遞歸神經網絡
與傳統(tǒng)神經網絡結構相比,RNN在隱藏層有一個數據的循環(huán)傳遞連接,表示當前時刻處理的信息會傳遞到下一時刻,在下一時刻的信息處理中會對該信息進行調用,其展開圖如圖5所示。當RNN的隱藏層由單層變?yōu)槎鄬訒r,稱其為深度循環(huán)神經網絡。
xt為t時刻輸入;st為t時刻隱藏層狀態(tài),Ot為t時刻輸出;U為輸入到隱藏層的權重矩陣;W為隱藏層間的權重矩陣;V為隱藏層到輸出層的權重矩陣圖5 RNN模型Fig.5 RNN model
陳如清等[45]提出了一種帶有偏差單元的循環(huán)神經網絡,適用于旋轉機械的在線故障診斷。李俊峰[46]采用循環(huán)神經網絡和蝙蝠算法相結合的方法,提出了一種新型電力變壓器故障診斷模型,該模型具有收斂性好、故障診斷準確率高等特點。Peng等[47]將RNN用于風機齒輪箱的在線預測健康指數,進而對齒輪箱故障進行預測。
RNN由于在信息處理時引入了上一時刻的信息,對于處理時間依賴型數據有很大的優(yōu)勢,但深層RNN可能由于網絡層過多導致網絡權值更新不穩(wěn)定,進而引起梯度消失和梯度爆炸的問題。LSTM就是為了解決上述問題而提出的。LSTM在RNN 的基礎上引入了門的概念,對上一時刻信息,當前時刻輸入信息,當前時刻輸出信息加以處理,其原理如圖6所示。LSTM解決了RNN的缺陷,在諸多與時間序列相關的領域中成功應用。
xt為t時刻輸入;ht為t時刻輸出,ct為t時刻的狀態(tài);σ和tanh為激活函數圖6 LSTM模型Fig.6 LSTM model
Wang等[48]和Xiao等[49]將LSTM模型分別用于齒輪故障和三相異步電動機故障診斷,通過與其他分類故障診斷模型相對比,得出LSTM具有最高的故障診斷準確率。趙建鵬等[50]提出一種利用LSTM對旋轉機械進行故障預測的模型,并將該模型與支持向量機對比得出LSTM具有更高的預測準確度。針對振動信號的高維度特征,文獻[51]提出了一種結合DBN和LSTM的故障預測方法,利用DBN優(yōu)異的特征提取能力提取時間序列故障數據的特征向量,并利用LSTM網絡對提取的特征向量進行故障預測,實驗證明,該方法可以提高故障預測的準確度。Zhang等[52]提出了一種基于LSTM網絡和SVM的電力系統(tǒng)基于數據的線路跳閘故障預測方法,利用LSTM在提取長時間跨度的時間序列特征方面良好的表現捕獲多源數據的時間特征,而SVM具有強大的泛化能力和魯棒性,引入用于分類以獲得最終預測結果??傮w來看,LSTM在時間序列處理方面具有極強的能力,且可以和多種算法相結合用于不同情況下的故障預測及診斷。
2.2.2 卷積神經網絡
CNN由若干卷積層、池化層、全連接層組成,其示意圖如圖7所示。將輸入數據逐層卷積池化可得到輸入數據數據平移、旋轉及縮放不變的抽象特征,進而實現對圖像的識別。CNN在語音識別和圖像處理方面有著得天獨厚優(yōu)勢。其局部權值共享的特殊結構,使得網絡結構極大的簡化;其可接受多維向量直接輸入的特性,避免了原始數據處理時特征提取和分類的操作。
圖7 CNN模型Fig.7 CNN model
李輝等[53]、黃新波等[54]和Chen等[55]利用構建CNN網絡,分別實現了對變壓器、高壓斷路器和風機齒輪箱的故障診斷。Shi等[56]將CNN和SVM算法相結合,提出了一種汽輪的機故障診斷方法。張立智[57]將CNN和D-S證據理論相結合,得到數據的基本概率分配,根據Dempster合成法則進行決策融合,實現對齒輪箱的復合故障診斷。由于卷積神經網絡是針對圖片處理的網絡,因此在對電力系統(tǒng)的測量數據處理時需將測量數據轉換為二維數據,在數據處理方面增加了難度。CNN在訓練時需要大量訓練樣本且需要參數調節(jié),這也是CNN的優(yōu)化方向。
2.2.3 深度信念網絡
2006年,Hinton提出的了一種由若干個受限玻爾茲曼機(restricted boltzmann machine,RBM)順堆疊形成的深度置信網絡,并給出了一種高效學習的算法,其原理如圖8所示。該學習方法中,原始數據由底層的RBM輸入并對網絡進行訓練,將底層RBM提取的數據特征作為頂層RBM的輸入數據,進行頂層網絡的訓練。以兩個RBM為一組重復以上步驟直到所有RBM網絡訓練完成。最后用反向傳播算法對整個網絡進行參數調優(yōu)。RBM網絡不再需要靠經驗來提取數據特征,而是在網絡訓練過程中自動提取,可以高效地對隱含層進行學習。
圖8 DBN訓練模型Fig.8 DBN training model
朱萌等[58]、劉冰堯等[59]和李夢詩等[60]利用深度置信網絡分別實現了對高壓斷路器、變壓器和風力發(fā)電機的故障診斷。DBN網絡訓練過程中易產生大量冗余特征,進而影響特征提取能力,因此,眾多學者在現有DBN結構和學習算法的基礎上進行了拓展與改進。王德文等[61]利用優(yōu)化深度置信網絡對變壓器故障進行診斷,優(yōu)化后的網絡精度提高,同時計算速度和網絡的收斂速度也大幅提升,證明了貝葉斯正則化算法優(yōu)化的有效性。Liu等[62]提出了一種基于深度信念網絡的風力發(fā)電變流器故障診斷方法,利用小波變換提取信號故障信號的特征向量,以特征向量對DBN進行有監(jiān)督的訓練,仿真結果表明該方法具有良好的識別轉換器故障的能力。目前比較常見的DBN網絡為定結構網絡,這種網絡的網絡結構一般由經驗或者充足的數據來決定,且結構一旦確定便無法調整,不能適應處理數據變化性的要求。因此,構造一種可以動態(tài)調整權值的定結構DBN網絡是今后需要攻克的一個難題[63]。
機器學習作為人工智能中的核心內容已經在生產生活中的多個領域得以運用。其中,電力系統(tǒng)作為與生產生活息息相關的重要產業(yè),必須要保證其運行的可靠性。為建設堅強穩(wěn)定的智能電網更需要引入先進的技術,將機器學習算法用于電網中電氣設備的故障預警及診斷可以在很大程度上遏制故障的發(fā)展,避免微小的故障造成不可逆的影響,進而給生產生活帶來嚴重的后果。目前應用在電氣設備故障預警及診斷方面比較常見的算法有BP神經網絡算法,支持向量機算法和深度學習。常用于電力系統(tǒng)的深度學習方法有RNN,CNN和DBN。BP神經網絡是較早發(fā)展起來的神經網絡。由于其訓練方便,結構簡介明了,在故障預警及診斷領域仍被廣泛使用,但BP網絡存在不穩(wěn)定的問題,目前提出了很多改進措施如引入自適應學習率,改變激活函數,與其他系統(tǒng)相結合等。SVM相對于BP網絡的優(yōu)勢在于SVM的訓練所需數據量少,可以解決訓練數據不足的問題,但也意味著SVM不適用于對大數據的處理。而且,傳統(tǒng)的SVM是一種二分類模型,如要對多類故障進行分類診斷仍需進一步研究改造。深度學習是機器學習中神經網絡的延伸,相較于傳統(tǒng)神經網絡,深度學習具有更強的數據挖掘能力,可以實現復雜高維函數的表示,但深度學習也存在難以選擇合適的網絡結構訓練速度慢等缺點。
由于深度學習在復雜函數擬合方面及準確率方面獨特的優(yōu)越性,在未來一段時間內仍將是故障預警及診斷研究中比較熱門的研究方向之一。將深度學習與其他傳統(tǒng)算法相結合可以在很大程度上提高模型的性能,且深度神經網絡在結構上的改造也有很大的提升空間,如隱藏層數的選擇,網絡間的連接形式等,因此推動神經網絡在故障預警及診斷中的發(fā)展十分必要。