劉展,包琰洋,李大字*
(1.北京能高普康測控技術有限公司,北京市 豐臺區(qū) 100070;2.北京化工大學自動化研究所,北京市 朝陽區(qū) 100029)
近年來,為應對氣候變化與能源危機,清潔能源在全球能源組成中的比重不斷加大[1]。風電作為一種重要的清潔能源,具有獲取難度低、技術成熟等優(yōu)點,得到了廣泛重視與大力發(fā)展。據(jù)預計,到2030年,風力發(fā)電量將占全球總發(fā)電量的22%。在我國提出了“雙碳”目標后,風電在國家能源戰(zhàn)略發(fā)展中將具有越來越重要的地位[2-3]。
隨著風力發(fā)電在我國的大規(guī)模發(fā)展,風電機組的數(shù)量快速增長[4],風電機組故障率高的問題應引起重視。因此,如何快速而準確地進行故障診斷,特別是對難以排查的機械故障[5-8]進行診斷,以降低風電機組運行的維護成本[9],成為風力發(fā)電領域面臨的問題之一。
由于風電機組運行所處的環(huán)境與其主要機械結(jié)構(gòu)的特點,風機振動信號中包含了大量的運行狀態(tài)信息,這些信息可用來分析并判斷風電機組運行狀態(tài)與故障[10]。目前,風電機組的故障診斷[11]主要依賴于對風機振動信號的特征分析。
當前用于風機故障診斷的信號分析方法主要有時域分析、頻域分析與時頻域分析,其中時域分析[12]是最常用的方法。因為風機狀態(tài)的改變所帶來的振動信號的變化在時域中有明顯的體現(xiàn),方便對其進行特征的提取與分析。目前在故障診斷領域主要應用的時域分析方法有時域波形分析法、概率密度分析法、相關分析法、濾波處理法以及與人工智能相結(jié)合的方法[13]等。
國內(nèi)外目前對基于時域分析的故障診斷方法已有一定的研究。文獻[14]為適應原始數(shù)據(jù)中不同尺度的噪聲強度,提出了一種基于Morlet 小波變換的噪聲控制二階增強隨機共振方法,對風機振動信號進行故障提取。針對時域上的重噪聲引起經(jīng)驗小波變換中的模態(tài)混疊現(xiàn)象,文獻[15]首先用原始數(shù)據(jù)來驅(qū)動閾值小波空間鄰近系數(shù)法,在此基礎上再進行經(jīng)驗小波分解,可以自適應性地將信號分解成單組分來提取原有的調(diào)制信息。
隨著人工智能技術在深度學習領域的發(fā)展[16],其具有越來越強的特征學習、提取與分析能力,在故障診斷問題上有著良好的應用前景。文獻[17]提出了一種在時域分析中應用多傳感器數(shù)據(jù)融合技術的風機故障診斷方法,將原始時域數(shù)據(jù)通過融合得到由峰值指數(shù)、脈沖指數(shù)等組成的故障特征時域集,并結(jié)合云蝙蝠算法和核極限學習機構(gòu)成CBAKELM 模型實現(xiàn)故障診斷。文獻[18]針對齒輪箱振動信號故障診斷,提出了一種結(jié)合小波包變換濾波器和交叉驗證粒子群優(yōu)化核極端學習機的診斷方法。
針對風電機組的故障診斷問題,本文基于時域分析方法,通過對原始風機現(xiàn)場數(shù)據(jù)進行多種信號預處理,并采用寬卷積深度神經(jīng)網(wǎng)絡(wide deep convolutional neural network,WDCNN)進行信號特征提取。此方法受風機的機械轉(zhuǎn)速差異等因素影響較小,在真實診斷場景中具有很好的泛化性與實用性。
寬卷積深度神經(jīng)網(wǎng)絡 是卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的一種[19],其最顯著的特點在于首層卷積層所使用的卷積核為寬卷積核。卷積神經(jīng)網(wǎng)絡中卷積核的大小決定了感受野的大小,即所提取信息的全局性。寬卷積深度神經(jīng)網(wǎng)絡所使用的寬卷積核在基于時域分析的故障診斷問題中可有效捕獲周期性或波動性故障信號,避免了普通的卷積神經(jīng)網(wǎng)絡所使用的窄卷積核容易出現(xiàn)的無法將此類故障信號完全納入感受野的問題。在使用寬卷積的首層卷積層將故障信息完全截取之后,再經(jīng)過多層使用窄卷積核的卷積層對信息進行深層語義剖析,進一步提取其特征。
WDCNN 共有4 層組成,其基本結(jié)構(gòu)如圖1所示。
圖1 WDCNN結(jié)構(gòu)圖Fig.1 Diagram of WDCNN structure
第1 層為卷積層,該層用于提取輸入信息的特征,而其中的卷積核可看作濾波器,其提取特征的全局性與其感受野有關,也即與卷積核的大小有關。一般來說,經(jīng)過的卷積層越多,提取的特征越深層。卷積后將輸出進一步通過一個激活函數(shù)即非線性映射,以滿足網(wǎng)絡非線性的要求。卷積層的輸出表示為
式中:σ為激活函數(shù);xi為輸入信號;wi為卷積核;bi為偏差。
第2層為池化層,該層一般位于卷積層之后,對卷積層的輸出降維。一方面使經(jīng)過卷積層得到的特征圖進一步變小,降低計算復雜度;另一方面對特征進一步壓縮,提取主要特征,去除冗余信息,加快網(wǎng)絡收斂,防止過擬合現(xiàn)象的發(fā)生。
第3 層為全連接層,該層的作用是將網(wǎng)絡學習所得到的分布式特征進行連接,將其映射到樣本標記空間,用于接下來的分類任務。
第4層為歸一化層,該層中使用的Softmax函數(shù)可將網(wǎng)絡全連接層的輸出結(jié)果歸一化為故障的概率分布,該層的輸出結(jié)果可直接用于故障診斷。
神經(jīng)網(wǎng)絡中用損失函數(shù)來表示真實值與預測值之間的差距,并在網(wǎng)絡中進行反向傳播,指導網(wǎng)絡參數(shù)的訓練,使網(wǎng)絡在訓練后預測值盡可能接近真實值,從而提高預測精度,在故障診斷問題中也即提高診斷結(jié)果的可靠性。
本文提出的方法中所用的WDCNN 共有5 層卷積層,其中第1層卷積核的尺寸為16×16,其余4層卷積核的尺寸為3×3,所使用的非線性激活函數(shù)為Relu函數(shù)。
對采集得到的風機原始振動信號數(shù)據(jù)進行分析時,由于原始數(shù)據(jù)中包含了多臺風機的數(shù)據(jù),不同風機的機械轉(zhuǎn)速等都有所差別,常常導致通過信號分析所得到的不是故障狀態(tài)的特征,而是有關特征轉(zhuǎn)速、頻率等的差異所導致的特征,背離了故障診斷的要求。
為了減小轉(zhuǎn)速差異對特征提取的影響,本文在數(shù)據(jù)預處理中采用了基于信號頻率與機械轉(zhuǎn)速的重采樣方法。信號重采樣間隔表示為
式中:fs為原始數(shù)據(jù)采樣頻率;ft為重采樣頻率;n為旋轉(zhuǎn)機械的轉(zhuǎn)速;q為重采樣倍數(shù)常量。
重采樣倍數(shù)常量q決定了最后的重采樣頻率,需要通過實驗進行調(diào)試,最后選取合適的q值。實驗所用的q值依照振動信號來源的不同而有所不同。以某風力發(fā)電機組高速軸斷齒時的振動信號數(shù)據(jù)為例,其高速軸轉(zhuǎn)速約1 700 r/min,采用16 384 Hz的原始采樣頻率,經(jīng)過調(diào)試發(fā)現(xiàn)q=144,即采樣間隔為4,實際重采樣頻率在4 096 Hz時所得到的故障檢測結(jié)果最好。重采樣過程如圖2 所示,圖中L表示所截取數(shù)據(jù)中采樣點個數(shù)。
圖2 某機組高速軸斷齒振動信號重采樣示意圖Fig.2 Diagram of resampling vibration signal of highspeed shaft tooth breakage in a certain unit
該重采樣方法一方面減少了數(shù)據(jù)中關于轉(zhuǎn)速等因素的冗余信息,增大了數(shù)據(jù)中關于故障狀態(tài)特征的信息密度,有利于后續(xù)的特征提取與網(wǎng)絡訓練;另一方面增大了數(shù)據(jù)量,起到了對訓練集與測試集進行數(shù)據(jù)增強的效果。
原始風機振動信號數(shù)據(jù)除了受到轉(zhuǎn)速、頻率的影響,還混合了環(huán)境中的自然噪聲,僅僅依靠重采樣無法消除噪聲的影響。WDCNN的輸入為時域上的信號數(shù)據(jù),需要避免對噪聲的特征進行無效提取,消除噪聲是保證其有效性的重要步驟。
由于風機振動信號本身具有時變性,因此本文在信號重采樣之后采用了小波閾值去噪的方法,以得到特征性更強的信號,其原理如下。
將包含噪聲的原始數(shù)據(jù)在各尺度上與式(3)所示的小波基函數(shù)進行小波正交變換:
保留在大尺度(低分辨率)下的所有分解值,即保留信號主體的時頻域特征;對小尺度(高分辨率)下的分解值設定一個閾值,保留小波系數(shù)高于該閾值的分解值,舍棄小波系數(shù)低于該閾值的分解值,即去除幅值相較于原始信號較小的突變噪聲信號。最后對處理過后的信號進行逆小波變換,重構(gòu)出去除噪聲后的振動信號數(shù)據(jù)。
圖3 為某風機機組高速軸斷齒時的振動信號數(shù)據(jù)在降噪前后的對比圖。從圖3 可看出,小波閾值降噪消除了偽分量,明顯地將其中一些由噪聲引起的較高峰值數(shù)據(jù)進行了削弱,避免之后提取到錯誤的故障特征。
圖3 小波閾值降噪前后對比圖Fig.3 Comparison before and after wavelet threshold denoising
現(xiàn)場風機機組的一個部件上往往會包含多個傳感器測點,因此得到的振動信號數(shù)據(jù)包含了多個通道的數(shù)據(jù)。這些不同通道數(shù)據(jù)彼此具有強相關性而又包含了不同的特征。目前在工程領域會憑借人工經(jīng)驗選擇某個或某幾個通道的數(shù)據(jù)進行使用,這種依賴先驗知識的做法會降低方法的泛化性與可遷移性,同時也具有不可靠性。而將所有通道數(shù)據(jù)都參與網(wǎng)絡模型訓練的做法一方面引入了不必要的特征,另一方面計算量過大,拖慢訓練時間。
本文采用了主成分分析法(principal component analysis,PCA)對預處理后的振動信號數(shù)據(jù)進行處理,降低數(shù)據(jù)通道數(shù),提取合適的特征數(shù)據(jù)。PCA 的原理為利用降維的方法,通過正交線性組合方式,最大化保留樣本間方差,把多指標轉(zhuǎn)化為幾個綜合指標。圖4為具有5個測點的某風機機組數(shù)據(jù)PCA 降維前后的頻域圖。圖4 顯示PCA 將原本的5 個數(shù)據(jù)通道降維成3 個數(shù)據(jù)通道,在大大減少參加訓練的數(shù)據(jù)量的同時自動提取并保留了原本5 個數(shù)據(jù)通道的主要頻域特征。本文實驗中所采用的降維通道數(shù)以主元貢獻度之和大于85%為標準來選取,并非一個固定的數(shù)。
圖4 某機組高速軸振動信號PCA降維前后頻域圖Fig.4 Frequency domain diagram of high-speed shaft vibration signal of a certain unit before and after PCA dimensionality reduction
風機機組的振動信號數(shù)據(jù)不僅具有鮮明的時域特征,而且在頻域上故障信號與正常信號也會有所區(qū)別。圖5 為某風電機組高速軸在正常與故障時的振動信號數(shù)據(jù)在頻域上的對比。
圖5 某風機機組高速軸振動信號頻域數(shù)據(jù)Fig.5 Frequency domain data of high-speed shaft vibration signal for a certain unit
本文所提出的方法不僅選取了時域上常用的15 個特征參數(shù)(如平均值、方差、峰峰值、峭度等),還選取了頻域上的5個特征參數(shù)(如基頻等),以全面描述振動信號的特征。
本文所提出的方法利用了卷積神經(jīng)網(wǎng)絡通過自身的訓練能自適應地從信號中提取有關故障特征的優(yōu)點,減少了采樣頻率、轉(zhuǎn)速等因素對特征提取的影響,降低了信號預處理的復雜度與參數(shù)的敏感性,且網(wǎng)絡訓練所需的數(shù)據(jù)量較少,實現(xiàn)了故障診斷的自動化與泛用化。
基于寬卷積神經(jīng)網(wǎng)絡的方法結(jié)構(gòu)如圖6所示,其主要步驟如下:
圖6 基于WDCNN方法結(jié)構(gòu)圖Fig.6 Structure diagram based on WDCNN method
1)利用風機上的傳感器采集振動信號數(shù)據(jù)。
2)將采集得到的原始振動信號數(shù)據(jù)按照設置的步長間隔進行重采樣處理,即對隨后的網(wǎng)絡訓練中作為訓練集與驗證集的數(shù)據(jù)進行數(shù)據(jù)增強;并進行小波閾值去噪。將預處理后的數(shù)據(jù)進行PCA降維。
3)對預處理后的數(shù)據(jù)按照設置的切片數(shù)目與長度進行切片,作為接下來WDCNN 的輸入,并提取時頻域特征作為標簽。
4)按照初始化的參數(shù),先后經(jīng)過一層寬卷積核的卷積層與多層窄卷積核的卷積層,每次通過卷積層后都通過一個池化層進行壓縮,以此對數(shù)據(jù)的深度特征信息進行提取。
5)經(jīng)過全連接層與歸一化層將網(wǎng)絡輸出轉(zhuǎn)化為故障的概率分布。
6)按照根據(jù)真實值與預測值之間的差距所設計的損失函數(shù)進行反向傳播,更新網(wǎng)絡參數(shù)。網(wǎng)絡收斂同時在驗證集上達到預計的準確率后,保存訓練所得到的模型。
7)將在線數(shù)據(jù)經(jīng)過重采樣與切片后輸入到訓練好的WDCNN 中,對數(shù)據(jù)的深度特征信息進行提取。
8)在經(jīng)過卷積神經(jīng)網(wǎng)絡模型之后,經(jīng)過全連接層與歸一化層輸出故障的概率分布即對故障的分類結(jié)果,完成在線故障診斷。
風力發(fā)電機是風電機組中最重要的部件,但也常出現(xiàn)機械故障。本節(jié)通過分析風力發(fā)電機的數(shù)據(jù)進行診斷實驗,所采用的數(shù)據(jù)為實際采集的某風電機組數(shù)據(jù)。
實驗數(shù)據(jù)分為2 組,分別是發(fā)電機驅(qū)動端數(shù)據(jù)與發(fā)電機非驅(qū)動端數(shù)據(jù)。其中,發(fā)電機驅(qū)動端數(shù)據(jù)包含發(fā)電機驅(qū)動端正常與發(fā)電機驅(qū)動端磨損2種狀態(tài),某個通道2種狀態(tài)的振動信號數(shù)據(jù)分別如圖7(a)、(b)所示。發(fā)電機非驅(qū)動端數(shù)據(jù)包含發(fā)電機非驅(qū)動端正常與發(fā)電機非驅(qū)動端磨損2 種狀態(tài),某個通道2種狀態(tài)的振動信號數(shù)據(jù)分別如圖8(a)、(b)所示。分別從編號為39的風機機組的發(fā)電機驅(qū)動端數(shù)據(jù)與非驅(qū)動端數(shù)據(jù)中取出20組具有相同轉(zhuǎn)速的數(shù)據(jù)用于網(wǎng)絡訓練,每組包含6 個數(shù)據(jù)通道,每個通道有65 536 個振動信號數(shù)據(jù),故障數(shù)據(jù)與正常數(shù)據(jù)各占一半,其中70%的數(shù)據(jù)用作訓練集,剩余30%的數(shù)據(jù)用作預測集。網(wǎng)絡訓練完成后分別用其他機組的50組具有相同轉(zhuǎn)速的數(shù)據(jù)進行測試。實驗結(jié)果如表1所示。
表1 相同轉(zhuǎn)速下風機發(fā)電機故障診斷結(jié)果Tab.1 Fault diagnosis results of wind turbine generator at the same speed
圖7 發(fā)電機驅(qū)動端原始數(shù)據(jù)Fig.7 Raw data of drive end of generator
圖8 發(fā)電機非驅(qū)動端原始數(shù)據(jù)Fig.8 Raw data of non drive end of generator
從表1 可以看到,當機械轉(zhuǎn)速相同時,用較少數(shù)據(jù)訓練得到的網(wǎng)絡有相當高的診斷準確率,其中風機發(fā)電機驅(qū)動端的故障分類準確率達到100%,發(fā)電機非驅(qū)動端的故障分類準確率達到98%。
為檢驗轉(zhuǎn)速因素對本文提出方法的影響,分別從編號為46的風機機組的發(fā)電機驅(qū)動端數(shù)據(jù)與非驅(qū)動端數(shù)據(jù)中取出30組包含不同轉(zhuǎn)速的數(shù)據(jù)用于網(wǎng)絡訓練,每組包含6 個數(shù)據(jù)通道,每個通道有65 536 個振動信號數(shù)據(jù),故障數(shù)據(jù)與正常數(shù)據(jù)各占一半,其中70%的數(shù)據(jù)作為訓練集,30%的數(shù)據(jù)作為預測集。網(wǎng)絡訓練完成后分別用其他機組的50組包含不同轉(zhuǎn)速的數(shù)據(jù)進行測試。實驗結(jié)果如表2所示。
表2 不同轉(zhuǎn)速下風機發(fā)電機故障診斷結(jié)果Tab.2 Fault diagnosis results of fan generators at different rotational speeds
從表2中可以看出,轉(zhuǎn)速的差異對網(wǎng)絡的特征提取與診斷能力影響較小,風機發(fā)電機驅(qū)動端與非驅(qū)動端的故障分類準確率分別達到了98%與96%。
齒輪箱是風電機組中另一個較為重要的部件,該部件信號受齒輪數(shù)差異的影響較大,信號中干擾特征較多。本節(jié)通過分析齒輪箱的數(shù)據(jù)進行診斷實驗。
所采用的數(shù)據(jù)為實際采集的某風電機組數(shù)據(jù),共包含齒輪箱正常與齒輪箱斷齒2 種狀態(tài),其中某個通道2種狀態(tài)的振動信號數(shù)據(jù)如圖9所示。
圖9 齒輪箱驅(qū)動端原始數(shù)據(jù)Fig.9 Raw data of drive end of gearbox
實驗中共從編號為4 的風機機組中取出20 組數(shù)據(jù)用于網(wǎng)絡訓練,每組包含6 個數(shù)據(jù)通道,每個通道有131 072個振動信號數(shù)據(jù),故障數(shù)據(jù)與正常數(shù)據(jù)各占一半,其中70%的數(shù)據(jù)作為訓練集,30%的數(shù)據(jù)作為預測集。用訓練好的網(wǎng)絡對編號為30的風機機組的50組數(shù)據(jù)進行測試,分類準確率為98%,說明對于信號差異較大的齒輪箱數(shù)據(jù),本文提出的方法仍有較好的診斷效果。實驗結(jié)果表明,本文提出的方法對轉(zhuǎn)速差異等因素具有良好的抗干擾能力,對狀態(tài)特征具有優(yōu)秀的特征提取能力。
針對本文所采用的預處理方法進行了消融實驗,設置了4組實驗來驗證所采用方法的有效性。4 組實驗所采用的數(shù)據(jù)均為某風機機組驅(qū)動端振動信號數(shù)據(jù)。
第1 組實驗設置為進行重采樣,未進行小波閾值降噪。第2組實驗設置為進行小波閾值降噪,未進行重采樣。第3 組實驗設置為進行重采樣與小波閾值降噪。前3 組實驗均未進行PCA 降維,均按人工經(jīng)驗選取數(shù)據(jù)通道。第4 組實驗設置為同時進行了重采樣、小波閾值降噪與PCA降維。
表3 為消融實驗結(jié)果,可以看出,未進行重采樣或小波閾值降噪的網(wǎng)絡性能均會有所下降,證明了本文所采用預處理方法的有效性。另外,采用PCA降維后的實驗結(jié)果基本能接近人工經(jīng)驗選擇的網(wǎng)絡訓練結(jié)果,考慮到該方法具有更好的靈活性與泛化性,綜合評估下與PCA結(jié)合的方法具有一定的可行性。
表3 消融實驗結(jié)果Tab.3 Results of ablation experiment
針對風電機組的故障診斷問題,基于時域分析給出了一種使用WDCNN 來進行特征提取并完成自動診斷的方法。此方法在風機軸承轉(zhuǎn)速不同的情況下,采用重采樣處理數(shù)據(jù),并使用小波閾值降噪的方法去除偽分量。另外,針對現(xiàn)場風機數(shù)據(jù)所含通道數(shù)較多的情況,結(jié)合PCA 進行降維,選取合適的數(shù)據(jù)通道。最后,訓練好的神經(jīng)網(wǎng)絡可有效提取出風電振動信號所包含的故障特征。在風電場中的風機數(shù)據(jù)表明,此方法通過較少的風機數(shù)據(jù)即可訓練出具有較強特征提取與故障診斷能力的網(wǎng)絡,同時不受風機軸承轉(zhuǎn)速改變的影響。所提出的方法在保證較高診斷準確率的同時具有數(shù)據(jù)需求量少、訓練時間短與限制條件少等優(yōu)點,在實際工程中有著較大的應用價值。