劉曉悅,張澤明,趙立國,孟凡偉,張 怡
(1.華北理工大學電氣工程學院,唐山 063000;2.唐山市天然氣有限公司,唐山 063000)
風能作為可持續(xù)發(fā)展戰(zhàn)略中最重要的清潔能源之一,其設備的高效運維和故障診斷已經成為當前電力系統(tǒng)面臨的重要問題之一[1]。齒輪箱作為風機傳動系統(tǒng)中的重要部件,一旦發(fā)生故障,將面臨巨大的經濟損失[2]。因此,對風機齒輪箱進行狀態(tài)監(jiān)測和故障診斷,及時告知風機齒輪箱故障部位,為風機維護決策提供指導,對于提高風電機組的可靠性和安全性具有重要意義。
在風機的實際工作環(huán)境中,非平穩(wěn)時間序列信號不可避免地包含了很大程度的噪聲。小波閾值去噪[3]方法可以有效的對振動信號進行降噪處理。在故障特征提取方面,傳統(tǒng)的風電機組振動信號處理方法僅能作為故障判斷的一般指標,不能有效實現風機故障的精準判斷[4]。HUANG等[5]首先提出了經驗模態(tài)分解(EMD),被廣泛應用于機械故障診斷、信號濾波等領域[6-7]。為解決其存在模態(tài)混疊和端點效應問題,集合經驗模態(tài)分解(EEMD)[8]在原始信號中加入高斯白噪聲,雖然模態(tài)混疊問題在一定程度上得到了緩解,但分解效率低,在低頻區(qū)域仍存在模態(tài)混疊和能量泄露問題。在此基礎上,TORRES等[9]提出了自適應噪聲完全集合經驗模態(tài)分解(CEEMDAN),CEEMDAN[10]能很好地處理這種非線性、非平穩(wěn)信號,由于在分解過程的每個階段都自適應地加入高斯白噪聲,完全分解且重構誤差極低,可以獲得較好的模態(tài)分離結果[11]。CEEMDAN方法優(yōu)于傳統(tǒng)的模態(tài)分解方法,能夠更加充分地處理齒輪箱振動信號。特征提取之后,需要使用合適的分類算法來實現故障類型的識別。WEI等[12]利用極限學習機(extreme learn mchine,ELM)進行了旋轉機械的故障診斷。麻雀搜索算法(sparrow search algorithm,SSA)是XUE等[13]受麻雀覓食和反捕食行為的啟發(fā),而提出的一種新型群體優(yōu)化算法。該算法求解精度高、收斂速度快、穩(wěn)定性好,并且具有很好地全局探索與局部開發(fā)能力[14]。利用SSA算法優(yōu)化ELM的輸入層權值和隱藏層閾值,可以避免隨機賦值對網絡結構的影響,提高模型的分類精度。
綜上所述,本文結合小波閾值去噪、CEEMDAN、皮爾遜相關系數和樣本熵,將SSA-ELM方法應用于風機齒輪箱的故障診斷中。為了準確提取齒輪箱故障信號的特征向量,本文選用小波閾值去噪方法對齒輪箱振動信號進行去噪預處理,再對處理后的信號進行CEEMDAN分解,利用皮爾遜相關系數法篩有效的IMF分量,并計算所選IMF分量的樣本熵,將其作為特征向量輸入經麻雀搜索算法優(yōu)化的極限學習機模型中,從而實現風機齒輪箱的故障診斷。與類似方法進行對比,驗證了該方法具有更好的分類性能。
小波閾值去噪是根據信號與噪聲的小波系數在不同尺度上具有不同的性質,利用相應的數學方法構造系數的選擇方式,從而對含噪信號的小波系數進行處理。其基本原理如圖1所示。常用的小波閾值去噪函數包括硬閾值和軟閾值[15]。由于硬閾值函數在這里會引起信號去噪的吉布斯效應,因此本文采用軟閾值去噪。軟閾值表達式如式(1)所示:
(1)
式中,sign(·)為符號函數;ω為小波系數的大??;ωλ為施加閾值后的小波系數;λ為閾值。
圖1 小波閾值去噪流程圖
在本研究中,使用MATLAB小波工具箱中的wden函數來獲得閾值,wden函數使用指定的正交或雙正交小波對信號進行N級小波分解,得到小波系數,wden函數如式(2)所示:
xd=wden(x,tptr,sorh,scal,n,wname)
(2)
式中,xd為通過小波閾值去噪得到的去噪后的信號;x為輸入的原始信號;tptr為指定的閾值選擇規(guī)則;sorh為閾值的選擇方式;n為分解層數;wname為小波基函數。
CEEMDAN是在EMD的基礎上加以改進,同時借用了EEMD算法在原始信號中加入高斯白噪聲并通過多次疊加求平均值以抵消噪聲的思想。
對于任意信號X(t),vi(t)為第i次添加高斯白噪聲序列的實驗內容,則第i個信號序列為:Xi(t)=X(t)+εivi(t),(i=1,2,3,…,n),εi為振幅,n為實驗次數,Ek(·)為由EMD方法生成的第k階IMF,IMFk(t)為用CEEMDAN方法生成的k階模態(tài)分量。算法流程圖如圖3a所示。具體分解步驟如下:
步驟1:采用EMD方法對信號X(t)=εivi(t)進行i次分解,得到第一階模態(tài)分量,如式(3)所示:
(3)
步驟2:在第一階段中,第一剩余分量被計算為:
r1(t)=X(t)-IMF1
(4)
步驟3:進行i次實驗(i=1,2,3,…,n),每個信號都分解成:r1(t)=X(t)+εiE1(vi(t)),直到找到第一個固有模態(tài)分量,在此基礎上,計算第二階固有模態(tài)分量,如式(5)所示:
(5)
步驟4:重復步驟3以進行后一階模態(tài)分量的計算。首先,計算第k個殘差信號,然后計算第(k+1)個模態(tài)分量,如式(6)、式(7)所示:
rk(t)=rk-1(t)-IMFk(t)
(6)
(7)
步驟5:重復步驟4,直到所有的殘差信號被分解。終止準則為殘差信號極值點的最大個數不超過2,當算法終止時,模態(tài)分量數為K,最終殘差信號如式(8)所示:
(8)
原始信號X(t)表示為式(9)所示:
(9)
樣本熵是在近似熵的基礎上提出的一種新的時間序列復雜度及非線性程度的表征參數,樣本熵在具有近似熵優(yōu)點的同時,不依賴數據長度進行計算,具有更好的抗干擾能力[16]。本文將依據皮爾遜相關系數選擇后的IMF分量樣本熵構造特征向量,表征信號所包含的狀態(tài)信息。對于N個數據點組成的時間序列{x(1),x(2),…,x(n)}樣本熵被定義為:
(10)
式中,m為嵌入維度;r為相似容限值,一般情況下r取0.1~0.5SD(SD是時間序列的樣本差);Bm(r)為在m維度上時間序列的間距小于r的個數總和;Bm+1(r)為在m+1時間序列小于r的個數總和。
在SSA算法中,麻雀的類型主要有兩種:探索者和追隨者。探索者負責積極地尋找食物來源,追隨者從探索者那里獲取食物。另外,還有掠食者在掠奪食物。具體流程如下:
由n個麻雀組成的種群表示如下:
(11)
式中,d為待優(yōu)化問題變量的維數,所有麻雀的適應度函數表示為:
(12)
探索者的位置更新如式(13)所示:
(13)
當R2 追隨者的位置更新如式(14)所示: (14) 式中,XP為探索者當前占領的最佳位置;Xω為當前的全局最差位置;A為所有元素被隨機賦值為1或-1的(1×d)的矩陣,且A+=AT(AAT)-1,當i>n/2時,意味著適應度值比較低的第i個追隨者尚未得到食物,需要飛到其他地方覓食。 我們假設這些意識到危險的麻雀,即看守者占整個種群的10%~20%,并且這些看守者的初始位置是隨機產生的,建立全局最優(yōu)定位公式為: (15) 式中,K∈[-1,1]為隨機數;Xb為當前的全局最佳位置;β為服從正態(tài)分布的隨機數(均值為0,方差為1),代表步長控制參數;fi為當前的個體適應度值;fg為當前全局最佳的適應度值;fω為當前全局最差的適應度值;λ為避免分母為0的最小常數。 ELM是由HUANG等[17]構建的一種只有一個隱藏層的前饋神經網絡,其泛化性能優(yōu)于傳統(tǒng)的神經網絡模型,我們只需要設置隱藏層神經元的數量,而不需要調整其參數,就可以在訓練過程中得到唯一最優(yōu)解。ELM結構如圖2所示。具體流程如下: 對于輸入樣本X,隱藏層節(jié)點數為l的ELM網絡結構,輸出函數Y可表示為: (16) 圖2 ELM結構 式中,W為輸入權值,即輸入層與隱藏層之間的連接權值;β為輸出權值,即隱藏層和輸出層之前的連接權值;b為隱藏層的閾值;g(x)為激活函數。 訓練神經網絡使誤差最小,即輸出與期望輸出之間的誤差接近于0,誤差可計算為: (17) 并將上述兩個公式組合得到: (18) 將上述表達式簡化為: Hβ=T′ (19) 式中,H為隱藏層節(jié)點的輸出矩陣;T為預期輸出。 (20) 隱藏層和輸出層之間的連接權值β是通過求解上述方程的最小二乘解得到的: (21) SSA優(yōu)化ELM流程如圖3c所示,具體優(yōu)化步驟為: 步驟1:設置初始化參數,包括種群大小、迭代次數、探索者的比例、意識到有危險的看守者所占比重等相關參數; 步驟2:將種群劃分為探索者和追隨者,計算適應度值并排序,選擇出此時的最優(yōu)值和最差值; 步驟3:利用式(13)更新探索者的位置; 步驟4:利用式(14)更新追隨者的位置; 步驟5:隨機選擇看守者,并用式(15)進行其位置的更新,得到此時的最優(yōu)值; 步驟6:將此時得到的最優(yōu)值與上一次迭代得到的最優(yōu)值進行對比,保留更好的最優(yōu)值,繼續(xù)進行更新操作; 步驟7:判斷是否達到最大迭代次數,如果不是,返回步驟2繼續(xù)執(zhí)行,如果是,則終止執(zhí)行,輸出最優(yōu)參數。 本文所提出的基于CEEMDAN樣本熵和SSA-ELM小波閾值去噪的風機齒輪箱故障診斷方法如圖3b所示,具體過程如下: 步驟1:振動信號采集,將加速度傳感器安裝在齒輪箱的不同位置,采集齒輪箱的振動信號; 步驟2:數據預處理,利用小波閾值去噪對采集到的振動信號進行降噪,對降噪后的信號進行CEEMDAN分解,得到若干IMF分量; 步驟3:故障特征提取,計算分解后的IMF分量與原始信號的皮爾遜相關系數,選擇有效的IMF分量;利用式(10)計算有效IMF分量的樣本熵,構造特征向量; 步驟4:歸一化處理,對提取的故障特征數據集做歸一化處理,用處理后的數據集對診斷模型進行訓練和測試; 步驟5:確定診斷模型結構,采用SSA優(yōu)化ELM的權值和閾值,得到最優(yōu)參數; 步驟6:按一定的比例將數據劃分為訓練數據樣本和測試數據樣本,建立SSA-ELM故障診斷模型,進行齒輪箱的故障分類識別。 圖3 故障診斷整體流程圖 某公司的QPZZ-Ⅱ型故障模擬試驗臺能迅速模擬旋轉機械的多種狀態(tài),實驗裝置平臺[18]如圖4所示,主要由變速齒輪箱、三相交流變頻電機、聯軸器、旋轉軸、旋轉圓盤等組成。 圖4 實驗裝置平臺 本文利用該平臺模擬風機齒輪箱實驗來驗證所提方法的有效性,設置采樣頻率為2000×2.56 Hz,充分考慮齒輪箱的復雜工況,模擬了在轉速為880 r/min、加載0.1 A電流情況下的正常、斷齒、點蝕和磨損4種狀態(tài)。分別采集了53 248個振動信號,并將其分成52組,每組1024個樣本點。 以斷齒故障為例,其實驗信號及其頻譜如圖5所示。由圖5可以看出,雖然信號具有明顯的沖擊特征,但并不能直接判斷出故障的類型,因此需要做進一步的處理。 圖5 斷齒故障實驗信號波形及其頻譜 對去噪后的齒輪箱故障振動數據進行CEEMDAN分解,共得到9個IMF分量和1個殘差分量,如圖6所示。各分量對應頻譜圖如圖7所示。 由圖6和圖7可以看出,CEEMDAN分解后的IMF分量模態(tài)混疊問題得到了很好的抑制。高頻不連續(xù)信號被噪聲淹沒,低頻有用信號很好地分解,而且各個IMF分量頻譜具有顯著差異,頻域特征明顯,很好地達到了分解目的。 圖6 CEEMDAN分解結果 圖7 CEEMDAN分解結果對應頻譜 在此基礎上,計算CEEMDAN分解中各個IMF分量與原始信號的皮爾遜相關系數,如圖8所示。 圖8 皮爾遜相關系數 由圖8可知,前5階IMF分量與原始信號的相關系數較大,超過0.1,而IMF6~IMF9的相關系數趨于0,由此可以得出前5階IMF分量與原始信號的相關性最大,包含了主要的故障信息。因此,確定采用前5個IMF分量的樣本熵作為特征向量,其余為待去除的虛假分量。 用樣本熵度量IMF分量的復雜度,可以在一定程度上反應原始信號的振動規(guī)律和特征。4種狀態(tài)下的部分樣本熵特征值如表1所示。 表1 CEEMDAN分解的IMF分量樣本熵 在此基礎上,本文利用SSA-ELM的故障診斷模型對提取的特征進行分類和識別,并分別建立ELM、粒子群算法(PSO)優(yōu)化ELM、灰狼算法(GWO)優(yōu)化ELM的齒輪箱故障診斷模型與所提方法進行比較,驗證各種方法的分類性能。 SSA方法的參數設置如下:最大迭代次數為50,種群規(guī)模為20,探索者比例為0.7,預警值為0.6,看守者比重為0.2,以訓練集與測試集錯誤率的和為適應度函數確定種群的最優(yōu)值;ELM模型隱藏層個數設置為100,構建SSA-ELM故障診斷模型。隨機選取各種狀態(tài)的26組特征向量,分別對所建立的ELM、SSA-ELM、PSO-ELM、GWO-ELM4種模型進行訓練。利用每種狀態(tài)剩余的26組特征向量作為測試集數據,對SSA-ELM模型分類效果進行驗證,分類效果圖如圖9所示。為證明SSA-ELM模型的分類效果,利用該測試集分別對PSO-ELM、GWO-ELM、ELM模型進行測試,驗證結果如圖10~圖12所示。 圖9 SSA-ELM模型單次分類效果圖 圖10 PSO-ELM模型單次分類效果圖 圖11 GWO-ELM模型單次分類效果圖 圖12 ELM模型單次分類效果圖 由圖9~圖12可知,針對本文測試集,PSO-ELM、GWO-ELM、ELM模型的分類準確率分別為97%、96%、90%,而本文所提出的SSA-ELM模型的分類準確率達到了98%。為進一步驗證實驗結果的準確性,分別對4種模型重復20次實驗,并計算平均值,得到的診斷結果如表2所示。 表2 實驗結果對比 通過表2可知,本文所提出的SSA-ELM模型的平均訓練精度為100%,平均測試精度為98.06%,具有更高的診斷精度;從診斷時間來看,與同類模型GWO-ELM、PSO-ELM模型進行相比,該方法所需的診斷時間較短,需要30 s左右,同樣占有優(yōu)勢。 針對風機齒輪箱的故障識別與診斷問題,提出了小波閾值去噪、CEEMDAN樣本熵和SSA-ELM融合方法,并從數據預處理、故障特征提取和故障分類識別三個方面進行了討論,最后經過實驗對比驗證了該方法的有效性和準確性。本研究的主要結論如下: (1)采用小波閾值去噪的方法對齒輪箱振動信號進行預處理,很好地避免了噪聲對振動信號的干擾,為后期準確識別齒輪箱的不同狀態(tài)奠定了基礎。 (2)將CEEMDAN分解應用于風機齒輪箱故障診斷,大大降低了模態(tài)混疊問題。之后,利用皮爾遜相關系數所選取的有效分量的樣本熵,更好地反映了齒輪箱的故障信息。 (3)將小波閾值去噪方法、CEEMDAN樣本熵和SSA-ELM方法相結合,應用于風機齒輪箱的故障分類與識別。通過QPZZ-Ⅱ旋轉機械故障模擬實驗平臺模擬齒輪箱的實測數據,對齒輪箱不同狀態(tài)的診斷,驗證了該方法的有效性,通過對比實驗,表明該方法具有更高的診斷精度。2.2 ELM原理
2.3 SSA優(yōu)化ELM模型
2.4 故障診斷模型
3 實驗對比分析
3.1 數據采集與預處理
3.2 基于CEEMDAN分解的特征提取
3.3 實驗對比分析
4 結論