時(shí)培明, 范雅斐, 伊思穎, 韓東穎
(1. 燕山大學(xué) 電氣工程學(xué)院, 河北 秦皇島 066004;2. 燕山大學(xué) 車輛與能源學(xué)院,河北 秦皇島 066004)
軸承作為基礎(chǔ)的支撐零件,是風(fēng)機(jī)中應(yīng)用最為廣泛的零件之一。風(fēng)電機(jī)組工作條件惡劣,工況復(fù)雜,其減速箱軸承是故障頻繁發(fā)生的關(guān)鍵部件之一,因而針對(duì)風(fēng)機(jī)軸承的故障診斷方法技術(shù)的探索一直是學(xué)術(shù)界的研究熱點(diǎn)[1-2]。然而, 風(fēng)機(jī)軸承的振動(dòng)信號(hào)一般是非線性非平穩(wěn)性的,如何從原始信號(hào)中提取有效的特征實(shí)現(xiàn)準(zhǔn)確診斷是一個(gè)很大的挑戰(zhàn)。最新進(jìn)展證明了深度學(xué)習(xí)算法[2-4]在處理復(fù)雜非線性、高維機(jī)械信號(hào)方面的高效性。其中,自動(dòng)編碼器網(wǎng)絡(luò)無監(jiān)督的學(xué)習(xí)模式有其突出的優(yōu)勢(shì)。Qi等[5]提出的經(jīng)驗(yàn)?zāi)B(tài)和疊加稀疏編碼器兩階段學(xué)習(xí)算法,證明了編碼器較強(qiáng)的特征學(xué)習(xí)能力。Li等[6]將距離度量學(xué)習(xí)和k-means聚類方法集成到自編碼網(wǎng)絡(luò)結(jié)構(gòu)中,表現(xiàn)出較高的分類精度。Zhang等[7]構(gòu)造了流形稀疏編碼器神經(jīng)網(wǎng)絡(luò),試驗(yàn)證明,該方法能更好地提取出偶識(shí)別性的高級(jí)特征。Jiang等[8]提出使用多個(gè)噪聲級(jí)順序地訓(xùn)練降噪編碼器,從輸入數(shù)據(jù)中以不同的尺度捕獲更詳細(xì)的信息,提高診斷正確率。然而,多數(shù)算法沒有表現(xiàn)出穩(wěn)定的診斷性能,且在保證診斷率的同時(shí)需要較長(zhǎng)的診斷時(shí)間。
本文提出基于修正的自動(dòng)編碼器-層疊降噪編碼器(stacked denoising autoencoder,SDAE),通過網(wǎng)絡(luò)架構(gòu)的多重非線性變換,實(shí)現(xiàn)自適應(yīng)魯棒學(xué)習(xí)。結(jié)合希爾伯特振動(dòng)分解(Hilbert vibration decomposition,HVD)高分解效率和小波包分解(wavelet packet decomposition,WPD)構(gòu)造數(shù)據(jù)之間非線性映射關(guān)系的優(yōu)點(diǎn),克服了振動(dòng)信號(hào)的噪聲干擾,提高了診斷性能,同時(shí)能量熵的低維表示也降低了故障診斷時(shí)間。低維預(yù)處理結(jié)果作為SDAE的網(wǎng)絡(luò)輸入,完成網(wǎng)絡(luò)的特征學(xué)習(xí)和故障分類。試驗(yàn)證明,本文提出的新的特征學(xué)習(xí)方法——HWSDAE方法能有效提高風(fēng)機(jī)軸承故障分類精度。
HVD是由Feldman等提出的一種經(jīng)典的振動(dòng)信號(hào)分解算法[9],將信號(hào)分解為幅值大小不同的分量之和,在處理非穩(wěn)定信號(hào)時(shí)表現(xiàn)出較為突出的優(yōu)越性。算法具體分解步驟如下。
步驟1希爾伯特變換。對(duì)于任意一個(gè)非平穩(wěn)連續(xù)時(shí)間信號(hào)x(t),其Hilbert 變換可表示為
(1)
(2)
步驟2幅值最大分量的頻率估計(jì)。多分量非平穩(wěn)信號(hào)可以進(jìn)行分解,根據(jù)式(2),信號(hào)x(t)的瞬時(shí)頻率f(t)也可表示為
(3)
式中:前半部分f1(t)為信號(hào)幅值最大頻率的瞬時(shí)頻率;后半部分表示與前者相比快速變化的震蕩頻率部分。后者可以利用HVD的低通濾波器進(jìn)行濾除。
步驟3同步檢測(cè)求幅值和相位。利用正余弦函數(shù)構(gòu)造兩個(gè)正交信號(hào),并同步檢測(cè)出瞬時(shí)頻率對(duì)應(yīng)的瞬時(shí)幅值a(t)和相位θ(t)。
步驟4分離迭代。經(jīng)步驟1~步驟3分離得到x(t)中幅值的最大分量
(4)
將x(t)與x1(t)的差值作為初始信號(hào)x0(t),即
x0(t)=x(t)-x1(t)
(5)
重復(fù)步驟2、步驟3,可得到各層分量xi(t),i=1,2,3,…設(shè)置迭代次數(shù)N或者x0(t)的歸一化標(biāo)準(zhǔn)差σ<0.001,作為迭代的終止條件。
步驟5根據(jù)峭度與信號(hào)沖擊強(qiáng)弱的關(guān)系選取模態(tài)分量S。
小波包分析[10]是改進(jìn)的小波變換,克服了小波變換對(duì)于高頻段的頻率分辨率較差的缺陷。將故障信號(hào)進(jìn)行小波包分解,WPD序列按照頻帶由低到高的階數(shù)進(jìn)行排序,計(jì)算各頻帶所占的能量熵,作為HWSDAE的輸入。詳細(xì)步驟如下。
步驟1對(duì)峭度選取分量S進(jìn)行j(本文令j=5)層小波包分解。Xij為了分解后第i層中的第j個(gè)節(jié)點(diǎn)所在頻段的小波包分解對(duì)應(yīng)的系數(shù)大小。
步驟2對(duì)底層小波包分解系數(shù)進(jìn)行重構(gòu)。將步驟1中得到的32個(gè)頻帶的特征信號(hào)序列進(jìn)行重構(gòu)。Sij為Xij對(duì)應(yīng)的重構(gòu)信號(hào)。S5j為第5層各節(jié)點(diǎn)的重構(gòu)信號(hào),則S表示為
(6)
(7)
式中:N為原始信號(hào)長(zhǎng)度;Hij為信號(hào)的第i層第j個(gè)小波包能量熵。
使用WPD分解矩陣的優(yōu)勢(shì)顯而易見,矩陣將信號(hào)分離到單獨(dú)的頻帶中,降低了被分析信號(hào)的總體復(fù)雜度,提取頻帶內(nèi)和頻帶間的特征比直接從原始信號(hào)中提取特征更容易,有助于提高模型的故障診斷性能[11]。
Vincent等提出了一個(gè)修正版的經(jīng)典AE(auto-encoder,AE)[12],并命名為DAE(denoising autoencoder,DAE)。DAE是從AE的基本思想出發(fā),隨機(jī)破壞原始輸入信號(hào),避免其輸出只是輸入的簡(jiǎn)單映射,形成更具魯棒性的表示。AE通過對(duì)隱藏特征進(jìn)行編碼解碼,使網(wǎng)絡(luò)輸出盡可能與輸入接近。標(biāo)準(zhǔn)的AE是一個(gè)全連接的3層神經(jīng)網(wǎng)絡(luò):輸入層、隱藏層和輸出層。結(jié)構(gòu)圖如圖1所示。
輸入層和隱藏層構(gòu)成編碼網(wǎng)絡(luò)
h=f(x)=Sf(WEx+bE)
(8)
隱藏層和輸出層構(gòu)成解碼網(wǎng)絡(luò)
y=g(h)=Sg(WDx+bD)
(9)
式中:x=[x1,x2,…,xn]∈Rn×1為輸入值;h=[h1,h2,…,hm]∈Rm×1為隱藏值;y=[y1,y2,…,yn]∈Rn×1為輸出值;f(·)和g(·)為激活函數(shù)。在標(biāo)準(zhǔn)的AE算法中,激活函數(shù)常采用S型函數(shù)即Sigmoid函數(shù),如式(10)所示。
圖1 標(biāo)準(zhǔn)AE模型Fig.1 Standard AE model
(10)
其中,編碼器網(wǎng)絡(luò)為ZE=WEx+bE,解碼器網(wǎng)絡(luò)為ZD=WDh+bD。WE∈Rm×n和WD∈Rn×m分別為編碼和解碼網(wǎng)絡(luò)的權(quán)值,bE∈Rm×1和bD∈Rn×1分別為偏置。AE將輸入數(shù)據(jù)加入權(quán)重參數(shù)W進(jìn)行編碼,經(jīng)過激活函數(shù)并進(jìn)行解碼,該訓(xùn)練過程是為了尋求一組網(wǎng)絡(luò)參數(shù)最小化損失函數(shù)。損失函數(shù)定義為輸入與輸出的二范數(shù),即
(11)
式中:N為訓(xùn)練樣本數(shù);‖·‖2為二范數(shù)模型。由此可知,該目標(biāo)函數(shù)是一個(gè)二次凸函數(shù),依次求解偏導(dǎo)數(shù),采用批量梯度下降法(batch gradient descent,BGD)更新權(quán)值參數(shù),并通過反向傳播算法進(jìn)行網(wǎng)絡(luò)微調(diào),最終找到全局最優(yōu)解。
(12)
層疊降噪自編碼器(stacked denoising autoencoder,SDAE)是多個(gè)DAE單元的堆棧,由一個(gè)輸入層、一個(gè)輸出層和多個(gè)隱藏層搭建而成。輸入數(shù)據(jù)通過逐層的學(xué)習(xí)表示,進(jìn)行特征的空間轉(zhuǎn)換,能夠捕捉更多數(shù)據(jù)的內(nèi)在信息。另外,損壞數(shù)據(jù)輸入的訓(xùn)練過程是無監(jiān)督的,其主要目的是從未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)特征表示,避免了人為添加樣本標(biāo)簽的步驟,提高了工作效率的同時(shí)減少了對(duì)主觀經(jīng)驗(yàn)的依賴,也更加適用于滾動(dòng)軸承故障診斷的實(shí)際場(chǎng)景。輸出端添加Softmax分類層,構(gòu)建一個(gè)具有特征提取和模式識(shí)別功能的深度神經(jīng)網(wǎng)絡(luò)模型。
本文提出的HWSDAE算法模型是以SDAE深度學(xué)習(xí)為改進(jìn)基礎(chǔ),結(jié)合HVD時(shí)頻分析工具和小波包降維算法對(duì)原振動(dòng)信號(hào)進(jìn)行預(yù)處理,處理結(jié)果作為模型訓(xùn)練的輸入,利用SDAE網(wǎng)絡(luò)的自身特性,進(jìn)行無監(jiān)督網(wǎng)絡(luò)訓(xùn)練和參數(shù)優(yōu)化完成故障分類。本文所提方法流程圖(見圖2)、模型圖(見圖3)及詳細(xì)診斷步驟總結(jié)如下。
步驟1將代表不同軸承故障類型的數(shù)據(jù)根據(jù)樣本點(diǎn)的設(shè)定進(jìn)行隨機(jī)分段,按照一定比例分配到訓(xùn)練集和測(cè)試集。分別定義為Datatrain,Datatest。
步驟2試驗(yàn)設(shè)定將數(shù)據(jù)進(jìn)行3層HVD模態(tài)分解,選取峭度值最大的模態(tài)分解量參與下一步的降維;接著進(jìn)行5層小波包分解,得到32樣本大小的能量熵,并以此構(gòu)造特征向量。同理,測(cè)試集也進(jìn)行上述步驟。分別定義為Trainset,Testset。
步驟3將步驟2得到的特征數(shù)據(jù)作為SDAE網(wǎng)絡(luò)的輸入,數(shù)據(jù)在深度學(xué)習(xí)網(wǎng)絡(luò)中進(jìn)行噪聲破壞、隱藏層壓縮、無監(jiān)督訓(xùn)練和有監(jiān)督微調(diào)等過程。網(wǎng)絡(luò)頂層添加Softmax分類層。
步驟4將步驟2得到的測(cè)試集Testset放入訓(xùn)練完成的編碼器網(wǎng)絡(luò),并給出對(duì)應(yīng)的健康狀況標(biāo)簽以及分類準(zhǔn)確率。
圖2 HWSDAE故障診斷流程圖Fig.2 Flowchart of HWSDAE fault diagnosis
圖3 HWSDAE故障診斷模型圖Fig.3 Model diagram of HWSDAE fault diagnosis
為了使網(wǎng)絡(luò)模型最優(yōu)化學(xué)習(xí),本節(jié)以西儲(chǔ)數(shù)據(jù)軸承外圈故障振動(dòng)信號(hào)為例,進(jìn)行參數(shù)選擇。相對(duì)標(biāo)準(zhǔn)差和峭度值兩個(gè)評(píng)估指標(biāo)的選擇基于模態(tài)信號(hào)穩(wěn)定性和對(duì)信號(hào)敏感度的表現(xiàn)。其中,相對(duì)標(biāo)準(zhǔn)差越小表示模態(tài)信號(hào)相對(duì)原信號(hào)相似度越高;峭度值越大表示對(duì)故障信號(hào)的敏感度越高。
(1) HVD分解模態(tài)數(shù)
以5個(gè)模態(tài)分量的HVD分解為例,如圖4所示。由圖4可知,HVD分量1與原信號(hào)最接近,高頻部分較為突出;分量2,3的波形圖波動(dòng)明顯,信號(hào)的低頻信息被細(xì)化分解;隨著分解模態(tài)數(shù)的增加,頻譜波動(dòng)幅度和范圍變小,頻譜幅值量級(jí)在1×10-3左右,分解過程所消耗的時(shí)間也變長(zhǎng)。圖5表明,相對(duì)標(biāo)準(zhǔn)差在3層以后趨于穩(wěn)定,且在3層分解量的峭度最大。綜上分析,我們?cè)O(shè)定HVD的模態(tài)分解數(shù)為3。
(2) 網(wǎng)絡(luò)隱藏層和節(jié)點(diǎn)數(shù)
由于深度學(xué)習(xí)網(wǎng)絡(luò)自身的深層挖掘特性,因此需要在進(jìn)行網(wǎng)絡(luò)選擇和訓(xùn)練時(shí)評(píng)估網(wǎng)絡(luò)隱藏層及節(jié)點(diǎn)數(shù)對(duì)診斷性能的影響。表1統(tǒng)計(jì)了上述兩個(gè)因素對(duì)系統(tǒng)模型表現(xiàn)性能的影響,由表1可知,當(dāng)輸入層為單元數(shù)為32 時(shí),一個(gè)或兩個(gè)隱藏層的設(shè)置明顯要優(yōu)于3個(gè)隱藏層,且表現(xiàn)穩(wěn)定,隨著隱藏層的增加,較深的網(wǎng)絡(luò)結(jié)構(gòu)會(huì)出現(xiàn)過擬合現(xiàn)象,導(dǎo)致診斷性能略有下降。當(dāng)隱藏層數(shù)設(shè)定為2且節(jié)點(diǎn)數(shù)均為100時(shí),網(wǎng)絡(luò)的重構(gòu)誤差最小,表明此時(shí)的網(wǎng)絡(luò)訓(xùn)練特征包含了更多的故障信息,模型表現(xiàn)出突出穩(wěn)定的診斷性能。
基于上述試驗(yàn),選擇由32和4個(gè)神經(jīng)元構(gòu)造輸入層和輸出層,兩個(gè)隱藏層均為100個(gè)神經(jīng)元的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)行基于深度網(wǎng)絡(luò)的特征學(xué)習(xí)。
圖4 5個(gè)模態(tài)分量時(shí)頻圖Fig.4 Time-frequency diagram of 5 modal components
圖5 指標(biāo)趨勢(shì)圖Fig.5 Indicator trend chart
表1 網(wǎng)絡(luò)隱藏層及節(jié)點(diǎn)設(shè)置
為了證明所提方法的穩(wěn)定有效性,采用兩個(gè)數(shù)據(jù)集進(jìn)行算法驗(yàn)證。訓(xùn)練集、測(cè)試集均包含4種不同工況數(shù)據(jù),如表2所示。
表2 試驗(yàn)數(shù)據(jù)描述
(1) 凱斯西儲(chǔ)數(shù)據(jù)集
圖6所示是凱斯西儲(chǔ)大學(xué)試驗(yàn)平臺(tái),試驗(yàn)臺(tái)設(shè)置的詳細(xì)信息可在文獻(xiàn)[13]中找到。本文使用12 000采樣頻率下的電機(jī)載荷為0負(fù)載的4種運(yùn)行狀態(tài)的驅(qū)動(dòng)端加速度數(shù)據(jù)(DE),另外,外圈的損傷點(diǎn)選擇6點(diǎn)鐘方向。試驗(yàn)設(shè)定每種故障各取30組,每組有3 000個(gè)樣本點(diǎn),等比例分配給訓(xùn)練集和測(cè)試集,其樣本空間大小均為15×3 000。
圖6 凱斯西儲(chǔ)大學(xué)試驗(yàn)平臺(tái)Fig. 6 The experimental platform of Western Reserve University
將本文所提方法與現(xiàn)有的SAE,DBN和原數(shù)據(jù)輸入SDAE網(wǎng)絡(luò)進(jìn)行比較,4種模型6次分類精度平均值以及所需的診斷時(shí)間如圖7所示。本文所提HWSDAE方法的平均準(zhǔn)確率高達(dá)99.49%,單次診斷率可達(dá)100%。HWSDAE網(wǎng)絡(luò)比原數(shù)據(jù)直接輸入SDAE網(wǎng)絡(luò)表現(xiàn)出更為突出的診斷性能,準(zhǔn)確率提高最為明顯,可達(dá)13.52%,導(dǎo)致該現(xiàn)象的原因是沒有經(jīng)過預(yù)處理的數(shù)據(jù)維度較高,含有更大比例的干擾噪聲和其他冗余信息,且非線性信號(hào)不利于深度網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)。
圖7 不同算法結(jié)果對(duì)比圖Fig.7 Comparison chart of different algorithm results
(2) 實(shí)驗(yàn)室平臺(tái)數(shù)據(jù)集
第二組振動(dòng)數(shù)據(jù)是在如圖8所示的實(shí)驗(yàn)室平臺(tái)上采集的。在轉(zhuǎn)速為1 500 r/min,3 kHz的采集頻率下采集軸承的正常狀態(tài)、內(nèi)圈故障、外圈故障和滾動(dòng)體故障的振動(dòng)數(shù)據(jù)。試驗(yàn)設(shè)定每種故障各取30組,每組有1 800個(gè)樣本點(diǎn),等比例分配給訓(xùn)練集和測(cè)試集,其樣本空間大小均為15×1 800。
圖8 實(shí)驗(yàn)室設(shè)計(jì)試驗(yàn)平臺(tái)Fig. 8 The experimental platform of laboratory design
圖9為4種算法模型在第二組數(shù)據(jù)集上的試驗(yàn)結(jié)果對(duì)比圖。相比第一組數(shù)據(jù)集整體準(zhǔn)確率略有下降,但本文提出的HWSDAE算法的性能表現(xiàn)依然最為突出,準(zhǔn)確率高達(dá)98.72%,且沒有因?yàn)榫W(wǎng)絡(luò)層的疊加造成時(shí)間消耗。由圖7、圖9可知,DBN網(wǎng)絡(luò)的性能表現(xiàn)較為穩(wěn)定,明顯優(yōu)于SDAE算法,但診斷時(shí)間和平均準(zhǔn)確率都差于SAE和HWSDAE網(wǎng)絡(luò)。HWSDAE與SAE網(wǎng)絡(luò)相比獲得了更穩(wěn)定的訓(xùn)練時(shí)間,主要是因?yàn)閿?shù)據(jù)破壞可以減少學(xué)習(xí)到的特征的反向傳播時(shí)間,具有更好的魯棒性。同時(shí),平均準(zhǔn)確率相比SAE網(wǎng)絡(luò)提高了3.71%。試驗(yàn)結(jié)果表明,合適比例的噪聲存在可以明顯增強(qiáng)網(wǎng)絡(luò)的魯棒性,提高診斷性能,即本文提出的HWSDAE算法在風(fēng)電機(jī)組的故障診斷上表現(xiàn)出更高的診斷性能,具有一定的實(shí)際意義。
圖9 不同算法結(jié)果對(duì)比圖Fig.9 Comparison chart of different algorithm results
(1) 本文提出了一種新的智能算法進(jìn)行風(fēng)機(jī)軸承的故障診斷,自適應(yīng)挖掘振動(dòng)數(shù)據(jù)的潛在特征。采用聯(lián)合降維方法對(duì)信號(hào)進(jìn)行特征提取,使故信息更具表現(xiàn)化,同時(shí)降低了故障診斷時(shí)間。
(2) 利用凱斯西儲(chǔ)軸承數(shù)據(jù)和實(shí)驗(yàn)室試驗(yàn)平臺(tái)數(shù)據(jù)為數(shù)據(jù)集,對(duì)所提出的HWSDAE方法和現(xiàn)有的3種深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行了算法驗(yàn)證和試驗(yàn)對(duì)比。結(jié)果表明,本文提出的方案模型不僅在診斷時(shí)間方面優(yōu)于其他3種模型,而且表現(xiàn)出高達(dá)99.49%的平均診斷準(zhǔn)確率,有效識(shí)別軸承健康狀況,顯著提高了故障分類準(zhǔn)確性。