董永峰,孫躍華,高立超,韓 鵬,季海鵬
(1.河北工業(yè)大學(xué)人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300401;2.河北省數(shù)據(jù)驅(qū)動工業(yè)智能工程研究中心(河北工業(yè)大學(xué)),天津 300401;3.中信戴卡股份有限公司,河北秦皇島 066011;4.天津開發(fā)區(qū)精諾瀚海數(shù)據(jù)科技有限公司,天津 300401;5.河北工業(yè)大學(xué)材料科學(xué)與工程學(xué)院,天津 300401)
隨著現(xiàn)代工業(yè)的迅速發(fā)展,“智能工廠”中的機(jī)械設(shè)備朝著集成化、復(fù)雜化方向蓬勃發(fā)展。滾動軸承作為旋轉(zhuǎn)機(jī)器中的部件得到廣泛應(yīng)用,伴隨機(jī)械設(shè)備的持續(xù)運行,軸承不可避免出現(xiàn)各式各樣的故障。據(jù)統(tǒng)計在旋轉(zhuǎn)機(jī)械的故障中,因軸承損壞造成的故障約占30%。造成故障的原因復(fù)雜多樣,滾動軸承的故障診斷是機(jī)械設(shè)備故障診斷與狀態(tài)監(jiān)測技術(shù)的重要內(nèi)容。因此,機(jī)械設(shè)備故障診斷對于提高工業(yè)生產(chǎn)效率和經(jīng)濟(jì)效益具有重要的意義。
基于信號處理的故障診斷方法在以數(shù)據(jù)驅(qū)動的方法中效果顯著,經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)最早是由Yadav 等提出的一種新型自適應(yīng)信號時頻域的處理技術(shù),該方法將信號局部時變特征分解成若干固有模態(tài)分量(Intrinsic Mode Function,IMF)之和,突出非平穩(wěn)、非線性信號數(shù)據(jù)的物理特征。Gao 等針對EMD 過程中的經(jīng)驗?zāi)B(tài)混疊現(xiàn)象,利用互補經(jīng)驗?zāi)B(tài)分解(Complementary Ensemble EMD,CEEMD)對滾動軸承振動信號分解,獲取具有故障特征IMF 的奇異熵、能量熵和置換熵,提出熵融合的特征提取方法,借助核主成分分析(Kernal Principal Component Analysis,KPCA)和粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法實現(xiàn)滾動軸承的分類。Shifat 等使用連續(xù)小波變化(Continuous Wavelet Transform,CWT)在時頻域中分析集合經(jīng)驗?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition,EEMD)生成的IMF,以更好地定位故障頻率并提取一些指示電動機(jī)健康狀態(tài)的統(tǒng)計特征,診斷永磁無刷直流電動機(jī)的不同故障狀態(tài)。Xiang 等提出了概率主成分分析(Probabilistic PCA,PPCA)和光譜峰度(Skewness and Kurtosis,SK)融合方法實現(xiàn)滾動元件軸承故障檢測,通過對不同故障類型的滾動軸承和數(shù)值模擬進(jìn)行實驗研究證明了該方法的有效性。傳統(tǒng)的基于信號特征提取的方法雖然取得不錯的進(jìn)展,但仍存在對先驗知識要求高、收斂速度慢、診斷精度不夠等先天缺點。
深度神經(jīng)網(wǎng)絡(luò)是解決復(fù)雜系統(tǒng)診斷問題有效的模型,可直接對高度非線性、復(fù)雜、多維系統(tǒng)數(shù)據(jù)進(jìn)行建模,挖掘數(shù)據(jù)與診斷目標(biāo)的映射關(guān)系。張弘斌等利用連續(xù)小波變換提取轉(zhuǎn)子兩端軸承振動信號的時頻域特征,構(gòu)造3 類振動信號的單通道二維圖形樣本并進(jìn)行融合,輸入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)中實現(xiàn)特征提取和軸承故障信號的精確分類。隨著反饋神經(jīng)網(wǎng)絡(luò)在自然語言處理(Natural Language Processing,NLP)領(lǐng)域取得重大突破,范宇雪等將自適應(yīng)白噪聲的完整集合經(jīng)驗?zāi)B(tài)分解(Complete EEMD with Adaptive Noise,CEEMDAN)與傅里葉變換對信號進(jìn)行分解后輸入雙向長短期記憶(Bidirectional Long Short-Term Memory,BiLSTM)神經(jīng)網(wǎng)絡(luò)實現(xiàn)對高速列車輪軸承的故障診斷。Hoang 等根據(jù)數(shù)據(jù)源設(shè)置有n
個分支的深度神經(jīng)網(wǎng)絡(luò)模型,每個分支由卷積層、批歸一化層、池化層組成實現(xiàn)故障軸承故障診斷,證明多分支模型比單傳感器具有更高的診斷性能。Tan 等設(shè)計一種新的單門聯(lián)合(Single Gated Unite,SGU)遞歸神經(jīng)網(wǎng)絡(luò)作為LSTM 神經(jīng)網(wǎng)絡(luò)的簡化策略,利用小波包分解提取特征作為雙向單門聯(lián)合的輸入實現(xiàn)軸承的故障診斷,減少達(dá)36%的網(wǎng)絡(luò)參數(shù)量,提高了故障診斷的時間效率。Liu 等提出彈性網(wǎng)絡(luò)和LSTM 相結(jié)合,并將彈性網(wǎng)絡(luò)的正則化項引入LSTM 結(jié)構(gòu)避免模型訓(xùn)練過程過擬合,實現(xiàn)了軸承剩余壽命預(yù)測。Zou 等將信號預(yù)處理技術(shù)EEMD 與LSTM 神經(jīng)網(wǎng)絡(luò)結(jié)合,避免傳統(tǒng)EMD 經(jīng)驗?zāi)B(tài)混疊現(xiàn)象,完成對軸承狀態(tài)的智能分類與識別。陳偉等為實現(xiàn)滾動軸承不同故障類型的振動加速度信號的智能分類,將隨機(jī)搜索(Random Search,RS)與LSTM 神經(jīng)網(wǎng)絡(luò)相結(jié)合,以原始故障數(shù)據(jù)作為輸入,驗證所提算法具有較高的泛化能力和魯棒性。Qiao 等結(jié)合CNN 和LSTM 神經(jīng)網(wǎng)絡(luò)構(gòu)建了端到端軸承故障診斷模型,模型采用時頻雙輸入結(jié)構(gòu),充分提取軸承振動數(shù)據(jù)的時空特征,實現(xiàn)了在強噪聲及可變負(fù)載工況下的軸承故障診斷。Hao 等提出了一種用于軸承故障診斷的 1DCNN-LSTM(one-Dimensional Convolutional and Bidirectional Long Short-Term Memory)網(wǎng)絡(luò)端到端解決方案,該方案直接從一維卷積層、池化層和LSTM層的多個傳感器測量的振動信號中提取時空特征,最后由輸出層完成軸承故障診斷進(jìn)行分類。Qiu 等基于雙小波包變換技術(shù),設(shè)計雙向長期記憶(Bidirectional Long Term Memory,Bi-LTM)神經(jīng)網(wǎng)絡(luò),僅利用改進(jìn)的長期記憶對滾動軸承特征數(shù)據(jù)進(jìn)行處理得到故障診斷結(jié)果。Xia 等將多種傳感器采集到的信號進(jìn)行融合并直接輸入到深度LSTM模型中,使用新收集的數(shù)據(jù)對模型參數(shù)進(jìn)行微調(diào),實現(xiàn)基于數(shù)據(jù)驅(qū)動的設(shè)備剩余使用壽命預(yù)測。傳統(tǒng)基于LSTM 神經(jīng)網(wǎng)絡(luò)在故障診斷任務(wù)中取得顯著成就,但同時忽略了時序性數(shù)據(jù)的上下文信息的完整性。與此同時,基于傳統(tǒng)CNN 的軸承故障診斷不能充分挖掘時序性數(shù)據(jù)的上下文相關(guān)性,模型不能對時序性特征進(jìn)行充分提取。針對以上問題,本文提出基于改進(jìn)1DCNN 與BiLSTM 神經(jīng)網(wǎng)絡(luò)模型的雙通道模型融合的解決方案,并嘗試在各通道中引入改進(jìn)的SENet(Squeeze and Excitation Network)模塊實現(xiàn)對特征通道的加權(quán)注意力機(jī)制。
本文的主要工作如下:
1)提出基于改進(jìn)1DCNN-BiLSTM 雙通道模型,使用經(jīng)CEEMDAN 信號技術(shù)處理原始故障振動信號的時序性數(shù)據(jù)作為模型輸入,免去人工提取特征步驟。
2)使用BiLSTM 對數(shù)據(jù)的當(dāng)前狀態(tài)及其前后時間序列信息特征進(jìn)行充分提取。與此同時,另一通道使用1DCNN 對時序數(shù)據(jù)的局部非相關(guān)性信息進(jìn)行提取。
3)將基于改進(jìn)的SENet 模塊對特征數(shù)據(jù)通道的加權(quán),同時作用于兩個不同通道,有效剔除噪聲干擾相關(guān)特征。
4)將雙通道模型提取的數(shù)據(jù)特征融合,實現(xiàn)對數(shù)據(jù)特征的合并提取并在輸出層實現(xiàn)故障信號的分類。
CEEMDAN 是為了避免EMD 集合平均時固有模態(tài)分量對齊問題,而在CEEMD 的過程中自適應(yīng)添加白噪聲以減小模態(tài)效應(yīng)的分解過程,可以達(dá)到濾波去噪,降低迭代次數(shù)的目的。算法步驟如下:
1)對原始故障時序信號X
(t
)添加自適應(yīng)白噪聲進(jìn)行一階EMD,如式(1)~(2)所示:r
(t
),接著在r
(t
)中添加自適應(yīng)白噪聲經(jīng)EMD得到IMF分量F
(n
(t
)),對其再進(jìn)行一階EMD,如式(3)~(5)所示:k
個剩余分量r
(t
),對剩余分量加入白噪聲進(jìn)行一階EMD,如式(6)~(7)所示:LSTM 神經(jīng)網(wǎng)絡(luò)是一種適用于處理時序性數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型,通過在其細(xì)胞單元中通過引入“門”結(jié)構(gòu),實現(xiàn)對細(xì)胞結(jié)構(gòu)信息的選擇性刪除與添加,解決循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在反向傳播過程中易出現(xiàn)的“梯度消失”和“梯度爆炸”等問題。
LSTM 神經(jīng)單元的三個“門”結(jié)構(gòu)具體包括:遺忘門、輸入門和輸出門。遺忘門接收上一細(xì)胞單元的輸出h
并結(jié)合當(dāng)前時刻細(xì)胞單元的輸入x
來決定保護(hù)或控制信息的繼續(xù)傳遞;輸入門決定了哪些信息加入到細(xì)胞狀態(tài)中:首先通過一個輸入門操作決定更新哪些信息,接著通過tanh 層得到新的細(xì)胞狀態(tài)C
′,這些信息被用于更新到細(xì)胞信息中。輸出門決定了哪些信息可作為當(dāng)前細(xì)胞狀態(tài)的輸出:首先通過上一細(xì)胞單元的輸出h
結(jié)合當(dāng)前時刻細(xì)胞單元的輸入x
經(jīng)過輸出門的Sigmoid 激活得到判斷條件,決定部分細(xì)胞狀態(tài)作為輸出。細(xì)胞狀態(tài)經(jīng)過tanh 層得到范圍為(-1,1)的向量,將其與輸出門判斷條件相乘的結(jié)果作為該LSTM 細(xì)胞單元的輸出。然而BiLSTM 神經(jīng)網(wǎng)絡(luò)的隱藏層實現(xiàn)正向計算和反向計算兩個過程,可為網(wǎng)絡(luò)提供數(shù)據(jù)上下文信息,BiLSTM 的更新過程如式(14)~(16)所示:
CNN 通過局部連接和共享權(quán)值的方式對輸入數(shù)據(jù)進(jìn)行卷積、池化運算以提取相關(guān)特征。其中一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)廣泛應(yīng)用于傳感器數(shù)據(jù)的時間序列分析、具有固定長度周期的音頻信號數(shù)據(jù)分析和自然語言處理領(lǐng)域。傳感器采集的機(jī)械部件運行狀態(tài)的振動加速度信號多為時序性數(shù)據(jù),采用1DCNN 對重構(gòu)后的時序信號沿時間軸正方向進(jìn)行局部特征的提取,從整體數(shù)據(jù)集固定長度的片段中提取特征。
在1DCNN 中濾波器沿著時序數(shù)據(jù)的時間軸單個維度進(jìn)行滑動計算,卷積層計算如式(17)所示:
X
表示輸入數(shù)據(jù)向量;W
表示卷積核權(quán)重矩陣;b
為參與計算的偏置向量;f
(·)表示卷積計算的激活函數(shù)ReLU(Rectified Linear Unit),從整體一維數(shù)據(jù)集中固定長度(濾波器尺寸大?。┨崛∮行卣鳌?h3>1.4 改進(jìn)的SENet模塊近幾年,注意力機(jī)制被廣泛應(yīng)用于深度學(xué)習(xí)研究。Momenta 在ImageNet 2017 挑戰(zhàn)賽中奪冠的網(wǎng)絡(luò)架構(gòu)SENet即自適應(yīng)學(xué)習(xí)不同特征通道的重要程度,并依據(jù)重要程度賦予有用特征較高權(quán)重,抑制對當(dāng)前任務(wù)目標(biāo)影響不大的特征。
本文對SENet 中的SE 模塊進(jìn)行改進(jìn),在改進(jìn)的SE 模塊中,基于特征通道的注意力機(jī)制思想表示為:在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)計算操作后新建“旁路分支”。首先,進(jìn)行Squeeze 操作,將二維特征圖進(jìn)行數(shù)據(jù)維度壓縮變成一個實數(shù),即進(jìn)行全局感受野的池化操作,特征通道數(shù)不變;接著,進(jìn)行Excitation 操作,獲取不同特征通道的重要程度,并逐通道與原始特征實現(xiàn)加權(quán)乘法。本文采用先降維后升維的Bottleneck 結(jié)構(gòu)中全連接層+Sigmoid 函數(shù)來實現(xiàn)學(xué)習(xí)到不同通道的重要程度。
由于SE 模塊的通用性,意味著可將其嵌入其他網(wǎng)絡(luò)架構(gòu)中。特征數(shù)據(jù)經(jīng)過變換,CNN 中因參與計算的卷積核個數(shù)不同而發(fā)生通道維數(shù)變化,BiLSTM 因記憶神經(jīng)單元數(shù)目不同而發(fā)生特征通道維數(shù)變化,從而產(chǎn)生新的特征信號U
。在圖1 中,通道維數(shù)由d
變?yōu)?p>d,即為此時特征通道數(shù)。首先通過將通道中所有特征值取全局平均值;然后經(jīng)Sigmoid 激活函數(shù)得到每個通道的權(quán)重;最終不同通道乘上不同權(quán)重,實現(xiàn)對關(guān)鍵特征通道域的注意力機(jī)制。具體計算過程如下所示:圖1 通道注意力機(jī)制Fig.1 Channel attention mechanism
本文構(gòu)建改進(jìn)的1DCNN-BiLSTM 雙通道模型框架如圖2中的Model1 所示。模型由輸入層、特征提取模塊、融合分類層組成,借助改進(jìn)的SENet 模塊中實現(xiàn)注意力機(jī)制,同時作用于1DCNN 和BiLSTM 兩個通道對神經(jīng)網(wǎng)絡(luò)中的特征矩陣通道維度方向進(jìn)行權(quán)重分配。接著構(gòu)建無SENet 模塊的1DCNN-BiLSTM 雙通道模型Model2,與Model1 對比以驗證SENet 模塊的有效性。最后分別構(gòu)建加入改進(jìn)SENet 模塊的1DCNN 單通道模型Model3 和BiLSTM 單通道模型Model4,驗證雙通道模型特征提取對比傳統(tǒng)單通道模型的有效性及優(yōu)化效果。
圖2 構(gòu)建的4種模型框架結(jié)構(gòu)Fig.2 Four kinds of constructed model frame work structures
特征提取模塊設(shè)計兩個通道,原始時序數(shù)據(jù)經(jīng)CEEMDAN、歸一化處理后同時輸入雙通道模塊進(jìn)行數(shù)據(jù)特征提取。Channel1 為棧型雙向長短期記憶(stacked BiLSTM)神經(jīng)網(wǎng)絡(luò)模型,調(diào)整BiLSTM 網(wǎng)絡(luò)的記憶單元數(shù)目和神經(jīng)網(wǎng)絡(luò)的層數(shù),實現(xiàn)對不同維度信號特征的提??;Channel4 設(shè)置為一維卷積模型,調(diào)整一維卷積核數(shù)目實現(xiàn)對信號不同尺度特征的提??;Channel2、Channel3 分別在Channel1、Channel4基礎(chǔ)上加入改進(jìn)的SENet 模塊對參數(shù)傳遞過程中的不同維度特征進(jìn)行權(quán)重計算。最終通過融合層將雙通道提取到的特征進(jìn)行融合,由分類層的Softmax 分類器實現(xiàn)軸承不同位置、不同程度故障的分類。
通過對SENet 模塊進(jìn)行改進(jìn),即選擇一維全局平均池化代替用于處理圖片分類任務(wù)的二維全局平局池化。改進(jìn)模塊內(nèi)部結(jié)構(gòu)如圖3 所示,首先對輸入數(shù)據(jù)進(jìn)行一維全局平均池化操作得到一個標(biāo)量,即進(jìn)行Squeeze 操作;接著通過兩個全連接層得到(0,1)內(nèi)的權(quán)重值,兩層激活函數(shù)分別取ReLU與Sigmoid。原始通道中的每個元素值與對應(yīng)通道權(quán)重相乘,得到新的Feature Map,即進(jìn)行Excitation 操作。1DCNN 與BiLSTM 神經(jīng)網(wǎng)絡(luò)均可通過先Squeeze 后Excitation 操作實現(xiàn)特征矩陣的優(yōu)化,最終得到加權(quán)后的特征Feature Recalibration。
圖3 改進(jìn)SENet模塊Fig.3 Improved SENet module
在上述構(gòu)建模型的各Channel 中加入Dropout 層防止模型出現(xiàn)過擬合,與此同時,在Channel1、Channel3 中引入批歸一化BN(Batch Normalization)層,作用于stacked BiLSTM 神經(jīng)網(wǎng)絡(luò)的參數(shù)傳遞過程中,以提升模型收斂速度從而降低模型的訓(xùn)練時間。
對于Model1 和Model2 雙通道模型,將雙Channel 組合提取到的特征經(jīng)全連接(FC)層后輸入融合層進(jìn)行融合,進(jìn)而為分類層的輸入提供更多分類特征參數(shù)依據(jù)。分類層將融合后的樣本特征向量作為輸入,采用Softmax 分類器得到故障軸承振動加速度時序信號屬于各類別的概率分布,如式(23)所示:
m
代表分類層輸出層單元個數(shù),即故障信號類別數(shù)目。改進(jìn)的雙通道模型訓(xùn)練過程模型具體參數(shù)如表1 所示,記錄訓(xùn)練過程中驗證集精度最高時刻訓(xùn)練出的模型參數(shù)作為訓(xùn)練模型的最終參數(shù)。
表1 模型訓(xùn)練過程的參數(shù)Tab 1 Description of parameters of model training process
采用獨熱編碼對故障類別進(jìn)行標(biāo)記,分類層采用Softmax 多分類器得到故障樣本分別為m
類不同故障的概率分布,采用交叉熵代價函數(shù)作為模型的驗證損失函數(shù),如式(24)所示:i
(i
=0,1,…,n
)表示故障樣本;n
表示樣本總數(shù);a
表示期望輸出;y
表示神經(jīng)元的實際輸出。比較Softmax 多分類器的輸出預(yù)測概率分布與目標(biāo)類別概率分布的相似度得到模型的診斷精度。
本文實驗操作系統(tǒng)為64 位,設(shè)備信息:Windows 10 CPU為Intel Core i5-8265U,運行內(nèi)存16 GB,深度學(xué)習(xí)框架采用TensorFlow+Keras,編程語言選擇Python3.5。
實驗數(shù)據(jù)來源于美國凱斯西儲大學(xué)軸承數(shù)據(jù)中心的滾動軸承故障振動數(shù)據(jù)集。驅(qū)動端采用型號為6205-2RS JEM SKF 深溝球軸承,風(fēng)扇端采用型號為6203-2RS JEM SKF 深溝球軸承。電火花加工技術(shù)分別對置于驅(qū)動端和風(fēng)扇端的滾動軸承內(nèi)圈(Inner Raceway,IR)、外圈(Outer Raceway,OR)、滾動體(Ball,BO)3 個軸承位置布置等級的單點損傷。3 種故障直徑分別設(shè)置0.007 inch、0.014 inch、0.021 inch(1 inch=2.54 cm),3種故障深度分別設(shè)置0.011 inch、0.050 inch、0.150 inch,4 種不同負(fù)載(0 kN、1 kN、2 kN、3 kN)。由放置在驅(qū)動端、風(fēng)扇端和基座的加速度傳感器分別以12 kHz、48 kHz 的頻率對軸承振動數(shù)據(jù)進(jìn)行采集,獲取正常樣本文件8 個、外圈故障樣本文件53 個、內(nèi)圈故障樣本文件23和滾動體故障樣本文件11 個。
本文基于12 kHz 的采樣頻率對驅(qū)動端IR、OR 和BO 故障位置的3 種不同故障直徑共9 類故障、每類樣本以時間步長為100 劃分為1 000 個數(shù)據(jù)樣本進(jìn)行故障診斷實驗,9 類軸承故障實驗樣本信息如表2 所示。將CEEMDAN 后重構(gòu)、歸一化預(yù)處理后的信號數(shù)據(jù)集及對應(yīng)類別標(biāo)簽隨機(jī)劃分為訓(xùn)練集1 和測試集(7∶3),并將訓(xùn)練集1 進(jìn)一步隨機(jī)劃分為訓(xùn)練集2、驗證集2(9∶1)用于對模型當(dāng)前訓(xùn)練結(jié)果的評估。將預(yù)處理后的時序信號數(shù)據(jù)分別輸入到本節(jié)構(gòu)建的4 種不同結(jié)構(gòu)模型中進(jìn)行特征提取與參數(shù)訓(xùn)練。
表2 9類軸承故障實驗樣本信息Tab 2 Experimental sample information of 9 bearing faults
將正常振動信號數(shù)據(jù)與9 類不同故障位置、故障程度的振動加速度信號進(jìn)行可視化,如圖4 所示。軸承故障振動數(shù)據(jù)表現(xiàn)出周期性特點且振幅明顯高于正常振動數(shù)據(jù)。內(nèi)圈、外圈、滾動體3 種不同故障位置、同一故障位置不同故障直徑的振動信號之間存在周期和振幅差異。軸承滾動體位置3 種故障直徑振動數(shù)據(jù)、內(nèi)圈位置故障直徑為0.14 inch 的信號周期性、振幅大小等直觀性特征較其他故障信號弱;內(nèi)圈位置不同故障直徑的信號振幅差異較大。
圖4 正常、故障軸承振動加速度信號Fig.4 Normal and faulty bearing vibration acceleration signals
9 類原始振動故障信號按時間步長1 000 分別進(jìn)行CEEMDAN 信號預(yù)處理后生成多個IMF 分量,以驅(qū)動端內(nèi)圈故障深度為0.007 信號數(shù)據(jù)(BO_07)經(jīng)CEEMDAN 分解為例進(jìn)行可視化,如圖5 所示。分解完成后先通過濾波去噪(過濾前2 個高頻信號分量),再對剩余有效IMF 數(shù)據(jù)重構(gòu)。
圖5 BO_07信號CEEMDAN分解Fig.5 CEEMDAN decomposition of BO_07 signal
本文依次構(gòu)建四種不同結(jié)構(gòu)模型實現(xiàn)對軸承的對比故障診斷實驗。Model1 為改進(jìn)的SENet 模塊同時作用于1DCNN 通道和stacked BiLSTM 通道的1DCNN-BiLSTM 雙通道模型,Model2 為不添加SENet 的1DCNN-BiLSTM 雙通道模型,Model3 為1DCNN構(gòu)成的傳統(tǒng)單通道模型,Model4 為stacked BiLSTM 構(gòu)成傳統(tǒng)單通道模型。單/雙通道時間序列分類模型的Channel 中各層參數(shù)信息描述如表3 所示。原始驅(qū)動端振動信號樣本同時包含驅(qū)動端、風(fēng)扇端、基座加速度數(shù)據(jù),增加了時序性信號數(shù)據(jù)的維度。當(dāng)SENet 模塊作用于1DCNN 層后時,經(jīng)16 個卷積核計算后產(chǎn)生16 個新通道特征,即將數(shù)據(jù)特征一個通道的信息分解為16 個卷積核上的信號分量。核函數(shù)上的分量對關(guān)鍵信息的貢獻(xiàn)度存在差異。
表3 時間序列分類模型參數(shù)Tab 3 Parameters of time series classification model
當(dāng)SENet 模塊作用于BiLSTM 層后時,第一層BiLSTM 網(wǎng)絡(luò)實現(xiàn)對輸入序列高層次特征學(xué)習(xí),批歸一化過程之后利用注意力機(jī)制分別對第一層BiLSTM 各神經(jīng)單元分配注意力權(quán)重,求解后作為下一BiLSTM 網(wǎng)絡(luò)層的輸入。
為驗證改進(jìn)1DCNN-BiLSTM 雙通道模型的有效性和適應(yīng)性,對4 種構(gòu)建的模型進(jìn)行對比實驗,9 類故障識別率如圖6 所示。
圖6 軸承故障診斷分類混淆矩陣Fig.6 Confusion matrix of bearing fault diagnosis classification
對4 類模型進(jìn)行重復(fù)實驗取平均值,以避免模型診斷結(jié)果偶然性。對比Model1、Model3 及Model4 的訓(xùn)練過程曲線,如圖7 所示。3 種模型的診斷精度如圖8 所示。
圖7 Model1、Model3、Model4的訓(xùn)練過程Fig.7 Training processes of Model1,Model3,Model4
圖8 三種單/雙通道模型結(jié)果對比Fig.8 Comparison of results of three one-/dual-channel models
實驗結(jié)果顯示Model1 在測試集上表現(xiàn)最佳,損失下降到0.109 2,診斷精度最高達(dá)到96.87%。將基于通道的注意力機(jī)制單獨作用于Model3、Model4 時,其在測試集上的平均損失分別為0.187 3、0.144 1,平均診斷精度分別為94.56%、95.22%。證實此改進(jìn)的1DCNN-BiLSTM 雙通道模型較傳統(tǒng)單通道能更好挖掘軸承故障數(shù)據(jù)的時序相關(guān)性特征和局部區(qū)域的振動弱周期性規(guī)律。不加任何注意力機(jī)制的Model2平均診斷精度達(dá)到96.68%,損失值下降到0.116 2。
將加入改進(jìn)SENet 模塊的Model1 與Model2 進(jìn)行收斂速度對比實驗。訓(xùn)練過程中訓(xùn)練集、驗證集診斷精度曲線如圖9 所示,驗證損失收斂趨勢對比如圖10 所示。添加注意力機(jī)制的Model1 訓(xùn)練Epoch
=15 次后達(dá)到相對穩(wěn)定,未加入注意力機(jī)制的Model2 訓(xùn)練Epoch
=30 次后處于較穩(wěn)定狀態(tài)。由于添加SENet 模塊后,模型訓(xùn)練賦予了針對分類任務(wù)的關(guān)鍵特征通道較高的權(quán)重,改進(jìn)的Model1 訓(xùn)練收斂速度有明顯提升。圖9 Model1、Model2訓(xùn)練集與驗證集診斷精度曲線Fig.9 Training and validation diagnosis accuracy curves of Model1 and Model2
圖10 Model1、Model2模型訓(xùn)練收斂情況Fig.10 Training convergence conditions of Modle1 and Model2
經(jīng)重復(fù)對比實驗,本文構(gòu)建的改進(jìn)模型通過引入基于通道注意力機(jī)制,并將其同時作用于1DCNN 通道和stacked BiLSTM 通道時有最高的測試診斷精度達(dá)到96.87%,相對不加入SENet 模塊的雙通道模型Model2 而言,模型訓(xùn)練的收斂速度有顯著提升。證明改進(jìn)的SENet 模塊針對CNN、LSTM神經(jīng)網(wǎng)絡(luò)中不同記憶單元輸出權(quán)值的重要程度高低賦予權(quán)重,過濾噪聲等冗余信息影響、更快實現(xiàn)信號數(shù)據(jù)特征的提取從而加快模型收斂。
本文提出了一種基于改進(jìn)的1DCNN-BiLSTM 雙通道軸承故障診斷模型。在本文方法中,將原始振動加速度信號經(jīng)過CEEMDAN 信號預(yù)處理后同時刻、等量、同分布輸入雙通道特征提取模塊,分別提取信號數(shù)據(jù)的時序性相關(guān)性特征、局部非相關(guān)性空間特征和弱周期性規(guī)律,并通過融合層將其連接起來實現(xiàn)高效的軸承故障診斷。通過改進(jìn)模型結(jié)構(gòu)并加入通道注意力機(jī)制,證實同時添加改進(jìn)的SENet 模塊的1DCNN-BiLSTM 雙通道模型優(yōu)于傳統(tǒng)單通道模型,能夠快速過濾信號夾雜的噪聲等冗余信息、更快學(xué)習(xí)時序性數(shù)據(jù)關(guān)鍵特征信息,最高獲得96.87%的診斷精度。因此改進(jìn)的雙通道模型可作為軸承故障診斷的解決方案,可有效識別故障位置、故障嚴(yán)重程度等信息從而實現(xiàn)軸承典型故障的精確定位,有助于工業(yè)部件生產(chǎn)、質(zhì)檢、運行過程的管理。