劉 晶, 梁佳杭, 封 晨, 季海鵬
(1.河北工業(yè)大學(xué) 人工智能與數(shù)據(jù)科學(xué)學(xué)院 天津 300400; 2.河北省數(shù)據(jù)驅(qū)動 工業(yè)智能工程研究中心 天津 300400; 3.天津開發(fā)區(qū)精諾瀚海數(shù)據(jù)科技有限公司 天津 300400; 4.天津光電通信技術(shù)有限公司 天津 300400; 5.河北工業(yè)大學(xué) 材料科學(xué)與工程學(xué)院 天津 300400)
滾動軸承被廣泛應(yīng)用于飛機(jī)發(fā)動機(jī)、高鐵滾輪、風(fēng)力機(jī)等旋轉(zhuǎn)機(jī)械中,其運(yùn)行狀態(tài)對整個機(jī)械的性能有著重要影響[1],因此判斷軸承故障對保證旋轉(zhuǎn)機(jī)械安全運(yùn)行至關(guān)重要。
傳統(tǒng)的軸承故障診斷方法主要是從信號的時(shí)域[2]、頻域[3-4]和時(shí)頻域[5]對故障原始振動信號進(jìn)行分析和特征提取。但該類方法仍存在先驗(yàn)知識要求高、過度依賴復(fù)雜信號處理方法和診斷經(jīng)驗(yàn)、淺層分類模型難以從少量特征中獲取復(fù)雜的故障信息等問題。
深度神經(jīng)網(wǎng)絡(luò)能夠有效提取振動信號深層次特征,具有不依賴先驗(yàn)信息和判別能力強(qiáng)的特點(diǎn),很好解決了上述問題[6]。Khorram等[7]提出一種端對端的滾動軸承故障診斷算法,使用等效時(shí)間序列作為新型卷積長短記憶遞歸神經(jīng)網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)了短時(shí)間成本的故障診斷。Zhou等[8]提出一種改進(jìn)的并行長短時(shí)記憶網(wǎng)絡(luò)進(jìn)行信號的特征提取,并將特征轉(zhuǎn)換成圖像,實(shí)現(xiàn)了利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)故障診斷。Zhang等[9]提出了一種將原始信號轉(zhuǎn)換為二維圖像,利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取和故障診斷的方法,并通過軸承數(shù)據(jù)驗(yàn)證了該方法的有效性。上述的深度學(xué)習(xí)方法相比于傳統(tǒng)的基于信號分析的診斷方法,已經(jīng)極大減少了對專家經(jīng)驗(yàn)的依賴,但是此類方法大多直接從軸承故障原始時(shí)域振動信號中提取信息,存在故障診斷特征單一的問題。進(jìn)而,有學(xué)者在多特征融合診斷方面進(jìn)行了研究。如通過增加特征的維度進(jìn)行診斷[10-12],但是此類方法仍然直接從軸承故障原始時(shí)域振動信號中提取信息,忽略了軸承故障在頻域和時(shí)頻域中的關(guān)鍵特征。
針對上述問題,提出一種基于權(quán)重自適應(yīng)特征融合的軸承故障診斷方法(bearing fault diagnosis method based on adaptive weight feature fusion,BFD-AWFF),本文的主要貢獻(xiàn)如下。
1) 針對滾動軸承原始時(shí)域信號中故障特征單一的問題,提出了雙通道特征提取模型。對原始數(shù)據(jù)進(jìn)行快速傅里葉變換和小波變換,突出原始信號中主要的故障特征,利用該模型實(shí)現(xiàn)對頻域和時(shí)頻域特征的提取。
2) 針對特征融合診斷時(shí),關(guān)鍵故障特征重要程度缺失導(dǎo)致的模型收斂速度較慢問題,提出特征自適應(yīng)加權(quán)算法,自適應(yīng)地為頻域和時(shí)頻域特征匹配權(quán)重,提高模型收斂速度,實(shí)現(xiàn)故障診斷分類。
傳統(tǒng)軸承故障診斷研究中樣本大多基于一維原始時(shí)域振動信號,存在診斷特征單一的問題,無法充分地利用振動信號中頻域和時(shí)頻域的差異性故障特征,導(dǎo)致故障診斷精度受限。本文提出的BFD-AWFF方法框架如圖1所示。
圖1 BFD-AWFF方法框架Figure 1 BFD-AWFF method framework
該方法有特征提取模塊和特征加權(quán)融合分類模塊兩個部分。特征提取模塊中提出雙通道特征提取模型,實(shí)現(xiàn)對故障的頻域特征和時(shí)頻域特征的提取;特征加權(quán)融合分類模塊中提出特征自適應(yīng)加權(quán)算法,實(shí)現(xiàn)對故障特征的加權(quán)融合。
由于傳統(tǒng)的軸承故障診斷方法大多基于時(shí)域信號進(jìn)行診斷,存在故障特征單一的問題,為了更好挖掘隱藏的多域故障信息,在特征提取模塊中提出雙通道特征提取模型,將經(jīng)過時(shí)頻分析之后的數(shù)據(jù)分別輸入雙通道中,得到故障的頻域特征和時(shí)頻域特征。雙通道特征提取模型結(jié)構(gòu)如圖2所示。
圖2 雙通道特征提取模型Figure 2 Two-channel feature extraction model
該模型由輸入層和特征提取層組成。輸入層包含通道1的一維卷積輸入和通道2的二維卷積輸入,分別接受一維頻域數(shù)據(jù)和二維時(shí)頻圖作為輸入數(shù)據(jù);特征提取層的兩個通道均由卷積、池化、激活函數(shù)和歸一化相繼堆疊組成,最后實(shí)現(xiàn)對故障的頻域特征和時(shí)頻域特征的提取。
1.2.1輸入層 將傳感器采集的原始軸承運(yùn)轉(zhuǎn)時(shí)的時(shí)序性信號按照統(tǒng)一步長進(jìn)行分段切割數(shù)據(jù),原始軸承振動信號序列數(shù)據(jù)可以表示為
X=[X(1),X(2),…,X(n-1),X(n)],
(1)
其中:n為樣本數(shù)量。截取每個時(shí)間點(diǎn)樣本序列可以表示為
(2)
其中:t代表樣本編號;d代表樣本中的數(shù)據(jù)點(diǎn)數(shù)。
將時(shí)間點(diǎn)樣本序列作為原始數(shù)據(jù)進(jìn)行快速傅里葉變換之后可以得到變換之后的序列為
(3)
其中:k為原數(shù)據(jù)經(jīng)過快速傅里葉變換之后的數(shù)據(jù)點(diǎn)數(shù)。將經(jīng)過快速傅里葉變換之后的數(shù)據(jù)作為通道1的輸入。
同時(shí)將時(shí)間段樣本序列原始數(shù)據(jù)進(jìn)行連續(xù)小波變換,變換之后形成的時(shí)頻圖如式(4)所示。小波變換時(shí)頻圖作為通道2的輸入數(shù)據(jù)。
(4)
1.2.2特征提取層 特征提取層分為兩個通道,兩個通道均由卷積、池化、激活函數(shù)以及歸一化層循環(huán)堆疊而成。其中,通道1為一維卷積通道,輸入為一維頻域數(shù)據(jù);通道2為二維卷積通道,輸入為小波變換時(shí)頻圖。
卷積層可以通過設(shè)置卷積核的不同個數(shù)和大小實(shí)現(xiàn)對輸入數(shù)據(jù)的差異性特征和上、下文信息的提取。其計(jì)算過程為
cl=f(W·xl+b),
(5)
其中:xl代表輸入向量;cl代表輸出特征向量;W、b分別代表計(jì)算過程的權(quán)重和偏置向量,實(shí)現(xiàn)特征的非線性變換提取。
池化層的作用是降低特征向量的維度,從而降低卷積神經(jīng)網(wǎng)絡(luò)中需要計(jì)算的數(shù)據(jù)量,提升神經(jīng)網(wǎng)絡(luò)訓(xùn)練的效率。池化過程為
Pl=max{xl|s(m-1)+1≤n≤sm},
(6)
其中:max{·}代表最大池化策略;m、n為xl對應(yīng)的pool核覆蓋的區(qū)域;s為無重疊段長度;Pl表示池化后的特征矢量。
激活函數(shù)層采用ReLU函數(shù)作為激活函數(shù),可以有效抑制梯度消失的問題,加快模型尋找全局最優(yōu)解的過程,計(jì)算過程為
(7)
其中:Rl表示激活后的特征矢量;φ(·)代表激活操作。
最后經(jīng)過批歸一化(BN)層,將隱含層中的輸入變換標(biāo)準(zhǔn)正態(tài)分布,抑制了梯度消失和訓(xùn)練過程中的過擬合問題。
在特征融合過程中,傳統(tǒng)方法大多使用Concatenate機(jī)制實(shí)現(xiàn)特征簡單拼接融合,存在關(guān)鍵故障特征重要性缺失的問題,導(dǎo)致模型收斂速度變慢。針對上述問題提出特征自適應(yīng)加權(quán)算法,該算法借鑒注意力機(jī)制,自適應(yīng)地為頻域和時(shí)頻域特征匹配不同權(quán)重,實(shí)現(xiàn)高精度故障診斷分類,特征自適應(yīng)加權(quán)融合過程如圖3所示。
圖3 特征自適應(yīng)加權(quán)融合算法Figure 3 Feature adaptive weighted fusion algorithm
設(shè)特征提取模塊的輸出為ω1,…,ωi,…,ωn,其中:ωi為第i個特征提取通道的特征輸出;ωi(k)為輸出特征ωi的第k個數(shù)值;n為特征數(shù)量,由特征提取模塊中的通道數(shù)決定。函數(shù)F(·)將第i個通道的輸出特征ωi進(jìn)行求和,得到相應(yīng)的特征Fi,
(8)
將獲得的特征Fi通過全連接層獲得輸出φi,然后通過Softmax函數(shù)獲得該特征的權(quán)重αi。αi為第i個特征提取通道所提取特征的權(quán)重,通過Softmax函數(shù)將每個通道所提取特征的權(quán)重映射到(0,1)數(shù)值空間,各通道特征的權(quán)重和為1,計(jì)算為
(9)
(10)
將加權(quán)融合特征F作為故障診斷的依據(jù),輸入分類層進(jìn)行故障分類。
分類層由3個全連接網(wǎng)絡(luò)層組成,其中第一層全連接網(wǎng)絡(luò)將加權(quán)之后的特征進(jìn)行展平操作,即將所有加權(quán)特征矢量首尾連接組成一維向量;第二層全連接網(wǎng)絡(luò)實(shí)現(xiàn)對融合之后的特征降維;第三層全連接網(wǎng)絡(luò)的輸出個數(shù)與故障類別數(shù)目保持一致,利用Softmax分類器實(shí)現(xiàn)目標(biāo)輸出類別。
本文采用美國凱斯西儲大學(xué)(Case Western Reserve University,CWRU)電氣工程實(shí)驗(yàn)室的軸承故障數(shù)據(jù)集[13]和德國帕德博恩大學(xué)(Paderborn University,PU)機(jī)械工程學(xué)院的軸承故障數(shù)據(jù)集[14]進(jìn)行實(shí)驗(yàn),驗(yàn)證本文方法的有效性。
CWRU軸承數(shù)據(jù)實(shí)驗(yàn)臺使用電火花加工技術(shù)分別對置于驅(qū)動端和風(fēng)扇段的軸承內(nèi)圈(inner raceway,IR)、滾動體(ball,BO)和軸承外圈(outer raceway,OR)三個位置人為設(shè)置不同等級的單點(diǎn)故障,故障尺寸分別為0.177 8 mm、0.355 6 mm和0.533 4 mm。本文實(shí)驗(yàn)樣本選取0 W下10種故障狀態(tài)(包含一種正常狀態(tài))振動信號,CWRU數(shù)據(jù)集的具體實(shí)驗(yàn)樣本信息如表1所示。
表1 CWRU軸承故障實(shí)驗(yàn)樣本信息Table 1 CWRU bearing fault test sample information
PU數(shù)據(jù)集是一個6203軸承數(shù)據(jù)集,相比于CWRU數(shù)據(jù)集,該數(shù)據(jù)集的測試軸承故障既包含人工模擬損傷也包含真實(shí)損傷,本文選取的實(shí)驗(yàn)數(shù)據(jù)為真實(shí)損傷下的軸承數(shù)據(jù),軸承故障分為單點(diǎn)損傷(single damage,S)和多點(diǎn)損傷(multiple damage,M)。故障發(fā)生的位置分為軸承的內(nèi)圈(inner raceway,IR)和外圈(outer raceway,OR)。故障類型分為疲勞點(diǎn)蝕(fatigue pitting,FP)和壓痕(indentation,IN)。選取其中的7種故障類別(包含一種正常軸承狀態(tài))數(shù)據(jù)進(jìn)行實(shí)驗(yàn),PU數(shù)據(jù)集的具體實(shí)驗(yàn)樣本信息如表2所示。
表2 PU軸承故障實(shí)驗(yàn)樣本信息Table 2 PU bearing fault test sample information
運(yùn)行實(shí)驗(yàn)的計(jì)算機(jī)配置信息:CPU為Intel(R) Core(TM) i7-11800H;運(yùn)行內(nèi)存為 DDR4 3200 MHz 16 GB;顯卡為NVIDIA GeForce RTX 3060 6 GB;編程語言為python3.7;深度學(xué)習(xí)框架為pytorch 1.10.1。
對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行劃分,每段數(shù)據(jù)樣例長度為864,作為訓(xùn)練集、驗(yàn)證集以及測試集的原始樣本數(shù)據(jù),劃分訓(xùn)練集、驗(yàn)證集和測試集的比例為7∶2∶1,每類故障樣本生成數(shù)量為200。
將原始信號數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集和測試集之后,對數(shù)據(jù)集進(jìn)行快速傅里葉變換[15]和小波變換[16],獲取軸承故障原始振動信號中的頻域和時(shí)頻域特征。選擇 Cmor小波作為小波函數(shù)對軸承故障振動信號進(jìn)行分析,可以更好地表征振動信號在時(shí)頻域上的特征。
使用數(shù)據(jù)集驗(yàn)證BFD-AWFF方法在軸承故障診斷中的有效性。訓(xùn)練過程的超參數(shù)設(shè)置為:迭代次數(shù)為200;批次數(shù)據(jù)量為64;優(yōu)化器選用Adam優(yōu)化器;損失函數(shù)采用交叉熵?fù)p失函數(shù)(crossentropyloss)。構(gòu)建6種模型進(jìn)行對軸承故障診斷的對比實(shí)驗(yàn),其中Model6為本文提出的模型,各個模型的結(jié)構(gòu)及輸入如表3所示。
表3 對比實(shí)驗(yàn)?zāi)P图拜斎霐?shù)據(jù)Table 3 Comparative experimental model and input data
實(shí)驗(yàn)使用的性能指標(biāo)準(zhǔn)確率(accuracy)表示模型預(yù)測類別正確的樣本數(shù)量占總樣本數(shù)量的百分比。其中,訓(xùn)練集準(zhǔn)確率(Train-acc)和驗(yàn)證集準(zhǔn)確率(Valid-acc)為模型訓(xùn)練輪次200時(shí)的準(zhǔn)確率。對比Train-acc和Valid-acc可以得到模型過擬合情況。測試集準(zhǔn)確率(Test-acc)為訓(xùn)練完成的模型在測試集上的準(zhǔn)確率,得到訓(xùn)練完成模型的效果。表3中提到的6種模型的對比實(shí)驗(yàn)結(jié)果如表4所示。
表4 模型結(jié)果對比Table 4 Comparison of model results 單位:%
由表4可知,本文提出的方法在訓(xùn)練集、驗(yàn)證集以及測試集中都有最好的準(zhǔn)確率。其中Model1、Model2和Model3為單通道模型,Model1的輸入數(shù)據(jù)為原始振動數(shù)據(jù),在訓(xùn)練集和驗(yàn)證集上的準(zhǔn)確率有較大的差異,且在兩個測試集上的Test-acc較低,分別為85.00%和84.28%;將原始振動數(shù)據(jù)經(jīng)過快速傅里葉變換和小波變換之后,分別作為Model2和Model3的輸入數(shù)據(jù),Model2在兩個測試集上的Test-acc分別達(dá)到了97.50%和96.42%,Model3在兩個測試集上的Test-acc分別達(dá)到99.50%和95.71%,由此可以證明,快速傅里葉變換和小波變換對于提取原始數(shù)據(jù)中的故障特征均有較好的表現(xiàn)。Model4、Model5和Model6為雙通道模型,Model6為本文方法,兩個通道輸入的數(shù)據(jù)分別為原始振動數(shù)據(jù)經(jīng)過快速傅里葉變換之后的頻域數(shù)據(jù)和小波變換之后的時(shí)頻圖,該模型在測試集的準(zhǔn)確率最高,達(dá)到99.75%和98.57%。
本文所提方法在兩個數(shù)據(jù)集上的訓(xùn)練曲線如圖4所示,其中圖例標(biāo)簽“CWRU-train”表示該方法在CWRU數(shù)據(jù)集上的訓(xùn)練曲線,“CWRU-valid”表示該方法在CWRU數(shù)據(jù)集上的驗(yàn)證曲線;PU數(shù)據(jù)集同理。由該訓(xùn)練曲線可知,本文所提方法在訓(xùn)練過程中,模型具有較好的收斂性,且模型的收斂速度較快。證明本文所提方法可以有效提取軸承故障的頻域特征和時(shí)頻域特征,并對故障特征進(jìn)行自適應(yīng)加權(quán)融合診斷。
圖4 Model6在兩個數(shù)據(jù)集上訓(xùn)練曲線Figure 4 Model6 training curve on two datasets
為驗(yàn)證特征自適應(yīng)加權(quán)模塊在本文提出整體方法中的作用,對該模塊進(jìn)行消融實(shí)驗(yàn)。本節(jié)中的實(shí)驗(yàn)數(shù)據(jù)采用CWRU數(shù)據(jù)集和PU數(shù)據(jù)集,對本文提出的BFD-AWFF方法和無特征自適應(yīng)加權(quán)的BFD-AWFF(BFD-AWFF with non feature adaptive weighting,BFD-AWFF-NA)方法進(jìn)行對比實(shí)驗(yàn),兩個方法在兩個數(shù)據(jù)集上的表現(xiàn)如表5所示。
由表5可知,BFD-AWFF方法比缺少特征自適應(yīng)加權(quán)的BFD-AWFF-NA方法在兩個數(shù)據(jù)集上具有更高的分類準(zhǔn)確率,在CWRU數(shù)據(jù)集上,雖然訓(xùn)練集和驗(yàn)證集準(zhǔn)確率相同,但在測試集上有更高的準(zhǔn)確率,提高了0.25%。在PU數(shù)據(jù)集上,訓(xùn)練集、驗(yàn)證集和測試集上的準(zhǔn)確率,分別提高了3.67%、7.5%和3.57%。為了更好地說明特征自適應(yīng)加權(quán)模塊對模型訓(xùn)練過程中模型收斂速度的影響,將BFD-AWFF方法和BFD-AWFF-NA方法在兩個數(shù)據(jù)集上的訓(xùn)練過程的準(zhǔn)確率曲線進(jìn)行對比,如圖5所示。
表5 模型結(jié)果對比Table 5 Comparison of model results 單位:%
由圖5對比可知,在CWRU數(shù)據(jù)集上,添加特征自適應(yīng)加權(quán)融合模塊的BFD-AWFF在Epoch為20次后達(dá)到相對穩(wěn)定,缺少特征自適應(yīng)加權(quán)融合模塊的BFD-AWFF-NA在Epoch為30次后達(dá)到較平穩(wěn)狀態(tài);在PU數(shù)據(jù)集上,BFD-AWFF在Epoch為70次后達(dá)到相對穩(wěn)定,BFD-AWFF-NA在Epoch為100次后達(dá)到較平穩(wěn)狀態(tài)。
經(jīng)過對比實(shí)驗(yàn),本文提出的BFD-AWFF方法通過在特征融合時(shí)加入特征自適應(yīng)加權(quán)算法,使得該方法可以在兩個數(shù)據(jù)集上具有最好的表現(xiàn),且通過對關(guān)鍵特征賦予較高的權(quán)重,模型訓(xùn)練收斂速度明顯提升。證明特征自適應(yīng)加權(quán)算法針對特征提取模塊提取的特征的重要程度高低賦予權(quán)重,實(shí)現(xiàn)故障特征有效融合從而加快模型收斂速度,提高故障診斷效果。
傳統(tǒng)的軸承故障診斷方法大多基于原始時(shí)域信號進(jìn)行特征提取,僅利用時(shí)域特征進(jìn)行診斷,存在故障特征單一的問題。針對上述問題,提出一種基于權(quán)重自適應(yīng)特征融合的軸承故障診斷方法(BFD-AWFF),該方法由特征提取和特征加權(quán)融合分類兩個部分組成。在特征提取部分,提出雙通道特征提取模型,對原始數(shù)據(jù)進(jìn)行快速傅里葉變換和小波變換,并利用該模型對經(jīng)過時(shí)頻分析的數(shù)據(jù)同時(shí)提取故障的頻域特征和時(shí)頻域特征。在特征加權(quán)融合分類部分,使用特征自適應(yīng)加權(quán)算法,實(shí)現(xiàn)特征動態(tài)自適應(yīng)加權(quán),加快模型收斂速度。通過CWRU數(shù)據(jù)集和PU數(shù)據(jù)集對BFD-AWFF方法進(jìn)行實(shí)驗(yàn)驗(yàn)證,證明了該方法可以有效提取故障特征并保持優(yōu)異的診斷準(zhǔn)確率,同時(shí)證明特征自適應(yīng)加權(quán)算法可以有效加快模型的收斂速度。