鄭鋒
(金風(fēng)科技股份有限公司數(shù)字化中心,北京 101102)
滾動軸承作為機(jī)械設(shè)備的關(guān)鍵零部件之一被廣泛應(yīng)用于軌道交通、石化冶金、水電風(fēng)電等領(lǐng)域,對其開展故障診斷技術(shù)研究,對于設(shè)備安全可靠運行具有重大意義。深度學(xué)習(xí)作為故障診斷領(lǐng)域的后起之秀,能直接對原始信號自動提取特征,建立從故障數(shù)據(jù)到故障類別的端到端映射,在提升故障診斷效率的同時,實現(xiàn)智能故障診斷,擺脫了設(shè)備狀態(tài)監(jiān)測過程對專家知識以及人工特征提取的依賴。
近年來,大數(shù)據(jù)和傳感器技術(shù)的發(fā)展積累了大量的機(jī)械設(shè)備運行狀態(tài)數(shù)據(jù)。在實驗數(shù)據(jù)測試下,這些診斷模型都具有較高的精度。然而,在工程實際中,軸承的工作環(huán)境往往復(fù)雜多變,高噪聲、不同工況和跨設(shè)備等場景下的軸承故障診斷具有極高的挑戰(zhàn)性,高噪聲場景下信號淹沒在噪聲中,軸承故障特征提取困難,導(dǎo)致現(xiàn)有方法無法滿足實際應(yīng)用要求。Gu等通過對原始信號進(jìn)行變分模態(tài)分解后得到的二維時頻圖進(jìn)行故障診斷。Gundewar等提出了一種基于時頻變換和CNN相結(jié)合的診斷模型,再使用壓縮技術(shù)來提升模型診斷速度。Li等為了改善模型可解釋性,提出一種連續(xù)小波卷積層來代替原來標(biāo)準(zhǔn)CNN的第一層卷積層,使得此層具有實際意義,有效解決了高噪聲數(shù)據(jù)特征提取困難的問題。
上述研究中,針對噪聲環(huán)境下,使用信號處理的預(yù)處理方法對數(shù)據(jù)進(jìn)行處理然后將處理后的數(shù)據(jù)用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練,這樣不僅過程煩瑣診斷效果較差,而且難以應(yīng)用于實際工業(yè)環(huán)境中。通過基于多層小波變換與自注意力機(jī)制構(gòu)建相應(yīng)的診斷模型,其中不僅可以通過小波變換層對故障信號進(jìn)行處理實現(xiàn)數(shù)據(jù)的降噪,而且利用注意力機(jī)制使診斷模型能夠更加有效地過濾掉與故障無關(guān)的信息,提高模型的診斷性能。利用江南大學(xué)提供的軸承故障數(shù)據(jù)集,在數(shù)據(jù)集上添加不同的噪聲進(jìn)行實驗驗證,并將所提模型與CNN、(Residual Networks,ResNets)殘差網(wǎng)絡(luò)、FFT-CNN的結(jié)果對比驗證,證明所提方法良好的抗噪性能以及優(yōu)越的診斷性能。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種具有代表性的深度學(xué)習(xí)算法,其通過相應(yīng)的卷積核進(jìn)行卷積運算并加上偏置量在整體輸入信號上進(jìn)行特征提取,然后利用激活函數(shù)將特征輸出。其計算公式如下。
小波變換是一種強(qiáng)大信號處理工具,其通過使用小波函數(shù)對信號進(jìn)行分解和分析。小波函數(shù)是一種有限長度的波形函數(shù),可以在不同尺度和位置上對信號進(jìn)行分析。小波變換通過對信號進(jìn)行小波基函數(shù)的卷積來獲取信號在不同尺度和位置上的表示。這種變換可以在不同頻率范圍內(nèi)捕獲信號的瞬時特征,對于非平穩(wěn)信號的分析和處理有很大的優(yōu)勢。對于信號2x∈L(R)的離散小波變換如下:
式中,ψ*(t)是ψ(t)的復(fù)共軛。
注意力機(jī)制(Attention Mechanism)在神經(jīng)網(wǎng)絡(luò)與機(jī)械學(xué)習(xí)的模型中被廣泛使用,通過注意力機(jī)制可以使模型在處理序列數(shù)據(jù)時更加準(zhǔn)確和有效。傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)中,只將前一層的所有神經(jīng)元的輸出作為后一層神經(jīng)元的輸入,相反得是在注意力機(jī)制中,神經(jīng)元的輸入不僅取決于上一層神經(jīng)元的輸出,而且還將所輸入的數(shù)據(jù)按照不同部分進(jìn)行加權(quán),即對不同部分給予不同的權(quán)重,這樣就可以實現(xiàn)在特征提取得過程中更加關(guān)注數(shù)據(jù)中的關(guān)鍵信息,忽略數(shù)據(jù)中不重要的信息,進(jìn)而提高診斷模型得診斷精度以及效率。在診斷模型中注意力機(jī)制通過對各通道的特征加以自適應(yīng)加權(quán)操作,進(jìn)而實現(xiàn)抑制數(shù)據(jù)內(nèi)不重要信息的作用。其主要原理結(jié)構(gòu)如圖1所示,通過對輸入特征進(jìn)行池化操作,并且獲取不同維度通道的權(quán)重,并利用Sigmoid實施相關(guān)激活得到新權(quán)重值,最后將權(quán)重與初始特征值相乘并與初始特征值相加得到新的特征。
圖1 注意力機(jī)制的工作原理
通過小波變換層代替部分卷積層,結(jié)合小波變換的信號處理技術(shù)對數(shù)據(jù)分解出高頻和低頻信號,然后將低頻信號和高頻信號經(jīng)行拼接,進(jìn)而提高模型對故障信息的提取能力。由于采用小波變換層作為卷積的映射空間,在模型進(jìn)行訓(xùn)練時,模型易出現(xiàn)過擬合現(xiàn)象。Dropout層是神經(jīng)網(wǎng)絡(luò)中的一種正則化方法,原理主要是在訓(xùn)練過程中隨機(jī)將一部分神經(jīng)元的輸出置為0,也就是說,它們的權(quán)重不會被更新,同時其他神經(jīng)元的權(quán)重將會按照梯度下降法進(jìn)行更新。所以在多小波變換層后添加Dropout層,通過預(yù)先設(shè)定好的神經(jīng)元概率,來避免網(wǎng)絡(luò)出現(xiàn)過擬合現(xiàn)象,并且減少訓(xùn)練參數(shù),從而提高模型決策效率。
注意力機(jī)制可以使模型從復(fù)雜的信息中得到所需要的關(guān)注的重點。在本卷積模塊中,先采用3×1的卷積,從局部感知振動信號的更細(xì)致的特征信息,并且采用1×1的卷積儲存數(shù)據(jù)的原始信息,然后二者相互配合進(jìn)而在更細(xì)致地提取故障信息的基礎(chǔ)上進(jìn)一步避免前一個卷積對非關(guān)鍵信息的錯誤關(guān)注。
基于多層小波變換與自注意力機(jī)制構(gòu)建相應(yīng)的診斷模型,在診斷模型中小波變換層能夠有效對振動數(shù)據(jù)進(jìn)行降噪處理,注意力機(jī)制模塊能夠有效地過濾掉與故障無關(guān)的信息,提高模型的診斷性能。本模型的框架如圖2所示,具體模型參數(shù)如表1所示。
表1 網(wǎng)絡(luò)參數(shù)
圖2 算法流程
為驗證采用模型在噪聲環(huán)境中優(yōu)異的診斷性能,本實驗采用江南大學(xué)標(biāo)準(zhǔn)數(shù)據(jù)集,并且對數(shù)據(jù)集數(shù)據(jù)分別加入-6dB、-4dB、-2dB、2dB、4dB以及6dB的白噪聲,表達(dá)式為公式(3),用于檢驗?zāi)P驮诓煌肼暛h(huán)境的抗干擾能力。將所提方法與CNN、殘差網(wǎng)絡(luò)以及FFTCNN三種模型進(jìn)行對比,用于驗證本模型相較于其他模型優(yōu)越的診斷性能。CNN模型即傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò),由五個相應(yīng)的卷積層和一個全連接層組成;殘差網(wǎng)絡(luò)在一維卷積網(wǎng)絡(luò)中加入殘差模塊,將部分一維卷積層轉(zhuǎn)化為殘差層,提高了模型特征提取能力;FFT-CNN首先利用傅里葉變換將所得到得數(shù)據(jù)進(jìn)行預(yù)處理,然后診斷模型于CNN模型相同,經(jīng)過所提方法與三個模型對比,通過與CNN與殘差網(wǎng)絡(luò)對比可以證明所提模型的診斷性能,通過所提模型與FFT-CNN對比證明所提方法的降噪能力。最后使用,斷精度結(jié)果圖、診斷過程圖、以及特征可視化圖,將實驗結(jié)果進(jìn)行可視化。
式中,Psignal與Pnoise為原始信號以及噪聲信號的有效功率。
江南大學(xué)數(shù)據(jù)集的數(shù)據(jù)以50kHz的采樣頻率采集正常軸承和單點缺陷損壞軸承的振動信號,其中包括正常、內(nèi)圈故障、外圈故障、滾動體故障四種狀態(tài)的數(shù)據(jù)。采用重疊采樣的樣本分割方式,每1024個采樣點作為一個樣本,每種工況下的每類健康狀態(tài)標(biāo)記樣本共有500個。
通過使用PyTorch深度學(xué)習(xí)框架構(gòu)建模型,在驗證過程時采用具有自適應(yīng)學(xué)習(xí)率(初始學(xué)習(xí)率為0.01,權(quán)重衰減系數(shù)為0.0005)的Adam優(yōu)化器來訓(xùn)練。實驗樣本批次設(shè)置為32,訓(xùn)練輪次為200;采取10次的隨機(jī)實驗的平均診斷精度驗證所提方法的有效性。
各方法在的診斷結(jié)果如圖3與表2所示。通常認(rèn)為在添加白噪聲時,SNR≤0為強(qiáng)噪聲環(huán)境。由表2可以看出,在-4dB環(huán)境下,傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)、殘差網(wǎng)絡(luò)以及使用輸入使用傅里葉變換進(jìn)行預(yù)處理的(FFT-CNN)的診斷精度分別為74.90%、76.68%、81.962%。由結(jié)果可以明顯看出相較傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)殘差網(wǎng)絡(luò)以及對數(shù)據(jù)事先進(jìn)行預(yù)處理的方法的診斷精度明顯更高。相應(yīng)的所提方法在-4dB環(huán)境下的診斷精度為84.08%明顯優(yōu)于其他模型。而且相應(yīng)的準(zhǔn)確率標(biāo)準(zhǔn)差所提方法為0.82%相比較其他模型最低。證明所提方法的穩(wěn)定性也優(yōu)于其他模型。由圖4不同方法在-6dB環(huán)境下單次訓(xùn)練結(jié)果可以看出,對比算法在迭代20次后,訓(xùn)練精度逐漸收斂趨于穩(wěn)定,然而,驗證精度在趨于平衡后明顯低于了訓(xùn)練精度,表明存在明顯的過擬合。所提方法在圖上明顯高于其他方法,而且并未出現(xiàn)過擬合現(xiàn)象。
表2 不同方法在-4dB噪聲下平均診斷精度
圖3 不同方法診斷精度
圖4 不同方法在-4dB環(huán)境下單次訓(xùn)練結(jié)果
為驗證小波變換層對數(shù)據(jù)的識別能力,將某次已訓(xùn)練好的模型對測試集進(jìn)行驗證,將四層小波變換層后的特征進(jìn)行可視化。使用t-SNE將模型提取的特征降至為二維平面,并且以散點圖呈現(xiàn)特征聚集效果。其結(jié)果如圖5所示,由圖(a)到圖(b)可以看出,數(shù)據(jù)雖經(jīng)過部分處理,但由于數(shù)據(jù)總體分布比較復(fù)雜,各數(shù)據(jù)之間相互交叉難以區(qū)分不同類別;由圖(c)到圖(d),可以看出,隨著模型的深度增加,數(shù)據(jù)的區(qū)分度明顯增加,說明所提方法對特征提取的優(yōu)異性。
圖5 所提方法不同層的特征可視化
目前,大部分故障診斷方法研究基于實驗室實驗裝置所得到的數(shù)據(jù)進(jìn)行驗證,但實際工業(yè)環(huán)境多為高噪聲環(huán)境,與實驗室環(huán)境差異過大,導(dǎo)致目前所研究的診斷模型難以應(yīng)用于實際的工業(yè)環(huán)境中?;谛〔ㄗ儞Q與注意力機(jī)制,不僅結(jié)合了小波變換在噪聲環(huán)境中對故障特征良好的識別能力,而且結(jié)合注意力機(jī)制自身的特點,即注意數(shù)據(jù)中有用信息,拋棄數(shù)據(jù)中無用信息,進(jìn)一步對模型進(jìn)行優(yōu)化,提高了模型的故障識別能力。通過在江南大學(xué)故障數(shù)據(jù)集中加以高噪聲模擬高噪聲環(huán)境下的故障數(shù)據(jù),并且對比3個目前主流的故障診斷模型,對模型優(yōu)異的診斷能力以及穩(wěn)定性進(jìn)行了驗證,實驗結(jié)果證明了所提方法在高噪聲環(huán)境下的診斷能力以及穩(wěn)定性明顯優(yōu)于對比模型的方法。