康濤,段蓉凱,楊磊,薛久濤,廖與禾
(1.西安交通大學(xué)現(xiàn)代設(shè)計及轉(zhuǎn)子軸承系統(tǒng)教育部重點實驗室,710049,西安;2.西安交通大學(xué)陜西省機械產(chǎn)品質(zhì)量保障與診斷重點實驗室,710049,西安)
滾動軸承作為機械傳動系統(tǒng)的重要組成部分,其健康狀態(tài)與主機的性能與效率緊密相關(guān)。受到惡劣環(huán)境和復(fù)雜工況的影響,軸承在服役期間極易出現(xiàn)故障,大量的統(tǒng)計分析結(jié)果表明:超過40%的設(shè)備故障與軸承相關(guān)[1]。因此,實現(xiàn)對軸承故障的及時發(fā)現(xiàn)和診斷,是確保主機安全平穩(wěn)運行的關(guān)鍵。但是,在實際工作過程中軸承故障信號相對微弱,分析過程極易受到噪聲干擾的影響[2]。因此,在強噪聲干擾條件下準(zhǔn)確提取信號中的故障特征,對軸承故障進(jìn)行及時診斷、避免軸承故障的持續(xù)惡化,具有重要的科研和工程意義[3-4]。
振動信號對故障敏感且對軸承健康狀態(tài)的反映直觀,因此目前在故障診斷中應(yīng)用最為廣泛[5]。依據(jù)振動信號實施的滾動軸承故障診斷大致包括以下3個環(huán)節(jié):信號獲取、特征提取、故障診斷。傳統(tǒng)基于信號處理的診斷方法由于需要復(fù)雜的信號分析算法來提取特征,且特征分析和故障診斷過程嚴(yán)重依賴專家經(jīng)驗,其應(yīng)用受到了很大的限制[6]。
近年來,通過深層非線性結(jié)構(gòu)學(xué)習(xí)數(shù)據(jù)內(nèi)在規(guī)律、構(gòu)建樣本和結(jié)果之間映射關(guān)系的深度學(xué)習(xí)方法開始引起故障診斷領(lǐng)域的關(guān)注[7]。其中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)利用卷積運算的思想,在大大減少模型參數(shù)量的同時增強了網(wǎng)絡(luò)的能力,無需對信號進(jìn)行預(yù)處理就可以實現(xiàn)端到端的智能診斷[8]。例如:Abdeljaber等[9]提出了一種CNN模型,對旋轉(zhuǎn)機械的結(jié)構(gòu)損傷進(jìn)行了檢測和定位;周奇才等[10]基于經(jīng)典多尺度CNN模型AlexNet實現(xiàn)了旋轉(zhuǎn)機械故障診斷。
在此基礎(chǔ)上,有學(xué)者進(jìn)一步通過對CNN進(jìn)行改進(jìn),嘗試對噪聲干擾場景下的軸承故障診斷問題展開研究。Zhang等[11]提出將殘差網(wǎng)絡(luò)用于軸承故障診斷,并在信噪比為0~8 dB范圍內(nèi)實現(xiàn)了軸承故障診斷。董紹江等[12]提出了多層降噪技術(shù)與CNN相結(jié)合的方法,對信噪比范圍在-6~10 dB的信號均有較好的診斷結(jié)果。張弘斌等[13]提出了一種新的多通道樣本構(gòu)造方法,結(jié)合深度CNN來提高軸承故障診斷的效果。這些工作提高了CNN在有噪聲干擾下的診斷效果,也為后續(xù)的研究打下了基礎(chǔ)。但是,在強噪聲干擾場景下,CNN對沒有預(yù)降噪的信號診斷準(zhǔn)確率仍需提高,且工況變化對性能的影響亦不容忽視[14-15]?,F(xiàn)有研究的不足主要有以下兩點。
(1)傳統(tǒng)CNN為了提高其特征表達(dá)能力,設(shè)置的通道數(shù)較大,這樣的深度CNN雖然可以提高性能,但并不是所有通道都富含故障信息,一些通道中學(xué)習(xí)的甚至是噪聲的分布特征[16]。對通道的無差別對待導(dǎo)致CNN結(jié)構(gòu)復(fù)雜并造成算力的浪費。同時,由于整段信號中往往只有部分?jǐn)?shù)據(jù)(如連續(xù)的脈沖信號段等)含有關(guān)鍵故障信息,其他與故障無關(guān)的數(shù)據(jù)對CNN的學(xué)習(xí)造成了干擾。上述原因使得目前大多的CNN優(yōu)化方法往往只能通過復(fù)雜的模型結(jié)構(gòu)來改善性能,而并沒有提高CNN的學(xué)習(xí)效率,導(dǎo)致其性能易退化的同時限制了CNN在工況變化時的泛化能力。
(2)信號中對應(yīng)于故障的特征頻率成分與干擾分量分布在不同的信號尺度中,且工況變化會改變這種分布,因此不同尺度下的信息對故障診斷的價值并不等同?,F(xiàn)有的多尺度CNN雖然通過設(shè)置多個卷積通路來分別獲取不同尺度下的信息,但仍未能充分考慮不同尺度間信息差異,極易受到無關(guān)分量和冗余信息的干擾。
針對以上不足,本文提出一種多注意力卷積神經(jīng)網(wǎng)絡(luò)(multi-attention convolutional neural network,MACNN)自適應(yīng)抗噪模型。通過融合通道注意力機制和時間注意力機制對卷積層進(jìn)行增強,在抑制噪聲等干擾信息的同時,有效挖掘了數(shù)據(jù)中的關(guān)鍵故障特征信息,從而優(yōu)化了CNN的學(xué)習(xí)機制;再通過通道注意力機制融合多種不同尺度下提取的故障特征,使網(wǎng)絡(luò)能夠自適應(yīng)地選擇需要的特征。本文主要的貢獻(xiàn)如下。
(1)從優(yōu)化CNN的學(xué)習(xí)機制出發(fā)提高其學(xué)習(xí)效率。具體地,通過引入并改進(jìn)多注意力機制來改善其可用性,使網(wǎng)絡(luò)判別并有選擇性地學(xué)習(xí)通道和信號中的關(guān)鍵故障特征。
(2)在多尺度CNN的基礎(chǔ)上提高其對不同尺度下特征的提取能力。將多個尺度間的數(shù)據(jù)等效為多個大型通道,并使用通道注意力機制自適應(yīng)融合不同尺度中的特征。
CNN通常由卷積層、池化層以及全連接層組成[17],如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)
卷積層通過卷積核的移動遍歷整段數(shù)據(jù),以此進(jìn)行卷積運算,分別計算出數(shù)據(jù)點的權(quán)重與偏差。通過激活函數(shù)進(jìn)行非線性變換來擬合復(fù)雜的映射關(guān)系,建立數(shù)據(jù)與其所屬類別間的聯(lián)系,運算式為
(1)
sigmoid激活函數(shù)在本文提出的網(wǎng)絡(luò)中多次使用,其公式為
(2)
式中:σ(·)為sigmoid函數(shù);X為輸入矩陣。
卷積層運算后的數(shù)據(jù)會進(jìn)入池化層,池化層主要是對卷積層中抽取出來的抽象特征進(jìn)一步降維[18]。本文使用的方法是最大池化,即在一個區(qū)域內(nèi)求出最大值來代替該區(qū)域的所有值,從而實現(xiàn)降低維度目的,即有
(3)
全連接層整合不同的特征,并通過分類函數(shù)給出網(wǎng)絡(luò)的輸出結(jié)果,其公式為
(4)
注意力機制以權(quán)重的生成和分配重新調(diào)制網(wǎng)絡(luò)參數(shù)[19],并通過訓(xùn)練最終使網(wǎng)絡(luò)聚焦于關(guān)鍵特征,從而優(yōu)化CNN的學(xué)習(xí)機制。在調(diào)制網(wǎng)絡(luò)的同時不損失原有的故障特征、避免負(fù)優(yōu)化的情況發(fā)生是使用注意力機制的前提。為此,本文分別引入并改進(jìn)通道注意力機制以及時間注意力機制,通過從不同角度壓縮特征生成通道和時間維度下數(shù)據(jù)的自適應(yīng)權(quán)重,實現(xiàn)抑制干擾信息,保留并突出了關(guān)鍵故障特征的響應(yīng)。
2.1.1 通道注意力機制
為解決卷積神經(jīng)網(wǎng)絡(luò)中大量通道間信息價值不等同造成網(wǎng)絡(luò)難以訓(xùn)練并影響識別準(zhǔn)確率的問題,本文引入文獻(xiàn)[16]中提出的通道注意力機制方法并加以改進(jìn)。該方法通過均值池化和最大池化,將全局信息壓縮到信息通道維度,以此建立不同通道間的相互依存關(guān)系。為了進(jìn)一步獲取不同通道的關(guān)鍵程度,將池化后的向量分別送入瓶頸結(jié)構(gòu)的擠壓-激勵網(wǎng)絡(luò),通過設(shè)置壓縮比例r來迫使網(wǎng)絡(luò)舍棄一些不重要的神經(jīng)元的值。
設(shè)送入多注意力機制的矩陣為X∈H×1×W,其中,H為通道數(shù),W為數(shù)據(jù)長度。有中間向量c∈H/r×1×1。兩個擠壓-激勵網(wǎng)絡(luò)的輸出相加,獲得一個新的特征向量c′∈H×1×1。最后,通道注意力機制的輸出矩陣C為
C=Xσ(c′)
(5)
卷積神經(jīng)網(wǎng)絡(luò)的通道數(shù)很大,反復(fù)利用注意力機制重新校準(zhǔn)網(wǎng)絡(luò)參數(shù)易減少深度特征的響應(yīng),使網(wǎng)絡(luò)無法學(xué)習(xí)潛在的故障信息。因此,本文在注意力機制生成并賦予權(quán)重后,額外引入了殘差連接[20]的思想,在原始數(shù)據(jù)與注意力機制調(diào)校后的數(shù)據(jù)間建立映射,保留原始信息以提高優(yōu)化的可行性。殘差連接可表示為C′=X+C,用于防止網(wǎng)絡(luò)性能的退化。通道注意力機制的結(jié)構(gòu)如圖2所示。
圖2 通道注意力機制
2.1.2 時間注意力機制
通道注意力機制解決的是通道間信息差異性判別的問題,另一個值得注意的問題是如何確定信號中包含關(guān)鍵故障信息的信號段。這個問題主要涉及在不損失信號原有特征的條件下獲取信號在時間維度上故障信息關(guān)鍵程度的分布,而池化方法難免會丟失特征,不適用于該問題。為此,本文提出采用參數(shù)為1×1×1的元卷積核遍歷整段信號來獲取權(quán)重分布的時間注意力機制。元卷積核在對信號進(jìn)行卷積運算時,并不會改變原有數(shù)據(jù)的特征,而會壓縮信息實現(xiàn)特征的升維,從而實現(xiàn)了將整段信號特征向高維度的非線性映射。所生成的權(quán)重向量t∈1×1×W在通道維度上已壓縮,其神經(jīng)元代表了時間維度上每個數(shù)據(jù)點的響應(yīng)值,數(shù)值越大意味著信號在此處故障特征越為關(guān)鍵,反之信號在此處為干擾特征。與通道注意力機制相同,使用sigmoid函數(shù)生成調(diào)制的權(quán)重并與原始信號相乘來賦予權(quán)重
(6)
時間注意力機制同樣使用殘差連接的方式,即T′=C′+T。對應(yīng)的結(jié)構(gòu)如圖3所示。
圖3 時間注意力機制
在MACNN中,通道注意力機制和時間注意力機制先后布置,分別提取關(guān)鍵通道和關(guān)鍵信號段的特征,輸出矩陣T′包含了多角度的關(guān)鍵故障信息并隨著模型訓(xùn)練不斷優(yōu)化。
在上述多注意力機制的基礎(chǔ)上,本文構(gòu)建了MACNN自適應(yīng)抗噪網(wǎng)絡(luò)模型,整體結(jié)構(gòu)如圖4所示。軸承振動數(shù)據(jù)輸入模型先將整段數(shù)據(jù)隨機采樣,之后分為可供網(wǎng)絡(luò)訓(xùn)練和測試的樣本。樣本先后通過特征預(yù)篩選層以及由特征提取子網(wǎng)絡(luò)和多注意力模型交替布置組成的多尺度特征提取器,最終自適應(yīng)融合所有提取的特征給出診斷結(jié)果。
圖4 多注意力CNN結(jié)構(gòu)
模型的第1層參數(shù)設(shè)置尤為關(guān)鍵,對網(wǎng)絡(luò)整體的性能有較大的影響。軸承故障對應(yīng)的特征分量往往位于低頻段,而在步長相同的條件下,大卷積核提取低頻信息的能力更強[21]。同時,軸承振動信號具有很強的周期性,大卷積核還提供了更大的感受野,可以使模型更為關(guān)注整段信號的全局性周期特征。基于以上考慮,在MACNN中設(shè)置了使用較大卷積核的卷積層進(jìn)行特征預(yù)篩選。該層卷積運算后的信號依次通過最大池化層、BatchNorm層以及Dropout層。其中:BatchNorm層通過對模型參數(shù)的歸一化可以有效地加快網(wǎng)絡(luò)收斂速度并防止梯度爆炸或消失;Dropout層通過隨機丟棄神經(jīng)元參數(shù)可以有效地抑制過擬合。
在對數(shù)據(jù)中特征預(yù)篩選后,為了增強網(wǎng)絡(luò)的泛化能力以及對不同尺度下特征的提取能力,本文沿用文獻(xiàn)[16]中使用的多尺度CNN作為特征提取器,改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)并重新設(shè)置了所有參數(shù)。具體地,在每次卷積運算后使用BatchNorm函數(shù)來加快訓(xùn)練、防止過擬合。同時,為了防止多次池化造成特征丟失,僅第一個特征提取子網(wǎng)絡(luò)使用了池化層。運算式為
Yk=δ(P(BN(Wk*Y+Bk)))
(7)
式中:Yk為特征提取子網(wǎng)絡(luò)中卷積層輸出的矩陣;Wk和Bk分別為每個尺度下的權(quán)重矩陣和偏差矩陣;BN為BatchNorm函數(shù);P為最大池化函數(shù);δ為ReLU激活函數(shù),可以增加模型非線性表達(dá)能力,有
(8)
在多尺度特征提取器的框架下,多注意力機制模塊化后布置在每個特征提取子網(wǎng)絡(luò)后。通過內(nèi)部權(quán)重生成網(wǎng)絡(luò)生成自適應(yīng)權(quán)重向量c′和t,并在訓(xùn)練過程中不斷優(yōu)化,再根據(jù)權(quán)重值逐層重新調(diào)制網(wǎng)絡(luò)參數(shù)。交替布置的特征提取子網(wǎng)絡(luò)和多注意力機制模塊共同構(gòu)建了多尺度特征提取器的一條通路。
更為關(guān)鍵的是,特征提取器提取到的不同尺度下的信息價值并不等同,過往研究中的簡單拼接操作無法去除尺度間的冗余特征,無法增強其中關(guān)鍵尺度下的信息。為解決此問題,本文創(chuàng)新性地使用通道注意力機制關(guān)聯(lián)不同尺度間的特征,將多個尺度的信息看作多個大型通道的信息。每個卷積通路對應(yīng)為一個通道,分別生成α1,…,αk的尺度權(quán)重并進(jìn)行自適應(yīng)融合,根據(jù)不同尺度下特征的價值分配網(wǎng)絡(luò)的關(guān)注度。
最終分類需要將信息融合后的特征矩陣展開排成一列。相比常用的全連接層,全局平均池化可以大大減少網(wǎng)絡(luò)的參數(shù),減輕過擬合現(xiàn)象[2]。因此,MACNN使用全局平均池化來獲取分類所需的特征向量z。該向量節(jié)點數(shù)與所分類別數(shù)一致,每個節(jié)點的輸出值表示該樣本屬于對應(yīng)類別的概率。網(wǎng)絡(luò)結(jié)構(gòu)末尾輸出層使用Softmax分類器,以概率最大的類別為模型診斷類別。設(shè)N為軸承健康狀態(tài)類別數(shù),則運算式為
(9)
式中q(n)表示最終輸出的診斷類別為第n類。
在構(gòu)建MACNN整體結(jié)構(gòu)后,為評價獲取的深層特征結(jié)果,選擇交叉熵?fù)p失函數(shù)來衡量輸出值與真實值的差距,其公式為
(10)
式中p(n)為網(wǎng)絡(luò)輸出層預(yù)測樣本屬于第n類健康狀態(tài)的概率。模型的訓(xùn)練目標(biāo)是使損失函數(shù)L最小,從而使預(yù)測值接近真實值,并使用Adam優(yōu)化算法來優(yōu)化梯度下降的過程。為了防止模型收斂后繼續(xù)訓(xùn)練導(dǎo)致過擬合,50輪內(nèi)識別準(zhǔn)確率提升值小于0.5%便提前結(jié)束訓(xùn)練,模型的訓(xùn)練流程如圖5所示。
圖5 MACNN訓(xùn)練流程
為了驗證本文提出的MACNN模型在強噪聲環(huán)境下的性能及泛化能力,采用課題組自研的軸承故障模擬實驗臺的測試數(shù)據(jù)進(jìn)行實驗驗證。
使用python語言在Keras深度學(xué)習(xí)框架上進(jìn)行編程。計算機使用NVIDIA 3060Ti GPU以及16 GB內(nèi)存硬件配置。訓(xùn)練模型時,數(shù)據(jù)批量大小選擇為128,訓(xùn)練輪次為200,學(xué)習(xí)率設(shè)置為0.001。由于深度學(xué)習(xí)在訓(xùn)練樣本數(shù)較少時結(jié)果較差,使用重采樣的方法擴充數(shù)據(jù)集[22]。設(shè)置重采樣步長為450,最終得到每類數(shù)據(jù)包括540個樣本,每個樣本的長度為2 048,每類數(shù)據(jù)按照8∶1的比例劃分訓(xùn)練集與測試集。為使模型盡快收斂,對所有數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,即
(11)
在網(wǎng)絡(luò)參數(shù)的設(shè)置上:經(jīng)過交叉驗證實驗對比和調(diào)整,通道注意力機制中擠壓-激勵網(wǎng)絡(luò)的壓縮比設(shè)置為4;Dropout層丟棄的概率為0.5;多尺度CNN中參數(shù)k取為3,3個尺度卷積核大小分別選擇為3、5、9,對應(yīng)卷積通路1、2、3,每個通路中的每個多尺度卷積層包括了3個內(nèi)部的特征提取子網(wǎng)絡(luò);多注意力機制模塊中,時間注意力機制根據(jù)其原理均需選擇1×1×1的卷積核,不再單獨列出,列出的核數(shù)為通道注意力機制中擠壓-激勵網(wǎng)絡(luò)的神經(jīng)元數(shù),其他參數(shù)如表1所示。
表1 多注意力CNN參數(shù)
軸承實驗臺由電機、轉(zhuǎn)速傳感器、徑向加載組件以及待測軸承等部分組成,其實物圖如圖6所示。
圖6 實驗室軸承實驗臺實物
測試軸承型號為SKF6308,包含正常、內(nèi)圈故障、外圈故障、滾動體故障以及保持架故障共5種狀態(tài)。其中,內(nèi)圈、外圈通過激光加工出矩形缺陷,滾動體故障使用砂輪機磨削,保持架故障采用線切割。
數(shù)據(jù)采樣頻率為12 kHz,采樣時長為10 s。分別在電機轉(zhuǎn)速為500、1 000、1 500、2 000 r/min以及軸承徑向負(fù)載為0.4、0.8、1.2 kN共12種工況組合下進(jìn)行了數(shù)據(jù)采集。不同工況的數(shù)據(jù)樣本數(shù)相同,每一個工況數(shù)據(jù)集描述如表2所示。其中:故障程度1、2、3分別代表輕微、中等、嚴(yán)重這3種故障程度,0則代表沒有故障;每類數(shù)據(jù)均打上了對應(yīng)的標(biāo)簽。
表2 軸承實驗臺數(shù)據(jù)集描述
t-SNE降維方法通過對數(shù)據(jù)向二維空間線性投影,可以直觀展示數(shù)據(jù)的分布。以轉(zhuǎn)速為2 000 r/min、徑向負(fù)載為1.2 kN的數(shù)據(jù)為例,對網(wǎng)絡(luò)的訓(xùn)練過程進(jìn)行了可視化,結(jié)果見圖7。
圖7(a)為數(shù)據(jù)輸入網(wǎng)絡(luò)前的分布,可以看出,此時10類數(shù)據(jù)間完全不可分。圖7(b)、(c)分別為數(shù)據(jù)通過多注意力模塊1中卷積通路1、融合多尺度的通道注意力機制的分布,可以看出,隨著網(wǎng)絡(luò)層次的深入,模型逐漸對不同類別的數(shù)據(jù)有了明顯的分類邊界。圖7(d)為網(wǎng)絡(luò)輸出層數(shù)據(jù)的分布,可以看出,此時模型不僅可以對不同類型的數(shù)據(jù)有效地分類,且類別間的分布距離較大而類內(nèi)數(shù)據(jù)距離較小。綜上所述可知,可視化結(jié)果表明所提出的模型分類效果較好。
(a)原始分布 (b)多注意力模塊1的分布
為了分析所提出的多注意力機制權(quán)重在模型訓(xùn)練時的變化情況,并驗證權(quán)重優(yōu)化過程的有效性,展示了模型剛開始訓(xùn)練5輪以及最終收斂時,多注意力機制模塊1卷積通路1中通道和時間注意力機制權(quán)重的分布,如圖8所示。此處,網(wǎng)絡(luò)的通道數(shù)為64,數(shù)據(jù)點數(shù)為218。
(a)前期通道權(quán)重分布
從圖8(a)可以看出,在模型剛開始訓(xùn)練時,各個通道的注意力權(quán)重值差距不超過0.2且集中在0.5附近;在圖8(b)模型最終收斂時,通道間的權(quán)重已呈現(xiàn)明顯的差異性分布,表明通道注意力機制已根據(jù)通道內(nèi)信息的關(guān)鍵程度進(jìn)行了參數(shù)調(diào)制。類似地,如圖8(c)、8(d)所示,時間注意力機制早期各數(shù)據(jù)點權(quán)重比較接近,而收斂時權(quán)重存在明顯的周期性分布。均勻周期性分布過程表明,時間注意力機制突出了包含周期性故障特征的數(shù)據(jù)點響應(yīng),其他無關(guān)數(shù)據(jù)點賦予了低權(quán)重來降低干擾。綜上所述可知,多注意力機制通過訓(xùn)練可以有效調(diào)整權(quán)重值,從而有效地挖掘了關(guān)鍵故障特征并且抑制了對故障診斷無用的干擾。
為考察MACNN自適應(yīng)抗噪模型在噪聲下的性能,對軸承信號添加一定的噪聲來模擬實際場景。圖9以滾動體輕微故障數(shù)據(jù)為例,給出了原始測試信號與添加大量隨機干擾后(信號信噪比為-25 dB)的對比??梢钥闯?加噪后信號中的故障沖擊特征被噪聲完全淹沒。
(a)原始信號
為驗證所提模型中多注意力機制對抗噪性能的提高能力,對比了無注意力機制(no attention mechanism,NAM)與多注意力機制(multi attention mechanism,MAM)兩種網(wǎng)絡(luò)結(jié)構(gòu)在轉(zhuǎn)速為2 000 r/min、強噪聲環(huán)境(信噪比為-25 dB)下不同負(fù)載的故障診斷準(zhǔn)確率。兩種網(wǎng)絡(luò)其他參數(shù)均一致,測試10次的實驗結(jié)果如圖10所示。
圖10 多注意力機制對模型抗噪性能的影響
圖10表明,多注意力機制對模型的自適應(yīng)抗噪性有較好的改善,準(zhǔn)確率平均提升12.46%。其中,在徑向載荷為0.8 kN時,包含多注意力機制的模型MAM比不使用注意力機制的模型NAM的識別準(zhǔn)確率提高了22.12%。分析結(jié)果同時表明,隨著載荷的降低,兩種模型的識別率都有不同程度的下降,但任意情況下MAM識別準(zhǔn)確率都比NAM高。由此可見,添加多注意力機制的網(wǎng)絡(luò)可有效抑制噪聲干擾。分析結(jié)果驗證了MACNN的性能和多注意力機制的有效性。
為對比所提方法與其他方法的自適應(yīng)抗噪性能,分別以信噪比為-16~-6 dB的軸承振動信號為分析對象進(jìn)行方法驗證。實驗中用于對比分析的方法包括WDCNN[21]、CNN-LSTM[23]、MSCNN[24]以及ResNet[25]。WDCNN針對軸承信號特點改進(jìn)了CNN的模型參數(shù);CNN-LSTM中引入了長短時記憶網(wǎng)絡(luò)結(jié)構(gòu),更易捕捉軸承信號中的特征;MSCNN使用了多卷積通路,有較強的特征提取能力;ResNet建立了殘差連接,可以在提取深層特征信息的同時將淺層提取的特征信息保留下來。這些方法在軸承故障識別上已取得了較好的結(jié)果,被許多后續(xù)文獻(xiàn)引用對比,本文取這4種經(jīng)典方法進(jìn)行性能對比驗證。4種方法與MACNN的數(shù)據(jù)分析結(jié)果如圖11所示。
圖11 不同方法的自適應(yīng)抗噪能力對比
可以看出,隨著噪聲強度增大(信噪比降低),4種對比方法的準(zhǔn)確率明顯下降。在信噪比為-16 dB時,WDCNN、MSCNN、CNN-LSTNM、ResNet的準(zhǔn)確率分別為18.07%、54.30%、49.23%、83.85%。MACNN在所有噪聲背景下的準(zhǔn)確率穩(wěn)定在98.5%以上,在信噪比為最低的-16 dB時,準(zhǔn)確率為98.85%,遠(yuǎn)高于對比方法。
為進(jìn)一步檢驗各方法在不同轉(zhuǎn)速下的抗噪性能及穩(wěn)定性,對4種不同轉(zhuǎn)速下(徑向負(fù)載為1.2 kN)的測試信號添加隨機噪聲(信號信噪比為-10 dB)進(jìn)行10次測試,結(jié)果如表3所示,表中數(shù)據(jù)形式為10次測試的“平均值±標(biāo)準(zhǔn)差”。
表3 不同轉(zhuǎn)速下各方法的測試結(jié)果
分析結(jié)果表明,轉(zhuǎn)速變化對不同方法的診斷準(zhǔn)確率均有影響。從故障激發(fā)響應(yīng)的規(guī)律看,轉(zhuǎn)速越低則信號中的故障特征越微弱。此時,對比方法的診斷準(zhǔn)確率均明顯下降且不穩(wěn)定,WDCNN、ResNet、CNN-LSTM、MSCNN的準(zhǔn)確率最大降幅分別為28.4%、44.43%、40.83%以及12.83%。MACNN在4種不同轉(zhuǎn)速下,準(zhǔn)確率始終保持在94%以上,準(zhǔn)確率最大下降僅為2.62%,且多次測試的準(zhǔn)確率波動值均小于對比方法,表明MACNN模型具有較好的抗噪性能和穩(wěn)定性。
為考察負(fù)載變化的影響,繼續(xù)在轉(zhuǎn)速2 000 r/min下對實驗軸承徑向載荷分別為0.4、0.8、1.2 kN,信噪比為-10 dB的數(shù)據(jù)進(jìn)行分析。為便于描述,分別以A、B、C代表上述3種載荷工況,以一種工況下的數(shù)據(jù)進(jìn)行訓(xùn)練,其他兩種工況下的數(shù)據(jù)進(jìn)行測試。例如:A-B表示以0.4 kN徑向載荷下的噪聲數(shù)據(jù)進(jìn)行訓(xùn)練、以0.8 kN徑向載荷下的噪聲數(shù)據(jù)進(jìn)行測試。測試10次后的實驗結(jié)果如圖12所示,圖中數(shù)據(jù)為10次測試的平均值。
圖12 不同方法抗負(fù)載變化能力的對比
可以看出,WDCNN、ResNet、CNN-LSTM這3種模型在負(fù)載變化時,性能均發(fā)生了明顯的退化。例如,負(fù)載變化時的C-A場景與負(fù)載未變化時的C-C場景相比,3個模型的準(zhǔn)確率分別下降至58.40%、69.24%、68.70%。MSCNN和MACNN在所有負(fù)載變化場景下比其他方法的診斷準(zhǔn)確率都要更高,但相比MSCNN,MACNN的抗負(fù)載變化能力更好。MACNN在所有變載荷場景的準(zhǔn)確率均保持在88%以上,最低準(zhǔn)確率為88.21%,最高準(zhǔn)確率可達(dá)98.50%;MSCNN在各場景下的準(zhǔn)確率均低于所提方法5%左右。分析結(jié)果表明,MACNN在噪聲環(huán)境下仍有較好的抗負(fù)載變化能力。
本文以融合通道注意力機制和時間注意力機制的方案改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),形成了一種具備自適應(yīng)抗噪能力的多注意力卷積網(wǎng)絡(luò)模型MACNN。主要結(jié)論如下。
(1)該網(wǎng)絡(luò)利用通道和時間的復(fù)合注意力機制,從不同角度抑制噪聲及無關(guān)信號分量等干擾信息的影響,并自適應(yīng)地增強故障特征的響應(yīng),優(yōu)化了CNN的學(xué)習(xí)機制。實驗結(jié)果表明,在強噪聲背景下,多注意力機制的引入使模型的識別準(zhǔn)確率平均提升了22.12%,所提方法有效、可行。
(2)在不同信噪比下的對比實驗中,MACNN在各噪聲背景下的準(zhǔn)確率均穩(wěn)定在98.5%以上,驗證了其自適應(yīng)抗噪能力。
(3)跨載荷實驗結(jié)果顯示,MACNN的準(zhǔn)確率均保持在88%以上,相比其他方法,其抗噪性能和穩(wěn)定性更優(yōu)。所提方法在跨工況條件下仍然具有更好的故障特征提取能力。
(4)由于多注意力機制的引入,計算量增加,模型訓(xùn)練需要更多的時間。此外,方法有效的前提是設(shè)備有大量標(biāo)記數(shù)據(jù)。因此,縮短模型訓(xùn)練時間、降低模型訓(xùn)練過程對大量標(biāo)記樣本的依賴性是后續(xù)研究的重點。