韓淞宇,邵海東,*,姜洪開,張笑陽
1. 湖南大學(xué) 機械與運載工程學(xué)院,長沙 410082 2. 西北工業(yè)大學(xué) 民航學(xué)院,西安 710072 3. 中國航空工業(yè)集團(tuán)公司西安航空計算技術(shù)研究所 民機事業(yè)部,西安 710065
航空發(fā)動機是飛機的“心臟”,其服役性能直接影響飛機的安全運行,每一次返廠維修的費用高達(dá)數(shù)百萬美元?,F(xiàn)代航空發(fā)動機正朝著高速重載,輕量化、高可靠性方向發(fā)展,使得發(fā)動機的工作條件愈發(fā)惡劣。作為航空發(fā)動機轉(zhuǎn)子系統(tǒng)的“關(guān)節(jié)”,軸承長期于轉(zhuǎn)速高且波動劇烈,負(fù)載大且變化明顯的工況,將不可避免地產(chǎn)生性能衰退甚至引發(fā)各類故障。自動準(zhǔn)確的航空發(fā)動機高速軸承故障診斷方法有助于提升航空發(fā)動機轉(zhuǎn)子系統(tǒng)的運行安全性和維修經(jīng)濟(jì)性。基于振動信號特征提取構(gòu)建淺層學(xué)習(xí)模型在航空發(fā)動機故障診斷領(lǐng)域已得到了廣泛研究。然而由于航空軸承的動力學(xué)特性復(fù)雜、故障形式多樣、原始振動信號具有強烈的非平穩(wěn)性且含有大量干擾,致使淺層學(xué)習(xí)模型的診斷性能過度依賴信號預(yù)處理和人工特征提取。
人工智能的發(fā)展為故障診斷提供了新的思路和機遇,深度學(xué)習(xí)模型能在很大程度上擺脫對研究人員的診斷知識和工程經(jīng)驗的依賴,形成了端到端的診斷系統(tǒng)。近年來,在軸承等關(guān)鍵機械部件的故障診斷中受到了極大關(guān)注:姜洪開等對飛行器關(guān)鍵部件的深度學(xué)習(xí)智能故障診斷研究進(jìn)行了系統(tǒng)性綜述。Ding等結(jié)合了稀疏分解與卷積變分自編碼器,實現(xiàn)了航空發(fā)動機主軸承的微弱故障特征提取。邵海東等提出基于提升深度遷移自動編碼器的智能診斷方法實現(xiàn)不同機械設(shè)備間的遷移診斷。李巍華等改進(jìn)了堆疊降噪自編碼器,提高了軸承的故障識別準(zhǔn)確率。楊世錫等提出了基于長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)的智能故障診斷方法,能快速準(zhǔn)確地區(qū)分滾動軸承故障類型。Zhang等將原始振動信號轉(zhuǎn)化為二維圖像,采用軸承數(shù)據(jù)集驗證了該方法的有效性。此外,陳仁祥等提出了基于深度置信網(wǎng)絡(luò)遷移學(xué)習(xí)的診斷方法;胡蔦慶等提出基于經(jīng)驗?zāi)B(tài)分解的CNN(Convolutional Neural Network)故障診斷方法;湯寶平等構(gòu)建多共振分量融合卷積神經(jīng)網(wǎng)絡(luò);魏曉良等構(gòu)建了基于LSTM和CNN的損傷程度識別方法;均對機電液系統(tǒng)的關(guān)鍵部件故障完成了準(zhǔn)確診斷。
CNN減少了對故障診斷先驗知識的依賴性,然而傳統(tǒng)CNN的卷積核只有一個尺度,導(dǎo)致其難以提取具有較強魯棒性的多尺度特征適應(yīng)不同類型故障,也難以自適應(yīng)不同的故障數(shù)據(jù)集。相較于傳統(tǒng)CNN,多尺度CNN具有更豐富的視野域和泛化能力,能夠同時對信號的全局性信息和局部特征進(jìn)行提取,近年來成為研究的熱點:張明德等闡述了多尺度卷積策略,利用軸承數(shù)據(jù)進(jìn)行了驗證。彭鵬等利用多尺度卷積網(wǎng)絡(luò)實現(xiàn)噪聲干擾下旋轉(zhuǎn)矢量減速器的故障診斷。沈長青等提出了基于多尺度卷積類內(nèi)自適應(yīng)的深度遷移學(xué)習(xí)模型,有效診斷了變工況下軸承的多種故障模式。
多尺度CNN為故障診斷提供了新的思路,然而,現(xiàn)有研究多是基于平衡數(shù)據(jù)樣本開展。實測的航空高速軸承故障樣本遠(yuǎn)小于健康樣本,在健康樣本與故障樣本不平衡時,深度學(xué)習(xí)模型診斷結(jié)果容易向大樣本偏斜,導(dǎo)致診斷性能的下降。數(shù)據(jù)增強和重采樣方法對小樣本進(jìn)行數(shù)量補償是解決數(shù)據(jù)不平衡故障診斷問題時常采用的策略,如利用生成對抗網(wǎng)絡(luò)(Generative Adversarial Network, GAN和合成少數(shù)類過采樣技術(shù)(Synthetic Minority Oversampling Technique, SMOTE產(chǎn)生與原始數(shù)據(jù)樣本近似的生成數(shù)據(jù)樣本,平衡故障數(shù)據(jù)和健康數(shù)據(jù)之間的數(shù)量差異。然而,通過GAN進(jìn)行訓(xùn)練對樣本數(shù)量要求嚴(yán)苛,訓(xùn)練樣本太少難以保證訓(xùn)練效果,訓(xùn)練樣本太多會脫離發(fā)動機的實際工況;利用SMOTE擴(kuò)充樣本存在盲目性,可能導(dǎo)致樣本混疊,增加故障診斷的難度。此外,生成樣本會增加大量時間成本,因此更高效的研究工作需要展開,提升不平衡數(shù)據(jù)下端對端的軸承故障診斷性能。
為自動準(zhǔn)確地診斷不平衡數(shù)據(jù)下航空發(fā)動機高速軸承的各類故障,提出了一種提升卷積神經(jīng)網(wǎng)絡(luò):多尺度卷積網(wǎng)絡(luò)用于提取數(shù)據(jù)的多尺度特征,使提取特征更具代表性;自適應(yīng)權(quán)重單元用于提升相關(guān)特征的重要性,減少非相關(guān)特征的影響;LSTM進(jìn)一步處理加權(quán)融合特征,增加特征的魯棒性;采用Focal Loss損失函數(shù),提升網(wǎng)絡(luò)模型對故障樣本的關(guān)注程度。航空發(fā)動機高速軸承模擬試驗臺的振動加速度數(shù)據(jù)集證明了所提方法在樣本不平衡下故障診斷的有效性。
由于權(quán)值共享,魯棒性好等優(yōu)點,CNN在故障診斷中得到了廣泛應(yīng)用。常見的CNN主要由卷積層,池化層,批量歸一化層和激活函數(shù)構(gòu)成。卷積層的主要作用在于提取輸入信號的相關(guān)特征;池化層對卷積層提取的特征向量進(jìn)行降維處理,進(jìn)一步減少優(yōu)化參數(shù)的數(shù)量,降低訓(xùn)練過程中過擬合的可能;常見的池化方法包括最大值池化和平均值池化;批量歸一化層通過規(guī)范化手段將神經(jīng)網(wǎng)絡(luò)的任意神經(jīng)元輸入修正至標(biāo)準(zhǔn)正態(tài)分布,使訓(xùn)練時每一批次的分布相似,避免了梯度離散的問題,提高了神經(jīng)網(wǎng)絡(luò)的表現(xiàn)性能;激活函數(shù)的選擇對網(wǎng)絡(luò)模型的診斷準(zhǔn)確率有顯著的影響,常見的Sigmoid函數(shù)隨著訓(xùn)練次數(shù)的迭代容易導(dǎo)致梯度消失,ReLU函數(shù)有效地解決了這一問題,但隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的加深會導(dǎo)致神經(jīng)元死亡,Swish函數(shù)綜合了兩者的優(yōu)點,在避免梯度消失的同時提高了迭代速度,不同數(shù)據(jù)集的驗證證實其分類準(zhǔn)確率高于ReLU函數(shù),鑒于此,采取Swish作為所提模型的激活函數(shù)。
采用一維CNN直接處理振動信號更為合適,其運算可定義為
(1)
(2)
(3)
(4)
CNN對時序信號的前后聯(lián)系不敏感,RNN被證明能夠更好學(xué)習(xí)時間序列中隱藏的發(fā)展趨勢。作為RNN的變體,LSTM解決了RNN記憶容量有限,易產(chǎn)生梯度離散的問題,對長時間序列有更強的適應(yīng)能力。結(jié)合CNN和LSTM,能從空間和時間兩個維度實現(xiàn)對樣本表征性信息更全面的提取。
LSTM通過引入遺忘門,輸入門,輸出門等門結(jié)構(gòu),狀態(tài)向量,內(nèi)存向量對循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行了改進(jìn),提高了網(wǎng)絡(luò)的表現(xiàn)性能。遺忘門作用于內(nèi)存向量,控制之前的系統(tǒng)狀態(tài)信息對系統(tǒng)當(dāng)前時刻狀態(tài)的影響,并對記憶內(nèi)容進(jìn)行篩選;輸入門通過更新實時狀態(tài)向量來控制系統(tǒng)對輸入的接受程度,并通過tanh函數(shù)將輸入數(shù)據(jù)進(jìn)行壓縮;輸出門計算系統(tǒng)的輸出,并根據(jù)輸出完成對當(dāng)前狀態(tài)向量的更新:
=(*[-1,]+)
(5)
′=tanh(*[-1,]+)
(6)
=(*[-1,]+)
(7)
=×′+×-1
(8)
=(*[-1,]+)
(9)
=×tanh()
(10)
式中:(·)為sigmoid激活函數(shù);為上一時刻的狀態(tài)向量-1和當(dāng)前時刻輸入與遺忘門之間的權(quán)重矩陣;為相關(guān)偏置;為遺忘門的輸出;、分別為、-1同輸入門之間的權(quán)重矩陣;、為相關(guān)偏置;為輸入門的輸出;′為候選單元狀態(tài),和系統(tǒng)前一時刻內(nèi)存向量-1共同決定系統(tǒng)當(dāng)前時刻的內(nèi)存向量;為-1、同輸出門之間的權(quán)重矩陣;為相關(guān)偏置;為輸出門的輸出;為更新之后當(dāng)前時刻的狀態(tài)向量。
準(zhǔn)確故障診斷的關(guān)鍵之一在于提取特征是否能夠反映不同類型信號的差異性,單尺度的卷積核只能對信號的特定周期進(jìn)行覆蓋,提取特征時缺乏自適應(yīng)性,難以在不同的機械設(shè)備故障診斷中得到應(yīng)用。多尺度特征提取網(wǎng)絡(luò)將不同尺寸的卷積核作用于不同的卷積單元,其不同卷積層視野域的迭代計算公式為
=(+1-1)+
(11)
式中:為卷積核的尺寸;為卷積步長;為視野域;下標(biāo)為卷積層數(shù)。
當(dāng)步長和迭代次數(shù)一定時,卷積核的大小反映了視野域的大小。小尺寸的卷積核更關(guān)注數(shù)據(jù)局部之間的聯(lián)系,注重定位信號中的關(guān)鍵信息,大尺寸的卷積核利于提取信號的全局特征。將不同大小卷積核的卷積網(wǎng)絡(luò)并行作用于同一信號,能學(xué)習(xí)到信號不同尺度的抽象特征,從多個尺度挖掘具有識別性的振動信息,增強網(wǎng)絡(luò)故障特征識別的魯棒性。組合不同尺寸的卷積核能夠適應(yīng)輸入信號的改變,使模型具有更強的泛化能力。
多尺度特征提取網(wǎng)絡(luò)采用不同大小的卷積核對輸入信號的視野域進(jìn)行感受,不僅能夠降低選擇卷積核尺寸的經(jīng)驗要求,更能提取魯棒性好的多尺度特征。相比于單尺度特征,多尺度特征更能體現(xiàn)對不同故障數(shù)據(jù)的描述。所提方法的多尺度網(wǎng)絡(luò)構(gòu)建了相同形狀的平行通道,采用不同大小的卷積核搭配不同數(shù)量的過濾器提取樣本的多尺度特征。為了豐富特征的視野尺度,卷積核尺寸應(yīng)該覆蓋一定的范圍,選擇單數(shù)的卷積核,能夠匹配數(shù)據(jù)的中心點,不易產(chǎn)生特征偏移,因此不同平行通道的卷積核尺寸設(shè)置為:3、11、17。此外,每個平行通道添加了旁路連接,利用大小為1的卷積核對信號的關(guān)鍵信息進(jìn)行定位。
多尺度特征提取網(wǎng)絡(luò)的有關(guān)結(jié)構(gòu)參數(shù)和示意圖由表1和圖1給出,過程可以描述為
(12)
表1 多尺度特征提取網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)
圖1 多尺度特征提取網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Structure of multiscale feature extraction network
通過多尺度特征提取網(wǎng)絡(luò)提取的特征具有同等的重要性,然而不同的特征對故障診斷結(jié)果理應(yīng)有不一樣的貢獻(xiàn)率。為了提升相關(guān)特征的貢獻(xiàn),降低非相關(guān)特征對故障診斷結(jié)果的干擾,設(shè)計了自適應(yīng)權(quán)重單元對多尺度特征進(jìn)一步處理。如圖2所示,首先利用卷積層和最大池化層對輸入特征進(jìn)行壓縮,使特征的重要性更容易被學(xué)習(xí),然后利用大小為1的卷積神經(jīng)網(wǎng)絡(luò)為每個特征生成對應(yīng)權(quán)重值,上采樣層用于將權(quán)重還原至和輸入特征相同的尺寸和維度,使特征權(quán)重值的形狀和特征形狀對應(yīng),便于乘積運算,最后通過Softmax函數(shù)將特征的重要性壓縮至0~1之間。自適應(yīng)權(quán)重單元本質(zhì)上是所提方法中的網(wǎng)絡(luò)連接層,利用分類損失函數(shù)進(jìn)行訓(xùn)練,通過誤差的反向傳播即可完成有關(guān)參數(shù)的更新,從而每次訓(xùn)練過程中計算的特征重要性也會發(fā)生變化,即完成權(quán)重的自適應(yīng)過程:
(13)
(14)
(15)
(16)
圖2 自適應(yīng)權(quán)重單元結(jié)構(gòu)Fig.2 Structure of adaptive weight unit
在樣本高度不平衡時,損失函數(shù)同樣對故障診斷性能產(chǎn)生了影響,傳統(tǒng)的交叉熵?fù)p失(Cross Entropy Loss,CE Loss)通過計算真實分布與預(yù)測分布的差異計算損失值:
(17)
1) CE Loss將每一類型樣本的分類成本視為相等,但訓(xùn)練過程中的總損失是所有樣本的CE Loss之和。當(dāng)健康樣本遠(yuǎn)多于故障樣本時,健康樣本的損失值在總損失中占有足夠高的比例,當(dāng)對損失值進(jìn)行最小優(yōu)化時,由于故障樣本的CE Loss對整體損失的貢獻(xiàn)程度很小,當(dāng)健康樣本已經(jīng)正確分類,整體的損失值就會降低到相對較低的水平,容易導(dǎo)致神經(jīng)網(wǎng)絡(luò)訓(xùn)練停滯。
2) CE Loss對易混淆樣本的重視程度有待提高。如對于一個類的故障診斷問題,存在兩個故障類別的樣本,在某次訓(xùn)練過程中輸出分別為[0.19…0.190.200.19…0.19],[0.10…0.100.500.10…0.10],在進(jìn)行下一次訓(xùn)練過程時,前者被誤判為其他樣本的概率顯然高于后者,提高易混淆樣本的損失值所占比例有利于提高整體的故障診斷準(zhǔn)確率。
針對上述問題,采用Focal Loss損失函數(shù)作為訓(xùn)練過程中的損失函數(shù):
(18)
相較于CE Loss,做出如下改進(jìn):
1) 引入平衡因子平衡健康樣本與故障樣本之間的數(shù)量差異,其與不同故障類型的樣本數(shù)量呈負(fù)相關(guān)關(guān)系。
2) 引入放縮因子用于降低易分類樣本損失所占比例,增加易混淆樣本的損失貢獻(xiàn),使訓(xùn)練過程中神經(jīng)網(wǎng)絡(luò)更關(guān)注易混淆樣本。
所提方法用于不平衡數(shù)據(jù)下的航空發(fā)動機高速軸承故障診斷,主要步驟如下:
采用三軸振動傳感器采集各種狀態(tài)下航空發(fā)動機高速軸承振動加速度數(shù)據(jù),其中健康樣本遠(yuǎn)多于故障樣本。
對振動加速度數(shù)據(jù)進(jìn)行線性歸一化處理,歸一化的范圍為[-1,1]。
將3個方向的振動數(shù)據(jù)簡單拼接,使每個數(shù)據(jù)點包含3個方向的振動數(shù)據(jù),并將數(shù)據(jù)集劃分為訓(xùn)練樣本和測試樣本。
構(gòu)建基于自適應(yīng)權(quán)重和多尺度卷積的提升卷積神經(jīng)網(wǎng)絡(luò)模型,訓(xùn)練過程中采用Focal Loss損失函數(shù)。
測試樣本進(jìn)行故障診斷,不同的評價指標(biāo)評估所提模型的診斷性能。
采用的數(shù)據(jù)來自意大利都靈理工大學(xué)機械和航天工程系的航空發(fā)動機高速軸承故障模擬試驗臺,該試驗臺可測量航空軸承在不同高轉(zhuǎn)速和不同重載荷下的振動加速度數(shù)據(jù)。
圖3為實驗平臺,B1、B2、B3為3個軸承支座,A1和A2處各安裝1個三軸振動加速度傳感器,分別用于測量損壞軸承支架B1處和受外載荷最大B2處的振動數(shù)據(jù)。使用Rockwell工具在軸承內(nèi)圈或滾子上產(chǎn)生不同大小的錐形壓痕,模擬不同的故障類型,軸承不同健康狀態(tài)的測量過程相同:首先在空載下以100 Hz轉(zhuǎn)頻(6 000 r/min)短暫運行,檢查安裝是否正確,正確安裝后逐步改變外載荷的大小,并以100 Hz為步長提高。當(dāng)軸的轉(zhuǎn)速穩(wěn)定后就通過傳感器對振動數(shù)據(jù)進(jìn)行測量,表2給出了轉(zhuǎn)速和外載荷之間的試驗組合。
圖3 實驗平臺Fig.3 Experimental platform
表2 測試負(fù)載和旋轉(zhuǎn)速度Table 2 Testing load and rotating speed
為模擬航空發(fā)動機軸承長期運行于高速和重載的真實工況,且進(jìn)一步測試所提方法的故障狀態(tài)識別性能,選取3種高轉(zhuǎn)速(18 000、24 000、30 000 r/min)和2種大載荷下(1 000、1 400 N)的振動數(shù)據(jù)用于驗證所提方法有效性,不僅可以更好地模擬航空發(fā)動機轉(zhuǎn)速的波動,還可以提升故障診斷任務(wù)的復(fù)雜性。為了模擬訓(xùn)練樣本的不平衡情形,將健康類別的訓(xùn)練樣本設(shè)置為1 000個,故障類別的訓(xùn)練樣本數(shù)量滿足均值為50,方差為10的高斯正態(tài)分布,進(jìn)行測試時,健康樣本和各故障類型樣本均設(shè)置為100個。傳感器不同通道的數(shù)據(jù)體現(xiàn)了對故障類型的一致性描述,雖然在分布上有所差異,但本質(zhì)上屬于同構(gòu)數(shù)據(jù),采用直接拼接的處理方式不僅可以減少數(shù)量的損失,也能更全面探索不同通道間互補的信息。鑒于此,選擇、、方向各1 200個數(shù)據(jù)點依次拼接成1 200×3的樣本。共構(gòu)建2個實驗數(shù)據(jù)集T1和T2,相關(guān)的具體描述由表3和表4給出。
表3 數(shù)據(jù)集T1描述 (載荷=1 400 N)Table 3 Description of data set T1 (載荷=1 400 N)
表4 數(shù)據(jù)集T2描述 (載荷=1 000 N)Table 4 Description of data set T2 (載荷=1 000 N)
所提方法與目前常用的深度學(xué)習(xí)智能診斷方法對比,包括:CNN1 (CE Loss)、CNN2 (Focal Loss)、卷積自編碼器和雙向LSTM。CNN1和CNN2采用單一尺寸的卷積核,堆疊層數(shù)與所提方法相同,對比方法均采用ReLU函數(shù)作為激活函數(shù)。分別對數(shù)據(jù)集T1和數(shù)據(jù)集T2進(jìn)行故障診斷。為防止隨機誤差對實驗的干擾,所有的實驗重復(fù)進(jìn)行10次,并取實驗的平均值作為該種方法的平均診斷準(zhǔn)確率,具體的結(jié)果由表5給出。
表5 不同方法故障診斷結(jié)果對比
案例運行環(huán)境簡單介紹:CPU:i5-10400F;GPU:GTX1650;運行系統(tǒng):Windows10;運行軟件版本:Tensorflow2.1。案例中參數(shù)設(shè)置如下:設(shè)置為2;為第類樣本數(shù)量占總樣本數(shù)量的倒數(shù)再經(jīng)過歸一化處理后的值;迭代次數(shù)設(shè)置為100次;初始學(xué)習(xí)率為0.000 1,若訓(xùn)練過程中連續(xù)5次損失值未下降,學(xué)習(xí)率乘以0.85進(jìn)行更新。訓(xùn)練過程中,CNN1采用CE Loss函數(shù),其余所有方法均使用Focal Loss函數(shù)。
結(jié)果顯示所提方法對數(shù)據(jù)集T1的平均診斷正確率為98.20%±0.834%,對數(shù)據(jù)集T2的平均診斷正確率為98.92%±0.532%,均高于其余對比方法。采用Focal Loss后,CNN2在診斷準(zhǔn)確率上相較CNN1有了明顯提升,分別提高了約20個百分點和17個百分點,但結(jié)果顯示Focal Loss損失函數(shù)只能在訓(xùn)練過程中對小樣本的數(shù)量進(jìn)行補償,并不能保證CNN能準(zhǔn)確提取不同故障類型具有代表性的樣本特征,因此CNN2相較CNN1,雖然故障診斷準(zhǔn)確率有了提升,但由于提取的故障樣本特征依然不具有充分的表征性,仍難以實現(xiàn)高性能的故障診斷。
當(dāng)訓(xùn)練樣本數(shù)量不平衡時,精確率和召回率是評估診斷性能的優(yōu)良指標(biāo):
(19)
(20)
式中:pre為精確率;recall為召回率;TP為正樣本預(yù)測為正樣本的個數(shù);FP 為負(fù)樣本預(yù)測為正樣本的個數(shù);FN為正樣本預(yù)測為負(fù)樣本的個數(shù)。
圖4和圖5給出了訓(xùn)練過程中所提方法針對數(shù)據(jù)集T1、T2的故障診斷準(zhǔn)確率,精確率,召回率的迭代變化曲線,進(jìn)一步對所提方法的故障診斷性能進(jìn)行評估。結(jié)果顯示當(dāng)訓(xùn)練次數(shù)超過20次之后,訓(xùn)練集的各項指標(biāo)已經(jīng)達(dá)到較高的水準(zhǔn),只在小范圍內(nèi)進(jìn)行波動。當(dāng)?shù)螖?shù)達(dá)到100次時,各項指標(biāo)都達(dá)到了100%的水準(zhǔn);測試曲線的各項指標(biāo)略低于訓(xùn)練曲線,并未出現(xiàn)神經(jīng)網(wǎng)絡(luò)過擬合導(dǎo)致測試精度降低的現(xiàn)象,證明所提方法在訓(xùn)練樣本不平衡的情況下針對測試樣本的診斷性能也維持原有的高水平。
圖4 評價指標(biāo)曲線-T1Fig.4 Curves of evaluation indexes-T1
圖5 評價指標(biāo)曲線-T2Fig.5 Curves of evaluation indexes-T2
為更好評估模型的診斷性能,分別給出某次測試過程中所提方法關(guān)于數(shù)據(jù)集T1和T2的故障診斷混淆矩陣,如圖6和圖7所示。圖中橫坐標(biāo)代表的是真實標(biāo)簽,縱坐標(biāo)代表的是預(yù)測標(biāo)簽。
圖6結(jié)果顯示,在對數(shù)據(jù)集T1進(jìn)行測量時,類別為1的樣本診斷準(zhǔn)確率為91%,被誤分為類別3,8的比例分別為8%,1%;類別為2的樣本診斷準(zhǔn)確率為88%,被誤分為類別4的比例為12%;類別為4的樣本診斷準(zhǔn)確率為91%,被誤分為類別2的比例為9%,其余樣本的診斷準(zhǔn)確率均達(dá)到了100%。
圖6 所提方法診斷結(jié)果混淆矩陣-T1Fig.6 Confusion matrix of diagnosis results of proposed method-T1
圖7結(jié)果顯示,在對數(shù)據(jù)集T2進(jìn)行測量時,類別為3的樣本診斷準(zhǔn)確率為71%,被誤分為類別0的比例達(dá)到了29%;其余樣本的診斷準(zhǔn)確率均高于95%,其中類別1的診斷準(zhǔn)確率為96%,少量樣本被誤判為類別0和類別3;除類別3,類別1外,其余樣本的診斷準(zhǔn)確率均達(dá)到了100%兩實驗集的混淆矩陣進(jìn)一步證明所提方法在不平衡樣本的情況下更能適應(yīng)不同故障信號的變化,提取的特征具有較好的差異性,能夠完成高準(zhǔn)確率的航空發(fā)動機軸承故障診斷。
圖7 所提方法診斷結(jié)果混淆矩陣-T2Fig.7 Confusion matrix of diagnosis results of proposed method-T2
采用T分布隨機鄰域嵌入(T-Stochastic Neighbor Embedding,T-SNE)方法可視化某次測試過程中CNN1,CNN2,和所提方法的最終輸出特征,如圖8和圖9所示。
圖8展示了3種對比方法對數(shù)據(jù)集T1進(jìn)行故障診斷時提取特征的二維空間分布圖。圖像顯示所提方法提取的特征在二維空間上的聚類非常清晰,相同類型樣本之間的分布更加緊湊,只有少量不同類別樣本的輸出特征分布在臨近的區(qū)域。結(jié)果同樣顯示CNN1和CNN2能夠區(qū)分個別樣本類型,提取特征在二維空間上形成聚類分布,但多數(shù)樣本產(chǎn)生了重疊現(xiàn)象,證明單一尺寸卷積核可實現(xiàn)對某些類型振動信號特征的提取,但難以適應(yīng)振動信號的改變,導(dǎo)致診斷準(zhǔn)確率難以達(dá)到較高水平。
圖8 特征二維可視化-T1Fig.8 Two-dimensional visualization of features-T1
圖9展示了3種對比方法對數(shù)據(jù)集T2進(jìn)行故障診斷時提取特征的二維空間分布圖。相較于數(shù)據(jù)集T1、CNN1和CNN2能夠識別更多類別的樣本,Focal Loss提高了卷積神經(jīng)網(wǎng)絡(luò)對小樣本損失的重視,使CNN2提取特征的聚類現(xiàn)象優(yōu)于CNN1,但兩種方法依然無法適應(yīng)所有類型的輸入信號,產(chǎn)生重疊的樣本類別和數(shù)量依然多于所提方法。
圖9 特征二維可視化-T2Fig.9 Two-dimensional visualization of features-T2
兩組數(shù)據(jù)集的特征二維空間分布圖的對比證實了在不平衡數(shù)據(jù)集下,所提方法提取的多尺度特征具有更強的識別性,能夠反映不同故障信號之間的差異。
自適應(yīng)權(quán)重單元對特征重要性進(jìn)行了區(qū)分,提高相關(guān)特征的重要性利于實現(xiàn)高性能的故障診斷。圖10給出了訓(xùn)練過程中卷積核尺寸為17的特征提取網(wǎng)絡(luò)提取特征的權(quán)重自適應(yīng)過程,數(shù)據(jù)顯示提取特征被賦予了不同的權(quán)重,其重要性得到有效區(qū)分。權(quán)重隨著迭代進(jìn)行而改變,當(dāng)?shù)?0次和100次時,所提模型的分類準(zhǔn)確率在峰值水平波動,對應(yīng)的特征重要性也存在很大程度的相似,說明了自適應(yīng)權(quán)重單元的必要性。
圖10 特征權(quán)重自適應(yīng)過程Fig.10 Adaptive process of feature weights
1) 相較于單尺度神經(jīng)網(wǎng)絡(luò),多尺度卷積神經(jīng)網(wǎng)絡(luò)更能夠適應(yīng)不同的故障信號,具有更強的泛化能力,在樣本不平衡時能夠挖掘表征性特征,經(jīng)過自適應(yīng)權(quán)值單元的加權(quán)融合處理能使多尺度特征更具代表性,所提模型能夠充分挖掘故障樣本的信息,在樣本不平衡條件下實現(xiàn)高性能的故障診斷。
2) 不平衡數(shù)據(jù)集下采用Focal Loss損失函數(shù)能夠提高卷積神經(jīng)網(wǎng)絡(luò)對小樣本和易混淆樣本的關(guān)注程度,進(jìn)而在一定程度上提高故障診斷的準(zhǔn)確率。