趙志宏 李樂(lè)豪 楊紹普 李 晴
1.省部共建交通工程結(jié)構(gòu)力學(xué)行為與系統(tǒng)安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,石家莊,0500432.石家莊鐵道大學(xué)信息科學(xué)與技術(shù)學(xué)院,石家莊,050043
目前,故障診斷的傳統(tǒng)方法以信號(hào)處理技術(shù)為基礎(chǔ),分別在時(shí)域、頻域、時(shí)頻域上提取故障特征信息以實(shí)現(xiàn)診斷[1-3]。傳統(tǒng)方法的特征需要人工提取,并且提取到的往往是淺層故障特征。
2006年HINTON等[4]提出了深度學(xué)習(xí)理論,深度神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的自動(dòng)特征提取能力,能夠擬合復(fù)雜映射關(guān)系,在很多領(lǐng)域掀起了研究浪潮,在計(jì)算機(jī)視覺(jué)[5]和自然語(yǔ)言處理[6]領(lǐng)域的發(fā)展尤為迅速。近年來(lái),深度學(xué)習(xí)在機(jī)械故障診斷方面的研究越來(lái)越得到專家學(xué)者的關(guān)注,取得了不少研究成果。已經(jīng)用于故障診斷的深度網(wǎng)絡(luò)模型有卷積神經(jīng)網(wǎng)絡(luò)[7-8]、循環(huán)神經(jīng)網(wǎng)絡(luò)[9-10]、深度信念網(wǎng)絡(luò)[11-12]、降噪自編碼器[13-14]等。降噪自編碼器是一種改進(jìn)的自編碼器,在輸入信號(hào)被損壞的情況下,可以重構(gòu)出無(wú)噪聲的輸入,以此提高特征提取的魯棒性。降噪自編碼器的主要優(yōu)勢(shì)在于它是一種無(wú)監(jiān)督學(xué)習(xí)模型,可以提取輸入數(shù)據(jù)的本質(zhì)特征。在降噪自編碼器訓(xùn)練的過(guò)程中由于輸入數(shù)據(jù)較為復(fù)雜,重構(gòu)難度較大,會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)不容易收斂,同時(shí)缺少標(biāo)簽信息的參與,使得模型很難提取到低維且富含類別信息的特征[15],這也是自編碼器普遍存在的問(wèn)題。
為了解決網(wǎng)絡(luò)訓(xùn)練不收斂問(wèn)題,一些專家學(xué)者使用信號(hào)的頻譜代替時(shí)域信號(hào)作為自編碼器的輸入,取得了較好的特征提取能力,在故障分類和壽命預(yù)測(cè)任務(wù)中均取得了比較好的效果。雷亞國(guó)等[16]使用堆疊自編碼方法提取行星齒輪故障特征,實(shí)現(xiàn)了行星齒輪故障100%的分類準(zhǔn)確率。 LI等[17]使用深度卷積自編碼器網(wǎng)絡(luò),將距離度量學(xué)習(xí)和k-means聚類方法集成到神經(jīng)網(wǎng)絡(luò)模型中,在標(biāo)簽數(shù)據(jù)較少的半監(jiān)督學(xué)習(xí)任務(wù)上取得了良好的故障診斷性能,另外也適用于無(wú)監(jiān)督的情況。唐守強(qiáng)等[18]使用改進(jìn)的稀疏自編碼器提取能夠表征軸承退化趨勢(shì)的特征,然后利用Bi-LSTM進(jìn)行滾動(dòng)軸承壽命預(yù)測(cè)。這些工作都是將頻譜作為自編碼器網(wǎng)絡(luò)的輸入以提取頻域特征,需要對(duì)原始信號(hào)進(jìn)行傅里葉變換,能否直接從時(shí)域信號(hào)中提取頻域特征是一個(gè)非常有價(jià)值的研究課題。本文提出一種直接從原始時(shí)域信號(hào)提取頻域特征的降噪自編碼器方法,與傳統(tǒng)自編碼器以利用原始信號(hào)作為目標(biāo)輸出不同,這里使用頻譜作為目標(biāo)輸出訓(xùn)練網(wǎng)絡(luò)模型,訓(xùn)練后的自編碼器可以從時(shí)域信號(hào)中提取頻域特征信息。為了便于敘述,將本文提出的以提取頻域特征為目標(biāo)的降噪自編碼器稱為頻域自編碼器。
圖1 降噪自編碼器結(jié)構(gòu)Fig.1 Structure of denoising auto-encoder
傳統(tǒng)自編碼器的目標(biāo)輸出為重構(gòu)原始信號(hào),編碼器的任務(wù)是擬合從原始信號(hào)到特征的映射關(guān)系,解碼器的任務(wù)為擬合從特征到原始信號(hào)的映射關(guān)系,因此傳統(tǒng)自編碼器為對(duì)稱結(jié)構(gòu)。為了能夠從時(shí)域信號(hào)中提取頻域特征,本文在降噪自編碼器的基礎(chǔ)上設(shè)計(jì)了一種提取頻域特征非對(duì)稱的自編碼器。模型結(jié)構(gòu)如圖2所示,主要由卷積層和全連接層組成。
圖2 頻域自編碼器模型結(jié)構(gòu)Fig.2 Model structure of frequency domain auto-encoder
編碼器第一層為卷積層,使用大尺度卷積核對(duì)受損壞的信號(hào)進(jìn)行特征提取,并且擁有一定程度上的降噪效果。在卷積層后使用批標(biāo)準(zhǔn)化層緩解梯度消失,加快訓(xùn)練速度[19]。選取LeakyReLU作為編碼器各個(gè)網(wǎng)絡(luò)層的激活函數(shù),以避免由于特征稀疏導(dǎo)致的表征能力下降[20]。然后通過(guò)兩個(gè)全連接層來(lái)實(shí)現(xiàn)降維。解碼器由兩個(gè)全連接層組成,兩個(gè)全連接層分別使用激活函數(shù)LeakyReLU和ReLU,并在之間使用批標(biāo)準(zhǔn)化。
編碼器加上分類器后的故障診斷模型如圖3所示,分類器使用兩層全連接神經(jīng)網(wǎng)絡(luò),激活函數(shù)分別為ReLU和Softmax。
圖3 故障診斷模型結(jié)構(gòu)Fig.3 Structure of fault diagnosis model
本文頻域自編碼器網(wǎng)絡(luò)模型中的重要參數(shù)如表1所示,其中LeakyReLU激活函數(shù)中alpha的取值為0.3。
表1 網(wǎng)絡(luò)參數(shù)
頻域自編碼器特征提取流程圖如圖4所示,步驟如下:
圖4 頻域特征提取流程圖Fig.4 Flow chart of feature extraction infrequency domain
(1)采集原始振動(dòng)信號(hào)。
(2)將原始信號(hào)劃分為訓(xùn)練集和測(cè)試集。
(3)使用傅里葉變換獲取訓(xùn)練集的頻譜。
(4)采用文獻(xiàn)[13]的方法對(duì)訓(xùn)練集中的振動(dòng)信號(hào)以一定的概率P置零得到受損信號(hào)作為頻域自編碼器的輸入,這里置零的概率為20%。將振動(dòng)信號(hào)對(duì)應(yīng)的頻譜作為重構(gòu)目標(biāo),損失函數(shù)為
(2)
使用Adam優(yōu)化器訓(xùn)練得到頻域自編碼器網(wǎng)絡(luò)的參數(shù),學(xué)習(xí)率設(shè)置為0.003。
(5)去掉頻域自編碼器網(wǎng)絡(luò)中的解碼器。將測(cè)試集中的診斷信號(hào)輸入編碼器得到的輸出即為原始信號(hào)的頻域特征信息 。
(6)在編碼器后面接上分類器,固定編碼器參數(shù),利用訓(xùn)練集中的振動(dòng)信號(hào)和對(duì)應(yīng)的故障類型標(biāo)簽訓(xùn)練得到分類器的參數(shù)。
(7)將測(cè)試集中的振動(dòng)信號(hào)輸入網(wǎng)絡(luò)進(jìn)行故障分類。
本文選取凱斯西儲(chǔ)大學(xué)公開(kāi)滾動(dòng)軸承數(shù)據(jù)[21]進(jìn)行驗(yàn)證。滾動(dòng)軸承型號(hào)為SKF6205-RS JEM SKF。數(shù)據(jù)采集系統(tǒng)由電機(jī)、矩陣傳感器、功率計(jì)和電子控制設(shè)備組成,采樣頻率為48 kHz。使用電火花在軸承的滾動(dòng)體、內(nèi)圈和外圈加工出故障,故障大小為0.1778 mm。包含正常狀態(tài)的軸承在內(nèi),共計(jì)4種不同狀態(tài)的軸承,在1HP、2HP和3HP 3種負(fù)載下采集振動(dòng)信號(hào)。
為了避免神經(jīng)網(wǎng)絡(luò)過(guò)擬合,同時(shí)減輕相位對(duì)特征提取造成的影響,使用滑動(dòng)窗口采樣分別對(duì)訓(xùn)練集和測(cè)試集擴(kuò)充樣本。采樣過(guò)程如圖5所示,采樣窗口長(zhǎng)度為2000個(gè)采樣點(diǎn),窗口滑動(dòng)的步長(zhǎng)為28個(gè)采樣點(diǎn)。使用滑動(dòng)窗口采樣法分別對(duì)3種負(fù)載下的4種故障類型的軸承振動(dòng)數(shù)據(jù)各采集2000個(gè)樣本,對(duì)故障類型使用One-Hot編碼。
圖5 滑動(dòng)窗口采樣Fig.5 Sliding window sampling
根據(jù)樣本的負(fù)載不同數(shù)據(jù)集劃分為3個(gè),其中數(shù)據(jù)集A負(fù)載為1HP,數(shù)據(jù)集B負(fù)載2HP,數(shù)據(jù)集C負(fù)載3HP。每個(gè)數(shù)據(jù)集均包含4類故障數(shù)據(jù),即滾動(dòng)體故障、內(nèi)圈故障、外圈故障和正常狀態(tài)故障,每個(gè)數(shù)據(jù)集的每類數(shù)據(jù)樣本均為2000個(gè)。
為驗(yàn)證頻域自編碼器的特征提取效果,與傳統(tǒng)降噪自編碼器進(jìn)行對(duì)比實(shí)驗(yàn)。本文設(shè)計(jì)的傳統(tǒng)自編碼器網(wǎng)絡(luò)參數(shù)與頻域編碼器中的網(wǎng)絡(luò)參數(shù)大致相同,不同的是,傳統(tǒng)自編碼器FC_3的神經(jīng)元個(gè)數(shù)為600,F(xiàn)C_4的神經(jīng)元個(gè)數(shù)為2000,該層不使用激活函數(shù)。
3.2.1特征提取實(shí)驗(yàn)
將數(shù)據(jù)集A、B和C混合,從每類樣本中取75%作為訓(xùn)練集用于訓(xùn)練自編碼器,剩余25%作為測(cè)試集。為了直觀地展示提取到的特征,利用t-SNE降維可視化方法[22]對(duì)特征進(jìn)行降維聚類,并與傳統(tǒng)自編碼器方法進(jìn)行對(duì)比。
頻域自編碼器對(duì)測(cè)試集進(jìn)行特征提取后通過(guò)t-SNE降至二維的結(jié)果如圖6所示,其中特征1、特征2分別為頻域自編碼器特征經(jīng)過(guò)t-SNE降低后獲取的2個(gè)特征值。從圖中可以看到不同類別的故障信號(hào)之間有著清晰的界限,可以有效的區(qū)分不同類別的故障信號(hào)。
圖6 頻域自編碼器特征降維結(jié)果Fig.6 Feature dimension reduction results of frequencydomain auto-encoder
傳統(tǒng)自編碼器對(duì)測(cè)試集進(jìn)行特征提取后通過(guò)t-SNE降至二維的結(jié)果如圖7所示,從圖中可以看到對(duì)外圈故障和正常軸承有一定的聚類效果,但是滾動(dòng)體故障和內(nèi)圈故障混雜在了一起,并且正常軸承中也摻雜了部分外圈故障和滾動(dòng)體故障,不足以有效區(qū)分不同故障信號(hào)。
圖7 傳統(tǒng)自編碼器特征降維結(jié)果Fig.7 Feature dimension reduction results oftraditional auto-encoder
頻域自編碼器和傳統(tǒng)自編碼器提取到的特征在三維空間中的分布分別如圖8和圖9所示,從圖中可以看到頻域自編碼器提取的不同類別軸承特征之間存在著清晰的界限。正常軸承、滾動(dòng)體故障和內(nèi)圈故障的類內(nèi)間距比較小,外圈故障的類內(nèi)間距較大但是與其他類別可以準(zhǔn)確區(qū)分。傳統(tǒng)自編碼器提取到的特征在空間中的分布規(guī)律則較差,只能看到外圈故障和內(nèi)圈故障軸承,滾動(dòng)體故障和正常軸承被它們包圍而無(wú)法看到。另外,正常軸承、滾動(dòng)體故障和內(nèi)圈信號(hào)之間的界限不清晰,無(wú)法區(qū)分4種類別軸承。
圖8 頻域自編碼器特征在三維空間中的分布Fig.8 Distribution of frequency domain auto-encoderfeatures in three dimensional space
圖9 傳統(tǒng)自編碼器特征在三維空間中的分布Fig.9 Distribution of traditional auto-encoder featuresin three dimensional space
3.2.2頻譜重構(gòu)實(shí)驗(yàn)
測(cè)試集中4類振動(dòng)信號(hào)的頻譜和頻域自編碼器重構(gòu)的頻譜如圖10所示,從圖中可以看到頻域自編碼器可以較好地重構(gòu)信號(hào)的頻譜。滾動(dòng)體故障、內(nèi)圈故障、外圈故障和正常狀態(tài)的頻譜中幅值較高的頻率都進(jìn)行了重構(gòu),其中外圈故障的頻譜和重構(gòu)頻譜相似度最高,其他重構(gòu)頻譜雖然頻率較低的部分有所丟失,但是保留了主要的頻譜特征,驗(yàn)證了本文的頻域自編碼器方法可以在不經(jīng)過(guò)傅里葉變換的情況下就可以提取信號(hào)的頻域特征。
在機(jī)械設(shè)備的運(yùn)轉(zhuǎn)過(guò)程中,負(fù)載的變化會(huì)影響時(shí)域波形,常常會(huì)造成故障的誤報(bào)和漏報(bào),對(duì)網(wǎng)絡(luò)模型的特征提取能力提出了更高的要求[23]。在實(shí)際生產(chǎn)環(huán)境中,很難判斷軸承發(fā)生故障的時(shí)間,因此對(duì)實(shí)際工作環(huán)境下收集的軸承振動(dòng)信號(hào)添加標(biāo)簽有一定難度。一個(gè)好的特征提取方法應(yīng)該對(duì)故障類型敏感,對(duì)負(fù)載不敏感,并且需要的標(biāo)簽數(shù)量盡量少。為進(jìn)一步驗(yàn)證本文所提頻域自編碼器的特征提取能力,進(jìn)行故障診斷泛化實(shí)驗(yàn),設(shè)計(jì)訓(xùn)練集與測(cè)試集為不同負(fù)載,分別在不同標(biāo)簽數(shù)量的情況下進(jìn)行實(shí)驗(yàn)。
(a)滾動(dòng)體故障頻譜 (b)重構(gòu)的滾動(dòng)體故障頻譜 (c)內(nèi)圈故障頻譜
(d)重構(gòu)的內(nèi)圈故障頻譜 (e)外圈故障頻譜 (f)重構(gòu)的外圈故障頻譜
(g)正常狀態(tài)頻譜 (h)重構(gòu)的正常狀態(tài)頻譜圖10 頻譜與重構(gòu)頻譜的對(duì)比Fig.10 Comparison of spectrum and reconstructed spectrum
使用兩種負(fù)載下的數(shù)據(jù)集中全部的振動(dòng)信號(hào)作為訓(xùn)練集,使用剩余負(fù)載的全部振動(dòng)信號(hào)作為測(cè)試集。
方法1為上文使用的傳統(tǒng)自編碼器,分類器參數(shù)設(shè)置和訓(xùn)練流程與頻域自編碼器保持一致。方法2為端到端訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),使用有標(biāo)簽樣本進(jìn)行訓(xùn)練,網(wǎng)絡(luò)組成為編碼器拼接上分類器,網(wǎng)絡(luò)參數(shù)設(shè)置與頻域自編碼器一致。
分別使用訓(xùn)練集中100%、10%和1%的有標(biāo)簽樣本訓(xùn)練頻域自編碼器方法和方法1中的分類器,分別使用訓(xùn)練集中100%、10%和1%的有標(biāo)簽樣本端到端訓(xùn)練方法2中的深度神經(jīng)網(wǎng)絡(luò)。訓(xùn)練頻域自編碼器時(shí)迭代訓(xùn)練300代,訓(xùn)練分類器時(shí)迭代訓(xùn)練2000代。方法1中自編碼器和分類器訓(xùn)練代數(shù)和頻域自編碼器方法保持一致;方法2中深度神經(jīng)網(wǎng)絡(luò)迭代訓(xùn)練2000代。
頻域自編碼器、方法1和方法2分別在100%、10%和1%的有標(biāo)簽樣本訓(xùn)練分類器時(shí)的故障分類準(zhǔn)確率如圖11~圖13所示。圖中“AB→C”的意思為使用數(shù)據(jù)集A和B作為訓(xùn)練集,使用C作為測(cè)試集,其他情況以此類推。由不同方法的故障診斷準(zhǔn)確率可以看出,方法1的故障診斷性能最差,故障分類準(zhǔn)確率不到70%。方法2中在標(biāo)簽充足時(shí),故障診斷準(zhǔn)確率也較高,但是在少量標(biāo)簽的情況下,故障診斷準(zhǔn)確率下降到了80%以下。本文提出的頻域自編碼器方法不管是在標(biāo)簽充足還是在少量標(biāo)簽的情況下,都可以保持較好的故障診斷準(zhǔn)確率。
圖11 使用100%有標(biāo)簽樣本訓(xùn)練分類器的準(zhǔn)確率對(duì)比Fig.11 Accuracy comparison of training classifierswith all labeled samples
圖12 使用10%有標(biāo)簽樣本訓(xùn)練分類器的準(zhǔn)確率對(duì)比Fig.12 Accuracy comparison of training classifierswith 10% labeled samples
圖13 使用1%有標(biāo)簽樣本訓(xùn)練分類器的準(zhǔn)確率對(duì)比Fig.13 Accuracy comparison of training classifierswith 1% labeled samples
方法1、方法2和頻域自編碼器方法在進(jìn)行故障分類時(shí)所使用的模型結(jié)構(gòu)是一樣的,但是最終的結(jié)果相差較大。分析其原因,方法1在自編碼器訓(xùn)練的階段沒(méi)有訓(xùn)練出可以有效提取故障特征的編碼器,影響到了最終的故障診斷準(zhǔn)確率。方法2由于是直接端到端訓(xùn)練出全部參數(shù),整個(gè)網(wǎng)絡(luò)提取的特征是為了擬合從振動(dòng)信號(hào)到故障標(biāo)簽的映射關(guān)系,當(dāng)樣本較少時(shí),由于噪聲和相位的影響,網(wǎng)絡(luò)不能充分學(xué)習(xí)故障特征,最終導(dǎo)致故障診斷準(zhǔn)確率不高。頻域自編碼器方法可以提取故障信號(hào)更本質(zhì)的特征,因此在標(biāo)簽較少的情況下也可以取得較好的故障分類準(zhǔn)確率。
(1)頻域自編碼器經(jīng)過(guò)訓(xùn)練后可以直接從時(shí)域信號(hào)中提取頻域特征,無(wú)需對(duì)原始信號(hào)進(jìn)行傅里葉變換。
(2)與傳統(tǒng)自編碼器相比,頻域自編碼器在軸承振動(dòng)信號(hào)中的特征提取能力更強(qiáng),可以更好地區(qū)分不同故障類型的軸承。
(3)頻域自編碼器方法與其他方法相比具有更好的泛化能力,可以提取軸承故障信號(hào)更本質(zhì)的特征,僅需少量有標(biāo)簽樣本訓(xùn)練分類器就可以實(shí)現(xiàn)更好的故障分類準(zhǔn)確率。