楊青,張繼云,吳東升,劉伊鵬
(沈陽理工大學 自動化與電氣工程學院,沈陽 110159)
滾動軸承作為轉(zhuǎn)子系統(tǒng)的核心部件,被廣泛應(yīng)用于裝備制造、精密儀器工程、醫(yī)療器械等領(lǐng)域,軸承故障將會引發(fā)一系列連鎖故障,造成巨大損失[1-2],軸承故障診斷具有重大研究價值。
目前,軸承故障診斷方法可分為4類:基于數(shù)學模型、基于數(shù)據(jù)驅(qū)動、基于人工智能、集合型故障診斷方法[3-6]。集合型故障診斷方法融合了單一方法的優(yōu)點,又可分為基于淺層學習和基于深度學習的集合方法。近年來,基于深度學習的集合型故障診斷方法成為研究重點,如VMD-DBN[7],VMD-LMD-CNN[8],CRN-DBN-DAE[9]等,但對于深度學習而言,數(shù)據(jù)集質(zhì)量和標簽數(shù)量對網(wǎng)絡(luò)訓練起著決定性的作用,需要采集大量特征明顯且?guī)撕灥臄?shù)據(jù)集。然而在實際工作中,采集的軸承數(shù)據(jù)都是一維時域信號,特征不明顯且不帶標簽,需要耗費時間和人力對數(shù)據(jù)進行標注,通常采用半監(jiān)督學習算法進行處理。
生成對抗網(wǎng)絡(luò)(Generation Adversarial Networks,GAN)[10]具有學習原始樣本的數(shù)據(jù)分布特征,生成與原始樣本逼真新樣本的能力。文獻[11]提出一種基于輔助分類器生成對抗網(wǎng)絡(luò)的方法生成逼真的一維信號,文獻[12]提出WGAN-CNN方法對故障數(shù)據(jù)的頻譜信號進行過采樣以擴充數(shù)據(jù)集,文獻[13]將一維信號轉(zhuǎn)換為頻譜信號以解決數(shù)據(jù)不平衡問題,并提出了FFT-GAN-SDAE的故障診斷方法。
在生成對抗網(wǎng)絡(luò)的基礎(chǔ)上演變出了深度卷積生成對抗網(wǎng)絡(luò)[14],進一步用softmax代替分類器并修改損失函數(shù)后得到了半監(jiān)督生成對抗網(wǎng)絡(luò)(Semi-Supervised Generation Adversarial Networks,SGAN)[15]。文獻[16]將SGAN與剩余網(wǎng)絡(luò)結(jié)合用于鋼表面故障檢測,文獻[17]提出一種基于自適配歸一化半監(jiān)督生成對抗網(wǎng)絡(luò)的新型軸承故障診斷方法,文獻[18]提出一種聯(lián)合訓練的半監(jiān)督學習的目標識別方法。
為進一步提高半監(jiān)督生成對抗網(wǎng)絡(luò)的故障診斷性能,提出一種VMD-2D-SN-SGAN集合型故障診斷方法:首先將一維的振動信號經(jīng)過變分模態(tài)分解(Variational Mode Decomposition,VMD)降噪后轉(zhuǎn)換為2D圖像作為SGAN網(wǎng)絡(luò)的輸入;其次,使用自適配歸一化 (Switchable Normalization,SN)替換SGAN網(wǎng)絡(luò)中的批歸一化(BN),防止過擬合并提升網(wǎng)絡(luò)的泛化能力;然后,利用生成器網(wǎng)絡(luò)生成軸承圖像并與真實圖像一起輸入到判別器網(wǎng)絡(luò)中,由softmax輸出故障類別并在不同標簽比例下優(yōu)化更新網(wǎng)絡(luò)參數(shù);最后,將訓練好的判別器網(wǎng)絡(luò)用于二維圖像分類。
1.1.1 GAN
生成對抗網(wǎng)絡(luò)由一個生成器網(wǎng)絡(luò)(G)和一個判別器網(wǎng)絡(luò)(D)組成,對于給定的訓練數(shù)據(jù)集,生成器網(wǎng)絡(luò)的目的是生成與訓練數(shù)據(jù)集相似的數(shù)據(jù)集,判別器網(wǎng)絡(luò)是一個常見的二進制分類器,主要目的是確定輸入的數(shù)據(jù)是來自真實的數(shù)據(jù)還是來自生成器生成的數(shù)據(jù),并引導(dǎo)生成器網(wǎng)絡(luò)通過反向傳播梯度產(chǎn)生更真實的樣本。生成器和判別器的訓練過程是一個二元極小極大博弈問題,其目標函數(shù)為
Ez~pz(z)[log(1-D2(G(z)))],
(1)
訓練過程中,E表示數(shù)學期望,應(yīng)最大化鑒別器的區(qū)分度log(D1(x))+log(1-D2(G(z))),最小化生成器和真實數(shù)據(jù)集的數(shù)據(jù)分布log(D2(z)),使訓練最終達到“納什均衡”。
生成對抗網(wǎng)絡(luò)如圖1所示,在生成對抗網(wǎng)絡(luò)中,由判別器學習到的特征可以提升分類器(C)的效果,好的分類器也可以優(yōu)化判別器的最終效果,生成器的效果也會隨判別器效果的提升變得更好,三者會在一個交替過程中趨向一個理想的平衡點。
圖1 生成對抗網(wǎng)絡(luò)流程圖Fig.1 Flow chart of GAN
1.1.2 SGAN
傳統(tǒng)生成對抗網(wǎng)絡(luò)的分類器和判別器無法同時訓練,因此,為同時訓練生成器與分類器,實現(xiàn)一個更優(yōu)的半監(jiān)督式分類器(S)并提高生成樣本的質(zhì)量,提出了半監(jiān)督生成對抗網(wǎng)絡(luò)。
對于一個N類的分類問題,半監(jiān)督生成對抗網(wǎng)絡(luò)采用softmax分類器將輸出類別擴展為N+1維,對生成的樣本定義額外類別標簽引導(dǎo)訓練,采用半監(jiān)督訓練損失的方式來訓練網(wǎng)絡(luò)。半監(jiān)督生成對抗網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
圖2 半監(jiān)督生成對抗網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Structure diagram of SGAN
softmax函數(shù)用于N分類神經(jīng)網(wǎng)絡(luò)的輸出,將每一類的概率壓縮在0與1之間,再除以輸出總和最終輸出一個維邏輯向量{L1,L2,…,LN},從而精確地表示每一類的輸入概率,其表達式為
(2)
1.1.3 改進的半監(jiān)督生成對抗網(wǎng)絡(luò)
(3)
與其他歸一化方法不同,自適配歸一化在計算μ和σ2時,從3種歸一化方法(批歸一化BN、實例歸一化IN、層歸一化LN)的集合Ω={BN,IN,LN}中選擇合適的歸一化方法進行加權(quán)平均,即
(4)
(5)
式中:Ik為像素值;|Ik|為像素的數(shù)量,k∈Ω。
權(quán)重系數(shù)ωk則利用softmax函數(shù)對3個維度的控制參數(shù)λk進行計算,即
(6)
自適配歸一化在訓練期間為每一層網(wǎng)絡(luò)自動尋找合適的歸一化操作,相較于其他歸一化方法更易使網(wǎng)絡(luò)達到最優(yōu)性能。
由于實際采集到的軸承信號為一維時域振動信號,特征不明顯并伴隨大量噪聲干擾,特征提取較為困難,而且卷積神經(jīng)網(wǎng)絡(luò)直接處理一維振動信號的效果也不佳。因此,將一維振動信號進行變分模態(tài)分解[19]降噪處理,將其轉(zhuǎn)換為2D灰度圖像。變分模態(tài)分解的原理是將帶有噪聲的信號分解為頻率不同的一系列固有模態(tài)分量(IMF),分解模型為
(7)
式中:ωk為中心頻率;x為輸入信號;uk為k個IMF分量。為約束上述變分問題,采用增廣拉格朗日函數(shù)計算求約束變分問題的最優(yōu)解,交替更新ωk和uk,即
(8)
(9)
分解完成后,通過計算相關(guān)系數(shù)來反映不同變量之間的相關(guān)程度。以不同變量與其平均值的差為基準,將差值相乘以表達變量之間的相關(guān)程度,計算公式為
(10)
式中:μx,μy分別為原始信號和IMF分量的均值;σx,σy分別為原始信號和IMF分量的標準差。由于噪聲信號的頻譜能量較低,可將IMF分量與原信號頻譜能量的比值ρ0作為閾值來確定相關(guān)性。除去相關(guān)系數(shù)ρxy小于ρ0的IMF分量,將剩余的IMF分量進行重構(gòu)以達到降噪的目的。經(jīng)試驗對比,設(shè)定k=4作為模態(tài)分解的數(shù)量,設(shè)定閾值ρ0=0.3。降噪后將一維信號轉(zhuǎn)換為二維圖像,轉(zhuǎn)換過程如圖3所示。
圖3 VMD-2D變換示意圖Fig.3 Transformation diagram of VMD-2D
設(shè)需要轉(zhuǎn)換圖像的像素為N×N,圖像對應(yīng)像素點h,w的值為P[h,w],且1 通過(11)式將振動信號的值V歸一化至[0,255]之間,將每個樣本歸一化的值由取整函數(shù)f取整后與圖像中像素的強度一一對應(yīng),最終二維圖像的像素數(shù)等于時域信號的個數(shù)。 (11) 半監(jiān)督生成對抗網(wǎng)絡(luò)的訓練實質(zhì)上是對損失函數(shù)的優(yōu)化過程,softmax分類器先將生成器網(wǎng)絡(luò)生成的圖像樣本添加到數(shù)據(jù)庫中,用新的標簽y=N+1標注;判別器網(wǎng)絡(luò)將生成的樣本作為輸入,由(12)式輸出一個N+1維的邏輯向量{L1,L2,…,LN+1}。 (12) 整個網(wǎng)絡(luò)的損失包括生成器和判別器的損失,其中判別器損失為 LD=Lunsupervised+Lsupervised, (13) Lunsupervised=Lg+Lunlabel, (14) Lg=-Ex~g[logPmodel(y=N+1|x)], (15) Lunlabel=-Ex~pdata[log(1-Pmodel(y=N+1|x)], (16) 式中:Lsupervised為監(jiān)督損失;Lunsupervised為無監(jiān)督損失;Lg為生成樣本損失;Lunlabel為無標簽損失;Pmodel(y=N+1|x)為將樣本判斷為生成樣本的概率。 對于無監(jiān)督學習部分,判別器只需要輸出真假,不需確定類別。生成樣本損失就是將生成器生成的圖像樣本誤判為真實樣本,用X~g表示取自生成樣本,訓練中應(yīng)最小化該損失。無標簽損失就是將真實不帶標簽的樣本誤判為生成器生成的樣本,用1-Pmodel(y=N+1|x)表示將無標簽樣本判斷為真實樣本的概率,用x~pdata表示取自真實樣本,訓練時也應(yīng)該最小化該損失。 在監(jiān)督學習部分,半監(jiān)督生成對抗網(wǎng)絡(luò)通過最小化真實數(shù)據(jù)標簽與預(yù)測分布Pmodel(y|x)之間的交叉熵進行訓練,有標簽損失為 Llable=-Ex,y~pdata[logPmodel(y|x,y (17) 為實現(xiàn)生成器最大化擬合真實數(shù)據(jù)的分布,生成更高質(zhì)量的樣本,采用生成器生成與真實數(shù)據(jù)統(tǒng)計分布相匹配的特征匹配方法,則生成器的損失為 Ex~glog[1-pmodel(y=N+1|x)]。 (18) 基于VMD-2D-SN-SGAN的故障診斷方法總體架構(gòu)如圖4 所示,整個過程包括監(jiān)督學習和無監(jiān)督學習:在監(jiān)督學習部分,真實帶標簽的數(shù)據(jù)輸入判別器網(wǎng)絡(luò),經(jīng)過卷積、歸一化等操作學習標簽數(shù)據(jù)的潛在特征,最后由softmax輸出N維概率向量值;在無監(jiān)督學習部分,生成器網(wǎng)絡(luò)生成的圖像和真實不帶標簽的圖像一起輸入到判別器網(wǎng)絡(luò),同樣由softmax輸出二維概率向量值;判別器網(wǎng)絡(luò)和生成器網(wǎng)絡(luò)交替訓練,優(yōu)化更新網(wǎng)絡(luò)參數(shù)。 圖4 VMD-2D-SN-SGAN的總體架構(gòu)Fig.4 Overall frame of VMD-2D-SN-SGAN 2.1.1 生成器網(wǎng)絡(luò) 生成器網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)見表1,其由4個分數(shù)步長卷積層和1個全連接層組成。首先,將符合高斯分布的隨機100維噪聲向量輸入到全連接層,通過維度變換后由分數(shù)步長卷積分解輸入矩陣;在反卷積后進行自適配歸一化處理,前3個反卷積層采用ReLu作為激活函數(shù),最后一個采用Tanh作為激活函數(shù),在激活函數(shù)之后加入dropout算法;最終輸出一張分辨率為28×28的灰度圖像。 表1 生成器網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Tab.1 Structure parameters of generator network 2.1.2 判別器網(wǎng)絡(luò) 判別器網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)見表2,其由4個卷積層和1個全連接層組成。輸入尺寸為[B,28,28,1]的圖像樣本,在卷積操作后進行自適配歸一化處理,卷積層均采用LReLu作為激活函數(shù),激活函數(shù)之后加入dropout算法,由softmax輸出分類結(jié)果。 表2 判別器網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Tab.2 Structure parameters of discriminator network VMD-2D-SN-SGAN方法采用半監(jiān)督訓練方式,共同調(diào)整生成器和判別器的損失(均采用Adam優(yōu)化)使總損失最小,進一步提高故障診斷能力。該方法(圖5)的具體步驟為: 圖5 VMD-2D-SN-SGAN算法流程圖Fig.5 Flow chart of VMD-2D-SN-SGAN algorithm 1)對軸承振動信號進行變分模態(tài)分解降噪。 2)將降噪后的信號轉(zhuǎn)為二維灰度圖像,按3∶1∶1劃分訓練集、驗證集和測試集。 3)選取符合高斯分布的隨機噪聲向量輸入生成器網(wǎng)絡(luò),生成灰度圖像。 4)將有標簽圖像、無標簽圖像和生成圖像按batch-size輸入判別器網(wǎng)絡(luò)中得到分類結(jié)果。 5)計算生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)的損失。 6)固定生成器網(wǎng)絡(luò)的參數(shù),采用Adam算法提升隨機梯度,優(yōu)化判別器的權(quán)重參數(shù)。 7)固定判別器網(wǎng)絡(luò)的參數(shù),選取全連接層輸出作為中間層特征,采用Adam算法降低隨機梯度,更新生成器的權(quán)重參數(shù)。 8)重復(fù)第3—7步,直至達到迭代次數(shù)。 9)保存模型,將測試圖像輸入判別器網(wǎng)絡(luò),輸出故障類別。 數(shù)據(jù)分析在32G內(nèi)存,NVIDIA GeForce GTX 1080Ti CPU,Intel i7-8700 3.2GHz 6核12線程的工作站上進行。訓練半監(jiān)督生成對抗網(wǎng)絡(luò)時,Adam優(yōu)化算法的學習率(learning rate)設(shè)為0.000 1,動量(momentum)設(shè)為0.5,dropout rate設(shè)為0.5,batch-size設(shè)置為16,迭代次數(shù)(epoch)設(shè)為1 000。試驗數(shù)據(jù)按3∶1∶1劃分訓練集、驗證集和測試集,其中測試集是從整個數(shù)據(jù)集中隨機抽取20%,生成數(shù)據(jù)與真實數(shù)據(jù)的比例為1∶1。 采用美國西儲大學(CWRU)公開發(fā)布的軸承數(shù)據(jù)[20],選取1 772 r/min工況下的驅(qū)動端軸承數(shù)據(jù),采樣頻率為12 kHz,將正常軸承(Health)和鋼球故障(B007,B014,B021)、內(nèi)圈故障(IR007,IR014,IR021)、外圈故障(OR007,OR014,OR021)共10種數(shù)據(jù)作為研究對象,其中007,014,021分別對應(yīng)于0.178,0.356,0.534 mm的故障尺寸。每種數(shù)據(jù)取120 736個采樣點進行變分模態(tài)分解降噪,降噪完成后每隔784個點生成一張像素為28×28的二維灰度圖像,每類故障生成154張圖像,所有類別共計1 540張,每類數(shù)據(jù)生成的灰度圖像如圖6所示。 圖6 CWRU灰度圖像Fig.6 Gray images of CWRU 將預(yù)處理完成的10類灰度圖像輸入不同故障診斷模型,在不同標簽比例下開始訓練,迭代1 000次后的分類結(jié)果如圖7所示,由圖可知:1)2D-SN-SGAN標簽比例為0.3時的分類精度達到了92.45%,遠遠超過2D-BN-SGAN標簽比例為0.8時的分類精度,說明2D-SN-SGAN算法雖然收斂速度較慢,但有效解決了過擬合的問題,并提高了分類精度,有更強的歸一化能力;2)當標簽比例為0.5時,2D-SN-SGAN算法的分類精度上升到93.09%,與標簽比例為0.8時相差不大,說明2D-SN-SGAN方法降低了對標簽的依賴;3)VMD-2D-SN-SGAN算法在標簽比例為0.3時分類精度達到93.05%,當標簽比例上升到0.5和0.8時,分類精度分別達到93.13%和94.51%,分類精度和速度均得到了提升,具有更好的性能。 圖7 CWRU不同標簽比例下的分類精度Fig.7 Classification accuracy of CWRU under different label proportions 與傳統(tǒng)機器學習算法FFT-SVM[17]、監(jiān)督學習算法2D-DNN、半監(jiān)督方法2D-BN-SGAN及2D-SN-SGAN的分類精度進行對比分析,結(jié)果見表3:標簽比例對監(jiān)督學習算法2D-DNN和歸一化能力較差的2D-BN-SGAN算法影響較大,對2D-SN-SGAN算法的影響較小,對VMD-2D-SN-SGAN算法的影響不明顯。實際中對數(shù)據(jù)進行大規(guī)模標簽處理比較困難,而VMD-2D-SN-SGAN算法能夠消除標簽比例減小帶來的影響,實用性得到了顯著提高。 表3 CWRU不同標簽比例的分類精度Tab.3 Classification accuracy of CWRU with different label proportions 為探索不同batch-size和噪聲干擾對網(wǎng)絡(luò)性能的影響,本章在標簽比例為0.5,batch-size分別為4,16,25,64的情況下,對2D-BN-SGAN,2D-SN-SGAN和VMD-2D-SN-SGAN的分類精度進行對比,結(jié)果見表4:在同等情況下,小批次對2D-BN-SGAN算法的影響很大,對2D-SN-SGAN和VMD-2D-SN-SGAN算法的影響較小,說明SN在各種批次設(shè)置下分類精度都保持穩(wěn)定,其為不同歸一化層選擇不同的操作,拓展了歸一化技術(shù)的邊界,彌補其他歸一化方法的缺陷;加入VMD則可以增強模型的抗干擾能力,提高分類精度。 表4 CWRU不同batch-size的分類精度Tab.4 Classification accuracy of CWRU with different batch-size 選取東南大學感應(yīng)電動機ML軸承數(shù)據(jù)集[21-22]和西安交通大學的XJTU-SY軸承數(shù)據(jù)集[23-25]作為研究對象。其中,ML軸承數(shù)據(jù)選取自轉(zhuǎn)頻20 Hz,負載配置為2的工況,每類數(shù)據(jù)取1 019 200個采樣點進行VMD處理,降噪完成后每隔784個點生成一張像素為28×28的二維灰度圖像,每類故障生成1 300張圖像。XJTU-SY 軸承數(shù)據(jù)選取自轉(zhuǎn)速2 250 r/min,徑向力11 kN的工況,每類數(shù)據(jù)取588 000個采樣點進行VMD降噪后每隔784個點生成一張像素為28×28的二維灰度圖像,每類故障生成750張圖像。 不同標簽比例(batch-size為16),不同batch-size(標簽比例為0.5)下的分類精度分別見表5、表6,由表可知:VMD-2D-SN-SGAN算法在噪聲環(huán)境和不同批次設(shè)置下均能得到較高的分類精度。說明該模型有較強的泛化能力和魯棒性,適用于不同的對象以及復(fù)雜的環(huán)境。 表5 不同標簽比例下各算法的分類精度Tab.5 Classification accuracy of each algorithm under different label proportions 表6 不同batch-size下各算法的分類精度Tab.6 Classification accuracy of each algorithm under different batch-size 通過對3組軸承數(shù)據(jù)集的分析可以發(fā)現(xiàn),由于CWRU軸承數(shù)據(jù)集的數(shù)據(jù)量遠沒有其他2組豐富,VMD-2D-SN-SGAN算法的分類精度不如其他2組高,但在數(shù)據(jù)量不充足和標記數(shù)據(jù)稀缺的情況下,依然實現(xiàn)了較高的分類精度和更強的魯棒性,相比于其他方法更具應(yīng)用價值。 為提高半監(jiān)督生成對抗網(wǎng)絡(luò)的故障診斷精度和泛化能力,提出了一種基于二維圖像和自適配歸一化半監(jiān)督生成對抗網(wǎng)絡(luò)(VMD-2D-SN-SGAN)的集合型故障診斷方法,通過對不同軸承數(shù)據(jù)集的分析得到以下結(jié)論: 1)與監(jiān)督學習方法、單一型半監(jiān)督生成對抗網(wǎng)絡(luò)、其他集合型半監(jiān)督生成對抗網(wǎng)絡(luò)相比,在標簽樣本不足時,VMD-2D-SN-SGAN算法能得到較高的分類精度。 2)面向不同的試驗對象,VMD-2D-SN-SGAN算法均能得到更高的分類精度,且具備較強的魯棒性和泛化能力。 在研究過程中發(fā)現(xiàn),VMD-2D-SN-SGAN算法用于變負載故障診斷時效果有所下降,其在變負載軸承故障診斷方面的應(yīng)用有待進一步研究。1.3 VMD-2D-SN-SGAN網(wǎng)絡(luò)訓練
2 故障診斷流程
2.1 系統(tǒng)架構(gòu)
2.2 算法流程
3 試驗研究
3.1 分類能力驗證
3.2 泛化能力驗證
3.3 小結(jié)
4 結(jié)束語