張永宏,張中洋,趙曉平,王麗華,邵 凡,呂凱揚(yáng)
(1.南京信息工程大學(xué) 自動(dòng)化學(xué)院,南京 210044;2.南京信息工程大學(xué) 計(jì)算機(jī)與軟件學(xué)院,南京 210044;3.南京信息工程大學(xué) 江蘇省網(wǎng)絡(luò)監(jiān)控中心,南京 210044)
滾動(dòng)軸承是旋轉(zhuǎn)機(jī)械設(shè)備中的核心部件之一,由于長時(shí)間的運(yùn)行和復(fù)雜的系統(tǒng)環(huán)境,其常常發(fā)生損壞,甚至?xí)?dǎo)致事故發(fā)生。因此,精準(zhǔn)地診斷出滾動(dòng)軸承的健康狀態(tài)對(duì)于監(jiān)測(cè)設(shè)備健康,及時(shí)排除安全隱患具有重大意義[1]。經(jīng)典的軸承故障診斷方法大多基于故障信號(hào)的分解、變換,通過人工手段提取故障特征,例如經(jīng)驗(yàn)?zāi)B(tài)分解[2]、小波變換[3]等。近年來,不少學(xué)者開始將神經(jīng)網(wǎng)絡(luò)方法和信號(hào)處理技術(shù)結(jié)合進(jìn)行軸承故障診斷。常見的有支持向量機(jī)[4]、深度置信網(wǎng)絡(luò)[5]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[6]等。然而這些方法需要大量分布均衡的故障數(shù)據(jù)作為支撐才能獲得較好的診斷效果。在實(shí)際生產(chǎn)中,機(jī)械設(shè)備發(fā)生故障是低概率事件,并且采集故障數(shù)據(jù)時(shí)設(shè)備可能已經(jīng)無法運(yùn)行,這導(dǎo)致采集到的故障類樣本常常遠(yuǎn)少于正常類樣本,產(chǎn)生樣本分布不均衡問題。
目前,國內(nèi)外專家、學(xué)者針對(duì)樣本不均衡問題主要從數(shù)據(jù)擴(kuò)充和算法改進(jìn)兩個(gè)方面進(jìn)行研究。Chawla等[7]提出了經(jīng)典的合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE),通過在少數(shù)類樣本間進(jìn)行線性隨機(jī)插值生成新的樣本,從而使原始數(shù)據(jù)分布均衡。Douzas等[8]對(duì)SMOTE方法進(jìn)行改進(jìn),提出了Kmeans-SMOTE算法,并將其應(yīng)用到實(shí)際問題中。姚培等[9]提出一種基于代價(jià)敏感度框架的Boosting故障診斷方法,通過建立一個(gè)新的代價(jià)敏感損失函數(shù),賦予正樣本和負(fù)樣本不同的懲罰因子,在轉(zhuǎn)子故障數(shù)據(jù)不足的情況下,明顯提高了故障診斷性能。盡管上述方法在解決樣本不均衡問題時(shí)能夠產(chǎn)生一定的效果,但過采樣方法在合成新樣本的同時(shí)也可能造成過生成、過泛化或者改變?cè)紨?shù)據(jù)分布的問題[10];代價(jià)敏感算法需要對(duì)代價(jià)參數(shù)進(jìn)行合理設(shè)置,并且當(dāng)數(shù)據(jù)不均衡比過大時(shí),由于缺少少數(shù)類樣本的特征信息,算法的提升效果有限。
深度學(xué)習(xí)模型以其可以自動(dòng)學(xué)習(xí)數(shù)據(jù)特征的優(yōu)點(diǎn),在圖像分類、目標(biāo)識(shí)別等領(lǐng)域已經(jīng)取得了巨大成功[11]。其中生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN)[12]和變分自編碼器(variational auto-encoder,VAE)[13]是近年來興起的最具潛力的生成模型,經(jīng)過研究者的不斷改進(jìn),已被廣泛應(yīng)用于圖像修復(fù)[14]、風(fēng)格遷移[15]、超分辨率重建[16]以及故障診斷等領(lǐng)域。王威等[17]研究了一種少樣本信息情況下的行星齒輪箱故障診斷方法,利用生成對(duì)抗網(wǎng)絡(luò)產(chǎn)生補(bǔ)充的故障樣本,提高了樣本不均衡條件下的診斷準(zhǔn)確率。Cabrera等[18]提出一種基于GAN的往復(fù)式機(jī)械故障診斷方法,通過試驗(yàn)證明了在數(shù)據(jù)失衡情況下該方法的有效性。張周磊等[19]針對(duì)同步電機(jī)樣本稀少引起的診斷偏差問題,提出一種基于變分自編碼的故障樣本快速擴(kuò)展策略,豐富了訓(xùn)練數(shù)據(jù)集。盡管如此,GAN在實(shí)際應(yīng)用中還存在訓(xùn)練不穩(wěn)定、梯度消失等問題,容易造成生成圖像失真;VAE生成的圖像會(huì)出現(xiàn)邊緣模糊,缺少紋理細(xì)節(jié)的問題。兩種方法各有不足,一定程度上限制其在各領(lǐng)域中進(jìn)一步的發(fā)展和應(yīng)用。
總體來說,在故障診斷領(lǐng)域,針對(duì)樣本不均衡問題的研究還較少,應(yīng)用于軸承故障診斷的方法更加屈指可數(shù)。此外,現(xiàn)有方法大多是針對(duì)二分類診斷問題進(jìn)行建模,且不均衡比例單一,適用范圍有限?;谝陨戏治?,為了解決故障類樣本與正常類樣本分布不均衡情況下的軸承故障診斷問題,本文提出一種基于VAE-GAN+FLCNN的故障診斷模型。首先,對(duì)采集到的振動(dòng)信號(hào)進(jìn)行快速傅里葉變換并切分為訓(xùn)練集和測(cè)試集;其次,將樣本量少的故障類數(shù)據(jù)輸入到VAE-GAN模型訓(xùn)練,生成相應(yīng)的故障樣本;然后把生成的樣本混合到真實(shí)樣本中進(jìn)行數(shù)據(jù)增廣,使各類樣本分布均衡;最后將增廣后的訓(xùn)練數(shù)據(jù)輸入FLCNN樣本分類模型中,利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的特征提取能力和焦點(diǎn)損失(focal loss,FL)對(duì)故障類樣本的關(guān)注實(shí)現(xiàn)軸承故障的精準(zhǔn)分類。試驗(yàn)結(jié)果表明,提出的VAE-GAN+FLCNN方法與其他3種經(jīng)典方法(SMOTE+CNN、VAE+CNN、GAN+CNN)相比能夠取得更好的故障診斷效果。
VAE是一種基于變分推斷的隱空間生成模型,被廣泛應(yīng)用于數(shù)據(jù)生成。與普通自編碼器相比,VAE能夠?qū)W習(xí)到隱含變量的近似概率分布,并通過采樣生成新的數(shù)據(jù)。假設(shè)訓(xùn)練數(shù)據(jù)集為X,隱含變量為Z,由貝葉斯公式可推斷出Z的概率分布,如式(1)所示。
(1)
式中:P(Z|X)為給定X時(shí)Z的概率分布,即可以通過觀測(cè)大量的數(shù)據(jù)樣本來計(jì)算隱變量的分布情況。但在實(shí)際應(yīng)用中,真實(shí)數(shù)據(jù)X一般為高維連續(xù)變量,難以用公式直接求解出Z的分布。因此,VAE使用神經(jīng)網(wǎng)絡(luò)訓(xùn)練一個(gè)簡單的分布Q(Z)來近似P(Z|X),并通過KL(Kullback Leibler)散度[20]來度量二者的接近程度。
由于任意復(fù)雜的分布都可由簡單分布經(jīng)過函數(shù)映射而成,為了簡化求解過程,一般假定Q(Z)服從于高斯分布,隱變量Z服從于標(biāo)準(zhǔn)正態(tài)分布,即Q(Z)~N(μ,σ2),P(Z)~N(0,1)。μ和σ2表示均值和方差,可以通過網(wǎng)絡(luò)學(xué)習(xí)得到。為了能使用梯度下降法優(yōu)化網(wǎng)絡(luò),在采樣操作時(shí),VAE運(yùn)用重參數(shù)方法[21],通過一個(gè)高斯噪聲e將μ和σ2組合成隱變量Z,即Z=μ+e×σ,VAE的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 VAE網(wǎng)絡(luò)結(jié)構(gòu)圖
VAE的網(wǎng)絡(luò)結(jié)構(gòu)主要包含隱變量編碼部分和解碼生成部分,模型的優(yōu)化目標(biāo)是盡可能使學(xué)習(xí)到的隱變量分布逼近標(biāo)準(zhǔn)正態(tài)分布,并且不斷縮小生成樣本和原始真實(shí)樣本間的重構(gòu)誤差,其損失函數(shù)如式(2)所示。
(2)
GAN由兩個(gè)部分組成,即生成器(generator,G)和判別器(discriminator,D),模型基本結(jié)構(gòu)如圖2所示。其中,G的作用是學(xué)習(xí)真實(shí)數(shù)據(jù)的潛在分布,并生成新的數(shù)據(jù)樣本,其輸入是一定維度的隨機(jī)向量。D相當(dāng)于一個(gè)二分類器,訓(xùn)練目標(biāo)是最大程度判斷出輸入網(wǎng)絡(luò)的是真實(shí)樣本還是G生成的假樣本。
圖2 GAN網(wǎng)絡(luò)結(jié)構(gòu)圖
網(wǎng)絡(luò)優(yōu)化過程中,生成器G和判別器D二者交替訓(xùn)練,相互對(duì)抗。G不斷提高網(wǎng)絡(luò)的生成能力,D不斷提高網(wǎng)絡(luò)的判別能力,最終達(dá)到平衡狀態(tài)。此時(shí),G生成的樣本接近于真實(shí)樣本,而D也難以判斷數(shù)據(jù)的真假,GAN的損失函數(shù)如式(3)所示。
Ez~Pz(z)[log2(1-D(G(z)))]
(3)
式中:x為真實(shí)樣本;z為隨機(jī)向量;Pdata為真實(shí)樣本的分布;G(z)為生成器生生成的數(shù)據(jù),網(wǎng)絡(luò)的訓(xùn)練目標(biāo)是最小化生成器損失和最大化判別器的輸出值。
焦點(diǎn)損失(focal loss,F(xiàn)L)是由Lin等[22]針對(duì)目標(biāo)檢測(cè)中的類別不平衡問題提出的,由標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)改進(jìn)而來。其主要思想是通過降低易分樣本的權(quán)重,使模型在訓(xùn)練時(shí)更加關(guān)注難分樣本。
(4)
傳統(tǒng)交叉熵?fù)p失對(duì)每個(gè)樣本的預(yù)測(cè)標(biāo)簽進(jìn)行計(jì)算疊加,在各類樣本數(shù)量不一致時(shí)會(huì)降低少數(shù)類樣本的損失比率。FL在交叉熵的基礎(chǔ)上引入兩個(gè)可調(diào)節(jié)的參數(shù),對(duì)訓(xùn)練數(shù)據(jù)中的難分樣本和少樣本類別分配更大的權(quán)重,表達(dá)式如式(5)所示。
(5)
式中:(1-pj)γ為調(diào)制系數(shù);αj和γ為超參數(shù),用來調(diào)節(jié)不同類別的樣本在損失中占的權(quán)重。當(dāng)某類樣本難分時(shí),預(yù)測(cè)標(biāo)簽pj的值會(huì)偏小,通過設(shè)置γ為大于1的整數(shù),(1-pj)γ將變大,從而增加分類權(quán)重。
針對(duì)軸承故障診斷中故障類樣本和正常類樣本分布不均衡的問題,本文從數(shù)據(jù)和算法兩個(gè)方面入手,采用VAE-GAN樣本增廣模型來增加故障類樣本,然后通過FLCNN分類模型對(duì)軸承故障進(jìn)行識(shí)別,將兩個(gè)模型融合,從而構(gòu)建VAE-GAN+FLCNN故障診斷模型。
盡管VAE和GAN模型在數(shù)據(jù)生成方面已經(jīng)取得了良好的效果,但傳統(tǒng)VAE生成的數(shù)據(jù)往往比較模糊,對(duì)復(fù)雜模型的表達(dá)能力差;傳統(tǒng)GAN訓(xùn)練困難,生成器和判別器很難同時(shí)收斂,且容易出現(xiàn)梯度消失問題。基于此,本文同時(shí)借鑒了VAE對(duì)數(shù)據(jù)的特征編碼能力和GAN的對(duì)抗學(xué)習(xí)機(jī)制,提出VAE-GAN樣本增廣模型。
VAE-GAN模型在GAN的基礎(chǔ)上增加了真實(shí)樣本的特征編碼部分,用編碼后得到的隱變量代替隨機(jī)向量來改進(jìn)網(wǎng)絡(luò),具體結(jié)構(gòu)包含3個(gè)部分,即編碼網(wǎng)絡(luò)、生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò),如圖3所示。
圖3 VAE-GAN網(wǎng)絡(luò)結(jié)構(gòu)
編碼網(wǎng)絡(luò)由3個(gè)全連接層組成,其作用是將輸入的高維真實(shí)樣本映射為2個(gè)低維的特征參數(shù),即數(shù)據(jù)分布的均值和方差。編碼網(wǎng)絡(luò)的優(yōu)化目標(biāo)是最小化隱變量分布與標(biāo)準(zhǔn)正態(tài)分布之間的KL散度,其損失函數(shù)如式(6)所示。
(6)
式中:μ和σ2為編碼網(wǎng)絡(luò)輸出的均值和方差;KL(·)為計(jì)算兩個(gè)數(shù)據(jù)分布之間的散度。
生成網(wǎng)絡(luò)由5個(gè)反卷積層組成,除最后一層外,對(duì)每一層輸出進(jìn)行批標(biāo)準(zhǔn)化,激活函數(shù)采用Relu。生成網(wǎng)絡(luò)將輸入的低維隱變量逐層進(jìn)行特征放大,最終生成和真實(shí)樣本尺寸相同的新樣本,其優(yōu)化目標(biāo)除了盡可能生成逼真的樣本去欺騙判別網(wǎng)絡(luò),還包括最小化生成樣本和真實(shí)樣本間的特征誤差,損失函數(shù)為
(7)
式中:Z為由μ和σ2采樣合成的隱變量;G(Z)為生成的樣本;D(·)為判別網(wǎng)絡(luò)將輸入數(shù)據(jù)判斷為真實(shí)樣本的概率;Dl(·)為判別網(wǎng)絡(luò)第l層輸出的特征向量;X為輸入的真實(shí)樣本。
判別網(wǎng)絡(luò)由4個(gè)卷積層和2個(gè)全連接層組成,每個(gè)卷積層后面加入了批標(biāo)準(zhǔn)化層,除了最后的輸出層,其余層激活函數(shù)采用LeakyRelu。判別網(wǎng)絡(luò)將輸入的真實(shí)樣本和生成網(wǎng)絡(luò)生成的樣本進(jìn)行特征提取和降維,最后通過Sigmoid激活后輸出真?zhèn)螛?biāo)簽,其優(yōu)化目標(biāo)是盡可能地區(qū)分出輸入的是真實(shí)樣本還是生成樣本,損失函數(shù)如式(8)所示。
LD=log2D(X)+log2(1-D(G(Z)))
(8)
VAE-GAN模型將VAE的解碼部分和GAN的生成器合為一體,綜合兩個(gè)模型的優(yōu)點(diǎn),使二者相互促進(jìn),既能改善生成數(shù)據(jù)的質(zhì)量,也能緩解模型訓(xùn)練不夠穩(wěn)定、難以收斂問題。訓(xùn)練生成網(wǎng)絡(luò)時(shí),利用真實(shí)樣本編碼后的隱變量代替原始GAN中的隨機(jī)向量,提升生成網(wǎng)絡(luò)中初始參數(shù)與真實(shí)樣本間的關(guān)聯(lián)性,并且將判別網(wǎng)絡(luò)從生成樣本和真實(shí)樣本中提取到的特征向量進(jìn)行誤差優(yōu)化,能夠使生成網(wǎng)絡(luò)更快地學(xué)習(xí)到真實(shí)數(shù)據(jù)的分布,不至于在對(duì)抗訓(xùn)練中輕易被判別網(wǎng)絡(luò)擊敗。此外,在判別網(wǎng)絡(luò)和生成網(wǎng)絡(luò)的搭建上,借鑒了DCGAN(deep convolutional generative adversarial networks)[23]的結(jié)構(gòu)設(shè)計(jì),通過一些經(jīng)驗(yàn)性的結(jié)構(gòu)設(shè)計(jì)使得對(duì)抗訓(xùn)練更加穩(wěn)定,采用了卷積和反卷積結(jié)構(gòu)以及批歸一化層,并去掉了池化層,VAE-GAN的訓(xùn)練步驟如下:
步驟1輸入N個(gè)真實(shí)樣本X={x(1),x(2),…,x(N)};
步驟2對(duì)輸入樣本進(jìn)行編碼(μ,σ2)=Encoder(X);
步驟3對(duì)(μ,σ2)采樣合成隱變量,Z=μ+e×σ;
步驟4將隱變量輸入生成網(wǎng)絡(luò)生成樣本;
步驟5將生成樣本和真實(shí)樣本輸入判別網(wǎng)絡(luò);
步驟6用梯度下降法更新LE、LG、LD中的參數(shù);
步驟7重復(fù)步驟1~步驟6,直到滿足最大訓(xùn)練次數(shù)。
CNN具有強(qiáng)大的特征表征能力,在特征提取方面展現(xiàn)出巨大的優(yōu)勢(shì),其網(wǎng)絡(luò)結(jié)構(gòu)主要包含卷積層、池化層和全連接層[24],能夠自主提取故障信號(hào)中的不同特征,從而完成故障分類。根據(jù)學(xué)習(xí)任務(wù)的不同,通常將不同數(shù)量的卷積層和池化層堆疊起來組成不同深度的卷積網(wǎng)絡(luò)結(jié)構(gòu)。
傳統(tǒng)CNN在分類時(shí)一般采用平方誤差或交叉熵作為損失函數(shù),將數(shù)據(jù)集中每個(gè)類別平等看待,無法適應(yīng)類別不均衡和樣本難易程度不一致的分類問題。在文中,為了適應(yīng)軸承信號(hào)的一維特性,采用一維卷積結(jié)構(gòu)搭建故障識(shí)別模型。此外,盡管前期已經(jīng)通過VAE-GAN方法解決了故障類樣本數(shù)量的不足問題,但其只是在數(shù)據(jù)層面上的處理,并且由于生成模型本身的限制,生成的樣本并不能完全替代真實(shí)樣本。因此,為了進(jìn)一步提升識(shí)別模型對(duì)故障類樣本的分類準(zhǔn)確性,在損失計(jì)算部分采用FL函數(shù)代替?zhèn)鹘y(tǒng)的交叉熵?fù)p失,增加故障類樣本的錯(cuò)分權(quán)重,減小正常類樣本的錯(cuò)分權(quán)重,從而在算法層面上加強(qiáng)模型對(duì)故障類樣本的關(guān)注度。在此基礎(chǔ)上,提出FLCNN樣本分類模型,結(jié)構(gòu)如圖4所示。
由圖4可知,F(xiàn)LCNN樣本分類模型包含3個(gè)卷積模塊和2個(gè)全連接層,每個(gè)卷積模塊由1個(gè)卷積層和1個(gè)池化層組成。其中,卷積層通過不同尺寸的卷積核與訓(xùn)練數(shù)據(jù)進(jìn)行卷積運(yùn)算來提取局部特征;池化層通過下采樣方式減少特征維數(shù),加快訓(xùn)練速度和避免模型過度擬合;全連接層將最終提取到的特征圖映射為一維向量然后送入分類器。模型的輸入是包含真實(shí)樣本和生成樣本的均衡數(shù)據(jù)集,輸出是每個(gè)樣本的識(shí)別結(jié)果。計(jì)算分類損失時(shí),通過設(shè)置Focal Loss中參數(shù)α和γ的值以賦予故障類樣本和正常類樣本不同的分類權(quán)重。
圖4 樣本分類模型
VAE-GAN+FLCNN故障診斷模型的整體框架包含數(shù)據(jù)預(yù)處理、故障樣本增廣和樣本分類3個(gè)部分,訓(xùn)練流程如圖5所示。
圖5 軸承故障診斷流程
(1)數(shù)據(jù)預(yù)處理
試驗(yàn)采集的軸承故障數(shù)據(jù)為時(shí)域振動(dòng)信號(hào),其存在采樣點(diǎn)密集、故障特征不明顯、信息冗余的問題。相比之下,頻域信號(hào)的規(guī)律性更強(qiáng),包含的有用信息和特征也更加明顯。因此,把時(shí)域信號(hào)按照每2 000點(diǎn)為一段切分成多個(gè)樣本,然后進(jìn)行快速傅里葉變換,將得到的頻域樣本劃分為訓(xùn)練集和測(cè)試集,隨機(jī)去除一定數(shù)量的故障樣本使訓(xùn)練集樣本分布不均衡。
(2)故障樣本增廣
將各訓(xùn)練集中數(shù)量少的故障類樣本分別輸入VAE-GAN模型進(jìn)行訓(xùn)練,然后把生成的樣本混合到原始分布不均衡的訓(xùn)練集中實(shí)現(xiàn)故障樣本的增廣。
(3)樣本分類
將經(jīng)過故障樣本增廣后的均衡訓(xùn)練集輸入搭建好的FLCNN樣本分類模型訓(xùn)練,然后用訓(xùn)練完成的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行診斷,通過CNN強(qiáng)大的特征提取能力和Focal Loss對(duì)故障類樣本的關(guān)注實(shí)現(xiàn)對(duì)各類樣本的準(zhǔn)確識(shí)別。
本文的試驗(yàn)數(shù)據(jù)采集自Spectra Quest公司制造的動(dòng)力傳動(dòng)故障診斷試驗(yàn)臺(tái)(drivertrain diagnostics simulator,DDS),試驗(yàn)裝置如圖6所示。試驗(yàn)共采集到5種狀態(tài)的故障軸承數(shù)據(jù),除去正常狀態(tài),其余4種故障軸承的實(shí)物,如圖7所示。每個(gè)故障軸承不區(qū)分損傷位置和損傷程度,框內(nèi)標(biāo)注的字母表示軸承的故障類型:Ball為滾動(dòng)體故障,Combine為復(fù)合故障(滾動(dòng)體、內(nèi)圈和外圈均發(fā)生損傷),Inner為內(nèi)圈故障,Outer為外圈故障。
圖6 動(dòng)力傳動(dòng)故障診斷試驗(yàn)臺(tái)
圖7 軸承的4種故障狀態(tài)
為了使采集到的軸承數(shù)據(jù)更具多樣化和普遍性,能夠包含多種條件下的軸承數(shù)據(jù),更加貼近實(shí)際情況,試驗(yàn)設(shè)置了4種電機(jī)轉(zhuǎn)速(1 700 r/min、1 800 r/min、3 400 r/min、3 800 r/min)和4種負(fù)載(負(fù)載電壓為0、4 V、6 V、8 V),共16種工況狀態(tài)。采用單向加速度傳感器獲取振動(dòng)信號(hào),采樣頻率設(shè)置為20 kHz,采樣時(shí)間20 s。每種故障狀態(tài)下得到16個(gè)振動(dòng)信號(hào)文件(16種工況,每種工況得到1個(gè)文件),每個(gè)文件包含409 600個(gè)點(diǎn)。按照每2 000點(diǎn)為一段進(jìn)行切分,每個(gè)文件得到200個(gè)樣本,最終共獲取16 000個(gè)樣本,其中每類故障有3 200個(gè)樣本(包含各種工況數(shù)據(jù)),通過快速傅里葉變換得到頻域數(shù)據(jù)樣本。取每類故障樣本的25%作為測(cè)試集,為了制造樣本分布不均衡的訓(xùn)練集,在剩余的75%樣本中,把正常狀態(tài)之外的4類故障樣本隨機(jī)去除一定的數(shù)量,使其滿足故障樣本與正常樣本的比例分別為1∶2,1∶5,1∶10和1∶40,將這4種類別的數(shù)據(jù)集定義為訓(xùn)練集A、B、C、D,每個(gè)訓(xùn)練集中均包含了各種工況的軸承數(shù)據(jù),數(shù)據(jù)集具體切分情況如表1所示。
表1 試驗(yàn)數(shù)據(jù)集
3.2.1 試驗(yàn)參數(shù)設(shè)置
編程環(huán)境為i7-4790 CPU、英偉達(dá)GTX1050Ti、python3.7、Pytorch1.3。試驗(yàn)分為VAE-GAN增廣故障樣本和FLCNN樣本分類兩個(gè)部分,訓(xùn)練樣本增廣模型時(shí),Batch-size設(shè)置為60,采用Adam優(yōu)化器,學(xué)習(xí)率均設(shè)置為0.000 2,迭代500次;訓(xùn)練分類模型時(shí),Batch-size設(shè)置為100,采用Adam優(yōu)化器,學(xué)習(xí)率設(shè)置為0.001,迭代300次,F(xiàn)ocal Loss中參數(shù)α的值設(shè)為1,γ大小參照經(jīng)驗(yàn)值設(shè)為2,能夠增加難分樣本的錯(cuò)分權(quán)重。
VAE-GAN和FLCNN模型中的具體參數(shù),如表2和表3所示。其中神經(jīng)元個(gè)數(shù)括號(hào)中的數(shù)值分別表示前一層的節(jié)點(diǎn)個(gè)數(shù)和當(dāng)前層的節(jié)點(diǎn)個(gè)數(shù),卷積參數(shù)括號(hào)中的數(shù)值分別表示輸入通道、輸出通道、卷積核尺寸、步長和padding的大小,池化參數(shù)括號(hào)中的數(shù)值分別表示池化窗口大小和步長。
表2 VAE-GAN模型的參數(shù)設(shè)置
表3 FLCNN模型的參數(shù)設(shè)置
3.2.2 VAE-GAN樣本增廣效果分析
為了驗(yàn)證VAE-GAN模型對(duì)故障樣本的生成效果,將訓(xùn)練集A、B、C、D中的真實(shí)樣本(見表1)分別輸入模型訓(xùn)練,通過生成網(wǎng)絡(luò)生成一定數(shù)量的故障樣本。不均衡比為1∶10(即使用訓(xùn)練集C訓(xùn)練模型)情況下4種故障軸承的真實(shí)樣本和生成樣本的頻域圖,如圖8所示。
圖8中,實(shí)線代表真實(shí)故障樣本,虛線代表VAE-GAN模型生成的樣本,為了量化二者的接近程度,借鑒文獻(xiàn)[25]中的相似度計(jì)算法,求解真實(shí)樣本和生成樣本的均方根誤差并進(jìn)行歸一化處理,得到的結(jié)果越接近1表明二者的相似度越高。相似度計(jì)算方法如式(9)所示。
(a)滾動(dòng)體故障樣本對(duì)比
(9)
為從整體上驗(yàn)證生成樣本與真實(shí)故障樣本在空間分布上的近似程度,對(duì)原始不均衡數(shù)據(jù)集和增廣后分布均衡的數(shù)據(jù)集進(jìn)行T-SNE可視化。同樣以1∶10不均衡情況為例,提取數(shù)據(jù)的前3個(gè)主要特征,可視化結(jié)果如圖9所示。
(a)原始真實(shí)數(shù)據(jù)的特征散點(diǎn)
圖9(a)為原始真實(shí)數(shù)據(jù)的分布情況,從圖9中可以明顯看出:正常類樣本數(shù)量多且集中,包含的特征信息更為全面;而故障類樣本分布稀疏,各故障類之間重疊也較多。圖9(b)為增廣后的數(shù)據(jù)分布情況,可以看出:用VAE-GAN生成的樣本有效地補(bǔ)充了故障樣本的數(shù)量,使各類故障樣本與正常類樣本在數(shù)量上保持一致;同時(shí),生成樣本基本都聚集在真實(shí)故障樣本周圍,使每類故障的特征點(diǎn)更加豐富和集中,從而大大增加了類間的可區(qū)分性。從以上分析可以得出,提出的VAE-GAN樣本增廣模型有效解決了故障樣本不足問題。
3.2.3 VAE-GAN+FLCNN故障診斷效果分析
在一般的分類問題中,通常采用準(zhǔn)確率作為模型的評(píng)價(jià)指標(biāo),但這對(duì)于數(shù)據(jù)分布不均衡的情況并不適用[26]。本文選擇更能反映各種故障類型分類情況的Recall和F1-score作為試驗(yàn)的評(píng)價(jià)指標(biāo),并通過可視化混淆矩陣,給出了每一類故障的分類情況。Recall也被稱為查全率,能夠反映每類故障被分類正確的比重;F1-score反映的是精確率(Precision)和Recall的綜合水平,其值越高說明分類模型越穩(wěn)健。
為驗(yàn)證提出的VAE-GAN+FLCNN模型在樣本不均衡條件下對(duì)各類軸承故障的診斷效果,對(duì)采集的5種軸承故障數(shù)據(jù),設(shè)置3組試驗(yàn)進(jìn)行階段性對(duì)比:第一組將原始分布不均衡的數(shù)據(jù)直接輸入CNN進(jìn)行訓(xùn)練;第二組先通過VAE-GAN模型生成故障樣本,然后將增廣后分布均衡的數(shù)據(jù)集輸入CNN進(jìn)行訓(xùn)練;第三組采用改進(jìn)完全的VAE-GAN+FLCNN方法進(jìn)行訓(xùn)練。使用測(cè)試集驗(yàn)證各組試驗(yàn)的診斷結(jié)果,對(duì)Recall和F1-score值進(jìn)行對(duì)比,結(jié)果如表4所示。
從表4可知,當(dāng)直接采用CNN進(jìn)行診斷,Recall值和F1-score值都比較低,并且不均衡程度越高,診斷結(jié)果越差,尤其是使用訓(xùn)練集D訓(xùn)練網(wǎng)絡(luò)時(shí),Recall值和F1-score值僅有0.51和0.44;而采用VAE-GAN進(jìn)行樣本增廣后,CNN的診斷結(jié)果有明顯的提升,Recall值和F1-score值在訓(xùn)練集D上仍然可以達(dá)到0.83和0.82,使用訓(xùn)練集A時(shí),兩個(gè)指標(biāo)的值都達(dá)到了0.96;采用VAE-GAN+FLCNN方法后,即首先進(jìn)行數(shù)據(jù)增廣,并將Focal Loss應(yīng)用到CNN模型,診斷效果得到進(jìn)一步的改善,兩個(gè)指標(biāo)在使用訓(xùn)練集A作為訓(xùn)練數(shù)據(jù)時(shí)的值都為0.98,即使在訓(xùn)練集D上也能達(dá)到0.86和0.84。
表4 VAE-GAN+FLCNN方法不同改進(jìn)階段診斷結(jié)果的Recall、F1-score值對(duì)比
為了清晰地展示VAE-GAN+FLCNN方法對(duì)每類樣本的識(shí)別情況,將其與CNN方法進(jìn)行對(duì)比,以訓(xùn)練集A和訓(xùn)練集D作為訓(xùn)練數(shù)據(jù)為例,診斷結(jié)果的混淆矩陣如圖10所示。
圖10 不均衡比為1∶2和1∶40時(shí)CNN方法和VAE-GAN+FLCNN方法診斷結(jié)果的混淆矩陣對(duì)比
縱坐標(biāo)表示樣本的真實(shí)類別,橫坐標(biāo)表示預(yù)測(cè)的類別。當(dāng)不均衡比為1∶2時(shí),從圖10可知,用CNN進(jìn)行診斷,只有正常類樣本被準(zhǔn)確識(shí)別,其他故障類均有不同數(shù)量的樣本被錯(cuò)分。在圖10(a)中,800個(gè)正常類樣本都被預(yù)測(cè)正確,而外圈故障僅有638個(gè)被預(yù)測(cè)正確;采用VAE-GAN+FLCNN方法后,各類樣本均能被準(zhǔn)確識(shí)別;在圖10(b)中,正常類樣本都被預(yù)測(cè)正確,外圈故障也有782個(gè)被預(yù)測(cè)正確,比CNN增加了144個(gè)。當(dāng)不均衡比為1∶40時(shí),從圖10(c)和圖10(d)可知,用CNN進(jìn)行診斷,4種故障的分類情況很差,有大量樣本被識(shí)別錯(cuò)誤。在圖10(c)中,滾動(dòng)體故障和外圈故障分別僅有350個(gè)和441個(gè)樣本被預(yù)測(cè)正確;采用VAE-GAN+FLCNN方法后,錯(cuò)分的故障樣本數(shù)大大減少;在圖10(d)中,滾動(dòng)體故障和外圈故障分別有578個(gè)和664個(gè)樣本被預(yù)測(cè)正確,其他故障類別被正確預(yù)測(cè)的樣本也顯著增多。綜合來看,無論訓(xùn)練數(shù)據(jù)的不均衡程度低或高,提出的VAE-GAN+FLCNN方法均能提升故障診斷效果。
為了進(jìn)一步驗(yàn)證VAE-GAN+FLCNN方法對(duì)不均衡樣本故障診斷的有效性,選取SMOTE+CNN方法、VAE+CNN方法和GAN+CNN方法作為對(duì)比。SMOTE方法通過在真實(shí)樣本間進(jìn)行隨機(jī)插值來擴(kuò)充數(shù)據(jù),VAE和GAN方法即1.1節(jié)、1.2節(jié)介紹的標(biāo)準(zhǔn)變分自編碼網(wǎng)絡(luò)和生成對(duì)抗網(wǎng)絡(luò),試驗(yàn)結(jié)果的Recall值和F1-score值如表5所示。
表5 不同故障診斷方法的Recall、F1-score對(duì)比
從表5可知,在不同的訓(xùn)練數(shù)據(jù)集下,SMOTE+CNN方法的故障診斷效果均是最差的,使用訓(xùn)練集D作為訓(xùn)練數(shù)據(jù)時(shí),Recall值和F1-score值只有0.69和0.67,表明通過簡單插值方法增加訓(xùn)練樣本數(shù)量并不能使模型學(xué)到更多的特征信息,提高模型對(duì)測(cè)試樣本的泛化性;GAN+CNN方法的診斷效果在3種對(duì)比方法中表現(xiàn)最好,在使用訓(xùn)練集A作為訓(xùn)練數(shù)據(jù)時(shí),Recall值和F1-score值達(dá)到0.92和0.94,但當(dāng)使用訓(xùn)練集D作為訓(xùn)練數(shù)據(jù)時(shí)效果仍然不理想,Recall值和F1-score值分別只有0.73和0.72;而VAE-GAN+FLCNN方法在使用訓(xùn)練集D作為訓(xùn)練數(shù)據(jù)時(shí)兩個(gè)指標(biāo)仍然能達(dá)到0.86和0.84,相較于其他3種方法有明顯的提升,可以對(duì)各類軸承數(shù)據(jù)進(jìn)行準(zhǔn)確診斷。
為了更直觀地展示VAE-GAN+FLCNN方法在樣本分布不均衡情況下與其他3種方法相比有更好的故障診斷效果,以1∶10不均衡比(訓(xùn)練集C)為例,將訓(xùn)練數(shù)據(jù)分別輸入4種模型,然后用訓(xùn)練好的模型診斷測(cè)試集樣本,對(duì)最終的分類結(jié)果進(jìn)行可視化,結(jié)果如圖11所示。
圖11 不同方法故障診斷結(jié)果可視化
從圖11(a)可知,SMOTE+CNN方法在幾種方法中分類效果較差,各故障種類之間均有不同程度的重疊,例如內(nèi)圈故障的部分樣本混合到了滾動(dòng)體故障和外圈故障中,正常類樣本也混合到了滾動(dòng)體故障中;從圖11(b)可知,GAN+CNN方法的錯(cuò)分樣本數(shù)量較少,滾動(dòng)體故障、內(nèi)圈故障和正常類樣本都被很好地區(qū)分開了,分類結(jié)果相對(duì)較好。從圖11(c)可知,VAE+CNN方法的診斷效果一般,內(nèi)圈故障和正常類樣本均有部分被錯(cuò)分到了滾動(dòng)體故障中,復(fù)合故障和外圈故障重疊較多。從圖11(a)、圖11(b)、圖11(c)的對(duì)比可知,3種對(duì)比方法對(duì)各類樣本均有不同程度的錯(cuò)分,并且對(duì)復(fù)合故障和外圈故障產(chǎn)生了較高的錯(cuò)分率,樣本間重疊嚴(yán)重。從圖11(d)可知,使用VAE-GAN+FLCNN方法后,不同類別樣本之間有較大的間隔,復(fù)合故障和外圈故障之間也能看到明顯界限,僅有少量外圈故障樣本被分類錯(cuò)誤,總體而言,VAE-GAN+FLCNN方法對(duì)軸承的故障診斷效果明顯優(yōu)于其他3種方法。
本文提出一種基于VAE-GAN+FLCNN的不均衡樣本軸承故障診斷方法,通過VAE-GAN樣本增廣模型生成少數(shù)類故障樣本,實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)的均衡化;然后將增廣后的數(shù)據(jù)輸入FLCNN分類模型進(jìn)行特征提取和故障識(shí)別。設(shè)置了4種不均衡比例的訓(xùn)練數(shù)據(jù)進(jìn)行試驗(yàn)驗(yàn)證,主要結(jié)論如下:
(1)VAE-GAN模型能有效學(xué)習(xí)真實(shí)故障樣本的分布特點(diǎn),從而生成大量故障樣本以增廣原始不均衡數(shù)據(jù)集。
(2)通過將Focal Loss應(yīng)用到CNN分類網(wǎng)絡(luò),提高了FLCNN模型對(duì)故障類樣本的診斷精度。
(3)通過和其他3種方法(SMOTE+CNN、VAE+CNN、GAN+CNN)的試驗(yàn)對(duì)比可知,在不同的訓(xùn)練數(shù)據(jù)集下,提出的VAE-GAN+FLCNN方法都能有效提高診斷結(jié)果的Recall值和F1-score值。
本文的貢獻(xiàn)在于將VAE和GAN結(jié)合,彌補(bǔ)各自的缺點(diǎn),改善了樣本生成能力,從而實(shí)現(xiàn)故障樣本的增廣;通過多次試驗(yàn)對(duì)比,驗(yàn)證了VAE-GAN+FLCNN方法對(duì)樣本不均衡下軸承故障診斷的有效性。