劉 杰, 李長(zhǎng)杰, 蘇宇涵, 孫興偉
(沈陽(yáng)工業(yè)大學(xué) 機(jī)械工程學(xué)院,沈陽(yáng) 110870)
滾動(dòng)軸承作為機(jī)械設(shè)備最重要的部件之一,其廣泛的應(yīng)用于各類機(jī)械設(shè)備之中[1]。在工程實(shí)際過(guò)程中,滾動(dòng)軸承的狀態(tài)直接影響著設(shè)備的工作效率,如發(fā)生突發(fā)故障不僅會(huì)造成巨大的經(jīng)濟(jì)損失,嚴(yán)重時(shí)會(huì)導(dǎo)致相關(guān)工作人員的傷亡。因此,對(duì)滾動(dòng)軸承的故障診斷研究不僅保證了設(shè)備的工作效率,而且對(duì)設(shè)備操作者的保護(hù)具有重要的意義[2]。在滾動(dòng)軸承故障診斷過(guò)程中,故障數(shù)據(jù)的可靠度直接影響診斷結(jié)果的準(zhǔn)確性。在數(shù)據(jù)的采集和收集過(guò)程中由于軸承的工作環(huán)境較為復(fù)雜,易導(dǎo)致收集的數(shù)據(jù)丟失,或不能精準(zhǔn)收集到大量的對(duì)應(yīng)故障數(shù)據(jù)[3]。而針對(duì)數(shù)據(jù)驅(qū)動(dòng)下的滾動(dòng)軸承故障診斷,首要前提是解決滾動(dòng)軸承數(shù)據(jù)缺失的問(wèn)題[4]。
Li等[5]提出了一種改進(jìn)GAN(generative adversarial networks)生成樣本在機(jī)器故障條件下生成人工樣本并進(jìn)行跨域故障診斷的方法。Gao等[6]提出了一種基于Wasserstein梯度懲罰GAN(wasserstein generative adversarial networks with gradient penalty, WGAN-GP)的樣本數(shù)據(jù)量不足方法,重新設(shè)計(jì)了WGAN的損失函數(shù)。Shao等[7]利用一維卷積神經(jīng)網(wǎng)絡(luò)(1D-convolutional neural networks,1D-CNN)構(gòu)造輔助分類器GAN(auxiliary classifier generative adversarial networks, ACGAN)進(jìn)行數(shù)據(jù)擴(kuò)充,其中附加的標(biāo)簽信息有利于生成相應(yīng)的故障樣本。上述基于GAN的數(shù)據(jù)生成方法在一定程度上克服了在高維度、丟失比例較大的情況下仍能重建數(shù)據(jù)和恢復(fù)數(shù)據(jù)。但由于損失函數(shù)的限制,使GAN在訓(xùn)練過(guò)程中會(huì)出現(xiàn)梯度消失和色散。雖然改進(jìn)的WGAN方法可以一定程度上解決梯度消失問(wèn)題,但會(huì)導(dǎo)致訓(xùn)練效率降低。
針對(duì)上述問(wèn)題,本文提出將最小二乘生成對(duì)抗網(wǎng)絡(luò)結(jié)合SqueezeNet應(yīng)用于樣本數(shù)據(jù)量不足條件下的滾動(dòng)軸承故障診斷。首先,將滾動(dòng)軸承故障數(shù)據(jù)重構(gòu)為二維矩陣輸入生成器中添加了dropout層的改進(jìn)LS-GAN(least squares generative adversarial networks)模型,通過(guò)最小二乘損失函數(shù)代替交叉熵?fù)p失函數(shù)的方法生成相應(yīng)故障樣本。與真實(shí)故障樣本按不同比例輸入SqueezeNet模型,經(jīng)過(guò)訓(xùn)練得到準(zhǔn)確率較高的診斷模型,并通過(guò)真實(shí)樣本驗(yàn)證模型診斷的準(zhǔn)確率和有效性,同時(shí)對(duì)比其他方法驗(yàn)證所提方法的優(yōu)越性。
GAN在2014年由Goodfellow等[8]提出,它由生成器生成樣本結(jié)合判別器判別生成樣本與真實(shí)樣本數(shù)據(jù)分布是否一致,一致就輸出否則循環(huán)此過(guò)程直到生成樣本符合真實(shí)樣本分布。其廣泛應(yīng)用于圖像生成、語(yǔ)音識(shí)別等領(lǐng)域。GAN是一種無(wú)監(jiān)督的學(xué)習(xí)模式,該模型體現(xiàn)在一方贏則另一方一定為輸?shù)摹傲愫筒┺摹彼枷隱9],GAN由生成器G和判別器D基于非合作博弈概念組成。生成器G用于訓(xùn)練任意分布樣本Z得到映射樣本x′=G(z),x′服從真實(shí)數(shù)據(jù)的分布PG(x)。其目標(biāo)是最小化生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的分布差距。判別器D判別輸入樣本是“生成數(shù)據(jù)”還是“真實(shí)數(shù)據(jù)”,在訓(xùn)練過(guò)程中生成器G和判別器D的相互博弈,得到最優(yōu)生成樣本并達(dá)到納什均衡[10]。
GAN的目標(biāo)函數(shù)可表示為
Ez~pG(x)[log(1-D(G(x)))]
(1)
式中:PG(x)為真實(shí)數(shù)據(jù)的分布;pdata(x)為最優(yōu)解;Ex~pdata為樣本分布為pdata(x),x的期望;Ex~pG(x)為樣本分布pG(x),x的期望。判別器的目標(biāo)是最大化V(D,G)使其能夠更好地區(qū)分D和G,當(dāng)logD(x)越大,log(1-D(G(x)))就越小,判別準(zhǔn)確率就越高。
原始GAN由生成器G構(gòu)造的“生成樣本”分布可能與實(shí)際樣本分布存在較大的差異,會(huì)致使訓(xùn)練過(guò)程中梯度消散,從而導(dǎo)致生成樣本質(zhì)量偏低。針對(duì)上述問(wèn)題,Mao等[11]于2017年提出LS-GAN模型,將GAN的目標(biāo)函數(shù)由交叉熵?fù)p失函數(shù)變?yōu)樽钚《藫p失函數(shù),解決了生成樣本質(zhì)量不高和訓(xùn)練過(guò)程不穩(wěn)定的兩大缺陷。
LSGAN的目標(biāo)函數(shù)表示為
(2)
式中:a,b分別為生成樣本和真實(shí)樣本的標(biāo)簽;c為判別器D對(duì)生成樣本判別為真的期望值。對(duì)a,b,c值的確定,現(xiàn)存在兩種取值思路[12]。結(jié)合本文內(nèi)容將選擇其中一種取值方法作為目標(biāo)函數(shù),并進(jìn)行詳細(xì)闡述:設(shè)定b=c時(shí)生成樣本盡可能的接近真實(shí)數(shù)據(jù)分布,則設(shè)定a=0,b=c=1代入目標(biāo)函數(shù)可得
(3)
LSGAN的中心思想是判別器通過(guò)平滑且非飽和的梯度損失函數(shù),將生成的“偽樣本”訓(xùn)練為趨近真實(shí)樣本的數(shù)據(jù)分布[13]。
為了防止生成器中過(guò)擬合,加入dropout層,防止生成重復(fù)的數(shù)據(jù)影響訓(xùn)練效果。同時(shí)在生成器加入的dropout層與判別器中的最小二乘損失函數(shù)均會(huì)保證生成數(shù)據(jù)的質(zhì)量,提高滾動(dòng)軸承故障診斷結(jié)果的準(zhǔn)確性。圖1所示為L(zhǎng)SGAN的網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖1 LSGAN網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 LSGAN network structure diagram
SqueezeNet是一個(gè)簡(jiǎn)易的CNN架構(gòu)[14],是在保持模型分類準(zhǔn)確性的基礎(chǔ)上,減少網(wǎng)絡(luò)的深度以及參數(shù)。與加深網(wǎng)絡(luò)結(jié)構(gòu)提高準(zhǔn)確率的ResNet等網(wǎng)絡(luò)不同的是,SqueezeNet在保證了提高模型準(zhǔn)確率的基礎(chǔ)上同時(shí)降低了訓(xùn)練成本。在CNN的基礎(chǔ)上采用以下幾種策略來(lái)設(shè)計(jì)SqueezeNet[15]:
(1)網(wǎng)絡(luò)中卷積核尺寸由3×3簡(jiǎn)化為1×1。
(2)將輸入通道的數(shù)量減少至3×3。
(3)在網(wǎng)絡(luò)后期進(jìn)行欠采樣,使卷積層具有較大的激活函數(shù)。
其中,(1)和(2)可以顯著減少參數(shù)數(shù)量,(3)在參數(shù)數(shù)量受限的情況下提高準(zhǔn)確率。
Fire Module是SqueezeNet主要組成模塊,該模塊由包含1×1卷積核壓縮層,和混合1×1和3×3多尺度學(xué)習(xí)卷積核的擴(kuò)展層組成,模塊結(jié)構(gòu)如圖2所示[16]。
圖2 Fire Module模塊結(jié)構(gòu)Fig.2 Fire Module structure
本文采用的SqueezeNet由conv層結(jié)合Fire Module模塊加Softmax分類器組成,其模型結(jié)構(gòu)如圖3所示。
圖3 SqueezeNet網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 SqueezeNet network structure
在如圖3所示的網(wǎng)絡(luò)結(jié)構(gòu)中,SqueezeNet具體的網(wǎng)絡(luò)內(nèi)部參數(shù)如下表1所示。
表1 SqueezeNet網(wǎng)絡(luò)內(nèi)部參數(shù)Tab.1 Internal parameters of SqueezeNet
其中輸出尺寸為特征圖輸出該網(wǎng)絡(luò)層的特征圖尺寸,如64×64×3為輸出尺寸為64×64,通道數(shù)為3的特征圖。
采用LSGAN-SqueezeNet的滾動(dòng)軸承故障診斷流程圖如圖4所示。其包含以下步驟。
步驟1數(shù)據(jù)集構(gòu)建。根據(jù)數(shù)據(jù)特點(diǎn)和類型結(jié)合LSGAN需求,將一維數(shù)據(jù)信號(hào)轉(zhuǎn)為二維矩陣信號(hào),并按比例劃分?jǐn)?shù)據(jù)集為訓(xùn)練和測(cè)試集。
步驟2生成樣本。將步驟1中數(shù)據(jù)輸入LSGAN模型中進(jìn)行訓(xùn)練,生成更多數(shù)據(jù)樣本,擴(kuò)充訓(xùn)練數(shù)據(jù)集。
步驟3訓(xùn)練SqueezeNet網(wǎng)絡(luò)模型。將生成數(shù)據(jù)和真實(shí)數(shù)據(jù)轉(zhuǎn)換為二維灰度圖輸入SqueezeNet模型,對(duì)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。
步驟4將不同的樣本作為測(cè)試集輸入步驟3中訓(xùn)練得到的網(wǎng)絡(luò)模型中,獲得故障識(shí)別的準(zhǔn)確率,實(shí)現(xiàn)對(duì)LSGAN-SqueezeNet模型性能的測(cè)試。
中國(guó)國(guó)有企業(yè)大致分為三類:一是中央所屬的工業(yè)企業(yè)(特殊行業(yè)的不算),即“中央企業(yè)”(狹義); 第二類是中央所屬的非工業(yè)企業(yè)和特殊行業(yè)的工業(yè)企業(yè),這類企業(yè)被財(cái)政部稱為“中央企業(yè)”(廣義),不但包括中央所屬的金融機(jī)構(gòu),如四大國(guó)有商業(yè)銀行、煙草總公司、鐵路總公司等巨無(wú)霸企業(yè),也包括各中央部委所屬的林林總總的企業(yè),甚至某部委機(jī)關(guān)服務(wù)中心下屬的地下室招待所、印刷廠都在其中;第三類是地方政府出資成立的國(guó)有企業(yè),按屬地原則由當(dāng)?shù)卣鶎俚膰?guó)資委或指派特定機(jī)構(gòu)履行出資人職責(zé)。說(shuō)明一下,地方國(guó)資委與國(guó)務(wù)院國(guó)資委無(wú)直接隸屬關(guān)系,它們歸地方政府管。
步驟5采用不同類型的軸承試驗(yàn)數(shù)據(jù)對(duì)上述步驟進(jìn)行驗(yàn)證,數(shù)據(jù)集1采用凱斯西儲(chǔ)大學(xué)軸承試驗(yàn)數(shù)據(jù),數(shù)據(jù)集2采用德國(guó)帕德博恩大學(xué)軸承故障數(shù)據(jù)。
圖4 本文軸承故障診斷流程Fig.4 Bearing fault diagnosis process in this paper
LSGAN的試驗(yàn)訓(xùn)練樣本1來(lái)自凱斯西儲(chǔ)大學(xué)軸承數(shù)據(jù)中心公開(kāi)軸承數(shù)據(jù)集[17]。采用12 kHZ采樣頻率下驅(qū)動(dòng)端軸承數(shù)據(jù),根據(jù)軸承的故障狀態(tài)分為:正常(N)、內(nèi)圈故障(IR)、外圈故障(OR)以及滾動(dòng)體故障(RE)。在同種故障條件下,根據(jù)故障程度分為0.177 8 mm,0.355 6 mm,0.533 5 mm,負(fù)載條件為735~2 205 W,如表2所示。
表2 滾動(dòng)軸承故障類型Tab.2 Fault types of rolling bearing
將每類一維數(shù)據(jù)構(gòu)建二維矩陣,作為L(zhǎng)SGAN的網(wǎng)絡(luò)輸入。每段取4 096個(gè)采樣點(diǎn)重構(gòu)為64×64的軸承信號(hào)矩陣輸入判別器進(jìn)行訓(xùn)練及生成對(duì)應(yīng)種類樣本。
采用表2所示10類訓(xùn)練樣本,每類樣本量為400,共4 000個(gè)訓(xùn)練樣本。按80%訓(xùn)練集和20%測(cè)試集劃分比例,作為L(zhǎng)SGAN訓(xùn)練的輸入樣本數(shù)據(jù)。為了保證訓(xùn)練結(jié)果的可比性,采用的各類型生成對(duì)抗網(wǎng)絡(luò)參數(shù)均設(shè)置為:采用RMSProp方式訓(xùn)練,生成器與判別器學(xué)習(xí)率均設(shè)置為0.000 2;迭代次數(shù)500次;批尺寸為32;β1取0.5;β2取0.999。
圖5為迭代500次后生成的軸承故障數(shù)據(jù)與真實(shí)樣本數(shù)據(jù)轉(zhuǎn)換為二維灰度圖后的比較。
圖5 生成數(shù)據(jù)與真實(shí)數(shù)據(jù)比較圖Fig.5 Comparison between generated data and real data
圖6所示為L(zhǎng)SGAN在迭代過(guò)程中生成器與判別器的損失函數(shù),當(dāng)模型迭代次數(shù)達(dá)到200時(shí),判別器與生成器的損失變?yōu)樾》鹗?,并其值均保持在小?.5的數(shù)據(jù)范圍內(nèi),說(shuō)明網(wǎng)絡(luò)達(dá)到納什平衡。
圖6 LSGAN判別器和生成器損失函數(shù)趨勢(shì)Fig.6 Loss function trend of LSGAN discriminator and generator
通過(guò)對(duì)比3種GAN生成數(shù)據(jù)的能力,引入GAN[18]和SGAN[19]按2.1節(jié)所述網(wǎng)絡(luò)結(jié)構(gòu),采用相同的迭代次數(shù)和網(wǎng)絡(luò)深度生成樣本。通過(guò)Wasserstein距離(Wasserstein distance,WD)[20]、歐氏距離(Euclidean distance,ED)[21]以及最大均值差異距離(maximum mean discrepancy,MMD)[22]3個(gè)衡量分布差異的指標(biāo)來(lái)判定生成樣本的質(zhì)量。上述分布差異指標(biāo)均為越小越優(yōu)型。結(jié)果如表3所示。
表3 不同樣本數(shù)據(jù)量不足方法的指標(biāo)對(duì)比Tab.3 Index comparison of different data enhancement methods
通過(guò)表3對(duì)比可知,LSGAN相較于對(duì)比的GAN網(wǎng)絡(luò),生成數(shù)據(jù)的質(zhì)量有一定的提升。
結(jié)合SqueezeNet卷積神經(jīng)網(wǎng)絡(luò)設(shè)置不同訓(xùn)練比例的生成樣本和真實(shí)樣本,驗(yàn)證生成樣本在故障診斷過(guò)程中對(duì)模型及結(jié)果的影響。驗(yàn)證樣本分為三類:第一類,使用不同樣本量的真實(shí)數(shù)據(jù),訓(xùn)練模型并使用該模型對(duì)真實(shí)數(shù)據(jù)生成的4 000個(gè)樣本進(jìn)行分類;第二類,按不同比例設(shè)置真實(shí)+生成復(fù)合數(shù)據(jù)集訓(xùn)練模型,將上述4 000個(gè)樣本輸入該模型用于故障診斷;第三類,只使用生成樣本訓(xùn)練SqueezeNet網(wǎng)絡(luò)模型,再將訓(xùn)練好的模型用于對(duì)4 000個(gè)真實(shí)數(shù)據(jù)樣本的故障診斷。在訓(xùn)練上網(wǎng)絡(luò)模型過(guò)程中始終使用80%訓(xùn)練20%驗(yàn)證的比例,記錄訓(xùn)練模型準(zhǔn)確率、測(cè)試模型準(zhǔn)確率以及測(cè)試過(guò)程所耗時(shí)長(zhǎng)。
表4 不同樣本比例對(duì)模型及診斷準(zhǔn)確率Tab.4 Model and diagnostic accuracy of different sample proportion
表4展示了在3類數(shù)據(jù)集的訓(xùn)練及驗(yàn)證準(zhǔn)確率,從序號(hào)3~4及18~20表明訓(xùn)練模型的數(shù)量較小時(shí),驗(yàn)證的誤差也會(huì)隨之升高,降低模型精度。其中序號(hào)6和9得到本次試驗(yàn)的最高準(zhǔn)確率,均達(dá)到99%以上,可以得出生成數(shù)據(jù)結(jié)合真實(shí)數(shù)據(jù)能夠明顯的提升訓(xùn)練模型的準(zhǔn)確率。當(dāng)單純使用真實(shí)數(shù)據(jù)或生成數(shù)據(jù)訓(xùn)練模型時(shí),驗(yàn)證準(zhǔn)確率并不理想。而將真實(shí)數(shù)據(jù)結(jié)合生成數(shù)據(jù)輔助訓(xùn)練時(shí),模型精度達(dá)到最高。結(jié)果表明,當(dāng)訓(xùn)練數(shù)據(jù)量及真實(shí)數(shù)據(jù)量過(guò)少時(shí)均會(huì)導(dǎo)致模型準(zhǔn)確率降低,原因是生成數(shù)據(jù)本身有一定的誤差,從而影響模型的性能進(jìn)而降低故障診斷的準(zhǔn)確性。
在本試驗(yàn)過(guò)程中對(duì)比6號(hào)和9號(hào)的訓(xùn)練模型準(zhǔn)確率時(shí)會(huì)發(fā)現(xiàn),9號(hào)的模型訓(xùn)練準(zhǔn)確率略高于6號(hào),但測(cè)試準(zhǔn)確率卻相對(duì)較低。說(shuō)明此時(shí)9號(hào)網(wǎng)絡(luò)在訓(xùn)練模型的驗(yàn)證過(guò)程中出現(xiàn)過(guò)擬合現(xiàn)象,但將訓(xùn)練好的網(wǎng)絡(luò)對(duì)其他數(shù)據(jù)集進(jìn)行故障診斷時(shí)效果明顯不如6號(hào)。同時(shí)也可得出結(jié)論,當(dāng)出現(xiàn)過(guò)擬合現(xiàn)象時(shí),解決方法之一就是增加訓(xùn)練樣本的數(shù)量。
為了驗(yàn)證LSGAN生成樣本的有效性,將對(duì)比方法GAN和SGAN,生成與LSGAN數(shù)量相同的樣本。構(gòu)建GAN和SGAN生成樣本與真實(shí)樣本訓(xùn)練集對(duì)SqueezeNet進(jìn)行訓(xùn)練,再對(duì)4 000個(gè)真實(shí)樣本進(jìn)行分類。通過(guò)對(duì)比診斷的準(zhǔn)確率,判別生成樣本模型的有效性。
表5為當(dāng)采用GAN和SGAN生成數(shù)據(jù)與真實(shí)數(shù)據(jù)樣本結(jié)合進(jìn)行的滾動(dòng)軸承故障診斷準(zhǔn)確率及所用測(cè)試時(shí)長(zhǎng)。各選取LSGAN測(cè)試過(guò)程中比較有代表性的數(shù)據(jù)集比例,對(duì)應(yīng)表3中編號(hào)分別為1,2,6,7的樣本量比例。在各個(gè)模型訓(xùn)練過(guò)程中的參數(shù)均與LSGAN網(wǎng)絡(luò)參數(shù)相同,迭代次數(shù)為500,按照不同的故障種類訓(xùn)練10種生成模型。通過(guò)結(jié)果對(duì)比可知,對(duì)比方法生成的數(shù)據(jù)在診斷時(shí)長(zhǎng)上與本文所提方法較接近。但本文所提故障診斷模型的準(zhǔn)確率均達(dá)到90%以上,明顯優(yōu)于對(duì)比方法。
表5 不同生成數(shù)據(jù)方法對(duì)準(zhǔn)確率的影響Tab.5 Influence of different data generation methods on accuracy
圖7所示為真實(shí)樣本與生成樣本量各為2 000時(shí),對(duì)SqueezeNet模型進(jìn)行1 600次訓(xùn)練迭代過(guò)程的變化。當(dāng)訓(xùn)練達(dá)到1 400次時(shí),驗(yàn)證準(zhǔn)確率達(dá)到99.5%;損失率在1 200次迭代之后逐步趨近于0,并持續(xù)到最大迭代次數(shù)1 600次。表明在此樣本訓(xùn)練模型的情況下,模型可以較好的擬合。
圖7 SqueezeNet模型迭代過(guò)程Fig.7 SqueezeNet model iteration process
將負(fù)載分別為735 W,1 470 W以及2 205 W的滾動(dòng)軸承真實(shí)故障樣本輸入本節(jié)所述訓(xùn)練模型,得到真實(shí)樣本結(jié)合生成樣本訓(xùn)練的網(wǎng)絡(luò)模型診斷結(jié)果。并采用該模型對(duì)735 W及2 205 W負(fù)載下的故障進(jìn)行遷移診斷。對(duì)各診斷情況進(jìn)行定量描述,如圖8所示。
圖8 訓(xùn)練模型對(duì)不同負(fù)載條件下軸承故障診斷Fig.8 Fault diagnosis of bearing under different load conditions by training model
對(duì)比圖8各圖可知,LSGAN-SqueezeNet模型在以1 470 W負(fù)載條件下真實(shí)結(jié)合生成樣本進(jìn)行訓(xùn)練,輸入735~2 205 W負(fù)載條件下的軸承故障樣本進(jìn)行故障診斷,結(jié)果分別對(duì)應(yīng)為735 W為97.7%、1 470 W為99.7%和2 205 W為97.3%。故障診斷識(shí)別均達(dá)到97%以上,驗(yàn)證了模型在滾動(dòng)軸承故障診斷的準(zhǔn)確率和有效性,同時(shí)對(duì)不同工況下故障診斷具有較強(qiáng)的泛化性。
采用德國(guó)帕德博恩大學(xué)提供的公開(kāi)軸承數(shù)據(jù)集,試驗(yàn)臺(tái)由幾個(gè)模塊組成:電機(jī)、扭矩測(cè)量軸、滾動(dòng)軸承測(cè)試模塊、飛輪和負(fù)載電機(jī),如圖9所示。
圖9 德國(guó)Paderborn大學(xué)軸承試驗(yàn)臺(tái)Fig.9 Bearing test bench of Paderborn University of Germany
采用6203型球軸,以64 kHZ采樣頻率采樣。根據(jù)軸承的故障狀態(tài)分為:正常(N)、內(nèi)圈故障(IR)以及外圈故障(OR)。其中內(nèi)圈故障由3種加工方式所得:電火花加工、鉆孔以及電刻加工;外圈故障由兩種加工方式所得:電火花加工及電刻加工。選用電火花加工數(shù)據(jù)目的是與實(shí)例1中故障加工方法一致。為保持收集的信號(hào)的穩(wěn)定性,需要使驅(qū)動(dòng)系統(tǒng)的轉(zhuǎn)速、軸承徑向力以及傳動(dòng)系統(tǒng)負(fù)載扭矩3個(gè)參數(shù)恒定。本文選取轉(zhuǎn)速為1 500 r/min、負(fù)載扭矩0.7 Nm、徑向力1 000 N的基本條件下采集的軸承振動(dòng)信號(hào)。
每段取4 096個(gè)采樣點(diǎn)重構(gòu)為64×64的軸承信號(hào),構(gòu)建二維矩陣,每種狀態(tài)信號(hào)構(gòu)建400個(gè)樣本,作為輸入LSGAN進(jìn)行訓(xùn)練及生成對(duì)應(yīng)種類樣本。實(shí)例2所使用網(wǎng)絡(luò)結(jié)構(gòu)與表1相同,且學(xué)習(xí)率、批尺寸以及優(yōu)化器參數(shù)設(shè)定均與2.1節(jié)保持一致。
使用LSGAN分別對(duì)N,IR,OR狀態(tài)下振動(dòng)信號(hào)樣本進(jìn)行訓(xùn)練,經(jīng)過(guò)500次迭代后得到生成樣本,將生成樣本與真實(shí)樣本的時(shí)域及頻域?qū)Ρ热鐖D10所示。
由圖10所示可知,LSGAN生成的數(shù)據(jù)可以有效的學(xué)習(xí)到原數(shù)據(jù)的分布規(guī)律,從而實(shí)現(xiàn)在訓(xùn)練樣本量不足的情況下實(shí)現(xiàn)數(shù)據(jù)擴(kuò)充及增強(qiáng)的效果。
將生成數(shù)據(jù)的三類信號(hào)各構(gòu)建400個(gè)樣本集,作為SqueezeNet的網(wǎng)絡(luò)輸入,結(jié)合真實(shí)樣本數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,得到不同樣本比例的情況下模型診斷的準(zhǔn)確率。
圖10 真實(shí)樣本與生成樣本信號(hào)時(shí)域頻域圖Fig.10 Real sample and generating sample signal in time domain and frequency domain
表6 不同樣本比例對(duì)模型及診斷準(zhǔn)確率Tab.6 Model and diagnostic accuracy of different sample proportion
由表6可知,使用帕德博恩數(shù)據(jù)集進(jìn)行故障診斷過(guò)程中,在訓(xùn)練樣本量較小時(shí)如序號(hào)3,6,15,訓(xùn)練模型的及驗(yàn)證準(zhǔn)確率均很低,且均低于90%準(zhǔn)確率。在序號(hào)7的試驗(yàn)中得到最高準(zhǔn)確率,達(dá)到99.7%。并且結(jié)合序號(hào)8,9,10,13的試驗(yàn)結(jié)果可得,生成數(shù)據(jù)結(jié)合真實(shí)數(shù)據(jù)訓(xùn)練的模型可以達(dá)到提升故障診斷準(zhǔn)確率的目的,驗(yàn)證了所提方法的有效性。其中序號(hào)7所示的具體分類結(jié)果混淆矩陣如圖11所示。
圖11 軸承3種不同狀態(tài)的混淆矩陣Fig.11 Confusion matrix of three different states of bearing
為驗(yàn)證所提方法的有效性,采用LSGAN生成樣本結(jié)合真實(shí)樣本集,與其他應(yīng)用于軸承故障診斷的方法進(jìn)行對(duì)比。選取試驗(yàn)1中的數(shù)據(jù)集6、試驗(yàn)2中的數(shù)據(jù)集7作為輸入,利用GoogleNet進(jìn)行故障診斷[23]。將對(duì)比方法1中所提數(shù)據(jù)集作為輸入,與AlexNet結(jié)合進(jìn)行故障診斷[24]。選用文獻(xiàn)[25]中提到的振動(dòng)信號(hào)特征包括:峰值、均值、方差、均方根、峭度、斜度、時(shí)頻域特征選用小波變換的3層低頻信號(hào)結(jié)合3層高頻信號(hào),所提取的特征結(jié)合SVM進(jìn)行故障診斷分類,數(shù)據(jù)集采用與前對(duì)比方法相同,但未轉(zhuǎn)換成二維矩陣的一維振動(dòng)信號(hào)。
表7 不同模型的故障診斷準(zhǔn)確率Tab.7 Fault diagnosis accuracy of different models
由表7可以看出,在生成結(jié)合真實(shí)樣本的條件下,本文所提方法診斷準(zhǔn)確率均高于對(duì)比方法。GoogleNet在對(duì)數(shù)據(jù)集2的診斷能力略遜于AlexNet和SqueezeNet;而SqueezeNet的網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)于AlexNet更為簡(jiǎn)化,但診斷精度更優(yōu)于后者,不僅提升了診斷準(zhǔn)確率還降低了訓(xùn)練成本。多特征-SVM通過(guò)提取特征在進(jìn)行故障診斷,雖然準(zhǔn)確率也達(dá)到了90%以上,但受限于特征提取不夠充分導(dǎo)致準(zhǔn)確率不如本文所提方法。與其他方法對(duì)比,本文所提方法在保證了故障診斷準(zhǔn)確率的同時(shí),也降低了診斷過(guò)程的時(shí)間成本,體現(xiàn)了該方法的優(yōu)越性。
本文提出LSGAN結(jié)合SqueezeNet滾動(dòng)軸承故障診斷方法,驗(yàn)證該方法應(yīng)用于樣本數(shù)據(jù)量不足情況下的可行性:
(1)采用改進(jìn)LSGAN數(shù)據(jù)樣本生成方法,相較于其他對(duì)比方法,生成樣本精度有一定的提升。同時(shí)對(duì)應(yīng)生成數(shù)據(jù)在應(yīng)用于故障診斷過(guò)程中,所提方法相較于對(duì)比方法準(zhǔn)確率由80%左右提升至99.7%。
(2)選擇不同比例的真實(shí)樣本與生成樣本訓(xùn)練SqueezeNet模型,在兩個(gè)試驗(yàn)中診斷準(zhǔn)確率最高達(dá)到99.7%,體現(xiàn)出所提模型對(duì)故障診斷的有效性。
(3)將不同負(fù)載條件下的滾動(dòng)軸承樣本輸入訓(xùn)練模型中,其準(zhǔn)確率分別達(dá)到97.7%,99.7%和97.3%,表明該模型在不同工況數(shù)據(jù)集上具有較強(qiáng)的泛化能力。
(4)所提方法不僅在診斷準(zhǔn)確率優(yōu)于對(duì)比方法,在同類型方法中網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)簡(jiǎn)化但不降低診斷精度,節(jié)約了故障診斷過(guò)程中的時(shí)間成本,具有較高的實(shí)用價(jià)值。為樣本數(shù)據(jù)量不足條件下的滾動(dòng)軸承故障診斷提供一種具有較高效率及準(zhǔn)確率的方法。
Vol.41 No.12 2022