張笑璐,鄒益勝*,,曾大懿,彭飛,趙市教
(1.西南交通大學(xué) 機(jī)械工程學(xué)院,成都 610031;2. 中車工業(yè)研究院有限公司,北京 100070)
軸承作為主要的旋轉(zhuǎn)機(jī)械之一,被廣泛應(yīng)用于工程機(jī)械、軌道交通、精密機(jī)床、儀器儀表等領(lǐng)域。在工作運(yùn)行時(shí)受到力與載荷的作用容易發(fā)生磨損、疲勞剝落、銹蝕等故障,據(jù)Cerrada等[1]統(tǒng)計(jì),約40%的旋轉(zhuǎn)機(jī)械故障是由軸承故障引起的。軸承一旦發(fā)生故障,將嚴(yán)重影響設(shè)備的正常運(yùn)行,甚至可能造成較大安全事故及經(jīng)濟(jì)損失。故而需要對軸承故障進(jìn)行監(jiān)測和診斷,及時(shí)發(fā)現(xiàn)潛在的安全隱患[2]。
軸承故障診斷方法多基于對采集的振動信號進(jìn)行處理與分析,現(xiàn)有故障診斷方法采用的模型如:支持向量機(jī)(Support vector machines, SVM)[3]、BP神經(jīng)網(wǎng)絡(luò)[4]、貝葉斯分類器[5]和隨機(jī)森林(Random forests,RF)[6]等都立足于充足且均衡的樣本數(shù)據(jù)。而實(shí)際工況下,滾動軸承故障中內(nèi)圈和外圈出現(xiàn)裂紋是最常見的,據(jù)統(tǒng)計(jì)內(nèi)外圈故障占滾動軸承的90%[7],其余部位僅占10%,故而在采集故障樣本數(shù)據(jù)時(shí),往往出現(xiàn)個(gè)別故障類型采集的樣本較少的情況,導(dǎo)致總體樣本不均衡。
傳統(tǒng)用來解決樣本不均衡問題的方法可以歸類為以下3個(gè):樣本采樣、改進(jìn)診斷模型和樣本擴(kuò)增。其中,樣本采樣分為Oversampling[8]和Under-sampling[9]兩類:Oversampling通過復(fù)制操作產(chǎn)生重復(fù)樣本,會導(dǎo)致分類器傾向過度擬合;Underr-sampling 技術(shù)剔除了部分大樣本,信息可能嚴(yán)重丟失從而導(dǎo)致信息空間的扭曲與不完整。改進(jìn)診斷模型的方式從診斷模型本身出發(fā),常通過調(diào)整分類器敏感度來提高診斷精度,提升的程度往往有限且較難獲得最優(yōu)權(quán)重。樣本擴(kuò)增方法通過生成虛擬樣本填充小樣本空間,能有效避免采樣方法存在的問題,但傳統(tǒng)的樣本擴(kuò)增方法多運(yùn)用SMOTE及其改良模型[10],存在局限性:一是在近鄰選擇時(shí)具有一定的盲目性;二是該算法無法克服非平衡數(shù)據(jù)集的數(shù)據(jù)分布問題,容易分布邊緣化。
Goodfellow等[11]在2014年提出的一種基于博弈場景的半監(jiān)督特征學(xué)習(xí)算法——生成對抗網(wǎng)絡(luò)(Generative adversarial network, GAN)改善了這種局限性。隨著對抗學(xué)習(xí)思想的不斷完善,GAN已經(jīng)在圖像生成、圖像辨識和風(fēng)格遷移等領(lǐng)域有了較多的應(yīng)用[12],并且衍生出了實(shí)現(xiàn)不同功能的變體。GAN通過生成網(wǎng)絡(luò)和鑒別網(wǎng)絡(luò)的博弈過程學(xué)習(xí)訓(xùn)練樣本的數(shù)據(jù)分布,使生成網(wǎng)絡(luò)輸出能夠以假亂真的訓(xùn)練樣本,從而解決實(shí)際故障診斷中故障樣本少于正常樣本的數(shù)據(jù)不平衡問題。
為了更好地解決樣本不均衡情況下軸承的故障診斷問題,提出一種基于DCGAN(Deep convolution generative adversarial network)的故障診斷模型。軸承診斷常采用原始數(shù)據(jù)作為研究對象,但在簡單的生成對抗網(wǎng)絡(luò)中常常無法獲得較好的結(jié)果。將軸承振動數(shù)據(jù)進(jìn)行了快速傅里葉變換凸顯特征。此外結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolution neural network,CNN)[13]與GAN的優(yōu)點(diǎn),提高了生成對抗網(wǎng)絡(luò)對原始數(shù)據(jù)特征的挖掘能力。并在模型中加入Dropout層防止過擬合,提高模型的泛化能力。此外,模型采用衰減學(xué)習(xí)率提高模型的訓(xùn)練速率,能更快速的生成虛擬樣本填充不均衡樣本空間,實(shí)現(xiàn)不均衡情景下軸承故障診斷效率的提升。采用德國Paderborn大學(xué)的公開軸承數(shù)據(jù)集進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,該方法在樣本不均衡情景下能夠有效提升診斷精度及穩(wěn)定性。
卷積神經(jīng)網(wǎng)絡(luò)是受神經(jīng)科學(xué)感受野機(jī)制啟發(fā)而提出的一種前饋多級神經(jīng)網(wǎng)絡(luò),主要由卷積層、池化層和全連接層堆疊形成。卷積層中,前一層的輸出信號通過卷積核提取出一個(gè)局部特征,并將該特征輸出。池化層則通過特征選擇降低特征數(shù)量,常用的有最大池化和平均池化兩種操作。全連接層則連接前一層的所有特征,整合卷積層或池化層中具有類別區(qū)分的局部信息并將輸出值發(fā)送到分類器。提出的方法在生成對抗網(wǎng)絡(luò)上應(yīng)用了卷積以及反卷積方法,故障診斷模型中采用了一維的卷積神經(jīng)網(wǎng)絡(luò)模型。卷積原理為
(1)
式中Mj表示輸入的神經(jīng)元集合。
在卷積層中,每個(gè)神經(jīng)元僅對局部區(qū)域進(jìn)行感知,而不以全連接的形式,極大的降低運(yùn)算量。此外,卷積神經(jīng)網(wǎng)絡(luò)的權(quán)值共享,每個(gè)神經(jīng)元對應(yīng)的參數(shù)是相同的,同一個(gè)卷積核對不同數(shù)據(jù)進(jìn)行處理時(shí)具有相同的權(quán)值和偏置值,減少了網(wǎng)絡(luò)的參數(shù)量。這些卷積核按照設(shè)定的步長對給定的數(shù)據(jù)進(jìn)行卷積操作,并提取特征,上一層的特征神經(jīng)元被一個(gè)卷積核卷積并通過一個(gè)激活函數(shù),獲得新一層的特征神經(jīng)元。為了防止過擬合情況的發(fā)生,采用的卷積神經(jīng)網(wǎng)絡(luò)模型都加入了Dropout層。
生成對抗網(wǎng)絡(luò)GAN是一種無監(jiān)督學(xué)習(xí)方法,通過生成模型(Generative model)和判別模型(Discriminative model)的零和博弈生成虛擬樣本。其中,生成器接收隨機(jī)的噪聲z并通過反卷積的方式生成一組生成樣本Xf,將Xf與原始樣本Xr一起放入鑒別器,利用鑒別結(jié)果反向訓(xùn)練生成器優(yōu)化生成樣本。
針對軸承故障診斷,基礎(chǔ)的GAN模型會出現(xiàn)梯度消失、模式崩潰等問題,生成的結(jié)果較差,即使將訓(xùn)練時(shí)間增長,生成結(jié)果依舊沒有得到改善。并且未經(jīng)過預(yù)處理的原始數(shù)據(jù)量級相差較大,特征較為復(fù)雜往往會導(dǎo)致模型崩潰。DCGAN是在GAN基礎(chǔ)上提出的一種新的模型,在網(wǎng)絡(luò)結(jié)構(gòu)上有所改進(jìn),主要的變化有:采用步長卷積代替上采樣層,利用卷積層能挖掘樣本特征的優(yōu)點(diǎn),更好的促進(jìn)生成器的訓(xùn)練。這種網(wǎng)絡(luò)模型多應(yīng)用于圖像樣本。生成對抗網(wǎng)絡(luò)模型如圖1所示。
圖1 生成對抗網(wǎng)絡(luò)模型
提出的基于DCGAN診斷模型利采用卷積與反卷積的結(jié)構(gòu)。生成器由五層反卷積組成,針對軸承的樣本情況給每個(gè)反卷積層分配不同的步長,通過反卷積的形式將接收的一維噪音擴(kuò)充到所需的樣本大小;鑒別器則由卷積層組成,通過輸出0或1的集合來反向給予生成器信息使其進(jìn)一步優(yōu)化,并在鑒別器中使用LeakyReLu激活函數(shù)增強(qiáng)模型的穩(wěn)定性。此外,在采用Adam優(yōu)化器進(jìn)行訓(xùn)練的同時(shí),應(yīng)用衰減學(xué)習(xí)率,初始的學(xué)習(xí)率設(shè)定為0.000 2,其后每500次訓(xùn)練衰弱5%。在訓(xùn)練過程中,針對實(shí)驗(yàn)采用的軸承情況,出現(xiàn)了生成器和鑒別器的優(yōu)化訓(xùn)練速度并不一致的情況。為了獲得較好的結(jié)果進(jìn)行了不同的訓(xùn)練比例的嘗試,當(dāng)生成器與鑒別器的訓(xùn)練比例調(diào)高時(shí),生成器的loss值上升的情況會相較1∶1有所減緩但趨勢不會產(chǎn)生變化。鑒別器的損失函數(shù)為
Ez~Pz(z)[lg(1-D(G(z)))]
(2)
式中:G、D分別代表生成器和鑒別器,G的輸入是一維隨機(jī)噪聲向量z,輸入的真實(shí)試驗(yàn)樣本為x;G(z)是生成的虛擬樣本。
故障診斷模型構(gòu)建的一維卷積神經(jīng)網(wǎng)絡(luò),由2個(gè)卷積層、2個(gè)池化層、Dropout層以及Softmax層構(gòu)成。利用卷積層挖掘訓(xùn)練集的特征,在池化層放大后通過Softmax層輸出對應(yīng)判定結(jié)果。該模型中,Batchsize取值為10,池化采用最大池化。DCGAN故障診斷流程如圖2所示。
圖2 DCGAN故障診斷流程
首先對軸承數(shù)據(jù)進(jìn)行快速傅里葉變化并用歸一化進(jìn)行處理。將處理后的真實(shí)樣本導(dǎo)入DCGAN模型進(jìn)行對抗訓(xùn)練,生成所需的虛擬樣本。根據(jù)不同實(shí)驗(yàn)要求分別構(gòu)建對應(yīng)的訓(xùn)練集和測試集,將劃分好的數(shù)據(jù)集導(dǎo)入一維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行診斷,得到對應(yīng)的診斷精度。
試驗(yàn)數(shù)據(jù)來源于德國帕德伯恩大學(xué)設(shè)計(jì)與驅(qū)動技術(shù)系滾動軸承狀態(tài)監(jiān)測試驗(yàn)臺。如圖3所示,試驗(yàn)臺由5個(gè)模塊組成:電機(jī)、扭矩測量軸、滾動軸承試驗(yàn)?zāi)K、飛輪和負(fù)載電機(jī)。
圖3 滾動軸承狀態(tài)監(jiān)測試驗(yàn)臺
試驗(yàn)軸承為6203型滾珠軸承。軸承以900 r/min的轉(zhuǎn)速運(yùn)轉(zhuǎn),負(fù)載扭矩為0.7 Nm,軸承徑向力為1 000 N,數(shù)據(jù)采集系統(tǒng)頻率為64 kHz,軸承溫度大致保持在45~50 ℃,試驗(yàn)采用了3種軸承狀態(tài):內(nèi)圈損壞、外圈損壞和健康。每個(gè)軸承采集20個(gè)原始振動時(shí)間序列信號,每個(gè)信號記錄約256 000個(gè)數(shù)據(jù)點(diǎn)。
為了構(gòu)造樣本不均衡的情景,在單一工況下,針對5類不同軸承狀態(tài)各提取20*2 048的樣本數(shù)據(jù),包括4類對應(yīng)內(nèi)外圈不同故障嚴(yán)重程度以及對照健康組,具體信息如表1所示。
表1 故障類型和總量
原始振動數(shù)據(jù)作為作為時(shí)域信號,可以看作由多個(gè)不同頻率的正弦波信號無限疊加組成。傅里葉變換通過累加的方式將組成該信號的所有正弦波信號在頻域中表示出來。未處理過的原始信號在生成器中訓(xùn)練較為困難,為了提升模型訓(xùn)練能力并且考慮整體運(yùn)算量,對振動數(shù)據(jù)進(jìn)行了快速傅里葉變換。其次,考慮到不同的樣本特征數(shù)據(jù)量級差異較大,為使每個(gè)特征都能獲得一定的權(quán)重,對數(shù)據(jù)進(jìn)行了歸一化處理。
為了驗(yàn)證生成樣本的真實(shí)性。首先采用T-SNE(t-distributed stochastic neighbor embedding)[14]將原始數(shù)據(jù)以及生成數(shù)據(jù)的特征進(jìn)行可視化處理,將所有特征降至三維。通過對比兩者的三維特征分布,評估生成數(shù)據(jù)的有效性。真實(shí)樣本與生成樣本的頻域特性對比如圖4所示。由圖5可知,兩者的三維特征存在較大的重合區(qū)域,保證了生成數(shù)據(jù)對原始特征的學(xué)習(xí),而部分離散的點(diǎn)則留存了一定的差異性。
圖4 真實(shí)樣本與生成樣本的頻域特性對比分析
圖5 真實(shí)樣本和生成樣本的空間分布情況對比分析
此外,為了進(jìn)一步評估生成數(shù)據(jù)的真實(shí)性,采用最大均值差異(Maximum mean discrepancy,MMD)指標(biāo)[15]通過計(jì)算生成樣本以及真實(shí)樣本的概率分布距離來評估樣本的真實(shí)性,其計(jì)算式為
(3)
式中H表示該距離通過映射函數(shù)將數(shù)據(jù)映射到再生希爾伯特空間中進(jìn)行度量。
利用高斯核函數(shù)對MMD進(jìn)行求解,5類不同情況下生成樣本過程中的變化趨勢見圖6。隨著訓(xùn)練次數(shù)的上升,MMD的數(shù)值會有所波動但整體呈現(xiàn)下降趨勢,生成樣本與真實(shí)樣本的概率分布逐漸接近。
為了驗(yàn)證生成數(shù)據(jù)的真實(shí)性以及所提方法的有效性,設(shè)計(jì)了兩組對比試驗(yàn),具體如圖7所示。
圖7 試驗(yàn)設(shè)計(jì)
試驗(yàn)一利用真實(shí)樣本以1∶1比例生成對應(yīng)的生成樣本,并將兩者進(jìn)行組合構(gòu)成A、B、C這3組。其中:A、B組訓(xùn)練集為真實(shí)樣本,C組為生成樣本;A、C組測試集為生成樣本,B組為真實(shí)樣本。每組進(jìn)行20次診斷,以此驗(yàn)證生成數(shù)據(jù)在實(shí)際軸承診斷中的真實(shí)性和可靠性。試驗(yàn)二則構(gòu)造了樣本不均衡情況,將其中一類的樣本數(shù)據(jù)減少至3個(gè),并利用這3個(gè)樣本進(jìn)行生成,將生成的虛擬數(shù)據(jù)進(jìn)行填充,填充前為D組,填充后為E組。以此驗(yàn)證虛擬數(shù)據(jù)在真實(shí)樣本不均衡情景下提高軸承診斷精度的有效性。同樣每組進(jìn)行20次診斷。
采用最低精度、最高精度、平均精度以及方差4個(gè)統(tǒng)計(jì)量分析原始樣本與生成樣本在兩個(gè)試驗(yàn)中的表現(xiàn)情況,具體如圖8所示。A、B兩組均能獲得較高的診斷精度,B組較A組診斷精度提高方差下降。而生成樣本作為訓(xùn)練集的C組最低精度也在90%以上。證明生成樣本較好的學(xué)習(xí)了原始樣本的特征并且能夠訓(xùn)練模型以分類原始數(shù)據(jù)構(gòu)成的測試集。不均衡的D組在加入生成樣本后,診斷精度有了較大的提升,且增強(qiáng)了穩(wěn)定性。
圖8 各試驗(yàn)整體平均精度
此外,為了進(jìn)一步分析各軸承狀態(tài)的診斷情況,針對每個(gè)不同軸承狀態(tài)的故障診斷精度見圖9,當(dāng)類1的樣本數(shù)據(jù)大幅度下降時(shí),其診斷精度出現(xiàn)大幅的下跌。而當(dāng)生成樣本作為填充時(shí),使得模型樣本均衡后,精度有明顯的提升。模型對不同情況的軸承故障誤判的幾率并不相同。在圖10中,類1的誤判主要出現(xiàn)在試驗(yàn)D組與試驗(yàn)E組中,與設(shè)計(jì)實(shí)驗(yàn)的初衷相符。試驗(yàn)D組因大幅度減少了類1的軸承樣本,從而導(dǎo)致誤判幾率急劇上升,大量類1樣本被誤判為類4。在利用生成樣本填充后,誤判幾率有明顯的下降。結(jié)合圖9、圖10,試驗(yàn)中其他類最容易被誤判為類4,在試驗(yàn)A、D組中分別為將類5錯(cuò)分為類4,類5及類1錯(cuò)分為類4。類5錯(cuò)分類的原因來自診斷模型無法完全正確的對類5和類4進(jìn)行分類。而出現(xiàn)類1錯(cuò)分類的原因可以歸結(jié)于類1樣本數(shù)量的減少。在試驗(yàn)D、E組的對比下,通過生成樣本填充的方法,能有效降低小眾類被誤判的幾率,從而提高整體診斷精度。
圖9 各試驗(yàn)診斷結(jié)果
圖10 各試驗(yàn)不同類型錯(cuò)誤診斷結(jié)果統(tǒng)計(jì)
為進(jìn)一步考慮極端情況下的小樣本情況,當(dāng)類型一的真實(shí)樣本僅存在1個(gè),利用僅1個(gè)樣本進(jìn)行生成虛擬樣本填充樣本空間,使之達(dá)到均衡,填充前后的混淆矩陣結(jié)果如圖11所示。
圖11 診斷結(jié)果的混淆矩陣
通過混淆矩陣可以發(fā)現(xiàn),原先僅放入1個(gè)樣本導(dǎo)致出現(xiàn)誤判的類1,在加入生成樣本使樣本數(shù)據(jù)均衡后,診斷成功率有了明顯的提升。實(shí)驗(yàn)證明,采用生成虛擬樣本的方法,能有效的降低誤判率,防止了極少樣本類被當(dāng)作離群點(diǎn)的情況,同時(shí)在樣本不均衡的情況下也能有效的提高故障診斷精度以及診斷的穩(wěn)定性。
針對樣本不均衡情況下軸承故障診斷問題,提出了基于DCGAN的軸承故障診斷方法。該方法具有以下優(yōu)點(diǎn):
1) 采用快速傅里葉變換對原始樣本進(jìn)行了數(shù)據(jù)預(yù)處理,提高了深度卷積生成對抗網(wǎng)絡(luò)生成虛擬樣本的能力。
2) 將深度卷積生成對抗網(wǎng)絡(luò)引入不均衡情景下的軸承故障診斷問題,通過生成虛擬樣本填充樣本空間的方式提高了模型在樣本不均衡情景下的診斷能力。并在模型中加入了Dropout層,以及采用衰減學(xué)習(xí)率提高了生成樣本生成的有效性以及效率。
提出的方法在樣本不均衡情景下能有效的生成虛擬樣本。多角度分析以及構(gòu)建的實(shí)驗(yàn)結(jié)果證明,該方法能有效提高模型在不同樣本情景下的診斷精度以及診斷的穩(wěn)定性。