肖俊青, 金江濤, 岳敏楠, 李 春,2, 許子非, 孫 康
(1.上海理工大學(xué) 能源與動力工程學(xué)院,上海 200093;2.上海市動力工程多相流動與傳熱重點實驗室,上海 200093)
21世紀(jì)以來,環(huán)境保護日益受到重視,目前已列為國家“十四五”規(guī)劃主要內(nèi)容,我國將采取必要措施在2030年前達(dá)到碳達(dá)峰,2060年前實現(xiàn)碳中和,為此必須加強新能源研發(fā)力度,促進產(chǎn)業(yè)轉(zhuǎn)型[1]。風(fēng)能、水能以及核能等新能源的發(fā)展需要依靠高效穩(wěn)定的旋轉(zhuǎn)設(shè)備,而滾動軸承是旋轉(zhuǎn)設(shè)備必不可少的零部件,其運行狀況直接影響著整機性能[2]。因此,快速準(zhǔn)確地發(fā)現(xiàn)軸承故障已成為狀態(tài)監(jiān)測和診斷技術(shù)分析的主要研究內(nèi)容。
軸承故障分析雖常用易于大量采集的振動信號,但其復(fù)雜的運行環(huán)境難以確保信號純凈,且因設(shè)備振動和沖擊導(dǎo)致信號呈現(xiàn)典型的非線性、非平穩(wěn)特征,對有效提取特征信息和早期故障預(yù)警提出了嚴(yán)峻挑戰(zhàn)[3]。而時域分析是診斷領(lǐng)域普遍使用的方法,可有效提取多噪聲下非線性信號中的故障信息,可更好地實現(xiàn)機械設(shè)備的預(yù)防與維護[4]。小波變換(Wavelet Transform, WT)不僅需要分析有、無量綱參數(shù),還需要人工設(shè)置分解層數(shù),嚴(yán)重影響了結(jié)果的分析精度[5]。經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)方法在信號自適應(yīng)分解時雖無需人工干預(yù)就可保證本征模態(tài)函數(shù)(Intrinsic Mode Function, IMF)分量良好的完備性,但無法避免模態(tài)混疊和端點效應(yīng)[6];研究者基于傳統(tǒng)EMD方法改進提出了集合經(jīng)驗?zāi)B(tài)分解法(Ensemble Empirical Mode Decomposition, EEMD),在輸入信號中添加白噪聲可較好地保持?jǐn)?shù)據(jù)連續(xù)性并抑制模態(tài)混疊,但因信號獨立性難以分解出相同的數(shù)量,并未徹底解決模態(tài)混疊的難題[7]。而自適應(yīng)白噪聲總體平均經(jīng)驗?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)方法可有效避免端點效應(yīng),減少冗余和IMF分量中的殘余噪聲[8]。學(xué)者們針對如何準(zhǔn)確篩選出有效的IMF分量進行了大量研究,蘇文勝等[9]通過IMF分量的峭度與皮爾森相關(guān)系數(shù)篩選最佳IMF分量;彭暢等[10]使用距離度量因子選擇最優(yōu)IMF分量進行故障分析;蔣超等[11]基于快速譜峭度圖挑選敏感IMF分量。以上研究雖取得了一定效果,但均忽略了故障信息不僅存在于單個IMF分量中還可能存在于多個IMF分量中的問題。
大數(shù)據(jù)時代下,海量、高維數(shù)據(jù)泛濫,而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)依靠強大的自學(xué)習(xí)能力廣泛應(yīng)用于故障診斷領(lǐng)域[12]。王麗華等[13]采用短時傅里葉變換對原始數(shù)據(jù)進行預(yù)處理,利用CNN實現(xiàn)了電機故障診斷與分類;雷亞國等[14]利用深度神經(jīng)網(wǎng)絡(luò)對機械設(shè)備健康狀況進行智能診斷,有效挖掘了機械裝備大數(shù)據(jù)中隱藏的信息;Lu等[15]采用重構(gòu)時間序列輸入CNN對滾動軸承進行故障診斷,較好地驗證了強噪聲下的魯棒性。以上研究證明CNN善于處理海量、高維數(shù)據(jù),且具有強大的自學(xué)習(xí)能力,但均未考慮噪聲對故障診斷的影響。
針對以上不足,筆者采用主成分分析(Principal Component Analysis, PCA)降維與分形盒維數(shù)聯(lián)合方法篩選CEEMDAN算法分解的有效IMF分量并重構(gòu),克服了現(xiàn)有研究選取最佳單一IMF分量的不足,并依靠強大自學(xué)習(xí)能力的CNN對隱含故障信息進行進一步挖掘。通過添加不同信噪比還原實際噪聲分析對故障診斷的影響,以驗證所提方法的魯棒性與泛化性。
圖1 CEEMDAN算法流程圖Fig.1 Flow chart of CEEMDAN algorithm
因分形可以較好地分析部分與整體的自相似性、反饋體系無標(biāo)度性及定量分析,因此深受非線性領(lǐng)域研究者的青睞[17]。而主元分析可對高維、海量數(shù)據(jù)進行降維處理并提取主要特征信息,簡化計算的同時提升效率[18]。
自適應(yīng)添加白噪聲的CEEMDAN算法,雖有效降低了模態(tài)混疊問題,但仍無法徹底消除冗余分量和虛假分量的影響,干擾主分量篩選。而大部分學(xué)者采用皮爾森相關(guān)系數(shù)、峭度以及灰色關(guān)聯(lián)度等方法篩選最優(yōu)IMF分量[19],忽略了故障信息往往存在于部分IMF分量中,導(dǎo)致有效信息難以完全提取。筆者采用PCA與分形盒維數(shù)結(jié)合的方法改進CEEMDAN算法,PCA可對數(shù)據(jù)降維以提取有效故障信息,采用交叉分析法計算降維前后的分形盒維數(shù)確定最佳分量組,分形盒維數(shù)越大,表明信號越混亂,反之,則信號越穩(wěn)定。改進的CEEMDAN算法流程圖如圖2所示。其中,p為最佳IMF分量的個數(shù)。
圖2 改進CEEMDAN算法流程圖Fig.2 Flow chart of improved CEEMDAN algorithm
卷積神經(jīng)網(wǎng)絡(luò)源于靈長動物視覺神經(jīng)系統(tǒng)神經(jīng)元,不僅具有深層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),還有強大的數(shù)據(jù)挖掘與特征提取能力[20]。而局部感受野、權(quán)值共享及下采樣作為其獨有特征,不僅可實現(xiàn)數(shù)據(jù)特征的深度挖掘,還可增強數(shù)據(jù)特征的自學(xué)習(xí)能力,較好地消除算法過擬合[21]。CNN模型結(jié)構(gòu)如圖3所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.3 Model structure of CNN
卷積層作為CNN的核心,利用卷積核與輸入特征重合區(qū)域?qū)?yīng)乘積并重構(gòu),經(jīng)添加偏置以獲取特征值實現(xiàn)特征信息提取。數(shù)據(jù)經(jīng)卷積層雖提高了特征信息提取能力,但增加了數(shù)據(jù)維度,易造成維數(shù)災(zāi)難,而池化層可在保留其關(guān)鍵特征的同時減少參數(shù)量,實現(xiàn)降維和篩選主要特征的目的[22]。其數(shù)學(xué)表達(dá)式為:
pj=f(yi+bj)
(1)
pk=f(βj·?+bj)
(2)
式中:pj為卷積輸出;pk為池化輸出;yi為輸入數(shù)據(jù);bj為偏置;βj為網(wǎng)絡(luò)偏置;?為子采樣函數(shù);f(·)為激活函數(shù)(Relu);i,j,k∈R。
全連接層可對特征信息進行有效分類,其包含的多層感知機隱含層可較好整合卷積、池化后的數(shù)據(jù)信息[23]。Dropout正則化技術(shù)[24]可將隱藏層的部分單元忽略以防止過擬合現(xiàn)象,提高模型的泛化性能,Dropout效果示意圖如圖4所示。
(a) 標(biāo)準(zhǔn)的全連接網(wǎng)絡(luò)
(b) Dropout后的網(wǎng)絡(luò)圖4 Dropout效果示意圖Fig.4 Effect schematic diagram of Dropout
CEEMDAN可有效避免端點效應(yīng),減少冗余和IMF分量中的殘余噪聲;PCA可將難于識別的故障映射到另一子空間進行降維處理以提取關(guān)鍵特征信息;分形盒維數(shù)作為最佳重構(gòu)分量篩選條件,可進一步剔除IMF冗余分量及虛假分量;而CNN依靠強大的數(shù)據(jù)處理優(yōu)勢,對其故障信息進行準(zhǔn)確識別與分類。模型結(jié)構(gòu)如圖5所示。
圖5 改進CEEMDAN融合CNN模型結(jié)構(gòu)圖Fig.5 Structural diagram of improved CEEMDAN fusion CNN
由圖5可知,通過改進CEEMDAN分解獲取4種故障信號各最佳重構(gòu)分量,將其導(dǎo)入含5層卷積層、5層池化層、5層Batch Normalization (BN)層和1層Dropout (DR)層和1層全連接層的CNN中,由Softmax進行故障識別與分類。采用BN、DR不僅可簡化計算、提高故障識別率,還能有效避免梯度爆炸、過擬合以及梯度消失等現(xiàn)象。
針對單一CEEMDAN和CNN算法存在的不足,筆者提出了一種改進CEEMDAN融合CNN的故障診斷方法,診斷流程如圖6所示。
圖6 故障診斷流程圖Fig.6 Flow chart of fault diagnosis
為較好地評估實際情況,采用西安交通大學(xué)公開的軸承振動數(shù)據(jù)[25]驗證本文故障診斷方法的優(yōu)越性。軸承試驗測試平臺如圖7所示。
圖7 軸承測試平臺Fig.7 Test platform of the bearing
試驗平臺電機轉(zhuǎn)速為2 100 r/min和2 250 r/min,采樣頻率為25.6 kHz。試驗工況如表1所示。由表1可知,軸承存在混合損傷、內(nèi)圈磨損、保持架磨損及外圈磨損4種故障,其時域、頻域圖如圖8所示,其中f為頻率。
表1 軸承試驗工況Tab.1 Test conditions of the bearing
(a) 時域波形
(b) 頻域波形圖8 軸承振動信號時域和頻域波形Fig.8 Time and frequency domain waveform of the bearing vibration signals
由圖8可知,滾動軸承不同故障振動信號時域和頻域圖整體雖有一定差異,但無法直接進行故障識別與分類,更難保證其診斷精度。而提取準(zhǔn)確、純凈及有效的故障特征才是診斷的基礎(chǔ),因此需對原始信號進行降噪處理以突顯故障信息,增強信號的實用性。
將原始信號分別采用EMD、EEMD以及CEEMDAN 算法實現(xiàn)降噪處理,但因數(shù)據(jù)過多且無法直接進行診斷,因此僅展示內(nèi)圈磨損分解結(jié)果,如圖9所示。
由圖9可知,從3種算法的時域和頻域圖無法準(zhǔn)確篩選最佳重構(gòu)分量進行故障分析,與EMD、EEMD算法相比,CEEMDAN算法雖采用自適應(yīng)添加白噪聲改善模態(tài)混疊的影響,但仍無法準(zhǔn)確剔除冗余分量和虛假分量。
(a) EMD分解結(jié)果
(b) EEMD分解結(jié)果
(c) CEEMDAN分解結(jié)果圖9 內(nèi)圈故障信號分解結(jié)果Fig.9 Decomposition results of inner ring fault signal
基于以上問題,采用PCA降維與分形盒維數(shù)結(jié)合的方法篩選最佳重構(gòu)分量,4種故障降維前后的分形盒維數(shù)對比結(jié)果如圖10所示。
(a) 內(nèi)圈磨損
(b) 外圈磨損
(c) 混合損傷
(d) 保持架磨損圖10 不同方法對各故障最佳重構(gòu)分量的篩選Fig.10 Screening of different methods to the optimal reconstructed components of each fault
由圖10可知,降維前后分形盒維數(shù)呈現(xiàn)負(fù)相關(guān)現(xiàn)象且CEEMDAN算法明顯優(yōu)于EMD和EEMD算法,基于分形盒維數(shù)性質(zhì),盒維數(shù)大小與信號穩(wěn)定性呈負(fù)相關(guān)。PCA降維前,IMF分量中的殘余噪聲會直接影響整體的穩(wěn)定性,導(dǎo)致盒維數(shù)隨IMF分量逐漸減小;降維后,主要故障信息被進一步提取、凈化,增強了數(shù)據(jù)穩(wěn)定性。通過交叉確定最佳重構(gòu)分量,不僅可避免殘余噪聲的影響,還能剔除冗余分量和虛假分量。各故障最佳重構(gòu)分量時域圖如圖11所示,其中內(nèi)圈磨損2代表已重構(gòu)內(nèi)圈信號,其余類同。
圖11 最佳重構(gòu)分量與原始信號分量時域圖Fig.11 Time domain diagram of optimal reconstruction components and original signal components
根據(jù)改進CEEMDAN篩選的最佳重構(gòu)分量,采用CNN方法驗證并與改進EMD、EEMD算法進行對比。將原始信號按8∶1∶1比例進行訓(xùn)練、測試及驗證,同時采用重采樣方法增加樣本數(shù)量,提高其識別精度。在無噪聲下,最佳重構(gòu)分量的訓(xùn)練集準(zhǔn)確率和損失情況如圖12所示。
圖12 最佳重構(gòu)分量的訓(xùn)練集準(zhǔn)確率和損失Fig.12 Accuracy rate and loss of training set for optimal reconstruction components
由圖12可知,改進CEEMDAN-CNN算法的準(zhǔn)確率及損失均優(yōu)于其他算法,具有較好的魯棒性和可行性。而實際環(huán)境中存在混雜噪聲,為進一步驗證該方法的實用性和泛化性,需盡可能還原實際運行環(huán)境,在信號中添加不同信噪比的噪聲。
4.3.1 可視化
鑒于直觀性,采用t-SNE方法對改進CEEMD-NAN-CNN算法在無噪聲下的各層進行可視化,結(jié)果如圖13所示。
(a) 卷積層1
(b) 卷積層2
(c) 卷積層3
(d) 卷積層4
(e) 卷積層5
(f) 全連接層
圖13 改進CEEMDNAN-CNN算法各層可視化分析結(jié)果Fig.13 Visualization results of each layer for improved CEEMDAN-CNN algorithm
4.3.2 泛化性驗證
為進一步還原實際運行工況,需在原始信號中添加不同信噪比的噪聲,各方法不同信噪比下的識別準(zhǔn)確率如圖14所示。
圖14 各方法不同信噪比下的識別準(zhǔn)確率Fig.14 Recognition accuracy of each method under different SNR
由圖14可知,與其他算法相比,改進CEEMDAN-CNN算法有顯著的優(yōu)越性和良好的泛化性。信噪比可較好地還原實際運行環(huán)境,而其與準(zhǔn)確率呈正相關(guān),間接反映了噪聲對診斷精度的影響。與原始算法相比,改進算法篩選最佳重構(gòu)分量具有更高的識別與分類精度;所提方法準(zhǔn)確率最高可達(dá)99.79%,在-6 dB信噪比時識別精度仍有87.13%,較其他算法提高了0.54%~10.33%;改進后的算法可較好地剔除冗余信號與虛假分量并實現(xiàn)降噪,增強有效故障體征提取的準(zhǔn)確性,進一步提高了故障診斷識別與分類精度。
(1) 所提改進CEEMDAN-CNN算法可較好地濾除噪聲干擾并準(zhǔn)確提取有效的故障特征,減小診斷誤差。
(2) 采用PCA降維與分形盒維數(shù)結(jié)合方法篩選最佳重構(gòu)分量,可有效剔除冗余分量與虛假分量,從而提高CNN故障識別與分類精度,通過對不同工況下滾動軸承進行故障分析,驗證了所提方法具有較強的魯棒性和實用性。
(3) 相比現(xiàn)有方法,本文改進CEEMDAN融合CNN方法在不同信噪比下均具有較高的識別精度,準(zhǔn)確率最高可達(dá)99.79%。