張 龍,周 俊
(上海工程技術大學 機械與汽車工程學院,上海 201620)
滾動軸承是最常見、最易受損的機械部件之一,作為機電設備中的核心零部件,它也是保證旋轉機械高效穩(wěn)定運行的重要部件。據相關統(tǒng)計顯示,滾動軸承每年的故障率在35%左右,有超過一半的滾動軸承需要進行檢查[1–2]。滾動軸承的優(yōu)劣對機械設備能否高效穩(wěn)定運行有很大的影響,因此對滾動軸承的質量檢測、狀態(tài)監(jiān)測和故障診斷具有十分重大的意義。
現代化生產中,大型化、復雜化、高速化、自動化、智能化是機械設備未來發(fā)展的方向,舊的依賴于人的傳統(tǒng)診斷方法已遠遠不能滿足當前各式各樣復雜化的系統(tǒng)需要,工業(yè)生產迫切需要融合智能傳感網絡、智能診斷算法和智能決策預示的智能診斷系統(tǒng)等。發(fā)展智能化的故障診斷方法是一條全新的途徑[3–4]。夏田等[5]采用小波包分解方法對軸承信號進行分解,再計算每一頻帶的小波包能量作為軸承故障特征,結合梯度提升決策樹構造軸承故障診斷模型。劉長良等[6]先將原始軸承故障信號進行變分模態(tài)分解(Variational mode decomposition,VMD),再利用奇異值分解技術進一步提取各模態(tài)的特征,最后采用標準模糊C 均值聚類(Fuzzy cmeans clustering,FCM)進行軸承故障識別;劉尚坤等[7]先利用自適應MED(Minimum entropy deconvolution)降噪方法對軸承信號進行最優(yōu)降噪處理,再通過EMD(Empirical mode decomposition)分解出若干個IMF(Intrinsic mode function)分量,選取峭度值最大的IMF進行包絡譜分析,通過其故障特征的頻率實現故障診斷。仝兆景等[8]通過變步長粒子群算法優(yōu)化的變分模態(tài)分解與Hilbert變換提取故障特征并將其作離散化處理,結合貝葉斯網絡構造故障診斷模型。周建民等[9]對原始軸承信號采用時域方法和集成經驗模態(tài)分解(Ensemble empirical mode decomposition,EEMD)能量熵提取軸承特征,通過遺傳算法(GeneticAlgorithm,GA)優(yōu) 化SVM(Support vector machine)相關參數,建立故障診斷模型。
上述方法存在兩個主要問題:(1)對于軸承信號預處理的方法處理過程復雜且計算量大;(2)在對軸承故障進行分類時往往只針對單一分類器進行故障診斷研究。本文提出將WELCH功率譜算法與集成學習相結合的集成故障診斷模型。其中WELCH算法計算簡單,有利于滾動軸承故障特征的提??;然后將單一的SVM 分類器與Bagging 算法相結合構造Bagging-SVM 集成模型;最后驗證該集成模型在不同電機轉速下的診斷性能以及抗噪性測試。
WELCH 功率譜是一種有效且實用的經典的譜估計運算,具有很好的信號分析能力。主要通過窗函數在被分析數據串上滑動截取數據并進行交疊,使數據中被截取的段數增加,并且對每一段被截取的數據都進行求取功率譜轉換并平均后疊加,這使得轉換后的信號數據更加平滑。這樣不僅降低了譜估計方差,還減少了對信號分辨率破壞,對信號所蘊藏的信息進行有效的保留,且計算量相對較小,對故障特征的提取相對平穩(wěn)[10–11]。
WELCH 算法進行功率譜轉換主要有參數及窗函數的確定、數據分段、部分重疊幾個步驟組成[12]。
如果用(ejω) 表示WELCH算法計算得到的信號x(n)功率譜估計,則有:
其中x(n)的長度為N,被分成了L段,每一段包含M個數據,ω(n)為窗函數,為歸一化因子,它的存在使得功率譜估計是漸進無偏估計。
Bagging 算法是一種經典的并行式集成學習方法,可以提高分類精度,推廣數據模式[13]。首先給定一個數據集,其中包含有m個樣本,從中有放回的隨機抽取一部分樣本作為訓練集,通過T 次隨機采樣操作后,產生了T個基學習器,將所有的基學習器按照某種集成策略相互結合,就構成了集成學習模型。具體步驟如下。
輸入:訓練集
D={(x1,y1),(x2,y2),…,(xm,ym)};基學習算法?;訓練輪數T。
過程:
1:fori=1 toTdo
2:ht=?(D,Dbs)
3:endfor
輸出:
滾動軸承的故障診斷主要有3 個步驟:原始信號預處理、故障特征提取和模式識別[14]。將已知的故障狀態(tài)的滾動軸承的原始振動信號先通過WELCH 算法進行預處理,然后從功率譜中提取相關特征參數,輸入到SVM 分類器中,進行滾動軸承的故障診斷。圖1為Bagging-SVM集成模型。
圖1 基于WELCH算法的Bagging-SVM集成模型
將所有基分類器的輸出結果進行整合時,通常采用以下兩種集成策略:
(1)多數投票法。假設基分類器有T個,多數投票法就是先將T個分類器輸出相同結果的個數統(tǒng)計起來,最終的輸出結果為基分類器相同個數最多的輸出結果。當個數相同時,則隨機選擇一個結果作為最終輸出結果。
(2)簡單平均法。假設基分類器有T個,簡單平均法就是先累加所有分類器的輸出結果,通過平均后再進行輸出,即:由于最終的輸出結果為對應的故障標簽均為整數,故在用簡單平均法進行集成后,再對結果采取了就近取整的原則。
本文實驗的軟件環(huán)境是Windows1064位操作系統(tǒng),硬件配置為Intel(R)Core(TM)i7-9750HCPU@2.60GHz, GPU 為 NVIDIAGeForceGTX16504 GGDDR5 獨立顯卡,內存為16G,使用的MATLAB軟件是R2018a版本。
數據集來自Case Western Reserve University 軸承數據中心。選取了電機轉速為1 730 r/min、1 750 r/min、1 772 r/min、1 797 r/min,采樣頻率為12 kHz下的驅動端滾動軸承數據,分成10 種故障類型,分別為正常狀態(tài)以及內圈、外圈和滾動體故障直徑分別為0.18 mm、0.36 mm、0.53 mm下的故障。每個樣本包含1 200個采樣點,其中每一種故障狀態(tài)都選取了100個樣本,總共1 000個樣本數據。每種故障類型選取80個樣本作為訓練集,共800個,剩余的作為測試集,共200個。表1為轉速為1 772 r/min下的實驗數據集。
表1 實驗數據集
圖2為電機轉速1 772 r/min下的滾動軸承部分故障類型振動波形圖,分別是正常狀態(tài)以及內圈、滾動體和外圈故障直徑在0.18 mm下的故障狀態(tài)。
圖2 不同故障類型的振動波形圖
將原始的滾動軸承的原始振動信號通過WELCH 算法進行預處理,選取采樣點數為1 200,FFT 點數為600,采用矩形窗,窗函數長度設置為100,重疊樣本數為25。圖3是經過WELCH 算法預處理后的功率譜。
圖3 WELCH法預處理后的功率譜
從功率譜中獲得峭度Xku、偏度Xsk、波形因子XS、峰值因子XC、脈沖因子XZ和裕度因子XL6 個參數,構成SVM的特征矢量,作為輸入。部分相關數據見表2。
表2 部分SVM特征向量數據
首先通過對單個SVM分類器進行實驗研究,采用RBF 核函數,利用C-V 交叉驗證法求得最優(yōu)的懲罰因子C=16,核函數參數γ=2。未進行預處理的故障診斷率為90.5 %,經過WELCH 預處理后的故障診斷率為96.5%。說明WELCH算法有利于故障特征的提取,SVM分類器對于軸承的故障診斷有一定的識別率,但仍有上升空間。本文則是在單個SVM分類器的基礎上,結合Bagging 算法,建立Bagging-SVM 集成模型,將原始數據與經WELCH 算法預處理過的數據進行對比實驗,并在最終的集成策略上分別采用多數投票法和簡單平均法進行對比實驗。
實驗一:設定分類器個數為20 個,從數據集中有放回的隨機抽取不同比例的樣本數量構成訓練子集進行實驗,每次實驗均重復進行10 次,取其平均值。診斷結果如圖4所示。兩種集成方式下的診斷率隨著樣本數量的增加而不斷上升;說明訓練樣本越多就越有利于診斷模型更好的將這些故障類型區(qū)分開來。
圖4 不同樣本數量下的診斷率
實驗二:從數據集中有放回的隨機抽取900 個訓練樣本構成訓練子集,設定不同數量的分類器進行實驗,每次實驗均重復進行10次,取其平均值。
診斷結果如圖5所示。當分類器個數為20 個時,兩種集成策略下的診斷率均達到最高,分別為98%和97%。在此之后,多數投票法下的診斷率趨于穩(wěn)定,而簡單平均法下的診斷率在97 %左右波動??梢?,當分類器超過一定數量時,診斷率便不再增加,甚至呈下降趨勢;這表明產生了分類效果較差的弱分類器,影響了集成模型的分類性能,降低了故障診斷率。
圖5 不同分類器個數下的診斷率
WELCH 算法預處理后的故障診斷率明顯高于原始數據的故障診斷率;并且多數投票法的集成策略也優(yōu)于簡單平均法。因此設定分類器個數為20個,訓練樣本數量為900個,采用多數投票法進行實驗,構造該數據下最優(yōu)的集成模型,每次實驗均重復進行10 次,取其平均值。將其與單一SVM 分類器的實驗結果相對比,實驗結果見表3。
表3 診斷模型性能比較
本文提出的集成模型是針對電機轉速為1 772 r/min下的滾動軸承的故障診斷,為驗證該模型是否在其他電機轉速下一樣具有良好的診斷性能,故設定以下實驗。將電機轉速為1 730 r/min,1 750 r/min,1 772 r/min 和1 797 r/min 下的軸承數據分別用該集成模型進行實驗,診斷結果如圖6所示。相關數據見表4。
在圖6中可以清楚地了解到本文提出的模型對于不同電機轉速下的故障診斷效果相對均衡,其結果并無明顯的波動,診斷率分別為99.5 %,98 %,98%和97%。這很好地證明了本文提出的模型同樣適用于不同工況下的軸承故障診斷。
圖6 不同電機轉速下的診斷結果
由表4可知,對于滾動體故障直徑在0.36 mm的情況下,平均診斷率較低,僅為88.75%,甚至在電機轉速為1 797 r/min下僅為75%。分析其原因,可能與滾動體本身的工作原理有關,導致所采集的振動數據不規(guī)則且具有隨機性,從而導致診斷率偏低。但是在大部分情況下,對于不同轉速下同種故障類型,該集成模型的故障診斷性能穩(wěn)定,平均診斷率為95%,97.5%,100%。
表4 4 種不同電機轉速下的診斷準確率/(%)
為驗證該集成模型在噪聲條件下的診斷性能,在電機轉速為1 772 r/min 的工況下,給每類故障的原始信號中分別加入信噪比(Signal-to-noise ratio,SNR)為-8 dB~8 dB的高斯白噪聲構成帶有噪聲的數據集。每組實驗均做10次,取平均值。實驗結果如表5所示。
表5 不同信噪比下的模型診斷結果
SNR的定義如下:
式中:Ps——原始信號能量大??;
Pn——噪聲信號能量大小。
由表5可知,本文提出的集成模型具有一定的抗噪性能,隨著SNR 值的減小,也就是說隨著噪聲干擾的增強,故障診斷準確率也在不斷下降,但下降幅度相對平緩。在SNR 達到-8 dB 的情況下也能達到80%以上的準確率。
(1)通過WELCH 功率譜算法預處理后的軸承數據,能夠很好地將各種故障類型區(qū)分開來,有利于提取故障特征,提高故障診斷率;相比于原始數據而言,兩者的診斷誤差最高能達到15%左右。
(2)單一的SVM分類器,其診斷率為96.5%;而采用集成學習Bagging算法構造的Bagging-SVM集成模型診斷率在同種電機轉速下能達到98%;在電機轉速為1 730 r/min 下甚至能達到99.5%;說明了集成模型能彌補單個分類器的不足,提高分類系統(tǒng)的分類能力。
(3)當分類器數量不斷增加時,故障的診斷率并不會一直上升,甚至可能出現下降的情況。由此可知,分類器個數并不是越多越好,對于分類器數量的確定以及適當的篩選一部分分類器進行集成,需要進一步的深入研究。并且集成策略的選擇很大程度上會直接影響到最終的診斷結果,對于本文的集成模型而言,多數投票法明顯優(yōu)于簡單平均法,兩者之間的診斷誤差最高能達到20%左右。
(4)本文是在電機轉速為1 772 r/min 下構造的集成模型,在變轉速故障診斷中,除了轉速為1 797 r/min 下滾動體故障0.36 mm 之外,其余故障類型均取得了很高的故障診斷率。
(5)本文提出的集成模型具有一定的抗噪性,在SNR為-8 dB的情況下也能達到80%以上的診斷準確率。