常新宇,李 琦
(1.沈陽(yáng)工業(yè)大學(xué)化工過(guò)程自動(dòng)化學(xué)院,遼寧 沈陽(yáng) 110023;2.東北大學(xué)機(jī)械工程與自動(dòng)化學(xué)院,遼寧 沈陽(yáng) 110819)
地鐵風(fēng)機(jī)是保障城市軌道交通安全運(yùn)行的重要設(shè)備,滾動(dòng)軸承是地鐵風(fēng)機(jī)裝備中的必要部件,在實(shí)際運(yùn)行過(guò)程中出現(xiàn)的故障率非常高。為了防止風(fēng)機(jī)因軸承故障而停機(jī),對(duì)滾動(dòng)軸承的故障進(jìn)行診斷至關(guān)重要[1]。近年來(lái),模式識(shí)別、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等先進(jìn)算法不斷被應(yīng)用到機(jī)械設(shè)備的故障診斷中,結(jié)合先進(jìn)算法建立準(zhǔn)確的地鐵風(fēng)機(jī)軸承故障診斷模型。
信號(hào)故障特征提取是故障診斷的關(guān)鍵步驟,其特征的可區(qū)分性直接影響診斷結(jié)果[2]。文獻(xiàn)[3]利用均方根值、標(biāo)準(zhǔn)差等時(shí)域指標(biāo)鑒定H-60A“黑鷹”直升機(jī)中行星齒輪箱故障。文獻(xiàn)[4]利用時(shí)域同步平均方法對(duì)獲取的振動(dòng)信號(hào)進(jìn)行預(yù)處理實(shí)現(xiàn)故障診斷。文獻(xiàn)[5]將采集到的振動(dòng)信號(hào)進(jìn)行積分達(dá)到風(fēng)機(jī)故障診斷的目的。文獻(xiàn)[6]通過(guò)對(duì)比地鐵風(fēng)機(jī)振動(dòng)信號(hào)的時(shí)域特征和頻域特征找到能夠區(qū)分故障類型的特征,實(shí)現(xiàn)故障診斷。
文獻(xiàn)[7]利用α分布估計(jì)法對(duì)振動(dòng)信號(hào)進(jìn)行特征提取,然后通過(guò)ELM進(jìn)行故障識(shí)別。文獻(xiàn)[8]提取小波包能量熵特征作為故障診斷指標(biāo),并通過(guò)相關(guān)向量機(jī)進(jìn)行識(shí)別。
上述方法雖然都實(shí)現(xiàn)了故障識(shí)別,但地鐵風(fēng)機(jī)軸承采集到的振動(dòng)信號(hào)通常存在強(qiáng)大背景噪聲,由于噪聲的存在導(dǎo)致許多特征在不同故障間的差異性不大,這將會(huì)影響分類結(jié)果。可利用拉普拉斯評(píng)分來(lái)選擇最重要特征,忽略那些差異性較小的特征,從而提高分類識(shí)別準(zhǔn)確率。
為診斷地鐵風(fēng)機(jī)軸承故障,提出基于特征篩選與支持向量機(jī)(Support Vector Machine,SVM)的診斷方法。首先,提取地鐵風(fēng)機(jī)滾動(dòng)軸承運(yùn)轉(zhuǎn)時(shí)振動(dòng)信息,按不同運(yùn)行狀態(tài)分別建立振動(dòng)信號(hào)的特征數(shù)據(jù)庫(kù);然后,利用拉普拉斯評(píng)分對(duì)不同故障狀態(tài)下與健康狀態(tài)下的特征進(jìn)行健康指標(biāo)敏感程度打分,對(duì)敏感程度較高的健康指標(biāo)賦予較小的權(quán)值,對(duì)敏感程度較低的健康指標(biāo)賦予較大的權(quán)值,綜合不同故障狀態(tài)下的健康指標(biāo)特征敏感程度評(píng)價(jià)結(jié)果,篩選出對(duì)于不同故障狀態(tài)均較為敏感的三個(gè)故障特征,通過(guò)篩選出的敏感特征處理軸承處于正常狀態(tài)和故障狀態(tài)下的振動(dòng)信號(hào),驗(yàn)證篩選出的敏感指標(biāo)的有效性;最后,運(yùn)用SVM對(duì)篩選出的敏感特征進(jìn)行故障識(shí)別獲得診斷結(jié)果。
假設(shè)采集到的振動(dòng)信號(hào)為:
式中:N—信號(hào)的采樣長(zhǎng)度。
依據(jù)時(shí)域信號(hào)構(gòu)造9個(gè)時(shí)域特征指標(biāo),如表1所示。
表1 時(shí)域特征指標(biāo)Tab.1 Time Domain Characteristic Indexes
通過(guò)頻譜分析,得到振動(dòng)信號(hào)的頻域信號(hào)S,其中:
依據(jù)頻域信號(hào)構(gòu)造12個(gè)頻域特征指標(biāo),如表2所示。
表2 頻域特征指標(biāo)Tab.2 Frequency Domain Characteristic Indexes
為了全面反映故障狀態(tài)信息,同樣提取12個(gè)基于包絡(luò)的特征指標(biāo),對(duì)采集到的軸承故障信號(hào)進(jìn)行希爾伯特變換,希爾伯特變換相當(dāng)于將一個(gè)信號(hào)X與1/πt做卷積,得到解析信號(hào):
式中:P—柯西主分量。
則,瞬時(shí)頻率ω(t)定義為:
基于時(shí)域、頻域和包絡(luò)方式提取的特征是高維的,其中一些特征與軸承故障有關(guān),另一些特征則可能是多余的。為了獲得更高的分類準(zhǔn)確率,避免維數(shù)災(zāi)難,需要選取故障信息最多的特征,使用拉普拉斯評(píng)分(LS)來(lái)選擇最重要的特征。給定m個(gè)數(shù)據(jù)樣本,假設(shè)每個(gè)樣本有n個(gè)特征。Lr定義特征中第r個(gè)元素(r=1,2,…,n)的拉普拉斯分值,fri定義第r個(gè)特征的第i個(gè)樣本(i=1,2,…,m),LS算法的計(jì)算步驟為:
(1)構(gòu)造一個(gè)有m個(gè)節(jié)點(diǎn)的最近鄰圖G。第i個(gè)節(jié)點(diǎn)對(duì)應(yīng)第i個(gè)數(shù)據(jù)點(diǎn)xi,在節(jié)點(diǎn)i和節(jié)點(diǎn)j之間畫一條線段,如果xi和xj是“近鄰”,xi被認(rèn)為是xj的K個(gè)最近鄰之一,或者xj也是xi的K個(gè)最近鄰之一,通常將K的值設(shè)為5。
(2)定義權(quán)重矩陣Sij為:
式中:t—一個(gè)常數(shù)。
(3)對(duì)于第r個(gè)特征定義為:
式中:I—維數(shù)為m的單位向量;L—鄰接圖G的拉普拉斯矩陣。
為避免鄰圖在某些維度上受數(shù)據(jù)較大變化的影響,對(duì)特征進(jìn)行平均處理。
(4)第r個(gè)特征的拉普拉斯分值可以計(jì)算為:
式中:Var(fr)—第r個(gè)特征值的估計(jì)方差。
選擇幾個(gè)得分較低的特征來(lái)重建一個(gè)新的特征空間,因?yàn)橐粋€(gè)特征的得分與它的可識(shí)別性成反比,利用最小二乘法將高維特征空間轉(zhuǎn)化為低維特征空間。
與常用算法相比,SVM通常能夠獲得較好分類性能[9]。SVM在有限的樣本下可以實(shí)現(xiàn)準(zhǔn)確的狀態(tài)識(shí)別,被廣泛應(yīng)用于故障診斷領(lǐng)域,SVM的基本模型為:
通過(guò)拉格朗日轉(zhuǎn)化為下式:
求解上述函數(shù),得到?jīng)Q策函數(shù)f(x):
使用文獻(xiàn)[10]中的凱斯西儲(chǔ)大學(xué)(Case Western Reserve University,CWRU)的軸承數(shù)據(jù)信息進(jìn)行比對(duì),來(lái)驗(yàn)證所提出的故障診斷方法的性能。CWRU 數(shù)據(jù)包括四種健康狀態(tài)數(shù)據(jù),即正常(N)、外圈(ORF)、內(nèi)圈(IRF)和滾輪(RF),采樣頻率為12000Hz,電機(jī)轉(zhuǎn)速為1750轉(zhuǎn)/分,采樣點(diǎn)個(gè)數(shù)總計(jì)為2400個(gè),每種運(yùn)行狀態(tài)設(shè)置50個(gè)樣本。
軸承故障信號(hào)信息見文獻(xiàn)[10]。利用9個(gè)時(shí)域信號(hào)、12個(gè)頻域信號(hào)和12個(gè)包絡(luò)信號(hào)的監(jiān)測(cè)指標(biāo)處理加速度信號(hào),得到軸承在內(nèi)圈故障、外圈故障和滾動(dòng)體故障下的50組監(jiān)測(cè)數(shù)據(jù)對(duì)應(yīng)的33個(gè)健康指標(biāo)。
通過(guò)與軸承在正常狀態(tài)下的50組監(jiān)測(cè)數(shù)據(jù)對(duì)應(yīng)的33個(gè)健康指標(biāo)合并,經(jīng)拉普拉斯評(píng)分處理,得到軸承不同故障下特征評(píng)價(jià)結(jié)果,如圖1所示。
圖1 軸承不同故障下特征評(píng)價(jià)結(jié)果Fig.1 Evaluation Results of Characteristics Under Different Faults
對(duì)33個(gè)健康指標(biāo)按軸承不同故障下特征評(píng)分排序結(jié)果,如圖2所示。
圖2 軸承不同故障下特征評(píng)分排序Fig.2 Sort of Characteristics Scores Under Different Faults
選取三種故障狀態(tài)中評(píng)分排名前三的特征指標(biāo),構(gòu)建特征集,得到的軸承不同故障下排名前三的特征集,如表3所示。
表3 軸承不同故障下排名前三的特征集Tab.3 Top Three Characteristics of Bearing Under Different Faults
選取表3中風(fēng)險(xiǎn)評(píng)分最高的三個(gè)特征點(diǎn)及評(píng)分最低的三個(gè)特征點(diǎn)輸入SVM分類器進(jìn)行故障識(shí)別。
通過(guò)敏感特征篩選,利用頻域信號(hào)F8指標(biāo)、頻域信號(hào)F9指標(biāo)、頻域信號(hào)F11指標(biāo)、頻域信號(hào)F12指標(biāo)、包絡(luò)信號(hào)F11指標(biāo)和包絡(luò)信號(hào)F12指標(biāo)構(gòu)造特征向量集。針對(duì)每種運(yùn)行狀態(tài)各采集50組不同的數(shù)據(jù),并將這些數(shù)據(jù)按組進(jìn)行隨機(jī)劃分,隨機(jī)選擇30組數(shù)據(jù)作為訓(xùn)練樣本,剩余的20組數(shù)據(jù)作為測(cè)試樣本。
訓(xùn)練樣本被用于訓(xùn)練SVM并使其獲得最優(yōu)的分類參數(shù),然后通過(guò)測(cè)試樣本驗(yàn)證分類模型的性能。兩種方法預(yù)測(cè)分類,如圖3所示。由圖3可知,所提出的方法在測(cè)試樣本中的正確識(shí)別樣本個(gè)數(shù)為80個(gè),其診斷準(zhǔn)確率為100%。而沒(méi)有進(jìn)行敏感特征篩選時(shí)的正確識(shí)別樣本個(gè)數(shù)為76個(gè),其診斷準(zhǔn)確率僅為95%。說(shuō)明所提出的方法可以提高軸承故障診斷方法的診斷性能。
圖3 兩種方法預(yù)測(cè)分類Fig.3 Predictive Classification Charts of the Two Methods
為了更好地說(shuō)明所提出方法的優(yōu)越性,對(duì)兩個(gè)故障診斷方法在不同訓(xùn)練樣本數(shù)量下的診斷性能進(jìn)行了分析,不同訓(xùn)練樣本下的分類性能,如圖4所示。
圖4 不同訓(xùn)練樣本下的分類性能Fig.4 Classification Performance Under Different Training Samples
由圖4可以看出,所提出的方法在5個(gè)訓(xùn)練樣本情況下,診斷準(zhǔn)確率達(dá)到了96.25%。相比之下,沒(méi)有進(jìn)行特征篩選時(shí)的準(zhǔn)確率為76.25%。當(dāng)訓(xùn)練樣本為20個(gè)的情況下,提出的方法的故障診斷準(zhǔn)確率就達(dá)到了100%,而沒(méi)有特征篩選方法的診斷準(zhǔn)確率為92.5%。因此,可以說(shuō)明所提出的方法對(duì)識(shí)別軸承故障具有較強(qiáng)的穩(wěn)定性。
針對(duì)地鐵風(fēng)機(jī)軸承的故障診斷問(wèn)題,提出了一種基于特征篩選與SVM的故障診斷方法。首先在實(shí)驗(yàn)數(shù)據(jù)中依次提取9個(gè)時(shí)域、12個(gè)頻域和12個(gè)包絡(luò)特征指標(biāo),然后采用拉普拉斯特征評(píng)分法獲得軸承在不同故障模式下各指標(biāo)的評(píng)價(jià)分值,經(jīng)過(guò)對(duì)故障特征指標(biāo)進(jìn)行篩選,得到各故障模式下評(píng)分最高的前三個(gè)指標(biāo)構(gòu)成特征向量集,采用SVM對(duì)特征向量集進(jìn)行分類,得到故障診斷結(jié)果。通過(guò)分析多組不同數(shù)量訓(xùn)練樣本下兩種方法的實(shí)驗(yàn)結(jié)果,驗(yàn)證了基于特征篩選與SVM的故障診斷方法的診斷性能,明顯優(yōu)于沒(méi)有進(jìn)行敏感特征篩選的故障診斷方法。