張利宏,羅振鵬
(內(nèi)蒙古工業(yè)大學(xué) 電力學(xué)院, 呼和浩特 010010)
電機(jī)的滾動軸承是連接電機(jī)與后續(xù)執(zhí)行機(jī)構(gòu)的關(guān)鍵部件,軸承發(fā)生故障時會極大地影響整套系統(tǒng)的工作性能,嚴(yán)重時造成巨大的經(jīng)濟(jì)損失和人員傷亡。但是軸承故障的產(chǎn)生不是突發(fā)性的,故障前期對系統(tǒng)性能影響較小,難以人為判斷,但是不同故障的振動信號與正常情況呈現(xiàn)一定的差異性[1],基于振動信號差異性對軸承故障情況進(jìn)行在線診斷,可以對軸承進(jìn)行及時更換和針對性修復(fù),對提高設(shè)備性能、保證設(shè)備和人員安全具有重要意義。
電機(jī)軸承故障診斷可以從特征提取和智能診斷算法2個角度進(jìn)行分類。從特征提取的角度講,故障信號的載體形式包括振動信號、聲學(xué)信號、溫度信號與油液檢測等[2]。其中溫度信號難以分辨軸承早期故障,油液檢測操作復(fù)雜且無法實時監(jiān)測軸承狀態(tài),因此這2種方法應(yīng)用較少,而振動信號和聲學(xué)信號因操作簡單、采集方便、可實時監(jiān)測等優(yōu)點得到了廣泛應(yīng)用。Zhou等[3]基于集合經(jīng)驗?zāi)B(tài)分解將振動信號分解為若干個固有模態(tài),而后計算各分量模態(tài)的加權(quán)置換熵作為特征向量,最后使用支持向量機(jī)實現(xiàn)了故障模式識別。孫蕭等[4]使用CEEMD將軸承故障聲信號進(jìn)行分解后,依據(jù)相關(guān)系數(shù)法和峰值因子選擇包含故障信息豐富的分量,并使用Hilbert法解析出故障頻率。從智能診斷算法的角度講,可以分為基于模型的診斷方法和基于數(shù)據(jù)的診斷方法2種?;谀P偷姆椒ㄊ侵竿ㄟ^系統(tǒng)的功能和結(jié)構(gòu)預(yù)測系統(tǒng)的輸出,將預(yù)測值與觀測值進(jìn)行比較得到故障狀態(tài)。Hailun等[5]建立了基于低精度傳感器的非線性故障診斷模型,并使用卡爾曼濾波對模型參數(shù)進(jìn)行估計,有效提高了故障診斷精度。基于數(shù)據(jù)的診斷方法是指通過機(jī)器學(xué)習(xí)和統(tǒng)計分析進(jìn)行故障診斷,此方法不依賴任何模型,具有更強(qiáng)的通用性。李益兵等[6]針對卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練次數(shù)過多的問題,提出了混合蛙跳算法對網(wǎng)絡(luò)參數(shù)優(yōu)化的方法,經(jīng)驗證明此方法可以有效減少訓(xùn)練次數(shù)并提高診斷準(zhǔn)確率。
本文中研究了電機(jī)軸承故障診斷方法,在故障特征提取方面,結(jié)合LCD分解與散布熵計算方法,提取了故障信號的自適應(yīng)多尺度散布熵作為特征向量。在模式識別方面,使用會議制隨機(jī)森林算法對故障模式進(jìn)行判斷,有效提高了電機(jī)軸承故障的診斷準(zhǔn)確率。
當(dāng)前的電機(jī)軸承多數(shù)為滾動軸承,由外圈、滾動體、內(nèi)圈和保持架組成,其結(jié)構(gòu)如圖1所示,圖中d為滾動體直徑,D為滾動體中心軸直徑,α為接觸角。
滾動軸承早期故障通常發(fā)生在局部位置,且為局部點蝕形式。發(fā)生局部點蝕損失的旋轉(zhuǎn)部件與其余部件每接觸一次則產(chǎn)生一次沖擊力,反映在振動信號上則為周期性的沖擊變化。由文獻(xiàn)[7]可知,滾動軸承的內(nèi)圈故障特征頻率fin為:
(1)
式中:Z為滾動體數(shù)量;fm為電機(jī)轉(zhuǎn)動頻率。
外圈故障特征頻率fou為:
(2)
滾動體故障特征頻率fba為:
(3)
由式(1)~(3)可知,軸承不同部位發(fā)生故障時其特征頻率是不同的,即信號的規(guī)律性是不同的。一般來說,特征頻率越大,信號的規(guī)律性越強(qiáng),特征頻率越小,信號的規(guī)律性越弱,熵能夠反映信號的規(guī)律性,因此可以使用故障信號的熵值作為特征量對故障模式進(jìn)行識別。
局部特征尺度分解(local characteristic-scale decomposition,LCD)可以實現(xiàn)信號的多尺度自適應(yīng)分解,其基本原理為:使用3個相鄰極值點(1個極小值與2個相鄰極大值或1個極大值與2個相鄰極小值)構(gòu)造局部極值點,基于局部均值點進(jìn)行擬合得到均值曲線,將均值曲線從原始信號中篩除,重復(fù)以上過程,直至將信號分解為多個不同尺度的內(nèi)稟尺度分量(intrinsic scale components,ISC)與1個余量之和[8],即:
(4)
式中:x(t)為原始信號;r為內(nèi)稟尺度分量的個數(shù);ui(t)為第i個內(nèi)稟尺度分量;s(t)為余量。
由以上局部特征尺度分解過程可以看出,此方法以原始信號極值點為依據(jù)進(jìn)行分解,可以實現(xiàn)信號的頻率自適應(yīng)分解,具有普遍適用性。提取各內(nèi)稟尺度分量的散布熵作為特征向量,第i個信號分量假設(shè)為ui(t)={ui(t),t=1,2,…,N},其散布熵的計算分為以下4個步驟[9]。
步驟1信號映射。使用2次映射將信號映射為整數(shù)序列zi(t)={zi(t),t=1,2,…,N},且zi(t)∈[1,2,…,c]。映射函數(shù)為:
(5)
式中:yi∈(0,1)為中間映射量;σ為正態(tài)分布標(biāo)準(zhǔn)差;μ為正態(tài)分布均值;k為積分變量;c為設(shè)置的取值上限;R為四舍五入函數(shù)。
步驟2抽取嵌入信號。記延遲時間為d,從zi(t)={zi(t)}中以d為固定延遲抽取m維嵌入信號,得:
(6)
步驟3計算各散布模式概率p(πv0v1…vm-1),得:
(7)
式中:p(πv0v1…vm-1)為散布模式概率;N-(m-1)d為抽取的嵌入模式數(shù)量。
步驟4計算第i個內(nèi)稟尺度分量ui(t)的散布熵,為:
(8)
式中:cm為散布模式的所有種類數(shù)量。
根據(jù)1.2節(jié)對局部特征尺度分解和散布熵的原理介紹與分析,得到自適應(yīng)多尺度散布熵的提取步驟。
步驟1將原始信號分解為多個內(nèi)稟尺度分量與余量和的形式。
步驟2計算各內(nèi)稟尺度分量的散布熵,得到各ISC分量對應(yīng)的特征參數(shù)。
步驟3將各ISC分量的散布熵進(jìn)行組合,得到不同故障模式下的特征向量。
在隨機(jī)森林中,每個決策樹都是一個分類器,隨機(jī)森林算法以一種“全民投票”的方式取代了傳統(tǒng)“獨裁”的決策方式,因此具有更高的分類精度。
隨機(jī)森林算法主要包括構(gòu)建決策樹、集成學(xué)習(xí)、投票決策3個重要內(nèi)容[10]。
1) 決策樹。決策樹是隨機(jī)森林的基本分類器,其以遞歸的方式依據(jù)特征評估準(zhǔn)則從根節(jié)點依次向下生成子節(jié)點,特征評估準(zhǔn)則包括ID3算法、CART算法、C4.5算法等,其中CART算法對離散數(shù)據(jù)和連續(xù)數(shù)據(jù)均適用,且對孤立點和空缺點不敏感,因此,本文中選用CART算法作為特征評估準(zhǔn)則。
2) 集成學(xué)習(xí)。集成學(xué)習(xí)是對決策樹訓(xùn)練樣本的抽取方法進(jìn)行限定,集成學(xué)習(xí)抽樣方法主要包括Bagging和Boosting兩種方法,其中Bagging是有放回的樣本數(shù)據(jù)隨機(jī)抽取方法,抽樣過程具有完全的獨立性,可以有效減小決策樹間的相關(guān)性和泛化誤差,因此選擇Bagging抽樣法。
3) 投票決策。投票決策是決策樹集中決斷的合作方式,對于給定的樣本x,決策樹l的分類記為fl(x)=i,i=1,2,…,c,l=1,2,…,L為決策樹編號。得票數(shù)最多的類別為隨機(jī)森林的輸出結(jié)果,即:
fRF(x)=argmax{I(fl(x)=i)}
(9)
式中:fRF(x)為隨機(jī)森林的決策結(jié)果;I(fl(x)=i)表示輸出類別為i的決策樹數(shù)量。
傳統(tǒng)的隨機(jī)森林算法中,每個決策樹具有相同的發(fā)言權(quán),這種投票方式雖然充分發(fā)揮了民主作用,但是沒有考慮不同決策樹的差異性。類似于在一個由專家和普通群眾組成的會議中,專家的決策應(yīng)當(dāng)具有更大可信度,群眾的決策可信度相對較小?;谝陨峡紤],提出對不同決策樹加權(quán)的會議制隨機(jī)森林算法。創(chuàng)新點包括決策樹舍棄和決策樹加權(quán)2個方面。
1) 決策樹舍棄。決策樹舍棄的思路為:將訓(xùn)練樣本劃分為訓(xùn)練組和預(yù)測試組2類,使用訓(xùn)練組對決策樹進(jìn)行訓(xùn)練,而后使用預(yù)測試組對決策樹的分類精度進(jìn)行預(yù)測試。眾所周知,會議中的個體決策精度高則會議的決策精度才能更高。因此按照預(yù)測試的分類精度對決策樹進(jìn)行排序,舍棄正確率靠后的20%決策樹,保留正確率靠前的80%決策樹。決策樹l的分類準(zhǔn)確率為:
(10)
式中:Rl為決策樹l的分類準(zhǔn)確率;Cl為決策樹l分類正確的樣本數(shù);C為參與預(yù)測試的樣本數(shù)量。
2) 決策樹加權(quán)。決策樹的預(yù)測試準(zhǔn)確性能夠準(zhǔn)確反映決策樹的專家屬性,預(yù)測試準(zhǔn)確性高的決策樹趨于專家類別,應(yīng)賦予較大權(quán)重;預(yù)測試準(zhǔn)確性低的決策樹趨于群眾類別,應(yīng)賦予較小權(quán)重。按照以上思路,依據(jù)決策樹的預(yù)測試準(zhǔn)確性賦予決策樹相應(yīng)的權(quán)重,為:
(11)
式中:wl為決策樹l會議決策的權(quán)重。
基于加權(quán)決策樹的會議制隨機(jī)森林算法,決策結(jié)果為:
(12)
式中:fRRF(x)為會議制隨機(jī)森林算法的決策結(jié)果;Bl(i)為決策樹l的標(biāo)識函數(shù),當(dāng)決策樹l的識別種類為i時有Bl(i)=1,否則Bl(i)=0。式(12)表示輸出加權(quán)和最大的類別。
根據(jù)創(chuàng)新點原理,制定會議制隨機(jī)森林算法流程為:
步驟1初始化算法參數(shù),包括森林規(guī)模L、訓(xùn)練樣本的訓(xùn)練組規(guī)模、訓(xùn)練樣本的預(yù)測試組規(guī)模。
步驟2從總訓(xùn)練樣本中抽取L個訓(xùn)練集,將每組訓(xùn)練集分為訓(xùn)練組和預(yù)測試組2類。
步驟3使用訓(xùn)練樣本集中的訓(xùn)練組對L個決策樹進(jìn)行訓(xùn)練,完畢后使用預(yù)測試組測試決策樹的分類精度,對決策樹的測試精度進(jìn)行排序,舍棄準(zhǔn)確度靠后的20%決策樹。
步驟4依據(jù)預(yù)測試的準(zhǔn)確率為決策樹施加會議權(quán)重,得到會議制隨機(jī)森林。
步驟5將測試樣本輸入到分類器中,加權(quán)和最大的類別為最終輸出類別。
從不同故障類型的識別、同一類型不同故障程度2個方面對提出的故障診斷方法進(jìn)行驗證。實驗數(shù)據(jù)來源于美國凱斯西儲大學(xué)的軸承實驗數(shù)據(jù),所選軸承為SKF6205型軸承,實驗數(shù)據(jù)的采樣頻為48 kHz,電機(jī)轉(zhuǎn)速為1 772 r/min。軸承的不同故障類型包括正常狀態(tài)、內(nèi)圈故障、滾動體故障、外圈故障,每種故障狀態(tài)下均選擇損失直徑為0.18 mm的振動信號。
對于同一故障類型不同故障程度的實驗驗證,選擇內(nèi)圈故障實驗數(shù)據(jù),故障程度分為正常、輕度損傷(損傷直徑0.18 mm)、中度損傷(損傷直徑0.36 mm)、重度損傷(損傷直徑0.54 mm)等4類。
隨機(jī)選擇每種故障狀態(tài)下的150組數(shù)據(jù)進(jìn)行實驗驗證,其中50組為訓(xùn)練樣本的訓(xùn)練組,30組為訓(xùn)練樣本的預(yù)測試組,70組作為測試樣本。以其中一組數(shù)據(jù)的分析過程為例,不同故障狀態(tài)下的振動信號如圖2所示。
圖2 不同故障狀態(tài)下振動信號曲線
使用LCD對不同故障狀態(tài)下的振動信號進(jìn)行分解,得到各振動信號的ISC分量,其中內(nèi)圈故障信號的ISC分量最少,為7個。以內(nèi)圈故障的分解為例,分解結(jié)果如圖3所示。
圖3 LCD分解結(jié)果曲線
嵌入維度設(shè)置為m=2,參數(shù)轉(zhuǎn)換取值上限c=6,延遲時間d=1,得到不同故障的自適應(yīng)多尺度散布熵如圖4所示。
由圖4可以明確看出,不同故障振動信號的前4個ISC分量散布熵區(qū)分度較好,第5個到第7個ISC分量散布熵的區(qū)分度較差,出現(xiàn)了較為嚴(yán)重的重疊。為了對以上分析進(jìn)行驗證,得到不同ISC分量散布熵個數(shù)作為特征向量的識別精度變化曲線,如圖5所示。圖5中使用的故障診斷算法為會議制隨機(jī)森林算法。
圖4 不同故障的自適應(yīng)多尺度散布熵曲線
圖5 不同數(shù)量的特征參數(shù)識別曲線
由圖5可以看出,不同故障類型的診斷準(zhǔn)確率在散布熵數(shù)量為4時取為最大值。當(dāng)散布熵數(shù)量小于4時,準(zhǔn)確率隨散布熵數(shù)量的增加而增大;當(dāng)散布熵數(shù)量大于4時,準(zhǔn)確率隨散布熵數(shù)量的增加而減小。結(jié)合圖4,這是因為第5、6、7個ISC分量散布熵的重疊較大,無法對不同故障類型進(jìn)行區(qū)分。因此將前4個ISC分量的散布熵作為特征向量。
同時使用傳統(tǒng)隨機(jī)森林算法和會議制隨機(jī)森林算法對實驗軸承的故障模式進(jìn)行識別,統(tǒng)計2種算法的故障識別準(zhǔn)確率,如表1所示。
表1 2種算法的識別準(zhǔn)確率 %
由表1中數(shù)據(jù)可知,傳統(tǒng)隨機(jī)森林算法對4種軸承故障的識別準(zhǔn)確率均在90%以上,故障識別準(zhǔn)確率均值為93.07%。會議制隨機(jī)森林算法對4種軸承故障的識別準(zhǔn)確率均在99%以上,識別準(zhǔn)確率均值為99.75%,比傳統(tǒng)隨機(jī)森林算法的準(zhǔn)確率均值提高了7.18%。這是因為會議制隨機(jī)森林算法按照決策樹的識別準(zhǔn)確率對其決策進(jìn)行加權(quán),使專家型決策樹具有更大話語權(quán),從而提高整個隨機(jī)森林的識別準(zhǔn)確率。
隨機(jī)選擇每種故障程度的150組數(shù)據(jù)進(jìn)行實驗驗證,其中50組為訓(xùn)練樣本的訓(xùn)練組,30組為訓(xùn)練樣本的預(yù)測試組,70組作為測試樣本。按照3.1節(jié)的實驗設(shè)置,以一組數(shù)據(jù)為例進(jìn)行分析,軸承內(nèi)圈正常狀態(tài)、輕微故障、中度故障和重度故障的振動信號如圖6所示。
圖6 內(nèi)圈不同故障程度的振動信號曲線
按照3.2節(jié)確定ISC分量散布熵數(shù)量的方法,最終確定使用各振動信號前3個ISC分量的散布熵作為特征向量。4種軸承故障狀態(tài)的特征向量在三維空間分布如圖7所示。
圖7 不同故障程度的特征向量分布圖
由圖7可以看出,不同故障程度的特征向量無重疊,且同一故障程度的特征向量聚集度較好,即類與類之間區(qū)分明顯,類內(nèi)特征參數(shù)聚集性好,參數(shù)的這種分布特性說明特征參數(shù)能夠很好地表征故障類型。
按照以上特征參數(shù)的設(shè)置方法,同時使用傳統(tǒng)隨機(jī)森林算法、會議制隨機(jī)森林算法進(jìn)行故障模式識別,并與文獻(xiàn)[11]的馬爾可夫診斷模型進(jìn)行對比,結(jié)果如表2所示。
表2 不同識別方法的準(zhǔn)確率 %
由表2中數(shù)據(jù)可知,在不同程度的內(nèi)圈故障識別中,會議制隨機(jī)森林算法的故障識別準(zhǔn)確率達(dá)到了100%,傳統(tǒng)隨機(jī)森林算法的識別準(zhǔn)確率次之,為93.82%,文獻(xiàn)[11]使用的主成分分析與馬爾可夫模型結(jié)合法的識別準(zhǔn)確率均值為92.14%。與傳統(tǒng)隨機(jī)森林算法相比,會議制隨機(jī)森林算法的識別準(zhǔn)確率較高,是因為會議制隨機(jī)森林算法中對決策樹的話語權(quán)進(jìn)行了針對性加權(quán),充分發(fā)揮了專家型決策樹的作用。本文的故障識別方法準(zhǔn)確率高于文獻(xiàn)[11]的識別方法,這是因為在文獻(xiàn)[11]中使用了時域、頻域等混合域的特征參數(shù),對軸承故障的振動信號特征沒有進(jìn)行針對性提取,且馬爾可夫診斷模型是傳統(tǒng)“獨裁”式的決策方式,與隨機(jī)森林發(fā)揮“民主”的決策方式比,會議制隨機(jī)森林的決策方式準(zhǔn)確率必然相對更高?;谝陨蠈嶒灁?shù)據(jù)與分析可知,本文提出的會議制隨機(jī)森林診斷方法可以有效提高電機(jī)軸承的診斷準(zhǔn)確率。
1) 與傳統(tǒng)隨機(jī)森林算法比,會議制隨機(jī)森林算法中決策樹依據(jù)其準(zhǔn)確度賦予不同權(quán)值,有效提高了算法的識別準(zhǔn)確率。
2) 在軸承不同故障模式與不同故障程度的識別中,會議制隨機(jī)森林算法的識別準(zhǔn)確率均高于傳統(tǒng)隨機(jī)森林算法。