潘曉博,葛鯤鵬,錢(qián)孟浩,趙 衍,董 飛
(1.徐州工程學(xué)院 大數(shù)據(jù)學(xué)院,江蘇 徐州 221008;2.揚(yáng)州市職業(yè)大學(xué) 電子工程學(xué)院,江蘇 揚(yáng)州 225127;3.安徽大學(xué) 互聯(lián)網(wǎng)學(xué)院,安徽 合肥 230039)
作為旋轉(zhuǎn)機(jī)械設(shè)備的關(guān)鍵零部件之一,滾動(dòng)軸承的可靠性和穩(wěn)定性直接影響機(jī)械設(shè)備的安全、穩(wěn)定運(yùn)行[1,2]。由于滾動(dòng)軸承通常在非平穩(wěn)和復(fù)雜的工作條件下運(yùn)行,導(dǎo)致其易磨損并產(chǎn)生缺陷,因此,研究滾動(dòng)軸承的故障診斷具有重要意義。
目前,許多學(xué)者基于軸承振動(dòng)信號(hào)開(kāi)展了故障狀態(tài)分析和診斷,其方法主要包括信號(hào)時(shí)頻分析方法、機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)等,并在此基礎(chǔ)上,構(gòu)建了軸承智能故障診斷系統(tǒng)。
例如,祝永濤等人[4]采用改進(jìn)閾值小波分析方法,進(jìn)行了提升機(jī)軸承故障特征提取和降噪,并結(jié)合稀疏自編碼器,完成了智能故障診斷模型訓(xùn)練,發(fā)現(xiàn)了采用該方法能夠取得較高的故障診斷準(zhǔn)確率;但該研究未考慮設(shè)備變工況帶來(lái)的數(shù)據(jù)分布差異對(duì)故障診斷準(zhǔn)確率的影響。馬輝等人[5]采用基于滑動(dòng)窗口重疊采樣數(shù)據(jù)的增加方法,對(duì)軸承振動(dòng)信號(hào)進(jìn)行了處理,擴(kuò)充了其數(shù)據(jù)集規(guī)模,并利用降噪自編碼器處理振動(dòng)信號(hào),結(jié)合深度神經(jīng)網(wǎng)絡(luò)雙層分類器,完成了提升機(jī)軸承故障診斷工作,發(fā)現(xiàn)了該方法在進(jìn)行含噪軸承故障診斷方面的有效性與優(yōu)勢(shì);但該模型存在基于深度學(xué)習(xí)模型的共性問(wèn)題,即超參數(shù)、高耗時(shí)和解釋性不足。廖玉波等人[6]采用最大重疊離散小波包變換,對(duì)原始軸承振動(dòng)信號(hào)進(jìn)行了分解,并提取了時(shí)域和頻域統(tǒng)計(jì)特征,再選取特征并將其用于深度置信網(wǎng)絡(luò)的訓(xùn)練,最后采用預(yù)訓(xùn)練-微調(diào)的方法,獲得了適用于目標(biāo)域特征數(shù)據(jù)的故障診斷模型,完成了不同工況下的軸承故障診斷工作;但該方法未考慮模型在缺乏足量故障數(shù)據(jù)樣本下的故障診斷性能。HE Z等人[7]提出了一種新型的齒輪箱智能故障診斷方法,采用深度自動(dòng)編碼器和多小波相結(jié)合的方式,以此來(lái)挖掘故障診斷的重要特征,發(fā)現(xiàn)了基于重要特征訓(xùn)練的故障診斷分類器在變工況下故障診斷準(zhǔn)確率較高;但該方法仍存在超參數(shù)和高計(jì)算復(fù)雜度的問(wèn)題。HU Q等人[8]提出了一種基于多尺度樣本熵和平衡適應(yīng)調(diào)整的軸承故障診斷方法,發(fā)現(xiàn)了該方法在減小不同工況下軸承故障數(shù)據(jù)分布差異上的有效性;但該方法仍未充分考慮帶標(biāo)簽故障樣本不足的問(wèn)題,且故障診斷性能不夠理想。
雖然,許多學(xué)者在基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的智能故障診斷方面進(jìn)行了研究,并取得了許多成果,但該方法在應(yīng)用過(guò)程中仍面臨一些挑戰(zhàn)[9]:1)變工況下的機(jī)械設(shè)備難以獲取足量故障樣本;2)變工況導(dǎo)致同一種故障下的信號(hào)存在分布差異,直接影響基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的模型診斷效果和泛化性能;3)深度學(xué)習(xí)模型存在超參數(shù)、高能耗和可解釋性不足的問(wèn)題[10,11]。
上述挑戰(zhàn)阻礙了智能故障診斷方法在實(shí)際工業(yè)場(chǎng)景下的應(yīng)用。
為此,筆者在基于特征的遷移學(xué)習(xí)方法基礎(chǔ)上,研究信號(hào)時(shí)頻分析方法、可遷移特征選取方法、域適應(yīng)和故障模式識(shí)別方法,提出一種新的基于改進(jìn)聯(lián)合分布適應(yīng)的軸承智能故障診斷方法(BIFD-IJDA)。
筆者提出一種新的軸承智能故障診斷方法BIFD-IJDA,該方法的流程共分為4步,其流程圖如圖1所示。
圖1 BIFD-IJDA方法的流程
BIFD-IJDA方法的具體流程如下:
1)基于小波包變換的信號(hào)處理與特征提取。采用小波包變換對(duì)原始軸承振動(dòng)信號(hào)進(jìn)行處理,再結(jié)合統(tǒng)計(jì)參數(shù),提取時(shí)域和頻域統(tǒng)計(jì)特征,構(gòu)建原始特征集;
2)利用基于特征重要度與KL散度的遷移特征選取方法(transferable feature selection based on feature importance and KL divergence, TFFK),減少高維原始特征集中的干擾和冗余特征,選取有利于故障模式識(shí)別且域間分布差異小的特征,用于后續(xù)處理。首先,利用隨機(jī)森林算法處理特征數(shù)據(jù),獲得表征特征判別能力的特征重要度(feature importance, FI);然后,再計(jì)算各特征在不同域下的KL散度(KL divergence,KLD),以表征特征在不同域下的分布差異;最后,基于FI和KLD,構(gòu)建表征特征可遷移性的指標(biāo),即特征重要度與KL散度比(ratio of FI and KLD,RFK)。該步驟的執(zhí)行分為兩部分:首先,基于源域特征數(shù)據(jù)和目標(biāo)域正常狀態(tài)下的特征數(shù)據(jù),計(jì)算FI與KLD,獲得RFK;然后,直接采用所得到的RFK對(duì)需進(jìn)行故障診斷的目標(biāo)域特征數(shù)據(jù)進(jìn)行特征選取,無(wú)需進(jìn)行重復(fù)的隨機(jī)森林算法處理;
3)基于改進(jìn)聯(lián)合分布適應(yīng)的特征遷移學(xué)習(xí)。在TFFK之后,在源域和目標(biāo)域特征集中選取RFK值大的特征,構(gòu)建特征子集,再利用該改進(jìn)聯(lián)合分布適應(yīng),將源域和目標(biāo)域特征子集進(jìn)行分布適應(yīng),以減小分布差異;
4)故障模式識(shí)別分類器訓(xùn)練與測(cè)試。在對(duì)源域和目標(biāo)域樣本進(jìn)行分布適應(yīng)后,將有標(biāo)簽源域特征集用于訓(xùn)練智能故障診斷分類器,再將無(wú)標(biāo)簽?zāi)繕?biāo)域樣本輸入已訓(xùn)練好的分類器,獲得目標(biāo)域的故障診斷結(jié)果。
為從軸承原始振動(dòng)信號(hào)中提取故障特征,筆者采用小波包變換對(duì)振動(dòng)信號(hào)進(jìn)行四層分解,獲得16個(gè)終端節(jié)點(diǎn),再基于這16個(gè)終端節(jié)點(diǎn)的重構(gòu)信號(hào),計(jì)算11種統(tǒng)計(jì)參數(shù)[12,13](均值、標(biāo)準(zhǔn)差、峭度、能量、能量熵、峰度、波峰因數(shù)、脈沖因數(shù)、形狀因子、偏度、極值),可提取出176種時(shí)域統(tǒng)計(jì)特征(計(jì)算16個(gè)終端節(jié)點(diǎn)的重構(gòu)信號(hào)的11種統(tǒng)計(jì)參數(shù));然后,分別計(jì)算16個(gè)重構(gòu)信號(hào)的希爾伯特包絡(luò)譜,將得到的16個(gè)包絡(luò)譜信號(hào)用于計(jì)算11種統(tǒng)計(jì)參數(shù),可提取出176種頻域統(tǒng)計(jì)特征;最后,將獲得的352個(gè)統(tǒng)計(jì)特征構(gòu)成原始特征集,用于后續(xù)的特征選取、遷移學(xué)習(xí)和故障模式識(shí)別。
雖然小波包變換能夠?qū)S承振動(dòng)信號(hào)進(jìn)行有效分解,提取故障特征,但也存在數(shù)據(jù)維度高,且易引入干擾和冗余特征的局限[14,15],進(jìn)而降低故障診斷的精度。此外,為提高后續(xù)特征遷移學(xué)習(xí)的效果,有效減小不同域特征數(shù)據(jù)間的分布差異,需選取在不同域間分布差異小的特征。
因此,筆者提出基于特征重要度與KL散度的遷移特征選取方法,主要從2個(gè)方面對(duì)特征進(jìn)行評(píng)價(jià):即特征的故障判別能力和特征的域間差異。
1)特征的故障判別能力評(píng)價(jià)
筆者采用經(jīng)典的隨機(jī)森林算法對(duì)各統(tǒng)計(jì)特征進(jìn)行處理,獲得特征重要度指標(biāo)[16]FI。FI能夠衡量各特征對(duì)于分類準(zhǔn)確率的貢獻(xiàn)程度。筆者認(rèn)為,當(dāng)該指標(biāo)數(shù)值越大,表明該特征的故障判別能力越好。
給定源域特征數(shù)據(jù)集如下:
(1)
其中:
(2)
筆者利用隨機(jī)森林算法對(duì)源域特征數(shù)據(jù)集進(jìn)行處理,獲得了M種特征的重要度指標(biāo),構(gòu)建特征重要度序列SI如下:
SI={i(1),i(2),…,i(M}
(3)
式中:i(M)為第M種特征的重要度指標(biāo)。
2)特征的域間差異度量
KL散度,又稱KL距離[17],是一種在概率論和信息論中描述2個(gè)概率分布P和Q之間分布差異的方法,又稱為相對(duì)熵。P和Q之間的KL散度定義如下:
(4)
式中:p(xi)為目標(biāo)分布;q(xi)為匹配的分布;xi為離散隨機(jī)變量;L為概率分布的長(zhǎng)度。
當(dāng)DKLD(P‖Q)越小,表明P和Q之間分布差異越小;當(dāng)DKLD(P‖Q)=0時(shí),則P和Q完全匹配。
因此,筆者采用源域和目標(biāo)域中正常狀態(tài)下特征樣本來(lái)計(jì)算KLD,度量各特征在不同域下的分布差異,獲得M種特征的KLD序列如下:
SKLD={d(1),d(2),…,d(M)}
(5)
式中:d(M)為第M種特征的KLD。
為綜合考慮特征重要度和域間分布差異兩方面性能,取得理想的特征遷移學(xué)習(xí)效果,筆者基于上述兩方面的特征評(píng)價(jià),分別獲得特征的FI和KLD指標(biāo),再基于這2個(gè)指標(biāo),構(gòu)建一種新到的特征可遷移性量化指標(biāo)RFK。
其表達(dá)式如下:
r(m)=i(m)/d(m)
(6)
基于上式,可獲得M種統(tǒng)計(jì)特征的可遷移性指標(biāo)序列。最后,筆者對(duì)可遷移性指標(biāo)序列按照數(shù)值大小進(jìn)行降序排列,選取數(shù)值較大的特征,用于后續(xù)的特征遷移學(xué)習(xí)。
1.4.1 聯(lián)合分布自適應(yīng)
聯(lián)合分布自適應(yīng)的特點(diǎn)是通過(guò)擴(kuò)展非參數(shù)最大均值差異對(duì)源域和目標(biāo)域樣本間邊緣概率分布和條件概率分布進(jìn)行度量,完成這2種分布的聯(lián)合適應(yīng)工作。
JDA能夠彌補(bǔ)經(jīng)典遷移學(xué)習(xí)方法遷移成分分析(transfer component analysis, TCA)僅考慮邊緣概率分布適應(yīng)的局限,綜合考慮了2種概率分布,進(jìn)而提升了遷移學(xué)習(xí)效果。
JDA的基本原理概述如下:分別給定有標(biāo)簽的源域數(shù)據(jù)DS={(x1,y1),…,(xnS,ynS)}和目標(biāo)域數(shù)據(jù)DT={(xnS+1),…,(xnS+nr)},nS和nT分別為源域和目標(biāo)域樣本數(shù),且2個(gè)域數(shù)據(jù)間的邊緣概率分布和條件概率分布均存在差異,即Qs(ys|xs)≠Q(mào)T(yT|xT)和Ps(xs)≠PT(xT),JDA算法目標(biāo)是利用DS和DT學(xué)習(xí)得到一個(gè)特征映射變換矩陣W,使得經(jīng)變換后的域數(shù)據(jù)的Ps(WTxs)和PT(WTxT)、Qs(ys|WTxs)和QT(yT|WTxT)之間距離盡可能減小。
因此,JDA算法包括2個(gè)方面的優(yōu)化目標(biāo):
1)實(shí)現(xiàn)源域和目標(biāo)域數(shù)據(jù)的邊緣概率分布適應(yīng),即Ps(WTxs)和PT(WTxT)之間的最大均值差異(maximum mean discrepancy, MMD)最小,優(yōu)化目標(biāo)表達(dá)式如下:
=tr(WTXM0XTW)
(7)
式中:M0為邊緣概率分布MMD矩陣;X為源域和目標(biāo)域樣本集合;tr為取矩陣的跡;
2)實(shí)現(xiàn)源域和目標(biāo)域數(shù)據(jù)的條件概率分布適應(yīng)目的,即Qs(ys|WTxs)和QT(yT|WTxT)之間的MMD最小,優(yōu)化目標(biāo)表達(dá)式如下:
(8)
基于上述兩方面優(yōu)化目標(biāo),可得JDA總優(yōu)化目標(biāo)如下:
(9)
關(guān)于JDA原理的詳細(xì)描述可參考文獻(xiàn)[18]。
1.4.2 鄰域保持嵌入
NPE是經(jīng)典流形學(xué)習(xí)算法局部線性嵌入(locally linear embedding,LLE)[19]的一種線性逼近。NPE算法目標(biāo)是將高維數(shù)據(jù)映射到低維空間時(shí)保持其流形結(jié)構(gòu)。
該算法的步驟如下:
1)選擇近鄰,構(gòu)建鄰圖G?;贙最近鄰方法,對(duì)數(shù)據(jù)樣本點(diǎn)構(gòu)造鄰圖。其中,第i個(gè)節(jié)點(diǎn)對(duì)應(yīng)數(shù)據(jù)樣本點(diǎn)xi,根據(jù)歐式距離來(lái)計(jì)算xi與相鄰節(jié)點(diǎn)xj間距離,距離屬于近鄰范圍的話,則將兩個(gè)節(jié)點(diǎn)相連,構(gòu)建G;
(10)
該矩陣W′可通過(guò)最小化重構(gòu)損失函數(shù)求解,再將yi=ATxi代入損失函數(shù)求解,得到轉(zhuǎn)化后的表達(dá)式如下:
P(A)=min(tr(ATXZXTA))
(11)
式中:A為映射矩陣;X為輸入的樣本數(shù)據(jù)。
其中:
Z=(I-W′)T(I-W′),I=diag(1,…,1)
(12)
3)為進(jìn)一步求解映射矩陣A,可將式(14)的優(yōu)化求解問(wèn)題轉(zhuǎn)化為廣義特征向量最小特征值的求解問(wèn)題。
優(yōu)化問(wèn)題表達(dá)式如下:
XZXTa=λXXTa
(13)
式中:λ為特征值;a為特征值對(duì)應(yīng)的特征向量,根據(jù)特征值升序排列,選取特征值對(duì)應(yīng)的特征向量構(gòu)建新的特征子集。
NPE算法的運(yùn)算流程如圖2所示[20]。
圖2 NPE算法運(yùn)算流程
1.4.3 流形嵌入的聯(lián)合分布自適應(yīng)
雖然,JDA能夠彌補(bǔ)TCA僅考慮邊緣概率分布適應(yīng)的局限,其綜合考慮了兩種概率分布,進(jìn)而提升了遷移學(xué)習(xí)效果;但是其直接對(duì)源域和目標(biāo)域樣本進(jìn)行兩種分布的適應(yīng),仍存在局限,即在原始數(shù)據(jù)空間中進(jìn)行兩種分布適應(yīng)時(shí),無(wú)法克服特征扭曲的問(wèn)題[21,22],導(dǎo)致分布適應(yīng)效果不佳。因此,筆者提出一種思路,將原始數(shù)據(jù)空間進(jìn)行流形學(xué)習(xí),原始數(shù)據(jù)空間映射到流形子空間后,再進(jìn)行兩種分布的適應(yīng),進(jìn)而克服由于特征扭曲而帶來(lái)的分布適應(yīng)效果不佳的問(wèn)題。
基于上述改進(jìn)思路,筆者提出基于特征流形學(xué)習(xí)和概率分布適應(yīng)的改進(jìn)聯(lián)合分布自適應(yīng),該方法的步驟如下:
1)將DS數(shù)據(jù)輸入NPE算法,流形子空間維度參數(shù),進(jìn)行流形特征學(xué)習(xí),獲得新的特征子集ZS和特征映射矩陣A;
2)基于第一步獲得的映射矩陣,對(duì)DT數(shù)據(jù)進(jìn)行映射轉(zhuǎn)換,獲得新的特征子集ZT;
3)將前兩步獲得的ZS和ZT作為聯(lián)合分布適應(yīng)的輸入,計(jì)算式(8)、式(9)中的MMD矩陣,即M0和Mc;
為驗(yàn)證該BIFD-IJDA方法對(duì)于變工況下軸承故障診斷的有效性、優(yōu)越性和適應(yīng)性,筆者采用美國(guó)凱斯西儲(chǔ)大學(xué)軸承故障數(shù)據(jù)和自有實(shí)驗(yàn)平臺(tái)軸承故障數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證。
采用2種故障數(shù)據(jù)的原因?yàn)?美國(guó)凱斯西儲(chǔ)大學(xué)的數(shù)據(jù)在軸承領(lǐng)域內(nèi)非常普遍地被用于故障診斷方法驗(yàn)證;第二種自有的軸承故障數(shù)據(jù),采用的故障缺陷產(chǎn)生方法以及缺陷尺寸、工況等設(shè)置,均與美國(guó)凱斯西儲(chǔ)大學(xué)實(shí)驗(yàn)中的設(shè)置不同。
因此,為驗(yàn)證該方法的普遍適應(yīng)性,筆者增加第二種自有故障數(shù)據(jù)下的實(shí)驗(yàn)。
2.1.1 實(shí)驗(yàn)數(shù)據(jù)與任務(wù)設(shè)置
筆者采用美國(guó)凱斯西儲(chǔ)大學(xué)軸承故障數(shù)據(jù)集中4種工況下的12種軸承狀態(tài)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析。
實(shí)驗(yàn)平臺(tái)如圖3所示。
圖3 美國(guó)凱斯西儲(chǔ)大學(xué)軸承故障實(shí)驗(yàn)臺(tái)
實(shí)驗(yàn)臺(tái)軸承的4種工況分別為0 horse power(hp)、1 hp、2 hp和3 hp,對(duì)應(yīng)的電機(jī)轉(zhuǎn)速分別為1 797 r/min、1 772 r/min、1 750 r/min和1 730 r/min;12種軸承狀態(tài)有4類:正常狀態(tài)、滾動(dòng)體缺陷故障、內(nèi)圈缺陷故障和外圈缺陷故障(其中,滾動(dòng)體缺陷故障和內(nèi)圈缺陷故障均有4種故障尺寸,分別為0.017 78 mm、0.035 56 mm、0.053 34 mm和0.071 12 mm;外圈缺陷故障有3種故障尺寸,分別為0.017 78 mm、0.035 56 mm和0.053 34 mm)。
針對(duì)每種軸承狀態(tài),筆者隨機(jī)選擇60組振動(dòng)數(shù)據(jù)樣本,其中隨機(jī)選取20組作為訓(xùn)練數(shù)據(jù)集,剩余40組作為測(cè)試數(shù)據(jù)集,每組數(shù)據(jù)集共包含2 000個(gè)連續(xù)采樣數(shù)據(jù)點(diǎn)。
根據(jù)軸承經(jīng)常工作在惡劣變工況環(huán)境的實(shí)際情況,筆者設(shè)置多個(gè)不同工況下軸承故障診斷任務(wù),對(duì)該方法進(jìn)行驗(yàn)證?;?種工況的故障數(shù)據(jù),筆者設(shè)置12個(gè)不同工況下故障診斷任務(wù),即任務(wù)1~12。其中,任務(wù)1~3中,均采用179 7 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),分別采用177 2 r/min,175 0 r/min和173 0 r/min下的數(shù)據(jù)作為任務(wù)1~3的目標(biāo)域(測(cè)試樣本);任務(wù)4~6中,均采用1 772 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),分別采用1 797 r/min,1 750 r/min和1 730 r/min下的數(shù)據(jù)作為任務(wù)4~6的目標(biāo)域(測(cè)試樣本);任務(wù)7~9中,均采用1 750 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),分別采用1 797 r/min,1 772 r/min和1 730 r/min下的數(shù)據(jù)作為任務(wù)7~9的目標(biāo)域(測(cè)試樣本);任務(wù)10~12中,均采用1 730 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),分別采用1 797 r/min,1 772 r/min和1 750 r/min下的數(shù)據(jù)作為任務(wù)10~12的目標(biāo)域(測(cè)試樣本)。
在上述12種故障診斷任務(wù)下,進(jìn)行兩方面的實(shí)驗(yàn)驗(yàn)證與分析,即:
1)驗(yàn)證該BIFD-IJDA方法對(duì)不同工況下故障診斷的有效性;
2)驗(yàn)證該TFFK與IJDA方法對(duì)提高故障診斷準(zhǔn)確率的有效性和優(yōu)越性。
因此,筆者設(shè)置了一些對(duì)比模型,開(kāi)展了實(shí)驗(yàn)驗(yàn)證。
首先,設(shè)置由經(jīng)典機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法構(gòu)建的故障診斷模型,和BIFD-IJDA方法進(jìn)行對(duì)比,驗(yàn)證BIFD-IJDA方法在取得理想的故障診斷準(zhǔn)確率方面的優(yōu)勢(shì)。該模型構(gòu)成基于原始特征集(raw characteristic set, RCS)和經(jīng)典機(jī)器學(xué)習(xí)方法,包括支持向量機(jī)(support vector machine, SVM)、K最近鄰(k-nearest neighbor,KNN)、深度置信網(wǎng)絡(luò)(deep belief network, DBN)、深度自編碼器(deep auto-encoder, DAE)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)。
進(jìn)行對(duì)比的模型分別是:RCS-SVM、RCS-KNN、RCS-DBN-SoftMax,RCS-DAE-SoftMax和RCS-CNN-SoftMax。其中,RCS-SVM和RCS-KNN模型分別是直接采用原始特征集輸入SVM和KNN,進(jìn)行故障診斷模型訓(xùn)練與測(cè)試;RCS-DBN-SoftMax、RCS-DAE-SoftMax和RCS-CNN-SoftMax模型分別將原始特征集輸入DBN、DAE和CNN中,然后再結(jié)合SoftMax分類器訓(xùn)練故障診斷模型。
然后,選用經(jīng)典遷移學(xué)習(xí)方法TCA、JDA和GFK(geodesic flow kernel),構(gòu)建RCS-TFFK-TCA、RCS-TFFK-JDA和RCS-TFFK-GFK模型。這3種模型均是將原始特征集經(jīng)TFFK方法處理后,獲得特征子集,再分別將其輸入到遷移學(xué)習(xí)方法TCA、JDA和GFK中,得到遷移學(xué)習(xí)后的特征數(shù)據(jù)。
最后,訓(xùn)練SVM分類器,獲得故障診斷模型。
2.1.2 實(shí)驗(yàn)結(jié)果分析
1)驗(yàn)證BIFD-IJDA方法對(duì)不同工況下故障診斷的有效性
根據(jù)圖1所示的BIFD-IJDA流程,筆者首先進(jìn)行原始振動(dòng)信號(hào)處理和特征提取,共提取出352個(gè)統(tǒng)計(jì)特征構(gòu)成RCS;隨后,將RCS輸入遷移特征選取方法TFFK中,對(duì)各統(tǒng)計(jì)特征的可遷移性進(jìn)行量化評(píng)估,選取可遷移性指標(biāo)高的特征輸入該改進(jìn)聯(lián)合分布適應(yīng),并進(jìn)行特征遷移學(xué)習(xí),降低源域和目標(biāo)域樣本間的分布差異;最后,采用SVM來(lái)訓(xùn)練故障診斷模型,將經(jīng)特征遷移學(xué)習(xí)后的有標(biāo)簽源域特征集用于故障診斷模型訓(xùn)練,再將已訓(xùn)練好的模型用于無(wú)標(biāo)簽?zāi)繕?biāo)域特征集的故障模式識(shí)別與分類,獲得故障診斷準(zhǔn)確率。
BIFD-IJDA模型的最大故障診斷準(zhǔn)確率分別為:97.92%、100%、96.25%、93.75%、100%、99.17%、94.17%、98.75%、99.58%、93.33%、98.33%和100%,驗(yàn)證了BIFD-IJDA方法對(duì)不同工況下故障診斷的有效性。
2)驗(yàn)證TFFK與IJDA方法對(duì)提高故障診斷準(zhǔn)確率的有效性和優(yōu)越性
筆者在12個(gè)不同工況下故障診斷任務(wù)基礎(chǔ)上,設(shè)置了一系列對(duì)比模型。其中,任務(wù)1~4下的不同模型故障診斷準(zhǔn)確率對(duì)比結(jié)果,如表1所示。
表1 任務(wù)1~4下的不同模型故障診斷準(zhǔn)確率對(duì)比
任務(wù)5~8下的不同模型故障診斷準(zhǔn)確率對(duì)比如表2所示。
表2 任務(wù)5~8下的不同模型故障診斷準(zhǔn)確率對(duì)比
任務(wù)9~12下的不同模型故障診斷準(zhǔn)確率對(duì)比如表3所示。
表3 任務(wù)9~12下的不同模型故障診斷準(zhǔn)確率對(duì)比
由表1~表3可知:
BIFD-IJDA模型的最大故障診斷準(zhǔn)確率明顯高于RCS-SVM、RCS-KNN、RCS-DBN-SoftMax、RCS-DAE-SoftMax和RCS-CNN-SoftMax模型的故障診斷準(zhǔn)確率,且這5種模型的最大故障診斷準(zhǔn)確率均未超過(guò)90%。上述結(jié)果表明了它們應(yīng)用于不同工況下故障診斷的劣勢(shì)。
RCS-TFFK-TCA、RCS-TFFK-JDA和RCS-TFFK-GFK模型的最大故障診斷準(zhǔn)確率明顯高于RCS-TCA、RCS-JDA和RCS-GFK模型的故障診斷準(zhǔn)確率,RCS-TFFK-TCA模型在12個(gè)任務(wù)下的最大故障診斷準(zhǔn)確率分別比RCS-TCA高26.62%、32.00%、37.12%、13.67%、20.21%、20.83%、19.96%、19.80%、20.29%、16.63%、19.58%、18.13%。RCS-TFFK-JDA模型在12個(gè)任務(wù)下的最大故障診斷準(zhǔn)確率分別比RCS-JDA的最大故障診斷準(zhǔn)確率高22.67%、26.33%、25.17%、13.29%、20.00%、20.25%、16.62%、17.50%、15.00%、18.83%、17.12%、16.83%。RCS-TFFK-GFK模型在12個(gè)任務(wù)下的最大故障診斷準(zhǔn)確率分別比RCS-GFK高27.91%、33.55%、33.54%、16.25%、25.16%、26.00%、25.21%、25.80%、26.29%、19.25%、27.17%、28.75%。上述結(jié)果表明,TFFK方法提升遷移學(xué)習(xí)效果明顯,使不同工況下故障診斷準(zhǔn)確率得到明顯地提升。
BIFD-IJDA模型的最大故障診斷準(zhǔn)確率高于RCS-TFFK-TCA,RCS-TFFK-JDA和RCS-TFFK-GFK模型,BIFD-IJDA模型的12個(gè)任務(wù)下的診斷準(zhǔn)確率分別比RCS-TFFK-TCA模型高4.17%、5.17%、3.46%、2.95%、3.12%、3.34%、1.42%、3.12%、1.79%、0.20%、4.58%、3.12%;比RCS-TFFK-JDA模型高1.42%、2.50%、1.25%、1.46%、1.50%、2.09%、0.42%、2.50%、1.25%、-1.88%、1.04%、1.50%;比RCS-TFFK-GFK模型高6.88%、10.62%、9.58%、8.33%、2.71%、3.34%、3.79%、3.12%、1.41%、8.75%、9.16%、0.42%。上述結(jié)果表明,IJDA在提升特征遷移學(xué)習(xí)效果、降低源域和目標(biāo)域數(shù)據(jù)間分布差異上,優(yōu)于經(jīng)典特征遷移學(xué)習(xí)方法TCA、JDA和GFK。
為進(jìn)一步驗(yàn)證BIFD-IJDA方法的適應(yīng)性,筆者進(jìn)行案例2實(shí)驗(yàn)分析,其中,所采用的軸承故障數(shù)據(jù)采集自MFS機(jī)械故障綜合模擬實(shí)驗(yàn)臺(tái)[23]。
該機(jī)械故障綜合模擬實(shí)驗(yàn)臺(tái)如圖4所示。
圖4 MFS機(jī)械故障綜合模擬實(shí)驗(yàn)臺(tái)
該案例的軸承故障數(shù)據(jù)集中包括2種工況下的10種軸承狀態(tài)數(shù)據(jù)。2種工況分別為1 200 r/min和1 500 r/min;10種軸承狀態(tài)有4類:正常狀態(tài)、滾動(dòng)體缺陷故障、內(nèi)圈缺陷故障和外圈缺陷故障,其中,滾動(dòng)體缺陷故障,內(nèi)圈缺陷故障和外圈缺陷故障均有3種故障尺寸,分別為0.05 mm、0.01 mm和0.02 mm。針對(duì)每種軸承狀態(tài),筆者隨機(jī)選擇90組振動(dòng)數(shù)據(jù)樣本,其中隨機(jī)選取30組作為訓(xùn)練數(shù)據(jù)集,剩余60組作為測(cè)試數(shù)據(jù)集,每組數(shù)據(jù)集共包含5 000個(gè)連續(xù)采樣數(shù)據(jù)點(diǎn)。
該案例設(shè)置2個(gè)故障診斷任務(wù),任務(wù)1采用1 200 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),采用1 500 r/min下的數(shù)據(jù)作目標(biāo)域(測(cè)試樣本);任務(wù)2采用1 500 r/min下的數(shù)據(jù)作為源域(訓(xùn)練樣本),采用1 200 r/min下的數(shù)據(jù)作目標(biāo)域(測(cè)試樣本)。實(shí)驗(yàn)步驟和內(nèi)容與案例1相同。
故障診斷案例2中,任務(wù)1和任務(wù)2下的不同模型故障診斷準(zhǔn)確率如表4所示。
表4 故障診斷案例2中任務(wù)1和任務(wù)2下的不同模型故障診斷準(zhǔn)確率
根據(jù)表4中的實(shí)驗(yàn)結(jié)果可知:在任務(wù)1和任務(wù)2下,BIFD-IJDA模型的最大故障診斷準(zhǔn)確率分別達(dá)到了96.29%和93.70%,明顯高于其他模型的診斷準(zhǔn)確率。該結(jié)果進(jìn)一步驗(yàn)證了其有效性和優(yōu)越性。
筆者提出了一種基于改進(jìn)聯(lián)合分布適應(yīng)的提升機(jī)軸承智能故障診斷方法(BIFD-IJDA)。該方法主要包括信號(hào)處理與特征提取、遷移特征選取、數(shù)據(jù)分布適應(yīng)以及故障模式識(shí)別四部分。
為驗(yàn)證該方法的有效性、優(yōu)越性和適應(yīng)性,筆者采用美國(guó)凱斯西儲(chǔ)大學(xué)軸承故障數(shù)據(jù)和MFS實(shí)驗(yàn)臺(tái)軸承故障數(shù)據(jù),分別對(duì)該方法進(jìn)行了實(shí)驗(yàn)分析。
研究結(jié)果表明:
1)采用BIFD-IJDA方法構(gòu)建的故障診斷模型,能夠在不同工況下取得較高的故障診斷準(zhǔn)確率,且其診斷準(zhǔn)確率明顯高于其他模型的準(zhǔn)確率;
2)TFFK與IJDA方法對(duì)提高故障診斷準(zhǔn)確率具有明顯的效果,RCS-TFFK-TCA、RCS-TFFK-JDA和RCS-TFFK-GFK模型的最大故障診斷準(zhǔn)確率明顯高于RCS-TCA、RCS-JDA和RCS-GFK模型的診斷準(zhǔn)確率;
3)IJDA具有比經(jīng)典遷移學(xué)習(xí)方法TCA、JDA和GFK更優(yōu)的性能,能夠取得更高的故障診斷準(zhǔn)確率。
下一步工作中,筆者將繼續(xù)開(kāi)展泛化能力更強(qiáng)的跨設(shè)備軸承故障診斷方法研究,包括特征可遷移性量化評(píng)估方法的進(jìn)一步優(yōu)化,以及基于不同距離度量的流形結(jié)構(gòu)挖掘方法研究等。