姜萬錄 李 滿 張培堯 趙亞鵬 張淑清
1.燕山大學(xué)河北省重型機(jī)械流體動力傳輸與控制重點(diǎn)實(shí)驗(yàn)室,秦皇島,0660042.燕山大學(xué)先進(jìn)鍛壓成形技術(shù)與科學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,秦皇島,066004 3.燕山大學(xué)電氣工程學(xué)院,秦皇島,066004
旋轉(zhuǎn)設(shè)備中的液壓泵、滾動軸承等部件在動力傳動方面有著不可替代的作用,被廣泛應(yīng)用于航空航天、交通運(yùn)輸?shù)戎匾I(lǐng)域[1-2]。一旦這些部件發(fā)生故障,將對工業(yè)生產(chǎn)整個(gè)過程的穩(wěn)定性和安全性產(chǎn)生影響。然而,由于旋轉(zhuǎn)機(jī)械固有的復(fù)雜性,對其進(jìn)行有效的故障診斷變得十分具有挑戰(zhàn)性。
隨著數(shù)據(jù)驅(qū)動技術(shù)的日漸成熟,直接對故障數(shù)據(jù)進(jìn)行深度挖掘以實(shí)現(xiàn)故障診斷成為可能。傳統(tǒng)基于數(shù)據(jù)驅(qū)動的故障診斷方法通常包含括兩個(gè)步驟,即故障特征提取[3-5]和分類模型訓(xùn)練[6-8]。為提高故障分類的效率,許多經(jīng)典機(jī)器學(xué)習(xí)方法已被廣泛使用,如隨機(jī)森林(random forest,RF)、支持向量機(jī)(support vector machine,SVM)和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)等。但是,相關(guān)研究表明,上述淺層學(xué)習(xí)模型難以直接使用原始數(shù)據(jù),需要依據(jù)特征工程提取故障特征。復(fù)雜的特征提取過程需要豐富的專業(yè)知識,且特征提取的好壞會嚴(yán)重影響診斷準(zhǔn)確率。
深度學(xué)習(xí)的出現(xiàn)克服了這一不足,它可從原始數(shù)據(jù)中挖掘有價(jià)值的信息,避免依賴于專家知識的特征提取,從而實(shí)現(xiàn)端到端診斷?;谏疃葘W(xué)習(xí)的故障診斷逐漸成為研究熱點(diǎn),深度置信網(wǎng)絡(luò)(deep belief network,DBN)[9]、深度自編碼器(deep auto-encoders,DAE)[10]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[11]和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[12]等深度學(xué)習(xí)方法被廣泛地研究并應(yīng)用。這些深度學(xué)習(xí)算法都屬于深度神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)。眾所周知,深度神經(jīng)網(wǎng)絡(luò)的超參數(shù)較多,需要進(jìn)行微調(diào),并且在訓(xùn)練數(shù)據(jù)不足時(shí),很容易出現(xiàn)過擬合[13]。
相關(guān)研究表明,振動信號在表征旋轉(zhuǎn)設(shè)備狀態(tài)信息方面有著獨(dú)特優(yōu)勢,振動信號分析方法也是國內(nèi)外比較成熟的旋轉(zhuǎn)機(jī)械設(shè)備故障診斷方法。但是,多數(shù)方法采用單源信號進(jìn)行故障識別與診斷,而旋轉(zhuǎn)機(jī)械設(shè)備發(fā)生故障時(shí),會在不同方向表現(xiàn)出不同的振幅值和相位角,因此單源信號所獲取的信息不全面,易造成誤判[14]。
全矢譜(full vector spectrum,F(xiàn)VS)技術(shù)[15]可對兩通道同步獲取的振動信號進(jìn)行有效融合,通過主振矢特征保證信息的完備性。此外,多粒度級聯(lián)森林(multi-grained cascade forest,gcForest)是一種隨機(jī)森林在深度學(xué)習(xí)上的衍生方法[16],又稱深度森林,其超參數(shù)較少且模型大小可自適應(yīng)調(diào)整。卞凌志等[17]針對增加級聯(lián)森林層數(shù)后出現(xiàn)特征消失的問題,對級聯(lián)森林進(jìn)行了改進(jìn),提出了級聯(lián)殘差森林(cascade residual forest,grcForest)。PANG等[18]針對級聯(lián)層中增強(qiáng)特征被淹沒在原始特征中的問題,設(shè)置特征選擇機(jī)制,提出了特征篩選級聯(lián)森林(gcForest with feature screening, gcForestFS)。
綜上,本文提出了一種全矢數(shù)據(jù)融合增強(qiáng)深度森林(full vector-grained residual cascade forest with feature screening,F(xiàn)V-grcForestFS)的旋轉(zhuǎn)設(shè)備故障診斷新方法,實(shí)現(xiàn)對旋轉(zhuǎn)機(jī)械端到端的故障診斷。首先將全矢同源信息融合技術(shù)與多粒度掃描相結(jié)合,提出全矢多粒度掃描(full vector multi-grained scanning,F(xiàn)V-MGS),以獲得基于完備信息的特征向量;然后在級聯(lián)森林的基礎(chǔ)上添加類似殘差網(wǎng)絡(luò)的結(jié)構(gòu)及特征選擇機(jī)制,提出特征篩選級聯(lián)殘差森林(cascade residual forest with feature screening,crForestFS),用于接收FV-MGS輸出的特征向量并進(jìn)行分類。最后通過兩種不同旋轉(zhuǎn)設(shè)備故障診斷實(shí)驗(yàn),驗(yàn)證所提方法的有效性。
旋轉(zhuǎn)機(jī)械動態(tài)特征與多傳感器信息融合技術(shù)相結(jié)合便產(chǎn)生了全矢譜技術(shù)。假設(shè)設(shè)備運(yùn)轉(zhuǎn)平穩(wěn),由轉(zhuǎn)子動力學(xué)理論,它在兩個(gè)垂直方向的運(yùn)動學(xué)方程[19]如下:
(1)
Xci=XicosφxiXsi=Xisinφxi
Yci=YicosφyiYsi=Yisinφyi
式中,Xi、Yi分別為諧波ωi在x、y方向的振幅;φxi、φyi分別為諧波ωi在x、y方向的初始相位角,如圖1a所示。
由式(1)可進(jìn)一步推知轉(zhuǎn)子渦動的軸心運(yùn)動軌跡為一系列橢圓。軸心沿橢圓的運(yùn)動可分解為沿兩個(gè)正圓運(yùn)動的合成,如圖1b所示。這兩個(gè)正圓定義為正進(jìn)動圓和反進(jìn)動圓,橢圓長短半軸可通過兩圓得到[19]。橢圓長短半軸可由下式求得:
(a)坐標(biāo)轉(zhuǎn)換
(2)
式中,Xpi、Xri分別為兩正反進(jìn)動圓半徑。
橢圓軌跡長半軸RLi被定義為諧波頻率ωi下的主振矢,短半軸RSi被定義為該諧波頻率ωi的副振矢。
為了保證全矢數(shù)值計(jì)算的快速性、穩(wěn)定性,將x、y兩方向上的振動信號序列{xn}、{yn}構(gòu)造為復(fù)數(shù)序列{zn}={xn}+j{yn}(n=0,2,…,N-1),其中N為序列長度。復(fù)數(shù)序列{zn}由傅里葉變換可得到{Zn},進(jìn)一步由傅里葉變換的共軛性可得
(3)
由上述數(shù)值計(jì)算可知,該種多傳感器數(shù)據(jù)級融合方法計(jì)算簡單可靠,兼容性強(qiáng)。實(shí)際情況中,加速度信號較位移信號幅度更高,因此同源位移信號可被同源加速度信號替代[20]。
深度學(xué)習(xí)技術(shù)因具有強(qiáng)大的表征學(xué)習(xí)能力而迅速發(fā)展,在各種應(yīng)用中都取得了很大成功。本文所提FV-grcForestFS方法的深度學(xué)習(xí)功能是通過FV-MGS和crForestFS兩部分實(shí)現(xiàn)的。
多粒度掃描(MGS)采用了類似卷積神經(jīng)網(wǎng)絡(luò)的滑動窗口,用于掃描原始輸入信號,旨在提取更多有用的特征信息。旋轉(zhuǎn)設(shè)備振動信號呈現(xiàn)出復(fù)雜性、非線性和非平穩(wěn)性[21],通過MGS提取故障特征較為困難,同時(shí)單通道信號分析所獲取的信息總是不完備不充分,因此引入全矢譜融合技術(shù)對MGS加以改進(jìn),提出FV-MGS,其結(jié)構(gòu)如圖2所示。
圖2 FV-MGS結(jié)構(gòu)示意圖
級聯(lián)森林采用多層結(jié)構(gòu),每一層可包含多個(gè)不同的基學(xué)習(xí)器,如RF、CRF、XGBoost、LightGBM、CasCatBoost等[22], 它通過層數(shù)的增加來使模型獲取更多的信息,但可能出現(xiàn)類似DNN梯度消失或梯度爆炸的問題。為了避免在級聯(lián)層中增加隨機(jī)森林層數(shù)時(shí)出現(xiàn)此問題,采用類似殘差連接的結(jié)構(gòu),可在增加隨機(jī)森林層數(shù)時(shí)使模型能夠在保留之前效果的基礎(chǔ)上向最優(yōu)值靠近[17,22]。
在級聯(lián)森林中,除第一層級外,其余各層級輸入為原始輸入特征與上一層級輸出增強(qiáng)特征的拼接向量。原始輸入特征比每層輸出增強(qiáng)特征維數(shù)大很多,增強(qiáng)特征可能被淹沒在原始輸入特征中。特征篩選可以促進(jìn)增強(qiáng)特征和原始特征之間保持平衡,提高各層模型的學(xué)習(xí)能力[18, 23],并且,通過篩選出無關(guān)特征,增加了每棵決策樹分裂時(shí)選擇相關(guān)特征的機(jī)會,通過增強(qiáng)單座森林的性能提高了整體性能。
因此,為減少級聯(lián)森林特征消失及特征冗余,本文對級聯(lián)森林增加殘差連接和特征選擇機(jī)制加以改進(jìn),提出crForestFS,其結(jié)構(gòu)如圖3所示。
圖3 crForestFS結(jié)構(gòu)示意圖
在crForestFS的每個(gè)層級中,特征篩選是依據(jù)各個(gè)特征對模型分類的重要程度進(jìn)行的,而基于樹的森林模型可充分利用各層模型內(nèi)決策樹生成過程中的相關(guān)信息實(shí)現(xiàn)特征重要性量化。不同功能的決策樹量化特征重要性有所差異,對于分類問題主要通過基尼系數(shù)進(jìn)行最優(yōu)特征選擇。在基尼系數(shù)基礎(chǔ)上,使用g(a)刻畫特征a在各層模型中的重要性[23],計(jì)算如下:
(4)
式中,K為每座森林中決策樹棵數(shù),且每個(gè)級聯(lián)層中包含四座森林;L為特征a在此層模型中被用作決策樹節(jié)點(diǎn)劃分的次數(shù);Gini(Dl)為特征a在第l次被作為節(jié)點(diǎn)特征劃分時(shí),當(dāng)前決策樹節(jié)點(diǎn)中樣本集的純度;Gini(Dl,a)為第l次經(jīng)過特征a分割后樣本集的純度。
假設(shè)給定決策樹當(dāng)前節(jié)點(diǎn)中的樣本集D,特征a可將樣本集D劃分為W個(gè)不同子集,即D1,D2,…,DW,則Gini(D)與Gini(D,a)可由下式計(jì)算:
(5)
式中,C為D中樣本的種類數(shù);pc為第c類樣本在D中所占比例;|D|為D中樣本數(shù)量;Gini(D)越小,樣本D純度越高。
在crForestFS訓(xùn)練過程中,全部輸入特征x用于第一層模型中所有森林的訓(xùn)練。之后,在各層模型訓(xùn)練開始之前,使用各個(gè)特征在上一層模型中返回的g值衡量其特征重要程度,并從上一層模型使用的原始輸入特征子集中篩選出相對重要的特征。
(6)
式中,θ(0<θ≤1)為選擇比例;|At|為第t層模型輸入特征重要性和;zt(x)為t層原始輸入特征子集。
crForestFS逐層學(xué)習(xí)可以看成從特征空間X(X?RM)到類別概率空間Y(Y=[0,1]C),進(jìn)而得到類別Z={1,2,…,C}的監(jiān)督學(xué)習(xí)映射問題,C為每個(gè)樣本可能的標(biāo)記類型。那么,crForestFS可由(h,f)二元數(shù)組形式表示。h=(h1,h2,…,hT),f=(f1,f2,…,fT),其中ht為第t層森林的集成;ft為級聯(lián)至t層時(shí)模型的集成,t∈{1,2,…,T},T為模型層數(shù)。
對于層數(shù)t,X→Y的映射函數(shù)ft定義為
(7)
對于層級t,ht和ft都將輸出類概率向量(p1,t,p2,t,…,pC,t),z1(x)為原始輸入特征經(jīng)過特征重要性選擇后的子集。第一層h1(x)的輸入為x;第二層輸入為原始特征約減子集z1(x)與第一層輸出f1(x)的拼接向量h2((z1(x),f1(x)));其余ht輸入為t-1層輸入特征子集zt-1(x)、前層級聯(lián)輸出ft-1(x)和第一層輸出f1(x)的拼接向量(zt-1(x),ft-1(x),f1(x))。
改進(jìn)級聯(lián)森林模型M:X→Z可由(h,f)定義[18]:
M(x)=argmax([fT(x)]c)c={1,2,…,C}
(8)
式中,[fT(x)]c為類別向量fT(x)中第c類的預(yù)測概率。
為了避免過擬合,訓(xùn)練過程中樣本的類概率特征向量和特征重要性度量都以k折交叉驗(yàn)證的方式獲得。在級聯(lián)森林的基礎(chǔ)上增加殘差連接與特征選擇機(jī)制,并且設(shè)置森林樹木棵數(shù)線性增加。隨著級聯(lián)層級的增加,從低到高去改變模型復(fù)雜性可以帶來更好的泛化性能,同時(shí)可進(jìn)一步降低內(nèi)存要求和時(shí)間成本[24]。
圖4是FV-grcForestFS總體結(jié)構(gòu)示意圖,由設(shè)置多個(gè)不同大小的滑動窗口對雙通道原始信號于旋轉(zhuǎn)設(shè)備振動信號具有非平穩(wěn)、非線性特點(diǎn),故進(jìn)行采樣。類似于短時(shí)傅里葉變換思想,假設(shè)信號在很短的時(shí)間內(nèi)是平穩(wěn)的,通過窗函數(shù)切割成有限個(gè)平穩(wěn)信號片段,使得模型具有一定的非線性信號處理能力,多窗口同時(shí)也可挖掘更多的有用信息。采用M1、M2、M3三種不同窗長在同一步長S下對P維雙通道信號進(jìn)行掃描,經(jīng)過全矢融合以獲得主振矢特征,不同窗長主振矢特征分別訓(xùn)練相應(yīng)的森林子模型,通過FV-MGS分別得到R、U、V維增強(qiáng)特征向量。將三類特征向量拼接組成的R+U+V維向量作為crForestFS的輸入,以訓(xùn)練集k(k=5)折交叉驗(yàn)證準(zhǔn)確率為層級生長依據(jù),最后將所有森林生成的類概率平均,取概率最大的類別為預(yù)測結(jié)果。
圖4 FV-grcForestFS結(jié)構(gòu)示意圖
為了評估所提出的旋轉(zhuǎn)設(shè)備故障診斷模型的性能,進(jìn)行了兩種不同的實(shí)驗(yàn)驗(yàn)證。所使用計(jì)算機(jī)配置為:Intel Core i7-8750H 2.20 GHz CPU; 8 GB RAM; 512 GB SSD; 1 TB HDD,Python IDE為PyCharm 2020.1。
3.1.1數(shù)據(jù)集獲取
在本實(shí)驗(yàn)中,使用來自XJTU-SY 的滾動軸承加速壽命實(shí)驗(yàn)振動數(shù)據(jù)集[25]去評估所提出的方法的性能。實(shí)驗(yàn)設(shè)備如圖5a所示[25],滾動軸承型號為LDKUER204,共采集3類工況,每類工況5個(gè)軸承,共15個(gè)滾動軸承從正常運(yùn)行到故障的數(shù)據(jù)。實(shí)驗(yàn)中振動信號采集頻率為25.6 kHz,采樣間隔時(shí)間為1 min,每次同步采樣1.28 s同一截面水平和垂直兩方向的同源振動信號。
XJTU-SY數(shù)據(jù)集在工況2250 r/min與11 kN下退化出現(xiàn)三種不同故障類型,即軸承2_1內(nèi)圈故障、軸承2_2外圈故障、軸承2_3保持架故障,如圖5b所示[25]。峭度對振動信號沖擊特性十分敏感,當(dāng)軸承出現(xiàn)故障時(shí),瞬態(tài)沖擊將會加劇[26],故對出現(xiàn)故障的軸承數(shù)據(jù)采用峭度指標(biāo)進(jìn)行選取標(biāo)定。
(a)實(shí)驗(yàn)平臺 (b)故障部件
提取軸承故障前期、中期同源雙通道數(shù)據(jù),每種類型順序選取30組數(shù)據(jù)。選擇軸承 2_1的第11~40組標(biāo)記為正常狀態(tài)數(shù)據(jù)。本實(shí)驗(yàn)采用無重疊截?cái)嗟姆绞缴上鄳?yīng)的訓(xùn)練集與測試集,其中窗口大小為1024個(gè)數(shù)據(jù)點(diǎn),每種類型可生成900組樣本,采用兩種比例的數(shù)據(jù)集隨機(jī)劃分方法,得到數(shù)據(jù)集A1、B1如表1所示。
表1 XJTU-SY數(shù)據(jù)集及劃分
3.1.2參數(shù)設(shè)定
FV-grcForestFS能夠自適應(yīng)更新關(guān)鍵模型參數(shù)(如級聯(lián)森林的層數(shù)),并有著深度森林超參數(shù)少,模型對其不敏感等特點(diǎn)[27-28]。本文中,F(xiàn)V-MGS中森林樹木棵數(shù)采用深度森林MGS默認(rèn)設(shè)置[16],即30棵;crForestFS中森林樹木棵數(shù)采用線性增長方式[24](即初始樹木棵數(shù)設(shè)置為40,逐層步長設(shè)置為30,上限為200)。自適應(yīng)生長條件設(shè)置為:若2層模型性能均未提高,停止生長,且丟棄這2層,并保存模型。同時(shí)原始深度森林級聯(lián)層也采用同樣參數(shù),便于對所提方法優(yōu)越性、先進(jìn)性進(jìn)行說明。
下面對掃描窗口的數(shù)量、大小及特征選擇比例θ進(jìn)行分析選取。在數(shù)據(jù)集A1上,改變不同窗長,重復(fù)實(shí)驗(yàn)20次,記錄結(jié)果均值,如表2所示。
表2 不同窗長M的診斷結(jié)果對比
從表2中可知,單窗口長度M越大,F(xiàn)V-MGS所輸出的增強(qiáng)特征向量的x維度越少,訓(xùn)練與測試所需時(shí)間成本越低。同時(shí)窗長越大,對信號的感受野越大,有著更好的信息挖掘能力,但增強(qiáng)特征維度的減少會導(dǎo)致模型泛化性降低,故測試準(zhǔn)確率在單窗口上表現(xiàn)為先升再降。
多窗口的測試準(zhǔn)確率高于單窗口的測試準(zhǔn)確率,但時(shí)間成本相應(yīng)更高。多窗口可對樣本進(jìn)行多尺度采樣,從而獲得更多的樣本信息。三種多窗口的測試準(zhǔn)確率相近,但{256,512,1024}窗口搭配方式的時(shí)間成本最低。綜上分析,設(shè)置掃描窗口長度分別為256、512、1024,掃描步長為64,在保證獲取樣本信息多樣性的情況下,最大化計(jì)算效率。
在數(shù)據(jù)集A1上,改變不同特征選擇比例θ,得到的結(jié)果如表3所示。其中,lmax表示最大級聯(lián)層數(shù)。
表3 不同特征選擇比例θ的診斷結(jié)果對比
從表3中可知,當(dāng)θ取值較小時(shí),crForestFS并不能得到有效擴(kuò)展生長,此時(shí)保存的模型中最大級聯(lián)層數(shù)lmax僅為1。隨著θ值的增大,有效特征保留數(shù)量增加,crForestFS能通過級聯(lián)生長獲得更好的性能,同時(shí)訓(xùn)練時(shí)間有所增長。當(dāng)θ值為0.7~0.9時(shí),測試準(zhǔn)確率相近,當(dāng)θ=0.9時(shí),最大級聯(lián)層數(shù)lmax為4。當(dāng)θ=1時(shí),訓(xùn)練所需時(shí)間有較大增長,測試準(zhǔn)確率也有所下降,大量的冗余特征增加了訓(xùn)練時(shí)間成本,也使得測試集準(zhǔn)確率下降。綜上,將θ設(shè)置為0.9,以此獲得最佳性能。
3.1.3診斷結(jié)果及分析
為對crForestFS的有效性進(jìn)行分析,在數(shù)據(jù)集A1上采用FV-MGS提取增強(qiáng)特征向量,將crForestFS固定生長層數(shù)設(shè)置為10,繪制出每層訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率和所需訓(xùn)練時(shí)間,結(jié)果如圖6所示。為保證結(jié)果的準(zhǔn)確性,重復(fù)實(shí)驗(yàn)20次,將均值和標(biāo)準(zhǔn)偏差作為結(jié)果記錄。由圖6可以看出,crForestFS的準(zhǔn)確率較傳統(tǒng)級聯(lián)森林的準(zhǔn)確率略有提高;對于訓(xùn)練時(shí)間,crForestFS對無效特征進(jìn)行篩減,有效減少特征維數(shù),減短模型訓(xùn)練時(shí)間近50%。
(a)訓(xùn)練集交叉驗(yàn)證準(zhǔn)確率
為了說明所提出FV-MGS方法的優(yōu)越性,將數(shù)據(jù)集A1中X通道信號、Y通道信號分別輸入MGS,X、Y同源雙通道信號輸入FV-MGS中,分別得到相應(yīng)的增強(qiáng)特征向量,然后輸入crForestFS,模型參數(shù)同上。結(jié)果如圖7所示,相對于單通道信號MGS,F(xiàn)V-MGS的訓(xùn)練時(shí)間大幅縮短,同時(shí)測試集準(zhǔn)確率也有所提高。
圖7 全矢多粒度掃描的性能(實(shí)驗(yàn)1)
為了可視化故障識別性能,采用t分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding,t-SNE)[29]描繪一次實(shí)驗(yàn)中MGS與FV-MGS輸出特征的二維圖。圖8所示為單源信號經(jīng)MGS和同源雙通道信號經(jīng)FV-MGS提取特征的t-SNE可視化結(jié)果,可以看出,對于不同訓(xùn)練數(shù)據(jù)集大小,F(xiàn)V-MGS較MGS能更有效地提取故障特征,可以清楚地區(qū)分軸承的4種狀態(tài)。
(a)X(MGS)
為驗(yàn)證FV-grcForestFS的優(yōu)越性,采用三種傳統(tǒng)淺層模型(RF、ELM、SVM)和兩種深度學(xué)習(xí)模型(gcForest、CNN)與所提出模型的性能進(jìn)行比較。
考慮到淺層模型難以直接從原始信號中挖掘有效信息,使用db3小波對Y通道信號進(jìn)行三層小波包分解,取其第三層子帶能量譜作為特征向量。RF中設(shè)置決策樹棵數(shù)為200,決策樹分枝標(biāo)準(zhǔn)依據(jù)特征基尼系數(shù),其余參數(shù)采用默認(rèn)值。ELM中隱層神經(jīng)元數(shù)目設(shè)置100,激活函數(shù)選擇Sigmoid函數(shù)。SVM中核函數(shù)采用高斯徑向基(RBF)核函數(shù),懲罰因子與RBF核參數(shù)通過鯨魚優(yōu)化算法(whale optimization algorithm,WOA)[30]來實(shí)現(xiàn)最佳選擇。WOA設(shè)置種群數(shù)量為10,迭代次數(shù)30,懲罰因子與RBF核參數(shù)取值范圍均為[0.01,100]。
深度學(xué)習(xí)模型能自適應(yīng)地從原始振動數(shù)據(jù)中挖掘有效信息,因此直接對原始振動信號進(jìn)行診斷。gcForest相關(guān)參數(shù)與FV-grcForestFS設(shè)置相同,其級聯(lián)森林中每座森林樹木棵數(shù)也逐層增加以便于對照分析。CNN網(wǎng)絡(luò)模型設(shè)置為三個(gè)卷積層、三個(gè)池化層、一個(gè)全局最大池化層和一個(gè)全連接層。卷積層C1卷積核大小為128×1,個(gè)數(shù)為7,池化層P1大小為3×1;卷積層C2卷積核大小為64×1,池化層P2大小為5×1;卷積層C3卷積核大小為32×1,池化層P3大小為5×1;全連接層F的神經(jīng)元個(gè)數(shù)為32,設(shè)置Dropout機(jī)制,Dropout率為50%。模型訓(xùn)練次數(shù)設(shè)置為100,batch_size為128,優(yōu)化函數(shù)采用Adam,學(xué)習(xí)率為1×10-3。
各類算法診斷結(jié)果對比如表4所示。
表4 實(shí)驗(yàn)1各類算法診斷結(jié)果對比
表4結(jié)果表明,RF在傳統(tǒng)淺層模型中診斷準(zhǔn)確率最高,同時(shí)在訓(xùn)練集數(shù)據(jù)較少時(shí)也有較好的性能,但由于其需要提取小波包子帶能量作為特征向量,導(dǎo)致測試時(shí)間較長。相比于傳統(tǒng)淺層模型,深度學(xué)習(xí)模型在診斷準(zhǔn)確率上更高。CNN所需測試時(shí)間最短,但它受訓(xùn)練集數(shù)據(jù)規(guī)模影響較大,在訓(xùn)練集數(shù)據(jù)較少的情況下,性能下降較為明顯,并且訓(xùn)練所需時(shí)間較長。所提出的FV-grcForestFS在兩種不同規(guī)模訓(xùn)練數(shù)據(jù)集上診斷準(zhǔn)確率分別為99.81%和99.19%,比其他方法更高,訓(xùn)練時(shí)間在深度學(xué)習(xí)模型中也最短。對于測試時(shí)間,由于FV-MGS時(shí)間花費(fèi)較長,造成整體檢測時(shí)間較CNN更長。盡管如此,這三種深度學(xué)習(xí)模型在識別速度上仍處于相同量級。綜合來看,F(xiàn)V-grcForestFS用于滾動軸承的故障診斷時(shí)具有較高的診斷準(zhǔn)確率和診斷效率,這對工程實(shí)際應(yīng)用有著重要意義。
3.2.1數(shù)據(jù)采集
本實(shí)驗(yàn)所需的數(shù)據(jù)采集于液壓泵故障模擬實(shí)驗(yàn)臺。液壓原理如圖9所示,使用固定在柱塞泵殼體上的三個(gè)振動加速度傳感器進(jìn)行同源信號采集,分別為徑向水平方向X、徑向垂直方向Y和軸向Z。實(shí)驗(yàn)臺部分主要元件的性能參數(shù)如表5所示,實(shí)物照片如圖10a所示。
圖9 液壓泵故障模擬實(shí)驗(yàn)臺液壓原理圖
表5 實(shí)驗(yàn)臺主要元件
數(shù)據(jù)采集軟件采用NI公司的LabView,該采集系統(tǒng)可以保證同源雙通道20 kHz的采集速率。實(shí)驗(yàn)前,準(zhǔn)備好相應(yīng)的故障替換部件,包括滑靴磨損(輕、中、重)、松靴(輕、中、重)、中心彈簧磨損(輕、中、重)和斜盤磨損,如圖10b所示。
(a)實(shí)驗(yàn)臺 (b)故障替換件
在實(shí)驗(yàn)中,調(diào)定工作壓力為15 MPa,對X、Y、Z方向的振動信號進(jìn)行采樣,采樣頻率設(shè)為20 kHz。通過故障件替換正常件的方法進(jìn)行故障注入,實(shí)現(xiàn)對柱塞泵不同故障下的同源振動信號采集。采集時(shí)間設(shè)置為10 s,即每組采集2×106個(gè)數(shù)據(jù)點(diǎn)。本實(shí)驗(yàn)采用重疊截?cái)嗟姆绞缴上鄳?yīng)的訓(xùn)練集與測試集,其中截?cái)啻翱诖笮?024個(gè)數(shù)據(jù)點(diǎn),重疊大小為512。每種類型可生成380組樣本,并采用了兩種不同比例的數(shù)據(jù)集劃分方法,得到數(shù)據(jù)集A2、B2,如表6所示。
表6 液壓泵數(shù)據(jù)集及劃分
3.2.2診斷結(jié)果及分析
在本實(shí)驗(yàn)中,F(xiàn)V-grcForestFS、gcForest以及各對比方法的參數(shù)與實(shí)驗(yàn)1設(shè)置相同。FV-MGS性能如圖11所示,可以看出,相對于單通道信號MGS,F(xiàn)V-MGS使模型在訓(xùn)練時(shí)間以及測試準(zhǔn)確率上都有較大改善。單源信號經(jīng)MGS與同源雙通道信號經(jīng)FV-MGS提取特征的可視化結(jié)果如圖12所示。
圖11 全矢多粒度掃描的性能(實(shí)驗(yàn)2)
由圖12可以看出,單通道信號經(jīng)MGS處理無法有效提取增強(qiáng)特征,各類型樣本重疊嚴(yán)重,這也導(dǎo)致模型診斷準(zhǔn)確率較低。與之相比,同源信號經(jīng)過FV-MGS處理后,可清楚地區(qū)分液壓泵11種不同狀態(tài),即便是小訓(xùn)練樣本依然有較好表現(xiàn)。
(a)X(MGS)
使用混淆矩陣對20次重復(fù)實(shí)驗(yàn)中的一次測試結(jié)果進(jìn)行展示,圖13所示為FV-grcForestFS在兩種不同比例數(shù)據(jù)集A2、B2上的診斷結(jié)果。由圖13可以看出,在兩種不同比例數(shù)據(jù)集上,F(xiàn)V-grcForestFS對柱塞泵各種不同程度狀態(tài)類型均能做到有效識別。
(a)數(shù)據(jù)集A1
表7所示為各類算法故障診斷結(jié)果,可以看出,由于柱塞泵故障具有種類多、程度變化大的特點(diǎn),給診斷帶來了難度。因此,傳統(tǒng)淺層診斷方法在兩種比例數(shù)據(jù)集上性能較差,也表明液壓泵比軸承診斷難度更大。當(dāng)各類訓(xùn)練集樣本數(shù)量為260時(shí),CNN和gcForest模型診斷準(zhǔn)確率分別為95.30%和95.81%,而FV-grcForestFS接近100%。同時(shí)FV-grcForestFS模型在各類訓(xùn)練集樣本僅為40的條件下,也達(dá)到了99.23%的診斷準(zhǔn)確率,遠(yuǎn)高于其余模型的診斷準(zhǔn)確率。因此,所提出的FV-grcForestFS模型能有效地對液壓泵進(jìn)行故障診斷,既能區(qū)別出不同故障類型,同時(shí)又能分辨出不同的故障程度。
表7 實(shí)驗(yàn)2各類算法診斷結(jié)果對比
(1)全矢多粒度掃描(FV-MGS)能有效提取旋轉(zhuǎn)設(shè)備完備的故障信息,彌補(bǔ)單源信號信息不完備的弊端,為提高故障診斷準(zhǔn)確率提供了可靠特征。
(2)特征篩選級聯(lián)殘差森林(crForestFS)能對輸入特征進(jìn)行篩選,通過剔除無效特征來進(jìn)行特征約減,在提高性能的同時(shí)使每層模型訓(xùn)練時(shí)間節(jié)約近50%。
(3)將所提FV-grcForestFS與三種傳統(tǒng)淺層智能診斷模型(ELM、SVM、RF)和兩種深度學(xué)習(xí)模型(CNN、gcForest)進(jìn)行比較,F(xiàn)V-grcForestFS在軸承與液壓泵故障診斷實(shí)驗(yàn)中的端對端診斷準(zhǔn)確率均達(dá)到了99%以上,遠(yuǎn)高于其他模型結(jié)果,訓(xùn)練時(shí)間相較于深度學(xué)習(xí)模型也最短,且在小訓(xùn)練樣本條件下(訓(xùn)練/測試約為1∶8.5)仍能分別達(dá)到99.19%和99.23%的故障識別準(zhǔn)確率。
(4)盡管所提端對端模型取得了較高的診斷準(zhǔn)確率和較短的訓(xùn)練時(shí)間,但是FV-MGS中全矢數(shù)據(jù)融合的加入與其特殊的數(shù)據(jù)傳遞機(jī)制,會在一定程度上導(dǎo)致測試時(shí)間的增長。在未來的研究中,將探究優(yōu)化FV-MGS,進(jìn)一步提高故障診斷效率,使其更適于工程實(shí)際應(yīng)用。