收稿日期:2022-02-24
基金項(xiàng)目:國家自然科學(xué)基金(51465035);甘肅省自然科學(xué)基金(20JR5RA466)
通信作者:薛林林(1995—),男,碩士研究生,主要從事機(jī)械系統(tǒng)故障診斷方面的研究。xuell544614966@163.com
DOI:10.19912/j.0254-0096.tynxb.2022-0204 文章編號:0254-0096(2023)06-0436-09
摘 要:為解決實(shí)際應(yīng)用中風(fēng)力機(jī)滾動軸承故障訓(xùn)練樣本嚴(yán)重不足的問題,提出一種基于改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的小樣本滾動軸承故障診斷模型。首先,該模型將擠壓與激勵網(wǎng)絡(luò)嵌入到一維殘差神經(jīng)網(wǎng)絡(luò)中,增加了模型的特征提取能力;其次,使用源域數(shù)據(jù)對所搭建改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,確定結(jié)構(gòu)和參數(shù),并使用L2正則化和Dropout機(jī)制抑制過擬合;然后,引入遷移學(xué)習(xí),凍結(jié)使用源域數(shù)據(jù)訓(xùn)練好的部分模型參數(shù),使用少量目標(biāo)域數(shù)據(jù)對模型的全連接層參數(shù)進(jìn)行微調(diào);最后,對不同故障的樣本進(jìn)行分類。該方法在凱斯西儲大學(xué)軸承數(shù)據(jù)集和本實(shí)驗(yàn)室軸承數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明:在不同實(shí)驗(yàn)條件下,所提方法與其他方法的計(jì)算結(jié)果進(jìn)行比較,其均有更高的故障診斷準(zhǔn)確度和更強(qiáng)的泛化能力。
關(guān)鍵詞:風(fēng)力機(jī);滾動軸承;故障診斷;遷移學(xué)習(xí);擠壓與激勵網(wǎng)絡(luò);小樣本
中圖分類號:TH133.33 " 文獻(xiàn)標(biāo)志碼:A
0 引 言
進(jìn)入21世紀(jì),能源安全和環(huán)境保護(hù)已成為全球化問題。各國政府高度重視發(fā)展可再生能源,風(fēng)力發(fā)電作為可再生能源技術(shù)之一,由于其存在眾多優(yōu)點(diǎn),正朝著大型化、規(guī)?;姆较虬l(fā)展。旋轉(zhuǎn)機(jī)械是風(fēng)力機(jī)中廣泛使用的機(jī)械類型之一,其可靠性和安全性對風(fēng)力機(jī)的穩(wěn)定運(yùn)行至關(guān)重要。軸承是旋轉(zhuǎn)機(jī)械中最關(guān)鍵的部件,由于其復(fù)雜的工作環(huán)境,也是最易損壞的部件之一[1-2]。因此,軸承故障的及時診斷對于保障風(fēng)電設(shè)備的高效運(yùn)行具有重要作用[3]。
近年來,隨著智能制造的發(fā)展,設(shè)備運(yùn)行數(shù)據(jù)的獲取變得容易[4],這種情況促進(jìn)了基于深度學(xué)習(xí)的故障診斷方法的發(fā)展,并取得了一些顯著成果。文獻(xiàn)[5]采用基于門控遞歸單元的降噪自編碼器,在軸承數(shù)據(jù)分類任務(wù)中取得了較高的精度。文獻(xiàn)[6]通過人工變性天牛算法對SDAE網(wǎng)絡(luò)超參數(shù)進(jìn)行自適應(yīng)選取,在風(fēng)力機(jī)組軸承故障診斷中取得了更好的表現(xiàn)。文獻(xiàn)[7]將殘差神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)融合相結(jié)合,取得了更高的識別精度。
基于上述方法的故障診斷模型在軸承的狀態(tài)識別中取得了較好的結(jié)果,但需滿足2個條件:1)訓(xùn)練樣本與測試樣本同來源、同分布;2)需足量的數(shù)據(jù)集。
然而,在實(shí)際應(yīng)用中,一個具有充足樣本量的數(shù)據(jù)集需耗費(fèi)大量的精力和成本去采集和標(biāo)注[8],尤其是在風(fēng)電行業(yè),這就導(dǎo)致許多現(xiàn)實(shí)場景均存在數(shù)據(jù)量不足或標(biāo)注不足的情況,致使訓(xùn)練出的模型精確度不高或泛化能力低。因此,如何在小樣本條件下建立能夠有效識別滾動軸承故障的診斷模型已成為當(dāng)前一個重要的研究課題。
針對上述問題,遷移學(xué)習(xí)為學(xué)者們提供了一個思路[9]。遷移學(xué)習(xí)放松了機(jī)器學(xué)習(xí)的2個前提條件,解決了因數(shù)據(jù)分布不同而導(dǎo)致的傳統(tǒng)故障診斷方法應(yīng)用受限的問題[10]。文獻(xiàn)[11]針對滾動軸承振動數(shù)據(jù)少的問題,提出一種基于VMD和遷移學(xué)習(xí)的故障診斷模型,取得了更高的準(zhǔn)確率。文獻(xiàn)[12]提出一種基于CNN的小樣本遷移學(xué)習(xí)故障診斷框架,在故障樣本極少的情況下,取得了較高的準(zhǔn)確率。文獻(xiàn)[13]針對實(shí)際工況下可用的標(biāo)記故障數(shù)據(jù)較少等問題,提出一種深度遷移卷積神經(jīng)網(wǎng)絡(luò)模型,取得了較高的故障診斷精度。文獻(xiàn)[14]提出一種基于CNN和遷移學(xué)習(xí)的故障診斷模型,該模型在減小計(jì)算量的同時,還取得了較高的診斷精度。
上述方法在小樣本滾動軸承故障診斷中得到了較為廣泛的應(yīng)用,但仍存在不足之處。例如,使用數(shù)據(jù)來自同一型號軸承,只是從一種工況到另一種工況,并未考慮不同軸承振動信號之間的差異,其泛化能力未得到充分證實(shí)。此外,在風(fēng)力機(jī)滾動軸承數(shù)據(jù)采集和模型訓(xùn)練過程中,不同型號及工況下采集到的數(shù)據(jù)的特征分布存在漂移,使得模型的診斷精度降低;同時,訓(xùn)練樣本量過小,也易導(dǎo)致模型訓(xùn)練時出現(xiàn)過擬合現(xiàn)象。
因此,為解決上述問題,本文提出一種基于改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的滾動軸承故障診斷模型。首先,構(gòu)建一種基于一維殘差神經(jīng)網(wǎng)絡(luò)與擠壓與激勵網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)模型,并使用大量源域樣本對其進(jìn)行訓(xùn)練;然后將訓(xùn)練好的部分模型參數(shù)遷移至目標(biāo)域,通過少量目標(biāo)域樣本對模型進(jìn)行微調(diào);最后得到適用于小樣本故障診斷的神經(jīng)網(wǎng)絡(luò)模型,并通過不同數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。
1 基本原理
1.1 ResNet
為解決神經(jīng)網(wǎng)絡(luò)隨深度增加而產(chǎn)生的網(wǎng)絡(luò)退化問題,何凱明等[15]提出殘差神經(jīng)網(wǎng)絡(luò)(residual neural network, ResNet)。ResNet由多個殘差模塊堆疊組成,殘差模塊如圖1所示。
殘差模塊通過捷徑連接的方式,將輸入數(shù)據(jù)直接傳遞至輸出,使整個模型只需學(xué)習(xí)輸入和輸出之間不同的部分,在簡化網(wǎng)絡(luò)學(xué)習(xí)任務(wù)的同時,提高了網(wǎng)絡(luò)的判別能力。其學(xué)習(xí)過程為:
[Hx=Fx+x]"" (1)
式中:[x]——恒等映射;[Hx]——未知映射;[Fx]——?dú)埐钣成洹?/p>
得益于捷徑連接,ResNet計(jì)算性質(zhì)從乘法變?yōu)榧臃?,極大地緩解了隨網(wǎng)絡(luò)深化而出現(xiàn)的網(wǎng)絡(luò)退化問題,提高了模型訓(xùn)練時的穩(wěn)定性,使可訓(xùn)練網(wǎng)絡(luò)的層數(shù)大大增加。
1.2 SENet
胡潔等[16]于2018年提出擠壓與激勵網(wǎng)絡(luò)(squeeze-and-excitation networks, SENet),該網(wǎng)絡(luò)自動學(xué)習(xí)每個特征通道的重要性參數(shù),并根據(jù)獲得的參數(shù)對特征進(jìn)行提取,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
在傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)中,通常會對卷積后得到的每個通道都進(jìn)行相同的處理,即分配的權(quán)重是相同的。但在實(shí)際中,卷積后每個通道提取的特征信息不同,其重要性也不同。SENet通過Squeeze模塊和Exciation模塊實(shí)現(xiàn)了通道之間的權(quán)重生成,提高了對有用信息的敏感程度。
首先,輸入數(shù)據(jù)在Squeeze模塊通過全局平均池化進(jìn)行特征壓縮,從而將每個特征圖在一定程度上轉(zhuǎn)化為一個具有全局感受野的實(shí)數(shù),如式(2)所示。
[Zc=Fsquc=1H×Wi=1Hj=1Wuci,j]"" (2)
式中:[Fsq]——Squeeze操作;[Zc]——Squeeze模塊輸出,也為Exciation模塊的輸入;[uci,j]——輸入數(shù)據(jù)。
然后,將數(shù)據(jù)導(dǎo)入Exciation模塊。Exciation操作通過參數(shù)[W]學(xué)習(xí)通道之間的非線性關(guān)系,并更新每一個特征通道相對應(yīng)的權(quán)重,如式(3)所示。
[s=Fexz,W=σgz,W=σW2δW1z] (3)
式中:[s]——特征通道權(quán)重;[σ]——Sigmoid激活函數(shù);[W1]、[W2]——全連接層參數(shù);[δ]——ReLU激活函數(shù)。
最后,對數(shù)據(jù)進(jìn)行重標(biāo)定操作。Exciation模塊輸出值為每個特征通道的重要程度,將輸出值通過點(diǎn)積方式逐個通道加權(quán)到先前的特征上,實(shí)現(xiàn)原始特征通道的重新標(biāo)定,如式(4)所示。
[X′=Fscaleuc,sc=sc?uc]" (4)
式中:[sc∈0,1];[uc]——特征通道。
SENet作為一個獨(dú)立的子網(wǎng)絡(luò)結(jié)構(gòu),可嵌入到原有的網(wǎng)絡(luò)中,從而提升網(wǎng)絡(luò)模型對有用特征的敏感程度。SENet只需增加少量的計(jì)算量,便可提升模型的分類準(zhǔn)確度。
本文將SENet嵌入到一維殘差神經(jīng)網(wǎng)絡(luò)中,以提升模型對有用特征的利用程度。SENet嵌入到殘差模塊的網(wǎng)絡(luò)結(jié)構(gòu)圖如圖3所示。
1.3 遷移學(xué)習(xí)
1901年,Thorndike和Woodworth提出遷移學(xué)習(xí)(Transfer learning)概念。他們從教育心理學(xué)的角度出發(fā),發(fā)現(xiàn)人類可利用已有知識更快地解決新的問題。2010年,遷移學(xué)習(xí)被重新定義[17]。遷移學(xué)習(xí)即利用數(shù)據(jù)之間的關(guān)聯(lián)性,將知識遷移到新領(lǐng)域中,達(dá)到提高準(zhǔn)確性或減少訓(xùn)練時間的目的。
領(lǐng)域(Domain)和任務(wù)(Task)是遷移學(xué)習(xí)的2個基礎(chǔ)性概念。依據(jù)數(shù)據(jù)的不同來源和作用,領(lǐng)域被分為源域[Ds]和目標(biāo)域[Dt],由特征空間[χ]及邊際概率分布[P(X)]組成。在概率分布[P(X)]中,[X=x1,x2,???,xn∈χ]。源域[Ds]中存在許多標(biāo)注數(shù)據(jù),用于訓(xùn)練分類器,但源域中的數(shù)據(jù)和目標(biāo)域中的數(shù)據(jù)之間存在差異。目標(biāo)域[Dt]包含少量帶有標(biāo)注的訓(xùn)練數(shù)據(jù),可用于微調(diào)分類器以提高分類精度,完成分類任務(wù)。任務(wù)[T]由標(biāo)記空間[Y]和預(yù)測函數(shù)[f?]組成,形式為[T=Y,f?]。函數(shù)[f?]可以用來預(yù)測實(shí)例[x]的相應(yīng)預(yù)測函數(shù)值[fx]。遷移學(xué)習(xí)模型如圖4所示。
隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,遷移學(xué)習(xí)以其訓(xùn)練時間少、效率高和無需大量訓(xùn)練數(shù)據(jù)等優(yōu)點(diǎn),被應(yīng)用于越來越多的領(lǐng)域。
2 新滾動軸承故障診斷模型的建立
本文將SENet對有用特征的敏感性與1D-ResNet的強(qiáng)大特征提取能力充分結(jié)合,并將遷移學(xué)習(xí)應(yīng)用于風(fēng)力機(jī)小樣本滾動軸承故障診斷中,提出基于改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的滾動軸承故障診斷方法。風(fēng)力機(jī)滾動軸承故障診斷流程如圖5所示。
具體步驟為:
1)采集風(fēng)力機(jī)滾動軸承振動信號。為保障故障信息的完整性和可靠性,本文將每個故障數(shù)據(jù)樣本長度設(shè)置為2048,對每個樣本均做歸一化處理,如式(5)所示。
[x=x-xminxmax-xmin] (5)
數(shù)據(jù)增強(qiáng)方法采用重疊采樣,即對于源域樣本,分割數(shù)據(jù)時,相鄰樣本之間重疊1024個采樣點(diǎn),目標(biāo)域樣本則無重疊,從而達(dá)到增加訓(xùn)練樣本量的目的。
2)采用one-hot編碼方式對分割好的數(shù)據(jù)打上標(biāo)簽,按比例劃分訓(xùn)練集、驗(yàn)證集和測試集。
3)將SENet嵌入到1D-ResNet中,構(gòu)建改進(jìn)后的殘差模塊,按序堆疊,搭建改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)模型;在所搭建模型的全連接層之間加入Dropout層和L2正則化以抑制過擬合現(xiàn)象,初始化各參數(shù)。
4)將源域數(shù)據(jù)導(dǎo)入模型中,訓(xùn)練模型參數(shù),保存模型。
5)將保存的模型遷移至目標(biāo)域,凍結(jié)部分模型參數(shù),使用目標(biāo)域微調(diào)樣本對全連接層參數(shù)進(jìn)行微調(diào)。
6)使用微調(diào)后的模型對目標(biāo)域測試集數(shù)據(jù)進(jìn)行滾動軸承故障診斷,獲取分類結(jié)果,驗(yàn)證模型性能。
3 軸承故障實(shí)驗(yàn)驗(yàn)證及分析
為證明所提故障診斷模型的有效性,本文通過不同實(shí)驗(yàn)進(jìn)行驗(yàn)證。同時,為表明所提方法的診斷精度和穩(wěn)定性,將本文模型與基于遷移學(xué)習(xí)的ResNet模型(TL-ResNet)和基于遷移學(xué)習(xí)的CNN模型(TL-CNN)各自的分類結(jié)果進(jìn)行比較。
本文選用凱斯西儲大學(xué)(Case Western Reserve University, CWRU)軸承數(shù)據(jù)庫數(shù)據(jù)與本實(shí)驗(yàn)室MFS軸承試驗(yàn)臺采集的數(shù)據(jù),分別做以下對比實(shí)驗(yàn):
1)CWRU軸承數(shù)據(jù)庫數(shù)據(jù)跨工況(不同負(fù)載)故障診斷實(shí)驗(yàn);
2)以CWRU軸承數(shù)據(jù)庫數(shù)據(jù)為源域,實(shí)驗(yàn)室軸承試驗(yàn)臺采集數(shù)據(jù)為目標(biāo)域,做跨型號跨工況故障診斷實(shí)驗(yàn);
3)以實(shí)驗(yàn)室軸承試驗(yàn)臺采集數(shù)據(jù)為源域,CWRU軸承數(shù)據(jù)庫數(shù)據(jù)為目標(biāo)域,做跨型號跨工況故障診斷實(shí)驗(yàn)。
3.1 實(shí)驗(yàn)數(shù)據(jù)來源及設(shè)置
本實(shí)驗(yàn)選用CWRU軸承實(shí)驗(yàn)數(shù)據(jù)[18]與本實(shí)驗(yàn)室MFS軸承試驗(yàn)臺采集數(shù)據(jù)。
CWRU軸承實(shí)驗(yàn)數(shù)據(jù)包含健康軸承和具有內(nèi)圈、外圈以及滾動體故障的軸承。試驗(yàn)臺由電機(jī)、軸承、傳感器、功率測試計(jì)等組成。數(shù)據(jù)選用試驗(yàn)臺驅(qū)動端軸承數(shù)據(jù),軸承型號為SKF6205,采樣頻率為12 kHz。故障類型分別為正常、內(nèi)圈損傷、外圈損傷和滾動體損傷。
本實(shí)驗(yàn)室MFS軸承試驗(yàn)臺為SQI公司所制造,試驗(yàn)臺滾動軸承固定在支座內(nèi),軸承型號為ER-16K,左側(cè)為故障軸承,右側(cè)為健康軸承,在2個軸承中間安裝5.1 kg的轉(zhuǎn)子盤施加50 N的徑向載荷,采樣頻率為15.36 kHz。試驗(yàn)臺左側(cè)軸承有4種狀態(tài),分別為正常、內(nèi)圈損傷、外圈損傷和滾動體損傷,損傷深度為0.2 mm。
3.2 模型結(jié)構(gòu)參數(shù)設(shè)置
本文選用Adam優(yōu)化算法自適應(yīng)調(diào)整學(xué)習(xí)率的大小,初始學(xué)習(xí)率設(shè)置為0.001,保證了參數(shù)的平穩(wěn)性。為防止因樣本量過小易出現(xiàn)的過擬合現(xiàn)象,在所搭建模型的2個全連接層之間加入Dropout層以及L2正則化,Dropout大小設(shè)置為0.5。迭代次數(shù)設(shè)置為30,batch_size為20。
保存使用源域數(shù)據(jù)訓(xùn)練好的模型,將模型遷移至目標(biāo)域,凍結(jié)除全連接層參數(shù)之外的所有參數(shù),在目標(biāo)域上隨機(jī)選取樣本對模型進(jìn)行微調(diào),微調(diào)時迭代次數(shù)設(shè)置為100。將batch_size分別設(shè)置為1、2、4、8進(jìn)行實(shí)驗(yàn),發(fā)現(xiàn)當(dāng)batch_size設(shè)置為1時故障分類效果最好,故將微調(diào)參數(shù)batch_size設(shè)置為1。
3.3 跨工況遷移故障診斷實(shí)驗(yàn)
滾動軸承在實(shí)際工作中,其負(fù)載大小往往會發(fā)生改變,因此,驗(yàn)證所提出的故障診斷模型在不同負(fù)載工況下的分類準(zhǔn)確率是非常有必要的。
依據(jù)負(fù)載的不同,將CWRU軸承數(shù)據(jù)集分為4組,每組數(shù)據(jù)中,各軸承狀態(tài)均有600個樣本數(shù)據(jù),共計(jì)2400個,并按7∶1∶2的比例劃分訓(xùn)練集、驗(yàn)證集和測試集。軸承工作狀態(tài)及故障信息見表1。
實(shí)驗(yàn)1:使用源域數(shù)據(jù)分別對所搭建的本文模型、TL-ResNet模型和基于時域分析的TL-CNN模型進(jìn)行訓(xùn)練。本文模型訓(xùn)練過程中的準(zhǔn)確率和損失率曲線如圖6所示。由圖6可看出,在第6個迭代次數(shù)后,本文模型在源域測試集上準(zhǔn)確率達(dá)到99.89%,損失率也下降到0.35%,并在之后的訓(xùn)練中趨于平穩(wěn)。這表明本文模型在滾動軸承故障診斷中具有良好的穩(wěn)定性和分類效果。
為說明模型在跨工況條件下的分類效果,在目標(biāo)域數(shù)據(jù)集中隨機(jī)選取單類6個樣本對全連接層參數(shù)微調(diào),并取300個樣本作為測試集。實(shí)驗(yàn)結(jié)果如表2所示,符號“→”的左側(cè)表示源域,右側(cè)表示目標(biāo)域,“→”表示不同域之間模型的遷移。
從表2中的分類結(jié)果來看,本文方法的平均準(zhǔn)確率與穩(wěn)定性明顯高于其余2種方法。當(dāng)源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)來源相同時,3種模型均可獲得最高的平均分類準(zhǔn)確率。TL-ResNet模型相較于TL-CNN模型分類結(jié)果較好,且穩(wěn)定性更好。但在跨工況的4組實(shí)驗(yàn)中,本文方法的平均分類準(zhǔn)確率在所有情況下均明顯優(yōu)于TL-ResNet模型和TL-CNN模型。以源域數(shù)據(jù)為工況0,目標(biāo)域數(shù)據(jù)為工況1為例,本文方法的平均準(zhǔn)確率為99.35%,比TL-ResNet模型高5.09%,比TL-CNN模型高14.07%。從表2數(shù)據(jù)中也可看出,本文方法的穩(wěn)定性均高于其余2種方法,這表明本文方法改善了在負(fù)載改變時,隨診斷結(jié)果的不確定性增加而增加的診斷誤差問題。因此,在跨工況小樣本滾動軸承故障診斷方面,本文所提方法具有更好的特征提取能力和泛化能力,同時避免了小樣本故障診斷的過擬合問題。
3.4 跨型號跨工況故障診斷實(shí)驗(yàn)
在實(shí)際場景中,不同旋轉(zhuǎn)機(jī)械的軸承型號也可能不同,其軸承振動信號也不盡相同,因此,為了能應(yīng)用于實(shí)際現(xiàn)場,
驗(yàn)證所提出的故障診斷模型在不同軸承型號之間的分類準(zhǔn)確率是非常有必要的。軸承實(shí)驗(yàn)數(shù)據(jù)如表3所示,數(shù)據(jù)集A為CWRU軸承實(shí)驗(yàn)數(shù)據(jù),數(shù)據(jù)集B為本實(shí)驗(yàn)室MFS軸承試驗(yàn)臺采集數(shù)據(jù)。
3.4.1 A→B跨型號跨工況故障診斷
實(shí)驗(yàn)2:源域數(shù)據(jù)為數(shù)據(jù)集A,目標(biāo)域數(shù)據(jù)為數(shù)據(jù)集B,做跨型號跨工況故障診斷實(shí)驗(yàn)。使用源域數(shù)據(jù)對本文模型、TL-ResNet模型和基于時域分析的TL-CNN模型進(jìn)行訓(xùn)練,凍結(jié)訓(xùn)練好的部分模型參數(shù),分別在目標(biāo)域數(shù)據(jù)上隨機(jī)選取單類6、8、12、16、20個樣本對全連接層參數(shù)進(jìn)行微調(diào),取300個樣本作為測試集,其余樣本為驗(yàn)證集。實(shí)驗(yàn)結(jié)果如圖7所示。
由圖7可看出,在A→B跨型號跨工況的軸承故障診斷實(shí)驗(yàn)中,僅使用6個微調(diào)樣本,本文方法的平均分類準(zhǔn)確率便達(dá)到94.18%,高于TL-ResNet模型的88.21%和TL-CNN模型的78.94%;隨著微調(diào)樣本數(shù)量的增加,分類準(zhǔn)確率均有所提升,在微調(diào)樣本數(shù)為12時,本文方法的分類準(zhǔn)確率為99.56%,比TL-ResNet模型高3.8%,比TL-CNN模型高17.3%。
相較于TL-ResNet模型和TL-CNN模型,本文方法采用SENet捕獲特征通道之間的信息,加強(qiáng)模型對有用特征的使用能力,因此,本文方法取得了更高的故障診斷精度。同時,在本小節(jié)中,源域數(shù)據(jù)選取多個故障尺寸下的故障信息,使訓(xùn)練好的模型具有更強(qiáng)的魯棒性,在測試目標(biāo)域數(shù)據(jù)集時具有更為穩(wěn)定的準(zhǔn)確率。
混淆矩陣可直觀看出不同故障類型被錯分的數(shù)量和類型,本文方法的故障診斷分類結(jié)果混淆矩陣如圖8所示。由圖8可看出,隨著微調(diào)樣本數(shù)量的增加,被錯分的故障樣本越來越少,在微調(diào)樣本數(shù)為20時,僅有2個樣本被錯分,且均為外圈損傷被誤判為內(nèi)圈損傷,說明了本文所提方法在故障診斷方面的具有優(yōu)異的判別能力。
此外,不同樣本數(shù)下的模型診斷性能和穩(wěn)定性也可通過箱線圖更直觀地表達(dá),如圖9所示。由圖9可看出,本文所提方法在所有情況下均具有更好的分類效果和穩(wěn)定性。如圖9d所示,本文所提方法識別準(zhǔn)確率均在(99.84±0.1)%,相較于其余2種方法具有更小的方差,且基于時域分析的TL-CNN模型還伴有異常值的出現(xiàn)。
3.4.2 A→B不同故障程度下的跨型號跨工況故障診斷
為進(jìn)一步研究遷移過程中不同故障程度對模型診斷性能的影響,設(shè)置實(shí)驗(yàn)3進(jìn)行驗(yàn)證。
實(shí)驗(yàn)3:源域數(shù)據(jù)集為數(shù)據(jù)集A,選擇故障直徑分別為0.18、0.36和0.54 mm的3組軸承數(shù)據(jù);目標(biāo)域數(shù)據(jù)集為數(shù)據(jù)集B,共包含故障直徑分別為1.2、1.8和2.4 mm的3組軸承數(shù)據(jù),分別進(jìn)行實(shí)驗(yàn)以討論不同故障程度對模型性能的影響,實(shí)驗(yàn)結(jié)果如表4所示。由表4可看出,在每種實(shí)驗(yàn)條件下,本文所提方法的平均分類準(zhǔn)確率均在93.88%以上,驗(yàn)證了本文方法的魯棒性和識別能力。
一方面,從源域故障直徑的影響考慮,當(dāng)源域故障直徑改變時,模型的分類結(jié)果也發(fā)生變化。當(dāng)源域數(shù)據(jù)故障直徑為0.36和0.54 mm時,所提方法的故障診斷準(zhǔn)確率分別達(dá)到94.43%以上和94.24%以上,優(yōu)于在源域數(shù)據(jù)故障直徑為0.18 mm時的故障診斷表現(xiàn)。源域數(shù)據(jù)故障直徑為0.36 mm時的平均故障診斷準(zhǔn)確率略高于源域數(shù)據(jù)故障直徑為0.54 mm時,這是因?yàn)殡S著故障直徑的增大,雖然故障的特征更為明顯,但卻伴隨著更多噪聲干擾信息的產(chǎn)生,降低了部分模型性能。
另一方面,表4也顯示了這樣一個趨勢,即目標(biāo)域故障直徑越大,故障診斷準(zhǔn)確率越高。在所有實(shí)驗(yàn)條件下,當(dāng)目標(biāo)域故障直徑為2.4 mm時,均取得該組中的最大準(zhǔn)確率。因此,當(dāng)目標(biāo)域故障尺寸更大時,故障的種類更易區(qū)分,模型也可獲取更多更有價(jià)值的故障特征信息,從而獲得更高的故障診斷精度。同時,由表4中分類準(zhǔn)確率的上下偏差可看出,所提方法具有很強(qiáng)的故障診斷穩(wěn)定性,其上下偏差最大值僅為0.71%。
3.4.3 B→A跨型號跨工況故障診斷
實(shí)驗(yàn)4:源域數(shù)據(jù)為數(shù)據(jù)集B,目標(biāo)域數(shù)據(jù)為數(shù)據(jù)集A,做跨型號跨工況的對比故障診斷實(shí)驗(yàn),各參數(shù)賦值同3.4.1,實(shí)驗(yàn)結(jié)果如圖10所示。
如圖10所示,B→A跨型號跨工況的軸承故障診斷實(shí)驗(yàn)中,在使用6個微調(diào)樣本的情況下,本文方法的平均分類準(zhǔn)確率為92.17%,遠(yuǎn)高于TL-ResNet模型的69.05%和TL-CNN模型的76.74%。在微調(diào)樣本數(shù)為12時,本文方法的分類準(zhǔn)確率便達(dá)99.01%,比TL-ResNet模型高13.65%,比TL-CNN模型高15.71%。
經(jīng)過以上對比分析可知,本文所提方法在各種情況下均優(yōu)于TL-ResNet模型和TL-CNN模型,在僅使用6個微調(diào)樣本的情況下,跨型號跨工況軸承故障診斷的平均準(zhǔn)確率比其余模型高6%~23%。因此,所提方法具有更強(qiáng)的泛化能力和更高的故障診斷精度,實(shí)驗(yàn)結(jié)果驗(yàn)證了本文所提方法的有效性和可行性。
4 結(jié) 論
本文針對風(fēng)力機(jī)滾動軸承故障診斷中存在的小樣本問題,提出一種基于改進(jìn)殘差神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)的故障診斷模型。通過CWRU軸承數(shù)據(jù)集與本實(shí)驗(yàn)室軸承數(shù)據(jù)集對模型在不同型號及不同工況之間的分類性能進(jìn)行驗(yàn)證,體現(xiàn)了該模型的優(yōu)越性,并得出以下結(jié)論:
1)本文所提模型充分利用了ResNet的特征提取能力,在此基礎(chǔ)上引入SENet以提取特征通道信息,加強(qiáng)了有用特征的權(quán)重,相較于TL-ResNet模型和基于時域分析的TL-CNN模型,不僅具有更高的分類準(zhǔn)確率,還具備更好的診斷穩(wěn)定性,有利于風(fēng)力機(jī)等機(jī)械設(shè)備的良好運(yùn)行。
2)本文所提模型使用一種預(yù)訓(xùn)練微調(diào)的遷移學(xué)習(xí)方法,該方法通過軸承數(shù)據(jù)之間的相似性在目標(biāo)域中共享源域訓(xùn)練參數(shù),并使用少量目標(biāo)域樣本微調(diào)模型參數(shù),使模型參數(shù)更符合目標(biāo)域數(shù)據(jù)分類的需求。
3)選用不同負(fù)載工況下的源域數(shù)據(jù)和目標(biāo)域數(shù)據(jù),相較于其他常用智能診斷算法,該模型具有更好的特征提取能力和泛化能力,同時避免了小樣本故障診斷的過擬合問題。
4)在跨型號跨工況的情況下,本文所提模型能準(zhǔn)確識別軸承數(shù)據(jù)集的4種不同故障狀態(tài),在僅使用6個微調(diào)樣本的情況下,分類準(zhǔn)確率便達(dá)到92.17%以上,在微調(diào)樣本不斷增加時,該模型依舊保證了其在故障診斷方面的優(yōu)越性。
[參考文獻(xiàn)]
[1]" CHEN Z Q, DENG S C, CHEN X D, et al. Deep neural networks-based rolling bearing fault diagnosis[J]. Microelectronics reliability, 2017, 75: 327-333.
[2]" 向玲, 李營. 風(fēng)力機(jī)組滾動軸承復(fù)合故障診斷研究[J]. 太陽能學(xué)報(bào), 2021, 42(3): 90-97.
XIANG L,LI Y. Research on composite fault diagnosis of wind turbine rolling bearings[J]. Acta energiae solaris sinica, 2021, 42(3): 90-97.
[3]" 張文龍, 胡天亮, 王艷潔, 等. 云/邊緣協(xié)同的軸承故障診斷方法[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2020, 26(3): 589-599.
ZHANG W L, HU T L, WANG Y J, et al. A cloud/edge collaborated bearing fault diagnosis method[J]. Computer integrated manufacturing systems, 2020, 26(3): 589-599.
[4]" 趙春華, 胡恒星, 陳保家, 等. 基于深度學(xué)習(xí)特征提取和WOA-SVM狀態(tài)識別的軸承故障診斷[J]. 振動與沖擊, 2019, 38(10): 31-37, 48.
ZHAO C H, HU H X, CHEN B J, et al. Bearing fault diagnosis based on the deep learning feature extraction and WOA-SVM state recognition[J]. Journal of vibration and shock, 2019, 38(10): 31-37, 48.
[5]" LIU H, ZHOU J Z, ZHENG Y, et al. Fault diagnosis of rolling bearings with recurrent neural network based autoencoders[J]. ISA transactions, 2018, 77: 167-178.
[6]" 余萍, 曹潔. 優(yōu)化堆疊降噪自動編碼器滾動軸承故障診斷[J]. 太陽能學(xué)報(bào), 2021, 42(11): 307-314.
YU P, CAO J. Optimized stacked denoising auto-encoders (SDAE)-based fault diagnosis of rolling bearing[J]. Acta energiae solaris sinica, 2021, 42(11): 307-314.
[7]" PENG B S, XIA H, LYU X Z, et al. An intelligent fault diagnosis method for rotating machinery based on data fusion" and" deep" residual"" neural" network[J]." Applied intelligence, 2022, 52: 3051-3065.
[8]" 張根保, 李浩, 冉琰, 等. 一種用于軸承故障診斷的遷移學(xué)習(xí)模型[J]. 吉林大學(xué)學(xué)報(bào)(工學(xué)版), 2020, 50(5): 1617-1626.
ZHANG G B, LI H, RAN Y, et al. A transfer learning model" for" bearing" fault"" diagnosis[J]." Journal" of" Jilin University(engineering and technology edition), 2020, 50(5): 1617-1626.
[9]" XUE T, WU D H, WANG H G, et al. Research on application of transfer learning in equipment fault diagnosis[J]."" Journal"" of" physics:" conference" series,"" 2021, 1986(1): 012099.
[10]" WEISS K, KHOSHGOFTAAR T M, WANG D D. A survey of transfer learning[J]. Journal of big data, 2016, 3(1): 9-48.
[11]" 康守強(qiáng), 胡明武, 王玉靜, 等. 基于特征遷移學(xué)習(xí)的變工況下滾動軸承故障診斷方法[J]. 中國電機(jī)工程學(xué)報(bào), 2019, 39(3): 764-772.
KANG S Q, HU M W, WANG Y J, et al. Fault diagnosis method of a rolling bearing under variable working conditions based on feature transfer learning[J]. Proceedings of the CSEE, 2019, 39(3): 764-772.
[12]" WU J Y, ZHAO Z B, SUN C, et al. Few-shot transfer learning for intelligent fault diagnosis of machine[J]. Measurement, 2020, 166: 108202.
[13]" CHEN Z H, CEN J, XIONG J B. Rolling bearing fault diagnosis using time-frequency analysis and deep transfer convolutional neural network[J]. IEEE access, 2020, 8: 150248-150261.
[14]" ZHENG Z, FU J M, LU C Q, et al. Research on rolling bearing fault diagnosis of small dataset based on a new optimal"" transfer"" learning"" network[J]."" Measurement, 2021, 177: 109285.
[15]" HE K M, ZHANG X Y, REN S Q. Deep residual learning for image recognition[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, USA, 2016: 770-778.
[16]" HU J, SHEN L, SUN G, et al. Squeeze-and-excitation networks[C]//Proceedings" of" the" IEEE" Conference" on Computer Vision and Pattern Recognition(CVPR), Salt Lake City, USA, 2018: 7132-7141.
[17]" PAN S J, YANG Q. A survey on transfer learning[J]. IEEE transactions on knowledge and data engineering, 2010, 22(10): 1345-1359.
[18]" LAPARO K A. Bearing vibration data set[EB/OL]. http:// www. eecs.cwru.edu/laboratory/bearing/download.htm.
FAULT DIAGNOSIS METHOD OF WIND TURBINES ROLLING
BEARING BASED ON IMPROVED RESNET AND TRANSFER LEARNING
Lei Chunli1,2,Xue Linlin1,Jiao Mengxuan1,Zhang Huqiang1,Shi Jiashuo1
(1. School of Mechanical and Electronical Engineering, Lanzhou University of Technology, Lanzhou 730050, China;
2. Key Laboratory of Digital Manufacturing Technology and Application, Ministry of Education, Lanzhou University of Technology,
Lanzhou 730050, China)
Keywords:wind turbines; rolling bearings; fault diagnosis; transfer learning; squeeze-and-excitation networks;small sample