魏文軍,張軒銘,楊立本
(1.蘭州交通大學(xué) 自動化與電氣工程學(xué)院,蘭州 730070;2.蘭州交通大學(xué) 光電技術(shù)與智能控制教育部重點(diǎn)實(shí)驗(yàn)室,蘭州 730070)
軸承作為機(jī)械設(shè)備的重要旋轉(zhuǎn)部件,也是旋轉(zhuǎn)機(jī)械設(shè)備重要的故障源之一,復(fù)雜的結(jié)構(gòu)和嚴(yán)酷的工作條件,容易出現(xiàn)故障而造成較大的事故和經(jīng)濟(jì)損失[1-2],據(jù)統(tǒng)計(jì)機(jī)械設(shè)備中30%的故障由軸承引起[3]。為確保機(jī)械設(shè)備的長期穩(wěn)定運(yùn)行,有效的軸承故障診斷顯得尤為重要。傳統(tǒng)的故障診斷主要分為數(shù)據(jù)的特征提取和故障分類,對采集的振動信號進(jìn)行時頻域分析并提取特征,然后利用分類器進(jìn)行特征分類[4-5],特征提取方法主要包括傅里葉變換[6]、小波變換(WT)[7]、局部均值分解(LMD)[8]以及經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)[9-10]等;故障分類主要包括支持向量機(jī)(SVM)、隱馬爾可夫模型[11]和人工神經(jīng)網(wǎng)絡(luò)[12]等。但此類方法存在一定弊端,數(shù)據(jù)處理往往需要一定的專業(yè)知識及人工經(jīng)驗(yàn),存在數(shù)據(jù)利用不足以及早期微弱故障特征提取不充分等問題,其次機(jī)器學(xué)習(xí)需要手動挖掘特征,算法架構(gòu)過于淺薄難以處理復(fù)雜的非線性故障問題。
隨著大數(shù)據(jù)時代的到來,以“數(shù)據(jù)驅(qū)動”為基礎(chǔ)的深度學(xué)習(xí)[13]在圖像處理[14]和故障診斷[15-16]展現(xiàn)了獨(dú)特的優(yōu)勢。文獻(xiàn)[15]在傳統(tǒng)CNN激活函數(shù)的基礎(chǔ)上提出了STAC-tach自適應(yīng)激活函數(shù),通過改進(jìn)殘差網(wǎng)絡(luò)ResNet建立ResNet-STAC-tanch模型實(shí)現(xiàn)對軸承的非線性特征自適應(yīng)提取,文獻(xiàn)[16]提出了一種基于熱成像的軸承故障診斷,利用不同工況下的熱成像結(jié)合ANN和CNN實(shí)現(xiàn)故障診斷。上述文獻(xiàn)中存在一個問題,利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷需要大量數(shù)據(jù)訓(xùn)練,但在實(shí)際應(yīng)用的過程中故障數(shù)據(jù)難以獲得,數(shù)據(jù)量少難以滿足訓(xùn)練的要求,在數(shù)據(jù)不足的情況下容易發(fā)生過擬合現(xiàn)象嚴(yán)重影響分類結(jié)果。文獻(xiàn)[16-17]將CNN與SVM結(jié)合提出了小樣本情況下的故障診斷 ,文獻(xiàn)[17]利用遷移學(xué)習(xí)建立了故障樣本特征計(jì)算模型,將源域中學(xué)習(xí)到的故障信息遷移到目標(biāo)域,映射模型的輸出作為SVM的輸入,借助遷移學(xué)習(xí)和SVM分類器實(shí)現(xiàn)小樣本下的燃?xì)鈾C(jī)故障診斷,文獻(xiàn)[18]以軸承時域圖像為輸入,訓(xùn)練CNN模型,通過softmax層輸出的分類結(jié)果判斷是否滿足SVM最終分類條件,通過多次訓(xùn)練提取出最適合SVM分類的特征實(shí)現(xiàn)故障診斷。上述文獻(xiàn)中采用SVM作為最終分類器,SVM本質(zhì)上為二分類器,當(dāng)故障種類繁雜和樣本多時,需要構(gòu)建多分類器,運(yùn)算量大耗時長,實(shí)現(xiàn)多分類情況較困難,同時上述文獻(xiàn)CNN模型中全連接層中存在大量參數(shù),全連接層與softmax在整個卷積神經(jīng)網(wǎng)絡(luò)中起到“分類器”作用,全連接層將卷積池化提取的特征映射到樣本空間,但在訓(xùn)練CNN網(wǎng)絡(luò)時多數(shù)數(shù)據(jù)用于訓(xùn)練全連接層參數(shù),如果分類層使用不需要訓(xùn)練的方法實(shí)現(xiàn)分類,將可大大減少訓(xùn)練數(shù)據(jù),簡化卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
預(yù)訓(xùn)練微調(diào)可以將源域?qū)W習(xí)到的知識遷移到目標(biāo)域[19],由于源域中已經(jīng)學(xué)習(xí)到大量基礎(chǔ)知識,在目標(biāo)域中僅訓(xùn)練部分特殊特征數(shù)據(jù),即可完成網(wǎng)絡(luò)訓(xùn)練。文獻(xiàn)[20]根據(jù)源域與目標(biāo)域間數(shù)據(jù)分布不同,建立域自適應(yīng)神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)軸承不同工況間的故障診斷,文獻(xiàn)[21]使用與目標(biāo)域近似的輔助數(shù)據(jù),利用LSSVM遷移學(xué)習(xí)算法實(shí)現(xiàn)變工況下的軸承故障診斷,上述文獻(xiàn)在在變工況情況下可用數(shù)據(jù)充足,但實(shí)際大部分變工況情況下數(shù)據(jù)較少,同時上述文獻(xiàn)利用遷移學(xué)習(xí)對不同軸承型號情況下的故障診斷識別率提升程度較小,達(dá)不到實(shí)用化程度。
本文研究發(fā)現(xiàn)訓(xùn)練數(shù)據(jù)中有相當(dāng)數(shù)據(jù)用于訓(xùn)練CNN網(wǎng)絡(luò)中的全連接層和softmax層,而全連接層和softmax層主要用于分類,如果減少全連接層網(wǎng)絡(luò)參數(shù)和使用不需要訓(xùn)練的分類算法則可以顯著減少訓(xùn)練數(shù)據(jù)。模糊聚類(fuzzy clustering means,FCM)作為一種無監(jiān)督分類方法,利用模糊數(shù)學(xué)原理可以實(shí)現(xiàn)不需要訓(xùn)練即可實(shí)現(xiàn)多種故障分類,廣泛應(yīng)用于故障診斷[22]和圖像處理[23],為此本文針對以上不足借助凱斯西儲大學(xué)[24],提出了一種基于模糊聚類的改進(jìn)CNN-模型的軸承故障診斷,首先設(shè)計(jì)一維度自適應(yīng)的全局均值池化層(global average pooling,GAP)替換卷積神經(jīng)網(wǎng)絡(luò)的全連接層網(wǎng)絡(luò),縮減網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)量,減少所需訓(xùn)練樣本,同時以模糊聚類代替softmax函數(shù)分類,將軸承時域圖像輸入到改進(jìn)后的網(wǎng)絡(luò)中,在網(wǎng)絡(luò)的GAP層輸出特征,不同軸承時域圖像的特征構(gòu)建特征向量矩陣,采用模糊聚類分析算法求該矩陣的模糊等價矩陣,在模糊等價矩陣中,當(dāng)λ(可變閾值)在[0,1]上變動時,模糊等價矩陣轉(zhuǎn)化為等價的布爾矩陣,由布爾矩陣可以得到動態(tài)聚類圖并得到故障分類結(jié)果,從而實(shí)現(xiàn)軸承的故障診斷。最后在凱斯西儲大學(xué)軸承公開數(shù)據(jù)集的基礎(chǔ)上假設(shè)源域數(shù)據(jù)充足目標(biāo)域數(shù)據(jù)較少的情況下對同型號同工況和同型號跨工況進(jìn)行實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該算法在配合少量目標(biāo)域數(shù)據(jù)的情況下能夠準(zhǔn)確識別軸承故障。
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)主要由卷積層、池化層、激活函數(shù)、全連接層和Softmax層組成[25]。卷積層作為CNN網(wǎng)絡(luò)的核心,通過Relu激活函數(shù)獲得非線性特征,池化層可以保持?jǐn)?shù)據(jù)的顯著特征,降低特征的維度,卷積層通過池化層進(jìn)入一個或多個全連接層,然后進(jìn)入Softmax層分類。
Densenet神經(jīng)網(wǎng)絡(luò)在2017年由Gao Huang等提出,Densenet以前饋的方式將每個層連接在一起,相比于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)中n層對應(yīng)n個連接,其在n層的輸出為xn=Hn(xn-1),而Densenet網(wǎng)絡(luò)n層中有(n+1)/2個連接,其在n層的輸出為xn=Hn([x0,x1,…,xn-1]),這大大減輕了梯度消失,增強(qiáng)了特征的傳遞和利用,減少了參數(shù)量,提高了網(wǎng)絡(luò)的整體特征提取能力。
在現(xiàn)有的機(jī)器學(xué)習(xí)理論下,要訓(xùn)練出一個魯棒性強(qiáng)的深度學(xué)習(xí)模型,需要大量的數(shù)據(jù)支撐,這在實(shí)際應(yīng)用中很難滿足。遷移學(xué)習(xí)將預(yù)訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行遷移,在新應(yīng)用場合用少量數(shù)據(jù)進(jìn)行再訓(xùn)練,不需要大量數(shù)據(jù)即可建立精確的深度學(xué)習(xí)模型。
全連接層(fully connected layer,FC)中參數(shù)量占了整個網(wǎng)絡(luò)的80%~90%,降低了訓(xùn)練速度且容易發(fā)生過擬合現(xiàn)象,本文提出使用全局均值池化層代替FC,利用池化層的降維,圖1為GAP與FC結(jié)構(gòu)對比,傳統(tǒng)的方法經(jīng)過卷積層特征提取后,經(jīng)全連接層將特征展開逐過程降維分類,而GAP替代FC可以將任意維度的特征以一維特征輸出,增強(qiáng)卷積層特征提取能力的同時又保留了卷積層和池化層提取的空間信息,減少了模型中的參數(shù)量,一方面減少數(shù)據(jù)訓(xùn)練量,另一方面防止過擬合。本文算法擬設(shè)計(jì)維度自適應(yīng)的GAP代替卷積神經(jīng)網(wǎng)絡(luò)模型中的全連接網(wǎng)絡(luò)部分。
圖1 FC與GAP結(jié)構(gòu)對比
模糊聚類作為一種無監(jiān)督分類算法,利用模糊數(shù)學(xué)原理,對所研究的事物按一定標(biāo)準(zhǔn)分類,本文采用基于模糊關(guān)系矩陣的聚類算法代替卷積神經(jīng)網(wǎng)絡(luò)中的softmax分類層分類,基于模糊關(guān)系的聚類分析如下。
設(shè)被分類軸承健康狀態(tài)共n種,其論域表示為U=(x1,x2,x3,…,xn),每種健康狀態(tài)有m個特征指標(biāo)Xi=(xi1,xi2,…,xim),i=1,2,…,n,由此可得相應(yīng)的數(shù)據(jù)矩陣:
(1)
1)為消除特征指標(biāo)之間量綱不同的問題,滿足模糊聚類算法要求需對上述矩陣作標(biāo)準(zhǔn)化處理,采用平移·標(biāo)準(zhǔn)差和平移·極差變換將區(qū)間壓縮到[0,1]。
平移·標(biāo)準(zhǔn)差:
(2)
(3)
平移·極差:
(4)
式中:i=1,2,…,n,k=1,2,…,m。
2)根據(jù)分類對象m個特征指標(biāo)得到的標(biāo)準(zhǔn)化數(shù)據(jù),利用距離法計(jì)算分類對象樣本間的相似程度rij,建立模糊模糊相似矩陣R,其中rij=1-cd(xi,xj)。
歐幾里得距離:
(5)
3)由上述得到的模糊相似矩陣,需利用傳遞閉包法求得傳遞閉包t(R),得到模糊等價矩陣R*,對于不同的λ,當(dāng)存在rij>λ時,將兩個樣本歸為一類,對于不同的置信因子λ∈[0,1]得到不同的聚類結(jié)果,形成動態(tài)聚類圖[26]。
本文所使用預(yù)訓(xùn)練微調(diào)方法如圖2所示,在源域上預(yù)訓(xùn)練Densenet卷積神經(jīng)網(wǎng)絡(luò)后將源域中網(wǎng)絡(luò)參數(shù)遷移到目標(biāo)域,凍結(jié)網(wǎng)絡(luò)的1到n-3層網(wǎng)絡(luò)參數(shù),使用新的卷積層替換Densenet最后一個可學(xué)習(xí)層,以便匹配新數(shù)據(jù)集,在目標(biāo)域中使用小樣本數(shù)據(jù)重新訓(xùn)練微調(diào)深層網(wǎng)絡(luò),建立TL-Densenet模型。其數(shù)學(xué)表達(dá)式如下[27]:
(6)
圖2 預(yù)訓(xùn)練微調(diào)示意圖
傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類時,經(jīng)過多層卷積與池化后,使用FC與softmax進(jìn)行分類,但在小樣本的情況下,FC層因參數(shù)多以及訓(xùn)練數(shù)據(jù)不足容易出現(xiàn)過擬合現(xiàn)象,導(dǎo)致診斷率下降,針對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)CNN中參數(shù)量大、訓(xùn)練時間長以及需要大量數(shù)據(jù)訓(xùn)練等不足,在2.1節(jié)的基礎(chǔ)上對預(yù)訓(xùn)練微調(diào)的Densenet網(wǎng)絡(luò)基礎(chǔ)上進(jìn)行改進(jìn),為達(dá)到降低網(wǎng)絡(luò)參數(shù)、加快識別分類速度的目的,本文設(shè)計(jì)一維度自適應(yīng)調(diào)節(jié)維度的全局均值池化層替換Densenet網(wǎng)絡(luò)中的全連接網(wǎng)絡(luò)部分,降低整個網(wǎng)絡(luò)90%以上的參數(shù)量,該全局均值池化可根據(jù)輸出軸承特征維度和類別進(jìn)行自適應(yīng)調(diào)整,在多層感知器后為分類中的每個類別生成一個feature map,并對每個feature map進(jìn)行全局平均。在GAP結(jié)構(gòu)上設(shè)計(jì)一個[x,wout,n]的自適應(yīng)矩陣,x代表前一層卷積輸入GAP層通道數(shù),n代表池化核的數(shù)量,wout代表前一層的卷積層輸入特征圖feature map尺寸:
(7)
式中:win為輸入特征圖大小,F為卷積核大小,s為步長。對于前一卷積層輸入到GAP的feature map,GAP的池化核自動匹配卷積核輸出的個數(shù)n和維度,并對特征圖尺寸wout利用池化運(yùn)算計(jì)算出一個與CNN中FC等效的全局平均值作為GAP輸出的特征值,用于后續(xù)分類。GAP的運(yùn)算方式為
(8)
以VggNet-16為例對改進(jìn)后的參數(shù)量進(jìn)行對比,如表1所示,全局總參數(shù)減少了90.92%。其中卷積層參數(shù)量計(jì)算公式為
表1 改進(jìn)后各層參數(shù)量對比
P=C0×(kw×kh×Ci+1)
(9)
式中:C0為輸出通道,Ci為輸入通道,kw×kh×Ci為一個卷積核的權(quán)重?cái)?shù)量。
采用第一節(jié)中模糊聚類算法代替TL-Densenet-GAP網(wǎng)絡(luò)中的Softmax分類層,在GAP層中利用activations函數(shù)輸出GAP層提取的特征,建立TL-Densenet-GAP-FCM模型,構(gòu)建特征向量矩陣,由模糊聚類構(gòu)建動態(tài)聚類圖,實(shí)現(xiàn)軸承的故障診斷。改進(jìn)后的網(wǎng)絡(luò)模型如圖3所示,該模型由輸入層、特征提取層、GAP層和模糊聚類分類層組成,采集軸承時域圖像輸入到卷積層自動提取特征,在網(wǎng)絡(luò)的GAP層降維后輸出特征,在實(shí)際應(yīng)用中,將標(biāo)準(zhǔn)數(shù)據(jù)得到的特征向量與待測樣本的特征向量構(gòu)建特征向量矩陣,然后由模糊聚類形成聚類圖輸出診斷結(jié)果。
圖3 軸承故障診斷框圖
采用凱斯西儲大學(xué)軸承公開數(shù)據(jù)集中的驅(qū)動端數(shù)據(jù),利用該數(shù)據(jù)集驗(yàn)證本文所提算法在同型號同工況下的軸承故障診斷情況,其中軸承型號為SKF6205,采樣頻率為12 kHz,選取電機(jī)轉(zhuǎn)速為1 797 r/min工況下故障直徑分別為0.177 8 mm和0.533 4 mm的外圈故障、內(nèi)圈故障和滾動體故障6類故障狀態(tài),再加上正常狀態(tài)共7類數(shù)據(jù),從這7類數(shù)據(jù)的時域信號中取1 000個連續(xù)點(diǎn)作為一個樣本,建立標(biāo)準(zhǔn)數(shù)據(jù)庫。圖4為正常狀態(tài)下的軸承時域信號,圖5為不同故障狀態(tài)下的軸承時域信號。每組選取20個樣本,共140組,以卷積神經(jīng)網(wǎng)絡(luò)DenseNet-201為例,利用預(yù)訓(xùn)練微調(diào)訓(xùn)練建立TL-Densenet-GAP-FCM模型,將源域中軸承的故障知識遷移到目標(biāo)域,提高模型的特征提取能力。
圖4 軸承正常狀態(tài)f0時域曲線圖
圖5 軸承各故障時域曲線圖
圖6軸承時域圖輸入TL-Desenet-GAP-FCM模型中,在GAP層輸出1 920個特征向量,其中圖5和圖6用于構(gòu)建標(biāo)準(zhǔn)數(shù)據(jù)向量庫,如表2所示,圖6輸出的向量構(gòu)建待測樣本特征向量,如表3所示,其中d0為正常軸承待測樣本。
表2 標(biāo)準(zhǔn)數(shù)據(jù)庫樣本特征
表3 待測樣本特征
將表2和表3數(shù)據(jù)建立特征向量矩陣,為消除數(shù)據(jù)間量綱不同的影響,需對特征向量矩陣作標(biāo)準(zhǔn)化處理,使數(shù)據(jù)分布在[0,1]內(nèi),得到標(biāo)準(zhǔn)化矩陣X如下所示:
上述矩陣共14行1 920列,從上到下依次表示f0~d6,為計(jì)算樣本間的相似程度,對矩陣X標(biāo)定得到模糊相似矩陣R,利用傳遞閉包法將矩陣R改造成模糊等價矩陣R*:
在模糊等價矩陣R*中當(dāng)置信因子λ從1到0變化時,形成動態(tài)聚類圖,得到診斷結(jié)果,如圖7所示。對預(yù)訓(xùn)練的TL-DenseNet模型以及本文TL-DenseNet-GAP-FCM模型進(jìn)行對比驗(yàn)證,采用12 kHz采樣頻率的驅(qū)動端、故障直徑0.177 8mm、電機(jī)轉(zhuǎn)速1 797 r/min同型號同工況軸承每種故障類型各15組數(shù)據(jù),共105組數(shù)據(jù),進(jìn)行實(shí)驗(yàn)驗(yàn)證對比分析其結(jié)果如表4所示,其中TL-DenseNet平均準(zhǔn)確率為79.04%,改進(jìn)后TL-DenseNet-GAP-FCM模型準(zhǔn)確率為99.05%,實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的卷積神經(jīng)網(wǎng)絡(luò)其卷積層的具有更好的特征提取能力,在同型號同工況情況下,使用少量樣本進(jìn)行遷移學(xué)習(xí)并改進(jìn)建立TL-Densenet-GAP-FCM模型,在此模型的基礎(chǔ)上只需要建立標(biāo)準(zhǔn)數(shù)據(jù)庫就可實(shí)現(xiàn)軸承故障診斷,無需新樣本的數(shù)據(jù)訓(xùn)練。但內(nèi)圈的故障檢測分類存在一定誤差究其原因內(nèi)圈故障滾動體故障在故障機(jī)理和傳遞路徑來說存在一定的相似性,因此在提取到內(nèi)圈和滾動體故障特征時出現(xiàn)部分特征混合,造成一定的誤差,可以通過增加預(yù)訓(xùn)練微調(diào)的樣本來提高分類準(zhǔn)確率。
圖7 同型號同工況動態(tài)聚類圖
將本節(jié)算法模型與各文獻(xiàn)中基于CWRU數(shù)據(jù)集的結(jié)果進(jìn)行比較,以說明本文算法的優(yōu)越性,如表5所示,在140組樣本情況下,實(shí)現(xiàn)了和文獻(xiàn)[28]CNN模型3 030樣本相近的準(zhǔn)確性,表明本文算法在小樣本的優(yōu)越性。
表5 基于西儲軸承數(shù)據(jù)集分類準(zhǔn)確率比較
3.2.1 零目標(biāo)樣本軸承故障診斷
在3.1節(jié)驅(qū)動端12 kHz、電機(jī)轉(zhuǎn)速1 797 r/min軸承預(yù)訓(xùn)練微調(diào)模型基礎(chǔ)上,驗(yàn)證電機(jī)轉(zhuǎn)速1 750 r/min情況下故障分類準(zhǔn)確率??紤]在沒有目標(biāo)樣本可用于訓(xùn)練的情況下,如果利用轉(zhuǎn)速1 797 r/min得到的改進(jìn)遷移學(xué)習(xí)模型TL-DenseNet-GAP-FCM,進(jìn)行轉(zhuǎn)速1 750 r/min狀態(tài)下軸承故障分類驗(yàn)證,在目標(biāo)域零樣本的情況下(即沒有轉(zhuǎn)速1 750 r/min狀態(tài)下軸承樣本),驗(yàn)證其不同故障直徑下內(nèi)圈、外圈和滾動體共6種故障分類準(zhǔn)確率,并與其他零樣本方法進(jìn)行對比,迭代次數(shù)均設(shè)置100,LSVM的準(zhǔn)確率為46.67%,ANN的準(zhǔn)確率為41.67%,TL-DenseNet的準(zhǔn)確率為58.33%,TL-DenseNet-GAP-FCM的準(zhǔn)確率為84.17%,實(shí)驗(yàn)結(jié)果表明在零目標(biāo)樣本的情況下利用預(yù)訓(xùn)練好的TL-DenseNet-GAP-FCM模型可以對不同類型的故障進(jìn)行診斷和分類,具有較高的實(shí)用參考價值,同時在今后的研究中還可以進(jìn)一步完善。例如:1)可以考慮參考文獻(xiàn)[31],利用向量空間表述不同故障的屬性描述;2)增加預(yù)訓(xùn)練微調(diào)樣本種類和數(shù)量,使卷積層學(xué)習(xí)到更多的軸承故障特征,提高特征提取層的提取能力。
3.2.2 小樣本軸承故障診斷
現(xiàn)在進(jìn)行小樣本遷移學(xué)習(xí),1 750 r/min的每種故障各取15組,共90組數(shù)據(jù)記為數(shù)據(jù)F,將3.1節(jié)標(biāo)準(zhǔn)數(shù)據(jù)A記為源域,數(shù)據(jù)F記為目標(biāo)域進(jìn)行預(yù)訓(xùn)練,即建立A→F的遷移學(xué)習(xí)任務(wù),以A→F建立的TL-DenseNet-GAP-FCM模型,動態(tài)聚類圖如圖8所示,其中f1~f5為建立的1 772 r/min、1 750 r/min中內(nèi)圈、外圈和滾動體故障數(shù)據(jù)庫,d1~d5為其對應(yīng)待測故障。
圖8 同型號跨工況動態(tài)聚類圖
從上述結(jié)果可以看出去除全連接層的模型具有更好的特征提取能力,使用全局均值池化層代替全連接層避免了數(shù)據(jù)不足引起的過擬合現(xiàn)象,利用模糊數(shù)學(xué)的方法對樣本間的特征進(jìn)行定量分析,實(shí)現(xiàn)小樣本的軸承故障診斷,僅需140組目標(biāo)域樣本數(shù)據(jù),準(zhǔn)確率可達(dá)99.05%。在零目標(biāo)樣本同型號跨工況情況下分類準(zhǔn)確率為84.17%,究其原因?yàn)椴煌r下數(shù)據(jù)存在一定差異,但可利用數(shù)據(jù)充足的實(shí)驗(yàn)室數(shù)據(jù)作為源域結(jié)合少量目標(biāo)域數(shù)據(jù)利用遷移學(xué)習(xí)微調(diào)網(wǎng)絡(luò),在TL-DenseNet-GAP-FCM模型的基礎(chǔ)上實(shí)現(xiàn)實(shí)際應(yīng)用中可用數(shù)據(jù)較少而出現(xiàn)的過擬合現(xiàn)象以及分類準(zhǔn)確率低的問題。
本節(jié)采用西安交通大學(xué)XJTU-SY軸承公開數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證,軸承型號LDK UER204,該數(shù)據(jù)集包括3種工況,設(shè)定轉(zhuǎn)速分別為2 100、2 250、2 400 r/min,每種工況包括水平和垂直振動信號,本文以工況2水平振動信號數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn)驗(yàn)證,以軸承2為例,如表6所示,選取工況2中正常、內(nèi)圈故障、外圈故障、保持架故障進(jìn)行驗(yàn)證,鑒于在實(shí)際應(yīng)用過程中故障數(shù)據(jù)可用較少,對于4種不同狀態(tài)軸承,每種選擇20組共80組訓(xùn)練TL-Densenet-GAP-FCM模型,從每種狀態(tài)中隨機(jī)選擇一組數(shù)據(jù)進(jìn)行驗(yàn)證,其結(jié)果如圖9所示,f1到f4分別為正常、內(nèi)圈、外圈和保持架故障,d1到d4為隨機(jī)選取的待測樣本,故障分類結(jié)果均準(zhǔn)確。
表6 XJTU-SY工況2數(shù)據(jù)介紹
圖9 XJTU-SY軸承故障診斷聚類圖
通過實(shí)驗(yàn)以及對比驗(yàn)證,說明改進(jìn)后的模型保留了Densenet網(wǎng)絡(luò)卷積層的特征提取能力,通過改進(jìn)池化層和分類層來減少訓(xùn)練樣本數(shù)量,提高運(yùn)算速度有效地避免了過擬合現(xiàn)象,本文算法不僅僅適用于各類型號軸承的故障診斷,相關(guān)算法還適用于轉(zhuǎn)轍機(jī)的狀態(tài)診斷[32],可根據(jù)檢測目標(biāo)的曲線復(fù)雜程度來適當(dāng)增減訓(xùn)練樣本的數(shù)量以此來提高卷積層特征提取能力,增加分類準(zhǔn)確率。但在本文算法分類層使用的是模糊聚類算法,該算法需要提前收集出現(xiàn)的故障數(shù)據(jù)建立相應(yīng)的標(biāo)準(zhǔn)數(shù)據(jù)庫樣本特征,利用模糊數(shù)學(xué)原理實(shí)現(xiàn)檢測樣本特征與數(shù)據(jù)庫樣本特征的配對,如果后續(xù)出現(xiàn)新的故障可以添加到數(shù)據(jù)庫中。
1)針對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)全連接層參數(shù)、Softmax層參數(shù)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練,在小樣本情況下容易出現(xiàn)過擬合等問題,本文提出了一種TL-Densenet-GAP-FCM模型用于軸承故障診斷,該模型以全局均值池化層代替全連接層和模糊聚類層代替Softmax層,包括輸入層、特征提取層、全局均值池化層和模糊聚類分類層,該模型大大減少了訓(xùn)練樣本需求,適合小樣本故障診斷。
2)利用凱斯西儲大學(xué)軸承數(shù)據(jù)和西安交通大學(xué)XJTU-SY軸承數(shù)據(jù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,在小樣本的情況下,TL-DenseNet-GAP-FCM相比TL-DenseNet 模型具有更好的故障分類準(zhǔn)確率,究其原因是全連接層存在大量參數(shù),在數(shù)據(jù)量不足的情況下會出現(xiàn)過擬合現(xiàn)象,可有效解決實(shí)際應(yīng)用中因數(shù)據(jù)量不足導(dǎo)致機(jī)器學(xué)習(xí)分類精度低的問題。