康 濤,王 書,陳志剛,劉 菲,景騰飛
(1.北京航天萬源科技有限公司,北京 100176;2.北京航天拓?fù)涓呖萍加邢挢?zé)任公司,北京 100176)
旋轉(zhuǎn)機(jī)械設(shè)備廣泛應(yīng)用在航天、交通、工業(yè)制造和風(fēng)力發(fā)電等重要工程領(lǐng)域[1],其在重大工程中扮演著不可或缺的角色,設(shè)備發(fā)生故障或者停機(jī)可能造成嚴(yán)重后果。旋轉(zhuǎn)機(jī)械設(shè)備中滾動(dòng)軸承是其非常重要的零部件[2],同時(shí)滾動(dòng)軸承在惡劣工況下容易出現(xiàn)磨損、裂紋、斷裂等故障[3]。因此,采用故障診斷技術(shù)對(duì)滾動(dòng)軸承狀態(tài)的準(zhǔn)確識(shí)別,可以有效防止軸承故障引起的意外事故。傳統(tǒng)的故障診斷技術(shù)有:自回歸滑動(dòng)平均模型(Autoregressive moving average model,ARMA)[4]、變分模態(tài)分解(Variational Mode Decomposition,VMD)[5]、小波分析[6]、概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network,PNN)[7]等得到了廣泛的應(yīng)用。隨著大數(shù)據(jù)時(shí)代的到來,利用海量數(shù)據(jù)驅(qū)動(dòng)軸承故障診斷算法成為近些年的研究熱點(diǎn)。其中基于深度學(xué)習(xí)算法的軸承故障診斷成為現(xiàn)階段的主流。主要手段如下:首先人為處理原始信號(hào),然后將信號(hào)輸入到深度學(xué)習(xí)算法中,再通過分類器對(duì)故障識(shí)別。
然而上述介紹的故障診斷方法將故障診斷分割為信號(hào)預(yù)處理、特征提取、故障分類三個(gè)孤立的部分,無法將各個(gè)部分形成有效的耦合關(guān)系,可能導(dǎo)致在數(shù)據(jù)傳遞的過程中出現(xiàn)故障特征損失的情況發(fā)生。針對(duì)此問題,提出一種端到端的滾動(dòng)軸承故障診斷模型,將三個(gè)步驟直接整合到一個(gè)模型中,直接將原始振動(dòng)信號(hào)輸入模型中,經(jīng)過模型計(jì)算、算法處理后得到軸承故障類型。提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)的滾動(dòng)軸承故障診斷模型。利用一維卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取能力,對(duì)原始信號(hào)提取特征。然后將提取的特征輸入到全連接,通過全連接層對(duì)特征分類得到故障識(shí)別。同時(shí)考慮到一維信號(hào)的特點(diǎn),設(shè)計(jì)了大卷積核的診斷模型。減少了數(shù)據(jù)傳遞過程中故障特征損失。
卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Networks,CNN)是共享權(quán)重、局部特征提取、特征池化的多層神經(jīng)網(wǎng)絡(luò)[8]。其中共享權(quán)重可以使其泛化能力增強(qiáng),局部特征提取使卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度得到了很大提高,特征池化降低特征維度放大特征明顯區(qū)域。卷積神經(jīng)網(wǎng)絡(luò)主要由前向傳播算法和反向傳播算法相結(jié)合,前向傳播算法用于接收輸入數(shù)據(jù)直至輸出產(chǎn)生誤差,反向傳播算法是將減少輸出層的誤差并同時(shí)更新權(quán)重。
卷積神經(jīng)網(wǎng)絡(luò)根據(jù)輸入類型不同,可以將其分為一維(1D)和二維(2D)卷積神經(jīng)網(wǎng)絡(luò)。本文采用一維卷積神經(jīng)網(wǎng)絡(luò)對(duì)原始一維振動(dòng)信號(hào)處理,其中1D-CNN 包括隱含層、輸出層及輸入層,而隱含層包含一維卷積層(Convolutional Layers)、激活函數(shù)層(Activation Layers)以及池化層(Pooling Layers)等,隱含層主要用于接收輸入層的輸出并完成對(duì)數(shù)據(jù)特征的提取。
為驗(yàn)證本文提出方法的有效性,試驗(yàn)選用來自美國凱斯西儲(chǔ)大學(xué)的軸承數(shù)據(jù)集[9]。滾動(dòng)軸承運(yùn)行狀態(tài)可以分成四種分別為:健康、內(nèi)圈故障、外圈故障和滾珠故障,正常狀態(tài)時(shí)域如圖1 所示,內(nèi)圈故障時(shí)域如圖2 所示,外圈故障如圖3 所示,滾珠故障如圖4 所示,根據(jù)圖片很難分辨出故障類型。每種故障狀態(tài)包含三種故障尺寸:小(0.18 mm)、中(0.36 mm)和大(0.54 mm)。根據(jù)上述介紹軸承狀態(tài)共有10 種情況。
圖1 正常狀態(tài)
圖2 內(nèi)圈故障
圖3 外圈故障
圖4 滾珠故障
提升模型對(duì)樣本的泛化效果,試驗(yàn)采取重疊采樣的操作對(duì)數(shù)據(jù)集進(jìn)行增強(qiáng),實(shí)現(xiàn)模型魯棒性的提升。重疊采樣如圖5 所示。數(shù)據(jù)集具體信息見表1。
表1 數(shù)據(jù)集信息
圖5 重疊采樣
為了使1D-CNN 診斷模型具有效果更佳的診斷效果,需對(duì)其模型結(jié)構(gòu)進(jìn)行設(shè)計(jì)。常見的二維卷積神經(jīng)網(wǎng)絡(luò),比如ResNet[10]和VGGnet[11]采用堆疊式的3×3的卷積核,可以實(shí)現(xiàn)少參數(shù)大感受野的效果,從而防止過擬合現(xiàn)象。但是對(duì)于一維振動(dòng)信號(hào)采用堆疊式3×1的卷積結(jié)構(gòu),以6 個(gè)權(quán)值為代價(jià),只得到5×1的感受野,反而將上述優(yōu)勢(shì)變成了劣勢(shì)。因此根據(jù)一維振動(dòng)信號(hào)的特點(diǎn),將1D-CNN 診斷模型的第一層設(shè)計(jì)為大卷積核,其作用提取短時(shí)特征。其余的卷積層為3×1的小卷積核,減少模型參數(shù)防止過擬合現(xiàn)象。
為了選擇合適的第一層卷積核的參數(shù),通過對(duì)比實(shí)驗(yàn)進(jìn)行比較分析,設(shè)計(jì)三種1D-CNN 診斷模型。這三種模型的第一層卷積核分別為32×1、64×1、128×1,每個(gè)模型共有4 層卷積核池化層,除了第一層外,剩下的卷積核均為3×1,全連接層為10 個(gè)輸出對(duì)應(yīng)著軸承的10 種狀態(tài)。模型對(duì)比實(shí)驗(yàn)結(jié)果見表2。
表2 模型對(duì)比實(shí)驗(yàn)
由表2 可以看出,隨著卷積核尺寸的增加,模型在測(cè)試集中的準(zhǔn)確率隨之提高,當(dāng)卷積核尺寸由32 增加到64 時(shí),準(zhǔn)確率由96.01%提升到99.33%,提高了3.46%,計(jì)算時(shí)間變化不大,當(dāng)卷積核尺寸由64 增加到128 時(shí),準(zhǔn)確率提升不多,僅提升0.44%,但由于計(jì)算參數(shù)的增加,計(jì)算所消耗的時(shí)間增加了0.02 s,對(duì)網(wǎng)絡(luò)準(zhǔn)確率提升不高,卻造成了比較多的資源消耗,因此選擇64×1 作為第一層卷積核的尺寸。具體診斷網(wǎng)絡(luò)模型參數(shù)見表3。
表3 故障診斷網(wǎng)絡(luò)參數(shù)
使用上述數(shù)據(jù)集,對(duì)比所確立的模型進(jìn)行訓(xùn)練。訓(xùn)練過程中,全連接層使用Dropout 防止過擬合問題,Dropout 比率設(shè)置為0.2,Adam 算法的學(xué)習(xí)率為0.001。為了保證模型的可靠性,在訓(xùn)練工程中,每個(gè)數(shù)據(jù)集迭代60 次。為了直觀地觀察模型對(duì)每種故障的識(shí)別情況,采用混淆矩陣表示實(shí)驗(yàn)結(jié)果如圖6 所示,圖中行表示實(shí)際分類,列表示預(yù)測(cè)分類。其中在混淆矩陣中,0~9 分別代表不同的類別,具體混淆矩陣標(biāo)識(shí)說明見表4。
表4 混淆矩陣標(biāo)識(shí)說明
圖6 故障診斷混淆矩陣
根據(jù)混淆矩陣圖可以看出,所提出的基于1D-CNN的故障診斷網(wǎng)絡(luò),在美國凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集中所進(jìn)行的實(shí)驗(yàn),在同故障尺寸之間容易發(fā)生混淆,例如對(duì)于故障尺寸為0.36 mm 中內(nèi)圈故障(標(biāo)識(shí)4)和外圈故障(標(biāo)識(shí)6)發(fā)生混淆。雖然發(fā)生了混淆,但是每種故障識(shí)別準(zhǔn)確率都高于97%。并且模型的類間平均準(zhǔn)確率為99.33%,可以滿足對(duì)軸承故障的準(zhǔn)確識(shí)別。
提出了一種基于一維卷積神經(jīng)網(wǎng)絡(luò)的端到端軸承故障診斷模型,直接將原始信號(hào)輸入,減少了數(shù)據(jù)傳遞中特征損失。針對(duì)一維原始振動(dòng)信號(hào)特點(diǎn),在CNN 設(shè)計(jì)方法的基礎(chǔ)上,設(shè)計(jì)了三種第一層大卷積核模型,通過實(shí)驗(yàn)數(shù)據(jù)集測(cè)試,確定了一種最優(yōu)的CNN 網(wǎng)絡(luò)模型。通過實(shí)驗(yàn)美國凱斯西儲(chǔ)大學(xué)數(shù)據(jù)集驗(yàn)證,所提模型的類間平均準(zhǔn)確率為99.33%,測(cè)試時(shí)間為0.03 s。實(shí)現(xiàn)了快速識(shí)別高準(zhǔn)確率的診斷性能,證明了所提出方法的可行性,具有較好的技術(shù)應(yīng)用前景。