張政君,井陸陽,徐衛(wèi)曉,戰(zhàn)衛(wèi)俠,王曉昆
(青島理工大學(xué) 機械與汽車工程學(xué)院,山東 青島 266000)
目前,軸承已經(jīng)被廣泛應(yīng)用于各個領(lǐng)域的機械設(shè)備中,其健康狀況對機械設(shè)備的壽命、穩(wěn)定性都有非常大的影響[1]。因此,對軸承進行故障診斷具有重要意義[2]。
軸承故障診斷最常見的方法是對軸承振動信號進行監(jiān)測[3],利用傳感器對軸承的振動信號進行采集,并利用時頻分析方法獲取其信號特征。常見的時頻分析方法包括時序分析[4]、譜峰度[5]、稀疏表示[6]、Wigner Ville分布(Wigner Ville distribution, WVD)[7]和連續(xù)小波變換[8]等。采用平滑偽Wigner Ville分布(SPWVD)對WVD與平滑函數(shù)進行卷積,可有效降低WVD中交叉項的影響[9]。經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition, EMD)[10]和集成經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)都可以自適應(yīng)地將非線性非平穩(wěn)信號轉(zhuǎn)換為多個頻段的本征模態(tài)函數(shù)。
但以上兩種方法容易受到模態(tài)混疊和端點效應(yīng)的影響。為了解決這些問題,學(xué)者們又提出了變分模態(tài)分解(VMD)。
VMD為分解問題提供了一個具有嚴謹數(shù)學(xué)基礎(chǔ)的解決方案,并且VMD對噪聲具有很強的魯棒性[11],可以有效地避免模態(tài)混疊現(xiàn)象,其在環(huán)境科學(xué)[12]、生物醫(yī)學(xué)信號[13]等領(lǐng)域都展現(xiàn)出了良好的效果。但懲罰因子α和分解層數(shù)K的選擇對VMD效果有很大的影響,其往往依賴人工判斷。
以樣本熵峭度指標最小值為目標函數(shù),采用灰狼優(yōu)化對VMD進行參數(shù)尋優(yōu),并對VMD處理后得到的分量進行SPWVD運算,可以得到高分辨率的時頻圖,并用于特征的提取。
隨著人工智能技術(shù)的飛速進步,深度學(xué)習(xí)方法逐漸被應(yīng)用在了故障診斷領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(CNN)作為深度學(xué)習(xí)的重要分支,其布局接近實際的生物神經(jīng)網(wǎng)絡(luò),圖像可以直接輸入網(wǎng)絡(luò),這一特點避免了特征提取和分類過程中數(shù)據(jù)重建的復(fù)雜度。
陳宇航等人[14]使用快速傅里葉變換及CNN,對軸承故障進行了識別,取得了較高的準確率。許同樂等人[15]利用EEMD對信號進行了降噪等預(yù)處理,將處理后的信號輸入到改進后的CNN中,解決了微弱故障特征提取困難的問題。肖俊青等人[16]利用完全自適應(yīng)噪聲集合經(jīng)驗?zāi)B(tài)分解模糊熵以及CNN,進行了不同工況下軸承的故障診斷,解決了軸承故障信息難以提取的問題。
以上結(jié)果表明:時頻分析結(jié)合CNN提取特征的方法在故障診斷方面有著優(yōu)良的效果。
但以上研究忽略了CNN更適合對圖像進行特征識別的特點(因為其局部權(quán)值共享的特殊結(jié)構(gòu)),并且其訓(xùn)練過程需要大量數(shù)據(jù),以保證CNN的性能。
鑒于以上情況,筆者從軸承振動信號的時頻圖出發(fā),提出一種基于時頻圖和雙通道CNN的軸承故障診斷方法。
筆者使用SPWVD處理參數(shù)優(yōu)化后的VMD得到的模量分類,以及直接對軸承信號進行CWT運算這兩種方式得到時頻圖,并以此作為數(shù)據(jù)增強手段;將兩種方式得到的時頻圖分別作為雙通道CNN中一個通道的輸入,在神經(jīng)網(wǎng)絡(luò)中提取時頻圖的深層次特征,以期完成對軸承進行故障診斷的任務(wù)。
變分模態(tài)分解(VMD)是一種自適應(yīng)信號分解算法。它可以將信號分解為多個分量,其實質(zhì)和核心思想是變分問題的構(gòu)造和求解。
其算法流程如下:
首先,建立變分模型,即:
(1)
(2)
式中:?t為偏導(dǎo)數(shù)運算;δ(t)為狄利克雷函數(shù)分布函數(shù);*為卷積;f為原始信號;K為IMFs的個數(shù)。
其中:{uk}={u1,u2,…,uk}為VMD分解得到的K個模態(tài)分量IMFs;{ωk}={ω1,ω2,…,ωk}為各IMF的中心頻率。
然后,使用懲罰因子和乘法算子將問題轉(zhuǎn)化為無約束問題,增廣拉格朗日函數(shù)為:
(3)
式中:λ為拉格朗日常數(shù);α為懲罰因子。
最后,為了求解變分問題的最優(yōu)解,必須采用交替方向乘子法(alternating direction method of multipliers,ADMM)對變量進行更新。
(4)
(5)
(6)
VMD算法的主要迭代求解過程如下:
2)n=n+1,進入循環(huán),其中n為迭代次數(shù);
3)更新uk,ωk,λ;
4)重復(fù)式(4)~式(9),直到滿足迭代停止條件,即:
(7)
式中:ε為預(yù)先設(shè)定的收斂閾值。
VMD的效果受參數(shù)K和α的影響,因此需要使用灰狼優(yōu)化算法(GWO)對參數(shù)進行迭代尋優(yōu)。
GWO是一種基于種群的元啟發(fā)式算法,是從灰狼(Canis)的種群結(jié)構(gòu)、社會等級和狩獵機制中得到啟發(fā)而創(chuàng)立。與其他元啟發(fā)式優(yōu)化算法相似,GWO在機器學(xué)習(xí)模型超參數(shù)和機器學(xué)習(xí)特征選擇優(yōu)化領(lǐng)域具有良好的效果。GWO的實現(xiàn)方式簡單,用于迭代的參數(shù)數(shù)量少,可以滿足迭代過程中目標函數(shù)最小值或最大值尋優(yōu)的要求,并且有收斂速度快、求解精度高等特點[17]。
對于優(yōu)化算法的目標函數(shù),樣本熵(sample entropy, SampEn)是一種判斷時間序列復(fù)雜程度的算法,其對時間序列長度的依賴性少、抗噪能力強,有利于對故障特征進行提取[18]。
峭度(kurtosis,KU)作為一個無量綱參數(shù),對振動信號中由早期故障引起的沖擊信號非常敏感,當(dāng)振動信號中沖擊成分以及故障信息越多時,其峭度值越大。
因此,筆者結(jié)合兩者的優(yōu)點,構(gòu)建目標函數(shù)樣本熵峭度指標(kurtosis sample entropy,KUSE):
(8)
式中:KU為所有模態(tài)分量峭度最大值。
在其優(yōu)化過程中,目標函數(shù)達到最小值時可獲得最優(yōu)的參數(shù)組合。
Wigner Ville分布(WVD)作為Cohen類雙線性時頻分布中最基本一種分布,其實質(zhì)是將信號的能量分布于時頻平面內(nèi)。它的優(yōu)點是不加窗、分辨率高。然而將其應(yīng)用于多個信號分量時,會受到交叉干擾項的影響。因此,如何減小交叉項就成了WVD性能改進的主要目標。
平滑偽Wigner Ville分布(SPWVD)的實質(zhì)就是在時域和頻域分別對信號進行加窗處理,達到平滑濾波的作用,有效抑制干擾項帶來的干擾[19]。其定義為:
(9)
式中:g(u),h(τ)為兩個偶窗函數(shù)。
此處,筆者將不同損傷類型的軸承信號分別輸入到經(jīng)過灰狼優(yōu)化的變分模態(tài)分解(GWO-VMD)中,以獲得K個模態(tài)分量;再對分解出來的分量進行SPWVD計算,對結(jié)果進行同一坐標系下的累加,以降低信號的不穩(wěn)定性;最后進一步降低交叉項的干擾,以得到對應(yīng)的高分辨率二維時頻圖。
小波變換的初衷就是體現(xiàn)信號時域信息,故而小波變換相比傅里葉變換(FT)增加了一個變量,以展現(xiàn)時域的信息[20-21]。
小波函數(shù)的一般形式如下:
(10)
對于任何一個隨機信號的函數(shù),相應(yīng)的連續(xù)小波變換(CWT)表達式為:
(11)
連續(xù)小波變換(CWT)可以將原始信號從時域變換到時頻域,其結(jié)果是原始振動信號在時頻域的歸一化表示。CWT將每個信號段轉(zhuǎn)換為標量圖圖像,表示其系數(shù)的絕對值。
此處筆者把Morlet小波作為小波函數(shù)的CWT,將其應(yīng)用于軸承信號的時頻分析中。
卷積神經(jīng)網(wǎng)絡(luò)是一種多級神經(jīng)網(wǎng)絡(luò)。其基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成。CNN經(jīng)常被用于處理輸入為一維數(shù)據(jù)的自然語言處理和語音識別任務(wù)。CNN的主要特點有兩個方面(權(quán)重共享和空間池化),這使得它非常適合處理輸入為二維圖像數(shù)據(jù)的計算機視覺應(yīng)用。
對于每個特征映射,首先由具有局部接收域的卷積核對輸入進行卷積操作;然后,在卷積結(jié)果中加入一個偏置項;最后,應(yīng)用激活函數(shù)。
其數(shù)學(xué)表達式定義為:
(12)
為了減少CNN中參數(shù)的數(shù)量,同一特征圖的卷積核共享相同的權(quán)向量和偏置。通常需在每個卷積層上加一個最大池化層(max-pooling),利用子采樣操作生成低分辨率的特征圖。
Max-pooling定義如下:
(13)
池化層減小了輸入特征映射的大小,同時保持了特征映射的數(shù)量。筆者采用子采樣技術(shù),使CNN中的參數(shù)數(shù)量進一步減少。最后一個池化層后面是一個全連接層。全連接層中的每個神經(jīng)元都連接到最后一個池化層中的所有特征映射。
筆者提取全連接層的高級特征,作為輸出層的輸入;然后生成CNN模型的預(yù)測輸出;最后使用最小化損失函數(shù)對網(wǎng)絡(luò)的參數(shù){W,b}(權(quán)重向量和偏差)進行微調(diào),計算預(yù)測輸出y與目標輸出t之間的誤差如下:
(14)
式中:{W,b}*為優(yōu)化后的參數(shù);n為被標記樣本的數(shù)量;j為損失函數(shù)。
此外,筆者采用反向傳播算法對網(wǎng)絡(luò)進行基于梯度的監(jiān)督訓(xùn)練。
AlexNet模型作為經(jīng)典CNN模型之一,其優(yōu)點包括:
1)可以對數(shù)百萬張ImageNet圖像進行訓(xùn)練,使用ReLU作為激活函數(shù),解決了網(wǎng)絡(luò)結(jié)構(gòu)較深時sigmoid的梯度發(fā)散問題;
2)Dropout在訓(xùn)練過程中隨機忽略部分神經(jīng)元,減少了神經(jīng)元之間復(fù)雜的相互適應(yīng)關(guān)系;
3)在CNN模型中使用重疊最大池化層,提高了特征的豐富度,同時避免了平均池化層的模糊效應(yīng);
4)建立了局部神經(jīng)元活動的競爭機制,以提高模型的泛化能力。其網(wǎng)絡(luò)結(jié)構(gòu)包括5個卷積層和3個全連接層。
筆者所使用的雙通道CNN模型在AleXNet的結(jié)構(gòu)上進行了改進。
雙通道卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖1所示。
圖1 雙通道卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of dual channel convolutional neural network
雙通道神經(jīng)網(wǎng)絡(luò)模型參數(shù)如表1所示。
表1 雙通道神經(jīng)網(wǎng)絡(luò)模型參數(shù)
表1是對圖1結(jié)構(gòu)的具體描述。
表1中,網(wǎng)絡(luò)結(jié)構(gòu)第一層表示輸入層,兩個并行的通道的結(jié)構(gòu)和參數(shù)一致;Conv表示卷積層,選擇ReLU作為激活函數(shù);M表示最大池化層;Concat代表將兩個通道輸出的特征圖進行疊加;Fc代表全連接層,并在全連接層使用dropout防止網(wǎng)絡(luò)出現(xiàn)過擬合。
每個通道包括5個卷積層,3個池化層,時頻圖的特征被提取出來;然后在匯聚層進行疊加和特征融合,經(jīng)過兩個全連接層將二維圖像特征轉(zhuǎn)化成一維的向量;最后使用SoftMax分類器對故障進行分類。
筆者所提出的基于時頻圖和雙通道CNN的軸承故障診斷方法(模型)流程如下:
首先以前文提到的KUSE最小值作為適應(yīng)度函數(shù),使用灰狼優(yōu)化算法對VMD進行參數(shù)優(yōu)化,利用VMD對軸承原始信號進行處理,得到K個模態(tài)分量,對模態(tài)分量進行SPWVD計算,并對結(jié)果進行累加,得到GWOVMD-SPWVD時頻圖;再對振動信號進行小波變換,以得到時頻圖,將這兩種時頻圖輸入到雙通道CNN中,提取不同故障類型和損傷程度時頻圖的特征;最后由SoftMax完成故障分類的任務(wù)。
基本流程圖如圖2所示。
圖2 方法流程圖Fig.2 Method flow chart
此處的實驗數(shù)據(jù)來自某旋轉(zhuǎn)機械故障模擬試驗臺。
該試驗臺主要由驅(qū)動電機、轉(zhuǎn)速轉(zhuǎn)矩傳感器、加速度傳感器、負載和測試軸承等部件組成。其構(gòu)造實物圖如圖3所示。
圖3 軸承故障試驗臺Fig.3 Bearing failure test stand
其中,實驗軸承為圓柱滾子軸承,型號為NU205M,滾動體個數(shù)為13。
筆者使用加速傳感器采集XYZ這3個方向的振動信號,其中Y為徑向(垂直方向),Z為軸向(水平方向),X為切線方向(水平方向)。
實驗用圓柱滾子軸承包括4種狀態(tài),分別為正常和內(nèi)圈故障、外圈故障和滾動體故障。每個故障狀態(tài)包括輕微損傷和嚴重損傷兩種損傷程度,共計7種故障類別。軸承故障為人為故障,即在軸承不同部位,采用砂輪機磨削的方法加工出與軸線平行的縫隙。
實驗數(shù)據(jù)來自傳感器,即采用加速度傳感器采集其Y方向的振動信號。數(shù)據(jù)采集時,采樣頻率為100 kHz,采樣時間為10 s,實驗中電機轉(zhuǎn)速為900 r/min。在采集到的振動數(shù)據(jù)中,以2 048個點截取為一個樣本(每種類別樣本數(shù)均為100)。
試驗臺數(shù)據(jù)集的分類情況如表2所示。
表2 試驗臺數(shù)據(jù)集分類情況
筆者使用GWOVMD-SPWVD和CWT方法對軸承數(shù)據(jù)進行處理。其中,CWT使用cmor3-3作為小波函數(shù)對信號進行運算;對于GWOVMD-SPWVD方法,使用樣本熵峭度指標最小值作為適應(yīng)度函數(shù),使用GWO對VMD進行參數(shù)優(yōu)化,迭代次數(shù)設(shè)置為80。
適應(yīng)度變化曲線如圖4所示。
圖4 適應(yīng)度變化曲線Fig.4 Fitness curve
由圖4可以看出:隨著迭代次數(shù)的增加,適應(yīng)度函數(shù)逐漸收斂,最終得到最優(yōu)VMD參數(shù)組合。
筆者對每種故障類型分別進行VMD參數(shù)優(yōu)化,得到了故障類型及對應(yīng)的VMD參數(shù),如表3所示。
表3 不同故障類型對應(yīng)的VMD參數(shù)
筆者先對不同故障狀態(tài)的樣本進行VMD處理,得到相應(yīng)的模態(tài)分量;再對分量進行SPWVD運算,得到相應(yīng)的時頻圖;最后對不同工況的二維時頻圖進行特征提取,以進行最后的軸承故障識別。
由于篇幅所限,此處筆者僅展示使用GWOVMD-SPWVD方式得到的時頻圖。
不同故障類型及損傷程度所對應(yīng)的時頻圖,如圖5所示。
圖5 不同損傷情況時頻圖Fig.5 Time-frequency diagram of different damage conditions
由圖5(a)可知,在正常工況下,軸承時頻圖像的能量較為均勻地分布在低頻段和高頻段;在5圖(a)~5圖(g)中,工況圖像的能量分布相對集中在某個頻段,且存在明顯的差別;使用該處理方式可以清晰地判斷出軸承的健康狀況。
在圖像輸入神經(jīng)網(wǎng)絡(luò)前,筆者隨機選取不同工況下圖像數(shù)據(jù)集的25%作為測試集,其余為訓(xùn)練集。在試驗臺數(shù)據(jù)集中,采用兩種時頻圖生成方式分別得到700張圖像,共計1 400張時頻圖(其中1 050張作為訓(xùn)練,350張作為測試)。
筆者將圖像輸入至雙通道神經(jīng)網(wǎng)絡(luò)中,選擇訓(xùn)練參數(shù)如下:選擇Adam優(yōu)化器,設(shè)定學(xué)習(xí)率為0.000 1,設(shè)置Batchsize為32、MaxEpochs為150。
模型訓(xùn)練過程精確率和損失值如圖6所示。
圖6 模型訓(xùn)練過程精確率和損失值Fig.6 Training process accuracy rate and loss value
圖6展示了模型訓(xùn)練過程中損失值和模型準確率的變化過程,其中,隨著迭代次數(shù)的增加,網(wǎng)絡(luò)的損失值不斷下降,準確率也逐漸上升;在前200次迭代中,損失值下降和準確率提高的速度較快;在迭代中期,圖像出現(xiàn)細微的波動,并逐漸趨于平穩(wěn);最后達到一個穩(wěn)定狀態(tài)。
經(jīng)過多次迭代,得到最終的準確率和損失值分別為99.69%和0.000 4。
以上結(jié)果表明:基于時頻圖和雙通道CNN的診斷模型對具有較強的軸承故障識別能力和魯棒性。
為進一步驗證基于時頻圖和雙通道CNN的軸承故障診斷模型所具備的優(yōu)越性,筆者使用的數(shù)據(jù)集均為試驗臺采集到的數(shù)據(jù),將上述雙通道模型與CWT-CNN模型、GWOVMD-CNN模型和基于機器學(xué)習(xí)的傅里葉變換-支持向量機(FT-SVM)模型進行處理結(jié)果對比驗證。
為了降低實驗結(jié)果的偶然性,驗證模型的穩(wěn)定性,筆者對每個模型進行10次實驗,并統(tǒng)計每次試驗的結(jié)果,計算模型的平均準確率和準確率的標準差,以說明模型準確率的波動情況。
最后得到的各個模型性能(即平均準確率和標準差),如表4所示。
表4 模型性能
其中,訓(xùn)練準確率變化曲線如圖7所示。
圖7 訓(xùn)練準確率變化曲線Fig.7 Training accuracy curve
圖7中:TWO-CNN表示筆者提出的雙通道CNN模型;CWT-CNN和GWOVMD-CNN模型是筆者提出的雙通道模型中的一個通道;FT-SVM表示FT-SVM模型。
筆者將軸承信號(包括包絡(luò)熵值、峭度等在內(nèi)的9種時頻域特征參數(shù)),經(jīng)過歸一化和降維處理后,輸入到SVM分類器中進行故障分類。
基于時頻圖和雙通道CNN的模型平均準確率為99.61%,準確率標準差為0.167,相比單通道模型和機器學(xué)習(xí)模型,該模型有著更高的準確率和更出色的穩(wěn)定性。
由此可以證明,基于時頻圖和雙通道CNN模型在軸承故障診斷方面具有一定的優(yōu)越性。
由于采用傳統(tǒng)信號處理方法難以從軸承振動信號中提取可以準確反映軸承運行狀態(tài)的特征,為此,筆者提出了一種基于時頻圖和雙通道CNN的軸承故障診斷方法。
首先,筆者使用GWOVMD-SPWVD和CWT兩種方式處理振動信號,并得到了其時頻圖;然后,將時頻圖作為雙通道CNN的輸入,采用雙通道CNN故障診斷方法對軸承進行了故障診斷。最后,將該方法與單通道CNN和SVM方法進行了對比,利用軸承故障試驗臺數(shù)據(jù)對其有效性進行了驗證。
研究結(jié)果表明:
1)采用GWOVMD-SPWVD和CWT兩種方式可以獲得高分辨率特征信息豐富的二維圖像,而且可以作為一種數(shù)據(jù)增強的方式擴充數(shù)據(jù)集;
2)使用的雙通道CNN在軸承故障實驗中的準確率達到了99.69%,在10次實驗中的平均準確率為99.61%。相比其他兩種單通道,CNN模型的平均準確率分別提高了0.45%和0.58%??梢婋p通道CNN結(jié)構(gòu)對軸承故障有更好的診斷效果;
3)根據(jù)實驗結(jié)果可知,雙通道CNN的平均準確率相比SVM提高了8.7%,這表明雙通道CNN相比SVM可以更有效地提取圖像深層次特征,并在較深層完成特征融合和軸承故障分類的任務(wù)。
鑒于神經(jīng)網(wǎng)絡(luò)層數(shù)的大小、參數(shù)的選擇等因素對模型準確率有著很大影響,因此在后續(xù)工作中,筆者將對神經(jīng)網(wǎng)絡(luò)的具體結(jié)構(gòu)及其參數(shù)優(yōu)化做進一步的研究。