姜 山,封松林,吳 波,王文瑞,魯方林,袁曉兵
(1.中國科學院 上海高等研究院,上海 201210;2.中國科學院大學,北京 100049;3.中國科學院 上海微系統與信息技術研究所 無線傳感網與通信重點實驗室,上海 200050)
軸承作為機械設備的旋轉核心,廣泛地使用在各種旋轉機械設備中。對軸承故障診斷的研究一直都是學者的研究重點,一般故障診斷方法可以分為:基于搭建故障模型的方法、基于故障信號處理的方法、基于故障診斷知識的方法和多方法混合的方法[1,2]。其中,傳統基于故障模型搭建和故障信號處理的診斷方法,如小波變換[3]、短時傅里葉變換[4,5]、經驗模式分解[6~8]、支持向量機[9,10]等,要求通過構建數學模型來探索故障類型與故障現象之間的關聯,隨著機械裝備不斷向大型化和精細化方向發(fā)展,這種傳統的方法[11]逐漸難以勝任診斷任務的要求。
深度學習算法由于其強大的特征提取能力,在故障診斷領域引起廣泛的關注[12,13]。但傳統深度學習算法需要大量數據訓練模型,而軸承數據天然分布不均,帶標簽的異常數據十分稀缺。針對上述問題,遷移學習技術被應用在軸承故障診斷上[14]。趙宇凱等人[15]提出的基于VGG16網絡的遷移學習算法,通過ImageNet數據集作為源域數據對VGG16網絡進行預訓練,保存預訓練后的網絡結構及參數用于對軸承故障數據進行分類;張根保等人[16]利用棧式稀疏編碼器進行特征提取,利用SoftMax 函數進行分類,最終只需利用少量樣本即可調整模型,完成變工況故障診斷;Yang B等人[17]提出一種利用遷移學習方法進行軸承故障診斷的方法,通過對神經網絡進行遷移,同時添加正則項,最終實現了在缺乏數據的情況下訓練可靠模型;Wen L 等人[18]在稀疏自編碼器中加入最大均值差異(maximum mean discrepancy,MMD)以衡量源域和目標域的相似程度,泛化模型在變工況下的有效性。
本文針對單一帶標簽軸承故障數據稀缺,但物聯網技術可以采集多源異構軸承故障數據的現象[19],提出一種基于并行網絡多尺度特征融合的軸承診斷方法:首先,獲取不同視角下采集的軸承振動數據,分別作為并行網絡的輸入;其次,利用遷移學習理論,通過預訓練、微調的方式,分別獲取針對不同視角數據的遷移網絡模型,且將遷移網絡并行布置,得到并行網絡結構;再次,對并行網絡提取的中間特征進行多尺度特征融合,用融合后特征訓練分類神經網絡;最后,通過測試集數據對訓練的網絡進行測試,驗證網絡的準確性。
卷積神經網絡(convolutional neural network,CNN)[20~22]是應用最廣泛的神經網絡之一,其通常由卷積層、激活層、池化層和全連接層組成,結構見圖1。
圖1 CNN示意
卷積運算的數學模型為
式中 xl為第l 層卷積層的輸入特征,wl為第l 層卷積核對應的權重,bl為偏置,xl+1為第l層卷積運算的輸出特征,同時也是第l +1層的輸入特征。
本文采用ReLU函數作為激活函數[23],激活層表達式如下
式中 f(·)為ReLU 激活運算,yl+1為經過激活后新的輸出特征,xl+1為上層輸入特征。
本文采用最大池化[24],表達式如下
式中 yl+1為激活層輸出的特征圖;x,y 為池化窗起始坐標;L,W為池化窗的長和寬;pl+1為池化窗范圍內取得的最大值。
全連接層最后輸出等于分類數量的結果,公式見下
式中 fc為全連接層最終輸出,c 為第c 類分類,c =1,2,…,C;input為全連接層輸入。
通過SoftMax函數得出不同分類出現的概率公式如下
式中 Pc為經過SoftMax函數后第c類對應概率。
本文選用VGG16網絡作為并行網絡支路的組成網絡,表1為VGG16網絡詳細結構。
表1 VGG16 網絡結構
本文采用遷移學習中的模型遷移方法,采用預訓練—微調操作,先在大數據集上對神經網絡參數進行充分預訓練,然后將預訓練的神經網絡局部或者完整結構及參數遷移至新任務情景中實現“知識”遷移;再用目標域數據對網絡進行參數微調,獲得更匹配目標數數據分布的網絡。由于神經網絡淺層結構用于提取圖像的通用特征,基于預訓練—微調的模型遷移方法可以節(jié)約大量用于訓練網絡淺層結構的數據。
如圖2所示,本文并行網絡結構由2 條遷移VGG16 卷積網絡并行組成,遷移VGG16 網絡均采用預訓練—微調的模型遷移方法獲得。首先,利用自然圖像數據集ImageNet對VGG16網絡進行預訓練,然后,用連續(xù)小波變換(continuous wavelet transform,CWT)處理1D 信號所獲取時頻圖PCWT微調支路1網絡參數,用直接截取的軸承振動監(jiān)控波形圖Pwave微調支路2 網絡參數。完成預訓練—微調的遷移VGG16網絡模型分別提取軸承故障數據的中間特征fVGG16—CWT,fVGG16—wave。式(6)、式(7)為所提取特征的表達式
圖2 并行遷移VGG16 網絡結構
式中 fVGG16—CWT,fVGG16—wave為2條支路分別提取的故障數據中間特征;PCWT,Pwave為并行神經網絡不同分支的輸入數據;ImageNet 為遷移學習的源域數據集,fc1 為最終輸出特征的網絡層次。
本文提出一種多尺度特征融合方法。如圖3(a)所示,首先,將并行CNN提取出的中間特征進行拼接,獲取聯合特征fjoint。然后,對拼接特征fjoint分別進行1 ×1、3 ×1、5 ×1卷積以及3 ×1池化操作;通過1 ×1 卷積操作獲取特征的非稀疏表達,通過3 ×1 和5 ×1 卷積獲取特征不同尺度的稀疏特征,通過3 ×1池化獲取局部寬尺度特征。經過上述多尺度采樣操作,獲取最終融合特征ffusion。式(8)、式(9)為聯合特征fjoint和融合特征ffusion表達式
圖3 特征融合模塊和分類模塊
式中 fn(fjoint)為第n路子結構對拼接特征fjoint進行特征提取后所得子特征;n為子結構總數量;n =1,2,3,4。
分類模塊第一層為全連接層輸入層,直接取特征融合模塊輸出的最終融合特征;經過全連接網絡后輸入SoftMax層得到最終分類結果。為了增強分類模模塊的泛化能力,在分類模塊的全連接層與全連接層、全連接層與SoftMax層之間添加Dropout層以及ReLU層。圖3(b)為分類模塊結構。
1)獲取軸承不同視角振動信號;2)對輸入網絡的數據進行預處理,如信號采樣、獲取信號時頻圖、波形圖等;3)將預處理后數據分別輸入并行VGG16網絡,獲得對應的特征輸出fVGG16—CWT,fVGG16—wave;4)將步驟(3)所得特征輸入特征融合模塊,輸出融合特征向量;5)利用融合特征訓練分類模塊,直至模型最終收斂;6)驗證融合模型,用測試集數據驗證模型檢測準確性。上述診斷步驟如圖4。
圖4 故障診斷流程
本文采用凱斯西儲大學(Case Western Reserve University,CWRU)軸承數據中心提供的軸承測試數據集作為實驗訓練集。該數據集中一共設置了3 種類型的故障類型,分別為軸承內圈故障(inner-ring fault,IF)、外圈故障(outerring fault,OF)和球體故障(sphere fault,SF),同時也采集了無故障(NO)數據,每種故障分別用電火花加工出0.007,0.014,0.021,0.028 in(1in =2.54 cm)4 種不同的故障直徑,共有12種故障,此12種故障分別用0,1,2,3 hp驅動力進行驅動。
驅動電機轉速取值范圍為1 730 ~1 797 r/min,信號采樣率為12 kS/s,為保證輸入信號至少包含一個完整的軸承旋轉周期,每個取樣窗中至少包含400(12 000/1 797 ×60 =400.7)個采樣點;考慮到信號邊緣的無效區(qū)域,為了增強信號魯棒性,最終采用1 024 個采樣點作為一個訓練樣本,相鄰的樣本之間取50%的重疊采樣率;在最終獲取的所有樣本集中隨機選取50%作為訓練集,其余作為測試集。
本文設計實驗針對2 種軸承故障情況進行驗證,情況1,同樣的軸承故障尺寸,不同的故障位置;情況2,同樣故障位置,不同的故障尺寸。圖5 為不同情況下軸承故障數據圖像。其中,第1行為正常軸承數據,左側為采集的軸承振動波形,右側為對應的CWT時頻圖;第2 行為2 hp驅動下不同軸承故障位置對應的故障數據,上部數據為振動波形,下部數據為對應的時頻圖,從左到右依次為軸承IF、SF和OF;第3行為2 hp驅動下不同尺寸的軸承IF,從左到右依次對應0.007,0.014,0.021 in 大小故障,同樣上層數據為軸承振動波形圖,下側數據為對應時頻圖。
圖5 軸承故障數據
本文中設計表2結構的CNN作為對照模型,設振動波形數據輸入對照CNN組為實驗1,時頻圖輸入對照CNN組為實驗2;同時設遷移VGG16網絡分別輸入振動波形圖和時頻圖作為實驗3 和實驗4;設并行網絡結構但不進行多尺度特征融合為實驗5;設并行網絡結構及多尺度特征融合為實驗6。每組實驗分別針對情況1 和情況2 進行驗證。
表2 對照CNN結構
表3記錄情況1和情況2下各組實驗最終收斂所需迭代輪數和最終收斂準確率。由于各組實驗收斂輪數相差較多,故只取前50輪迭代準確率,如圖6。
表3 實驗結果
圖6 情況1 和情況2 下各組實驗50 輪迭代準確率
由表3和圖6(a)可得情況1 結果:實驗6 為最終提出算法,經實驗驗證只需經過約11 輪迭代即可收斂于99.6%的準確率。由表3和圖6(b)可得,實驗6驗證本文所提算法,最終以最快的收斂速度取得最高的準確率。
從6組實驗結果中可以得出:1)無論是振動波形圖數據還是時頻圖數據,均包含可供神經網絡學習的故障特征。2)實驗5驗證并行遷移VGG16 網絡提取特征直接拼接進行故障診斷方法效果,結果證明,在2種情況下其最終診斷準確率均要高于單一神經網絡模型。值得注意的是:在情況1下,雖然實驗5收斂準確率最高,但其前期收斂速度慢于實驗4,而在情況2下,實驗5 收斂速度和準確率均高于實驗3和實驗4,表明并行網絡結構相對于單一神經網絡可以對故障進行更多角度的表征。但從不同故障數據處理方法中提取的特征并不一定正相關,如果提取的兩個特征起始相關性不強,融合模型初始表現并不一定會優(yōu)于單獨神經網絡的表現。3)實驗6 驗證本文提出的算法效果,主要與實驗5進行對比可以發(fā)現:加入多尺度特征融合模塊后,其網絡模型在2種情況下表現均優(yōu)于實驗5,證明多尺度特征融合方法可以更好地提取包含在單一網絡模型提取出特征中的有效信息,通過更多角度、更多尺度的故障特征表征。
通過實驗得到如下結論:1)直接采集的振動信號數據和監(jiān)視器屏幕截圖數據,可以提取出有用的故障特征并應用于軸承的故障分類,從而減少了對數據處理先驗經驗的依賴、也減少了人為處理數據造成的有效數據丟失。2)利用并行CNN結構,同步提取不同視角下軸承故障數據中的中間特征;設計多尺度特征提取模塊,獲取對多視角特征的多尺度表達,實現對故障特征進行大尺度的全局解釋和小尺度的局部特征高精度解釋,獲取更好的故障特征表征。
3)針對軸承故障的不同分布,設計不同的實驗進行驗證,多角度驗證本文算法的故障診斷能力。