郭占廣,尹 帥,謝敬玲,宮 輝
(青島杰瑞工控技術(shù)有限公司,青島 266520)
近年來隨著科學(xué)技術(shù)的飛速發(fā)展,我國新型軌道交通技術(shù)已經(jīng)融入到人們的生活當(dāng)中。城市軌道交通行業(yè)對我國經(jīng)濟(jì)發(fā)展、社會安全、改善民生有著至關(guān)重要的作用[1]。數(shù)據(jù)顯示最近幾年我國城市軌道交通行業(yè)運送客流量急劇增加,運營里程數(shù)迅速增長,如何在列車高效快速運行環(huán)境中保證行車安全,逐漸成為每個城市面對的重大難題[2]。
由中國中車研制的我國首列中國標(biāo)準(zhǔn)地鐵列車下線,該列車作為未來城市軌道交通建設(shè)的重點車型,其車輛技術(shù)規(guī)范中明確要求對列車關(guān)鍵部件實現(xiàn)在線安全監(jiān)測[3]。走行部是城市軌道車輛關(guān)鍵的部件之一,負(fù)責(zé)列車運行方向的導(dǎo)引以及車體承重,列車走行部一旦出現(xiàn)故障,輕則停運、抽線、救援,重則引起重大安全事故,走行部的實時狀態(tài)關(guān)系著整車的運營安全[4]。
走行部軸承作為城市軌道列車應(yīng)用最易損耗的部件之一,其健康狀態(tài)對列車的安全運行有著重大影響[5]。我國針對城軌列車軸承在線故障診斷研究開始相對較晚,目前城市軌道列車走行部的狀態(tài)檢測、運行維護(hù)主要靠運維人員在當(dāng)日列車回庫后進(jìn)行目視檢查[6],人為因素較大,實時性不強,多數(shù)情況下不能及時發(fā)現(xiàn)問題,容易存在安全隱患,降低列車運行的可靠性和安全性[7]。目前國內(nèi)許多專家學(xué)者就軸承診斷問題進(jìn)行研究,文獻(xiàn)[8]基于MPE和PSO-SVM 建立了軸承故障診斷模型;文獻(xiàn)[9]通過聯(lián)合MOMEDA 實現(xiàn)故障特征的提取;文獻(xiàn)[10]基于GA-BP 神經(jīng)網(wǎng)絡(luò)針對軸承狀態(tài)建立了預(yù)防模型。但國內(nèi)目前研究結(jié)果還不能實際應(yīng)用到軸承故障預(yù)測中,如果能夠?qū)崟r感知軸承狀態(tài),跟蹤潛在故障,進(jìn)行針對性的維修,將可以有效地降低列車發(fā)生故障的概率。
因此本文針對走行部軸承的實時狀態(tài),提出了基于膠囊神經(jīng)網(wǎng)絡(luò)的軸承狀態(tài)識別算法,實驗結(jié)果表明該模型具有良好的魯棒性、實時性,能夠準(zhǔn)確地識別走行部軸承的健康狀態(tài),對列車關(guān)鍵部件實現(xiàn)實時監(jiān)測具有重要的推動作用,為研究和開發(fā)實用有效的列車關(guān)鍵部件自檢系統(tǒng)奠定良好的基礎(chǔ)。
卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的代表算法,其在特征提取方向上有良好的表象能力,與常規(guī)的人工特征提取方法相比,卷積神經(jīng)網(wǎng)絡(luò)通過池化技術(shù)有效地降低數(shù)據(jù)特征維度,改善了模型的泛化性能。但是卷積神經(jīng)網(wǎng)絡(luò)仍然存在一些問題,為保證模型的準(zhǔn)確率,卷積神經(jīng)網(wǎng)絡(luò)需要龐大的數(shù)據(jù)集進(jìn)行訓(xùn)練且不能很好地應(yīng)對模糊性,卷積神經(jīng)網(wǎng)絡(luò)會在池化層丟失大量的信息,從而降低空間分辨率。膠囊神經(jīng)網(wǎng)絡(luò)的提出解決了卷積神經(jīng)網(wǎng)絡(luò)這一難題。
2017 年10 月份全球頂級機(jī)器學(xué)習(xí)會議“神經(jīng)信息處理系統(tǒng)大會(NIPS)”中,深度學(xué)習(xí)之父Hinton教授提出了膠囊神經(jīng)網(wǎng)絡(luò)。膠囊神經(jīng)網(wǎng)絡(luò)摒棄了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)事無巨細(xì)的特征提取方式,提出膠囊的概念,利用膠囊表示一個事物整體的一個局部特征,進(jìn)行高緯度分類,具體核心思路概括為以下兩點:第一,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)不同,膠囊神經(jīng)網(wǎng)絡(luò)的基本單元是膠囊(Capsule),膠囊中包含多個神經(jīng)元,膠囊的輸入輸出均為向量,且向量的長度代表傳統(tǒng)神經(jīng)元中的概率,向量方向則用來表示其他信息(位置、顏色等信息);第二,膠囊神經(jīng)網(wǎng)絡(luò)的動態(tài)路由機(jī)制替代了傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的最大池化方法。
膠囊神經(jīng)網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上有所不同。以手寫體數(shù)字識別為例,編碼結(jié)構(gòu)如圖1 所示,膠囊神經(jīng)網(wǎng)絡(luò)的第1 層為卷積層(Conv1 層),數(shù)據(jù)輸入到膠囊神經(jīng)網(wǎng)絡(luò)首先經(jīng)過卷積層進(jìn)行卷積計算,進(jìn)行特征的初步提取,此卷積層通過ReLU 激活函數(shù)來激活神經(jīng)元,卷積層輸出的特征傳遞到膠囊神經(jīng)網(wǎng)絡(luò)的下一層的基礎(chǔ)膠囊層中。
圖1 編碼結(jié)構(gòu)Fig.1 Encoding structur
膠囊神經(jīng)網(wǎng)絡(luò)在卷積層后面加入了基礎(chǔ)膠囊層(Primary Caps)和數(shù)字膠囊層(Digit Caps)替代原卷積神經(jīng)網(wǎng)絡(luò)中的采樣層?;A(chǔ)膠囊層是一種特殊的卷積結(jié)構(gòu),可以通過多個卷積核獲得最低級的多維實體特征,并將這些特征進(jìn)行組合。數(shù)字膠囊層與全連接層相似,膠囊單元接受來自基礎(chǔ)膠囊層的輸出矢量,其耦合系數(shù)決定每個膠囊信息的接受程度。動態(tài)路由機(jī)制僅在基礎(chǔ)膠囊層和數(shù)字膠囊層之間進(jìn)行[11]。
膠囊神經(jīng)網(wǎng)絡(luò)的解碼結(jié)構(gòu)共包含3 個全連接層,如圖2 所示。
圖2 解碼結(jié)構(gòu)Fig.2 Decoding structure
原始數(shù)據(jù)輸入到膠囊神經(jīng)網(wǎng)絡(luò),首先進(jìn)行編碼,對原始數(shù)據(jù)進(jìn)行特征提取獲得多維度輸出,而后經(jīng)過數(shù)字膠囊層得到每種結(jié)果的預(yù)測概率,概率最高的被送入解碼結(jié)構(gòu)進(jìn)行重建,獲得重建損失。
膠囊神經(jīng)網(wǎng)絡(luò)引入Squashing 函數(shù)作為激活函數(shù),確保輸出的向量長度能夠歸一化。表達(dá)式如式(1)所示:
式中:Vj為j 個膠囊的總輸出向量;Sj為j 個膠囊的總輸入向量。
傳統(tǒng)網(wǎng)絡(luò)通過加權(quán)求和的方式獲得網(wǎng)絡(luò)的輸出,膠囊神經(jīng)網(wǎng)絡(luò)在傳統(tǒng)加權(quán)求和的基礎(chǔ)上增加了耦合系數(shù)cij,表達(dá)式如式(2)和式(3)所示:
式中:ui表示第l 層的第i 個膠囊,ui儲存局部信息;Wij代表第l 層的第i 個膠囊和第l+1 層的第j 個膠囊的權(quán)重矩陣,通過仿射變換,將ui儲存的局部信息映射為整體信息;代表l+1 層的第j 個膠囊在第l 層的第i 個膠囊下的整體信息預(yù)測結(jié)果。
其中Cij為每一個底層膠囊與之相對應(yīng)的高層膠囊之間的權(quán)重,由采用的動態(tài)路由算法中的softmax 函數(shù)決定,表達(dá)式如式(4)所示:
動態(tài)路由算法的具體計算過程,如圖3 所示。其中bij為膠囊i 與膠囊j 相互耦合的先驗概率,bij只依賴于兩個膠囊的位置與類型。
圖3 膠囊神經(jīng)網(wǎng)絡(luò)路由算法運算流程Fig.3 Capsule neural network routing algorithm operation flow chart
膠囊神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為SVM 中的Margin Loss 函數(shù),如式(5)所示:
式中:Tk為分類指示函數(shù)(k 類存在即為1,不存在為0);vk代表網(wǎng)絡(luò)輸出數(shù)據(jù);m+為上界,懲罰假陽性;m-為下界,懲罰假陰性,本文選取經(jīng)驗值m+=0.9,m-=0.1;λ 為比例系數(shù),調(diào)整兩者比重,默認(rèn)初始值為0.5[12]。
由于膠囊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)比較復(fù)雜,訓(xùn)練數(shù)據(jù)集龐大,故選擇高性能服務(wù)器來實現(xiàn)模型訓(xùn)練提速。本實驗所用服務(wù)器CPU 為i9 12900KF 型號,顯卡采用RTX 3090 Ti,內(nèi)存32 GB。操作系統(tǒng)為Windows10 64 位,膠囊神經(jīng)網(wǎng)絡(luò)模型通過開源的Keras 模塊搭建,軟件編程環(huán)境為python3.0。
美國凱斯西儲大學(xué)(Case Western Reserve University,CWRU)的滾動軸承數(shù)據(jù)作為本次實驗的數(shù)據(jù)集。該數(shù)據(jù)集作為當(dāng)前軸承故障診斷領(lǐng)域里公認(rèn)用于研究測試的數(shù)據(jù)集,在故障診斷研究領(lǐng)域的頂級期刊《機(jī)械系統(tǒng)和信號處理》上,有超過41 篇文章是基于該數(shù)據(jù)集做的研究。為驗證本文建立的模型的有效性以及效果的客觀性,本文將基于此數(shù)據(jù)集做模型的實驗測試,并與其他基于該數(shù)據(jù)集的軸承故障診斷方法進(jìn)行比較。
本文選取CWRU 數(shù)據(jù)集中的部分?jǐn)?shù)據(jù)作為實驗數(shù)據(jù)集,其中實驗數(shù)據(jù)集為電動機(jī)驅(qū)動端的軸承振動加速度信號,采樣頻率為48 kHz,軸承型號為6205-2RS JEM SKF 型軸承,電機(jī)轉(zhuǎn)速為1797 r/min,數(shù)據(jù)集共包含7 中狀態(tài)類型,分別是正常狀態(tài)、軸承內(nèi)圈輕故障、軸承內(nèi)圈重故障,軸承外圈輕故障、軸承外圈重故障、滾子輕故障、滾子重故障。每種狀態(tài)共包含100000 條數(shù)據(jù)。具體故障類型及編號如表1 所示。
表1 本文實驗數(shù)據(jù)說明Tab.1 Experimental data in this paper
為消除實驗數(shù)據(jù)中不同量綱帶來的影響,加快網(wǎng)絡(luò)模型的訓(xùn)練速度,本文采用Min-Max(minmax normalization)標(biāo)準(zhǔn)化方式對每種故障類型的每個傳感器數(shù)據(jù)進(jìn)行歸一化處理。計算方法如式(6)所示:
將處理后的數(shù)據(jù)集按4∶1 的比例劃分為訓(xùn)練集和驗證集,即每組數(shù)據(jù)訓(xùn)練集為80000 條數(shù)據(jù),驗證集為20000 條數(shù)據(jù)。
本文提出軸承故障診斷模型(BFD-Caps)共包括4 個結(jié)構(gòu)層:2 個卷積層,2 個膠囊層,與原始的CapsNet 相比,模型網(wǎng)絡(luò)結(jié)構(gòu)更深,提高了分類精度。具體網(wǎng)絡(luò)結(jié)構(gòu)如表2 和圖4 所示。基礎(chǔ)膠囊層與數(shù)字膠囊層之間全連接,所有權(quán)重由動態(tài)路由算法確定。
圖4 網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Network structure
表2 網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù)Tab.2 Network structure and parameters
實驗經(jīng)過3000 次迭代訓(xùn)練,訓(xùn)練時間花費約7 h,本文構(gòu)建的模型在實驗中的準(zhǔn)確率如圖5 所示,其中測試集準(zhǔn)確率高達(dá)98.65%,驗證集準(zhǔn)確率高達(dá)97.58%,可見該模型對軸承故障分類的準(zhǔn)確率極高,且具有良好的泛化能力,可應(yīng)用到實際中去。
圖5 訓(xùn)練效果Fig.5 Training results
不同的軸承故障診斷模型在CWRU 數(shù)據(jù)集中的識別結(jié)果,如表3 所示??梢钥闯霰疚幕谀z囊神經(jīng)網(wǎng)絡(luò)的軸承故障診斷模型識別率略低于RS-LSTM模型,但本文實驗訓(xùn)練時間遠(yuǎn)遠(yuǎn)少于RS-LSTM 模型的40 h,實驗結(jié)果表明本文模型改善了傳統(tǒng)故障診斷算法識別率低,訓(xùn)練速度慢的的問題。在較差的硬件配置下,花費更少的訓(xùn)練時間獲得較高的準(zhǔn)確識別率。
表3 本文算法與其他算法比較Tab.3 Proposed algorithm is compared with other algorithms
本文通過實驗證實了膠囊神經(jīng)網(wǎng)絡(luò)比其他方法更適合走行部軸承的故障診斷,膠囊神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡易,訓(xùn)練速度大幅提升。同時,由于膠囊神經(jīng)網(wǎng)絡(luò)的空間特性提煉出了更完整的振動信號特征,提升了識別精確度。目前膠囊神經(jīng)網(wǎng)絡(luò)仍處于起步階段,在以后的學(xué)習(xí)工作中去探索和已經(jīng)成熟的模型相結(jié)合,進(jìn)一步改善其應(yīng)用場景。