李益兵, 黃定洪, 馬建波, 江 麗
(1. 武漢理工大學 機電工程學院,武漢 430070; 2. 數(shù)字制造湖北省重點實驗室,武漢 430070)
齒輪作為旋轉(zhuǎn)機械和傳動系統(tǒng)中的關(guān)鍵零部件之一,具有結(jié)構(gòu)緊湊、傳動效率高等優(yōu)點。當齒輪發(fā)生故障時,會嚴重影響旋轉(zhuǎn)機械和傳動系統(tǒng)的使用壽命和運行安全[1]。齒輪的振動信號往往呈現(xiàn)出非線性、非平穩(wěn)性等特點,傳統(tǒng)的故障診斷方法主要從時域、頻域和時頻域方面對數(shù)據(jù)進行特征提取,并輸入到相應(yīng)的分類器中進行故障分類。胡蔦慶等[2]通過經(jīng)驗模態(tài)分解對振動信號進行特征提取,并利用深度卷積神經(jīng)網(wǎng)絡(luò)進行特征融合,實現(xiàn)了齒輪箱的故障診斷。辛玉等[3]通過迭代經(jīng)驗小波變換對齒輪振動信號進行特征提取,利用輸出層(soft-max)進行故障分類。上述方法中,需要進行人為的特征提取,依賴于一定的信號處理技術(shù)和專家經(jīng)驗;而且,傳統(tǒng)的分類器,如BP(back propagation)神經(jīng)網(wǎng)絡(luò)、SVM(support vector machine)等大多是基于淺層的網(wǎng)絡(luò)模型結(jié)構(gòu),訓練時容易陷入局部最優(yōu),泛化能力較差。
深度置信網(wǎng)絡(luò)(deep belief network, DBN)作為經(jīng)典的深度學習算法之一,具有強大的自適應(yīng)特征提取和非線性數(shù)據(jù)處理能力,可以直接對原始時域振動信號進行特征提取[4],避免了傳統(tǒng)方法對信號處理技術(shù)和專家經(jīng)驗的依賴。近年來,DBN被廣泛應(yīng)用于各種機械設(shè)備的故障診斷。Yan等[5]針對傳統(tǒng)數(shù)據(jù)處理方法無法有效挖掘多源異構(gòu)數(shù)據(jù)中的特征分布,提出一種基于多源異構(gòu)信息融合的DBN轉(zhuǎn)子不平衡故障診斷方法。與傳統(tǒng)故障診斷方法相比,該方法對轉(zhuǎn)子不平衡的故障診斷精度高達100%,大大提高了模型的故障識別精度。Xu等[6]提出一種基于DBN和模糊C均值聚類算法的無標簽數(shù)據(jù)滾動軸承故障診斷方法,試驗表明,該方法的故障診斷精度優(yōu)于變分模態(tài)分解-奇異值分解-模糊C均值聚類等組合模型。Zhang等[7]提出一種基于混合深度置信網(wǎng)絡(luò)的故障診斷模型,該模型通過不同的數(shù)據(jù)集成方式對汽車驅(qū)動系統(tǒng)進行智能故障診斷,并通過試驗證明了方法的優(yōu)越性。陳保家等[8]對齒輪的原始時域振動信號進行傅里葉變換,然后將提取的特征信號輸入到DBN模型中進行診斷分析,并取得了較好的識別效果。鄭小霞等[9]采用變分模態(tài)分解法對風機的振動信號進行特征提取,然后將提取到的故障特征構(gòu)建高維特征向量輸入到DBN分類器中進行故障識別,提高了風機易損部件故障預警的準確率。
DBN結(jié)構(gòu)參數(shù)的選取對模型的故障特征提取能力起著至關(guān)重要的作用,然而上述方法,對DBN結(jié)構(gòu)參數(shù)的選擇大多是憑經(jīng)驗人為確定,從而導致模型的故障診斷性能存在一定的不確定性。對此,Shao等[10]提出一種基于粒子群優(yōu)化DBN的軸承故障診斷方法,在缺乏先驗知識的情況下取得了較好的故障識別精度。此外,相對于單一傳感器,多傳感器信息融合可以較為全面、準確的反映設(shè)備的運行狀態(tài),從而提高故障診斷的精度。李松柏等[11]通過對多傳感器采集的振動信號進行數(shù)據(jù)層融合,并利用堆疊降噪自編碼進行逐層特征提取,試驗表明該方法的識別精度高于單一信號的識別精度。
基于此,本文提出基于DBN與信息融合的齒輪故障診斷方法。該方法利用多傳感器信息融合技術(shù)對每個傳感器采集的振動信號進行數(shù)據(jù)層融合。同時,為了避免人為選擇結(jié)構(gòu)參數(shù)對DBN特征提取能力的影響,結(jié)合改進的混合蛙跳算法(improved shuffled frog leaping algorithm,ISFLA)全局搜索能力強、收斂速度快、易跳出局部極值等優(yōu)點[12]對DBN結(jié)構(gòu)參數(shù)進行優(yōu)化,以提高模型的故障診斷精度。
深度置信網(wǎng)絡(luò)是由多個受限玻爾茲曼機(restricted boltzmann machine,RBM)堆疊而成的多隱含層神經(jīng)網(wǎng)絡(luò),其核心是通過逐層貪婪學習算法優(yōu)化DBN各隱含層之間的連接權(quán)重,從而有效挖掘原始數(shù)據(jù)中的故障特征。圖1(a)為三個RBM和soft-max堆疊而成的DBN模型結(jié)構(gòu),每一個RBM由可視層和隱含層組成。RBM層間的神經(jīng)元相互獨立無連接,層與層之間的神經(jīng)元全連接,如圖1(b)所示。圖中:v為可視層神經(jīng)元;h為隱含層神經(jīng)元;a為可視層偏置向量;b為隱含層偏置向量;Wnm為可視層與隱含層之間的連接權(quán)重。
RBM作為DBN的基本組成單元,訓練DBN的實質(zhì)就是對RBM進行訓練。RBM是基于能量的模型,其公式推導見文獻[13],由于其值不易求解,文獻[14]采用對比散度算法用于快速訓練RBM,其訓練過程如圖1(c)所示。DBN訓練過程主要分為兩個階段:
(1) RBM無監(jiān)督逐層預訓練過程。通過一系列非線性變換,自適應(yīng)的從原始高維數(shù)據(jù)中提取深層次的特征表示。
(2) 反向微調(diào)過程。RBM無監(jiān)督逐層預訓練過程只能確保每一層自身的權(quán)值對該層的特征提取能力達到最優(yōu),由于訓練誤差會進行逐層傳遞,從而形成誤差累積。因此,需要對DBN每一層的連接權(quán)重和偏置進行微調(diào),使誤差達到最小。
圖1 DBN模型結(jié)構(gòu)
為了避免因人為選擇DBN結(jié)構(gòu)參數(shù)導致模型診斷性能下降,以及窮舉法耗時耗力等問題,本文采用ISFLA對DBN結(jié)構(gòu)參數(shù)進行優(yōu)化。優(yōu)化參數(shù)包括RBM1,RBM2和RBM3各隱含層的神經(jīng)元個數(shù)m1,m2和m3,以及學習率η(0,1)。
ISFLA的基本思想是將一個青蛙種群Fp劃分為mp族群,然后在每個族群中進行局部搜索策略,使性能優(yōu)異的青蛙(模因)在族群個體之間傳遞。局部搜索策略結(jié)束之后,將mp個族群混合,并進行全局搜索策略,然后更新全局最優(yōu)蛙。全局搜索策略使不同族群之間的模因得以交流,從而使算法能夠跳出局部極值點,避免早熟現(xiàn)象發(fā)生,向全局最優(yōu)方向前進,ISFLA更新公式為[15]
s=r1(Ul-Uw)+r2(Ug-Uw)
(1)
(2)
U′w=Uw+S
(3)
Smax=Ps(Xup-Xdown)
(4)
式中:r1和r2為[0,1]的隨機數(shù);Uw,Ul和Ug分別為局部最差蛙、局部最優(yōu)蛙和全局最優(yōu)蛙;U′w為更新后的值;Smax為最大跳躍步長;Ps為跳躍步長系數(shù)。
ISFLA是一種基于種群的啟發(fā)式算法,因此,初始種群的好壞對算法的搜索性能極其重要。當初始種群在可行域中分布不均勻時,將導致算法的搜索范圍受到一定的限制,從而降低算法的全局搜索能力。因此,本文采用正交設(shè)計理論來初始化青蛙種群[16]。族群mp較小時,不僅會導致各族群之間的交流減少,而且還會使得算法的求解速度變慢,所以mp數(shù)量不宜過小。族群內(nèi)青蛙個數(shù)np的增加會導致青蛙種群數(shù)目變大,會有更多的青蛙接近于最優(yōu)解,但是在族群mp確定的情況下,np的增大不僅不會提高求解精度,反而會增加計算成本。局部迭代次數(shù)Nl太小,則失去局部深度搜索的意義,太大則會導致算法的效率大打折扣。根據(jù)Eusuff等研究中給出的參考范圍,本文選取的算法參數(shù)如表1所示。
表1 ISFLA參數(shù)
為了保證青蛙族群的多樣性,同時防止陷入局部最優(yōu)解,在隨機選擇q只青蛙構(gòu)建子族群時,對適應(yīng)度值較大的青蛙賦予較大的權(quán)重,適應(yīng)度值較小的青蛙賦予較小的權(quán)重,權(quán)重按照式(5)進行分配[17]。
(5)
為了能夠全面、準確的反映設(shè)備運行狀態(tài),通常采用多傳感器進行信號采集,以提高故障診斷精度。在連續(xù)時間上采用D個同類型傳感器,對反映設(shè)備運行狀態(tài)隨時間變化的一系列振動信號進行采集,得到多維時間序列數(shù)據(jù)集X。
式中:D為傳感器的個數(shù);i為1~N的某一時刻;xk(i)為第k個傳感器在i時刻的觀測值。
使用加權(quán)平均法,將D個傳感器在i時刻采集的振動信號進行數(shù)據(jù)層融合為Pi={x1(i),x2(i),L,xk(i),L,xD(i)},得到樣本數(shù)據(jù)集Q=[P1,P2,L,Pi,L,PN]T。
基于深度置信網(wǎng)絡(luò)與信息融合的齒輪故障診斷模型如圖2所示,主要分為三個步驟:
步驟1振動信號采集和數(shù)據(jù)預處理
本文試驗部分采用型號為PCB-356A16的三個加速度傳感器,采集齒輪箱振動信號,數(shù)據(jù)采集卡型號為NIPXI-1042,采樣頻率為5 000 Hz。然后,對采集的多維時間序列數(shù)據(jù)集X利用加權(quán)平均法進行數(shù)據(jù)層融合,得到樣本數(shù)據(jù)集Q。
為消除變量之間量綱和數(shù)量級的影響,利用式(6)對樣本集Q進行歸一化處理。
(6)
式中:xi為第i個采樣點;xmin為樣本集中最小采樣值;xmax為最大采樣值。然后,將處理后的樣本集按一定的長度進行采樣,得到由n個樣本組成的數(shù)據(jù)集A,按3∶1∶1的比例劃分為訓練集S、驗證集V和測試集T,滿足關(guān)系A(chǔ)=S∪V∪T,且S∩V∩T=?。
步驟2ISFLA-DBN逐層特征提取
首先,利用ISFLA對DBN各隱含層神經(jīng)元個數(shù)和反向微調(diào)算法的學習率進行參數(shù)優(yōu)化,并將ISFLA輸出的最優(yōu)解重構(gòu)DBN模型。然后,將訓練集和驗證集數(shù)據(jù)輸入到經(jīng)ISFLA優(yōu)化后的DBN模型中進行訓練,使得各隱含層之間的連接權(quán)重和偏置達到最優(yōu),從而提高模型的故障特征提取能力。最后,將測試集數(shù)據(jù)輸入到訓練好的DBN模型中進行逐層特征提取。
步驟3故障分類
將ISFLA-DBN模型中最后一個隱含層提取的故障特征輸入到Soft-max分類器中進行故障分類,從而實現(xiàn)齒輪的故障診斷。
圖2 基于深度置信網(wǎng)絡(luò)與信息融合的齒輪故障診斷模型
多傳感器信號采集試驗臺如圖3所示,主要包括:一臺伺服電機、單級齒輪變速箱、一個扭矩傳感器、以及電磁制動器和制動控制器。
圖3 單級齒輪變速箱試驗臺
由于制造、裝配以及傳動等誤差的共同作用下,齒輪箱中的齒輪、軸承等在工作時會產(chǎn)生振動,振動信號由齒輪經(jīng)傳動軸和軸承座傳遞到箱體上,從而引起箱體的振動。信號在傳遞過程中會不斷發(fā)生衰減,靠近軸承座附近的測點信號頻率及幅值衰減較小,振動信號故障特征表現(xiàn)較為明顯。基于此,為了有效、全面的獲取齒輪振動信號,分別在主動齒輪軸承端、從動齒輪軸承端以及試驗臺基座上安裝加速度傳感器,采集x,y,z方向上的振動信號,加速度傳感器按照位置如圖4所示。
試驗中,通過線切割的方式在主動齒輪齒根處切割四種不同深度的齒輪裂紋,以模擬齒輪正常狀態(tài)、輕度故障、中度故障和重度故障,對應(yīng)的裂紋深度分別為0 mm,5 mm,10 mm,15 mm,試驗用齒輪參數(shù)如表2所示。
圖4 加速度傳感器安裝位置
實際工況下,齒輪的轉(zhuǎn)速或負載并不是一個恒定值,即同一種齒輪故障狀態(tài)可能對應(yīng)多種運行工況。因此,為了探究模型對同一故障類型在不同工況下的故障診斷性能,對每一種齒輪裂紋分別選擇轉(zhuǎn)速1 200 r/min、負載2 N·m,以及轉(zhuǎn)速1 500 r/min、負載4 N·m兩種工況進行試驗研究。每種齒輪故障取900個樣本,每個樣本維度為800,共3 600個樣本,將其劃分為訓練集S、驗證集V和測試集T。齒輪樣本劃分如表3所示。
表2 齒輪參數(shù)列表
表3 齒輪故障參數(shù)及樣本劃分
在64位Intel i5-8250U 2.2 GHz,8 GB內(nèi)存運行環(huán)境下,使用相同的數(shù)據(jù)集進行試驗。本文選取BP神經(jīng)網(wǎng)絡(luò)、未經(jīng)優(yōu)化的DBN和本文提出的方法進行試驗對比,比較三種方法在訓練集、驗證集上的準確率和損失值,以及算法趨于穩(wěn)定時所需的迭代次數(shù)。
由輸入樣本維數(shù)以及齒輪故障類型可知:DBN以及BP神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層神經(jīng)元個數(shù)分別為800和4。由于Adam算法是目前優(yōu)化效果最好的反向微調(diào)算法[18],因此,本文采用Adam算法作為反向微調(diào)算法。其中,Adam第一次估計指數(shù)衰減率為0.9,Adam第二次估計指數(shù)衰減率為0.999。算法迭代次數(shù)K=500,迭代步長為64,每個RBM迭代次數(shù)為100,輸入層激活函數(shù)為Relu函數(shù),輸出層為soft-max,損失函數(shù)為交叉熵損失函數(shù)。
3.2.1 ISFLA-DBN模型
采用ISFLA對DBN各隱含層神經(jīng)元個數(shù)以及反向微調(diào)算法學習率進行參數(shù)優(yōu)化。利用ISFLA在給定范圍進行參數(shù)尋優(yōu),得到DBN模型結(jié)構(gòu)為800-1 084-682-364-4,反向微調(diào)算法學習率η=8.661 4×10-4。
3.2.2 DBN模型
采用逐級遞減的方式[19]人為構(gòu)建DBN模型,即DBN模型中后一層神經(jīng)元個數(shù)要小于前一層神經(jīng)元個數(shù),得到的DBN模型結(jié)構(gòu)為800-600-400-200-4,反向微調(diào)算法學習率為η=6×10-5。
3.2.3 ISFLA-BP模型
選取三層ISFLA-BP神經(jīng)網(wǎng)絡(luò)作為比較算法,利用ISFLA對BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元個數(shù)以及反向微調(diào)算法學習率進行優(yōu)化,得到ISFLA-BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)為800-336-4,學習率η=0.062 466。
3.3.1 DBN與ISFLA-DBN對比分析
DBN和ISFLA-DBN模型在訓練集和驗證集上的準確率和損失變化曲線,如圖5和圖6所示。由圖可知,DBN模型在訓練集和驗證集上的收斂速度相對較慢,并且存在過擬合情況。而ISFLA-DBN模型在訓練集和驗證集上的準確率、損失值、收斂速度、擬合效果均優(yōu)于DBN模型,即ISFLA可用于優(yōu)化DBN結(jié)構(gòu)參數(shù)以提高模型的故障診斷性能。
圖5 DBN和ISFLA-DBN準確率對比
圖6 DBN和ISFLA-DBN損失對比
3.3.2 ISFLA-DBN逐層特征提取能力
由于樣本數(shù)據(jù)和ISFLA-DBN模型中各隱含層提取的特征維數(shù)較高,不利于可視化觀察。因此,為了便于進一步評估ISFLA-DBN模型特征提取能力,對樣本數(shù)據(jù)和ISFLA-DBN模型中各隱含層的輸出利用主成分分析法,提取前兩個主成分進行可視化分析,可視化特征如圖7~圖10所示。圖中:“0”為正常齒輪; “1”為輕度齒輪故障; “2”為中度齒輪故障; “3”為重度齒輪故障。
圖7 原始數(shù)據(jù)集可視化特征圖
圖8 第1隱含層可視化特征圖
由圖7可知,齒輪原始時域振動信號相互交錯,很難進行故障區(qū)分。將數(shù)據(jù)集輸入到ISFLA-DBN模型中進行特征提取,經(jīng)RBM1特征提取后,四種故障信號由最初混亂無序的狀態(tài)開始有效的聚集,并且處于一種向外發(fā)散狀態(tài)。其中,正常齒輪和重度齒輪故障信號有效的聚集在一起,輕度齒輪和中度齒輪兩種故障信號存在部分交叉重疊現(xiàn)象,如圖8所示。經(jīng)RBM2特征提取之后,輕度齒輪和中度齒輪兩種故障信號基本上完全剝離開,只有極少部分出現(xiàn)相互交錯的現(xiàn)象,如圖9所示。經(jīng)RBM3特征提取之后,四種故障信號全部剝離開,如圖10所示。
圖9 第2隱含層可視化特征圖
圖10 第3隱含層可視化特征圖
3.3.3 ISFLA-BP、DBN和ISFLA-DBN對比分析
對比三種故障診斷模型在訓練集和驗證集上算法趨于穩(wěn)定時,訓練集和驗證集準確率的最大值,以及算法趨于穩(wěn)定時,所需迭代次數(shù)和損失差值大小,取10次運行結(jié)果的平均值進行比較,結(jié)果如表4所示。
表4 三種算法運行結(jié)果對比
由表4可知,ISFLA-DBN模型在訓練集和驗證集上的準確率和損失差值均高于DBN和ISFLA-BP模型,且算法趨于穩(wěn)定時所需的迭代次數(shù)僅為43次,遠低于DBN和ISFLA-BP模型的126次和264次。
3.3.4 ISFLA-DBN模型泛化性能分析
為了進一步評估ISFLA-DBN模型的泛化性能,即檢驗模型在未知數(shù)據(jù)集上的故障分類準確率,將測試集數(shù)據(jù)輸入到訓練好的ISFLA-DBN模型,并將結(jié)果以混淆矩陣形式表示,如圖11所示。橫軸代表預測的軸承故障類別,縱軸代表真實故障類別,對角線上的數(shù)值表示故障類別預測準確率,非對角線上的數(shù)值表示該類別預測錯誤的概率。
圖11 齒輪故障分類混淆矩陣
由圖11可知,正常齒輪故障識別率達到100%。輕度齒輪故障識別率較低,為94.44%,其中4.81%的概率預測為中度齒輪故障,說明輕度齒輪和中度齒輪故障的振動信號存在部分相似。中度齒輪和重度齒輪故障識別都較高,分別為97.78%和96.67%。四種齒輪故障平均準確率為97.22%,說明ISFLA-DBN模型在未知數(shù)據(jù)集上具有較好的泛化性能。
3.3.5 多傳感器與單傳感器試驗對比
為了驗證多傳感器信息融合相對于單傳感器更能全面、準確的反映齒輪運行狀態(tài),將傳感器1、傳感器2和傳感器3采集的振動信號作為獨立的數(shù)據(jù)源,與融合后的信號進行試驗對比,比較其在算法趨于穩(wěn)定時訓練集和驗證集故障識別準確率的大小,取5次運行結(jié)果的平均值進行比較,結(jié)果如表5所示。
表5 多傳感器數(shù)據(jù)融合與單傳感器故障診斷對比
由表5可知,多傳感器數(shù)據(jù)融合在驗證集和訓練集上的準確率最高,相對于傳感器1~傳感器3來說更能準確地反映齒輪的運行狀態(tài)。傳感器2和傳感器3在訓練集和驗證集的準確率都較高,傳感器1的準確率最低。
本文針對傳統(tǒng)故障診斷方法依賴于一定的信號處理技術(shù)和專家經(jīng)驗,單一傳感器無法全面、準確的反映復雜設(shè)備的運行狀態(tài),提出基于深度置信網(wǎng)絡(luò)與信息融合的齒輪故障診斷方法。該方法利用加權(quán)平均法對多傳感器采集的振動信號進行數(shù)據(jù)層融合,并利用ISFLA全局搜索能力強、易跳出局部極值、收斂速度快等優(yōu)點對DBN結(jié)構(gòu)參數(shù)進行優(yōu)化。
試驗表明,ISFLA-DBN和DBN模型相對于淺層BP神經(jīng)網(wǎng)絡(luò)具有更高的故障識別精度、更快的收斂速度以及更少的迭代次數(shù)。經(jīng)過ISFLA優(yōu)化后的DBN模型擬合效果更好、損失誤差更小、故障識別精度更高。相對于單一傳感器故障診斷來說,多傳感器數(shù)據(jù)融合更能全面、準確地反映齒輪的運行狀態(tài)。