劉秀麗, 徐小力
(北京信息科技大學 現代測控技術教育部重點實驗室,北京 100192)
行星齒輪和軸承被廣泛應用于風力發(fā)電機組和航空設備中.由于長期工作在變轉速和變載荷的環(huán)境中,部件容易出現磨損等故障[1],對其開展故障診斷方法研究具有重要意義.
隨著機器學習方法的日漸成熟,傳統(tǒng)智能診斷方法在故障診斷領域應用廣泛.基于機器學習的傳統(tǒng)故障診斷方法分為3個步驟:① 通過對信號的降噪和分解等實現對信號的預處理;② 利用特征提取方法獲得經處理后的信號的時域、頻域和其他特征;③ 將最終提取的特征輸入到基于機器學習的分類器中進行訓練,利用訓練分類器實現對故障類型的識別.在上述步驟中,特征提取方法包括小波變換[1-2]、同步提取變換[3-4]和變分模態(tài)分解[5-6]等,其能夠二次過濾信號的無用特征,使得所需故障特征更明顯.反向傳播神經網絡[7-8]和支持向量機[9-10]等方法已被應用于故障診斷.雖然傳統(tǒng)智能方法具有特征提取操作簡單和分類器參數容易調節(jié)等特點,最終的診斷識別率可滿足大部分場景要求,但其割裂了故障特征提取與診斷識別,在信號特征處理中需要大量的專家經驗.
深度學習的目的為模仿人腦的學習方式,構建深層網絡模型.其利用大數據訓練模型獲得數據中隱含的特征,是一種集提取特征與模式識別為一體的智能模型.卷積神經網絡(CNN)[11-15]具有特征強大的學習能力和較高的泛化能力,在圖像識別領域應用廣泛.近幾年,一些學者提出將CNN應用于故障診斷領域.李恒等[16]對軸承滾動振動信號進行短時傅里葉變換,得到二維圖的時頻圖樣本,再將其分為訓練集和測試集放入二維CNN中進行故障診斷;韓濤等[17]提出一種基于多小波變換和CNN的滾動軸承智能復合故障診斷方法,將振動信號進行處理后得到多小波系數分支并利用其構造特征圖,輸入二維CNN以實現診斷.但上述研究中的CNN對故障信息提取的方式局限在二維形式,對一維時序原始信息的利用有限,影響故障診斷的準確率,并且對信號特征的處理方法仍依賴人工操作,沒有充分發(fā)揮深度學習模型的優(yōu)勢.Wu等[18]和李東東等[19]將原始一維振動信號直接輸入淺層的一維CNN實現故障診斷,但原始振動信號表現出多尺度復雜性和單一尺度的特征提取,無法充分獲取故障信息,對故障的特征提取效果不佳,診斷準確率和泛化能力有待提升.
本研究不固定各故障的特征在信號中所占比例和位置,原始振動信號表現出多尺度復雜性,利用特征金字塔網絡(FPN)[20]結構對CNN進行改進,構建基于特征金字塔的卷積循環(huán)神經網絡(CRNN):首先利用CNN框架,結合CNN的卷積層和循環(huán)神經網絡(RNN)中的長短時記憶(LSTM)層,形成新的CRNN以充分利用CNN對空間域信息和RNN對時域信息的學習能力;然后在每一層中權值共享,減少網絡參數;最后利用FPN構建全新特征圖,對傳感器采集的信號進行特征提取,實現故障診斷.該方法可以同時處理一維原始信號和二維信號,不依賴專家經驗和人工提取特征.多尺度的特征提取豐富了診斷信息,更高層級網絡結構使得網絡的特征學習更有效.
卷積核是構建卷積層的主要部分,其主要目的為提取信息特征.卷積核主要通過稀疏鏈接和權值共享在輸入信息上提取特征,其與輸入信息以局部鏈接的方式進行鏈接并滑動,滑動時利用權值共享進行計算得到信息特征值:
(1)
(2)
RNN是將時序信息納入計算范疇的網絡,對振動信號具有良好的解析能力.LSTM是循環(huán)神經網絡中的特種網絡,具備良好的時域特征提取特性.借助遺忘門,其可以更快收斂,減小過擬合概率.
LSTM的主要結構如圖1所示,包含輸入門、輸出門和遺忘門,表示為
圖1 LSTM結構Fig.1 Structure of LSTM
ft=σ(Wfht-1+Ufxt+bf)
it=σ(Wiht-1+Uixt+bi)
at=tanh(Waht-1+Uaxt+ba)
Ct=Ct-1ft+itat
ot=σ(Woht-1+Uoxt+bo)
ht=ottanhCt-1
(3)
式中:下標t表示第t輪循環(huán);ft為遺忘門;Wf、Wi、Wa和Wo為各門中的隱藏狀態(tài)權重矩陣的一維分量;Uf、Ui、Ua和Uo為輸入數據的權重矩陣的一維分量;xt為特征值;it和at為輸入門的兩條支路;Ct為細胞狀態(tài);ht為隱藏狀態(tài),由支路ot和Ct構成.
針對多尺度圖像的檢測共有如下3種方法[20]:
(1) 利用圖像金字塔構建不同尺度的特征金字塔.其缺點是訓練時間較長,內存較大,并且網絡只對某一個特點的分辨率進行訓練,可能會在訓練與推理時產生矛盾.
(2) 利用單個高層特征圖進行檢測.
(3) 利用不同層多尺度的特征圖進行檢測.該方法沒有充分利用低層特征圖中的空間信息.
FPN可以彌補目標檢測在處理多尺度變化問題時的不足,使得每一層不同尺度的特征圖都具有較強的語義信息.FPN可以融合低分辨率但語義信息較強和高分辨率語義信息較弱但空間信息豐富的特征圖,且僅增加較少計算量.在以特征金字塔為基礎的結構上,其能夠對每一層級的特征圖分別進行預測.具體結構如圖2所示.其中,conv為卷積運算函數,空間分辨率采用2倍采樣(2×up),然后利用逐元素相加融合上采樣的特征圖與相關從下而上的特征圖.迭代此過程,直到生成最精細的分辨率特征圖.通過附加1×1卷積層來產生最粗糙的分辨率特征圖.
圖2 FPN結構Fig.2 Structure of FPN
提出一種特征金字塔的CRNN結構,CRNN結合CNN與RNN中的LSTM層,充分利用兩種網絡對時域特征和空間域特征的強大處理能力,實現對故障特征全方位多尺度特征提取,提高故障診斷的準確率.
CRNN模塊的結構如圖3所示.其中,Relu為線性整流函數.其由卷積支路和LSTM支路并聯(lián)構成.卷積支路為卷積層,LSTM支路由LSTM層串聯(lián)池化層構成.為了配合FPN構建特征圖,要求CRNN塊的兩條支路擁有相同的語義尺寸.由于卷積的運算特性,每經過一層CNN,其實際語義強度增加(顏色漸深)同時,語義信息尺寸相應減小.而LSTM算法經過多輪運算后仍保持與原數據相同的語義尺寸,如圖4所示.因此,在LSTM支路中串聯(lián)池化層以達到改變實際語義尺寸輸出的目的.
圖3 CRNN塊結構Fig.3 Structure of CRNN
圖4 CNN和LSTM的語義變化Fig.4 Semantic map of CNN and LSTM
在設定實際參數時,將LSTM支路池化層的池化窗口參數與卷積支路卷積核參數設為相同,可以保證兩支路輸出的語義信息尺寸相等.將兩支路特征進行并聯(lián)運算:
Y2=UY2+VH+B
(4)
式中:Y2為并行運算的輸出;U和V分別為LSTM和卷積兩支路的合并權重;Y2為CNN支路輸出的一維展開;H為多輪LSTM支路輸出的集合;B為偏執(zhí)項.將Y2代入最大池化層后得到CRNN塊的輸出矩陣F.
利用特征金字塔構建特征圖可以在幾乎不增加預算量的前提下增強特征圖的數量和質量.在利用傳統(tǒng)網絡進行故障診斷時,只有最后一層網絡的輸出被納入分類器的運算輸入范疇.而特征金字塔特征提取方法能夠使用低層級網絡提取的特征,更有效地利用網絡的運算資源.
每個CRNN塊產生一個F.設共有q個層級的CRNN塊,則其輸出分別為F1,F2,…,Fq.利用FPN構建特征圖的具體實現方法如下:
(5)
式中:Fz為重構后第z層的特征圖;Fr為重構前第r層的特征圖.重構特征圖均包含深層特征語義,其中部分特征圖還包含淺層特征語義.
基于FPN的CRNN模型如圖5所示.其優(yōu)點主要有兩方面:① 在網絡的各個層級同時提取時域信息和空間域信息,使得特征信息更加豐富,有利于提升診斷準確率;② 使用FPN構建特征圖,增強各層級故障特征語義的同時節(jié)約運算資源,有利于加快故障診斷模型的收斂速度.特征金字塔的構建如圖6所示.
圖5 特征金字塔CRNN結構Fig.5 CRNN structure based on feature pyramid
圖6 特征金字塔構建示意圖Fig.6 Construction of feature pyramid
2.3.1構建數據集 將采集到的振動信號分為訓練集和測試集.為了取消量綱,加速收斂并增強數據可靠性,對原始振動數據進行歸一化處理:
(6)
圖7 順序重疊抽樣法Fig.7 Sequential overlapping sampling
CNN具有降維特性,導致每經過一次池化運算,數據量均降低至原數據的1/4,因此要求拆分后的單個數據長度可以被22n整除.其中,n為池化層層數,且數據長度大于一個轉動周期內所采集數據的長度,即
L≥60f/N
其中:L為抽取數據長度;f為采樣頻率;N為轉速.
將一維信號堆疊為二維信號,以滿足在減少對原始信號改動的同時,在兩支路分別輸入二維信號和一維信號.該方法可逆,將堆疊后的信號重新展開為一維信號即可還原信號.在卷積支路中使用堆疊后的二維信號,在LSTM支路中使用一維信號.堆疊方法如圖8所示.其中,一維信號長度為mna;二維信號長度為m,寬度為na.
圖8 信號堆疊法Fig.8 Signal stacking method
2.3.2網絡訓練 構建如圖9所示的網絡結構并初始化網絡參數.各支路的具體參數包括:卷積核的寬度Wk、高度Hk、數量Kk和步長Sk;LSTM隱藏層數、LSTM細胞隱藏向量維度Dl和循環(huán)次數Kl;池化層窗口寬度Wp、高度Hp和步長Sp;全連接層隱藏層細胞數量以及分類器分類數量.為保證語義信息尺寸一致性,令Wk=Wp、Hk=Hp、Sk=Sp;為保證LSTM中間支路隱藏狀態(tài)作為特征輸出,設
圖9 基于特征金字塔CRNN的故障診斷流程Fig.9 Fault diagnosis flow based on feature pyramid CRNN
定Dl等于輸入信號單元素的維度; 為保證兩支路輸出特征數量相等,令Kk=Kl.學習率采用指數衰減法,初始設為0.02,衰減系數設為0.90.共進行80次訓練,每次輸入10個從數據集中隨機抽取的樣本.編譯語言為Python,模型運行框架為Keras+Sklearn,硬件環(huán)境為Intel Core i5 2.5 GHz+Inter Iris Plus Graphics 655.對網絡輸入訓練集樣本進行訓練.
2.3.3網絡測試 網絡經多次反向傳播更新后,得到最優(yōu)參數,并輸出故障類型和診斷準確率.使用t-分布隨機近鄰嵌入(t-SNE)可視化網絡內部對特征的學習效果.具體流程如圖9所示.
行星齒輪箱故障數據由試驗臺(見圖10)測得.電機、扭矩儀、行星齒輪箱和磁粉制動器通過聯(lián)軸器相互聯(lián)結實現傳動.行星齒輪箱兩側的扭矩儀對行星齒輪箱的輸入軸和輸出軸施加徑向載荷,磁粉制動器施加軸向載荷.行星齒輪箱參數如表1所示.
圖10 行星齒輪箱試驗臺Fig.10 Planetary gearbox test bed
表1 行星齒輪箱基本參數Tab.1 Parameters of planetary gearbox
在行星齒輪箱中放置三向加速度傳感器,用以收集縱向振動信號構建試驗數據集.利用替換故障件的方法模擬行星齒輪箱故障.采樣頻率設為 20.48 kHz,電機轉速為 1 980 r/min.每組采集到的振動信號點為 3 276 750 個,樣本分割窗尺寸設為 1 024 個點.采用順序重疊抽樣法,共生成 4 000 個樣本.其中,訓練集樣本 3 200 個,測試集樣本800個.數據集基本信息如表2所示.模型分類器的神經元個數與故障標簽數相同.圖11為采集信號時域圖示例.
表2 行星齒輪箱故障數據集信息Tab.2 Data information of planetary gearbox fault
圖11 采集時域信號示例Fig.11 Signal acquisition of time domain
從采集到的振動信號中抽取每種工況的樣本信號,約80%作為訓練集,約20%作為測試集.抽取信號的步長設為40.選取所抽取樣本信號的每個樣本堆疊為24×128 的二維樣本.使用該信號組進行診斷,網絡參數設定如表3所示.
表3 網絡參數設定Tab.3 Parameters of network
將預處理后的數據代入設定好的網絡中,每迭代200輪計算一次故障診斷準確率(ε),所得曲線如圖12所示.學習率設為0.001,經過約 6 000 輪迭代后,學習率設為 0.000 1,網絡的準確率得以收斂.
圖12 診斷準確率曲線Fig.12 Diagnostic accuracy
在此基礎上對網絡診斷結果進行K折交叉驗證.K折交叉驗證是評估模型性能的重要驗證方法:將數據集隨機劃分為K組,選擇其中一組作為輸入數據進行測試,其余組依次進行測試,并重復若干次劃分.為實現K折交叉驗證,試驗數據總量需要大于單次試驗所需最小數據量的K倍.設置K=5,通過調整步長獲得更多數據.驗證結果如表4所示.可知準確率的最大值為100%,平均值為99.20%,表明網絡訓練沒有過擬合或欠擬合.
表4 網絡5折交叉驗證準確率Tab.4 50% cross validation accuracy of network
基于特征金字塔的CRNN對試驗臺的故障診斷準確率較高,為驗證其對其他實驗數據的泛用性,利用凱斯西儲大學的滾動軸承數據集進行泛用性驗證,軸承試驗臺如圖13所示.其中,軸承轉速為 1 750 r/min,采樣頻率為12 kHz.軸承故障數據集基本信息如表5所示.對該數據集的診斷結果做5折交叉驗證,診斷準確率結果如圖14所示.
圖13 凱斯西儲大學軸承試驗臺Fig.13 Bearing test bed of Case Western Reserve University
圖14 凱斯西儲大學數據診斷準確率Fig.14 Data diagnosis accuracy rate of Case Western Reserve University
表5 軸承狀態(tài)數據信息Tab.5 Data information of bearing status
根據驗證結果可知,在該滾動軸承的數據集上,基于特征金字塔的CRNN能很好地實現故障診斷,準確率可達99.5%以上.
利用行星齒輪箱試驗臺數據對傳統(tǒng)模型進行故障診斷對比驗證,以驗證基于特征金字塔的CRNN在故障診斷方面的優(yōu)勢.分別對DNN、CNN和LSTM進行5折交叉驗證,重復3次,結果如表6所示.其中,DNN結構為1層輸入層、3層隱藏層和1層輸出層;CNN結構為3層卷積層、3層池化層和1層輸出層;LSTM包括 3 072 個細胞,重復訓練64輪.
表6 DNN、CNN和LSTM診斷準確率Tab.6 Diagnostic accuracy of DNN, CNN, and LSTM
計算得到DNN、CNN和LSTM故障診斷準確率的平均值分別為62.66%、86.50%和95.63%.可知,傳統(tǒng)DNN的診斷效果最差,LSTM因為針對時域信息更加有效,所以比CNN診斷準確率更高.基于特征金字塔的CRNN的診斷準確率平均值則比LSTM高3.62%,證明該方法具有優(yōu)越性.
t-SNE方法具有可視化效果好、低維數據的分布和原始數據特征空間分布重合度高等特點.對完成訓練的特征金字塔CRNN中卷積池化層和全連接層的輸出特征進行t-SNE降維可視化分析,如圖15所示.在圖15(a)中,由卷積池化層提取的特征,經過降維后具有良好的聚類效果.在圖15(b)中,經過特征金字塔和全連接層篩選后,不同故障類別的特征得到了較好的分類效果,驗證了該方法提取目標域故障特征的有效性.
圖15 行星齒輪箱試驗臺數據集t-SNE分析Fig.15 t-SNE analysis of data set of planetary gearbox test bench
(1) 利用CNN和LSTM,特征金字塔CRNN可以同時使用一維和二維信號并行提取信號特征,并使用特征金字塔進行特征構建,實現在較小網絡層級和較低系統(tǒng)內存占用前提下的訓練和故障診斷.
(2) 利用基于特征金字塔CRNN故障診斷方法對振動信號進行診斷,僅對振動峰值時域信號進行簡單歸一化和堆疊,簡化了人工信號優(yōu)化流程.該方法可以很好地實現對振動信號的識別和分類,經行星齒輪箱故障數據集測試,得到的診斷準確率平均值為99.20%.
(3) 使用凱斯西儲大學數據集驗證了基于特征金字塔CRNN對振動信號診斷的泛用性,利用t-SNE對所提方法的網絡中全連接層故障特征進行了降維和可視化,驗證了該方法提取目標域故障特征的有效性.