高美真,高燁童
(1.焦作師范高等專科學(xué)校信息工程學(xué)院,河南焦作 454000;2.西安理工大學(xué)計算機與信息工程學(xué)院,陜西西安 710061)
隨著自動控制技術(shù)的快速發(fā)展,工業(yè)物聯(lián)網(wǎng)也獲得了廣泛應(yīng)用,可以高效收集大量的設(shè)備運行故障,通過傳統(tǒng)故障分析方法已無法實現(xiàn)及時處理這種大數(shù)據(jù)故障信息[1-4]。行星齒輪可以通過設(shè)計特定的結(jié)構(gòu)來適應(yīng)不同的工況條件,目前該齒輪已成為機械動力系統(tǒng)的一個重要組成部件,對控制設(shè)備穩(wěn)定運行發(fā)揮了關(guān)鍵作用。通過分析齒輪運行期間的信號變化特征,可以發(fā)現(xiàn)存在多種不同形式的變化特性[5-7]。其中深度學(xué)習(xí)方法因具備數(shù)據(jù)自我迭代處理的效果,對多種復(fù)雜數(shù)據(jù)都能夠達到快速準確提取的效果,成為大數(shù)據(jù)處理領(lǐng)域的一項重要應(yīng)用技術(shù),已被用于語音信號處理、圖像分析等領(lǐng)域[8-10]。
相關(guān)方面的研究吸引了很多學(xué)者。王惠中等[10]則根據(jù)長短時記憶神經(jīng)網(wǎng)絡(luò)(long short-time memory,Bi-LSTM)方法在時間序列提取的獨特優(yōu)勢,綜合運用LTSM與softmax分類器方法對各類故障信號進行診斷分析,同時設(shè)計了相應(yīng)的仿真實驗,對該方法的有效性進行驗證。國內(nèi)學(xué)者胡蔦慶等[11]開展了智能診斷方面的研究工作,利用經(jīng)驗?zāi)B(tài)分解方法對度數(shù)據(jù)進行處理,再通過深度卷積神經(jīng)網(wǎng)達到診斷的要求,測定行星齒輪泵齒的振動信號并驗證了該方法實際診斷效果。Hsueh等[12]綜合運用經(jīng)驗小波變換與卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)相結(jié)合的方式進行故障診斷,同時利用該方法驗證了感應(yīng)電動機的運行故障信號分析情況。Chen[13]通過改進循環(huán)神經(jīng)網(wǎng)絡(luò)的方式,建立了長短時記憶神經(jīng)網(wǎng)絡(luò),以循環(huán)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)并對前期信號實施過濾,由此克服了采用循環(huán)神經(jīng)網(wǎng)絡(luò)方法面臨的無法大范圍依賴學(xué)習(xí)的問題,從而實現(xiàn)對時序數(shù)據(jù)的高效分析。經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)則根據(jù)CEEMD的運行特性與排列熵的隨機檢測方式,使模態(tài)混疊受到顯著抑制,確保獲得準確的IMF分量[14]。
本次測試在行星齒輪泵故障診斷前進,采用EEMD 和雙向記憶網(wǎng)絡(luò)相結(jié)合的模式,對4 種不同的行星輪進行了故障測試。采用EEMD 方法實施信號分解,生成相應(yīng)的IMF 分量,將上述參數(shù)輸入模型內(nèi)進行訓(xùn)練得到準確分類結(jié)果,再對其他網(wǎng)絡(luò)參數(shù)進行測試分析。
由于EEMD 同時具備CEEMD 和排列熵在信號處理方面的優(yōu)勢,非常適合信號中隨機參數(shù)的精確測試[12]。非平穩(wěn)信號s(t)的分解步驟如下:
步驟1依次將均值為零的白噪聲信號ni(t)與-ni(t)加入原始信號s(t),得到
式中:ni(t)為加入的白噪聲信號;ai為加入的噪聲信號幅值;i取值為1,2,…,N,N為白噪聲對數(shù)。
通過EMD分解獲得IMF分量序列集成分量為
再對得到的排列熵根據(jù)各自熵值大判斷I1(t)是否存在異常。進行計算時設(shè)定排列熵2 個參數(shù),控制嵌入維數(shù)m為6,時間延遲λ為1。
步驟2當(dāng)I1(t)屬于異常信號時,則重新回到步驟1,直到IMF分量Ip(t)屬于非異常信號為止。
步驟3從原始信號內(nèi)分解得到前p-1個分量:
步驟4以EMD 方法分解剩余信號r(t),以頻率高低順序作為依據(jù)對IMF分量實施排列。
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)屬于遞歸神經(jīng)網(wǎng)絡(luò),時間序列輸出取決于前一時刻與當(dāng)前輸入的共同影響。
t時刻的RNN網(wǎng)絡(luò)輸出為
式中:t-1 為上個時刻;t為現(xiàn)有時刻;w為之前隱藏層相對目前隱藏層所占的權(quán)重;x為RNN 網(wǎng)絡(luò)輸入;u為輸入層至隱藏層權(quán)重;y為RNN 網(wǎng)絡(luò)預(yù)測結(jié)果;s為隱藏層狀態(tài)輸出。
網(wǎng)絡(luò)在t時的總損失E為
對網(wǎng)絡(luò)進行訓(xùn)練時,通過參數(shù)優(yōu)化算法來完成u、w、v參數(shù)的更新。參數(shù)w在t時梯度誤差計算式為
在處理深層次網(wǎng)絡(luò)的時候,當(dāng)選擇參數(shù)優(yōu)化模式實施更新時,將會出現(xiàn)局部梯度彌散的結(jié)果,嚴重時還會引起梯度爆炸,從而產(chǎn)生差異很大的網(wǎng)絡(luò)權(quán)重,表現(xiàn)為網(wǎng)絡(luò)狀態(tài)的大幅波動。
長短時記憶網(wǎng)絡(luò)結(jié)構(gòu)存在以下3個內(nèi)部運行階段。
(1)計算細胞狀態(tài)遺忘信息比例:
式中:ωf為遺忘門權(quán)重;按照[ht-1,xt]的形式把2個向量共同組成1個向量,σ為simoid激活函數(shù),取值在0~1范圍內(nèi)。
(2)按照細胞的不同時期狀態(tài)確定記憶過程并對數(shù)據(jù)進行更新。通過輸入門it選擇性記憶當(dāng)前信息,更新后得到的細胞狀態(tài)Ct內(nèi)將舊信息去除后增加了2個新的細胞數(shù)據(jù):
式中:wi為輸入門權(quán)重;Ct為加入的信息;bi為輸入門偏置;bc為新增信息偏置;wc為新增信息權(quán)重;it·Ct為新增部分的細胞信息。
(3)輸出階段。輸出結(jié)果受到輸出門和細胞單元狀態(tài)的共同影響,通過輸出門作為依據(jù)得到輸出結(jié)果,進行tanh 計算實現(xiàn)細胞單元的處理,對其相乘計算得到
式中:wo、bo分別為輸出門權(quán)重與偏置。
為得到更加準確的信息,構(gòu)建得到雙向長短時記憶網(wǎng)絡(luò)(bi-directional long short-time memory,Bi-LTSM),Bi-LTSM 通過時間展開計算的結(jié)果如圖1所示。
圖1 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Bi-LSTM network structure diagram
由圖1 可見,當(dāng)前輸出受到前向?qū)雍头聪驅(qū)虞敵鼍C合作用,以下給出了網(wǎng)絡(luò)在t時的輸出ot:
式中:w為權(quán)重;為正向隱藏層輸出;為反向隱藏層輸出。
分別對行星輪處于不同的運行狀態(tài)下形成的信號數(shù)據(jù)進行采集分析。將采樣頻率設(shè)定在10 kHz,電機轉(zhuǎn)速2 500 r/min,依次對各齒輪狀態(tài)進行信號數(shù)據(jù)采集得到300組振動加速度信號,每組中存在900點數(shù)據(jù)。故障數(shù)據(jù)集描述結(jié)果見表1。
表1 故障數(shù)據(jù)集描述Tab.1 Description of the fault data set
對采集得到的初始數(shù)據(jù)進行EEMD 分解獲得IMF 分量,以頻率由高往低的順序排序,再將高斯白噪聲加入,其標準偏差為0.2,迭代次數(shù)上限為25。本次共確定6 個IMF 分量,對齒輪不同運行狀態(tài)下的信號實施分解。
利用Bi-LTSM 網(wǎng)絡(luò)對初始6 個模態(tài)分量識別,進行模型訓(xùn)練時,由于分量包含了太長的數(shù)據(jù),需要花費更長時間才能完成訓(xùn)練。為提升訓(xùn)練效率并改善精度,選擇15 個時域和16 個頻域特征進行分析,再將模型輸入維度由1 000降低至30,進一步優(yōu)化了故障特征。
本研究構(gòu)建的雙向長短時記憶模型包含了1個softmax 層、1 個全連接層、1 個分類輸出層、1 個Bi-LTSM 層。為全連接層設(shè)置了dropout 隨機失活層,避免模型發(fā)生過擬合的問題,控制失活值恒定在0.65,并設(shè)置更多ReLU 激活層來達到加快網(wǎng)絡(luò)訓(xùn)練的效果。本次模型運行環(huán)境為Matlab,Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置見表2。
表2 Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置Tab.2 Parameter settings of Bi-LSTM network model
測試時設(shè)定批量為100,學(xué)習(xí)率0.01,選擇Adam 算法完成尋優(yōu)計算。通過控制梯度閾值等于1,以防止梯度爆炸的情況;以輪數(shù)代表訓(xùn)練次數(shù),共訓(xùn)練50 次,每個周期結(jié)束后再對網(wǎng)絡(luò)開展一次迭代計算。本實驗的網(wǎng)絡(luò)超參數(shù)見表3。
表3 Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置Tab.3 Parameter settings of Bi-LSTM network model
測試時將Bi-LTSM 層節(jié)點數(shù)設(shè)置在50~200范圍內(nèi),訓(xùn)練進度與用時如圖2 所示。隨著節(jié)點數(shù)持續(xù)增加,形成了先增大再降低的驗證精度變化規(guī)律,診斷用時快速延長。當(dāng)節(jié)點數(shù)等于200 時,網(wǎng)絡(luò)達到了最高驗證精度。
圖2 模型精度、耗時與Bi-LSTM節(jié)點數(shù)關(guān)系Fig.2 Relationship between model accuracy and time consumption and Bi-LSTM node number
本次測試的網(wǎng)絡(luò)Bi-LTSM 層數(shù)對模型精度和耗時的影響結(jié)果如圖3 所示。通過對比不同層數(shù)下的Bi-LTSM 模型結(jié)果可以發(fā)現(xiàn)精度幾乎相同,而診斷時間明顯增加,綜合判斷認為4 層Bi-LTSM 具備最佳性能。
圖3 模型精度、耗時與Bi-LSTM層數(shù)關(guān)系Fig.3 Relationship between model accuracy and time consumption and Bi-LSTM layers
隨機選擇比例為70%的數(shù)據(jù)實施訓(xùn)練,再測試剩余30%的數(shù)據(jù),圖4 給出了模型訓(xùn)練與驗證過程,可以看到在不同迭代次數(shù)下驗證誤差變化情況。通過測試發(fā)現(xiàn)該模型精度達到95.3%,進行迭代計算時形成了波動變化的訓(xùn)練曲線,可以推斷該模型并沒有達到穩(wěn)定預(yù)測的效果。以圖5 的混淆矩陣模型準確識別齒面形成的磨損缺陷和缺齒情況,斷齒識別率94.1%,最低的是齒根裂紋故障識別率,只達到86.5%,同時發(fā)現(xiàn)齒根裂紋只達到了一個較低的識別率,這是由于齒根裂紋會被誤判為斷齒而引起結(jié)果偏差。
圖4 模型訓(xùn)練損失率與隨迭代次數(shù)關(guān)系Fig.4 Relationship between model training loss rate and the number of iterations
圖5 模型混淆矩陣分布Fig.5 Distribution of model confusion matrix
4.3.1 必要性驗證
圖6 為EEMD 處理前后模型對應(yīng)的迭代精度。圖中可見,未經(jīng)EEMD處理的模型表現(xiàn)出了不穩(wěn)定的測試結(jié)果,實際精度只有70%,EEMD 處理后模型精度與穩(wěn)定性都發(fā)生了大幅上升。因此,Bi-LTSM 模型在時序信號處理方面具有明顯優(yōu)勢,本次測試的初始信號呈現(xiàn)相對紊亂的時序特性,不能達到準確識別的效果,先對信號EEMD 分解后,可以促進所有分量都獲得更優(yōu)的時序性,促使模型診斷精度得到顯著提升。
圖6 模型精度與隨迭代次數(shù)關(guān)系Fig.6 Relationship between model accuracy and number of iterations
4.3.2 優(yōu)越性驗證
圖7為LTSM與Bi-LTSM網(wǎng)絡(luò)迭代處理得到的精度變化趨勢。
圖7 LTSM、Bi-LTSM網(wǎng)絡(luò)模型精度與隨迭代次數(shù)關(guān)系Fig.7 Relationship between LTSM and Bi-LTSM network model accuracy and iteration times
在迭代的初期階段時,LTSM 模型呈現(xiàn)快速收斂的特點,產(chǎn)生這一結(jié)果的原因為LTSM 模型屬于單向的往前訓(xùn)練形式,Bi-LTSM 模型中共由2 個LTSM 層組成,按照前、后方式訓(xùn)練,效率較低。Bi-LTSM 模型到達后期迭代過程時,可以更快擬合,獲得高于LTSM的驗證精度。
(1)通過模型精度和耗時的最優(yōu)參數(shù)范圍為節(jié)點數(shù)200和網(wǎng)絡(luò)層數(shù)4層。
(2)本網(wǎng)絡(luò)損失小于1%,滿足良好穩(wěn)定性的條件,可以實現(xiàn)精確識別齒面磨損和缺齒故障,斷齒、正常齒輪的識別率都達到了93%以上,齒根裂紋故障識別正確率達到了86.5%。
(3)對信號EEMD 分解后,可以促進Bi-LTSM模型所有分量都獲得更優(yōu)的時序性,促使模型診斷精度得到顯著提升。Bi-LTSM 模型到達后期迭代過程時,可以更快擬合,獲得高于LTSM 的驗證精度。