高美真,高燁童
(1.焦作師范高等??茖W(xué)校信息工程學(xué)院,河南焦作 454000;2.西安理工大學(xué)計(jì)算機(jī)與信息工程學(xué)院,陜西西安 710061)
隨著自動(dòng)控制技術(shù)的快速發(fā)展,工業(yè)物聯(lián)網(wǎng)也獲得了廣泛應(yīng)用,可以高效收集大量的設(shè)備運(yùn)行故障,通過傳統(tǒng)故障分析方法已無法實(shí)現(xiàn)及時(shí)處理這種大數(shù)據(jù)故障信息[1-4]。行星齒輪可以通過設(shè)計(jì)特定的結(jié)構(gòu)來適應(yīng)不同的工況條件,目前該齒輪已成為機(jī)械動(dòng)力系統(tǒng)的一個(gè)重要組成部件,對(duì)控制設(shè)備穩(wěn)定運(yùn)行發(fā)揮了關(guān)鍵作用。通過分析齒輪運(yùn)行期間的信號(hào)變化特征,可以發(fā)現(xiàn)存在多種不同形式的變化特性[5-7]。其中深度學(xué)習(xí)方法因具備數(shù)據(jù)自我迭代處理的效果,對(duì)多種復(fù)雜數(shù)據(jù)都能夠達(dá)到快速準(zhǔn)確提取的效果,成為大數(shù)據(jù)處理領(lǐng)域的一項(xiàng)重要應(yīng)用技術(shù),已被用于語音信號(hào)處理、圖像分析等領(lǐng)域[8-10]。
相關(guān)方面的研究吸引了很多學(xué)者。王惠中等[10]則根據(jù)長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(long short-time memory,Bi-LSTM)方法在時(shí)間序列提取的獨(dú)特優(yōu)勢(shì),綜合運(yùn)用LTSM與softmax分類器方法對(duì)各類故障信號(hào)進(jìn)行診斷分析,同時(shí)設(shè)計(jì)了相應(yīng)的仿真實(shí)驗(yàn),對(duì)該方法的有效性進(jìn)行驗(yàn)證。國內(nèi)學(xué)者胡蔦慶等[11]開展了智能診斷方面的研究工作,利用經(jīng)驗(yàn)?zāi)B(tài)分解方法對(duì)度數(shù)據(jù)進(jìn)行處理,再通過深度卷積神經(jīng)網(wǎng)達(dá)到診斷的要求,測(cè)定行星齒輪泵齒的振動(dòng)信號(hào)并驗(yàn)證了該方法實(shí)際診斷效果。Hsueh等[12]綜合運(yùn)用經(jīng)驗(yàn)小波變換與卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)相結(jié)合的方式進(jìn)行故障診斷,同時(shí)利用該方法驗(yàn)證了感應(yīng)電動(dòng)機(jī)的運(yùn)行故障信號(hào)分析情況。Chen[13]通過改進(jìn)循環(huán)神經(jīng)網(wǎng)絡(luò)的方式,建立了長短時(shí)記憶神經(jīng)網(wǎng)絡(luò),以循環(huán)神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)并對(duì)前期信號(hào)實(shí)施過濾,由此克服了采用循環(huán)神經(jīng)網(wǎng)絡(luò)方法面臨的無法大范圍依賴學(xué)習(xí)的問題,從而實(shí)現(xiàn)對(duì)時(shí)序數(shù)據(jù)的高效分析。經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)則根據(jù)CEEMD的運(yùn)行特性與排列熵的隨機(jī)檢測(cè)方式,使模態(tài)混疊受到顯著抑制,確保獲得準(zhǔn)確的IMF分量[14]。
本次測(cè)試在行星齒輪泵故障診斷前進(jìn),采用EEMD 和雙向記憶網(wǎng)絡(luò)相結(jié)合的模式,對(duì)4 種不同的行星輪進(jìn)行了故障測(cè)試。采用EEMD 方法實(shí)施信號(hào)分解,生成相應(yīng)的IMF 分量,將上述參數(shù)輸入模型內(nèi)進(jìn)行訓(xùn)練得到準(zhǔn)確分類結(jié)果,再對(duì)其他網(wǎng)絡(luò)參數(shù)進(jìn)行測(cè)試分析。
由于EEMD 同時(shí)具備CEEMD 和排列熵在信號(hào)處理方面的優(yōu)勢(shì),非常適合信號(hào)中隨機(jī)參數(shù)的精確測(cè)試[12]。非平穩(wěn)信號(hào)s(t)的分解步驟如下:
步驟1依次將均值為零的白噪聲信號(hào)ni(t)與-ni(t)加入原始信號(hào)s(t),得到
式中:ni(t)為加入的白噪聲信號(hào);ai為加入的噪聲信號(hào)幅值;i取值為1,2,…,N,N為白噪聲對(duì)數(shù)。
通過EMD分解獲得IMF分量序列集成分量為
再對(duì)得到的排列熵根據(jù)各自熵值大判斷I1(t)是否存在異常。進(jìn)行計(jì)算時(shí)設(shè)定排列熵2 個(gè)參數(shù),控制嵌入維數(shù)m為6,時(shí)間延遲λ為1。
步驟2當(dāng)I1(t)屬于異常信號(hào)時(shí),則重新回到步驟1,直到IMF分量Ip(t)屬于非異常信號(hào)為止。
步驟3從原始信號(hào)內(nèi)分解得到前p-1個(gè)分量:
步驟4以EMD 方法分解剩余信號(hào)r(t),以頻率高低順序作為依據(jù)對(duì)IMF分量實(shí)施排列。
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)屬于遞歸神經(jīng)網(wǎng)絡(luò),時(shí)間序列輸出取決于前一時(shí)刻與當(dāng)前輸入的共同影響。
t時(shí)刻的RNN網(wǎng)絡(luò)輸出為
式中:t-1 為上個(gè)時(shí)刻;t為現(xiàn)有時(shí)刻;w為之前隱藏層相對(duì)目前隱藏層所占的權(quán)重;x為RNN 網(wǎng)絡(luò)輸入;u為輸入層至隱藏層權(quán)重;y為RNN 網(wǎng)絡(luò)預(yù)測(cè)結(jié)果;s為隱藏層狀態(tài)輸出。
網(wǎng)絡(luò)在t時(shí)的總損失E為
對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),通過參數(shù)優(yōu)化算法來完成u、w、v參數(shù)的更新。參數(shù)w在t時(shí)梯度誤差計(jì)算式為
在處理深層次網(wǎng)絡(luò)的時(shí)候,當(dāng)選擇參數(shù)優(yōu)化模式實(shí)施更新時(shí),將會(huì)出現(xiàn)局部梯度彌散的結(jié)果,嚴(yán)重時(shí)還會(huì)引起梯度爆炸,從而產(chǎn)生差異很大的網(wǎng)絡(luò)權(quán)重,表現(xiàn)為網(wǎng)絡(luò)狀態(tài)的大幅波動(dòng)。
長短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)存在以下3個(gè)內(nèi)部運(yùn)行階段。
(1)計(jì)算細(xì)胞狀態(tài)遺忘信息比例:
式中:ωf為遺忘門權(quán)重;按照[ht-1,xt]的形式把2個(gè)向量共同組成1個(gè)向量,σ為simoid激活函數(shù),取值在0~1范圍內(nèi)。
(2)按照細(xì)胞的不同時(shí)期狀態(tài)確定記憶過程并對(duì)數(shù)據(jù)進(jìn)行更新。通過輸入門it選擇性記憶當(dāng)前信息,更新后得到的細(xì)胞狀態(tài)Ct內(nèi)將舊信息去除后增加了2個(gè)新的細(xì)胞數(shù)據(jù):
式中:wi為輸入門權(quán)重;Ct為加入的信息;bi為輸入門偏置;bc為新增信息偏置;wc為新增信息權(quán)重;it·Ct為新增部分的細(xì)胞信息。
(3)輸出階段。輸出結(jié)果受到輸出門和細(xì)胞單元狀態(tài)的共同影響,通過輸出門作為依據(jù)得到輸出結(jié)果,進(jìn)行tanh 計(jì)算實(shí)現(xiàn)細(xì)胞單元的處理,對(duì)其相乘計(jì)算得到
式中:wo、bo分別為輸出門權(quán)重與偏置。
為得到更加準(zhǔn)確的信息,構(gòu)建得到雙向長短時(shí)記憶網(wǎng)絡(luò)(bi-directional long short-time memory,Bi-LTSM),Bi-LTSM 通過時(shí)間展開計(jì)算的結(jié)果如圖1所示。
圖1 Bi-LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Bi-LSTM network structure diagram
由圖1 可見,當(dāng)前輸出受到前向?qū)雍头聪驅(qū)虞敵鼍C合作用,以下給出了網(wǎng)絡(luò)在t時(shí)的輸出ot:
式中:w為權(quán)重;為正向隱藏層輸出;為反向隱藏層輸出。
分別對(duì)行星輪處于不同的運(yùn)行狀態(tài)下形成的信號(hào)數(shù)據(jù)進(jìn)行采集分析。將采樣頻率設(shè)定在10 kHz,電機(jī)轉(zhuǎn)速2 500 r/min,依次對(duì)各齒輪狀態(tài)進(jìn)行信號(hào)數(shù)據(jù)采集得到300組振動(dòng)加速度信號(hào),每組中存在900點(diǎn)數(shù)據(jù)。故障數(shù)據(jù)集描述結(jié)果見表1。
表1 故障數(shù)據(jù)集描述Tab.1 Description of the fault data set
對(duì)采集得到的初始數(shù)據(jù)進(jìn)行EEMD 分解獲得IMF 分量,以頻率由高往低的順序排序,再將高斯白噪聲加入,其標(biāo)準(zhǔn)偏差為0.2,迭代次數(shù)上限為25。本次共確定6 個(gè)IMF 分量,對(duì)齒輪不同運(yùn)行狀態(tài)下的信號(hào)實(shí)施分解。
利用Bi-LTSM 網(wǎng)絡(luò)對(duì)初始6 個(gè)模態(tài)分量識(shí)別,進(jìn)行模型訓(xùn)練時(shí),由于分量包含了太長的數(shù)據(jù),需要花費(fèi)更長時(shí)間才能完成訓(xùn)練。為提升訓(xùn)練效率并改善精度,選擇15 個(gè)時(shí)域和16 個(gè)頻域特征進(jìn)行分析,再將模型輸入維度由1 000降低至30,進(jìn)一步優(yōu)化了故障特征。
本研究構(gòu)建的雙向長短時(shí)記憶模型包含了1個(gè)softmax 層、1 個(gè)全連接層、1 個(gè)分類輸出層、1 個(gè)Bi-LTSM 層。為全連接層設(shè)置了dropout 隨機(jī)失活層,避免模型發(fā)生過擬合的問題,控制失活值恒定在0.65,并設(shè)置更多ReLU 激活層來達(dá)到加快網(wǎng)絡(luò)訓(xùn)練的效果。本次模型運(yùn)行環(huán)境為Matlab,Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置見表2。
表2 Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置Tab.2 Parameter settings of Bi-LSTM network model
測(cè)試時(shí)設(shè)定批量為100,學(xué)習(xí)率0.01,選擇Adam 算法完成尋優(yōu)計(jì)算。通過控制梯度閾值等于1,以防止梯度爆炸的情況;以輪數(shù)代表訓(xùn)練次數(shù),共訓(xùn)練50 次,每個(gè)周期結(jié)束后再對(duì)網(wǎng)絡(luò)開展一次迭代計(jì)算。本實(shí)驗(yàn)的網(wǎng)絡(luò)超參數(shù)見表3。
表3 Bi-LSTM網(wǎng)絡(luò)模型參數(shù)設(shè)置Tab.3 Parameter settings of Bi-LSTM network model
測(cè)試時(shí)將Bi-LTSM 層節(jié)點(diǎn)數(shù)設(shè)置在50~200范圍內(nèi),訓(xùn)練進(jìn)度與用時(shí)如圖2 所示。隨著節(jié)點(diǎn)數(shù)持續(xù)增加,形成了先增大再降低的驗(yàn)證精度變化規(guī)律,診斷用時(shí)快速延長。當(dāng)節(jié)點(diǎn)數(shù)等于200 時(shí),網(wǎng)絡(luò)達(dá)到了最高驗(yàn)證精度。
圖2 模型精度、耗時(shí)與Bi-LSTM節(jié)點(diǎn)數(shù)關(guān)系Fig.2 Relationship between model accuracy and time consumption and Bi-LSTM node number
本次測(cè)試的網(wǎng)絡(luò)Bi-LTSM 層數(shù)對(duì)模型精度和耗時(shí)的影響結(jié)果如圖3 所示。通過對(duì)比不同層數(shù)下的Bi-LTSM 模型結(jié)果可以發(fā)現(xiàn)精度幾乎相同,而診斷時(shí)間明顯增加,綜合判斷認(rèn)為4 層Bi-LTSM 具備最佳性能。
圖3 模型精度、耗時(shí)與Bi-LSTM層數(shù)關(guān)系Fig.3 Relationship between model accuracy and time consumption and Bi-LSTM layers
隨機(jī)選擇比例為70%的數(shù)據(jù)實(shí)施訓(xùn)練,再測(cè)試剩余30%的數(shù)據(jù),圖4 給出了模型訓(xùn)練與驗(yàn)證過程,可以看到在不同迭代次數(shù)下驗(yàn)證誤差變化情況。通過測(cè)試發(fā)現(xiàn)該模型精度達(dá)到95.3%,進(jìn)行迭代計(jì)算時(shí)形成了波動(dòng)變化的訓(xùn)練曲線,可以推斷該模型并沒有達(dá)到穩(wěn)定預(yù)測(cè)的效果。以圖5 的混淆矩陣模型準(zhǔn)確識(shí)別齒面形成的磨損缺陷和缺齒情況,斷齒識(shí)別率94.1%,最低的是齒根裂紋故障識(shí)別率,只達(dá)到86.5%,同時(shí)發(fā)現(xiàn)齒根裂紋只達(dá)到了一個(gè)較低的識(shí)別率,這是由于齒根裂紋會(huì)被誤判為斷齒而引起結(jié)果偏差。
圖4 模型訓(xùn)練損失率與隨迭代次數(shù)關(guān)系Fig.4 Relationship between model training loss rate and the number of iterations
圖5 模型混淆矩陣分布Fig.5 Distribution of model confusion matrix
4.3.1 必要性驗(yàn)證
圖6 為EEMD 處理前后模型對(duì)應(yīng)的迭代精度。圖中可見,未經(jīng)EEMD處理的模型表現(xiàn)出了不穩(wěn)定的測(cè)試結(jié)果,實(shí)際精度只有70%,EEMD 處理后模型精度與穩(wěn)定性都發(fā)生了大幅上升。因此,Bi-LTSM 模型在時(shí)序信號(hào)處理方面具有明顯優(yōu)勢(shì),本次測(cè)試的初始信號(hào)呈現(xiàn)相對(duì)紊亂的時(shí)序特性,不能達(dá)到準(zhǔn)確識(shí)別的效果,先對(duì)信號(hào)EEMD 分解后,可以促進(jìn)所有分量都獲得更優(yōu)的時(shí)序性,促使模型診斷精度得到顯著提升。
圖6 模型精度與隨迭代次數(shù)關(guān)系Fig.6 Relationship between model accuracy and number of iterations
4.3.2 優(yōu)越性驗(yàn)證
圖7為LTSM與Bi-LTSM網(wǎng)絡(luò)迭代處理得到的精度變化趨勢(shì)。
圖7 LTSM、Bi-LTSM網(wǎng)絡(luò)模型精度與隨迭代次數(shù)關(guān)系Fig.7 Relationship between LTSM and Bi-LTSM network model accuracy and iteration times
在迭代的初期階段時(shí),LTSM 模型呈現(xiàn)快速收斂的特點(diǎn),產(chǎn)生這一結(jié)果的原因?yàn)長TSM 模型屬于單向的往前訓(xùn)練形式,Bi-LTSM 模型中共由2 個(gè)LTSM 層組成,按照前、后方式訓(xùn)練,效率較低。Bi-LTSM 模型到達(dá)后期迭代過程時(shí),可以更快擬合,獲得高于LTSM的驗(yàn)證精度。
(1)通過模型精度和耗時(shí)的最優(yōu)參數(shù)范圍為節(jié)點(diǎn)數(shù)200和網(wǎng)絡(luò)層數(shù)4層。
(2)本網(wǎng)絡(luò)損失小于1%,滿足良好穩(wěn)定性的條件,可以實(shí)現(xiàn)精確識(shí)別齒面磨損和缺齒故障,斷齒、正常齒輪的識(shí)別率都達(dá)到了93%以上,齒根裂紋故障識(shí)別正確率達(dá)到了86.5%。
(3)對(duì)信號(hào)EEMD 分解后,可以促進(jìn)Bi-LTSM模型所有分量都獲得更優(yōu)的時(shí)序性,促使模型診斷精度得到顯著提升。Bi-LTSM 模型到達(dá)后期迭代過程時(shí),可以更快擬合,獲得高于LTSM 的驗(yàn)證精度。