石 慧,王婉娜,張 巖,劉佳媛
(太原科技大學(xué) 電子與信息工程學(xué)院,太原 030024)
齒輪作為機(jī)械設(shè)備的傳動(dòng)裝置,其健康狀況對設(shè)備的穩(wěn)定性和壽命有很大的影響?,F(xiàn)代機(jī)械設(shè)備隨著集成度的提高,齒輪的精度也越來越高,在長期運(yùn)行中很容易出現(xiàn)磨損,從而發(fā)生輪齒折斷。監(jiān)測齒輪的健康狀態(tài)是保障機(jī)械設(shè)備可靠運(yùn)行的重要手段。基于可靠性、經(jīng)濟(jì)性考慮,齒輪故障預(yù)測與健康管理(Prognostics And Health Management,PHM)[1]得到了越來越多的關(guān)注,其中,剩余壽命(Remaining Useful Life,RUL)預(yù)測是其核心研究內(nèi)容。隨著信息傳感技術(shù)的發(fā)展,設(shè)備可監(jiān)測點(diǎn)增多,信號采樣頻率增高,設(shè)備在運(yùn)行過程中可獲得海量的數(shù)據(jù),進(jìn)而推動(dòng)PHM進(jìn)入了大數(shù)據(jù)時(shí)代[2]。如何利用海量數(shù)據(jù)挖掘設(shè)備的狀態(tài)退化規(guī)律,從而預(yù)測設(shè)備的剩余壽命,已成為預(yù)測與健康管理的一大挑戰(zhàn)。
齒輪一般封裝在齒輪箱中,借助傳感器接收到的信息反映設(shè)備的退化狀態(tài)。數(shù)據(jù)驅(qū)動(dòng)的剩余壽命預(yù)測方法是基于統(tǒng)計(jì)學(xué)理論與人工智能理論,利用傳感器獲得表征設(shè)備狀態(tài)退化的數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)剩余壽命預(yù)測[3-4]。劉穎等[5]利用時(shí)間序列ARMA(Auto regressive moving average)預(yù)測模型,根據(jù)模擬信號對汽輪機(jī)故障進(jìn)行診斷,但ARMA預(yù)測模型適用于時(shí)間序列的短期預(yù)測和處理具有一定規(guī)律性的平穩(wěn)性數(shù)據(jù)。WANG X等[6]提出支持向量回歸(Support vector machines regression,SVR)和奇異譜分析(Singular spectrum analysis,SSA)相結(jié)合的方法對飛機(jī)齒輪箱的故障進(jìn)行預(yù)測,利用SSA提取原始數(shù)據(jù)的特征值,分別建模預(yù)測齒輪箱的故障,取得了比單一模型更好的結(jié)果。但模型結(jié)構(gòu)復(fù)雜,當(dāng)樣本數(shù)據(jù)量很大時(shí),預(yù)測結(jié)果耗時(shí)。DAVIES T M等[7]采用人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)對柴油機(jī)渦輪增壓器和汽車發(fā)動(dòng)機(jī)的故障進(jìn)行預(yù)測,利用遺傳算法對ANN的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)進(jìn)行優(yōu)化。ANN中網(wǎng)絡(luò)神經(jīng)元起著關(guān)鍵作用,計(jì)算的復(fù)雜性取決于神經(jīng)元的數(shù)目和隱藏層層數(shù),若樣本過多容易出現(xiàn)“維數(shù)災(zāi)難”,或出現(xiàn)“過學(xué)習(xí)問題”。
近年來,深度學(xué)習(xí)受到了廣泛關(guān)注。深度學(xué)習(xí)[8-9]通過海量的訓(xùn)練數(shù)據(jù)構(gòu)建具有很多隱層的神經(jīng)網(wǎng)絡(luò)模型,將樣本在原空間的特征表示變換到一個(gè)新特征空間,逐層提取輸入輸出樣本中潛在的映射關(guān)系。循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[10]可將前面的序列輸入進(jìn)行記憶并應(yīng)用于之后的計(jì)算中,但無法解決長時(shí)依賴問題[11]。長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)模型通過模型參數(shù)和控制信息流動(dòng)的門控單元系統(tǒng)可避免梯度消失等問題,使得時(shí)序信息預(yù)測更加準(zhǔn)確。Haitao Zhao[12]等將長短時(shí)期記憶網(wǎng)絡(luò)應(yīng)用在故障診斷方面,對故障進(jìn)行分類,但是需要對數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,如果監(jiān)測信號出現(xiàn)信號中斷,將引起模態(tài)混疊不利于故障診斷。趙建鵬[13]等將長短時(shí)期記憶網(wǎng)絡(luò)LSTM應(yīng)用在旋轉(zhuǎn)機(jī)械狀態(tài)單步預(yù)測,取得比支持向量回歸機(jī)更好的效果。王鑫[14]等將LSTM應(yīng)用在飛機(jī)故障時(shí)間序列的預(yù)測上,通過與多種時(shí)許序列預(yù)測模型對比,LSTM具有很強(qiáng)的適用性和更高的準(zhǔn)確性。
本文針對大數(shù)量級的序列預(yù)測,建立新的記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)剩余壽命預(yù)測模型,并從網(wǎng)絡(luò)結(jié)構(gòu)的搭建,學(xué)習(xí)率、窗口設(shè)置上改進(jìn)網(wǎng)絡(luò)模型預(yù)測的準(zhǔn)確性。參數(shù)修正時(shí)采用加入Nesterov動(dòng)量的隨機(jī)梯度下降算法,防止陷入局部最優(yōu);采用RMSProps算法修正模型自適應(yīng)率。最后,應(yīng)用齒輪彎曲疲勞試驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證,并與時(shí)間序列預(yù)測模型對比,試驗(yàn)結(jié)果表明本文建立的新的記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)剩余壽命預(yù)測模型在剩余壽命預(yù)測上具有良好的優(yōu)越性。
循環(huán)神經(jīng)網(wǎng)絡(luò)是將深度學(xué)習(xí)擴(kuò)展到序列數(shù)據(jù)預(yù)測的一類方法。如動(dòng)態(tài)系統(tǒng)的經(jīng)典形式:
s(t)=f(s(t-1),x(t);θ)
(1)
圖1 RNN展開結(jié)構(gòu)Fig.1 RNN expand structure
(2)
(3)
(4)
圖2 LSTM結(jié)構(gòu)圖Fig.2 LSTM structure diagram
遺忘門移除LSTM學(xué)習(xí)不重要的信息,這些信息將通過門控單元運(yùn)算移除。遺忘門采取兩個(gè)輸入ht-1和xt.相應(yīng)的前向傳播算法如下:
Input gates:
(5)
Forget gates:
(6)
Cells:
(7)
(8)
Output gates:
(9)
Cell outputs:
(10)
本文采用加入動(dòng)量考慮的隨機(jī)梯度下降算法優(yōu)化模型參數(shù),結(jié)合Nesterov動(dòng)量的RMSProp算法自適應(yīng)學(xué)習(xí)率,并利用隨機(jī)搜索選擇模型超參數(shù)。采用梯度下降法優(yōu)化求解損失函數(shù)J(θ)極小值。
梯度下降法要在全部訓(xùn)練數(shù)據(jù)上最小化損失,當(dāng)樣本量非常大或是迭代次數(shù)加大時(shí)會(huì)非常消耗計(jì)算資源。隨機(jī)梯度下降(Stochasitc Gradient Descent,SGD)優(yōu)化損失函數(shù)通過計(jì)算梯度均值,求其最小化損失。SGD算法中關(guān)鍵的參數(shù)是學(xué)習(xí)率,在LSTM應(yīng)用中會(huì)隨著時(shí)間的推移逐漸改變學(xué)習(xí)率。
隨機(jī)梯度下降是深度學(xué)習(xí)中常用的優(yōu)化算法,加入動(dòng)量優(yōu)化算法旨在加速學(xué)習(xí),特別是對加噪聲的梯度。動(dòng)量將梯度累加,即更新的時(shí)候在一定程度上增加穩(wěn)定性,從而加速學(xué)習(xí),抑制震蕩,具有跳出局部最優(yōu)的能力,表示為:
xt+1=αxt-ηg
(11)
超參數(shù)α∈[0,1]決定了之前梯度的貢獻(xiàn)衰減,通常設(shè)為0.5、0.9、0.99.本文使用Nesterov動(dòng)量的隨機(jī)梯度下降更新如表1所示:
表1 隨機(jī)梯度下降Tab.1 Random gradient drop
學(xué)習(xí)率對預(yù)測模型的性能有顯著影響,決定了參數(shù)收斂到最優(yōu)值的速度。學(xué)習(xí)率太小,收斂過程十分緩慢,容易引起運(yùn)算冗余;學(xué)習(xí)率太大,會(huì)導(dǎo)致參數(shù)可能越過最優(yōu)值,長時(shí)間運(yùn)算無法收斂。目前常用的算法有AdaGrad[18]算法、RMSProp[19]算法和Adam[20]算法等,RMSProp算法在非凸設(shè)定下效果更好。本文采用結(jié)合Nesterov動(dòng)量的RMSProp算法,引入新的超參數(shù)ρ,自適應(yīng)改變學(xué)習(xí)率,求得最優(yōu)值的同時(shí)提高收斂速度。
表2 RMSProp算法Tab.2 RMSProp algorithm
LSTM預(yù)測模型中包括了很多參數(shù),其中以學(xué)習(xí)率,分割窗口,狀態(tài)向量大小最為關(guān)鍵。最常見的參數(shù)優(yōu)化方法為網(wǎng)格搜索和隨機(jī)搜索。Bernoulli and Bengio[21]對比了網(wǎng)格搜索和隨機(jī)搜索,網(wǎng)格搜索計(jì)算代價(jià)會(huì)隨著超參數(shù)數(shù)量呈指數(shù)級增長,無法提供令人滿意的搜索規(guī)模;本文采用的隨機(jī)搜索可以替代網(wǎng)格搜索的方法,通過隨機(jī)搜索可以發(fā)現(xiàn)數(shù)據(jù)在某一維上的變化更加明顯,能更快的收斂到超參數(shù)的良好取值。
試驗(yàn)數(shù)據(jù)采用如圖3所示齒輪疲勞壽命試驗(yàn)臺的實(shí)時(shí)監(jiān)測數(shù)據(jù)集。試驗(yàn)過程對箱體振動(dòng)、油溫和噪音等進(jìn)行監(jiān)測。
圖3 齒輪試驗(yàn)臺架Fig.3 Gear test bench
疲勞試驗(yàn)臺主試箱傳感器位置如圖4所示。本試驗(yàn)共布置11個(gè)傳感器,當(dāng)試驗(yàn)齒輪發(fā)生斷齒時(shí)即判定該齒輪失效。試驗(yàn)中齒輪安裝采用正反面交錯(cuò)搭接嚙合方式,采樣頻率25.6 kHz,采樣時(shí)間60 s,采樣間隔9 min.所采集信號為齒輪箱體的振動(dòng)加速度信號。
圖4 主試箱傳感器位置圖Fig.4 Main test box sensor location map
選擇合適的特征指標(biāo)不但可以真實(shí)準(zhǔn)確的反應(yīng)齒輪在服役過程中的性能變化,而且易于計(jì)算。本文將均方幅值(Root Mean Square,RMS)作為特征值對齒輪磨損狀態(tài)變化進(jìn)行性能衰退評估。均方幅值作為有量綱的特征值[22],會(huì)隨疲勞狀態(tài)的累積呈現(xiàn)出遞增趨勢,能較好的反映采樣時(shí)刻振動(dòng)能量的變化情況。均方幅值可表示為:
(12)
式中,Δt為采樣時(shí)間,F(xiàn)s為采樣頻率,n為采樣點(diǎn)數(shù),n=Fs×Δt.在不同的退化狀態(tài),齒輪振動(dòng)能量會(huì)有明顯的變化。
數(shù)據(jù)的訓(xùn)練平臺主要配置為:處理器XeonE5-2620 v2系列六核心,內(nèi)存32 GB,顯卡NVIDIA Tesla K20c,在本試驗(yàn)中采用GPU進(jìn)行數(shù)據(jù)的訓(xùn)練和預(yù)測。
采用本文建立的改進(jìn)的基于記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM實(shí)時(shí)預(yù)測模型進(jìn)行預(yù)測,選取最靠近主試驗(yàn)箱的4#加速度傳感器接收到的振動(dòng)數(shù)據(jù)均方幅值作為模型輸入,結(jié)果如圖5所示。
圖5 (a)(b)(c)分別在70 h、73.3 h、75 h的預(yù)測效果Fig.5 Predictive effects in 70 h,73.3 h and 75 h respectively
橫坐標(biāo)表示采集的樣本數(shù),縱坐標(biāo)表示齒輪退化狀態(tài),在預(yù)測時(shí)間點(diǎn)之前實(shí)線表示實(shí)際的觀測值,在預(yù)測時(shí)間點(diǎn)之后的虛線表示預(yù)測結(jié)果。分別展現(xiàn)了模型在70 h、73.3 h、75 h的預(yù)測效果。
圖6橫坐標(biāo)為模型的訓(xùn)練次數(shù)step=200,縱坐標(biāo)表示訓(xùn)練誤差loss。隨著訓(xùn)練次數(shù)的增加,loss呈下降趨勢,表明模型正在學(xué)習(xí)該預(yù)測問題并且具備預(yù)測能力。試驗(yàn)表明,LSTM在迭代300次左右開始收斂,下降速度變慢,說明其誤差已經(jīng)非常小,具備良好的預(yù)測能力。
圖6 LSTM訓(xùn)練誤差下降曲線Fig.6 LSTM training error drop curve
為驗(yàn)證本文所提模型的準(zhǔn)確性,與自適應(yīng)回歸模型(Autoregressive model,AR)預(yù)測效果相比較。如圖7所示為AR模型預(yù)測效果,預(yù)測點(diǎn)之前實(shí)線表示實(shí)際的觀測值,預(yù)測點(diǎn)之后虛線表示預(yù)測結(jié)果。
圖7 AR模型預(yù)測效果Fig.7 AR model predictive effect
由試驗(yàn)可知,齒輪退化狀態(tài)的閾值為76.375 mm/s2,T*=77.2 h為齒輪的實(shí)際故障時(shí)間。
齒輪的實(shí)際剩余壽命Ta為:
Ta=T*-tp
(13)
式中,tp表示當(dāng)前時(shí)刻,T*為齒輪首次到達(dá)故障閾值的時(shí)間。
將采樣點(diǎn)數(shù)折算成時(shí)間,引用相對誤差百分比(Relative Percentage Error,RPE)
(14)
TRUL表示齒輪剩余壽命,模型的預(yù)測準(zhǔn)確度(Prediction Accuracy,PA)為:
PA=1-ERPE
(15)
由表3所示的實(shí)際值與預(yù)測值之間的差異,可看出本文所提模型預(yù)測誤差小,學(xué)習(xí)數(shù)據(jù)演變規(guī)律的能力較強(qiáng)。
表3 預(yù)測數(shù)據(jù)與真實(shí)數(shù)據(jù)對比Tab.3 Comparison of forecast data with real data
本文建立的改進(jìn)型記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)LSTM實(shí)時(shí)剩余壽命預(yù)測模型預(yù)測剩余壽命的準(zhǔn)確度如下表4所示。試驗(yàn)表明,訓(xùn)練樣本數(shù)據(jù)越多,預(yù)測準(zhǔn)確度就越高。針對疲勞累積型數(shù)據(jù)的長距離預(yù)測,本文所提實(shí)時(shí)剩余壽命預(yù)測模型與ANFIS模型相比表現(xiàn)出明顯優(yōu)勢。
表4 模型預(yù)測準(zhǔn)確度的比較Tab.4 Comparison of predictive accuracy of models
本文通過研究齒輪振動(dòng)數(shù)據(jù)特性,建立改進(jìn)的基于記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)時(shí)剩余壽命預(yù)測模型,并對預(yù)測模型參數(shù)進(jìn)行優(yōu)化,將預(yù)測模型應(yīng)用于齒輪的剩余壽命預(yù)測研究中。結(jié)果證明本文建立記憶機(jī)理循環(huán)神經(jīng)網(wǎng)絡(luò)模型預(yù)測實(shí)時(shí)剩余壽命具有更高的準(zhǔn)確度。下一步工作將多監(jiān)測點(diǎn)的數(shù)據(jù)進(jìn)行融合,研究其剩余壽命預(yù)測模型。