馬 忠, 郭建勝, 顧濤勇, 毛 聲
(空軍工程大學(xué)裝備管理與無人機(jī)工程學(xué)院, 西安, 710051)
航空發(fā)動(dòng)機(jī)是航空器最重要的設(shè)備之一,為航空器提供動(dòng)力來源,也是日常航空維護(hù)作業(yè)中的主要關(guān)注對象。有研究表明,飛機(jī)機(jī)械故障導(dǎo)致的飛行事故數(shù)量僅低于飛行員操作失誤引起的飛行事故數(shù),而發(fā)動(dòng)機(jī)故障是機(jī)械故障里占比最高的一項(xiàng),這種現(xiàn)象在軍用飛行器里尤為明顯[1-2]。預(yù)測發(fā)動(dòng)機(jī)剩余壽命對于及時(shí)開展視情維修、避免飛行安全事故具有重要的意義。從大體上來分,目前常用的壽命預(yù)測方法主要為兩類[3]:即基于發(fā)動(dòng)機(jī)的運(yùn)行規(guī)律采用物理模型的方法進(jìn)行預(yù)測;從數(shù)據(jù)挖掘的角度出發(fā)采用數(shù)據(jù)驅(qū)動(dòng)的方法。由于航空發(fā)動(dòng)機(jī)包含許多部件,各部件功能差別較大,結(jié)構(gòu)組成復(fù)雜,并且發(fā)動(dòng)機(jī)失效故障種類繁多,常常是多種故障的復(fù)合出現(xiàn),且各個(gè)變量之間的耦合程度很深,從故障表征現(xiàn)象中難以直接和某個(gè)變量對應(yīng)起來,因此依靠原始數(shù)據(jù)確定特征指標(biāo)建立精確物理失效模型較為困難。傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)預(yù)測方法如依據(jù)統(tǒng)計(jì)性能退化監(jiān)測數(shù)據(jù)進(jìn)行壽命預(yù)測[4]、采用退化特征相似性的壽命預(yù)測[5]以及采用非線性維納過程進(jìn)行壽命預(yù)測的建模研究[6]等,是從統(tǒng)計(jì)的角度出發(fā),依據(jù)監(jiān)測數(shù)據(jù),根據(jù)統(tǒng)計(jì)性能指標(biāo),結(jié)合歷史數(shù)據(jù)得到預(yù)測結(jié)果。這些方法更多的是從整體上尋找規(guī)律,再從整體上進(jìn)行預(yù)測,而事實(shí)上,個(gè)體與個(gè)體之間的差別不可忽略,以整體規(guī)律衡量個(gè)體屬性的準(zhǔn)確度不高。
隨著深度學(xué)習(xí)的興起,數(shù)據(jù)驅(qū)動(dòng)的方法迎來了新的選擇,目前深度學(xué)習(xí)在圖像識別和文本分析等領(lǐng)域都顯現(xiàn)了較高的應(yīng)用價(jià)值。近年來,深度學(xué)習(xí)的方法在其他領(lǐng)域也得到了廣泛的應(yīng)用,長短記憶神經(jīng)網(wǎng)絡(luò)[7]、深度置信網(wǎng)絡(luò)[8]、卷積神經(jīng)網(wǎng)絡(luò)[9]等在故障診斷、壽命預(yù)測方面均有較好的應(yīng)用[10]。通過這種基于數(shù)據(jù)驅(qū)動(dòng)的方法通過挖掘數(shù)據(jù)和故障狀態(tài)之間的隱含關(guān)系進(jìn)行預(yù)測,對物理機(jī)理依賴程度低,可以直接將原始采樣數(shù)據(jù)作為輸入,通過提取出重要的特征用于預(yù)測,其通用性更強(qiáng)。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)最早應(yīng)用在圖像處理領(lǐng)域[11],目前已經(jīng)成功的應(yīng)用于計(jì)算機(jī)視覺等領(lǐng)域[12]。CNN獨(dú)特的特征提取能力,使其在處理圖像分類方面擁有較高的精度。近年來在故障診斷和故障預(yù)測領(lǐng)域,CNN也展現(xiàn)了良好的潛力,尤其是在機(jī)械設(shè)備的故障診斷和壽命預(yù)測方面有較多地應(yīng)用。Wang等通過波形變換將一維的齒輪時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為二維的時(shí)頻數(shù)據(jù)[13],輸入到CNN模型中進(jìn)行故障診斷;Ren等采用CNN平滑濾波使軸承預(yù)測結(jié)果連續(xù)化[14]。
采用一種方法解決一個(gè)問題需要立足于問題的具體情況進(jìn)行具體分析。CNN在圖像處理領(lǐng)域應(yīng)用較多,但是直接將其運(yùn)用到時(shí)間序列的預(yù)測中是不合適的。時(shí)間序列最大的特點(diǎn)在于序列前后采樣數(shù)據(jù)之間存在著很強(qiáng)的關(guān)聯(lián)性,時(shí)間維度上的數(shù)據(jù)包含著趨勢信息,但是同一次的采樣數(shù)據(jù)之間不一定存在很強(qiáng)的相關(guān)性,而圖像不論是在橫向還是縱向上,灰度都是漸變的,因此二維CNN在圖像處理中能得到很好的應(yīng)用,但是在時(shí)間序列數(shù)據(jù)的預(yù)測中卻要考慮數(shù)據(jù)特點(diǎn)。例如文獻(xiàn)[15]采用CNN-GRU的組合方法進(jìn)行航空發(fā)動(dòng)機(jī)剩余壽命預(yù)測,通過一維CNN對發(fā)動(dòng)機(jī)數(shù)據(jù)實(shí)現(xiàn)特征的提取,再經(jīng)過GRU得到預(yù)測值。但是作者沒有針對發(fā)動(dòng)機(jī)數(shù)據(jù)特點(diǎn)進(jìn)行分析,直接在同一次采樣數(shù)據(jù)進(jìn)行卷積,會因輸入?yún)?shù)順序的不同使結(jié)果不同,導(dǎo)致同樣的數(shù)據(jù)得到不同的結(jié)果,使得模型的可解釋性降低。
本文采用改進(jìn)的二維CNN進(jìn)行航空發(fā)動(dòng)機(jī)退化數(shù)據(jù)剩余壽命預(yù)測,針對時(shí)間序列數(shù)據(jù)的特性,在時(shí)間維度上進(jìn)行卷積運(yùn)算以挖掘出數(shù)據(jù)的趨勢和剩余壽命之間的關(guān)系,增強(qiáng)了模型的可解釋性,使模型通用性更強(qiáng),不僅適用于本文的發(fā)動(dòng)機(jī)數(shù)據(jù)集,也能運(yùn)用到其他的高維數(shù)據(jù)預(yù)測中。通過建立退化模型估計(jì)每個(gè)狀態(tài)時(shí)刻的剩余壽命,再對特征進(jìn)行提取,最后在NASA提供的仿真數(shù)據(jù)集上進(jìn)行測試,并和其它方法進(jìn)行了對比,預(yù)測結(jié)果表明CNN預(yù)測誤差更低,對航空發(fā)動(dòng)機(jī)剩余壽命的預(yù)測精度更高。
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)主要包括卷積層、池化層和全連接層,通過卷積和池化層進(jìn)行特征的提取,采用全連接層微調(diào)末端的輸出,提高模型精度。本文采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行時(shí)間序列預(yù)測,若每一次采樣的序列數(shù)據(jù)為:
(1)
式中:FN為傳感器的數(shù)目;i為序列標(biāo)號,則x=(x1,x2,xi,…,xN)T(N為采樣的次數(shù))構(gòu)成一個(gè)完整序列。
卷積運(yùn)算是卷積神經(jīng)網(wǎng)絡(luò)中的重要運(yùn)算,能夠有效的進(jìn)行特征提取,相比于全連接神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)采用權(quán)值共享降低了網(wǎng)絡(luò)復(fù)雜度,在減少訓(xùn)練參數(shù)的同時(shí)提升了訓(xùn)練速度。將輸入信號的局部區(qū)域與卷積核進(jìn)行卷積運(yùn)算,在激活函數(shù)的作用下產(chǎn)生非線性映射。卷積核的選取對卷積的運(yùn)算有較大影響,若卷積核的尺寸太小,則需要的卷積操作會增加。若卷積核的尺寸太大,則難以準(zhǔn)確的獲取輸入數(shù)據(jù)的特征。卷積核和感受野以元素的點(diǎn)積運(yùn)算進(jìn)行卷積,若其中卷積核u∈md,感受野的范圍為xi:i+T-1,則運(yùn)算后的卷積結(jié)果[16]為:
ci=φ(u·xi:i+T-1+b)
(2)
式中:φ為激活函數(shù),一般選用非線性函數(shù)使網(wǎng)絡(luò)具有更好的擬合能力;b為偏置量;xi:i+T-1為長度為T的感受區(qū)域矩陣,定義為:
xi:i+T-1=xi⊕xi+1⊕…⊕xi+T-1
(3)
式中:⊕為矩陣按照某一維度進(jìn)行的連接運(yùn)算,輸出為卷積核u作用在相應(yīng)區(qū)域產(chǎn)生的結(jié)果,通過不斷的卷積即可得到映射結(jié)果為:cj=[c1,c2,…,cl-T+1] ,j表示與第j個(gè)卷積核作用,其與{x1:T,x2:T+1,…,xl-T+1:l} 相對應(yīng)。
池化運(yùn)算能夠有效減少訓(xùn)練參數(shù),提取最有效的特征,增強(qiáng)網(wǎng)絡(luò)的魯棒性。通常采用的有最大池化運(yùn)算和平均池化運(yùn)算,池化層的超參數(shù)是池化長度,運(yùn)算得到的新的序列:
h=[h1,h2,…,h(l-T)/s+1]
(4)
剩余壽命的預(yù)測是一個(gè)復(fù)雜的問題,在實(shí)際中,如果沒有精確的失效機(jī)理數(shù)學(xué)模型,很難直接依據(jù)設(shè)備的當(dāng)前使用情況精確的確定剩余壽命,而基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測方法在訓(xùn)練模型時(shí)需要獲得每個(gè)狀態(tài)對應(yīng)的剩余壽命。
由于運(yùn)行時(shí)機(jī)械部件的磨損變形、疲勞退化、材料裂痕等原因,機(jī)械設(shè)備的剩余壽命隨使用時(shí)間的增多而減少。本文采用線性退化模型擬合使用時(shí)間與剩余壽命的關(guān)系,即按照線性函數(shù)以線性遞減到0的方式設(shè)置剩余壽命(如圖1所示),考慮到發(fā)動(dòng)機(jī)的使用小時(shí)數(shù)不能完全反應(yīng)發(fā)動(dòng)機(jī)壽命消耗的本質(zhì),因此本文將發(fā)動(dòng)機(jī)可繼續(xù)工作至發(fā)生故障,導(dǎo)致發(fā)動(dòng)機(jī)不能正常使用的循環(huán)次數(shù)作為剩余壽命[17]。文獻(xiàn)[18]在初始階段設(shè)置固定的剩余壽命Rearly,如將Rearly設(shè)置為125、135、145等,這種分段線性設(shè)置方法更多的適用某些特定數(shù)據(jù),即適用于那些整體壽命不高且使用時(shí)間不長的樣本。事實(shí)上,把所有樣本的初始階段壽命設(shè)置為一個(gè)定值,將導(dǎo)致預(yù)測結(jié)果和實(shí)際值之間存在較大的差異。由于所處環(huán)境和使用方式的差別,即使同一型號的設(shè)備也可能存在較大的不同,因此應(yīng)當(dāng)對每個(gè)樣本按照實(shí)際的使用時(shí)間情況進(jìn)行分析。故本文按照給定的每個(gè)壽命周期數(shù)據(jù)求取每個(gè)狀態(tài)的RUL以作為每個(gè)樣本擬合的目標(biāo)。
圖1 線性退化模型示意圖
目前CNN最成功的應(yīng)用是圖像處理領(lǐng)域,如常見的RGB三通道圖像是由像素點(diǎn)構(gòu)成的二維矩陣,因此本文將所涉及到的訓(xùn)練和測試樣本數(shù)據(jù)轉(zhuǎn)換為二維形式。本文引入時(shí)間窗(如圖2所示)來進(jìn)行數(shù)據(jù)樣本的重構(gòu)。
圖2 時(shí)間窗劃分
f:Xi→yi+T
(5)
在每臺發(fā)動(dòng)機(jī)的L個(gè)運(yùn)行周期內(nèi)采集的傳感器數(shù)據(jù),經(jīng)過時(shí)間窗口的劃分后,成為L-T+1個(gè)T×FN樣本,實(shí)現(xiàn)了將采集的一維序列數(shù)據(jù)轉(zhuǎn)化為二維數(shù)據(jù),得到的每個(gè)二維數(shù)據(jù)樣本類似于一個(gè)像素矩陣,更有助于利用CNN處理圖像的優(yōu)勢進(jìn)行模型的訓(xùn)練。
深度神經(jīng)網(wǎng)絡(luò)通過多層非線性變換,能夠擬合比較復(fù)雜的映射關(guān)系。本文采用的卷積神經(jīng)網(wǎng)絡(luò)包括兩個(gè)部分,多層卷積部分和全連接層部分,通過卷積層提取輸入數(shù)據(jù)特征,池化層降低模型復(fù)雜度,經(jīng)過扁平化層轉(zhuǎn)化數(shù)據(jù)形式,再使用全連接層微調(diào)模型,卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 CNN模型結(jié)構(gòu)示意圖
模型輸入數(shù)據(jù)為Xi,其2個(gè)維度分別為T和FN,網(wǎng)絡(luò)主要包括5層,其中第1、2、4、5層為卷積層,第3層為最大池化層。區(qū)別于一般的卷積神經(jīng)網(wǎng)絡(luò),在此處對二維數(shù)據(jù)進(jìn)行縱向時(shí)間維度上的一維卷積,更有助于模型學(xué)習(xí)到序列趨勢和目標(biāo)值之間的關(guān)系,使模型更具有通用性。前兩層卷積核大小為(5,1),設(shè)置較大的卷積核能降低噪聲的影響,后兩層卷積核大小為(3,1),用于提取更細(xì)微的特征,每層添加Dropout以防止過擬合,池化層采用最大池化運(yùn)算,采用Relu函數(shù)作為激活函數(shù)。
原始采樣數(shù)據(jù)預(yù)處理后,進(jìn)行時(shí)間窗的劃分,再輸入到CNN模型中得到預(yù)測結(jié)果,CNN預(yù)測模型整體流程如圖4所示。
圖4 預(yù)測模型流程圖
本文數(shù)據(jù)來源于NASA提供的C-MAPSS渦輪風(fēng)扇發(fā)動(dòng)機(jī)仿真數(shù)據(jù)集[19],文獻(xiàn)[20]對仿真數(shù)據(jù)的產(chǎn)生仿真環(huán)境的設(shè)置做了詳盡的描述。該數(shù)據(jù)集每次采樣記錄航空發(fā)動(dòng)機(jī)的24維數(shù)據(jù),其中包含21維傳感器數(shù)據(jù)(見表1)和由不同飛行高度、馬赫數(shù)以及油門桿解算角度組合的運(yùn)行環(huán)境狀態(tài)數(shù)據(jù)。數(shù)據(jù)集包含4個(gè)子數(shù)據(jù)集(FD001~FD004),每個(gè)子數(shù)據(jù)集均有一個(gè)測試集和訓(xùn)練集,訓(xùn)練集數(shù)據(jù)記錄了發(fā)動(dòng)機(jī)從正常運(yùn)行到失效的完整過程數(shù)據(jù),測試集數(shù)據(jù)為發(fā)動(dòng)機(jī)失效前的若干循環(huán)數(shù)據(jù)。
表1 傳感器數(shù)據(jù)描述
盡管每次能夠采樣測量21維傳感器的數(shù)據(jù),但并不是數(shù)據(jù)越多包含的有用信息量越大,有部分傳感器監(jiān)測數(shù)據(jù)在整個(gè)壽命周期中始終不變,不僅不能為剩余壽命的預(yù)測提供有效的信息,還會產(chǎn)生數(shù)據(jù)的冗余。因此先分析各個(gè)傳感器和剩余壽命之間的相關(guān)關(guān)系,確定出和剩余壽命相關(guān)關(guān)系強(qiáng)的傳感器。
最大信息系數(shù)(maximal information coefficient,MIC)[21]可以衡量2個(gè)變量之間的非線性關(guān)系,可以不限于特定的函數(shù)關(guān)系,且不受噪聲干擾,在此處將其用來衡量各傳感器與剩余壽命之間的相關(guān)關(guān)系。分別計(jì)算各個(gè)傳感器和剩余壽命之間的MIC值,將MIC值從高到低排序得到表2結(jié)果,從表2可以看出,前14個(gè)傳感器和剩余壽命之間的MIC值較大,因此選擇第2、3、4、7、8、9、11、12、13、14、17、20、21號傳感器數(shù)據(jù)作為模型的輸入?yún)?shù)。這些傳感器主要監(jiān)測壓氣機(jī)出口的溫度和壓強(qiáng)、核心機(jī)的轉(zhuǎn)速以及渦輪冷卻氣的流速,從發(fā)動(dòng)機(jī)的實(shí)際使用情況來看,壓氣機(jī)容易產(chǎn)生低周期疲勞,渦輪易發(fā)生疲勞損傷和蠕變[22],可以看出以上傳感器監(jiān)測的部位都是易發(fā)生故障的部位。
表2 各傳感器與剩余壽命之間的MIC值
從各傳感器的實(shí)際意義來看,當(dāng)有故障發(fā)生時(shí),這些傳感器監(jiān)測值會出現(xiàn)較大的變化,例如喘振是對航空發(fā)動(dòng)機(jī)危害比較大的非正常工作狀態(tài),極易造成部件的嚴(yán)重?fù)p壞。航空發(fā)動(dòng)機(jī)發(fā)生喘振時(shí),高壓壓氣機(jī)出口總壓大幅波動(dòng),轉(zhuǎn)速出現(xiàn)不穩(wěn)定的變化,同時(shí)有可能使燃燒室的高溫氣體倒流到壓氣機(jī),使得壓氣機(jī)出口溫度急劇上升[22],因此以上傳感器監(jiān)測參數(shù)與剩余壽命有著緊密聯(lián)系。
評價(jià)一個(gè)模型預(yù)測性能的優(yōu)劣,需要給定一個(gè)性能指標(biāo)來度量,本文采用均方誤差(RMSE)和評分函數(shù)(Score)2個(gè)指標(biāo)[20]。其中RMSE(簡記S)反映了預(yù)測值和真實(shí)值的平均偏離程度,得分函數(shù)則能在一定程度上反映模型超前或滯后預(yù)測的程度,滯后預(yù)測可能導(dǎo)致航空發(fā)動(dòng)機(jī)壽命未到即退役,而超前預(yù)測可能會使發(fā)動(dòng)機(jī)到壽后仍然在使用,從而存在極大的安全隱患。因此在具有相同的RMSE的條件下,Score(簡記SS)函數(shù)值越小,模型預(yù)測的精度越高,性能越好。
(6)
(7)
(8)
按照前面的模型結(jié)構(gòu)在Corei7,8-GB RAM,GERORCE 940MX GPU環(huán)境下搭建CNN網(wǎng)絡(luò)結(jié)構(gòu),在訓(xùn)練集上訓(xùn)練模型得到網(wǎng)絡(luò)超參數(shù),對測試集進(jìn)行預(yù)測得到結(jié)果如圖5所示。
圖5 FD001預(yù)測誤差分布直方圖
圖5為測試集FD001的預(yù)測結(jié)果,從誤差分布直方圖可以看出,預(yù)測誤差大部分在(-13,10]范圍內(nèi),只有少量樣本的預(yù)測誤差落在兩側(cè)區(qū)間中,即超前與滯后預(yù)測的樣本相對較少,整體的預(yù)測值和真實(shí)值更接近。
從測試集FD003中隨機(jī)選取30、64、75、82號測試樣本,得到的預(yù)測結(jié)果如圖6所示,預(yù)測結(jié)果表明,在一定的誤差允許范圍內(nèi),采用線性退化模型是合理的。
為減少隨機(jī)誤差的影響,在相同的條件下進(jìn)行10次實(shí)驗(yàn),取RMSE與Score平均值得到各個(gè)數(shù)據(jù)集的預(yù)測結(jié)果如表3所示。
從表3中可以看出,相比于其他方法,采用CNN進(jìn)行預(yù)測,RMSE更小,即平均預(yù)測誤差更小;Score值更小,極差更小,預(yù)測結(jié)果和真實(shí)剩余壽命整體偏離程度更小,預(yù)測更準(zhǔn)確。
圖6 從FD003中隨機(jī)選取4個(gè)測試樣本預(yù)測結(jié)果
表3 各數(shù)據(jù)集預(yù)測結(jié)果
從測試集整體的預(yù)測結(jié)果來看一、三數(shù)據(jù)集的精度高于二、四的精度,這是由于一、三數(shù)據(jù)集是在單一的運(yùn)行環(huán)境下的采集數(shù)據(jù),二、四數(shù)據(jù)集是在多種運(yùn)行環(huán)境下采集到的數(shù)據(jù),受工作環(huán)境的變化,提取到的特征會受到環(huán)境變化的干擾,影響預(yù)測精度。另外由于多種故障模式的耦合,較之單一故障模式下的一、二數(shù)據(jù)集的預(yù)測結(jié)果,三、四數(shù)據(jù)集的預(yù)測誤差相對較大。對于復(fù)雜的設(shè)備而言,變工況下的多種故障模式產(chǎn)生過程復(fù)雜,難以得到整個(gè)失效的規(guī)律;相對而言,固定運(yùn)行環(huán)境下的單一故障發(fā)生規(guī)律容易獲得,因此這種預(yù)測結(jié)果符合現(xiàn)實(shí)的情況。
本文基于多性能參數(shù)的航空發(fā)動(dòng)機(jī)退化數(shù)據(jù),通過建立改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在時(shí)間維度上對各維參數(shù)進(jìn)行卷積運(yùn)算,建立了一個(gè)符合時(shí)間序列數(shù)據(jù)特性的模型,實(shí)現(xiàn)了航空發(fā)動(dòng)機(jī)仿真數(shù)據(jù)集的剩余壽命預(yù)測,并對預(yù)測結(jié)果進(jìn)行了分析,驗(yàn)證了改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)在時(shí)間維度上進(jìn)行卷積的有效性。