牟含笑,鄭建飛,*,胡昌華,趙瑞星,董青
1. 火箭軍工程大學(xué) 導(dǎo)彈工程學(xué)院,西安 710025 2. 火箭軍裝備部駐西安地區(qū)第三軍事代表室,西安 710100
預(yù)測(cè)與健康管理(Prognostics and Health Management, PHM)技術(shù)通過(guò)實(shí)時(shí)監(jiān)測(cè)的健康狀態(tài)信息評(píng)估設(shè)備的可靠性,預(yù)測(cè)設(shè)備的剩余壽命(Remaining Useful Life, RUL),并在此基礎(chǔ)上制定合理的維修策略,從而保證設(shè)備安全可靠運(yùn)行。對(duì)于工作在復(fù)雜環(huán)境下的多元退化設(shè)備,其退化過(guò)程往往可以由多個(gè)性能參量表征,因此需要根據(jù)多方面的狀態(tài)信息來(lái)評(píng)估其健康狀況,以免由于設(shè)備的潛在故障或安全隱患造成較大的生命財(cái)產(chǎn)損失。例如,發(fā)動(dòng)機(jī)大部分故障都是由氣路部件故障引起的,而這些故障變化通常都會(huì)反映在氣路參數(shù)中,包括發(fā)動(dòng)機(jī)在部分重要截面氣流的壓力、溫度、發(fā)動(dòng)機(jī)轉(zhuǎn)速以及耗油率等參數(shù)。因此,僅依靠單一傳感器的監(jiān)測(cè)數(shù)據(jù)并不能準(zhǔn)確反映多元退化設(shè)備的健康狀態(tài)和性能退化趨勢(shì),需要綜合考慮多個(gè)傳感器的性能監(jiān)測(cè)數(shù)據(jù),更全面地評(píng)估其健康狀態(tài),為設(shè)備后續(xù)的運(yùn)行規(guī)劃和維修決策提供支持。
為充分利用多元退化設(shè)備的監(jiān)測(cè)數(shù)據(jù),國(guó)內(nèi)外研究人員在多源傳感器融合以及RUL預(yù)測(cè)領(lǐng)域做了大量研究。任子強(qiáng)等將多傳感器數(shù)據(jù)進(jìn)行線性組合構(gòu)造出一個(gè)復(fù)合健康指標(biāo)(Health Index, HI),進(jìn)而采用線性維納過(guò)程對(duì)該HI進(jìn)行退化建模。García Nieto等采用混合粒子群算法優(yōu)化了支持向量機(jī)(Support Vector Machine, SVM)中的超參數(shù),該組合方法提高了航空發(fā)動(dòng)機(jī)RUL預(yù)測(cè)準(zhǔn)確度。彭鴻博和蔣雄偉采用核主元分析算法提取了發(fā)動(dòng)機(jī)的健康指數(shù),并結(jié)合相關(guān)向量機(jī)進(jìn)行預(yù)測(cè),有效利用了反映發(fā)動(dòng)機(jī)性能退化的低維信息。盡管統(tǒng)計(jì)數(shù)據(jù)驅(qū)動(dòng)方法和傳統(tǒng)的基于機(jī)器學(xué)習(xí)的方法在RUL預(yù)測(cè)方面取得了不少成果,但均面臨難以自動(dòng)處理大規(guī)模監(jiān)測(cè)數(shù)據(jù)的難題。
深度學(xué)習(xí)由于具有強(qiáng)大的數(shù)據(jù)分析和學(xué)習(xí)能力,能更好地對(duì)多元退化設(shè)備監(jiān)測(cè)獲得的大規(guī)模狀態(tài)信息進(jìn)行深度特征提取,因而在PHM領(lǐng)域得到了快速發(fā)展。Li等提出使用深度卷積神經(jīng)網(wǎng)絡(luò)提取退化特征,提高了航空發(fā)動(dòng)機(jī)RUL的預(yù)測(cè)準(zhǔn)確度。在鋰電池容量退化預(yù)測(cè)中,Zhang等在構(gòu)造長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)網(wǎng)絡(luò)時(shí)采用dropout方法防止訓(xùn)練過(guò)擬合,相較于SVM和循環(huán)神經(jīng)網(wǎng)絡(luò),LSTM網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確性明顯提高。基于深度學(xué)習(xí)的RUL預(yù)測(cè)方法無(wú)需任何設(shè)備退化的先驗(yàn)知識(shí)即可進(jìn)行預(yù)測(cè),但是,現(xiàn)有基于深度學(xué)習(xí)的RUL預(yù)測(cè)方法得到的結(jié)果通常僅為點(diǎn)估計(jì)而非區(qū)間估計(jì),預(yù)測(cè)結(jié)果的不確定性無(wú)法衡量,因此無(wú)法直接應(yīng)用于后續(xù)的維修決策。
鑒于此,融合深度學(xué)習(xí)和統(tǒng)計(jì)數(shù)據(jù)驅(qū)動(dòng)的RUL預(yù)測(cè)方法得到了廣泛關(guān)注。Hu等提出在使用深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)提取反映軸承退化的HI后,進(jìn)一步選用擴(kuò)散過(guò)程進(jìn)行分析,得到了軸承RUL的概率密度函數(shù)(Probability Density Function, PDF)。彭開(kāi)香等提出了一種融合DBN和隱馬爾可夫模型的混合模型來(lái)計(jì)算設(shè)備RUL,實(shí)現(xiàn)了設(shè)備健康狀態(tài)的自動(dòng)識(shí)別。上述方法通過(guò)深度學(xué)習(xí)提取高維非線性監(jiān)測(cè)數(shù)據(jù)隱含的退化特征作為HI,進(jìn)而利用傳統(tǒng)的退化建模方法來(lái)刻畫(huà)設(shè)備的退化趨勢(shì),但其得到的HI沒(méi)有實(shí)際物理意義,對(duì)應(yīng)的失效閾值難以確定,并且退化建模和參數(shù)估計(jì)的相關(guān)計(jì)算和推導(dǎo)也較為繁瑣。
在工程實(shí)際中,大型復(fù)雜多元退化設(shè)備的運(yùn)行狀態(tài)通常受多種操作條件和環(huán)境變化影響,其相關(guān)先驗(yàn)知識(shí)匱乏且獲取代價(jià)昂貴,退化建模和推導(dǎo)較為困難。融合無(wú)監(jiān)督和有監(jiān)督的深度學(xué)習(xí)模型能更好地挖掘多元退化設(shè)備性能監(jiān)測(cè)數(shù)據(jù)之間的時(shí)序關(guān)聯(lián)信息,從而提高RUL預(yù)測(cè)準(zhǔn)確度。
連續(xù)深度置信網(wǎng)絡(luò)(Continuous Deep Belief Network, CDBN)是一種典型的無(wú)監(jiān)督學(xué)習(xí)模型,其在DBN基礎(chǔ)上引入了獨(dú)立的高斯噪聲,可以更好地處理連續(xù)性輸入數(shù)據(jù),減小重構(gòu)誤差,并且能夠?qū)崿F(xiàn)數(shù)據(jù)降維,適用于時(shí)間序列的深度特征提取階段。Xu等使用CDBN預(yù)測(cè)城市用水需求,相較于SVM等方法預(yù)測(cè)準(zhǔn)確度明顯提高。喬俊飛等提出一種雙隱層CDBN,并應(yīng)用于大氣二氧化碳預(yù)測(cè)問(wèn)題,初步驗(yàn)證了該網(wǎng)絡(luò)在工業(yè)應(yīng)用中的可行性。盡管CDBN在連續(xù)性數(shù)據(jù)預(yù)測(cè)中展現(xiàn)了一定的優(yōu)勢(shì),但其長(zhǎng)期預(yù)測(cè)性能較差,因此常與其他模型混合使用。
設(shè)備退化過(guò)程是一個(gè)在時(shí)間上具有前后依賴關(guān)系的連續(xù)變化過(guò)程,處理當(dāng)前信息時(shí)也有必要整合未來(lái)的信息。雙向長(zhǎng)短期記憶(Bidirectional Long Short-Term Memory, BiLSTM)網(wǎng)絡(luò)能夠以前向和后向2種方式捕獲數(shù)據(jù)間的動(dòng)態(tài)依賴性,適用于時(shí)間序列的預(yù)測(cè)階段。Zhang等基于BiLSTM網(wǎng)絡(luò)處理由操作條件變化和環(huán)境干擾引起的不確定性,有效平滑了退化軌跡和預(yù)測(cè)結(jié)果??凳貜?qiáng)等提出一種基于改進(jìn)稀疏自編碼器和BiLSTM的滾動(dòng)軸承RUL預(yù)測(cè)方法,提高了模型的收斂速度,并且降低了預(yù)測(cè)誤差。雖然BiLSTM具有強(qiáng)大的時(shí)序信息處理能力,但對(duì)多維數(shù)據(jù)的非線性擬合能力不足。
針對(duì)上述不足,本文研究了一種融合無(wú)監(jiān)督和有監(jiān)督的深度學(xué)習(xí)框架,提出基于CDBN與BiLSTM的RUL預(yù)測(cè)方法。引入無(wú)監(jiān)督的CDBN能夠充分利用獲得的大規(guī)模、非線性、高維化連續(xù)性監(jiān)測(cè)數(shù)據(jù),對(duì)設(shè)備的多元退化狀態(tài)進(jìn)行自動(dòng)有效的深度特征提取,實(shí)現(xiàn)高維原始監(jiān)測(cè)數(shù)據(jù)到低維退化特征的抽象表示,避免了人工特征提取的低效率以及所帶來(lái)的預(yù)測(cè)不確定性。通過(guò)提取的退化特征構(gòu)造反映設(shè)備偏離初始健康程度的HI,進(jìn)而輸入到有監(jiān)督的BiLSTM網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),能夠充分利用退化設(shè)備過(guò)去和未來(lái)的信息,從前向和后向2個(gè)方向捕獲HI序列間的動(dòng)態(tài)依賴關(guān)系,從而提高RUL預(yù)測(cè)結(jié)果的準(zhǔn)確性。這種組合方法無(wú)需推導(dǎo)構(gòu)造的HI對(duì)應(yīng)的失效閾值,并且能夠大幅提升計(jì)算和預(yù)測(cè)效率。在此基礎(chǔ)上,通過(guò)蒙特卡洛(Monte Carlo, MC)仿真技術(shù)對(duì)預(yù)測(cè)的RUL分布進(jìn)行擬合,能有效解決常見(jiàn)深度學(xué)習(xí)模型中預(yù)測(cè)結(jié)果不確定性難以度量的問(wèn)題,為后續(xù)健康管理提供可靠依據(jù)。
CDBN是一個(gè)多隱藏層的混合概率圖模型,由多個(gè)CRBM(Continuous Restricted Boltzman Machine)堆疊而成。通過(guò)無(wú)監(jiān)督學(xué)習(xí),可以更好地提取連續(xù)性輸入數(shù)據(jù)的深層特征,同時(shí)降低輸入數(shù)據(jù)維度。
連續(xù)受限玻爾茲曼機(jī)通過(guò)在可視層添加一個(gè)均值為0的高斯噪聲從而引入一個(gè)連續(xù)隨機(jī)單元。CRBM主要包括可視層、隱藏層以及層間連接,其層內(nèi)無(wú)連接,具體結(jié)構(gòu)如圖1所示。
圖1 CRBM結(jié)構(gòu)示意圖Fig.1 Structure of CRBM
CRBM的可視層用于接收輸入數(shù)據(jù),隱藏層用于提取特征,通過(guò)最小化對(duì)比散度(Minimizing Contrastive Divergence, MCD)算法將隱藏層數(shù)據(jù)重構(gòu)回可視層,計(jì)算輸入數(shù)據(jù)與重構(gòu)數(shù)據(jù)之間的誤差,根據(jù)誤差值調(diào)整網(wǎng)絡(luò)參數(shù),通過(guò)逐層訓(xùn)練對(duì)原始數(shù)據(jù)特征進(jìn)行深度挖掘。以下用同一符號(hào)表示可視層和隱藏層神經(jīng)元的狀態(tài),令表示神經(jīng)元的輸出,為其他神經(jīng)元對(duì)神經(jīng)元的輸入,則可表示為
(1)
式中:函數(shù)的表達(dá)式為
(2)
該函數(shù)表示漸近線在和處的sigmoid函數(shù),參數(shù)決定sigmoid曲線的斜率,即噪聲控制項(xiàng),為神經(jīng)元的所有輸入,表達(dá)式為
(3)
其中:為CRBM的連接權(quán)重;為常數(shù)項(xiàng);(0,1)表示均值為0、方差為1的高斯噪聲,其概率分布為
(4)
CRBM采用MCD算法進(jìn)行連接權(quán)重和噪聲控制項(xiàng)參數(shù)的迭代更新:
(5)
(6)
本文以2個(gè)CRBM為例,相應(yīng)的CDBN結(jié)構(gòu)如圖2所示。CDBN訓(xùn)練過(guò)程中,從左至右每相鄰2層神經(jīng)元作為一個(gè)CRBM,上一層CRBM的輸出作為下一層CRBM的輸入。對(duì)于單個(gè)CRBM,當(dāng)隱藏層神經(jīng)元個(gè)數(shù)小于可視層神經(jīng)元個(gè)數(shù)時(shí),可實(shí)現(xiàn)數(shù)據(jù)降維。將多元退化設(shè)備的性能監(jiān)測(cè)數(shù)據(jù)經(jīng)預(yù)處理后輸入CDBN,通過(guò)MCD算法逐層確定每個(gè)CRBM的連接權(quán)重和噪聲控制參數(shù),進(jìn)而基于式(1)計(jì)算各層神經(jīng)元的狀態(tài),充分挖掘設(shè)備運(yùn)行期間的退化狀態(tài)信息。
本文將多元退化設(shè)備的監(jiān)測(cè)數(shù)據(jù)代入CDBN網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取設(shè)備初始健康特征和退化特征,構(gòu)造出衡量設(shè)備退化偏離初始健康狀態(tài)程度的HI如下:
(7)
式中:為實(shí)時(shí)退化特征;為初始健康特征;為HI序列長(zhǎng)度。
圖2 CDBN結(jié)構(gòu)示意圖Fig.2 Structure of CDBN
為了有效評(píng)價(jià)本文與其他方法構(gòu)造的HI,采用文獻(xiàn)[21]所提魯棒性和趨勢(shì)性指標(biāo)對(duì)HI進(jìn)行性能度量。
1) 魯棒性
由于測(cè)量不確定性、退化過(guò)程的隨機(jī)性以及設(shè)備運(yùn)行狀態(tài)受環(huán)境影響產(chǎn)生的變化,HI曲線通常包含隨機(jī)波動(dòng)。因此,性能較好的HI應(yīng)該對(duì)這些干擾具有較強(qiáng)的魯棒性,記為
(8)
2) 趨勢(shì)性
設(shè)備隨運(yùn)行時(shí)間累積而逐漸退化,因此,設(shè)備的退化特征與運(yùn)行時(shí)間相關(guān)。本文用HI和時(shí)間之間的相關(guān)系數(shù)衡量其趨勢(shì)性,記為
(9)
式中:為設(shè)備運(yùn)行時(shí)間;為當(dāng)前監(jiān)測(cè)時(shí)刻。
由式(8)和式(9)可以看出,衡量HI魯棒性和趨勢(shì)性的評(píng)價(jià)指標(biāo)取值范圍為[0,1],與所構(gòu)造HI的性能呈正相關(guān)。
BiLSTM由前向LSTM和后向LSTM共同構(gòu)成,前向LSTM獲取輸入序列的過(guò)去信息,后向LSTM獲取輸入序列的未來(lái)信息,因此能夠更加深入的挖掘設(shè)備監(jiān)測(cè)數(shù)據(jù)所包含的時(shí)序信息。
=(·[-1,]+)
(10)
=(·[-1,]+)
(11)
(12)
(13)
=(·[-1,]+)
(14)
=?()
(15)
式中:、、、分別表示遺忘門(mén)、輸入門(mén)、輸出門(mén)和單元狀態(tài)的權(quán)重矩陣;、、、分別表示遺忘門(mén)、輸入門(mén)、輸出門(mén)和單元狀態(tài)的偏置;和分別是sigmoid激活函數(shù)和tanh激活函數(shù)。
(16)
(17)
(18)
圖3 LSTM結(jié)構(gòu)示意圖[25]Fig.3 Structure of LSTM[25]
圖4 BiLSTM結(jié)構(gòu)示意圖Fig.4 Structure of BiLSTM
考慮到一類監(jiān)測(cè)數(shù)據(jù)呈現(xiàn)大規(guī)模、非線性、高維化等特點(diǎn)的多元退化設(shè)備,本文提出一種基于CDBN與BiLSTM網(wǎng)絡(luò)的剩余壽命預(yù)測(cè)方法,主要分為2部分,第1部分是利用CDBN對(duì)監(jiān)測(cè)到的退化數(shù)據(jù)進(jìn)行無(wú)監(jiān)督深層特征提取,構(gòu)造出反映設(shè)備退化的HI;第2部分是根據(jù)構(gòu)造的HI,利用BiLSTM網(wǎng)絡(luò)挖掘其時(shí)序信息和退化趨勢(shì),預(yù)測(cè)多元退化設(shè)備的RUL。多元退化設(shè)備的RUL預(yù)測(cè)流程如圖5所示。具體步驟為
1) 數(shù)據(jù)預(yù)處理
圖5 CDBN-BiLSTM預(yù)測(cè)模型Fig.5 CDBN-BiLSTM prediction model
在工程實(shí)際中,由于受到外部擾動(dòng),多元退化設(shè)備獲得的性能監(jiān)測(cè)數(shù)據(jù)往往包含大量隨機(jī)噪聲,而數(shù)據(jù)濾波是去除噪聲還原真實(shí)數(shù)據(jù)的一種數(shù)據(jù)處理技術(shù)。本文采用卡爾曼濾波對(duì)原始數(shù)據(jù)進(jìn)行降噪處理,以提高數(shù)據(jù)的平滑度。
多元退化設(shè)備基于多個(gè)傳感器進(jìn)行性能監(jiān)測(cè),獲得的監(jiān)測(cè)數(shù)據(jù)表示不同的物理特性。為得到更好的神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果,需要對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行歸一化處理。由于CDBN要求輸入數(shù)據(jù)的范圍為[0,1],本文采用min-max歸一化方法對(duì)降噪后的數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)縮放至0~1之間,保留數(shù)據(jù)間的時(shí)空關(guān)系,具體公式為
(19)
式中:,()為第個(gè)設(shè)備中第個(gè)傳感器在時(shí)刻的監(jiān)測(cè)數(shù)據(jù);min(:,)和max(:,)分別表示第個(gè)傳感器所有時(shí)刻數(shù)據(jù)的最小值和最大值;′,()為歸一化后的值。
2) 健康指標(biāo)構(gòu)建
將經(jīng)過(guò)預(yù)處理的數(shù)據(jù)集輸入CDBN網(wǎng)絡(luò)進(jìn)行無(wú)監(jiān)督特征提取,通過(guò)調(diào)整超參數(shù)使重構(gòu)誤差最小,得到初始健康特征和退化特征,利用式(7)構(gòu)造反映設(shè)備退化偏離初始健康狀態(tài)程度的HI。
3) 滑動(dòng)時(shí)間窗處理
滑動(dòng)時(shí)間窗處理技術(shù)不僅可以將原始時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為所需的序列數(shù)據(jù),而且能夠保留原始時(shí)間序列數(shù)據(jù)的局部依賴性。為滿足BiLSTM網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)的要求,利用滑動(dòng)時(shí)間窗處理HI,得到反映設(shè)備退化趨勢(shì)的時(shí)間序列訓(xùn)練集和測(cè)試集。
4) RUL預(yù)測(cè)
將訓(xùn)練集輸入BiLSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,其輸出與樣本標(biāo)簽進(jìn)行對(duì)比,將每次迭代得到的輸出誤差進(jìn)行反向傳播從而更新BiLSTM門(mén)控節(jié)點(diǎn)的權(quán)重矩陣,最后得到訓(xùn)練好的網(wǎng)絡(luò)模型。其中,訓(xùn)練標(biāo)簽為每組時(shí)間序列的下一個(gè)監(jiān)測(cè)點(diǎn)所對(duì)應(yīng)的RUL。將測(cè)試集代入訓(xùn)練好的BiLSTM網(wǎng)絡(luò),得到RUL的預(yù)測(cè)結(jié)果。
5) RUL區(qū)間估計(jì)
RUL的不確定性度量對(duì)于保障設(shè)備安全有效運(yùn)行至關(guān)重要,貝葉斯神經(jīng)網(wǎng)絡(luò)方法假設(shè)神經(jīng)網(wǎng)絡(luò)模型內(nèi)部連接權(quán)重為服從某一分布的隨機(jī)變量而非固定系數(shù),利用貝葉斯理論確定權(quán)重后驗(yàn)分布,通過(guò)權(quán)重的隨機(jī)性刻畫(huà)出預(yù)測(cè)結(jié)果的不確定性。文獻(xiàn)[29]已經(jīng)證明,使用dropout的傳統(tǒng)深度學(xué)習(xí)模型等價(jià)于對(duì)應(yīng)的基于變分推斷的貝葉斯深度學(xué)習(xí)模型,主要公式及說(shuō)明如下:
(20)
貝葉斯神經(jīng)網(wǎng)絡(luò)通過(guò)隨機(jī)化權(quán)重系數(shù)來(lái)刻畫(huà)預(yù)測(cè)結(jié)果的不確定性,然而在實(shí)際中,由于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)通常比較復(fù)雜,權(quán)重系數(shù)的后驗(yàn)分布(|,)難以直接求得,需要根據(jù)變分推斷思想構(gòu)造一個(gè)近似分布()來(lái)逼近該后驗(yàn)分布,并通過(guò)最小化KL散度來(lái)確定最優(yōu)的近似變分分布,基于此得到的目標(biāo)函數(shù)為
(21)
綜上,本文基于文獻(xiàn)[29]的結(jié)論,在所提網(wǎng)絡(luò)模型中引入dropout,等價(jià)實(shí)現(xiàn)模型隨機(jī)權(quán)重系數(shù)變分推理過(guò)程,并通過(guò)MC仿真技術(shù)得到由隨機(jī)權(quán)重系數(shù)引入的RUL預(yù)測(cè)結(jié)果不確定性。
6) 性能度量
為了衡量所提預(yù)測(cè)模型的優(yōu)劣,本文選取常用的2個(gè)性能度量指標(biāo):評(píng)分函數(shù)(Scoring function, Score)和均方根誤差(Root Mean Square Error, RMSE)對(duì)RUL預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。
Score的計(jì)算公式為
(22)
式中:=RUL′-RUL,RUL′為RUL預(yù)測(cè)值,RUL為RUL真實(shí)值。
RMSE可以衡量全測(cè)試循環(huán)數(shù)據(jù)序列的預(yù)測(cè)結(jié)果,其計(jì)算公式為
(23)
一般而言,Score和RMSE的數(shù)值越小意味著預(yù)測(cè)效果越好。
航空發(fā)動(dòng)機(jī)作為提供飛機(jī)動(dòng)力的關(guān)鍵設(shè)備,對(duì)于航空器的正常運(yùn)轉(zhuǎn)起著至關(guān)重要的作用。相關(guān)事故調(diào)查統(tǒng)計(jì)結(jié)果表明,發(fā)動(dòng)機(jī)故障是導(dǎo)致飛機(jī)飛行事故的主要原因之一。因此,對(duì)發(fā)動(dòng)機(jī)的健康狀態(tài)進(jìn)行監(jiān)測(cè)與評(píng)估,并對(duì)其進(jìn)行準(zhǔn)確地RUL預(yù)測(cè)是保障飛行安全的重要手段,也是飛機(jī)健康管理的關(guān)鍵環(huán)節(jié)。航空發(fā)動(dòng)機(jī)結(jié)構(gòu)復(fù)雜,狀態(tài)監(jiān)測(cè)變量類型多,獲得的監(jiān)測(cè)數(shù)據(jù)維度高、數(shù)量大,屬于一種典型的多元退化設(shè)備。因此,本文以航空發(fā)動(dòng)機(jī)數(shù)據(jù)集為例,對(duì)所提的基于CDBN與BiLSTM的多元退化設(shè)備剩余壽命預(yù)測(cè)方法進(jìn)行驗(yàn)證。
CMAPSS數(shù)據(jù)集是由NASA經(jīng)過(guò)仿真實(shí)驗(yàn)獲取的發(fā)動(dòng)機(jī)從正常運(yùn)行至失效的性能退化數(shù)據(jù)集,共有發(fā)動(dòng)機(jī)在不同工作狀態(tài)和故障模式下的4組監(jiān)測(cè)數(shù)據(jù),其中包含了21個(gè)能夠表征航空發(fā)動(dòng)機(jī)工作狀態(tài)的典型指標(biāo)。每組數(shù)據(jù)包括訓(xùn)練集、測(cè)試集以及RUL標(biāo)簽3部分,訓(xùn)練集為發(fā)動(dòng)機(jī)的失效數(shù)據(jù),測(cè)試集為測(cè)試發(fā)動(dòng)機(jī)的退化數(shù)據(jù),RUL標(biāo)簽與測(cè)試集相對(duì)應(yīng),為每個(gè)測(cè)試發(fā)動(dòng)機(jī)最后監(jiān)測(cè)時(shí)刻的RUL,具體信息如表1所示。
表1 CMAPSS數(shù)據(jù)集Table 1 CMAPSS dataset
本文選取FD001數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),訓(xùn)練集和測(cè)試集分別包含100臺(tái)發(fā)動(dòng)機(jī)的狀態(tài)監(jiān)測(cè)數(shù)據(jù),篩選出14個(gè)變化較明顯的變量數(shù)據(jù)作為輸入,進(jìn)行濾波及歸一化處理,代入CDBN網(wǎng)絡(luò)提取發(fā)動(dòng)機(jī)退化特征,并通過(guò)式(7)計(jì)算得到HI,進(jìn)而輸入BiLSTM網(wǎng)絡(luò)進(jìn)行RUL預(yù)測(cè)。通過(guò)設(shè)置dropout,得到由隨機(jī)權(quán)重系數(shù)引入的預(yù)測(cè)不確定性,最后通過(guò)MC仿真得到區(qū)間估計(jì)結(jié)果。CDBN與BiLSTM網(wǎng)絡(luò)的主要參數(shù)設(shè)置如表2所示。
表2 CDBN與BiLSTM網(wǎng)絡(luò)參數(shù)Table 2 Parameters of CDBN and BiLSTM network
4.2.1 CDBN提取健康指標(biāo)
本文采用CDBN來(lái)融合多傳感器的監(jiān)測(cè)數(shù)據(jù),實(shí)現(xiàn)設(shè)備的深層退化特征提取,具體過(guò)程如下:
假定航空發(fā)動(dòng)機(jī)的原始監(jiān)測(cè)數(shù)據(jù)經(jīng)濾波以及歸一化后可表示為=[,,…,],其中,(0≤≤)表示CDBN第輸入神經(jīng)元的特征序列,為輸入特征的總數(shù)。本文選擇有變化的14個(gè)變量,將這些特征當(dāng)作CDBN的輸入,采用MCD算法,即式(5)和式(6)逐層確定每個(gè)CRBM的模型參數(shù),然后基于式(1)可計(jì)算出CDBN各層神經(jīng)元的狀態(tài)。換句話說(shuō),可實(shí)現(xiàn)對(duì)輸入數(shù)據(jù)的完美抽象表示,即通過(guò)多重CRBM可自動(dòng)提取出反映設(shè)備健康狀態(tài)的深層次特征。因而,CDBN的輸出可視為輸入數(shù)據(jù)的深層次特征,可表示為=[,,…,],其中,(0≤≤)表示CDBN第輸出神經(jīng)元的特征序列,為CDBN輸出神經(jīng)元總數(shù)。本文設(shè)置的CDBN網(wǎng)絡(luò)結(jié)構(gòu)為14-7-1,通過(guò)堆疊2個(gè)CRBM進(jìn)行自動(dòng)特征提取,可以將輸入的14維數(shù)據(jù)映射到1維的深層退化特征,實(shí)現(xiàn)了對(duì)多傳感器數(shù)據(jù)的融合。
在構(gòu)造的CDBN中,具體參數(shù)設(shè)置如表2所示時(shí)重構(gòu)誤差最小。此時(shí)通過(guò)無(wú)監(jiān)督訓(xùn)練,將輸出的退化特征與初始健康特征按式(7)處理得到發(fā)動(dòng)機(jī)HI。圖6為100臺(tái)發(fā)動(dòng)機(jī)訓(xùn)練集和測(cè)試集數(shù)據(jù)構(gòu)建出的HI,刻畫(huà)發(fā)動(dòng)機(jī)隨著運(yùn)行周期的增加偏離初始健康狀態(tài)的程度。從圖中可以看出,在性能退化前期,HI變化較慢,而隨著運(yùn)行時(shí)間的累積,HI偏離初始健康狀態(tài)的速率逐漸加快,與實(shí)際設(shè)備的運(yùn)行退化趨勢(shì)相符。
本文選用魯棒性和趨勢(shì)性2種指標(biāo)來(lái)評(píng)價(jià)所構(gòu)造HI的優(yōu)劣,對(duì)比了主成分分析(Principal Component Analysis, PCA)、DBN和本文所提方法CDBN,測(cè)試集平均評(píng)價(jià)指標(biāo)結(jié)果對(duì)比如表3所示??梢钥闯?,通過(guò)CDBN提取的HI,魯棒性和趨勢(shì)性均優(yōu)于其他常用的降維方法,因此能更好地挖掘性能監(jiān)測(cè)數(shù)據(jù)中隱含的設(shè)備退化深層特征。
圖6 CDBN提取的健康指標(biāo)Fig.6 Health index extracted by CDBN
表3 HI評(píng)價(jià)指標(biāo)對(duì)比Table 3 Comparison of HI evaluation indexes
4.2.2 BiLSTM預(yù)測(cè)剩余壽命
發(fā)動(dòng)機(jī)各性能監(jiān)測(cè)變量在退化初期均變化較小,因此提取的HI在退化初期變化也比較緩慢。為了提高模型預(yù)測(cè)的準(zhǔn)確性,假定設(shè)備在運(yùn)行初期無(wú)退化,將設(shè)備RUL標(biāo)簽設(shè)為分段線性,最大值設(shè)為發(fā)動(dòng)機(jī)的平均壽命125。由于1號(hào)發(fā)動(dòng)機(jī)僅有31個(gè)測(cè)試循環(huán),將滑動(dòng)時(shí)間窗設(shè)置為30。為防止過(guò)擬合,同時(shí),得到由隨機(jī)權(quán)重系數(shù)引入的RUL預(yù)測(cè)不確定性,將dropout設(shè)置為0.2,MC仿真的采樣次數(shù)設(shè)置為1 000次。具體網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)設(shè)置如表2所示,此時(shí)得到的Score和RMSE最小,因此基于以上網(wǎng)絡(luò)參數(shù)得到測(cè)試集RUL預(yù)測(cè)結(jié)果。為便于觀察,根據(jù)測(cè)試數(shù)據(jù)集中各發(fā)動(dòng)機(jī)最后監(jiān)測(cè)點(diǎn)處RUL標(biāo)簽值,按照從大到小順序排列,可得如圖7中的預(yù)測(cè)結(jié)果。
圖7 100臺(tái)發(fā)動(dòng)機(jī)RUL預(yù)測(cè)結(jié)果Fig.7 RUL prediction results for 100 engines
圖7中,綠色線為100臺(tái)發(fā)動(dòng)機(jī)的真實(shí)RUL,粉色線為經(jīng)過(guò)分段線性處理后的RUL標(biāo)簽,通過(guò)MC仿真技術(shù)對(duì)預(yù)測(cè)結(jié)果進(jìn)行區(qū)間估計(jì),得到預(yù)測(cè)RUL的均值為圖中藍(lán)線所示,并給出了預(yù)測(cè)結(jié)果95%的置信區(qū)間。由圖7可以看出,本文所提方法的RUL預(yù)測(cè)均值與真實(shí)RUL基本吻合,預(yù)測(cè)結(jié)果的95%置信區(qū)間基本能覆蓋真實(shí)RUL,并且置信區(qū)間的寬度隨著發(fā)動(dòng)機(jī)真實(shí)RUL變小而有逐漸變窄的趨勢(shì)。這是因?yàn)榘l(fā)動(dòng)機(jī)隨著運(yùn)行時(shí)間的累積,故障特征逐漸增強(qiáng),其退化特征和趨勢(shì)能更好地被所提網(wǎng)絡(luò)捕獲,因此預(yù)測(cè)結(jié)果更好。
在設(shè)備退化初期,由于性能監(jiān)測(cè)數(shù)據(jù)較少,預(yù)測(cè)的RUL均值與真實(shí)RUL之間存在一定偏差。表4給出了測(cè)試集中不同監(jiān)測(cè)數(shù)據(jù)量下4臺(tái)發(fā)動(dòng)機(jī)的RUL預(yù)測(cè)結(jié)果,結(jié)果表明,獲得的監(jiān)測(cè)數(shù)據(jù)越充分,退化趨勢(shì)越明顯,本文所提方法的預(yù)測(cè)效果越好。此外,本文通過(guò)MC仿真技術(shù)給出預(yù)測(cè)RUL的95%置信區(qū)間,可以幫助運(yùn)維人員對(duì)預(yù)測(cè)結(jié)果的可信度進(jìn)行衡量。
本文對(duì)比了文獻(xiàn)[8,12,32-33]與所提方法的預(yù)測(cè)效果,結(jié)果如表5所示。相較于淺層機(jī)器學(xué)習(xí)方法SVR和單一有監(jiān)督的深度學(xué)習(xí)模型CNN、Deep LSTM以及DCNN,文獻(xiàn)[12]中提出的混合預(yù)測(cè)模型Semi-supervised setup效果更好。本文所提方法CDBN-BiLSTM考慮到融合無(wú)監(jiān)督與有監(jiān)督學(xué)習(xí)模型的優(yōu)越性,結(jié)合CDBN和BiLSTM網(wǎng)絡(luò)的優(yōu)勢(shì),預(yù)測(cè)結(jié)果得到進(jìn)一步改善。
表4 不同監(jiān)測(cè)數(shù)據(jù)量下RUL預(yù)測(cè)結(jié)果對(duì)比
表5 不同方法RUL預(yù)測(cè)結(jié)果對(duì)比
為進(jìn)一步觀察本文所提方法的預(yù)測(cè)結(jié)果,圖8 給出了部分測(cè)試發(fā)動(dòng)機(jī)的全測(cè)試循環(huán)RUL預(yù)測(cè)結(jié)果。由于發(fā)動(dòng)機(jī)的性能退化狀態(tài)與實(shí)時(shí)有效的監(jiān)測(cè)數(shù)據(jù)有關(guān),監(jiān)測(cè)數(shù)據(jù)越全,預(yù)測(cè)效果越好,因此這里選取測(cè)試循環(huán)比較多的4臺(tái)發(fā)動(dòng)機(jī)實(shí)例,分別為第24臺(tái)、34臺(tái)、76臺(tái)和第100臺(tái),給出其一次全測(cè)試循環(huán)的RUL預(yù)測(cè)結(jié)果。
圖8 單個(gè)發(fā)動(dòng)機(jī)RUL預(yù)測(cè)結(jié)果Fig.8 RUL prediction results for single engine
由圖8可以觀察到,盡管在測(cè)試循環(huán)前期預(yù)測(cè)值與實(shí)際RUL之間存在一定誤差,但隨著發(fā)動(dòng)機(jī)單元運(yùn)行時(shí)間的累積,本文所提方法的預(yù)測(cè)結(jié)果較準(zhǔn)確,具有一定的工業(yè)參考價(jià)值,因?yàn)閷?duì)發(fā)動(dòng)機(jī)的后期狀態(tài)進(jìn)行準(zhǔn)確評(píng)估,可以有效保障飛機(jī)的飛行安全,降低運(yùn)行維護(hù)成本。
圖9和圖10分別給出了第76臺(tái)發(fā)動(dòng)機(jī)和第100臺(tái)發(fā)動(dòng)機(jī)通過(guò)MC仿真技術(shù)得到的最后6個(gè)監(jiān)測(cè)點(diǎn)處RUL的PDF,以及RUL預(yù)測(cè)全測(cè)試循環(huán)95%置信區(qū)間。可以看出,隨著設(shè)備運(yùn)行周期的增加,故障特征不斷增強(qiáng),本文所提預(yù)測(cè)方法的預(yù)測(cè)效果較好,并且得到的區(qū)間估計(jì)結(jié)果能為后續(xù)的健康管理環(huán)節(jié)提供依據(jù)。
圖9 76號(hào)發(fā)動(dòng)機(jī)RUL區(qū)間估計(jì)Fig.9 RUL interval estimation for No.76 engine
圖10 100號(hào)發(fā)動(dòng)機(jī)RUL區(qū)間估計(jì)Fig.10 RUL interval estimation for No.100 engine
針對(duì)一類監(jiān)測(cè)數(shù)據(jù)呈現(xiàn)大規(guī)模、非線性、高維化等特點(diǎn)的多元退化設(shè)備,本文提出了一種基于CDBN與BiLSTM網(wǎng)絡(luò)的剩余壽命預(yù)測(cè)方法。該方法充分利用了監(jiān)測(cè)獲得的性能退化數(shù)據(jù),能更好地挖掘多元退化設(shè)備的退化趨勢(shì),提高RUL預(yù)測(cè)準(zhǔn)確度。通過(guò)在CMAPSS數(shù)據(jù)集進(jìn)行驗(yàn)證并與其他文獻(xiàn)所提方法對(duì)比,可以得到以下結(jié)論:
1) 本文基于CDBN對(duì)監(jiān)測(cè)到的性能退化數(shù)據(jù)進(jìn)行分析,提取反映多元退化設(shè)備隱含深層次特征的HI,實(shí)現(xiàn)了高維原始監(jiān)測(cè)數(shù)據(jù)到低維退化特征的抽象表示,與常用降維方法相比,通過(guò)本文方法提取的HI魯棒性和趨勢(shì)性更好。
2) 在RUL預(yù)測(cè)階段,本文利用BiLSTM網(wǎng)絡(luò)挖掘所構(gòu)造HI的時(shí)序信息,并通過(guò)MC仿真技術(shù)得到了RUL的區(qū)間估計(jì),可獲得更精確的RUL預(yù)測(cè)結(jié)果及分布形式,該結(jié)果可直接用于發(fā)動(dòng)機(jī)后續(xù)的運(yùn)行規(guī)劃、維修決策等健康管理活動(dòng)中。
本文通過(guò)CDBN實(shí)現(xiàn)對(duì)監(jiān)測(cè)數(shù)據(jù)的無(wú)監(jiān)督特征提取,在未來(lái)的研究中,將考慮構(gòu)建一種新的網(wǎng)絡(luò)模型,通過(guò)不同的無(wú)監(jiān)督學(xué)習(xí)模型提取多個(gè)健康指標(biāo)來(lái)反映設(shè)備的健康狀態(tài),并基于這些健康指標(biāo)開(kāi)展多個(gè)退化規(guī)律融合,以及多個(gè)判決準(zhǔn)則與所提模型融合的相關(guān)研究,以進(jìn)一步有效利用獲得的監(jiān)測(cè)數(shù)據(jù),提取多元退化設(shè)備的深層退化特征,從而提高剩余壽命預(yù)測(cè)結(jié)果的準(zhǔn)確性。