黃 林, 龔 立, 姜 偉, 王康勃
(海軍工程大學(xué)艦船綜合試驗訓(xùn)練基地, 湖北 武漢 430033)
在故障預(yù)測與健康監(jiān)測(prognostics and health management,PHM)領(lǐng)域中,對設(shè)備性能退化的實時預(yù)測非常重要,是基于狀態(tài)維修(condition-based maintenance,CBM)策略制定的重要依據(jù)。但是在大多數(shù)情況下,監(jiān)控系統(tǒng)測量的數(shù)據(jù)無法跟蹤系統(tǒng)每個組件的退化狀態(tài),因此CBM需要一個能夠基于監(jiān)測數(shù)據(jù)預(yù)測其系統(tǒng)性能退化狀態(tài)的模型或者是一個可以量化的指標(biāo),例如系統(tǒng)健康指數(shù)(health index, HI)、剩余使用壽命(remaining useful life, RUL)等。
RUL是指設(shè)備失效前能夠運(yùn)行的次數(shù)或者時間。準(zhǔn)確的RUL預(yù)測在實施CBM策略中起著關(guān)鍵作用,因為其可以為維修人員在系統(tǒng)故障之前提供足夠的時間,使用者能夠及時評估設(shè)備的健康狀況,并針對設(shè)備狀態(tài)規(guī)劃和制定未來的維護(hù)保養(yǎng)計劃。目前常采取的做法是,利用系統(tǒng)傳感器采集大量的實時數(shù)據(jù),將這些數(shù)據(jù)存儲在歷史數(shù)據(jù)集中,并通過建立基于數(shù)據(jù)驅(qū)動模型(data-driven model,DDM)來預(yù)測精確的組件衰減狀態(tài)和RUL。
在關(guān)于PHM和CBM的文獻(xiàn)中,基于物理模型、統(tǒng)計學(xué)理論和數(shù)據(jù)驅(qū)動等諸多方法被提出來解決RUL預(yù)測問題。近年來,由于機(jī)器學(xué)習(xí)方法能夠在不了解設(shè)備退化機(jī)制的情況下,僅依靠歷史數(shù)據(jù)對設(shè)備運(yùn)行狀態(tài)進(jìn)行學(xué)習(xí)和預(yù)測,不需要過多的領(lǐng)域知識,因此受到了越來越多的關(guān)注,其中常用的方法包括支持向量機(jī)(support vector machine,SVM)、隱馬爾可夫模型(hidden Markov model,HMM)、卡爾曼濾波、深度學(xué)習(xí)方法等。
HMM最早被應(yīng)用于語音識別,是一個雙重嵌入的隨機(jī)過程,其一般隨機(jī)過程是不可觀測的(設(shè)備的狀態(tài)是隱藏的),只能通過產(chǎn)生觀測序列(即傳感器信號)的另一組隨機(jī)過程來觀測,適用于動態(tài)過程時間序列信號分析和平穩(wěn)隨機(jī)信號的建模,在語音識別、手勢識別、目標(biāo)跟蹤等許多應(yīng)用領(lǐng)域都顯示出其優(yōu)越的性能。
HMM同樣也被廣泛應(yīng)用于故障診斷和故障預(yù)測領(lǐng)域,故障預(yù)測是PHM核心課題之一,HMM可根據(jù)測量信號檢測和識別系統(tǒng)健康狀態(tài),并對未來一段時間內(nèi)的健康狀態(tài)進(jìn)行估計,從而實現(xiàn)系統(tǒng)RUL預(yù)測。Zhu等針對動態(tài)工業(yè)過程中的故障分類問題,提出了一種HMM驅(qū)動的魯棒隱變量模型,將概率結(jié)構(gòu)發(fā)展為一種分類器形式,以便在模型獲取過程中融合各種類型的過程信息。Yiakopoulos等利用分段聚合近似和符號聚合近似時間序列數(shù)據(jù)挖掘表示方法,結(jié)合HMM應(yīng)用于過程變量監(jiān)控數(shù)據(jù),并與過程缺陷相關(guān)聯(lián),從而捕捉隱藏在觀測數(shù)據(jù)中的有意義的信息,識別特定異常情況。Galagedarage等采用HMM-貝葉斯網(wǎng)絡(luò)混合系統(tǒng),對田納西-伊斯曼過程中的10個已識別故障進(jìn)行預(yù)測和隔離,并成功地預(yù)測了所選的10個過程故障,并對其中的8個進(jìn)行了準(zhǔn)確隔離。Wang等提出了一種基于HMM的多模態(tài)過渡過程故障檢測方法,以一種隱狀態(tài)概率集成策略將局部監(jiān)測結(jié)果以概率方式組合成兩個全局指標(biāo),并采用貝葉斯信息準(zhǔn)則進(jìn)行模型評估,后采用負(fù)對數(shù)似然概率指標(biāo)進(jìn)行過渡過程故障檢測。Du等以HMM建立潤滑油降解的狀態(tài)演化過程,利用最大化期望(expectation maximization,EM)算法估計HMM的未知參數(shù),并以后驗概率的形式通過條件可靠度函數(shù)和平均剩余壽命函數(shù)來進(jìn)行預(yù)測。Soualhi等提出了兩種基于HMM故障預(yù)測的概率方法,將故障預(yù)測不僅限于對RUL的估計,而且還擴(kuò)展到對未來可能出現(xiàn)故障的風(fēng)險的估計。Le等針對系統(tǒng)可能存在多個性能退化機(jī)制的情況,提出了一個多分支建??蚣?通過CBM環(huán)境中的狀態(tài)監(jiān)測信息,證明了多分支HMM在RUL估計方面的性能。
上述文獻(xiàn)證明了HMM在RUL預(yù)測應(yīng)用中的有效性,并且與許多其他RUL預(yù)測方法相比,HMM的一個顯著優(yōu)點是具有比較強(qiáng)的可解釋性。但是,標(biāo)準(zhǔn)HMM的最基礎(chǔ)的假設(shè)是馬爾可夫鏈,即系統(tǒng)下一時刻的狀態(tài)僅由當(dāng)前狀態(tài)決定,不依賴于以往的任何狀態(tài),并以此計算所有變量的聯(lián)合概率分布。這樣將導(dǎo)致在利用建立好的HMM進(jìn)行預(yù)測時,因為沒有考慮預(yù)測對象的全壽命過程退化軌跡,HMM將產(chǎn)生較大的偏差,從而導(dǎo)致預(yù)測結(jié)果不夠理想。
針對上述問題,提出了一種基于多源信息融合的HMM建模方法,首先定義經(jīng)驗信噪比(empirical signal to noise ratio, eSNR)選取主要信號,隨后基于主成分分析(principal component analysis, PCA)方法將多維發(fā)動機(jī)監(jiān)控數(shù)據(jù)進(jìn)行信息融合,將監(jiān)控數(shù)據(jù)從多維降至一維,通過對降維后的數(shù)據(jù)進(jìn)行分析和比較,得到每臺發(fā)動機(jī)的HI,再將測試數(shù)據(jù)集中的發(fā)動機(jī)性能HI與訓(xùn)練數(shù)據(jù)集遍歷比較,通過相似性分析得到若干個與之最為接近的訓(xùn)練發(fā)動機(jī)HI,再將相應(yīng)的發(fā)動機(jī)數(shù)據(jù)進(jìn)行HMM建模,針對測試數(shù)據(jù)集中的每個發(fā)動機(jī)分別建立一個與之相對應(yīng)的高斯混合隱馬爾可夫模型(Gaussian mixture HMM, GM-HMM),再對其進(jìn)行隱狀態(tài)分析,通過EM算法,得到后驗概率最大的模型后,采用維特比算法估計當(dāng)前發(fā)動機(jī)的退化狀態(tài),再利用蒙特卡羅模擬,通過生成從當(dāng)前健康狀態(tài)到故障狀態(tài)的路徑,估計發(fā)動機(jī)的RUL。相比于直接利用所有的數(shù)據(jù)訓(xùn)練一個HMM,該方法在分析發(fā)動機(jī)退化軌跡的基礎(chǔ)上,針對每一個測試發(fā)動機(jī)分別得到一個HMM,充分考慮了發(fā)動機(jī)的歷史退化軌跡的影響,提高了模型的準(zhǔn)確度。同時,為了避免可能出現(xiàn)的過擬合風(fēng)險,相比于直接挑選一個最相似的退化軌跡,利用相似度原理分析選出了若干個最相似軌跡,再對其進(jìn)行HMM建模。最后通過對NASA公開的航空發(fā)動機(jī)的案例進(jìn)行研究,證明了所提預(yù)測方法的有效性。
特征提取是模式識別和機(jī)器學(xué)習(xí)的重要課題,數(shù)據(jù)中如果包含大量冗余變量或噪聲信號,會對模型性能產(chǎn)生非常大的影響,導(dǎo)致模型過擬合或精度差等問題。在RUL預(yù)測的應(yīng)用中,特征提取等價于選擇合適的傳感器信號,其目的是降低數(shù)據(jù)之間的冗余并盡量提高其相關(guān)性。常用的傳感器選擇方法包括觀察傳感器數(shù)據(jù)變化趨勢、基于信息熵理論的傳感器選擇,上述方法簡單直觀,操作性強(qiáng),但缺乏理論基礎(chǔ),基于主觀判斷的信號特征使預(yù)測結(jié)果不穩(wěn)定。
為提取有用的傳感器信號,并同時達(dá)到降噪的目的,本文提出了一種基于信噪比分析的傳感器特征提取方法。首先對信號進(jìn)行歸一化處理,在此基礎(chǔ)上分析各傳感器數(shù)據(jù)的信噪比,再采用sigmoid函數(shù)將信噪比轉(zhuǎn)化至0~1區(qū)間后,將歸一化的傳感器信號乘以對應(yīng)的信噪比函數(shù),對信號進(jìn)行加權(quán)后,同時考慮傳感器信號的變化趨勢和不同信號之間的相關(guān)性,采用核PCA方法對數(shù)據(jù)進(jìn)行降維,根據(jù)主成分方差占比提取信號作為最終的預(yù)測信號。
令{}為1維時間序列的原始傳感器信號,{_}為經(jīng)過PCA降維和數(shù)據(jù)平滑后的時間序列,定義eSNR為
eSNR ()=var{—})var{}
(1)
傳感器信號的權(quán)重將根據(jù)其對應(yīng)的eSNR而定,具體為
(2)
PCA是一種數(shù)據(jù)壓縮和特征提取的多變量統(tǒng)計分析技術(shù),能夠有效去除數(shù)據(jù)間的相關(guān)性,目的就是在保證數(shù)據(jù)損失盡可能小的前提下,經(jīng)過線性變換舍棄小部分信息,以少數(shù)新的綜合變量取代原始變量,因此要求主成分能夠充分反映原始變量的信息,同時又互不相關(guān),從而進(jìn)行樣本評價。
在許多情況下可以通過PCA來降低特征向量的維數(shù),將系統(tǒng)眾多的傳感器信號轉(zhuǎn)換為較少數(shù)量的主成分,同時PCA可以消除變量間的線性相關(guān)性,并通過融合多個變量來抑制噪聲。傳感器信號之間可能存在關(guān)聯(lián),且其相關(guān)性可能會破壞RUL預(yù)測模型,使預(yù)測結(jié)果產(chǎn)生偏差。PCA是一種將潛在相關(guān)變量轉(zhuǎn)換為少量不相關(guān)變量的常用技術(shù)。
數(shù)據(jù)集=(,,…,,…,)包含個樣本,每個樣本為維變量,則的經(jīng)驗均值為
=(,,…,)
(3)
(4)
樣本的協(xié)方差矩陣為
(5)
式中:為全為1的維向量。
對協(xié)方差矩陣進(jìn)行特征向量分解,并選取前個特征向量,特征向量數(shù)的選擇取決于希望保留的數(shù)據(jù)方差,例如80%,即有:
(6)
因此,可以對數(shù)據(jù)集進(jìn)行降維處理,并保留系統(tǒng)80%方差:
(7)
式中:=(,,…,)為由個特征向量組成的×矩陣,為×矩陣且每列為中對應(yīng)列向量的一個主分量向量。
本文對比了目前使用較為廣泛的用于數(shù)據(jù)平滑從而構(gòu)建系統(tǒng)HI的兩種算法,分別是核嶺回歸(kernel ridge regression,KRR)和支持向量回歸(support vector regre-ssion,SVR)模型。算法對經(jīng)過eSNR特征選擇和PCA降維后的多維系統(tǒng)監(jiān)測數(shù)據(jù)進(jìn)行擬合平滑處理,提取系統(tǒng)性能退化特征曲線,從而構(gòu)建系統(tǒng)HI。
1.3.1 KRR
KRR是嶺回歸(ridge regression,RR)的擴(kuò)展,而RR的本質(zhì)是在線性回歸的基礎(chǔ)上增加L2正則化,RR的最小化代價函數(shù)為
(8)
式中:為正則化參數(shù);‖·‖表示F范數(shù);∈×是變化矩陣;為第個樣本;為第個樣本的真實值。
即求解
arg min()=(+λ)
(9)
式中:∈×,∈×為訓(xùn)練數(shù)據(jù)特征向量矩陣和因變量矩陣;∈×為恒等矩陣。
通過核變換可以將此方法進(jìn)行擴(kuò)展,將數(shù)據(jù)映射到某一個核空間,使得數(shù)據(jù)在該核空間線性可分,從而能夠處理非線性數(shù)據(jù),則回歸函數(shù)結(jié)果可表示為
()=(+λ)()
(10)
式中:為Gram矩陣,=(,) (=1,2,…,),為訓(xùn)練樣本的數(shù)量。
本文使用高斯核函數(shù):
(11)
式中:為核函數(shù)寬度,通常采用交叉驗證的方式選取合適的寬度參數(shù)。
132 SVR
SVR是SVM在分類應(yīng)用方面的推廣,SVR假設(shè)模型輸出()與真實值之間最多有的誤差,即僅當(dāng)與之間的誤差絕對值小于就算預(yù)測正確。于是,SVR問題寫成:
(12)
式中:為樣本空間中超平面的法向量;為正則化常數(shù);為的不敏感損失函數(shù):
(13)
更多關(guān)于SVM的原理建議參看文獻(xiàn)[21]。
1.3.3 對比分析
圖1為兩種方法對論文擬采用的數(shù)據(jù)集中某一訓(xùn)練樣本進(jìn)行擬合的情況,直接采用經(jīng)過PCA降維后的散點作為系統(tǒng)HI不能很好地反應(yīng)系統(tǒng)性能隨使用時間增加而導(dǎo)致的性能退化情況,因此需要進(jìn)行曲線擬合,提取系統(tǒng)退化特征,作為系統(tǒng)HI。圖1分別為KRR和SVR對數(shù)據(jù)的平滑效果以及相應(yīng)的誤差變化趨勢??梢钥闯?采用KRR提取的性能退化軌跡更加平滑,更能反應(yīng)系統(tǒng)性能退化的真實狀態(tài),SVR曲線起伏波動較大,與實際情況有所差別,因此采用本文所提的KRR進(jìn)行系統(tǒng)性能退化軌跡提取。
圖1 KRR與SVR擬合效果對比Fig.1 Comparison of fitting effect between KRR and SVR
HMM是一種基于動態(tài)貝葉斯網(wǎng)(dynamic Bayesian network,DBN)的統(tǒng)計概率模型。HMM假定系統(tǒng)狀態(tài)不可觀測,并由有限個隱狀態(tài)和一組觀測變量構(gòu)成,每個隱狀態(tài)對應(yīng)兩種概率:狀態(tài)轉(zhuǎn)移概率和輸出觀測概率,且在任一時刻,觀測變量的取值僅依賴于隱狀態(tài)。在本文所關(guān)心的狀態(tài)監(jiān)測和故障診斷等領(lǐng)域的應(yīng)用中,系統(tǒng)的健康狀態(tài)(故障參數(shù)、RUL、HI等)即為HMM模型假定的隱狀態(tài)。
HMM變量分兩組:① 隱狀態(tài){,,…,},為模型在時刻的隱狀態(tài),假定馬爾可夫隱狀態(tài)空間={,,…,},其中為馬爾可夫鏈隱狀態(tài)數(shù)目,則顯然有∈; ② 觀測變量{,,…,},為時刻的觀測值。若觀測變量為離散值,并假定取值空間為={,,…,},則有∈。若HMM應(yīng)用于RUL預(yù)測中,觀測變量通常為系統(tǒng)一組可量化的監(jiān)測變量,通常為連續(xù)型,因此取值空間可為無限維。一個標(biāo)準(zhǔn)的HMM可由以下3組參數(shù)確定。
(1) 模型在各狀態(tài)之間的轉(zhuǎn)移概率=[]×,其中
(14)
(2) 初始狀態(tài)概率=[,,…,],其中
(15)
(3) 輸出觀測概率=[]×,其中
=(=|=), 1≤≤; 1≤≤
(16)
通過指定狀態(tài)空間、觀測空間和上述3組參數(shù)即可確定一個HMM,并可簡化表示為
=(,,)
在RUL預(yù)測中,系統(tǒng)性能逐漸退化直至失效(RUL為0)的過程通常是不可逆的,因此左右連續(xù)型HMM(left-right continuous HMM)是描述退化過程的合適選擇,其失效概率將隨著時間推移而增加,狀態(tài)轉(zhuǎn)移概率矩陣形式如下:
(17)
另外,在實際應(yīng)用中,由于觀測變量往往是連續(xù)變化的,因此采用混合高斯函數(shù)擬合各個隱狀態(tài)的對應(yīng)輸出分布,則式(16)可改寫為
(18)
式中:為觀測序列;為高斯元數(shù)目;為狀態(tài)對應(yīng)的權(quán)重;為第個高斯元函數(shù)。因此,GM-HMM可表示為
′=(,,,,)
(19)
并且有:
≥0, 1≤≤; 1≤≤
(20)
(21)
HMM主要用于解決3個基本問題,分別是: ① 評估模型與觀測序列之間的匹配程度; ② 根據(jù)觀測序列推斷出隱藏的模型狀態(tài); ③ 訓(xùn)練模型使其能更好地描述觀測數(shù)據(jù)。本文主要利用GM-HMM解決后面兩個問題。針對本文的實際需求,首先采用Baum-Welch算法,基于充足的訓(xùn)練樣本數(shù)據(jù),對GM-HMM模型參數(shù)進(jìn)行訓(xùn)練,通過極大似然估計可得到觀測序列下概率最大的模型,以該模型作為最終的模型,即上文中提到的問題③。得到HMM模型后,運(yùn)用維特比算法,對測試數(shù)據(jù)進(jìn)行分析處理,從而推斷系統(tǒng)當(dāng)前的健康狀態(tài),即HMM模型的隱狀態(tài),從而實現(xiàn)對設(shè)備當(dāng)前健康狀態(tài)的有效識別,對應(yīng)上文提到的問題②,具體流程如圖2所示。
圖2 HMM健康狀態(tài)預(yù)測流程Fig.2 Health status prediction based on HMM
通過訓(xùn)練數(shù)據(jù)對GM-HMM模型進(jìn)行訓(xùn)練后,即可得到系統(tǒng)的轉(zhuǎn)移矩陣,轉(zhuǎn)移矩陣以概率的形式,描述了系統(tǒng)健康狀態(tài)在每一個循環(huán)過程的演變信息,從而可以有效地對系統(tǒng)當(dāng)前的健康狀態(tài)進(jìn)行預(yù)測,系統(tǒng)RUL預(yù)測流程如圖3所示。
圖3 RUL預(yù)測流程Fig.3 RUL prediction process
本文采用蒙特卡羅模擬,基于GM-HMM轉(zhuǎn)移矩陣計算系統(tǒng)RUL,具體過程為: ① 基于訓(xùn)練后的GM-HMM模型,對當(dāng)前測試樣本進(jìn)行次模擬,在這次模擬中,設(shè)備將逐步從健康狀態(tài)演變至失效狀態(tài)。根據(jù)GM-HMM轉(zhuǎn)移概率生成0~1之間的均勻分布隨機(jī)數(shù),從而估計下一時刻系統(tǒng)健康狀態(tài); ② 將計算出的下一個狀態(tài)視為當(dāng)前狀態(tài),重復(fù)此過程直到達(dá)到系統(tǒng)失效狀態(tài); ③ 系統(tǒng)從健康狀態(tài)運(yùn)行至失效前的運(yùn)行次數(shù)可作為RUL預(yù)測值,通過次模擬,可以得到個RUL預(yù)測值,直至完成所有樣本模擬。根據(jù)蒙特卡羅模擬方法的思想,系統(tǒng)到達(dá)失效狀態(tài)的平均步數(shù)可作為RUL預(yù)測值:
(22)
為驗證本文方法的有效性,采用美國國家航空航天局(National Aeronautics and Space Administration, NASA)公布的基于C-MAPSS的航空發(fā)動機(jī)性能退化仿真數(shù)據(jù)集,對基于GM-HMM和蒙特卡羅方法的RUL預(yù)測算法進(jìn)行驗證。
圖4為基于C-MAPSS構(gòu)造的航空發(fā)動機(jī)結(jié)構(gòu)簡圖,包含風(fēng)扇、燃燒室、高低壓壓氣機(jī)、透平、噴嘴等部件。
圖4 C-MAPSS航空發(fā)動機(jī)簡圖Fig.4 C-MAPSS aeroengine diagram
NASA公布了5組數(shù)據(jù)集,每組數(shù)據(jù)集包含了上百臺發(fā)動機(jī)單元,每臺發(fā)動機(jī)初始為健康運(yùn)行狀態(tài)。在發(fā)動機(jī)運(yùn)行過程中,隨機(jī)注入不同的故障來模擬系統(tǒng)性能退化過程,每個發(fā)動機(jī)狀態(tài)記錄總共有24個變量,其中3個是操作設(shè)置,21個為監(jiān)測值,包括工作循環(huán)數(shù)、工作環(huán)境參數(shù)、每個工作循環(huán)的監(jiān)控數(shù)據(jù)等,如表1所示,監(jiān)測數(shù)據(jù)加入了高斯白噪聲干擾模擬實際傳感器噪聲影響,數(shù)據(jù)能夠逼真地模擬真實系統(tǒng),具有非常高的可信度。
表1 發(fā)動機(jī)傳感器數(shù)據(jù)描述
續(xù)表1
以NASA公布的5組數(shù)據(jù)集中的第一組為例進(jìn)行方法驗證。數(shù)據(jù)集FD001分為訓(xùn)練集和測試集,訓(xùn)練集即歷史數(shù)據(jù)庫樣本,包含100組從正常運(yùn)行狀態(tài)至系統(tǒng)失效的全壽命數(shù)據(jù),測試集即測試樣本,包含樣本發(fā)動機(jī)從完好狀態(tài)運(yùn)行至失效前一段時間的數(shù)據(jù)。
常用的RUL預(yù)測結(jié)果評價指標(biāo)有平均絕對誤差、均方根誤差、百分比誤差、平均絕對百分比誤差(mean absolute percentage error,MAPE)等,為方便比較和分析,本文采用MAPE作為評價指標(biāo)之一,其計算式為
(23)
另一方面,在實際應(yīng)用中,RUL預(yù)測值偏大比RUL預(yù)測值偏小造成的損害大,因此除了MAPE之外,還采用文獻(xiàn)[25]提出的分段懲罰系數(shù)的方法,其表達(dá)式如下:
(24)
(25)
除此之外,還采用假陽性率(false positive rate, FPR)、假陰性率(false negative rate, FNR)和準(zhǔn)確度來進(jìn)行評價,其中
(26)
(27)
(28)
式中:Num為error<-10的個數(shù);Num為error>13的個數(shù)。
首先對訓(xùn)練集中的發(fā)動機(jī)歷史數(shù)據(jù)進(jìn)行分析,通過觀察數(shù)據(jù)分布可以看出,部分傳感器信號為常值,不隨發(fā)動機(jī)運(yùn)行發(fā)生變化,例如、、、、、、,去除這些數(shù)據(jù)后,為降低數(shù)據(jù)之間的線性相關(guān)性,同時為達(dá)到降噪的目的,首先對傳感器信號的趨勢進(jìn)行觀察和分析,再基于eSNR和PCA進(jìn)行降維處理,作為后續(xù)系統(tǒng)HI提取的數(shù)據(jù)來源。
圖5為id為1的發(fā)動機(jī)的14個傳感器信號在生命周期的變化趨勢,需要注意的是,所有數(shù)據(jù)在分析之前已經(jīng)進(jìn)行了歸一化處理,因此變化范圍都在0~1之間。從圖5中可以看出,航空發(fā)動機(jī)的14個傳感器信號在生命周期內(nèi)都具有單調(diào)性,可以被用來提取系統(tǒng)性能退化軌跡。
圖5 樣本發(fā)動機(jī)監(jiān)控數(shù)據(jù)變化趨勢Fig.5 Trend of sample engine monitoring data
為了降低數(shù)據(jù)維度以及數(shù)據(jù)之間的相關(guān)性,同時為了起到一定的數(shù)據(jù)降噪作用,對14維監(jiān)控數(shù)據(jù)進(jìn)行PCA降維處理?;谕瑯拥挠?xùn)練參數(shù),對測試集中的所有發(fā)動機(jī)監(jiān)控數(shù)據(jù)做同樣的處理,可以得到測試樣本從正常運(yùn)行狀態(tài)到當(dāng)前狀態(tài)的性能退化曲線。圖6(a)和圖6(b)分別為樣本庫中100臺發(fā)動機(jī)經(jīng)過PCA降維和KRR處理后,基于eSNR進(jìn)行特征提取得到的訓(xùn)練樣本HI和經(jīng)過降維和平滑處理后的狀態(tài)。
圖6 系統(tǒng)HIFig.6 System HI
構(gòu)建系統(tǒng)HI后,需要確定系統(tǒng)性能退化隱狀態(tài)數(shù)目。部分文獻(xiàn)直接通過經(jīng)驗確定隱狀態(tài)數(shù)目,例如假設(shè)系統(tǒng)退化經(jīng)歷4個狀態(tài):正常狀態(tài)、初步退化狀態(tài)、嚴(yán)重退化狀態(tài)和實效狀態(tài)。直接通過經(jīng)驗確定HMM隱狀態(tài)數(shù)目的方式包含部分不確定性,本文采用基于貝葉斯信息標(biāo)準(zhǔn)(Bayesian information criterion,BIC)的方法確定隱狀態(tài)數(shù)目,并有:
BIC=·ln-2ln(|)
(29)
式中:為隱狀態(tài)數(shù)目;為樣本時間步長;(|)為觀測概率。使得BIC最小的值為最佳隱狀態(tài)數(shù)目。
圖7為基于訓(xùn)練樣本數(shù)據(jù)進(jìn)行BIC分析的結(jié)果。顯然,假設(shè)系統(tǒng)經(jīng)歷4個退化狀態(tài)取得的效果最好。
圖7 BIC分析結(jié)果Fig.7 BIC analysis results
圖8為基于4個退化狀態(tài)建立的高斯混合模型,4個高斯混合模型(Gaussian mixture model, GMM)分別對應(yīng)系統(tǒng)4個退化狀態(tài),從圖8中可以看出GM-HMM可以較好地對系統(tǒng)退化狀態(tài)進(jìn)行模擬。
圖8 4個組件對應(yīng)的GMM模型Fig.8 GMM model of four components
基于提取的系統(tǒng)性能指數(shù)和GM-HMM模型,將訓(xùn)練樣本數(shù)據(jù)輸入模型中進(jìn)行訓(xùn)練,并假定系統(tǒng)初始狀態(tài)轉(zhuǎn)移概率為
(30)
需要注意的一點是,將所有訓(xùn)練數(shù)據(jù)全部用于訓(xùn)練一個HMM并將該HMM模型應(yīng)用于所有測試樣本進(jìn)行RUL預(yù)測,這種方式將會產(chǎn)生非常大的偏差。為了避免這種偏差,同時又盡可能地降低過擬合風(fēng)險,本文提出并采用了一種“定制”策略,具體為:針對每一組測試數(shù)據(jù),根據(jù)HI退化情況,基于最小歐式距離,從所有訓(xùn)練樣本中選取5個性能最相近的發(fā)動機(jī)樣本,以這些樣本數(shù)據(jù)為每一組測試發(fā)動機(jī)訓(xùn)練一個HMM模型,即總共訓(xùn)練得到100個HMM。
以樣本庫中1號發(fā)動機(jī)HMM模型訓(xùn)練為例,經(jīng)過訓(xùn)練后的狀態(tài)轉(zhuǎn)移概率為
(31)
圖9為訓(xùn)練樣本健康狀態(tài),即模型隱狀態(tài)變化趨勢。
圖9 系統(tǒng)隱狀態(tài)變化趨勢Fig.9 Change trend of system hidden state
將訓(xùn)練好的HMM模型對所有測試發(fā)動機(jī)數(shù)據(jù)進(jìn)行RUL預(yù)測,計算相應(yīng)評價指標(biāo),并將結(jié)果與多源信息融合、多層感知機(jī)、深度卷積網(wǎng)絡(luò)、長短時記憶網(wǎng)絡(luò)、DBN-HMM等文獻(xiàn)方法的結(jié)果進(jìn)行對比分析。表2為對比情況,從表2可以看出,本文所提方法在均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)等指標(biāo)上比現(xiàn)有算法都有較大提高,并且相比于以上方法,在預(yù)測RUL的基礎(chǔ)上能夠更全面地監(jiān)測系統(tǒng)退化過程,便于給出系統(tǒng)健康狀態(tài)評估結(jié)果。
表2 試驗結(jié)果對比分析
針對系統(tǒng)RUL估計的問題,提出多源信息融合與HMM的方法,采用PCA進(jìn)行降維和降噪處理,并采用KRR對退化軌跡進(jìn)行平滑處理并進(jìn)一步降噪,在此基礎(chǔ)上基于傳感器信噪比構(gòu)建系統(tǒng)HI,通過樣本數(shù)據(jù)訓(xùn)練得到GM-HMM模型,推導(dǎo)系統(tǒng)性能退化狀態(tài),并進(jìn)行RUL預(yù)測。最后,應(yīng)用NASA公開的航空發(fā)動機(jī)數(shù)據(jù)對預(yù)測方法進(jìn)行了驗證,并與最新文獻(xiàn)的結(jié)果進(jìn)行了對比分析,驗證了方法的可行性,預(yù)測結(jié)果較最新文獻(xiàn)有了較大的提高,方法具有較高的實用性。