何兆民,王少萍
(北京航空航天大學 自動化科學與電氣工程學院,北京 100191)
基于時變狀態(tài)轉(zhuǎn)移隱半馬爾科夫模型的壽命預測*
何兆民?,王少萍
(北京航空航天大學 自動化科學與電氣工程學院,北京 100191)
隱半馬爾科夫模型在進行系統(tǒng)狀態(tài)估計及壽命預測時,其狀態(tài)轉(zhuǎn)移概率矩陣是固定值,得到的剩余壽命預測值呈階梯狀變化,與系統(tǒng)的實際剩余壽命值之間存在著較大的誤差.針對上述問題,提出了具有時變狀態(tài)轉(zhuǎn)移概率矩陣的隱半馬爾科夫模型,根據(jù)系統(tǒng)的3種典型退化狀態(tài)分析,給出3種不同的狀態(tài)轉(zhuǎn)移系數(shù).與初始狀態(tài)轉(zhuǎn)移矩陣相結(jié)合,得到隨時間變化的狀態(tài)轉(zhuǎn)移矩陣.提高系統(tǒng)在當前健康狀態(tài)下的剩余持續(xù)時間估計精度,最終得到更為準確的總體剩余壽命預測值.結(jié)果表明,基于時變狀態(tài)轉(zhuǎn)移概率矩陣的隱半馬爾科夫模型相比傳統(tǒng)的隱半馬爾科夫模型,可顯著提高剩余壽命預測的準確性.
時變狀態(tài)轉(zhuǎn)移概率;隱半馬爾科夫模型;狀態(tài)估計;壽命預測
視情維修(CBM)通過狀態(tài)監(jiān)測對系統(tǒng)進行故 障預測,從而制定合理的維修策略,是解決傳統(tǒng)定期維修中的“維修不足”和“維修過剩”的有效方法.其中,系統(tǒng)運行過程中的健康狀態(tài)估計與剩余壽命預測是視情維修的關(guān)鍵,已成為一個備受國內(nèi)外研究關(guān)注的熱點.
目前,常用的剩余壽命預測技術(shù)可分為基于數(shù)學模型和基于數(shù)據(jù)驅(qū)動的壽命預測方法兩大類[1-2].由于系統(tǒng)或系統(tǒng)的結(jié)構(gòu)日趨復雜,獲取其精確的數(shù)學模型越來越困難,使得基于數(shù)學模型的壽命預測技術(shù)發(fā)展比較緩慢.隨著信號采集及處理技術(shù)的發(fā)展,基于數(shù)據(jù)驅(qū)動的壽命預測方法得到越來越多的關(guān)注.其中,隱馬爾科夫模型(HMM)作為一種有效的隨機數(shù)據(jù)建模與分析方法,在諸如語音信號處理[3]等領(lǐng)域得到了廣泛應用.Carey等人[4]首次將HMM應用于系統(tǒng)故障診斷領(lǐng)域,通過分析機械系統(tǒng)的振動信號,實現(xiàn)對故障的診斷.HSMM是對HMM的擴展[5],它通過引入狀態(tài)駐留時間實現(xiàn)了對系統(tǒng)剩余壽命的估計,Dong等人[6-7]將HSMM應用于狀態(tài)估計與壽命預測的建模中,利用柱塞泵在不同污染狀態(tài)下的振動數(shù)據(jù)驗證了HSMM在狀態(tài)估計與壽命預測領(lǐng)域的可行性與有效性.
HSMM將系統(tǒng)退化描述成狀態(tài)轉(zhuǎn)移及狀態(tài)持續(xù)的過程,但是該方法認為狀態(tài)轉(zhuǎn)移概率是固定的,用歷史數(shù)據(jù)訓練后得到的狀態(tài)轉(zhuǎn)移概率不會發(fā)生改變.實際上,隨著系統(tǒng)工作時間不斷累積,系統(tǒng)的狀態(tài)轉(zhuǎn)移概率是變化的,傳統(tǒng)的HMM和HSMM均不能反映狀態(tài)轉(zhuǎn)移概率矩陣的時變特性,導致的結(jié)果是在利用HSMM進行壽命預測時,往往把目前狀態(tài)的總體持續(xù)時間看成是該狀態(tài)的剩余持續(xù)時間,造成嚴重的預測誤差[8].
本文針對以上問題,在利用HSMM進行狀態(tài)估計及壽命預測的基礎上,引入時變狀態(tài)轉(zhuǎn)移概率的方法,給出了在系統(tǒng)的不同退化階段中不同形式的狀態(tài)轉(zhuǎn)移系數(shù),將系統(tǒng)歷史數(shù)據(jù)信息融入到狀態(tài)轉(zhuǎn)移描述中,更準確地反映系統(tǒng)性能退化過程,實現(xiàn)更為準確的剩余壽命預測.最后通過柱塞泵全壽命振動數(shù)據(jù)驗證該方法的可行性與優(yōu)越性.
HSMM是在HMM的基礎上擴展而來的,它在HMM的基礎上加入狀態(tài)駐留時間的概念.HMM是一個雙重隨機過程,其中一個隨機過程用來描述狀態(tài)之間的轉(zhuǎn)移關(guān)系,另一個隨機過程用來描述狀態(tài)與狀態(tài)觀測值之間的隨機關(guān)系,因為HMM的實際狀態(tài)不能直接觀測到,只能通過振動、溫度等與其相關(guān)的狀態(tài)觀測值來感知.
一個HMM由以下幾個基本的元素組成[9]:
1)初始狀態(tài)概率分布π= {πi}=P(s1=i),1≤i≤N,其中N為系統(tǒng)可能的宏觀健康狀態(tài)數(shù),s1為初始時刻系統(tǒng)的宏觀健康狀態(tài).
2)狀態(tài)轉(zhuǎn)移概率矩陣A= {aij},其中aij=P(st+1=j|st=i),1≤i,j≤N ,該矩陣表示的是系統(tǒng)使用過程中,各宏觀健康狀態(tài)之間的轉(zhuǎn)移概率.
3)狀態(tài)觀測概率矩陣B= {bik},其中bik=P(vk|st=i),1≤i≤N,1≤k≤M.M 為狀態(tài)i下的觀測數(shù)目,該矩陣表示的是在不同時刻觀測到的用以表征宏觀健康狀態(tài)的觀測值.
當π,A,B確定之后,就可以定義一個基本的HMM,用λ=(π,A,B)來表示.對HMM進行分析發(fā)現(xiàn),通過狀態(tài)轉(zhuǎn)移概率矩陣A推導可以得到系統(tǒng)在某個狀態(tài)i下持續(xù)d個單位觀測時間的概率分布是pi(d)=ad-1ii(1-aii),這是典型的指數(shù)分布,與大多數(shù)實際系統(tǒng)的性能退化過程并不吻合.HSMM在HMM的基礎上,通過對系統(tǒng)的狀態(tài)持續(xù)時間進行定義,估計每個狀態(tài)的狀態(tài)持續(xù)時間,實現(xiàn)對剩余壽命的預測,具有更好的建模與分析能力.因此,引入第4個矩陣,狀態(tài)駐留時間矩陣D={Pi(d)},1≤i≤N.該矩陣表示系統(tǒng)在狀態(tài)i下持續(xù)d個單位觀測時間的概率.最終HSMM的模型記為λ=(π,A,B,D).與HMM在實際應用中需要解決3個基本問題一樣,HSMM也需要解決3個基本問題[4]:
1)評價問題:已知一個觀測序列O1O2O3…OT和模型λ=(π,A,B,D),計算該觀測序列在給定模型下的概率P(O|λ),解決該問題的算法是前向-后向算法.
2)解碼問題:已知一個觀測序列O1O2O3…OT和模型λ = (π,A,B,D),找到一個隱狀態(tài)序列S1S2…SN,使其能最優(yōu)地解釋該觀測序列,解決該問題的算法是Viterbi算法.
3)訓練問題:已知一個觀測序列O1O2O3…OT和初始模型λ0= (π,A,B,D),如何調(diào)整模型中的參數(shù),使得P(O|λ)最大化,解決該問題的算法是Baum-Welch算法.
傳統(tǒng)HSMM雖然引入了狀態(tài)持續(xù)時間概率矩陣,在一定程度上改進了HMM的不足,可以進行系統(tǒng)健康狀態(tài)估計及壽命預測,如圖1所示.從圖中可以明顯看出傳統(tǒng)HSMM將狀態(tài)轉(zhuǎn)移矩陣作為一個固定值進行剩余壽命預測,最終得到的預測結(jié)果基本上呈階梯狀,與實際的剩余壽命之間存在著較大的誤差.因此,為了提高剩余壽命預測的精度,需要對傳統(tǒng)的HSMM進行改進,根據(jù)系統(tǒng)性能退化過程引入狀態(tài)轉(zhuǎn)移系數(shù),使狀態(tài)轉(zhuǎn)移矩陣變?yōu)殡S時間變化的時變矩陣,從而更加符合系統(tǒng)的實際性能退化過程.
圖1 傳統(tǒng)HSMM的壽命預測結(jié)果Fig.1 The life prediction results of traditional HSMM
典型系統(tǒng)的性能退化曲線如圖2所示,可劃分為A,B,C 3個階段,其中A階段為平穩(wěn)退化階段,在該階段中系統(tǒng)的健康性能指標變化比較平穩(wěn),基本保持不變;B階段為均勻退化階段,在該階段中系統(tǒng)的健康性能指標發(fā)生均勻變化,系統(tǒng)進入早期故障階段;C階段為加速退化階段,在該階段中系統(tǒng)的健康性能指標急劇惡化,系統(tǒng)從早期故障快速發(fā)展到失效.
圖2 典型系統(tǒng)性能退化曲線Fig.2 The typical curve of system performance degradation
傳統(tǒng)的 HSMM中,利用Baum-Welch算法對系統(tǒng)狀態(tài)監(jiān)測數(shù)據(jù)進行訓練后,可以得到狀態(tài)轉(zhuǎn)移概率矩陣A,該矩陣是一個固定矩陣,即系統(tǒng)在不同時刻的狀態(tài)轉(zhuǎn)移概率并不發(fā)生變化.但是從圖2中可以看出,系統(tǒng)實際運行過程中,隨著在當前健康狀態(tài)駐留時間的增長,繼續(xù)停留在當前狀態(tài)的狀態(tài)轉(zhuǎn)移概率aii會減小,相應的轉(zhuǎn)移至其他狀態(tài)的概率aij會增大.而且對實際歷史數(shù)據(jù)的分析發(fā)現(xiàn),系統(tǒng)在不同健康狀態(tài)時,狀態(tài)轉(zhuǎn)移概率的變化情況也并不一致.因此,在傳統(tǒng)的HSMM基礎上,考慮引入狀態(tài)轉(zhuǎn)移系數(shù),將固定狀態(tài)轉(zhuǎn)移矩陣A轉(zhuǎn)變?yōu)殡S時間變化的時變狀態(tài)轉(zhuǎn)移矩陣A(t).
系統(tǒng)從開始使用到最終失效的過程中,一般會經(jīng)歷平穩(wěn)退化、均勻退化、加速退化等3個階段.3個階段中系統(tǒng)的狀態(tài)轉(zhuǎn)移概率隨時間發(fā)展的變化趨勢是不一致的,通??煞譃?種形式,分別對應系統(tǒng)的3個退化階段.下面針對3種形式的時變狀態(tài)轉(zhuǎn)移矩陣進行分析.
1)平穩(wěn)退化的狀態(tài)概率描述.在平穩(wěn)退化階段,即圖2中的A階段,狀態(tài)轉(zhuǎn)移概率隨時間的變化是固定的,即
式中:θ2為常數(shù)且θ2≥0.根據(jù)假設,下一觀測時刻系統(tǒng)的狀態(tài)轉(zhuǎn)移概率為:
根據(jù)式(8)沿著時間往回推導,可以得到當前時刻的狀態(tài)轉(zhuǎn)移概率與剛進入該健康狀態(tài)時狀態(tài)轉(zhuǎn)移概率之間的關(guān)系表達式:
初始狀態(tài)轉(zhuǎn)移概率矩陣A0通過訓練歷史數(shù)據(jù)獲得.實際情況下,系統(tǒng)運轉(zhuǎn)過程中如果不對其進行維修,其性能是隨時間逐漸退化的,只會轉(zhuǎn)入更差的健康狀態(tài),因此,當1≤i<j≤N時,aij=0,初始狀態(tài)轉(zhuǎn)移矩陣可以描述為:
將式(3),(6),(9)分別與式(10)結(jié)合可以得到不同退化階段的時變狀態(tài)轉(zhuǎn)移概率矩陣,限于篇幅原因,只給出了加速退化階段中,經(jīng)歷時刻t=kΔt后的狀態(tài)轉(zhuǎn)移矩陣為:
利用EM算法[10]計算出狀態(tài)轉(zhuǎn)移系數(shù)的值之后,就可以計算3種退化階段的狀態(tài)轉(zhuǎn)移概率,通過比較系統(tǒng)停留在當前狀態(tài)的概率atii與轉(zhuǎn)移至其他狀態(tài)的概率(1≤i≠j≤N)的大小,當<時,認為系統(tǒng)性能退化狀態(tài)發(fā)生轉(zhuǎn)移,由當前狀態(tài)i轉(zhuǎn)移至其他狀態(tài)j,從而選用不同的狀態(tài)轉(zhuǎn)移系數(shù)θ計算時變狀態(tài)轉(zhuǎn)移矩陣.
通過引入針對系統(tǒng)不同退化階段的狀態(tài)轉(zhuǎn)移系數(shù)θ1,θ2,θ3,可以得到如式(11)所示的狀態(tài)轉(zhuǎn)移矩陣,該狀態(tài)轉(zhuǎn)移矩陣是隨時間變化的,結(jié)合傳統(tǒng)的HSMM可以計算得到系統(tǒng)在當前健康狀態(tài)下的剩余壽命,該剩余壽命預測值是隨時間變化的,可以有效提高剩余壽命預測的精度.
系統(tǒng)從投入使用到最終失效的過程中,會經(jīng)歷多個健康狀態(tài),其剩余使用壽命等于系統(tǒng)停留在當前狀態(tài)的時間與在后續(xù)各個狀態(tài)的持續(xù)時間之和.利用全壽命歷史數(shù)據(jù)訓練得到的HSMM,可以得到系統(tǒng)在每個狀態(tài)持續(xù)時間的均值和方差.
系統(tǒng)在各個健康狀態(tài)的持續(xù)時間服從高斯分布,利用改進的前向-后向算法[11]可以得到狀態(tài)持續(xù)時間的均值和方差:
從式(12)和式(13)中可以看出,狀態(tài)持續(xù)時間是隨著狀態(tài)轉(zhuǎn)移矩陣的變化而變化的,改進的HSMM將傳統(tǒng)HSMM中固定狀態(tài)轉(zhuǎn)移矩陣轉(zhuǎn)變?yōu)闀r變狀態(tài)轉(zhuǎn)移矩陣,并根據(jù)在線監(jiān)測數(shù)據(jù)不斷更新狀態(tài)轉(zhuǎn)移概率,隨著狀態(tài)轉(zhuǎn)移概率的變化系統(tǒng)在當前狀態(tài)的持續(xù)時間也會發(fā)生變化,可以給出更加精確的剩余壽命預測值:
綜上所述,基于時變狀態(tài)轉(zhuǎn)移HSMM的壽命預測的流程如圖3所示.
圖3 基于時變狀態(tài)轉(zhuǎn)移HSMM的壽命預測流程圖Fig.3 The life prediction process based on time-varying state transition HSMM
為驗證本文方法,搭建了某型號柱塞泵磨損實驗臺,如圖4所示.進行實驗的柱塞泵柱塞數(shù)為9,額定轉(zhuǎn)速為4 000r/min,對應的軸頻率為66.7Hz,利用加速度傳感器采集泵殼體的振動信號作為判斷其磨損狀態(tài)的原始特征信號,加速度傳感器的采樣頻率為2kHz.對采集的振動信號進行處理,提取其中的Hilbert包絡譜邊頻相對能量和作為其健康狀態(tài)表征,實驗共進行了1 120h.當運行至該時刻時,柱塞泵因為內(nèi)部摩擦副的嚴重磨損引起殼體劇烈振動,實驗結(jié)束.柱塞泵的性能退化曲線如圖5所示,由圖5可以看到,隨著實驗的進行,柱塞泵的性能退化曲線大體可以分為3個階段,符合前文中的分析.圖5 柱塞泵的全壽命曲線圖
圖4 柱塞泵磨損實驗臺Fig.4 The wear test bench of piston pump
Fig.5 The whole life curve of the piston pump
根據(jù)圖3中的壽命預測流程,首先對得到的全壽命歷史數(shù)據(jù)進行訓練,得到柱塞泵3種健康狀態(tài)的初始狀態(tài)轉(zhuǎn)移矩陣及各個健康狀態(tài)持續(xù)時間的均值和方差,分別如表1和表2所示.
表1 柱塞泵健康狀態(tài)的初始狀態(tài)轉(zhuǎn)移矩陣Tab.1 The state transition matrix at beginning
表2 柱塞泵狀態(tài)初始持續(xù)時間的均值及方差Tab.2 The mean and variance of duration time at beginning
系統(tǒng)運行200h后,對系統(tǒng)的狀態(tài)轉(zhuǎn)移概率和狀態(tài)持續(xù)時間的均值及方差進行重估計.此時,系統(tǒng)處于平穩(wěn)退化階段,利用EM算法對θ1進行估計得到θ1=0.001 8,將其代入式(3),計算此時的狀態(tài)轉(zhuǎn)移概率,得到如表3所示的結(jié)果.
表3 200h時的狀態(tài)轉(zhuǎn)移矩陣Tab.3 The state transition matrix at 200h
將表3中的數(shù)值代入式(12)和(13)中,得到此時各狀態(tài)持續(xù)時間的均值和方差,如表4所示.
表4 200h時的狀態(tài)持續(xù)時間均值及方差Tab.4 The mean and variance of duration time at 200h
對比表1和表3及表2和表4可以發(fā)現(xiàn),柱塞泵從平穩(wěn)退化狀態(tài)轉(zhuǎn)移至平穩(wěn)退化狀態(tài)的概率隨著時間的增長逐漸減小,而向其他退化狀態(tài)轉(zhuǎn)移的概率逐漸增大,這與實際情況是相吻合的.
為了對比基于時變狀態(tài)轉(zhuǎn)移HSMM與傳統(tǒng)HSMM壽命預測方法的準確性,選取相對誤差作為評價指標,其表達式為:
選取了10組不同工作時間的柱塞泵,利用本文提出的方法與傳統(tǒng)HSMM壽命預測方法[12]得到的壽命預測結(jié)果進行比對,如表5所示.
表5 不同預測方法的預測結(jié)果對比Tab.5 The comparison between different prediction methods
從表5可以看出:①基于時變狀態(tài)轉(zhuǎn)移的HSMM與傳統(tǒng)的HSMM方法都可以進行壽命預測,反映柱塞泵隨著使用時間的增長,其壽命逐漸縮短;②本文提出的方法與傳統(tǒng)HSMM方法相比較,相對誤差更小,穩(wěn)定在5%以內(nèi);③在同一退化狀態(tài)下,本文提出的方法隨著時間的增加,精度逐漸提高,這是因為隨著在某一退化狀態(tài)下收集的數(shù)據(jù)越多,對狀態(tài)轉(zhuǎn)移系數(shù)估計的精度就越高,得到的在該退化狀態(tài)下的剩余持續(xù)時間就越準確;④本文提出的方法給出的壽命預測值相對保守,均小于實際剩余壽命值,這樣可以保證系統(tǒng)的安全運行.
本文針對傳統(tǒng)HSMM中將狀態(tài)轉(zhuǎn)移矩陣看成是一個固定矩陣,造成剩余壽命預測具有較大誤差的問題,提出了利用時變狀態(tài)轉(zhuǎn)移矩陣來提高剩余壽命預測的精度.針對系統(tǒng)的不同退化階段提出了3種不同的狀態(tài)轉(zhuǎn)移系數(shù),根據(jù)實時監(jiān)測數(shù)據(jù)動態(tài)估計狀態(tài)轉(zhuǎn)移系數(shù),計算不同時刻的狀態(tài)轉(zhuǎn)移概率矩陣,實時更新系統(tǒng)在當前狀態(tài)下的剩余壽命,結(jié)合傳統(tǒng)HSMM給出的其余健康狀態(tài)下的持續(xù)時間,可以提高壽命預測的準確率.最后,通過柱塞泵全壽命試驗驗證了該方法的有效性和準確性.
[1] LEE Jay,WU Fang-ji,ZHAO Wen-yu.Prognostics and health management design for rotary machinery systems-reviews,methodology and applications[J].Mechanical Systems and Signal Processing,2014,42(1/2):314-334.
[2] 楊宇,王歡歡,曾鳴,等.基于變量預測模型的模式識別方法在滾動軸承故障診斷中的應用[J].湖南大學學報:自然科學版,2013,40(3):36-40.
YANG Yu,WANG Huan-huan,ZENG Ming,et al.Application of pattern recognition approach based on VPMCD in roller bearing fault diagnosis[J].Journal of Hunan University:Natural Sciences,2013,40(3):36-40.(In Chinese)
[3] MOORE M D,SAVIC M I.Speech reconstruction using ageneralized HSMM (GHSMM)[J].Digital Signal Processing,2004,14(1):37-53.
[4] CAREY B,DAN M,TARIK A.Condition-based maintenance of machines using hidden markov models[J].Mechanical Systems and Signal Processing,2000,14(4):597-612.
[5] YU Shun-zheng.Hidden semi-markov models[J].Artificial Intelligence,2010,174(2):215-243.
[6] DONG Ming,HE David.A segmental hidden semi-Markov model(HSMM)-based diagnostics and prognostics framework and methodology[J].Mechanical Systems and Signal Processing,2007,21(5):2248-2266.
[7] DONG Ming,HE David.Hidden semi-Markov model based methodology for multi-sensor equipment health diagnosis and prognosis[J].European Journal of Operational Research,2007,178(3):858-878.
[8] CHEN A,WU G S.Real-time health prognosis and dynamic preventive maintenance policy for equipment under aging Markovian deterioration[J].International Journal of Production Research,2007,45(15):3351-3379.
[9] RABINER L R.A tutorial on hidden Markov models and selected applications in speech recognition[C]//Proceedings of the IEEE.1989,77:257-286.
[10]LEVINSON S E.Continuously variable duration hidden Markov models for automatic speech recognition[J].Computer Speech and Language,1986,1(1):29-45.
[11]RUSSELL M J,MOORE R K.Explicit modeling of state occupancy in hidden Markov models for automatic speech recognition[C]//Acoustics,Speech and Signal Processing,IEEE International Conference on ICASSP'85.1985,10:5-8.
[12]王寧,孫樹棟,李淑敏.基于DD-HSMM的設備運行狀態(tài)識別與故障預測方法[J].計算機集成制造系統(tǒng),2012,18(8):1861-1868.
WANG Ning,SUN Shu-dong,LI Shu-min.Equipment state recognition and fault prognostics method based on DDHSMM model[J].Computer Integrated Manufacturing Systems,2012,18(8):1861-1868.(In Chinese)
Remaining Lifetime Prediction Based on Time-varying State Transition Probabilities of Hidden Semi-Markov Model
HE Zhao-min?,WANG Shao-ping
(School of Automation Science and Electrical Engineering,Beijing Univ of Aeronautics and Astronautics,Beijing 100191,China)
In system state recognition and prognostics,state transition probability matrix of hidden semi-Markov model(HSMM)is constant and the predicted life value shows stepladder change,which is different from the actual residual life of the system.To solve this problem,an HSMM with time varying state transition probability matrix was proposed.Based on the analysis of three typical degradation states of the system,three different state transition coefficients were given.Combined with initial state transition matrix,a time varying state transition matrix was obtained,the estimation accuracy of residual life of the system under current healthy state was increased,and a more accurate overall residual life prediction value can be obtained.Experiment results show that,compared with traditional HSMM,HSMM based on time varying state transition probability matrix can increase the accuracy of residual life prediction and can be used in life prediction with high precision.
time-varying state transition probability;hidden semi-Markov model(HSMM);state estimation;remaining lifetime prediction
TH322
A
1674-2974(2014)08-0047-07
2013-12-24
國家重點基礎研究發(fā)展計劃資助項目(2014CB046402);國家自然科學基金資助項目(51175014);國防基金資助項目(9140A17050113HK01233)
何兆民(1985-),男,山東臨沂人,北京航空航天大學博士研究生
?通訊聯(lián)系人,E-mail:he2811@163.com