廖雯竹,崔詩好
(重慶大學 機械工程學院,重慶 400044)
隨著機械設備結構與功能的日益復雜和自動化程度的日益提升,人們對設備安全性和可靠性的要求越來越高,愈加關注設備的狀態(tài)評估及預測。在歷經事后維修、基于時間的預防性維護后,基于狀態(tài)維護(Condition Based Maintenance, CBM)成為研究熱點。對設備狀態(tài)進行準確評估作為實現良好狀態(tài)維護的關鍵,已經成為備受國內外學者關注的重要問題之一[1]。
現有的設備故障診斷方法分為定性與定量分析兩大類,其中定性方法主要有定性仿真、專家系統(tǒng)、抽象分層和圖論方法等;定量方法主要基于解析模型和數據驅動的故障診斷方法,如人工神經網絡(Artificial Neural Networks, ANN)和隱馬爾可夫模型(Hidden Markov Model, HMM)等智能診斷技術[2]。HMM最初應用于語音識別領域,Bunks等[3]根據CBM過程與語音識別過程的相似性,首次提出將基于狀態(tài)的分類方法應用于直升機齒輪箱的視情維修的思想,同時對基于故障診斷的視情維修進行了可行性分析;隨后,Atlas等[4]將HMM用于工具磨損的過程監(jiān)控;Ertunc等[5]將連續(xù)隱馬爾可夫模型(Continuous HMM, CHMM)用于鉆井作業(yè)刀具磨損的狀態(tài)監(jiān)測與故障診斷;Dong等[6-8]開展了基于隱半馬爾可夫模型(Hidden Semi-Markov Model, HSMM)的設備故障診斷、預測和健康管理研究;Wu等[9]通過改進前后向算法解決了HSMM運算時可能出現的下溢問題;Zhu等[10]提出一個依賴時間間隔因素的HSMM來預計設備剩余使用壽命(Remaining Useful Life, RUL);Liu等[11]運用最大似然和線性回歸的方法訓練數據對RUL進行的預測。此外,一些學者還致力于改進傳統(tǒng)HMM,例如龔勛等[12]利用機械設備的空間結構性對經典HMM模型進行補償;Xia等[13]采用期望值最大法(Expectation Maximization, EM)訓練優(yōu)化模型參數,建立了基于HMM的設備健康狀況評價模型;Liao等[14]提出一個集成模擬退火算法(Simulated Annealing, SA)和EM的混合算法優(yōu)化參數;Le等[15]提出一種多分支HMM,用于描述多個衰退模式下的設備劣化過程;Yuwono等[16]提出一個基于群快速質心估計(Swarm Rapid Centroid Estimatio,SRCE)的故障診斷模型,并應用于軸承的故障診斷;Gao等[17]提出一個基于SA的k-means聚類算法對滾軸的故障狀態(tài)進行分級,在此基礎上使用HMM進行故障診斷。
在設備運行過程中,某些部件會隨時間而磨損,或者裂紋增長、被腐蝕等,導致狀態(tài)逐漸劣化。目前設備劣化模型按狀態(tài)類型分為兩大類:①離散狀態(tài)劣化系統(tǒng),如Markov或半Markov過程模型;②連續(xù)狀態(tài)劣化系統(tǒng),如Gamma過程[18]。HMM作為一種統(tǒng)計模型,可描述設備性能衰退規(guī)律與健康狀態(tài)轉移的雙重隨機過程。然而,傳統(tǒng)HMM往往假定設備的狀態(tài)轉移概率為固定值,忽略了實際運行中,設備狀態(tài)轉移概率隨時間增加發(fā)生變化的情況,即設備保持其原有狀態(tài)的概率會變小,而轉移到更差狀態(tài)的概率會增加。針對該問題,本文提出一個考慮劣化因素的HMM,并通過開發(fā)一個雙重EM來估計HMM參數,以有效地進行設備狀態(tài)評估。雖然以往文獻(如文獻[19-20])也有考慮劣化因素,但其大多假定初始狀態(tài)的轉移概率為已知,而實際情況中由于前期數據較少,該參數很難通過訓練得到。本文除劣化因子外,還考慮了初始狀態(tài)轉移概率,并通過設計雙重EM算法估算這兩個參數值。此外,以往文獻多是在HSMM中引入劣化因子,并與灰色理論等結合用于設備壽命預測,本文則采用一類新的指數型劣化因子設計方式構建新的HMM,以提高設備狀態(tài)評估的可行性和有效性。
HMM用于描述一個雙重隨機過程,即狀態(tài)之間的轉移過程以及狀態(tài)和觀測值之間的對應關系。其完整定義如下:
N為模型中狀態(tài)的個數;
M為每個狀態(tài)可以輸出不同觀測值的個數;
π=(π1,π1,…,πN)為初始狀態(tài)概率分布,其中
(1)
A={aij}N×N為狀態(tài)轉移概率矩陣,aij表示從狀態(tài)i轉移到狀態(tài)j的概率,其中
1≤i,j≤N;
(2)
B={bjk}N×M為觀測值概率矩陣,bjk表示t時刻狀態(tài)j出現觀測值vk的概率,其中
1≤j≤N,1≤k≤M。
(3)
HMM記為λ=(π,A,B),同時定義前向概率變量αt(i)、后向概率變量βt(i)及概率變量γt(i)。αt(i)是給定模型λ在時刻t輸出觀測序列{O1,O2,…,Ot}且設備處于狀態(tài)θi的概率;βt(i)是給定模型λ在時刻t設備處于狀態(tài)θi,在t+1時刻到最后時刻T輸出的觀測序列為{Ot+1,Ot+2,…,OT}的概率;γt(i)是給定模型λ和觀測序列O,在t時刻設備處于狀態(tài)θi的概率。
(4)
式中:t=1,2,…,T;i=1,2,…,N。根據式(4),變量αt(i),βi(i),γt(i)計算如下:
(5)
一般地,對于正常運行的設備而言,設備從健康逐漸劣化到失效會經歷不同狀態(tài),例如從狀態(tài)1、狀態(tài)2直至狀態(tài)N。在不同觀測時間點,可觀測得到該時刻的設備狀態(tài),該過程可看作為一個隨機過程[21]。設備狀態(tài)序列從狀態(tài)i轉移到狀態(tài)j的概率即為轉移概率aij,則轉移概率矩陣
(6)
(7)
傳統(tǒng)HMM可通過訓練得到轉移概率矩陣A,但一般認為設備各狀態(tài)之間的轉移概率固定不變,而且轉移概率矩陣會呈現出一種特性,即當j>i時,aij隨著j的增加而減小,因此轉移概率矩陣每一行中aii都趨于最大值。
然而,設備在運行過程中的健康狀態(tài)會逐漸惡化,即設備狀態(tài)變得更差的可能性將增加,保持原狀態(tài)的概率會變小[22]。在HMM中使用轉移概率描述設備狀態(tài)的轉移過程,前面這種狀況在HMM的表現即為原有狀態(tài)概率的aii值將隨設備運行時間的增加而變小,轉移到更差狀態(tài)的概率aij將增加。傳統(tǒng)HMM未考慮設備運行過程中健康狀態(tài)轉移概率發(fā)生變化的情況,一般僅用固定值描述轉移概率,該特性容易造成設備狀態(tài)評估的偏差,因此本文提出一個考慮劣化因素的HMM(Age-dependentHMM)來克服傳統(tǒng)HMM的不足,以提高設備狀態(tài)評估的準確性。
設備劣化可認為是設備在不同狀態(tài)間轉移的一個過程(設為S),有S={s1,s2,…,sk,…,sf},且sk∈(θ1,θ2,…,θN),其中sk表示第k個觀測時刻的設備狀態(tài),f表示觀測序列樣本容量,sf一般為設備的失效狀態(tài)且1≤k≤f。則設備經歷此劣化過程的概率為
P(S{s1,s2,…,sf-1,sf})=P(sf|sf-1)·
…·P(s3|s2)·P(s2|s1)。
(8)
(9)
根據式(9)推導得
aii(t+Δt)=(aii(t))1+δ。
(10)
aii(t)-aii(t+Δt)=
(11)
因此,可推導
aij(t+Δt)=aij(t)+(aii(t)-
(12)
式中:1≤i≤N,1≤j≤N。
aii(kΔt)=(aii((k-1)Δt))(1+δ)1
(14)
同理,根據式(12)和式(14)可得
aij(kΔt)=aij((k-1)Δt)+(aii((k-1)Δt)-
(15)
式中:1≤i≤N,1≤j≤N。由式(14)和式(15)可知,A0歷經t=kΔt時刻后的轉移概率矩陣
(16)
本文采用最大似然估計的方法估計劣化因子δ。已知A0和設備劣化過程的狀態(tài)序列,當轉移概率考慮了劣化因素時,式(8)可以進一步推導為
(17)
式中:Psksk+1表示設備狀態(tài)由sk到sk+1的概率;1≤k≤f-1。
在估計劣化因子δ時,為排除偶發(fā)性,提高估計準確性,本文綜合考慮多個劣化過程。假設有W個劣化過程序列,則似然函數
(18)
因此,δ的估計值可由最大化似然函數L的對數得到:
(19)
推導可得
(20)
(21)
E(nij)=
1≤i≤N,1≤j≤N。
(22)
因此,A0中的
(23)
(24)
本文提出的雙重EM算法的主要步驟描述如下:
步驟1初始化。設定AI0,迭代次數s=0,迭代步長iter_step。
步驟2令s++,劣化因子δ=s×iter_step。
步驟3根據式(23)和式(24)及δ,計算A0。
步驟4根據式(19)和A0,計算logL。
步驟5如果|logLs-logLs-1|≤ε(ε為預先設定的收斂條件),則轉步驟6,否則返回步驟2。
步驟6輸出A0和s,結束。
這里,迭代步長iter_step和預先設定的收斂條件ε對算法的收斂速度和精度都有影響。理論上,更小的iter_step和ε可以得到更精確的結果,但是過小的iter_step意味著更長的時間,過小的ε意味著可能導致算法無法收斂,本文采用試值的方法確定iter_step和ε的值:首先選擇一個稍大的iter_step和ε,已知δ∈(0,1),若取iter_step=0.01,則可保證算法在100次內收斂,此時設置ε=0.01,根據收斂結果得到一個δ的值;再根據得到的δ,盡可能地縮小iter_step和ε,進一步估算δ。經過如此試算得到足夠小的iter_step和ε,繼而通過雙重EM算法求解A0和δ。
本文基于Age-dependent HMM對設備狀態(tài)進行評估,評估流程如圖1所示,主要分為數據收集處理、HMM構建和狀態(tài)評估3部分。首先通過實時觀測數據處理得到構建HMM所需的觀測序列,然后通過上述算法得到A0和δ,接著通過構建的Age-dependent HMM計算設備處于各狀態(tài)的概率,最后采用最大后驗估計[24]確定設備狀態(tài)。
(1) 設備狀態(tài)分類
設備隨著持續(xù)運行,其健康狀況將不斷惡化,即經歷一個劣化的過程。設備健康狀態(tài)是通過一項或多項設備特征參數來反映的,如溫度、壓力、電壓、振動信號等。通過狀態(tài)監(jiān)測得到設備的特征數據,通過數據處理可將設備的特征數據轉為衡量設備健康狀態(tài)的健康指標,該健康指標即可量化設備的健康狀態(tài)。HMM通常根據設備健康指標將設備健康狀態(tài)分為特定等級,然后將評估得到的設備健康指標映射到特定等級。
(2)HMM構建
通過對設備健康指標進行數據處理、分類、抽樣后,得到算法的輸入數據。將該數據輸入本文所提的雙重EM算法可得構建Age-dependent HMM所需的參數A0和δ,并構建新的HMM。
(3)設備狀態(tài)評估
根據式(5),t(k)=kΔt時前向變量αt(k)(i)和后向變量βt(k)(i)可以表示為
(25)
式中:1≤k≤f,1≤i≤N。
根據αt(k)(i)和βt(k)(i),可以得到設備在t(k)=kΔt時處于狀態(tài)i的概率
(26)
根據最大后驗估計方法,t(k)=kΔt時設備所處的狀態(tài)
本文以一鉆孔加工設備為研究對象,該設備主要對金屬材料小型板件進行鉆孔加工。根據工程師的工作經驗,該設備的主軸電壓信號能較好地反映設備性能的優(yōu)劣,主軸電壓信號可通過電壓信號傳感器采集得到。在實際加工過程中,當設備處于更好的健康狀態(tài)時,其性能較優(yōu),磨損較小,相應的負載也較小,采集的主軸電壓信號樣本特征振幅更小;相反,當設備處于更差的健康狀態(tài)時,其性能較差;磨損較大,相應的負載也較大,采集的主軸電壓信號樣本特征振幅更大。
(1)數據收集與處理
本文所提模型必須配備適量的訓練數據才能較好地模擬設備狀態(tài)的劣化情況。該鉆孔加工設備用主軸電壓信號反映其設備性能的優(yōu)劣,即收集980個反映設備性能變化過程的主軸電壓信號,進行數據預處理、特征提取和降維等處理[25]后,用于估計設備健康狀態(tài),可得到各樣本數據對應的設備健康指標,如圖2所示。
本文采用交叉檢驗[26]的方法選擇最優(yōu)的等級劃分?;诂F有數據可確定不同等級數目下HMM診斷結果的錯誤率,由此得到狀態(tài)數目和診斷錯誤率的關系(如圖3),進而確定N=5時的HMM可用于后續(xù)的設備狀態(tài)評估。同理,通過該交叉驗證思想可進一步確定設備健康狀態(tài)和健康指標值的對應關系。
因此,本文將設備健康狀態(tài)劃分為五級,如表1所示,其中“1”表示設備處于最好狀態(tài),“5”表示設備處于最差狀態(tài)(即設備已失效)。根據表1的設備健康狀態(tài)分級方式,將處理后的設備指標數據轉化為可用于本文計算輸入的設備狀態(tài)劣化序列。
表1 健康狀態(tài)分級
通過上述設備健康狀態(tài)分級方式,對收集的12組設備性能變化實時數據序列進行轉化,得到12組設備狀態(tài)劣化序列,其中一組設備劣化序列(含38個觀測數據)如圖4所示。
(2)HMM構建
根據輸入的12組設備劣化觀測序列,采用K-means聚類算法估算出AI0,有
(3)狀態(tài)評估
本文采用另一組包括40個數據的驗證序列來驗證模型的有效性,評估結果如表2所示。
表2 評估結果
本文還利用該數據對傳統(tǒng)HMM(其參數λ用Baum-Welch算法[27]得到)進行訓練,并用訓練后的模型進行評估。表3對比了兩類方法得到的評估結果??梢?,本文提出的Age-dependent HMM準確率更高,顯示了其良好的評估性能。
表3 評估結果對比
注:正確為1,錯誤為0。
設備維護管理對于設備正常運行和企業(yè)順利生產意義重大,而準確的設備狀態(tài)評估是進行設備維護管理的前提。雖然HMM已廣泛用于設備狀態(tài)評估并取得了一些成果,但是基于傳統(tǒng)HMM的設備狀態(tài)評估卻仍有一定不足,其假定設備各個狀態(tài)間的轉移概率為固定值,忽略了劣化過程中設備轉移到更差狀態(tài)的概率會增大、保持原有較好狀態(tài)的概率會減小的實際情況,使HMM無法有效地模擬設備劣化過程并準確評估設備狀態(tài)。
為提高設備狀態(tài)評估的準確率,本文提出一個Age-dependent HMM,該模型通過引入劣化因子來克服傳統(tǒng)HMM的轉移概率為固定值而不能準確反映設備實際劣化過程的不足。同時,由于在HMM中引入了新因素,為合理構建改進的HMM,本文還開發(fā)了一個雙重EM算法來估計設備初始狀態(tài)轉移概率A0和δ,并基于所提出的改進HMM,通過最大后驗估計的方法來評估設備在各觀測時刻的健康狀態(tài)。最后的算例分析結果證明了本文所提模型的有效性和準確性,為完善現有設備狀態(tài)評估研究提供了一定的支持。
結合本文結果,下一步研究可針對EM算法對初值敏感的不足進行改進。另外,還將繼續(xù)探討劣化因子的其他設計方式,優(yōu)化Age-dependentHMM,使其更加滿足實際生產的需要。
參考文獻:
[1] DENG Chao, SUN Yaozong, LI Rong, et al. Hidden markov model based on the heavy-duty CNC health state estimate[J]. Computer Integrated Manufacturing Systems,2013,19(3):552-558(in Chinese).[鄧 超,孫耀宗,李 嶸,等.基于隱Markov模型的重型數控機床健康狀態(tài)評估[J].計算機集成制造系統(tǒng),2013,19(3):552-558.]
[2] XIA Lisha. Research on fault diagnosis and related algorithm based on hidden Markov model[D]. Wuhan:Huazhong University of Science and Technology,2014(in Chinese).[夏麗莎.復雜條件下基于HMM的故障診斷技術研究[D].武漢:華中科技大學,2014.]
[3] BUNKS C, MCCARTHY D, AI-ANI T. Condition-based maintenance of machines using hidden Markov models[J]. Mechanical Systems and Signal Processing,2000,14(4):597-612.
[4] ATLAS L, OSTENDOR M, BERNARD G D. Hidden Markov models for monitoring machine tool-wear[C]∥Proceedings of the IEEE International Conference on Acoustic, Speech, and Signal Processing.Washington,D.C.,USA:IEEE,2000:3887-3890.
[5] ERTUNC H M, LOPARO K A. A decision fusion algorithm for tool wear condition monitoring in drilling[J]. International Journal of Machine Tools and Manufacture,2001,41(9):1347-1362.
[6] DONG Ming, HE D. A segmental hidden semi-Markov model(HSMM)based diagnostics and prognostics framework and methodology[J]. Mechanical Systems and Signal Processing,2007,21(5):2248-2266.
[7] DONG Ming, HE D. Hidden semi-Markov model-based methodology for multi-sensor equipment health diagnosis and prognosis[J]. European Journal of Operational Research,2007,178(3):858-878.
[8] DONG Ming, PENG Ying. Equipment PHM using non-stationary segmental hidden semi-Markov model[J]. Robotics and Computer-Integrated Manufacturing,2011,27(3):581-590.
[9] WU X, LI Y, TENG W. Modified hidden semi-Markov models for motor wear prognosis[J]. ARCHIVE Proceedings of the Institution of Mechanical Engineers Part J Journal of Engineering Tribology,2015,226(2):174-179.
[10] ZHU Kunpeng, LIU Tongshun. On-line tool wear monitoring via hidden semi-Markov model with dependent durations[J]. IEEE Transactions on Industrial Informatics,2017,14(1):69-78.
[11] LIU Qinming, DONG Ming, LYU Wenyuan, et al. A novel method using adaptive hidden semi-Markov model for multi-sensor monitoring equipment health prognosis[J]. Mechanical Systems and Signal Processing,2015,64(12):217-232.
[12] GONG Xun, FENG Yixiong, TAN Jianrong, et al. Fault diagnosis based on spatial structure hidden Markov model[J]. Computer Integrated Manufacturing Systems,2012,18(1):132-139(in Chinese).[龔 勛,馮毅雄,譚建榮,等.基于空間結構隱Markov模型的故障診斷[J].計算機集成制造系統(tǒng),2012,18(1):132-139.]
[13] XIA Lisha, FANG Huajing, ZHANG Hui. HMM based modeling and health condition assessment for degradation process[C]//Proceedings of the 25th Chinese Control and Decision Conference. Washington, D.C., USA: IEEE,2013:2945-2948.
[14] LIAO Wenzhu , LI Dan , CUI Shihao. A heuristic optimization algorithm for HMM based on SA and EM in machinery diagnosis [J]. Journal of Intelligent Manufacturing, 2016:1-13. DOI: 10.1007/s10845-016-1222-1.
[15] LE T T, CHATELAIN F, BERENGUER C. Hidden Markov models for diagnostics and prognostics of systems under multiple deterioration modes [C]//Proceedings of Conference on European Safety and Reliability. Boca Raton, Fla., USA: Taylor & Francis-CRC Press/Balkema, 2014, 230(5): 473-484.
[16] YUWONO M, QIN Yong, ZHOU Jing, et al. Automatic bearing fault diagnosis using particle swarm clustering and Hidden Markov model[J]. Engineering Applications of Artificial Intelligence,2016,47(C):88-100.
[17] GAO Yinqiang, XIE Nan, HU Kai, et al. An optimized clustering approach using simulated annealing algorithm with HMM coordination for rolling elements bearings’ diagnosis[J]. Journal of Failure Analysis & Prevention,2017,17(3):1-18.
[18] LI Ling, CHENG Guoqing, LIU Bingxiang. Accelerated deterioration system model based on Gamma process and its optimal condition-based maintenance policy[J]. Computer Integrated Manufacturing Systems,2013,19(11):2922-2927(in Chinese).[李 玲,成國慶,柳炳祥.基于Gamma過程的加速劣化系統(tǒng)模型及其最優(yōu)視情維修策略[J].計算機集成制造系統(tǒng),2013,19(11):2922-2927.]
[19] PENG Ying, DONG Ming. A prognosis method using age-dependent hidden semi-Markov model for equipment health prediction[J]. Expert Systems with Applications,2011,38(10):12946-12953.
[20] PENG Ying. A prognosis method using age-dependent hidden semi-Markov model and a systematic maintenance policy[D]. Shanghai:Shanghai Jiao Tong University,2011(in Chinese).[彭 穎.基于退化隱式半馬爾科夫模型的設備健康預測及系統(tǒng)性維護策略研究[D].上海:上海交通大學,2011.]
[21] PENG Ying, DONG Ming. A hybrid approach of HMM and grey model for age-dependent health prediction of engineering assets[J]. Mechanical Systems and Signal Processing 2011, 25(1):237-252.
[22] ARGON C, WU G S. Real-time health prognosis and dynamic preventive maintenance policy for equipment under aging Markovian deterioration[J]. International Journal of Production Research,2007,45(15):3351-3379.
[23] WANG Mei, WANG Jie. CHMM for tool condition monitoring and remaining useful life prediction[J]. International Journal of Advanced Manufacturing Technology,2012,59(5/6/7/8):463-471.
[24] SIOHAN O, CHESTA C, LEE C H. Joint maximum a posteriori adaptation of transformation and HMM parameters[J]. IEEE Transaction on Speech and Audio Processing, 2001, 9(4):417-428.
[25] LIAO Wenzhu. Research of predictive maintenance policy and integrated production scheduling model based on machine degradation[D].Shanghai:Shanghai Jiao Tong University,2011(in Chinese).[廖雯竹.基于設備衰退機制的預知性維護策略及生產排程集成研究[D]. 上海:上海交通大學, 2011.]
[26] GILLES C, JEAN B D. Selecting hidden Markov model state number with cross-validated likelihood[J]. Computational Statistics,2008,23(4):541- 564.
[27] WELCH, LIOYD R. Hidden Markov models and the baum-welch algorithm[J]. IEEE Information Theory Society Newsletter,2003,53(2):194-211.