陳建華,陳世和
(華潤電力技術研究院有限公司,廣東深圳 518001)
RCM(Reliability Centered Maintenance,以可靠性為中心的維修),在世界范圍內的工業(yè)企業(yè)維修領域發(fā)揮著非常重要的作用,通過RCM 技術分析與成果應用,能夠提高設備可靠性和可用率,降低運行和維修成本[1]。它的特點在于提供了一種系統(tǒng)框架,通過對電廠各系統(tǒng)功能和失效后果進行分析(Failure Mode and Effect Analysis,F(xiàn)MEA),針對故障后果較為嚴重的設備,增加預防性維修和點巡檢工作[2]。這種方法雖可降低設備故障風險,但對于發(fā)生頻率極低的故障存在嚴重的過修,導致檢修資源投入不合理等現(xiàn)象。提出一種構建風險矩陣的方法,通過威布爾分布[3]擬合獲取設備故障模式分布規(guī)律,采用蒙特卡洛法[4]模擬某種維修策略執(zhí)行后對故障風險的影響,從而達到優(yōu)化維修策略的目的,避免了傳統(tǒng)設備維修管理中的過修或欠修問題。
以設備故障的平均故障間隔時間、設備故障表現(xiàn)特征等級和預設風險維度的影響等級為指標,創(chuàng)建預設風險維度下的風險矩陣。考慮到對于不同的設備故障,其發(fā)生的可能性或頻率可能并不相同,為了解各故障模式的風險情況,進而制定相應的維修策略,可利用設備故障的平均故障間隔時間(Mean Time Between Failure,MTBF)來表示該設備故障發(fā)生的可能性或發(fā)生頻率,該平均故障間隔時間可根據實際的需求進行不同的時段劃分。以一設備故障為例,其平均故障間隔時間劃分方法見表1。
表1 平均故障間隔時間劃分方法
對于設備故障的平均故障間隔時間的劃分時段等級以及每一等級的時段時長不應限于上述表中的劃分,用戶可以根據實際需求對該平均故障間隔時間的等級劃分進行相應調整,以使得到各故障模式的風險情況更加符合對應設備的實際發(fā)生故障的可能性。
設備故障模式表現(xiàn)特征等級維度包括但不限于設備優(yōu)(A)、良(B)、中(C)、差(D)等。通過對設備不同故障模式表現(xiàn)特征等級的劃分可以判定設備當前狀態(tài)等級,見表2。故障模式表現(xiàn)特征等級劃分是評價設備隱性故障發(fā)展狀態(tài)的一種方法,利用設備狀態(tài)的實時監(jiān)測參數(shù),提取能直觀反映某種設備故障的特征,如指標參數(shù)的變化率、峰度、方差等統(tǒng)計特征值,并根據歷史故障特征的發(fā)展情況確定出等級劃分的標準。
表2 設備故障模式表現(xiàn)特征等級劃分方法
預設風險維度包括人員傷害維度、經濟損壞維度、供熱影響維度、環(huán)境影響維度或聲譽影響維度等。通過在不同的風險維度下對發(fā)生的設備故障所產生的后果進行后果評估,獲取該故障對應的影響等級[5]。以某公司的企業(yè)標準制定的經濟損壞維度為例,將故障產生的影響后果劃分成不同的影響等級,見表3??紤]到劃分的合理性,對于不同的風險維度下的影響程度,其具體等級的劃分可參考企業(yè)標準或相關行業(yè)標準來進行合理劃分,而經濟損壞維度的影響等級劃分也不應限于表中的劃分。
表3 故障影響等級劃分方法
根據平均故障間隔時間、設備故障表現(xiàn)特征等級和預設風險維度的影響等級,將風險矩陣劃分成不同的風險等級區(qū),利用這3個指標可建立對應的三維風險矩陣。以上述3 個表的劃分為例,可得到經濟損失維度下的風險矩陣。利用故障模式不同的MTBF等級、表現(xiàn)特征等級和不同的影響等級可將該風險矩陣劃分為不同的風險等級區(qū)。不同的風險等級區(qū)可分為4 個等級,分別是低風險區(qū)、中風險區(qū)、高風險區(qū)和嚴重高風險區(qū)[6]。該風險等級區(qū)的劃分可根據實際情況進行其他劃分,例如,可劃分為3 個等級,如低風險區(qū)、中風險區(qū)和高風險區(qū),又或者可劃分為5 個等級等。
在建立好該風險矩陣后,可利用設備的歷史故障數(shù)據來得到各故障模式的平均故障間隔時間、設備故障表現(xiàn)特征和對該故障模式在對應的風險維度下的影響程度來確定其影響等級,然后根據這3 個值將該故障模式填入該風險矩陣中的對應位置。通過確定該故障模式的分布,可直觀了解該故障模式的風險情況,例如,當某一故障模式分布在嚴重高風險區(qū)時,可知該故障模式對應的設備故障的發(fā)生是不被允許的。因此,為降低該故障模式再次發(fā)生的可能性,可針對性地制定其對應的維修策略,如進行預防性維修或增加該故障模式的檢修頻率等。維修策略包括檢修周期、維修類型等。
該維修策略制定方法還包括,將具有相同的所述預設風險維度下的影響等級,且獲取的所述平均故障間隔時間屬于同一平均故障間隔時間時段的多個故障模式,在所述風險矩陣中的同一位置進行匯總展示,如圖1 所示。利用在該風險矩陣中把所有出現(xiàn)過的故障模式在當前時段的風險情況進行匯總展示,可直觀了解到該設備的整體風險情況等。而利用各故障模式在風險矩陣中的不同分布,還可直觀地確定各故障模式的風險排序,然后根據不同的風險排序可采用不同的維修策略。
圖1 經濟損失維度下的風險矩陣
若某一故障模式分布在預設高風險區(qū),則可增加該故障模式的檢修頻率,以降低該故障模式的平均故障間隔時間,從而使該故障模式向低風險區(qū)移動,達到降低設備風險的目的;若某一故障模式分布在預設低風險區(qū),則可降低該故障模式的檢修頻率,以降低檢修成本等。當然,若降低其檢修頻率后,該故障模式的平均故障間隔時間明顯增大而不再分布在該預設低風險區(qū)時,則還需要再次調整其檢修頻率等,以保證該故障模式仍分布在該預設低風險區(qū),從而獲得設備安全性與維修經濟性的平衡。
本方案中,還可利用該風險矩陣來評價各故障模式的已有維修策略是否合理等。而對于一些存在過修或欠修的情況,可根據該故障模式在該風險矩陣中的持續(xù)分布情況來判斷,進而針對性地調整該故障模式對應的維修策略。
電力市場環(huán)境下的發(fā)電設備可靠性研究,將打破傳統(tǒng)的計劃檢修模式[7]。數(shù)據挖掘技術是發(fā)電設備可靠性管理走向實時化、智能化和預測化的有力工具。本文提出的風險矩陣評估法通過對歷史檢修數(shù)據的挖掘獲取設備故障分布規(guī)律并模擬出檢修策略執(zhí)行后的故障分布,直觀地展示出檢修前后設備風險的變化,該方法克服了國內缺乏RCM 實施效果的評估準則和實施指南的難題[8],可有效解決現(xiàn)有技術中存在過修或維修投入不合理等問題。