譙 兵,胡 斌
(1.北京經(jīng)緯信息技術(shù)有限公司,北京 100081;2.北京新聯(lián)鐵集團(tuán)股份有限公司,北京 100034)
隨著信息化的發(fā)展,設(shè)備健康管理(EHM,Equipment Health Management)已經(jīng)成為當(dāng)今時代的潮流,通過整合設(shè)備管理規(guī)章制度和業(yè)務(wù)流程,緊密結(jié)合狀態(tài)監(jiān)測、維修、使用和環(huán)境等信息,對涉及設(shè)備健康的因素進(jìn)行全過程控制,對維修活動進(jìn)行計劃和優(yōu)化[1]。EHM使得設(shè)備在實際工作時保持更好的工作狀態(tài),在降低維修成本的同時提高工作效率,因此越來越受到各類相關(guān)企業(yè)的重視。
前人在該領(lǐng)域做了很多嘗試,例如,故障預(yù)測與健康管理(PHM,Prognostics and health management)[2]技術(shù)最早是美國等國家針對復(fù)雜軍事裝備研究的健康管理方案;廖可通過數(shù)據(jù)分析排查機(jī)務(wù)設(shè)備規(guī)律性故障[3];李航等人針對航空發(fā)電機(jī)的健康管理,提出了基于航空發(fā)電機(jī)參數(shù)設(shè)計航空發(fā)電機(jī)健康預(yù)測模型的方法[4];周奇才等人針對機(jī)械設(shè)備的健康管理,提出了基于深度學(xué)習(xí)方法的預(yù)測模型[5];針對選煤設(shè)備的健康管理,胡煒等人提出了基于設(shè)備狀態(tài)的持續(xù)監(jiān)測和監(jiān)測數(shù)據(jù)的分析方法[6]。
在前人的研究基礎(chǔ)上,針對鐵路機(jī)務(wù)設(shè)備的健康管理,本文設(shè)計并實現(xiàn)了基于EHM理念的鐵路機(jī)務(wù)設(shè)備大數(shù)據(jù)健康管理系統(tǒng)。本系統(tǒng)通過自回歸(AR,Autoregressive)模型和支持向量機(jī)(SVM,Support Vector Machine)模型對鐵路機(jī)務(wù)設(shè)備進(jìn)行健康趨勢預(yù)測和故障預(yù)測,結(jié)合鐵路機(jī)務(wù)設(shè)備工作人員的實際工作經(jīng)驗和數(shù)據(jù)源分析結(jié)果,制定了鐵路機(jī)務(wù)設(shè)備風(fēng)險評估等級。
基于EHM理念的鐵路機(jī)務(wù)設(shè)備大數(shù)據(jù)健康管理系統(tǒng)的架構(gòu)設(shè)計如圖1所示。
圖1 系統(tǒng)架構(gòu)圖
(1)數(shù)據(jù)源
系統(tǒng)的數(shù)據(jù)源由鐵路機(jī)務(wù)設(shè)備的歷史運行數(shù)據(jù)、維修數(shù)據(jù)和實時監(jiān)測數(shù)據(jù)構(gòu)成。
鐵路機(jī)務(wù)設(shè)備的歷史運行數(shù)據(jù)是設(shè)備既有的監(jiān)測數(shù)據(jù),包括機(jī)務(wù)設(shè)備的初始各項指標(biāo)值、工作時長、工作次數(shù)、工作環(huán)境以及每次工作的各項指標(biāo)等;維修數(shù)據(jù)是設(shè)備在損壞時的維修記錄,包括損壞時間、損壞情況、維修方式、維修地點、維修費用等;實時監(jiān)測數(shù)據(jù)是設(shè)備運行情況下各項指標(biāo)要素的實時記錄,系統(tǒng)每隔一段時間就會將前一階段的實時記錄轉(zhuǎn)移到鐵路機(jī)務(wù)設(shè)備的歷史運行數(shù)據(jù)庫中。
(2)數(shù)據(jù)傳輸
系統(tǒng)的數(shù)據(jù)傳輸需要在滿足文件傳輸協(xié)議(FTP)的前提下,通過企業(yè)服務(wù)總線(ESB)和數(shù)據(jù)網(wǎng)關(guān)將數(shù)據(jù)存儲系統(tǒng)中的源數(shù)據(jù)抽取、轉(zhuǎn)置、加載到系統(tǒng)中。
(3)數(shù)據(jù)處理
將源數(shù)據(jù)加載到系統(tǒng)中后,系統(tǒng)會自動對源數(shù)據(jù)進(jìn)行解析、去重、篩選、清洗、合并、分類、轉(zhuǎn)換等數(shù)據(jù)預(yù)處理,使源數(shù)據(jù)標(biāo)準(zhǔn)化。
(4)數(shù)據(jù)存儲
經(jīng)過預(yù)處理之后,大部分?jǐn)?shù)據(jù)通過Hadoop架構(gòu)實現(xiàn)分布式存儲,小部分的常用數(shù)據(jù)通過本地的MySQL數(shù)據(jù)庫進(jìn)行存儲。
(5)數(shù)據(jù)分析
系統(tǒng)通過層次分析法,AR、SVM等數(shù)據(jù)分析模型對經(jīng)過預(yù)處理的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,進(jìn)而支撐系統(tǒng)的各項功能[7]。
結(jié)合鐵路機(jī)務(wù)EHM的實際需求,本系統(tǒng)設(shè)計的主要功能包括設(shè)備實時監(jiān)控、設(shè)備趨勢分析、設(shè)備故障預(yù)測和風(fēng)險等級評估。
1.2.1 設(shè)備實時監(jiān)控
鐵路機(jī)務(wù)設(shè)備運行狀態(tài)實時監(jiān)控功能用于對鐵路機(jī)務(wù)設(shè)備的健康進(jìn)行實時監(jiān)控[8],使工作人員及時了解設(shè)備工作狀態(tài),提高鐵路機(jī)務(wù)設(shè)備的可靠性[9]。
(1)設(shè)備位置監(jiān)控
設(shè)備在工作中經(jīng)常根據(jù)需要進(jìn)行位置改動,涉及到設(shè)備的安裝、調(diào)試、退役以及變更等。系統(tǒng)基于采集到的地理結(jié)構(gòu)定位數(shù)據(jù)對設(shè)備進(jìn)行跟蹤管理,在此基礎(chǔ)上,可支持顯示建筑物、車間等位置類別及其實際位置,未來可直接結(jié)合GIS,實現(xiàn)圖形化篩選定位功能。
(2)設(shè)備狀態(tài)信息監(jiān)控
對設(shè)備的使用狀態(tài)進(jìn)行實時查詢,包括設(shè)備的新增、在用、檢修、報廢、閑置等設(shè)備狀態(tài)標(biāo)志的設(shè)置和變更,如果設(shè)備處于在用狀態(tài),可實時監(jiān)控不同設(shè)備的各項參數(shù)、指標(biāo)等狀態(tài)信息。使得相關(guān)人員通過手機(jī)、PC機(jī)、調(diào)度大屏等實時掌握生產(chǎn)中設(shè)備運行情況。
1.2.2 設(shè)備趨勢分析
(1)設(shè)備效率趨勢分析
系統(tǒng)通過與設(shè)備控制系統(tǒng)集成,實時采集各生產(chǎn)設(shè)備的開動狀態(tài)、運行狀態(tài),對設(shè)備運行狀況進(jìn)行集中監(jiān)控。系統(tǒng)采集設(shè)備開停機(jī)時間、設(shè)備作業(yè)量、設(shè)備故障時間等,自動生成全局設(shè)備效率(OEE,Overall Equipment Effectiveness),并提供設(shè)備的實時OEE趨勢,便于工作人員及時發(fā)現(xiàn)影響生產(chǎn)效率的因素。
(2)設(shè)備健康趨勢分析
該功能對鐵路機(jī)務(wù)設(shè)備未來一段時間內(nèi)的健康趨勢進(jìn)行分析預(yù)測。系統(tǒng)采集設(shè)備開停機(jī)時間、設(shè)備作業(yè)量、設(shè)備使用率、設(shè)備異常率等關(guān)檢指標(biāo),進(jìn)行綜合數(shù)據(jù)分析,實現(xiàn)設(shè)備健康趨勢的分析。
1.2.3 設(shè)備故障預(yù)測
(1)設(shè)備性能預(yù)測
不同設(shè)備的使用環(huán)境、偶發(fā)因素、使用場景各不相同,很難對設(shè)備或其部件進(jìn)行壽命預(yù)測,系統(tǒng)根據(jù)歷史數(shù)據(jù)進(jìn)行趨勢預(yù)測和關(guān)鍵指標(biāo)跟蹤,并通過基于原始數(shù)據(jù)的分類、聚類、異常點識別、關(guān)聯(lián)性分析等多種算法實現(xiàn)趨勢研判和異常點追蹤,和智能化的性能指標(biāo)閾值設(shè)置,當(dāng)性能指標(biāo)超出預(yù)警值,系統(tǒng)可自動進(jìn)行報警。
(2)設(shè)備故障預(yù)測
該功能用于對鐵路機(jī)務(wù)設(shè)備未來一段時間內(nèi)是否會發(fā)生故障進(jìn)行預(yù)測分析。故障預(yù)測可綜合利用上述各部分的數(shù)據(jù)信息,評估和預(yù)測被監(jiān)測設(shè)備未來發(fā)生故障的可能性,并做出判斷、建議和決策。工作人員根據(jù)系統(tǒng)提示,采取相應(yīng)的措施,在部件發(fā)生故障之前選擇適宜時機(jī)進(jìn)行維修。
1.2.4 風(fēng)險等級評估
(1)故障風(fēng)險等級評估
通過設(shè)備實時狀態(tài)信息推算設(shè)備故障率,以設(shè)備自身資產(chǎn)和資產(chǎn)損失度衡量經(jīng)濟(jì)性,綜合考慮設(shè)備故障率及設(shè)備退出運行對生產(chǎn)的經(jīng)濟(jì)性、安全性的影響,對設(shè)備故障風(fēng)險進(jìn)行評估
(2)安全風(fēng)險等級評估
實現(xiàn)在生產(chǎn)及維修過程中對安全風(fēng)險的預(yù)警功能,向工作人員發(fā)出相應(yīng)的預(yù)警提示,風(fēng)險等級分為一般風(fēng)險、低級風(fēng)險、中級風(fēng)險、高級風(fēng)險。
基于EHM理念的鐵路機(jī)務(wù)設(shè)備大數(shù)據(jù)健康管理系統(tǒng)在Windows 10操作系統(tǒng)環(huán)境下,利用python 3.5和pycharm 2018兩種工具構(gòu)建鐵路機(jī)務(wù)設(shè)備健康評測模型、健康趨勢預(yù)測模型和故障預(yù)測模型,進(jìn)而支撐系統(tǒng)的各個功能模塊,實現(xiàn)對鐵路機(jī)務(wù)設(shè)備的大數(shù)據(jù)健康管理。
鐵路機(jī)務(wù)設(shè)備健康評測值是對鐵路機(jī)務(wù)設(shè)備當(dāng)前工作狀態(tài)的一種認(rèn)知。鐵路機(jī)務(wù)設(shè)備的運行歷史數(shù)據(jù)、維修數(shù)據(jù)和實時監(jiān)測數(shù)據(jù)對設(shè)備健康評測模型的構(gòu)建至關(guān)重要[10]。在構(gòu)建健康評測模型時,必須要確定設(shè)備各個指標(biāo)要素的權(quán)重。層次分析法能夠把與決策有關(guān)的元素分解成目標(biāo)、準(zhǔn)則、方案等層次,進(jìn)行定性和定量分析,適用于鐵路機(jī)務(wù)設(shè)備各個指標(biāo)要素的權(quán)重確定[11]。
鐵路機(jī)務(wù)設(shè)備健康評測模型的構(gòu)建分3個部分。
(1)基于鐵路機(jī)務(wù)設(shè)備的運行歷史數(shù)據(jù)、維修數(shù)據(jù)和實時監(jiān)測數(shù)據(jù)構(gòu)建鐵路機(jī)務(wù)設(shè)備的健康評估體系,如圖2所示。
圖2 鐵路機(jī)務(wù)設(shè)備健康評估體系圖
(2)結(jié)合鐵路機(jī)務(wù)設(shè)備相關(guān)專家的意見確定每個指標(biāo)要素的健康得分,滿分為10分。通過層次分析法對鐵路機(jī)務(wù)設(shè)備各個指標(biāo)要素之間的關(guān)系進(jìn)行分析并確定其各自的權(quán)重,將定性問題定量化,達(dá)到歸一化處理的目的[12]。
(3)通過把機(jī)務(wù)設(shè)備實時監(jiān)測的各個指標(biāo)要素的值代入定量化分析的鐵路機(jī)務(wù)設(shè)備健康值評測體系,如式(1)所示,對該鐵路機(jī)務(wù)設(shè)備進(jìn)行健康值評測,從而對該鐵路機(jī)務(wù)設(shè)備的當(dāng)前健康狀況有所認(rèn)知。
其中,H表示鐵路機(jī)務(wù)設(shè)備的當(dāng)前健康評測值;Vi表示鐵路機(jī)務(wù)設(shè)備第i個指標(biāo)要素的監(jiān)測值;Mi表示鐵路機(jī)務(wù)設(shè)備第i個指標(biāo)要素的閾值中位數(shù);Li表示鐵路機(jī)務(wù)設(shè)備第i個指標(biāo)要素的閾值長度;ωi表示鐵路機(jī)務(wù)設(shè)備第i個指標(biāo)要素的權(quán)重;i=1,…,10。
鐵路機(jī)務(wù)設(shè)備的健康值與設(shè)備的歷史狀態(tài)關(guān)系緊密,受其它因素影響較小。AR模型是統(tǒng)計領(lǐng)域一種處理時間序列的方法,通過結(jié)合同一變量之前各期的表現(xiàn)記錄,來預(yù)測本期的表現(xiàn)情況,適用于鐵路機(jī)務(wù)設(shè)備健康趨勢預(yù)測[13]。AR模型原理如式(2)所示[14]。
其中,t為某一時刻;X為t時刻的電壓數(shù)據(jù);c為設(shè)備電壓修正值常量;p和l代表設(shè)備電壓取值范圍的上界和下界;φi為t時刻的電壓數(shù)據(jù)是否適用于式(2)的權(quán)重值;t-i為歷史某一時刻電壓數(shù)據(jù);εt為隨機(jī)誤差值。
將鐵路機(jī)務(wù)設(shè)備指標(biāo)要素歷史監(jiān)測數(shù)據(jù)分為訓(xùn)練集和測試集,對訓(xùn)練集進(jìn)行AR模型訓(xùn)練,得到健康趨勢預(yù)測模型。該模型對測試集進(jìn)行測試的結(jié)果如圖3所示,其中,原始數(shù)值代表測試集的實際健康值,評估和預(yù)測是通過健康趨勢預(yù)測AR模型得到的測試集健康預(yù)測值。對比健康趨勢預(yù)測模型預(yù)測結(jié)果與測試集實際健康值,預(yù)測結(jié)果準(zhǔn)確率約為96.2%。
圖3 基于AR模型的鐵路機(jī)務(wù)設(shè)備健康趨勢預(yù)測圖
鐵路機(jī)務(wù)設(shè)備狀態(tài)分為正常和故障2種,屬于二分類問題。而SVM是一種按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器[15],適合處理設(shè)備狀態(tài)判斷問題。本系統(tǒng)通過使用SVM對各種鐵路機(jī)務(wù)設(shè)備故障維修數(shù)據(jù)進(jìn)行分析、訓(xùn)練得到設(shè)備故障預(yù)測模型,通過該模型進(jìn)行故障預(yù)測[16]。
當(dāng)模型獲取到如圖4所示的數(shù)據(jù)時,可在圖例中根據(jù)第一列標(biāo)簽標(biāo)示出數(shù)據(jù)的有效性進(jìn)行判斷處理,例如,當(dāng)?shù)谝涣袛?shù)據(jù)為+1時數(shù)據(jù)有效,為-1時則數(shù)據(jù)無效。
圖4 鐵路機(jī)務(wù)設(shè)備部分故障維修訓(xùn)練數(shù)據(jù)處理界面
將通過故障預(yù)測模型得到的故障預(yù)測結(jié)果與鐵路機(jī)務(wù)設(shè)備故障實際情況進(jìn)行對比,得出預(yù)測的成功率為99.08%,如圖5所示。
圖5 鐵路機(jī)務(wù)設(shè)備故障預(yù)測界面
本系統(tǒng)結(jié)合鐵路機(jī)務(wù)設(shè)備工作人員的實際工作經(jīng)驗和數(shù)據(jù)源分析結(jié)果,為鐵路機(jī)務(wù)設(shè)備設(shè)定了如圖6所示的風(fēng)險等級評估系數(shù)。
圖6 鐵路機(jī)務(wù)設(shè)備健康風(fēng)險預(yù)警等級示意圖
系統(tǒng)會根據(jù)設(shè)備健康值分?jǐn)?shù)所處的風(fēng)險評估等級,向工作人員發(fā)出不同級別的風(fēng)險評估預(yù)警,方便工作人員及時采取應(yīng)對措施,保證鐵路機(jī)務(wù)設(shè)備維護(hù)的工作效率[17]。
基于EHM理念的鐵路機(jī)務(wù)設(shè)備大數(shù)據(jù)健康管理系統(tǒng)將前沿的信息化技術(shù)融入鐵路機(jī)務(wù)設(shè)備的實際工作中,實現(xiàn)了對鐵路機(jī)務(wù)設(shè)備的健康管理,提高了鐵路機(jī)務(wù)設(shè)備的整體管理水平,保證了工作質(zhì)量,為前沿信息化技術(shù)的普及發(fā)揮了示范作用[18]。然而,EHM的關(guān)鍵技術(shù)現(xiàn)在還不夠成熟,本文中的健康趨勢預(yù)測和故障預(yù)測模型都只采用了一種關(guān)鍵技術(shù)。下一步準(zhǔn)備在這2個功能上采用混合方法,使得健康趨勢預(yù)測模型和故障預(yù)測模型更加完善,進(jìn)一步提高預(yù)測準(zhǔn)確率。