楊 晨
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京100081)
故障管理是動(dòng)車(chē)組運(yùn)維檢修的重要環(huán)節(jié),隨著動(dòng)車(chē)組數(shù)量的不斷增加,如何對(duì)故障數(shù)據(jù)進(jìn)行有效運(yùn)用,描述動(dòng)車(chē)組及其部件的安全規(guī)律和服役狀態(tài)已成為重要的研究課題。同時(shí),動(dòng)車(chē)組健康管理、動(dòng)車(chē)組修程修制優(yōu)化和動(dòng)車(chē)組數(shù)字化精準(zhǔn)維修等業(yè)務(wù)的開(kāi)展,要求故障管理系統(tǒng)能夠快速、準(zhǔn)確、及時(shí)地完成故障發(fā)生時(shí)相關(guān)信息的采集、處理和傳遞,全面提高故障分析水平[1]。
目前,運(yùn)行于鐵路單位的故障管理系統(tǒng)包括動(dòng)車(chē)組管理信息系統(tǒng)(EMIS,EMU Management Information System)、動(dòng)車(chē)組車(chē)載信息無(wú)線(xiàn)傳輸系統(tǒng)(WTDS,Wireless Transmit Device System)、動(dòng)車(chē)組運(yùn)行故障動(dòng)態(tài)圖像檢測(cè)系統(tǒng)(TEDS,Trouble of moving EMU Detection System)、動(dòng)車(chē)組滾動(dòng)軸承故障軌邊聲學(xué)診斷系統(tǒng)(TADS,Trackside Acoustic Detection System)及各單位自建的故障管理系統(tǒng)等[2-5]。其中,EMIS已基本實(shí)現(xiàn)了對(duì)多源故障的匯集,并對(duì)故障進(jìn)行了有效地閉環(huán)管理,但其更側(cè)重于對(duì)故障處理結(jié)果的記錄,并未對(duì)故障相關(guān)數(shù)據(jù)進(jìn)行全面運(yùn)用,也無(wú)法對(duì)動(dòng)車(chē)組及其部件的安全規(guī)律分析提供行之有效的決策支持。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,尤其是大數(shù)據(jù)、人工智能和機(jī)器學(xué)習(xí)方面的發(fā)展,為積累的歷史故障數(shù)據(jù)帶來(lái)了新的利用價(jià)值[6-7]。可利用數(shù)據(jù)挖掘和分析技術(shù),為動(dòng)車(chē)組健康管理及動(dòng)車(chē)組修程修制優(yōu)化提
供切實(shí)可行的實(shí)施方向?;诖?,本文依托動(dòng)車(chē)組安全大數(shù)據(jù)平臺(tái),以動(dòng)車(chē)組故障管理為核心,對(duì)動(dòng)車(chē)組運(yùn)用檢修相關(guān)數(shù)據(jù)進(jìn)行采集和存儲(chǔ),設(shè)計(jì)了動(dòng)車(chē)組安全規(guī)律分析系統(tǒng)的架構(gòu)和功能,提出了系統(tǒng)中采用的關(guān)鍵技術(shù)。系統(tǒng)的建設(shè)可以為動(dòng)車(chē)組運(yùn)維管理人員提供有效的管理工具和輔助決策支持。
本文從動(dòng)車(chē)組海量運(yùn)用、監(jiān)測(cè)及故障數(shù)據(jù)出發(fā),研究多源數(shù)據(jù)的傳輸、存儲(chǔ)、處理和分析技術(shù)。通過(guò)動(dòng)車(chē)組安全規(guī)律分析系統(tǒng)的建設(shè),準(zhǔn)確地描述動(dòng)車(chē)組運(yùn)行過(guò)程中各種因素對(duì)動(dòng)車(chē)組及其部件的失效規(guī)律和服役狀態(tài)的影響,輔助動(dòng)車(chē)組的運(yùn)行、維護(hù)和費(fèi)用控制等決策的制定,提高動(dòng)車(chē)組數(shù)字化精準(zhǔn)維修水平,促進(jìn)動(dòng)車(chē)組設(shè)計(jì)、制造和維修技術(shù)的改進(jìn)。
動(dòng)車(chē)組安全規(guī)律分析系統(tǒng)依托動(dòng)車(chē)組安全大數(shù)據(jù)平臺(tái),系統(tǒng)整體架構(gòu)分為數(shù)據(jù)源、平臺(tái)層、應(yīng)用層和用戶(hù)層,如圖1所示。
圖1 系統(tǒng)總體架構(gòu)
(1)數(shù)據(jù)源:負(fù)責(zé)提供動(dòng)車(chē)組及其部件的故障信息。
(2)平臺(tái)層:主要完成對(duì)數(shù)據(jù)源產(chǎn)生的動(dòng)車(chē)組故障、動(dòng)態(tài)履歷、線(xiàn)路工務(wù)和檢測(cè)監(jiān)測(cè)等數(shù)據(jù)進(jìn)行自動(dòng)抽取、存儲(chǔ)和匯集,并利用大數(shù)據(jù)技術(shù)提供的即時(shí)檢索服務(wù)、實(shí)時(shí)數(shù)據(jù)分發(fā)和共享服務(wù),提升跨業(yè)務(wù)領(lǐng)域的數(shù)據(jù)挖掘能力,對(duì)海量的故障相關(guān)數(shù)據(jù)開(kāi)展分析,為系統(tǒng)應(yīng)用提供數(shù)據(jù)支持。
(3)應(yīng)用層:對(duì)相關(guān)數(shù)據(jù)進(jìn)行分析,為用戶(hù)層提供動(dòng)車(chē)組安全規(guī)律,發(fā)現(xiàn)動(dòng)車(chē)組運(yùn)行中的薄弱環(huán)節(jié)。
(4)用戶(hù)層:通過(guò)動(dòng)車(chē)組安全規(guī)律指導(dǎo)動(dòng)車(chē)組安全生產(chǎn),提高動(dòng)車(chē)組故障分析能力和安全管理水平。
系統(tǒng)綜合利用分布式存儲(chǔ)、分布式計(jì)算、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘等技術(shù),滿(mǎn)足多用戶(hù)、高并發(fā)和高可用的需求,集“易用性、伸縮性、開(kāi)放性”于一體,同時(shí),采用統(tǒng)一的應(yīng)用開(kāi)發(fā)框架,定義標(biāo)準(zhǔn)的軟件開(kāi)發(fā)測(cè)試規(guī)范、安全管理規(guī)范和運(yùn)維規(guī)范,實(shí)現(xiàn)基于云化、分布式和服務(wù)化的技術(shù)架構(gòu),如圖2所示。
圖2 系統(tǒng)技術(shù)架構(gòu)
系統(tǒng)技術(shù)架構(gòu)自底向上劃分為基礎(chǔ)設(shè)施層、平臺(tái)層、接口層和前端展示層。
1.3.1基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層通過(guò)虛擬化資源池,對(duì)基礎(chǔ)計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源進(jìn)行池化和虛擬化,為上層應(yīng)用與服務(wù)提供統(tǒng)一硬件資源調(diào)度和監(jiān)控管理,支持按需分配與彈性擴(kuò)展,并通過(guò)標(biāo)準(zhǔn)化接口向上層提供計(jì)算、存儲(chǔ)等基礎(chǔ)服務(wù),提高信息技術(shù)(IT,Information Technology)資源的易用性、敏捷性。通過(guò)服務(wù)器集群,實(shí)現(xiàn)海量數(shù)據(jù)的存儲(chǔ)與計(jì)算,緩解資源壓力,提升服務(wù)器整體性能。通過(guò)高穩(wěn)定、高帶寬的網(wǎng)絡(luò)鏈路,實(shí)現(xiàn)網(wǎng)絡(luò)資源的高吞吐、高可用、低延時(shí)。
1.3.2平臺(tái)層
(1)數(shù)據(jù)平臺(tái)層面向數(shù)據(jù)處理關(guān)鍵技術(shù),通過(guò)數(shù)據(jù)采集工具、分布式消息隊(duì)列、分布式文件系統(tǒng)、資源調(diào)度和平臺(tái)管理工具等多種手段,實(shí)現(xiàn)數(shù)據(jù)采集、數(shù)據(jù)抽取、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)分析挖掘;通過(guò)分布式協(xié)調(diào)調(diào)度服務(wù)實(shí)現(xiàn)數(shù)據(jù)平臺(tái)的高效、穩(wěn)定運(yùn)行;通過(guò)可視化管理界面,為數(shù)據(jù)平臺(tái)核心組件及整體環(huán)境提供性能展示、配置和預(yù)警功能。
(2)集成平臺(tái)層通過(guò)關(guān)系型數(shù)據(jù)庫(kù)、內(nèi)存數(shù)據(jù)庫(kù)、安全認(rèn)證及報(bào)表組件等,提供服務(wù)運(yùn)行環(huán)境與模型管理,實(shí)現(xiàn)中間件服務(wù),面向應(yīng)用開(kāi)發(fā),提供安全可靠的平臺(tái)支撐。通過(guò)基于內(nèi)存鍵值對(duì)的分布式內(nèi)存數(shù)據(jù)庫(kù)查詢(xún)方法,實(shí)現(xiàn)對(duì)大規(guī)模并發(fā)、高速數(shù)據(jù)訪(fǎng)問(wèn)計(jì)算、實(shí)時(shí)數(shù)據(jù)處理等方面的高性能快速響應(yīng);通過(guò)身份認(rèn)證確認(rèn)操作者身份和資源訪(fǎng)問(wèn)權(quán)限;采用不同的數(shù)據(jù)加密策略實(shí)現(xiàn)數(shù)據(jù)安全保障;通過(guò)報(bào)表組件實(shí)現(xiàn)動(dòng)車(chē)組故障統(tǒng)計(jì)分析功能。
1.3.3服務(wù)層
服務(wù)層通過(guò)統(tǒng)一認(rèn)證、統(tǒng)一接口服務(wù)及數(shù)據(jù)集成服務(wù)等,實(shí)現(xiàn)前端應(yīng)用的服務(wù)集成。通過(guò)統(tǒng)一認(rèn)證為用戶(hù)提供不同強(qiáng)度的安全認(rèn)證手段和單點(diǎn)登錄門(mén)戶(hù);通過(guò)統(tǒng)一接口服務(wù)實(shí)現(xiàn)負(fù)載均衡、緩存、日志、限流限額功能;通過(guò)數(shù)據(jù)集成服務(wù)對(duì)外提供標(biāo)準(zhǔn)、統(tǒng)一、規(guī)范的業(yè)務(wù)接口,實(shí)現(xiàn)應(yīng)用功能。
1.3.4前端展示層
前端采用基于HTML、CSS和JavaScript的Bootstrap框架,提供HTML與CSS規(guī)范,結(jié)合各類(lèi)前端JS控件、報(bào)表控件,實(shí)現(xiàn)Web前端的簡(jiǎn)潔、快速、高效開(kāi)發(fā),面向用戶(hù)實(shí)際需要,提供可視化分析結(jié)果。
(1)動(dòng)車(chē)組總體安全規(guī)律分析
以動(dòng)車(chē)組運(yùn)行故障數(shù)據(jù)為主,根據(jù)車(chē)型(批次)、走行公里、配屬、檢修歷史、故障發(fā)生時(shí)車(chē)組的高級(jí)修程、輪次、交路和區(qū)段等多個(gè)維度,建立不同維度動(dòng)車(chē)組安全規(guī)律演化模型,對(duì)不同車(chē)型(批次)及系統(tǒng)進(jìn)行基礎(chǔ)性安全規(guī)律分析。
(2)動(dòng)車(chē)組慣性故障分析
慣性故障指動(dòng)車(chē)組經(jīng)常性發(fā)生的故障,慣性故障的分析能夠發(fā)現(xiàn)故障頻發(fā)事件,通過(guò)更深入的分析,幫助查找設(shè)計(jì)、運(yùn)用檢修過(guò)程中的缺陷和問(wèn)題,有利于動(dòng)車(chē)組技術(shù)的不斷優(yōu)化迭代。不同車(chē)型慣性故障字典不完全相同,但有“血緣關(guān)系”的動(dòng)車(chē)組故障字典高度相似,針對(duì)動(dòng)車(chē)組的慣性故障,描述并展示動(dòng)車(chē)組慣性故障發(fā)生規(guī)律。
標(biāo)志性事件指對(duì)動(dòng)車(chē)組運(yùn)用檢修產(chǎn)生較大影響的事件,如動(dòng)車(chē)組提速、修程修制改革等,分別提取標(biāo)志性事件發(fā)生前后的動(dòng)車(chē)組故障數(shù)據(jù),從單位、車(chē)型(批次)等維度,對(duì)動(dòng)車(chē)組發(fā)生標(biāo)志性事件的前后進(jìn)行安全規(guī)律的綜合對(duì)比分析,從數(shù)據(jù)分析結(jié)果反映該事件對(duì)動(dòng)車(chē)組安全的影響。
高速鐵路具有地域跨度大、速度快、里程長(zhǎng)和始末時(shí)間短等特點(diǎn),不同線(xiàn)路條件、不同天氣均會(huì)對(duì)動(dòng)車(chē)組故障產(chǎn)生影響。提取動(dòng)車(chē)組開(kāi)行、交路和天氣信息建立站站氣象信息庫(kù),基于站站氣象信息庫(kù)對(duì)不同交路、不同城市、不同天氣環(huán)境因素對(duì)動(dòng)車(chē)組各安全規(guī)律進(jìn)行分析,主要包括基于線(xiàn)路的動(dòng)車(chē)組安全規(guī)律分析、基于天氣(溫濕度、晴雨雪等)及多維環(huán)境因素的動(dòng)車(chē)組安全規(guī)律分析。
針對(duì)故障數(shù)據(jù)及安全規(guī)律模型,對(duì)動(dòng)車(chē)組及部件的運(yùn)用檢修提出視情維修和預(yù)防性維修策略,達(dá)到降低維修成本的目的。
(1)動(dòng)車(chē)組運(yùn)用建議
針對(duì)運(yùn)行數(shù)據(jù)、部件故障數(shù)據(jù)和部件更換數(shù)據(jù)等,分析動(dòng)車(chē)組運(yùn)用檢修內(nèi)容和運(yùn)用開(kāi)行需求,構(gòu)建運(yùn)用方案優(yōu)化模型,輔助提升動(dòng)車(chē)組運(yùn)營(yíng)品質(zhì),提出動(dòng)車(chē)組運(yùn)用建議。
(2)動(dòng)車(chē)組精準(zhǔn)維修建議
匯總?cè)穭?dòng)車(chē)組及部件的故障歷史、檢修歷史情況,以車(chē)型、部件和檢修項(xiàng)目等為維度,考慮動(dòng)車(chē)組維修時(shí)機(jī)、維修間隔及維修成本等要素,在保障車(chē)輛可靠性的同時(shí)降低維修費(fèi)用,提高檢修效率,給出精準(zhǔn)維修建議。
(3)動(dòng)車(chē)組設(shè)計(jì)制造建議
發(fā)現(xiàn)批次、部件等設(shè)計(jì)和產(chǎn)品優(yōu)化改進(jìn)功能點(diǎn),及時(shí)反饋給動(dòng)車(chē)組及零部件造修企業(yè)進(jìn)行深入研究,從設(shè)計(jì)制造角度實(shí)現(xiàn)動(dòng)車(chē)組的改進(jìn)和創(chuàng)新,提升乘客體驗(yàn)和動(dòng)車(chē)組運(yùn)營(yíng)效率。
動(dòng)車(chē)組安全規(guī)律分析需要采集大量故障數(shù)據(jù),包含圖片、聲音資源,而這些圖片和聲音的存儲(chǔ)多數(shù)是小文件,且大多數(shù)文件大小在幾十KB以?xún)?nèi)。如果使用以GFS、HDFS為代表的適用于流式訪(fǎng)問(wèn)大文件的分布式存儲(chǔ)系統(tǒng)存儲(chǔ)圖片,在元數(shù)據(jù)膨脹的情況下擴(kuò)展性和性能方面均存在嚴(yán)重問(wèn)題[8]。系統(tǒng)采用基于HDFS的Hbase作為簡(jiǎn)單結(jié)構(gòu)化數(shù)據(jù)分布式存儲(chǔ)方式,用于存儲(chǔ)海量圖片小文件,并具有系統(tǒng)層小文件合并、全局命名空間等多種優(yōu)勢(shì)。
將各系統(tǒng)數(shù)據(jù)采集至大數(shù)據(jù)平臺(tái)后,需要將原始數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,采用除噪、補(bǔ)缺失值和除冗余值的方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并按照主題域存放各類(lèi)數(shù)據(jù),形成可供分析的數(shù)據(jù)集。在動(dòng)車(chē)組制造運(yùn)用領(lǐng)域,需要針對(duì)設(shè)計(jì)、工藝、制造和維修等不同維度的需求對(duì)數(shù)據(jù)進(jìn)行拆解。在動(dòng)車(chē)組運(yùn)維業(yè)務(wù)領(lǐng)域,主要包括基于功能分類(lèi)的結(jié)構(gòu)和基于部件裝配的結(jié)構(gòu),兩者相互對(duì)應(yīng),可互相轉(zhuǎn)化。為便于數(shù)據(jù)使用,在數(shù)據(jù)處理過(guò)程中,應(yīng)為各類(lèi)數(shù)據(jù)創(chuàng)建便于統(tǒng)計(jì)分析的各類(lèi)索引。
在安全規(guī)律分析過(guò)程中,需要使用大數(shù)據(jù)機(jī)器學(xué)習(xí)技術(shù)對(duì)安全規(guī)律模型進(jìn)行訓(xùn)練與驗(yàn)證,動(dòng)車(chē)組安全大數(shù)據(jù)平臺(tái)為各類(lèi)算法、模型的開(kāi)發(fā)和運(yùn)行、海量數(shù)據(jù)的分析存儲(chǔ)提供環(huán)境支撐。在模型中采用了各種機(jī)器學(xué)習(xí)算法,如差分整合移動(dòng)平均自回歸模型、決策樹(shù)、支持向量機(jī)和隨機(jī)森林等,并采用準(zhǔn)確率、精確度和召回率等統(tǒng)計(jì)指標(biāo)對(duì)模型結(jié)果進(jìn)行驗(yàn)證。
目前,動(dòng)車(chē)組故障規(guī)律分析系統(tǒng)已經(jīng)研發(fā)完成,并以CRH380系列動(dòng)車(chē)組為例,對(duì)CRH380系列動(dòng)車(chē)組開(kāi)行以來(lái)的數(shù)據(jù)進(jìn)行特征提取與選擇、時(shí)間序列預(yù)測(cè)、關(guān)聯(lián)分析等,用可視化應(yīng)用功能實(shí)現(xiàn)、驗(yàn)證、固化了各類(lèi)安全規(guī)律分析成果,全方位地描述了CRH380動(dòng)車(chē)組上線(xiàn)以來(lái)的安全服役狀態(tài)。CRH380系列動(dòng)車(chē)組作為當(dāng)前應(yīng)用最廣泛、運(yùn)行地域最廣、涉及用戶(hù)單位最多、線(xiàn)路最多的動(dòng)車(chē)組,其安全規(guī)律分析對(duì)于保證中國(guó)高鐵運(yùn)營(yíng)安全、降低運(yùn)用維修成本、提高運(yùn)用檢修效率等都具有重要意義。
本文依托動(dòng)車(chē)組安全大數(shù)據(jù)平臺(tái)建立動(dòng)車(chē)組安全規(guī)律分析系統(tǒng),并介紹了系統(tǒng)架構(gòu)、功能組成、關(guān)鍵技術(shù),同時(shí)以CRH380動(dòng)車(chē)組為例開(kāi)展驗(yàn)證,取得了良好的效果。下一步,系統(tǒng)將擴(kuò)大數(shù)據(jù)范圍,對(duì)動(dòng)車(chē)組安全規(guī)律分析方法和預(yù)測(cè)模型在其他型號(hào)動(dòng)車(chē)組和典型線(xiàn)路開(kāi)展驗(yàn)證和應(yīng)用工作,全面提升動(dòng)車(chē)組安全管理水平。