李 燕,張 瑜,周軍偉
(中國鐵道科學(xué)研究院集團有限公司 電子計算技術(shù)研究所,北京 100081)
我國動車組車型較多,應(yīng)用環(huán)境較國外差別較大,行車設(shè)備故障、源頭質(zhì)量、作業(yè)檢修質(zhì)量等問題時有發(fā)生,對動車組運營、維修時常產(chǎn)生不可避免的影響。同時,動車組的計劃預(yù)防修和狀態(tài)更正修方式,存在過度修和欠維修的情況,導(dǎo)致動車組維修保養(yǎng)成本高昂、次生災(zāi)害及行車設(shè)備故障時有發(fā)生?;谏鲜霈F(xiàn)實情況,建立一套適合中國高速鐵路國情的故障預(yù)測與健康管理系統(tǒng)(PHMP,Prognostics and Health Management)具有重要的現(xiàn)實意義。
近年來, 國外已在航空航天、國防軍事以及工業(yè)領(lǐng)域開展了PHM技術(shù)的研發(fā)和應(yīng)用工作。直升機健康與使用監(jiān)控系統(tǒng)(HUMS), 用來監(jiān)控轉(zhuǎn)子軌跡和平衡等,提供維修趨勢信息[1-2];飛機狀態(tài)監(jiān)測系統(tǒng)(ACMS)系統(tǒng)[3]能夠保證航空公司減少飛行延誤、航班取消、中途返航和中途換機等事件[4]。在動車組領(lǐng)域,法國TGV、德國ICE、美國AC6000CW、英國IC125型高速列車等依靠車載網(wǎng)絡(luò)控制系統(tǒng)實現(xiàn)了全列動車組關(guān)鍵部件及系統(tǒng)實時狀態(tài)監(jiān)控和自動診斷[5]。
國內(nèi)方面,既有的CRH系列動車組的狀態(tài)監(jiān)測也大多依賴車載設(shè)備監(jiān)控系統(tǒng),以及在重要部件上加裝傳感器獲取狀態(tài)信息[6]。上海鐵路局與中車唐山機車車輛有限公司聯(lián)合開展動車組故障預(yù)測與健康管理的研究工作,并嘗試對CRH3型車的變壓器散熱裝置等部件發(fā)生的故障進行關(guān)聯(lián)分析和故障診斷,探尋故障與外部因素的關(guān)系,從而制定不同的檢修優(yōu)化策略,指導(dǎo)維修[7]。
本文第1部分介紹了故障預(yù)測與健康管理(PHM)技術(shù)相關(guān)的基本概念和定義。第2部分對現(xiàn)階段建立動車組故障預(yù)測與健康管理地面系統(tǒng)的數(shù)據(jù)、用戶及業(yè)務(wù)需求進行了分析。第3部分在文獻[5]的體系架構(gòu)基礎(chǔ)上,根據(jù)動車組管理和執(zhí)行的實際需要,增加了動車組健康管理系統(tǒng)的硬件部署,從總體架構(gòu)、邏輯架構(gòu)和功能設(shè)計角度出發(fā)提出了一整套的系統(tǒng)設(shè)計方案,并在接口設(shè)計部分首次明確了與動車組管理信息系統(tǒng)的包含關(guān)系。第4部分對動車組健康管理系統(tǒng)的應(yīng)用前景進行了展望。
從定義上,PHM指利用各類先進傳感器實時監(jiān)測裝備運行的各類狀態(tài)參數(shù)及特征信號,借助各種智能推理算法和模型來評估裝備的健康狀態(tài),在其故障發(fā)生前對故障進行預(yù)測,并結(jié)合各種可利用的資源信息提供一系列的維修保障決策,以實現(xiàn)裝備的狀態(tài)維修[8]。
上述定義中涵蓋了以下若干個相關(guān)概念:
(1)狀態(tài)維修:指通過對設(shè)備狀態(tài)進行檢測,并且按設(shè)備的健康狀態(tài)來安排維修的一種決策方法[9]。
(2)故障診斷:指利用被診斷對象的各種知識,進行信息的綜合處理,最終得到裝備運行和故障狀況綜合評價結(jié)果的過程,目的是確定有無故障及故障情況。
(3)故障預(yù)測:以裝備的使用狀態(tài)為起點,結(jié)合各類信息,對裝備未來時間可能發(fā)生的故障進行預(yù)報、分析和判斷。
(4)健康狀態(tài):對裝備系統(tǒng)、子系統(tǒng)、部件在執(zhí)行其設(shè)計功能時所表現(xiàn)出的能力的描述。
(5)狀態(tài)監(jiān)測:根據(jù)裝備的狀態(tài)特征,利用檢測設(shè)備,連續(xù)或定期采集裝備系統(tǒng)的狀態(tài)特征參數(shù),并對其進行分析和解釋。
(6)狀態(tài)評估:以先進的狀態(tài)監(jiān)視手段、可靠的評價方法和完整的運行數(shù)據(jù)來判斷裝備所處的健康狀態(tài)。
這些概念或涵蓋了一部分PHM的研究內(nèi)容,或描述了PHM研究的最終目標,從各個不同角度詳細剖析了故障預(yù)測與健康管理的內(nèi)容和作用,他們之間的關(guān)系,如圖1所示。
圖1 PHM相關(guān)概念關(guān)系圖
動車組故障預(yù)測與健康管理系統(tǒng)應(yīng)依托各類數(shù)據(jù)建模、分析和挖掘技術(shù),依托鐵路總公司(簡稱:總公司)和各鐵路局動車組技術(shù)中心,滿足不同層級故障預(yù)測與健康管理的需要。
從用戶層級劃分,系統(tǒng)用戶可分為總公司、鐵路局、動車段3個級別;從用戶類別劃分,系統(tǒng)用戶可分為模型構(gòu)建及訓(xùn)練用戶和車輛業(yè)務(wù)用戶。
2.1.1 從用戶層級劃分
(1)總公司用戶:統(tǒng)籌管理全路車輛運用、維修工作;查看全路動車組健康狀態(tài)、檢修修程優(yōu)化建議;查看數(shù)據(jù)統(tǒng)計分析相關(guān)功能。
(2)鐵路局用戶:合理安排局管內(nèi)動車組的運用檢修工作;查看局管內(nèi)所有動車組的健康狀態(tài);跟蹤監(jiān)督故障預(yù)警的執(zhí)行情況;組織開展應(yīng)急指揮工作。
(3)動車(車輛)段用戶:執(zhí)行動車組的運用檢修工作計劃;完成故障預(yù)警的閉環(huán)管理;監(jiān)控所內(nèi)動車組的健康狀態(tài),根據(jù)不同狀態(tài)等級安排后續(xù)操作;具體落實應(yīng)急指揮工作。
2.1.2 從用戶類別劃分
(1)模型構(gòu)建及訓(xùn)練用戶:對包括可靠性模型、大數(shù)據(jù)模型、機理模型等在內(nèi)的平臺各類模型進行建模、訓(xùn)練和管理。通過系統(tǒng)對模型進行新增、修改、刪除、導(dǎo)入、導(dǎo)出等操作,評估模型適用性,與業(yè)務(wù)管理人員共同保證模型預(yù)警及規(guī)則的有效性。
(2)車輛業(yè)務(wù)用戶:通過對動車組健康狀態(tài)的監(jiān)控,及時發(fā)現(xiàn)問題,確保動車組設(shè)備正常運營;通過查看健康管理模型預(yù)警結(jié)果,實時監(jiān)控動車組故障發(fā)生情況,并進行相應(yīng)的后續(xù)處理。
為支持動車組故障預(yù)測與健康管理系統(tǒng)中對故障模型的建模和計算,實現(xiàn)故障預(yù)測和健康評價應(yīng)用,系統(tǒng)需要從業(yè)務(wù)系統(tǒng)、手工渠道及外部環(huán)境采集5大類,25小類數(shù)據(jù),進行存儲、篩選、轉(zhuǎn)化和清洗工作,如表1所示。掌握故障發(fā)生規(guī)律,并預(yù)測未來的動車組狀態(tài),包括剩余壽命、可正常工作時間等。
(4)維修決策建議:通過對動車組故障發(fā)生規(guī)律、動車組健康狀態(tài)的評估,結(jié)合當前定期檢修機制,給出視情檢修建議,包括車組檢修時間和項目,以及不同級別檢修優(yōu)化建議。
表1 數(shù)據(jù)類型列表
結(jié)合動車組運用檢修實際,故障預(yù)測與健康管理地面系統(tǒng)大體應(yīng)具備以下功能:
(1)動車組狀態(tài)監(jiān)測:接收來自動車組制造或檢修廠家的傳感器數(shù)據(jù),并對數(shù)據(jù)進行解析,對于故障進行等級管理,根據(jù)不同用戶需求,對故障進行分層展示,根據(jù)報警規(guī)則,對重要故障進行實時報警。
(2)健康評估:根據(jù)各車組的故障發(fā)生情況、運行和檢修記錄等對動車組健康狀態(tài)建模,計算各動車組、各車組子系統(tǒng)、各系統(tǒng)部件的健康狀態(tài)值,并對不同用戶進行不同級別的報警,確保上線動車組原設(shè)計功能正常,狀態(tài)良好。
(3)故障預(yù)測:通過對動車組機理、可靠性、故障發(fā)生規(guī)律進行建模,預(yù)測動車組設(shè)備故障發(fā)生,
PHM系統(tǒng)的結(jié)構(gòu)形式取決于裝備的組成結(jié)構(gòu)和功能關(guān)系,從信息處理方式的角度,可將裝備PHM系統(tǒng)的結(jié)構(gòu)歸結(jié)為3種類型,即集中式結(jié)構(gòu)、分布式結(jié)構(gòu)和分層融合式結(jié)構(gòu)。集中式結(jié)構(gòu)簡單、信息傳遞過程清晰、中央故障管理控制器的功能強大,但執(zhí)行效率低,一般只用于小型系統(tǒng);分布式可有效地提高子系統(tǒng)故障管理控制器的執(zhí)行效率,但無法有效利用健康狀態(tài)信息之間的冗余信息,系統(tǒng)級診斷/預(yù)測的可信度較低,適用于大型但結(jié)構(gòu)簡單的裝備;分層融合式結(jié)構(gòu)能夠在系統(tǒng)各層全面的利用冗余信息,降低了系統(tǒng)整體的虛警概率,更適用于結(jié)構(gòu)復(fù)雜、產(chǎn)品結(jié)構(gòu)層次多的裝備[8]。
動車組作為結(jié)構(gòu)復(fù)雜的大型裝備,宜采用分層融合式結(jié)構(gòu)進行故障預(yù)測與健康管理系統(tǒng)的建設(shè)。系統(tǒng)物理部署可分為兩層,總公司服務(wù)器部署在鐵科院動車組技術(shù)中心,支持全路動車組的健康管理應(yīng)用、通用模型的建立和訓(xùn)練;鐵路局級服務(wù)器部署在各鐵路局動車組技術(shù)分中心,支持鐵路局范圍內(nèi)動車組的健康管理、通用模型的配置和個性化建模應(yīng)用。
在邏輯結(jié)構(gòu)上,動車組故障預(yù)測與健康管理系統(tǒng)劃分為總公司級、鐵路局級及動車(車輛)段級3層,分別與EMIS的總公司、鐵路局、動車段層相對應(yīng),可逐級嵌入,進行故障、檢修等數(shù)據(jù)的交互,形成緊密耦合的統(tǒng)一整體。其總體架構(gòu),如圖2所示。
PHM系統(tǒng)設(shè)計為B/S架構(gòu),總公司級別的應(yīng)用由鐵科院動車組技術(shù)中心服務(wù)器集群支撐相關(guān)應(yīng)用、計算和數(shù)據(jù)管理;鐵路局級別和動車(客車)段級別功能均由各鐵路局動車組技術(shù)分中心服務(wù)器集群支持,通過用戶和權(quán)限管理區(qū)分不同層級的應(yīng)用和不同屬性用戶的功能。PHM系統(tǒng)本身無車間級應(yīng)用,故障預(yù)警、個性化檢修周期配置等功能在段級PHM系統(tǒng)與EMIS進行交互,在車間級EMIS內(nèi)部,通過計劃及檢修管理模塊完成閉環(huán)管理。
圖2 動車組PHM總體架構(gòu)圖
參考鐵路大數(shù)據(jù)應(yīng)用體系架構(gòu)[10],基于5大類26個小類基礎(chǔ)數(shù)據(jù),PHM系統(tǒng)邏輯架構(gòu)自下而上劃分為數(shù)據(jù)采集處理、數(shù)據(jù)管理、智能分析支撐、健康管理應(yīng)用和用戶訪問5個層次,其架構(gòu),如圖3所示。
(1)數(shù)據(jù)采集層:通過數(shù)據(jù)自動接入、人工導(dǎo)入和人工錄入等方式,獲取項目所需的監(jiān)測、檢測數(shù)據(jù),運用檢修數(shù)據(jù)等,通過對數(shù)據(jù)進行格式處理、清洗等操作,形成符合要求的數(shù)據(jù),存儲到主數(shù)據(jù)庫。
(2)數(shù)據(jù)管理層:集中存儲和管理經(jīng)過結(jié)構(gòu)化和標準化處理的監(jiān)測、檢測數(shù)據(jù),業(yè)務(wù)數(shù)據(jù)以及知識庫數(shù)據(jù)等,為數(shù)據(jù)分析打好基礎(chǔ)。
(3)智能分析支撐層:為分析模型提供數(shù)據(jù)和模型運行環(huán)境,支撐分析模型的實現(xiàn)和評估。集中存儲分析模型的運行結(jié)果數(shù)據(jù)和大數(shù)據(jù)挖掘及分析應(yīng)用的各類指標數(shù)據(jù),為后續(xù)更多的智能分析數(shù)據(jù)應(yīng)用提供支持。
(4)健康管理應(yīng)用層:完成健康管理的應(yīng)用業(yè)務(wù)支撐,實現(xiàn)各種類型的健康管理功能,主要包括健康監(jiān)測、預(yù)警預(yù)測、分析決策支持及模型管理等。
圖3 動車組PHM系統(tǒng)邏輯架構(gòu)圖
(5)用戶訪問層:依托統(tǒng)一門戶管理,通過單點登錄,用戶權(quán)限和安全管理,通過可視化報表、交互式操作、定制開發(fā)和頁面功能集成,為用戶提供靈活多樣的訪問方式,并保障用戶訪問功能時的數(shù)據(jù)安全及系統(tǒng)安全。
基于視情維修的開放體系(OSA-CBM)[11]綜合了現(xiàn)有PHM系統(tǒng)的共同設(shè)計思想、應(yīng)用技術(shù)和方法,已在艦船、飛機、車輛等領(lǐng)域到初步的應(yīng)用和驗證,如圖4所示。
圖4 OSA-CBM體系結(jié)構(gòu)
(1)數(shù)據(jù)采集與傳輸:利用各種無源和智能傳感器采集裝備系統(tǒng)的相關(guān)參數(shù)信息,作為數(shù)據(jù)基礎(chǔ),本部分具有數(shù)據(jù)轉(zhuǎn)換和傳輸?shù)墓δ堋?/p>
(2)數(shù)據(jù)處理:接受傳感器及其他數(shù)據(jù)處理模塊的數(shù)據(jù)和信號,并將數(shù)據(jù)處理成后續(xù)狀態(tài)監(jiān)控、健康評估和故障預(yù)測等部分處理要求的格式。
(3)狀態(tài)監(jiān)測:接收來自傳感器、數(shù)據(jù)處理以及其他狀態(tài)監(jiān)測模塊的數(shù)據(jù),然后將這些數(shù)據(jù)同預(yù)訂的失效判斷等進行比較來監(jiān)測裝備系統(tǒng)當前的狀態(tài),可根據(jù)預(yù)定的各種參數(shù)指標極限值/閾值進行故障報警。
(4)健康評估:進行被監(jiān)測系統(tǒng)(子系統(tǒng)、部件)的健康狀態(tài)評估,形成故障診斷記錄并確定故障發(fā)生的可能性。
(5)故障預(yù)測:對被監(jiān)測系統(tǒng)進行狀態(tài)評估和預(yù)測未來的健康狀態(tài),包括剩余壽命、可正常工作時間等。
(6)自動推理決策:接收狀態(tài)監(jiān)測、健康評估、故障預(yù)測部分的數(shù)據(jù),通過推理決策產(chǎn)生更換、維修等活動的建議與措施。
(7)接口:人–機器接口—數(shù)據(jù)信息表示與交互;機器–機器接口—各模塊之間、PHM與其他系統(tǒng)之間的數(shù)據(jù)信息傳遞。
學(xué)生信息管理系統(tǒng)主要功能包括:學(xué)生基本信息和成績的錄入,瀏覽、查詢、刪除、修改及計算成績等功能。功能分析如下:
動車組故障預(yù)測與健康管理系統(tǒng)參考OSA-CBM開放體系結(jié)構(gòu)來進行地面系統(tǒng)的功能設(shè)計,主要包含4部分功能,即車組狀態(tài)監(jiān)控、故障分析、故障預(yù)警和維修建議支持。功能結(jié)構(gòu),如圖5所示。
3.3.1 車組狀態(tài)監(jiān)控
車組狀態(tài)監(jiān)控模塊全面監(jiān)控全路動車組的運用狀態(tài)及健康狀態(tài),通過對動車組健康狀態(tài)的建模、定義和計算,關(guān)注車組運用情況,確保上線動車組狀態(tài)良好,高效完成運營任務(wù)。模塊分為全圖車組狀態(tài)和單車組狀態(tài)查詢兩個功能:
(1)全圖車組狀態(tài)以全路動車開行線路圖為依托,通過不同顏色標識健康狀態(tài)不同的動車組,及其目前所處的運用狀態(tài)(開行顯示途中位置,檢修顯示檢修地點),對于健康狀態(tài)不達標的上線車組進行狀態(tài)報警;
(2)單車組狀態(tài)以車組的視角展示動車組健康狀態(tài),并追根溯源、逐層逐級地剖析動車組各系統(tǒng)及部件的健康狀態(tài)值,并結(jié)合車組一車一檔履歷,給出進一步的跟蹤或維修警示。
圖5 動車組PHM系統(tǒng)功能構(gòu)成圖
3.3.2 故障預(yù)警
故障預(yù)警模塊通過大數(shù)據(jù)、可靠性模型及機理模型等,對動車組部件、系統(tǒng)等故障發(fā)生規(guī)律進行建模,預(yù)測未來故障發(fā)生的時間、部位,動車組剩余壽命等屬性。模塊分為車組數(shù)據(jù)預(yù)警、系統(tǒng)可靠性預(yù)警、部件機理預(yù)3個功能。
(1)車組數(shù)據(jù)預(yù)警模塊基于動車組運用開行歷史、故障發(fā)生歷史、車載故障歷史數(shù)據(jù)、檢修歷史等,利用大數(shù)據(jù)平臺及方法,從數(shù)據(jù)分析建模的角度預(yù)測故障的發(fā)生和發(fā)展趨勢。
(3)部件機理報警根據(jù)動車組部件的組成和工作原理,構(gòu)建模型,結(jié)合車載離線數(shù)據(jù),預(yù)測部件故障的發(fā)生和發(fā)展趨勢。
3.3.3 故障分析
故障分析模塊針對動車組在開行途中及運用檢修、高級修中發(fā)生的故障進行逐步深入的分析,全面描述故障發(fā)生的規(guī)律和趨勢,根據(jù)不同的統(tǒng)計分析級別,又可以劃分為遠程故障報警及分析、故障基礎(chǔ)性分析、故障率分析和可靠性分析4個功能:
(1)遠程故障報警分析利用WTDS實時和離線下載數(shù)據(jù),進行故障分析與報警。其中,實時報警數(shù)據(jù)根據(jù)不同級別,在全圖車組狀態(tài)頁面進行復(fù)視;離線數(shù)據(jù)進入大數(shù)據(jù)平臺,進行動態(tài)分析、相關(guān)分析和回歸分析等。
(2)故障基礎(chǔ)分析從故障發(fā)生的時間、里程信息、配屬和擔當屬性、車型屬性及故障發(fā)生結(jié)構(gòu)點等維度,進行基礎(chǔ)的描述性分析,通過可視化工具進行展示。
(3)故障率分析通過將故障發(fā)生的時間、里程、發(fā)生線別等信息的聯(lián)合查詢,顯示故障沿各個維度的變化規(guī)律,通過百萬公里故障率、平均無故障時間、平均無故障公里數(shù)等指標的計算,對不同維度的故障發(fā)生進行評價。
(4)RAMS分析模塊從可靠性分析角度,通過設(shè)置可靠性、可用性、可維修性和安全性性能指標,對單車組和車型進行評估分析。
3.3.4 維修建議
維修建議模塊通過動車組全生命周期中的故障數(shù)據(jù)和檢修數(shù)據(jù)發(fā)生頻率、檢修頻率、檢修范圍的劃定,給出維修項目及維修周期的優(yōu)化建議,輔助維修人員達到視情檢修的目標,最大限度的節(jié)約動車組運用、檢修的人力、物力和時間成本。該模塊又可劃分為全生命周期故障發(fā)生規(guī)律和檢修項目與故障相關(guān)性兩個功能。
動車組管理信息系統(tǒng)接口,如圖6所示。
圖6 動車組管理信息系統(tǒng)接口
動車組故障預(yù)測與健康管理系統(tǒng)作為動車組管理信息系統(tǒng)的一部分,通過動車組管理信息系統(tǒng)獲取眾多系統(tǒng)的數(shù)據(jù)。
3.4.1 數(shù)據(jù)采集
5大類系統(tǒng)數(shù)據(jù)及人工導(dǎo)入數(shù)據(jù)統(tǒng)一接入動車組管理信息系統(tǒng)總公司級系統(tǒng)進行存儲、管理,通過內(nèi)部接口向動車組故障預(yù)測與健康管理系統(tǒng)提供健康計算所需的輸入數(shù)據(jù)。
3.4.2 數(shù)據(jù)交互
動車組故障預(yù)測與健康管理系統(tǒng)同動車組管理系信息系統(tǒng)通過系統(tǒng)間接口服務(wù)器進行健康相關(guān)數(shù)據(jù)的交互。動車組故障預(yù)測與健康管理系統(tǒng)將動車組特征指標、健康狀態(tài)評估、狀態(tài)修任務(wù)等發(fā)送給動車組管理信息系統(tǒng),后者將狀態(tài)檢修回填信息發(fā)送給動車組故障預(yù)測與健康管理系統(tǒng)子系統(tǒng),進行迭代的模型計算,完成預(yù)警故障的閉環(huán)管理。
本文結(jié)合鐵路總公司和鐵路局實際情況,通過對用戶、數(shù)據(jù)、功能等的需求分析,提出了一套動車組故障預(yù)測與健康管理系統(tǒng)建設(shè)方案,對于完善動車組運用檢修信息化體系,實現(xiàn)動車組視情檢修,提高動車組運用、維修效率具有積極的推動意義。
動車組故障預(yù)測與健康管理是動車組運用檢修質(zhì)量管理及技術(shù)管理工作的熱點,能夠有效減少動車組運營過程中故障引起的風險,提高運營效率。但除了系統(tǒng)建設(shè)本身,對于動車組故障預(yù)測與健康管理完整體系的建立,還應(yīng)同步完成以下兩部分工作:
(1)動車組構(gòu)型數(shù)據(jù)的不斷完善和優(yōu)化。構(gòu)型管理能夠控制各個構(gòu)型部件發(fā)生的變化,并在系統(tǒng)的整個生命周期內(nèi)保證此部件的完整性和可追溯性,這對于研究部件乃至系統(tǒng)和車組的可靠性至關(guān)重要。
(2)動車組健康體系的建立是一個復(fù)雜、龐大的工程,每個環(huán)節(jié)的確定都需要大量的理論、實踐的論證。