李 斌
(佳訊飛鴻(北京)智能科技研究院有限公司,北京 100044)
截止2018 年年底,中國高鐵運營里程達到2.9 萬km 以上,電氣化里程達到9.2 萬km,電氣化率70%。在列車控制系統(tǒng)中,軌道電路起到關鍵作用,成為關鍵性的基礎設施。軌道電路是由鋼軌線路和鋼軌絕緣構(gòu)成的電路,主要用于列車自動和連續(xù)的占用檢查、列車控制系統(tǒng)的地車通訊、鋼軌的斷軌檢查,以保證行車安全的設備。軌道電路分為室內(nèi)設備與室外設備,室外設備主要包括:補償電容、扼流變壓器、調(diào)諧匹配單元、空心線圈、機械絕緣節(jié)、匹配單元等。室外設備由于遠離車站和信號工區(qū),且多數(shù)器件和部件分布在鐵路線周圍,所以對其養(yǎng)護和維修的效率低,故障處置時延較長,而且其工況環(huán)境復雜,易受溫度、濕度、振動、氣壓等環(huán)境因素和不確定性人為因素影響,常有故障發(fā)生,成為影響列車控制系統(tǒng)安全可靠工作的關鍵因素。
當前國內(nèi)鐵路電務專業(yè)對于典型的軌道電路故障,仍然沒有很有效的解決辦法,部分故障的報警和預警機制尚未建立。如:伴隨著大功率電力機車的應用,造成接觸網(wǎng)網(wǎng)流不斷增大,經(jīng)過軌道電路扼流變壓器的回歸電流相應的也越來越大,造成的電化干擾也在不斷的增強,致使牽引電流入侵軌道電路設備的干擾量也越來越大,極易造成軌道電路繼電器誤動作,出現(xiàn)“閃紅光帶”情況。監(jiān)測檢測手段更多依靠的是傳統(tǒng)的儀器儀表,以及一線運維工作人員的現(xiàn)場經(jīng)驗和既有故障數(shù)據(jù)。規(guī)范性不強,智能化不足,以及問題庫和專家?guī)旖ㄔO不完善,造成無法形成統(tǒng)一、高效的軌道電路養(yǎng)護維修體系。當前亟需對軌道電路室外設備故障診斷預測和健康管理領域進行系統(tǒng)性探索和研究,一方面填補軌道電路監(jiān)測檢測領域的技術空白,另一方面將新ICT 技術和軌道電路運維工作進一步融合,從而提高鐵路行車安全性和運維的效率。
故障診斷預測與健康管理(Prognostics and Health Management,PHM),是綜合利用新ICT 技術(如先進的傳感器技術、云計算技術、大數(shù)據(jù)技術、人工智能技術等)的研究成果而提出的一種全新的管理設備實時工作狀態(tài)和健康狀態(tài)的解決方案。PHM 包含兩方面的內(nèi)容,故障診斷預測是指根據(jù)系統(tǒng)現(xiàn)在或歷史工作狀態(tài)數(shù)據(jù),預測性地診斷部件或系統(tǒng),完成其功能的狀態(tài)(未來的健康狀態(tài)),包括確定部件或者系統(tǒng)的剩余壽命或正常工作的時間長度;健康是指與期望的正常性能狀態(tài)相比較的性能下降或偏差程度,健康管理是根據(jù)診斷/預測信息、可用維修資源和使用要求對維修活動做出適當決策的能力。
PHM 系統(tǒng)一般應具備故障監(jiān)測、故障隔離、故障診斷、故障預測、健康管理和壽命追蹤等功能,PHM 要素如圖1 所示。對于復雜裝備和系統(tǒng),PHM 應能實現(xiàn)不同層次、不同級別的綜合診斷、預測和健康管理。
圖1 PHM要素圖Fig.1 PHM element diagram
PHM 廣泛應用于各個領域,具體到鐵路軌道電路室外設備,PHM 指的是:利用軌道電路工作過程中產(chǎn)生的各類工作狀態(tài)數(shù)據(jù),如:電流(工作電流、勵磁電流、損耗電流)、電壓(壓升壓降),磁化阻抗;電容偏差等和各類工況數(shù)據(jù),如:溫度、濕度、氣壓、振動、振動加速度、位移加速度等,經(jīng)過信號處理,多模傳輸,數(shù)據(jù)采集、處理、分析等大數(shù)據(jù)處理方法,實現(xiàn)對軌道電路室外設備復雜系統(tǒng)的設備監(jiān)控和健康管理,從而進行預警預測和管理的系統(tǒng)性工程。PHM 技術將設備的監(jiān)控和健康管理,從傳統(tǒng)的“故障”管理轉(zhuǎn)變?yōu)椤邦A測”和“衰退”管理,通過預測性養(yǎng)護維修,實現(xiàn)設備的零故障和持續(xù)可靠的運行。
軌道電路室外設備的工作原理,基本基于傳統(tǒng)的電路模型,其中多數(shù)器件、部件和元件可以等效看作是電阻、電容、電感及變壓器等模擬電子元件構(gòu)成。在軌道電路室外設備使用和運維的過程中,一線的運維人員積累了大量的故障診斷經(jīng)驗和故障問題庫,對于常見的故障類型和典型故障,基本已能做到快速、準確的定位。針對軌道電路故障定位,常用的方法包括:以電路模型為基礎,根據(jù)系統(tǒng)應用邏輯,分析軌道電路的電氣特性,從而推測故障特征;以軌道電路運行過程中產(chǎn)生的狀態(tài)數(shù)據(jù)為出發(fā)點,通過數(shù)據(jù)分析的方法對故障特征進行提取,達到故障診斷的目的。
室外設備故障的診斷則較為復雜,室外設備容易受到鋼軌、電纜、補償電容、道床電阻和環(huán)境因素的影響和干擾。當運維人員首先確認是室外設備發(fā)生故障后,通常采用逐級測量或者甩線測試的方法對具體的故障位置進行定位。操作過程中,對于人的依賴以及人為標準差異,運維經(jīng)驗的差異和工器具的差異造成了對于過程的不同分析路徑和故障原因的不同判定結(jié)果。
由于軌道電路室外設備包含多種設備和系統(tǒng)模塊,結(jié)構(gòu)多為機電結(jié)構(gòu),且較為復雜,故障模式繁多,所以利用神經(jīng)網(wǎng)絡進行求解時,會面臨輸入變量眾多,網(wǎng)絡結(jié)構(gòu)龐大,經(jīng)驗值、估值數(shù)據(jù)、實際管理規(guī)范交叉的問題。此方案從集中監(jiān)測系統(tǒng)的監(jiān)測數(shù)據(jù)和軌道電路的自身監(jiān)測系統(tǒng)的數(shù)據(jù)著手,對基于數(shù)據(jù)的自動診斷算法展開研究,采用混合量化的方法,構(gòu)建模糊神經(jīng)網(wǎng)絡對軌道電路故障進行診斷分析。
在進行參數(shù)權重自動分配和參數(shù)調(diào)優(yōu)時,采用模糊聚類分析算法和粗糙集理論算法相結(jié)合,既考慮到采集到的室外設備的工作狀態(tài)和工況信息之間的不同特征,數(shù)據(jù)之間的關聯(lián)關系以及相似性,通過建立模糊相似關系對采集到的數(shù)據(jù)進行分類、匯總。又考慮到現(xiàn)場采集數(shù)據(jù)時同步產(chǎn)生的噪聲數(shù)據(jù),既往維修數(shù)據(jù)以及現(xiàn)場人員的運維經(jīng)驗,在數(shù)據(jù)處理時,需要進行區(qū)間劃分和層次劃分,需要忽略掉部分實際采集到的工作狀態(tài)數(shù)據(jù)和工況數(shù)據(jù)。因此兩種算法的結(jié)合,來進行多因素,多參數(shù)問題的定量分析和定性分析,是十分必要的和有益的探索。
將既往運維經(jīng)驗數(shù)據(jù)、既往設備工作狀態(tài)數(shù)據(jù)、故障數(shù)據(jù)、檢修維護數(shù)據(jù)等進行梳理統(tǒng)計,并結(jié)合采集到的實時工作狀態(tài)數(shù)據(jù)和工況數(shù)據(jù),采用模糊聚類分析的方法進行若干類別的劃分,計算各參數(shù)的權重,最后利用各因素所含信息量相對大小,進行歸一化來進行權重自動分配。
PHM 平臺整體技術架構(gòu)分為3 層:應用層:故障診斷預測、設備健康管理、資源管理、輔助決策;信息基礎設施:云計算平臺、大數(shù)據(jù)平臺、物聯(lián)網(wǎng)平臺、微服務;感知傳輸層:傳感器、采集電路、傳輸模塊、物聯(lián)網(wǎng)網(wǎng)關。PHM 平臺整體架構(gòu)如圖2 所示。
3.2.1 采集層
1)傳感器
軌道電路室外設備主要包括:補償電容、扼流變壓器、調(diào)諧匹配單元、空心線圈、機械絕緣節(jié)、匹配單元等,通過在不同的設備、器件、部件內(nèi)部或者近旁增設諸如:位移傳感器、振動傳感器、霍爾傳感器、溫濕度傳感器、加速度傳感器等,來采集其工作狀態(tài)數(shù)據(jù)和工況數(shù)據(jù),完成感知層面的全要素數(shù)據(jù)的采集工作。
2)采集電路
在軌道電路室外設備內(nèi)部和近旁,搭建新的采集電路,基于電橋檢測原理通過AD 轉(zhuǎn)換器實現(xiàn)對多點傳感器的模擬數(shù)據(jù)采集,經(jīng)AD 轉(zhuǎn)換后的數(shù)字信號接入網(wǎng)關。
圖2 PHM平臺整體架構(gòu)Fig.2 Overall architecture of PHM platform
3)物聯(lián)網(wǎng)網(wǎng)關
物聯(lián)網(wǎng)網(wǎng)關實現(xiàn)數(shù)字信號的接入,網(wǎng)關總體設計以ARM 處理器為硬件基礎平臺,以嵌入式LINUX操作系統(tǒng)為軟件開發(fā)平臺。開發(fā)功能包括硬件接口設計、軟件驅(qū)動開發(fā)、網(wǎng)關協(xié)議開發(fā),WEB 端開發(fā)等。技術架構(gòu)如圖3 所示。
4)傳輸模塊
傳輸模塊,支持無線接入運營商2G/3G/4G 網(wǎng)絡;支持無線接入鐵路專用移動通信GSM-R 和LTE-R 網(wǎng)絡;支持接收物聯(lián)網(wǎng)網(wǎng)關數(shù)據(jù)并進行數(shù)據(jù)轉(zhuǎn)發(fā);支持設備管理配置,日志記錄,告警上報。
3.2.2 平臺層
圖3 網(wǎng)關技術架構(gòu)Fig.3 Gateway technical architecture
1)物聯(lián)網(wǎng)平臺
物聯(lián)網(wǎng)平臺的設計是基于對軌道電路室外設備所布設傳感器的連接狀態(tài),采集的數(shù)據(jù)及其上報的設備工作狀態(tài)、工況數(shù)據(jù)、故障事件、報警等時序數(shù)據(jù)的處理、存儲與展現(xiàn)。根據(jù)軌道電路的應用場景,底層傳感器數(shù)據(jù)接入物聯(lián)網(wǎng)平臺主要是非直連方式,即由物聯(lián)網(wǎng)網(wǎng)關負責與物聯(lián)網(wǎng)平臺之間連接的建立和維護、認證和鑒權,傳感器以有線方式與網(wǎng)關進行交互,以實現(xiàn)消息的發(fā)送和命令的接收。
物聯(lián)網(wǎng)平臺的邏輯架構(gòu)如圖4 所示。
圖4 物聯(lián)網(wǎng)平臺邏輯架構(gòu)Fig.4 Logic architechure of IoT platform
物聯(lián)網(wǎng)平臺的詳細設計如下。
采用基于MQTT Broker 的設備連接管理機制。
運用物聯(lián)網(wǎng)傳感器準標準協(xié)議MQTT 協(xié)議解決傳感器接入和數(shù)據(jù)傳輸?shù)腝oS 保證。采用MQTT Broker 集群的方式來解決廣域軌道電路設備中傳感器的并發(fā)接入和通信的需求。
時序數(shù)據(jù)的分布式處理和存儲機制。
利用Storm 和Spark Streaming 對流數(shù)據(jù)強大的分析處理能力和天然的支持分布式擴展的屬性來處理軌道電路室外設備大量傳感器數(shù)據(jù)。
2)大數(shù)據(jù)平臺
大數(shù)據(jù)平臺作為軟件服務部署在云計算平臺上,提供數(shù)據(jù)的集中整合、集中管理和統(tǒng)一接入,有效實現(xiàn)數(shù)據(jù)共享。并在數(shù)據(jù)統(tǒng)一接入和數(shù)據(jù)整合基礎上,平臺提供數(shù)據(jù)分析處理以及數(shù)據(jù)可視化的能力。
大數(shù)據(jù)平臺的層次設計分為以下部分。
a.數(shù)據(jù)采集接入層設計
對于軌道電路室外設備的數(shù)據(jù),采用基于隊列的實時采集接入方式,經(jīng)由物聯(lián)網(wǎng)平臺的消息服務,將采集數(shù)據(jù)接入大數(shù)據(jù)平臺的采集接入層。大數(shù)據(jù)采集接入服務與物聯(lián)網(wǎng)平臺的消息服務之間通過分布式隊列服務Kafka 實現(xiàn)數(shù)據(jù)流轉(zhuǎn),根據(jù)后階段數(shù)據(jù)處理的需要,可以將Kafka數(shù)據(jù)分流到存儲引擎NoSQL 型數(shù)據(jù)庫HBase, 以 便后續(xù)的清洗加工處理、ETL 處理等。作為接入層數(shù)據(jù),為支持某些查詢業(yè)務要求,需要對原始接入數(shù)據(jù)按一定存儲周期要求做保留。原則上,在采集接入測,不做任何數(shù)據(jù)的聚合操作,保證接入段的高效和可靠。
b.數(shù)據(jù)存儲層設計
根據(jù)軌道電路設備數(shù)據(jù)的特征,數(shù)據(jù)以結(jié)構(gòu)化為主,將經(jīng)由物聯(lián)網(wǎng)平臺的消息服務接入數(shù)據(jù),采用大數(shù)據(jù)平臺中結(jié)構(gòu)化數(shù)據(jù)存儲引擎進行數(shù)據(jù)存儲管理。根據(jù)數(shù)據(jù)量、交互性和實時性支持以及并發(fā)性支持等因素,可以將處理場景分為離線、在線、主題分析3 類場景。
c.大數(shù)據(jù)處理層設計
根據(jù)處理的實時性要求,將處理分成批處理、實時流處理;根據(jù)處理層次,將處理分成清洗處理、數(shù)據(jù)分析加工處理(包括多維分析)、數(shù)據(jù)在線分析和復雜查詢處理,以及包括深度學習在內(nèi)的數(shù)據(jù)挖掘、機器學習處理等。
批處理具有處理時間長、處理量大的特點,作為軌道電路室外設備的可預測維護、健康分析應用,基于對各類設備傳回參數(shù),按照各維度的匯總統(tǒng)計分析是一個典型應用場景。采用的技術有Hive、Spark SQL、MPP 數(shù)據(jù)庫以及基于Mapreduce 的Java 或者Pig 腳本等;實時處理,對于秒級響應的實時處理分析和實時數(shù)據(jù)清洗場景,采用Spark Streaming 框架實現(xiàn),其底層基于Spark 框架,可接受Kafka、MQTT 隊列傳回的數(shù)據(jù),對隊列數(shù)據(jù)實現(xiàn)Map、Reduce、Join、Window 等各類實時流式加工處理。
數(shù)據(jù)清洗,在數(shù)據(jù)接收完成,對數(shù)據(jù)進行加工分析和數(shù)據(jù)挖掘之前,需要按照指定業(yè)務規(guī)則對數(shù)據(jù)進行清洗、轉(zhuǎn)換和過濾工作。該層處理適合采用MapReduce、Hive 技術實現(xiàn)這一階段處理。對于實時清洗處理場景,采用Spark Streaming 實現(xiàn);數(shù)據(jù)加工和多維分析階段的處理,主要根據(jù)車站、區(qū)間、設備、器件、部件、設備類型、時間、人員、信號、狀態(tài)等維度,對清洗后結(jié)構(gòu)化數(shù)據(jù)做多維統(tǒng)計和分析。
除了上述所說的大數(shù)據(jù)分析和數(shù)據(jù)挖掘處理場景外,還包括基于專家經(jīng)驗的專家系統(tǒng)。根據(jù)所表達知識的復雜程度,可以采用圖數(shù)據(jù)庫、知識圖譜及相應引擎進行知識的存儲、加工、查詢和處理。采用基于傳統(tǒng)的關系數(shù)據(jù)庫的關系描述方法,將專家系統(tǒng)事先定義的故障規(guī)則用關系二維表來表現(xiàn),并通過關聯(lián)運算實現(xiàn)規(guī)則的匹配,達到故障預測和故障原因探索的目的。
3.3.1 健康狀態(tài)評估
結(jié)合設備履歷,維修記錄,故障記錄等形成以設備狀態(tài)數(shù)據(jù)庫為基礎,按照設備標準編碼進行查詢檢索、通過對設備的運行時長、運行環(huán)境、維修次數(shù)、故障類型、產(chǎn)品批次等信息進行建模挖掘,形成設備健康狀態(tài)評估體系,通過0 ~100 的分數(shù)區(qū)間表示設備健康狀態(tài),并根據(jù)打分提出維修時間、維修部位的建議,以實現(xiàn)設備“預測修”目標。
3.3.2 設備健康狀態(tài)綜合管理
提供全局視角的設備狀態(tài)綜合統(tǒng)計功能,提供多維分析功能,包括設備按管轄地域的維修次數(shù)排行、維修部位、使用時長排行、產(chǎn)品批次的故障率統(tǒng)計、故障分類統(tǒng)計等。
此外與設備狀態(tài)管理相關其他功能還包括:設備運用情況分析;設備故障趨勢分析;設備狀態(tài)評價預警;設備性能分析;設備趨勢分析;環(huán)境分析(溫度、濕度等);設備超期預警等。作為系統(tǒng)還提供設備資產(chǎn)相關的主數(shù)據(jù)管理功能,包括:產(chǎn)品型號主數(shù)據(jù)管理和查詢;生產(chǎn)企業(yè)主數(shù)據(jù)管理和查詢;機構(gòu)類字典管理和查詢;設備故障字典管理和查詢等。
軌道電路室外設備狀態(tài)預測應用系統(tǒng)主要針對各種室外設備常見故障,通過物聯(lián)網(wǎng)采集數(shù)據(jù)按照事先專家系統(tǒng)注冊的故障檢驗規(guī)則、參數(shù)閾值條件,在實際量測值和故障特征參數(shù)之間進行對比和匹配,實現(xiàn)故障預測和故障原因確定的效果。
圍繞專家系統(tǒng)上述應用,系統(tǒng)所需實現(xiàn)的具體功能如下。
1)設備故障預測規(guī)則注冊、更新和刪除。
2)設備故障參數(shù)閾值描述注冊、更新和刪除。
故障規(guī)則定義了規(guī)則與參數(shù)之間的相關關系,而設備故障參數(shù)描述了針對一個規(guī)則下的各個參數(shù)如何判斷故障的異常性的閾值比較公式,參數(shù)異常性主要按照閾值來判斷,根據(jù)故障和設備的不同,閾值的判斷規(guī)則不盡相同,需要用戶根據(jù)實際需要進行閾值判斷模式的選擇,并指定相關閾值描述參數(shù)。
系統(tǒng)提供以下4 種參數(shù)閾值描述。
第一類閾值指標:存在單一閾值,判斷參數(shù)指標大于或者小于或者等于所設定的閾值門限。
第二類閾值指標:存在閾值的上限、下限,判斷參數(shù)指標在上限、下限所設定的閾值之間。
第三類閾值指標:針對某一基準值,設定上下偏差區(qū)間,判斷參數(shù)指標在偏差區(qū)間內(nèi)。
第四類閾值指標:針對平均值,設定上下限偏離百分比,判斷參數(shù)指標在偏差范圍內(nèi)。
3)設備故障規(guī)則匹配參數(shù)映射關系錄入、更新和刪除。
系統(tǒng)在進行故障原因判斷和故障預測時,需要將實際采集的量測數(shù)值與上述事先輸入到專家系統(tǒng)規(guī)則下參數(shù)做一一對比和匹配,基于目前采集得到的量測數(shù)值做出故障判斷。為實現(xiàn)這種實測值與規(guī)則參數(shù)之間的一一匹配,專家人員或者管理人員能夠通過專家系統(tǒng)的映射關系輸入功能事先定義實測數(shù)值表內(nèi)各個字段與規(guī)則參數(shù)之間的映射關系。
4)設備故障原因確認。
5)設備故障預測。
通過對于軌道電路室外設備運維現(xiàn)狀的分析,針對特定的問題,提出當前鐵路行業(yè)電務專業(yè)對于監(jiān)測檢測領域一種新穎的設備故障診斷預測和健康管理方法,通過對PHM 平臺的整體架構(gòu),設計思路,以及對物聯(lián)網(wǎng)平臺和大數(shù)據(jù)平臺設計理念的詳細闡述,提出構(gòu)建一種安全、高效、智能的軌道電路室外設備故障診斷預測和健康管理平臺。通過現(xiàn)場部署此套平臺可以有效的輔助電務運維人員高質(zhì)量完成運維工作,研究并探索軌道電路室外設備“預測修”的新模式,為后續(xù)電務專業(yè)運維模式轉(zhuǎn)型提供堅實的基礎。后續(xù)工作中,需要在前端傳感器技術、后端數(shù)據(jù)挖掘,數(shù)據(jù)關聯(lián)分析,數(shù)據(jù)呈現(xiàn)上繼續(xù)開展深入的研究,同時還需要橫向了解“工電供”專業(yè)融合的需求以及多專業(yè),多工種的結(jié)合部的設備健康管理。