李恒
摘 要:動車組故障檢修過程中積累大量數(shù)據(jù)資源,若能將其充分開發(fā),可輔助動車組故障預(yù)警、維修工作的高效開展。為此本文分析大數(shù)據(jù)環(huán)境下動車組故障數(shù)據(jù)挖掘分析技術(shù),通過數(shù)據(jù)分析挖掘,從中總結(jié)故障發(fā)生規(guī)律及原因,制定故障風(fēng)險防控方案,實(shí)現(xiàn)故障的事前管理。
關(guān)鍵詞:大數(shù)據(jù);動車組故障;數(shù)據(jù)挖掘
引言:國內(nèi)現(xiàn)役動車組車型較多,加之不同運(yùn)行環(huán)境、運(yùn)行壓力的影響,使動車組故障類型及引發(fā)原因趨于復(fù)雜化,給故障預(yù)防和檢修維護(hù)工作帶來不小難度。大數(shù)據(jù)背景下,利用數(shù)據(jù)挖掘分析技術(shù)完成動車組故障信息的采集、篩選、分類和挖掘,即可為故障原因確定及預(yù)防維修方案制定提供可靠的理論依據(jù),幫助提高故障預(yù)防及檢修水平,因此有必要對故障數(shù)據(jù)挖掘分析技術(shù)進(jìn)行分析。
一、數(shù)據(jù)挖掘分析技術(shù)
(一)數(shù)據(jù)挖掘的內(nèi)容
數(shù)據(jù)挖掘主要完成關(guān)聯(lián)分析、聚類分析、數(shù)據(jù)分類、規(guī)律預(yù)測、損失模型、偏差分析等任務(wù)。其中,關(guān)聯(lián)分析對兩個及以上變量間存在的相互影響管理進(jìn)行分析,常用分析方法包括簡單關(guān)聯(lián)、因果關(guān)聯(lián)以及時序關(guān)聯(lián),影響關(guān)聯(lián)分析結(jié)果的主要參數(shù)為置信度和支持度。聚類分析將帶有相同或類似特征的數(shù)據(jù)聚集到一起,命名為同一類別,以此來突出不同類別間的差異程度,聚類分析在圖像處理、客戶分析、模式識別等領(lǐng)域有廣泛應(yīng)用。
(二)數(shù)據(jù)挖掘的步驟
第一,數(shù)據(jù)清洗。數(shù)據(jù)清洗可剔除動車組故障數(shù)據(jù)中的噪聲數(shù)據(jù)、冗余數(shù)據(jù)或無用數(shù)據(jù)。由于數(shù)據(jù)來源較廣,因此存在一定異常數(shù)據(jù)不可避免,但這部分?jǐn)?shù)據(jù)會對數(shù)據(jù)挖掘分析結(jié)果產(chǎn)生一定干擾,因此在挖掘分析之前需將其剔除[1]。第二,數(shù)據(jù)集成。數(shù)據(jù)集成將不同數(shù)據(jù)源的數(shù)據(jù)相互組合,當(dāng)描述相同概念的屬性處于不同數(shù)據(jù)庫中時,其有不同的命名方式,若進(jìn)行數(shù)據(jù)集成易引發(fā)數(shù)據(jù)冗余或不一致的現(xiàn)象。數(shù)據(jù)體系中的冗余數(shù)據(jù)過多,會給挖掘分析速度帶來負(fù)面影響,因此需將冗余數(shù)據(jù)重點(diǎn)清除。第三,數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換將原始數(shù)據(jù)轉(zhuǎn)變?yōu)榭杀煌诰虻男问胶筮M(jìn)行存儲,主要操作步驟為數(shù)據(jù)格式化,即將原本連續(xù)的數(shù)據(jù)轉(zhuǎn)化為離散型數(shù)據(jù),易于符號歸納;或?qū)㈦x散型數(shù)據(jù)轉(zhuǎn)化為連續(xù)型,方便神經(jīng)網(wǎng)絡(luò)計算。第四,數(shù)據(jù)挖掘。該步驟為數(shù)據(jù)挖掘分析的核心,從數(shù)據(jù)集或數(shù)據(jù)體系中挖掘潛在的規(guī)律或模式,用以指導(dǎo)實(shí)際工作。數(shù)據(jù)挖掘開展于數(shù)據(jù)預(yù)處理之后,可根據(jù)挖掘任務(wù)特點(diǎn)選擇相適應(yīng)的數(shù)據(jù)處理技術(shù)。常見的數(shù)據(jù)挖掘任務(wù)有數(shù)據(jù)特征分析、數(shù)據(jù)分類、關(guān)聯(lián)性分析等。第五,評估與表現(xiàn)。評估與表現(xiàn)對數(shù)據(jù)挖掘結(jié)果進(jìn)行評價和篩選,找出最具價值的規(guī)律或模模式,經(jīng)可視化處理后,將最終的結(jié)果以知識形式呈現(xiàn)給用戶。
二、數(shù)據(jù)環(huán)境下動車組故障數(shù)據(jù)挖掘分析技術(shù)
(一)故障數(shù)據(jù)模型設(shè)計
動車組故障數(shù)據(jù)模型可大致劃分為四個層級:(1)狀態(tài)信息層。該層級包括故障發(fā)生時的動車狀態(tài)信息,如故障時間、車次、型號、運(yùn)行區(qū)間、運(yùn)行距離、運(yùn)行環(huán)境等。(2)故障現(xiàn)象層。該層用以描述故障本身的狀態(tài),如故障位置、故障形式、發(fā)生程度、影響范圍、具體描述等。(3)解決方案層。解決方案層可被視為專家?guī)欤靡源鎯榆嚱M常見故障類型、故障誘發(fā)原因、常用處理方案等,結(jié)合解決方案層的數(shù)據(jù),可對動車組實(shí)際故障做定性分析,并結(jié)合歷史數(shù)據(jù)找到最佳的故障排除方案。(4)故障處理層。該層包括故障處理時間、操作人員、具體措施、處理結(jié)果等信息。
(二)故障數(shù)據(jù)庫搭建
動車組故障數(shù)據(jù)挖掘分析基于大量準(zhǔn)確、有效的故障數(shù)據(jù),為方便數(shù)據(jù)采集和存儲,確保故障數(shù)據(jù)的規(guī)范性,需搭建相應(yīng)的故障數(shù)據(jù)庫,并完成網(wǎng)絡(luò)配置。數(shù)據(jù)庫系統(tǒng)軟件設(shè)計可由計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)完成??紤]到鐵路系統(tǒng)現(xiàn)有資源配置情況及數(shù)據(jù)庫搭建效率,以O(shè)A網(wǎng)作為數(shù)據(jù)庫運(yùn)行網(wǎng)絡(luò)平臺,動車組故障數(shù)據(jù)庫系統(tǒng)架構(gòu)包括OA網(wǎng)絡(luò)、數(shù)據(jù)庫服務(wù)器、Web服務(wù)器、挖掘分析終端、用戶端等模塊。故障數(shù)據(jù)庫在Visual Studio2008環(huán)境下開發(fā),使用B/S架構(gòu),并以C#為編程語言,硬件服務(wù)器和軟件服務(wù)器分別為DELL_R720 PC和Windows Server 2008 R2 Standard。
(三)數(shù)據(jù)庫功能實(shí)現(xiàn)
動車組故障數(shù)據(jù)庫包含如下功能模塊:(1)數(shù)據(jù)錄入:完成動車組故障表單的填寫、上傳及故障數(shù)據(jù)的批量化導(dǎo)入;表單中部分信息為選擇式填入,以確保錄入數(shù)據(jù)、名稱的規(guī)范性;從動車組上下載的故障數(shù)據(jù)在批量化導(dǎo)入之前,需對其進(jìn)行篩選,清除操作提示、狀態(tài)提醒等與動車故障無關(guān)的數(shù)據(jù)。(2)信息查詢:提供多條件組合查詢方式。(3)故障統(tǒng)計:包括時間、里程和車型三種統(tǒng)計標(biāo)準(zhǔn)。(4)故障跟蹤:跟蹤對象為待處理故障和運(yùn)行觀察故障。(5)故障分析:分為車載故障、遠(yuǎn)程故障數(shù)據(jù)分析和部件平均壽命計算[2]。(6)標(biāo)準(zhǔn)數(shù)據(jù):該模塊可實(shí)現(xiàn)用戶權(quán)限管理、故障模式配置、計算參數(shù)設(shè)定等功能。
(四)成果檢驗(yàn)
將動車組故障數(shù)據(jù)挖掘分析技術(shù)應(yīng)用至某鐵路局CRH1A型動車組的故障分析工作中,采集其在2018年9~12月的故障數(shù)據(jù)信息,發(fā)現(xiàn)其在12月運(yùn)行里程達(dá)到320~360萬公里時,發(fā)生轉(zhuǎn)向架故障的概率要更高,該結(jié)果與動車組故障處理經(jīng)驗(yàn)判斷結(jié)果保持一致。經(jīng)檢測驗(yàn)證,該動車組轉(zhuǎn)向架的齒輪箱、軸向軸承等節(jié)點(diǎn)度過高,因此建議在日常維修保養(yǎng)中,加強(qiáng)節(jié)點(diǎn)處零部件的檢查。
三、結(jié)論
大數(shù)據(jù)時代,動車組故障分析、處理的信息化水平顯著提高,借助數(shù)據(jù)挖掘分析技術(shù),可有效降低動車組故障處理的難度和時間成本,同時強(qiáng)化故障風(fēng)險的可預(yù)見、可預(yù)防性,確保動車組安全、高效運(yùn)行。
參考文獻(xiàn):
[1]黃凌云.大數(shù)據(jù)環(huán)境下動車組故障數(shù)據(jù)挖掘分析技術(shù)研究[D].中國鐵道科學(xué)研究院,2019.
[2]何騰翔.Flink平臺下Eclat算法的研究及在動車組故障關(guān)聯(lián)關(guān)系挖掘中的應(yīng)用[D].北京交通大學(xué),2019.