吳臻易
(中車青島四方機(jī)車車輛股份有限公司,山東 青島 266111)
隨著互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的不斷發(fā)展應(yīng)用,智能化目前已成為動(dòng)車組發(fā)展的必然趨勢(shì)之一[1]。近年來(lái),軌道交通行業(yè)已初步實(shí)現(xiàn)了車輛的遠(yuǎn)程監(jiān)控,運(yùn)維人員可在地面實(shí)時(shí)獲取動(dòng)車組的故障信息,提高了行車故障應(yīng)急處置效率。但在故障預(yù)警方面,目前的主要措施仍是各項(xiàng)參數(shù)的閾值預(yù)警(如最大值、最大差值、差值變化率等),所面臨的問題一是無(wú)線傳輸裝置(wireless transport device,WTD)車地通信數(shù)據(jù)密度高,海量數(shù)據(jù)匯集到地面服務(wù)器進(jìn)行運(yùn)算,致使地面服務(wù)器不堪重負(fù);二是計(jì)算機(jī)領(lǐng)域的人工智能算法與傳統(tǒng)的動(dòng)車組故障檢測(cè)方法之間缺少切實(shí)可行的結(jié)合點(diǎn),應(yīng)用困難。動(dòng)車組自身是一個(gè)極為復(fù)雜的系統(tǒng),其運(yùn)行狀態(tài)會(huì)受外部環(huán)境的影響,在實(shí)際的故障預(yù)警研究中,目前尚無(wú)法獲取全部關(guān)聯(lián)數(shù)據(jù)。因此,探討一種現(xiàn)階段可行的大數(shù)據(jù)平臺(tái)構(gòu)建及故障預(yù)警預(yù)測(cè)實(shí)現(xiàn)方法,對(duì)于進(jìn)一步提高動(dòng)車組運(yùn)營(yíng)可靠性、保障運(yùn)輸效率具有必要性及迫切的現(xiàn)實(shí)意義。
本文從“車-地”一體化大數(shù)據(jù)平臺(tái)的構(gòu)建出發(fā),分別闡述了車載和地面故障預(yù)測(cè)與健康管理(prognostics health management,PHM)平臺(tái)的技術(shù)框架,同時(shí)提出了通過數(shù)字仿真思路建立動(dòng)車組關(guān)鍵部件預(yù)警預(yù)測(cè)模型的方法,并以牽引電機(jī)溫度預(yù)警預(yù)測(cè)模型的建立為例進(jìn)行了詳細(xì)說明。
“車-地”一體化大數(shù)據(jù)平臺(tái)采用分布式網(wǎng)絡(luò)思路構(gòu)建,其列車端在基于4G移動(dòng)網(wǎng)絡(luò)的傳統(tǒng)WTD數(shù)據(jù)車地傳輸?shù)幕A(chǔ)上增加了車載PHM系統(tǒng)。這樣不僅可以很好地彌補(bǔ)地面PHM平臺(tái)數(shù)據(jù)密度低、實(shí)時(shí)性不足的缺陷,而且對(duì)車載狀態(tài)數(shù)據(jù)進(jìn)行分散預(yù)處理,可以更加高效地進(jìn)行早期故障預(yù)警。其總體設(shè)計(jì)方案見圖1。
圖1 “車-地”一體化大數(shù)據(jù)平臺(tái)總體架構(gòu)Fig.1 Overall architecture of the vehicle-ground integration big data platform
車載PHM系統(tǒng)實(shí)時(shí)采集車輛數(shù)據(jù),并通過搭載的車載故障預(yù)警模型提前識(shí)別車輛異常狀態(tài)。該系統(tǒng)對(duì)車輛實(shí)時(shí)數(shù)據(jù)進(jìn)行分散預(yù)處理,將實(shí)時(shí)性要求高、計(jì)算量小的預(yù)警模型放在車輛端完成,并將運(yùn)算結(jié)果傳輸至地面服務(wù)器,從而提升車輛數(shù)據(jù)實(shí)時(shí)運(yùn)算效率[2]。車載PHM系統(tǒng)由部件級(jí)PHM和列車級(jí)PHM組成。通過在牽引、制動(dòng)、軸溫等系統(tǒng)的控制主機(jī)內(nèi)增加部件級(jí)PHM單元,對(duì)所采集的內(nèi)部數(shù)據(jù)進(jìn)行故障預(yù)警、預(yù)測(cè)及系統(tǒng)狀態(tài)自診斷,從而完成部件級(jí)PHM分析;并利用列車網(wǎng)絡(luò)將部件的原始數(shù)據(jù)、狀態(tài)信息以及故障信息發(fā)送給車載PHM主機(jī),從而完成整車自診斷。列車智能顯示屏顯示診斷信息,并將其通過WTD傳輸至地面。車載PHM系統(tǒng)架構(gòu)示意見圖2。
圖2 車載PHM系統(tǒng)架構(gòu)示意圖Fig.2 Schematic diagram of onboard PHM system
以走行部安全監(jiān)測(cè)為例,其車載PHM系統(tǒng)架構(gòu)如圖3所示。獨(dú)立的車載PHM系統(tǒng)與列車網(wǎng)絡(luò)共享走行部安全監(jiān)測(cè)系統(tǒng)數(shù)據(jù),對(duì)軸溫、平穩(wěn)性、失穩(wěn)、振動(dòng)特性等部件級(jí)數(shù)據(jù)及整車級(jí)數(shù)據(jù)進(jìn)行實(shí)時(shí)運(yùn)算分析,并將處理后的預(yù)警信息和狀態(tài)特征傳輸給列車網(wǎng)絡(luò)主處理單元,然后統(tǒng)一傳輸至列車WTD,最終通過移動(dòng)通信網(wǎng)絡(luò)發(fā)送給地面接收服務(wù)器。
圖3 走行部車載PHM架構(gòu)Fig.3 Onboard PHM architecture of running gear
地面PHM平臺(tái)架構(gòu)按照云計(jì)算的3層框架建設(shè),如圖4所示,其包含基礎(chǔ)設(shè)施層服務(wù)(IaaS 層)、平臺(tái)層服務(wù)(PaaS 層)和軟件層服務(wù)(SaaS層)3部分內(nèi)容[3]。
圖4 地面PHM平臺(tái)架構(gòu)Fig.4 Architecture of ground PHM platform
1.2.1 基礎(chǔ)設(shè)施層服務(wù)
基礎(chǔ)設(shè)施主要包含計(jì)算資源、存儲(chǔ)資源及網(wǎng)絡(luò)資源等硬件設(shè)施。計(jì)算資源包括虛擬服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器和數(shù)據(jù)處理服務(wù)器等。存儲(chǔ)資源主要為物理的服務(wù)器硬盤,負(fù)責(zé)數(shù)據(jù)的統(tǒng)一管理存放,保證數(shù)據(jù)的高可靠性、可用性和冗余性。網(wǎng)絡(luò)資源主要為高速、大容量和安全穩(wěn)定運(yùn)行的企業(yè)私有云。
1.2.2 平臺(tái)層服務(wù)
故障預(yù)警需要盡可能地貫通動(dòng)車組全壽命周期的數(shù)據(jù),實(shí)現(xiàn)不同形式數(shù)據(jù)間的融合和調(diào)用。傳統(tǒng)的數(shù)據(jù)處理方式及系統(tǒng)架構(gòu)很難滿足海量數(shù)據(jù)的快速處理及運(yùn)算分析,而“Hadoop+Spark”云平臺(tái)架構(gòu)具有跨集群、分布式處理龐大數(shù)據(jù)的功能,是現(xiàn)階段組建大數(shù)據(jù)服務(wù)平臺(tái)的首選[4]。多源異構(gòu)數(shù)據(jù)根據(jù)周期、來(lái)源、格式分類接入云平臺(tái),經(jīng)過數(shù)據(jù)清洗、解析后存入到分布式文件系統(tǒng)(Hadoop distributed file system),然后分別通過并行處理框架(MapReduce)及Spark計(jì)算引擎對(duì)靜態(tài)數(shù)據(jù)及實(shí)時(shí)流數(shù)據(jù)進(jìn)行處理,以確保數(shù)據(jù)服務(wù)高效、可靠[5]。
1.2.3 軟件層服務(wù)
軟件層服務(wù)提供車輛運(yùn)行監(jiān)控、故障預(yù)警預(yù)測(cè)、維修作業(yè)預(yù)測(cè)及健康評(píng)估等功能應(yīng)用,其將大數(shù)據(jù)、互聯(lián)網(wǎng)和人工智能等新技術(shù)與動(dòng)車組運(yùn)維檢修相融合,以充分挖掘動(dòng)車組全生命周期數(shù)據(jù)所蘊(yùn)含的價(jià)值,是面向動(dòng)車組運(yùn)維人員實(shí)現(xiàn)故障預(yù)警、維修預(yù)測(cè)及壽命評(píng)估等功能應(yīng)用的門戶。
動(dòng)車組故障預(yù)警需要基于大數(shù)據(jù)平臺(tái)構(gòu)建的針對(duì)具體部件的數(shù)據(jù)模型來(lái)實(shí)現(xiàn)。目前行業(yè)內(nèi)的數(shù)據(jù)模型從技術(shù)類型上可以分為兩類:一類是基于部件設(shè)計(jì)原理的機(jī)理模型,一類是基于人工智能的算法模型。而通過這兩種技術(shù)方法的相互結(jié)合,可以進(jìn)一步構(gòu)建數(shù)字仿真模型,從而以部件關(guān)鍵物理特性來(lái)反映其工作狀態(tài)并提前識(shí)別潛在故障。
目前,新型動(dòng)車組在設(shè)計(jì)階段針對(duì)部分系統(tǒng)或部件實(shí)現(xiàn)了數(shù)字樣機(jī)的構(gòu)建,以數(shù)字化方式表達(dá)產(chǎn)品的設(shè)計(jì)信息,從而對(duì)其尺寸、功能、特性等進(jìn)行模擬仿真。在此基礎(chǔ)上,我們可以將數(shù)字樣機(jī)的概念進(jìn)一步拓展,在動(dòng)車組的服役階段以數(shù)字化方式創(chuàng)建產(chǎn)品物理實(shí)體的數(shù)字仿真模型,對(duì)其在故障發(fā)生前出現(xiàn)的異常趨勢(shì)進(jìn)行預(yù)測(cè)[6]。其思路是以產(chǎn)品設(shè)計(jì)參數(shù)、運(yùn)行狀態(tài)數(shù)據(jù)、造修履歷數(shù)據(jù)及運(yùn)用維護(hù)數(shù)據(jù)為基礎(chǔ),并結(jié)合環(huán)境、線路等全壽命關(guān)聯(lián)數(shù)據(jù),從部件設(shè)計(jì)原理及故障影響因素出發(fā),確定反映部件工作狀態(tài)的核心數(shù)據(jù)項(xiàng)點(diǎn)及其關(guān)聯(lián)數(shù)據(jù)范圍,然后通過數(shù)據(jù)擬合方法分析和驗(yàn)證關(guān)聯(lián)數(shù)據(jù)的有效性,并選用合適的人工智能算法對(duì)故障樣本及歷史數(shù)據(jù)進(jìn)行訓(xùn)練,最終建立虛擬化數(shù)字仿真模型。在此基礎(chǔ)上,需要運(yùn)用機(jī)理分析方法對(duì)模型的各項(xiàng)數(shù)據(jù)權(quán)重進(jìn)行調(diào)優(yōu),使模型效果符合預(yù)期;通過對(duì)核心數(shù)據(jù)項(xiàng)點(diǎn)的監(jiān)測(cè),預(yù)知部件工作狀態(tài)及演變趨勢(shì),從而實(shí)現(xiàn)部件故障預(yù)警及趨勢(shì)預(yù)測(cè)。動(dòng)車組關(guān)鍵部件數(shù)字仿真模型構(gòu)建路線見圖5。
圖5 動(dòng)車組關(guān)鍵部件數(shù)字仿真模型構(gòu)建路線圖Fig.5 Digital simulation model construction roadmap of EMU key components
現(xiàn)實(shí)條件下,無(wú)法獲取動(dòng)車組服役期間所涉及的全部數(shù)據(jù),甚至單個(gè)部件的全部數(shù)據(jù)也幾乎不可能獲取得到。因此,目前我們需要有選擇地針對(duì)特定部件、特定物理維度來(lái)實(shí)現(xiàn)有限的數(shù)字仿真。
牽引電機(jī)是動(dòng)車組動(dòng)力系統(tǒng)的核心部件,其在工作中會(huì)產(chǎn)生熱損耗,若因內(nèi)阻變化、散熱不良等原因?qū)е码姍C(jī)溫度急劇升高,超過其所能承受的最高溫度,則會(huì)造成設(shè)備故障,導(dǎo)致列車晚點(diǎn)或停車。本文以CR400AF型復(fù)興號(hào)高速動(dòng)車組牽引電機(jī)為例,來(lái)說明動(dòng)車組關(guān)鍵部件數(shù)字仿真模型的構(gòu)建思路。
2.2.1 建立實(shí)時(shí)溫度預(yù)警子模型
首先從牽引電機(jī)工作原理出發(fā),梳理分析電機(jī)狀態(tài)核心判定指標(biāo)——電機(jī)定子溫度及其影響關(guān)聯(lián)因素,定義特征變量范圍。判定指標(biāo)既要涵蓋電機(jī)電流、列車速度、牽引級(jí)位、天氣情況(溫度、雨雪)等與溫度直接相關(guān)的特征變量數(shù),也要包括間接影響變量,例如線路區(qū)段的坡道、曲線半徑,其會(huì)影響電機(jī)的牽引功率,從而影響電機(jī)溫度。
然后,采用抽樣方式提取每列動(dòng)車組、每自然月中兩天的運(yùn)行數(shù)據(jù),提取時(shí)需盡量覆蓋不同線路。將抽樣數(shù)據(jù)按照時(shí)間順序進(jìn)行排列并隱藏列號(hào)和車廂信息。隨機(jī)抽取1 000組數(shù)據(jù),通過SPSS軟件對(duì)每個(gè)變量與電機(jī)定子溫度的相關(guān)性進(jìn)行Pearson分析驗(yàn)證。選取相關(guān)度大于0.2、顯著性(雙側(cè))小于0.01的數(shù)據(jù)指標(biāo)來(lái)構(gòu)建模型,符合條件的數(shù)據(jù)指標(biāo)見表1。
表1 電機(jī)溫度關(guān)聯(lián)數(shù)據(jù)相關(guān)性分析Tab. 1 Correlation analysis of motor temperature linked data
再者,篩選出CR400AF復(fù)興號(hào)動(dòng)車組7起牽引電機(jī)歷史故障信息,其均為因電機(jī)繞組絕緣不良而導(dǎo)致的接地常見故障。根據(jù)設(shè)計(jì)原理及數(shù)據(jù)分析可知,這類故障發(fā)生前后均有電機(jī)溫度的較大變化。選取故障發(fā)生前0.5 h內(nèi)的電機(jī)溫度及表1的關(guān)聯(lián)數(shù)據(jù)作為故障樣本,同時(shí)選取50列動(dòng)車組共計(jì)100 h正常歷史數(shù)據(jù)作為正常樣本,與故障樣本組成樣本庫(kù)。當(dāng)前數(shù)據(jù)采集周期為10 s,所以樣本庫(kù)共包含37 260組數(shù)據(jù),每6組數(shù)據(jù)記為一個(gè)樣本,共生成6 210個(gè)樣本,其中正常樣本6 000個(gè),故障樣本210個(gè)。將樣本數(shù)據(jù)隨機(jī)打亂并按照7∶3的比例劃分為訓(xùn)練集和測(cè)試集。訓(xùn)練集共有4 347個(gè)樣本,其中正常樣本4 200個(gè),故障樣本147個(gè);測(cè)試集為1 863個(gè)樣本,其中正常樣本1 800個(gè),故障樣本63個(gè)。采用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法建立1個(gè)3層的牽引電機(jī)溫度預(yù)警神經(jīng)網(wǎng)絡(luò)模型[7],輸入神經(jīng)元包括表1中的數(shù)據(jù)指標(biāo)變量,模型的輸出神經(jīng)元為牽引電機(jī)溫度預(yù)警信息,模型示意如圖6所示。
圖6 牽引電機(jī)溫度神經(jīng)網(wǎng)絡(luò)模型示意圖Fig.6 Schematic diagram of traction motor temperature neural network model
最后,使用訓(xùn)練集樣本數(shù)據(jù)以0.1的學(xué)習(xí)率進(jìn)行模型訓(xùn)練,目標(biāo)相對(duì)誤差為1×10-2,最大迭代數(shù)為5 000次。訓(xùn)練完畢后,利用測(cè)試集數(shù)據(jù)進(jìn)行泛化能力檢測(cè),當(dāng)泛化能力不再提高時(shí),終止訓(xùn)練,完成基于神經(jīng)網(wǎng)絡(luò)算法的牽引電機(jī)溫度實(shí)時(shí)預(yù)警模型的構(gòu)建。模型測(cè)試集預(yù)測(cè)結(jié)果如表2所示,模型準(zhǔn)確率為99.14%,召回率為93.65%。
表2 模型測(cè)試集預(yù)測(cè)結(jié)果Tab. 2 Prediction results model test set
2.2.2 建立溫度趨勢(shì)預(yù)測(cè)子模型
同一車次的發(fā)車和到站時(shí)間以及線路頂棚速度完全相同,所以動(dòng)車組在同一區(qū)間的自身運(yùn)行情況、線路坡度等影響牽引電機(jī)溫度的因素基本一致,僅有環(huán)境溫度屬于不穩(wěn)定變量,其可通過沿線天氣預(yù)報(bào)數(shù)據(jù)獲取?;诖耍覀兛梢詫?shí)現(xiàn)牽引電機(jī)溫度預(yù)測(cè)。
首先,從最近一年的CR400AF復(fù)興號(hào)動(dòng)車組正常運(yùn)行數(shù)據(jù)中按照不同季節(jié)、不同線路對(duì)表1中8項(xiàng)數(shù)據(jù)指標(biāo)變量進(jìn)行抽樣,對(duì)牽引電機(jī)定子溫度進(jìn)行回歸分析,以此構(gòu)建電機(jī)溫度預(yù)測(cè)模型[8]。
然后,通過當(dāng)天開行計(jì)劃、實(shí)時(shí)GPS定位信息與歷史數(shù)據(jù)的關(guān)聯(lián)來(lái)獲取該列動(dòng)車組在后續(xù)區(qū)間的最近一次正常運(yùn)行狀態(tài)數(shù)據(jù),包括速度、轉(zhuǎn)子頻率、直流電壓、擋位、恒速狀態(tài)、線路坡度及電機(jī)電流,并通過互聯(lián)網(wǎng)沿線天氣預(yù)報(bào)數(shù)據(jù)獲取環(huán)境溫度。所有數(shù)據(jù)關(guān)聯(lián)獲取周期為30 min,通過溫度預(yù)測(cè)模型預(yù)測(cè)各牽引電機(jī)正常工作狀態(tài)下后續(xù)30 min的溫度變化趨勢(shì)。
為反映電機(jī)溫度預(yù)測(cè)情況,用某列動(dòng)車組某天的實(shí)際電機(jī)溫度與當(dāng)天預(yù)測(cè)的電機(jī)溫度進(jìn)行對(duì)比驗(yàn)證,結(jié)果見圖7。從數(shù)據(jù)分析結(jié)果來(lái)看,動(dòng)車組行駛工況相對(duì)簡(jiǎn)單(如處于恒速、恒擋位狀態(tài))時(shí)預(yù)測(cè)效果很好;動(dòng)車組行駛工況復(fù)雜(如反復(fù)調(diào)速、牽引制動(dòng)切換頻繁)時(shí)預(yù)測(cè)偏差有所增大。導(dǎo)致此種情況的原因是,復(fù)雜工況下預(yù)測(cè)模型相關(guān)擋位、電機(jī)電流等指標(biāo)變化劇烈,而WTD車地?cái)?shù)據(jù)傳輸周期較長(zhǎng)(10 s),因此無(wú)法完全記錄其變化過程。
圖7 電機(jī)實(shí)際溫度與模型預(yù)測(cè)溫度對(duì)比Fig.7 Comparison between actual motor temperature and model predicted temperature
為進(jìn)一步評(píng)價(jià)預(yù)測(cè)效果,將模型預(yù)測(cè)值與實(shí)際值進(jìn)行擬合分析,見圖8??梢钥闯?,實(shí)際溫度與預(yù)測(cè)溫度趨勢(shì)一致性較好,擬合系數(shù)R2值為0.97,基本符合預(yù)期要求。
圖8 牽引電機(jī)定子溫度預(yù)測(cè)子模型的預(yù)測(cè)值與實(shí)際值擬合分析Fig.8 Fitting analysis between predicted values and actual values of traction motor stator temperature prediction sub model
至此,牽引電機(jī)定子溫度預(yù)測(cè)的數(shù)字仿真模型完成搭建。其功能共包括兩部分:一是來(lái)判定牽引電機(jī)工作狀態(tài)正常與否,以識(shí)別異常并提醒應(yīng)急指揮人員及時(shí)介入;二是獲取電機(jī)正常工作狀態(tài)下后30 min內(nèi)的溫度變化趨勢(shì)信息,并與電機(jī)故障后的實(shí)時(shí)溫度進(jìn)行比對(duì),使應(yīng)急指揮人員能較為直觀地了解電機(jī)異常程度,為后續(xù)的分析決策提供數(shù)據(jù)支撐。
2.2.3 模型應(yīng)用
2017年CR400AF復(fù)興號(hào)動(dòng)車組上線初期,其牽引電機(jī)接地故障率較高,約每百萬(wàn)公里1.4件;2019年2月采取絕緣測(cè)試、改進(jìn)絕緣工藝等措施加強(qiáng)故障預(yù)防后,故障率逐漸下降,與同期整車平均水平持平,約每百萬(wàn)公里0.5件。牽引電機(jī)數(shù)字仿真模型于2020年6月份上線應(yīng)用后,累計(jì)預(yù)防牽引電潛在機(jī)故障40余起,使?fàn)恳姍C(jī)故障率下降至每百萬(wàn)公里0.1件左右,顯著低于以往整車平均水平,詳見圖9。
圖9 CR400AF型動(dòng)車組牽引電機(jī)故障率Fig.9 Failure rate of traction motor for CR400AF EMU
本文從動(dòng)車組故障預(yù)警需求出發(fā),提出了一種車-地?cái)?shù)據(jù)分散處理、分布式大數(shù)據(jù)平臺(tái)構(gòu)建方案;運(yùn)用基于部件故障機(jī)理與神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法,探索構(gòu)建動(dòng)車組關(guān)鍵部件故障預(yù)警模型,并以CR400AF型復(fù)興號(hào)動(dòng)車組牽引電機(jī)的故障預(yù)警及溫度預(yù)測(cè)模型構(gòu)建及應(yīng)用為例,進(jìn)行牽引電機(jī)故障預(yù)警。應(yīng)用結(jié)果顯示,采用該預(yù)警模型后,牽引電機(jī)故障率從每百萬(wàn)公里0.5件下降至每百萬(wàn)公里0.1件??梢姡撃P偷膽?yīng)用提高了應(yīng)急處置效率。
由于目前動(dòng)車組制造、運(yùn)維及檢修的全場(chǎng)景數(shù)據(jù)尚未全部貫通,故障預(yù)警、預(yù)測(cè)的研究與應(yīng)用仍存在諸多限制。因此,需要通過不斷積累現(xiàn)有數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),提出多源異構(gòu)數(shù)據(jù)研究需求,推動(dòng)動(dòng)車組全壽命周期數(shù)據(jù)貫通,逐步優(yōu)化、完善現(xiàn)有的數(shù)據(jù)采集、傳輸方式,進(jìn)而通過研究成果的推廣落地引導(dǎo)動(dòng)車組生產(chǎn)制造、故障診斷、運(yùn)維檢修等環(huán)節(jié)現(xiàn)有機(jī)制的不斷變革。