馮富人
(同濟(jì)大學(xué) 鐵道與城市軌道交通研究院,上海 201804)
軌道交通車輛在服役期間會產(chǎn)生巨量的數(shù)據(jù),如列車軸速、受電弓電壓、空氣彈簧壓力等。隨著列車運(yùn)行,這些數(shù)據(jù)會被動態(tài)地實(shí)時(shí)更新,形成了區(qū)別于傳統(tǒng)數(shù)據(jù)庫中靜態(tài)數(shù)據(jù)的流數(shù)據(jù)。這些數(shù)據(jù)反映了列車的狀態(tài)信息,對于保障列車安全運(yùn)營和健康管理而言具有重要意義,而流數(shù)據(jù)實(shí)時(shí)性的特點(diǎn)也令其較歷史數(shù)據(jù)具有更多有用的信息。傳統(tǒng)的閾值判斷方法過多地關(guān)注當(dāng)前數(shù)據(jù)流的數(shù)值表現(xiàn),卻忽視了流數(shù)據(jù)變化趨勢所隱藏的信息:如果閾值的裕量過大,則服役前期的識別效果差;若閾值的裕量過小,則隨著性能的衰退,服役后期的誤報(bào)率明顯提高。
流數(shù)據(jù)處理方法重在能夠?qū)崟r(shí)有效地處理數(shù)據(jù)流,其要求算法的時(shí)間復(fù)雜度低,以滿足流速要求,主要方法包括滑動窗體技術(shù)和關(guān)聯(lián)技術(shù)等[1]。Chang Joong Hyuk[2]和李國徽[3]等針對滑動時(shí)間窗方法分別進(jìn)行了研究,以滿足其短時(shí)流數(shù)據(jù)中模式信息獲取的需要。Seo Bok I, Kim Jae In等[4]提出了基于流環(huán)境的關(guān)聯(lián)算法,能夠快速地從提取的數(shù)據(jù)項(xiàng)中發(fā)現(xiàn)關(guān)聯(lián)規(guī)則。具體到應(yīng)用層面,基于內(nèi)存的分布式流處理框架Spark Streaming是現(xiàn)今應(yīng)用最為廣泛的流數(shù)據(jù)處理平臺,其能夠較好地實(shí)現(xiàn)流數(shù)據(jù)信息的接收、快速處理和計(jì)算需要。基于Spark平臺,吳海波、施式亮等[5]建立了瓦斯?jié)舛攘鲾?shù)據(jù)異常檢測系統(tǒng),提高了瓦斯風(fēng)險(xiǎn)評價(jià)時(shí)效。聶睿和黃鵬[6]將歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)進(jìn)行聯(lián)合分析,提高了實(shí)時(shí)采集數(shù)據(jù)的吞吐量以及準(zhǔn)實(shí)時(shí)分析的計(jì)算速度,提高了飛機(jī)試飛效率。李欣[7]實(shí)現(xiàn)了對交通流數(shù)據(jù)的高效處理以及預(yù)測,但由于Spark平臺要求進(jìn)行分布式計(jì)算,對算力要求高,因此難以滿足在線單機(jī)設(shè)備的相關(guān)要求。劉光俊、張杜瑋等[8]也只是從合理性角度設(shè)計(jì)了一車一協(xié)議的可配置化方案,為PHM系統(tǒng)展示和數(shù)據(jù)挖掘應(yīng)用提供了數(shù)據(jù)基礎(chǔ)?;跀?shù)據(jù)驅(qū)動對列車狀態(tài)進(jìn)行診斷和健康管理已經(jīng)得到越來越廣泛的應(yīng)用。秦方方、鄭財(cái)暉等[9]針對通用超限報(bào)警檢測方法存在的不足,提出一種供電系統(tǒng)接地絕緣故障實(shí)時(shí)診斷與預(yù)測方法。潘瑩[10]從數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用3個層級來實(shí)現(xiàn)對地鐵車輛的故障預(yù)測和健康管理。
鑒于閾值判斷方法對設(shè)備性能衰退方面分析能力的不足,結(jié)合列車流數(shù)據(jù)的動態(tài)性、實(shí)時(shí)性和海量性特點(diǎn),本文針對列車運(yùn)行過程中流數(shù)據(jù)特征表現(xiàn)異常的實(shí)時(shí)報(bào)警和性能衰退監(jiān)測問題,提出了一種基于一致性表現(xiàn)的流數(shù)據(jù)分析方法;為驗(yàn)證該方法,開發(fā)了一套應(yīng)用于多功能車輛總線(multifunction vehicle bus,MVB)的智能設(shè)備,其能夠滿足流數(shù)據(jù)處理和列車在線狀態(tài)監(jiān)測的需要;最后,基于列車實(shí)測數(shù)據(jù)和故障注入技術(shù),對所提方法和所開發(fā)的設(shè)備進(jìn)行了驗(yàn)證。
本文提出一種流數(shù)據(jù)處理方法,其重點(diǎn)在于針對異常特征進(jìn)行實(shí)時(shí)報(bào)警,同時(shí)基于長時(shí)間序列內(nèi)數(shù)據(jù)性能的變化規(guī)律,對列車設(shè)備健康狀態(tài)進(jìn)行分析。其基本思想在于某一系統(tǒng)或設(shè)備的運(yùn)行參數(shù)或特征應(yīng)當(dāng)按設(shè)計(jì)要求表現(xiàn)出較好的穩(wěn)定性;對于偏移設(shè)計(jì)范圍的值,則應(yīng)被視為異常情況。由浴盆曲線可知,隨著后期服役時(shí)間的增長,設(shè)備出現(xiàn)異常的概率大大增加,表現(xiàn)在數(shù)據(jù)方面,即狀態(tài)參數(shù)明顯偏移目標(biāo)數(shù)值,出現(xiàn)大范圍波動的情況[11]。因此可以從聚類的質(zhì)心遷移規(guī)律、離散程度和離群點(diǎn)的偏移量等角度對流數(shù)據(jù)進(jìn)行實(shí)時(shí)分析。
設(shè)算法的滑動時(shí)間窗寬度為m,即一次分析的有序數(shù)據(jù)集合D=(a1,a2, …,am)。當(dāng)有新的數(shù)據(jù)增加時(shí),將其添加到集合的末尾,并彈出集合中排序第一也就是距今最久的數(shù)據(jù)點(diǎn),以保持時(shí)間窗的大小不變。不失一般性,以兩特征為例進(jìn)行分析。對數(shù)據(jù)集合D,依據(jù)質(zhì)心公式其若有質(zhì)心P,則對任意一點(diǎn)ai(ai∈D;i=1, 2, …,m),其平均密度ρ的計(jì)算如下:
式中:d(ai,P)——ai到P的歐式距離。
ρ表征了聚類的離散程度。ρ越大,說明數(shù)據(jù)越集中,數(shù)據(jù)的一致性越好。若t時(shí)刻平均密度ρt小于能接收的最小密度ρmin,即數(shù)據(jù)離散程度過大,則視設(shè)備為需要進(jìn)行調(diào)整和檢修。
若新增數(shù)據(jù)點(diǎn)am+1出現(xiàn)明顯偏離聚類情況,即d(am+1,P)>ε,其中ε為聚類最大的鄰域范圍,則設(shè)定該超過聚類鄰域的點(diǎn)為離群點(diǎn),并予以報(bào)警,這也就是流數(shù)據(jù)分析的動態(tài)實(shí)時(shí)報(bào)警功能。一般來說,ε由設(shè)備的數(shù)值設(shè)計(jì)冗余決定,其在設(shè)備性能優(yōu)良階段明顯大于聚類的半徑。
隨時(shí)序變化,數(shù)據(jù)集更新為D′=(aT+1,aT+2,…,aT+m),其質(zhì)心由P遷移到P′。隨著數(shù)據(jù)集的不斷更新,根據(jù)質(zhì)心遷移函數(shù)f(P,t),在T時(shí)刻,由質(zhì)心到設(shè)定檢修線的距離d(PT,Ljx)小于設(shè)定值djx,則設(shè)定為設(shè)備的狀態(tài)難以滿足服役要求,需要進(jìn)行檢修和更換。這也就是流數(shù)據(jù)從性能變化趨勢中挖掘的有效信息。
圖1示出流數(shù)據(jù)分析方法在不同服役階段數(shù)據(jù)聚類表現(xiàn)和實(shí)時(shí)報(bào)警情況的示意。圖1(a)示出服役狀態(tài)初期設(shè)備的性能表現(xiàn)。可以看到,聚類情況十分明顯,聚類半徑小,密度大。落在聚類鄰域ε外的點(diǎn)均被判定為離群點(diǎn)并予以報(bào)警。隨著服役期的增長,狀態(tài)過渡到圖1(b)所示狀態(tài),其聚類半徑增大,密度減小,且隨著整體性能的衰退,聚類的質(zhì)心發(fā)生偏移。因?yàn)橘|(zhì)心的遷移,早期離群點(diǎn)在此時(shí)很可能不再被判定為離群點(diǎn),即設(shè)備的整體性能出現(xiàn)了衰退現(xiàn)象,該特征表現(xiàn)已成為主流趨勢。隨著服役時(shí)間的繼續(xù)增長,狀態(tài)發(fā)展至圖1(c)所示情況,可以看到,聚類偏移明顯,數(shù)據(jù)離散程度大,其不滿足預(yù)期要求的點(diǎn)的出現(xiàn)概率大大提高。
圖1 不同服役階段數(shù)據(jù)聚類表現(xiàn)和實(shí)時(shí)報(bào)警情況示意Fig.1 Schematic diagrams of data clustering performance and real-time alarm conditions in different service stages
可以利用反映數(shù)據(jù)數(shù)值表現(xiàn)的、到檢修線距離djx和反映數(shù)據(jù)離散程度的最小密度ρmin來對設(shè)備提出檢修策略。預(yù)警鄰域范圍ε需要針對分析的對象并結(jié)合專家經(jīng)驗(yàn)進(jìn)行設(shè)定,以避免出現(xiàn)過高的誤報(bào)率,而ρmin和djx可以通過對歷史數(shù)據(jù)的訓(xùn)練并結(jié)合設(shè)備的檢修周期和安全等級等參數(shù)進(jìn)行設(shè)定。
本文所提出的流數(shù)據(jù)分析方法的優(yōu)勢在于:
(1)不會因少數(shù)異常值影響對性能衰退結(jié)果的判斷,對設(shè)備狀態(tài)的異常表現(xiàn)只會進(jìn)行報(bào)警,而長時(shí)間窗的計(jì)算沖淡了少次數(shù)異常的影響;
(2)可以基于不斷更新的流數(shù)據(jù)對數(shù)據(jù)表現(xiàn)進(jìn)行實(shí)時(shí)地動態(tài)響應(yīng);
(3)從數(shù)值表現(xiàn)和數(shù)據(jù)離散程度兩個角度對趨勢進(jìn)行分析;
(4)計(jì)算方式相對容易,較神經(jīng)網(wǎng)絡(luò)等方法而言算力少,可滿足在線單機(jī)測試設(shè)備計(jì)算能力的要求。
流數(shù)據(jù)處理的關(guān)鍵在于實(shí)時(shí)準(zhǔn)確地獲取列車運(yùn)行狀態(tài)參數(shù),進(jìn)行快速分析后,將結(jié)果加以反饋。傳統(tǒng)安裝傳感器的方式成本高,布置復(fù)雜,且難以多方面獲取到列車狀態(tài)信息來實(shí)現(xiàn)多變量聯(lián)合分析和信息融合。為驗(yàn)證和應(yīng)用所提流數(shù)據(jù)分析方法,本文開發(fā)了一種適用于MVB總線網(wǎng)絡(luò)的智能監(jiān)測設(shè)備(圖2),其主要包括
(1)負(fù)責(zé)數(shù)據(jù)處理和算法應(yīng)用的工控機(jī);
(2)負(fù)責(zé)網(wǎng)絡(luò)對接的MVB網(wǎng)卡網(wǎng)絡(luò)接口單元(network interface unit, NIU);
(3)負(fù)責(zé)數(shù)據(jù)遠(yuǎn)程發(fā)送的遠(yuǎn)程數(shù)據(jù)發(fā)送模塊(data transfer unit, DTU)及供電等外圍電路,其能夠根據(jù)MVB協(xié)議獲取總線過程數(shù)據(jù)。
圖2 設(shè)備外觀與內(nèi)部結(jié)構(gòu)Fig.2 Appearance and internal structure of the equipment
MVB總線是應(yīng)用于車廂或者固定編組這一特定范圍內(nèi)的通信網(wǎng)絡(luò),其為車廂內(nèi)諸多功能(如門控、制動、空調(diào)、照明等)的自動實(shí)現(xiàn)、消息的傳送、資源的共享及各設(shè)備之間的合理配合提供了可靠、順暢的信息交換通道[12]。智能監(jiān)測設(shè)備作為MVB總線網(wǎng)絡(luò)中的一個節(jié)點(diǎn)出現(xiàn),其安裝位置如圖3所示。
圖3 設(shè)備安裝位置Fig.3 Installation site of the equipment
在得到分析結(jié)果后,一方面,智能監(jiān)測設(shè)備將在源端口上利用廣播方式通過總線發(fā)送給列車網(wǎng)絡(luò)控制系統(tǒng)(train control and management system,TCMS),以便列車控制系統(tǒng)對實(shí)時(shí)報(bào)警的結(jié)果加以研判;另一方面,為更加有效地保存和綜合利用列車數(shù)據(jù),進(jìn)一步彌補(bǔ)單機(jī)計(jì)算能力的不足,該設(shè)備將部分加工后的信息通過DTU模塊并利用4G網(wǎng)絡(luò)發(fā)送到云端的服務(wù)器中。其傳輸方式如圖4所示。
圖4 分析結(jié)果的傳輸方式Fig.4 Transmission method of analysis results
為解決列車運(yùn)行線路環(huán)境中可能存在的網(wǎng)絡(luò)信號不佳等問題,對設(shè)備與服務(wù)器接收程序制定了相應(yīng)的校驗(yàn)-重傳機(jī)制,以保障在軌運(yùn)行期間數(shù)據(jù)保存的準(zhǔn)確性和完整性。列車智能運(yùn)維團(tuán)隊(duì)一方面可以通過列車通信網(wǎng)絡(luò)實(shí)時(shí)監(jiān)測列車狀態(tài);另一方面也可以利用手機(jī)隨時(shí)隨地地觀察其性能表現(xiàn)、故障狀態(tài)、運(yùn)行里程及綜合評分等信息,從而有的放矢地指導(dǎo)列車的健康維護(hù)。
為驗(yàn)證本文所提方法和設(shè)備的有效性和實(shí)用性,在實(shí)驗(yàn)室內(nèi)模擬列車總線MVB網(wǎng)絡(luò)環(huán)境,基于列車實(shí)測數(shù)據(jù)并在數(shù)據(jù)中根據(jù)需求注入偶發(fā)性異常故障和衰退性故障進(jìn)行測試驗(yàn)證。
測試數(shù)據(jù)的來源為某地鐵列車的在線測試數(shù)據(jù)。選用某公司生產(chǎn)的MVB主站模擬列車MVB網(wǎng)絡(luò)環(huán)境,數(shù)據(jù)中心(上位機(jī))將保存的實(shí)測列車數(shù)據(jù)利用故障模擬軟件注入部分故障或異常后,以串口通信的方式發(fā)送給MVB主站,主站的EMD接口與設(shè)備相連接。列車測試與實(shí)驗(yàn)室測試環(huán)境如圖5所示。
圖5 數(shù)據(jù)的采集與實(shí)驗(yàn)室的環(huán)境模擬Fig.5 Data collection and laboratory environment simulation
MVB主站具有模擬功能,能夠模擬出多個包含源端口和宿端口的虛擬設(shè)備來對設(shè)備進(jìn)行測試。數(shù)據(jù)中心(上位機(jī))在通過故障注入模擬出總線發(fā)送的數(shù)據(jù)后,首先將其轉(zhuǎn)化為MVB主站能識別的傳輸格式,然后根據(jù)設(shè)備軟件所面向的MVB協(xié)議,將發(fā)送數(shù)據(jù)按照端口類型和端口長度進(jìn)行配置,配置成功,設(shè)備就能直接與模擬設(shè)備的對應(yīng)端口進(jìn)行信息的接發(fā),也就意味著設(shè)備可以直接應(yīng)用于MVB協(xié)議對應(yīng)的列車總線網(wǎng)絡(luò)中。圖6示出實(shí)驗(yàn)室內(nèi)MVB網(wǎng)絡(luò)環(huán)境示意。
圖6 實(shí)驗(yàn)室內(nèi)MVB網(wǎng)絡(luò)環(huán)境示意Fig.6 Schematic diagram of MVB network environment in the laboratory
本文以列車氣制動系統(tǒng)為主要測試分析對象,同時(shí)參考風(fēng)源系統(tǒng)、軸速控制裝置等。列車氣制動系統(tǒng)中,制動缸壓力作用于基礎(chǔ)制動裝置,通過閘瓦或制動盤將列車高速運(yùn)行時(shí)的巨大動能轉(zhuǎn)化為熱能。利用黑箱理論[13]對列車氣制動系統(tǒng)進(jìn)行分析,制動缸壓力P是氣制動系統(tǒng)氣路部分輸出的最后結(jié)果,其直接影響制動能力的好壞(圖7)。
圖7 制動缸壓力變化與特征選取Fig.7 Change of brake cylinder pressure and feature selection
一般而言,選取制動缸壓力上升時(shí)間(表征制動缸的快速響應(yīng)能力,其中a和b為小于1的參數(shù),需要根據(jù)制動缸壓力的數(shù)值表現(xiàn)選擇特征)和制動缸的穩(wěn)態(tài)壓力(表征制動能力的強(qiáng)弱)為特征進(jìn)行分析。而這些特征又與列車載荷和制動級位等有關(guān),故分析時(shí)需要對其進(jìn)行標(biāo)準(zhǔn)化處理,將其變?yōu)闊o量綱的值。
測試通過上位機(jī)中的故障注入功能與驗(yàn)證仿真平臺軟件注入故障信息,如圖8所示。
圖8 上位機(jī)故障注入軟件Fig.8 Upper computer fault injection software
測試中發(fā)送的信息包括制動指令及空簧壓力、軸速、總風(fēng)壓力、各軸制動缸壓力等物理量信息。測試的內(nèi)容包括:
(1)偶發(fā)性故障測試。注入添加不同程度的偶發(fā)性異常,以檢驗(yàn)算法是否能夠?qū)ζ溥M(jìn)行識別;
(2)衰退性故障測試。注入衰退性故障,即依據(jù)設(shè)定的衰減函數(shù),對數(shù)據(jù)造成持續(xù)性的下降與幅值更大的噪聲干擾,觀測其質(zhì)心變化情況及聚類的密度變化情況,假定了一條檢修線,觀測算法是否能在相應(yīng)時(shí)刻提出相關(guān)建議;
(3)數(shù)據(jù)通路測試。對設(shè)備的分析結(jié)果經(jīng)總線上傳、云端發(fā)送和手機(jī)界面顯示的數(shù)據(jù)通路進(jìn)行驗(yàn)證。
以每次制動為一個分析點(diǎn),其制動缸壓力上升特征和穩(wěn)態(tài)壓力作為兩個特征(標(biāo)準(zhǔn)化處理后),進(jìn)行第 1~100,101~200和201~300次制動過程的流數(shù)據(jù)分析。期間,每一階段隨機(jī)注入7次偶發(fā)性故障,全程持續(xù)注入衰退性故障,利用主站模擬的分析結(jié)果接收宿端口對結(jié)果進(jìn)行觀察,同時(shí)利用云端服務(wù)器對分析結(jié)果加以記錄,結(jié)果如圖9所示。
圖9 試驗(yàn)測試結(jié)果Fig.9 Results of the test
結(jié)果顯示,第1~100次突發(fā)性異常識別率為85.7%,第101~200次突發(fā)性異常識別率為71.4%,第201~300次突發(fā)性異常識別率為57.1%。造成識別率降低的主要原因是性能衰退后注入的偶發(fā)故障導(dǎo)致數(shù)據(jù)又偏離到正常的區(qū)域帶內(nèi),致使系統(tǒng)無法正確識別。而質(zhì)心偏移軌跡為(30.245 → 31.872 →32.316,77.616 →78.012→77.425),特征1變化明顯基本滿足要求,而特征2變化幅度不大,且出現(xiàn)了數(shù)據(jù)的逆向變化。
由圖9可以看到,隨著偶發(fā)性故障和衰退性故障的添加,聚類半徑越來越大,數(shù)據(jù)特征出現(xiàn)較大的浮動和離散,而聚類的質(zhì)心也發(fā)生了遷移。同時(shí),流數(shù)據(jù)方法對偶發(fā)性故障進(jìn)行了報(bào)警,隨著性能的逐漸退化,開始予以報(bào)警的點(diǎn)因性能的變化將不再成為報(bào)警點(diǎn),滿足了動態(tài)異常過程識別的需要,而非單純地根據(jù)單次制動過程制動缸壓力的數(shù)值表現(xiàn)進(jìn)行對異常的判斷,且識別率大于50%,整體而言滿足了設(shè)計(jì)要求。但也可以看到,質(zhì)心偏移軌跡仍需進(jìn)行更為精準(zhǔn)的優(yōu)化與參數(shù)校準(zhǔn),從而避免檢修預(yù)警方式出現(xiàn)問題。
為解決列車運(yùn)行過程中對故障或設(shè)備異常表現(xiàn)進(jìn)行實(shí)時(shí)報(bào)警的問題,同時(shí)基于長時(shí)間序列內(nèi)數(shù)據(jù)性能的變化規(guī)律對列車設(shè)備健康狀態(tài)進(jìn)行分析,本文從數(shù)據(jù)特征一致性角度出發(fā)提出了一種流數(shù)據(jù)分析方法,研究和設(shè)計(jì)了一套適用于MVB總線的智能監(jiān)測設(shè)備,實(shí)現(xiàn)了“列車-設(shè)備-手機(jī)端”的列車健康狀態(tài)分析系統(tǒng),并以制動系統(tǒng)為例,基于實(shí)測數(shù)據(jù)與故障注入技術(shù),在實(shí)驗(yàn)室模擬的列車MVB網(wǎng)絡(luò)環(huán)境下對所提方法和研制的設(shè)備進(jìn)行了驗(yàn)證。結(jié)果表明,本文所提方法和研制的設(shè)備能滿足列車動態(tài)異常過程識別的需要。為了提高方法的精度和異常過程識別的準(zhǔn)確性,后續(xù)將利用某一特定列車的真實(shí)歷史數(shù)據(jù)對方法進(jìn)行訓(xùn)練和優(yōu)化;通過對聚類質(zhì)心遷移曲線和聚類半徑變化函數(shù)的研究,更好地修正異常過程判別條件。