孔令坤 中國(guó)鐵路上海局集團(tuán)有限公司海高鐵基礎(chǔ)設(shè)施段
上海高鐵基礎(chǔ)設(shè)施段地處長(zhǎng)三角地區(qū),管內(nèi)供電管轄接觸網(wǎng)延展里程2 000.32條公里,是全路第一批踐行綜合養(yǎng)修模式的設(shè)備管理單位。隨著管內(nèi)滬寧、滬杭高鐵先后邁過(guò)首個(gè)“十年周期”,接觸網(wǎng)設(shè)備老化問(wèn)題日趨凸顯、動(dòng)態(tài)監(jiān)測(cè)缺陷日益增多。為了不斷發(fā)掘檢測(cè)數(shù)據(jù)潛力,提高設(shè)備質(zhì)量,我們立足自身養(yǎng)修經(jīng)驗(yàn),引進(jìn)大數(shù)據(jù)分析算法,在實(shí)踐中摸索出一套動(dòng)檢數(shù)據(jù)的分析方法,幫助我們從龐大的檢測(cè)數(shù)據(jù)中找到薄弱設(shè)備,提高接觸網(wǎng)的運(yùn)行質(zhì)量和可靠性。
接觸網(wǎng)動(dòng)態(tài)監(jiān)測(cè)裝備包括高鐵綜合檢測(cè)車(簡(jiǎn)稱1C)和運(yùn)營(yíng)動(dòng)車組車載檢測(cè)裝置(簡(jiǎn)稱3C),用于測(cè)量升弓條件下的接觸線幾何參數(shù)、接觸壓力、燃弧量等參數(shù)。1C和3C裝置的測(cè)量原理不同,因此其測(cè)量值和下發(fā)缺陷也有很大不同,數(shù)據(jù)分析時(shí)要綜合考慮。
(1)1C裝置和3C裝置的幾何參數(shù)測(cè)量模塊不同,前者采用雙線陣相機(jī)和視覺(jué)三角測(cè)量法,后者采用圖像深度學(xué)習(xí)技術(shù)進(jìn)行識(shí)別,但都滿足±10 mm以內(nèi)的測(cè)量精度。但由于不同車型在同一曲線軌道下的的橫滾、橫擺幅度不同,拉出值參數(shù)測(cè)量值存在較大差別。
(2)1C裝置和3C裝置的檢測(cè)受電弓型號(hào)不同,前者采用DSA380或SS400型雙滑板受電弓,后者普遍采用CX-PG型單滑板受電弓,其接觸力和燃弧特性都有很大區(qū)別。
(3)1C裝置和3C裝置的燃弧量測(cè)量原理不同,前者采用紫外相機(jī),對(duì)一跨內(nèi)燃弧像素出現(xiàn)時(shí)間進(jìn)行累加,后者采用對(duì)銅金屬燃燒光線波段敏感的紅外熱成像相機(jī)對(duì)接觸網(wǎng)進(jìn)行測(cè)溫并計(jì)算單次燃弧的持續(xù)時(shí)間。
由于不同檢測(cè)車受電弓的型號(hào)、開(kāi)閉口、初始?jí)毫Σ煌瑱z測(cè)車通過(guò)時(shí)的車速、環(huán)境溫度、濕度、電磁干擾因素也不相同,所以每次檢測(cè)的接觸力、燃弧值存在顯著差異。此外檢測(cè)系統(tǒng)采用的機(jī)車GYK里程,與實(shí)際里程存在隨機(jī)誤差,因此我們?cè)诖髷?shù)據(jù)分析前要對(duì)單次檢車情況進(jìn)行評(píng)估,剔除無(wú)效數(shù)據(jù)。
我們通過(guò)pyqt5界面開(kāi)發(fā)庫(kù)和pandas數(shù)據(jù)處理庫(kù)開(kāi)發(fā)數(shù)據(jù)批量導(dǎo)入分析工具,對(duì)每次檢測(cè)下發(fā)的數(shù)據(jù)進(jìn)行篩選與統(tǒng)計(jì)分析,分別計(jì)算每次檢測(cè)的缺陷數(shù)量占比、達(dá)速率(包括統(tǒng)計(jì)得分長(zhǎng)度、不得分長(zhǎng)度、不評(píng)價(jià)長(zhǎng)度、未檢測(cè)長(zhǎng)度等)、得分與非得分區(qū)段的CDI分量分析(統(tǒng)計(jì)CDI各分量的平均值、中位值、標(biāo)準(zhǔn)差等)、錨段CDI分量的得分分布情況,并進(jìn)行可視化,分析各測(cè)量傳感器的工作狀態(tài)是否良好。單次檢測(cè)數(shù)據(jù)分析結(jié)果如圖1所示。
圖1 單次動(dòng)檢數(shù)據(jù)分析界面
如圖1所示,本次檢測(cè)CDI管理評(píng)分僅為64.5%,且CDI不得分錨段較多。從CDIA的平均分和頻數(shù)分布可以看出,絕大多數(shù)錨段的燃弧得分接近滿分,說(shuō)明燃弧傳感器工作狀態(tài)異常。缺陷中占比最大的是接觸力缺陷,共有17個(gè),但從接觸力均值和頻數(shù)分布看,全線的接觸力得分主要集中在較小的范圍,接觸力傳感器工作正常。
動(dòng)檢數(shù)據(jù)具有以下幾個(gè)特點(diǎn):數(shù)據(jù)量龐大、多次檢測(cè)一致性不強(qiáng)、里程上存在隨機(jī)誤差。因此我們需要根據(jù)動(dòng)檢數(shù)據(jù)的特點(diǎn),運(yùn)用大數(shù)據(jù)分析方法,篩選經(jīng)常存在檢測(cè)大值的薄弱區(qū)段,并分析其發(fā)生發(fā)展過(guò)程。
圖2是某高鐵1-5月整條線路各單元CDI得分隨里程變化情況,雖然單個(gè)錨段的CDI曲線在不同月份略有不同,但其整體變化趨勢(shì)呈現(xiàn)出明顯的規(guī)律,在K81、K148處存在明顯高于附近的大值。
圖2 某高鐵1-5月錨段CDI曲線
通過(guò)pygraph庫(kù)生成多次CDI數(shù)據(jù)曲線對(duì)比圖,通過(guò)同步平移里程坐標(biāo),對(duì)比同一錨段不同日期的CDI得分變化。圖3是某高鐵線路K60-K80范圍內(nèi)四次檢測(cè)的CDI曲線,為排除車型不同的干擾,均采用CRH2C-2150的檢測(cè)數(shù)據(jù)??梢钥闯鰴z測(cè)速度對(duì)CDI得分影響較大,相同速度下得分變化趨勢(shì)一致性較強(qiáng)。通過(guò)對(duì)比多次檢測(cè)曲線的CDI大值的一致性,可以進(jìn)一步確認(rèn)CDI超標(biāo)錨段。
圖3 同一線路多次CDI檢測(cè)曲線對(duì)比界面
CDI原始數(shù)據(jù)是按錨段逐行排列的,分析某個(gè)錨段的歷史變化情況,首先需要將同一錨段的不同次檢測(cè)的數(shù)據(jù)劃分到一組。因此我們引入了聚類算法,按照起止公里標(biāo)相近的原則將錨段數(shù)據(jù)進(jìn)行分組。
常用的聚類算法有K-Means、均值偏移、DBSCAN和層次聚類等。由于在聚類前不確定簇的個(gè)數(shù),原始數(shù)據(jù)包含離群點(diǎn)(例如某一次檢測(cè)的里程誤差過(guò)大),且需同時(shí)考慮錨段公里標(biāo)和錨段長(zhǎng)度兩個(gè)量的相近程度,擬選用基于密度空間的無(wú)監(jiān)督學(xué)習(xí)算法DBSCAN進(jìn)行聚類。
對(duì)我段兩年來(lái)共計(jì)85 242條CDI錨段數(shù)據(jù)進(jìn)行聚類試驗(yàn),密度函數(shù)選用起、止公里標(biāo)差值的歐式距離,最小鄰近距離設(shè)為100 m,最小簇大小設(shè)置為3,本次聚類成功的數(shù)據(jù)條數(shù)為83 817,占比98.3%,滿足要求。
通過(guò)聚類計(jì)算,每組聚類成功的CDI錨段數(shù)據(jù)都獲得了一個(gè)簇編號(hào),簇編號(hào)相同的錨段即為同一錨段。然后按照FRM算法依次對(duì)每一簇?cái)?shù)據(jù)進(jìn)行統(tǒng)計(jì),即計(jì)算F(近度:最近一次不達(dá)標(biāo)時(shí)間)、R(頻度:不達(dá)標(biāo)次數(shù)÷達(dá)速次數(shù))、M(額度:CDI超標(biāo)最大值)、不達(dá)標(biāo)時(shí)間分布(每季度不達(dá)標(biāo)次數(shù))。最后編寫(xiě)用戶界面,對(duì)分類結(jié)果分線別、行別進(jìn)行展示,如圖4所示:點(diǎn)擊左表中某一錨段,右側(cè)顯示每次檢測(cè)結(jié)果并繪制柱形圖,分析該錨段CDI各分量的歷史變化情況。
圖4 不得分CDI錨段歷史分析
接觸網(wǎng)的動(dòng)檢缺陷數(shù)據(jù)是指1C或3C裝置下發(fā)的缺陷及報(bào)警數(shù)據(jù),其特點(diǎn)是一級(jí)缺陷數(shù)量較少,二級(jí)缺陷數(shù)量龐大且偶發(fā)性強(qiáng)。缺陷分析中我們最關(guān)注的缺陷有兩種:固定處所頻繁檢出的、首次檢出的。前者表示某處接觸網(wǎng)經(jīng)常處于一種不良的運(yùn)行工況中,后著則表示設(shè)備狀態(tài)可能發(fā)生了突變。因此我們首先需要分析缺陷發(fā)生的頻繁程度。
動(dòng)檢缺陷數(shù)據(jù)的聚類同樣根據(jù)缺陷里程參數(shù)的分布密度,缺陷里程數(shù)據(jù)跟CDI數(shù)據(jù)中的里程數(shù)據(jù)類似,同樣存在50 m左右的誤差,但使用DBSCAN進(jìn)行聚類的效果并不好。因?yàn)槿毕輸?shù)據(jù)的里程只有1維,且沒(méi)有明顯間隔,導(dǎo)致DBSCAN聚類后的簇寬度會(huì)達(dá)到2 km或更長(zhǎng)。為了縮小簇寬度,我們選用里程窗滑動(dòng)求頻次的方法進(jìn)行聚類,具體方法是:選用固定公里標(biāo)窗口按10 m步進(jìn)平移,依次求窗口范圍內(nèi)的缺陷數(shù)量,得到全線的頻數(shù)曲線,然后利用finkpeak算法找到頻率峰值所在的位置。圖5是某線K50-K75內(nèi)接觸線接觸力缺陷頻數(shù)曲線(100 m窗),叉號(hào)表示用finkpeak算法找到的頻數(shù)曲線波峰。
圖5 某線K50-K75范圍內(nèi)接觸力缺陷頻數(shù)分布情況
把計(jì)算得到的某個(gè)峰值里程數(shù)據(jù)代入動(dòng)檢缺陷庫(kù)查詢,得到一個(gè)缺陷信息分組,分組內(nèi)的缺陷視為同一接觸網(wǎng)設(shè)備產(chǎn)生。對(duì)每個(gè)信息簇統(tǒng)計(jì)P(近度:最近一次產(chǎn)生缺陷時(shí)間)、F(頻度:最近兩年每季度的缺陷個(gè)數(shù))、M(幅度:缺陷最大值),得到該組缺陷的分類統(tǒng)計(jì)信息。最后利用pygraph可視化工具實(shí)時(shí)輸出每組缺陷關(guān)于日期、里程的散點(diǎn)分布圖,進(jìn)一步確認(rèn)缺陷的集中程度,具體界面如圖6。
圖6 動(dòng)檢缺陷聚類分組分析界面
前文介紹了從龐大的數(shù)據(jù)中篩選高頻缺陷和突發(fā)缺陷的方法,實(shí)現(xiàn)了對(duì)缺陷庫(kù)的動(dòng)態(tài)分組管理,大大減少了需要關(guān)注數(shù)據(jù)的個(gè)數(shù)。為了更有效地指導(dǎo)檢修,還需要對(duì)缺陷數(shù)據(jù)進(jìn)行深度分析,判斷缺陷產(chǎn)生的原因和危險(xiǎn)程度。
接觸網(wǎng)是一個(gè)系統(tǒng)性工程,因此我們要充分利用各種數(shù)據(jù),通過(guò)橫向關(guān)聯(lián)對(duì)比、縱向歷史追溯等方法,全面掌握缺陷設(shè)備的狀態(tài)變化。同樣,對(duì)同類型缺陷進(jìn)行專項(xiàng)綜合分析,找出各種可能原因中的共性因素,不僅可以幫我們找到快速識(shí)別該類型缺陷的方法,也可以指導(dǎo)現(xiàn)場(chǎng)對(duì)同類設(shè)備進(jìn)行補(bǔ)強(qiáng),是一種靈活、有效地提高設(shè)備可靠性的方法。
我們編制程序,自動(dòng)將缺陷信息根據(jù)里程關(guān)聯(lián)線路基礎(chǔ)數(shù)據(jù)、檢測(cè)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)等,分類匯總生成樹(shù)形數(shù)據(jù)結(jié)構(gòu),以便分析人員根據(jù)需要進(jìn)行查詢。
主要包括缺陷里程附近的軌道環(huán)境信息和接觸網(wǎng)設(shè)備信息。軌道環(huán)境信息主要包括鋼軌的曲線、豎曲線、坡度、橋梁、隧道、區(qū)間、通道門(mén)等。設(shè)備特征主要包括在關(guān)節(jié)、線岔、分相內(nèi)的具體位置、附近是否有電連接、硬橫梁等。
為了便于分析人員查看,將匹配到的每個(gè)信息條進(jìn)行計(jì)算,按照固定格式生成一個(gè)新字段。例如,曲線信息可以縮寫(xiě)為:“曲線半徑”-“外軌超高”-“距起點(diǎn)長(zhǎng)度”-“距終點(diǎn)長(zhǎng)度”-“是否屬于緩和曲線”-“緩和曲線長(zhǎng)度”。
主要包括對(duì)缺陷地點(diǎn)檢測(cè)的1C、4C的弓網(wǎng)波形數(shù)據(jù)的查詢。受制于1C、4C數(shù)據(jù)解析方法不開(kāi)放,無(wú)法直接使用,所以我們利用python-win32工具調(diào)用波形查看軟件的操作系統(tǒng)接口,自動(dòng)對(duì)缺陷位置的每次檢測(cè)曲線進(jìn)行截圖,并附上本次檢測(cè)的車型、速度、檢測(cè)弓開(kāi)口、所屬錨段CDI均值等信息。針對(duì)1C波形公里標(biāo)誤差較大的問(wèn)題,我們根據(jù)CDI錨段數(shù)據(jù)庫(kù)中錨段的起始里程對(duì)缺陷里程進(jìn)行重定位,取得良好的對(duì)齊效果。
主要包括1C、2C、3C缺陷庫(kù)和檢修問(wèn)題庫(kù)中與弓網(wǎng)關(guān)系相關(guān)的缺陷的查詢。并對(duì)查詢到的每類缺陷信息進(jìn)行梳理統(tǒng)計(jì),合并生成一個(gè)字段,并鏈接到查詢到的各類數(shù)據(jù)表。合并字段包括缺陷頻次和缺陷類型兩個(gè)部分。缺陷頻度為當(dāng)前日期往前每三個(gè)月缺陷發(fā)生的次數(shù),缺陷類型信息為缺陷類型和發(fā)生次數(shù)。例如,某缺陷的3C查詢結(jié)果為:“0-4-6-8-6_疑似中錨線夾燃弧:3_疑似燃弧:3-疑似吊弦松_2”。
動(dòng)檢數(shù)據(jù)分析方法是一個(gè)不斷發(fā)展的過(guò)程。我們?cè)跀?shù)據(jù)獲取廣度、分析深度上還有很大提升空間。我們將以近些年來(lái)多發(fā)的接觸網(wǎng)故障為問(wèn)題導(dǎo)向,分析故障設(shè)備的典型特征,不斷改進(jìn)分析方法。對(duì)現(xiàn)有檢測(cè)設(shè)備無(wú)法覆蓋的風(fēng)險(xiǎn),要加強(qiáng)技術(shù)攻關(guān),改進(jìn)檢測(cè)設(shè)備,不斷縮小接觸網(wǎng)檢測(cè)與設(shè)備安全、現(xiàn)場(chǎng)維修之間的鴻溝。
此外,接觸網(wǎng)檢測(cè)管理正朝著大數(shù)據(jù)管理、智能分析方向不斷發(fā)展。通過(guò)建立局級(jí)、站級(jí)別的6c數(shù)據(jù)中心,實(shí)現(xiàn)不同檢測(cè)設(shè)備、不同類型檢測(cè)數(shù)據(jù)之間的互聯(lián)互通和多用戶實(shí)時(shí)操作,旨在解決數(shù)據(jù)孤島和信息傳遞效率低下的弊病。