封博卿,李平,楊連報(bào)
(1. 中國(guó)鐵道科學(xué)研究院,北京 100081;2. 中國(guó)鐵道科學(xué)研究院 鐵路大數(shù)據(jù)研究與應(yīng)用創(chuàng)新中心,北京 100081)
基于時(shí)空大數(shù)據(jù)的高速鐵路接觸網(wǎng)鳥巢病害分析
封博卿1,李平2,楊連報(bào)2
(1. 中國(guó)鐵道科學(xué)研究院,北京 100081;2. 中國(guó)鐵道科學(xué)研究院 鐵路大數(shù)據(jù)研究與應(yīng)用創(chuàng)新中心,北京 100081)
高速鐵路基礎(chǔ)設(shè)施檢測(cè)領(lǐng)域多年來(lái)積累了大量的歷史數(shù)據(jù),為故障分析及檢修決策提供了重要支撐。建立在空間信息技術(shù)之上的時(shí)空大數(shù)據(jù)分析為接觸網(wǎng)鳥巢病害提供了新的處理和預(yù)防方法,能夠突破傳統(tǒng)分析方法的局限,達(dá)到快速、及時(shí)的目的,從而有效提高病害處理效率和預(yù)防效果,并可降低接觸網(wǎng)鳥巢病害處理的成本?;诖髷?shù)據(jù)技術(shù)原理,針對(duì)接觸網(wǎng)鳥害發(fā)生時(shí)蘊(yùn)含的時(shí)空數(shù)據(jù),利用地理信息技術(shù)、時(shí)空聚合方法等,構(gòu)建一種基于地理信息的全維度、多層次的鳥巢病害分析流程,補(bǔ)強(qiáng)接觸網(wǎng)巡檢,為提高接觸網(wǎng)鳥巢病害處理能力和預(yù)測(cè)手段提供新的技術(shù)和方法。
時(shí)空大數(shù)據(jù);高速鐵路;GIS;接觸網(wǎng);鳥巢病害
大數(shù)據(jù)(Big Data)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。由于蘊(yùn)含著巨大的商業(yè)及社會(huì)經(jīng)濟(jì)價(jià)值,大數(shù)據(jù)被譽(yù)為未來(lái)的新石油、鉆石礦,對(duì)大數(shù)據(jù)的利用將成為企業(yè)提高核心競(jìng)爭(zhēng)力并搶占市場(chǎng)先機(jī)的關(guān)鍵。未來(lái),一個(gè)國(guó)家擁有數(shù)據(jù)的規(guī)模和運(yùn)用數(shù)據(jù)的能力將成為綜合國(guó)力的重要組成部分。
大數(shù)據(jù)在鐵 路應(yīng)用能夠優(yōu)化實(shí)際生產(chǎn)方式,保障鐵路運(yùn)輸更安全[1]。作為高速鐵路重要基礎(chǔ)設(shè)施的接觸網(wǎng)設(shè)備,目前普遍采用高架線路的牽引供電方式。接觸網(wǎng)安全直接關(guān)系著高速鐵路運(yùn)輸安全與效率,而鳥巢病害所造成的接觸網(wǎng)跳閘占比最高,同時(shí)也是接觸網(wǎng)巡檢、檢修的重要工作內(nèi)容。京滬高鐵自開通至2015年,由于鳥巢病害造成9次接觸網(wǎng)跳閘,占所有跳閘原因的50%以上。2013年3月,在京滬高鐵無(wú)錫—蘇州段,由于鳥巢病害造成短接故障,致使區(qū)間停電124 min[2]。與此同時(shí),現(xiàn)場(chǎng)站段為應(yīng)對(duì)鳥巢病害,需要周期性投入大量人力、物力,極大地干擾接觸網(wǎng)日常檢修任務(wù)的完成。即便這樣,也不能杜絕鳥巢病害的發(fā)生。
目前,針對(duì)高鐵鳥巢病害信息采集和分析方面的研究剛剛起步。在信息采集方面,主要依靠人工巡檢采集鳥巢病害業(yè)務(wù)數(shù)據(jù)。國(guó)內(nèi)有學(xué)者提出利用基于關(guān)鍵區(qū)域HOG特征的方法分析車載視頻,實(shí)現(xiàn)接觸網(wǎng)鳥巢智能檢測(cè)和信息獲取[3]。在分析方面,李軍[2]、魏峰[4]、單寶來(lái)[5]等先后針對(duì)實(shí)際生產(chǎn)現(xiàn)狀給出了鳥巢病害經(jīng)驗(yàn)分析和預(yù)防措施。但是以上信息采集和分析均集中在鳥巢病害業(yè)務(wù)屬 性信息方面,缺少鳥巢病害存在的環(huán)境信息。分析手段受限于技術(shù)條件,大多采用傳統(tǒng)趨勢(shì)分析,缺少綜合大數(shù)據(jù)分析,分析的結(jié)果缺少定量分析。因此,如何利用先進(jìn)大數(shù)據(jù)技術(shù)手段有效預(yù)防、處理鳥巢病害成為一項(xiàng)緊迫的任務(wù)。
在此,從大數(shù)據(jù)及時(shí)空大數(shù)據(jù)的基礎(chǔ)概念出發(fā),提出接觸網(wǎng)鳥巢病害時(shí)空大數(shù)據(jù)分析技術(shù)框架,針對(duì)時(shí)空大數(shù)據(jù)與空間信息技術(shù)的相互結(jié)合、多源數(shù)據(jù)融合、高速鐵路設(shè)備空間信息建模、時(shí)空分析模型等關(guān)鍵技術(shù)進(jìn)行闡述。通過(guò)對(duì)鳥巢病害時(shí)空大數(shù)據(jù)分析,能夠?yàn)楦咚勹F路鳥巢病害的定量分析提供技術(shù)手段,從而增強(qiáng)驅(qū)鳥裝置安裝與日常巡檢的針對(duì)性,提高接觸網(wǎng)運(yùn)維工作效率。
1.1 大數(shù)據(jù)基本概念
大數(shù)據(jù)主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)管理、數(shù)據(jù)分析與數(shù)據(jù)挖掘、數(shù)據(jù)可視化等。隨著技術(shù)的不斷發(fā)展,符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集容量也會(huì)增長(zhǎng);并且定義隨不同的行業(yè)也有變化,這依賴于在一個(gè)特定行業(yè)通常能夠處理的數(shù)據(jù)集有多大。因此,大數(shù)據(jù)在當(dāng)前不同行業(yè)中的范圍可以從幾十TB到幾PB。
1.2 鳥巢病害時(shí)空大數(shù)據(jù)特征
在現(xiàn)實(shí)世界中,時(shí)間和空間屬性是對(duì)事物描述最基本的信息,有研究表明,超過(guò)80%數(shù)據(jù)與地理位置、發(fā)生時(shí)間直接或間接相關(guān)。越來(lái)越多的業(yè)務(wù)專題屬性隨著時(shí)間積累,已成為無(wú)法在合理時(shí)間內(nèi)處理的數(shù)據(jù)集合。隨著3S技術(shù)的不斷發(fā)展,越來(lái)越多的空間信息能夠快速的按照時(shí)間序列進(jìn)行采集和積累。時(shí)空大數(shù)據(jù)就是將規(guī)模巨大的業(yè)務(wù)專題屬性數(shù)據(jù)集按照時(shí)間和空間維度與空間信息進(jìn)行融合。從信息維度上來(lái)說(shuō),時(shí)空大數(shù)據(jù)包括了時(shí)間、空間和屬性3個(gè)維度。從信息范圍來(lái)說(shuō),任何具備了時(shí)間、空間的業(yè)務(wù)屬性數(shù)據(jù)都可以納入時(shí)空大數(shù)據(jù)分析的范圍。
根據(jù)以往鳥巢病害處理經(jīng)驗(yàn),其發(fā)生具有明顯的時(shí)空特性。在時(shí)間維度上,鳥巢病害呈現(xiàn)明顯的季節(jié)性周期規(guī)律,每年自入冬后進(jìn)入鳥害發(fā)生期,并隨春季進(jìn)入鳥害高發(fā)期,在初夏逐步減少偶有發(fā)生。在空間維度上,具有明顯的地域分布匯聚特征,在1個(gè)月內(nèi),京滬高鐵濟(jì)南—泰安區(qū)間內(nèi)的同一個(gè)接觸網(wǎng)支柱發(fā)生16次鳥害,并且鳥類在接觸網(wǎng)結(jié)構(gòu)部件的搭巢部位也具有明顯特征,易于發(fā)生在補(bǔ)償裝置、吊柱等位置。
1.3 鳥巢病害時(shí)空大數(shù)據(jù)解決思路
鳥巢病害時(shí)空大數(shù)據(jù)中的專業(yè)屬性數(shù)據(jù)集 可以通過(guò)大數(shù)據(jù)分布式存儲(chǔ)技術(shù)進(jìn)行管理,時(shí)間信息以序列標(biāo)記的形式與專業(yè)屬性數(shù)據(jù)融合,目前已有相應(yīng)的大數(shù)據(jù)管理分析軟件對(duì)其進(jìn)行支撐。針對(duì)鳥巢病害時(shí)空大數(shù)據(jù)中的空間維度信息則需要地理信息系統(tǒng)進(jìn)行管理,地理信息能夠存儲(chǔ)、查詢、分析和展示空間對(duì)象,同時(shí)GIS為多源異構(gòu)的海量數(shù)據(jù)提供了數(shù)據(jù)融合的空間基準(zhǔn)。
鳥巢病害時(shí)空大數(shù)據(jù)分析需要以高速鐵路地理信息系統(tǒng)為技術(shù)基礎(chǔ),在設(shè)備空間位置信息的統(tǒng)一基準(zhǔn)上,融合鳥巢病害處理屬性數(shù)據(jù)集、線路周邊人文信息、資源信息、環(huán)境信息等鐵路外部信息,形成高速鐵路鳥巢病害時(shí)空分析的數(shù)據(jù)基礎(chǔ),并在數(shù)據(jù)基礎(chǔ)上建立相應(yīng)的時(shí)空數(shù)據(jù)分析模型,形成鳥巢病害分析的模型基礎(chǔ)。鳥巢病害時(shí)空大數(shù)據(jù)解決思路見圖1。
圖1 鳥巢病害時(shí)空大數(shù)據(jù)解決思路
2.1 整體技術(shù)框架
基于GIS的高速鐵路接觸 網(wǎng)鳥巢病害時(shí)空大數(shù)據(jù)分析的整體框架見圖2。
(1)數(shù)據(jù)源層。數(shù)據(jù)源層的主要功能是采集與接觸網(wǎng)鳥巢病害大數(shù)據(jù)分析相關(guān)的數(shù)據(jù),按照數(shù)據(jù)來(lái)源可分為鐵路內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),數(shù)據(jù)類型分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和流數(shù)據(jù)。鐵路內(nèi)部數(shù)據(jù)主要來(lái)源于鐵路目前已有各業(yè)務(wù)領(lǐng)域的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù),以及從視頻監(jiān)控、傳感設(shè)備、GPS設(shè)備采集的視頻音頻數(shù)據(jù)、傳感數(shù)據(jù)、GIS數(shù)據(jù)等;外部數(shù)據(jù)主要是來(lái)自氣象(溫度、濕度等)、人文、植被等數(shù)據(jù)。
圖2 基于GIS的高速鐵路接觸網(wǎng)鳥巢病害時(shí)空大數(shù)據(jù)分析整體框架
(2)數(shù)據(jù)融合層。數(shù)據(jù)融合層是將數(shù)據(jù)源層的數(shù)據(jù)進(jìn)行抽取和轉(zhuǎn)換,并根據(jù)建立的地理信息模型進(jìn)行空間數(shù)據(jù)融合,以便進(jìn)行存儲(chǔ)[6]。針對(duì)鐵路業(yè)務(wù)結(jié)構(gòu)相對(duì)獨(dú)立、數(shù)據(jù)權(quán)力敏感、數(shù)據(jù)接口復(fù)雜繁多等特征,需要多個(gè)部門協(xié)商建立一個(gè)統(tǒng)一的數(shù)據(jù)集成和管理平臺(tái),以解決部門之間頻繁的數(shù)據(jù)交換需求。
(3)數(shù)據(jù)存儲(chǔ)層。數(shù)據(jù)存儲(chǔ)層是將數(shù)據(jù)源層獲取的數(shù)據(jù)按格式分類后經(jīng)網(wǎng)絡(luò)傳輸進(jìn)行集群存儲(chǔ)。針對(duì)關(guān)系型數(shù)據(jù)庫(kù)采用數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市的方式進(jìn)行集成和存儲(chǔ),對(duì)于非關(guān)系型數(shù)據(jù)庫(kù)可以采用NoSQL存儲(chǔ)和基于HDFS文件的存儲(chǔ),而對(duì)于空間數(shù)據(jù)主要采用圖數(shù)據(jù)庫(kù)進(jìn)行存儲(chǔ)。
(4)數(shù)據(jù)分析層。數(shù)據(jù)分析層主要是對(duì)存儲(chǔ)在集群中的數(shù)據(jù)或?qū)崟r(shí)流數(shù)據(jù)進(jìn)行分析,為應(yīng)用層提供服務(wù)。常用的數(shù)據(jù)分析工具有Mahout和Pig。Mahout可以提供一些可擴(kuò)展的機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典算法的實(shí)現(xiàn),幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序,主要包括聚類、分類、推薦過(guò)濾、頻繁子項(xiàng)挖掘等;Pig是一種編程語(yǔ)言,簡(jiǎn)化了Hadoop常見的工作任務(wù),對(duì)數(shù)據(jù)進(jìn)行排序、過(guò)濾、求和、分組(Group)、關(guān)聯(lián)(Joining),還可加載數(shù)據(jù)、表達(dá)轉(zhuǎn)換數(shù)據(jù)以及存儲(chǔ)最終結(jié)果。Mahout和Pig都是基于并行計(jì)算架構(gòu)(MapReduce)進(jìn)行數(shù)據(jù)處理和分析,是提高大數(shù)據(jù)運(yùn)算效率的有效手段。
(5)應(yīng)用層。應(yīng)用層主要對(duì)鳥巢病害的發(fā)生趨勢(shì)進(jìn)行時(shí)間分析、空間分布分析、驅(qū)鳥裝置安裝位置分析等。可根據(jù)鳥巢病害發(fā)生的重點(diǎn)區(qū)域進(jìn)行重點(diǎn)防控,并根據(jù)鳥巢病害發(fā)生的時(shí)間規(guī)律,進(jìn)行巡檢周期的動(dòng)態(tài)調(diào)整。
2.2 高速鐵路設(shè)施設(shè)備地理信息
時(shí)空大數(shù)據(jù)的分析和展示離不開空間信息技術(shù)的支撐,而空間信息技術(shù)的基礎(chǔ)和關(guān)鍵在于空間數(shù)據(jù)基準(zhǔn)和空間信息模型。
2.2.1 空間信息模型的數(shù)據(jù)基準(zhǔn)
空間信息的存儲(chǔ)與表達(dá)需要坐標(biāo)系的統(tǒng)一,目前國(guó)家現(xiàn)行大地坐標(biāo)系是2000年頒布的CGCS2000坐標(biāo)系,而已建成高速鐵路的空間數(shù)據(jù)大多采用北京54坐標(biāo)、西安80坐標(biāo)、工程獨(dú)立坐標(biāo)。鐵路運(yùn)營(yíng)后的設(shè)備管理位置描述大部分采用線性里程坐標(biāo)。在高速鐵路地理信息系統(tǒng)的建立過(guò)程中 需要對(duì)上述坐標(biāo)系進(jìn)行坐標(biāo)轉(zhuǎn)換,統(tǒng)一到CGCS2000坐標(biāo)系下。
針對(duì)北京54坐標(biāo)、西安80坐標(biāo)、工程獨(dú)立坐標(biāo)可利用同名點(diǎn)進(jìn)行坐標(biāo)轉(zhuǎn)換。針對(duì)線性里程坐標(biāo),可采用線性參考與動(dòng)態(tài)分段算法將接觸網(wǎng)設(shè)備的位置信息由一維里程坐標(biāo)向二維地理坐標(biāo)進(jìn)行轉(zhuǎn)換。
2.2.2 空間信息模型
高速鐵路接觸網(wǎng)鳥巢病害的時(shí)空大數(shù)據(jù)分析,需要以接觸網(wǎng)設(shè)備及其關(guān)鍵結(jié)構(gòu)的空間位置為基礎(chǔ),建立適用于鳥巢病害分析的空間信息模型,該模型應(yīng)能反應(yīng)接觸網(wǎng)設(shè)備構(gòu)成的最小單元。
高速鐵路接觸網(wǎng)設(shè)備主要包含兩部分:支柱及附屬設(shè)備、接觸網(wǎng)線纜。接觸網(wǎng)支柱是鳥巢病害發(fā)生的主要位置,需要對(duì)支柱進(jìn)行類別細(xì)分和粒度細(xì)化。從類別上劃分,接觸網(wǎng)支柱可分為線路上的中間柱、轉(zhuǎn)換柱,隧道或車站的吊柱以及接觸網(wǎng)硬橫跨;從設(shè)備粒度上劃分,接觸網(wǎng)支柱可分為支柱基礎(chǔ)、絕緣端子、定位器、補(bǔ)償裝置等。同時(shí)根據(jù)目前接觸網(wǎng)專業(yè)管理實(shí)際,接觸網(wǎng)專業(yè)管理以支柱為管理單元,附屬設(shè)備與線纜均需與支柱建立聯(lián)系,形成接觸網(wǎng)支柱“一桿一檔”。因此,空間信息模型的建立必須符合現(xiàn)場(chǎng)管理實(shí)際。接觸網(wǎng)設(shè)備空間信息模型見圖3。
圖3 接觸網(wǎng)設(shè)備空間信息模型
2.3 基于統(tǒng)一空間坐標(biāo)的多源數(shù)據(jù)融合
高速鐵路接觸網(wǎng)鳥害處理需要融合多時(shí)相廣范圍數(shù)據(jù),包括鳥巢病害處理業(yè)務(wù)大數(shù)據(jù)、周邊環(huán)境大數(shù)據(jù)。
目前,高速鐵路鳥巢病害的發(fā)現(xiàn)和處理主要依靠人工線路巡檢,巡檢人員通過(guò)接觸網(wǎng)智能巡檢系統(tǒng)填報(bào)鳥巢病害信息,上報(bào)信息主要包含基礎(chǔ)桿號(hào)、鳥巢發(fā)生位置、上報(bào)時(shí)間等。鳥巢病害時(shí)空大數(shù)據(jù)分析可利用數(shù)據(jù)接口,從接觸網(wǎng)智能巡檢系統(tǒng)中將鳥巢病害信息接入,通過(guò)與地理信息中的接觸網(wǎng)支柱桿號(hào)一一對(duì)應(yīng),完成鳥巢病害的位置融合。
周邊環(huán)境信息包括氣象信息、植被信息以及人文信息。其中氣象信息主要來(lái)源于國(guó)家級(jí)氣象基準(zhǔn)站,主要內(nèi)容包括逐日溫濕度數(shù)據(jù)、風(fēng)力風(fēng)向數(shù)據(jù),由于需反映區(qū)域氣象情況,可以與地區(qū)行政區(qū)劃位置進(jìn)行融合。植被信息通常以植被覆蓋度來(lái)表示,其測(cè)量可分為地面測(cè)量和遙感估算兩種方法。地面測(cè)量常用于田間尺度,遙感估算常用于區(qū)域尺度。高速鐵路跨度大,宜采用遙感測(cè)量植被覆蓋度,較為實(shí)用的方法是利用植被指數(shù)近似估算植被覆蓋度,常用的植被指數(shù)為歸一化差分植被指數(shù)(NDVI)。由于其數(shù)據(jù)源即是遙感影像產(chǎn)品,本身具備空間位置信息,能夠直接與地理信息系統(tǒng)融合。人口密度是反映人類活動(dòng)的重要指數(shù),其數(shù)據(jù)來(lái)源于全國(guó)人口普查,人口普查以行政區(qū)劃為數(shù)據(jù)單元,因此,人口密度可按照行政區(qū)劃空間位置與地理信息進(jìn)行數(shù)據(jù)融合。人口數(shù)據(jù)融合見圖4,植被數(shù)據(jù)融合見圖5,綜 合數(shù)據(jù)融合結(jié)果見圖6。
2.4 時(shí)空大數(shù)據(jù)聚合分析模型
2.4.1 時(shí)空大數(shù)據(jù)分布式存儲(chǔ)與計(jì)算
面對(duì)海量的業(yè)務(wù)專題屬性數(shù)據(jù)、空間地理信息數(shù)據(jù)、周邊環(huán)境數(shù)據(jù),對(duì)數(shù)據(jù)的存儲(chǔ)提出了新的挑戰(zhàn),主要體現(xiàn)在3個(gè)方面:數(shù)據(jù)庫(kù)高并發(fā)讀寫,海量數(shù)據(jù)的高效率存儲(chǔ)和訪問,以及數(shù)據(jù)庫(kù)的高擴(kuò)展性和高可用性。數(shù)據(jù)的存儲(chǔ)采用分布式存儲(chǔ)架構(gòu),目前主流的分布式存儲(chǔ)系統(tǒng)是Hadoop的分布式文件系統(tǒng)HDFS,其內(nèi)部架構(gòu)基于一組特定的節(jié)點(diǎn)構(gòu)建,這些節(jié)點(diǎn)包括HDFS NameNode和DataNode。一個(gè)Hadoop集群包含一個(gè)NameNode和大量DataNode,并且HDFS內(nèi)部的所有通信都基于標(biāo)準(zhǔn)的TCP/IP協(xié)議。HDFS架構(gòu)見圖7。
2.4.2 時(shí)空聚合分析模型
圖4 人口數(shù)據(jù)融合
圖5 植被數(shù)據(jù)融合
圖6 綜合數(shù)據(jù)融合結(jié)果
時(shí)空聚合分析是以時(shí)間、空間維度作為聚合坐標(biāo)系,將散列在時(shí)空維度的信息進(jìn)行快速高效聚合。其算法原理是:在每個(gè)位置點(diǎn)(X,Y)坐標(biāo)的基礎(chǔ)上,增設(shè)時(shí)間坐標(biāo)T,任何產(chǎn)生的信息均可在這樣的三維坐標(biāo)系中確定位置點(diǎn)。初始時(shí)沒有任何已知聚合點(diǎn),然后對(duì)每個(gè)點(diǎn)進(jìn)行迭代,計(jì)算一個(gè)點(diǎn)的外包正方體,若此點(diǎn)的外包正方體與現(xiàn)有聚合點(diǎn)的外包正方形不相交,則新建聚合點(diǎn);若相交,則把該點(diǎn)聚合到該聚合點(diǎn)中;若此點(diǎn)與多個(gè)已知聚合點(diǎn)的外包正方形相交,則計(jì)算該點(diǎn)到聚合點(diǎn)的距離,聚合到距離最近的聚合點(diǎn)中,如此循環(huán),直到所有點(diǎn)都遍歷完畢。時(shí)空聚合分析模型見圖8。
圖7 HDFS架構(gòu)
圖8 時(shí)空聚合分析模型
自2011年全線通車以來(lái),京滬高鐵頻繁受到鳥巢病害影響,造成接觸網(wǎng)短路斷電,影響高速鐵路持續(xù)穩(wěn)定運(yùn)行。以濟(jì)南西—泰安區(qū)間為試驗(yàn)范圍,利用京滬高鐵地理信息平臺(tái)的空間數(shù)據(jù),結(jié)合鳥巢病害處理業(yè)務(wù),采用上述分析模型,與周邊環(huán)境、人文信息進(jìn)行時(shí)空數(shù)據(jù)挖掘,給出試驗(yàn)驗(yàn)證。
試驗(yàn)中時(shí)空大數(shù)據(jù)的數(shù)據(jù)采集范圍包括:基礎(chǔ)設(shè)施、鳥害信息、空間位置信息、氣象信息、人口信息、植被信息6個(gè)方面。在試驗(yàn)段范圍內(nèi),共采集1萬(wàn)余個(gè)接觸網(wǎng)基礎(chǔ)設(shè)施設(shè)備信息,包括接觸網(wǎng)支柱基本信息、供電線纜、支柱附屬設(shè)備等。并依據(jù)接觸網(wǎng)設(shè)備設(shè)施空間信息模型,建立基礎(chǔ)信息與設(shè)備空間位置的關(guān)聯(lián)關(guān)系,形成完整的接觸網(wǎng)設(shè)備設(shè)施基礎(chǔ)地理信息。
在鳥害業(yè)務(wù)信息的采集方面,與試驗(yàn)段接觸網(wǎng)智能巡檢系統(tǒng)建立系統(tǒng)接口,以Web Service的方式,接入2012—2016年接觸網(wǎng)鳥害巡檢與處理信息,包括鳥害發(fā)生的支柱、發(fā)生部位、發(fā)現(xiàn)時(shí)間、處理時(shí)間等信息,形成接觸網(wǎng)鳥害業(yè)務(wù)信息數(shù)據(jù)集。
在外部信息方面,采集濟(jì)南市和泰安市分區(qū)縣第6次人口普查數(shù)據(jù),并與行政區(qū)劃數(shù)據(jù)相融合,形成兩市人口密度空間數(shù)據(jù)庫(kù);利用美國(guó)Landsat 8衛(wèi)星OLI陸地成像儀所采集的影像數(shù)據(jù),基于歸一化植被指數(shù)(NDVI估值)形成試驗(yàn)段植被覆蓋率空間數(shù)據(jù);針對(duì)氣象數(shù)據(jù),采集濟(jì)南、泰山國(guó)家氣象基準(zhǔn)站2012—2015年逐日氣象信息,包括溫度、氣壓、相對(duì)濕度、風(fēng)速風(fēng)向、日照指數(shù)等信息。
以京滬地理信息系統(tǒng)為統(tǒng)一空間數(shù)據(jù)基準(zhǔn)和數(shù)據(jù)融合平臺(tái),建立鐵路基礎(chǔ)業(yè)務(wù)信息、鳥巢病害業(yè)務(wù)信息與地理信息系統(tǒng)中設(shè)備位置的關(guān)聯(lián),同時(shí)將人口數(shù)據(jù)、氣象數(shù)據(jù)與行政區(qū)劃進(jìn)行數(shù)據(jù)融合,此外,利用統(tǒng)一的空間坐標(biāo)系,將植被覆蓋數(shù)據(jù)與地理信息進(jìn)行融合。最終在京滬高鐵地理信息系統(tǒng)中實(shí)現(xiàn)多源數(shù)據(jù)的整合。京滬高鐵時(shí)空大數(shù)據(jù)分析界面見圖9。
圖9 京滬高鐵時(shí)空大數(shù)據(jù)分析界面
通過(guò)鳥巢 病害時(shí)空大數(shù)據(jù)聚合分析模型,鳥巢病害呈現(xiàn)明顯的分布規(guī)律,并與周邊環(huán)境、人文環(huán)境具有緊密聯(lián)系。規(guī)律體現(xiàn)在4個(gè)維度:(1)從時(shí)間維度上,每年鳥害從11月開始在3—4月份達(dá)到頂峰,6月份逐步減少,7月份基本絕跡;(2)從氣象環(huán)境方面,鳥巢病害頻度最高發(fā)生在平均氣溫15~20 ℃、平均氣壓995.2 hPa的地區(qū);(3)從人文環(huán)境方面,鳥害多發(fā)生于人口密度變化較大(即城市邊緣)、植被覆蓋率為65%左右的區(qū)域;(4)從搭巢部位上,區(qū)間搭巢集中在補(bǔ)償裝置和隔離開關(guān)處,站區(qū)搭巢主要發(fā)生在吊柱底座和隔離開關(guān)處。分析結(jié)果展現(xiàn)見圖10。
隨著大數(shù)據(jù)時(shí)代的到來(lái),利用時(shí)空大數(shù)據(jù)技術(shù)對(duì)接觸網(wǎng)鳥巢病害進(jìn)行分析和預(yù)測(cè),能夠使鳥巢病害處理與防護(hù)得到數(shù)據(jù)支撐,指導(dǎo)驅(qū)鳥裝置的安裝,從而減輕現(xiàn)場(chǎng)作業(yè)量,保障高速鐵路供電的持續(xù)穩(wěn)定。結(jié)合大數(shù)據(jù)技術(shù)、空間信息技術(shù),針對(duì)接觸網(wǎng)鳥巢病害發(fā)生的內(nèi)外在因素,利用高速鐵路設(shè)施設(shè)備地理信息模型,在基于統(tǒng)一空間坐標(biāo)的基礎(chǔ)上,實(shí)現(xiàn)多源多維時(shí)空信息融合,構(gòu)建了基于時(shí)空大數(shù)據(jù)的聚合分析模型,并在京滬高鐵濟(jì)南西—泰安區(qū)間進(jìn)行試驗(yàn),取得了初步的試驗(yàn)結(jié)果。
圖10 分析結(jié)果展現(xiàn)
[1] 馬小寧,李平,史天運(yùn).鐵路大數(shù)據(jù)應(yīng)用體系架構(gòu)研究[J]. 鐵路計(jì)算機(jī)應(yīng)用,2016(9):7-13.
[2] 李軍. 接觸網(wǎng)鳥害防治方案研究[J]. 中國(guó)鐵路,2014(1):49-53.
[3] 段旺旺,唐鵬,金煒東,等.基于關(guān)鍵區(qū)域HOG特征的鐵路接觸網(wǎng)鳥巢檢測(cè)[J].中國(guó)鐵路,2015(8):73-77.
[4] 魏峰.淺談高速鐵路接觸網(wǎng)防鳥相關(guān)措施[J].科技創(chuàng)新與應(yīng)用,2016(2):195-196.
[5] 單寶來(lái).淺談接觸網(wǎng)鳥害防治[J].中小企業(yè)管理與科技,2015(10):213-214.
[6] 徐田華,楊連報(bào),胡紅利,等.高速鐵路信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策[J].西安交通大學(xué)學(xué)報(bào),2015(1):72-78.
責(zé)任編輯 盧敏
On Harm of Bird Nests on HSR OCL Based on Time-Space Big Data
FENG Boqing1,LI Ping2,YANG Lianbao2
(1. China Academy of Railway Sciences,Beijing 100081,China;2. Railway Big Data Research and Application Innovation Center,China Academy of Railway Sciences,Beijing 100081,China)
Over the years, much data have been accumulated in the field of high-speed railway infrastructure, which provide important support for fault analysis and decision-making in maintenance. The time-space big data analysis based on spatial information technology provides a new treatment and prevention method for the harm of bird nests on HSR OCL. Capable of what the traditional analysis method cannot achieve, it provides solutions in a rapid and timely manner, so as to effectively improve the eff ciency of treatment and prevention of the harm and reduce the cost of its treatment. Based on the principle of big data technology and the space-time data when the harm occurs, this paper develops a full-dimensional and multi-level analysis process of the harm, using geo-information technology and space-time aggregation method, etc., which supplements the patrol inspection of the OCL, and provide a new technology and method to improve the capability of treating and forecasting the harm.
time-space big data;high-speed railway;GIS;OCL;harm of bird nests on OCL
U226.8;TP391
A
1001-683X(2017)01-0029-06
10.19549/j.issn.1001-683x.2017.01.029
2017-01-04
封博卿(1984—),男,博士研究生。E-mail:fengboqing@rails.cn