馬小寧
(中國鐵道科學(xué)研究院集團(tuán)有限公司 鐵路大數(shù)據(jù)研究與應(yīng)用創(chuàng)新中心,北京 100081)
自2011年大數(shù)據(jù)作為一個完整的技術(shù)詞匯面世以來,已在全球掀起一場思維變革的浪潮。當(dāng)前,全球的數(shù)據(jù)總量正呈指數(shù)增長,過去兩年間產(chǎn)生的數(shù)據(jù)量超過以往總和。大數(shù)據(jù)技術(shù)已成為新一輪科技革命的制高點(diǎn),發(fā)達(dá)國家紛紛加快布局,推動大數(shù)據(jù)發(fā)展和應(yīng)用,中國對于大數(shù)據(jù)更是寄予了超常的重視及期待。從2014年至今,大數(shù)據(jù)已連續(xù)6年出現(xiàn)在國務(wù)院政府工作報告中,在2019年的政府工作報告中提出,深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用,使中國從“數(shù)據(jù)大國”邁向“數(shù)據(jù)強(qiáng)國”。
中國鐵路一貫重視數(shù)據(jù)資源的開發(fā)利用,伴隨著整個鐵路信息化過程,圍繞數(shù)據(jù)處理、數(shù)據(jù)資源共享、數(shù)據(jù)挖掘分析、數(shù)據(jù)可視化等開展了一系列探索應(yīng)用,為大數(shù)據(jù)工作奠定了堅實(shí)基礎(chǔ)。在數(shù)據(jù)分析方面,客運(yùn)領(lǐng)域開展了客流預(yù)測、旅客群體分析和互聯(lián)網(wǎng)風(fēng)控分析,貨運(yùn)領(lǐng)域開展了市場價格監(jiān)測、客戶流失預(yù)警、貨運(yùn)收益管理,移動裝備領(lǐng)域開展了動車組保有量分析、動車組開行分析、動車組生產(chǎn)力布局分析,基礎(chǔ)設(shè)施領(lǐng)域開展了軌道檢測、鋼軌探傷分析,行車安全領(lǐng)域開展了綜合報警分析、問題規(guī)律分析、設(shè)備技術(shù)狀態(tài)評價等研究應(yīng)用。但總體來看,上述應(yīng)用還都局限于點(diǎn)狀應(yīng)用,分析的深度及作用有限,大數(shù)據(jù)應(yīng)用還處于起步階段。
2017年是鐵路大數(shù)據(jù)的全面開局之年,中國鐵路總公司發(fā)布《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》[1],作為頂層設(shè)計文件,為全路大數(shù)據(jù)工作指明了方向。同期,鐵路數(shù)據(jù)服務(wù)平臺的基本功能研發(fā)完畢,為鐵路大數(shù)據(jù)應(yīng)用奠定了技術(shù)基礎(chǔ)[2]。2018年,基于“平臺+應(yīng)用”模式,大數(shù)據(jù)應(yīng)用在多個鐵路局集團(tuán)公司(簡稱:鐵路局)同步展開,探索大數(shù)據(jù)的應(yīng)用模式,取得顯著的成績。2019年是第3個年頭,鐵路大數(shù)據(jù)應(yīng)用也進(jìn)入全面深化應(yīng)用的階段。目前,中國鐵路大數(shù)據(jù)正處在一個承上啟下的關(guān)鍵階段,有必要總結(jié)前兩年的經(jīng)驗(yàn)與不足,借鑒國內(nèi)外大數(shù)據(jù)應(yīng)用成功經(jīng)驗(yàn),理清思路,把準(zhǔn)方向,全面推進(jìn)大數(shù)據(jù)工作健康、快速發(fā)展。
大數(shù)據(jù)時代,數(shù)據(jù)已成為國家基礎(chǔ)性戰(zhàn)略資源,數(shù)據(jù)規(guī)模和數(shù)據(jù)運(yùn)用能力成為評價國家綜合國力的重要標(biāo)志,大數(shù)據(jù)被譽(yù)為未來的新石油和鉆石礦[3]。在開展大數(shù)據(jù)應(yīng)用之前,需要明確大數(shù)據(jù)帶來的價值到底有哪些,可以分為技術(shù)和業(yè)務(wù)兩個層面。
大數(shù)據(jù)技術(shù)層面的價值是指,不涉及任何業(yè)務(wù)功能,僅通過大數(shù)據(jù)技術(shù)的應(yīng)用,提升既有應(yīng)用的速度和效率。大數(shù)據(jù)指代具有4V特征的數(shù)據(jù)集合,即:體量大,類型多,處理速度快,價值密度低。對于此類數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)難以應(yīng)對。數(shù)據(jù)量大,處理速度變慢,處理結(jié)果反饋時間過長,難以滿足應(yīng)用的時效性要求,用戶體驗(yàn)降低;對于大量的視頻、音頻、圖片、網(wǎng)絡(luò)日志等非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)處理技術(shù)無法處理,導(dǎo)致大量有價值信息的流失。通過使用分布式存儲、分布式計算、內(nèi)存計算等大數(shù)據(jù)技術(shù),將一個大型的數(shù)據(jù)處理任務(wù)化整為零,分散到多個服務(wù)器并行計算,極大地提升處理的速度,快速得到處理結(jié)果。通過使用非結(jié)構(gòu)化文本分析技術(shù)、基于深度學(xué)習(xí)的圖像識別技術(shù),可以對分結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行快速、準(zhǔn)確地處理和分析,提取出其中有價值的信息。
大數(shù)據(jù)業(yè)務(wù)層面的價值是指,通過對數(shù)據(jù)的收集、整理、處理、分析,從中得到之前隱藏在背后的有價值的信息,對于決策判斷提供重要的輔助支撐。在《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》[4]中提出,發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力,用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新,正是對此的詮釋。
大數(shù)據(jù)的意義或價值歸根到底是4個字:輔助決策。利用大數(shù)據(jù)分析,能夠總結(jié)經(jīng)驗(yàn)、發(fā)現(xiàn)規(guī)律、預(yù)測趨勢,由經(jīng)驗(yàn)支持決策向數(shù)據(jù)支持決策轉(zhuǎn)變。通過對相關(guān)數(shù)據(jù)的收集和分析,為管理決策提供依據(jù),可以避免個人意志帶來的主觀性、片面性和局限性,可以減少因缺少數(shù)據(jù)支撐而帶來的偏差,降低決策風(fēng)險。
鐵路行業(yè)是大數(shù)據(jù)技術(shù)富有現(xiàn)實(shí)意義的應(yīng)用領(lǐng)域之一,鐵路大數(shù)據(jù)是國家大數(shù)據(jù)的重要組成部分,中國鐵路高度重視大數(shù)據(jù)技術(shù)的應(yīng)用。然而鐵路大數(shù)據(jù)作為一個復(fù)雜的系統(tǒng)工程,涉及面廣,建設(shè)周期長,需要頂層設(shè)計的支撐。2017年,鐵路總公司編制并發(fā)布了《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》,為全路大數(shù)據(jù)工作繪制了總體藍(lán)圖,指明了發(fā)展方向。
《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》的核心內(nèi)容可以概括為“1+2+N”,即:1個平臺,2大體系,N項(xiàng)應(yīng)用。如圖1所示。
圖1 《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》的核心內(nèi)容
2.1.1 1個平臺
“1個平臺”是指數(shù)據(jù)服務(wù)平臺。數(shù)據(jù)服務(wù)平臺是鐵路信息化規(guī)劃中的重要基礎(chǔ)平臺,是一體化信息集成平臺的重要組成部分。數(shù)據(jù)服務(wù)平臺的功能是承載數(shù)據(jù)的接入、存儲、分析及應(yīng)用。按照總體規(guī)劃的要求,所有大數(shù)據(jù)應(yīng)用都是基于數(shù)據(jù)服務(wù)平臺開展,即“平臺+應(yīng)用”模式。所有業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)都要采集到數(shù)據(jù)服務(wù)平臺,平臺對于數(shù)據(jù)進(jìn)行治理清洗,形成統(tǒng)一規(guī)范的數(shù)據(jù)資源,再為上層大數(shù)據(jù)應(yīng)用提供數(shù)據(jù)支撐,從而確?!皵?shù)出一門、統(tǒng)一管理”。
2.1.2 2大體系
“2大體系”是指支撐大數(shù)據(jù)應(yīng)用順利開展的保障體系,包括數(shù)據(jù)治理體系和安全保障體系。數(shù)據(jù)治理體系包括大數(shù)據(jù)應(yīng)用的組織機(jī)構(gòu)體系以及大數(shù)據(jù)標(biāo)準(zhǔn)體系。安全保障體系包括大數(shù)據(jù)安全防護(hù)技術(shù)、安全標(biāo)準(zhǔn)規(guī)范、安全測評機(jī)制等。
2.1.3 N項(xiàng)應(yīng)用
“N項(xiàng)應(yīng)用”是指基于數(shù)據(jù)服務(wù)平臺開展的鐵路領(lǐng)域的N項(xiàng)大數(shù)據(jù)重點(diǎn)應(yīng)用,N是隨著業(yè)務(wù)發(fā)展逐步擴(kuò)充的,目前是16項(xiàng)重點(diǎn)應(yīng)用[5]。具體包括:運(yùn)輸調(diào)度大數(shù)據(jù)應(yīng)用,客運(yùn)大數(shù)據(jù)應(yīng)用,貨運(yùn)大數(shù)據(jù)應(yīng)用,精準(zhǔn)客服大數(shù)據(jù)應(yīng)用,設(shè)備狀態(tài)大數(shù)據(jù)應(yīng)用,價格分析大數(shù)據(jù)應(yīng)用,安全風(fēng)險管控大數(shù)據(jù)應(yīng)用,建設(shè)管理大數(shù)據(jù)應(yīng)用,經(jīng)營開發(fā)大數(shù)據(jù)應(yīng)用,警務(wù)大數(shù)據(jù)應(yīng)用,審計大數(shù)據(jù)應(yīng)用,輿情和職工思想動態(tài)大數(shù)據(jù)應(yīng)用,人力資源大數(shù)據(jù)應(yīng)用,財會管理大數(shù)據(jù)應(yīng)用,物資管理大數(shù)據(jù)應(yīng)用,計劃和統(tǒng)計支持大數(shù)據(jù)應(yīng)用。
按照各業(yè)務(wù)領(lǐng)域大數(shù)據(jù)應(yīng)用的發(fā)展成熟度和緊迫程充,鐵路大數(shù)據(jù)應(yīng)用將分3個階段有序推進(jìn),如圖2所示。
圖2 鐵路大數(shù)據(jù)應(yīng)用發(fā)展階段
(1)2017-2018年,強(qiáng)化基礎(chǔ),重點(diǎn)突破。此前,鐵路大數(shù)據(jù)應(yīng)用的基礎(chǔ)尚薄弱,現(xiàn)階段首要任務(wù)是建立健全數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)管理的體制機(jī)制、技術(shù)平臺、人才隊伍等基礎(chǔ)設(shè)施,圍繞個別重點(diǎn)應(yīng)用開展先行先試。
(2)2019-2020年,深化應(yīng)用,持續(xù)提升。在數(shù)據(jù)服務(wù)平臺初步建成的基礎(chǔ)上,開展數(shù)據(jù)資源匯集,建立大數(shù)據(jù)應(yīng)用的數(shù)據(jù)基礎(chǔ),進(jìn)而開展各專業(yè)大數(shù)據(jù)應(yīng)用。在本階段,專業(yè)內(nèi)大數(shù)據(jù)應(yīng)用全面深化,跨專業(yè)大數(shù)據(jù)應(yīng)用全面展開,跨行業(yè)大數(shù)據(jù)應(yīng)用初步啟動。
(3)2021-2025年,全面應(yīng)用,引領(lǐng)行業(yè)。專業(yè)內(nèi)、跨專業(yè)大數(shù)據(jù)應(yīng)用得到全面深化,跨行業(yè)大數(shù)據(jù)應(yīng)用取得顯著成效,鐵路大數(shù)據(jù)在行業(yè)外的影響力顯著提升。
鐵路數(shù)據(jù)服務(wù)平臺是鐵路一體化信息集成平臺的重要組成部分,統(tǒng)一為各業(yè)務(wù)應(yīng)用系統(tǒng)提供基礎(chǔ)數(shù)據(jù)、共享數(shù)據(jù)和大數(shù)據(jù)分析服務(wù)。該平臺由基礎(chǔ)數(shù)據(jù)管理、數(shù)據(jù)集成、數(shù)據(jù)共享、大數(shù)據(jù)存儲與分析4部分組成[6-8],如圖3所示。
(1)基礎(chǔ)數(shù)據(jù)管理:用于實(shí)現(xiàn)鐵路主數(shù)據(jù)、地理信息及元數(shù)據(jù)的規(guī)范化管理;
(2)數(shù)據(jù)集成:用于實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的抽取、轉(zhuǎn)換和導(dǎo)入;
(3)數(shù)據(jù)共享:用于實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的瀏覽及共享;
(4)大數(shù)據(jù)存儲與分析:按照主題域在數(shù)據(jù)倉庫組織數(shù)據(jù),并根據(jù)業(yè)務(wù)應(yīng)用需要將數(shù)據(jù)發(fā)布到數(shù)據(jù)集市,提供數(shù)據(jù)分析、多維報表、管理員駕駛艙、數(shù)據(jù)挖掘等功能。
圖3 鐵路數(shù)據(jù)服務(wù)平臺總體架構(gòu)
鐵路數(shù)據(jù)服務(wù)平臺基于Hortonw orks Data Platform(HDP)開源組件進(jìn)行自主研發(fā)[9-10],主要開發(fā)及創(chuàng)新工作如下:
(1)基于Spring Cloud的微服務(wù)架構(gòu)設(shè)計開發(fā),利用HDP集成大數(shù)據(jù)組件;
(2)利用Ambari對大數(shù)據(jù)組件的運(yùn)維管理和可視化狀態(tài)監(jiān)控;
(3)針對Hadoop源碼進(jìn)行深度優(yōu)化,解決組件兼容性問題,提升處理性能;
(4)構(gòu)建多租戶管理體系,結(jié)合Kerberos和LDAP認(rèn)證對用戶的功能權(quán)限、資源權(quán)限、數(shù)據(jù)權(quán)限進(jìn)行細(xì)粒度控制;
(5)研發(fā)平臺和數(shù)據(jù)審計功能,針對用戶操作和數(shù)據(jù)流轉(zhuǎn)全過程實(shí)現(xiàn)跟蹤和追溯;
(6)構(gòu)建多元異構(gòu)數(shù)據(jù)的數(shù)據(jù)集成和全過程監(jiān)控,實(shí)現(xiàn)數(shù)據(jù)的加密存儲和脫敏配置功能;
(7)設(shè)計全生命周期元數(shù)據(jù)管理模式,實(shí)現(xiàn)元數(shù)據(jù)血緣關(guān)系和影響分析功能;
(8)基于分布式系統(tǒng)架構(gòu),設(shè)計Spark引擎,實(shí)現(xiàn)海量數(shù)據(jù)質(zhì)量稽核;
(9)構(gòu)建數(shù)據(jù)資產(chǎn)目錄,提供統(tǒng)一資產(chǎn)視圖,實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)管理;
(10)創(chuàng)建鐵路業(yè)務(wù)模型,提供在線腳本開發(fā)環(huán)境,支持Java、Python、R等多種開發(fā)語言;
(11)集成優(yōu)化presto可視化引擎,提供交互性強(qiáng)、易用性好的數(shù)據(jù)可視化環(huán)境;
(12)提供租戶數(shù)據(jù)共享申請審批流程管理及數(shù)據(jù)接口的創(chuàng)建發(fā)布管理,提供高性能、高可用的數(shù)據(jù)應(yīng)用程序接口(API)服務(wù)。
未來數(shù)據(jù)服務(wù)平臺面向兩個層面,提供兩大類服務(wù),如圖4所示。
圖4 數(shù)據(jù)服務(wù)平臺服務(wù)模式
2018年,在《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》指導(dǎo)下,各鐵路局相繼啟動大數(shù)據(jù)工作,可謂百花齊放,各展所長。此階段對于大數(shù)據(jù)的應(yīng)用模式、建設(shè)路徑等關(guān)鍵問題進(jìn)行了探索,形成了許多可復(fù)制、可推廣的有益經(jīng)驗(yàn)。下面介紹幾個典型的應(yīng)用案例。
4.1.1 安全管控大數(shù)據(jù)應(yīng)用
運(yùn)用大數(shù)據(jù)技術(shù)開展安全生產(chǎn)規(guī)律性、傾向性、關(guān)聯(lián)性特征分析,深度挖掘事故、故障變化趨勢和作業(yè)行為習(xí)慣,研判風(fēng)險發(fā)展規(guī)律,及時發(fā)現(xiàn)隱患特征,指導(dǎo)對安全方向和隱患的超前防控,提高安全管理、生產(chǎn)組織和過程控制的針對性,實(shí)現(xiàn)事前有預(yù)測、事中有監(jiān)控、事后有分析的安全管理新機(jī)制。
遵循“人機(jī)料法環(huán)”的主線,逐步接入影響安全的各類檢測監(jiān)測信息,實(shí)現(xiàn)對安全事故故障的超前防控,其中,重點(diǎn)是人員和設(shè)備。目前,已實(shí)現(xiàn)人員及設(shè)備的安全狀態(tài)畫像,如圖5所示。
圖5 安全管控大數(shù)據(jù)應(yīng)用
(1)人員畫像。收集人員年齡、工齡、學(xué)歷、培訓(xùn)等靜態(tài)數(shù)據(jù),以及標(biāo)準(zhǔn)化程序落實(shí)、監(jiān)督檢查問題、典型故障發(fā)現(xiàn)等動態(tài)信息,對人員安全狀態(tài)進(jìn)行綜合評價,實(shí)現(xiàn)管理人員靶向精準(zhǔn)監(jiān)督檢查。
(2)設(shè)備畫像?;谠O(shè)備的各類檢測監(jiān)測信息,建立科學(xué)的評價體系,客觀真實(shí)地評價設(shè)備的安全狀態(tài),實(shí)現(xiàn)對設(shè)備的精準(zhǔn)管控及對設(shè)備故障的超前預(yù)警。
4.1.2 基于大數(shù)據(jù)的電務(wù)智能運(yùn)維
解決電務(wù)信號“三級四層”結(jié)構(gòu)復(fù)雜、服務(wù)器設(shè)置分散問題,實(shí)現(xiàn)通信信號數(shù)據(jù)融合匯聚,綜合使用多種智能化分析技術(shù),實(shí)現(xiàn)對電務(wù)設(shè)備的綜合化、智能化分析。
按照“集中化、可視化、智能化、自動化”的設(shè)計原則,整合電務(wù)網(wǎng)管、各類檢測監(jiān)測裝備所采集的技術(shù)狀態(tài)數(shù)據(jù),實(shí)現(xiàn)電務(wù)設(shè)備設(shè)施單元技術(shù)狀態(tài)全壽命周期的管理,并進(jìn)行綜合分析評價;實(shí)現(xiàn)采集數(shù)據(jù)自動共享、設(shè)備隱患自動報警、設(shè)備故障自動診斷、應(yīng)急處置自動啟動、維護(hù)作業(yè)自動派工、作業(yè)過程自動監(jiān)控、設(shè)備生命自動管理。
4.1.3 基于大數(shù)據(jù)的應(yīng)急調(diào)度指揮
使用大規(guī)模分布式非結(jié)構(gòu)化文本檢索,依據(jù)輸入的關(guān)鍵字在歷史文本庫中查詢類似案例,對歷史案例進(jìn)行文本分析,挖掘歷史案例中事故、故障的發(fā)生規(guī)律,提供決策支持。
在檢索歷史案例的基礎(chǔ)上,依據(jù)從文本報告中提取的時間、車型、故障描述、故障發(fā)生位置等多種特征,結(jié)合歷史數(shù)據(jù)分析,預(yù)測事故、故障造成影響的嚴(yán)重程度,從而預(yù)先準(zhǔn)備相應(yīng)級別的應(yīng)急預(yù)案。
對比各鐵路局既有大數(shù)據(jù)應(yīng)用,其應(yīng)用水平參差不齊,可分為3個層次。
4.2.1 集成整合
數(shù)據(jù)集成整合是大數(shù)據(jù)應(yīng)用的第1個層次,同時也是基礎(chǔ)。將分散在各個系統(tǒng)中的數(shù)據(jù)整合至一個平臺中,打破數(shù)據(jù)壁壘,實(shí)現(xiàn)數(shù)據(jù)的關(guān)聯(lián)、共享和跨專業(yè)綜合展示,包括“一桿一檔”、“一車一檔”、“一公里一檔”、“一件一檔”等等。例如,“一桿一檔”:(1)為每個供電桿建立基礎(chǔ)履歷檔案,包括廠家、服役時間、歷史故障次數(shù)、上次故障時間、檢修時間等;(2)建立從設(shè)備到故障,再到人員之間的關(guān)聯(lián)聯(lián)系。從設(shè)備關(guān)聯(lián)到其歷史上發(fā)生的故障信息,再由每一次故障關(guān)聯(lián)到故障的維修人員,并查詢看到該維修人員的檔案、歷史業(yè)績、獎懲信息等。
4.2.2 統(tǒng)計分析
在第1層次基礎(chǔ)上,對于存儲的海量歷史數(shù)據(jù),從不同維度進(jìn)行統(tǒng)計并對比分析。同比、環(huán)比,不同廠家對比、不同型號對比、各專業(yè)對比、各單位對比,并借助豐富的可視化工具進(jìn)行多樣化展示,從而找出時間、空間、數(shù)據(jù)關(guān)聯(lián)等方面的規(guī)律,獲取對于數(shù)據(jù)更深入的觀察和分析。大數(shù)據(jù)時代,可視化技術(shù)得到了長足的發(fā)展,無論從外觀上還是內(nèi)涵上,都比傳統(tǒng)的圖表有了質(zhì)的提升。該層次的大數(shù)據(jù)應(yīng)用,實(shí)施難度較低、能夠快速見效,目前,多數(shù)大數(shù)據(jù)應(yīng)用都停留在此層面。
4.2.3 趨勢預(yù)測
大數(shù)據(jù)最吸引人、價值最高的地方在于預(yù)測、預(yù)警,也是最難實(shí)現(xiàn)的。預(yù)測的核心是建立預(yù)測模型。預(yù)測模型是用數(shù)學(xué)語言或公式所描述的事物間的數(shù)量關(guān)系,它在一定程度上揭示了事物間的內(nèi)在規(guī)律性。找出影響某種結(jié)果的幾個因素,建立因與果之間的數(shù)學(xué)模型,根據(jù)因變量的變化預(yù)測結(jié)果變量的變化。當(dāng)結(jié)果變量超過臨界值時進(jìn)行報警,以預(yù)先采取應(yīng)對措施。如設(shè)備健康狀態(tài)預(yù)測、行車安全事故預(yù)測等都屬于此類應(yīng)用。預(yù)測模型包括:灰色模型,回歸模型,時間序列模型,神經(jīng)網(wǎng)絡(luò)模型等。這些預(yù)測模型各有優(yōu)劣,根據(jù)特性適用不同場景。
4.3.1 基礎(chǔ)設(shè)施缺失
大部分大數(shù)據(jù)應(yīng)用還是基于傳統(tǒng)的信息化底層架構(gòu),未采用分布式計算架構(gòu)。傳統(tǒng)架構(gòu)在數(shù)據(jù)量不大、數(shù)據(jù)類型單一的情況下尚可應(yīng)對,但隨著數(shù)據(jù)量的逐步積累及應(yīng)用場景的增加,勢必出現(xiàn)資源緊張造成的性能大幅下降。因此,開展大數(shù)據(jù)應(yīng)用,還需統(tǒng)籌規(guī)劃,盡快搭建與大數(shù)據(jù)應(yīng)用相匹配的底層技術(shù)平臺。
4.3.2 應(yīng)用層次不高
從功能上來看,很多是基礎(chǔ)信息化的內(nèi)容。大部分應(yīng)用還停留在統(tǒng)計分析、可視化展示的層面,缺乏更深一步的預(yù)警預(yù)測等亮點(diǎn)應(yīng)用,缺乏跨專業(yè)的綜合性分析應(yīng)用。
4.3.3 應(yīng)用之間缺乏統(tǒng)籌
個別單位同步開展多個領(lǐng)域的大數(shù)據(jù)應(yīng)用建設(shè),缺乏統(tǒng)籌規(guī)劃,應(yīng)用之間存在交叉及重復(fù),形成了新的業(yè)務(wù)域豎井和數(shù)據(jù)孤島。
4.3.4 與原有業(yè)務(wù)系統(tǒng)之間界面不清晰
應(yīng)用所面向的用戶未界定清晰,與原業(yè)務(wù)系統(tǒng)之間關(guān)系沒有處理好,導(dǎo)致新開發(fā)的大數(shù)據(jù)應(yīng)用與原業(yè)務(wù)系統(tǒng)功能存在交叉。
4.3.5 大數(shù)據(jù)應(yīng)用的最后一公里問題
對于第2個層次的大數(shù)據(jù)應(yīng)用,通過多種形式給用戶展現(xiàn)了海量的信息,揭示了業(yè)務(wù)的規(guī)律及發(fā)展方向。但通過這些信息,用戶應(yīng)當(dāng)做哪些決策,采取哪些措施,沒有明確的界定。因此,所展示的信息與最后決策之間建立明確關(guān)聯(lián)關(guān)系還有待繼續(xù)探索。
自全路大數(shù)據(jù)應(yīng)用全面啟動至今,已經(jīng)歷2年,目前,進(jìn)入一個承上啟下的關(guān)鍵階段。需要全面總結(jié)前期經(jīng)驗(yàn)及不足,對未來工作進(jìn)行統(tǒng)籌布局[11]。下階段,鐵路大數(shù)據(jù)工作應(yīng)圍繞以下方面展開。
按照信息化總體規(guī)劃,數(shù)據(jù)服務(wù)平臺是開展大數(shù)據(jù)應(yīng)用的基本技術(shù)平臺。數(shù)據(jù)服務(wù)平臺兩級部署,分別承載鐵路總公司及鐵路局級應(yīng)用。目前,鐵路總公司級平臺已部署完畢,近期將提供常態(tài)化服務(wù)。在鐵路局級層面,平臺已落后于大數(shù)據(jù)應(yīng)用,需要加快推進(jìn)平臺建設(shè),更好地為上層應(yīng)用提供支撐。
大數(shù)據(jù)應(yīng)用,數(shù)據(jù)是核心和命脈。數(shù)據(jù)服務(wù)平臺建成后的首要任務(wù)就是開展數(shù)據(jù)匯集:(1)需要建立數(shù)據(jù)資源規(guī)格標(biāo)準(zhǔn);(2)要明確數(shù)據(jù)匯集的各角色,包括:數(shù)據(jù)采集,數(shù)據(jù)質(zhì)量管理,數(shù)據(jù)運(yùn)營等;(3)需要科學(xué)劃分、切實(shí)保障數(shù)據(jù)擁有方的利益,這樣才能打消顧慮,真正促進(jìn)數(shù)據(jù)的共享。
按照數(shù)據(jù)服務(wù)平臺規(guī)劃,對外提供數(shù)據(jù)共享及平臺的計算存儲能力。在服務(wù)提供之前,需要明確基本的運(yùn)營服務(wù)體系,包括提供服務(wù)的范圍、服務(wù)模式研究、申請流程、審批流程等。
應(yīng)用功能是大數(shù)據(jù)的核心。鑒于前期多數(shù)大數(shù)據(jù)應(yīng)用的層次不高,還停留在簡單的統(tǒng)計分析層面,甚至只是基礎(chǔ)信息化的功能。因此,還需圍繞《鐵路大數(shù)據(jù)應(yīng)用實(shí)施方案》,緊抓業(yè)務(wù)痛點(diǎn),研判數(shù)據(jù)分析需求,全面深化各應(yīng)用的功能點(diǎn),真正做到發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升新能力。
大數(shù)據(jù)是全面貫徹落實(shí)鐵路總公司智能鐵路戰(zhàn)略的有力抓手,是建設(shè)智能京張、智能京雄、智能川藏的基礎(chǔ)性工作。鐵路大數(shù)據(jù)經(jīng)過近兩年的應(yīng)用實(shí)踐,取得了豐碩的成果,積累了相當(dāng)?shù)募夹g(shù)和經(jīng)驗(yàn),即將進(jìn)入全面深化應(yīng)用的階段。未來還需加快推進(jìn)兩級數(shù)據(jù)服務(wù)平臺體系的構(gòu)建,分期分批完成各專業(yè)數(shù)據(jù)資源的匯集,建立健全運(yùn)營服務(wù)體系,推進(jìn)數(shù)據(jù)服務(wù)平臺的常態(tài)化服務(wù)。在此基礎(chǔ)上,全面深化大數(shù)據(jù)應(yīng)用,為建設(shè)智能型鐵路提供平臺保障。