朱建生
(中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司 電子計(jì)算技術(shù)研究所,北京 100081)
近年來(lái),我國(guó)高度重視大數(shù)據(jù)研究和應(yīng)用,從國(guó)家層面制定了一系列宏觀發(fā)展戰(zhàn)略、規(guī)劃和政策。2015年8月發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》[1]明確指出,堅(jiān)持創(chuàng)新驅(qū)動(dòng)發(fā)展,加快大數(shù)據(jù)部署,深化大數(shù)據(jù)應(yīng)用,已成為穩(wěn)增長(zhǎng)、促改革、調(diào)結(jié)構(gòu)、惠民生和推動(dòng)政府治理能力現(xiàn)代化的內(nèi)在需要和必然選擇。我國(guó)鐵路也建立了一系列客運(yùn)相關(guān)信息系統(tǒng),包括新一代客票系統(tǒng)、旅客服務(wù)系統(tǒng)、客運(yùn)管理信息系統(tǒng)、客運(yùn)延伸服務(wù)系統(tǒng)和客運(yùn)清算、營(yíng)銷等系統(tǒng),為鐵路旅客運(yùn)輸服務(wù)質(zhì)量的提升奠定了良好的技術(shù)基礎(chǔ),也為鐵路客運(yùn)大數(shù)據(jù)平臺(tái)建設(shè)提供了大量客票銷售、旅客乘車、運(yùn)輸清算等業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù),成為構(gòu)建鐵路客運(yùn)大數(shù)據(jù)平臺(tái)的重要數(shù)據(jù)支撐[2]。
中國(guó)鐵道科學(xué)研究院集團(tuán)有限公司客票團(tuán)隊(duì)從2012年開始進(jìn)行大數(shù)據(jù)的應(yīng)用技術(shù)研究,主要包括以下幾方面:
(1)大數(shù)據(jù)平臺(tái)技術(shù)積累。包括數(shù)據(jù)的采集、存儲(chǔ)、處理、共享、可視化及數(shù)據(jù)安全等。
(2)大數(shù)據(jù)技術(shù)人才儲(chǔ)備。通過(guò)大數(shù)據(jù)專項(xiàng)技術(shù)培訓(xùn)、技術(shù)論壇、產(chǎn)品交流會(huì)等多種形式,進(jìn)行大數(shù)據(jù)技術(shù)人才的培養(yǎng)與儲(chǔ)備。
(3)客運(yùn)業(yè)務(wù)運(yùn)營(yíng)及運(yùn)營(yíng)業(yè)務(wù)需求梳理。對(duì)既有系統(tǒng)的業(yè)務(wù)數(shù)據(jù)進(jìn)行歸類、建立模型、總結(jié)經(jīng)驗(yàn)。
(4)技術(shù)與應(yīng)用結(jié)合實(shí)踐。對(duì)大數(shù)據(jù)技術(shù)和產(chǎn)品進(jìn)行比較分析和測(cè)試,搭建大數(shù)據(jù)實(shí)驗(yàn)平臺(tái),并在部分業(yè)務(wù)系統(tǒng)中開展試點(diǎn),進(jìn)行系列大數(shù)據(jù)應(yīng)用創(chuàng)新。
本文通過(guò)研究鐵路大數(shù)據(jù)關(guān)鍵技術(shù),實(shí)現(xiàn)了票額智能預(yù)分、鐵路旅客畫像和客運(yùn)運(yùn)營(yíng)支撐等重點(diǎn)大數(shù)據(jù)應(yīng)用創(chuàng)新,對(duì)鐵路客運(yùn)創(chuàng)新發(fā)展具有借鑒意義。
為滿足鐵路新一代客票系統(tǒng)大數(shù)據(jù)應(yīng)用需求,在系統(tǒng)建設(shè)和優(yōu)化過(guò)程中,引入了多種大數(shù)據(jù)技術(shù)進(jìn)行支撐,鐵路客運(yùn)大數(shù)據(jù)平臺(tái)應(yīng)運(yùn)而生。
鐵路新一代客票系統(tǒng)應(yīng)用于中國(guó)鐵路總公司、18個(gè)鐵路局集團(tuán)公司及所有客運(yùn)車站和旅客列車,是我國(guó)鐵路運(yùn)輸服務(wù)核心支撐平臺(tái)和國(guó)家關(guān)鍵信息基礎(chǔ)設(shè)施。系統(tǒng)提供了12306互聯(lián)網(wǎng)售票系統(tǒng)(簡(jiǎn)稱:12306)網(wǎng)站/手機(jī)APP、車站/代售點(diǎn)窗口、自動(dòng)售票機(jī)、電話訂票等豐富的售票渠道,支持現(xiàn)金、銀行卡、網(wǎng)銀以及第三方支付等多種支付方式,提供互聯(lián)網(wǎng)訂餐、動(dòng)車組自助選座、接續(xù)換乘、鐵路暢行會(huì)員等延伸服務(wù)功能。系統(tǒng)以其靈活的售票組織策略,形成了涵蓋售前預(yù)分票額、售中預(yù)警與調(diào)整、售后評(píng)估反饋的售票組織動(dòng)態(tài)優(yōu)化技術(shù),有效支撐了鐵路運(yùn)輸計(jì)劃、客運(yùn)組織、調(diào)度指揮、資源配置的精準(zhǔn)化管理。在運(yùn)營(yíng)過(guò)程中積累了大量的系統(tǒng)運(yùn)行、業(yè)務(wù)運(yùn)營(yíng)數(shù)據(jù),如客票交易、席位、訂票等,通過(guò)對(duì)數(shù)據(jù)的整合、分析,可為管理部門提供決策支持,為運(yùn)營(yíng)部門業(yè)務(wù)開展提供支撐,為旅客用戶提供更加個(gè)性化的、更好的社會(huì)化服務(wù),充分發(fā)掘和利用這些數(shù)據(jù)資產(chǎn),將為鐵路產(chǎn)生巨大的價(jià)值。
隨著鐵路客運(yùn)業(yè)務(wù)的不斷發(fā)展,業(yè)務(wù)數(shù)據(jù)呈爆炸式增長(zhǎng),數(shù)據(jù)的高效處理和精準(zhǔn)分析對(duì)存儲(chǔ)資源和處理性能提出了更高要求。傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)所采用的SM P架構(gòu)主機(jī)、共享存儲(chǔ)的擴(kuò)展非常困難,且擴(kuò)容代價(jià)高昂,使得系統(tǒng)中的計(jì)算資源、存儲(chǔ)空間逐漸成為瓶頸,系統(tǒng)數(shù)據(jù)處理和功能擴(kuò)展受到限制。鐵路客運(yùn)大數(shù)據(jù)平臺(tái)采用基于大數(shù)據(jù)的體系架構(gòu)和數(shù)據(jù)分析技術(shù),對(duì)營(yíng)銷系統(tǒng)和既有鐵路客運(yùn)信息系統(tǒng)數(shù)據(jù)接口進(jìn)行重構(gòu)和優(yōu)化,充分發(fā)揮分布式系統(tǒng)的優(yōu)點(diǎn),實(shí)現(xiàn)了系統(tǒng)的靈活擴(kuò)展,在提供擴(kuò)展性更好的存儲(chǔ)能力同時(shí),計(jì)算能力也得到大幅的提升。
鐵路客運(yùn)大數(shù)據(jù)平臺(tái)管理著全部客票交易、席位、訂票等相關(guān)業(yè)務(wù)和日志數(shù)據(jù),提供了豐富的分析主題,并支持?jǐn)?shù)據(jù)集市應(yīng)用,其架構(gòu)如圖1所示[1]。
(1)外部系統(tǒng)層:包括為客運(yùn)大數(shù)據(jù)平臺(tái)提供相關(guān)數(shù)據(jù)的外部鐵路客運(yùn)信息系統(tǒng)。
(2)數(shù)據(jù)層:從外部鐵路客運(yùn)信息系統(tǒng)獲取相關(guān)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗、整理,形成內(nèi)部數(shù)據(jù)。
(3)存儲(chǔ)層:包括客運(yùn)大數(shù)據(jù)平臺(tái)數(shù)據(jù)計(jì)算資源、存儲(chǔ)資源以及用于支撐平臺(tái)運(yùn)行的各類網(wǎng)絡(luò)資源和系統(tǒng)管理資源。
(4)分析層:部署各類分析服務(wù),用于提供分類、統(tǒng)計(jì)、聚合等分析操作的數(shù)據(jù)服務(wù)。
(5)展示訪問(wèn)層:部署各類展示服務(wù),展示類型包括圖、表以及地理信息系統(tǒng)(GIS)服務(wù)等。
(6)應(yīng)用層:結(jié)合各類業(yè)務(wù)特征,定制、構(gòu)建和發(fā)布具體的應(yīng)用以滿足用戶需求。
鐵路新一代客票系統(tǒng)在建設(shè)過(guò)程中引入了一系列關(guān)鍵技術(shù),目前,應(yīng)用廣泛的包括分布式數(shù)據(jù)存儲(chǔ)和計(jì)算框架、實(shí)時(shí)流式計(jì)算分析和大數(shù)據(jù)可視化技術(shù)。
(1)分布式存儲(chǔ)。鐵路新一代客票系統(tǒng)廣泛采用了計(jì)算存儲(chǔ)融合技術(shù),使用通用X86服務(wù)器,構(gòu)建分布式存儲(chǔ)系統(tǒng),有效解決傳統(tǒng)共享存儲(chǔ)系統(tǒng)所帶來(lái)的擴(kuò)展性差和可用性不足等問(wèn)題,提供高可靠、高性能、高可擴(kuò)展、高性價(jià)比的一體化存儲(chǔ)解決方案。
(2)分布式數(shù)據(jù)庫(kù)。鐵路客運(yùn)大數(shù)據(jù)平臺(tái)采用MPP + Shared Nothing[3]架構(gòu)的分布式并行數(shù)據(jù)庫(kù)集群系統(tǒng)來(lái)完善現(xiàn)有數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)。分布式數(shù)據(jù)庫(kù)集群具備高性能、高可用、高擴(kuò)展特性,可以為營(yíng)銷系統(tǒng)提供高性價(jià)比的存儲(chǔ)、計(jì)算平臺(tái),為數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)、商務(wù)智能(BI)系統(tǒng)和輔助決策系統(tǒng)提供支撐。
(3)分布式計(jì)算框架。常規(guī)的單機(jī)計(jì)算模式無(wú)法支撐大數(shù)據(jù)計(jì)算的任務(wù)量,必須以分布式計(jì)算框架將計(jì)算任務(wù)分解為單機(jī)可以承受的計(jì)算任務(wù),充分利用大數(shù)據(jù)分布式計(jì)算的特點(diǎn),發(fā)揮分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù)的優(yōu)勢(shì)[4],同時(shí)對(duì)計(jì)算過(guò)程中各種問(wèn)題和異常進(jìn)行控制,常用的分布式計(jì)算框架包括Hadoop、Storm、Spark等[5]。這些框架不僅為12306提供了高可用性服務(wù),也為營(yíng)銷系統(tǒng)的數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理和數(shù)據(jù)查詢提供高效的計(jì)算資源,為實(shí)時(shí)數(shù)據(jù)處理提供保障。
利用大數(shù)據(jù)中的流式計(jì)算組件,如storm、spark stream ing等基于內(nèi)存的計(jì)算框架[6-7]實(shí)現(xiàn)(準(zhǔn))實(shí)時(shí)數(shù)據(jù)更新和統(tǒng)計(jì),解決目前對(duì)統(tǒng)計(jì)實(shí)時(shí)性要求較高而計(jì)算資源不足以支持的現(xiàn)狀,實(shí)現(xiàn)在小時(shí)、分鐘甚至是秒級(jí)別完成大量數(shù)據(jù)的計(jì)算過(guò)程[8]。
數(shù)據(jù)展現(xiàn),通過(guò)可視化技術(shù)使數(shù)據(jù)形象化,從而激發(fā)人的形象思維。采用大數(shù)據(jù)可視化技術(shù),針對(duì)不同業(yè)務(wù)特點(diǎn)采用不同的方式進(jìn)行,有助于找出數(shù)據(jù)中隱藏的規(guī)律,從而為運(yùn)營(yíng)管理、業(yè)務(wù)決策等提供依據(jù)[9]。采用的可視化圖像類型主要包括折線(面積)圖、柱狀(條形)圖、散點(diǎn)(氣泡)圖、K線圖、餅(圓環(huán))圖、雷達(dá)(面積)圖、和弦圖、力導(dǎo)向布局圖、地圖、儀表盤、漏斗圖、事件河流圖和混搭等。另外,使用動(dòng)態(tài)的圖形和圖像結(jié)果,用于實(shí)時(shí)預(yù)警、流程監(jiān)控和趨勢(shì)對(duì)比分析等業(yè)務(wù)場(chǎng)景。
鐵路新一代客票系統(tǒng)在建設(shè)和運(yùn)營(yíng)過(guò)程中,圍繞票額預(yù)分、鐵路旅客畫像和可視化分析等業(yè)務(wù)場(chǎng)景開展了深入研究。
圖1 鐵路客運(yùn)大數(shù)據(jù)平臺(tái)架構(gòu)
由于鐵路運(yùn)力資源分配受限較多、停站方案復(fù)雜、鐵路票額始發(fā)集中管理,導(dǎo)致旅客需求與運(yùn)能的匹配情況不易掌握,因此,要求新一代客票系統(tǒng)自預(yù)售之日起,保證始發(fā)長(zhǎng)途票額分配合理,兼顧沿途需求,保障中間站的旅客發(fā)送,充分提高中間站組織客流的積極性,達(dá)到票額管理合理化、科學(xué)化、趟車效益增加的目的[10]。票額智能預(yù)分是以最大程度有效利用運(yùn)能、滿足旅客出行需求為目標(biāo)而構(gòu)建的客運(yùn)票額優(yōu)化組織與管理的創(chuàng)新管理模式,其基本思路是在鐵路有限運(yùn)力條件下,以歷史數(shù)據(jù)為基礎(chǔ),以列車運(yùn)行圖為約束,按列車席別,對(duì)起終點(diǎn)間(OD)客流進(jìn)行需求預(yù)測(cè),生成列車席位預(yù)分方案,并根據(jù)客流波動(dòng)的規(guī)律對(duì)票額進(jìn)行實(shí)時(shí)調(diào)整,其流程如圖2所示。票額智能預(yù)分對(duì)各鐵路客運(yùn)企業(yè)運(yùn)輸組織實(shí)現(xiàn)挖潛提效、精細(xì)化管理起到了關(guān)鍵作用。
圖2 票額智能預(yù)分流程
3.1.1 OD客流預(yù)測(cè)
來(lái)自鐵路新一代客票系統(tǒng)的多個(gè)渠道的售票歷史數(shù)據(jù)通過(guò)傳輸、復(fù)制等數(shù)據(jù)同步技術(shù)進(jìn)入到鐵路總公司營(yíng)銷系統(tǒng),形成所需分析的數(shù)據(jù)源,通過(guò)ETL裝載進(jìn)入鐵路客運(yùn)大數(shù)據(jù)平臺(tái),在營(yíng)銷系統(tǒng)的客流預(yù)測(cè)子系統(tǒng)中進(jìn)行預(yù)測(cè)[11]。由于票額預(yù)分所需的OD客流預(yù)測(cè)目標(biāo)需要精細(xì)化到每趟車的OD客流,而鐵路旅客上下車客流受多種因素影響,尤其是對(duì)于客流量較小的車站隨機(jī)性很強(qiáng),屬于大尺度空間下的小樣本預(yù)測(cè)難題。客流預(yù)測(cè)子系統(tǒng)采用長(zhǎng)期客流預(yù)測(cè)、短期客流預(yù)測(cè)以及車票預(yù)售過(guò)程中的動(dòng)態(tài)預(yù)測(cè)相結(jié)合的方法,結(jié)合同比、環(huán)比、節(jié)假日規(guī)律性波動(dòng)以及當(dāng)前預(yù)售情況,較好地解決了該預(yù)測(cè)難題。目前,平峰期每天預(yù)測(cè)約12萬(wàn)多個(gè)區(qū)間,高峰期可達(dá)13萬(wàn)多個(gè)區(qū)間。
3.1.2 預(yù)分方案生成與執(zhí)行
客流預(yù)測(cè)子系統(tǒng)產(chǎn)生的預(yù)測(cè)數(shù)據(jù)進(jìn)入票額預(yù)分執(zhí)行子系統(tǒng),票額預(yù)分執(zhí)行子系統(tǒng)形成預(yù)分方案,下發(fā)到各鐵路局集團(tuán)公司(簡(jiǎn)稱:鐵路局)。預(yù)分方案通過(guò)票額預(yù)分執(zhí)行子系統(tǒng)作用于席位庫(kù),對(duì)生成的初始票額進(jìn)行預(yù)分,各鐵路局通過(guò)票額預(yù)分優(yōu)化子系統(tǒng)對(duì)預(yù)分效果進(jìn)行實(shí)時(shí)反饋,形成優(yōu)化方案,供鐵路局客運(yùn)決策者進(jìn)行調(diào)整,實(shí)現(xiàn)智能調(diào)整。
3.1.3 實(shí)時(shí)動(dòng)態(tài)調(diào)整
為適應(yīng)動(dòng)車組列車的公交化開行和售票組織策略的動(dòng)態(tài)調(diào)整,進(jìn)一步提高訂票記錄和可售能力獲取的實(shí)時(shí)性,鐵路新一代客票系統(tǒng)采用內(nèi)存數(shù)據(jù)庫(kù)技術(shù)研究了可售能力的敏捷獲取方法,以實(shí)現(xiàn)對(duì)票額預(yù)分情況的動(dòng)態(tài)調(diào)整?;?2306余票查詢集群定義余票批量調(diào)用W ebService 接口,設(shè)置邏輯上的余票快照應(yīng)用服務(wù)器,在監(jiān)控車次定義表中定義需要監(jiān)控的車次,包括所有的購(gòu)票區(qū)間及席別,應(yīng)用服務(wù)器每隔一段時(shí)間向查詢接口發(fā)出一次所有定義表中已定義車次的采樣請(qǐng)求,由于車次較多,采用并發(fā)任務(wù)執(zhí)行。監(jiān)控車次定義表由工作流定時(shí)更新,不斷新增新開的車次,取消已經(jīng)停開的車次,并將車次加入預(yù)先設(shè)置好的并行分組,采樣結(jié)果存入大數(shù)據(jù)分析平臺(tái)。在鐵路局級(jí)客票系統(tǒng)設(shè)置席位庫(kù)觸發(fā)器,將訂票信息實(shí)時(shí)采集到本地,結(jié)合初始預(yù)分席位生成席位存量,席位存量存入大數(shù)據(jù)分析平臺(tái),以供其他系統(tǒng)分析使用。
智能票額預(yù)分實(shí)施以來(lái),列車效益得到了較好的提升,其中,京滬高鐵和武廣高鐵全線發(fā)送量分別提升了2%和0.3%,收入分別提升10.4%和4.8%,客座率分別提升7.9%和10.6%。
用戶畫像即通過(guò)對(duì)匯聚的海量用戶數(shù)據(jù)執(zhí)行不同的數(shù)據(jù)維度分析,進(jìn)行用戶信息標(biāo)簽化,形成每個(gè)用戶的特征標(biāo)簽集合,對(duì)外提供基于用戶特征標(biāo)簽的數(shù)據(jù)服務(wù)的過(guò)程。鐵路旅客用戶畫像系統(tǒng)是利用鐵路旅客出行和交易信息,推導(dǎo)出用戶的人口屬性、行為偏好等語(yǔ)義標(biāo)簽,為深度利用這些信息、提供更好的出現(xiàn)服務(wù)提供數(shù)據(jù)基礎(chǔ)。
3.2.1 用戶畫像系統(tǒng)構(gòu)建
鐵路旅客用戶畫像系統(tǒng)架構(gòu)如圖3所示。利用Hadoop、Hive、Elastic Search、Hbase等大數(shù)據(jù)框架及組件對(duì)旅客的購(gòu)票行為、支付行為等進(jìn)行深入分析;分布式文件系統(tǒng)(HDFS)用于存儲(chǔ)業(yè)務(wù)數(shù)據(jù)與用戶標(biāo)簽屬性數(shù)據(jù); Hive用于統(tǒng)計(jì)分析用戶標(biāo)簽屬性;Elastic Search用于快速搜索用戶標(biāo)簽數(shù)據(jù)。采用SpringMVC、M yBatis、Bootstrap、echart等架構(gòu)開發(fā)系統(tǒng)管理界面,系統(tǒng)元數(shù)據(jù)統(tǒng)一存放在PostgreSQL數(shù)據(jù)庫(kù)中。
圖3 鐵路旅客用戶畫像系統(tǒng)架構(gòu)
3.2.2 用戶畫像系統(tǒng)應(yīng)用
基于目前鐵路客運(yùn)數(shù)據(jù)現(xiàn)狀,鐵路旅客用戶畫像系統(tǒng)可完成下述幾個(gè)方面的應(yīng)用:通過(guò)對(duì)旅客所購(gòu)車票信息的分析,可得到旅客成分結(jié)構(gòu)、產(chǎn)品選擇行為、購(gòu)票行為、旅行行為等方面信息。
(1)旅客群體分析
旅客群體分析是指旅客成分結(jié)構(gòu),主要包括性別比例、旅客區(qū)域(城市)比例、各年齡段比例、各票種的比例,可用于區(qū)分購(gòu)票人群和推算消費(fèi)偏好。
(2)旅客購(gòu)票行為分析
產(chǎn)品選擇行為包括旅客常選擇的列車類型、鋪別和席別、票價(jià)區(qū)間、乘車?yán)锍谭治?、列車開點(diǎn)到點(diǎn)、列車擔(dān)當(dāng)企業(yè)等偏好,用于指導(dǎo)運(yùn)輸企業(yè)設(shè)計(jì)客運(yùn)產(chǎn)品。
交易行為分析包括購(gòu)票渠道、是否需要互聯(lián)網(wǎng)換票、取票、自助售票習(xí)慣、支付方式、預(yù)售規(guī)律、通票、聯(lián)程、往返票分析、退票時(shí)間規(guī)律、改簽時(shí)間規(guī)律、改簽分類分析等,用于指導(dǎo)運(yùn)輸企業(yè)制定鐵路銷售策略。
(3)旅客出行行為分析
按旅客出行目的分析:通過(guò)設(shè)計(jì)合理的模型進(jìn)行評(píng)判,將出行目的分為旅游、商務(wù)、公務(wù)、探親、民工、學(xué)生、通勤職工等;按旅客出行頻度分析:按出行次數(shù)對(duì)旅客進(jìn)行分群分析,得到潛在的常旅客用戶;按旅客出行范圍分析:按行政區(qū)劃進(jìn)行出行范圍分析,如省內(nèi)客流、省間客流;按旅客出行行程分析:按旅客出行行程進(jìn)行分析,由聚類模型分析得到旅客行程的合理劃分。
(4)精準(zhǔn)營(yíng)銷
通過(guò)對(duì)旅客群體、購(gòu)票和出行行為的分析,可以發(fā)現(xiàn)需要重點(diǎn)關(guān)注的旅客,從而進(jìn)行產(chǎn)品推薦或者個(gè)性化服務(wù),提升旅客出行體驗(yàn)。鐵路旅客用戶畫像系統(tǒng),為旅客建立了人口屬性、出行行為、交易行為等多維度的標(biāo)簽,通過(guò)對(duì)多維度標(biāo)簽的篩選、聚類,找出符合要求的特定人群,然后在推薦平臺(tái)為人群制定對(duì)應(yīng)的營(yíng)銷策略,并利用廣告平臺(tái)實(shí)現(xiàn)對(duì)用戶群體的精準(zhǔn)營(yíng)銷[12]?;阼F路旅客用戶畫像數(shù)據(jù)的推薦系統(tǒng)利用Elastic search 組合和聚合搜索能力,提供快速的標(biāo)簽篩選能力,在此基礎(chǔ)上利用機(jī)器學(xué)習(xí)算法—基于用戶的協(xié)同過(guò)濾算法,根據(jù)用戶的偏好實(shí)現(xiàn)用戶聚類,即將相似度較高的用戶分為一個(gè)群體,在用戶訪問(wèn)時(shí)進(jìn)行信息的推送,從而實(shí)現(xiàn)產(chǎn)品的精準(zhǔn)推薦。
鐵路旅客用戶畫像系統(tǒng)的建立填補(bǔ)了鐵路客運(yùn)信息化的一項(xiàng)空白,通過(guò)對(duì)鐵路用戶的行為數(shù)據(jù)、交易數(shù)據(jù)等信息進(jìn)行采集、加工和分析,形成用戶精準(zhǔn)畫像數(shù)據(jù),支撐精準(zhǔn)廣告投放和精準(zhǔn)服務(wù)推薦,為用戶提供更加個(gè)性化、更好的社會(huì)化服務(wù),有利于鐵路部門提升客戶服務(wù)能力、提高信息資源收益和核心競(jìng)爭(zhēng)力。
近年來(lái),借助大數(shù)據(jù)和人工智能技術(shù)提升輔助決策的水平,強(qiáng)化了相關(guān)業(yè)務(wù)數(shù)據(jù)的實(shí)時(shí)統(tǒng)計(jì)和展現(xiàn),同時(shí),借助各種銷售渠道不斷豐富客流調(diào)查的范圍和調(diào)查內(nèi)容,同步優(yōu)化和完善了客流預(yù)測(cè)功能,加強(qiáng)票額預(yù)警監(jiān)控,分析售票組織策略,調(diào)整票額分配建議,測(cè)算趟車經(jīng)濟(jì)效益,為鐵路運(yùn)輸組織、運(yùn)力調(diào)配、客流分析、開行方案制定、運(yùn)行圖優(yōu)化等提供了有力的支撐。
3.3.1 客流分析與預(yù)測(cè)
客流分析是以客票交易數(shù)據(jù)、運(yùn)能利用數(shù)據(jù)為主要數(shù)據(jù)源,按日期、列車、方向、區(qū)域(省、局、段、站)、列車等級(jí)、席別、票種、渠道等不同類別對(duì)售票存根、席位庫(kù)數(shù)據(jù)進(jìn)行加工處理,為鐵路總公司、鐵路局、站段(含客運(yùn)段)三級(jí)用戶提供對(duì)客票發(fā)售、客流情況、票額利用以及各渠道銷售情況等進(jìn)行統(tǒng)計(jì)和分析的結(jié)果。
客流預(yù)測(cè)是以交易數(shù)據(jù)、客流調(diào)查數(shù)據(jù)、購(gòu)票請(qǐng)求數(shù)據(jù)、客流影響因素等為依據(jù),采用數(shù)據(jù)挖掘中的相關(guān)技術(shù),如分類與預(yù)測(cè)方法、聚類方法、時(shí)間序列方法等,對(duì)未來(lái)不同時(shí)間范圍內(nèi)(如年度、預(yù)售期內(nèi)、特定節(jié)假日等)、不同粒度(如全路、指定鐵路局、指定車站、指定車次、指定OD等)的客流變化趨勢(shì)、不同客流特點(diǎn)(既有線、高鐵、城際等)進(jìn)行預(yù)測(cè),為產(chǎn)品設(shè)計(jì)與調(diào)整、收益管理等各項(xiàng)營(yíng)銷決策任務(wù)提供依據(jù)。系統(tǒng)可實(shí)現(xiàn)總量預(yù)測(cè)、假日預(yù)測(cè)、客流成分與趨勢(shì)預(yù)測(cè)、專項(xiàng)預(yù)測(cè)。在研究過(guò)程中,建立了增長(zhǎng)率模型、四階段法模型等適用于鐵路客流情況分析的預(yù)測(cè)模型,實(shí)現(xiàn)了對(duì)未來(lái)客流量的高精度預(yù)測(cè)[13]。
3.3.2 開行方案制定
鐵路新一代客票系統(tǒng)以客流分析和預(yù)測(cè)的結(jié)果為依據(jù),結(jié)合對(duì)歷史數(shù)據(jù)的分析和專家經(jīng)驗(yàn),為鐵路總公司、各鐵路局進(jìn)行開行方案的輔助制定。
(1)圖定開行方案輔助編制
針對(duì)圖定列車開行方案,在對(duì)既有列車客流分析及預(yù)測(cè)的基礎(chǔ)上,為新增列車提供決策依據(jù)和模擬評(píng)估,對(duì)既有列車開行周期、運(yùn)行區(qū)間、徑路、停站、編組、運(yùn)行時(shí)段等提出調(diào)整建議,為建立基于收益評(píng)估的客運(yùn)列車退出機(jī)制提供數(shù)據(jù)支撐。根據(jù)既有線、高鐵和城際等不同類型列車,提供適合其各自特點(diǎn)的輔助編制流程[14]。
(2)臨客開行方案輔助編制
為滿足春運(yùn)、暑運(yùn)、節(jié)假日臨時(shí)旅客列車開行方案編制的業(yè)務(wù)需要,結(jié)合運(yùn)能配置與客流預(yù)測(cè)結(jié)果,對(duì)臨客的開行時(shí)間、等級(jí)、編組等提出建議。
3.3.3 運(yùn)行圖優(yōu)化
短期運(yùn)力調(diào)整建議。在現(xiàn)行開行方案的基礎(chǔ)上,針對(duì)近期的客流特征和票額預(yù)售情況,提出短期內(nèi)運(yùn)力調(diào)整的建議,如加掛、甩車、換掛、臥代座、動(dòng)車重聯(lián)及減編等,適應(yīng)客流需求。
使用數(shù)據(jù)可視化技術(shù)將客票數(shù)據(jù)賦予表現(xiàn)力,使客運(yùn)企業(yè)決策者能夠直觀感受到運(yùn)營(yíng)中存在的問(wèn)題[15]。基于旅客發(fā)送量、席位利用等指標(biāo)對(duì)當(dāng)前運(yùn)行圖進(jìn)行鐵路客流數(shù)據(jù)的可視化,了解客票系統(tǒng)的宏觀運(yùn)行情況,可直接反映運(yùn)能和客流匹配的程度,為運(yùn)行圖優(yōu)化提供重要依據(jù)。
鐵路新一代客票系統(tǒng)建設(shè)和運(yùn)營(yíng),積累了大量的系統(tǒng)運(yùn)行、業(yè)務(wù)運(yùn)營(yíng)等數(shù)據(jù),融合采集、存儲(chǔ)、處理、共享、可視化及數(shù)據(jù)安全的大數(shù)據(jù)技術(shù)。在鐵路數(shù)據(jù)服務(wù)平臺(tái)的基礎(chǔ)上,構(gòu)建鐵路客運(yùn)大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)了票額智能預(yù)分、鐵路旅客畫像、客運(yùn)運(yùn)營(yíng)支撐等大數(shù)據(jù)應(yīng)用創(chuàng)新。未來(lái),將繼續(xù)圍繞“客運(yùn)提質(zhì)”計(jì)劃,持續(xù)優(yōu)化數(shù)據(jù)處理、挖掘、增值等環(huán)節(jié)的模型、算法,構(gòu)建鐵路客運(yùn)大數(shù)據(jù)產(chǎn)業(yè)鏈,支撐鐵路客運(yùn)的創(chuàng)新發(fā)展,可在如下幾個(gè)方面進(jìn)行進(jìn)一步研究:
(1)基于鐵路客運(yùn)大數(shù)據(jù)平臺(tái),擴(kuò)展大數(shù)據(jù)在鐵路客運(yùn)業(yè)務(wù)的應(yīng)用范圍,重點(diǎn)圍繞運(yùn)輸能力和運(yùn)輸組織優(yōu)化,市場(chǎng)監(jiān)測(cè),收益管理,精準(zhǔn)營(yíng)銷,售票組織監(jiān)控、預(yù)警、調(diào)整以及風(fēng)險(xiǎn)防控等應(yīng)用領(lǐng)域開展研究,加快鐵路客運(yùn)數(shù)據(jù)內(nèi)在價(jià)值的轉(zhuǎn)化,使其成為鐵路客運(yùn)發(fā)展的生產(chǎn)力。
(2)積極開展大數(shù)據(jù)在鐵路客運(yùn)延伸領(lǐng)域的應(yīng)用,實(shí)現(xiàn)接送站、餐飲、旅游、租車、酒店等客運(yùn)延伸服務(wù)產(chǎn)品的智能推薦和精準(zhǔn)服務(wù),創(chuàng)新產(chǎn)品服務(wù)設(shè)計(jì)以滿足旅客不同層次的需要,并提供聚合信息服務(wù),發(fā)展出行新業(yè)態(tài)產(chǎn)品,提升鐵路旅客出行體驗(yàn)。
(3)構(gòu)建交通大數(shù)據(jù)業(yè)務(wù)生態(tài)圈,推動(dòng)行業(yè)互連互通及數(shù)據(jù)共享,構(gòu)建無(wú)縫化的旅客聯(lián)運(yùn)體系,推進(jìn)各運(yùn)輸方式間的聯(lián)程聯(lián)運(yùn)和智能協(xié)同調(diào)度,優(yōu)化運(yùn)輸資源配置,為公眾提供更加優(yōu)質(zhì)、便捷和高效的智慧出行服務(wù)。