楊廣祿
(深圳達(dá)實(shí)智能股份有限公司,廣東深圳 518000)
城市軌道交通(以下簡(jiǎn)稱地鐵)由于運(yùn)行在專用行車道上,不受其他交通工具干擾,可有效解決交通堵塞,具有方便快捷等諸多優(yōu)點(diǎn),而成為城市人群的主要出行方式,因此地鐵客流人群的管理與車站運(yùn)營(yíng)管理息息相關(guān)。目前,地鐵運(yùn)營(yíng)公司的車站管理依靠車站人員進(jìn)行人工管理,需要耗費(fèi)大量人力資源,管理效率低。車站的運(yùn)營(yíng)急需運(yùn)用計(jì)算機(jī)網(wǎng)絡(luò)、大數(shù)據(jù)分析等在內(nèi)的科學(xué)方法和技術(shù),實(shí)現(xiàn)車站的可視化、集成化和智慧化管理,實(shí)現(xiàn)車站管理信息的收集、傳輸、加工、儲(chǔ)存、更新和維護(hù),集客運(yùn)與設(shè)備管理于一體,通過對(duì)車站設(shè)備進(jìn)行數(shù)據(jù)采集,提供車站運(yùn)營(yíng)管控的數(shù)據(jù)處理,以達(dá)到數(shù)據(jù)共享、工作協(xié)同、數(shù)據(jù)分析的要求,為車站管理者提供管理與決策依據(jù),保證車站正常運(yùn)營(yíng),提前預(yù)防和控制車站運(yùn)營(yíng)管控風(fēng)險(xiǎn),從而達(dá)到減員增效、提高安全的目標(biāo)。
目前地鐵客流監(jiān)測(cè)[1]的主要方式及問題如下。
(1)視覺識(shí)別技術(shù)[2]。站內(nèi)、車上條件有限,視覺識(shí)別技術(shù)面臨技術(shù)困難。路網(wǎng)規(guī)模大,需要監(jiān)測(cè)點(diǎn)眾多而且投資大、建設(shè)周期長(zhǎng)。
(2)售檢票系統(tǒng)統(tǒng)計(jì)[3]。售檢票系統(tǒng)只提供乘客進(jìn)出站信息,出行過程信息缺失,無法掌握路網(wǎng)內(nèi)的客流分布和動(dòng)態(tài)。
(3)手機(jī)信號(hào)定位方法[4]。地面或高架站無法區(qū)分站內(nèi)外客流、定位準(zhǔn)確性不高、一人多號(hào)等技術(shù)處理問題。
(4)移動(dòng)通信(WiFi或藍(lán)牙)[5-6]。只能實(shí)現(xiàn)對(duì)部分客流(使用專用APP)監(jiān)測(cè),而且投資大、建設(shè)周期長(zhǎng)。
(5)車輛載重估算[7]。只能監(jiān)測(cè)車上客流人數(shù),而且估算數(shù)據(jù)準(zhǔn)確性有待證實(shí)。
目前,各種技術(shù)手段零散而無序,導(dǎo)致客流監(jiān)測(cè)能力不足,缺乏客流精準(zhǔn)管控方法。沒有對(duì)大客流條件下的高風(fēng)險(xiǎn)客流聚集點(diǎn)的精準(zhǔn)管理和控制方法,缺乏對(duì)事件影響范圍和影響程度的量化評(píng)估方法和手段,被動(dòng)式面向群體乘客的服務(wù)模式,缺乏對(duì)乘客的個(gè)性化出行服務(wù)需求分析,也沒有主動(dòng)式個(gè)性化的服務(wù)支撐手段。
運(yùn)營(yíng)大數(shù)據(jù)的建設(shè)需求,旨在基于實(shí)時(shí)精準(zhǔn)采集各車站內(nèi)關(guān)鍵區(qū)域的結(jié)構(gòu)化客流數(shù)據(jù),結(jié)合AFC、WiFi嗅探系統(tǒng)、CCTV系統(tǒng)、以及線網(wǎng)運(yùn)行數(shù)據(jù)、區(qū)域交通數(shù)據(jù)等技術(shù)手段和方法,進(jìn)行整合運(yùn)用,研究一套行之有效的智慧客流分析預(yù)測(cè)系統(tǒng),通過大數(shù)據(jù)分析技術(shù)對(duì)軌道交通客流數(shù)據(jù)進(jìn)行綜合分析研究,尋找數(shù)據(jù)之間的關(guān)系,預(yù)測(cè)乘客出行的趨勢(shì),為運(yùn)營(yíng)部門進(jìn)行客流檢查、組織與協(xié)調(diào)管控提供數(shù)據(jù)支撐及輔助,為行人出行提供信息服務(wù),為城市軌道交通的運(yùn)營(yíng)、車輛運(yùn)行提供決策支持。
客流大數(shù)據(jù)分析中應(yīng)用到的數(shù)據(jù)包括AFC刷卡交易明細(xì)數(shù)據(jù)、城市軌道交通線網(wǎng)、線路、斷面、車站、OD對(duì)(O為起始站點(diǎn)(Origin),代表客流量的產(chǎn)生地;D為終到站點(diǎn)(Destination),是客流量的吸引地;OD連接形成有效路徑,同一張票卡的進(jìn)站和出站信息進(jìn)行配對(duì),得到一個(gè)“O-D對(duì)”)的歷史客流數(shù)據(jù)[8]、各維度的固定屬性數(shù)據(jù)以及包括天氣信息、節(jié)假日信息、典型活動(dòng)、突發(fā)事件各種輿情信息等在內(nèi)的分析日相關(guān)數(shù)據(jù)。
其中,AFC刷卡交易明細(xì)數(shù)據(jù)和歷史客流數(shù)據(jù)直接調(diào)用,AFC刷卡交易明細(xì)數(shù)據(jù)來源于完成匹配的雙邊數(shù)據(jù)表,歷史客流數(shù)據(jù)來源于清分結(jié)果數(shù)據(jù)表[9],如表1所示。
表1 數(shù)據(jù)來源表
線網(wǎng)、線路、斷面、車站、OD對(duì)的固定屬性數(shù)據(jù),以及包括天氣信息、節(jié)假日信息、典型活動(dòng)、突發(fā)事件各種輿情信息等在內(nèi)的分析日相關(guān)數(shù)據(jù),需要進(jìn)行數(shù)據(jù)表結(jié)構(gòu)設(shè)計(jì)完成數(shù)據(jù)輸入并存儲(chǔ)。
根據(jù)車站、線路、線網(wǎng)、OD對(duì)的內(nèi)在屬性、分析日當(dāng)日車站、線路、線網(wǎng)、OD對(duì)外部環(huán)境屬性等信息,把車站、線路、線網(wǎng)、OD對(duì)標(biāo)簽分別分為固定屬性標(biāo)簽、非固定屬性標(biāo)簽和外部屬性標(biāo)簽,對(duì)車站、線路、線網(wǎng)、OD對(duì)分別進(jìn)行標(biāo)簽化處理,整理存入Excel表格。
客流影響主要指客流規(guī)模變化和特征變化,受到非固定屬性影響因子(包括星期、天氣、溫度、季節(jié)、典型活動(dòng)等)和外部屬性影響因子(包括新站開通、新線開通、票價(jià)調(diào)整、封站管控等)的影響,線網(wǎng)、線路、斷面、車站、OD對(duì)等不同維度的各指標(biāo)量會(huì)產(chǎn)生不同程度的波動(dòng)。對(duì)每一個(gè)線網(wǎng)/線路/斷面/車站/OD對(duì)各指標(biāo)量的變化程度,超過設(shè)定的異常點(diǎn)的閾值情況所對(duì)應(yīng)的非固定屬性與外部屬性的影響因子標(biāo)簽進(jìn)行提取,運(yùn)用數(shù)理統(tǒng)計(jì)中的貝葉斯的方法[10],分析異常點(diǎn)單一影響因子的影響程度,把單一影響因子進(jìn)行組合行車一個(gè)場(chǎng)景,分析不同場(chǎng)景對(duì)于客流的影響程度,繪制非固定屬性與外部屬性影響因子對(duì)于線網(wǎng)/線路/斷面/車站/OD對(duì)等不同維度各指標(biāo)量的影響權(quán)重表[11-14]。
根據(jù)客流展示、客流對(duì)比分析、客流時(shí)間序列擬合的比對(duì),選取日、周、月、年等時(shí)間段進(jìn)行指標(biāo)選取[4]。
(1)車站:進(jìn)站量、出站量、進(jìn)出站量、換乘量(換乘站)、分方向換乘量(換乘站)、乘降量(換乘站);
(2)斷面:分上下行斷面客流量、分上下行斷面滿載率、方向不均衡系數(shù)、斷面不均衡系數(shù)、時(shí)間不均衡系數(shù);
(3)線路:進(jìn)站量、本線進(jìn)它線出進(jìn)線量、本線進(jìn)本線出進(jìn)線量、出站量、進(jìn)出站量、換乘量、它線進(jìn)本線出換乘量、它線進(jìn)它線出換乘量、客運(yùn)量;
(4)線網(wǎng):進(jìn)站量、出站量、進(jìn)出站量、換乘量、客運(yùn)量;
(5)OD對(duì):OD量、OD比例。
為描述客流分布特征,需要引入分布函數(shù)進(jìn)行擬合,根據(jù)客流分布情況進(jìn)行擬合,最終用一種比較兩樣本是否同分布的常用的非參數(shù)統(tǒng)計(jì)方法(即K-S檢驗(yàn))確定最終周客流分布服從那種或那些分布。
對(duì)車站、線路、線網(wǎng)、OD對(duì)的客流分別進(jìn)行各指定階段內(nèi)的客流分析,指定階段包括春運(yùn)階段、學(xué)生寒暑假放假階段、不同季節(jié)各階段、節(jié)假日階段、典型活動(dòng)階段、突發(fā)性事件階段、特殊氣候階段、封站管控階段。分析內(nèi)容:(1)各階段內(nèi)車站、線路、線網(wǎng)、OD對(duì)對(duì)應(yīng)客流的總量、均值、變化趨勢(shì)、周期、階段等客流狀態(tài);(2)分析對(duì)象之間,即全網(wǎng)所有車站之間、全網(wǎng)所有線路之間、全網(wǎng)所有OD對(duì)之間,在該階段內(nèi)的客流量對(duì)比;(3)某一分析對(duì)象在某階段內(nèi)的客流量和平常日的客流量對(duì)比,為了確定該階段的存在引起的客流變化情況;(4)歷年該階段發(fā)生時(shí)客流量的對(duì)比。
主要針對(duì)不同事件下的車站、線路、線網(wǎng)、OD對(duì)客流,進(jìn)行特性分析,分析內(nèi)容:(1)客流變化分析:分析客流在事件發(fā)生期間的變化情況,用于確定節(jié)假日客流變化趨勢(shì)、周期或階段;(2)客流對(duì)比分析:對(duì)比計(jì)算來確定事件下客流與普通場(chǎng)景客流之間的差別,同時(shí)考慮同一事件在歷次發(fā)生時(shí)的客流量變化情況;(3)事件影響分析:分析事件的影響范圍。
事件分析通過對(duì)比計(jì)算來確定指定階段客流與普通場(chǎng)景客流之間的差別。另外,考慮同一指定階段在歷年的客流量變化情況,主要是從城市的角度出發(fā),初步分析人們的出行意愿,即指定階段對(duì)乘客出行的影響是否發(fā)生變化,變化幅度的分析等,可以為后續(xù)同類事件影響程度的分析提供基礎(chǔ)數(shù)據(jù)。
2.1 指標(biāo)計(jì)算
(1)車站指標(biāo)計(jì)算:普通站進(jìn)站量、普通站出站量、普通站進(jìn)出站量、換乘站進(jìn)站量、換乘站出站量、換乘站進(jìn)出站量、換乘站換乘量、換乘站分方向換乘量、換乘站乘降量。
(2)斷面指標(biāo)計(jì)算:斷面客流量、斷面擁擠度/斷面滿載率、方向不均衡系數(shù)、時(shí)間不均衡系數(shù)、斷面不均衡系數(shù)。
(3)線路指標(biāo)計(jì)算:線路進(jìn)線量、線路本線進(jìn)本線出進(jìn)線量、線路本線進(jìn)它線出進(jìn)線量、線路出站量、線路進(jìn)出站量、線路換乘量、線路它線進(jìn)本線出換入量、線路它線進(jìn)它線出途經(jīng)量、線路客運(yùn)量。
(4)線網(wǎng)指標(biāo)計(jì)算:線網(wǎng)進(jìn)站量、線網(wǎng)出站量、線網(wǎng)進(jìn)出站量、線網(wǎng)換乘量、線網(wǎng)客運(yùn)量。
(5)OD對(duì)指標(biāo)計(jì)算:OD量、OD比例。
2.2.1 數(shù)據(jù)對(duì)比分析
2.2.1.1 縱向?qū)Ρ?/p>
縱向?qū)Ρ葹檎故究缒?、跨月、跨周、跨日時(shí)間范圍內(nèi)不同時(shí)間粒度的對(duì)比情況。例如,2021年1月1日—2021年1月15日這一時(shí)間范圍以日為時(shí)間粒度,則對(duì)比每一天的A車站進(jìn)站量就是縱向?qū)Ρ龋鐖D1所示。
圖1 縱向?qū)Ρ?/p>
(1)所選時(shí)間范圍分時(shí)間粒度的指標(biāo)量與這一時(shí)間范圍的平均值進(jìn)行比較,平均值的計(jì)算公式如下:
(2)所選時(shí)間范圍分時(shí)間粒度的指標(biāo)量與這一時(shí)間范圍的中位數(shù)進(jìn)行比較,中位數(shù)算法如下:
有一組數(shù)據(jù)x1,x2,…,xn,將它從小到大的順序排序?yàn)閤(1),x(2),…,x(n),則有:
(3)所選時(shí)間范圍分時(shí)間粒度的指標(biāo)量與行業(yè)標(biāo)準(zhǔn)量(多年歷史數(shù)據(jù)分析的結(jié)果)進(jìn)行比較;
(4)將所選時(shí)間范圍分時(shí)間粒度的指標(biāo)量作為一個(gè)整體,A時(shí)間段的指標(biāo)量不同于剩余其他時(shí)間的指標(biāo)量,且指標(biāo)量的變化程度超過設(shè)定的異常點(diǎn)(確定異常點(diǎn),再分析由什么影響因素導(dǎo)致異常點(diǎn)產(chǎn)生,原因分析可以通過邏輯樹定位法、關(guān)聯(lián)規(guī)則等方法)的閾值,則認(rèn)定A時(shí)間段指標(biāo)量為異常值,A時(shí)間段指標(biāo)量的變化程度公式如下:
2.2.1.2 同比
用于觀察長(zhǎng)期的數(shù)據(jù),是本期數(shù)據(jù)與上一年同期數(shù)據(jù)的比值。通常情況下,會(huì)用同比增長(zhǎng)率來衡量變化程度,其計(jì)算公式如下:
2.2.1.3 環(huán)比
用于觀察短期數(shù)據(jù),是當(dāng)前周期與上一周期的對(duì)比,可以是本周與上周的對(duì)比、本月與上月的對(duì)比、當(dāng)年11月與當(dāng)年10月的對(duì)比等。通常情況下,會(huì)用環(huán)比增長(zhǎng)率來衡量變化程度,其計(jì)算公式如下:
2.2.1.4 定比
是當(dāng)前周期數(shù)據(jù)與固定周期數(shù)據(jù)的對(duì)比,可以是本月與某固定月的對(duì)比,例如2021年11月與2021年2月。通常情況下,會(huì)用定比增長(zhǎng)率來衡量變化程度,其計(jì)算公式如下:
定比示意圖如圖2所示。
圖2 定比示意圖
2.2.1.5 特定時(shí)期的對(duì)比
特定時(shí)期包括節(jié)假日、典型活動(dòng)、突發(fā)事件等,可以是節(jié)假日前中的比較、節(jié)假日中后的比較、節(jié)假日前后的比較、典型活動(dòng)前中的比較、典型活動(dòng)中后的比較、典型活動(dòng)前后的比較、新線開通前后的比較等。通常情況下,會(huì)用特定時(shí)期的增長(zhǎng)率來衡量變化程度,其計(jì)算公式如下:
2.2.1.6 橫向?qū)Ρ?/p>
相同時(shí)間范圍內(nèi)不同車站、斷面、線路、OD對(duì)的比較。例如,對(duì)比全網(wǎng)某幾個(gè)車站2021年元旦期間進(jìn)站量(進(jìn)站量增長(zhǎng)率)就是橫向?qū)Ρ?,橫向?qū)Ρ热鐖D3所示。
圖3 橫向?qū)Ρ仁疽鈭D
(1)全網(wǎng)所有車站/斷面/線路/OD對(duì)在相同時(shí)間范圍下,計(jì)算各指標(biāo)量的最大值、最小值、極差、指標(biāo)量排名前10、指標(biāo)量排名后10。
極差的計(jì)算方法:極差=最大值-最小值;
指標(biāo)量排名前10的計(jì)算方法:對(duì)某一個(gè)指標(biāo)量進(jìn)行降序排列后取排名在1~10之間的指標(biāo)量;
指標(biāo)量排名后10的計(jì)算方法:對(duì)某一個(gè)指標(biāo)量進(jìn)行升序排列后取排名在1~10之間的指標(biāo)量。
(2)全網(wǎng)所有車站/斷面/線路/OD對(duì)在相同時(shí)間范圍下,計(jì)算能夠反映不同車站/斷面/線路/OD對(duì)間的變異程度的指標(biāo)——變異系數(shù),變異系數(shù)的計(jì)算方法如下:
周粒度指標(biāo)量計(jì)算:
月粒度指標(biāo)量計(jì)算:
年粒度指標(biāo)量計(jì)算:
或
各階段指標(biāo)量計(jì)算:
各事件指標(biāo)量計(jì)算:
2.2.2 指標(biāo)量的時(shí)間序列擬合
為描述指標(biāo)量的時(shí)間序列分布特征,需要引入分布函數(shù)進(jìn)行擬合,根據(jù)指標(biāo)量的時(shí)間序列分布情況進(jìn)行擬合,最終用一種比較兩樣本是否同分布的常用的非參數(shù)統(tǒng)計(jì)方法(即K-S檢驗(yàn))確定最終指標(biāo)量時(shí)間序列分布服從那種或那些分布。
客流分布特征常見的分布函數(shù)包括連續(xù)型分布函數(shù)和離散型分布函數(shù)[15]。
2.2.2.1 連續(xù)型分布函數(shù)
描述客流分布特征常見的連續(xù)型分布函數(shù)如下。
(1)均勻分布
在實(shí)際問題中,當(dāng)無法區(qū)別在區(qū)間內(nèi)取值的隨機(jī)變量取不同值得可能性有何不同時(shí),就可以假設(shè)變量服從均勻分布。均勻分布由兩個(gè)參數(shù)a和b定義,他們是數(shù)軸上的最小值和最大值,縮寫為U(a,b)。
均勻分布的概率密度函數(shù)為:
(2)正態(tài)分布
正態(tài)分布曲線隨機(jī)變量X服從期望為μ,方差為σ2態(tài)分布,記為X~N(μ,σ2)。其概率密度函數(shù)為正態(tài)分布的期望值μ決定了其位置,其方差σ2決定了分布的幅度。正態(tài)分布函數(shù)密度曲線為:
(3)對(duì)數(shù)正態(tài)分布
對(duì)數(shù)正態(tài)分布是指一個(gè)隨機(jī)變量的對(duì)數(shù)服從正態(tài)分布,則該隨機(jī)變量服從對(duì)數(shù)正態(tài)分布。對(duì)數(shù)正態(tài)分布從短期來看,與正態(tài)分布非常接近。但長(zhǎng)期來看,對(duì)數(shù)正態(tài)分布向上分布的數(shù)值更多一些。變量x分布服從對(duì)數(shù)正態(tài)分布,即lnx~N(μ,σ2)。其概率密度函數(shù)為:
其中μ與σ分別是變量對(duì)數(shù)的平均值與標(biāo)準(zhǔn)差。
(4)柯西分布
柯西分布是一個(gè)數(shù)學(xué)期望不存在的連續(xù)性概率分布。當(dāng)隨機(jī)變量X滿足它的概率密度函數(shù)時(shí),稱X服從柯西分布,記為X~C(γ,x0)。γ=1,x0=0的特例稱為標(biāo)準(zhǔn)柯西分布,其概率密度函數(shù)為:
式中:x0為定義分布峰值位置的位置參數(shù);γ為最大值一半處的一半寬度的尺度參數(shù)。
2.2.2.2 離散型分布函數(shù)
描述客流分布特征常見的離散型分布函數(shù)如下。
(1)兩點(diǎn)分布
如果隨機(jī)變量X的概率分布為:
其中0<p<1,則稱隨機(jī)變量X服從兩點(diǎn)分布或(0-1)分布。在隨機(jī)試驗(yàn)中,如果只關(guān)心事件A是否發(fā)生,可以定義一個(gè)服從兩點(diǎn)分布的隨機(jī)變量:
(2)二項(xiàng)分布
如果隨機(jī)變量X的概率分布為:
其中0<p<1,則稱X服從參數(shù)為n和p的二項(xiàng)分布,記為X~B(n,p)。特別地,當(dāng)n=1時(shí),二項(xiàng)分布B(1,p)就是兩點(diǎn)分布。
在n重伯努利試驗(yàn)中,記事件A發(fā)生的概率p,X表示n重伯努利試驗(yàn)中A發(fā)生的次數(shù),則X是一個(gè)隨機(jī)變量并服從B(n,p)。
(3)幾何分布
如果隨機(jī)變量X的概率分布為:
其中0<p<1,則稱X服從參數(shù)為p的幾何分布,記為X~G(p)。
(4)泊松分布
如果隨機(jī)變量X的概率分布為:
其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P(λ)。
在大量實(shí)驗(yàn)中,小概率事件發(fā)生的次數(shù)常常服從泊松分布。泊松定理,設(shè)λ>0是常數(shù),n為任意正整數(shù),且滿足=λ,則對(duì)任意固定的非負(fù)整數(shù)k,有
利用該結(jié)論,可以將二項(xiàng)分布的相關(guān)問題近似轉(zhuǎn)化為泊松分布來計(jì)算,即當(dāng)n很大,p很小時(shí),近似的有:
基于上述方法搭建系統(tǒng)大數(shù)據(jù)平臺(tái),接入現(xiàn)有的AFC數(shù)據(jù)、運(yùn)行圖數(shù)據(jù)等業(yè)務(wù)信息,精準(zhǔn)把握網(wǎng)絡(luò)客流時(shí)間和空間分布規(guī)律,能實(shí)現(xiàn)客流預(yù)測(cè)、客流動(dòng)態(tài)推演、客流精準(zhǔn)管控、突發(fā)事件評(píng)估和個(gè)性化信息服務(wù)等功能。通過提供事前的精細(xì)化路網(wǎng)客流預(yù)測(cè)、當(dāng)前的路網(wǎng)客流分布詳情、未來的客流動(dòng)態(tài)預(yù)測(cè)預(yù)警,多場(chǎng)景的精準(zhǔn)客流管控,以及突發(fā)事件影響范圍和程度的即時(shí)量化評(píng)估,構(gòu)成一套完整的精細(xì)化客流解決方案。
本文通過使用數(shù)據(jù)化手段和科學(xué)的計(jì)算方案,提供實(shí)時(shí)的全路網(wǎng)車站(站臺(tái)、通道)、車上的當(dāng)前和未來的精準(zhǔn)數(shù)量,提供路網(wǎng)精細(xì)化擁擠度、客流分布監(jiān)測(cè)、風(fēng)險(xiǎn)點(diǎn)動(dòng)態(tài)預(yù)警信息,以便有針對(duì)性進(jìn)行調(diào)度智慧和客運(yùn)組織。根據(jù)日常運(yùn)營(yíng)信息跟蹤比對(duì)進(jìn)行自動(dòng)預(yù)警,并相應(yīng)開展乘客全出行鏈的引導(dǎo)、溝通信息服務(wù),實(shí)現(xiàn)具備場(chǎng)景化、智能化、人性化的網(wǎng)-線-
站一體化客流、車流調(diào)度技術(shù),從而提升線路運(yùn)行的安全性和高效性,提高指揮調(diào)度的集約化、智能化、科學(xué)化水平,以有效配置線網(wǎng)資源、保障安全高效的運(yùn)營(yíng)秩序、緩解客流壓力和提高服務(wù)水平。