羅 茜,熊 文
(云南師范大學(xué) 信息學(xué)院,云南 昆明 650500)
客流分析是公共交通系統(tǒng)運(yùn)營的基礎(chǔ)。準(zhǔn)確獲取乘客出行鏈?zhǔn)峭晟乒步煌ㄏ到y(tǒng)建設(shè)的重要前提。但由于公交乘客只需在上車刷卡,下車無需任何操作,所以客流分析者很難通過刷卡記錄直接得知乘客的下車站點(diǎn)。
目前獲取乘客下車站點(diǎn)的方法主要有人工采集法、自動計(jì)數(shù)設(shè)備采集法、基于乘客消費(fèi)數(shù)據(jù)推算方法等。前兩種方法效率較低、誤差較大,研究者們常用的是推算方法。Huang D[1]提出了一種利用智能卡和GPS數(shù)據(jù)估計(jì)OD矩陣的方法,根據(jù)公交出行鏈的特點(diǎn)推斷出乘客下車站點(diǎn);李佳怡[2]提出公交出行節(jié)的概念,并將其劃分為連續(xù)或斷裂來分析乘客出行鏈類型以推斷下車站點(diǎn);崔紫薇[3]用出行鏈方法推算的下車站點(diǎn)記錄作為歷史出行數(shù)據(jù)集,從歷史數(shù)據(jù)的生成和選擇兩方面進(jìn)行考慮,以此方法推算了更多的下車站點(diǎn);劉曉[4]基于整體出行規(guī)律和基于個體出行規(guī)律,提出下車站點(diǎn)推導(dǎo)算法。
本文根據(jù)乘客IC卡記錄、車輛GPS軌跡數(shù)據(jù)、車輛排班信息,提出一種基于出行鏈分析方法來推算公交乘客下車站點(diǎn)。首先,本文利用時間匹配方法識別乘客上車站點(diǎn),然后根據(jù)乘客歷史刷卡數(shù)據(jù)構(gòu)建出行鏈,分析出行鏈特點(diǎn)并分類推算各次的下車站點(diǎn),最后以實(shí)例檢驗(yàn)方法有效性。
乘客IC卡數(shù)據(jù)沒有記錄站點(diǎn)名稱,所以需要先識別出乘客的上車站點(diǎn)。上車站點(diǎn)可根據(jù)時間匹配的方法獲取,該方法將上車記錄中的時間與所在車輛進(jìn)出站時間做對比,時間差最小的站點(diǎn)為乘客的上車站點(diǎn)。在車輛調(diào)度數(shù)據(jù)缺失的情況下,本文將上車時間匹配至差值最小的GPS記錄,獲取乘客的具體位置,匹配最近的站點(diǎn)為乘客上車站點(diǎn)。
一般地,公交乘客的出行鏈主要概括為3種,如圖1所示。
圖1 乘客公交出行鏈分析
圖1(a)中乘客的出行以“公交+公交”方式構(gòu)成閉合出行鏈,始末點(diǎn)均為公交出行。該情況符合學(xué)生、上班族等群體的出行行為。
圖1(b)中乘客的出行以“公交+非公交+公交”方式構(gòu)成閉合出行鏈,即始末點(diǎn)均為公交出行,但乘客在中途以非公交形式發(fā)生移動。該情況符合組合出行的規(guī)律性乘客。
圖1(c)中乘客的出行以“公交+非公交”方式構(gòu)成開放出行鏈,即只知在起點(diǎn)乘坐公交,后續(xù)行程無法了解,該情況多為隨機(jī)出行。
閉合的公交出行鏈具有較強(qiáng)的時空規(guī)律性,可根據(jù)乘客出行規(guī)律判斷下車站點(diǎn)。開放的公交出行鏈具有較強(qiáng)的隨機(jī)性,需根據(jù)站點(diǎn)自身吸引強(qiáng)度判斷乘客下車站點(diǎn)。
對于閉合的出行鏈路,當(dāng)后一次出行的上車站點(diǎn)位于前一次出行上車站點(diǎn)的下游,或距離下游小于閾值(通常設(shè)為1 km),本文認(rèn)為乘客此次是規(guī)律出行,前一次出行的下車站點(diǎn)為后一次出行的上車站點(diǎn)。
對于開放的出行鏈路,由于站點(diǎn)自身具有吸引屬性,本文認(rèn)為在上車站點(diǎn)的下游中,某站點(diǎn)吸引強(qiáng)度越大,乘客在此站下車可能性越大。站點(diǎn)吸引強(qiáng)度可用該路線各站點(diǎn)的上車人數(shù)表示,計(jì)算公式為:
(1)
式中,P表示站點(diǎn)吸引強(qiáng)度,N為站點(diǎn)的上車人數(shù),k為該路線站點(diǎn)總數(shù)。
推算流程如圖2所示。
圖2 下車站點(diǎn)推算流程
由于公交乘客的整體出行在各路線上下行的客流量基本持平,存在線性關(guān)系:
(2)
式中,N表示站點(diǎn)客流,a、b為回歸系數(shù)。當(dāng)a越趨近于1時,該路線各站點(diǎn)上下車客流量越持平。檢驗(yàn)該方法的數(shù)據(jù)采集由于自動售檢票系統(tǒng)(AFC),利用無線技術(shù)傳輸于后臺服務(wù)器中,包括廣州市2021年7月的199萬條刷卡記錄、537萬條車輛排班信息、7 260萬條GPS記錄。
隨機(jī)選取3條路線進(jìn)行實(shí)驗(yàn),在MATLAB軟件上以各個站點(diǎn)的上下人數(shù)據(jù)建造矩陣,求得各路線參數(shù)如表1所示。參數(shù)a值均趨近于1,參數(shù)b值略有浮動但差距不大,說明該路線上下車客流量基本持平,本文的方法具有可靠性。
表1 各路線參數(shù)
如表2所示,乘客****2913連續(xù)兩天在836路的不同方向上車,屬于規(guī)律出行者,故南洲北路站和東坑站互為該乘客出行的始末點(diǎn)。乘客****2794只有單次乘車記錄,屬于隨機(jī)出行,經(jīng)計(jì)算可知在下游站點(diǎn)中吸引強(qiáng)度最大的站點(diǎn)是白云區(qū)醫(yī)院站,因此推算該乘客此次出行的下車站點(diǎn)為白云區(qū)醫(yī)院站。
表2 上下車站點(diǎn)推算
為推算乘客下車站點(diǎn),本文基于海量的公交大數(shù)據(jù),構(gòu)建乘客出行鏈,并分析3種出行方式,滿足了多場景下的預(yù)測需求。以廣州公交為實(shí)例,本文的方法推算出80%以上不同出行鏈的乘客下車站點(diǎn)。
后續(xù)研究將考慮可能影響站點(diǎn)吸引強(qiáng)度的因素,并加入公交車內(nèi)無線監(jiān)控系統(tǒng)采集的數(shù)據(jù)驗(yàn)證推算的準(zhǔn)確性。