李 軍,鄧紅平
(中山大學(xué) 廣東省智能交通系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006)
基于公交IC卡數(shù)據(jù)的乘客出行分類研究
李 軍,鄧紅平
(中山大學(xué) 廣東省智能交通系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510006)
為得到體現(xiàn)公交乘客出行時(shí)空規(guī)律的數(shù)據(jù),采用基于出行鏈方法推導(dǎo)出公共汽車乘客的下車站點(diǎn);建立了描述單個(gè)乘客多天出行的完整數(shù)據(jù)框架;根據(jù)乘客參加不同活動(dòng)所產(chǎn)生的出行時(shí)空特征定義了3類出行:通勤類出行、普通類出行和隨機(jī)類出行,將出行頻次與出發(fā)時(shí)間的標(biāo)準(zhǔn)差作為分類標(biāo)準(zhǔn)對(duì)公交乘客出行進(jìn)行分類。研究表明:39.1%的乘客具有普通類或通勤類出行,生成總客流的76.4%;60.9%的乘客只具有隨機(jī)類出行,生成總客流的23.6%。通過(guò)對(duì)乘客出行的分類研究可以更好地掌握乘客公交出行的規(guī)律和需求。
交通運(yùn)輸工程;公共交通;IC卡數(shù)據(jù);公交出行行為;時(shí)空分析
公共交通自動(dòng)收費(fèi)系統(tǒng)(Automated Fare System)目前已在很多城市公共交通系統(tǒng)中部署,除方便乘客采用公交IC卡刷卡支付外,系統(tǒng)還記錄了大量個(gè)體公交乘客的公交出行。相比于傳統(tǒng)的出行調(diào)查法,自動(dòng)收費(fèi)系統(tǒng)記錄的IC卡刷卡數(shù)據(jù)具有數(shù)據(jù)收集時(shí)間跨度長(zhǎng)、自動(dòng)收集、樣本量大等優(yōu)點(diǎn);但由于系統(tǒng)一開(kāi)始并不是為收集公交出行數(shù)據(jù)而設(shè)計(jì)的,因此很多關(guān)于出行的關(guān)鍵信息如上下車站點(diǎn)、出行目的、出行者屬性等,并不記錄在原始數(shù)據(jù)中。
對(duì)公交IC卡數(shù)據(jù)的研究基于兩個(gè)方面:①完善的原始數(shù)據(jù)可以更好地完整描述公交乘客出行,尤其是推斷上下車站點(diǎn)以獲取OD信息。大部分公共交通系統(tǒng)是開(kāi)放系統(tǒng),即上車刷卡,下車不刷卡,因此可很好地匹配出每一次上車刷卡的站點(diǎn),但下車站點(diǎn)的推斷則較為復(fù)雜。目前已有相關(guān)學(xué)者研究了如何推斷下車站點(diǎn)以及對(duì)推斷出來(lái)的數(shù)據(jù)質(zhì)量進(jìn)行驗(yàn)證分析[1-3]。②對(duì)公交IC卡數(shù)據(jù)的研究主要集中在對(duì)數(shù)據(jù)的應(yīng)用上。對(duì)于公交運(yùn)營(yíng)者而言,可以通過(guò)對(duì)刷卡數(shù)據(jù)的挖掘來(lái)獲取公交汽車或地鐵的調(diào)度管理等決策數(shù)據(jù)(如線路斷面客流量等)[4],以調(diào)整發(fā)車頻率與班次以更好地滿足乘客的出行需求;對(duì)公交規(guī)劃者而言,可以為線網(wǎng)的布局和調(diào)整提供數(shù)據(jù)決策支持,例如識(shí)別大范圍乘客的流量與流向,評(píng)估公交線網(wǎng)的供給能力,從刷卡數(shù)據(jù)的層面統(tǒng)計(jì)出線網(wǎng)的特征指標(biāo)以評(píng)估公交線網(wǎng),包括乘客的忠誠(chéng)度、線網(wǎng)可達(dá)性、線網(wǎng)換乘便利性等[4]。此外也有部分研究者通過(guò)挖掘IC卡刷卡數(shù)據(jù)以識(shí)別站點(diǎn)周圍潛在的商業(yè)伙伴,并結(jié)合土地利用情況,達(dá)到對(duì)數(shù)據(jù)的商業(yè)利用[5]。
對(duì)公交IC卡數(shù)據(jù)應(yīng)用的基礎(chǔ)是掌握公交乘客的出行行為。如何從公交IC卡數(shù)據(jù)中獲取乘客出行的規(guī)律進(jìn)而利用這些規(guī)律是公交IC卡數(shù)據(jù)研究的重點(diǎn)。公交IC卡數(shù)據(jù)記錄了大量個(gè)體公交出行者的出行數(shù)據(jù),因此可以從非集計(jì)的角度通過(guò)多天的數(shù)據(jù)記錄研究公交出行者的出行規(guī)律(主要指出行時(shí)間和空間規(guī)律)[6-8]。傳統(tǒng)的出行調(diào)查法很難收集多天的乘客出行數(shù)據(jù),并且被調(diào)查者往往面臨較大的調(diào)查負(fù)擔(dān),調(diào)查的范圍限于時(shí)間和財(cái)力成本往往比較小,因此對(duì)公交IC卡的刷卡數(shù)據(jù)提取分析可以更深入了解乘客的需求和規(guī)律。
出行需求是出行者參與活動(dòng)的衍生需求,出行者往往對(duì)于活動(dòng)的日程安排具有一定的規(guī)律性和穩(wěn)定性。例如準(zhǔn)時(shí)上班出門、定期購(gòu)物娛樂(lè)、定期探親訪友等,這些日程安排的規(guī)律會(huì)體現(xiàn)在出行者的出行行為上。從出行產(chǎn)生的IC卡刷卡數(shù)據(jù)角度,可通過(guò)累計(jì)多天的數(shù)據(jù)記錄觀察得到出行者相應(yīng)的出行規(guī)律,通過(guò)出發(fā)時(shí)間、活動(dòng)持續(xù)時(shí)間、土地利用數(shù)據(jù)等綜合判斷出行者參與活動(dòng)的類型[9],也可結(jié)合傳統(tǒng)的出行調(diào)查數(shù)據(jù)建立啟發(fā)式的規(guī)則判斷出行目的等[10]。不同的活動(dòng)會(huì)產(chǎn)生不同的出行時(shí)空特征,在沒(méi)有其他更多的出行者社會(huì)經(jīng)濟(jì)屬性的信息下,僅僅從產(chǎn)生的刷卡數(shù)據(jù)層面而言難以準(zhǔn)確地判定出行者出行目的以及參與活動(dòng)等詳細(xì)信息,但根據(jù)不同的時(shí)空特征對(duì)出行者的多天出行進(jìn)行分類可以判斷出行者主要的公交出行需求和規(guī)律。因此筆者通過(guò)對(duì)乘客出行按不同特征進(jìn)行分類以達(dá)到掌握乘客活動(dòng)出行需求和規(guī)律的目的。
筆者采用的是廣州市公共交通(包含公共汽車、地鐵等)的IC卡刷卡交易數(shù)據(jù)。為得到可利用的交通出行數(shù)據(jù),首先需要補(bǔ)全公共汽車刷卡數(shù)據(jù)的上下車站點(diǎn)信息;地鐵交易數(shù)據(jù)中包含進(jìn)出站信息,因此這部分無(wú)需補(bǔ)全。
在上車站點(diǎn)匹配方面,采用刷卡交易數(shù)據(jù)與車載GPS報(bào)站器數(shù)據(jù)字段中的車輛編號(hào)與時(shí)間字段進(jìn)行匹配[11-12],筆者采用的數(shù)據(jù)在上車站點(diǎn)的匹配成功率為95%。
下車站點(diǎn)匹配相對(duì)復(fù)雜,主要是采用基于出行鏈的匹配方法,首先將多天的刷卡數(shù)據(jù)記錄進(jìn)行融合以得到每張卡多天的按時(shí)間排序的出行刷卡記錄,然后對(duì)每張卡采用如下的兩種規(guī)則進(jìn)行公共汽車下車站點(diǎn)的推斷[1-2]。
規(guī)則1:若第1次刷卡上車線路的下車站點(diǎn)在第2次上車刷卡站點(diǎn)附近,則選取離第2次上車站點(diǎn)最近的站點(diǎn)為推斷下車站點(diǎn)。考慮城市公共交通首末站700~800 m的設(shè)計(jì)覆蓋半徑,取中間值750 m,以盡量識(shí)別出下車站點(diǎn),如圖1。
圖1 推斷下車站點(diǎn)的規(guī)則1Fig.1 Rule 1 for inferring the alighting stop
規(guī)則2:若第1次刷卡上車線路與第2次刷卡上車線路相同但方向相反,則認(rèn)為第2次乘坐的下車站點(diǎn)為第1次乘坐的上車站點(diǎn),如圖2。
圖2 推斷下車站點(diǎn)的規(guī)則2Fig.2 Rule 2 for inferring the alighting stop
若刷卡數(shù)據(jù)記錄中既包括公共汽車也包括地鐵,地鐵的數(shù)據(jù)記錄包含進(jìn)出站信息且采用地鐵網(wǎng)絡(luò)系統(tǒng)內(nèi)部換乘無(wú)需刷卡,因此在進(jìn)行公共汽車下車站點(diǎn)推斷時(shí)可將整個(gè)地鐵系統(tǒng)視為一個(gè)整體而無(wú)需區(qū)分地鐵的具體線路(封閉系統(tǒng))。具體推斷的方法流程如圖3。
圖3 下車站點(diǎn)推斷流程Fig.3 Process of inferring the alighting stop
筆者采用上述方法推斷出乘客下車站點(diǎn)的匹配率為65%,其余35%未成功匹配的數(shù)據(jù)記錄中有10%不滿足規(guī)則1,由于出行鏈斷裂或者是數(shù)據(jù)缺失錯(cuò)誤導(dǎo)致其他25%數(shù)據(jù)不能匹配。無(wú)法匹配下車站點(diǎn)的數(shù)據(jù)仍可用來(lái)進(jìn)行出行行為的分析,與匹配好的數(shù)據(jù)結(jié)合仍然可以提供有價(jià)值的出行信息。
在上述基礎(chǔ)數(shù)據(jù)中記錄的是每張卡的每一次刷卡記錄,通過(guò)融合多天的刷卡數(shù)據(jù)記錄,可以將單張卡的多天刷卡記錄提取出來(lái),假設(shè)一張IC卡對(duì)應(yīng)一個(gè)公交出行者,那么就得到單個(gè)出行者的多天出行記錄,為更加清楚地描述公交出行者在研究時(shí)段內(nèi)的出行行為,建立如圖4的出行數(shù)據(jù)框架。
圖4 描述乘客多天出行的數(shù)據(jù)框架Fig.4 Data framework for describing each passenger’s multiday travel behavior
圖4中,該框架將出行者的出行看作是在不同區(qū)域間的移動(dòng),區(qū)域是對(duì)單個(gè)公交出行者連續(xù)多天出行的上下車站點(diǎn)的空間聚類結(jié)果[7,13],區(qū)域內(nèi)包含了若干個(gè)上車或下車站點(diǎn),這些站點(diǎn)在空間距離上相近,聚類的過(guò)程如下。
Step1:從未被訪問(wèn)的上下車站點(diǎn)集合中隨機(jī)選擇一個(gè)站點(diǎn)(初始化時(shí)該乘客所有上下車站點(diǎn)均被標(biāo)記為未被訪問(wèn)),將該站點(diǎn)作為一類并標(biāo)記為已被訪問(wèn),若所有站點(diǎn)全被標(biāo)記為已被訪問(wèn),則聚類結(jié)束。
Step2:計(jì)算該類的重心與未被訪問(wèn)點(diǎn)之間的空間距離,得到最小空間距離及其對(duì)應(yīng)的站點(diǎn)。若最小空間距離≤1 km,則轉(zhuǎn)到Step3;否則轉(zhuǎn)到Step1。
Step3:將最小空間距離對(duì)應(yīng)的站點(diǎn)歸為該類,重新計(jì)算該類的重心,并將最小空間距離對(duì)應(yīng)的站點(diǎn)標(biāo)記為已被訪問(wèn)。若所有站點(diǎn)均被標(biāo)記為已被訪問(wèn)則聚類結(jié)束,否則轉(zhuǎn)到Step2。
上述聚類過(guò)程得到的每一類均為一個(gè)區(qū)域,進(jìn)行這樣的聚類處理目的是盡可能提取出行者的空間出行規(guī)律。例如乘客經(jīng)常從O點(diǎn)到D點(diǎn),可乘坐公交線路1從公交站A1至站B1,也可乘坐線路2從公交站A2到站B2,站A1和站A2都靠近O點(diǎn),而站B1和站B2都靠近D點(diǎn),實(shí)際上A1→B1和A2→B2這兩類出行是同一類型的出行即從O→D;因此可以將A1和A2聚為一類標(biāo)記為區(qū)域1,將B1和B2聚為一類標(biāo)記為區(qū)域2,這樣統(tǒng)一描述成為區(qū)域1到區(qū)域2的出行,可以解決由于乘客上下車站點(diǎn)過(guò)多造成出行雜亂不利于提取出行規(guī)律的問(wèn)題。此外以區(qū)域?yàn)榛締挝豢梢员苊庥捎谙萝囌军c(diǎn)推斷錯(cuò)誤而造成的信息失真,因?yàn)橥茢喑鰜?lái)的下車站點(diǎn)可能離真實(shí)的下車站點(diǎn)有一個(gè)或兩個(gè)的站間距(在乘坐線路真實(shí)下車站點(diǎn)的下游或上游),通過(guò)聚類的處理仍然可以確定乘客下車的真實(shí)區(qū)域從而避免了出行信息的失真。
該框架包含了區(qū)域?qū)傩浴⒊霭l(fā)地與目的地關(guān)系、站點(diǎn)屬性、出行者屬性等4個(gè)部分,用以完整描述出行者在研究時(shí)段內(nèi)的出行。
區(qū)域?qū)傩裕喊瑓^(qū)域的編號(hào)、出發(fā)次數(shù)(上車站點(diǎn)在該區(qū)域內(nèi))、到達(dá)次數(shù)(下車站點(diǎn)在該區(qū)域內(nèi))、區(qū)域重心坐標(biāo)(以經(jīng)緯度表示)、平均出發(fā)時(shí)間(從該區(qū)域出發(fā)的平均上車時(shí)間)。
出發(fā)地與目的地關(guān)系:描述一個(gè)區(qū)域與另一個(gè)區(qū)域之間的出行,具有方向性。例如從區(qū)域i到區(qū)域j與從區(qū)域j到區(qū)域i是不同的兩條記錄,包含出發(fā)地區(qū)域、到達(dá)地區(qū)域、出行次數(shù)、平均出發(fā)時(shí)間、出發(fā)時(shí)間標(biāo)準(zhǔn)差。
站點(diǎn)屬性:描述區(qū)域內(nèi)的站點(diǎn),包括所屬區(qū)域、站點(diǎn)編號(hào)、出發(fā)次數(shù)、平均出發(fā)時(shí)間、出發(fā)時(shí)間標(biāo)準(zhǔn)差。
出行者屬性:包括卡號(hào)、總出行次數(shù)(等于研究時(shí)段內(nèi)刷卡記錄條數(shù))、有效出發(fā)次數(shù)(所有能匹配上車站點(diǎn)的記錄條數(shù))、有效到達(dá)次數(shù)(所有能匹配下車站點(diǎn)的記錄條數(shù))、卡類型。
為更好描述單個(gè)出行者的出行,約定幾個(gè)關(guān)鍵參數(shù)的符號(hào):記出行者所有出行區(qū)域集合為L(zhǎng);區(qū)域i的出行次數(shù)為Ci(出發(fā)次數(shù)與到達(dá)次數(shù)之和);對(duì)任意的i∈L,有:C1≥C2≥C3…,也即是對(duì)區(qū)域編號(hào)時(shí)按照出行次數(shù)從高到低進(jìn)行排列。記區(qū)域i與區(qū)域j之間的出行次數(shù)為Rij(從i到j(luò)與從j到i的出行次數(shù)之和)。記區(qū)域i的平均出發(fā)時(shí)間為Ti,h;出發(fā)時(shí)間的標(biāo)準(zhǔn)差為σi。
通過(guò)建立完整描述出行者的出行數(shù)據(jù)框架,可以更容易清晰地了解出行者的出行,為進(jìn)一步活動(dòng)出行的分析奠定基礎(chǔ)。
通過(guò)上述對(duì)基礎(chǔ)數(shù)據(jù)補(bǔ)全和出行數(shù)據(jù)的生成,可以掌握大量個(gè)體公交出行者的出行軌跡數(shù)據(jù)。不同活動(dòng)會(huì)產(chǎn)生不同類別的出行,在研究時(shí)段內(nèi)產(chǎn)生的數(shù)據(jù)蘊(yùn)含了不同類別的出行特征,通過(guò)分析數(shù)據(jù)對(duì)出行進(jìn)行分類可以了解出行者參加的活動(dòng),而這些活動(dòng)對(duì)于單個(gè)出行者而言往往是穩(wěn)定和具有規(guī)律性的。因此通過(guò)對(duì)出行者的出行進(jìn)行分類可以發(fā)現(xiàn)出行或活動(dòng)的規(guī)律,筆者定義并研究了以下3類出行。
1)通勤類出行:這一類的出行是出行者參加強(qiáng)制性活動(dòng)產(chǎn)生的,例如上班、上學(xué)等,這類活動(dòng)對(duì)時(shí)間和空間有著強(qiáng)制性的要求,因此,這類出行具有最明顯的時(shí)間和空間規(guī)律性,表現(xiàn)為出行時(shí)間和出行地點(diǎn)較為固定。
2)普通類出行:這一類出行是出行者參加其他諸如購(gòu)物、探親訪友等活動(dòng)產(chǎn)生的,這類活動(dòng)出行的時(shí)間并不固定,但在空間上表現(xiàn)出一定的規(guī)律性,例如總是去同一個(gè)商場(chǎng)超市購(gòu)物、經(jīng)常去某地探望朋友等,將這一類的出行定義為普通類出行。
3)隨機(jī)類出行:這一類的出行往往不具有特定的時(shí)間和空間規(guī)律,比如娛樂(lè)活動(dòng)等,往往出行者參加過(guò)一次或幾次類似活動(dòng)后便不再參加,將這一類出行定義為隨機(jī)類出行。
在定義了以上3類出行之后,需要從掌握的數(shù)據(jù)角度來(lái)設(shè)置分類的標(biāo)準(zhǔn),也即是從生成的出行數(shù)據(jù)中根據(jù)出行類別的特征設(shè)置分類標(biāo)準(zhǔn)對(duì)出行進(jìn)行分類。筆者主要采用了出行頻次Rij和出發(fā)時(shí)間標(biāo)準(zhǔn)差σi進(jìn)行判別[14]。
3.1 通勤類出行判斷標(biāo)準(zhǔn)
若區(qū)域i與區(qū)域j之間的出行次數(shù)滿足Rij≥ε(ε為正整數(shù),表示出行頻次),且σi<1或σj<1(即是出發(fā)時(shí)間的標(biāo)準(zhǔn)差在1 h之內(nèi)),則認(rèn)為區(qū)域i與區(qū)域j之間的出行為通勤類出行,將這一類標(biāo)記為S0類。若判斷出有多個(gè)區(qū)域之間的出行滿足判斷標(biāo)準(zhǔn),則取出行頻次最高或平均出發(fā)時(shí)間Ti最小的那一類為S0類。
例如乘客經(jīng)常乘坐線路1從站A至站B去上班,那么除了可以觀測(cè)到從A至B較高的頻次外,還可以觀測(cè)到從A出發(fā)時(shí)間的標(biāo)準(zhǔn)差也會(huì)較小,表明經(jīng)常按時(shí)乘坐線路1,因此根據(jù)這樣的特征來(lái)判斷是否是通勤類出行。
3.2 普通類出行判斷標(biāo)準(zhǔn)
若區(qū)域i與區(qū)域j之間的出行次數(shù)滿足Rij≥ε(ε為正整數(shù),表示出行的頻次),σi≥1且σj≥1(即是出發(fā)時(shí)間的標(biāo)準(zhǔn)差>1 h),則認(rèn)為區(qū)域i與區(qū)域j之間的出行為普通類出行。如果有多個(gè)區(qū)域之間的出行滿足判斷標(biāo)準(zhǔn),則按照出行頻次的大小標(biāo)記為:S1,S2,S3,…。例如區(qū)域i與區(qū)域j、區(qū)域i與區(qū)域k之間的出行均滿足此類判斷標(biāo)準(zhǔn);若Rij≥Rik,則將區(qū)域i與區(qū)域j之間的出行標(biāo)記為S1類,區(qū)域i與區(qū)域k之間的出行標(biāo)記為S2類。
3.3 隨機(jī)類出行判斷標(biāo)準(zhǔn)
若區(qū)域i與區(qū)域j之間的出行次數(shù)滿足Rij<ε,則認(rèn)為區(qū)域i與區(qū)域j之間的出行為隨機(jī)類出行。
僅根據(jù)出行的數(shù)據(jù)來(lái)判斷出行的分類,對(duì)所有出行者而言沒(méi)有統(tǒng)一的判斷標(biāo)準(zhǔn)可以采用,因此判斷標(biāo)準(zhǔn)的參數(shù)ε取值的原則是盡可能對(duì)大多數(shù)出行者的出行軌跡進(jìn)行分類并盡量保證分類結(jié)果可以反應(yīng)出行者的活動(dòng)情況,以描述大多數(shù)出行者的規(guī)律,同時(shí)可以根據(jù)實(shí)際應(yīng)用的需要選取不同的值。
筆者采集了廣州市2014年1月6—12日,3月10—16日,4月21—27日,5月5—11日,6月2—8日共計(jì)5周35 d的IC卡刷卡數(shù)據(jù)。其中有17 d的數(shù)據(jù)包含地鐵的刷卡數(shù)據(jù),數(shù)據(jù)記錄的條數(shù)為2.2億條。對(duì)公共汽車的上車站點(diǎn)匹配成功率為95%,對(duì)公共汽車下車站點(diǎn)的匹配成功率為65%,加上地鐵刷卡數(shù)據(jù),總共有72%的數(shù)據(jù)記錄具有下車站點(diǎn)。所有數(shù)據(jù)采用SQL Server存儲(chǔ)管理,采用C++進(jìn)行數(shù)據(jù)的處理,采用一臺(tái)小型工作站承擔(dān)大量的數(shù)據(jù)運(yùn)算和處理任務(wù)。
4.1 出行者分析
通過(guò)對(duì)上述基礎(chǔ)數(shù)據(jù)的補(bǔ)全和出行數(shù)據(jù)的生成,得到了998萬(wàn)張公交IC卡的出行信息。在進(jìn)行出行分類的過(guò)程中,先取分類參數(shù)ε=4,即判斷區(qū)域之間的出行頻次是否大于4,若大于4即為通勤類或普通類出行,小于4即為隨機(jī)類出行,進(jìn)而進(jìn)一步判斷出行時(shí)間標(biāo)準(zhǔn)差σ的值,若σ<1則為通勤類出行;若σ≥1則為普通類出行。在這里設(shè)置的標(biāo)準(zhǔn)ε=4較低,目的是盡可能先對(duì)每張卡的出行進(jìn)行分類,分類的結(jié)果如下:
有39.1%的卡(約391萬(wàn)張)具有普通類出行或者通勤類出行類別,其中有245萬(wàn)張卡具有通勤出行類別。這部分的出行者并不一定是高頻次的出行者,但高頻次的出行者占有較高比例,其出行相對(duì)集中,其出行生成的客流占據(jù)了總客流的76.4%。
有60.9%的卡(約607萬(wàn)張)只有隨機(jī)類出行,不具有明顯的出行規(guī)律。這部分出行者并不一定是低頻次的出行者,但低頻次的出行者占有較高比例,出行相對(duì)分散,其出行生成的客流占據(jù)了總客流的23.6%。
目前廣州公交IC卡發(fā)行量已經(jīng)累計(jì)2 600萬(wàn)張,而在研究時(shí)段內(nèi)統(tǒng)計(jì)到具有刷卡記錄的卡片數(shù)為998萬(wàn)張,除去退換的IC卡外,IC卡的遺失廢棄率仍然較高。
對(duì)單個(gè)出行者而言,出行者會(huì)參與多種活動(dòng),在研究時(shí)段內(nèi)會(huì)產(chǎn)生多個(gè)不同類別的出行(例如通勤類出行和多個(gè)普通類出行可能同時(shí)存在)。圖5統(tǒng)計(jì)了39.1%的持卡乘客(約391萬(wàn)張)。經(jīng)過(guò)分類所含有的出行類別(不包括隨機(jī)類出行)的數(shù)量分布。這種出行類別的數(shù)量實(shí)際上反映了乘客的出行結(jié)構(gòu)和參與活動(dòng)類型的多少,出行類別越多說(shuō)明出行結(jié)構(gòu)越復(fù)雜,參與活動(dòng)的種類越多。
圖5 普通類或通勤類乘客出行類別數(shù)量分布Fig.5 Quantity distribution of passenger’s travel types,including commuting travel type and the ordinary type
從圖5可以看出,絕大部分出行者的出行種類數(shù)量較少,出行者的出行較為集中,這為明確出行者的出行規(guī)律和出行需求帶來(lái)了便利,因此重點(diǎn)關(guān)注前5類的出行。
4.2 出行分類分析
經(jīng)過(guò)分類判斷,有245萬(wàn)張卡具有通勤類出行,將通勤類出行標(biāo)記為S0類。圖6統(tǒng)計(jì)了S0類中含有的出行次數(shù)Rij的分布。
圖6 通勤類包含的出行次數(shù)分布Fig.6 Travel frequency distribution of commuting type
從圖6可以看出,出行次數(shù)在5次時(shí)所占的比例最高,通勤類中平均的出行次數(shù)為11.7次,此外在245萬(wàn)張卡中還有1.45%的持卡乘客的通勤類出行次數(shù)大于35次,通勤類出行次數(shù)越多,說(shuō)明乘客出行的通勤特征越明顯。除統(tǒng)計(jì)出行的絕對(duì)次數(shù),還統(tǒng)計(jì)了通勤類出行在出行者總出行次數(shù)中所占的比例,平均所占比例為35%。
無(wú)論包含的平均出行次數(shù)還是在出行中所占比例均偏低,主要有如下幾個(gè)原因:①分類參數(shù)的設(shè)置較低,從圖6中可以看到,較低的次數(shù)占據(jù)了較大的比例;②出行者的通勤出行在返程時(shí)并不一定按照原來(lái)的線路返回,例如下班之后并不一定立即回家而是參加其他活動(dòng);③其他交通方式的影響,例如出行者上班可能乘坐出租車,下班乘坐公交等。
圖7統(tǒng)計(jì)了普通類出行S1,S2,S3,S4,S5中包含的平均出行次數(shù)以及在總出行次數(shù)中的平均占有比例。
圖7 普通類出行包含的平均出行次數(shù)和占總出行的平均比例Fig.7 Average travel times of normal travel type and average proportion in the total travel
每一類出行均代表了出行者參加的某一類活動(dòng)。從圖7中可以看出,相比于通勤類出行,就乘客出行結(jié)構(gòu)中的各類平均出行占比而言,通勤類出行仍然占有較大的比例。
4.3 參數(shù)靈敏度分析
以上的結(jié)果是選取分類參數(shù)ε=4次時(shí)得出的,選取ε不同的值進(jìn)行參數(shù)靈敏度分析。表1展示了ε取不同值時(shí)各類包含的平均出行次數(shù)變化。
表1 ε取不同值時(shí)各類包含的平均出行次數(shù)值
從表1可以看出,隨著ε的增加,各類包含的平均出行次數(shù)也逐漸增加。ε越大,平均出行次數(shù)也越大,而實(shí)際上隨著ε的增大,滿足分類標(biāo)準(zhǔn)且出行類別較多的人數(shù)減少,ε的增加可以識(shí)別出高頻次有規(guī)律出行的持卡乘客。表2展示了ε取不同值時(shí)滿足分類標(biāo)準(zhǔn)的持卡乘客數(shù)。
表2 ε取不同值時(shí)滿足分類標(biāo)準(zhǔn)的人數(shù)
當(dāng)ε越小,所分出的類別隨機(jī)性也越大,即分出的普通類或者通勤類可能實(shí)際上是出行者的隨機(jī)出行類;而當(dāng)ε越大時(shí),這種隨機(jī)性變小,出行分類結(jié)果越顯著,更能代表出行者參與的活動(dòng)。可以根據(jù)實(shí)際應(yīng)用的需要選擇不同的值。
筆者對(duì)采集到的公交IC卡刷卡數(shù)據(jù)進(jìn)行了如上所述的上下車站點(diǎn)推斷,以補(bǔ)全公交出行者出行的空間信息,隨后建立并生成了描述個(gè)體公交出行者在研究時(shí)段內(nèi)的數(shù)據(jù)框架,之后對(duì)出行者的出行采用一定的分類標(biāo)準(zhǔn)將出行分成了通勤類、普通類和隨機(jī)出行類。
通過(guò)探討公交IC卡刷卡數(shù)據(jù)研究個(gè)體的活動(dòng)出行,對(duì)出行進(jìn)行分類以掌握出行者參與活動(dòng)的規(guī)律。雖然僅僅通過(guò)刷卡數(shù)據(jù)難以判斷出行者參加活動(dòng)類別、出行目的,但仍然可以通過(guò)對(duì)個(gè)體公交出行者的出行軌跡分析明確在個(gè)體出行層面上的規(guī)律和需求,這種需求對(duì)于出行者而言更加穩(wěn)定和具有規(guī)律性,相比于傳統(tǒng)的集計(jì)分析可以從交通發(fā)生的本源來(lái)了解交通需求。
筆者未來(lái)的研究重點(diǎn)在于,根據(jù)已經(jīng)掌握的大量個(gè)體公交出行者的出行規(guī)律,預(yù)測(cè)個(gè)體公交出行者的出行,包括出行的時(shí)間、地點(diǎn)等,并對(duì)結(jié)果進(jìn)行驗(yàn)證。
[1] CHEN Jun, YANG Dongyuan. Estimating smart card commuter’s origin-destination distribution based on APTS data[J].JournalofTransportationSystemsEngineeringandInformationTechnology,2013,13(4):47-53.
[2] MUNIZAGA M A, PALMA C. Estimation of a disaggregate multimodal public transport origin-destination matrix from passive smartcard data from Santiago, Chile[J].TransportationResearchPartC:EmergingTechnologies,2012,24:9-18.
[3] ZHAO Jinhua, RAHBEE A, WILSON N H M. Estimating a rail passenger trip origin-destination matrix using automatic data collection systems[J].Computer-AidedCivilandInfrastructureEngineering,2007,22(5):376-387.
[4] PELLETIER M-P, TRéPANIER M, MORENCY C. Smart card data use in public transit: a literature review[J].TransportationResearchPartC:EmergingTechnologies,2011,19(4):557-568.
[6] SUI Tao, ROHDE D, CORCORAN J. Examining the spatial-temporal dynamics of bus passenger travel behaviour using smart card data and the flow-comap[J].JournalofTransportGeography,2014,41:21-36.
[7] MA Xiaolei, WU Yaojan, WANG Yinhai, et al. Mining smart card data for transit riders’ travel patterns[J].TransportationResearchPartC:EmergingTechnologies,2013,36:1-12.
[8] NISHIUCHI H, KING J, TODOROKI T. Spatial-temporal daily frequent trip pattern of public transport passengers using smart card data[J].InternationalJournalofIntelligentTransportationSystemsResearch,2012,11(1):1-10.
[9] CHAKIROV A, ERATH A. Activity identification and primary location modelling based on smart card payment data for public transport[C]// 13thInternationalConferenceonTravelBehaviourResearch. Toronto: Avebury Records,2012.
[10] LEE S G, HICKMAN M. Trip purpose inference using automated fare collection data[J].PublicTransport,2014,6(1):1-20.
[11] 楊萬(wàn)波,王昊,葉曉飛,等.基于GPS和IC卡數(shù)據(jù)的公交出行OD推算方法[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2015, 34(3):117-121. YANG Wanbo, WANG Hao, YE Xiaofei, et al. OD matrix inference for urban public transportation trip based on GPS and IC card data[J].JournalofChongqingJiaotongUniversity(NaturalScience),2015,34(3):117-121.
[12] 于勇,鄧天民,肖裕民.一種新的公交乘客上車站點(diǎn)確定方法[J].重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,28(1):121-125. YU Yong, DENG Tianmin, XIAO Yumin. A novel method of confirming the boarding station of bus holders[J].JournalofChongqingJiaotongUniversity(NaturalScience),2009,28(1):121-125.
[13] KIM K, OH K, LEE Y K, et al. An analysis on movement patterns between zones using smart card data in subway networks[J].InternationalJournalofGeographicalInformationScience,2014,28(9):1781-1801.
[14] CHU K K A, CHAPLEAU R. Augmenting transit trip characterization and travel behavior comprehension[J].JournaloftheTransportationResearchBoard,2010,2183(1):29-40.
Classification of Passenger’s Travel Behavior Based on IC Card Data
LI Jun, DENG Hongping
(Guangdong Key Laboratory of Intelligent Transportation Systems, Sun Yat-Sen University, Guangzhou 510006, Guangdong, P. R. China)
To obtain the data of the spatial and temporal patterns of public transit passengers, the first step was to infer the alighting stop for each cardholder based on trip chain method, and then a full data framework was established for describing each passenger’s travel behavior in several days. Meanwhile, three types of travel were defined derived from passenger’s different types of activity in terms of temporal-spatial characteristics, including the commuting travel type, the ordinary type and the random travel type. Finally, each passenger’s travel was classified into the above three types according to travel frequency and the standard deviation of departure time. The result of classification shows that about 39.1% of total passengers have the commuting type or ordinary type and these passengers generate about 76.4% of total passenger flow; about 60.9% of total passengers only have random travel type and these passengers only generate about 23.6% of total passenger flow. It is possible to obtain the public transit passenger’s travel pattern and demand at a much more detail level by classifying each passenger’s multiday travel behavior.
traffic and transportation engineering; public transit; IC card data; transit travel behavior; spatial-temporal analysis
2015-04-02;
2016-08-11
國(guó)家自然科學(xué)基金項(xiàng)目(51178475)
李 軍(1968—),男,湖北武漢人,副教授,博士,主要從事交通工程、交通經(jīng)濟(jì)與智能交通系統(tǒng)及優(yōu)化方面的研究。E-mail:stslijun@mail.sysu.edu.cn。
鄧紅平(1992—),男,四川南充人,碩士,主要從事交通工程與智能交通方面的研究。E-mail:denghp3@mail2.sysu.edu.cn。
10.3969/j.issn.1674-0696.2016.06.23
U121
A
1674-0696(2016)06-109-06