魏廣奇,蘇躍江,余 暢
(廣州市交通運輸研究所廣州510635)
掌握城市居民公交出行行為規(guī)律,對于優(yōu)化公交資源配置和提升公交服務水平具有重要意義.IC卡數(shù)據(jù)中蘊藏著海量公交出行信息,能為公交出行研究提供豐富的數(shù)據(jù)支撐.近年來,基于IC卡數(shù)據(jù)的公交出行研究主要包括上下車站點估計、換乘識別、生成OD、出行特征分析等內(nèi)容.Trepanier 等[1]基于居民通勤出行規(guī)律提出兩站點模型,估計下車站點;Munizaga 等[2]利用IC 數(shù)據(jù),基于出行鏈的思想對公交出行的起訖站點進行推斷,通過模型生成公交OD 矩陣;Chen 等[3]基于IC數(shù)據(jù)以及公交運營數(shù)據(jù),根據(jù)出行者的出行頻率和時空特征對出行區(qū)域的屬性進行鑒定,估計出行者的OD分布;Trepanier等[4]基于每日IC卡出行記錄,提出利用離散時間風險模型來衡量IC卡用戶的出行規(guī)律性.上述研究主要集中在出行信息層面,研究重心在合理估計公交出行起訖點以及出行信息統(tǒng)計,較少對公交出行行為活動進行分析.隨著精細化公交服務的需求日益提升,關于公交出行規(guī)律的研究從出行信息宏觀層面向活動目的微觀層面發(fā)展.
本文基于IC卡數(shù)據(jù)獲取公交出行信息,提出以活動區(qū)域識別以及活動區(qū)域?qū)傩耘袆e為核心的公交出行重構分析方法,以廣州市居民為實例,對廣州市公交出行規(guī)律特點展開實證分析.
本文提出以活動理論為基礎的公交出行行為重構分析方法.首先,基于出行鏈思想將公交出行信息進行重組,轉(zhuǎn)換為居民的每一次出行行為;通過對每次出行的起訖站點進行空間上的聚合,獲得居民的日常活動區(qū)域.其次,在活動區(qū)域的主要活動屬性識別上,以歷史出行信息統(tǒng)計分析為導向,分別以日首次出行率、日均到達次數(shù)及日均停留時間作為標準,對居民的居住及工作區(qū)域進行判別;根據(jù)出行目的地區(qū)域的主要活動屬性不同,對居民的公交出行行為進行重構.最后,基于上述出行重構結果,研究居民的公交出行規(guī)律特點.
基礎數(shù)據(jù)包含IC卡數(shù)據(jù)和公交運營數(shù)據(jù).IC卡數(shù)據(jù)包含每次出行的刷卡時間和乘坐車輛及線路信息,結合公交報站數(shù)據(jù)獲知刷卡出行的上車站點;對于下車站點,需要根據(jù)出行者的下次上車站點信息對本次下車站點進行合理推斷.公交運營數(shù)據(jù)包括:報站數(shù)據(jù)、發(fā)班數(shù)據(jù)和線網(wǎng)靜態(tài)數(shù)據(jù).采用文獻[5]上下車站點估計模型,對基礎數(shù)據(jù)進行處理,生成公交出行OD信息.
為便于出行目的判別,將基于一次出行活動的出行信息關聯(lián)合并,將基于刷卡的出行信息轉(zhuǎn)化為基于活動的出行信息.若相鄰刷卡出行的地點滿足步行距離的空間約束,并且出行間隔不超過某個時間間隔閾值,認為該出行者在此期間進行換乘行為,這兩次刷卡可合并為一次出行行為.
2017年9月12 日廣州市全天450萬刷卡數(shù)據(jù)中,刷卡出行間隔在1 h以內(nèi)的頻數(shù)統(tǒng)計分布,如圖1所示.頻數(shù)在間隔0~20 min 區(qū)間內(nèi)呈現(xiàn)先增后減的趨勢,在大于20 min的區(qū)間,間隔的頻數(shù)變化幅度較小,說明大多數(shù)相鄰刷卡出行的間隔在20 min之內(nèi);根據(jù)對公交發(fā)班記錄的統(tǒng)計,廣州市87%的公交線路發(fā)車間隔在10~20 min區(qū)間內(nèi).因此,以20 min作為時間間隔閾值,將滿足條件的前后兩次刷卡出行合并為一次出行行為,將公交出行信息轉(zhuǎn)換成基于活動判別的出行行為.
實現(xiàn)居民出行行為判別后,根據(jù)每次出行的時空分布特征推斷出行目的.由于目的地公交可達性的影響,對于相同的出行起點,若出行終點不同,乘客會根據(jù)可達線路選擇在不同的車站上車;而對于相同的出行終點,根據(jù)不同的出行起點,乘客會在出行終點周邊不同的車站下車,如圖2所示.直接對出行的起終站點進行統(tǒng)計會導致統(tǒng)計特征指標的離散,不利于出行規(guī)律分析和出行目的識別,因此需要對可能屬于同一個活動區(qū)域的站點進行聚合.
圖2 某居民活動區(qū)域站點分布示意圖Fig.2 Distribution of bus stations and activity areas
系統(tǒng)聚類法根據(jù)類間距離對距離近的類不斷進行合并,適用于分類規(guī)則明確的聚類問題.居民通常會選擇在出行地周邊的步行可達范圍內(nèi)乘坐公交,因此,通過對居民日常使用的公交站點進行空間聚類,實現(xiàn)居民日?;顒訁^(qū)域的識別.
一方面,在當前共享單車有序發(fā)展的背景下,“最后一公里”的出行服務相應提升公交站點的接駁范圍;另一方面,按照步行速度4 km/h和城市規(guī)劃提出的15 min 生活圈,計算公交站點的服務范圍為1 km.因此,以1 km 作為最大類內(nèi)距離,即最大接駁范圍,采用系統(tǒng)聚類重心法對每位居民出行的公交站點進行聚類,聚類的結果即為每位居民的日?;顒訁^(qū)域.
類定義為
式中:i為第i類;n為聚類合并次數(shù);Sm為該類中第m個公交站點.
類重心定義為
式中:x(Si)為站點Si的橫坐標;y(Si)代表站點Si的縱坐標.
類間距離是兩個類的類重心之間的歐氏距離.
站點聚類步驟如下:
Step 1將某居民所有出行的起訖站點分別作為一類.即建立N類,以各個類間的距離(初始時即為各樣本間的距離),生成一個N×N的距離矩陣D(0),其中元素記為
Step 2選取使用次數(shù)最多的站點K作為聚類的起點開始本次聚類合并.
Step 3對于得到的距離矩陣D(n),求第K行中最小的元素,將和兩類進行合并,從而生成新類并計算的類重心重新計算類重心到類內(nèi)最遠的兩個元素之間的距離,若距離小于1 km,則新類有效,重新計算類間距離,得到;并繼續(xù)Step 3;若距離大于1 km,則執(zhí)行Step 2,直到所有站點都曾經(jīng)作為聚類起點并完成聚類過程.
通過上述步驟將每位居民出行記錄中距離相近的公交站點進行聚合,有效劃分出若干個活動區(qū)域,每個活動區(qū)域的出行特征得到聚合保留,便于對各區(qū)域的活動屬性進行判別.
城市居民公交出行的出行目的類型,可以分為通勤出行和非通勤出行.通勤出行在時空上具有較強的規(guī)律性,因此將活動區(qū)域的主要活動屬性劃分為三類:居住地(H)、工作地(W)和非職住地(O),根據(jù)區(qū)域主要活動屬性的分類,居民的出行定義為3種:回家出行、工作出行(包括上班和上學)以及其他出行.
(1)居住地(H)的判別.
對于大部分城市居民來說,至少擁有一個常用居住地.根據(jù)日常的出行規(guī)律,居民每天首次出行通常都以居住地為出發(fā)地.因此,日首次出行率可以作為居民居住地的判定指標.
日首次出行率指對于居民的某個活動區(qū)域,該區(qū)域作為出行日(有公交出行的某天)首次出行的出發(fā)區(qū)域次數(shù)占出行日總數(shù)的比例.對于活動區(qū)域的日首次出行率計算公式為
式中:Si是指該居民在活動區(qū)域i進行當日首次出行的總次數(shù);di是指該居民乘坐公交出行的總天數(shù).
為合理確定用于居住地判定的日首次出行率r的閾值,統(tǒng)計全部出行者樣本各活動區(qū)域的日首次出行率,其中所有樣本的最高首次出行比例區(qū)域的首次出行率分布及累計曲線如圖3所示.
圖3 最高首次出行比例區(qū)域的首次出行率分布—累計圖Fig.3 Proportion of first trip rate in the area with highest rate
由圖3可知,超過95%的出行者均具有一個日首次出行率超過40%的活動區(qū)域,對于出行者來說,每日第一次出行大概率發(fā)生在該區(qū)域,具有明顯的居住地特征.因此,以40%作為指標閾值,將每日首次出行比例大于40%的活動區(qū)域判別為該居民的居住地.
(2)工作地(W)的判別.
工作地指城市居民每日上班(或上學)的地方.對于絕大多數(shù)居民,在工作地區(qū)域的日均停留時間明顯大于其它活動區(qū)域,可將日均停留時間作為工作地的主要判別標準.對所有樣本各活動區(qū)域的日均停留時間進行統(tǒng)計,停留時間根據(jù)IC卡前后次出行時間差進行估算,剔除出行者的居住地區(qū)域,選取日均停留時間最長的區(qū)域,各出行者日均停留最久的區(qū)域停留時間頻次分布如圖4所示.
圖4 日均停留最久區(qū)域的日均停留時長分布圖Fig.4 Proportion of average retention tine in area with highest arriving time
由圖4可知,超過95%的出行者停留時間最長的活動區(qū)域日均停留時間超過4 h,與城市居民的日常工作時長相符(全日制工作為8 h、半日制工作為4 h).因此,將各活動區(qū)域中停留時間最長且大于4 h的區(qū)域判別為該出行者的工作地.針對普通卡持有者,工作地為上班地點;針對學生卡持有者,工作地為上學地點.
(3)非職住地(O)的判別.
對于既不滿足居住地判別條件,又不滿足工作地判別條件的區(qū)域,判定為非職住地區(qū)域.
采集廣州市2017年9月的IC卡數(shù)據(jù)及相關公交運營數(shù)據(jù).由于不同IC卡類型(普通卡、老人卡、學生卡等)具有不同的出行規(guī)律特征,在保持各類型卡占比與總體一致的前提下,抽樣選取26677張IC卡的刷卡出行樣本作為分析對象,出行記錄總數(shù)為110萬條.分析廣州市居民公交出行規(guī)律特征,獲取居民每日的出行鏈構成,對公交出行行為進行重構.對樣本出行者在分析時段內(nèi)所有出行日的出行鏈進行統(tǒng)計,提取出現(xiàn)次數(shù)最多的前十種出行鏈類型,如表1所示.出行鏈接活動數(shù)量越多,出行鏈數(shù)量所占比例則越低.
根據(jù)IC卡的票卡類型,對4類出行者群體的出行活動特征進行分析.表2為不同類型出行者的活動區(qū)域數(shù)量及平均停留時間情況.4類IC卡群體在一個月內(nèi)的平均活動區(qū)域個數(shù)在7、8個左右.從停留時間來看,普通卡和學生卡群體在活動區(qū)域的平均停留時間更長.
表1 出行鏈構成Table1 Composition of trip chains
表2 各類出行群體的活動區(qū)域數(shù)量與平均停留時間Table2 Number of activity areas and average retention time among different card types
由表1可知,無其他出行行為的簡單出行鏈“H-W-H”(家—工作地—家)和“H-O-H”(家—其他—家)所占的比例最高,占出行鏈組成比例74%;
圖5為4類IC卡群體月活動區(qū)域數(shù)量的頻數(shù)分布圖,各類型活動區(qū)域在6~8個之間的人數(shù)均接近人群總數(shù)的1/2,老人免費卡群體的活動區(qū)域數(shù)量相比其他群體顯著多,出行活動較為豐富.
圖5 4類IC 群體的活動區(qū)域數(shù)量分布Fig.5 Proportion of activity area in four types of smart card group
對于普通卡群體和學生卡群體這兩類通勤比例較高的群體,對其出行活動構成比例進行統(tǒng)計分析.圖6和圖7分別為學生卡群體和普通卡群體的工作出行(W 出行)、回家出行(H 出行)和其他出行(O出行)3種出行類型的占比分布.可以得到,學生卡群體出行基本以上學出行和回家出行為主,大多數(shù)學生的上學和回家出行總占比達到80%~90%;普通卡群體3種不同目的出行中,回家出行比例較大,與學生卡群體不同,工作出行與其他出行占日常出行比例比較相近,表明隨著城市的發(fā)展,居民非工作出行活動越來越多,出行更加豐富多元化.
圖6 學生卡群體各活動類型的出行比例分布Fig.6 Proportion of different activity type in student group
圖7 普通卡群體各活動類型的出行比例分布Fig.7 Proportion of different activity type in normal card group
對比工作日和非工作日的出行活動構成分布.圖8和圖9分別統(tǒng)計工作日(以周五為例)和非工作日(以周六為例)一天內(nèi)不同時段3種出行類型的出行量分布.
圖8 工作日(周五)不同時段不同類型出行需求堆積圖Fig.8 Accumulative diagram of travel demand with different period and activity type in working day
圖9 非工作日(周六)不同時段不同類型出行需求堆積圖Fig.9 Accumulative diagram of travel demand with different period and activity type in non-working day
由圖8和圖9可知,工作日工作出行需求主要發(fā)生在早高峰;回家出行需求從10:00開始逐漸增多,主要發(fā)生在晚高峰時段和夜間;其他出行的出行需求在全天分布比較均勻.非工作日3種類型出行的出行需求相比于工作日均有所下降;早高峰出行需求從工作出行為主變?yōu)楣ぷ鞒鲂小⑵渌鲂行枨笙喈數(shù)那樾?;而平峰時段其他出行和回家出行需求均有所增加.
通過對IC卡數(shù)據(jù)和公交運營數(shù)據(jù)的挖掘,實現(xiàn)居民主要活動區(qū)域及出行行為類型判別,并以實例數(shù)據(jù)分析廣州市居民公交出行行為的規(guī)律特征.結果表明:學生卡群體、普通卡群體工作日早晚通勤特征明顯,工作日、非工作日出行需求變化較大;老人卡群體工作日出行集中在早高峰后至平峰時段,工作日、非工作日出行需求變化較??;工作日早、晚高峰出行需求以工作出行和回家出行為主,非工作日不同類型出行需求均有所下降,時間分布更為均勻.本文的公交出行行為重構分析方法,對于站點聚類以及活動屬性判別等相關參數(shù)的設定主要基于統(tǒng)計結果,后繼研究將進一步開展相關參數(shù)的敏感性分析,形成更科學可靠的分析結果.