張健欽,王佳嘉,杜明義
(1.北京建筑大學測繪與城市空間信息學院,北京100044;2.現代城市測繪國家測繪地理信息局重點實驗室,北京100044)
公共交通作為城市交通的重要組成部分,影響著整個城市的交通狀況,研究客流的變化規(guī)律可以更好地為公交規(guī)劃和調度提供服務。隨著科學技術的進步,可記錄公交數據的設備和方法也越來越多。目前,對于公交客流規(guī)律的研究可分為兩大方面:一方面是研究用于公交運營決策的公交客流規(guī)律,如總客流、線路客流、站點客流、時段客流、斷面客流等;另一方面是研究用于公交規(guī)劃的居民公交出行特征規(guī)律,如平均出行次數、起訖點分布、平均換乘次數、出行耗時和出行距離等[1]。在公交客流規(guī)律的研究中,越來越多的研究引入了公交客流的時間和空間特性,將時空特性與客流規(guī)律相結合,可以更準確地對客流變化規(guī)律進行挖掘,提高分析結果的科學性。
本文依據公交車刷卡器獲得的客流數據,建立公交客流數據處理流程,實現對原始客流數據的預處理,為研究客流在站位的時空分布提供數據支持;在此基礎上利用GIS空間插值技術,對公交客流的時空分布進行可視化表達,并以北京市公交數據為例,挖掘客流分布規(guī)律,為公交的運營調度提供決策參考信息,為公交線路的設置和規(guī)劃提供科學的依據。
隨著公交IC卡技術在公交系統的逐步推廣應用,公交系統在運行過程中積累的客流數據量越來越大。以北京市公交數據為例,每一趟公交車??恳徽径紩纬梢粭l客流數據,一天可以記錄約178萬條數據。為了將大量的多樣化的公交數據進行有效存儲,本文利用Oracle數據庫系統建立BusData公交數據庫,利用ArcSDE存儲和管理公交GIS網絡數據,具體數據庫表結構如圖1所示。
BusData公交數據庫主要包含圖1所示的4個數據表:客流數據表、站點數據表、線路數據表和站位數據表。不同的數據表是通過兩表中相同的字段關聯的。GIS編號是用來連接站點數據表和客流數據表所建立的字段,是用來標識不同線路站點間的唯一值。上下行線路名稱字段的統一格式為“NNN(XX—XXX)”,如:103(動物園—北京站西),是用來連接站點數據表和線路數據表的字段。站位號是用來標識某一站位的唯一值,是用來整合客流數據的關鍵字段,也是連接站點數據表和站位數據表的字段。本文中的站點是指每一條線路??康恼?,每一條線路都有屬于自己的若干個站點;而站位是代表了所有??吭谙嗤恢玫恼军c的總和。如在站點數據表中查詢站位名稱(ZWMC)為“天安門西”的站點一共有14個,其中有9個站點的站位號為10,屬于長安街路北側的站位,剩下5個站點的站位號為31,屬于長安街路南側的站位,這就是站點與站位多對一的關系。
圖1 公交數據庫表結構
為了深入研究客流在站位的時空分布特征,本文采用VS2010開發(fā)環(huán)境建立客流數據處理系統,對原始客流數據整合處理(原始客流數據見表1),生成新的客流數據表,具體數據處理流程如圖2所示,主要處理步驟如下:
1)從原始客流數據表中篩選指定日期的客流數據,其中包含了不同的站位N個。
2)設站位為K,令K=1,查詢第K個站位。
3)設時間點為T,令T=1,計算T時間點內乘車登量數之和。
4)將計算結果在新的客流數據表里創(chuàng)建一條新數據,存儲日期、站位號等字段。
5)令T=T+1,判斷T是否小于24,若是,跳轉到步驟6);若否,跳轉到步驟3)。
6)令K=K+1,判斷K是否小于N,若是,跳轉到步驟7);若否,數據處理結束。
處理后的客流數據表包含日期(RQ,即車輛行駛的日期)、時間點(SJD,即車輛到達站位所屬的時間段,以整點計算,如8:00—9:00進站的公交車則會記錄時間點為9)、登量(DL,即上車客流量)、站位號(ZWH,即站位的唯一標識號)、站位名稱(ZWMC)、線路數(XLS,即此站點所包含的公交線路數)、站位坐標(X)、站位坐標(Y),經過處理后的客流數據表結構見表2。處理后的客流數據減少了原始數據中冗余的字段,并添加了站位的位置信息,將復雜、難理解的數據轉換為簡單、易懂的客流數據,為下文研究公交客流分布提供了依據,也可以直接用于交通規(guī)劃和運營調度的研究。
圖2 客流數據處理流程
表1 原始的客流數據表
表2 整合后的客流數據表
公交站位的客流登量信息存儲在具有空間信息的站位圖層中,研究公交客流的空間分布特征可以將登量人數分級后通過站位的所在位置展示,圖3為2013年6月4日早7:00—8:00的全北京市各個站位的登量圖。但是在離散的點狀信息中尋求不同站位間登量的區(qū)別和客流的分布規(guī)律是非常困難的,為了解決這個問題,本文對站位客流進行反距離加權法(inverse distance weighted,IDW)空間插值。設站位的分布為一系列離散點P,有待插值點Qj(Xj,Yj,Zj)和已知站點Pi(Xi,Yi,Zi)(i=1,2,…,n),其中(X,Y)為站位的空間坐標,Z為該站位的客流登量(DL)。則待插值點的屬性值可通過鄰近站位的客流登量值加權求得,具體計算公式如下
式中,Zj和Zi分別為待插值點和已知站位的值;ωi為已知站位對待插值點的權函數,公式如下
式中,di為已知站位與待插值點間的距離=(Xj+Xi)k+(Yj+Yi)k;k為控制參數。由公式可知,k的取值大小與權函數的值成反比,取值越大代表對距離較遠的待插值影響越小。從式(1)和式(2)可以看出,距離待插值點越近的站位被賦予的權重越大,反之,距離越遠賦予的權重越?。?]。
圖3 空間插值前點狀站位登量圖
選擇反距離插值法是根據居民的出行模式選擇的,居民乘車時一般都會選擇距離自己最近的車站乘車,因此將權重的衡量標準設定為已知站位距待插點的距離。對離散點數據進行插值計算后會生成連續(xù)的數據表面,通過這種空間插值可以對城市的客流分布進行展示,圖4為與圖3同一時間點生成的經過插值的站位登量圖。經過插值后再通過分級可視化顯示的圖像與原始數據的點狀圖(如圖3所示)對比,可以清楚地反映出公共交通乘車的熱點區(qū)域,并挖掘隨時間的變化乘客乘車的分布變化規(guī)律,為公交站點的設立和公交線路的規(guī)劃提供重要的參考,也為其他客流數據挖掘和研究提供依據。
利用上述公交客流數據處理的方法,選擇2013年6月4日的公交客流數據計算得到早高峰客流分布情況,如圖5所示;同樣,計算出時間粒度為1 h的客流分布情況,圖6為4個不同時間段內的客流分布情況。
圖4 空間插值后面狀站位登量圖
圖5 早高峰客流量分布圖
早高峰主要反映了北京市居民通勤乘坐公交的分布狀況。由圖6可以看出,站位客流較多的地區(qū)(熱點區(qū)域)多分布在北京市四環(huán)外,這與多數大型居住小區(qū)分布在城外的現狀吻合;居住地與工作地的距離較遠,會導致出行時間早于其他居住在城內的居民,因此早高峰時段內城區(qū)外圍的公交客流量明顯大于城區(qū)內部。通過對熱點區(qū)域所在的地理位置和站點屬性進一步分析,可將其分為以下3類:
1)大型住宅區(qū)周邊站位:這類站點的主要特征就是周邊有居住人口大的小區(qū),是距離居住地最近的公交站點。居民在此類站點乘坐公交車或去換乘地鐵和其他線路,如天通苑、通州東關、北皋、三元村等。
2)連通城內外的重要公交換乘點:這類站點的主要特征是該站可換乘的公交線路很多,包含了很多從城郊行駛來的公交車,大量的居民從這些站點換乘通往市區(qū)工作地的公交,北京市連接城郊的公交車一般以8、9字開頭,主要是負責運載居住地距離市中心較遠城區(qū)的乘客,居民出行模式大多為乘坐聯絡市區(qū)的公交到達市區(qū)某站進行換乘到達目的地,如達官營、東直門、勁松橋東、馬家樓橋北等站位可換成的線路都在10條以上。
3)地鐵主要換乘站周邊站點:這類站點主要是與地鐵客流相關聯的公交站點。乘坐地鐵出行雖然方便快捷,但是并不能覆蓋所有的區(qū)域,居民通過乘坐地鐵后還需換乘公交線路到達工作地,如公主墳、東直門、城鐵立水橋等。
通過對在一天內不同時段的客流分布比較(如圖6所示),早高峰時段全市各個地區(qū)的站點處于活躍狀態(tài),由于居民居住地分散在城市不同地區(qū),因此該時段內全市大部分地區(qū)都處于客流的高峰時段;午間時段全市的客流有明顯的回落,只有中心城區(qū)內有小范圍的客流高峰區(qū)域;晚高峰時段全市的客流迅速增長,達到了一天中另一個乘車高峰,乘車的熱點區(qū)多出現在連通城中心與遠郊區(qū)的主干道附近,如與通州區(qū)和石景山區(qū)連通的長安街沿線、與昌平區(qū)和延慶區(qū)連通的京藏高速、與大興區(qū)和房山區(qū)連通的京開高速、與順義區(qū)連通的京順路等;而晚間時段全市的客流量下降到最低,基本無乘車熱點出現。圖6表明了同一時間粒度內上下班高峰時段全城的客流總量明顯大于午間和夜間時段,產生這樣的原因是由城市居民日常早出晚歸的生活習慣而形成的。
圖6 北京市一天內不同時段內的公交客流分布
公交客流數據包含了大量的、全面的、實時的乘客乘車信息,是研究城市公交運行和客流分布規(guī)律的基礎。本文將原始的客流數據通過數據處理流程轉化為可直接用于研究分析的基礎數據;并提出利用GIS空間插值對北京市公交站點的客流量進行可視化展示的方法。該方法的優(yōu)勢在于將傳統的客流數據通過地理信息的空間展示進行表達,使抽象的客流數據轉變?yōu)橹庇^的可視化圖層,通過可視化展示了某一時段內整個城市內的客流分布情況,分析了早高峰不同客流熱點出現的原因,以及一天內客流變化的趨勢。下一步將通過結合其他相關知識對客流變化規(guī)律進行更深入的研究,實現為公交線路的設置和優(yōu)化提供幫助,從而提高公交利用率和乘客乘車滿意度,最終達到減少城市交通的壓力的目的。
[1] 舒國輝.基于數據挖掘的公交客流規(guī)律研究[D].北京:北京交通大學,2009.
[2] SULLIVAN D O,UNWIN D J.Geographic Information Analysis[M].北京:科學出版社,2013.
[3] 陳學武,戴霄,陳茜.公交IC卡信息采集、分析與應用研究[J].土木工程學報,2004,37(2):106-110.
[4] 朱求安,張萬昌,余鈞輝.基于GIS的空間插值方法研究[J].江西師范大學學報:自然科學版:2004,28(2):183-188.
[5] 王煒,楊新苗,陳學武.城市公共交通系規(guī)劃方法與管理技術[M].北京:科學出版社,2002.
[6] CHANGK T.Introduction to Geographic Information System[M].北京:清華大學出版社,2009.
[7] 劉學軍,徐鵬.交通地理信息系統[M].北京:科學出版社,2006.
[8] 單寶艷,郭金金.基于GIS空間分析的城市避震疏散規(guī)劃研究[J].測繪通報,2014(1):86-89.
[9] 張亦漢,鐘欣梅,李建程.利用自行車借還記錄分析與挖掘空間位置信息[J].測繪通報,2014(7):113-116.