殷瑋宏 楊健 何兆東 黃燕如 楊明慧
摘? 要:我國公共交通智能化水平不斷提升,公共交通系統(tǒng)內(nèi)部產(chǎn)生的海量的運營數(shù)據(jù),為城市的規(guī)劃發(fā)展提供了新的研究視角。通過地鐵刷卡數(shù)據(jù)的挖掘與可視化,結(jié)合網(wǎng)絡(luò)拓撲結(jié)構(gòu)分析、OD分析與過度通勤理論,對深圳地鐵的網(wǎng)絡(luò)拓撲特性與通勤空間特征進行了研究。研究結(jié)果表明,深圳地鐵站點離散分布程度較大,地鐵通勤存在過度通勤的現(xiàn)象,職住區(qū)分離現(xiàn)象日趨明顯。
關(guān)鍵詞:可視化;地鐵網(wǎng)絡(luò)拓撲;地鐵OD;職住分離;通勤時長;數(shù)據(jù)挖掘
Abstract:The intelligentization of the public transportation in China has been developing continually. The data produced by the public transportation system offers a new angle for research on the city planning. The research is conducted and visualized through the SCD(smart card data),combining network topology,OD and excessive commuting theory. It aims at researching on the network topology and the commuting space features of the metro in Shenzhen. The results show that the degree of the discrete distribution of the metro stations in Shenzhen is great. The phenomenon of excessive commuting exists in subway commuting,and the separation of work and residential areas is becoming more and more obvious.
Keywords:visualization;metro network topology;metro OD;job-housing separation;commuting hours;data mining
0? 引? 言
城市公共交通作為低碳節(jié)能的交通方式,有助于降低社會出行總成本,成為國內(nèi)外解決城市發(fā)展過程中面臨的各種交通問題的重要出路,我國更是將城市公交優(yōu)先發(fā)展上升到戰(zhàn)略層面。通過研究乘客在乘坐公共交通工具出行的行為,分析其出行習(xí)慣及特征,對于建設(shè)更完善的公交服務(wù)系統(tǒng)具有重要意義。在互聯(lián)網(wǎng)時代,大數(shù)據(jù)的作用日益凸顯,伴隨公眾出行而產(chǎn)生的海量數(shù)據(jù)背后蘊含著豐富的信息。
目前國內(nèi)外對公交出行數(shù)據(jù)的研究主要針對公共交通智能卡數(shù)據(jù)(SCD)進行挖掘。SCD數(shù)據(jù)結(jié)構(gòu)比較簡單,一般包含了乘客的ID、上車/下車具體時間和站點等。相比于傳統(tǒng)的交通出行數(shù)據(jù),SCD獲取成本較低、連續(xù)性好、覆蓋面廣、信息全面、易于動態(tài)更新,且具有地理標(biāo)識和時間標(biāo)簽[1]。國內(nèi)外對SCD數(shù)據(jù)的挖掘分析工作主要集中在以下幾個方面:(1)推算OD(Origin-Destination)矩陣。這是由于大量城市公共交通采用一票制(flat fare),僅僅要求乘客上車刷卡或下車刷卡,因此造成了出行信息的不完整,需要對數(shù)據(jù)進行補充,推算乘客出行的OD矩陣,而對于要求乘客上車下車均要刷卡產(chǎn)生的SCD則并不需要過多的推算與補充。(2)公共交通系統(tǒng)的運行與管理。SCD可以幫助決策者更好地理解公交系統(tǒng)的使用模式,從而對公交網(wǎng)絡(luò)線路進行更加系統(tǒng)的規(guī)劃。如SUN等[2]利用OD矩陣對地鐵時刻表進行了優(yōu)化。(3)持卡人的出行行為與社會網(wǎng)絡(luò)分析,這一領(lǐng)域的研究目前的趨勢是從所有人群到特定人群,從所有行為到特定行為。(4)城市空間結(jié)構(gòu)分析,城市的居住、就業(yè)和職住平衡一直是城市研究的重要問題,OTHMAN等[3]利用地鐵刷卡數(shù)據(jù)實現(xiàn)了軌道交通的智能體仿真系統(tǒng),研究軌道交通系統(tǒng)中的動力學(xué)。ZHOU等[4]基于識別通勤出行,分析了北京的過度通勤。相關(guān)研究處于起步階段,且多局限于可視化層次,少有形成機制分析。本研究利用了SCD數(shù)據(jù)所包含的時空信息進行研究。
1? 研究區(qū)域概況
深圳市是中國的經(jīng)濟特區(qū)、全國性的經(jīng)濟中心城市以及國際化的大都市。位于中國大陸南部,珠三角東部,毗鄰香港。深圳市水陸空鐵口岸完備,是中國擁有口岸數(shù)量最多、出入境人員最多、車流量最大的口岸城市之一。截至2015年末,常住人口1 137.89萬,下轄龍崗區(qū)、鹽田區(qū)、坪山區(qū)、大鵬新區(qū)、寶安區(qū)、光明區(qū)、南山區(qū)、前海新區(qū)、龍華區(qū)、福田區(qū)、羅湖區(qū)。深圳市目前有羅寶線(1號線)、蛇口線(2號線)、龍崗線(3號線)、龍華線(4號線)、環(huán)中線(5號線)、西麗線(7號線)、梅林線(9號線)、機場線(11號線)共8條地鐵線路,此外還有2條有軌電車線路,本次研究使用的SCD是來自于地鐵線路的刷卡數(shù)據(jù)。
2? 數(shù)據(jù)來源及處理
2.1? 數(shù)據(jù)來源
原始數(shù)據(jù)包括了深圳市全市范圍內(nèi)2015年12月1日的所有IC卡交易記錄表(包括公交、地鐵刷卡記錄,充值記錄),共有14 876 859行。
經(jīng)過對刷卡數(shù)據(jù)的初步分析,發(fā)現(xiàn)原始數(shù)據(jù)中存在與本研究無關(guān)的數(shù)據(jù)以及無效數(shù)據(jù),經(jīng)數(shù)據(jù)清洗后,共提取出了3 987 836條地鐵刷卡數(shù)據(jù),截取部分片段展示,如表1所示。其中,IDS代表每個刷卡者的唯一標(biāo)識符,DTLXNCODE代表刷卡者行為,DTLDATE代表刷卡日期,DTLTIME代表刷卡時間,UNIT代表地鐵線路標(biāo)識符,LINES代表站點名稱,PNUMS代表車輛標(biāo)識符。
2.2? 數(shù)據(jù)處理
2.2.1? 出入站刷卡行為計數(shù)
地鐵出入站刷卡行為是反映地鐵客流量的重要指標(biāo),對于地鐵通勤情況具有一定代表性。使用Python中的數(shù)據(jù)分析拓展包Pandas對各站點的出入站記錄進行計數(shù),生成各站點的出入站行為計數(shù)表;同時結(jié)合深圳交通早晚高峰的時間,生成早、晚高峰出入站行為計數(shù)表,并對該計數(shù)表進行分區(qū)統(tǒng)計,生成各區(qū)的早晚高峰出入站行為統(tǒng)計表。
2.2.2? OD矩陣建立
OD表通過特定的標(biāo)識符,記錄個體在空間中移動軌跡的起點與終點,可以反映個體的出行行為。使用Python提取出入站記錄,配合刷卡者的個人特定標(biāo)識符,將刷卡者的出站和入站記錄整合,形成OD表;在OD表的基礎(chǔ)上,使用相互連通的站點數(shù)據(jù)構(gòu)建網(wǎng)絡(luò)數(shù)據(jù)集,以站點間出入站刷卡次數(shù)為權(quán)重,建立OD成本矩陣,用于后續(xù)的分析。
3? 研究方法
3.1? 深圳市地鐵網(wǎng)絡(luò)拓撲結(jié)構(gòu)分析
通過進行網(wǎng)絡(luò)拓撲結(jié)構(gòu)分析,可掌握深圳市地鐵的網(wǎng)絡(luò)拓撲特性,了解各站點在拓撲網(wǎng)絡(luò)中的位置與分布情況。配合后續(xù)分析,可以為深圳市地鐵線路的規(guī)劃提供一定的參考。
3.1.1? 研究模型
使用Space L方法對深圳市的地鐵網(wǎng)絡(luò)進行建模,在Space L模型下,網(wǎng)絡(luò)中的各站點僅與相鄰站點通過相鄰的地鐵線路連接[5]。根據(jù)2015年深圳地鐵路網(wǎng),建立地鐵站點的鄰接矩陣(矩陣大小為117行*117列)。將鄰接矩陣導(dǎo)入Gephi,得到如圖1所示的深圳市地鐵網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖。
3.1.2? 站點度分布
在Space L模型下,站點的度值用于表示該站點相鄰站點的數(shù)目。假設(shè)某無向網(wǎng)絡(luò)的節(jié)點個數(shù)為n,則其鄰接矩陣A可以表示為:
使用Excel統(tǒng)計鄰接矩陣中的站點度值,通過對站點度值進行分析,可以得到各站點的度分布情況。
3.1.3? 平均路徑長度
在Space L模型下,站點之間的最短距離指的是在地鐵網(wǎng)絡(luò)中連接這兩點的最短路徑所經(jīng)過的邊數(shù)。使用Gephi,計算出深圳市地鐵網(wǎng)絡(luò)的平均路徑長度,可以得出地鐵路網(wǎng)的運輸效率。
3.2? OD分析
OD分析通過構(gòu)建乘客的移動網(wǎng)絡(luò)矩陣,描述持卡乘客的出行行為,可以用于城市交通、城市空間結(jié)構(gòu)、職住平衡等問題的研究分析。
使用OD成本矩陣,利用ArcMap在深圳地鐵站點上進行配對連線,得到OD分析圖,使用不同顏色及粗細的線段對刷卡次數(shù)進行分級。通過OD分析圖,可以較為直觀地看出通勤的流量情況及其空間特征。
3.3? 過度通勤理論與方法
過度通勤定義為實際平均通勤成本與理論最小平均通勤成本的差值[6],過度通勤率(百分比)的表達式為:
其中,E表示過度通勤率,Ta表示平均實際通勤時間,Tr表示平均理論最小通勤時間。
使用線性規(guī)劃求最優(yōu)解的方法[7],計算理論最小通勤時間。將OD成本矩陣導(dǎo)入Lingo軟件,使用Lingo的線性規(guī)劃模型來計算理論最小通勤時間。
在OD表數(shù)據(jù)的基礎(chǔ)上進行平均通勤時長的計算,利用Python計算乘客的出站時間與入站時間之差的平均值,即得平均實際通勤時間。
4? 研究結(jié)果分析
4.1? 深圳市地鐵網(wǎng)絡(luò)拓撲結(jié)構(gòu)特征
圖2展示了深圳市地鐵站點的度分布情況。
深圳市地鐵站點的平均度為2.203;其中77.12%的站點的度值為2,為非換乘的小型普通站點,如位于4號線北端的紅山站;度值大于2的站點占比16.10%,這些站點往往位于地鐵網(wǎng)絡(luò)的線路交叉處,有換乘的功能,如深圳北站、寶安中心站等地鐵站;其中福田站的度值最大,為5,該站位于1、2、3號線與11號線(在建)的交叉處,是一個大型的換乘站,為深圳市重要的交通樞紐??梢钥闯?,深圳市地鐵網(wǎng)絡(luò)呈現(xiàn)出以普通站點為主,中小型換乘站為輔的站點分布格局。
經(jīng)過計算得出,深圳市地鐵網(wǎng)絡(luò)的平均路徑長度為13.805個站點??傮w而言,深圳市地鐵從任意一個站點入站,到任意一個站點出站,平均需經(jīng)過約14個站點,說明地鐵站點離散分布程度較大;這與深圳市中心城區(qū)地鐵線網(wǎng)較密集,邊緣城區(qū)較稀疏的實際情況相符。
4.2? 地鐵通勤空間特征分析
4.2.1? 地鐵高峰出入站刷卡次數(shù)分析
通過對數(shù)據(jù)的分析,將7:00—9:00、17:30—19:30的兩個通勤流量高峰時段作為早高峰、晚高峰。對比圖3(a)和圖3(b),早、晚高峰刷卡頻率較高的站點分布存在較大的差異,早高峰流量較大的站點主要分布在西方、東北方的地鐵線路,晚高峰流量較大的站點集中在西南方、南方的地鐵線路。顯然,地鐵的入站和出站次數(shù)分別代表該站點入站、出站的人數(shù),下面將對出、入站統(tǒng)計數(shù)據(jù)進行對比分析。
本研究所獲取的數(shù)據(jù)日期為非特殊節(jié)日的普通工作日,對于工作日的地鐵通勤情況具有一定代表性。部分站點的早高峰入站數(shù)、晚高峰出站數(shù)都較大,并且存在相當(dāng)數(shù)量的重合部分,可以認為這部分重合的站點附近一定范圍是承擔(dān)了居住功能的區(qū)域,如:坪洲、白石洲、民治、龍華、白石龍、民樂等站。對比站點的晚高峰入站數(shù)與早高峰出站數(shù),可發(fā)現(xiàn)重合的高峰站點,由此歸為承擔(dān)了更多就業(yè)功能的區(qū)域,主要有:福田、崗廈北、崗廈、購物公園、高新園、深大、科苑、車公廟、大劇院等站。綜合對比,還存在著早晚高峰的出、入站人數(shù)相對持平的站點,這些站點附近一定距離的區(qū)域也可認為是兼?zhèn)淞司蜆I(yè)和居住功能的區(qū)域,歸為職住混合區(qū),如:大新、桃園、石廈、福民、蓮花北等站。
4.2.2? 地鐵高峰期客流流向分析
為了進一步分析地鐵通勤的空間分布規(guī)律,結(jié)合深圳市行政區(qū)劃,我們得出了地鐵人流凈流入和凈流出的區(qū)域。如圖4所示,深色區(qū)域為凈流入?yún)^(qū)域,淺色區(qū)域為凈流出區(qū)域,白色區(qū)域表示無地鐵通行區(qū)域,顏色越深流量越大。可以認為,早高峰期間的凈流入?yún)^(qū)域為深圳市主要承擔(dān)就業(yè)功能的區(qū)域,這三個區(qū)域相連集中在核心位置,臨近關(guān)口,毗鄰香港;而主要承擔(dān)居住功能的三個凈流出區(qū)域分布在外圍,呈現(xiàn)向外延伸擴展的趨勢,工作的區(qū)域呈現(xiàn)被居住區(qū)域半包圍的空間關(guān)系。
4.2.3? 地鐵OD數(shù)據(jù)分析
如圖5所示,福田、崗廈等站點處于十字交叉中心,以此為中心,在其南北東西向分別延伸的地鐵線路皆為較為密集的深色線條,通勤的流量相對較大。結(jié)合前文的分析,將就業(yè)和居住集中的區(qū)域分別進行標(biāo)識(半徑為1 km),如圖5所示??梢钥吹骄蜆I(yè)集中區(qū)主要位于高新區(qū)以及福田周圍,而居住區(qū)則分散在就業(yè)集中區(qū)的外圍,呈現(xiàn)類似半環(huán)形分布包圍就業(yè)集中區(qū)。
謝彥敏[6]等在基于地鐵刷卡數(shù)據(jù)的深圳市過度通勤研究中通過分析2014年2月一周的地鐵通勤數(shù)據(jù)得出了相應(yīng)的居住集中區(qū)和就業(yè)集中區(qū),通過對比,我們發(fā)現(xiàn)2015年12月的地鐵通勤數(shù)據(jù)得出的結(jié)果相比2014年2月產(chǎn)生了一些變化,如就業(yè)集中區(qū)增加了大新、桃園區(qū)域。
4.2.4? 過度通勤分析
根據(jù)過度通勤的計算方法,得到深圳市基于地鐵通勤的過度通勤率,如表2所示。
從表2可知,深圳市的晚高峰實際通勤時間稍高于早高峰實際通勤時間,總體差距不大;與理論最小通勤時間差距約20分鐘,差距較大;計算得出過度通勤率達63.13%的較高水平,說明深圳市地鐵通勤存在較嚴重的過度通勤現(xiàn)象。結(jié)合極光大數(shù)據(jù)的《2018中國城市通勤研究報告》[8],以及基于地鐵刷卡數(shù)據(jù)和問卷調(diào)查數(shù)據(jù)的深圳市過度通勤研究[9],對2014、2015、2018年的平均實際通勤時間進行對比,由表3可以發(fā)現(xiàn),深圳市通勤時間及其增長率皆呈上升趨勢,反映深圳市的長距離通勤狀況正在不斷加劇,職住分離現(xiàn)象日趨明顯。
為了進一步分析,本研究截取了17:30—22:30的數(shù)據(jù),并以一個小時作為區(qū)間,分別計算其平均實際通勤時間,并繪制成如圖6所示的折線圖。
圖6? 17:30—22:30平均實際通勤時間如圖6所示,深圳市17:30—19:30(即晚高峰)的平均實際通勤時間存在一個高峰期,而在20:30—21:30則存在一個次高峰。根據(jù)工作人群的實際下班情況可以判斷17:30—19:30期間為大部分人群的正常下班時間,因此對應(yīng)產(chǎn)生了一個高峰期;而次高峰20:30—21:30則對應(yīng)加班人群的下班時間,因此繼晚高峰后再次迎來了次高峰。同時,地鐵發(fā)車間隔會隨著人流量和需求的增加而適當(dāng)縮小,此時的通勤效率應(yīng)有所提升;然而高峰期的平均通勤時間仍然增加,主要是由于通勤人群從刷卡進站到上地鐵的時間延長了,易知人流量也是平均通勤時間的影響因素之一。
結(jié)合OD分析,我們選擇了寶安區(qū)(典型居住區(qū))西鄉(xiāng)、坪洲(站)至南山區(qū)(典型就業(yè)區(qū))桃園、深大、高新園(站),共5條線路,分別計算其早高峰、晚高峰、高峰期平均通勤距離及過度通勤率,進行局部分析,數(shù)據(jù)如表5所示。
其中西鄉(xiāng)—高新園線路的通勤時長與過度通勤率最為逼近深圳市的平均值,其次是西鄉(xiāng)—深大線路、坪洲—高新園線路及坪洲—深大線路,坪洲—桃園線路的平均通勤時長相對較短,過度通勤率較低于深圳市均值。由上文OD分析可知,隨著兩站點間實際通勤距離的增加,過度通勤率也會隨之增高,而以上5條線路中西鄉(xiāng)—高新園線路的實際通勤距離最長,過度通勤率最高,而坪洲—桃園線路的實際通勤距離最短,其過度通勤率也呈現(xiàn)較低值,說明工作區(qū)及居住區(qū)間的實際距離越長,過度通勤率越高,城市通勤浪費現(xiàn)象越凸顯。
此外,由表5可見各線路的早高峰實際通勤時間及過度通勤率均高于晚高峰。由于早高峰通勤人群的上班時間集中,晚上通勤人群下班時間相對分散,正常下班與加班下班人群之間的通勤存在時差,因此城市中早高峰時的通勤最為集中,通勤壓力最大。針對早高峰交通通勤特點結(jié)構(gòu)進行集中分析,通過減緩早高峰的通勤壓力,從而優(yōu)化城市的通勤模式,是在未來城市的發(fā)展規(guī)劃中值得探索的方向。
結(jié)合以上分析,可以發(fā)現(xiàn)深圳市的工作和居住區(qū)域是相對分離的,有較為明顯的職住分離現(xiàn)象。CERVERO R[10]認為就業(yè)與住房的不匹配是導(dǎo)致人們長距離通勤的重要原因,特別對于低收入階層而言,無法負擔(dān)就業(yè)中心周圍的高價住房,只能選擇遠離工作地點的居住區(qū),導(dǎo)致其平均通勤距離要比高收入階層更長。深圳市的職住分離情況對過度通勤現(xiàn)象產(chǎn)生著重要的影響,隨著城市的不斷擴張及郊區(qū)化的發(fā)展,深圳市的職住分離趨勢必然有所加強,因此如何平衡區(qū)域職住功能,比如通過規(guī)劃和稅收政策鼓勵在就業(yè)集中區(qū)建設(shè)配套住房,或在居住集中區(qū)增加就業(yè)崗位等[11],是城市發(fā)展中亟待思考的問題。對于城市的發(fā)展和規(guī)劃來說,平衡區(qū)域的職住功能,是緩解城市通勤壓力,提高通勤效率的可探索路徑。
5? 結(jié)? 論
本文基于深圳市一工作日地鐵刷卡數(shù)據(jù),利用Python等工具對大數(shù)據(jù)進行挖掘,分析了深圳市地鐵網(wǎng)絡(luò)的拓撲結(jié)構(gòu),使用OD矩陣對客流進行可視化,刻畫了深圳市居民通勤的時空特征,并結(jié)合過度通勤理論研究深圳的職住分離情況。研究結(jié)果表明,深圳市邊緣城區(qū)地鐵線網(wǎng)較稀疏,站點離散分布程度較大;地鐵過度通勤現(xiàn)象與職住區(qū)分離現(xiàn)象日趨明顯。因此,在未來的城市規(guī)劃中,平衡區(qū)域的職住功能,是緩解城市通勤壓力、提高通勤效率的可探索路徑。
參考文獻:
[1] 龍瀛,孫立君,陶遂.基于公共交通智能卡數(shù)據(jù)的城市研究綜述 [J].城市規(guī)劃學(xué)刊,2015(3):70-77.
[2] SUN L J,TIRACHINI A,AXHAUSEN K W,et al. Models of bus boarding and alighting dynamics [J].Transportation Research Part A,2014,69:447-460.
[3] OTHMAN N B,LEGARA E F,SELVAM V,et al. Simulating Congestion Dynamics of Train Rapid Transit Using Smart Card Data [J].Procedia Computer Science,2014,29:1610-1620.
[4] ZHOU J P,MURPHY E,LONG Y. Commuting efficiency in the Beijing metropolitan area:an exploration combining smartcard and travel survey data [J].Journal of Transport Geography,2014,41:175-183.
[5] 鄭蘇江.上海市地鐵網(wǎng)絡(luò)拓撲結(jié)構(gòu)性質(zhì)分析 [J].智能計算機與應(yīng)用,2019,9(4):205-208.
[6] 謝彥敏,錢志誠,陳宇.基于地鐵刷卡數(shù)據(jù)的深圳市過度通勤研究 [C]//2017中國城市規(guī)劃年會.持續(xù)發(fā)展 理性規(guī)劃——2017中國城市規(guī)劃年會論文集(05城市規(guī)劃新技術(shù)應(yīng)用).北京:中國建筑工業(yè)出版社,2017:898-921.
[7] WHITE M J. Urban Commuting Journeys Are Not “Wasteful” [J].Journal of Political Economy,1988,96(5):1097-1110.
[8] 極光大數(shù)據(jù).2018年中國城市通勤研究報告 [R/OL].(20 18-06-15).http://www.199it.com/archives/737728.html.
[9] 錢志誠.基于地鐵刷卡數(shù)據(jù)和問卷調(diào)查數(shù)據(jù)的深圳市過度通勤研究 [D].深圳:深圳大學(xué),2017.
[10] CERVERO R. Jobs-Housing Balancing and Regional Mobility [J].Journal of the American Planning Association,1985,55(2):135-160.
[11] 孟曉晨,吳靜,沈凡卜.職住平衡的研究回顧及觀點綜述 [J].城市發(fā)展研究,2009,16(6):23-28+35.
[12] 梁美蘭,郭玉香,胡嘉儀,等.中國城市地鐵網(wǎng)絡(luò)特征分析及分類 [J].測繪與空間地理信息,2018,41(11):155-159+162.
[13] 曹庭脈,湯黎明,趙渺希.基于地鐵數(shù)據(jù)的廣州市職住空間和通勤特征分析 [C]//中國城市規(guī)劃學(xué)會,重慶市人民政府.活力城鄉(xiāng) 美好人居——2019中國城市規(guī)劃年會論文集(05城市規(guī)劃新技術(shù)應(yīng)用).北京:中國建筑工業(yè)出版社,2019:459-475.
作者簡介:殷瑋宏(1999.06—),男,漢族,廣東佛山人,本科,研究方向:地理信息科學(xué)。