谷朋飛 李俊異 張?zhí)厣?戚將軍
摘 要:本文使用Python爬取高德地圖的交通態(tài)勢,收集了成都來渝方向高速路段4周的路況數(shù)據(jù),以交通態(tài)勢路況指數(shù)為指標對數(shù)據(jù)進行路網(wǎng)地圖可視化,發(fā)現(xiàn)某些地區(qū)高速公路與城市道路的銜接地段較為擁堵,并初步細化了地區(qū)內(nèi)的擁堵區(qū)域;以平均行程速度為指標驗證了上述的擁堵區(qū)域。結果證明:成渝環(huán)線高速(白市驛互通到西環(huán)立交段與賴家橋立交到渝遂互通段)擁堵問題比較嚴重,對這幾個互通區(qū)域的銜接道路以及周邊路網(wǎng)進行協(xié)同研究。
關鍵詞:交通態(tài)勢;Python;平均行程速度
0 引言
近年來,隨著重慶城市化、機動化進程的加快和“成渝雙城經(jīng)濟圈”等國家戰(zhàn)略規(guī)劃的提出,促使城市間和區(qū)域內(nèi)的人流量、車流量、信息流量快速增加。截至2020年底,重慶高速公路總里程數(shù)已達到3 400公里,省際出口通道由13個增加到24個,汽車保有量已經(jīng)突破500萬輛,這對重慶市高速公路與城市道路銜接提出了更高的要求。高速互通交通路況的擁堵程度是判斷高速公路與城市道路銜接是否合理的一個重要標準,所以本文將對重慶境內(nèi)的成渝環(huán)線高速擁堵路段以及擁堵程度進行細化與分析。
1 交通態(tài)勢數(shù)據(jù)爬取
1.1 交通態(tài)勢簡介
交通態(tài)勢數(shù)據(jù)是一類由高德提供的GPS點數(shù)據(jù),經(jīng)過ArcMap可視化后,可以反映道路的實時路況。數(shù)據(jù)中包含2個重要指標,分別是交通態(tài)勢指數(shù)和平均行程速度。交通態(tài)勢指數(shù)分為“0,1,2,3”,“0”表示路況未知路段,“1”表示路段暢通,“2”表示道路輕度擁堵,“3”表示道路重度擁堵;平均行程速度是一條道路上的某一區(qū)間路段的平均行程速度。
1.2 基本流程
(1)發(fā)送請求:申請“Web服務API接口”密鑰(Key);拼接HTTP請求URL,申請的Key作為必填參數(shù)一同發(fā)送。
(2)獲取響應:接收HTTP請求返回的數(shù)據(jù)(JSON或XML格式)。
(3)解析內(nèi)容:主要是將爬取出來的數(shù)據(jù)進行解析,存入文件。
(4)保存數(shù)據(jù):保存至數(shù)據(jù)庫。本文將獲得的交通態(tài)勢數(shù)據(jù)保存為CSV類型文件。
1.3 實現(xiàn)方法
本文使用Python編碼爬蟲程序事先采集了成渝環(huán)線高速(重慶段)四周的路況數(shù)據(jù),主要操作步驟如下:
首先,調用Python爬取模塊當中所需的第三方庫,包括requests,pandas,json,time模塊。
其次,采集區(qū)域劃分。本研究區(qū)域為成渝環(huán)線高速(重慶段)的范圍,西南角的經(jīng)緯度坐標為(106.227 817,
29.457 999);東北角的經(jīng)緯度坐標為(106.502 819,29.687 256);但由于高德地圖的矩形采集區(qū)域限制為對角線不超過10公里,故采用網(wǎng)格切分的思想,先將采集區(qū)域進行分割,劃分為幾個較小的采集區(qū)域。本文依據(jù)實際的面積大小,將采集區(qū)域劃分為4*4區(qū)域(如圖1所示),然后使用for... in range對每一個方格區(qū)域,進行循環(huán)依次采集。
最后,將運行的結果數(shù)據(jù)儲存為csv文件,如圖2所示。
c=pd.DataFrame(x,columns=['路名','交通態(tài)勢','速度','經(jīng)度','緯度','編號'])
c.to_csv('C:/Users/Learning/Desktop/交通態(tài)勢/traffic.csv',encoding='utf-8-sig')
2 數(shù)據(jù)預處理
數(shù)據(jù)分析的成功與否,取決于采集的數(shù)據(jù)能否真實反映研究對象的情況,所以數(shù)據(jù)預處理是數(shù)據(jù)分析的重要一環(huán)。存在質量問題的數(shù)據(jù)即缺失值。缺失值主要包括數(shù)據(jù)記錄的整體缺失,或者記錄中的關鍵值字段缺失。處理方式分為兩種,刪除記錄和缺失值插補。
本文對采集到的行程速度進行預處理。如果采集到的交通態(tài)勢指數(shù)或平均行程速度不完整,關鍵路段值缺失,則需要對缺失值處理;處理的方式包括刪除記錄和數(shù)據(jù)插補。采集的數(shù)據(jù)缺失整條路的交通態(tài)勢指數(shù)或平均行程速度值字段,即平均行程速度值字段為None,則刪除該記錄;若采集的數(shù)據(jù)缺失某點數(shù)據(jù),則需要采用數(shù)據(jù)插補的方式。本文采取最近鄰插補的方法,即在記錄中找到與缺失樣本最接近的樣本的平均行程速度進行插補。
3 數(shù)據(jù)可視化
3.1 交通態(tài)勢數(shù)據(jù)地圖化處理
首先,打開ArcMap軟件,將爬取的某一時刻交通態(tài)勢數(shù)據(jù)以XY數(shù)據(jù)的形式導入,XY坐標分別對應經(jīng)度和緯度,坐標系設置為WGS-84,點擊確定之后,即可看到CSV文件成功的轉換為了點要素文件(如圖3)。其次,將該要素導出為SHP文件,接下來是利用點集轉線工具將交通態(tài)勢點轉換為線,將除高速之外的路段數(shù)據(jù)剔除,然后對路況依據(jù)交通態(tài)勢指數(shù)進行標注(如圖3,紅色為嚴重擁堵路段,黃色為較為擁堵路段,綠色為暢通路段)。
通過將四周的交通態(tài)勢數(shù)據(jù)地圖化處理,可以發(fā)現(xiàn)早高峰擁堵程度較為嚴重的區(qū)域有:渝遂互通和西環(huán)立交;晚高峰擁堵程度較為嚴重的區(qū)域有:渝遂互通、西環(huán)立交、白市驛互通和西永互通。接下來利用渝遂互通、西環(huán)立交、白市驛互通和西永互通四個區(qū)域的平均行程速度分布進行驗證。
3.2 平均行程速度分布處理
從高德開放平臺上爬取到的交通態(tài)勢數(shù)據(jù)中的速度數(shù)據(jù),是一條道路上的某一區(qū)間路段的平均行程速度,而互通區(qū)域可能包含多個區(qū)間段,所以需要對平均行程速度進行計算。計算公式為:
其中,表示某條道路某方向的平均行程速度,單位為km/h;D表示區(qū)域內(nèi)道路的分段數(shù);表示某一區(qū)間路段的平均行程速度,單位為km/h。
利用平均行程速度計算公式分別計算互通區(qū)域與環(huán)線高速相交路段早晚高峰的平均行程速度,以下為其中一周數(shù)據(jù)的計算結果(如圖4所示)。
由以上5個高速互通區(qū)域路段一周的平均行程速度可以看出,早高峰時段,西環(huán)立交和渝遂互通的平均行程速度分布在30 km/h~40 km/h,白市驛互通和西永互通的平均行程速度分布在40 km/h~60 km/h;晚高峰時段,渝遂互通、西環(huán)立交、白市驛互通和西永互通的平均行程速度分布在30 km/h~40 km/h;物流園互通在早晚高峰時段的行程速度分布在90 km/h~95 km/h。
4 結論與討論
通過對交通態(tài)勢指數(shù)數(shù)據(jù)進行地圖化處理,篩選出擁堵程度比較嚴重的區(qū)域,并對區(qū)域內(nèi)的成渝環(huán)線高速路段計算平均行程速度,結果發(fā)現(xiàn),渝遂互通、西環(huán)立交、白市驛互通和西永互通早晚高峰的平均行程速度與其他互通區(qū)域相比較低,由此可以得出,成渝環(huán)線高速(重慶境內(nèi))早高峰擁堵嚴重的區(qū)域為渝遂互通和西環(huán)立交,較為擁堵的路段為白市驛互通和西永互通;晚高峰擁堵嚴重的區(qū)域為渝遂互通、西環(huán)立交、白市驛互通和西永互通。
本文以高德交通態(tài)勢數(shù)據(jù)為基礎,主要確定了早晚高峰時段成渝環(huán)線高速在重慶市的擁堵路段分布以及擁堵程度,接下來以文章中提及到的擁堵區(qū)域為中心,重點研究高速公路與城市道路銜接中存在的問題。
參考文獻:
[1]賀席燕,趙航,黃紅良.貴陽市道路擁堵狀態(tài)時空分布規(guī)律研究——基于出租車GPS大數(shù)據(jù)[J].人文地理,2018,33(3):112-120.
[2]盛宇裕,畢碩本,范京津,等.運用交通運行狀況指標分析交通熱點時空模式[J/OL].武漢大學學報(信息科學版):1-11[2021-05-18].
[3]丁濤杰,史殿習,李永謀.基于出租車GPS數(shù)據(jù)的道路平均速度估計方法[J].計算機技術與發(fā)展,2015,25(7):15-19.
[4]胡立偉,楊錦青,何越人,等.城市交通擁塞輻射模型及其對路網(wǎng)服務能力損傷研究[J].中國公路學報,2019,32
(3):145-154.