劉 涵,劉 聰
(蘭州交通大學(xué) 交通運(yùn)輸學(xué)院,甘肅 蘭州 730070)
隨著我國(guó)城市規(guī)模的擴(kuò)大和機(jī)動(dòng)化進(jìn)程的加快,城市內(nèi)部交通需求大幅提高。出租車作為城市公共交通的重要組成部分,在人們?nèi)粘3鲂兄邪l(fā)揮著重要的作用。由于城市客源時(shí)空分布不均衡、出租車間不良競(jìng)爭(zhēng)等因素,出租車尋客存在一定的難度,導(dǎo)致出租車運(yùn)營(yíng)效率低下。目前,我國(guó)大多數(shù)城市出租車都已配備有 GPS 軌跡記錄裝置,以出租車車載GPS數(shù)據(jù)為基礎(chǔ),開(kāi)展了很多研究。
王鄭委[1]通過(guò)Hadoop平臺(tái),可視化并分析了北京市一年的載客熱點(diǎn)區(qū)域。程靜[2]等人分析了出租車出行需求的時(shí)間分布信息,研究了基于GPS軌跡數(shù)據(jù)的出行需求在時(shí)間方面與空間方面的分布特征;陳玲燕[3]通過(guò)計(jì)算成都市居民日出行量等多個(gè)出行需求指標(biāo),研究了不同星期屬性的居民出行高峰時(shí)段分布;鄭林江[4]等提出了一種基于網(wǎng)格密度的Gscan聚類算法,并以實(shí)例分析了出行熱點(diǎn)區(qū)域時(shí)空分布及出行分布規(guī)律;曹梁[5]基于上海市連續(xù)32d記錄無(wú)誤的出租車數(shù)據(jù),探索了乘客出行規(guī)律、城市活躍度、碳排放的計(jì)算以及結(jié)合GPS數(shù)據(jù)的碳減排措施;程智源[6]對(duì)成都地區(qū)出租車軌跡的熱點(diǎn)路徑和區(qū)域進(jìn)行了分析;王明[7]在對(duì)傳統(tǒng)基于密度的DBSCAN算法研究的基礎(chǔ)上,考慮了出租車在道路上行駛時(shí)的距離因素;陳亞玲[8]結(jié)合波爾圖市出租車數(shù)據(jù),對(duì)該市現(xiàn)存公交路線進(jìn)行分析和改進(jìn),使公交線路更方便乘客出行;王建軍[9]研究了基于出租車軌跡挖掘的尋客路線推薦方法;唐雋玉[10]基于出租車GPS數(shù)據(jù),分別研究了出租車供需不平衡時(shí)空分布及其影響因素;劉麗[11]為了提高出租車尋客效益,提出了基于尋客效益指標(biāo)模型的時(shí)空分析方法,對(duì)高效益客源的時(shí)空分布特征進(jìn)行研究;Yazici M[12]等人利用logic回歸模型對(duì)出租車在機(jī)場(chǎng)的下客與搜索乘客的決策進(jìn)行分析;Moreira-Matias L[13]等人提出預(yù)測(cè)短期出租車空間分布的方法,可以短時(shí)間內(nèi)獲取城市的的出租車與乘客的空間分布特性。
本文以蘭州市出租車上下客事件作為研究對(duì)象,基于2021年4月全市出租車車載GPS數(shù)據(jù),采用數(shù)理統(tǒng)計(jì)和核密度分析的方法,從不同角度刻畫(huà)出租車的出行特征,探究出租車上下客時(shí)空變化規(guī)律,為出租車的智能化管理,出租車司機(jī)的巡游策略以及運(yùn)營(yíng)商提供參考依據(jù)。
研究采用蘭州市2021年4月5日至2021年4月11日的出租車GPS軌跡數(shù)據(jù)作為研究對(duì)象,數(shù)據(jù)文件采用csv格式存儲(chǔ),每日文件大小約4G,每30 s傳一次數(shù)據(jù),以表的形式進(jìn)行存儲(chǔ)。
受到數(shù)據(jù)采集設(shè)備故障、信號(hào)不良或者惡劣天氣的影響,出租車的GPS數(shù)據(jù)采集會(huì)存在異常數(shù)據(jù)。為了保證數(shù)據(jù)分析和后續(xù)處理的有效性和準(zhǔn)確性,有必要對(duì)收集到的出租車GPS軌跡數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理。
進(jìn)行數(shù)據(jù)質(zhì)量控制后,采用比較成熟的幾何分析法,將出租車GPS數(shù)據(jù)進(jìn)行地圖匹配。依據(jù)出租車數(shù)據(jù)中的STATUS(載客狀態(tài))屬性值對(duì)于出租車的OD進(jìn)行提取,當(dāng)STATUS的值由0變成1時(shí),表示乘客上車,當(dāng)STATUS的值由1變成0時(shí),表示乘客下車。同一個(gè)出租車的狀態(tài)變化為一次乘客乘坐出租車出行的乘客OD。
將全天的時(shí)間段分為24個(gè)間隔,以每個(gè)訂單的開(kāi)始時(shí)間作為基準(zhǔn)時(shí)間,每個(gè)小時(shí)進(jìn)行一次統(tǒng)計(jì),結(jié)果如圖1所示。橫坐標(biāo)“1”對(duì)應(yīng)的是“0∶00~1∶00”內(nèi)的需求量,依次類推??梢钥闯?工作日的出租車出行需求時(shí)間變化趨勢(shì)幾乎一致,且每個(gè)時(shí)間段的訂單量大小接近,非工作日的變化趨勢(shì)和工作日有一些區(qū)別,在工作日。0∶00~5∶00的客源量持續(xù)減少,在6∶00達(dá)到最低值。出租車的出行需求出現(xiàn)了三次高峰,由于早上居民上班上學(xué)的需求,居民出行量比較大,出行需求量在6∶00后急劇增加,7∶00~9∶00達(dá)到了第一個(gè)高峰,即出行早高峰,這部分出行量占到全天出行量的20.23%。在10∶00~14∶00之間出租車需求量較為穩(wěn)定,在17∶00~19∶00之間,由于下班、放學(xué)等原因,需求達(dá)到另一個(gè)高峰,即出行需求晚高峰。非工作日呈現(xiàn)不同的特征,凌晨訂單量比工作日的訂單多,居民在非工作日夜間出行的活動(dòng)較多,此時(shí)公交地鐵等公共的交通設(shè)施已經(jīng)停運(yùn),出租車需求較大。非工作日因?yàn)闆](méi)有了必須出門(mén)的剛性需求,總體出租車需求量較工作日減少,出行高峰也變得相對(duì)平穩(wěn)。
圖1 一周內(nèi)各時(shí)段上下客量分布
將出租車訂單量簡(jiǎn)化為工作日和非工作日,以便更加清晰的進(jìn)行分析工作日和非工作日蘭州市居民出租車出行需求的區(qū)別。使用周二到周五各時(shí)段的平均值作為工作日各時(shí)段的出租車訂單量,如圖2所示。
圖2 工作日與休息日各時(shí)段上下客量分布
出租車訂單時(shí)長(zhǎng)時(shí)間分布在0~140 min之間,大部分訂單載客時(shí)間10~20 min之間。展現(xiàn)每個(gè)時(shí)間段的出租車載客時(shí)長(zhǎng),繪制工作日和非工作日的分時(shí)段載客時(shí)長(zhǎng),如圖3所示。
圖3 出租車載客時(shí)長(zhǎng)分時(shí)段統(tǒng)計(jì)
由圖4可以看出,平均載客時(shí)長(zhǎng)在工作日和非工作日呈現(xiàn)不同的特征。工作日不同時(shí)段的平均載客時(shí)長(zhǎng)的變化幅度較大,高峰分布比較明顯,在7∶00~8∶00達(dá)到第一個(gè)高峰,中間較為平穩(wěn),在17∶00~18∶00達(dá)到了另一個(gè)高峰。非工作日平均載客時(shí)長(zhǎng)的高峰和非工作日不同,在早上六點(diǎn)之后開(kāi)始下降,7∶00到8∶00的平均載客時(shí)長(zhǎng)呈現(xiàn)低谷,八點(diǎn)后隨著時(shí)間增加逐漸增加,晚上七點(diǎn)后呈現(xiàn)下降的趨勢(shì)。為了更清晰的描述載客時(shí)長(zhǎng)分布,對(duì)于單次載客時(shí)長(zhǎng)的比例做統(tǒng)計(jì)分析,如圖4所示。
圖4 出租車載客時(shí)間分布
由圖4可得,從時(shí)間分布來(lái)看,5~10 min的出行占26%左右,在出行時(shí)間中占據(jù)最大比例,30 min以內(nèi)訂單累計(jì)占據(jù)90%,隨著載客時(shí)長(zhǎng)的增加,載客量逐漸減少,載客時(shí)長(zhǎng)大于60 min的訂單僅占1.49%,符合出租車為居民提供個(gè)性化的服務(wù)—適合短距離出行。
由圖5可以看出,無(wú)論是工作日和非工作日,候客時(shí)長(zhǎng)特征幾乎一致,在1∶00~2∶00候客時(shí)長(zhǎng)達(dá)到高峰,最高平均候客時(shí)長(zhǎng)達(dá)到67 min左右,這個(gè)時(shí)間居民幾乎都在休息,出行需求較低,出租車供大于求,在三點(diǎn)后平均候客時(shí)長(zhǎng)逐漸下降,八點(diǎn)達(dá)到了低谷,平均候客時(shí)長(zhǎng)6~10 min左右,8∶00到晚上24∶00趨于平穩(wěn)。繪制不同候客時(shí)長(zhǎng)的比例,深入分析出租車的運(yùn)營(yíng)特征,如圖6所示。
圖5 出租車平均候客時(shí)長(zhǎng)分布
圖6 出租車候客時(shí)間分布
蘭州市出租車有50.7%能夠在10~20 min內(nèi)尋找到乘客,但僅有28.25%的司機(jī)能夠在10 min內(nèi)找到乘客,有16.04%在20 min以上才能尋找到乘客。由以上數(shù)據(jù)可知,蘭州市出租車的尋客時(shí)間較長(zhǎng),出租車司機(jī)在尋客方面耗費(fèi)成本較多,有待進(jìn)一步的通過(guò)策略降低候客時(shí)長(zhǎng),提高司機(jī)收益。
居民出行需求和城市的區(qū)域結(jié)構(gòu)以及功能緊密相關(guān)。通常情況下,在一定的時(shí)間段內(nèi),一定區(qū)域內(nèi)的居民出行目的有著相似性。采用核密度分析方法研究空間分布特征。對(duì)于空間區(qū)域中的任一點(diǎn)S,其核密度估計(jì)值是其鄰域內(nèi)所有點(diǎn)的核函數(shù)對(duì)點(diǎn)S的貢獻(xiàn)之和,核密度計(jì)算公式如式(1)所示。
(1)
本文選取了蘭州市2021年4月6日和2021年4月11日的出租車軌跡全天數(shù)據(jù)作為研究對(duì)象,分別對(duì)工作日和非工作日出租車需求空間分布進(jìn)行分析。
可知,工作日和非工作日的出租車出行需求在分布上大致相似,但其出行需求量存在著較大差異。
選取出行高峰時(shí)間段7∶00~9∶00、12∶00~14∶00及17∶00~19∶00,對(duì)不同高峰時(shí)間段出行需求進(jìn)行對(duì)比分析,根據(jù)上車次數(shù)分為9個(gè)量級(jí)。可以得出,在工作日早高峰、午高峰晚高峰這三個(gè)時(shí)間段中,出行需求有所差距。出行需求分布規(guī)律如下:在早高峰出租車需求量最大,西固區(qū)主要集中在陳官營(yíng)地鐵站和西固村附近,安寧區(qū)集中在海關(guān)地鐵站和安寧區(qū)體育館附近,七里河區(qū)和城關(guān)區(qū)需求熱點(diǎn)集中在西站什字地鐵站和西關(guān)站附近,甘肅省公共資源交易局附近的出租車需求也較大。這段時(shí)間因?yàn)榫用裆习嗷蛘呱蠈W(xué)的剛性需求,出行量大,出租車需求高。午高峰和晚高峰的出行需求與早高峰的熱點(diǎn)較為類似,但更為分散。
非工作日在早高峰、午高峰、晚高峰著三個(gè)時(shí)間段中,出行需求和工作日出行高峰較為相似,出行范圍更大,但各個(gè)熱點(diǎn)的出租車出行需求量有所減少。西固區(qū)的乘客上車點(diǎn)主要集中在陳官營(yíng)和西固村,安寧區(qū)主要集中在安寧科教城,七里河區(qū)的乘客上客點(diǎn)是以蘭州西站什字為中心向外延伸,西站什字和蘭州西站是不同高峰都具有的熱點(diǎn)區(qū)域,城關(guān)區(qū)的上客點(diǎn)較多且比較分散,主要集中在蘭州站、五里埔、西關(guān)附近。
對(duì)不同高峰時(shí)間段的2 h出行需求進(jìn)行對(duì)比分析,根據(jù)上車次數(shù)分為9個(gè)量級(jí)。
可以看出,工作日以西站什字為中心的熱點(diǎn)區(qū)域早高峰出租車目的地最高,這個(gè)區(qū)域早高峰的出租車需求也較高,出租車司機(jī)可以考慮在此范圍內(nèi)尋找乘客;午高峰安寧區(qū)的出租車目的地較其它兩個(gè)高峰顯著減少,晚高峰的出租車出行目的地在城關(guān)區(qū)分散在各個(gè)區(qū)域行政區(qū)劃中,城關(guān)區(qū)的商業(yè)經(jīng)濟(jì)比較發(fā)達(dá),出租車出行交通量也較多。
非工作日在安寧區(qū)乘客下客點(diǎn)主要分布在居民區(qū)、高校和商業(yè)街為主的區(qū)域,尤其是費(fèi)家營(yíng)和金牛街商業(yè)廣場(chǎng)的乘客下客點(diǎn)較多,符合居民利用周末娛樂(lè)休息的特性;七里河區(qū)以西站什字附近的下客點(diǎn)較多;城關(guān)區(qū)以西關(guān)十字、解放門(mén)立交橋以及雁灘聚焦了較多出租車下客點(diǎn);城關(guān)區(qū)的下客點(diǎn)在數(shù)量上較其它三個(gè)區(qū)多。工作日較工作日增加了一些娛樂(lè)區(qū)域,如仁壽山、金城公園等。
OD分布主要可以反映人們?cè)诓煌瑓^(qū)域之間的遷移狀態(tài),在一定程度上說(shuō)明人們出行的情況,本節(jié)前兩章主要將出租車的需求地和目的地分別進(jìn)行研究。在本節(jié),將出租車出行的O和D進(jìn)行結(jié)合,分析蘭州市的各個(gè)行政區(qū)的客流之間的遷移情況。
蘭州市出租車需求點(diǎn)和目的地主要集中在安寧區(qū)、西固區(qū)、七里河區(qū)和城關(guān)區(qū),只有少部分集中在其它區(qū)域,根據(jù)統(tǒng)計(jì)得到主要四個(gè)區(qū)的出租車需求點(diǎn)占據(jù)總數(shù)據(jù)的99.38%,對(duì)于OD矩陣構(gòu)建僅考慮這些區(qū)域的客流遷移量,使用一天的數(shù)據(jù)構(gòu)建出行分布,如表1所示。
表1 居民出租車出行OD矩陣表單位:人次
可見(jiàn),在城關(guān)區(qū)內(nèi)出行的居民明顯比其它區(qū)域的人數(shù)要多。其中,各個(gè)區(qū)到達(dá)西固區(qū)的出租車較少,各個(gè)區(qū)到達(dá)城關(guān)區(qū)的出租車最多,數(shù)量最多的是從城關(guān)區(qū)到達(dá)城關(guān)區(qū)??傮w來(lái)看,出租車出行的目的地更加傾向于其原本所在的城區(qū)內(nèi)。
本文基于蘭州市的出租車GPS軌跡數(shù)據(jù)以城市出租車上下客事件為研究對(duì)象,使用數(shù)理統(tǒng)計(jì)和核密度分析的方法對(duì)上下客事件進(jìn)行時(shí)間和空間特征分析,得出出租車上下客事件在不同時(shí)間段以及工作日和非工作日的不同規(guī)律。出租車的上客量在一天中存在著明顯的早晚高峰,工作日和休息日也存在著較大差異。從時(shí)間分布來(lái)看,5~10 min的出行占26%左右,90%的訂單在30 min以內(nèi)完成,符合出租車為居民提供個(gè)性化的服務(wù)-適合短距離出行。蘭州市出租車有28.25%的司機(jī)能夠在10 min內(nèi)找到乘客,司機(jī)尋客時(shí)間較長(zhǎng)。與工作日不同的是,非工作日的早高峰出行需求量最低,午高峰需求量最高。工作日與休息日主要出行目的地位于城市商業(yè)中心西站什字以及西關(guān)附近、大型醫(yī)院、商務(wù)中心以及重要交通樞紐處。各個(gè)地鐵站附近也有大量的出租車乘坐需求,其它上下客熱點(diǎn)集中在高校附近,在非工作日居民的出行目的地增加了旅游景區(qū),如仁壽山公園、金城公園等。分析蘭州市各個(gè)行政區(qū)之間的遷移,發(fā)現(xiàn)出租車出行的目的地傾向于其原本所在的城區(qū)內(nèi)。研究結(jié)論可為蘭州市城市交通管理與優(yōu)化出租車運(yùn)營(yíng)管理策略提供科學(xué)依據(jù),也可為蘭州市出租車司機(jī)巡游提供一定的參考。
本文研究的是出租車出行的時(shí)空分布特征,城市公共交通中還有地鐵、公交車等方式,后續(xù)研究可加如更多的數(shù)據(jù),更深層次的全面挖掘城市居民出行特征,指導(dǎo)公眾出行,緩解城市交通壓力。