馬新露 程明遠(yuǎn)
(重慶交通大學(xué)交通運(yùn)輸學(xué)院,重慶 400074)
居民的出行活動(dòng)特征與城市空間發(fā)展密切相關(guān),探尋居民出行的時(shí)空特征、內(nèi)在的機(jī)制,對(duì)城市管理與規(guī)劃具有重要意義[1]。高鐵樞紐商圈是城市新興的地域?qū)傩?,隨著GPS定位技術(shù)的不斷發(fā)展,居民出行數(shù)據(jù)的獲取越來越迅速、客觀,各行業(yè)各領(lǐng)域積累了大量的出行軌跡數(shù)據(jù),這些軌跡數(shù)據(jù)中蘊(yùn)含著人類行為的時(shí)空分布模式[2]。出租車作為城市居民出行中最方便快捷的公共交通工具,在其運(yùn)營(yíng)過程中產(chǎn)生了海量的軌跡數(shù)據(jù)[3]?,F(xiàn)階段對(duì)出租車軌跡數(shù)據(jù)的挖掘主要集中在居民出行特征分析、人群移動(dòng)規(guī)律發(fā)展以及社會(huì)活動(dòng)模式挖掘三個(gè)方面,其中,居民出行特征分析是人群移動(dòng)規(guī)律發(fā)現(xiàn)和社會(huì)活動(dòng)模式挖掘的基礎(chǔ)[4]。出租車出行隨機(jī)性強(qiáng),不受線路約束,乘客涵蓋各個(gè)年齡段、各個(gè)階層的群體。對(duì)于沒有軌道交通的城市空間,出租車換乘概率相對(duì)較小,上下車點(diǎn)是居民真實(shí)的出發(fā)地與目的地。因此,大規(guī)模的出租車GPS上下車點(diǎn)(origin-destination,OD)是研究居民活動(dòng)情況的理想數(shù)據(jù)源。本文主要利用出租車訂單OD數(shù)據(jù),對(duì)出租車出行活動(dòng)的時(shí)空特征進(jìn)行分析,研究出租車在高鐵樞紐商圈區(qū)域內(nèi)的時(shí)間和空間的運(yùn)營(yíng)特征,并結(jié)合高鐵班次數(shù)據(jù)以及天氣數(shù)據(jù),進(jìn)一步解釋出租車需求量與各個(gè)影響因素之間的關(guān)系。
研究區(qū)域?yàn)橹貞c市沙坪壩站以及三峽廣場(chǎng)構(gòu)成的高鐵樞紐商圈。數(shù)據(jù)來源為2020年6~8月重慶市出租車運(yùn)營(yíng)的訂單數(shù)據(jù),每輛出租車一次完整的載客行為對(duì)應(yīng)一條數(shù)據(jù),當(dāng)乘客下車時(shí)將單筆訂單的數(shù)據(jù)記錄上傳至終端。
出租車訂單數(shù)據(jù)包含了出租車完成一筆訂單后,設(shè)備終端上傳的數(shù)據(jù),包含了9個(gè)有效字段,每個(gè)月的數(shù)據(jù)大小為2 G左右,共包含全城每個(gè)月1 300多萬(wàn)條數(shù)據(jù),主要包含字段:車輛車牌號(hào)、乘客上車經(jīng)緯度、乘客下車經(jīng)緯度、乘客上下車時(shí)間、訂單行駛里程、訂單最終價(jià)格。
原始出租車GPS數(shù)據(jù)中由于GPS設(shè)備老化、GPS信號(hào)被屏蔽等因素,導(dǎo)致設(shè)備不能返回GPS數(shù)據(jù)或返回的GPS數(shù)據(jù)有誤。根據(jù)數(shù)據(jù)真實(shí)情況,對(duì)訂單數(shù)據(jù)的處理主要由以下步驟組成:(1)刪除經(jīng)緯度異常,GPS記錄不在區(qū)域內(nèi)數(shù)據(jù);(2)根據(jù)完整字段的格式將不完整部分補(bǔ)充字段結(jié)構(gòu)不完整數(shù)據(jù);(3)刪除一條數(shù)據(jù)中部分字段為0值或空值的數(shù)據(jù);(4)只留下一條有用數(shù)據(jù),刪除其余重復(fù)數(shù)據(jù)。
選取2020年6~8月期間出租車訂單數(shù)據(jù)作為研究數(shù)據(jù),其中包括工作日58 d、周末22 d以及節(jié)假日3 d。
將三個(gè)場(chǎng)景的數(shù)據(jù)分別求取每小時(shí)時(shí)間段的平均值,不同場(chǎng)景需求量如圖1所示。
圖1 不同場(chǎng)景需求量
由圖1可知,三場(chǎng)景在不同時(shí)間段的需求量皆不同,尤其是節(jié)假日需求量更特殊,原因可能是節(jié)假日期間居民對(duì)于高鐵樞紐站以及商圈的需求在時(shí)間上更分散,沒有規(guī)律性。綜上所述,三個(gè)場(chǎng)景出租車在每個(gè)時(shí)段的需求量均不同,因此,不同場(chǎng)景對(duì)于出租車每小時(shí)的需求量均存在差異。
出租車需求量的周期性主要表現(xiàn)在當(dāng)日出租車小時(shí)需求量與前n周(n=1,2,3,...,n)的需求量之間的關(guān)系,選取6月18日(周四)為研究日,對(duì)應(yīng)的前一周相同星期屬性(6月11日)和前兩周相同星期屬性(6月4日)的數(shù)據(jù)為對(duì)應(yīng),如圖2所示。
圖2 相同星期屬性
出租車的需求量與前一周及前兩周同星期屬性的需求量有較強(qiáng)的關(guān)聯(lián)性,部分時(shí)段相差較大,但變化趨勢(shì)相似,因此,前n周的相同屬性的需求量與當(dāng)日需求量之間的聯(lián)系也較強(qiáng)烈。
每天需求量如圖3所示。
圖3 每天需求量
周一~周五的需求量整體變化曲線較為相似,在8:00~10:00時(shí)間段內(nèi)產(chǎn)生區(qū)別,但整體走勢(shì)類似。周六和周日的出行需求不同,在大部分時(shí)間出行需求與周中相似的情況下,同樣在8:00~10:00時(shí)間段內(nèi)需求量相比周中形成了一個(gè)波峰的形勢(shì),此現(xiàn)象體現(xiàn)了周末兩天居民購(gòu)物或高鐵出行,早上階段對(duì)出租車的需求均明顯大于周中的現(xiàn)象。
出租車的需求量不僅與時(shí)間序列相關(guān),與當(dāng)時(shí)區(qū)域所存在的出租車量也有關(guān)系,因此,可以使用出入特征表達(dá)此性質(zhì)。出入差(Xgap)是用來表達(dá)某一時(shí)段研究區(qū)域內(nèi)出租車到達(dá)(Xin)與出發(fā)(Xout)情況的量值:
式中:Xout——區(qū)域內(nèi)每小時(shí)出租車的出發(fā)量;Xin——研究區(qū)域內(nèi)每小時(shí)出租車的到達(dá)量。Xgap越高,表明當(dāng)前時(shí)段內(nèi)該地區(qū)越傾向于出租出行的目的地,越低則更傾向于出發(fā)地,接近0表示地區(qū)出租車的流入流出情況接近平衡。
路段車速是體現(xiàn)路段擁堵程度的重要指標(biāo)[5],根據(jù)交通工程相關(guān)理論,分別按照85%位、50%位、30%位、15%位車速對(duì)道路擁堵狀況進(jìn)行確定[6]。越擁堵的路段出租車的客運(yùn)量越低,車速可以直觀體現(xiàn)租車的運(yùn)營(yíng)狀態(tài)。由訂單數(shù)據(jù)行駛里程字段與出租車上下客時(shí)間得到的速度為行程車速,與出租車GPS數(shù)據(jù)包含的瞬時(shí)速度有所區(qū)別。區(qū)域小時(shí)平均行程速度可以宏觀展示整個(gè)區(qū)域的交通狀態(tài),交通狀態(tài)對(duì)居民選擇出租車出行具有重要的作用。
通過對(duì)研究區(qū)域、速度對(duì)應(yīng)擁堵狀況的確定,取2020年6~8月區(qū)域內(nèi)行駛里程小于4 km的速度,即85%位、50%位、30%位、15%位的車速為37、26.0、22.0、18.0 km/h,通過對(duì)每小時(shí)平均行程速度的區(qū)間劃分進(jìn)行分級(jí)。
出租車出行需求代表了乘客對(duì)以出租車為代表的小型公共交通的需求,結(jié)合上文所述,得到最終與研究區(qū)域內(nèi)出租車需求量相關(guān)的時(shí)空特征分別為:(1)時(shí)間段;(2)前1 h需求量;(3)前2 h需求量;(4)前1 h出入差;(5)前1 h區(qū)域交通狀態(tài);(6)場(chǎng)景屬性。
通過數(shù)據(jù)標(biāo)準(zhǔn)化組成影響因素指標(biāo),本文使用XgBoost重要度分析算法對(duì)指標(biāo)的重要程度進(jìn)行排序,如圖4所示。
圖4 指標(biāo)重要度排序
居民選擇出租車出行是為了減少工作及生活出行的煩瑣程度,但交通狀況的擁堵對(duì)居民選擇出租車出行具有決定性影響,擁堵狀態(tài)下幾乎不會(huì)選擇乘坐出租車出行,因此,交通狀態(tài)是決定出租車需求量的主要因素。其次,區(qū)域內(nèi)出租車的出入量對(duì)于出租車需求的影響,區(qū)域內(nèi)出租車出入量可直觀反映區(qū)域內(nèi)出租車的時(shí)段保有量,出入量可體現(xiàn)當(dāng)前區(qū)域的出租車狀態(tài),如出租車大量駛?cè)?、出租車大量駛出或出入平衡狀態(tài),對(duì)出租車需求的影響較大。時(shí)間序列對(duì)出租車需求量同樣屬于較重要的影響因素,因此,前兩個(gè)時(shí)間段的需求量在重要度分析中占據(jù)重要的地位。出租車需求量隨機(jī)性較強(qiáng),不同于高速公路車輛出行等現(xiàn)象,因此,時(shí)段、星期屬性為排列最后兩位的重要因素。
本文主要針對(duì)高鐵樞紐商圈進(jìn)行了時(shí)間及空間的特征分析,并使用XgBoost對(duì)時(shí)空特征指標(biāo)進(jìn)行了重要度排序,分析了對(duì)高鐵樞紐商圈出租車需求影響因素較靠前的指標(biāo),為高鐵樞紐商圈的建設(shè)、出租車對(duì)高鐵樞紐商圈的選型提供了理論依據(jù)。