魯鳴鳴,鄭 林
中南大學(xué) 信息科學(xué)與工程學(xué)院,長沙 410083
隨著城市交通系統(tǒng)的蓬勃發(fā)展和多樣化升級(jí),城市居民的日常出行越來越方便。與此同時(shí),城市范圍內(nèi)的路徑?jīng)Q策成為一個(gè)熱門的研究問題。出租車和私家車是人們最為熟悉的交通設(shè)備,城市道路上的路徑?jīng)Q策問題已經(jīng)較為成熟,現(xiàn)有的地圖服務(wù)都能夠給出最快路徑,最短距離路徑甚至可以手動(dòng)定義途經(jīng)點(diǎn)等不同的路徑?jīng)Q策方案。但是隨著私家車的增多,道路的擴(kuò)建跟不上車輛數(shù)的擴(kuò)張,城市道路變得越來越擁擠,高峰期時(shí)段的擁堵越為明顯,出租車的快捷性大打折扣。Wang等[1]利用乘客出行需求和城市道路網(wǎng)絡(luò)信息分析了每條道路在不同時(shí)段的擁堵情況,并在理論上驗(yàn)證了在特定時(shí)間段對(duì)道路進(jìn)行限速或增加道路容量能夠有效降低道路擁堵情況,同時(shí)減少車輛行駛時(shí)間。另外,由于出租車的價(jià)格較高,乘客出于經(jīng)濟(jì)的考慮經(jīng)常會(huì)放棄乘坐出租車出行。公交車是一種最為傳統(tǒng)的交通工具,價(jià)格低廉,范圍廣闊使其成為人們常用的出行方式,但是同樣受到道路擁堵的困擾。此外公交車的運(yùn)行線路和站點(diǎn)固定,難以完全符合乘客的出行線路。同時(shí)其時(shí)刻表的實(shí)際運(yùn)行情況往往波動(dòng)較大,經(jīng)常給乘客帶來較長的等車或乘車時(shí)間,造成延誤。
隨著城市地鐵的發(fā)展,越來越多的人選擇地鐵作為自己的主要出行方式。地鐵方便迅速,運(yùn)行時(shí)間也較為穩(wěn)定,但是不能夠覆蓋城市范圍內(nèi)的各個(gè)角落,不適合在乘客起點(diǎn)或終點(diǎn)離車站較遠(yuǎn)時(shí)的情況下使用。以上海為例,在上海南部有超過1 500 km2范圍沒有覆蓋地鐵網(wǎng)絡(luò),這個(gè)區(qū)域占上海總面積的1/4左右。出租車能夠覆蓋廣泛的城市范圍,但是價(jià)格高,容易遇上擁堵,特別是在上下班高峰期時(shí)段。如果同時(shí)結(jié)合兩者,不僅僅達(dá)到了廣泛的覆蓋范圍,也能夠減少用戶的出行時(shí)間和出行費(fèi)用。雖然現(xiàn)有的線路規(guī)劃系統(tǒng)也提供地鐵和公交車混合的路徑?jīng)Q策服務(wù),但是由于公交車線路的局限性導(dǎo)致乘客往往需要經(jīng)過多次換乘或是步行一定的距離才能到達(dá)最終目的地。另外由于缺乏對(duì)數(shù)據(jù)的詳細(xì)分析,現(xiàn)有的方案只是給出一個(gè)籠統(tǒng)的與計(jì)劃出行時(shí)間無關(guān)的路徑規(guī)劃方案。實(shí)際上,公交車的到站時(shí)間難以預(yù)估,道路上的行駛時(shí)間也容易受到突發(fā)事件的影響,往往會(huì)與預(yù)計(jì)的時(shí)間有較大的偏差,造成乘客旅行的延誤和較差的出行體驗(yàn)。
為此,本文提出了一個(gè)結(jié)合出租車和地鐵的出行方案,旨在提供更加精確的線路查詢服務(wù),并根據(jù)出行時(shí)刻的不同提供差異化的服務(wù)?;谙鄬?duì)穩(wěn)定的地鐵列車調(diào)度方案和出租車的分布規(guī)律,地鐵和出租車的混合方案能夠?yàn)槌丝吞岣吒鼮榭焖?、精?zhǔn)和經(jīng)濟(jì)的服務(wù),在為乘客節(jié)省出行費(fèi)用的同時(shí)降低城市總體交通資源的消耗。
在出租車的線路規(guī)劃方面現(xiàn)有的工具往往只能夠給出一個(gè)與計(jì)劃出行時(shí)間無關(guān)的預(yù)計(jì)行駛時(shí)間或價(jià)格,而實(shí)際上由于城市居民的在一天不同時(shí)段有著不同活動(dòng)規(guī)律,某些路段在高峰時(shí)段很容易擁堵,造成行駛時(shí)間的大幅度增長。Balan等[2]利用出租車歷史數(shù)據(jù)給出了不同時(shí)刻下的出租車價(jià)格和時(shí)間的計(jì)算方法,并對(duì)該方法進(jìn)行了優(yōu)化,建立了一個(gè)能夠在現(xiàn)實(shí)生活中使用的實(shí)時(shí)出租車服務(wù)系統(tǒng)。Wang等人[3]提出了一種在稀疏的車輛軌跡數(shù)據(jù)中提取不同道路在不同時(shí)間槽下所需的行駛時(shí)間的方法,能夠較為準(zhǔn)確和有效地預(yù)估乘客的出行時(shí)間。此外,文獻(xiàn)[4-5]也提出了一種利用歷史移動(dòng)軌跡建立語法生成樹的方式可以產(chǎn)生大量新的移動(dòng)軌跡,增加數(shù)據(jù)集的密度。Thiagarajan[6]提出可以利用乘客手機(jī)估計(jì)實(shí)時(shí)的道路行駛時(shí)間。雖然出租車行駛時(shí)間能夠較為準(zhǔn)確地估計(jì),但實(shí)際上乘客出行還應(yīng)該包含一個(gè)等車時(shí)間,即乘客等待一輛可用出租車的時(shí)間,但是由于城市范圍內(nèi)出租車的分布不均勻,不同區(qū)域的出租車數(shù)量有較大的不平衡,導(dǎo)致冷門區(qū)域的乘客較長的等車時(shí)間[7]?,F(xiàn)有的方法往往是從出租車司機(jī)的角度出發(fā),幫助其快速地找到下一個(gè)乘客,或是單純地指導(dǎo)乘客如何尋找出租車[8-9],并沒有一種結(jié)合乘客等車階段和出租車行車階段的出行規(guī)劃方案。
現(xiàn)有的城市范圍內(nèi)的線路規(guī)劃服務(wù)往往是針對(duì)單一的交通工具,在多元交通工具的線路規(guī)劃方面現(xiàn)有的線路查詢服務(wù)往往只提供地鐵和公交車混合的方式。公交車的負(fù)載情況和乘客的出行時(shí)間受到公交車線路和地鐵線路的直接影響[10],一個(gè)設(shè)計(jì)優(yōu)良的城市地鐵系統(tǒng)和公交車系統(tǒng)不僅能夠提高乘客的出行體驗(yàn)也能夠提升社會(huì)經(jīng)濟(jì)效益。崔愿等[11]將乘客換乘距離和公交車排隊(duì)時(shí)間作為優(yōu)化因素建立了地鐵和公交車接駁的線路優(yōu)化模型,能夠提高公共交通服務(wù)水平和車輛的運(yùn)行效率。熊杰[12]以及季運(yùn)文[13]則從公交車線路的規(guī)劃方面優(yōu)化乘客的出行時(shí)間。雖然地鐵與公交車接駁的出行方式能夠達(dá)到和地鐵與出租車接駁的出行方式類似的特點(diǎn),但是由于公交車線路的限制導(dǎo)致其靈活性較低,難以完全符合的出行線路,可能需要乘客經(jīng)過較長的步行距離才能搭乘公交車或到達(dá)最終目的地,給乘客出行帶來較大的不便。另外公交車的發(fā)車頻率相對(duì)較低,到站時(shí)間難以估計(jì)導(dǎo)致乘客較長的等車時(shí)間或乘車時(shí)間,最終造成旅途的延誤,不適用于時(shí)間要求較為嚴(yán)格的出行情況。雖然Zhou[14]提出利用城市居民的手機(jī)感知技術(shù)可以較為精準(zhǔn)地預(yù)測(cè)公交車的等車時(shí)間,但是需要較大規(guī)模量的志愿者參與,目前難以在現(xiàn)實(shí)中運(yùn)用。
本文使用的出租車數(shù)據(jù)是上海2015年4月的出租車GPS數(shù)據(jù),每天有超過13 000輛出租車參與統(tǒng)計(jì),產(chǎn)生的數(shù)據(jù)文件約為10 GB。每輛車每隔10 s產(chǎn)生一條數(shù)據(jù),主要包括車牌號(hào)、GPS坐標(biāo)、時(shí)間、是否載客、速度和方向等信息。其中,GPS按時(shí)間構(gòu)成的序列數(shù)據(jù)構(gòu)成了出租車的出行軌跡。
地鐵數(shù)據(jù)集是上海居民2015年4月份的城市一卡通的所有刷卡數(shù)據(jù)和地鐵站信息,乘客每次進(jìn)站或出站均產(chǎn)生一條記錄,每條記錄包括卡ID,打卡時(shí)間,打卡地點(diǎn)等信息。上海地鐵總共有289個(gè)車站,將每天同一張卡的刷卡記錄按時(shí)間排序,并將前后兩條刷卡記錄合并得到一個(gè)出行OD,同時(shí)去除誤差數(shù)據(jù)和異常數(shù)據(jù)(獨(dú)立的單條記錄和OD時(shí)間明顯過長或過短的記錄),最終得到每個(gè)工作日的地鐵出行OD總數(shù)如圖1所示。可以看出上海地鐵網(wǎng)絡(luò)在工作日中每天的人流量較為穩(wěn)定,維持在450萬左右,人流量在每周五有小幅度的增長。
圖1 地鐵OD量
3.2.1 出租車乘客上下車點(diǎn)分析
圖2和圖3分別描繪了出租車乘客上車點(diǎn)和下車點(diǎn)的分布,可以看到兩者的分布非常相似,主要集中在城市中心區(qū)域,同時(shí)在城市外圍區(qū)域也有廣泛的分布。但是這些分布并不是隨機(jī)的,而是與地鐵車站的分布有著密切的關(guān)聯(lián)。
圖2 乘客上車點(diǎn)熱力圖
圖3 乘客下車點(diǎn)熱力圖
圖4 反映出出租車乘客的上車點(diǎn)或下車點(diǎn)隨著最近地鐵站的距離的累積分布概率,可以看到有接近1/3的乘客選擇在地鐵站附近500 m的范圍內(nèi)上車或下車,也就是說,許多乘客的上車點(diǎn)或下車點(diǎn)分布在地鐵站附近,而幾乎沒有乘客同時(shí)在地鐵站附近上車和下車。上述現(xiàn)象還說明了地鐵站附近的可用車輛比較多,考慮到還有經(jīng)過地鐵站的車輛并沒有被統(tǒng)計(jì)在其中,這表明乘客在地鐵站附近搭乘上出租車的概率其實(shí)比較大,等車的時(shí)間也會(huì)比較短。
圖4 乘客上下車點(diǎn)隨最近地鐵站距離變化的累積概率
3.2.2 出行時(shí)間可變性分析
(1)地鐵出行時(shí)間
地鐵出行時(shí)間主要由起始站點(diǎn)和目的站點(diǎn)的距離決定,但同時(shí)也受當(dāng)前時(shí)刻的影響。圖5和圖6分別描繪了從莘莊到上海南站和從南浦大橋到人民廣場(chǎng)的乘坐地鐵所需出行時(shí)間在一天不同時(shí)間段的變化情況。由于高峰時(shí)段列車發(fā)車頻率的增加造成兩者的出行時(shí)間在高峰期都有所降低,但中午時(shí)段和高峰時(shí)段的出行時(shí)間差距均不到3 min。實(shí)際上,由于地鐵列車的高發(fā)車頻率和穩(wěn)定的行駛時(shí)間,超過70%的站點(diǎn)之間的地鐵平均出行時(shí)間波動(dòng)在8 min以下。
圖5 平均出行時(shí)間(莘莊-上海南站)
圖6 平均出行時(shí)間(南浦大橋-人民廣場(chǎng))
(2)出租車行駛時(shí)間
圖7描繪了一天中城市出租出軌跡的熱力分布圖,從圖中可以看出上海的出租車分布成輻射狀,城市中心區(qū)域車輛非常多,區(qū)域車流量隨著離中心點(diǎn)的距離增大而減少,邊緣區(qū)域的車輛相對(duì)較少,車流量主要分布在城市環(huán)線等主干道路。如果出租車的線路需要通過中心區(qū)域等人流量較大的道路,很容易造成堵車現(xiàn)象,特別是在上下班高峰期。而城市邊緣區(qū)域的道路通暢,一般不會(huì)造成堵車現(xiàn)象。
圖7 出租車分布熱力圖
圖8 出租車行駛時(shí)間的變化
圖9 行車線路圖
圖8 說明了寶山區(qū)山產(chǎn)路到普陀區(qū)中山北路閔行區(qū)建設(shè)村之間的出租車行駛時(shí)間在一天中不同時(shí)間段的變化曲線,圖9是通過百度地圖查詢的推薦行車路線。從圖中可以看出每個(gè)小時(shí)內(nèi)的出租車平均旅途時(shí)間是隨時(shí)間變化的。由于需要經(jīng)過一段車流量較為密集的區(qū)域,這條行車路徑在上下班高峰期時(shí)段很容易遇到堵車現(xiàn)象,造成行駛時(shí)間的上升,早上8點(diǎn)和下午5點(diǎn)分別對(duì)應(yīng)早晚高峰的最高值,行駛時(shí)間超過了40 min;而在其他時(shí)間段道路較為通暢,行駛時(shí)間也較小,中午12點(diǎn)下降到全天的最低值,只有20 min。該行車路徑甚至并未經(jīng)過城市最中心的區(qū)域,行駛時(shí)間在高峰期的數(shù)值就達(dá)到了最低時(shí)間的2倍,可見出行時(shí)段對(duì)出租車行駛時(shí)間有重要的影響。
(3)出租車等車時(shí)間
等車時(shí)間是指乘客在某個(gè)區(qū)域等待可用出租車所需的時(shí)間,可以通過單位時(shí)間內(nèi)可用出租車數(shù)量的倒數(shù)來表示。從圖7可以看出,城市不同區(qū)域的出租車密度不一樣,乘客的當(dāng)前位置決定了其等車時(shí)間。將地圖分成大小相同的區(qū)域,并統(tǒng)計(jì)了每個(gè)區(qū)域內(nèi)部每小時(shí)的可用出租車的數(shù)量,發(fā)現(xiàn)絕大多數(shù)區(qū)域的出租車數(shù)量也有隨時(shí)間變化的性質(zhì)。圖10和圖11分別是城市中心區(qū)域的人民廣場(chǎng)地鐵站和城市邊緣區(qū)域的凌空路地鐵站附近的出租車數(shù)量隨時(shí)間變化的曲線圖,人民廣場(chǎng)地鐵站位于車流量最為密集的區(qū)域,在高峰時(shí)段容易造成嚴(yán)重的擁堵,一些出租車在這些時(shí)段不愿前往該區(qū)域附近,造成高峰時(shí)期的出租車數(shù)量有一定的降低。而凌空路地鐵站附近較為通暢,高峰期的車流量相對(duì)較高,中午時(shí)刻和晚高峰過后車流量較低。在數(shù)值上,人民廣場(chǎng)的車流量明顯要高于凌空路??傮w來說,區(qū)域內(nèi)部的車流量不僅受到區(qū)域地理位置的影響,還和出行時(shí)段有著緊密的聯(lián)系。
圖10 人民廣場(chǎng)車流量變化
圖11 凌空路車流量變化
地鐵出行時(shí)間,出租車行駛時(shí)間和出租車等車時(shí)間隨時(shí)間變化的特點(diǎn)意味著針對(duì)乘客相同的請(qǐng)求,系統(tǒng)在不同時(shí)段給出的出行方案應(yīng)該有所區(qū)別。
乘客出行的主要衡量指標(biāo)是出行價(jià)格和出行時(shí)間。地鐵和出租車接駁的出行方案本身就是分段式的,其出行價(jià)格包括出租車價(jià)格和地鐵價(jià)格。出租車價(jià)格主要由行駛距離和低速等候時(shí)間決定,例如,上海出租車白天的價(jià)格P隨行駛距離x和低速等候時(shí)間t的計(jì)算方式如下所示:
上海出租車在白天的起步價(jià)為14元,起步里程為3 km,超過3 km但小于15 km的價(jià)格為2.5元/km,15 km以上3.8元/km,同時(shí)根據(jù)低速等候時(shí)間折算成對(duì)應(yīng)的里程數(shù)。地鐵價(jià)格由起始站點(diǎn)和終點(diǎn)站點(diǎn)的距離決定,分為2~9元的不同等級(jí)。從出租車和地鐵的價(jià)格計(jì)算方式可以看出前者的出行價(jià)格遠(yuǎn)高于后者,而出租車價(jià)格又主要由出租車行駛距離決定,為了簡化問題,本文將出租車的行駛距離作為衡量線路價(jià)格的主要指標(biāo)。
乘客出行時(shí)間主要包括以下3個(gè)方面的時(shí)間消耗:(1)出租車線路時(shí)間;(2)地鐵線路時(shí)間;(3)步行時(shí)間。出租車線路時(shí)間又可以分為等車時(shí)間和行駛時(shí)間,前者表示乘客等待出租車到來所需的時(shí)間,后者表示從乘客搭乘上出租車到乘客到達(dá)目的地所需的時(shí)間。地鐵線路時(shí)間是乘客利用地鐵列車出行所需的時(shí)間。由于難以從地鐵數(shù)據(jù)中分離出和出租車類似的等車時(shí)間和列車行駛時(shí)間,另外由于地鐵列車的發(fā)車頻率較高導(dǎo)致地鐵出行時(shí)間相對(duì)較為穩(wěn)定,用乘客進(jìn)站刷卡到乘客出站刷卡所需的時(shí)間表示地鐵線路時(shí)間。步行時(shí)間是指由于地理位置的限制乘客換乘交通工具所需的時(shí)間,本文假設(shè)正比于距離。將在4.4節(jié)給出出行時(shí)間和出租車行駛距離詳細(xì)的計(jì)算方法。
本文設(shè)計(jì)的出行線路規(guī)劃系統(tǒng)如圖12所示,主要包括三個(gè)組成部分,分別為乘客、云服務(wù)器和出租車。乘客是請(qǐng)求的發(fā)起者,通過選定起點(diǎn)和目的地作為一條線路規(guī)劃請(qǐng)求發(fā)往服務(wù)器端,服務(wù)器端對(duì)請(qǐng)求進(jìn)行對(duì)應(yīng)的線路計(jì)算并將結(jié)果返回。如果線路涉及到搭乘出租車,乘客可事先或到達(dá)相應(yīng)的區(qū)域后發(fā)起打車請(qǐng)求,服務(wù)器端給該區(qū)域附近的出租車發(fā)送訂單,并指派一位合適的出租車前去接送乘客,之后乘客和對(duì)應(yīng)的司機(jī)可以直接聯(lián)系無需通過服務(wù)器干預(yù)。該系統(tǒng)既能夠給乘客的出行方式和出行線路進(jìn)行指導(dǎo),也能夠幫助出租車司機(jī)尋找合適的乘客。相對(duì)于乘客單獨(dú)打車,通過服務(wù)器轉(zhuǎn)達(dá)的方式不僅給了乘客相對(duì)穩(wěn)定和可靠的等車時(shí)間,同時(shí)也增加了出租車司機(jī)的收益。
圖12 系統(tǒng)設(shè)計(jì)
考慮到換乘帶來的不便性,本文對(duì)換乘次數(shù)做出限制。對(duì)于一個(gè)查詢請(qǐng)求,地鐵和出租車的混合出行方案只可能產(chǎn)生以下4種結(jié)果:
(1)只搭乘出租車的方案。
(2)只搭乘地鐵的方案。
(3)乘客先搭乘地鐵到達(dá)某個(gè)地鐵站,再換乘出租車到達(dá)目的地。
(4)乘客先搭乘出租車到達(dá)某個(gè)地鐵站,再換乘地鐵達(dá)到目的地。
各個(gè)方案的示意圖如圖13所示。用戶每提交一個(gè)查詢請(qǐng)求,包括起始時(shí)間、起始地點(diǎn)、目的地點(diǎn),系統(tǒng)同時(shí)為用戶產(chǎn)生上述4種方案的結(jié)果集合,每個(gè)結(jié)果包括預(yù)計(jì)出行時(shí)間,預(yù)計(jì)出租車行駛距離(對(duì)應(yīng)價(jià)格)和出行線路等屬性,并由乘客選擇最佳的出行方案,上述請(qǐng)求方式保證了系統(tǒng)最終給出的出行線路最多只需換乘1次。由于出行線路結(jié)果包含出行時(shí)間和出租車行駛距離兩個(gè)評(píng)價(jià)指標(biāo),乘客既可以選擇最小化出行時(shí)間也可以選擇最小化出行行駛距離作為查詢條件。
圖13 線路方案示意圖
4.4.1 提取道路行駛時(shí)間
城市道路網(wǎng)絡(luò)構(gòu)成了一個(gè)有向圖,圖中的節(jié)點(diǎn)是各個(gè)道路交叉口,圖中的邊是每一段道路,道路的權(quán)重可以是該條道路的長度或是行駛時(shí)間。出租車的出行通常會(huì)經(jīng)過不同的道路,即一次出行由一組道路序列構(gòu)成,出租車行駛時(shí)間是通過各條道路的時(shí)間之和,出租車行駛距離時(shí)通過各條道路的距離之和。由于道路網(wǎng)絡(luò)節(jié)點(diǎn)個(gè)數(shù)較多,不是任意的兩個(gè)節(jié)點(diǎn)之間都能從出租車行車軌跡中直接提取行駛時(shí)間和行駛距離,但是有超過80%的相鄰節(jié)點(diǎn)對(duì)之間都有出租車歷史通行數(shù)據(jù)。如果能夠獲取各條道路的行駛時(shí)間和行駛距離,對(duì)于一些歷史數(shù)據(jù)中不能直接提取行駛時(shí)間的節(jié)點(diǎn)對(duì),利用Dijkstra最短路徑方法可以得到該節(jié)點(diǎn)對(duì)之間的最短路徑,同時(shí)利用其最短路徑包含的各條子道路的行駛時(shí)間進(jìn)行累加可以得到該路徑最終的行駛時(shí)間,各條子道路長度之和為該路徑最終的行駛距離。所以,首先需要提取出租車在不同道路的行駛時(shí)間。
出租車的旅程分為載有乘客和未載有乘客兩種情況,如果是前者,出租車司機(jī)一般都會(huì)選擇最優(yōu)路徑;如果是后者,大部分出租車也是帶有一定的目的性去往某地而不刻意繞路。為了獲取足夠多的行駛時(shí)間信息,對(duì)兩種路徑都做提取工作。
Shapefile文件是描述空間數(shù)據(jù)的幾何和屬性特征的非拓?fù)鋵?shí)體矢量數(shù)據(jù)結(jié)構(gòu)的一種格式,經(jīng)常在地理信息系統(tǒng)中被用于描述地圖道路信息,獲取了上海的Shape地圖文件,并利用一種快速地圖匹配算法[15]將每個(gè)出租車的GPS位置點(diǎn)匹配到城市道路中。對(duì)于一段旅程,只對(duì)其中起點(diǎn)和終點(diǎn)都是道路交叉口的子道路提取行駛時(shí)間,如圖14所示,由于起點(diǎn)A和終點(diǎn)E不是道路交叉口,旅程AE可以提取的子道路只有BC、CD。
圖14 道路行駛時(shí)間提取
通過上述方式,能夠從出租車GPS數(shù)據(jù)中提取大量的道路行駛時(shí)間信息,每條信息包括起點(diǎn)、終點(diǎn)、開始時(shí)刻、結(jié)束時(shí)刻。這些信息將用于生成城市任意兩點(diǎn)間的出租車行駛時(shí)間。
4.4.2 時(shí)間分區(qū)
如3.2.2小節(jié)所述,出租車行駛時(shí)間,等車時(shí)間以及地鐵出行時(shí)間都有著隨時(shí)間變化的特性,需要將一天劃分成不同的時(shí)間區(qū)間并分別計(jì)算路徑。一個(gè)越小的時(shí)間區(qū)間越能夠反映當(dāng)前時(shí)段的信息,但是由于需要一定的歷史數(shù)據(jù)支撐,每個(gè)區(qū)間又不能夠過小,否則無法反映統(tǒng)計(jì)規(guī)律。將一天按每個(gè)小時(shí)劃分出多個(gè)時(shí)間區(qū)間,并根據(jù)上一節(jié)所述從歷史數(shù)據(jù)中提取不同道路在不同時(shí)間區(qū)間下的平均行駛時(shí)間,同時(shí)統(tǒng)計(jì)不同地鐵站對(duì)在不同時(shí)間區(qū)間下的平均出行時(shí)間。
4.4.3 空間分區(qū)
地鐵出行時(shí)間和出租車出行時(shí)間主要受乘客的起點(diǎn)和終點(diǎn)決定,并且不同時(shí)間或不同地點(diǎn)的出租車等待時(shí)間有所差別。乘客在某個(gè)區(qū)域的等車時(shí)間可以直接利用該區(qū)域可用出租車的到達(dá)速率進(jìn)行估計(jì)。通常來說,出租車行駛是相互獨(dú)立的事件,某個(gè)區(qū)域在一定時(shí)間內(nèi)的車輛數(shù)服從泊松分布,而等待下一輛車的時(shí)間服從指數(shù)分布。而泊松分布用于描述單位時(shí)間內(nèi)隨機(jī)事件發(fā)生的次數(shù),例如,如果某個(gè)區(qū)域1 h內(nèi)有10輛不同的可用出租車,則平均等車時(shí)間為6 min。首先將上海地區(qū)按照1 000 m×1 000 m的大小劃分出不同的區(qū)域,計(jì)算各個(gè)區(qū)域在不同時(shí)間區(qū)間下的等車時(shí)間,如圖15所示。由于區(qū)域的面積較小,假設(shè)出租車在區(qū)域內(nèi)部行駛至乘客位置所需的時(shí)間為固定值2 min,并統(tǒng)計(jì)區(qū)域內(nèi)部不同時(shí)間區(qū)間下的歷史平均車輛數(shù)。實(shí)際上,一個(gè)區(qū)域周圍的車輛也可以通過一定的行駛距離到達(dá)該區(qū)域,以每個(gè)區(qū)域最靠近中心點(diǎn)的道路交叉口位置作為區(qū)域的起點(diǎn)或終點(diǎn),計(jì)算每個(gè)鄰近區(qū)域之間的行駛時(shí)間并假設(shè)該時(shí)間固定不變。對(duì)每個(gè)區(qū)域而言,統(tǒng)計(jì)以其為中心加上周圍8個(gè)區(qū)域的單位時(shí)間內(nèi)的不同車輛數(shù)的倒數(shù)作為該區(qū)域最終的平均等車時(shí)間。例如,如圖15所示,假設(shè)區(qū)域A和區(qū)域B在1 h內(nèi)經(jīng)過的出租車分別有6輛和10輛,16輛車互不相同,區(qū)域B行駛至區(qū)域A的時(shí)間為5 min,則在區(qū)域A中等待一輛來自A區(qū)域出租車并行駛至乘客位置所需的平均時(shí)間為(60/6+2),為12 min,在區(qū)域A中等待一輛來自B區(qū)域出租車并行駛至乘客位置所需的平均時(shí)間為(60/10+5),為11 min,那么在區(qū)域A中等待一輛來自A區(qū)域或B區(qū)域出租車的平均時(shí)間為60/(60/12+60/11),約為6 min。類似的,通過附加周圍8個(gè)區(qū)域的車輛數(shù),能夠獲得每個(gè)區(qū)域最終的平均等車時(shí)間。
圖15 地圖分區(qū)示意圖
4.4.4 各方案下線路計(jì)算方法
有了上述不同區(qū)域在不同時(shí)間區(qū)間下的平均等車時(shí)間,地鐵車站對(duì)在不同時(shí)間區(qū)間下的出行時(shí)間,以及各條子道路在不同時(shí)間區(qū)間下的行駛時(shí)間,可以給出各方案下乘客出行線路的計(jì)算方法。
方案1如圖13所示,方案1的路徑規(guī)劃不包含地鐵,可直接將乘客的起點(diǎn)和終點(diǎn)分別匹配到最近的道路交叉口,用作出租車路徑規(guī)劃的起點(diǎn)和終點(diǎn)。如果線路計(jì)算的原則是最小化出行時(shí)間,道路節(jié)點(diǎn)之間的權(quán)重即道路網(wǎng)絡(luò)圖中邊的權(quán)重被設(shè)定為各條道路的行駛時(shí)間;如果線路計(jì)算的原則是最小化出租車行駛距離,則道路網(wǎng)絡(luò)圖中邊的權(quán)重被設(shè)定為各條道路的長度。通過最短路徑搜索算法可以得到最優(yōu)的出行線路,并將最優(yōu)出行路徑所途徑的各條子道路的行駛距離進(jìn)行累積可以得到其總的出租車預(yù)計(jì)行駛距離;將各條子道路的行駛時(shí)間進(jìn)行累加并加上在起始區(qū)域的等車時(shí)間可以得到其總的預(yù)計(jì)出行時(shí)間。注意到由于出租車行駛時(shí)間存在隨時(shí)間變化的特性,子道路的行駛時(shí)間必須在搜索和疊加的過程中根據(jù)到達(dá)該道路的時(shí)間區(qū)間進(jìn)行相應(yīng)的更新。
方案2如圖13所示,方案2的路徑規(guī)劃不包含出租車,所以可直接將乘客的起點(diǎn)和終點(diǎn)分別匹配到最近的地鐵站,用作起點(diǎn)和終點(diǎn)并計(jì)算兩段路程的步行時(shí)間,同時(shí)加上歷史數(shù)據(jù)中當(dāng)前時(shí)間區(qū)間的地鐵平均出行時(shí)間作為最終的預(yù)計(jì)出行時(shí)間。由于此方案并不涉及搭乘出租車,此時(shí)的出租車預(yù)計(jì)行駛距離為0。
方案3如圖13所示,該方案實(shí)際上是方案1和方案2的組合,主要問題在于如何選擇一個(gè)地鐵目的車站使得出行時(shí)間最小。首先將乘客起點(diǎn)匹配到最近的地鐵車站,作為起點(diǎn),乘客終點(diǎn)匹配到最近的道路交叉口,作為目的地。對(duì)于一個(gè)地鐵目的車站,可以根據(jù)方案1和方案2的計(jì)算方式分別計(jì)算前后兩段線路的出行時(shí)間和行駛距離之和作為總的出行時(shí)間和出行行駛距離,通過遍歷地鐵站點(diǎn)集合作為目的車站并依次比較可以得到最優(yōu)的換乘線路。由于時(shí)間的可變性,如果乘客到達(dá)地鐵目的車站的旅途中跨過了一個(gè)時(shí)間區(qū)間,對(duì)應(yīng)下一段出租車線路的等車時(shí)間,出租車行駛時(shí)間都必須更新為新區(qū)間的值。上海地鐵的車站數(shù)量較少,截止到2015年4月份的數(shù)據(jù)總共有289個(gè)車站,此方案下的遍歷復(fù)雜度不會(huì)較高,能夠運(yùn)用在實(shí)時(shí)系統(tǒng)中。
方案4如圖13所示,該方案主要問題在于如何選擇一個(gè)地鐵起始車站使得出行時(shí)間最小。該方案的線路計(jì)算方式和方案3類似,遍歷整個(gè)車站集合即可得到最優(yōu)解。在線路計(jì)算的同時(shí)也要考慮時(shí)間的可變性。
地鐵的運(yùn)行時(shí)間較為穩(wěn)定,價(jià)格低廉,但是其行駛線路固定,常常導(dǎo)致較長的出行時(shí)間,同時(shí)也不能夠覆蓋廣闊的區(qū)域;出租車的可達(dá)區(qū)域非常廣泛,方便快捷,但是其價(jià)格較高,在高峰時(shí)段容易遇上堵車造成行車時(shí)間的上升。地鐵和出租車的接駁的出行方式實(shí)際上是單獨(dú)乘坐地鐵或出租車的折中方案,兼顧兩者的部分優(yōu)點(diǎn)。相對(duì)于只選擇出租車出行的方式,通過接駁地鐵和出租車的出行方式能夠減少乘客的出租車行駛距離,這不僅僅幫乘客減少了一定的出行價(jià)格,在節(jié)省社會(huì)資源上也有很大的幫助。同時(shí)對(duì)于某些擁堵路段,接駁地鐵和出租車的出行方式能夠在減少乘客的出行價(jià)格的同時(shí)降低乘客的出行時(shí)間。另一方面相對(duì)于只選擇地鐵出行的方式,也使得某些地鐵線路不可達(dá)的地鐵出行方案變?yōu)榭赡?。本文將從現(xiàn)有工具的分析對(duì)比,減少的出行時(shí)間以及減少出租車行駛距離等方面分析地鐵和出租車混合的出行方案帶來的效益。
為了說明地鐵和出租車混合出行方案的優(yōu)勢(shì),首先和國內(nèi)使用較為廣泛的地圖導(dǎo)航軟件“百度地圖”和“高德地圖”進(jìn)行了對(duì)比。在多元交通工具的線路規(guī)劃方面兩者目前只提供地鐵和公交車混合的方式,同時(shí)暫未看到其他地圖導(dǎo)航軟件有地鐵和出租車混合線路的查詢功能。實(shí)際上公交車的靈活性相對(duì)出租車較低,難以覆蓋較為廣闊的區(qū)域,同時(shí)其等車時(shí)間經(jīng)常無法估計(jì),給乘客出行帶來延誤。而提出的基于大規(guī)模交通數(shù)據(jù)出行線路規(guī)劃能夠給出一個(gè)較為準(zhǔn)確的等車時(shí)間和預(yù)計(jì)出行時(shí)間,同時(shí)覆蓋較大的出行范圍,為乘客出行帶更多的選擇。
另外在時(shí)間可變性方面,百度地圖和高德地圖目前在機(jī)動(dòng)車的預(yù)計(jì)行駛時(shí)間上是通過采集當(dāng)前路況信息計(jì)算并給出一個(gè)預(yù)計(jì)值,雖然此方法下能夠準(zhǔn)確地預(yù)估當(dāng)前的行駛時(shí)間,但其對(duì)采集的路況信息的精確度要求較高,同時(shí)用戶不能夠事先查詢將來某個(gè)時(shí)刻下的預(yù)計(jì)出行時(shí)間。雖然在公交線路的查詢上能夠讓乘客選定不同的出發(fā)時(shí)間,但其主要功能在于判斷公交線路是否超出其運(yùn)營時(shí)間,在預(yù)計(jì)出行時(shí)間上并沒有根據(jù)不同時(shí)段有所區(qū)分。實(shí)際上根據(jù)3.2.2小節(jié)所述,當(dāng)前時(shí)段對(duì)出行時(shí)間的影響是比較大的,特別在當(dāng)線路經(jīng)過擁堵路段的時(shí)候。選取了如圖9所示的旅程作為說明,通過百度地圖查詢?cè)撀贸叹€路在通暢的路況條件下所需的時(shí)間約為38 min,同時(shí)在不同時(shí)段下通過本文采用的每條道路在不同時(shí)間區(qū)間下的行駛時(shí)間進(jìn)行拼接得到的總行駛時(shí)間和總的標(biāo)準(zhǔn)差,最后和歷史記錄中直接提取的該旅程線路在不同時(shí)段下的平均行駛時(shí)間和標(biāo)準(zhǔn)差進(jìn)行對(duì)比,最終的行駛時(shí)間和標(biāo)準(zhǔn)差如圖16,圖17所示。為了作圖方便,圖中的標(biāo)準(zhǔn)差線被設(shè)置為原始長度的0.2倍。從圖中可以看到雖然在此條線路上百度地圖提供的查詢服務(wù)能夠給出一個(gè)較為保障的行駛時(shí)間,但是在非高峰時(shí)段即道路通暢情況下該值和實(shí)際的行駛時(shí)間的差異比較明顯,給乘客出行造成了一定的誤導(dǎo);基于大規(guī)模歷史數(shù)據(jù)中提取出的每條道路在不同時(shí)間段的行駛時(shí)間,拼接出總的差異化行駛時(shí)間能夠較為準(zhǔn)確地符合實(shí)際行駛時(shí)間的變化規(guī)律。相對(duì)于簡單的歷史平均時(shí)間,根據(jù)道路進(jìn)行拼接的總行駛時(shí)間的偏差較小,能夠指導(dǎo)乘客一個(gè)較為穩(wěn)定的出行時(shí)間。
圖16 拼接的出行時(shí)間和標(biāo)準(zhǔn)差
圖17 歷史平均出行時(shí)間和標(biāo)準(zhǔn)差
根據(jù)3.2.2小節(jié)分析可知上海車輛分布不均勻,在城市中心區(qū)域的車流量較高,容易造成堵車現(xiàn)象,從而造成經(jīng)過這些區(qū)域的出租車乘客出行時(shí)間增長。為了說明接駁地鐵和出租車出行的方式能夠減少乘客的出行時(shí)間,選取了圖18所示的線路作為說明,該線路的起點(diǎn)是石龍路地鐵站,終點(diǎn)為虹口區(qū)廣粵路。選取中山北路地鐵站作為中轉(zhuǎn)車站,對(duì)比只搭乘出租車的方案和先搭乘地鐵再在中山北路換乘出租車的方案的出行時(shí)間和出租車行駛距離。兩者的出行時(shí)間在一天不同時(shí)刻的變化曲線如圖19所示,前者所需的出租車行駛距離約為22 km,后者只需4 km。由于該線路需要經(jīng)過車流量最為密集的區(qū)域,導(dǎo)致前者的出行時(shí)間在高峰期時(shí)段有較為明顯的增長,而后者的時(shí)間較為穩(wěn)定,在高峰期時(shí)段相對(duì)前者能夠減少10 min左右的出行時(shí)間。
圖18 石龍路-廣粵路
圖19 總出行時(shí)間對(duì)比
通過出租車歷史數(shù)據(jù)提取乘客的出行需求,為乘客重新選擇出行方案,計(jì)算乘客在不同方案下所需的出行時(shí)間和出租車行駛距離。篩選出白天中所有出行時(shí)間大于30 min的乘客出行請(qǐng)求,在最小化出行時(shí)間條件下,分別計(jì)算四種方案所需的出行時(shí)間和出租車行駛距離,最終得到四種方案在每個(gè)小時(shí)的時(shí)間區(qū)間內(nèi)的平均出行時(shí)間和出租車平均行駛距離分別如圖20和圖21所示。
圖20 平均出行時(shí)間對(duì)比
圖21 出租車平均行駛距離對(duì)比
由圖4可知,雖然許多乘客的上車點(diǎn)或下車點(diǎn)分布在地鐵站附近,但是幾乎沒有乘客同時(shí)在地鐵站附近上車和下車。也就是說,如果將乘客的日常出行都通過方案2重新分配路線,雖然此時(shí)的出租車行駛距離為0,即出行價(jià)格最低,但是大部分乘客需要經(jīng)過一段較長的步行距離,導(dǎo)致平均出行時(shí)間較為明顯地增長。如圖20所示,方案2的平均出行時(shí)間在一天的不同時(shí)段均超過了方案1的1.5倍。而如果將乘客出行需求通過方案3和方案4重新分配出行路線,在增加少部分出行時(shí)間的前提下能夠較為明顯地減低出租車平均行駛距離。例如,在鄰近晚高峰時(shí)期的16:00到17:00的時(shí)段內(nèi),如果通過方案3進(jìn)行出行只增加了將近5 min的平均出行時(shí)間,但是卻能夠平均減少7 km的出租車行駛距離,接駁地鐵和出租車的出行方案確實(shí)能夠較為明顯地降低社會(huì)資源消耗。
本文提出了一種接駁出租車和地鐵的出行方案,兼顧兩者的部分優(yōu)點(diǎn),能夠在保證較低的出行時(shí)間條件下較為明顯地降低乘客的出行價(jià)格,降低了社會(huì)資源消耗。同時(shí)基于上海出租車數(shù)據(jù)和地鐵數(shù)據(jù)的詳細(xì)分析,新的出行方案能夠根據(jù)不同時(shí)段提供差異化服務(wù),指導(dǎo)乘客一個(gè)較為準(zhǔn)確的出行時(shí)間。在將來的工作中,將對(duì)接駁出租車和地鐵的出行方案做以下兩個(gè)方面進(jìn)行改進(jìn):(1)本文的線路計(jì)算方法目前只基于歷史數(shù)據(jù),將尋求和上海有關(guān)部門合作獲取實(shí)時(shí)的交通數(shù)據(jù),如信號(hào)燈和實(shí)時(shí)路況信息等,從而能夠結(jié)合歷史數(shù)據(jù)給出更加準(zhǔn)確的出租車行駛時(shí)間。(2)采取一種更加有效的車流量預(yù)測(cè)方法,如Zhang[16]提出的利用深度神經(jīng)網(wǎng)絡(luò)的流量預(yù)測(cè)方法,能夠通過時(shí)空數(shù)據(jù)實(shí)時(shí)并準(zhǔn)確地預(yù)測(cè)流量,從而更加準(zhǔn)確地估計(jì)等車時(shí)間。