席殷飛,劉鐘鍇,楊佩云,郁 燁,張 奇,劉志遠(yuǎn)
(東南大學(xué)交通學(xué)院,南京211189)
在當(dāng)今移動互聯(lián)網(wǎng)的信息時代,智慧交通的發(fā)展給人們的生活帶來了巨大的便捷,大大改變了人們的出行習(xí)慣.以手機(jī)APP為主要服務(wù)平臺的新業(yè)態(tài)的網(wǎng)約車(Internet private hire vehicles,IPHV)出行方式逐漸滲透入城市傳統(tǒng)巡游式出租車服務(wù)市場,該新型商業(yè)服務(wù)模式為具有出行需求的用戶和具有出行服務(wù)資格的駕駛員提供了雙向信息溝通,通過整合供需信息在出行用戶與司機(jī)/車輛之間實現(xiàn)合理匹配,并提供有保障的出行乘車服務(wù)[1].就國內(nèi)的出行服務(wù)市場而言,國家層面的相關(guān)部門也相繼制定了一系列的要求與政策.2017年9月,交通運輸部印發(fā)了《智慧交通讓出行更便捷行動方案(2017—2020年)》,以推動企業(yè)為主體的智慧交通出行信息服務(wù)體系建設(shè),促進(jìn)“互聯(lián)網(wǎng)+”便捷交通發(fā)展;2019年9月,中共中央、國務(wù)院正式印發(fā)《交通強(qiáng)國建設(shè)綱要》,明確提出要大力發(fā)展智慧交通,推動大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能等新技術(shù)與交通行業(yè)深度融合.
在移動互聯(lián)網(wǎng)快速發(fā)展大背景之下興起的網(wǎng)約車,按其具體運營類型可分為網(wǎng)約快車、網(wǎng)約出租車、網(wǎng)約順風(fēng)車等.網(wǎng)約車的出現(xiàn),一定程度上使我國傳統(tǒng)巡游式出租車市場普遍存在的“打車難”問題得到了緩解.根據(jù)中商產(chǎn)業(yè)研究院[2]發(fā)布的數(shù)據(jù)顯示,網(wǎng)約車用戶規(guī)模不斷擴(kuò)大及用戶使用率的不斷增長,使得網(wǎng)約車成為城市居民出行需求中越來越重要的部分.一些互聯(lián)網(wǎng)科技公司較早在該類出行市場獲益,國內(nèi)以“滴滴出行”“美團(tuán)打車”為代表的打車軟件相繼上線并迅速發(fā)展,逐漸占領(lǐng)市場;而面臨轉(zhuǎn)型的車企在資本的驅(qū)使下,也逐漸涌向這個市場.2019年7月,一汽、東風(fēng)、長安這3家車企聯(lián)合蘇寧、騰訊、阿里巴巴等共同打造了“T3出行”智慧出行平臺,采用定制化、智能化的新能源車輛,合規(guī)實體運營保障運力供給.與此同時,各類打車軟件逐漸轉(zhuǎn)向服務(wù)端優(yōu)化,通過提升乘車體驗來增強(qiáng)用戶黏性,從而保障司機(jī)和用戶量的穩(wěn)定增長.通過監(jiān)管升級,市場逐漸規(guī)范,網(wǎng)約車在為公共交通提供良好補(bǔ)充的同時也為用戶提供個性化出行需求,有效節(jié)約社會資源.然而,網(wǎng)約車模式在給用戶提供快速便捷的出行服務(wù)的同時,傳統(tǒng)巡游出租車行業(yè)受到了沖擊,過多的車輛服務(wù)資源導(dǎo)致行業(yè)無序競爭和服務(wù)質(zhì)量降低,交通擁堵加劇.此外,隨著駕駛員數(shù)量的增多以及乘車需求的快速增長,二者之間的供需矛盾日漸突出,減少車輛空載率與最大程度滿足乘客打車需求的資源配置平衡問題也日益凸顯.
因此,網(wǎng)約車出行需求的精準(zhǔn)預(yù)測成為值得深入研究的課題.實現(xiàn)網(wǎng)約車出行需求的精準(zhǔn)預(yù)測,能夠指向性地提高部分地區(qū)的運力,并引導(dǎo)用戶避開高峰與擁堵,進(jìn)而提高乘客出行體驗質(zhì)量,提高企業(yè)/司機(jī)的經(jīng)濟(jì)收入和服務(wù)質(zhì)量.可見,網(wǎng)約車出行需求的精準(zhǔn)預(yù)測,是優(yōu)化城市公共資源配置、提高運力和道路資源利用率的重要基礎(chǔ),對促進(jìn)新舊業(yè)態(tài)融合發(fā)展和維護(hù)行業(yè)穩(wěn)定具有重要的意義.但是,網(wǎng)約車出行需求受到的隨機(jī)因素的影響較大,社會經(jīng)濟(jì)水平、天氣因素、交通狀況、突發(fā)事件、區(qū)域土地利用情況等都會影響客流量.近年來,隨著感知技術(shù)和計算環(huán)境的成熟,各種大數(shù)據(jù)以及城市計算[3]等理念在城市中悄然而生.在這樣的背景下,有必要對網(wǎng)約車出行需求預(yù)測的文獻(xiàn)進(jìn)行梳理,總結(jié)數(shù)據(jù)挖掘、城市計算等技術(shù)在交通出行領(lǐng)域的應(yīng)用情況,分析既有研究的不足,提出潛在的研究方向.
本工作研究的網(wǎng)約車主要是指以網(wǎng)約快車、網(wǎng)約出租車為代表的網(wǎng)約車.本工作從為網(wǎng)約車用戶提供特定的智能化應(yīng)用和服務(wù)的角度出發(fā),解析網(wǎng)約車出行需求預(yù)測的關(guān)鍵問題.在分析網(wǎng)約車出行影響因素的基礎(chǔ)上,把網(wǎng)約車出行需求預(yù)測根據(jù)時間維度、事件維度進(jìn)行分類,總結(jié)梳理各類研究方法.這里,時間維度的網(wǎng)約車出行需求預(yù)測的研究內(nèi)容分為短期需求預(yù)測和長期需求預(yù)測;事件維度的網(wǎng)約車出行的需求預(yù)測研究內(nèi)容分為已知活動事件下和未知活動事件下的乘車需求量預(yù)測.具體研究框架如圖1所示.
圖1 網(wǎng)約車出行需求預(yù)測的關(guān)鍵技術(shù)Fig.1 Key technologies of demand forecasting for IPHV
網(wǎng)約車出行的影響因素可以分為靜態(tài)因素和動態(tài)因素2類(見表1).
表1 網(wǎng)約車出行影響因素Table 1 Influence factors of choosing IPHV
靜態(tài)因素研究方面,林玉川[4]從乘客感知價值角度解釋了基于互聯(lián)網(wǎng)出行平臺的用戶行為;唐軍[5]認(rèn)為城市的經(jīng)濟(jì)增長速度、公共交通的服務(wù)水平、道路設(shè)施的發(fā)展、路網(wǎng)密度等都是城市網(wǎng)約車需求的重要影響因素;林園[6]通過調(diào)查問卷的形式對居民出行方式選擇行為進(jìn)行建模與分析,并對各影響因素進(jìn)行敏感性分析,包括年齡、職業(yè)、收入等;高永等[7]通過量化計算的方法研究了網(wǎng)約車這種新型出行方式對居民出行行為和道路資源的影響.
動態(tài)因素主要包括實時的訂單情況、交通擁堵、天氣情況等.王一帆[8]強(qiáng)調(diào)互聯(lián)網(wǎng)出行方式的普及性是影響客戶使用的根本原因,并運用調(diào)查數(shù)據(jù)和博弈論的方法得出了天氣狀況、叫車時段、出租車供需匹配情況是影響用戶選擇行為的重要因素的結(jié)論;黎景壯[9]通過對網(wǎng)約車需求量的變化規(guī)律和影響因素進(jìn)行灰色關(guān)聯(lián)度分析,選取網(wǎng)約車歷史需求量、天氣類型和道路擁堵比例作為影響因子;賈興無[10]利用網(wǎng)約車歷史訂單數(shù)據(jù),包括司機(jī)ID,用戶ID,訂單地點和時間,旅程起止點、時長、票價,指出居民出行與時間和空間有很大關(guān)系,但是未分析區(qū)域之間的相互影響.
一些學(xué)者還分析了出行者在不同情景下對網(wǎng)約車服務(wù)的需求選擇行為.Dawes[11]指出,參加社交類活動以及避免酒駕是出行者選擇網(wǎng)約車出行的主要原因之一.還有部分學(xué)者站在司機(jī)端的角度進(jìn)行提供服務(wù)意愿分析,研究表明司機(jī)服務(wù)供給水平能夠間接地影響乘客的需求選擇行為.Farber[12]提到出租車司機(jī)會在參照收入水平達(dá)到之前就停止服務(wù),并指出司機(jī)在雨天服務(wù)的積極性會降低,會造成雨天需求過剩的情況.
綜上,很多學(xué)者利用調(diào)查分析、量化計算的方法對靜態(tài)因素進(jìn)行了深入剖析,結(jié)果表明該類因素主要出自于出行者個體,并涵蓋城市發(fā)展的固有特征.但是在動態(tài)因素方面,因時空的隨機(jī)性和多樣性,故無法定量化地將動態(tài)因素進(jìn)行表征.同時,動態(tài)因素的數(shù)據(jù)來源也是多元化的[13].隨著交通基礎(chǔ)設(shè)施、數(shù)據(jù)采集設(shè)備的不斷完善和大數(shù)據(jù)技術(shù)的不斷推動,動態(tài)時空關(guān)聯(lián)的網(wǎng)約車出行方式選擇意向分析將是潛在的研究方向.
按照需求預(yù)測的時間維度,網(wǎng)約車出行需求預(yù)測可以分為短期需求預(yù)測(1 h以內(nèi))和長期需求預(yù)測2類.
網(wǎng)約車出行短期需求預(yù)測是指城市居民出行中對網(wǎng)約車的需求量的短時預(yù)測,屬于短時交通預(yù)測范疇.短時交通預(yù)測的模型與理論方法為網(wǎng)約車出行短期需求預(yù)測提供了方法基礎(chǔ).因此,在介紹網(wǎng)約車需求預(yù)測方法之前,有必要對短時交通預(yù)測方法進(jìn)行討論.
3.1.1 短時交通預(yù)測方法
城市交通系統(tǒng)是一個復(fù)雜系統(tǒng),短時交通流受到各種因素的影響,包括土地利用情況、天氣條件、居民出行行為、人口變化等.短時交通預(yù)測的各種預(yù)測模型具有不同的預(yù)測精度和應(yīng)用條件.短時交通預(yù)測方法主要分為4類:基于統(tǒng)計分析的預(yù)測、基于非線性理論的預(yù)測、智能預(yù)測以及組合預(yù)測模型.
基于統(tǒng)計分析的預(yù)測模型主要應(yīng)用數(shù)理統(tǒng)計方法,并假設(shè)待預(yù)測的內(nèi)容與歷史數(shù)據(jù)有相同的特征,主要的代表模型有歷史平均模型、時間序列模型以及卡爾曼濾波模型等.賀國光等[14]指出,20世紀(jì)六七十年代開始城市交通控制系統(tǒng)把一些成熟的數(shù)學(xué)預(yù)測模型用于短時交通流預(yù)測領(lǐng)域.時間序列模型是一種統(tǒng)計方法[15-17],較為經(jīng)典的有自回歸整形滑動平均(autoregressive integrated moving average,ARIMA)模型.ARIMA模型適用于非平穩(wěn)時間序列的預(yù)測,其基本思想是將原始序列進(jìn)行差分平穩(wěn)化處理,然后對隨機(jī)誤差項的現(xiàn)值和滯后值進(jìn)行回歸分析.Kim等[17]結(jié)合自回歸移動平均模型預(yù)測的數(shù)據(jù)和歷史同一時段數(shù)據(jù),建立了實時交通流預(yù)測模型.卡爾曼濾波模型是一種基于線性遞推的預(yù)測方法,能處理平穩(wěn)與非平穩(wěn)數(shù)據(jù).王均等[18]基于卡爾曼濾波模型,結(jié)合分析城市環(huán)路交通特性,對短時交通流進(jìn)行了預(yù)測;Chien等[19]利用紐約高速公路交通數(shù)據(jù),采用卡爾曼濾波算法建立了路段和路徑的行程時間預(yù)測模型;楊高飛等[20]使用自回歸滑動平均模型與卡爾曼濾波模型對路段短時交通流量進(jìn)行了預(yù)測,提高了單一模型的預(yù)測精度.
基于非線性理論的預(yù)測模型主要通過挖掘短時交通流非線性特點,來體現(xiàn)城市交通運行的隨機(jī)特性,有3種具有代表性的理論方法:小波分析方法、混沌理論與突變理論.小波分析方法將交通流時間序列進(jìn)行分解,并分段預(yù)測,最后合成分析得到最終預(yù)測結(jié)果[21].曹征[22]在基于小波變換的短時交通流預(yù)測模型中加入指數(shù)平滑操作以提高預(yù)測的準(zhǔn)確性;Disbro等[23]在交通領(lǐng)域引入混沌理論,表明該理論能夠提高預(yù)測模型的可靠性;張勇[24]通過對交通流時間序列的非線性檢驗,分析得到其混沌特征,提出了一種改進(jìn)的單/多變量混沌時序預(yù)測方法,并通過仿真驗證了該方法的有效性.突變理論方法是利用實際交通流數(shù)據(jù)來標(biāo)定突變理論模型,解釋交通流特性并實現(xiàn)交通流預(yù)測.Forbes等[25]在高速公路環(huán)境下,引入突變理論建立了短期交通流預(yù)測模型;唐鐵橋等[26]認(rèn)為,交通流是一個動態(tài)過程,不能只考慮密度和流量,因此考慮時間因素,應(yīng)用燕尾突變理論建立了交通流預(yù)測模型,結(jié)果證明該模型更符合現(xiàn)實.
智能預(yù)測模型主要采用“黑箱”式模式,自動歸納歷史數(shù)據(jù)規(guī)律進(jìn)行預(yù)測,主要有非參數(shù)回歸預(yù)測、神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)(support vector machine,SVM)回歸預(yù)測等類型.非參數(shù)回歸預(yù)測模型從歷史數(shù)據(jù)中尋找預(yù)測點相似的“近鄰”,較適合應(yīng)用在特殊事件情況下的交通流預(yù)測;Davis等[27]首次將近鄰非參數(shù)回歸算法應(yīng)用在交通流預(yù)測領(lǐng)域;丁濤杰[28]基于出租車全球定位系統(tǒng)(global positioning system,GPS),利用非參數(shù)回歸模型估計出車輛實時速度.神經(jīng)網(wǎng)絡(luò)模型通過模擬神經(jīng)元組成結(jié)構(gòu),訓(xùn)練大量歷史數(shù)據(jù)建立預(yù)測模型,并不斷調(diào)整模型參數(shù).國外較早將單種神經(jīng)網(wǎng)絡(luò)應(yīng)用到交通流預(yù)測中,包括交通流3參數(shù)的預(yù)測等,預(yù)測效果較好[29-31].國內(nèi)部分學(xué)者通過引入變異算子訓(xùn)練優(yōu)化BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型的參數(shù),最終驗證該模型具有較好的擬合能力[32-33].SVM模型是通過訓(xùn)練歷史樣本,求解2次規(guī)劃問題得到?jīng)Q策函數(shù),從而進(jìn)行預(yù)測.呂宏義[34]基于杭州市浮動車GPS數(shù)據(jù),利用SVM回歸模型對路段平均速度進(jìn)行短時預(yù)測;孫朝東等[35]利用改進(jìn)的花授粉算法優(yōu)化了SVM模型參數(shù),繼而建立了交通流短時預(yù)測模型.
組合預(yù)測模型是指綜合采用2種及以上的模型進(jìn)行預(yù)測,分為并行式預(yù)測和串聯(lián)式預(yù)測.并行式預(yù)測是指先使用多種模型分別預(yù)測,再利用數(shù)學(xué)運算的方法得到綜合預(yù)測結(jié)果;而串聯(lián)式預(yù)測是指將一種模型的預(yù)測結(jié)果作為另一種模型的前期輸入,通過銜接得到最終預(yù)測結(jié)果.這里,Voort等[36]將ARIMA時間序列模型和神經(jīng)網(wǎng)絡(luò)結(jié)合;Yuan等[37]建立了小波模糊神經(jīng)網(wǎng)絡(luò)預(yù)測模型;譚滿春等[38]建立了ARIMA與SVM相融合的組合模型,該類研究試驗結(jié)果表明組合模型的抗干擾能力較好.還有部分學(xué)者嘗試將其他領(lǐng)域較先進(jìn)的模型引入交通預(yù)測領(lǐng)域,如Yu等[39]曾利用高斯混合模型所得參數(shù)建立了基于高階馬爾科夫鏈的預(yù)測模型;Tan等[40]建立了基于并行自縮放擬牛頓神經(jīng)網(wǎng)絡(luò)預(yù)測模型,利用迭代更新實現(xiàn)了較好的預(yù)測效果;劉芹等[41]利用歷史數(shù)據(jù)和實時數(shù)據(jù),引入了預(yù)測云模型,從而進(jìn)行交通流預(yù)測.
現(xiàn)將預(yù)測模型分類、各自優(yōu)缺點及適用條件進(jìn)行總結(jié),結(jié)果如表2所示.
通過上述對短時交通預(yù)測方法的分析可知,不同的預(yù)測模型有各自的優(yōu)缺點,需要根據(jù)預(yù)測目標(biāo)、預(yù)測類別選取合適的預(yù)測方法,其整體研究發(fā)展呈現(xiàn)如下幾個特點:
(1)預(yù)測精度高的模型,其計算量也較大;
(2)非線性模型可以更好地描述交通流特征;
(3)組合預(yù)測模型是目前的應(yīng)用趨勢.
3.1.2 短期需求預(yù)測方法
在網(wǎng)約車出現(xiàn)之前,學(xué)者們主要針對傳統(tǒng)巡航式出租車的短期需求預(yù)測展開了大量研究.Moreira等[42]將泊松模型和自回歸移動平均(auto-regression and moving average,ARMA)模型相結(jié)合來預(yù)測幾個固定出租車站臺的乘車需求,但并沒有考慮各出租車站臺歷史數(shù)據(jù)之間的關(guān)聯(lián)性;林永杰等[43]通過分析出租車出行影響因子等變量之間的相關(guān)性,建立了基于人工神經(jīng)網(wǎng)絡(luò)的短期需求預(yù)測模型,其預(yù)測精度高于傳統(tǒng)的自回歸滑動平均模型;王芮[44]利用濟(jì)南某園區(qū)出租車GPS數(shù)據(jù),通過分析出租車交通需求的時空特性,建立了卡爾曼濾波-神經(jīng)網(wǎng)絡(luò)組合預(yù)測模型,對園區(qū)內(nèi)的出租車出行需求進(jìn)行實時預(yù)測.
表2 短時交通預(yù)測方法Table 2 Short-term traffic prediction method
傳統(tǒng)巡航式出租車需求預(yù)測主要利用出租車GPS軌跡數(shù)據(jù)進(jìn)行建模分析,針對網(wǎng)約車出行需求預(yù)測,已有學(xué)者提出引入訂單流量數(shù)據(jù).Chiang等[45]提出了一種基于網(wǎng)格的高斯混合的生成模型,對網(wǎng)約車需求預(yù)測進(jìn)行時空建模,這種方法能夠預(yù)測城市中各小區(qū)在不同時間間隔內(nèi)的網(wǎng)約車需求量.但是這種模型主要存在2種缺陷:①工作日和周末分開處理訂單;②網(wǎng)約車的總需求量是由泊松模型預(yù)先決定的.當(dāng)實時的網(wǎng)約車需求量快速變化時,這種方法可能會導(dǎo)致較大的預(yù)測誤差.前述研究無法對空間和時間的復(fù)雜非線性關(guān)系進(jìn)行建模.近年來,一些學(xué)者結(jié)合了多種技術(shù)來模擬空間交互作用.例如Deng等[46]利用道路網(wǎng)絡(luò)上的矩陣因子分解捕獲到的道路連接區(qū)域之間的相關(guān)性來預(yù)測交通量;Tong等[47]也提出,通過對空間和時間相關(guān)性的正則化來平滑鄰近位置和時間點的預(yù)測差異;Nie[48]提出了一種新的基于區(qū)域劃分的長短時記憶神經(jīng)網(wǎng)絡(luò)模型,用于網(wǎng)約車服務(wù)需求預(yù)測,該模型主要包括網(wǎng)格合并區(qū)域劃分和神經(jīng)網(wǎng)絡(luò)的應(yīng)用2個部分,在實際情況中此方法的預(yù)測精度較高,可以幫助網(wǎng)約車平臺調(diào)度車輛資源.
城市范圍內(nèi)不同區(qū)域之間的出行特性存在較大的差異,網(wǎng)約車出行需求的時空依賴性非常復(fù)雜,盡管有些學(xué)者在考慮乘客需求時加入了時間、空間特性,預(yù)測精度還是不理想.得益于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)的成熟與發(fā)展,有學(xué)者提出了對空間相鄰區(qū)域之間的歐式相關(guān)性進(jìn)行建模的方法.Yao等[49]提出了一種深度多視點時空網(wǎng)絡(luò)框架(deep multi-view spatial-temporal network,DMVST-Net)來模擬時空關(guān)系.該模型包括3個視圖:時間視圖(通過長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)對未來需求值與近時間點的相關(guān)性進(jìn)行建模)、空間視圖(通過局部CNN(convolutional neural network)對局部空間相關(guān)性進(jìn)行建模)和語義視圖(對具有相似時間模式的區(qū)域之間的相關(guān)性進(jìn)行建模).但是,有研究表明遠(yuǎn)距離區(qū)域之間的非歐式成對關(guān)系對于預(yù)測的準(zhǔn)確性也是至關(guān)重要的.對此,滴滴出行AILab研究團(tuán)隊提出了一種新型深度學(xué)習(xí)模型,搭建時空多圖卷積網(wǎng)絡(luò)(spatiotemporal-multigraph convolution network,ST-MGCN)將區(qū)域之間的非歐幾里德相關(guān)性進(jìn)行建模,并進(jìn)一步建立了環(huán)境門控遞歸神經(jīng)網(wǎng)絡(luò)(generalized regression neural network,CGRNN)對時間相關(guān)性進(jìn)行建模,該模型對不同時間的歷史數(shù)據(jù)加以不同的權(quán)重進(jìn)行分析[50].
總體來看,網(wǎng)約車出行短期需求預(yù)測主要采用大數(shù)據(jù)處理技術(shù),基于數(shù)據(jù)驅(qū)動對網(wǎng)約車出行需求進(jìn)行預(yù)測.所使用的研究數(shù)據(jù)主要包括城市POI(point of information)數(shù)據(jù)、天氣情況數(shù)據(jù)、車輛GPS定位數(shù)據(jù)、平臺訂單數(shù)據(jù)、道路狀況數(shù)據(jù)等,所采用的方法主要是神經(jīng)網(wǎng)絡(luò)模型(見表3).深度學(xué)習(xí)在網(wǎng)約車出行短期需求預(yù)測中逐漸得到推廣,通過構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型來挖掘網(wǎng)約車用戶出行特征得到了眾多學(xué)者的青睞.在研究思路上,這方面的研究可以分為2類:①不考慮各區(qū)域之間的空間相互影響關(guān)系,根據(jù)乘車需求影響因素類型,將需求預(yù)測問題視為多維時序預(yù)測問題;②考慮空間相鄰區(qū)域之間的歐式相關(guān)性,將需求預(yù)測問題視為時空序列問題,其數(shù)據(jù)形態(tài)包括表格化數(shù)據(jù)和圖片數(shù)據(jù).如何利用城市計算體系及考慮區(qū)域時空關(guān)聯(lián)性,對網(wǎng)約車出行短期需求進(jìn)行精準(zhǔn)預(yù)測是未來重要的研究方向之一.
表3 基于神經(jīng)網(wǎng)絡(luò)的網(wǎng)約車出行短期需求預(yù)測模型Table 3 Short-term travel demand forecasting models for IPHV based on neural network
隨著人們出行習(xí)慣逐漸改變以及政策的引導(dǎo),網(wǎng)約車出行在城市居民出行中的比例持續(xù)增長.網(wǎng)約車出行長期需求預(yù)測主要是指季度或年度需求總量預(yù)測,該類預(yù)測數(shù)據(jù)是城市車輛運力配置的基礎(chǔ).同時,網(wǎng)約車整體管理需要遵循總量控制的原則,因為服務(wù)車輛資源的數(shù)量在一定程度上影響了網(wǎng)約車用戶的需求選擇,對網(wǎng)約車市場的供需平衡研究有著重要的意義.目前,專門針對網(wǎng)約車長期需求預(yù)測的研究很少.由于傳統(tǒng)巡游式出租車的相關(guān)研究對此具有借鑒意義,故對出租車長期需求預(yù)測的相關(guān)研究進(jìn)行梳理.這方面的研究主要包括車輛服務(wù)資源與用戶需求之間的供需匹配度、城市車輛服務(wù)運力配置2個方面的內(nèi)容.
在車輛服務(wù)資源供需匹配的研究中,部分學(xué)者采用不同類型的指標(biāo)來評價匹配度.聶篤憲等[51]從時空角度建立了層次分析模型計算出租車供求匹配度,結(jié)果表明工作日的乘車需求和供求匹配程度均高于節(jié)假日,但該模型沒有考慮消費者的偏好、重大事件、異常氣候等條件;樊文壯等[52]構(gòu)建了模糊綜合評價模型來評價重慶主城九區(qū)的出租車供求匹配度,該模型考慮了出租車宏觀資源因素、需求因素、供給因素,還考慮了社會經(jīng)濟(jì)因素;張娟等[53]基于出租車運營數(shù)據(jù),研究了出租車資源的供需匹配程度,該方法考慮了日常高峰與平峰、節(jié)假日等時間維度,城中與郊區(qū)等空間維度;劉嘉琪等[54]采用出租車的平均空載率、萬人擁有量、里程利用率等指標(biāo)衡量出租車總體供需匹配程度,并指出人口越集中的地區(qū)更容易打到車.然而,上述供求匹配度計算模型沒有考慮乘客出行需求未被滿足的部分.之后,逯強(qiáng)等[55]以等待人數(shù)與等待車數(shù)的比值、乘客等車時長、司機(jī)搜尋到乘客等車時長為指標(biāo)建立了供求匹配度模型,并通過分析同一區(qū)域不同時段供求匹配情況、不同區(qū)域相同時間段供求匹配情況,提出了用戶/司機(jī)補(bǔ)貼方案,但補(bǔ)貼方案沒有考慮車上乘客的滿意度.此外,也有學(xué)者提出建立短期模型,研究某一時刻的匹配度狀態(tài),但是對于空間變量的定義仍屬于整體的宏觀量,而沒有真正實現(xiàn)“實時實地”層面的微觀分析.例如,朱家明等[56]運用層次分析、熵值、3次樣條插值等方法,建立了層次分析法(analytic hierarchy process,AHP)熵值賦權(quán)模型,綜合分析了上海市出租車的供求匹配度在不同區(qū)域、不同時段的變化.
在城市車輛運力配置方面,陳文龍[57]指出,運力規(guī)模較小則不能滿足出行需求,規(guī)模較大則會造成資源浪費,可見出租車規(guī)模會間接影響乘客預(yù)期等待時間要求,通過運力規(guī)模測算模型,為控制城市出租車數(shù)量提供決策支持.部分學(xué)者通過分析歷史數(shù)據(jù)得到出租車乘客整體需求,從而預(yù)估城市出租車量運力配置數(shù)目.例如Yang等[58]通過分析紐約市出租車乘客的不同時間段的乘車需求建立了整個城市的出租車需求模型;Daniel[59]基于紐約城市的出租車數(shù)據(jù),論證了空駛出租車數(shù)量和乘客需求之間存在非彈性關(guān)系,通過計算每增加一輛車的邊際成本來確定城市出租車整體規(guī)模.另外,還有學(xué)者通過建立考慮多因素的綜合預(yù)測模型進(jìn)行研究,如楊英俊等[60]提出基于小波神經(jīng)網(wǎng)絡(luò)的城市出租車保有量預(yù)測模型,該模型考慮了人口、出行強(qiáng)度、出行需求、經(jīng)濟(jì)發(fā)展水平等城市環(huán)境參數(shù)的影響.
事件維度的需求預(yù)測是從影響需求的特定事件出發(fā),關(guān)注某個事件引發(fā)的需求.此類需求預(yù)測可分為已知事件下的出行需求預(yù)測研究和未知事件下的出行熱點區(qū)域預(yù)測2類.
許多能夠提前獲知的事件(如大型活動)容易引發(fā)大量交通需求,其在疏散時的交通供需矛盾尤為突出.這類事件結(jié)束后0.5~1.0 h是交通需求旺盛期[61],在活動結(jié)束20~35 min時交通量達(dá)到峰值[62].此類交通需求預(yù)測主要基于事件規(guī)模特征、城市交通、經(jīng)濟(jì)情況以及國內(nèi)外同類事件的經(jīng)驗.John[63]以奧運會為例強(qiáng)調(diào)了大型活動中交通需求分析的重要性;Latoski等[64]從特殊活動事件帶來的交通吸引、交通疏散不同維度進(jìn)行乘車需求分析,但并沒有對交通方式進(jìn)行劃分,無法得到出租車的需求量;王曉光等[65]針對武漢市江灘篝火晚會結(jié)束后的人員疏散所引起的乘車需求進(jìn)行了預(yù)測研究,基于4階段法對公交、私家車、出租車這3類出行方式進(jìn)行交通分配,得到了出租車需求量;趙躍萍[66]將出行者細(xì)分為活動參與者(外地人員、本地人員)、工作人員、志愿者等,并根據(jù)出行者特征進(jìn)行不同交通方式的需求預(yù)測.在以往的研究中,通常的預(yù)測流程包含如下2歩:①參考?xì)v史數(shù)據(jù),預(yù)估本地觀眾和外地觀眾的人數(shù)比例,利用趨勢外推法和恩格爾系數(shù)法(考慮門票價格、區(qū)域居民人均收入)得到本地各區(qū)交通量;②建立觀眾分布模型,得到各小區(qū)的人群分布,并將人流量轉(zhuǎn)化為車流量.在4階段法的基礎(chǔ)上,對交通需求預(yù)測方法進(jìn)行改進(jìn).之后,將活動參與者進(jìn)行分類,主要對觀眾出行方式進(jìn)行預(yù)測,通過狀態(tài)轉(zhuǎn)移方程,將調(diào)查得到的交通方式占有率轉(zhuǎn)為新的比例,即得到出租車需求量[67].
如今,公眾出行理念發(fā)生了較大變化,網(wǎng)約車為大型活動等事件后的人員疏散提供了更加靈活、便利的交通方式.然而,既有研究側(cè)重于總體車流量的估計,并未對交通方式進(jìn)行劃分,缺乏面向網(wǎng)約車出行方式的需求預(yù)測.另外,既有研究在預(yù)測過程中未能充分考慮消費者偏好、異常氣候等因素[68].
目前,專門面向網(wǎng)約車出行方式的出行熱點區(qū)域分析的研究較少,因此本工作對城市居民出行熱點區(qū)域分析的研究進(jìn)行總結(jié),內(nèi)容包括數(shù)據(jù)源的選取、模型建立方法等.
由于數(shù)據(jù)源獲取技術(shù)的限制,故這方面的早期研究主要基于出租車GPS數(shù)據(jù)展開.Tseng等[69]基于出租車GPS數(shù)據(jù),推斷道路之間的流量關(guān)系,建立了城市區(qū)域交通流量估計模型,為出行需求熱點區(qū)域預(yù)測研究提供依據(jù);孫貴治[70]基于出租車GPS軌跡數(shù)據(jù),采用隱馬爾可夫地圖匹配算法修正偏離實際路網(wǎng)的出租車軌跡點,并采用K-means聚類和系統(tǒng)聚類的組合模型以及DNN回歸算法實現(xiàn)了出行需求預(yù)測模型;陳紅麗[71]以出租車的GPS上下車軌跡點數(shù)據(jù)為基礎(chǔ),利用DBSCAN(density-based spatial clustering of applications with noise)聚類算法進(jìn)行聚類分析,接著使用ArcGIS平臺對聚類結(jié)果進(jìn)行可視化,識別出城市居民出行的熱點區(qū)域,并建立熱點區(qū)域的吸引力指數(shù),這不但可以進(jìn)行交通出行評估,還能合理預(yù)測未來居民出行需求.該類研究中數(shù)據(jù)源比較單一,且使用的出租車GPS軌跡數(shù)據(jù)時間跨度十分有限,出行需求特征較少.
隨著數(shù)據(jù)源多樣性的發(fā)展,利用數(shù)據(jù)融合技術(shù)能夠?qū)€體出行進(jìn)行時空軌跡的精準(zhǔn)刻畫,從而改善以往研究中出行熱點預(yù)測準(zhǔn)確率不高的缺點[72-74].這是因為:①結(jié)合手機(jī)信令數(shù)據(jù)進(jìn)行研究,如李追日[75]結(jié)合手機(jī)信令數(shù)據(jù)、出租車歷史/出行軌跡信息,建立了交通方式劃分及出行流量分配模型,推估出各個時間段研究區(qū)域的道路交通需求;②結(jié)合手機(jī)App數(shù)據(jù)進(jìn)行研究,如鄧博[76]通過手機(jī)App獲取居民的出行軌跡數(shù)據(jù),并結(jié)合社會經(jīng)濟(jì)屬性數(shù)據(jù),利用雙層停留點識別方法結(jié)合閾值法提取出行方式和出行目的信息;余琳玲[77]基于曲線擬合和道路拓?fù)浣Y(jié)構(gòu)相結(jié)合的聯(lián)合道路匹配算法,對用戶位置信息進(jìn)行定位,并對手機(jī)應(yīng)用的后臺業(yè)務(wù)特征信息進(jìn)行解析、挖掘,結(jié)合行人的歷史出行軌跡,著眼于群體行為,進(jìn)行出行方式的分析.③采用多源數(shù)據(jù)融合的方法,如張曉鵬[78]基于手機(jī)信令數(shù)據(jù)和相關(guān)的POI、天氣、路網(wǎng)等城市多源數(shù)據(jù),使用Hadoop平臺和Map Reduce計算框架等大數(shù)據(jù)技術(shù),對數(shù)據(jù)進(jìn)行處理和分析,提出了一種基于時間序列特性和POI特征的城市區(qū)域聚類合并算法,保證了對用戶出行用車需求量預(yù)測的精準(zhǔn)度;張凱[79]從出租車出行軌跡歷史數(shù)據(jù)和城市興趣點的數(shù)據(jù)中挖掘時空語義,設(shè)計并實現(xiàn)了一種基于時空聚類的自適應(yīng)出行需求熱點預(yù)測的算法,對未來乘客出行需求熱點進(jìn)行了預(yù)測,這類研究缺少對時空停留點更加精細(xì)的劃分,夜間熱點區(qū)域預(yù)測命中率較低,對于感知實時的路況以及突發(fā)事件帶來的影響也需完善.
近年來,國外以Uber為代表、國內(nèi)以滴滴為代表的互聯(lián)網(wǎng)出行方式迅速發(fā)展,給傳統(tǒng)巡游式出租車行業(yè)帶來了挑戰(zhàn).本研究系統(tǒng)綜述了網(wǎng)約車(主要指網(wǎng)約快車和網(wǎng)約出租車)的研究現(xiàn)狀,相關(guān)文獻(xiàn)主要涵蓋了網(wǎng)約車出行影響因素、時間維度的出行需求預(yù)測、事件維度的出行需求預(yù)測3個方面.總體來看,國外研究起步相對較早,在短時交通預(yù)測、車輛資源配置等方面均涌現(xiàn)出大量的數(shù)學(xué)模型及算法;而國內(nèi)研究起步較晚,主要集中于面向傳統(tǒng)巡航式出租車的乘客需求熱點區(qū)域、供需匹配度等方面,針對網(wǎng)約車出行需求預(yù)測的定量分析的研究較少,其總結(jié)如下.
(1)在網(wǎng)約車出行需求影響因素方面.研究表明,網(wǎng)約車對預(yù)計候車時間和車內(nèi)行駛時間比較敏感,天氣條件、交通狀況等帶來的候車時間不確定性的增大會減少該種方式的選擇概率.同時,網(wǎng)約車在出行費用上富有彈性,制定合理的出行費率對調(diào)節(jié)網(wǎng)約車的出行分擔(dān)比例有重要作用.
(2)在網(wǎng)約車出行短期需求預(yù)測方面.考慮到城市不同區(qū)域之間的出行需求有較大差異,區(qū)域級短期需求預(yù)測是重要任務(wù),從時空維度綜合挖掘出網(wǎng)約車用戶歷史出行的特征是研究關(guān)鍵.相鄰區(qū)域空間、較遠(yuǎn)區(qū)域空間之間的相互影響以及關(guān)聯(lián)性給網(wǎng)約車短期需求預(yù)測工作帶來了難度.
在網(wǎng)約車出行長期需求預(yù)測方面.城市范圍的車輛整體資源配置以及供需平衡研究是主要任務(wù).如果整體服務(wù)車輛資源過少,則不能夠滿足出行需求;如果服務(wù)車輛資源過多,則會加劇交通擁堵.影響網(wǎng)約車資源配置的因素較多,如運營模式、司機(jī)招募條件、服務(wù)車輛資格等,目前的大部分研究主要是針對傳統(tǒng)模式的出租車,關(guān)于網(wǎng)約車的整體資源配置的研究較少.
(3)在事件維度的網(wǎng)約車出行需求預(yù)測方面.從事件本身出發(fā)的研究相對較少,對大型活動等能夠提前獲知的事件,其客流來源復(fù)雜,返程需求多樣化,往往對特定時間下的區(qū)域交通會產(chǎn)生較大影響.雖然網(wǎng)約車的靈活機(jī)動性能夠彌補(bǔ)公交班車疏散客流的不足,但網(wǎng)約車的提前調(diào)度時間、調(diào)度區(qū)域需要進(jìn)行合理安排.此外,如何主動挖掘分析未知聚集性活動事件也有待于進(jìn)一步研究.
國內(nèi)外學(xué)者對網(wǎng)約車出行需求預(yù)測的關(guān)鍵技術(shù)進(jìn)行了大量研究,并取得了較豐富的研究成果.然而,既有研究中尚存在如下幾點不足.
(1)對網(wǎng)約車出行需求的影響因素考慮不夠全面.交通需求系統(tǒng)是有人參與的、時變的、復(fù)雜的非線性大系統(tǒng).這些影響因素的高度不確定性,不僅由自然因素(如季節(jié)、氣候因素等)造成的,還有人為因素(如大型活動和突發(fā)事件、乘客/駕駛員的心理狀態(tài)等)造成的.這些因素的不確定性較大,規(guī)律性不明顯,也是交通需求預(yù)測的難點.在網(wǎng)約車出行需求預(yù)測方面,既有研究主要從歷史數(shù)據(jù)中挖掘時空特性,沒有全面考慮當(dāng)前交通環(huán)境、天氣環(huán)境等多方面因素對乘車需求的影響.
(2)在網(wǎng)約車出行需求預(yù)測過程中未能充分結(jié)合時空特性.城市計算的特點之一在于城市數(shù)據(jù)的多樣性,而多模態(tài)的數(shù)據(jù)是從不同的角度展示著城市的方方面面.在網(wǎng)約車需求預(yù)測問題中合理地使用多模態(tài)數(shù)據(jù),可以讓預(yù)測模型獲取更多的信息,使得預(yù)測模型的性能更加完備.既有研究在網(wǎng)約車需求量預(yù)測過程中往往沒有充分結(jié)合時空特性,基于區(qū)域范圍的網(wǎng)約車出行需求預(yù)測任務(wù)是非歐式的,數(shù)據(jù)格式不再是矩陣,大部分既有研究中所使用的卷積神經(jīng)網(wǎng)絡(luò)模型無法很好地應(yīng)對此類問題,也難以明確區(qū)域之間的時空依賴性對預(yù)測精度的影響.
(3)大型事件下的網(wǎng)約車出行需求預(yù)測研究較少.城市組織大型活動后的大量人流往往很難在短時間內(nèi)疏散,這很大一部分原因是周圍沒有可供乘坐的交通工具,而交通方式的選擇通常與城市客運交通結(jié)構(gòu)的總體構(gòu)成、多種交通方式的競爭和供應(yīng)情況及大型活動時的交通管制方案有關(guān).網(wǎng)約車作為較靈活的交通工具,往往在大型活動的交通中扮演重要角色,然而目前針對大型活動中網(wǎng)約車出行需求預(yù)測的研究還相對較少.
交通出行方式的千變?nèi)f化,背后都隱藏著一個不可逆轉(zhuǎn)的邏輯——智慧化,即在最少的人工干預(yù)下,通過技術(shù)讓出行更加高效便捷,并享受更多的增值服務(wù).為了給網(wǎng)約車用戶提供更加精準(zhǔn)且個性化的智能交通服務(wù),網(wǎng)約車需求預(yù)測的進(jìn)一步研究可以從以下幾個角度進(jìn)行考慮.
(1)考慮互聯(lián)網(wǎng)出行方式下的乘客用車需求特性,結(jié)合大規(guī)模時空出行數(shù)據(jù),建立在城市范圍內(nèi)的網(wǎng)約車服務(wù)資源供需匹配度模型,進(jìn)行車輛資源配置優(yōu)化與城市運力計算.
(2)考慮應(yīng)用人工特征工程或圖卷積網(wǎng)絡(luò)處理城市各區(qū)域之間關(guān)系的不規(guī)則性所造成的非歐式結(jié)構(gòu)數(shù)據(jù),令空間特征的抽取更加合理有效.
(3)研究大型活動下的網(wǎng)約車出行需求特性,建立相應(yīng)的需求預(yù)測模型,明確因其而誘發(fā)的網(wǎng)約車出行需求的時空分布特性.