楊晨曦,莊旭菲,陳俊楠,李 衡
內(nèi)蒙古工業(yè)大學(xué)信息工程學(xué)院,呼和浩特 010080
優(yōu)先發(fā)展城市公交系統(tǒng),提高其服務(wù)質(zhì)量和吸引力,可以減少私人車輛的使用,從而達(dá)到緩解交通擁堵、提高城市公共服務(wù)水平、節(jié)約資源和保護(hù)環(huán)境的目的。時間可靠性是衡量公交系統(tǒng)服務(wù)質(zhì)量的決定性因素之一,主要體現(xiàn)為對公交行駛軌跡的準(zhǔn)確預(yù)測,即對公交線路上的重要位置點(站點或道路交叉口)進(jìn)行準(zhǔn)確的公交到達(dá)時間(bus arrival time,BAT)預(yù)測。由于公交旅行時間(bus travel time,BTT)計算為公交車從某一軌跡點行駛到目標(biāo)軌跡點的總時間[1],故可以將公交行駛軌跡預(yù)測、BTT預(yù)測和BAT預(yù)測視為同一問題的不同描述。準(zhǔn)確預(yù)測BAT的重點在于合理選擇影響因素,收集有效的觀測數(shù)據(jù)并進(jìn)行數(shù)據(jù)預(yù)處理,最終研究合適的預(yù)測模型。如圖1簡述了BAT預(yù)測問題的研究方法。
圖1 BAT預(yù)測問題的研究方法Fig.1 Research method for BAT prediction problem
近年來,眾多學(xué)者在BAT 預(yù)測領(lǐng)域進(jìn)行了大量研究,利用交通數(shù)據(jù)設(shè)計了一系列算法和模型。同時,也有一些學(xué)者對這些方法進(jìn)行了總結(jié)。柏夢婷等人[2]主要對高速公路上的行程時間預(yù)測方法進(jìn)行了總結(jié)分析,對城區(qū)內(nèi)的公交行程時間預(yù)測方法分析較少。Abdi 等人[3]對不同場景下,包括公交車在內(nèi)的各種類型車輛的出行時間預(yù)測方法進(jìn)行了總結(jié),但對基于深度學(xué)習(xí)的BAT 預(yù)測方法分析不足。Singh 等人[4]總結(jié)了使用機(jī)器學(xué)習(xí)算法和基于深度學(xué)習(xí)模型的BAT預(yù)測方法,但對基于深度學(xué)習(xí)的組合模型討論較少,也缺少對圖神經(jīng)網(wǎng)絡(luò)在BAT預(yù)測領(lǐng)域的分析。隨著深度學(xué)習(xí)領(lǐng)域的發(fā)展,越來越多的學(xué)者應(yīng)用并改進(jìn)了相關(guān)的模型算法進(jìn)行BAT預(yù)測,并且嘗試將不同的模型組合進(jìn)一步提高預(yù)測精度,其中將空間特征提取模型和時間特征提取模型進(jìn)行進(jìn)行組合,引起了廣泛關(guān)注。
本文回顧了近年來BAT預(yù)測領(lǐng)域的相關(guān)研究文獻(xiàn),討論了相關(guān)研究所涉及的影響因素和數(shù)據(jù)集,分析了這些研究所使用的模型方法并總結(jié)為歷史平均模型、參數(shù)模型和非參數(shù)模型三大類。參數(shù)模型包括回歸模型和時間序列模型,非參數(shù)模型以基于人工智能的模型為主,包括使用機(jī)器學(xué)習(xí)算法和基于深度學(xué)習(xí)的模型。本文重點闡述了基于深度學(xué)習(xí)的BAT預(yù)測方法,對比了各類方法的優(yōu)勢和局限性。最后,列舉了BAT預(yù)測模型的評價指標(biāo),總結(jié)了當(dāng)前BAT預(yù)測領(lǐng)域中所面臨的挑戰(zhàn)、存在的問題和未來的研究方向。
高質(zhì)量的公交運行數(shù)據(jù)集對于建立BAT 預(yù)測模型和獲得更為準(zhǔn)確的預(yù)測結(jié)果有著重要意義。BAT 預(yù)測模型的構(gòu)建依賴于公交歷史運行數(shù)據(jù),將一些可以收集并且對公交運行有著一定影響的因素構(gòu)建為輔助數(shù)據(jù)集,與公交歷史運行數(shù)據(jù)相結(jié)合輸入模型會提高預(yù)測精度。使用各種數(shù)據(jù)預(yù)處理方法可以提升數(shù)據(jù)集的質(zhì)量,進(jìn)一步改善模型的性能。
(1)基于GPS的公交車運行數(shù)據(jù)
通過部署GPS定位系統(tǒng)等數(shù)據(jù)收集設(shè)備,可以收集公交車的GPS軌跡數(shù)據(jù)、車輛自動定位(automatic vehicle location,AVL)數(shù)據(jù)和乘客自動計數(shù)(automatic passenger counting,APC)數(shù)據(jù)。GPS軌跡數(shù)據(jù)針對公交在線路上的運行狀況,以一定的采樣頻率記錄公交車在行駛過程中的經(jīng)緯度坐標(biāo)、時間戳、速度和方向角等實時信息。AVL 和APC 系統(tǒng)則重點收集公交車在站點處的信息,如公交車到站和離站時間、下車乘客人數(shù)等。
(2)其他類型數(shù)據(jù)集
有一些研究使用交通監(jiān)控攝像頭記錄的數(shù)據(jù)[5-6]、射頻識別(radio frequency identification,RFID)數(shù)據(jù)[7],以及通過乘客手機(jī)應(yīng)用程序收集的數(shù)據(jù)[8]等其他類型的數(shù)據(jù)。交通監(jiān)控攝像數(shù)據(jù)由部署在公交線路途經(jīng)站點和交叉口等重要位置點的交通攝像頭采集獲得,利用目標(biāo)檢測技術(shù)識別公交車及其車牌,結(jié)合攝像頭的經(jīng)緯度位置信息和數(shù)據(jù)記錄時間戳,可以得到公交車在不同數(shù)據(jù)采集點間路段的旅行時間,為預(yù)測公交到達(dá)線路上數(shù)據(jù)采集點的時間提供數(shù)據(jù)支撐。RFID數(shù)據(jù)可以通過公交車上的RFID電子標(biāo)簽和路側(cè)的RFID讀卡器,準(zhǔn)確獲取公交車的運行軌跡。有的研究[8]開發(fā)了面向乘客的手機(jī)應(yīng)用程序,收集乘客提供的出行信息,調(diào)用手機(jī)的GPS并以一定的采樣頻率獲取公交車的實時位置和速度等數(shù)據(jù),這可以視為車載定位設(shè)備。
輸入BAT 預(yù)測模型的影響因素可以分為靜態(tài)因素和動態(tài)因素兩類,或者根據(jù)其在現(xiàn)實中的影響對象分為公交車運行因素、城市道路交通因素和增強(qiáng)因素。表1對BAT預(yù)測模型的影響因素進(jìn)行了詳細(xì)的梳理。有的研究還提到了司機(jī)駕駛特征[9],將其分為正常、粗魯和緩慢三種類型[3]。粗魯?shù)乃緳C(jī)往往反應(yīng)迅速,在同一個區(qū)域,一個粗魯?shù)乃緳C(jī)會比一個正?;蚓徛乃緳C(jī)更早到達(dá)目的地。
表1 公交行駛軌跡預(yù)測模型的影響因素Table 1 Influencing factors of bus travel trajectory prediction models
影響因素通常需要進(jìn)行處理后才能輸入模型。對于線路長度、站點和交叉口數(shù)量以及溫濕度等有具體取值的連續(xù)變量,可以直接輸入模型或使用Z分?jǐn)?shù)進(jìn)行標(biāo)準(zhǔn)化。而對于天氣狀況、工作日與節(jié)假日以及一天中的時段等分類變量,通常使用以下幾種方法:對于天氣狀況等存在有序關(guān)系的因素,使用標(biāo)簽編碼將類別映射到整數(shù);使用One-Hot編碼將分類變量轉(zhuǎn)化為二進(jìn)制向量,但處理如時段等存在多個類別的分類變量時,會導(dǎo)致數(shù)據(jù)維度增加,浪費存儲和計算資源;使用Embedding方法將類別映射到連續(xù)向量空間,在降低數(shù)據(jù)維度的同時將具有相似語義的分類值嵌入到相近位置。
數(shù)據(jù)清洗方法可糾正原始數(shù)據(jù)集中存在的缺失、異常和重復(fù)等數(shù)據(jù)不一致現(xiàn)象,并根據(jù)預(yù)測模型的輸入要求,可進(jìn)一步執(zhí)行聚類操作對數(shù)據(jù)集進(jìn)行劃分。
插值法和歷史平均法分別基于近期和過去同時期的公交運行狀況補(bǔ)充缺失數(shù)據(jù),平滑方法可以去除原始數(shù)據(jù)集中的噪聲和存在異常的數(shù)據(jù)點。主成分分析(principle component analysis,PCA)可以去除高度相關(guān)的重疊信息并降低輸入特征的維度,以提高數(shù)據(jù)有效性[10]。謝智穎等人[11]提出了基于時空相關(guān)性的公交大數(shù)據(jù)清洗方法,并通過實驗證明了對公交數(shù)據(jù)進(jìn)行清洗可以提高模型預(yù)測精度。
Zhang 等人[12]依據(jù)公交運行時間,采用K-means 算法將所有樣本數(shù)據(jù)劃分到分別表示低峰、平峰、小高峰和高峰的四個簇中。Khetarpaul等人[13]應(yīng)用模糊可能性C-means(fuzzy possibilistic C-means clustering,F(xiàn)PCM)算法將公交行程分為準(zhǔn)點、晚點和提前到站三種情況,其中FPCM 算法使每個數(shù)據(jù)點與每個聚類有特定的隸屬度級別,同時可以識別數(shù)據(jù)集中的異常值與噪聲點。He 等人[14]和Alkilane 等人[15]均通過非負(fù)矩陣分解(nonnegative matrix factorization,NMF)算法識別公交車在不同路段上的相似出行時間范式,并以此為依據(jù)將出行時間范式相同的路段劃分到一個簇中。
通過分析不同路段上的相似交通模式,將公交線路中的路段進(jìn)行聚類,反映了公交出行時間的變化趨勢,對于提高預(yù)測精度有著積極的影響。
公交軌跡由公交車的時間和空間信息構(gòu)成,公交行駛軌跡預(yù)測問題可以視為確定公交線路上的某一具體位置,預(yù)測對應(yīng)的BAT。近年來,學(xué)者們在BAT 預(yù)測領(lǐng)域提出了一系列的預(yù)測模型和算法,這些方法的分類如圖2所示。在非參數(shù)模型中,由于深度學(xué)習(xí)技術(shù)的不斷發(fā)展以及基于深度學(xué)習(xí)的相關(guān)模型在時間序列預(yù)測研究中展現(xiàn)出來的優(yōu)越性能,基于深度學(xué)習(xí)的模型成為如今BAT預(yù)測領(lǐng)域中最受學(xué)者們歡迎的方法之一,并且從應(yīng)用單一模型逐步轉(zhuǎn)變?yōu)檠芯磕軌虿东@城市道路空間相關(guān)性和公交運行時間相關(guān)性的組合模型。
圖2 預(yù)測模型分類Fig.2 Prediction models classification
歷史平均模型假設(shè)預(yù)測時間段的交通狀況與過去同時期基本一致[16],依托于大量歷史數(shù)據(jù)取平均值對公交到達(dá)時間進(jìn)行預(yù)測。根據(jù)使用的歷史數(shù)據(jù)類型,可分為平均出行時間法和平均速度法。
Chung等人[17]基于歷史行程時間和當(dāng)前的運行條件計算公交車的到達(dá)時間。與實時數(shù)據(jù)相結(jié)合可以提高預(yù)測精度,Gong 等人[18]將公交車的歷史運行數(shù)據(jù)與實時運行數(shù)據(jù)進(jìn)行加權(quán)處理并利用實時信息對預(yù)測結(jié)果進(jìn)行對比反饋,提高了到站時間的預(yù)測精度。
歷史平均模型不能反映間歇性外部影響(如交通事故和交通擁堵)引起的交通時間變化,而城市交通網(wǎng)絡(luò)有著實時交通狀況復(fù)雜的特點,從而導(dǎo)致該類模型的魯棒性較差。在近年來的研究中,該類方法通常作為基線模型以將預(yù)測結(jié)果與其他方法進(jìn)行比較。
參數(shù)模型可以通過結(jié)構(gòu)化表達(dá)式和一組參數(shù)來表示,通常假設(shè)數(shù)據(jù)服從某種分布。該模型需要定義輸入變量和目標(biāo)變量(輸出)之間的關(guān)系,并仔細(xì)確定參數(shù),參數(shù)通常由實驗測量或理論計算得到,其維度空間是有限的。參數(shù)模型主要分為回歸模型和時間序列模型。
2.2.1 回歸模型
線性回歸模型是最具有代表性的一類參數(shù)模型,它基于自變量和因變量之間的線性關(guān)系,其中交通狀況和外部因素被合并為自變量[19]。
Qi 等人[20]將站間距離、站間出行時間、站間交叉口數(shù)、交叉口交通量和交通信號配時方案這五個因素作為輸入變量,提出了基于回歸分析的公交站間出行時間預(yù)測模型。Zhang等人[21]應(yīng)用了基于交通流理論的非線性回歸模型,提出了一種在上游信號交叉口和周邊交通流共同影響下的公交到站時間預(yù)測模型。然而,回歸模型對公交出行時間的預(yù)測結(jié)果因自變量組合的不同而有所差異,尤其是在交通狀況復(fù)雜且通常伴隨嚴(yán)重?fù)矶碌某鞘械缆分?,模型的輸入變量具有高度的不確定性并遵循復(fù)雜的關(guān)系,這會導(dǎo)致模型的預(yù)測精度較低。
2.2.2 時間序列模型
時間序列模型包括卡爾曼濾波(Kalman filtering,KF)模型、自回歸綜合移動平均(autoregressive integrated moving average,ARIMA)模型和粒子濾波模型(particle filter,PF)。
Reinhoudt等人[22]首次將KF算法引入公交到站預(yù)測研究中。Vanajakshi等人[23]將線路等長劃分,使用KF模型預(yù)測公交出行時間。Wang 等人[24]在KF 算法中加入遺忘因子,降低了交通信息對預(yù)測模型的影響,并提高了多步預(yù)測的精度。由于KF 模型通常使用線性濾波器,因此很難捕捉和預(yù)測城市公交系統(tǒng)中復(fù)雜的非線性動態(tài)特征,為了克服這一點,可以推廣到擴(kuò)展卡爾曼濾波模型[25],但當(dāng)多個路段同時產(chǎn)生結(jié)果時,計算成本則會迅速增加[26]。
ARIMA 模型是一種基于時間序列的統(tǒng)計模型,早期研究使用單變量ARIMA模型預(yù)測行程時間[27]。季節(jié)ARIMA 模型加入了季節(jié)性因素,根據(jù)季節(jié)差異進(jìn)行了修改[28]。Xiang等人[29]結(jié)合遺傳算法(genetic algorithm,GA)構(gòu)造GA-ARIMA 模型預(yù)測公交到站時間,其結(jié)果優(yōu)于傳統(tǒng)的時間序列模型。然而ARIMA模型是基于線性時間序列關(guān)系的假設(shè)構(gòu)建的,無法捕獲非線性關(guān)系,同時還要求輸入序列數(shù)據(jù)是穩(wěn)定的。
粒子濾波更適用于處理非線性和非高斯系統(tǒng)。任遠(yuǎn)等人[30]基于粒子濾波預(yù)測公交到站時間并與KF算法進(jìn)行對比,結(jié)果表明PF算法有著更高的預(yù)測精度、更好的適用性與穩(wěn)定性。Dhivyabharathi 等人[31]將路段進(jìn)行等長度劃分后應(yīng)用粒子濾波算法,并使用KNN 算法獲取輸入,以預(yù)測高度可變交通情況下的公交車出行時間。然而粒子濾波算法在高維狀態(tài)空間中的計算復(fù)雜性較高,隨著迭代次數(shù)的增加,有可能出現(xiàn)粒子退化現(xiàn)象。
非參數(shù)模型不假設(shè)特定的數(shù)據(jù)分布,其結(jié)構(gòu)或相應(yīng)的數(shù)學(xué)函數(shù)不是預(yù)先確立的。非參數(shù)模型是由收集的數(shù)據(jù)而不是預(yù)先確定的分布決定的,因此與其他方法相比,非參數(shù)模型需要更多的數(shù)據(jù)。非參數(shù)模型包括支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等淺層機(jī)器學(xué)習(xí)模型和基于深度學(xué)習(xí)的模型。
支持向量機(jī)(support vector machine,SVM)可以較好地解釋影響因素和公交行程時間之間的非線性關(guān)系,是公交行程時間研究領(lǐng)域常用的模型之一。Yu 等人[32]以大連市的一條公交線路為例進(jìn)行實驗,證明了超參選擇合適情況下,SVM 模型可以較為準(zhǔn)確地預(yù)測公交到站時間。構(gòu)造改進(jìn)的SVM 模型或與其他模型組合,可以獲得更好的預(yù)測結(jié)果。Yu 等人[33]將遺忘因子加入SVM模型來預(yù)測公交出行時間,提高了SVM的預(yù)測準(zhǔn)確度。柏叢和彭仲仁[34]建立了基于SVM-KF 的動態(tài)模型預(yù)測公交行程時間,其中SVM 使用歷史數(shù)據(jù)進(jìn)行靜態(tài)預(yù)測,KF 依據(jù)最新的數(shù)據(jù)對靜態(tài)預(yù)測結(jié)果進(jìn)行調(diào)整。Hashi等人[35]在SVM-KF模型的基礎(chǔ)上使用遺傳算法優(yōu)化SVM 參數(shù),進(jìn)一步提高了模型的準(zhǔn)確度。由于SVM 過于依賴核方法,在大規(guī)模問題中擴(kuò)展性差。當(dāng)面對高維、大規(guī)模數(shù)據(jù)時,會導(dǎo)致模型的計算量增大和預(yù)測結(jié)果的精度降低。隨著公交歷史數(shù)據(jù)和其他交通信息的海量積累,基于SVM 的模型已不適用于公交出行時間預(yù)測。
人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)可以捕捉交通問題中存在的非線性和隨機(jī)情況。BP神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)是一種特定類型的ANN,在訓(xùn)練過程中使用反向傳播算法來更新權(quán)重。Chen等人[36]利用APC數(shù)據(jù)研究了基于ANN的公交到站時間預(yù)測模型,并考慮了天氣因素的影響。Hua等人[37]基于前一站點的多線路公交到站時間數(shù)據(jù),使用ANN 預(yù)測公交車到達(dá)目標(biāo)站點的時間。Zhang 等人[12]將公交運行數(shù)據(jù)按照時段劃分為多個聚類,對每個聚類建立一個BPNN模型進(jìn)行預(yù)測。Kee等人[38]將公交到站時間預(yù)測問題轉(zhuǎn)換為一個多標(biāo)簽分類問題,并考慮了日期和高峰時段等影響因素,實驗結(jié)果表明,ANN優(yōu)于決策樹、隨機(jī)森林和樸素貝葉斯等算法。雖然ANN能夠使用簡單的體系結(jié)構(gòu)對復(fù)雜和非線性行為進(jìn)行建模。然而,對于日益復(fù)雜的城市交通場景,這些模型可能不足以提供高精度的預(yù)測結(jié)果。隨著深度學(xué)習(xí)的高速發(fā)展,ANN在BAT領(lǐng)域的應(yīng)用顯著減少,在大多數(shù)情況下作為基線模型。
歷史平均模型、參數(shù)模型和淺層機(jī)器學(xué)習(xí)模型等一系列基于非深度學(xué)習(xí)模型的BAT預(yù)測方法對比分析,如表2所示??傮w來說,SVM和人工神經(jīng)網(wǎng)絡(luò)這類基于淺層機(jī)器學(xué)習(xí)的模型在BAT預(yù)測中,在處理復(fù)雜的非線性關(guān)系、預(yù)測任務(wù)涉及大規(guī)模數(shù)據(jù)集和特征抽取時,一般要優(yōu)于歷史平均模型、回歸模型和時間序列模型。
表2 基于非深度學(xué)習(xí)模型的BAT預(yù)測方法總結(jié)Table 2 Summary of BAT prediction methods based on non-deep learning models
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的重要分支,是近年來的研究熱點,將深度學(xué)習(xí)應(yīng)用在BAT預(yù)測領(lǐng)域,提出并使用了基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的方法、基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)及其變體的方法和基于組合模型提取時空特征的方法。
CNN已經(jīng)在計算機(jī)視覺領(lǐng)域取得了重大突破和進(jìn)展。在BAT 預(yù)測領(lǐng)域,已有一些學(xué)者探索了基于CNN的方法。
Panovski 等人[39]創(chuàng)建了交通密度矩陣(由若干模擬交通信息組成,每個模擬交通信息是由時間和站點數(shù)量構(gòu)成的二維矩陣),將模擬交通信息視為灰度圖,在時間和站點維度上執(zhí)行卷積操作,基于CNN 構(gòu)建了用于預(yù)測線路上所有站點到達(dá)時間的運營商數(shù)據(jù)模型。但是該模型的輸入并沒有考慮外部因素,也忽略了模擬交通信息中存在的全局時序模式。
Nithishwer 等人[40]將公交線路分段處理,將路段過去三小時的歷史行程時間數(shù)據(jù)以張量形式輸入所構(gòu)建的CNN 模型中,來獲取這些路段在未來一小時內(nèi)行程時間的預(yù)測結(jié)果。同時,從數(shù)據(jù)集中提取了時段、日期和空間模式具有高度相關(guān)的路段等額外信息輸入模型,以進(jìn)一步提高模型的預(yù)測精度。由于忽略了線路上如交叉口等重要位置的影響以及每日的高峰時間段,導(dǎo)致模型預(yù)測交通峰值時間內(nèi)對包含主干道路交叉口的路段行程時間有著較高的誤差。
Paliwal 和Biyani[41]應(yīng)用Mask-CNN 模型對公交車的站間行程時間進(jìn)行預(yù)測。模型的輸入是由公交站間行程時間構(gòu)成的二維矩陣,行和列分別表示公交車的運行次數(shù)和線路站點數(shù)。他們所使用的Mask-CNN 架構(gòu)是一個七層的全卷積網(wǎng)絡(luò),可在整個層中保持其輸入的空間分辨率,并在每個位置輸出條件分布,通過使用掩碼卷積保證預(yù)測的因果關(guān)系(即當(dāng)前路段的行程時間依賴于前序路段的行程時間)。最終,該模型的輸出以離散值的形式模擬了任意兩個站點之間的出行時間。Mask-CNN的結(jié)構(gòu)相對來說更為復(fù)雜,并且只考慮了公交車的歷史運行數(shù)據(jù),忽略了一系列外部影響因素對公交行程時間的影響。
由于傳統(tǒng)CNN在捕捉時序信息和處理變長序列方面存在局限性,時間卷積網(wǎng)絡(luò)(temporal convolutional network,TCN)是CNN在處理時間序列數(shù)據(jù)上的一種改進(jìn)模型,通過引入因果卷積和膨脹卷積,可以捕捉長期依賴關(guān)系并保持序列的因果性質(zhì)。徐丸絮[42]結(jié)合TCN和時間注意力機(jī)制(temporal pattern attention mechanism,TPA),對公交車的行程時間進(jìn)行預(yù)測。TCN通過對歷史數(shù)據(jù)進(jìn)行因果卷積計算后,傳遞給TPA的時間模式捕捉層,通過卷積操作提取時間模式信息,最終,通過注意力系數(shù)計算層獲得權(quán)重系數(shù)并求得最終輸出。但是因果卷積只能捕捉歷史時刻的時間相關(guān)性,忽略了公交運行過程中存在的反向規(guī)律性。
在BAT 預(yù)測領(lǐng)域,基于CNN 的模型已經(jīng)取得了一定的成果,但由于時間序列數(shù)據(jù)的特殊性質(zhì)和CNN 的結(jié)構(gòu)特點,其在處理時間數(shù)據(jù)方面還存在一些挑戰(zhàn)。學(xué)者們探索了許多解決方案,包括設(shè)計針對時間序列數(shù)據(jù)的TCN,利用CNN 有著提取空間特征的特點和循環(huán)神經(jīng)網(wǎng)絡(luò)等模型融合,充分利用它們在空間和時間特征捕捉方面的優(yōu)勢,從而提升模型的性能。
RNN 與其他類型的神經(jīng)網(wǎng)絡(luò)相比,提供了一種處理時間序列數(shù)據(jù)和學(xué)習(xí)長期依賴關(guān)系的有效方法,是一種專門設(shè)計用于處理具有時序關(guān)聯(lián)數(shù)據(jù)的模型。BAT預(yù)測問題作為時間序列預(yù)測問題的一類,RNN 及其變體也得到了廣泛的應(yīng)用。Raut 和Goyal[43]使用RNN 預(yù)測公交車的到站時間,將目標(biāo)線路上的天氣情況作為外部影響因素考慮在內(nèi)。他們依據(jù)當(dāng)?shù)氐膶嶋H氣候?qū)⒁荒攴譃橄募?、雨季和冬季,通過數(shù)據(jù)挖掘獲取每類季節(jié)的天氣變化量,并利用歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)來對不同天氣條件下的公交到站時間進(jìn)行預(yù)測。Pang 等人[44]利用多個途經(jīng)站點所構(gòu)成時間步長之間的長期依賴關(guān)系,通過RNN預(yù)測公交到站時間,并使用One-Hot編碼將公交歷史運行數(shù)據(jù)和城市道路基礎(chǔ)信息等異構(gòu)數(shù)據(jù)融合到同一的向量空間以輸入模型進(jìn)行預(yù)測。雖然傳統(tǒng)RNN 結(jié)構(gòu)對于短期記憶具有較好的捕捉能力,但在處理長序列時,較早時間步的信息可能會逐漸被遺忘,這可能導(dǎo)致模型難以捕捉長時間跨度內(nèi)的模式,從而影響模型的預(yù)測能力。
長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory,LSTM)是一種特殊形式的RNN,能夠捕捉時間序列問題的非線性行為并學(xué)習(xí)長期依賴信息,是為了解決傳統(tǒng)RNN 在訓(xùn)練過程中的梯度消失和梯度爆炸而開發(fā)的,因此越來越多的學(xué)者應(yīng)用LSTM預(yù)測BAT。
LSTM是一種具有門控機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò),輸入門控制輸入信息的更新,遺忘門決定細(xì)胞狀態(tài)中哪些信息要被遺忘,輸出門控制輸出細(xì)胞狀態(tài)的選擇。通過這種機(jī)制,LSTM能夠有效地處理長期依賴和記憶問題。
葉之放[45]將影響公交車運行的動、靜態(tài)因素與歷史GPS數(shù)據(jù)融合,建立了基于多源公交數(shù)據(jù)的LSTM模型對公交到站時間進(jìn)行預(yù)測,其預(yù)測結(jié)果優(yōu)于KNN、SVR和BP 神經(jīng)網(wǎng)絡(luò)。Agafonov 和Yumaganov[46]使用LSTM模型預(yù)測單條線路中公交車到達(dá)每個剩余站點的時間,并將公交車的實時數(shù)據(jù)和統(tǒng)計信息等一系列能描述交通流的異構(gòu)信息作為模型的預(yù)測影響因素,實驗結(jié)果表明了LSTM模型有著更高的預(yù)測精度,且計算時間也能滿足實時狀態(tài)下的公交到站時間預(yù)測。學(xué)者們結(jié)合外部影響因素和公交歷史數(shù)據(jù),應(yīng)用LSTM 模型在解決BAT預(yù)測問題中取得了較好的結(jié)果,但應(yīng)用各種改進(jìn)方法還能進(jìn)一步提高模型的性能和預(yù)測結(jié)果準(zhǔn)確度。表3對一些基于LSTM 模型的改進(jìn)公交出行時間預(yù)測方法進(jìn)行了分析和總結(jié)[26,47-55]。
表3 基于改進(jìn)LSTM的BAT預(yù)測方法Table 3 BAT prediction methods based on improved LSTM
對表3 中的預(yù)測方法進(jìn)行對比分析,將基于LSTM模型的BAT預(yù)測方法的改進(jìn)方向分為以下幾類。
(1)將線路視為路段的集合,按照路段的類型劃分為若干子集,為每類路段構(gòu)建模型并行預(yù)測最終將各個結(jié)果聚合。Han等人[47]將單條線路的行程簡單劃分為站間行駛時間和站點停留時間,并沒有考慮不同路段的交通模式。而He等人[14]則拓展到出現(xiàn)同站換乘行為多線路公交出行,并且依照不同的交通模式對不同路段進(jìn)行分類,為每一類路段構(gòu)建一個LSTM 模型,最終相加計算總行程時間??傮w來說,利用不同公交運行路段上的相似交通模式雖然可以提高模型的預(yù)測精度,但僅使用LSTM 模型無法捕捉不同路段之間可能存在的空間關(guān)系,同時將路段按照交通模式進(jìn)行分類組合會改變公交線路中的路段順序,破壞公交線路的空間連通性,忽略了空間上相鄰路段的交通模式在時間上存在的依賴關(guān)系。
(2)將其他類型的模型算法,如變分模態(tài)分解(variational mode decomposition,VMD)算法、粒子濾波和卡爾曼濾波算法、優(yōu)化算法等與LSTM 相結(jié)合,可以進(jìn)一步提升模型的性能和預(yù)測結(jié)果的準(zhǔn)確度。Zhou 等人[48]構(gòu)造了VMD-LSTM模型,Bharathi等人[56]則進(jìn)一步考慮了預(yù)測中的不確定性,將基于分位數(shù)回歸的損失函數(shù)與LSTM 模型結(jié)合,使用速度和交通流時間序列數(shù)據(jù),預(yù)測車輛出行時間的預(yù)測區(qū)間。不同于文獻(xiàn)[49]將多個LSTM 的預(yù)測結(jié)果作為粒子濾波算法的輸入,Liu等人[57]使用卡爾曼濾波算法消除原始數(shù)據(jù)集中的噪聲后輸入LSTM。Jiang 等人[58]和張兵等人[50]分別使用遺傳算法和改進(jìn)的海鷗算法對模型的超參數(shù)進(jìn)行尋優(yōu),有效降低了出現(xiàn)局部最優(yōu)和過擬合現(xiàn)象的概率。
結(jié)合VMD算法雖然可以捕獲公交速度序列中的時間模式和空間模式,速度序列是由每個路段的平均公交速度組合的,只能粗略反映不同路段間的交通波動,且VMD-LSTM 模型的計算復(fù)雜度相對較高。將KF 算法與LSTM結(jié)合僅在數(shù)據(jù)集處理方面進(jìn)行了改進(jìn),并沒有提升模型捕獲時間相關(guān)性的能力。LSTM 串聯(lián)粒子濾波算法雖然避免陷入局部最優(yōu)解,但沒有對LSTM本身進(jìn)行改進(jìn),同時構(gòu)建多個LSTM 模型會增加計算成本。同理,優(yōu)化算法也僅僅對參數(shù)進(jìn)行尋優(yōu),沒有改進(jìn)模型的結(jié)構(gòu)。
(3)對LSTM 模型的結(jié)構(gòu)進(jìn)行改進(jìn),改進(jìn)的模型包括增加注意力機(jī)制的LSTM、結(jié)構(gòu)簡化的門控循環(huán)單元(gate recurrent unit,GRU)、能捕捉序列中反向依賴的雙向LSTM(bidirectional LSTM,BiLSTM),以及結(jié)合了CNN 提取空間特征能力,可以提取輸入數(shù)據(jù)時空相關(guān)性的卷積LSTM(ConvLSTM)。
Chawuthai 等人[59]將自注意力層置于LSTM 之前計算輸入數(shù)據(jù)的權(quán)重,而姚江濤等人[51]則分別使用普通注意力機(jī)制和自注意力機(jī)制計算不同特征對公交行程時間的影響程度以及不同時刻BiLSTM 輸出隱狀態(tài)的權(quán)重。將LSTM 模型作為編碼器和解碼器的基礎(chǔ)結(jié)構(gòu)并引入雙階段注意力機(jī)制,構(gòu)造了基于雙階段注意力機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)(dual-stage attention-based recurrent neural network,DA-RNN)。Leong等人[60]和Zhou等人[52]使用DA-RNN模型預(yù)測公交車到站時間,賀光焰[53]構(gòu)造了融合宏觀因素的DA-RNN 模型(macro factors integrated DA-RNN,MDARNN)對涉及換乘的多線路公交出行時間進(jìn)行預(yù)測?;谧⒁饬C(jī)制的改進(jìn)使得模型關(guān)注與預(yù)測結(jié)果高度相關(guān)的特征,進(jìn)一步提高模型捕獲長期依賴的能力,但忽略了公交運行的空間特征。
Xie等人[61]考慮了影響公交運行的靜態(tài)與動態(tài)因素,分別基于LSTM、GRU、BiLSTM 和ConvLSTM 等模型預(yù)測公交到站時間,對比實驗結(jié)果表明ConvLSTM模型的預(yù)測精度最高。Wu等人[54]通過實驗證明了ConvLSTM結(jié)合自注意力機(jī)制可以進(jìn)一步提高預(yù)測精度。賴永炫等人[55]使用ConvLSTM 分別捕捉站點停留和站間行駛時間的時空相關(guān)性,預(yù)測出停留時間和行駛時間參數(shù),結(jié)合天氣等外部特征輸入LSTM 中預(yù)測公交車在線路上的運行總時間。然而ConvLSTM 模型只能關(guān)注公交線路中鄰接站點或路段的局部空間特征,無法提取整條線路中不同地理位置間的全局空間特征,而這些全局特征信息對預(yù)測結(jié)果有著重要影響。
在BAT預(yù)測問題中,基于循環(huán)神經(jīng)網(wǎng)絡(luò)和其改進(jìn)的模型方法已經(jīng)取得了不錯的成果,但這些方法通常只關(guān)注公交歷史行程的時間維度,而忽略了空間維度上的特征。雖然ConvLSTM 模型通過引入卷積操作擁有了提取空間特征的能力,但通常只能提取線路空間中的局部特征,同時也無法考慮具有共同路段的其他線路的影響。隨著相關(guān)研究從預(yù)測單條線路的公交到站時間拓展到預(yù)測出現(xiàn)換乘行為的多線路公交出行時間,空間模式也由單條線路擴(kuò)展到多條線路構(gòu)成的公交網(wǎng)絡(luò),提取不同線路和站點間的空間相關(guān)性對于準(zhǔn)確預(yù)測公交行程時間非常重要。針對上述問題,學(xué)者們將能夠提取空間特征的模型和能夠提取時間特征的模型結(jié)合,利用城市公交網(wǎng)絡(luò)中存在的時空相關(guān)性,對公交車的行程時間進(jìn)行預(yù)測。表4 列舉了一些使用可提取時空特征組合模型的BAT預(yù)測方法[15,62-67]。
表4 基于可提取時空特征組合模型的BAT預(yù)測方法Table 4 BAT prediction methods based on extractable spatio-temporal feature combination model
對表4 中所列舉的基于可提取時空特征組合模型的BAT預(yù)測方法進(jìn)行分析對比,可以發(fā)現(xiàn)在這些組合模型中,時間特征通常由循環(huán)神經(jīng)網(wǎng)絡(luò)或其變體模型進(jìn)行提取,而空間特征通常由基于CNN 的模型或基于圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)的模型進(jìn)行提取。對于單條路線來說,整個道路中的重要地理位置(如站點、交叉口和路段等)間的空間關(guān)系較為簡單,通常應(yīng)用CNN進(jìn)行空間特征的提取。而考慮到由多條線路組成的公交網(wǎng)絡(luò),不同線路與站點間的空間關(guān)系復(fù)雜,通常使用GNN相關(guān)模型進(jìn)行空間特征提取。
Wang等人[68]首先提出了一個用于預(yù)測車輛出行時間的深度學(xué)習(xí)框架(deep learning framework for travel time estimation,DeepTTE),該框架通過使用1D-CNN構(gòu)造地理卷積捕獲車輛GPS軌跡序列之間的空間特征,使用LSTM模型提取時間相關(guān)性來預(yù)測行程時間,并將外部影響因素使用Embedding 方法轉(zhuǎn)換為低維向量后輸入模型。Zhang 等人[69]和Lee 等人[64]只收集站點處的公交運行信息構(gòu)造公交軌跡序列,基于DeepTTE 模型預(yù)測公交車的行程時間。其中Zhang等[69]人分別預(yù)測站間出行時間和站點停留時間,而Lee 等人[64]在構(gòu)造公交歷史軌跡序列時將二者結(jié)合,減少了模型計算量和訓(xùn)練時間,模型結(jié)構(gòu)如圖3 所示。付麗萍[65]結(jié)合線路上公交車和其他社會車輛的軌跡數(shù)據(jù),使用由兩個卷積層、兩個池化層和一個上采樣層構(gòu)成的CNN 提取空間特征,并使用GRU 提取時間特征,有效減少了計算量和訓(xùn)練成本。
圖3 用于預(yù)測公交出行時間的深度學(xué)習(xí)框架Fig.3 Deep learning framework for bus travel time estimation
對于由GPS點組成的軌跡序列,可依據(jù)坐標(biāo)將軌跡序列直接映射到二維網(wǎng)格中,使用2D-CNN提取空間特征。若網(wǎng)格設(shè)置過大會導(dǎo)致多個坐標(biāo)點映射重合,在執(zhí)行卷積操作時有可能會忽略重要的空間特征。而網(wǎng)格設(shè)置過小會導(dǎo)致整個空間信息稀疏,難以提取所需的空間特征。只收集公交在站點處的軌跡數(shù)據(jù)構(gòu)造軌跡序列,將每個站點映射到一個網(wǎng)格,使用1D-CNN 構(gòu)造地理卷積提取公交站點序列的空間特征,可以有效避免上述兩種情況。然而這種方法忽略了站點之間的路徑特征,同時僅適用于提取單條公交線路中的空間特征。由于網(wǎng)格順序反映了線路站點順序,若擴(kuò)展到公交網(wǎng)絡(luò)考慮其他線路公交車在重疊路徑上的影響時,難以對站點進(jìn)行建模。由于公交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)相對清晰,由站點、線路和路段等元素構(gòu)成且它們之間的連接關(guān)系明確,可用圖結(jié)構(gòu)對城市公交網(wǎng)絡(luò)進(jìn)行建模。GNN 是一種用于處理圖結(jié)構(gòu)數(shù)據(jù)的深度學(xué)習(xí)模型,由于城市公交網(wǎng)絡(luò)可以用圖結(jié)構(gòu)表示,故GNN 也可以用來捕獲空間特征[70]。GNN 相關(guān)模型已經(jīng)在道路交通流預(yù)測領(lǐng)域中取得了進(jìn)展,在BAT預(yù)測問題的研究中,越來越多的學(xué)者開始將目光投向GNN相關(guān)的網(wǎng)絡(luò)模型。
Ma 等人[66]針對單條線路,利用公交GPS 軌跡數(shù)據(jù)提取站點和交叉口并通過一種節(jié)點提取算法將站點之間的路段提取為公交網(wǎng)絡(luò)圖的節(jié)點,通過構(gòu)造多重加權(quán)鄰接矩陣來表示不同節(jié)點之間距離、路徑長度的相似性和交通狀況。而Liu等人[67]則額外考慮了與目標(biāo)線路有著重疊路段的其他線路,將站點作為圖的節(jié)點,并通過設(shè)置距離閾值判斷兩個節(jié)點之間是否構(gòu)成邊。圖卷積網(wǎng)絡(luò)(graph convolutional network,GCN)是GNN 的一種改進(jìn)形式,它引入了傳統(tǒng)CNN中的卷積操作,可以更好地捕捉節(jié)點間的局部特征和全局結(jié)構(gòu)。馬禹婷[71]提出了GCN-LSTM 模型預(yù)測公交站間行程時間,通過GCN 獲取道路網(wǎng)絡(luò)的空間結(jié)構(gòu)特征,將帶有空間特征的向量輸入LSTM 模型提取時間特征并做出預(yù)測。與GCN 和LSTM 模型進(jìn)行實驗對比,GCN-LSTM 模型的預(yù)測結(jié)果更為精確。
目前,使用基于深度學(xué)習(xí)的模型已成為BAT預(yù)測領(lǐng)域的主流方法。CNN模型利用卷積操作可以有效地捕獲公交歷史軌跡序列中的局部模式和短期相關(guān)性,但其固定長度輸入限制和對長期依賴性的建模能力相對較弱,限制了CNN 在長期BAT 預(yù)測中的應(yīng)用。雖然通過引入因果卷積等構(gòu)造TCN 模型緩解了上述問題,但在BAT 預(yù)測和其他類型的時間序列預(yù)測研究中,RNN 與LSTM 等專門設(shè)計用于處理時間序列問題的循環(huán)神經(jīng)網(wǎng)絡(luò)是更好的選擇。LSTM 模型相較于CNN 模型更擅長捕捉和處理長序列中的長期依賴關(guān)系,被越來越多的學(xué)者應(yīng)用于BAT預(yù)測中。為了進(jìn)一步提升預(yù)測精度,學(xué)者們將LSTM模型與其他模型算法相結(jié)合,并嘗試對模型的結(jié)構(gòu)進(jìn)行改進(jìn),如添加注意力機(jī)制、調(diào)整模型結(jié)構(gòu)和進(jìn)行多組件融合等。
隨著BAT預(yù)測領(lǐng)域相關(guān)研究的不斷深入,影響公交運行更深層次的特征被不斷探索,其中空間特征逐漸受到學(xué)者們的重視。通過將站點位置、站間距離和線路結(jié)構(gòu)等空間特征納入公交歷史數(shù)據(jù)中,可將公交歷史軌跡序列從較為簡單的時間序列數(shù)據(jù)視為更復(fù)雜的時空序列數(shù)據(jù)??紤]到公交歷史軌跡所展現(xiàn)的時空特性以及CNN具有捕獲空間特征的能力,將CNN與RNN網(wǎng)絡(luò)相結(jié)合,對處理公交時空序列來說,相較于使用僅提取時間特征的模型有著更好的效果。面對更為復(fù)雜的公交時空數(shù)據(jù),將提取空間特征的模型與提取時間特征的模型相結(jié)合,并嘗試對組合模型的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn)和優(yōu)化,在盡可能提高模型預(yù)測精度的同時降低計算成本,已成為當(dāng)前BAT預(yù)測領(lǐng)域的主要研究方向。隨著GNN的發(fā)展和它們在交通流預(yù)測等領(lǐng)域的應(yīng)用,為BAT預(yù)測任務(wù)中的空間特征提取提供了新的研究思路,使得從預(yù)測單條公交線路拓展到預(yù)測具有部分重疊路段和站點的多線路公交網(wǎng)絡(luò)成為可能。
本文分析總結(jié)了基于深度學(xué)習(xí)的BAT 預(yù)測模型的優(yōu)勢、局限性和改進(jìn)方向,如表5所示。
表5 基于深度學(xué)習(xí)的BAT預(yù)測模型總結(jié)Table 5 Summary of BAT prediction models based on deep learning
為了對比不同類型BAT預(yù)測模型的預(yù)測精度,需要引入一些標(biāo)準(zhǔn)的性能衡量指標(biāo)對模型進(jìn)行評估,因為模型的預(yù)測結(jié)果會受到各種因素的影響,例如模型本身、數(shù)據(jù)集和外部影響因素等。BAT 預(yù)測相關(guān)的研究中經(jīng)常使用以下三種性能指標(biāo)對模型的預(yù)測準(zhǔn)確度進(jìn)行評估:平均絕對誤差(mean absolute error,MAE)、平均絕對百分比誤差(mean absolute percentage error,MAPE)和均方根誤差(root mean square error,RMSE)。在表6中對上述三種評價指標(biāo)進(jìn)行了總結(jié),并給出了它們的計算公式,在計算公式中,yt是真實值,y′t是模型得出的預(yù)測值。
表6 BAT預(yù)測模型的評價指標(biāo)Table 6 Evaluation indicators of BAT prediction models
公交行駛軌跡預(yù)測研究面臨的挑戰(zhàn)和未來的研究方向總結(jié)如下:
(1)構(gòu)造多源多模態(tài)數(shù)據(jù)集,確保數(shù)據(jù)質(zhì)量和可用性。受GPS定位系統(tǒng)穩(wěn)定性和采樣頻率的影響,公交歷史軌跡數(shù)據(jù)可能會出現(xiàn)缺失或偏移??蓪PS 定位系統(tǒng)與RFID、超寬帶(ultra wide band,UWB)等定位傳感器相結(jié)合構(gòu)造多源定位數(shù)據(jù)集,同時考慮結(jié)合交通攝像頭數(shù)據(jù)進(jìn)行多模態(tài)數(shù)據(jù)融合,以確保公交歷史軌跡數(shù)據(jù)在時間和空間維度保持連續(xù)和完整。
(2)探索公交運行的規(guī)律性和地域性因素。多數(shù)研究分析了公交的每日運行規(guī)律和每周運行規(guī)律,但忽略了線路覆蓋的區(qū)域性??梢罁?jù)周邊建筑的社會功能對站點和路段進(jìn)行區(qū)域劃分,研究公交在不同區(qū)域的運行規(guī)律。同時,可結(jié)合公交的日運行和周運行規(guī)律賦予區(qū)域相應(yīng)的權(quán)重,精細(xì)公交運行的時空相關(guān)性分析。
(3)將公交行駛軌跡預(yù)測與城市交通管理結(jié)合。公交信號優(yōu)先控制系統(tǒng)通?;诮煌ɡ碚撚嬎愎卉嚨竭_(dá)交叉口的時間,并對交通信號配時進(jìn)行調(diào)整??墒褂没谏疃葘W(xué)習(xí)的模型預(yù)測公交到達(dá)和通過交叉口的時間,為公交信號優(yōu)先控制提供更精確的決策依據(jù),但這對預(yù)測模型的精度和實時性要求更高。
(4)深入研究公交運行的時空模式,挖掘公交網(wǎng)絡(luò)的空間特征。隨著學(xué)者們開始考慮相鄰公交線路對目標(biāo)線路運行的影響,道路空間也從單條線路轉(zhuǎn)換為多條線路構(gòu)成的網(wǎng)絡(luò)??蓪⒐痪W(wǎng)絡(luò)建模為圖結(jié)構(gòu)從而考慮不同線路、子路徑和站點間的相互影響。應(yīng)用GNN相關(guān)模型提取公交網(wǎng)絡(luò)的空間特征并不斷優(yōu)化模型結(jié)構(gòu)以獲取更高精度的預(yù)測結(jié)果,將會是未來的研究重點。
(5)BAT 預(yù)測模型融合,可以提高模型的整體泛化能力。由于公交運行環(huán)境的復(fù)雜性和數(shù)據(jù)的多樣性,單一的預(yù)測模型可能無法涵蓋所有情況下的準(zhǔn)確預(yù)測。因此,可以嘗試使用不同的預(yù)測模型分別進(jìn)行BAT 預(yù)測,并將它們的預(yù)測結(jié)果進(jìn)行融合。BAT預(yù)測模型融合可以采用簡單的平均、加權(quán)平均、投票等方法,也可以采用復(fù)雜的組合技術(shù),如集成學(xué)習(xí)(隨機(jī)森林、梯度提升等)、堆疊模型等。通過模型融合,可以綜合多個模型的優(yōu)勢,提高公交行駛軌跡預(yù)測的準(zhǔn)確性和魯棒性。
本文對公交行駛軌跡預(yù)測問題進(jìn)行了分析,歸納了影響公交運行的相關(guān)因素,分析了不同預(yù)測方法的優(yōu)勢、局限性和改進(jìn)方向,并重點分析了基于深度學(xué)習(xí)的預(yù)測方法,比較了基于LSTM模型和組合模型的各種預(yù)測方法的機(jī)制、優(yōu)勢、局限性和適用場景。最后,總結(jié)了當(dāng)前面臨的挑戰(zhàn)和未來的研究方向,以期為研究公交行駛軌跡預(yù)測問題提供參考。