姚江濤,鄔群勇,余丹青,羅建平
(1.福州大學(xué)空間數(shù)據(jù)挖掘與信息共享教育部重點(diǎn)實(shí)驗(yàn)室,衛(wèi)星空間信息技術(shù)綜合應(yīng)用國(guó)家地方聯(lián) 合工程研究中心,數(shù)字中國(guó)研究院(福建),福建 福州 350108;2.廣州交信投科技股份有限公司,廣東 廣州 510000)
提升公交車到站時(shí)間預(yù)測(cè)的準(zhǔn)確性,可有效提高乘客的出行體驗(yàn),提高公交車的滿載率、分擔(dān)率、運(yùn)行效率和服務(wù)質(zhì)量,有助于進(jìn)一步優(yōu)化城市交通系統(tǒng),緩解城市交通擁堵,促進(jìn)市民出行體驗(yàn)和城市交通發(fā)展的良性互動(dòng)[1-3].
目前公交車到站時(shí)間預(yù)測(cè)根據(jù)應(yīng)用主體的不同,可以分為兩大類.一類是面向公交車公司的終點(diǎn)站到站時(shí)間預(yù)測(cè),又稱行程時(shí)間預(yù)測(cè).該類方法僅能提供終點(diǎn)站的預(yù)計(jì)到站時(shí)間,而無法提供中間站點(diǎn)的預(yù)計(jì)到站時(shí)間,主要用于公交調(diào)度.另一類是面向公交車乘客的中間站點(diǎn)到站時(shí)間預(yù)測(cè),它可以向乘客提供公交車到達(dá)上車站點(diǎn)的預(yù)計(jì)到站時(shí)間.傳統(tǒng)的中間站點(diǎn)到站時(shí)間預(yù)測(cè)模型包括歷史數(shù)據(jù)模型[4]、粒子濾波模型[5]、支持向量機(jī)(support vector machines,SVM)模型[6]、卡爾曼濾波模型[7-8]等.上述傳統(tǒng)模型的適用性和實(shí)時(shí)性相對(duì)較差,在長(zhǎng)距離預(yù)測(cè)中會(huì)出現(xiàn)精度下降的現(xiàn)象,無法較好地捕獲公交車行駛過程中的時(shí)空規(guī)律.隨著機(jī)器學(xué)習(xí)的發(fā)展,較多學(xué)者將神經(jīng)網(wǎng)絡(luò)模型應(yīng)用到公交車中間站點(diǎn)的到站時(shí)間預(yù)測(cè)中.鄺先驗(yàn)等[9]提出基于天牛須搜索算法的小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型;謝芳等[10]提出一種基于MapReduce聚類和BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型;Xie等[11]創(chuàng)建多層循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)預(yù)測(cè)模型;安宇航等[12]建立一種基于長(zhǎng)短期記憶(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)和粒子濾波的預(yù)測(cè)模型;Han等[13]提出一種基于位置校準(zhǔn)的LSTM預(yù)測(cè)方法,在對(duì)GPS軌跡數(shù)據(jù)進(jìn)行校正后,利用LSTM對(duì)公交車到站時(shí)間進(jìn)行預(yù)測(cè).
但是,上述方法仍存在以下不足: 1) 僅僅采用歸一化的方式對(duì)模型的輸入特征進(jìn)行處理,未能較好地體現(xiàn)各個(gè)特征之間的重要性差異;2) 在應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)時(shí),未能較好地體現(xiàn)不同時(shí)間距離的公交車行程時(shí)間和當(dāng)前公交車到站時(shí)間的關(guān)聯(lián)性;3) 往往采用站點(diǎn)間分開預(yù)測(cè)再累計(jì)求和的預(yù)測(cè)方法,在長(zhǎng)距離預(yù)測(cè)中會(huì)出現(xiàn)誤差累積的現(xiàn)象,無法同時(shí)為乘客提供上下車時(shí)間參考.
針對(duì)上述問題,為向乘客提供目標(biāo)班次的動(dòng)態(tài)到站時(shí)刻表,本研究利用行程數(shù)據(jù),構(gòu)建基于雙層、雙注意力、雙向LSTM的公交車到站時(shí)間預(yù)測(cè)模型(簡(jiǎn)稱DLA-BLSTM模型).首先,通過注意力機(jī)制區(qū)分不同時(shí)刻各個(gè)因素對(duì)于公交車行程時(shí)間影響的差異性;其次,將自注意力與LSTM相融合,優(yōu)化LSTM網(wǎng)絡(luò)的記憶能力,使其能夠自主分析不同時(shí)間距離公交車行程時(shí)間之間的關(guān)聯(lián)性,充分挖掘公交車行程時(shí)間的時(shí)序性,實(shí)現(xiàn)對(duì)公交車行程時(shí)間的預(yù)測(cè);最后,將公交車到站時(shí)間問題轉(zhuǎn)化為行程時(shí)間預(yù)測(cè)子問題,基于預(yù)計(jì)行程時(shí)間和公交車站點(diǎn)間的行駛規(guī)律,對(duì)公交車到站時(shí)間進(jìn)行估算,獲得公交車預(yù)計(jì)到站時(shí)間,同時(shí)為乘客提供上下車時(shí)間參考.
圖1 DLA-BLSTM模型結(jié)構(gòu)圖Fig.1 DLA-BLSTM model structure diagram
DLA-BLSTM模型結(jié)構(gòu)如圖1所示,模型的構(gòu)建步驟如下:
1) 對(duì)公交車行程時(shí)間的影響因素進(jìn)行分析,確定模型的輸入特征,構(gòu)建模型輸入特征矩陣;
2) 在多層感知機(jī)的基礎(chǔ)上,利用注意力機(jī)制構(gòu)建特征重要性提取模塊,利用特征提取模塊提取各個(gè)特征的重要性權(quán)重,并將其與模型的輸入特征矩陣進(jìn)行拼接,輸入到行程時(shí)間預(yù)測(cè)模塊中;
3) 將自注意力機(jī)制融入到LSTM的時(shí)間步中,基于雙層、雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(bi-directional LSTM,BiLSTM)構(gòu)建行程時(shí)間預(yù)測(cè)模塊,使LSTM網(wǎng)絡(luò)可自主分析不同時(shí)間距離公交車行程時(shí)間之間的關(guān)聯(lián)性,將均方根誤差作為模型的損失函數(shù)對(duì)模型進(jìn)行訓(xùn)練,最后輸出公交車的預(yù)計(jì)行程時(shí)間;
4) 基于各個(gè)相鄰站點(diǎn)的平均行駛時(shí)間占比和預(yù)計(jì)行程時(shí)間,對(duì)該運(yùn)行班次相鄰站點(diǎn)之間的行駛時(shí)間進(jìn)行預(yù)估,獲得該運(yùn)行班次各站點(diǎn)的預(yù)計(jì)到站時(shí)間.
不同因素對(duì)公交車行程時(shí)間會(huì)產(chǎn)生不同程度的影響.為更好地區(qū)分不同特征的影響程度,在多層感知機(jī)的基礎(chǔ)上,利用注意力機(jī)制構(gòu)建特征重要性提取模塊,使模型能夠基于不同時(shí)刻、不同特征的輸入值,計(jì)算它們的注意力權(quán)重,生成不同的特征重要性矩陣,豐富模型的輸入信息.
首先,將模型輸入特征矩陣輸入到特征重要性提取模塊中;其次,結(jié)合上一時(shí)刻行程時(shí)間預(yù)測(cè)模塊中的隱藏層輸出的元胞隱狀態(tài),計(jì)算當(dāng)前時(shí)刻各個(gè)特征的重要性大小,獲取當(dāng)前時(shí)刻的特征注意力權(quán)重矩陣;最后,將各個(gè)維度的注意力權(quán)重矩陣和模型特征矩陣進(jìn)行拼接,獲得DLA-BLSTM模型的特征重要性矩陣.上述實(shí)現(xiàn)過程的計(jì)算公式為
(1)
(2)
(3)
傳統(tǒng)LSTM網(wǎng)絡(luò)由一系列LSTM記憶單元組成[14-16].LSTM的核心由遺忘門、輸入門和輸出門組成.其中,遺忘門用于決定上一時(shí)刻元胞狀態(tài)中所要遺忘的內(nèi)容;輸入門用于決定要添加到當(dāng)前元胞狀態(tài)中的新信息,對(duì)當(dāng)前的元胞狀態(tài)進(jìn)行更新;輸出門用于保留當(dāng)前元胞狀態(tài)中的重要信息,輸出元胞隱狀態(tài).
在傳統(tǒng)LSTM網(wǎng)絡(luò)的基礎(chǔ)上,DLA-BLSTM模型在行程時(shí)間預(yù)測(cè)模塊中搭建雙層、BiLSTM網(wǎng)絡(luò),深入挖掘公交車行程時(shí)間的時(shí)序性,并將注意力機(jī)制融入到LSTM的時(shí)間步中,使LSTM網(wǎng)絡(luò)可自主分析不同時(shí)間距離的公交車行程時(shí)間之間的關(guān)聯(lián)性,優(yōu)化LSTM網(wǎng)絡(luò)的記憶能力.
1) 雙層、雙向LSTM網(wǎng)絡(luò)的搭建.傳統(tǒng)LSTM網(wǎng)絡(luò)在訓(xùn)練過程中只能正向進(jìn)行,BiLSTM可以從正向和逆向兩個(gè)方向?qū)δP洼斎脒M(jìn)行處理,進(jìn)一步挖掘近鄰公交車行程時(shí)間之間的相關(guān)性.因此,在DLA-BLSTM模型的行程時(shí)間預(yù)測(cè)模塊中,基于第一層LSTM網(wǎng)絡(luò),添加BiLSTM,將第一層LSTM網(wǎng)絡(luò)輸出的隱藏狀態(tài)輸入到第二層BiLSTM中,提取公交車運(yùn)行過程中的雙向時(shí)序特征.
2) 注意力機(jī)制與LSTM的融合.注意力機(jī)制是一種注意力資源分配的模型,可對(duì)事物的不同部分賦予不同的權(quán)重,從而降低其它無關(guān)部分的作用[17].自注意力機(jī)制是在注意力機(jī)制的基礎(chǔ)上發(fā)展而來的,可以在編碼和解碼時(shí)單獨(dú)使用.相較于注意力機(jī)制,自注意力更加關(guān)注模型輸入之間的內(nèi)在聯(lián)系.DLA-BLSTM模型便是使用自注意力對(duì)BiLSTM輸出的元胞隱狀態(tài)進(jìn)行處理,提取各個(gè)時(shí)刻LSTM輸出的元胞隱狀態(tài)內(nèi)在聯(lián)系,賦予不同時(shí)間距離的元胞隱狀態(tài)不同的權(quán)重,進(jìn)而體現(xiàn)處于不同時(shí)間距離的公交車對(duì)于當(dāng)前公交車行程時(shí)間的影響,最終獲得公交車的預(yù)計(jì)行程時(shí)間.
首先,將特征重要性提取模塊中所獲得的特征重要性矩陣輸入到LSTM層中;其次,將LSTM層輸出的元胞隱狀態(tài)輸入到BiLSTM層中,經(jīng)過BiLSTM層處理,利用雙曲正切曲線計(jì)算BiLSTM輸出元胞隱狀態(tài)的得分,獲得各個(gè)時(shí)刻的元胞隱狀態(tài)的得分矩陣,并利用softmax函數(shù)對(duì)該矩陣進(jìn)行歸一化,獲取元胞隱狀態(tài)的概率向量;再次,基于元胞隱狀態(tài)得分矩陣和元胞隱狀態(tài)概率向量,獲取當(dāng)前時(shí)刻的元胞隱狀態(tài);最后,通過全連接層獲得當(dāng)前公交車的預(yù)計(jì)行程時(shí)間.上述實(shí)現(xiàn)過程的計(jì)算公式為
(4)
etime=utanh (wHtime+b)
(5)
αtime=softmax(etime)
(6)
(7)
到站時(shí)間估算模塊主要用于獲取當(dāng)前班次在各站點(diǎn)的預(yù)計(jì)到站時(shí)間.首先,獲取各個(gè)運(yùn)行班次在各相鄰站點(diǎn)間的行駛時(shí)間,計(jì)算各站間行駛時(shí)間在總行程時(shí)間中的占比;其次,公交車的發(fā)車時(shí)間間隔均在10 min左右,因此以10 min為時(shí)間間隔進(jìn)行時(shí)間分片,獲取每天各個(gè)10 min內(nèi)各個(gè)運(yùn)行班次在各相鄰站點(diǎn)間的平均行駛時(shí)間占比,統(tǒng)計(jì)星期一至星期五各個(gè)10 min時(shí)間分片內(nèi)各相鄰站點(diǎn)的平均行駛時(shí)間占比;最后,基于在行程時(shí)間預(yù)測(cè)模塊中獲取的預(yù)計(jì)行程時(shí)間和星期一至星期五各個(gè)10 min時(shí)間片內(nèi)各相鄰站點(diǎn)的平均行駛時(shí)間占比,預(yù)估當(dāng)前班次公交車在各相鄰站點(diǎn)間的預(yù)計(jì)行駛時(shí)間,進(jìn)而獲取當(dāng)前班次在各站點(diǎn)的預(yù)計(jì)到站時(shí)間.
本研究選取廣州市560路、B2路公交車作為研究對(duì)象,其中560路屬于普通公交線路,B2路屬于快速公交線路,兩條線路沿線均途經(jīng)較多居民小區(qū)、商業(yè)中心和高校等,公交乘坐需求度較高,具有較強(qiáng)的代表性.研究數(shù)據(jù)來源于廣州交信投科技股份有限公司,包含2020年10-12月期間B2路和560路上行線路的公交車實(shí)際運(yùn)行數(shù)據(jù),主要字段包括當(dāng)前運(yùn)行班次的唯一標(biāo)識(shí)、營(yíng)運(yùn)線路標(biāo)識(shí)、車輛標(biāo)識(shí)、駕駛員標(biāo)識(shí)、該班次的發(fā)車時(shí)刻、到站站臺(tái)標(biāo)識(shí)、站臺(tái)名稱、站臺(tái)經(jīng)緯度和當(dāng)前站臺(tái)的到達(dá)時(shí)刻等.
由于本研究的數(shù)據(jù)主要來源于GPS定位數(shù)據(jù),數(shù)據(jù)在傳輸、存儲(chǔ)的過程中,會(huì)受到一些外部因素的干擾,導(dǎo)致數(shù)據(jù)有時(shí)會(huì)出現(xiàn)記錄偏差或者記錄缺失的情況,因而需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.數(shù)據(jù)預(yù)處理主要包括剔除重復(fù)數(shù)據(jù)、校準(zhǔn)異常數(shù)據(jù)和插值缺失數(shù)據(jù).首先,對(duì)于重復(fù)記錄的數(shù)據(jù)直接剔除.其次,對(duì)異常數(shù)據(jù)進(jìn)行處理,異常數(shù)據(jù)是指出現(xiàn)倒時(shí)、運(yùn)行時(shí)間遠(yuǎn)小于平均站點(diǎn)運(yùn)行時(shí)間等情況的數(shù)據(jù),對(duì)其先進(jìn)行剔除,再進(jìn)行插值填充.最后,對(duì)缺失數(shù)據(jù)進(jìn)行插值補(bǔ)全,插值補(bǔ)全的方法有兩種: 1) 關(guān)注終點(diǎn)站到站時(shí)間缺失的數(shù)據(jù),通過獲取距離終點(diǎn)站最近鄰的已知到站時(shí)間的站點(diǎn),計(jì)算始發(fā)站到最近鄰已知到站時(shí)間站點(diǎn)的行駛時(shí)間占行程時(shí)間的平均占比,基于始發(fā)站到最近鄰站點(diǎn)的行駛時(shí)間和平均行駛時(shí)間占比,對(duì)缺失路段的行駛時(shí)間進(jìn)行補(bǔ)全;2) 中間站點(diǎn)到站時(shí)間缺失值也按上述類似思路進(jìn)行插值填充.
圖2 平均行程時(shí)間對(duì)比圖Fig.2 Comparison chart of average travel time
對(duì)模型的輸入特征進(jìn)行合理的選擇,有助于降低模型冗余,提升模型預(yù)測(cè)精度和預(yù)測(cè)效率.按照國(guó)慶假期、工作日、周末,對(duì)公交車運(yùn)行數(shù)據(jù)進(jìn)行分類,分別統(tǒng)計(jì)在不同特征日下各個(gè)時(shí)刻的公交車平均行程時(shí)間,統(tǒng)計(jì)結(jié)果如圖2所示.國(guó)慶假期、工作日、周末公交車具有明顯不同的運(yùn)行規(guī)律.其中,公交車在工作日的平均行程時(shí)間具有明顯的早晚高峰,且晚高峰的峰值高于早高峰,變化幅度較大.
公交車在運(yùn)行過程中,受到較多因素的影響.本研究從公交車運(yùn)行過程中的基本屬性特征和運(yùn)行規(guī)律特征兩方面進(jìn)行考慮,對(duì)模型輸入特征進(jìn)行預(yù)選取.首先,預(yù)選取公交車的基本屬性特征.考慮到公交車自身屬性因素的影響,添加公交車編號(hào)和駕駛員編號(hào).考慮到公交車在不同時(shí)刻具有不同的運(yùn)行狀態(tài),添加公交車的發(fā)車時(shí)間、發(fā)車間隔、相對(duì)于當(dāng)天首發(fā)車的相對(duì)發(fā)車時(shí)間.考慮到公交車運(yùn)行時(shí)所處的天氣狀況,添加天氣類型.其次,在基本屬性特征的基礎(chǔ)上,從天、周、月3個(gè)角度選取公交車運(yùn)行規(guī)律特征,使用斯皮爾曼相關(guān)系數(shù)從天、周、月3個(gè)角度對(duì)運(yùn)行規(guī)律特征與當(dāng)前班次的行程時(shí)間之間的相關(guān)性進(jìn)行分析.斯皮爾曼相關(guān)系數(shù)的計(jì)算公式為
(8)
結(jié)果表明,當(dāng)前班次的行程時(shí)間與前一工作日的平均行程時(shí)間的相關(guān)系數(shù)均大于0.70,與上一周相同特征日的平均行程時(shí)間的相關(guān)系數(shù)均大于0.75,與月平均行程時(shí)間的相關(guān)系數(shù)均都大于0.80.因此,所選取的運(yùn)行規(guī)律特征與當(dāng)前班次的行程時(shí)間之間具有較為明顯的相關(guān)性.最終,將基本屬性特征和運(yùn)行規(guī)律特征作為模型的預(yù)輸入特征,具體如表1所示.
表1 模型預(yù)輸入特征
從圖2中可發(fā)現(xiàn),公交車在工作日和非工作日的運(yùn)行規(guī)律存在明顯差異,工作日的交通狀況更為復(fù)雜.因此,選取2020年10-12月的工作日數(shù)據(jù)作為研究對(duì)象.其中,12月最后14 d中的工作日數(shù)據(jù)作為測(cè)試集,其他數(shù)據(jù)作為訓(xùn)練集.
本實(shí)驗(yàn)使用平均絕對(duì)誤差(MAE)、平均絕對(duì)百分比誤差(tMAPE)和均方根誤差(tRMSE)作為模型的評(píng)價(jià)指標(biāo).其中MAE和tMAPE用來衡量模型的預(yù)測(cè)精度,tRMSE用來衡量模型預(yù)測(cè)的穩(wěn)定性.
首先,對(duì)模型參數(shù)進(jìn)行初始化.LSTM層、BiLSTM層和全連接層的隱藏節(jié)點(diǎn)個(gè)數(shù)分別設(shè)置為150、75和15.對(duì)模型預(yù)輸入特征進(jìn)行特征消融實(shí)驗(yàn),結(jié)果如圖3所示.以tMAPE為精度衡量指標(biāo),將未進(jìn)行消融實(shí)驗(yàn)的預(yù)測(cè)結(jié)果與經(jīng)過消融實(shí)驗(yàn)的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,其精度相對(duì)提升比均大于0.由此可見,預(yù)輸入的特征對(duì)于模型預(yù)測(cè)精度均可起到提升作用.其中,相對(duì)發(fā)車時(shí)間和發(fā)車時(shí)刻對(duì)于預(yù)測(cè)精度的提升最為明顯,預(yù)測(cè)精度相對(duì)提升比分別為3.78%和3.43%.對(duì)比天、周、月3個(gè)維度的運(yùn)行規(guī)律特征可發(fā)現(xiàn),處于周維度的運(yùn)行規(guī)律特征對(duì)于預(yù)測(cè)精度提升最為明顯,預(yù)測(cè)精度相對(duì)提升比為2.05%.因此,最終確定預(yù)輸入的特征為模型的最終輸入特征.
對(duì)比不同批次大小、不同學(xué)習(xí)率、不同時(shí)間步長(zhǎng)DLA-BLSTM模型的預(yù)測(cè)性能,實(shí)驗(yàn)結(jié)果如表2所示.當(dāng)批次為64、學(xué)習(xí)率為0.000 5、時(shí)間步長(zhǎng)為4時(shí),模型可取得最優(yōu)預(yù)測(cè)性能,由此可確定模型的最終參數(shù).
圖3 特征消融實(shí)驗(yàn)結(jié)果Fig.3 Feature ablation experiment results
表2 不同參數(shù)實(shí)驗(yàn)結(jié)果對(duì)比
表3 不同預(yù)測(cè)模型實(shí)驗(yàn)結(jié)果對(duì)比
將DLA-BLSTM預(yù)測(cè)模型和其他行程時(shí)間預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果如表3所示.相較于未加入注意力的雙層、雙向LSTM模型,加入雙注意力的DLA-BLSTM模型(LSTM+BiLSTM)的MAPE提升5.93%,說明注意力的加入對(duì)于模型預(yù)測(cè)精度提升起到促進(jìn)作用;相較于傳統(tǒng)的單層LSTM預(yù)測(cè)模型、門控循環(huán)神經(jīng)網(wǎng)絡(luò)(gate recurrent unit,GRU)模型、決策樹模型、SVM模型、RNN模型,DLA-BLSTM預(yù)測(cè)模型的預(yù)測(cè)精度顯著提升,其MAPE可分別提升7.33%、11.10%、12.16%、15.20%、18.61%,DLA-BLSTM預(yù)測(cè)模型在行程時(shí)間預(yù)測(cè)上具有更高的預(yù)測(cè)精度.
分別對(duì)測(cè)試集的10 d數(shù)據(jù)進(jìn)行全天平均預(yù)測(cè)誤差分析.如表4所示,模型在12月25-31日的預(yù)測(cè)精度最差,其MAPE分別為11.35%和12.49%.這是由于12月25日是圣誕節(jié),12月31日是跨年日,在這兩個(gè)特殊日中,市民大量出行,導(dǎo)致城市擁堵情況頻發(fā),路段交通情況復(fù)雜,公交車行駛過程的規(guī)律性降低,DLA-BLSTM模型的預(yù)測(cè)精度有所下降.但除12月25日和12月31日這兩個(gè)特殊日外,其余8 d都取得較為不錯(cuò)的預(yù)測(cè)效果,其余8 d的MAPE為7.15%、tMAE為4.50 min.
在不考慮特殊日的情況下,分析測(cè)試集中星期一至星期五的全天平均預(yù)測(cè)誤差,結(jié)果如表5所示.模型在星期一至星期五的預(yù)測(cè)能力相對(duì)穩(wěn)定,雖然在星期五的預(yù)測(cè)精度會(huì)略有不足,但總體上未出現(xiàn)誤差明顯增大的情況.這可能是由于星期五作為工作日的最后一天,會(huì)有較多市民選擇在當(dāng)晚出行,從而導(dǎo)致預(yù)測(cè)難度增大,模型的預(yù)測(cè)精度有所下降.
表4 不同工作日實(shí)驗(yàn)結(jié)果對(duì)比
表5 星期一至星期五實(shí)驗(yàn)結(jié)果對(duì)比
同樣,在不考慮特殊日的情況下,對(duì)DLA-BLSTM模型在各個(gè)時(shí)間段的平均預(yù)測(cè)誤差進(jìn)行分析.模型在平峰期(6:00—7:00、8:30—17:00、19:30—22:30)的MAPE為6.54%,在早高峰(7:00—8:30)的MAPE為7.67%,在晚高峰(17:00—19:30)的MAPE為9.06%.由此可見,公交車在平峰期可以取得較高的預(yù)測(cè)精度,在早高峰誤差仍可維持相對(duì)較低的水平,但在晚高峰階段誤差明顯上升,預(yù)測(cè)能力有所下降.
通過訓(xùn)練集獲取星期一至星期五各個(gè)10 min時(shí)間分片內(nèi)的相鄰路段行駛時(shí)間占行程時(shí)間的平均占比,基于平均占比和預(yù)計(jì)行程時(shí)間,對(duì)各站點(diǎn)間的行駛時(shí)間進(jìn)行估算,實(shí)現(xiàn)對(duì)公交車各站點(diǎn)到站時(shí)間的估算.按照當(dāng)前運(yùn)行班次距離目標(biāo)站點(diǎn)(乘客上車點(diǎn)或乘客下車點(diǎn))的累積站點(diǎn)數(shù),統(tǒng)計(jì)B2路和560路公交車在不同累積站點(diǎn)數(shù)上的到站時(shí)間誤差,實(shí)驗(yàn)結(jié)果如表6所示.由于公交車發(fā)車間隔短,因此最近鄰乘客上車點(diǎn)的公交車的累積站點(diǎn)數(shù)相對(duì)較少.在本預(yù)測(cè)方法中,當(dāng)累積站點(diǎn)數(shù)為5個(gè)時(shí),tMAE為2.00 min左右,可以為乘客提供較為準(zhǔn)確的上車時(shí)間參考.在乘客乘車過程中,途經(jīng)站點(diǎn)數(shù)相對(duì)較多.通過本預(yù)測(cè)方法,當(dāng)累積站點(diǎn)數(shù)為10個(gè)時(shí),tMAE為3.00 min左右;而當(dāng)累積站點(diǎn)數(shù)為15個(gè)時(shí),tMAE為4.00 min左右.盡管隨著途經(jīng)站點(diǎn)個(gè)數(shù)的增加,公交車的預(yù)計(jì)到站時(shí)間誤差也會(huì)隨之增大,但誤差增大速度較為緩慢,可以為乘客提供較為準(zhǔn)確的下車時(shí)間參考.
表6 到站時(shí)間預(yù)測(cè)實(shí)驗(yàn)結(jié)果
DLA-BLSTM模型能夠獲得準(zhǔn)確性較高的預(yù)計(jì)行程時(shí)間,其MAPE為8.09%.以MAPE為精度衡量指標(biāo),與未加入注意力的雙層、雙向LSTM模型、LSTM模型、GRU模型、決策樹模型、SVM模型、RNN模型相比較,DLA-BLSTM模型的精度可分別提升5.93%、7.33%、11.10%、12.16%、15.20%、18.61%.通過將公交車到站時(shí)間問題轉(zhuǎn)化為行程時(shí)間預(yù)測(cè)子問題,實(shí)現(xiàn)對(duì)公交車到站時(shí)間的估算,誤差累積速度較慢.當(dāng)累積站點(diǎn)數(shù)為5個(gè)時(shí),誤差可保持在2.00 min左右;當(dāng)累積站點(diǎn)數(shù)為10個(gè)時(shí),誤差可保持在3.00 min左右;而當(dāng)累積站點(diǎn)數(shù)為15個(gè)時(shí),誤差仍可保持在4.00 min左右.DLA-BLSTM模型可同時(shí)向乘客提供精度較高的預(yù)計(jì)上車時(shí)間和下車時(shí)間,滿足乘客的出行需求,為乘客提供較為準(zhǔn)確、全面的決策參考.下一步,將在提升DLA-BLSTM模型在高峰期、特殊日的預(yù)測(cè)能力方面展開研究,并基于該模型構(gòu)建公交車預(yù)計(jì)到站時(shí)間可視化平臺(tái),提升其實(shí)際應(yīng)用價(jià)值.