李兆豐,倪少權(quán),2,3,孫克洋,呂苗苗,2,3
基于多特征融合的城市軌道交通短時(shí)客流預(yù)測(cè)
李兆豐1,倪少權(quán)1,2,3,孫克洋1,呂苗苗1,2,3
(1. 西南交通大學(xué),交通運(yùn)輸與物流學(xué)院,成都 611756;2. 綜合交通運(yùn)輸智能化國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,成都 611756;3. 綜合交通大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室,成都 611756)
客流需求是城市軌道交通運(yùn)營(yíng)組織的基礎(chǔ),隨著信息采集技術(shù)、計(jì)算能力等的快速發(fā)展,短時(shí)客流推演的準(zhǔn)確性在成網(wǎng)條件下尤為關(guān)鍵??紤]到客流的時(shí)間依賴(lài)性、空間關(guān)聯(lián)性與外部因子隨機(jī)性影響,以L(fǎng)STM神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)預(yù)測(cè)框架,構(gòu)建融合多特征的“端到端”短時(shí)客流預(yù)測(cè)框架,挖掘客流的時(shí)間依賴(lài)性特征,通過(guò)Embedding層嵌入外部因子稀疏矩陣,再利用全連接層融合時(shí)間特征、空間特征和其他因子得到預(yù)測(cè)結(jié)果。以成都地鐵火車(chē)南站為實(shí)例研究對(duì)象,經(jīng)多次實(shí)驗(yàn),與ARIMA模型與LSTM神經(jīng)網(wǎng)絡(luò)相比,融合多特征的組合預(yù)測(cè)模型預(yù)測(cè)性能最佳,訓(xùn)練集和驗(yàn)證集MAE誤差分別為11.49和10.85,并在測(cè)試集上對(duì)模型進(jìn)行測(cè)試,結(jié)果表明,該模型具有較佳的預(yù)測(cè)精度和魯棒性。
城市軌道交通;短時(shí)客流預(yù)測(cè);多特征融合;端到端預(yù)測(cè)框架;時(shí)空關(guān)聯(lián)性
近年來(lái),隨著我國(guó)城市軌道交通建設(shè)的快速推進(jìn),眾多城市軌道交通系統(tǒng)已實(shí)現(xiàn)網(wǎng)絡(luò)化運(yùn)營(yíng),客流需求作為組織城市軌道交通線(xiàn)網(wǎng)日常運(yùn)營(yíng)的前提與基礎(chǔ),客流預(yù)測(cè)在成網(wǎng)運(yùn)營(yíng)條件下至關(guān)重要??土黝A(yù)測(cè)結(jié)果過(guò)大,會(huì)引起人力、物力和財(cái)力的極大浪費(fèi),客流預(yù)測(cè)結(jié)果過(guò)小,則會(huì)造成車(chē)站、車(chē)廂擁擠,輕則引起乘客滿(mǎn)意度降低,重則造成人員傷亡等嚴(yán)重后果。因此,選擇合適的客流預(yù)測(cè)方法,提高客流需求預(yù)測(cè)的準(zhǔn)確性尤為關(guān)鍵。
客流屬于交通流的一種,而且交通流問(wèn)題的研究由來(lái)已久,并取得了相當(dāng)豐富的研究成果。如呂田[1]提出了基于SDZ-GRU的多特征短時(shí)交通流預(yù)測(cè)方法SGMTFP,該方法在客流數(shù)據(jù)基礎(chǔ)上加入時(shí)間信息等其他因素,通過(guò)SDZ改進(jìn)門(mén)控循環(huán)單元,構(gòu)成新RNN單元,動(dòng)態(tài)控制單元間傳輸,從而進(jìn)行短時(shí)交通流量預(yù)測(cè);崔洪濤[2]等提出了深度長(zhǎng)短期記憶網(wǎng)絡(luò)DLSTM方法進(jìn)行地鐵進(jìn)站客流量預(yù)測(cè),采用多源數(shù)據(jù)構(gòu)造數(shù)據(jù)特征;Ding[3]利用客流分解方式將客流序列分解為常數(shù)項(xiàng)和誤差項(xiàng)兩部分,建立ARIMA模型預(yù)測(cè)常數(shù)項(xiàng)部分,利用廣義自回歸條件異方差模型檢測(cè)高峰期、大型活動(dòng)等突發(fā)事件情況下客流的波動(dòng)性;Yang Liu[4]基于深度學(xué)習(xí)與交通理論,構(gòu)建基于長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)的端到端深度學(xué)習(xí)架構(gòu),實(shí)現(xiàn)了外部因素、時(shí)間依賴(lài)性、空間特征和線(xiàn)網(wǎng)特征的整合與建模;羅向龍[5]等針對(duì)交通流的時(shí)空性,提出了KNN-LSTM模型,通過(guò)-最近鄰篩選檢測(cè)站再將數(shù)據(jù)輸入長(zhǎng)短時(shí)記憶模型進(jìn)行預(yù)測(cè);陸百川等[6]融合多源數(shù)據(jù),并結(jié)合GA-WNN模型進(jìn)行短時(shí)交通流預(yù)測(cè),該模型克服單源數(shù)據(jù)的局限性進(jìn)行全局搜索并且可以具有自適應(yīng)學(xué)習(xí)的特點(diǎn);劉帆洨[7]等考慮票價(jià)等其他特征變量為輸入屬性,構(gòu)建短時(shí)客流預(yù)測(cè)模型;Zhang[8]基于譜分析技術(shù),構(gòu)建ARIMA模型與GARCH模型,分別對(duì)客流序列的確定性部分和波動(dòng)性部分進(jìn)行預(yù)測(cè)。
總的來(lái)說(shuō),針對(duì)短時(shí)交通流預(yù)測(cè)主要基于線(xiàn)性理論、非線(xiàn)性理論、人工智能、組合預(yù)測(cè)模型以及交通仿真的預(yù)測(cè)方法[9-11]。一方面,現(xiàn)有研究大都以歷史數(shù)據(jù)為基礎(chǔ),通過(guò)挖掘客流規(guī)律的相似性、依賴(lài)性以完成預(yù)測(cè)[9]。然而,在實(shí)際情況中,乘客出行具有極大的不確定性,天氣狀況會(huì)對(duì)出行是否發(fā)生、交通工具選擇產(chǎn)生影響,在客流序列特征挖掘方面,大多數(shù)研究只考慮客流序列的時(shí)間特征,未考慮客流發(fā)生的空間位置關(guān)聯(lián)性,同時(shí)在預(yù)測(cè)因子選擇上具有主觀(guān)性。另一方面,在不同輸入特征融合方面,當(dāng)前諸多研究中所建立的組合模型多為不同部分結(jié)果的融合,未充分考慮預(yù)測(cè)框架的整體性和特征融合的合理性[10, 12-14]。
基于此,本文以L(fǎng)STM神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)框架,構(gòu)建融合時(shí)間特征、空間特征和外部因子的“端到端”短時(shí)客流預(yù)測(cè)框架。其一,針對(duì)時(shí)空維度預(yù)測(cè)因子確定,利用Pearson相關(guān)系數(shù)法和Spearman相關(guān)系數(shù)法分別分析客流序列時(shí)間相關(guān)性和空間關(guān)聯(lián)性,并以此客觀(guān)確定時(shí)間維度和空間維度輸入屬性;其二,構(gòu)建以L(fǎng)STM神經(jīng)網(wǎng)絡(luò)為核心,融合時(shí)間特征、空間特征和外部因子的“端到端”短時(shí)客流組合預(yù)測(cè)模型,綜合考慮不同影響因子對(duì)客流的影響,以提高短時(shí)客流預(yù)測(cè)的精度。
當(dāng)前軌道交通短時(shí)客流預(yù)測(cè)研究大都集中于預(yù)測(cè)方法選擇和改進(jìn),忽略了輸入屬性對(duì)預(yù)測(cè)模型性能影響,預(yù)測(cè)因子選擇具有主觀(guān)性,在模型預(yù)測(cè)過(guò)程中引入了大量噪聲點(diǎn),降低了模型預(yù)測(cè)效率。在客流預(yù)測(cè)中,輸入屬性的好壞直接影響預(yù)測(cè)精度,一方面,若考慮的輸入屬性過(guò)少或者輸入屬性選擇不合適,則直接導(dǎo)致結(jié)果精度較低;另一方面,輸入屬性過(guò)多,考慮的影響因素中包含影響因子較小的屬性,會(huì)使得預(yù)測(cè)模型更加龐大,造成模型的計(jì)算復(fù)雜度指數(shù)級(jí)增長(zhǎng),浪費(fèi)計(jì)算資源和造成無(wú)法求解的問(wèn)題。因此,針對(duì)輸入屬性選擇問(wèn)題,本文提出利用相關(guān)系數(shù)法確定時(shí)間與空間維度的預(yù)測(cè)因子。
相關(guān)研究表明[15],在城市軌道交通線(xiàn)網(wǎng)中,不同站點(diǎn)的客流量之間存在潛在的關(guān)聯(lián)性,同時(shí),客流序列是時(shí)間序列的一種,具有時(shí)間序列的依賴(lài)性等特征。歷史客流數(shù)據(jù)是在特定時(shí)間和空間條件下,綜合交通發(fā)生、吸引與線(xiàn)網(wǎng)服務(wù)水平等長(zhǎng)期影響因素以及天氣狀況等隨機(jī)影響因素下實(shí)際進(jìn)站客流量統(tǒng)計(jì)值,蘊(yùn)含了客流波動(dòng)規(guī)律、不同影響因素對(duì)客流的影響程度大小等客流波動(dòng)特征。歷史某一時(shí)段客流量,代表了其在所有影響因素綜合作用條件下,某一站點(diǎn)或線(xiàn)路在該時(shí)段的實(shí)際客流量值。因此,本文選取Pearson相關(guān)系數(shù)法與Spearman等級(jí)相關(guān)系數(shù)法分別分析時(shí)間依賴(lài)性與空間關(guān)聯(lián)性大小,并以此為依據(jù)確定時(shí)間維度與空間維度的輸入屬性。
1.1.1 Pearson相關(guān)系數(shù)法基本原理
Pearson相關(guān)系數(shù)法是檢驗(yàn)變量之間相似性程度的一種有效方法,計(jì)算公式如下:
1.1.2 Spearman等級(jí)相關(guān)系數(shù)法基本原理
針對(duì)客流序列的非線(xiàn)性和波動(dòng)性特征,單一的預(yù)測(cè)方法都存在一定的缺陷,同時(shí),對(duì)于多特征融合問(wèn)題,當(dāng)前組合預(yù)測(cè)模型是對(duì)不同部分結(jié)果的融合,缺乏客觀(guān)性和合理性。本文模型構(gòu)建的目標(biāo)是挖掘不同維度的特征并融合,實(shí)現(xiàn)該目標(biāo)需要解決以下幾個(gè)關(guān)鍵問(wèn)題:第一,如何挖掘客流序列的時(shí)間依賴(lài)性;第二,如何解決外部因子矩陣的稀疏性;第三,如何客觀(guān)地融合時(shí)間特征、空間特征和外部因子。
因此,對(duì)于上述關(guān)鍵問(wèn)題,構(gòu)建以L(fǎng)STM神經(jīng)網(wǎng)絡(luò)為核心,融合時(shí)間特征、空間特征和外部因子的“端到端”短時(shí)客流組合預(yù)測(cè)模型?;舅枷胧抢肔STM神經(jīng)網(wǎng)絡(luò)挖掘和學(xué)習(xí)預(yù)測(cè)站點(diǎn)及與預(yù)測(cè)站點(diǎn)相關(guān)性較大的8個(gè)站點(diǎn)客流序列時(shí)間依賴(lài)性特征,通過(guò)Embedding層嵌入外部因子稀疏矩陣并利用“+”操作融合這兩步結(jié)果作為全連接層輸入,經(jīng)全連接層非線(xiàn)性映射輸出預(yù)測(cè)客流時(shí)間序列。
1.2.1 基于LSTM神經(jīng)網(wǎng)絡(luò)的時(shí)間依賴(lài)性挖掘
LSTM神經(jīng)網(wǎng)絡(luò)(長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò))是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò),能夠有效地解決時(shí)間序列的長(zhǎng)期依賴(lài)問(wèn)題。它是在RNN神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入時(shí)序的概念,對(duì)于LSTM單元,上一LSTM單元的隱節(jié)點(diǎn)輸出與本LSTM單元的輸入共同作為當(dāng)前LSTM單元的輸入,通過(guò)門(mén)控決定細(xì)胞狀態(tài)的記憶與遺忘,同時(shí)有效解決時(shí)間序列的長(zhǎng)期記憶問(wèn)題和梯度消失與爆炸問(wèn)題[16,17]。
圖1 LSTM單元內(nèi)部結(jié)構(gòu)
LSTM單元中門(mén)控結(jié)構(gòu)控制信息的“遺忘”與記憶并調(diào)整隱藏狀態(tài)h,基于此,LSTM神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的信息“記憶”功能,可以有效地挖掘客流序列的時(shí)間依賴(lài)性。
圖2所示是不同站點(diǎn)基于時(shí)間依賴(lài)性挖掘的初步預(yù)測(cè)框架,其中表示個(gè)站點(diǎn),表示前步預(yù)測(cè)輸入,表示預(yù)測(cè)后步客流。
1.2.2 基于Embedding層的外部因素嵌入
Word Embedding是一種基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)言模型,以獲取詞的分布式表達(dá)方式,自動(dòng)從文本語(yǔ)料中學(xué)習(xí)詞的低緯度、稠密和實(shí)數(shù)向量的表達(dá)形式,在經(jīng)Word Embedding處理之后,稀疏矩陣的稀疏性可大幅降低,且分布具有一定的規(guī)律性,其目的是將輸入的高維度映射到低緯度的表示。
對(duì)于天氣等外部因子,本文利用類(lèi)別標(biāo)簽標(biāo)定天氣類(lèi)別,并利用One-hot編碼表示類(lèi)別特征,具有較大的稀疏性,因此,本文采用Embedding方法將稀疏矩陣進(jìn)行嵌入。
小兒腹瀉是兒科高發(fā)疾病,如果不及時(shí)的進(jìn)行治療,就會(huì)導(dǎo)致患兒的病情遷延,引起營(yíng)養(yǎng)不良癥狀,無(wú)法正常生長(zhǎng)發(fā)育[4]。腹瀉對(duì)小兒的危害性非常大 [5]。小兒患者的消化系統(tǒng)功能不完善,腸道內(nèi)受到各種病菌的侵害引起了患兒的發(fā)病,導(dǎo)致腸道內(nèi)菌群失調(diào)引起腹瀉。該疾病影響了水和食物的消化吸收,腸液滲透壓上升,導(dǎo)致了滲透性腹瀉;產(chǎn)毒性細(xì)菌感染會(huì)對(duì)腸粘膜溶質(zhì)運(yùn)轉(zhuǎn)造成影響,導(dǎo)致分泌性腹瀉。不同原因引起的腹瀉,其生理變化特征存在差異性,小兒腹瀉疾病都有一個(gè)共通之處,腸道內(nèi)環(huán)境被破壞,菌群失調(diào)。
圖2 多站點(diǎn)“多對(duì)多”LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)框架
1.2.3 基于全連接層的多特征融合
式中,為sigmoid激活函數(shù);為第i個(gè)神經(jīng)元輸入;O為輸出預(yù)測(cè)值;為輸入層第i神經(jīng)元與隱藏層第j神經(jīng)元的權(quán)重值;為隱藏層第j神經(jīng)元與輸出層的權(quán)重值。
1.2.4 多特征融合的短時(shí)客流預(yù)測(cè)模型
圖4所示是預(yù)測(cè)模型整體框架,在預(yù)測(cè)模型訓(xùn)練時(shí),每一輪迭代計(jì)算真實(shí)值與預(yù)測(cè)值誤差,通過(guò)誤差反向傳播迭代更新模型內(nèi)部參數(shù),實(shí)現(xiàn)從樣本數(shù)據(jù)中自適應(yīng)學(xué)習(xí)和調(diào)整模型參數(shù),使得不同特征融合更合理、客觀(guān)。預(yù)測(cè)整體框架由LSTM模塊、Embedding模塊和全連接層融合模塊三部分構(gòu)成。
(1)LSTM模塊:將空間相關(guān)性較高的站點(diǎn)前時(shí)段客流輸入到LSTM神經(jīng)網(wǎng)絡(luò),挖掘客流序列的時(shí)間依賴(lài)性特征并輸出初步預(yù)測(cè)結(jié)果。
(2)Embedding模塊:首先通過(guò)One-hot編碼對(duì)天氣和客流模式特征進(jìn)行編碼形成稀疏矩陣,利用Embedding層將稀疏矩陣映射為與LSTM輸出具有一致維度的向量。
(3)全連接層融合模塊:利用“+”操作將外部因素和初步結(jié)果融合得到全連接層的輸入,利用全連接層挖掘和融合不同特征輸出預(yù)測(cè)客流時(shí)間序列。它為典型的三層全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),共有三層,分別為輸入層、隱藏層和輸出層。
圖4 預(yù)測(cè)模型整體框架
圖5 具體預(yù)測(cè)步驟流程圖
(1)客流數(shù)據(jù)預(yù)處理:對(duì)不同站點(diǎn)客流進(jìn)行采樣,生成客流時(shí)間序列。
(2)LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè):對(duì)于具有較強(qiáng)空間關(guān)聯(lián)性的站點(diǎn),利用LSTM神經(jīng)網(wǎng)絡(luò)挖掘各站點(diǎn)的時(shí)間依賴(lài)性特征,并輸出各站點(diǎn)的初步預(yù)測(cè)結(jié)果。
(3)Emebedding層嵌入外部因子矩陣:針對(duì)天氣特征和日期特征的稀疏矩陣,利用Embedding層降維嵌入與初步預(yù)測(cè)結(jié)果相同維度的向量。
(4)外部因子與初步預(yù)測(cè)結(jié)果融合:對(duì)嵌入后的外部因子向量與初步預(yù)測(cè)結(jié)果向量進(jìn)行“+”操作得到中間結(jié)果。
(5)全連接層特征融合:將(3)中中間結(jié)果作為全連接層輸入,輸出則為預(yù)測(cè)客流時(shí)間序列。
本實(shí)例選取成都地鐵2017年11月共30天數(shù)據(jù),選取15min粒度下每日有效時(shí)段為6:00~ 23:30,共計(jì)68個(gè)時(shí)段。
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練之初,首先需要構(gòu)造樣本數(shù)據(jù)集并將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。一般來(lái)說(shuō),數(shù)據(jù)集劃分比例為8∶1∶1或者6∶2∶2,考慮到本實(shí)例數(shù)據(jù)只有一個(gè)月共30天數(shù)據(jù),樣本量少,因此,選取2017年11月23日(周四)和2017年11月26日(周日)為驗(yàn)證集,選取2017年11月30日(周四)為測(cè)試集樣本,其余樣本為訓(xùn)練集數(shù)據(jù)。
在科學(xué)研究過(guò)程中,通常采用誤差來(lái)評(píng)價(jià)預(yù)測(cè)方法的性能和預(yù)測(cè)結(jié)果的有效性。本文采用平均絕對(duì)誤差作為預(yù)測(cè)性能評(píng)價(jià)指標(biāo)[13,18]。
平均絕對(duì)誤差(MAE)表示所有單個(gè)預(yù)測(cè)值與真實(shí)值的偏差絕對(duì)值的平均,能夠較好地反映誤差的實(shí)際情況,計(jì)算公式為:
均方誤差(MSE)能夠反映誤差分布的集中程度,其值越小表示誤差分布越集中,計(jì)算公式為:
本文計(jì)算當(dāng)前時(shí)段客流與前時(shí)間段客流的Pearson相關(guān)系數(shù)大小,抽取前5時(shí)段的相關(guān)系數(shù)如表1所示,計(jì)算火車(chē)南站與全網(wǎng)所有站點(diǎn)客流Spearman等級(jí)相關(guān)系數(shù)值,并抽取關(guān)聯(lián)性較大的8個(gè)站點(diǎn)如表2所示。依據(jù)相關(guān)性分析結(jié)果,確定前四時(shí)段客流量為時(shí)間維度的輸入因子,確定與預(yù)測(cè)站點(diǎn)Spearman相關(guān)系數(shù)最大的8個(gè)站點(diǎn)作為空間維度的輸入預(yù)測(cè)因子。
根據(jù)天氣狀況和全日最高溫度將天氣劃分為7類(lèi)(晴/多云/陰,≤25度;晴/多云/陰,>25度;晴/多云/陰和小雨,≤25度;晴/多云/陰和小雨,>25度;小雨/小雨,≤25度;小雨/小雨,>25度;陰/小雨和中雨)。
表1 不同時(shí)段客流量之間的Pearson相關(guān)系數(shù)表
Tab.1 Pearson coefficients of passenger flow at different time intervals
表2 火車(chē)南站Spearman相關(guān)系數(shù)表
Tab.2 Spearman coefficients for the South railway station
客流分析結(jié)果表明,站點(diǎn)客流在工作日與非工作日具有較大的差別。在工作日,居民出行目的大都為工作、上學(xué)等,根據(jù)站點(diǎn)所處空間位置差異,一般具有明顯的早晚高峰特征;而在非工作日,居民出行目的大都為購(gòu)物、訪(fǎng)友等,早晚高峰特征并不明顯,且工作日之間客流波動(dòng)情況高度相似,周六周日之間客流波動(dòng)情況較為相似,因次,本文將周內(nèi)客流劃分為工作日與休息日模式兩類(lèi)。
一般來(lái)說(shuō),利用虛擬變量對(duì)定性指標(biāo)進(jìn)行類(lèi)別特征劃分,但由于日期特征及天氣特征中的不同類(lèi)別,故不存在嚴(yán)格的大小關(guān)系,采用0,1,2,…這種量化方式顯然不太合適。在機(jī)器學(xué)習(xí)中,對(duì)于類(lèi)別標(biāo)簽這種標(biāo)稱(chēng)特征,采用獨(dú)熱編碼技術(shù)創(chuàng)建一個(gè)新的虛擬特征,具體編碼結(jié)果見(jiàn)表3。
表3 定性指標(biāo)量化結(jié)果
Tab.3 Quantitative results of qualitative indicators
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,為提高模型預(yù)測(cè)性能及泛化性能,采用了學(xué)習(xí)率衰減、Xavier初始化、權(quán)值衰減策略、隨機(jī)超參數(shù)調(diào)試策略與SGD優(yōu)化器。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練之初,需指定超參數(shù)取值或者取值范圍,本文所選取超參數(shù)搜索空間如表4所示。
表4 超參數(shù)取值或取值空間
Tab.4 Value intervals of hyper-parameters
經(jīng)多次實(shí)驗(yàn)和調(diào)試之后,當(dāng)初始學(xué)習(xí)率取0.01、預(yù)測(cè)步長(zhǎng)為2、LSTM層數(shù)為2、Batch_size為128、全連接層隱節(jié)點(diǎn)數(shù)量為96,Dropout概率為0.2時(shí),訓(xùn)練集和驗(yàn)證集誤差最小,MAE誤差和MSE誤差曲線(xiàn)如圖6和圖7所示。其中訓(xùn)練集MAE和MSE誤差分別為11.49和0.00084,驗(yàn)證集MAE和MSE誤差分別為0.00079和10.85。由圖6可看出,預(yù)測(cè)模型前期迭代過(guò)程中震蕩性較大,在迭代50次左右時(shí),誤差曲線(xiàn)逐漸趨于平緩,而且震蕩性較小,在迭代350次左右時(shí),趨于平緩。如圖7所示,MSE誤差在前50次震蕩程度較大,迭代50次之后其變化程度較小,這是由于MSE誤差是在標(biāo)準(zhǔn)化數(shù)據(jù)下計(jì)算的誤差,便于模型迭代求優(yōu),MAE誤差是在反歸一化之后計(jì)算的誤差。
圖6 訓(xùn)練集MSE誤差
圖7 驗(yàn)證集MAE誤差
為驗(yàn)證本預(yù)測(cè)模型的有效性,本文選取傳統(tǒng)ARIMA模型和單一LSTM神經(jīng)網(wǎng)絡(luò)為對(duì)比參照模型,經(jīng)多次試驗(yàn)與調(diào)試,得到三個(gè)模型在訓(xùn)練集和驗(yàn)證集的性能表現(xiàn)如表5所示。本文所提模型在訓(xùn)練集和驗(yàn)證集上的MAE誤差和MSE誤差分別為11.49和10.85,遠(yuǎn)小于A(yíng)RIMA和單一LSTM,其預(yù)測(cè)性能較ARIMA和LSTM更佳。
表5 模型的性能表現(xiàn)
Tab.5 Performances of different models
利用訓(xùn)練好的模型,對(duì)測(cè)試集進(jìn)行預(yù)測(cè),其中2017.11.30預(yù)測(cè)值與真實(shí)值對(duì)比如圖8所示,實(shí)線(xiàn)Real是真實(shí)值,實(shí)線(xiàn)Pred是多特征融合的組合預(yù)測(cè)模型預(yù)測(cè)值,實(shí)線(xiàn)LSTM_pred指單一LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值,實(shí)線(xiàn)ARIMA_pred指ARIMA模型預(yù)測(cè)值。由圖8可看出,多特征融合的組合預(yù)測(cè)模型能夠較好地?cái)M合客流變化特征,對(duì)高峰期客流突變有較好的識(shí)別性和擬合性,總體來(lái)說(shuō),模型預(yù)測(cè)性能表現(xiàn)穩(wěn)定且精度較佳;單一LSTM神經(jīng)網(wǎng)絡(luò)可以大致擬合客流變化趨勢(shì),但對(duì)于客流突變點(diǎn)、高峰點(diǎn)不能很好地識(shí)別和預(yù)測(cè),因此不能適應(yīng)波動(dòng)性較大的客流序列預(yù)測(cè);針對(duì)ARIMA模型,可以識(shí)別客流的早晚高峰,挖掘大體的客流變化趨勢(shì)特征,但是無(wú)法擬合客流波動(dòng)性大的特征。
圖8 2017.11.30預(yù)測(cè)值與真實(shí)值對(duì)比圖
由表5與圖8可知,LSTM神經(jīng)網(wǎng)絡(luò)在客流序列的時(shí)間依賴(lài)性發(fā)掘方面較ARIMA模型更佳,本文所提出的基于多特征融合的“端到端”短時(shí)客流預(yù)測(cè)模型性能最佳,這表明考慮時(shí)間維度、空間維度和外部因子作為預(yù)測(cè)輸入屬性,能夠有效提高模型預(yù)測(cè)性能和精度,同時(shí),“端到端”的預(yù)測(cè)框架能夠自適應(yīng)發(fā)掘特征融合的客觀(guān)規(guī)律。
本文考慮客流序列的時(shí)間依賴(lài)性、空間關(guān)聯(lián)性和外部因子建立多特征融合的“端到端”預(yù)測(cè)框架,利用全連接層融合不同特征,綜合考慮客流的不同影響因子?;谔荻认陆捣◤恼鎸?shí)數(shù)據(jù)中自適應(yīng)學(xué)習(xí)不同特征的方式,引進(jìn)學(xué)習(xí)率衰減、Xavier初始化、權(quán)值衰減策略和Dropout策略以提高模型預(yù)測(cè)性能。選取ARIMA模型和LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果表明,基于多特征融合的組合預(yù)測(cè)模型具有更佳的預(yù)測(cè)精度,其在訓(xùn)練集、驗(yàn)證集和測(cè)試集上的MAE誤差分別為11.49、10.85和11.98。綜上,融合多特征的“端到端”預(yù)測(cè)框架在客流預(yù)測(cè)上有更好的成效。但本文只預(yù)測(cè)單一站點(diǎn)的客流量,未實(shí)現(xiàn)全網(wǎng)客流同步預(yù)測(cè),未來(lái)還需進(jìn)一步研究全網(wǎng)客流整體預(yù)測(cè)。
[1] 呂田. 基于SDZ-GRU的多特征短時(shí)交通流預(yù)測(cè)方法[J]. 計(jì)算機(jī)與現(xiàn)代化, 2019 (10): 60-65.
[2] 崔洪濤, 陳曉旭, 楊超, 等. 基于深度長(zhǎng)短期記憶網(wǎng)絡(luò)的地鐵進(jìn)站客流預(yù)測(cè)[J]. 城市軌道交通研究, 2019, 22 (9): 41-45.
[3] DING C, DUAN J, ZHANG Y, et al. Using an ARIMA-GARCH modeling approach to improve subway short-term ridership forecasting accounting for dynamic volatility [J]. IEEE Transactions on Intelligent Transportation Systems, 2017, pp (99): 1-11.
[4] LIU Yang, LIU Zhiyuan, JIA Ruo. DeepPF: a deep learning based architecture for metro passenger flow prediction[J]. Transportation Research Part C, 2019 (101):18-34.
[5] 羅向龍, 李丹陽(yáng), 楊彧, 等. 基于KNN-LSTM的短時(shí)交通流預(yù)測(cè)[J]. 北京工業(yè)大學(xué)學(xué)報(bào), 2018, 44 (12): 1521-1527.
[6] 陸百川, 舒芹, 馬廣露. 基于多源交通數(shù)據(jù)融合的短時(shí)交通流預(yù)測(cè)[J]. 重慶交通大學(xué)學(xué)報(bào): 自然科學(xué)版, 2019, 38 (5): 13-19, 56.
[7] 劉帆洨, 彭其淵. 鐵路旅客購(gòu)票需求預(yù)測(cè)模型研究[J]. 交通運(yùn)輸工程與信息學(xué)報(bào), 2018, 16 (2): 50-56.
[8] ZHANG Y, ZHANG Y, HAGHANI A. A hybrid short-term traffic flow forecasting method based on spectral analysis and statistical volatility model [J]. Transportation Research Part C-emerging Technologies, 2014, 43: 65-78.
[9] LEE S, FAINBRO D. Application of subsct autoregressive integrated moving average model for short-term freeway traffic volume forecasting [J]. Journal of the Transportation Research Board. 1999: 179-188
[10] CHENMuchen, YU Wei. Forecasting the short-term metro passenger flow with empirical mode decomposition and neural networks[J]. Transportation research, Part C. Emerging Technologies, 2012, 148-162
[11] 馬小磊, 丁川, 于海洋, 等. 公共交通大數(shù)據(jù)挖掘與分析[M]. 北京: 人民交通出版社, 2017.
[12] WEI Y, CHEN M. Forecasting the short-term metro passenger flow with empirical mode decomposition and neural networks [J]. Transportation Research Part C: Emerging Technologies, 2012, 21 (1): 148-62.
[13] 胡進(jìn)寶. 基于雙層分解和核函數(shù)極限學(xué)習(xí)機(jī)的城市軌道交通短時(shí)客流預(yù)測(cè)[D]. 北京:北京交通大學(xué), 2017.
[14] ZHANG Y, ZHANG Y, HAGHANI A. A hybrid short-term traffic flow forecasting method based on spectral analysis and statistical volatility model [J]. Transportation Research Part C: Emerging Technologies, 2014,(43) 65-78.
[15] 黃梓榮. 軌道交通線(xiàn)網(wǎng)客流預(yù)測(cè)方法研究[D]. 廣州:華南理工大學(xué), 2015.
[16] 張琳. 基于深度神經(jīng)網(wǎng)絡(luò)的地鐵客流預(yù)測(cè)系統(tǒng)研究[D]. 北京:北京交通大學(xué), 2019.
[17] 張偉林. 基于深度學(xué)習(xí)的地鐵短時(shí)客流預(yù)測(cè)方法研究[D]. 深圳:中國(guó)科學(xué)院大學(xué)深圳先進(jìn)技術(shù)研究院, 2019.
[18] 周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社, 2016.
Short-term Passenger Flow Prediction of an Urban Rail Transit Based on Multi-feature Fusion
LI Zhao-feng1, NI Shao-quan1,2,3, SUN Ke-yang1, LV Miao-miao1,2,3
(1. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 611756, China; 2. National United Engineering Laboratory of Integrated and Intelligent Transportation, Chengdu 611756, China;3. National Engineering Laboratory of Integrated Transportation Big Data Application Technology, Chengdu 611756, China)
Passenger flow demand is a major prerequisite for the operations of an urban rail transit. With the rapid development of information collection technology and computing capabilities, the accuracy of short-term passenger flow deduction is especially critical when networks are established. Considering time dependence, the spatial correlation of passenger flow, and the randomness of external factors, an “end-to-end” short-term passenger flow prediction framework that incorporates multiple features is constructed based on a long short-term memory (LSTM) neural network. The LSTM neural network is used to mine the time-dependent characteristics of passenger flow. In addition, an external factor sparse matrix is embedded in the embedding layer, and a fully connected layer is used to fuse temporal features, spatial features, and other factors to obtain prediction results. Chengdu Metro South Railway Station was used as a case study. Following several experiments and based on a comparison of the autoregressive integrated moving average (ARIMA) model and LSTM neural network, the combined prediction model incorporating multiple features showed the best prediction performance, where the mean average errors of the training and validation sets were 11.49 and 10.85, respectively. In addition, the combined prediction model was tested on a test set and results showed that the model had better prediction accuracy and robustness than the ARIMA model and LSTM neural network.
urban rail transit; short-term passenger flow prediction; multi-feature fusion; end-to-end prediction framework; spatio-temporal correlation
1672-4747(2020)04-0093-10
U293
A
10.3969/j.issn.1672-4747.2020.04.012
2020-03-12
國(guó)家重點(diǎn)研發(fā)計(jì)劃資助(2017YFB1200702);國(guó)家自然基金項(xiàng)目(61703351,71971182);中國(guó)鐵路總公司科技研究計(jì)劃項(xiàng)目(P2018T001,P2018X001,N2018X006-01); 四川省科技計(jì)劃項(xiàng)目(2020YFH0035,2020YJ0268,2020YJ025,2020JDRC0032)
李兆豐(1994—),男,湖南岳陽(yáng)人,西南交通大學(xué)碩士研究生,研究方向:短時(shí)客流預(yù)測(cè)方法,E-mail:leezhaofeng94@foxmail.com
呂苗苗(1986—),女,山西文水人,西南交通大學(xué)講師,研究方向:鐵路運(yùn)輸組織與優(yōu)化,E-mail:314809108@ qq.com
李兆豐,倪少權(quán),孫克洋,等. 基于多特征融合的城市軌道交通短時(shí)客流預(yù)測(cè)[J]. 交通運(yùn)輸工程與信息學(xué)報(bào),2020, 18(4):93-102
(責(zé)任編輯:劉娉婷)