杜文博 石婉君 廖盛時(shí) 朱熙
(1. 北京航空航天大學(xué) 電子信息工程學(xué)院, 北京 100083; 2. 北京航空航天大學(xué) 前沿科學(xué)技術(shù)創(chuàng)新研究院, 北京 100083)
相比于城市道路交通,機(jī)場快軌以準(zhǔn)點(diǎn)率高、速度快、運(yùn)能大、舒適性好等優(yōu)勢(shì),成為銜接機(jī)場與市區(qū)的重要交通方式。 然而,目前中國各大機(jī)場的快軌系統(tǒng)時(shí)常出現(xiàn)繁忙時(shí)段運(yùn)力不足、空閑時(shí)段運(yùn)力浪費(fèi)的“客流-運(yùn)力”不匹配現(xiàn)象,成為進(jìn)一步提升民航旅客出行效率和機(jī)場運(yùn)轉(zhuǎn)效能的瓶頸之一。 因此,有必要依據(jù)機(jī)場客流動(dòng)態(tài)變化情況對(duì)快軌運(yùn)力進(jìn)行高效調(diào)配。 為達(dá)到該目的,首要一步便是設(shè)計(jì)機(jī)場快軌客流的準(zhǔn)確預(yù)測(cè)模型。
機(jī)場快軌客流受眾多非線性因素影響,如進(jìn)離港航班旅客量、天氣、時(shí)段、是否為工作日等,這些因素對(duì)快軌客流的影響機(jī)理及相互之間的影響方式和大小各不相同;同時(shí),這些影響在時(shí)間維度上也有著復(fù)雜的先后關(guān)系,難以定性和定量描述,如從機(jī)場到市區(qū)方向快軌的客流形成過程中,惡劣天氣會(huì)使到港航班靠橋時(shí)間延后,加上到港旅客從下機(jī)到抵達(dá)機(jī)場快軌站需要一定時(shí)間,造成了機(jī)場快軌客流變化在時(shí)序上相對(duì)于天氣與到港航班旅客數(shù)量等因素變化的復(fù)雜耦合性。 可見,機(jī)場快軌客流的形成是一個(gè)復(fù)雜多變的過程,準(zhǔn)確預(yù)測(cè)機(jī)場快軌客流極具挑戰(zhàn)。
目前專門針對(duì)機(jī)場快軌客流預(yù)測(cè)的研究較少,而對(duì)于地鐵、鐵路客流預(yù)測(cè)問題,國內(nèi)外已有不少研究,方法大體可分為2 類:①基于數(shù)學(xué)建模的方法;②基于機(jī)器學(xué)習(xí)的方法。 第1 類方法認(rèn)為客流在歷史上的統(tǒng)計(jì)規(guī)律也適用于未來,基于對(duì)歷史客流數(shù)據(jù)的挖掘分析構(gòu)建描述客流變化規(guī)律的統(tǒng)計(jì)學(xué)模型,從而實(shí)現(xiàn)對(duì)未來客流的預(yù)測(cè)。具體來說,Li[1]使用交通四階段預(yù)測(cè)模型,即基于交通產(chǎn)生量、吸引量、交通分布和交通方式劃分因素建立數(shù)學(xué)模型,對(duì)哈爾濱地鐵客流數(shù)據(jù)進(jìn)行了預(yù)測(cè)分析;Ding 等[2]在自回歸移動(dòng)平均(autoregressive integrated moving average,ARIMA)模型中增加自回歸條件異方差模塊,從地鐵歷史客流數(shù)據(jù)中捕捉軌道客流在一天中不同時(shí)段的平均值和方差;Zhang 和Liang[3]綜合考慮了客流數(shù)據(jù)的日相似性,計(jì)算2 周中同周次的客流量比值得到歸一化客流數(shù)據(jù),再基于該數(shù)據(jù)建立改進(jìn)后的卡爾曼濾波預(yù)測(cè)模型,實(shí)現(xiàn)了對(duì)北京地鐵站的客流預(yù)測(cè)。 總體上,基于數(shù)學(xué)建模的方法通常計(jì)算復(fù)雜度低、易于實(shí)現(xiàn),但就本文所研究的機(jī)場快軌在未來較短一段時(shí)間內(nèi)客流的預(yù)測(cè)問題來說,該類方法難以準(zhǔn)確建模與短時(shí)客流密切相關(guān)的氣象、航班載客數(shù)等高動(dòng)態(tài)因素對(duì)客流的影響,因此對(duì)機(jī)場快軌短時(shí)客流預(yù)測(cè)的精度較低。
第2 類方法是基于機(jī)器學(xué)習(xí)的軌道客流預(yù)測(cè)方法,通過使用歷史軌道客流樣本訓(xùn)練機(jī)器學(xué)習(xí)模型,從樣本中挖掘客流受多種因素影響而動(dòng)態(tài)變化的知識(shí),從而實(shí)現(xiàn)對(duì)未來客流量的預(yù)測(cè)。 具體來說,Roos 等[4]從所研究站點(diǎn)客流與其自身歷史客流及臨近站點(diǎn)客流具有因果關(guān)系這一事實(shí)出發(fā),采用貝葉斯網(wǎng)絡(luò)對(duì)客流進(jìn)行預(yù)測(cè),且提出了一種缺失數(shù)據(jù)擬合策略,在客流數(shù)據(jù)不完整時(shí)采用最大期望算法學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),提升了該方法在數(shù)據(jù)缺失條件下的魯棒性;惠陽等[5]通過反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)構(gòu)建節(jié)假日、是否為工作日、時(shí)段、天氣等多種因素與地鐵客流間的映射,實(shí)現(xiàn)了對(duì)西安地鐵各站客流的準(zhǔn)確預(yù)測(cè);Sun 等[6]針對(duì)地鐵客流數(shù)據(jù)變化兼?zhèn)湟?guī)律性及隨機(jī)性,將客流變化曲線視作信號(hào),提出了先使用小波分析對(duì)客流變化曲線的高頻和低頻成分進(jìn)行拆解,再使用多個(gè)支持向量機(jī)對(duì)各成分分別學(xué)習(xí)預(yù)測(cè),最后綜合預(yù)測(cè)結(jié)果,避免了客流曲線不同頻段成分在預(yù)測(cè)過程中的相互影響。 上述軌道客流預(yù)測(cè)方法所采用的機(jī)器學(xué)習(xí)模型較為經(jīng)典,較基于數(shù)學(xué)建模的方法對(duì)多維因素影響客流的非線性機(jī)理挖掘得更深,但在捕捉高動(dòng)態(tài)因素與快軌客流間的復(fù)雜時(shí)序關(guān)聯(lián)上仍較為欠缺,導(dǎo)致預(yù)測(cè)性能并未達(dá)到最佳。 為此,一些學(xué)者使用時(shí)序深度學(xué)習(xí)網(wǎng)絡(luò)來解決該問題。 Yang 等[7]使用長短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò)對(duì)地鐵客流進(jìn)行預(yù)測(cè),且考慮到每天相同時(shí)段的客流變化趨勢(shì)較為類似,因此,借助時(shí)間注意力機(jī)制重點(diǎn)關(guān)注所預(yù)測(cè)時(shí)段在歷史數(shù)據(jù)上的客流變化情況,提升了預(yù)測(cè)準(zhǔn)確性;Ma 等[8]將客流數(shù)據(jù)分布轉(zhuǎn)化為靜態(tài)圖像,采用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)提取其中的空間特征,進(jìn)而用Bi-LSTM 網(wǎng)絡(luò)對(duì)客流時(shí)間序列分別從前向和后向?qū)W習(xí)時(shí)間特征,實(shí)現(xiàn)了地鐵客流數(shù)據(jù)空間特征和周期性的有效提取;Liu 等[9]使用3 個(gè)LSTM 網(wǎng)絡(luò)分別提取地鐵客流的時(shí)、日、周特性,結(jié)合天氣、是否為工作日、降水、地鐵運(yùn)營時(shí)刻、站點(diǎn)間的交通時(shí)長等影響客流的因素對(duì)地鐵換乘站及常規(guī)站點(diǎn)客流進(jìn)行了準(zhǔn)確預(yù)測(cè)。
綜上所述,基于時(shí)序深度學(xué)習(xí)的軌道客流預(yù)測(cè)方法因?qū)ι顚哟螘r(shí)空特征挖掘的能力強(qiáng)已成為軌道客流預(yù)測(cè)的主流方法。 但已有相關(guān)工作大多針對(duì)市區(qū)內(nèi)軌道交通,而本文所研究的機(jī)場快軌客流形成機(jī)理較之更為復(fù)雜。 機(jī)場快軌客流由乘機(jī)、下機(jī)、接機(jī)、送機(jī)等多類人員組成,受氣象、航班延誤、旅客通關(guān)等高動(dòng)態(tài)因素影響較大,同時(shí)這些因素變化與機(jī)場快軌客流形成之間存在顯著但難以量化的時(shí)序關(guān)聯(lián),這些特點(diǎn)導(dǎo)致傳統(tǒng)時(shí)序深度學(xué)習(xí)網(wǎng)絡(luò)難以高效學(xué)習(xí)機(jī)場快軌客流的變化規(guī)律。
為此,本文提出了一種基于“時(shí)間-特征”協(xié)同注意力機(jī)制的機(jī)場快軌客流預(yù)測(cè)方法。 該方法在LSTM 時(shí)序預(yù)測(cè)模型的基礎(chǔ)上嵌入了“時(shí)間-特征”注意力機(jī)制,用于精細(xì)化捕捉各維特征在不同時(shí)序上對(duì)機(jī)場快軌客流的影響規(guī)律。 將所提方法的性能與支持向量機(jī)(support vector machine,SVM)、BPNN、ARIMA、標(biāo)準(zhǔn)LSTM 等現(xiàn)有軌道客流預(yù)測(cè)代表性方法進(jìn)行了對(duì)比,驗(yàn)證了本文方法的優(yōu)越性。
如圖1 所示,LSTM 網(wǎng)絡(luò)[10]由循環(huán)訓(xùn)練的LSTM 單元構(gòu)成,展開后呈現(xiàn)鏈狀,鏈中每個(gè)LSTM 單元對(duì)應(yīng)著一個(gè)時(shí)間片。 LSTM 單元內(nèi)部具體結(jié)構(gòu)如圖2 所示。
圖1 LSTM 網(wǎng)絡(luò)Fig.1 LSTM network
圖2 LSTM 單元結(jié)構(gòu)Fig.2 LSTM unit structure
LSTM 單元包含輸入門、遺忘門、輸出門和記憶細(xì)胞。 輸入門用來確定當(dāng)前輸入有多少新的信息可以加入到記憶細(xì)胞中;遺忘門用來確定當(dāng)前細(xì)胞需要遺忘的信息;輸入門和遺忘門共同更新記憶細(xì)胞在每個(gè)時(shí)間片的狀態(tài);輸出門用來控制記憶細(xì)胞要輸出的信息。 LSTM 單元涉及的計(jì)算公式如下:
式中:ft、it、ot∈Rm分別為遺忘門、輸入門、輸出門的計(jì)算結(jié)果;c⌒t、ct、ht∈Rm分別為新生成的細(xì)胞狀態(tài)、當(dāng)前細(xì)胞狀態(tài)、隱藏狀態(tài);Whf,Whi,Who,Whc∈Rm×m和Wxf,Wxi,Wxo,Wxc∈Rm×n為 遺 忘 門、輸 入門、輸出門和單元狀態(tài)分別涉及的2 個(gè)權(quán)重矩陣;bf,bi,bo,bc∈Rm分別為遺忘門、輸入門、輸出門和單元狀態(tài)的偏置向量;xt為t時(shí)刻的輸入時(shí)間序列值;σ(·)為Sigmoid 激活函數(shù);tanh(·)為雙曲正切函數(shù)激活函數(shù);⊙為哈達(dá)瑪積。
Therefore, we analyzed miRNA expressions of both LSTs and protruded tumors as a specific feature of the stepwise progression from adjacent non-neoplastic mucosa to adenoma and submucosal invasive carcinoma using matched samples to compare accurate miRNA expression in each phase.
影響機(jī)場快軌客流的各個(gè)因素對(duì)快軌客流預(yù)測(cè)的貢獻(xiàn)程度、作用方式存在差異,為獲得準(zhǔn)確的預(yù)測(cè)效果,需要對(duì)不同特征受關(guān)注程度,以及同一特征在不同時(shí)間片上的受關(guān)注程度進(jìn)行學(xué)習(xí)和優(yōu)化。 為此,本文提出了一種“時(shí)間-特征”協(xié)同注意力機(jī)制,使得預(yù)測(cè)模型能夠?qū)Σ煌瑫r(shí)間片上不同特征的關(guān)注焦點(diǎn)進(jìn)行動(dòng)態(tài)調(diào)配。
近年來,注意力機(jī)制被廣泛應(yīng)用于基于深度學(xué)習(xí)的各種分類、預(yù)測(cè)、聚類等任務(wù)中[11-12],促使模型在學(xué)習(xí)樣本過程中重點(diǎn)關(guān)注相對(duì)重要的特征或歷史時(shí)序(對(duì)于時(shí)序樣本),以獲得更好的樣本泛化能力。 自注意力機(jī)制在捕獲全局長時(shí)序依賴關(guān)系上較傳統(tǒng)注意力機(jī)制優(yōu)勢(shì)明顯,然而自注意力機(jī)制對(duì)不同時(shí)間片使用的是同一組權(quán)重矩陣,不同特征之間權(quán)重不同,因此自注意力機(jī)制只能得到不同特征之間的相對(duì)注意力大小,無法得到一組時(shí)間序列中同一特征在不同時(shí)間片的注意力分布。 因此,本文通過對(duì)每一個(gè)時(shí)間片設(shè)置獨(dú)立的自注意力模塊,構(gòu)建“時(shí)間-特征”協(xié)同注意力機(jī)制,實(shí)現(xiàn)為不同時(shí)間片上的多維特征進(jìn)行獨(dú)立的權(quán)重分配。
本文所提出的基于“時(shí)間-特征”協(xié)同注意力(time and feature cooperative attention, TFATT)的快軌客流預(yù)測(cè)模型如圖3 所示。 首先,對(duì)客流及相關(guān)影響因素的原始數(shù)據(jù)進(jìn)行清洗,包括對(duì)數(shù)據(jù)缺失部分進(jìn)行推測(cè)補(bǔ)全,以及對(duì)異常數(shù)據(jù)進(jìn)行剔除;然后,為了消除不同客流影響因素(或稱輸入特征) 間的量綱差異,對(duì)數(shù)據(jù)進(jìn)行0-1 歸一化處理[13]。
圖3 機(jī)場快軌客流預(yù)測(cè)模型Fig.3 Passenger flow prediction model of airport express rail
歸一化后的輸入特征時(shí)序數(shù)據(jù)X= (x1,x2,…,xi,…,xT)∈Rn×T,其中n為輸入特征的數(shù)量,T為時(shí)間序列長度,隱藏層輸出H= (h1,h2,…,hT)∈Rm×T,其中m為LSTM 單元數(shù)量;再將H經(jīng)過全連接層得到新的時(shí)間序列A=WF·H=(a1,a2,…,ai,…,aT)∈Rn×T,其中WF∈Rn×m為全連接矩陣。
為構(gòu)建“時(shí)間-特征”協(xié)同注意力機(jī)制,本文方法針對(duì)每一個(gè)時(shí)間片設(shè)置了獨(dú)立的特征注意力模塊,即對(duì)于第i個(gè)時(shí)間片分別計(jì)算查詢(Query)矩陣Qi、關(guān)鍵字(Key)矩陣Ki、值(Value)矩陣Vi,1≤i≤T。
式中:e為K的維度大小。
對(duì)于每一個(gè)計(jì)算結(jié)果Attentioni(Q,K,V) ∈RT×n, 取其中第i個(gè)向量,記為atti,atti∈Rn。 將所有注意力模塊計(jì)算出的向量組合得到新的時(shí)間序列:ATT =(att1,att2,…,atti,…,attT)∈Rn×T,再經(jīng)過一個(gè)全連接層得到^yst=wF2·ATT·wF3(wF2∈R1×n,wF3∈RT×1為全連接向量),最后對(duì)^yst進(jìn)行反歸一化處理,得到機(jī)場快軌客流預(yù)測(cè)值^y。
本文選取2019 年1 月5 日至7 日、5 月9 日至11 日、8 月4 日至15 日、9 月27 日至30 日、12 月14 日至17 日共26 天的北京首都國際機(jī)場快軌站的進(jìn)出站刷卡數(shù)據(jù)、機(jī)場天氣數(shù)據(jù)(含晴、霧、雨3 類),以及航班起降計(jì)劃數(shù)據(jù)和實(shí)際起降數(shù)據(jù)。 目標(biāo)預(yù)測(cè)時(shí)段為6:30—23:00,選取10 min作為一個(gè)時(shí)間片長度(共計(jì)100 個(gè)時(shí)間片/天×26 天=2 600個(gè)時(shí)間片),統(tǒng)計(jì)每個(gè)時(shí)間片對(duì)應(yīng)的市區(qū)到機(jī)場方向客流、機(jī)場到市區(qū)方向客流、天氣、機(jī)場實(shí)際/計(jì)劃到離港航班載客數(shù)、時(shí)段信息(以1 h為單元,如19 ~20 時(shí)段)、工作日/非工作日信息。
本文將所提TFATT 模型與近年來最常見的軌道客流預(yù)測(cè)模型SVR[6]、BPNN[5]、ARIMA[2]和標(biāo)準(zhǔn)LSTM[7]模型進(jìn)行對(duì)比,通過咨詢行業(yè)領(lǐng)域?qū)<遗c調(diào)研文獻(xiàn),得到影響機(jī)場快軌客流的主要因素包括快軌客流歷史數(shù)據(jù)、進(jìn)離港航班旅客量、天氣、時(shí)段、是否工作日等。 為了明確機(jī)場到市區(qū)、市區(qū)到機(jī)場2 個(gè)方向上機(jī)場快軌客流的關(guān)鍵影響因素,本文基于2 600 條樣本,使用Pearson相關(guān)系數(shù)、SNR 信噪比對(duì)各個(gè)客流影響因素與2 個(gè)方向客流的關(guān)聯(lián)程度作初步檢驗(yàn),并挑選其中關(guān)聯(lián)度較大的特征作為模型輸入(ARIMA 模型除外,根據(jù)文獻(xiàn)[1]可知其輸入特征僅為客流)。具體為:對(duì)于機(jī)場到市區(qū)方向客流,特征包括機(jī)場到市區(qū)方向歷史客流、機(jī)場實(shí)際到港航班載客數(shù)(機(jī)場實(shí)際到港航班載客數(shù)與快軌客流間Pearson系數(shù)為- 0. 106)、實(shí)際與計(jì)劃離港航班載客數(shù)(實(shí)際離港航班載客數(shù)與快軌客流間Pearson 系數(shù)為0.302,計(jì)劃離港航班載客數(shù)與快軌客流間Pearson 系數(shù)為0.244)、天氣(晴、霧、雨天氣與快軌客流間信噪比為0.114)、時(shí)段(時(shí)段與快軌客流間信噪比為1.426)、是否工作日(是否工作日與快軌客流間信噪比為0.108);對(duì)于市區(qū)到機(jī)場方向客流,特征包括市區(qū)到機(jī)場方向歷史客流、機(jī)場計(jì)劃到港航班載客數(shù)(機(jī)場計(jì)劃到港航班載客數(shù)與快軌客流Pearson 系數(shù)為-0. 078)、機(jī)場實(shí)際與計(jì)劃離港航班載客數(shù)(機(jī)場實(shí)際離港航班數(shù)與快軌客流Pearson 系數(shù)為0.136,機(jī)場計(jì)劃離港航班數(shù)與快軌客流Pearson 系數(shù)為0.156)、天氣(晴、霧、雨天氣與快軌客流間信噪比為0.265)、時(shí)段(時(shí)段與快軌客流間信噪比為0.671)、是否工作日(是否工作日與快軌客流間信噪比為0.311)。 各模型采用目標(biāo)預(yù)測(cè)時(shí)間片的前6 個(gè)時(shí)間片的特征向量,對(duì)目標(biāo)預(yù)測(cè)時(shí)間片客流進(jìn)行預(yù)測(cè)。
考慮到模型的參數(shù)對(duì)模型性能有很大的影響,目前還沒有成熟的模型參數(shù)選取理論方法,因此,本文進(jìn)行了參數(shù)遍歷實(shí)驗(yàn)來挑選參數(shù)。 參數(shù)設(shè)置如下:①SVM。 核函數(shù)選擇徑向基函數(shù)(radio basic function,RBF),核系數(shù)gamma 設(shè)為auto,誤差項(xiàng)的懲罰參數(shù)C設(shè)為10。 ②BPNN。 BPNN 隱含層數(shù)設(shè)為2,每層大小設(shè)為36。 ③ARIMA。 自回歸系數(shù)p設(shè)為4,滑動(dòng)平均系數(shù)設(shè)為1,差分階數(shù)d設(shè)為0。 ④LSTM。 batch_size =128,timesteps =6,epochs =300,LSTM 單元數(shù)設(shè)為70,LSTM 隱藏層數(shù)設(shè)為2,損失函數(shù)設(shè)為MAE,激活函數(shù)設(shè)為Sigmoid,優(yōu)化函數(shù)設(shè)為Adam。 ⑤TFATT。 batch_size =128,epochs =300,隱藏層數(shù)設(shè)為2,損失函數(shù)設(shè)為MAE,激活函數(shù)為Sigmoid,優(yōu)化函數(shù)設(shè)為Adam。
本文實(shí)驗(yàn)在Windows10 系統(tǒng)中完成,CPU 為i7-8550U@ 1. 8 GHz,內(nèi)存8. 0 GB,IDE 為Pycharm2018.2,Python 版本為3.6,實(shí)驗(yàn)框架為Tensorflow2.6.2。
將26 天的數(shù)據(jù)中某一天的數(shù)據(jù)作為測(cè)試集(含100 條樣本),剩下25 天作為訓(xùn)練集(含2 500 條樣本),設(shè)置26 組實(shí)驗(yàn),每組實(shí)驗(yàn)獨(dú)立開展10 次,共開展260 次實(shí)驗(yàn)。
本文使用均方誤差(mean square error,MSE)和平均絕對(duì)誤差(mean absolute error, MAE)來定量評(píng)估2 種模型的性能[14]。 計(jì)算公式如下:
式中:yi為實(shí)際值;^y為預(yù)測(cè)值;m為樣本總數(shù)。
基于2.3 節(jié)所述實(shí)驗(yàn)設(shè)計(jì),表1 為260 次實(shí)驗(yàn)的平均結(jié)果。
由表1 可知,BPNN 和SVR 預(yù)測(cè)效果不如ARIMA、LSTM 及本文所提TFATT 模型,這是由于其雖然能夠在一定程度上挖掘出多維特征對(duì)客流的非線性影響,但不能捕捉多維輸入特征在前后時(shí)序上的關(guān)聯(lián);ARIMA 僅使用歷史客流數(shù)據(jù)作為輸入實(shí)現(xiàn)對(duì)未來客流的預(yù)測(cè),但其只能挖掘內(nèi)生變量的時(shí)序影響而未考量其他多因素的綜合影響,因此預(yù)測(cè)效果不如本文所提TFATT 模型;LSTM 可學(xué)習(xí)客流受到的多元特征時(shí)序影響,但面對(duì)機(jī)場快軌運(yùn)行中復(fù)雜的多維因素與客流耦合機(jī)理,對(duì)于特征時(shí)序關(guān)聯(lián)的泛化準(zhǔn)確度仍不足;本文所提TFATT 模型通過“時(shí)間-特征”協(xié)同注意力機(jī)制充分捕捉不同特征影響客流的時(shí)序滯后性,由表1 可知,本文所提模型在2 個(gè)方向上的客流預(yù)測(cè)效果均優(yōu)于其他4個(gè)對(duì)比模型。
此外,由表1 還可看出,各模型對(duì)市區(qū)到機(jī)場方向客流的預(yù)測(cè)精度普遍低于機(jī)場到市區(qū)方向(后文將對(duì)該現(xiàn)象原因作進(jìn)一步分析),但本文TFATT 模型相比于其他4 個(gè)模型在2 個(gè)出行方向上均有更好的預(yù)測(cè)效果,說明了“時(shí)間-特征”協(xié)同注意力機(jī)制對(duì)于提升模型預(yù)測(cè)性能的有效性。
表1 機(jī)場快軌客流預(yù)測(cè)性能Table 1 Forecasting performance of airport express rail passenger flow
為更直觀地查看各模型的預(yù)測(cè)效果,圖4 展示了將前25 天的樣本作為訓(xùn)練集、最后1 天樣本作為測(cè)試集的預(yù)測(cè)曲線。
圖4 客流預(yù)測(cè)曲線Fig.4 Forecast results of passenger flow
由圖4 所示結(jié)果可知,5 種模型均能夠預(yù)測(cè)出機(jī)場快軌實(shí)際客流變化的總體趨勢(shì),但仔細(xì)對(duì)比可發(fā)現(xiàn),本文TFATT 模型較其他模型在對(duì)實(shí)際客流曲線的擬合度上更優(yōu)。 機(jī)場快軌實(shí)際客流曲線均出現(xiàn)了在短時(shí)間內(nèi)波動(dòng)較大的現(xiàn)象,特別是在市區(qū)到機(jī)場方向,這是由一些偶然因素所致。例如,圖4(b)中市區(qū)到機(jī)場方向列車到達(dá)機(jī)場站時(shí)刻在各預(yù)測(cè)時(shí)間片上并非均勻分布,一旦有車到站則客流猛增,無車到站則客流稀少,造成實(shí)際客流曲線跳躍明顯。 由于偶然因素尚未被納入到本文實(shí)驗(yàn)?zāi)P偷妮斎胩卣髦?造成各模型的預(yù)測(cè)客流曲線均不能嚴(yán)密擬合于實(shí)際客流曲線,但實(shí)驗(yàn)結(jié)果仍能說明在現(xiàn)有數(shù)據(jù)基礎(chǔ)上,本文方法相比于其他方法具有優(yōu)越性。
1) 本文面向機(jī)場快軌運(yùn)力配置不能適應(yīng)客流動(dòng)態(tài)變化導(dǎo)致運(yùn)力不足或浪費(fèi)的問題,提出了一種基于“時(shí)間-特征”協(xié)同注意力機(jī)制的機(jī)場快軌客流預(yù)測(cè)模型TFATT,通過對(duì)不同因素在不同時(shí)序下對(duì)于機(jī)場快軌客流影響的顯著性進(jìn)行精細(xì)化建模,提升了機(jī)場快軌客流預(yù)測(cè)的精度,為機(jī)場運(yùn)控部門開展機(jī)場快軌運(yùn)力調(diào)控提供支撐。
2) 基于北京首都國際機(jī)場及其快軌實(shí)際運(yùn)行數(shù)據(jù)開展快軌客流預(yù)測(cè)實(shí)驗(yàn),將本文所提客流預(yù)測(cè)模型TFATT 與常用的基于BPNN、SVR、ARIMA、LSTM 模型的客流預(yù)測(cè)方法進(jìn)行了實(shí)驗(yàn)對(duì)比,結(jié)果驗(yàn)證了TFATT 模型的有效性。
目前僅考慮了機(jī)場路側(cè)的一種交通方式機(jī)場快軌進(jìn)行客流預(yù)測(cè),而實(shí)際上路側(cè)具有多種交通方式,彼此之間互有影響,后續(xù)可以開展機(jī)場快軌[15]、巴士[16]、出租車[17]等多種交通方式客流協(xié)同預(yù)測(cè)研究,以提升預(yù)測(cè)精度。