張 陽,陳燕玲
(1.福建工程學(xué)院 交通運(yùn)輸學(xué)院,福建 福州 350118;2.福建工程學(xué)院 智能交通系統(tǒng)研究中心,福建 福州 350118)
地鐵具有運(yùn)送能力強(qiáng)、運(yùn)行效率高且節(jié)能環(huán)保等優(yōu)勢,一直受到城市居民和建設(shè)運(yùn)營部門的青睞。隨著城市化進(jìn)程的提速,城市人口的逐年增加,地鐵系統(tǒng)所承受的客流壓力也在不斷加大,部分線路和站點(diǎn)時常發(fā)生客流擁堵,不僅對乘客的出行體驗(yàn)產(chǎn)生不利影響,甚至?xí)順O大的安全隱患[1]。客流信息的及時發(fā)布以及面向客流變化的智能管控和調(diào)度技術(shù)能夠有效地幫助乘客制定合理的出行計(jì)劃,同時能夠幫助運(yùn)營部門制定合理的列車運(yùn)行時刻表,是避免乘客擁擠、維護(hù)地鐵運(yùn)營穩(wěn)定性的重要方法[2]。而準(zhǔn)確的地鐵客流預(yù)測則是實(shí)現(xiàn)這些重要方法的基礎(chǔ)和關(guān)鍵。
經(jīng)典客流預(yù)測方法較多關(guān)注客流量的時間關(guān)聯(lián)性,因而有較多學(xué)者利用客流量在時間上的變化特性進(jìn)行預(yù)測。此類方法可以在一定程度上提高對客流量預(yù)測的精度。較具有代表性的預(yù)測方法有時間序列法、支持向量機(jī)回歸[3]、卡爾曼濾波[4]、自回歸移動平均法(ARIMA)[5]、Holt-Winter[6]等多種方法。此類方法能夠充分考慮客流量數(shù)據(jù)在時間上的變化特性。然而客流量的變化是復(fù)雜的,尤其是受天氣因素、大型活動的影響等,地鐵客流量極易發(fā)生變化,使得預(yù)測結(jié)果產(chǎn)生較大的偏差。目前越來越多的學(xué)者嘗試?yán)蒙疃葘W(xué)習(xí)的方法來解決此問題。在此類方法中,具有代表性的模型有卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[7]、長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short-term Memory,LSTM)[8]以及深度信任神經(jīng)網(wǎng)絡(luò)[9]等多種模型。而以上模型大多只考慮了客流量的單一特征,利用單一的時間特性進(jìn)行客流預(yù)測。為了進(jìn)一步增強(qiáng)預(yù)測方法的泛化性,越來越多的學(xué)者使用組合模型進(jìn)行客流量預(yù)測。在多特征時間序列的預(yù)測上組合模型的預(yù)測精度比單一模型提高較多,應(yīng)用在客流預(yù)測中較為具有代表性的有蝙蝠算法優(yōu)化LSTM模型[10]、GA-BP神經(jīng)網(wǎng)絡(luò)模型[11]、小波-ARMA組合模型[12]、EMDPSO-LSTM組合模型[13]等多種組合模型。這些組合模型中,主要考慮了客流量的時間關(guān)聯(lián)性。由于客流量在地鐵網(wǎng)絡(luò)空間上也存在一定的關(guān)聯(lián)性,為了進(jìn)一步提升預(yù)測精度,已有部分學(xué)者開展了地鐵客流空間關(guān)聯(lián)性的相關(guān)研究,F(xiàn)eng等[14]設(shè)計(jì)了全局時空分量,可以有效地分析局部時空相關(guān)性。Yang等[15]提出多圖時空卷積神經(jīng)網(wǎng)絡(luò)(MGSTCN 網(wǎng)絡(luò)),構(gòu)造3 個圖來提取不同的客流變化模式,并通過圖卷積運(yùn)算從多個角度獲取空間特征。Huang 等[16]提出了一種基于多分量融合的時空圖模型MS-GAT提高處理多維數(shù)據(jù)的效率和實(shí)現(xiàn)自我注意力機(jī)制的便利性。傅成紅等[17]提出將深度信任網(wǎng)絡(luò)與支持向量機(jī)進(jìn)行結(jié)合,輸入影響因素?cái)?shù)據(jù)后進(jìn)行逐層學(xué)習(xí),提取關(guān)鍵信息,從而進(jìn)行預(yù)測。趙建東等[18]提出使用時間序列分解與門控循環(huán)單元相結(jié)合,將模型預(yù)測過程分為3 個階段進(jìn)行預(yù)測,同時將客流量劃分為3 類進(jìn)行預(yù)測。這些研究有效地提升了預(yù)測精確度。然而,與地鐵站點(diǎn)客流量的時間關(guān)聯(lián)性相比,地鐵網(wǎng)絡(luò)的客流數(shù)據(jù)在空間上的相關(guān)性更為復(fù)雜且難以準(zhǔn)確捕捉,如何準(zhǔn)確量化目標(biāo)站點(diǎn)與關(guān)聯(lián)站點(diǎn)群之間的空間關(guān)聯(lián)強(qiáng)弱性,如何在空間關(guān)聯(lián)性中更好地結(jié)合客流的時間關(guān)聯(lián)性等問題都亟待解決。
為了解決上述問題,研究提出一種多頭圖注意機(jī)制的深度學(xué)習(xí)地鐵客流預(yù)測方法。為了同時實(shí)現(xiàn)多個與目標(biāo)站點(diǎn)相關(guān)聯(lián)的地鐵站點(diǎn)群的客流時空數(shù)據(jù)學(xué)習(xí),構(gòu)建一種面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制,實(shí)現(xiàn)目標(biāo)站點(diǎn)與關(guān)聯(lián)站點(diǎn)群之間的空間關(guān)聯(lián)強(qiáng)弱性的準(zhǔn)確量化。同時,將面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制模型融入LSTM預(yù)測模型,在量化空間關(guān)聯(lián)性輸入數(shù)據(jù)的同時捕捉客流數(shù)據(jù)間的時間關(guān)聯(lián)性,進(jìn)一步提升客流預(yù)測的精度,以期能夠獲得較為優(yōu)質(zhì)的預(yù)測結(jié)果。
城市地鐵網(wǎng)絡(luò)中,客流的交通特性不僅在時間上存在關(guān)聯(lián)性,在起訖站點(diǎn)上也存在著空間關(guān)聯(lián)性。假設(shè)預(yù)測的目標(biāo)站點(diǎn)為訖點(diǎn),則其客流量的預(yù)測值和歷史客流數(shù)據(jù)相關(guān),且和潛在的起點(diǎn)站點(diǎn)客流相關(guān)。而在復(fù)雜的地鐵網(wǎng)絡(luò)中,潛在起點(diǎn)數(shù)量較多且?guī)茁噬洗嬖谳^大的差異性,存在量化困難。在地鐵網(wǎng)絡(luò)中,潛在起點(diǎn)對訖點(diǎn)的客流影響程度存在一定的差異。通常,不同起點(diǎn)對訖點(diǎn)的空間影響大小會與距離成正比。但是,由于地鐵站周圍土地屬性的差異,在同一空間距離內(nèi),各站點(diǎn)之間的客流影響程度并不完全一致。為了解決這一難題,構(gòu)建了一種面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制來學(xué)習(xí)獲取不同潛在起點(diǎn)的實(shí)際影響權(quán)重??紤]到圖神經(jīng)網(wǎng)絡(luò)與注意力機(jī)制相結(jié)合的圖注意力機(jī)制網(wǎng)絡(luò)模型對空間數(shù)據(jù)學(xué)習(xí)能力較強(qiáng),研究使用該框架進(jìn)行模型構(gòu)建。針對地鐵網(wǎng)絡(luò)存在多站點(diǎn)的問題,需要能夠重復(fù)多次執(zhí)行注意力機(jī)制,因而對圖注意力機(jī)制網(wǎng)絡(luò)模型進(jìn)行改進(jìn),通過構(gòu)建多個塊層實(shí)現(xiàn)能夠重復(fù)多次執(zhí)行注意力機(jī)制的多頭圖注意力機(jī)制,學(xué)習(xí)地鐵網(wǎng)絡(luò)的客流數(shù)據(jù)得出重要程度的差異性,從而為每一個潛在的起點(diǎn)站點(diǎn)分配不同的權(quán)重。塊層結(jié)構(gòu)如圖1所示。
圖1 塊層結(jié)構(gòu)Fig.1 Block layer structure
將地鐵網(wǎng)絡(luò)視為一個加權(quán)有向圖,表示為公式⑴。
其中V為頂點(diǎn)集,為各地鐵站點(diǎn)。V={V1,V2,…,Vn}即為頂點(diǎn)個數(shù),是研究范圍內(nèi)地鐵站點(diǎn)的個數(shù)。E代表邊集,用于表示節(jié)點(diǎn)連通性的鄰接矩陣。
構(gòu)建多頭圖注意力機(jī)制的構(gòu)建塊層,其中h={h1,h2,…,hn}hn∈nF為注意力層輸入特征。h′ =為注意力層輸出特征。使用多頭圖注意力機(jī)制得到映射a:通過映射a計(jì)算各節(jié)點(diǎn)的系數(shù),計(jì)算公式如下。
式中:eij為節(jié)點(diǎn)i相鄰節(jié)點(diǎn)j的重要程度;W為線性變換權(quán)重矩陣,W∈RF× RF′,F(xiàn)為各節(jié)點(diǎn)的特征數(shù)量。
對eij進(jìn)行歸一化操作,使其能夠更好地描述不同節(jié)點(diǎn)之間的權(quán)重。計(jì)算公式如下。
式中:aij為各節(jié)點(diǎn)的系數(shù),即各級節(jié)點(diǎn)的權(quán)重比例;LeakyReLU為非線性激活函數(shù);‖ 用于表示權(quán)重矩陣之間的串聯(lián)操作。
使用可訓(xùn)練的神經(jīng)網(wǎng)絡(luò)構(gòu)建a( ),并通過整體結(jié)構(gòu)訓(xùn)練進(jìn)行優(yōu)化。圖注意力機(jī)制中對中間層采用拼接、對最后一層采用求平均值的方法,利用公式⑷、公式⑸進(jìn)行注意力權(quán)重聚合鄰節(jié)點(diǎn)特征,其中中間層使用拼接方式計(jì)算過程如公式⑷,最后一層使用平均方式計(jì)算過程如公式⑸。
式中:為各個節(jié)點(diǎn)輸出權(quán)重;Ni為站點(diǎn)i的相鄰節(jié)點(diǎn)數(shù)量;為注意力機(jī)制計(jì)算后的權(quán)重;σ為非線性激活函數(shù)。
a為大小2F’的權(quán)重向量,因而相乘后可得到一實(shí)數(shù),則該實(shí)數(shù)即為注意力系數(shù)。eij通過權(quán)重矩陣a→進(jìn)行參數(shù)化,使用LeakyReLU函數(shù)激活。eij通過softmax函數(shù)進(jìn)行歸一化操作,在歸一化過后使得注意力權(quán)重產(chǎn)生非對稱性,從而能夠更好地進(jìn)行周邊站點(diǎn)影響力的分析。
與經(jīng)典的注意力機(jī)制不同,改進(jìn)的多頭注意機(jī)制構(gòu)建多個塊層能夠重復(fù)多次執(zhí)行注意力機(jī)制,從而能夠得到多個關(guān)聯(lián)站點(diǎn)與目標(biāo)站點(diǎn)間的差異化權(quán)重aij,這些權(quán)重是獨(dú)立互不干擾且能量化目標(biāo)站點(diǎn)與關(guān)聯(lián)站點(diǎn)間的空間關(guān)聯(lián)性,使數(shù)據(jù)的學(xué)習(xí)更加有側(cè)重性。
LSTM 在數(shù)據(jù)時間序列的規(guī)律性分析上性能優(yōu)越[19]。將研究提出的面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制融入LSTM 中,構(gòu)建融合多頭圖注意機(jī)制的LSTM 地鐵實(shí)時客流預(yù)測模型。在量化站點(diǎn)間空間關(guān)聯(lián)強(qiáng)弱性的基礎(chǔ)上利用LSTM來學(xué)習(xí)地鐵站中客流量的時間關(guān)聯(lián)性,使該方法既能側(cè)重于空間關(guān)聯(lián)性較強(qiáng)的站點(diǎn)間客流關(guān)聯(lián)性的學(xué)習(xí),同時也能捕捉站點(diǎn)自身客流數(shù)據(jù)時間上的關(guān)聯(lián)性,從而提升地鐵客流量的預(yù)測精度。
為了兼顧算法的時間關(guān)聯(lián)學(xué)習(xí)能力,模型采用LSTM 深度學(xué)習(xí)框架,用多頭圖注意機(jī)制替換傳統(tǒng)LSTM 中的矩陣乘法,融合多頭圖注意機(jī)制的LSTM 地鐵實(shí)時客流預(yù)測模型(以下簡稱“S-GATLSTM”)結(jié)構(gòu)如圖2所示。
圖2 S-GAT-LSTM結(jié)構(gòu)Fig.2 S-GAT-LSTM structure
在地鐵實(shí)時客流預(yù)測中,傳統(tǒng)的LSTM預(yù)測模型能夠較好地學(xué)習(xí)客流量的時間特性,但是對于客流量在空間上的關(guān)聯(lián)性學(xué)習(xí)上仍存有一定的不足。針對這一問題,將面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制融入LSTM中,以期在考慮時間關(guān)聯(lián)性的同時關(guān)注客流量的空間關(guān)聯(lián)性。S-GAT-LSTM 結(jié)構(gòu)組成主要有輸入門、輸出門、遺忘門。其中輸入門及記憶單元是用于學(xué)習(xí)歷史數(shù)據(jù)的時間特性,遺忘門則是用于對無關(guān)數(shù)據(jù)的淘汰,S-GAT-LSTM用于提取客流量空間關(guān)聯(lián)性,輸出門用于傳遞客流量歷史數(shù)據(jù)的時間、空間特性。融入面向地鐵網(wǎng)絡(luò)的多頭圖注意力機(jī)制后,其計(jì)算公式如公式⑹至公式⑾所示。
式中:不同的下標(biāo)中f,i,o分別表示LSTM 的遺忘門、輸入門和輸出門;其中,σ為Sigmoid 層(遺忘層)激活函數(shù),其輸出值在0~1之間,即表示遺忘層中的信息通過量;Ct-1,Ht-1,xt為上一時刻值,Ct,Ht為輸出值;tanh 層輸出值范圍為-1~1;F*用于豐富隱藏表示的多頭圖注意力機(jī)制;k為注意層數(shù),同時也是隱藏狀態(tài)和塊層狀態(tài)的維數(shù)。
利用城市交通IC 卡采集研究所需要的刷卡時間、刷卡站點(diǎn)等客流量數(shù)據(jù)信息,對該數(shù)據(jù)集進(jìn)行分析和預(yù)處理,從而實(shí)現(xiàn)融合多頭圖注意機(jī)制的LSTM地鐵實(shí)時客流預(yù)測。預(yù)測模型實(shí)現(xiàn)步驟如下。
步驟1:采集地鐵客流量樣本數(shù)據(jù),主要包括目標(biāo)地鐵站點(diǎn)過去一個月的歷史刷卡數(shù)據(jù),包括乘客進(jìn)出站點(diǎn)刷卡時間,周邊地鐵站點(diǎn)與目標(biāo)站點(diǎn)的距離,周邊地鐵站點(diǎn)的乘客進(jìn)出站刷卡時間等。對數(shù)據(jù)進(jìn)行預(yù)處理,主要進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)集成等,以去除數(shù)據(jù)中的噪聲及無關(guān)數(shù)據(jù)。將所得地鐵客流量數(shù)據(jù)按5 min 聚合,使其符合預(yù)測模型輸入數(shù)據(jù)格式要求。
步驟2:通過端到端學(xué)習(xí)平臺(Tensorflow)構(gòu)建融合多頭圖注意機(jī)制的LSTM地鐵實(shí)時客流預(yù)測模型,對預(yù)測模型的顯隱層結(jié)構(gòu)進(jìn)行初步設(shè)計(jì),初步設(shè)定隱層層數(shù)、顯隱層的結(jié)構(gòu)節(jié)點(diǎn)數(shù)等相關(guān)參數(shù)指標(biāo)。
步驟3:選取目標(biāo)研究地鐵站點(diǎn)的歷史客流量數(shù)據(jù)及周邊相關(guān)地鐵站點(diǎn)群的歷史數(shù)據(jù)作為模型輸入數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),將輸入數(shù)據(jù)劃分為訓(xùn)練集和測試集。利用訓(xùn)練集訓(xùn)練預(yù)測模型,根據(jù)上述計(jì)算目標(biāo)地鐵站周邊空間特性對其客流量的影響,使用公式⑴將地鐵網(wǎng)絡(luò)視為加權(quán)有向圖。根據(jù)公式⑵計(jì)算各節(jié)點(diǎn)的重要程度,使用公式⑶對各節(jié)點(diǎn)系數(shù)進(jìn)行歸一化操作,使用公式⑷至公式⑸進(jìn)行計(jì)算并輸出各節(jié)點(diǎn)特征。根據(jù)公式⑹至公式⑾實(shí)現(xiàn)數(shù)據(jù)的時間關(guān)聯(lián)性和站點(diǎn)的空間相關(guān)性學(xué)習(xí),分別輸出工作日和周末地鐵客流量預(yù)測值。
步驟4:利用測試集測試訓(xùn)練好的預(yù)測模型,根據(jù)測試結(jié)果多次調(diào)整模型參數(shù),計(jì)算相關(guān)指標(biāo),直至預(yù)測精度達(dá)到最好,從而在一定程度上提高模型預(yù)測效果。
步驟5:將地鐵客流量歷史數(shù)據(jù)作為真實(shí)值,使用模型預(yù)測所得結(jié)果與之進(jìn)行對比,以確定模型預(yù)測精度是否能夠達(dá)到預(yù)期目標(biāo),若符合模型輸出標(biāo)準(zhǔn)則輸出模型預(yù)測結(jié)果,若未達(dá)標(biāo)則返回步驟3,對模型結(jié)構(gòu)的相關(guān)參數(shù)指標(biāo)進(jìn)行修正,觀察模型輸出預(yù)測值的變化,直至模型預(yù)測精度達(dá)到預(yù)期標(biāo)準(zhǔn)。
上海市共有地鐵線路20 條,設(shè)有車站508 座。本次實(shí)驗(yàn)以徐家匯站為例,徐家匯站為地鐵1 號線、9 號線、11 號線換乘站點(diǎn)。徐家匯站周邊節(jié)點(diǎn)分布圖如圖3所示。
圖3 徐家匯站周邊節(jié)點(diǎn)分布圖Fig.3 Distribution of nodes around Xujiahui Station
使用相關(guān)地鐵刷卡信息,經(jīng)分析和預(yù)處理得到2019年4月1日至4月30日5:00—23:30共30 d實(shí)驗(yàn)研究范圍內(nèi)所需的上海地鐵一卡通刷卡數(shù)據(jù),并將其作為實(shí)驗(yàn)樣本設(shè)置,樣本時間粒度為5 min,將數(shù)據(jù)集劃分為訓(xùn)練集、測試集和驗(yàn)證集。考慮到地鐵網(wǎng)絡(luò)的工作日客流量與周末客流量存在一定的時空差異性,其中工作日有明顯的早晚高峰時間段,周末有較為明顯的站點(diǎn)客流量。因此將4 月前24天中的工作日時段和周末時段作為模型2個訓(xùn)練樣本集用于訓(xùn)練模型。分別對工作日時段和周末時段進(jìn)行了地鐵站點(diǎn)的客流量預(yù)測,進(jìn)行實(shí)證分析,以驗(yàn)證所提出的預(yù)測模型的預(yù)測精確度。將4 月26 日(周末)與4 月27 日(工作日)地鐵客流量數(shù)據(jù)作為預(yù)測模型中的測試集,用于測試多頭圖注意機(jī)制的深度學(xué)習(xí)地鐵實(shí)時客流預(yù)測模型的預(yù)測性能。
為使融合多頭圖注意機(jī)制的地鐵實(shí)時客流預(yù)測模型的精確度得到較好的評估,選取平均絕對誤差(MAE)[20]、相關(guān)系數(shù)R2及均方根誤差(RMSE)[18]作為評價(jià)指標(biāo)。
式中:xi為在時刻i的真實(shí)值;為在時刻i的預(yù)測值;為測試集平均數(shù);N為預(yù)測數(shù)據(jù)的總量;i為樣本數(shù)量。
為了評估圖注意機(jī)制對模型預(yù)測性能的影響,將融入圖注意力機(jī)制預(yù)測模型(S-GAT-LSTM)與不含圖注意力機(jī)制的LSTM預(yù)測模型的預(yù)測性能進(jìn)行對比,使用相關(guān)指標(biāo)驗(yàn)證S-GAT-LSTM 模型預(yù)測準(zhǔn)確性。
在本次研究中,所有神經(jīng)網(wǎng)絡(luò)均通過Tensorflow構(gòu)建,并選擇Adam[21]作為模型優(yōu)化器來更新模型中的參數(shù)。為了能夠更為準(zhǔn)確地對比圖注意機(jī)制對模型預(yù)測性能的影響,研究使用相同的學(xué)習(xí)率和迭代次數(shù)下進(jìn)行實(shí)驗(yàn)。由于模型之間參數(shù)的不同選擇會對模型精度產(chǎn)生一定影響,故文中不同模型的其他參數(shù)均采用該模型最優(yōu)參數(shù)。實(shí)驗(yàn)在前10 次迭代的學(xué)習(xí)率設(shè)置為0.01,每迭代10 次學(xué)習(xí)率減少0.1,所有模型在迭代30 次后停止。訓(xùn)練融合多頭圖注意機(jī)制的地鐵實(shí)時客流預(yù)測模型以及研究所需的其他相關(guān)模型,并根據(jù)地鐵網(wǎng)絡(luò)的客流量數(shù)據(jù)進(jìn)行預(yù)測。
分別對工作日和周末2 個時間段進(jìn)行地鐵站點(diǎn)的客流量預(yù)測,并與真實(shí)值做對比。工作日預(yù)測結(jié)果對比如圖4所示,周末預(yù)測結(jié)果對比如圖5所示。工作日預(yù)測結(jié)果指標(biāo)對比如表1 所示,周末預(yù)測結(jié)果指標(biāo)對比如表2所示。由圖4、圖5、表1、表2可知,在工作日時間段與在周末時間段,所提出的SGAT-LSTM模型預(yù)測精度均優(yōu)于傳統(tǒng)的LSTM預(yù)測模型。由此可見,面向地鐵網(wǎng)絡(luò)的多頭圖注意機(jī)制的深度學(xué)習(xí)地鐵實(shí)時客流預(yù)測方法是切實(shí)可行的,能夠有效提高地鐵網(wǎng)絡(luò)中站點(diǎn)的客流量預(yù)測精度。
表1 工作日預(yù)測結(jié)果指標(biāo)對比Tab.1 Comparison of weekday forecast results
圖4 工作日預(yù)測結(jié)果對比Fig.4 Comparison of weekday forecast results
圖5 周末預(yù)測結(jié)果對比Fig.5 Comparison of weekend forecast results
將S-GAT-LSTM 與其他經(jīng)典的深度學(xué)習(xí)預(yù)測模型、相關(guān)改進(jìn)DBN模型和STL-GRU組合預(yù)測模型進(jìn)行對比,各模型均采用3.2 所選取的指標(biāo)。各模型分別在工作日和周末進(jìn)行預(yù)測,工作日與經(jīng)典模型預(yù)測結(jié)果對比如圖6 所示,周末與經(jīng)典模型預(yù)測結(jié)果對比如圖7 所示。工作日與經(jīng)典模型預(yù)測結(jié)果指標(biāo)對比如表3 所示,周末與經(jīng)典模型預(yù)測結(jié)果指標(biāo)對比如表4所示。
表3 工作日與經(jīng)典模型預(yù)測結(jié)果指標(biāo)對比Tab.3 Comparison of weekday and classical model forecast result indexes
圖6 工作日與經(jīng)典模型預(yù)測結(jié)果對比Fig.6 Comparison of weekday and classical model forecast results
圖7 周末與經(jīng)典模型預(yù)測結(jié)果對比Fig.7 Comparison of weekend and classical model forecast results
根據(jù)圖6、圖7、表3、表4 可以得知,與其他經(jīng)典預(yù)測模型以及經(jīng)典改進(jìn)模型相比,S-GATLSTM 模型在工作日和周末的預(yù)測效果均有較大程度的提高。結(jié)果表明,S-GAT-LSTM 模型能夠兼顧地鐵站點(diǎn)中客流量的時間關(guān)聯(lián)性,以及多個與目標(biāo)站點(diǎn)相關(guān)聯(lián)的地鐵站點(diǎn)群客流的空間相關(guān)性,因而模型預(yù)測精度要優(yōu)于僅考慮了地鐵客流量時間關(guān)聯(lián)性的LSTM預(yù)測模型和僅考慮地鐵客流量空間相關(guān)性的DBN-SVR 預(yù)測模型。因此,在實(shí)際地鐵客流量的預(yù)測應(yīng)用中,同時考慮客流量的時間關(guān)聯(lián)性和空間相關(guān)性有利于提升模型的預(yù)測精度。同時,S-GAT-LSTM 模型在周末的預(yù)測準(zhǔn)確性優(yōu)于工作日,這表明在訓(xùn)練數(shù)據(jù)較少的情況下,S-GATLSTM模型的預(yù)測精確度不會產(chǎn)生較大的影響。
研究提出一種同時考慮客流量時間關(guān)聯(lián)性和站點(diǎn)空間相關(guān)性的地鐵站點(diǎn)客流預(yù)測方法,根據(jù)地鐵客流量的特征構(gòu)建面向地鐵網(wǎng)絡(luò)的多頭圖注意機(jī)制以學(xué)習(xí)潛在起點(diǎn)對研究站點(diǎn)的影響權(quán)重大小,構(gòu)建融合多頭圖注意力機(jī)制的LSTM預(yù)測模型,根據(jù)該預(yù)測模型學(xué)習(xí)地鐵周邊情況與相鄰站點(diǎn)對目標(biāo)站點(diǎn)的客流空間的影響系數(shù),以及地鐵客流量在時間上的變化特性,從而學(xué)習(xí)客流的時空特征,使用該模型學(xué)習(xí)周邊站點(diǎn)對目標(biāo)站點(diǎn)的空間影響,得出周邊站點(diǎn)的節(jié)點(diǎn)特征。根據(jù)該節(jié)點(diǎn)特征與空間相關(guān)性,進(jìn)行地鐵站點(diǎn)的客流量預(yù)測。通過地鐵客流量歷史數(shù)據(jù)進(jìn)行全面驗(yàn)證可以得出,所提出的面向地鐵網(wǎng)絡(luò)的多頭圖注意機(jī)制地鐵客流量預(yù)測方法預(yù)測精度優(yōu)于其他經(jīng)典的深度學(xué)習(xí)預(yù)測模型及其經(jīng)典的改進(jìn)模型。