摘 要:對軌道交通進站客流進行準確的預(yù)測有助于城市交通系統(tǒng)更好的管理,及時做出應(yīng)對措施。使用K-means聚類方法對南京地鐵113個站點進行聚類,得到5個不同類別的軌道站點,分析不同類型站點進站客流的時序特征以及天氣與工作日因素對客流的影響,發(fā)現(xiàn)是否為工作日對進站客流影響最為明顯。用長短時記憶網(wǎng)絡(luò)將前35天的數(shù)據(jù)作為訓(xùn)練集預(yù)測后4天的客流量,將預(yù)測結(jié)果與循環(huán)神經(jīng)網(wǎng)絡(luò)和支持向量機做比較。結(jié)果表明:類別1和類別3站點的進站客流預(yù)測精度要優(yōu)于其他類別,長短時記憶網(wǎng)絡(luò)模型對居住型軌道站點進站客流的短時預(yù)測具有很好的適用性。
關(guān)鍵詞:LSTM;K-means;短時交通流預(yù)測;時間序列;軌道交通
中圖分類號:U231
文獻標志碼:A
城市軌道交通的發(fā)展作為城市公共交通現(xiàn)代化的重要組成部分,對于提高大中型城市客流運輸量和運輸效率、發(fā)展綠色交通以及緩解大城市道路交通擁堵具有重要意義。截至2020年年底,全國(不含港澳臺)境內(nèi)共有44個主要城市建設(shè)并開通投入運營的城市軌道交通線路233條,運營里程7 545.5 km,車站4 660座,實際運行列車2 528萬列次,完成客運量175.9億人次,進站量109.1億人次。然而,隨著我國城市化進程的不斷加快,城鎮(zhèn)化水平已突破60%,大量的人口涌入城市,給城市軌道交通帶來巨大的壓力和考驗,尤其是在早高峰和晚高峰時,城市圈內(nèi)的通勤需求給軌道交通帶來更加沉重的負擔(dān)。為加快建設(shè)交通強國的步伐,完善綜合交通樞紐和物流網(wǎng)絡(luò),提高城市群和都市圈內(nèi)部城市之間軌道交通通達性,提高運輸效率,準確的掌握乘客的出行規(guī)律,對城市軌道交通各站點的客流量進行準確預(yù)測十分有必要。
目前,國內(nèi)外針對軌道交通客流短時預(yù)測已經(jīng)進行了較深入的研究。張智勇[1]等在站臺短時客流特性的基礎(chǔ)上,提出一種改進卡爾曼濾波短時客流預(yù)測模型。馬超群[2]等考慮到了時間粒度對客流預(yù)測的影響,選取不同時間粒度下的時間序列,使用差分自回歸移動平均模型(autoregressive integrated moving average model,ARIMA)進行預(yù)測。因為客流具有周期性,王瑩[3]等在ARIMA的基礎(chǔ)上使用季節(jié)性自回歸移動平均模型對北京地鐵進站客流進行預(yù)測,可以準確的判斷出客流量的變化趨勢。楊軍[4]等基于灰色馬爾科夫預(yù)測模型提出了一種可以預(yù)測大型活動期間的軌道交通大客流的模型。潘杰[5]等在灰色馬爾科夫預(yù)測模型基礎(chǔ)上,對原始數(shù)據(jù)進行滑動平均處理,再與無偏灰色模型方法結(jié)合,提出了一種滑動無偏灰色馬爾科夫預(yù)測模型。傳統(tǒng)的理論模型在軌道交通客流短時預(yù)測上,雖然操作簡單,但是難以滿足當前地鐵進站客流波動變化的限制。
基于機器學(xué)習(xí)的計算機預(yù)測模型依靠算法,通過大量的訓(xùn)練數(shù)據(jù)進行特征學(xué)習(xí),從而提高分類或預(yù)測的準確性,覆蓋范圍廣,適應(yīng)性好,受到了學(xué)者廣泛關(guān)注。近年來,大量研究表明循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)在對時間序列預(yù)測時要比其他模型更準確,HEWAMALAGE[6]等通過RNN與統(tǒng)計模型的比較,認為其是一種有競爭力的預(yù)測方法。MADAN [7]等利用離散小波變換(discrete wavelet transformation,DWT)對時間序列數(shù)據(jù)進行分解,分別使用ARIMA和RNN進行預(yù)測,也充分說明RNN在時間序列方面的優(yōu)勢。但是,RNN無法解決長序列訓(xùn)練過程中梯度消失和梯度爆炸的問題。針對這一問題,MA[8]等提出了一種長短時記憶網(wǎng)絡(luò)(long short term memory network, LSTM),通過對北京市車速數(shù)據(jù)的測試,發(fā)現(xiàn)其預(yù)測精度和穩(wěn)定性都能達到很好的效果。羅向龍[9]等根據(jù)交通流的時空相關(guān)性,提出一種基于K-最近鄰與LSTM相結(jié)合的短時交通流預(yù)測模型。根據(jù)軌道交通客流的規(guī)律性和隨機性,LIANG[10]等引入變分模態(tài)分解(variational mode decomposition,VMD)將客流進行分解,結(jié)合LSTM實現(xiàn)客流的預(yù)測。MA[11]等提出了一種由卷積神經(jīng)網(wǎng)絡(luò)和雙向長短時記憶網(wǎng)絡(luò)組成的并行結(jié)構(gòu)模型,分別提取時間和空間特征,在模型中考慮了整個地鐵網(wǎng)絡(luò)的時空相關(guān)性。LSTM依靠自身優(yōu)異的性能,經(jīng)常被用來處理時間序列預(yù)測問題。
在軌道交通站點聚類上,K-means聚類方法因其簡單高效、收斂快等優(yōu)點被廣泛使用。徐威[12]等選擇路網(wǎng)密度、商業(yè)比例、居住比例、客流等作為特征指標,使用K-means聚類方法將蘇州市軌道交通站點分為5類。鄧評心[13]等采用定性、定量分析相結(jié)合,通過K-means聚類方法將蘇州軌道交通系統(tǒng)的58個站點分為了4類。GAN [14]等使用K-means聚類方法將南京地鐵站點分為7類,分別研究各類站點乘客出行特征與站點周圍土地利用類型以及覆蓋范圍之間的聯(lián)系。
大部分學(xué)者在進行客流短時預(yù)測研究時都注重在模型方法上的創(chuàng)新以提高預(yù)測的精度,但是較少從不同類型站點進站客流的差異性規(guī)律角度研究預(yù)測模型的適用性,往往在試驗部分只選擇一個站點進行驗證,這樣會存在偶然性。對此本文以南京軌道交通刷卡數(shù)據(jù)為研究對象,在各個站點客流的時序統(tǒng)計特征基礎(chǔ)上,使用K-means聚類算法對南京軌道交通系統(tǒng)113個站點進行聚類,然后對各個類別站點的進站客流數(shù)據(jù)建立LSTM短時客流預(yù)測模型進行預(yù)測,比較各類別站點的預(yù)測結(jié)果,進而判斷并分析各類別站點在使用LSTM短時客流預(yù)測模型的情況下預(yù)測精度上的差異。
1 模型構(gòu)建
1.1 K-means聚類
K-means聚類是一種無監(jiān)督學(xué)習(xí)的聚類方法,通過迭代算法不斷更新各個聚類中心,從而尋找k個簇,使得聚類結(jié)果所產(chǎn)生的損失函數(shù)可以達到最小。算法步驟如下。
步驟1:選取聚類特征指標,在數(shù)據(jù)集中任意選取k個樣本作為最開始的聚類中心;
步驟2:計算每個樣本到聚類中心的歐式距離,并根據(jù)最小距離重新對相應(yīng)樣本進行劃分聚類;
步驟3:計算每一類中各個樣本的平均值從而得到一個新的聚類中心;
步驟4:重復(fù)步驟2和步驟3,直到滿足最大迭代次數(shù)或者停止條件。
2 基礎(chǔ)數(shù)據(jù)分析
截至2017年底,南京地鐵已開通6條線路、共建成139座車站,線路總長為258 km,地鐵線路總長度在中國大陸排名第5位(僅次于上海、北京、廣州、深圳)、居世界第12位。本文選用南京市軌道交通2017年9月23日—2017年10月31日共計39 d,每日5:30—23:50進站的客流量為研究數(shù)據(jù),由于部分數(shù)據(jù)缺失,只選擇了其中113個站點為研究對象,并每隔10 min統(tǒng)計一次進站客流的人數(shù),每個站點共有4 329條數(shù)據(jù)。
2.1 特征指標選取
時間序列種類多樣,具有眾多特征,每一個特征都對時間序列從某一角度上進行了一定的理解和認知。為提高每個類別中站點預(yù)測精度的相似性,特征指標的選取至關(guān)重用。時間序列的特征包括形態(tài)特征、模型特征以及結(jié)構(gòu)特征三種類型,其中形態(tài)特征是指對時間序列在物理和形狀上發(fā)生改變的一種表現(xiàn)形式;模型特征是指時間序列在變化過程中隱藏的規(guī)律;結(jié)構(gòu)特征是指對時間序列的結(jié)構(gòu)和內(nèi)在變化的說明。
根據(jù)不同軌道站點的進站客流特征,本文選取偏度S、峰度K、工作日早高峰、晚高峰進站系數(shù),非工作日早高峰、晚高峰進站系數(shù),工作日客流標準差、非工作日標準差以及工作日客流系數(shù)作為聚類依據(jù)。
本文統(tǒng)計了南京軌道交通系統(tǒng)各個站點的進站客流,早高峰進站客流為選取時間7:00—9:00的進站客流,晚高峰進站客流為選取時間17:30—19:30的進站客流,工作日客流標準差為工作日全天10 min進站客流數(shù)的標準差,非工作日標準差為非工作日全天10 min進站客流數(shù)的標準差,偏度一般用來衡量數(shù)據(jù)分布偏斜方向和程度的大小,峰度是用來研究數(shù)據(jù)分布陡峭或者平滑的一種統(tǒng)計學(xué)測定。公式表達為:
早、晚高峰進站系數(shù)=該時間段內(nèi)進站客流全天進站客流(8)
工作日客流系數(shù)=一周中工作日進站客流總數(shù)一周進站客流總數(shù)(9)
根據(jù)K-means聚類結(jié)果,類別1中只有新街口站,作為亞洲最大的地鐵站為中華第一商圈服務(wù),客流量要遠遠大于其他的幾類車站;類別2和4中,站點為混合型,即站點周圍多為居住型用地、高校、旅游景點或者商業(yè)用地;類別3中站點周圍分布大量的居住型用地,以通勤客流為主;類別5中地鐵站多為交通樞紐和商業(yè)中心。
2.3 進站客流時序特征分析
在5個類別站點中選取新街口站、夫子廟站、軟件大道站、油坊橋站、奧體中心站、夢都大街站、南京南站以及鼓樓站共8個站點的進站客流作為各個類別的代表站點進行特征分析。各站點39 d客流量變化如圖2所示,不同類型的站點客流量在不同的時間段上表現(xiàn)不同的特征。新街口站單日的客流量明顯大于其他7個站點,在周末,新街口站、夫子廟站、南京南站以及奧體中心站客流量上升,夢都大街站、鼓樓站、軟件大道站和油坊橋站客流量下降。在周五,除奧體中心站客流每周不一樣外,其他站點客流均上升。國慶假期過后的三個星期里,進站客流量具有明顯的周期性。
影響進站客流量的因素眾多,本文主要探究天氣、溫度、是否工作日以及站點周圍用地屬性對各個地鐵站進站客流的影響。在39 d的數(shù)據(jù)中選取2017年10月16日—2017年10月22日完整一周的客流量單獨研究。如圖3所示,工作日和非工作日客流量呈現(xiàn)兩種不同的特征,在客流量上,新街口站、夫子廟站非工作日的客流量要大于工作日的客流量,鼓樓站、軟件大道站、油坊橋、奧體中心站以及夢都大街站工作日的客流量大于非工作日客流量,而南京南站的客流量無明顯變化;就站點周圍土地利用而言,新街口和夫子廟作為旅游商業(yè)用地,客流多以消費游玩為目的,進站客流非工作日的高峰時間比工作日時間提前并且持續(xù)時間更長。奧體中心作為文化體育設(shè)施用地,客流總量較小,在工作日有明顯的早、晚客流高峰,非工作日客流高峰則與奧體中心舉辦的一些大型活動密切相關(guān),大型活動的舉辦會導(dǎo)致附近站點客流急劇增長,活動結(jié)束后站點的進站客流增多,從而形成進站客流高峰[15]。油坊橋站附近多為居住用地,進站客流多為通勤客流,因此只有一個早高峰。南京南站作為對外樞紐,客流分布均勻,進站客流量與周圍交通樞紐密切相關(guān)[16]。鼓樓站、軟件大道站以及夢都大街站周圍有辦公商業(yè)用地,非工作日客流高峰比工作日開始時間延遲且客流量小,有早、晚高峰。
為了分析天氣和溫度對進站客流的影響,選取8個車站同為星期三的10月11日(雨)、10月18日(陰)和10月25日(晴)的進站客流,以確保具有其他相同的特征,如圖3所示。可以發(fā)現(xiàn),在不同的天氣條件下各個站點的客流并未出現(xiàn)明顯的變化。
進一步探究各個因素對客流的影響,使用Spearman進行相關(guān)性分析,工作日與非工作日對客流相關(guān)性顯著,天氣與氣溫對客流的影響并不顯著,如表2所示。因此,針對軌道交通客流短時預(yù)測,本文以是否為工作日作為預(yù)測模型的特征變量。
3 模型預(yù)測結(jié)果
3.1 模型參數(shù)配置
建立LSTM網(wǎng)絡(luò)預(yù)測模型對進站客流進行準確的預(yù)測,需要對模型的一些參數(shù)進行調(diào)試,例如,神經(jīng)元數(shù)量、輸入層的維度、時間步長、隱藏層的層數(shù)與維度和輸出層的維度。
經(jīng)過反復(fù)試驗,將預(yù)測模型設(shè)置為兩層的LSTM網(wǎng)絡(luò),中間為dropout=0.2的隨機失活層,以防止過擬合,最后一層則為全連接層。輸入層的維度為2維,用過去15個時間步長來預(yù)測未來,第一層網(wǎng)絡(luò)中的神經(jīng)元數(shù)量為100個,第二層網(wǎng)絡(luò)中的神經(jīng)元數(shù)量為50個。選定Adam優(yōu)化器作為本文LSTM網(wǎng)絡(luò)模型的優(yōu)化算法,Adam優(yōu)化器具有收斂速度快、實現(xiàn)簡單、計算高效等優(yōu)點,普遍被應(yīng)用于神經(jīng)網(wǎng)絡(luò)模型中。損失函數(shù)是模型對數(shù)據(jù)擬合程度的反映,即模型預(yù)測出來的值與實際值之間的差值,模型擬合效果越好,損失函數(shù)越小,本文選擇均方誤差(mean square error,MSE)作為模型的損失函數(shù)。
將工作日的標簽設(shè)置為1,非工作日的標簽設(shè)置為0,look_back=15,batch_size=64。需要特別說明的是,因為數(shù)據(jù)中只有國慶一個節(jié)假日,且并無對節(jié)假日軌道交通客流短時預(yù)測,因此將國慶期間的工作日標簽也設(shè)置為0。
將各個站點前35 d的數(shù)據(jù)(共3 885條數(shù)據(jù))作為訓(xùn)練集,最后4 d的數(shù)據(jù)(共444條數(shù)據(jù))作為測試集。使用基于TensorFlow后端的Keras框架進行測試,并使用訓(xùn)練集對該神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,訓(xùn)練次數(shù)設(shè)定為200次。
3.2 評價指標
為了評價模型的性能,使用均方根誤差和決定系數(shù)兩個指標對試驗預(yù)測的結(jié)果進行量化評估。誤差函數(shù)的計算公式如下所示:
1)均方根誤差(root mean square error,RMSE)
RMSE=1n∑nt=1yt^-yt2(12)
2)決定系數(shù)(R-square,R2)
R2=1-∑nt=1(yt-yt^)2∑nt=1(yt-yt)2(13)
式中,yt^為地鐵進站客流預(yù)測值,yt為地鐵進站客流真實值,yt為地鐵進站客流真實值的均值,n為樣本數(shù)量。
均方根誤差反映了預(yù)測值與真實值之間的偏差,代表預(yù)測的總體可靠性,其值越小,說明預(yù)測偏差越小,即說明預(yù)測總體越可靠。決定系數(shù)取值范圍為[0,1],數(shù)值越大表示模型擬合效果越好。
3.3 預(yù)測結(jié)果
通過LSTM對8個車站進站客流進行預(yù)測,不同類型站點的預(yù)測結(jié)果有所不同。如圖4所示,模型在訓(xùn)練的過程中,在前30次的訓(xùn)練損失函數(shù)下降速度快,在訓(xùn)練的后期,損失函數(shù)均趨于收斂,訓(xùn)練效果較為理想,其中奧體中心站和夢都大街站前期損失函數(shù)下降較慢,損失值比其余站點大。
將處理好的測試集輸入訓(xùn)練好的LSTM模型中,可以得到的預(yù)測結(jié)果如圖5所示,包含兩個工作日和兩個非工作日,說明面對不同類型車站的進站客流,模型具有良好的準確性、可行性以及適用性。但是,由于不同類型站點客流的進站特征規(guī)律存在差異,模型預(yù)測的準確度也會有所不同,總體而言,客流波動性較小的站點預(yù)測精度要更加準確。南京南站進站客流受到高鐵列車到站時間的影響,客流波動性大且無規(guī)律,奧體中心站受舉辦活動的影響,客流會在短時間內(nèi)突然增加,給模型的訓(xùn)練提高了難度。相反,客流進站規(guī)律且上下波動相對較小的油坊橋站以及新街口站的客流預(yù)測結(jié)果決定系數(shù)可以達到0.99。
將考慮是否工作日影響的LSTM模型(LSTM-workday)與支持向量機模型(support vector machine, SVM)、RNN模型以及LSTM模型的預(yù)測結(jié)果進行比較,如表3所示??梢园l(fā)現(xiàn),考慮是否工作日的LSTM模型可以很好地對進站客流進行預(yù)測,預(yù)測結(jié)果要優(yōu)于不考慮是否工作日的LSTM、RNN和SVM,其中,新街口站和油坊橋站客流預(yù)測的決定系數(shù)可達到0.99,奧體中心和夢都大街站客流預(yù)測的決定系數(shù)小于0.90。
進一步對各個類別站點的進站客流使用LSTM-workday進行預(yù)測,類別1和類別3的預(yù)測精度明顯優(yōu)于其他3個類別,類別4中的站點預(yù)測效果最不理想,預(yù)測決定系數(shù)大于0.95的站點只有18%,所有站點使用LSTM-workday預(yù)測決定系數(shù)均大于0.70,如表4所示。
4 結(jié)論
本文使用K-means聚類方法對南京地鐵113個站點進行聚類,得到5個類別的軌道站點,對各個類別的站點的進站客流使用LSTM進行預(yù)測。
1)發(fā)現(xiàn)類別1和類別3的站點的預(yù)測效果最好,其次是類別2和類別5,最后是類別4。LSTM在預(yù)測周圍用地屬性是居住型的站點的進站客流最為準確,可以為用LSTM進行客流預(yù)測時站點的選擇提供依據(jù)。
2)在預(yù)測方法上,使用LSTM預(yù)測模型,與SVM和RNN模型進行比較,添加是否工作日因素明顯會提高模型預(yù)測的精度。
3)天氣作為影響進站客流的重要因素之一,在工作日的影響要小于非工作日的影響,其對節(jié)假日客流量的影響較為顯著。由于數(shù)據(jù)不足,考慮天氣因素對模型的預(yù)測精度并不會有顯著的提高。
4)不同類型站點的進站客流表現(xiàn)出不同的時空特征,為進一步提高模型的準確度,需要增加試驗的數(shù)據(jù),可以考慮更多的影響因素,宜對客流采用組合模型進行預(yù)測。
參考文獻:
[1]張智勇, 張丹丹, 賈建林, 等. 基于改進卡爾曼濾波的軌道交通站臺短時客流預(yù)測[J]. 武漢理工大學(xué)學(xué)報(交通科學(xué)與工程版), 2017, 41(6): 974-977.
[2]馬超群, 李培坤, 朱才華, 等. 基于不同時間粒度的城市軌道交通短時客流預(yù)測[J]. 長安大學(xué)學(xué)報(自然科學(xué)版), 2020, 40(3): 75-83.
[3]王瑩, 韓寶明, 張琦, 等. 基于SARIMA模型的北京地鐵進站客流量預(yù)測[J]. 交通運輸系統(tǒng)工程與信息, 2015, 15(6): 205-211.
[4]楊軍, 侯忠生. 一種基于灰色馬爾科夫的大客流實時預(yù)測模型[J]. 北京交通大學(xué)學(xué)報, 2013, 37(2): 119-123,128.
[5]潘杰, 馬超群. 基于改進灰色馬爾科夫模型的地鐵客流預(yù)測[J]. 交通科技與經(jīng)濟, 2018, 20(6): 52-56,69.
[6]HEWAMALAGE H, BERGMEIR C, BANDARA K, et al. Recurrent neural networks for time series forecasting: current status and future directions[J]. International Journal of Forecasting, 2021,37(1):388-427.
[7]MADAN R, SARATHIMANGIPUDI P. Predicting computer network traffic: a time series forecasting approach using DWT, ARIMA and RNN[C]//2018 Eleventh International Conference on Contemporary Computing (IC3), 2018:1-5.
[8]MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54:187-197.
[9]羅向龍, 李丹陽, 楊彧,等. 基于KNN-LSTM的短時交通流預(yù)測[J].北京工業(yè)大學(xué)學(xué)報, 2018, 44(12):55-61.
[10]LIANG D, XU J, LI S, et al. Short-term passenger flow prediction of rail transit based on VMD-LSTM neural network combination model[C]//2020 Chinese Control and Decision Conference(CCDC). Hefei, China: Institute of Electrical and Electronics Zngineers Zne, United States, 2020: 5131-5136.
[11]MA X, ZHANG J, DU B , et al. Parallel architecture of convolutional bi-directional lstm neural networks for network-wide metro ridership prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2018(99):1-11.
[12]徐威,鄭長江,馬庚華,等.基于k-means聚類的城市軌道交通站點分類研究[J].貴州大學(xué)學(xué)報(自然科學(xué)版),2018,35(6):106-111.
[13]鄧評心,鄭長江,馬庚華,等.基于AFC數(shù)據(jù)挖掘的軌道交通站點分類研究[J].華東交通大學(xué)學(xué)報,2019,36(2):77-82.
[14]GAN Z, YANG M,F(xiàn)ENG T, et al. Understanding urban mobility patterns from a spatiotemporal perspective: daily ridership profiles of metro stations[J]. Transportation, 2018,47(1) :315-336.
[15]王興川,姚恩建,劉莎莎.基于AFC數(shù)據(jù)的大型活動期間城市軌道交通客流預(yù)測[J].北京交通大學(xué)學(xué)報,2018,42(1):87-93.
[16]LIU Y, LIU Z Y, JIA R. DeepPF: a deep learning based architecture for metro passenger flow prediction[J]. Transportation Research Part C: Emerging Technologies, 2019, 101:18-34.
(責(zé)任編輯:于慧梅)
Abstract:
The accurate forecast of the passenger flow of rail transit is helpful for the better management of urban transportation system and the timely response measures. The K-means clustering method is used to cluster 113 stations of Nanjing Metro, and five different types of rail stations are obtained. The time sequence characteristics of inbound passenger flow of different types of stations and the influence of weather and working day factors on passenger flow are analyzed, and whether working day has the most obvious influence on passenger flow is analyzed. The LSTM is used to predict the passenger flow of the next four days using the data of the first 35 days as the training set, and the prediction results are compared with the recurrent neural network and support vector machine. The prediction accuracy of inbound passenger flow of category 1 and category 3 stations is better than that of other categories.
Key words:
LSTM; K-means; short term traffic flow forecasting; time series; rail transit