滕 靖,李金洋
(1.同濟(jì)大學(xué) 交通運(yùn)輸工程學(xué)院,上海 201804;2.同濟(jì)大學(xué) 上海市軌道交通結(jié)構(gòu)耐久與系統(tǒng)安全重點(diǎn)實(shí)驗(yàn)室,上海 201804)
近年來,隨著我國(guó)高速鐵路網(wǎng)絡(luò)的逐漸完善,生產(chǎn)要素在交通圈內(nèi)的流動(dòng)日益頻繁,這又進(jìn)一步助推了新型城鎮(zhèn)化發(fā)展進(jìn)程的不斷加快。在此過程中,都市圈內(nèi)的同城化效應(yīng)開始顯現(xiàn),高速鐵路城際客流規(guī)模不斷擴(kuò)大,并隨之出現(xiàn)高密度、通勤化、隨機(jī)性的新特征。因此,鐵路運(yùn)營(yíng)企業(yè)有必要做好客流預(yù)測(cè)研究,科學(xué)合理地把握城市間客運(yùn)需求狀態(tài),從而促進(jìn)企業(yè)在科學(xué)優(yōu)化資源配置、合理制定價(jià)格策略、動(dòng)態(tài)優(yōu)化產(chǎn)品結(jié)構(gòu)和持續(xù)提升運(yùn)輸服務(wù)質(zhì)量等方面不斷進(jìn)步。
客流預(yù)測(cè)是鐵路企業(yè)運(yùn)營(yíng)決策和動(dòng)態(tài)運(yùn)營(yíng)調(diào)整中最為關(guān)鍵的任務(wù)之一,同時(shí)也是支撐鐵路客運(yùn)產(chǎn)品設(shè)計(jì)向精細(xì)化發(fā)展的基礎(chǔ)。根據(jù)時(shí)間尺度,鐵路客流預(yù)測(cè)可以劃分為長(zhǎng)期、中期和短期預(yù)測(cè)3種類型[1]。短期預(yù)測(cè)一般以月份、星期、日為時(shí)間單位進(jìn)行,其中又以以日為單位的預(yù)測(cè)最具挑戰(zhàn)性。城際鐵路的短期客流因受到周末、節(jié)假日、大型活動(dòng)、天氣等因素的影響,呈現(xiàn)出波動(dòng)性大、隨機(jī)性強(qiáng)的特點(diǎn),為提高預(yù)測(cè)的準(zhǔn)確性增加了難度。
從預(yù)測(cè)模型類別來看,常用的短期預(yù)測(cè)方法可以分為2 類[2]。第1 類方法是參數(shù)模型,包括指數(shù)平滑模型、灰色預(yù)測(cè)模型、自回歸綜合移動(dòng)平均模型(ARIMA)等。這類方法在客流預(yù)測(cè)中較早得到應(yīng)用,但其不足也比較明顯,比如指數(shù)平滑模型難以對(duì)具有較大波動(dòng)性的序列做出較好的預(yù)測(cè);灰色預(yù)測(cè)模型可能會(huì)由于樣本的稀疏性,導(dǎo)致預(yù)測(cè)結(jié)果出現(xiàn)較大偏差;ARIMA 模型不能很好地把握時(shí)間序列的非線性關(guān)系等。第2 類方法是非參數(shù)模型,包括支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)模型等。其中,神經(jīng)網(wǎng)絡(luò)模型因其具有自適應(yīng)性、非線性、任意函數(shù)性和映射能力等特點(diǎn),在近年的鐵路客流短期預(yù)測(cè)中得到了大量應(yīng)用,成為研究的熱點(diǎn)。
早期,相關(guān)研究多是以單獨(dú)的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè),比如王艷輝等[3]建立了BP神經(jīng)網(wǎng)絡(luò)模型對(duì)鐵路客流量進(jìn)行了仿真預(yù)測(cè),汪健雄等[4-5]和WANG Yao 等[6]則在傳統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上做了進(jìn)一步改進(jìn),提高了模型的可擴(kuò)展性;在BP 神經(jīng)網(wǎng)絡(luò)之外,吳華穩(wěn)等[7]基于徑向基神經(jīng)網(wǎng)絡(luò),對(duì)鐵路客運(yùn)量進(jìn)行了分析研究,也取得了不錯(cuò)的效果。然而,神經(jīng)網(wǎng)絡(luò)還存在一些固有的缺陷,如局部極小問題、隱單元數(shù)目的選擇和過擬合的危險(xiǎn)等,這些都有可能影響模型預(yù)測(cè)的精度和可解釋性。為此,結(jié)合神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型近年來受到許多研究者的關(guān)注。比如曹承[8]將BP神經(jīng)網(wǎng)絡(luò)和模態(tài)分解算法結(jié)合起來構(gòu)建組合預(yù)測(cè)模型;任崇嶺[9]引入遺傳算法,對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行進(jìn)一步優(yōu)化;史峰等[10]將模態(tài)分解算法、遺傳算法和神經(jīng)網(wǎng)絡(luò)3種方法進(jìn)行融合,對(duì)高速鐵路平日客運(yùn)量進(jìn)行預(yù)測(cè),取得了較好的預(yù)測(cè)效果。
從預(yù)測(cè)對(duì)象范圍來看,早期的客流預(yù)測(cè)模型忽略了日期屬性,導(dǎo)致預(yù)測(cè)結(jié)果不能很好地解釋客流的異常波動(dòng)。后有學(xué)者區(qū)別日期的節(jié)假日、非節(jié)假日屬性,分別進(jìn)行短期客流預(yù)測(cè),這提升了預(yù)測(cè)精度,但卻降低了模型的普適性。近來又出現(xiàn)新的研究趨勢(shì),將節(jié)假日、非節(jié)假日整體考慮,建立統(tǒng)一的預(yù)測(cè)模型,對(duì)日期屬性做特殊標(biāo)記,在體現(xiàn)節(jié)假日特殊性的同時(shí)又恢復(fù)模型的通用性能。然而,現(xiàn)有的研究在日期屬性上的特征細(xì)分度還不夠,實(shí)踐中發(fā)現(xiàn),日客流波動(dòng)特征與日期所在月份、星期、節(jié)假日、甚至所在節(jié)假相鄰日期的屬性均有關(guān)系,有待于進(jìn)一步細(xì)化研究日期屬性帶來的影響。
在前述研究的基礎(chǔ)上,本文基于改進(jìn)的神經(jīng)網(wǎng)絡(luò)模型對(duì)鐵路城際客流進(jìn)行短期預(yù)測(cè):首先,基于2014—2018年間上海至南京單向鐵路客流的歷史數(shù)據(jù),對(duì)鐵路城際客流的波動(dòng)特征及影響因素進(jìn)行了分析;其次,綜合考慮日期屬性和天氣因素,提出1 種結(jié)合粒子群優(yōu)化(PSO)算法和長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)模型的鐵路城際短期客流預(yù)測(cè)方法;最后,以上海至南京的單向鐵路客流為例,對(duì)本文提出的預(yù)測(cè)方法進(jìn)行驗(yàn)證。
鐵路城際客流的短期變化受多方面因素影響,并呈現(xiàn)出既基于自身長(zhǎng)期演變趨勢(shì),又具有一定周期性、隨機(jī)性波動(dòng)的總體規(guī)律。以2014—2018年間,上海至南京的單向鐵路客流(包括高速鐵路、城際鐵路以及普速鐵路客流,以下簡(jiǎn)稱“滬—寧鐵路客流”)為例,觀察其變化趨勢(shì)。從長(zhǎng)期來看,滬—寧鐵路客流保持逐年增長(zhǎng)的發(fā)展態(tài)勢(shì),如圖1(a)所示;但若以更短的時(shí)間單位進(jìn)行周期性觀察,其客流變化還體現(xiàn)出不同的規(guī)律特征。
提取2017年全年的客流數(shù)據(jù),以月為單位觀察滬—寧鐵路客流,結(jié)果如圖1(b)所示。因受到暑假以及適宜度假的天氣因素影響,夏季8月的客流規(guī)模稍高于同年其他月份。而2月處于不適宜出行的冬季,當(dāng)月天數(shù)少于其他月份,又包含春節(jié)假期,對(duì)人們出行行為有較大影響,所以2月份的客流規(guī)模相對(duì)最低。
提取2017年11月1—28日客流數(shù)據(jù),以星期為單位觀察滬—寧鐵路客流,結(jié)果如圖1(c)所示。圖中,每個(gè)星期的起點(diǎn)為星期二??梢钥闯觯F路城際客流呈現(xiàn)出以星期為周期的顯著變化特征,星期五的客流會(huì)達(dá)到周期內(nèi)的高峰,星期一則是周期低谷,而其他工作日的客流則相對(duì)平穩(wěn)。
圖1 日期屬性對(duì)滬—寧鐵路客流變化規(guī)律與分布特征的影響
為了進(jìn)一步考察節(jié)假日的影響,以2017年清明小長(zhǎng)假為例,提取2017年3月20日—4月16日共4 個(gè)星期的客流數(shù)據(jù)(其中4月2—4日為清明小長(zhǎng)假),如圖1(d)所示??梢钥闯?,小長(zhǎng)假的出現(xiàn)打破了客流原有的以星期為周期的變化規(guī)律,使客流在小長(zhǎng)假的前1 d達(dá)到高峰,在小長(zhǎng)假中間1 d形成1個(gè)相對(duì)低谷,在小長(zhǎng)假最后1 d小幅反彈后,于小長(zhǎng)假結(jié)束后的2 d 達(dá)到客流最低谷,如圖中虛線所示。這一規(guī)律在歷年的小長(zhǎng)假中都可以得到印證,也說明了將節(jié)假日與非節(jié)假日綜合起來進(jìn)行預(yù)測(cè),能夠更全面地把握客流變化內(nèi)在規(guī)律。
為此,本文將細(xì)分日期屬性,綜合考慮客流產(chǎn)生時(shí)的月份、星期以及是否處于或臨近節(jié)假日,并將其影響納入預(yù)測(cè)模型。
以日為單位的鐵路客流預(yù)測(cè)還需要考慮其獨(dú)有的特征屬性:天氣。為排除周末因素對(duì)于客流的影響,選取2014年6月16日—7月3日共3 組 星期一至星期四的滬—寧鐵路客流進(jìn)行分析,如圖2所示;對(duì)應(yīng)日期上海的天氣情況整理列表見表1。可以看出,同樣是星期二到星期四,第1個(gè)星期以及第3 個(gè)星期的客流呈現(xiàn)逐步上升的趨勢(shì);而第2 個(gè)星期的客流則在星期三有所下降,原因是旅客的出行受到了天氣因素(大到暴雨)的影響。因此,本文將氣象特征如陰、晴、雨、雪等作為天氣因素的衡量指標(biāo),與日期屬性共同構(gòu)成鐵路城際短期客流的影響因素體系,以期提升預(yù)測(cè)的敏感度與準(zhǔn)確性。
圖2 2014年6月16日—7月3日共3組星期一至星期四的滬—寧鐵路客流
表1 2014年6月16日—7月3日共3組星期1至星期4的上海天氣情況
本文提出的考慮日期屬性與天氣因素的鐵路城際短期客流預(yù)測(cè)方法,是1 種考慮多影響因素的PSO-LSTM 組合預(yù)測(cè)模型(后文簡(jiǎn)稱PSOLSTM)。該方法應(yīng)用了粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法和長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)模型,其框圖如圖3所示。預(yù)測(cè)的具體步驟是:①對(duì)鐵路城際客流以及影響因素的歷史數(shù)據(jù)進(jìn)行預(yù)處理,將其轉(zhuǎn)化為有監(jiān)督學(xué)習(xí)的數(shù)據(jù)集;②用處理后的數(shù)據(jù)對(duì)LSTM 模型進(jìn)行訓(xùn)練,并應(yīng)用1種改進(jìn)的PSO 算法對(duì)超參數(shù)進(jìn)行優(yōu)化,從而得到最優(yōu)的預(yù)測(cè)模型;③將歷史數(shù)據(jù)以及預(yù)測(cè)期的影響因素?cái)?shù)據(jù)輸入訓(xùn)練好的最優(yōu)預(yù)測(cè)模型,對(duì)鐵路城際客流進(jìn)行預(yù)測(cè),其中,用于預(yù)測(cè)的歷史數(shù)據(jù)以及預(yù)測(cè)期長(zhǎng)度可根據(jù)應(yīng)用的實(shí)際需要進(jìn)行設(shè)定。
考慮鐵路城際短期客流的影響因素體系包括2方面:日期屬性和天氣因素。日期屬性包括月份、星期、節(jié)假日共3個(gè)因素,其中節(jié)假日取我國(guó)法定節(jié)假日的首末2日和相鄰日期,作為特殊的節(jié)假日屬性進(jìn)行處理。天氣因素以出發(fā)城市的氣象特征(如陰、晴、雨、雪等)來表征,這是因?yàn)榕c目的城市相比,出發(fā)城市的天氣更能夠直接影響旅客的出行決策。影響因素及其包含的取值見表2。
影響因素的取值兼顧了分類的簡(jiǎn)潔性和全面性。在節(jié)假日相關(guān)因素的取值中,考慮到清明節(jié)、端午節(jié)等春節(jié)以外的法定假日都具有相似的客流影響特征,將它們合并為1類;春節(jié)往往會(huì)帶來大量的返鄉(xiāng)、返工客流,對(duì)客流的時(shí)空影響范圍較大,所以春節(jié)假期內(nèi)的客流與其他小長(zhǎng)假的客流變化趨勢(shì)顯著不同,故將春節(jié)單獨(dú)列為1類。在氣象特征的取值中,本文進(jìn)行如下簡(jiǎn)化處理:對(duì)于氣象類型,“甲轉(zhuǎn)乙”的氣象類型取前者,如“晴轉(zhuǎn)多云”則記為“晴”;“甲到乙”的氣象類型則取后者,如“小到中雨”記為“中雨”。對(duì)于氣象類別,則是根據(jù)出發(fā)城市所處地理區(qū)位進(jìn)行差異化的具體設(shè)置,比如表2中的取值,就是在查閱歷年上海市氣象特征的基礎(chǔ)上,列出并涵蓋所有上海市常見的氣象特征。
圖3 基于PSO-LSTM 模型的鐵路城際短期客流預(yù)測(cè)方法框圖
各日期屬性與氣象特征的取值都為離散變量,在輸入模型時(shí)不宜采用1個(gè)連續(xù)的實(shí)數(shù)來表征;因此采用One-hot 編碼方式對(duì)影響因素?cái)?shù)據(jù)進(jìn)行離散化的表達(dá)。One-hot 編碼方式采用N位狀態(tài)寄存器,對(duì)N個(gè)狀態(tài)進(jìn)行編碼,每個(gè)狀態(tài)都采用獨(dú)立的寄存器位,并且在任意時(shí)間只有1位有效。這首先要求將分類值映射到整數(shù)值,再將每個(gè)整數(shù)值表示為二進(jìn)制向量,其中,除了整數(shù)的索引被標(biāo)記為1之外,其他的都被標(biāo)記為0。比如對(duì)于具有7個(gè)狀態(tài)的星期屬性而言,就需要用7 個(gè)字節(jié)進(jìn)行編碼,見表3。
同理,具有12 個(gè)狀態(tài)的月份屬性需要用12 個(gè)字節(jié)進(jìn)行編碼,具有11 個(gè)狀態(tài)的節(jié)假日屬性需要用11 個(gè)字節(jié)進(jìn)行編碼,具有13 個(gè)狀態(tài)的氣象特征需要用13個(gè)字節(jié)進(jìn)行編碼。綜上,在用One-hot編碼方式對(duì)4個(gè)影響因素進(jìn)行編碼處理之后,新的影響因素序列擴(kuò)充為12+7+11+13=43 列;加上客流數(shù)據(jù)列,共計(jì)44列。
在編碼處理歷史數(shù)據(jù)的基礎(chǔ)之上,再根據(jù)模型預(yù)測(cè)的輸入步長(zhǎng)和輸出步長(zhǎng)將數(shù)據(jù)轉(zhuǎn)化為有監(jiān)督學(xué)習(xí)的數(shù)據(jù)集。其中,輸入步長(zhǎng)是指在預(yù)測(cè)模型的實(shí)際應(yīng)用中需要輸入的歷史數(shù)據(jù)時(shí)間長(zhǎng)度,而輸出步長(zhǎng)則是指模型預(yù)測(cè)的時(shí)間長(zhǎng)度。比如本研究以14 d的歷史數(shù)據(jù)預(yù)測(cè)未來7 d 的客流,那么轉(zhuǎn)化為監(jiān)督學(xué)習(xí)后的數(shù)據(jù)總共為44×14+43×7=917列。
表2 鐵路城際短期客流影響因素指標(biāo)體系
表3 表示星期屬性的One-hot編碼
長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)的1 個(gè)變體,它能夠?qū)W習(xí)輸入數(shù)據(jù)中的長(zhǎng)期依賴,并且可以緩解模型訓(xùn)練中梯度消失和梯度爆炸的問題,在處理具有非線性時(shí)間序列的數(shù)據(jù)時(shí)具有明顯的優(yōu)勢(shì)[11-13]。雖然鐵路城際客流在短期內(nèi)的波動(dòng)較大,但它仍然是基于長(zhǎng)期客流變化的趨勢(shì)以及近期客流水平的,具有非常顯著的時(shí)間相關(guān)性。因此選用LSTM 神經(jīng)網(wǎng)絡(luò)模型,發(fā)揮其對(duì)于時(shí)間序列動(dòng)態(tài)變化規(guī)律的把握能力,精細(xì)化提取和學(xué)習(xí)鐵路城際短期客流演變特征,對(duì)客流做出精確預(yù)測(cè)。
在傳統(tǒng)遞歸神經(jīng)網(wǎng)絡(luò)模型(RNN)的隱藏層的神經(jīng)元中,LSTM 神經(jīng)網(wǎng)絡(luò)模型增加了1種被稱為記憶單元的結(jié)構(gòu),用來記憶過去的信息;增加了3 種門(輸入門、遺忘門、輸出門)結(jié)構(gòu),用來控制歷史信息的使用:忘記門控制記憶單元內(nèi)需要遺忘多少信息,輸入門控制每個(gè)記憶單元需要加入多少新信息,輸出門控制每個(gè)記憶單元需要輸出多少信息。LSTM 的神經(jīng)單元結(jié)構(gòu)如圖4所示。其中,it,ft和ot分別為t時(shí)刻的輸入門、遺忘門和輸出門;~ct,ct和ht分別為t時(shí)刻的候選長(zhǎng)期記憶、更新長(zhǎng)期記憶和工作記憶,其中ht亦為t時(shí)刻的輸出;xt為t時(shí)刻的輸入;σ 為sigmoid 激活函數(shù);tanh 為雙曲正切激活函數(shù);⊙表示逐點(diǎn)乘積。
圖4 LSTM 的神經(jīng)單元結(jié)構(gòu)示意圖
LSTM 神經(jīng)單元中各部分的計(jì)算方法如式(1)—(6)所示:
式中:Wxi,Wxf,Wxo,Wxc表示與t時(shí)刻輸入xt相關(guān)的權(quán)重矩陣;Whi,Whf,Who,Whc表示與前一時(shí)刻輸出ht-1相關(guān)的權(quán)重矩陣;bi,bf,bo,bc為各個(gè)函數(shù)的偏置項(xiàng)。
LSTM 神經(jīng)網(wǎng)絡(luò)中的記憶單元使得模型適合處理和預(yù)測(cè)時(shí)間序列數(shù)據(jù),但是學(xué)習(xí)率、隱藏層數(shù)以及訓(xùn)練次數(shù)這3 個(gè)超參數(shù)依然難以確定,而這3個(gè)超參數(shù)的設(shè)定又對(duì)模型的擬合能力、訓(xùn)練過程與訓(xùn)練效果有很大影響。在實(shí)際應(yīng)用中,超參數(shù)的設(shè)置通常依賴經(jīng)驗(yàn),具有很大的隨機(jī)性和主觀性。因此引入粒子群智能算法,對(duì)上述LSTM 神經(jīng)網(wǎng)絡(luò)中的3個(gè)超參數(shù)進(jìn)行優(yōu)化。
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法以其簡(jiǎn)單的操作和快速的收斂速度,廣泛應(yīng)用于各種優(yōu)化問題的求解當(dāng)中。在求解優(yōu)化問題時(shí),粒子群優(yōu)化算法通過跟蹤個(gè)體最優(yōu)粒子和群體最優(yōu)粒子來更新其速度和位置。這個(gè)過程可以描述如下:在1個(gè)D維的搜索空間中(即有D個(gè)待優(yōu)化參數(shù)),共有m個(gè)粒子組成1個(gè)群體。在第t步迭代中,某1 個(gè)粒子的速度和位置分別為vt和xt;然后該粒子通過追蹤當(dāng)前該粒子的最優(yōu)適應(yīng)度pbest和群體的最優(yōu)適應(yīng)度gbest,根據(jù)式(7)更新自己的速度和位置。
vt+1=wvt+e1r1(pbest-xt)+e2r2(gbest-xt)(7)式中:w為慣性權(quán)重;e1,e2為學(xué)習(xí)因子;r1,r2為隨機(jī)系數(shù);pbest,gbest分別為個(gè)體極值和群體極值;xt為粒子在t時(shí)刻的位置。
由于基本的粒子群優(yōu)化算法的全局尋優(yōu)能力和收斂速度有限,本研究在經(jīng)典算法之上又做了2 點(diǎn)改進(jìn)。①在粒子的速度更新表達(dá)式中,慣性權(quán)重w原本取固定值,現(xiàn)改進(jìn)為取值隨迭代次數(shù)動(dòng)態(tài)變化:即隨著迭代次數(shù)的增加,令慣性權(quán)重以非線性速度遞減,并且遞減的速度隨迭代次數(shù)遞增,從而保證了算法的局部尋優(yōu)能力。②在粒子的速度更新表達(dá)式中,學(xué)習(xí)因子e1和e2原本取固定值,現(xiàn)也改進(jìn)為取值隨迭代次數(shù)動(dòng)態(tài)變化。其中,對(duì)應(yīng)于局部最優(yōu)解的學(xué)習(xí)因子e1隨著迭代次數(shù)的增加由小到大變化,以加速粒子在前期的尋優(yōu)速度;而對(duì)應(yīng)于全局最優(yōu)解的學(xué)習(xí)因子e2則隨著迭代次數(shù)的增加由大到小變化,以在后期協(xié)助粒子的尋優(yōu)精度。改進(jìn)后的粒子群優(yōu)化算法流程如下。
第1 步,初始化參數(shù),確定種群規(guī)模、訓(xùn)練次數(shù)、學(xué)習(xí)因子以及位置的限定區(qū)間;
第2 步,初始化粒子的位置和速度,隨機(jī)生成LSTM神經(jīng)網(wǎng)絡(luò)模型的3個(gè)超參數(shù);
第3 步,確定粒子的評(píng)價(jià)函數(shù),本方法采用LSTM 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練樣本和測(cè)試樣本精度的均值作為模型的適應(yīng)度輸出;
第4 步,計(jì)算每個(gè)例子對(duì)應(yīng)位置的適應(yīng)度,根據(jù)初始粒子適應(yīng)度值確定個(gè)體極值和群體極值,并將每個(gè)粒子的最好位置作為其歷史最佳位置;
第5 步,在每1 次迭代過程中,根據(jù)下式更新粒子的速度、位置以及慣性權(quán)重和學(xué)習(xí)因子,并根據(jù)新種群粒子適應(yīng)度值更新粒子個(gè)體極值和群體極值。首先根據(jù)式(7)更新粒子的速度,然后根據(jù)式(8)—式(11)依次更新粒子的位置、慣性權(quán)重以及學(xué)習(xí)因子。
式中:t,tmax分別為當(dāng)前迭代次數(shù)和最大迭代次數(shù);vt為粒子在t時(shí)刻的速度;wmax,wmin分別為權(quán)重系數(shù)的上下界。
第6 步,滿足粒子群優(yōu)化算法最大迭代次數(shù)后,輸出模型最優(yōu)結(jié)果。
在最優(yōu)模型的基礎(chǔ)之上,將輸入步長(zhǎng)的歷史數(shù)據(jù)和輸出步長(zhǎng)的預(yù)測(cè)期影響因素?cái)?shù)據(jù)進(jìn)行預(yù)處理,輸入訓(xùn)練好的模型之中,即可得到預(yù)測(cè)期的鐵路城際客流預(yù)測(cè)結(jié)果。
上海和南京是長(zhǎng)三角城市群的2 大核心城市,經(jīng)濟(jì)關(guān)聯(lián)緊密,人員交流頻繁。滬寧通道正處在京滬運(yùn)輸大通道和沿江運(yùn)輸大通道的重疊區(qū)域,通道內(nèi)現(xiàn)有京滬既有線、京滬高鐵、滬寧城際3條鐵路線。本文即以上海至南京的O-D 客流為例,基于上文建立的PSO-LSTM 組合模型,對(duì)滬—寧鐵路客流進(jìn)行短期預(yù)測(cè),驗(yàn)證模型的有效性。
采集上海至南京2014年1月1日—2018年12月24日間,共計(jì)1 820 d 的單向鐵路客流數(shù)據(jù),以及5年間出發(fā)地上海的天氣信息,其中月份、星期、節(jié)假日屬性以及氣象特征的取值釋義見表4。
取前70%的數(shù)據(jù)作為訓(xùn)練樣本,后30%的數(shù)據(jù)作為檢驗(yàn)樣本。首先根據(jù)2.1 節(jié)所述方法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,對(duì)日期屬性和天氣因素進(jìn)行One-hot 編碼,并將編碼后的數(shù)據(jù)轉(zhuǎn)化為有監(jiān)督的數(shù)據(jù)集。取預(yù)測(cè)的輸入步長(zhǎng)為14,輸出步長(zhǎng)為7,即以14 d 的歷史數(shù)據(jù)預(yù)測(cè)未來7 d 的滬—寧鐵路客流。因此最后預(yù)處理后的有監(jiān)督數(shù)據(jù)集輸入列數(shù)為917列,輸出列數(shù)為7列。
表4 星期、月份、節(jié)假日屬性以及氣象特征的取值釋義
將上述數(shù)據(jù)輸入PSO-LSTM 模型中。根據(jù)嘗試和經(jīng)驗(yàn),PSO 算法中的種群規(guī)模和迭代次數(shù)都設(shè)置為15,LSTM 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)上下限分別設(shè)為10 和30,隱藏層數(shù)的上下限分別設(shè)置為8和64,學(xué)習(xí)率的上下限分別設(shè)置為0.000 1 和0.005 0。經(jīng)過15 次迭代,得到的最優(yōu)模型適應(yīng)度為91.58%,其中訓(xùn)練集的訓(xùn)練精度為90.81%,測(cè)試集的測(cè)試精度為92.35%;所對(duì)應(yīng)的LSTM 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)、隱藏層數(shù)以及學(xué)習(xí)率分別為26,46 和0.001 9。LSTM 模型的最優(yōu)訓(xùn)練次數(shù)、隱藏層數(shù)、學(xué)習(xí)率以及模型適應(yīng)度隨粒子群算法迭代次數(shù)的變化情況如圖5所示。
用上述LSTM 模型,預(yù)測(cè)2018年12月25—31日的滬—寧鐵路客流,其中12月30日和31日為2019年元旦假期的前2 d。將2018年12月11—24日共計(jì)14 d的滬寧鐵路客流數(shù)據(jù)與影響因素?cái)?shù)據(jù),以及預(yù)測(cè)期的影響因素?cái)?shù)據(jù)進(jìn)行預(yù)處理,然后將處理后的數(shù)據(jù)輸入LSTM 模型當(dāng)中,得到未來7 d 的滬寧鐵路客流預(yù)測(cè)結(jié)果,如圖6所示。
圖5 最優(yōu)訓(xùn)練次數(shù)、隱藏層數(shù)、學(xué)習(xí)率以及模型適應(yīng)度的變化曲線
圖6 基于PSO-LSTM 模型的滬—寧鐵路客流預(yù)測(cè)值
為了驗(yàn)證模型的有效性,再建立PSO-LSTM-1、PSO-LSTM-2、PSO-LSTM-3、PSO-LSTM-4、PSO-BP 共5 種模型,將其與本文PSO-LSTM 模型進(jìn)行對(duì)比。其中,PSO-LSTM-1、PSO-LSTM-2、PSO-LSTM-3、PSO-LSTM-4 模型分別是在原PSO-LSTM 模型中刪除了氣象特征、節(jié)假日屬性、月份屬性以及星期屬性的模型;PSO-BP 模型則是將原PSO-LSTM 模型中的LSTM 模型,替換為已被廣泛地應(yīng)用于鐵路城際短期客流預(yù)測(cè)的BP 神經(jīng)網(wǎng)絡(luò)。
本文建立的PSO-LSTM 模型,以及5 個(gè)對(duì)比模型最后的預(yù)測(cè)平均相對(duì)誤差分別為:6.75%,8.39%,15.66%,13.34%,8.48% 和9.35%。其中預(yù)測(cè)平均相對(duì)誤差?的計(jì)算方法如式(12)所示??梢姳疚乃⒌腜SO-LSTM 模型具有最優(yōu)的預(yù)測(cè)效果。
本文提出了1 種考慮多影響因素的PSOLSTM 組合預(yù)測(cè)模型。與以往的類似研究相比,本模型細(xì)分了日期屬性和天氣因素,設(shè)置了月份、星期、節(jié)假日等日期屬性,晴,多云,中雨等天氣因素;將日期屬性和天氣因素納入客流預(yù)測(cè)的影響因素體系;利用LSTM 模型對(duì)于處理非線性時(shí)間序列的優(yōu)勢(shì),提高模型的預(yù)測(cè)精度。采用上海到南京的單向鐵路城際客流數(shù)據(jù)以及上海的天氣信息進(jìn)行預(yù)測(cè)驗(yàn)證,預(yù)測(cè)輸入步長(zhǎng)為14 d,輸出步長(zhǎng)為7 d,最終的預(yù)測(cè)平均誤差為6.75%。與刪除了1 個(gè)影響因素的PSO-LSTM 模型,以及結(jié)合了BP 神經(jīng)網(wǎng)絡(luò)的PSO-BP模型相比,本模型具有最優(yōu)的預(yù)測(cè)精度。可見,全面考慮日期屬性與天氣因素的PSO-LSTM 模型具有較好的預(yù)測(cè)效果,可為鐵路運(yùn)營(yíng)企業(yè)把握城市間短期客運(yùn)需求狀態(tài)提供參考依據(jù)。
未來,本方法可考慮從以下2 個(gè)方面進(jìn)行改進(jìn)。其一,鐵路客流短期波動(dòng)的影響因素仍然需要全面細(xì)致的研究。本文所考慮的天氣和日期因素都是從需求側(cè)分析客流的波動(dòng),然而城際鐵路客流量也會(huì)受到供給側(cè)因素的影響,比如不同類型列車以及不同席位的數(shù)量比例等。其二,本文是用5年的客流數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,以14 d 的輸入步長(zhǎng)和7 d 的輸出步長(zhǎng)為例進(jìn)行客流預(yù)測(cè)的,而模型中最優(yōu)輸入輸出步長(zhǎng)的設(shè)置,也需要結(jié)合實(shí)際做進(jìn)一步的檢驗(yàn)和優(yōu)化。