譚 雪,張小強(qiáng),2,3
(1.西南交通大學(xué) 交通運(yùn)輸與物流學(xué)院,四川 成都 611756;2.綜合交通大數(shù)據(jù)應(yīng)用技術(shù)國(guó)家工程實(shí)驗(yàn)室,四川 成都 611756;3.綜合交通運(yùn)輸智能化國(guó)家地方聯(lián)合工程實(shí)驗(yàn)室,四川 成都 611756)
運(yùn)輸市場(chǎng)不同方式間競(jìng)爭(zhēng)越加激烈,鐵路運(yùn)輸企業(yè)若要進(jìn)一步提高貨運(yùn)市場(chǎng)的占有率,就必須制定并開(kāi)展靈活有效的貨運(yùn)營(yíng)銷及制定高效的運(yùn)輸計(jì)劃。這離不開(kāi)準(zhǔn)確預(yù)測(cè)計(jì)劃期內(nèi)的貨運(yùn)需求量。
目前許多學(xué)者已經(jīng)在運(yùn)量預(yù)測(cè)領(lǐng)域進(jìn)行研究,但大多以年貨運(yùn)量作為時(shí)間粒度,對(duì)月/日貨運(yùn)量預(yù)測(cè)研究較少。然而短期需求量是鐵路運(yùn)輸企業(yè)合理調(diào)配貨運(yùn)資源、制定運(yùn)輸生產(chǎn)計(jì)劃、衡量鐵路貨運(yùn)市場(chǎng)體系的重要指標(biāo)。其受多種復(fù)雜因素共同作用,如政策、季節(jié)、競(jìng)爭(zhēng)、運(yùn)價(jià)、國(guó)民經(jīng)濟(jì)指標(biāo)等,上下浮動(dòng)性和季節(jié)波動(dòng)性顯著,具有高度非線性和深度不確定性的特點(diǎn)。建立精確恰當(dāng)?shù)膮?shù)化預(yù)測(cè)函數(shù)模型較為困難。本文借助深度網(wǎng)絡(luò)對(duì)時(shí)序性數(shù)據(jù)強(qiáng)大的學(xué)習(xí)能力,研究結(jié)構(gòu)簡(jiǎn)單且具有高效記憶功能的GRU深度網(wǎng)絡(luò),在充分考慮短期特征向量的選取、預(yù)處理階段原始數(shù)據(jù)中異常清洗、模型參數(shù)設(shè)置等基礎(chǔ)上,建立鐵路短期貨運(yùn)量的預(yù)測(cè)模型,使月/日貨運(yùn)量預(yù)測(cè)更加精準(zhǔn)。
現(xiàn)階段時(shí)間序列問(wèn)題的需求預(yù)測(cè)方法包括定性分析和定量分析。定性分析包括德?tīng)柗品?、專家?huì)議法;定量分析又包括參數(shù)模型和非參數(shù)模型,其中參數(shù)化時(shí)間序列方法包括ARIMA、灰度模型,非參數(shù)化方法包括卡爾曼濾波器、支持向量機(jī)回歸(Supported Vector Regression,SVR)、神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)[1-5]等。
自然語(yǔ)言處理(Natural Language Processing,NLP)中的長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short Term Memory,LSTM)廣泛用于非語(yǔ)言類時(shí)間序列問(wèn)題。文獻(xiàn)[6]指出LSTM NN模型既可學(xué)習(xí)長(zhǎng)距離依賴關(guān)系又能確定最佳時(shí)間步長(zhǎng)。在交通流預(yù)測(cè)中,LSTM NN比Elman NN、時(shí)延神經(jīng)網(wǎng)絡(luò)(Time-Delay Neural Network,TDNN)、支持向量機(jī)等有更高的預(yù)測(cè)準(zhǔn)確率和泛化能力。文獻(xiàn)[7]同樣利用LSTM模型的記憶功能,根據(jù)城市當(dāng)前各區(qū)域內(nèi)的出租車出行量和出行行為信息預(yù)測(cè)后一階段各區(qū)域的出租車需求量。文獻(xiàn)[8]精簡(jiǎn)了LSTM單元結(jié)構(gòu),提出了門控復(fù)雜度更低的GRU結(jié)構(gòu)。文獻(xiàn)[9]將GRU應(yīng)用到城市交通流多步預(yù)測(cè)中,挖掘交通流前后時(shí)間序列間的依存關(guān)系。GRU深度網(wǎng)絡(luò)在短時(shí)間序列預(yù)測(cè)領(lǐng)域,原始時(shí)序數(shù)據(jù)中異常值處理對(duì)提高模型精度和魯棒性至關(guān)重要,常規(guī)的處理辦法是憑人工經(jīng)驗(yàn)發(fā)現(xiàn)異常值并刪除,但是該方法效率低下并且無(wú)理論依據(jù),不適合鐵路貨運(yùn)的大數(shù)據(jù)處理。
鐵路貨運(yùn)需求量預(yù)測(cè)的研究中,多使用BP神經(jīng)網(wǎng)絡(luò)、廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized Regression Neural Network,GRNN)和徑向基網(wǎng)絡(luò)(Radial Basis Function,RBF)預(yù)測(cè)年貨運(yùn)量。文獻(xiàn)[10]將AdaBoost與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,通過(guò)訓(xùn)練8個(gè)年貨運(yùn)量樣本外推2個(gè)年貨運(yùn)量,預(yù)測(cè)精度理想,但未闡述特征向量和目標(biāo)值間的相關(guān)性關(guān)系。文獻(xiàn)[11]首先利用相關(guān)性系數(shù)篩選出最優(yōu)的特征子集,又利用模糊聚類方法解決樣本數(shù)據(jù)自身矛盾問(wèn)題、強(qiáng)化高度相關(guān)指標(biāo)在神經(jīng)網(wǎng)絡(luò)中的作用,最后引入GRNN進(jìn)行貨運(yùn)量預(yù)測(cè),但是使用該模型每個(gè)測(cè)試樣本和全部訓(xùn)練樣本都要參與計(jì)算,空間復(fù)雜度高。文獻(xiàn)[12]采用徑向基神經(jīng)網(wǎng)絡(luò)對(duì)年貨運(yùn)量進(jìn)行預(yù)測(cè)。這三種模型預(yù)測(cè)時(shí)間粒度太大,在特征向量選擇上均弱化了月份、季節(jié)等日常因素對(duì)目標(biāo)值的影響,預(yù)測(cè)成果只對(duì)鐵路相關(guān)部門制定年計(jì)劃有借鑒作用。但就鐵路運(yùn)輸而言,運(yùn)輸企業(yè)更看重短期貨運(yùn)需求量,用以制定月計(jì)劃、靈活調(diào)整日班計(jì)劃和優(yōu)化貨運(yùn)營(yíng)銷辦法。
因此,建立結(jié)構(gòu)簡(jiǎn)單、高效的鐵路短期貨運(yùn)量預(yù)測(cè)模型并提高精度是鐵路貨運(yùn)部門亟待解決的問(wèn)題。本文將NLP領(lǐng)域中的GRU深度網(wǎng)絡(luò)與高度非線性且前后時(shí)間段相似性不強(qiáng)的日貨運(yùn)量數(shù)據(jù)結(jié)合,引入機(jī)器學(xué)習(xí)(Machine Learning,ML)中的隔離森林算法降噪,構(gòu)建短期貨運(yùn)量預(yù)測(cè)模型。
循環(huán)門單元是LSTM的變體,也是一種特殊類型的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neutral Network,RNN)。
傳統(tǒng)的RNN擁有輸入層-隱藏層-輸出層3種結(jié)構(gòu)。其基本思想是:時(shí)刻i輸入為Xi,輸出Yi由該時(shí)刻隱藏層節(jié)點(diǎn)狀態(tài)Si決定,而Si由Xi和i-1時(shí)刻的Si-1共同決定。這意味著RNN網(wǎng)絡(luò)對(duì)前時(shí)刻的記憶能力可以影響當(dāng)前時(shí)刻的輸出,所以廣泛應(yīng)用在時(shí)間序列問(wèn)題建模上。
當(dāng)RNN單元發(fā)展為標(biāo)準(zhǔn)的LSTM模型,隱藏層結(jié)構(gòu)發(fā)生顯著變化,包含1個(gè)單元和3個(gè)門:輸入門、輸出門和遺忘門。通過(guò)這樣的模型結(jié)構(gòu)設(shè)計(jì)增強(qiáng)了隱藏層功能,消除傳統(tǒng)RNN網(wǎng)絡(luò)反向傳播時(shí)梯度消失或梯度爆炸的問(wèn)題,可以學(xué)習(xí)長(zhǎng)距離依賴關(guān)系。
圖1 LSTM隱藏層單元結(jié)構(gòu)
GRU是LSTM的結(jié)構(gòu)變體,隱藏層單元結(jié)構(gòu)由重置門r和更新門z組成。取消了LSTM中細(xì)胞狀態(tài)和輸出門,將LSTM的輸入門和遺忘門組合為一個(gè)單獨(dú)的更新門。由于直接通過(guò)隱藏層狀態(tài)ht進(jìn)行信息傳遞,簡(jiǎn)化了LSTM的模型結(jié)構(gòu),網(wǎng)絡(luò)復(fù)雜度較低。GRU隱藏層單元結(jié)構(gòu)見(jiàn)圖2。
圖2 GRU隱藏層單元結(jié)構(gòu)
其時(shí)刻t的前向計(jì)算方法為[8]
zt=σ(Wz·[ht-1,xt]+bz)
(1)
rt=σ(Wr·[ht-1,xt]+br)
(2)
(3)
(4)
yt=σ(Wo·ht+bo)
(5)
本文針對(duì)短期貨運(yùn)量預(yù)測(cè)問(wèn)題,分別建立基于GRU的單步和多步預(yù)測(cè)模型。前者側(cè)重挖掘外部影響因素及歷史貨運(yùn)量對(duì)鐵路短期貨運(yùn)量大小的影響,后者是在前者的基礎(chǔ)上,可以挖掘貨運(yùn)量自身時(shí)序依賴關(guān)系的序列對(duì)序列(端對(duì)端)模型。為了提高輸入模型的樣本質(zhì)量、獲得更好的預(yù)測(cè)精度,在數(shù)據(jù)預(yù)處理階段引入隔離森林進(jìn)行異常值清洗。
兩種模型均包含輸入層、隱含層和輸出層3層基本結(jié)構(gòu)。
(1)輸入層
運(yùn)價(jià)、競(jìng)爭(zhēng)、日期、天氣等因素對(duì)鐵路貨運(yùn)量的影響存在滯后性,體現(xiàn)為貨主會(huì)根據(jù)運(yùn)輸市場(chǎng)運(yùn)價(jià)水平、天氣狀況調(diào)整發(fā)貨方式;同樣鐵路運(yùn)輸企業(yè),也會(huì)考慮自身的近期運(yùn)量水平和經(jīng)濟(jì)情況,改變經(jīng)營(yíng)決策。因此,t時(shí)刻的貨運(yùn)量大小yt不僅與當(dāng)前時(shí)刻外部影響因素指標(biāo)有關(guān),而且與前sstep外部影響因素及歷史貨運(yùn)量大小有聯(lián)系,這里認(rèn)為sstep之前的所有特征均為無(wú)關(guān)信息。
(2)隱含層
隱含層采用多層GRU單元。通過(guò)網(wǎng)格搜索法(Grid Search,CV)[14-15]調(diào)整超參數(shù),如GRU中隱藏神經(jīng)元的數(shù)量(hidden_dim)、堆疊循環(huán)單元的數(shù)量(隱含層數(shù))(layers_num)、訓(xùn)練樣本批大小(batch_size)和sstep值、學(xué)習(xí)率、訓(xùn)練次數(shù)等。
(3)輸出層
輸出層輸出預(yù)測(cè)值,這里采用MSE損失函數(shù)獲得預(yù)測(cè)值結(jié)果的誤差大小,計(jì)算方法為
(6)
在反向傳播階段,從損失函數(shù)開(kāi)始,逐層對(duì)各參數(shù)求偏導(dǎo),求得所有參數(shù)梯度,再根據(jù)學(xué)習(xí)率和梯度采用梯度下降算法調(diào)整權(quán)值。
深度網(wǎng)絡(luò)預(yù)測(cè)效果的優(yōu)劣取決于訓(xùn)練樣本的數(shù)量和質(zhì)量。預(yù)處理階段識(shí)別并清洗掉與預(yù)期對(duì)象行為差異較大的異常樣本,可提高模型的預(yù)測(cè)精度。
機(jī)器學(xué)習(xí)里面的異常檢測(cè)算法廣泛應(yīng)用在分類領(lǐng)域中。通常采用各種統(tǒng)計(jì)方法、距離、密度聚類等量化指標(biāo)描述樣本間的疏離程度,將遠(yuǎn)離所有族中心的樣本或密度極低處的樣本劃分異常點(diǎn),即少和不同的樣本點(diǎn)。這里我們采用隔離森林異常檢測(cè)方法[16],該方法較ORCA或隨機(jī)森林等在大量高維數(shù)據(jù)集異常點(diǎn)識(shí)別上效率、性能更優(yōu)。
隔離森林進(jìn)行異常檢測(cè)分為兩個(gè)階段:訓(xùn)練階段和檢測(cè)評(píng)估階段。
針對(duì)有n個(gè)樣本的數(shù)據(jù)集X={x1,x2,…,xn},訓(xùn)練階段是對(duì)X進(jìn)行子抽樣生成t棵隨機(jī)二叉樹(shù)(稱隔離樹(shù),iTree)組成一個(gè)隔離森林(iForest)。
在檢測(cè)評(píng)估階段,將測(cè)試樣本點(diǎn)x輸入iForest中的每一棵iTree中,獲得該樣本在iTree上劃入葉子節(jié)點(diǎn)到根節(jié)點(diǎn)的路徑長(zhǎng)度h(x),得到期望路徑長(zhǎng)度E(h(x))。
引入c(n)作為修正值,則x在由n個(gè)樣本數(shù)據(jù)集構(gòu)成的iTrees的異常分?jǐn)?shù)s(x,n)為
(7)
如果樣本的s(x,n)非常接近1,則該樣本一定為異常值;若s(x,n)遠(yuǎn)小于0.5,可視為正常樣本;如果所有樣本的s(x,n)近似為0.5,那所有的樣本無(wú)明顯異常值。
案例應(yīng)用某鐵路局2011—2017年7年間貨票系統(tǒng)原始數(shù)據(jù),部分?jǐn)?shù)據(jù)見(jiàn)圖3。為了使輸入深度網(wǎng)絡(luò)的貨票數(shù)據(jù)具有準(zhǔn)確性、完整性和一致性的特點(diǎn),對(duì)原始數(shù)據(jù)做以下預(yù)處理:
(1)去重去廢票
每一張貨票有唯一的貨票id和廢票標(biāo)志。對(duì)原始數(shù)據(jù)查證后發(fā)現(xiàn),存在大量重復(fù)貨票記錄和廢票,因此在貨票id及屬性值均相同的多條貨票中僅保留一條,同時(shí)去掉未進(jìn)行實(shí)際運(yùn)輸產(chǎn)生貨運(yùn)效益的廢票。
(2)貨票信息提取與按日期聚合
去除與貨運(yùn)量預(yù)測(cè)問(wèn)題相關(guān)性不強(qiáng)的貨票屬性,僅保留日期、運(yùn)價(jià)、計(jì)費(fèi)重量三種屬性,按照日期聚合獲得路局當(dāng)日貨運(yùn)總量(稱日貨運(yùn)量,百萬(wàn)t),平均獲得當(dāng)日平均運(yùn)價(jià)水平,分/t·km。
(3)隔離森林算法降噪
使用隔離森林對(duì)第二階段按日期聚合后的日貨運(yùn)量數(shù)據(jù)進(jìn)行異常樣本檢測(cè),并剔除部分對(duì)后續(xù)深度網(wǎng)絡(luò)訓(xùn)練有干擾的實(shí)際數(shù)據(jù),最終獲得2 429條能夠用于模型訓(xùn)練的日貨運(yùn)量數(shù)據(jù)。
圖3 2016年4月14日至2017年11月30日部分日貨運(yùn)量
(4)外部影響因素選取
現(xiàn)實(shí)中,鐵路貨運(yùn)量受國(guó)民生產(chǎn)總值、產(chǎn)業(yè)增加值、物價(jià)指數(shù)、競(jìng)爭(zhēng)環(huán)境、政策等經(jīng)濟(jì)指標(biāo)和運(yùn)輸能力、運(yùn)價(jià)水平、營(yíng)運(yùn)里程等路局生產(chǎn)指標(biāo)影響,這些指標(biāo)通常以月、季度和年時(shí)間段進(jìn)行統(tǒng)計(jì)。
為保證輸入深度網(wǎng)絡(luò)參與訓(xùn)練的數(shù)據(jù)量,我們?cè)谶x取粒度為日的外部影響因素指標(biāo)時(shí),綜合考慮所選的影響因素:對(duì)短期貨運(yùn)量預(yù)測(cè)問(wèn)題的重要度、合理性和獲取難易程度;從深度網(wǎng)絡(luò)過(guò)擬合的角度思考,也不宜選取過(guò)多因素。借鑒文獻(xiàn)[17-20],我們確定了對(duì)鐵路短期貨運(yùn)量預(yù)測(cè)3個(gè)非常重要且應(yīng)用較多的外部影響因素:日期、當(dāng)日平均運(yùn)價(jià)水平和天氣。
這里天氣是選取該鐵路局7個(gè)主要貨運(yùn)站所在5個(gè)城市的每日天氣狀況(數(shù)據(jù)來(lái)源:天氣預(yù)測(cè)網(wǎng)),理由如下:
在對(duì)7年間貨票原始數(shù)據(jù)做聚合時(shí)發(fā)現(xiàn),這7個(gè)貨運(yùn)站點(diǎn)年貨運(yùn)發(fā)送總量穩(wěn)居該鐵路局前9,并且占可進(jìn)行貨物到發(fā)業(yè)務(wù)的全部248個(gè)站點(diǎn)全年發(fā)送總量的份額,從2011年的25%逐年增長(zhǎng)至2017年的43%。
以年發(fā)貨量占比衡量站點(diǎn)的重要程度,將這7個(gè)站確定為主要貨運(yùn)站,選擇他們所在城市天氣狀況(晴、雨、雪、霾等)作為短期貨運(yùn)量預(yù)測(cè)的外部影響因素之一是合理的。
最終獲得2 429條數(shù)據(jù)記錄,每條記錄間隔時(shí)間為1 d,包含當(dāng)日平均運(yùn)價(jià)水平、日期、天氣狀況和日貨運(yùn)量。
(5)Max-min歸一化
未經(jīng)標(biāo)準(zhǔn)化的連續(xù)型變量往往會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)訓(xùn)練失敗。對(duì)輸入數(shù)據(jù)集的連續(xù)型變量的數(shù)據(jù)項(xiàng)進(jìn)行Max-min歸一化,加快神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)的梯度下降速度,在測(cè)試階段再對(duì)預(yù)測(cè)值做反歸一化處理。
(10)
式中:X為原時(shí)間序列;X′為歸一化后的時(shí)間序列;Xmax、Xmin分別為時(shí)間序列的最大值和最小值。
我們搭建兩種GRU模型,一種是將日期、當(dāng)日平均運(yùn)價(jià)水平和7個(gè)主要貨運(yùn)站所在5個(gè)城市天氣狀況3種外部影響因素和歷史幾日貨運(yùn)量數(shù)據(jù),共同作為特征向量預(yù)測(cè)模型/實(shí)驗(yàn)中將外部影響因素和歷史日貨運(yùn)量數(shù)據(jù)統(tǒng)稱特征向量預(yù)測(cè)短期貨運(yùn)量的基于GRU的單步預(yù)測(cè)模型;另一種為既考慮所有特征向量,又可挖掘貨運(yùn)量時(shí)間序列關(guān)系的基于GRU的多步預(yù)測(cè)模型,以下簡(jiǎn)稱GRU單步和GRU多步。
實(shí)驗(yàn)中所有預(yù)測(cè)模型按照2 429條數(shù)據(jù)記錄的80%、20%分別劃分訓(xùn)練集和測(cè)試集。
(1)單步預(yù)測(cè)模型參數(shù)
在Python3.7、TensorFlow1.12、Keras環(huán)境下編寫GRU單步算法程序??刂破渌瑓?shù)不變,sstep在{3,5,8,10,15}范圍內(nèi)搜索,按照單步模型在歸一化后的測(cè)試集上擬合MSE最小,選擇對(duì)應(yīng)sstep值,見(jiàn)圖4(a),設(shè)為5 d,即用前4天歷史日貨運(yùn)量和5天的日期、當(dāng)日平均運(yùn)價(jià)水平和天氣狀況其他3種外部影響因素一起,預(yù)測(cè)第5天的日貨運(yùn)量;保持sstep=5不變,堆疊GRU層數(shù)在{1,2,3,4,7}范圍內(nèi)搜索,見(jiàn)圖4(b)。其他超參數(shù)確定方法類似,最后搭建2層GRU單元和2層全連接層,隱藏神經(jīng)元數(shù)量分別設(shè)為20、10、10、1;學(xué)習(xí)率設(shè)為0.01;批大小設(shè)為32;優(yōu)化算法采用Adam;epochs為30時(shí)模型效果最優(yōu)。
圖4 網(wǎng)格搜索法
圖5 測(cè)試集效果對(duì)比
(2)多步預(yù)測(cè)模型參數(shù)
針對(duì)預(yù)測(cè)回歸類模型性能通常采用均方誤差(MSE)、均方根誤差(RMSE)、相對(duì)誤差(MAPE)和準(zhǔn)確率(ACC)等衡量,分別為
(11)
(12)
(13)
εACC=1-εMAPE
(14)
單步模型和多步模型在測(cè)試集上預(yù)測(cè)結(jié)果指標(biāo)見(jiàn)表1。
表1 模型指標(biāo)對(duì)比表
由表1可知,在測(cè)試集上GRU單步模型預(yù)測(cè)鐵路月貨運(yùn)量εACC高達(dá)98.87%,對(duì)比GRU多步模型高出1.13%;日貨運(yùn)量預(yù)測(cè)εACC達(dá)到94.56%,εRMSE僅為19.06,對(duì)比GRU多步模型εACC高出0.28%,εRMSE降低0.54。
現(xiàn)實(shí)中,農(nóng)歷春節(jié)一般正值2月,工礦制造企業(yè)停工,鐵路貨源減少,月貨運(yùn)量基本處于全年最低水平。圖5(a)發(fā)現(xiàn),2017年2月預(yù)測(cè)月貨運(yùn)量驟降,兩種模型結(jié)果都相對(duì)精準(zhǔn)且符合生產(chǎn)實(shí)際,這也檢驗(yàn)了模型的有效性。
為了比較GRU方法和其他經(jīng)典模型在預(yù)測(cè)鐵路短期貨運(yùn)量的性能,分別利用LSTM單步(模型結(jié)構(gòu)與GRU單步類似)、SVR、XGBoost和BP神經(jīng)網(wǎng)絡(luò)對(duì)同一數(shù)據(jù)集進(jìn)行大量反復(fù)試驗(yàn),各模型特征向量選擇及參數(shù)設(shè)置見(jiàn)表2。
表2 對(duì)比模型特征向量選擇及參數(shù)設(shè)置表
選擇對(duì)比模型在測(cè)試集上最優(yōu)指標(biāo)結(jié)果記錄,見(jiàn)表3。
表3 模型指標(biāo)對(duì)比表
由表3和圖6可知,在鐵路短期貨運(yùn)量預(yù)測(cè)問(wèn)題上,即便是GRU多步深度網(wǎng)絡(luò)模型也總體比LSTM、SVR、XGBoost和BP神經(jīng)網(wǎng)絡(luò)性能要優(yōu)。
從測(cè)試集日貨運(yùn)量預(yù)測(cè)指標(biāo)上看,SVR可以和GRU多步模型相媲美,RMSE和MAPE僅高了0.72和0.22%。從測(cè)試集月貨運(yùn)量預(yù)測(cè)指標(biāo)和效果圖上看,XGBoost和LSTM單步的對(duì)于測(cè)試集的預(yù)測(cè)趨勢(shì)和效果很接近;XGBoost模型的ACC僅低于GRU多步模型1.09%。
由此可見(jiàn),GRU深度網(wǎng)絡(luò)不但能提升模型復(fù)雜度去擬合高度非線性的短期貨運(yùn)量數(shù)據(jù),并且能自適應(yīng)考慮自身時(shí)序數(shù)據(jù)間的依賴性關(guān)系,所以能夠有效預(yù)測(cè)鐵路短期貨運(yùn)量。
圖6 測(cè)試集月貨運(yùn)量預(yù)測(cè)效果對(duì)比
本文結(jié)合某鐵路局實(shí)際貨運(yùn)生產(chǎn)情況,基于Tensorflow框架建立了基于GRU的單步和多步的短期貨運(yùn)量預(yù)測(cè)模型。前者側(cè)重挖掘日期、當(dāng)日平均運(yùn)價(jià)水平、天氣狀況和歷史貨運(yùn)量對(duì)鐵路短期貨運(yùn)量的影響;后者在單步模型的基礎(chǔ)上,又能挖掘貨運(yùn)量本身時(shí)間序列間的依賴性關(guān)系。然后與ML和DL領(lǐng)域主流的時(shí)間序列算法模型做比較。實(shí)驗(yàn)結(jié)果表明:GRU單步模型的準(zhǔn)確率在4組對(duì)比試驗(yàn)中最高,RMSE最小,泛化能力最強(qiáng),用其預(yù)測(cè)鐵路短期貨運(yùn)量、制定科學(xué)合理的貨運(yùn)月計(jì)劃和日班計(jì)劃、加強(qiáng)運(yùn)輸組織是可行的。
在接下來(lái)的研究中,我們會(huì)結(jié)合統(tǒng)計(jì)學(xué)習(xí)知識(shí),進(jìn)一步探索研究外部經(jīng)濟(jì)指標(biāo)與鐵路短期貨運(yùn)量之間的關(guān)系。