中圖分類號(hào):0211 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2025)13-0046-05
Abstract:Withthevigorousdevelopmentofe-commercelogisticsnetworks,enhancinglogisticstransportationficiencyand reducinglaborcostshavebecomecoreelementsforthelogisticsindustrytostrengthenitscompetitivenessThisstudyfocuseson thecargovolumeforecastingfortransportroutesinthesortingcentersofe-commercelogisticsnetworks,aiming toacurately depictthedailyandevenhourlyfluctuationsincargovolumeoverthenext3Odaysthroughin-depthminingofhistoricalcargo volumedata.Specificall,wefirstconducted meticulouspreprocessingofdailycargovolumedatafromthepastfourmonthsand hourlycargovolumedatafromthepast3Odaysfrom57sortingcenters.Onthisbasis,weconstructedanAutoregresive IntegratedMovingAverage(ARIMA)modeltopredictthedailycargovolumeprofileoverthenext3Odays.Furthermore,we introducedaLong Short-TermMemory(LSTM)neuralnetworkmodeltoachieveprecisepredictionsof hourlycargovolumedata for the next 30 days.
Keywords: logistics network; transportation route;cargo volume profile; ARIMA model; LSTM model
現(xiàn)代物流是國(guó)民經(jīng)濟(jì)的核心,對(duì)經(jīng)濟(jì)發(fā)展至關(guān)重要,能促進(jìn)市場(chǎng)繁榮、推動(dòng)高質(zhì)量發(fā)展。為確保貨物高效、準(zhǔn)時(shí)、低成本送達(dá),制定精確的分揀管理方案尤為關(guān)鍵。目前,學(xué)術(shù)界在物流需求預(yù)測(cè)方面已有深入研究,且我們掌握了多個(gè)分揀中心的歷史日貨量與小時(shí)貨量數(shù)據(jù)?;诖?,本文構(gòu)建了ARIMA和LSTM模型,旨在精準(zhǔn)預(yù)測(cè)分揀中心未來(lái)的日貨量與小時(shí)貨量。該模型緊密結(jié)合實(shí)際,具有良好的通用性和廣泛的適用性,為分揀管理提供了有力的支持。
1數(shù)據(jù)預(yù)處理
本文采用的數(shù)據(jù)來(lái)源于\"2024年第十四屆Math-orCup數(shù)學(xué)應(yīng)用挑戰(zhàn)賽\"官網(wǎng),官網(wǎng)提供了57個(gè)分揀中心過去4個(gè)月每天貨量和過去1個(gè)月每小時(shí)貨量
數(shù)據(jù)。現(xiàn)需要通過歷史貨量數(shù)據(jù)對(duì)57個(gè)分揀中心未來(lái)30天每天及每小時(shí)貨量進(jìn)行預(yù)測(cè)。部分?jǐn)?shù)據(jù)見表1和表2。
1.1異常值、缺失值的處理
按分揀中心分類數(shù)據(jù),填充表2缺失值為日平均貨量,確保 2 4 h 數(shù)據(jù)完整,繪制箱線圖檢測(cè)異常值。以SC1、SC2、SC3為例,箱線圖如圖1和圖2所示。
貨量的原始貨量圖以觀察數(shù)據(jù)的平穩(wěn)性,對(duì)原始數(shù)據(jù)進(jìn)行ADF和KPSS2種檢驗(yàn),以SC8為例,結(jié)果如圖3和圖4所示。
圖1和圖2顯示部分?jǐn)?shù)據(jù)點(diǎn)超出預(yù)設(shè)范圍,經(jīng)分析,這些高值出現(xiàn)在“雙11\"期間,因電商大促引發(fā)訂單激增所致??紤]到“雙11\"期間貨量上升符合實(shí)際,我們決定不將這些個(gè)別高值視為異常數(shù)據(jù)處理
1.2 數(shù)據(jù)特征分析
1.2.1 白噪聲檢驗(yàn)
白噪聲檢驗(yàn)可以判斷一個(gè)時(shí)間序列是否是一個(gè)沒有記憶的序列,即檢驗(yàn)過去的行為對(duì)將來(lái)的發(fā)展是否存在影響,選取Ljung-Box檢驗(yàn)來(lái)實(shí)現(xiàn),檢驗(yàn) m 階滯后范圍內(nèi)序列的自相關(guān)性是否顯著。結(jié)果見表3。
從表3可以看出, H = 1 表明SC8序列是一個(gè)非白噪聲序列, P=0 . 0 0 3lt;0 . 0 5 ,因此拒絕原假設(shè),即序列是純隨機(jī)序列。同樣顯著性水平為0.05的臨界值為1 . 9 6 lt; 2 6 . 5 0 8 ,因此拒絕原假設(shè),說(shuō)明序列存在研究?jī)r(jià)值。
1.2.2 平穩(wěn)性檢驗(yàn)
根據(jù)已知的歷史數(shù)據(jù),分別繪制各分揀中心每天
原始數(shù)據(jù)圖顯示,貨量受節(jié)假日、促銷等活動(dòng)影響,日貨量數(shù)據(jù)非平穩(wěn)但小時(shí)數(shù)據(jù)近似平穩(wěn),故針對(duì)日貨量不平穩(wěn)性,采用ARIMA模型預(yù)測(cè)。
1.2.3 周期性檢驗(yàn)
繪制基于傅里葉變換的頻譜圖以分析時(shí)間序列的周期性和隨機(jī)性,分析得到貨量與時(shí)間之間存在的特征關(guān)系,SC8分揀中心的頻譜圖如圖5和圖6所示。
每天數(shù)據(jù)頻譜圖平坦,表明信號(hào)頻率分布均勻,缺乏顯著周期性,體現(xiàn)數(shù)據(jù)隨機(jī)性。每小時(shí)數(shù)據(jù)在時(shí)頻上具強(qiáng)相關(guān)性,尤其是長(zhǎng)期依賴,且時(shí)間間隔短,ARIMA模型難捕捉其相關(guān)性。因此,選用LSTM模型預(yù)測(cè)未來(lái)30天各分揀中心貨量情況。
2基于ARIMA模型的預(yù)測(cè)模型建立
2.1ARIMA模型基本概述
ARIMA模型是一種時(shí)間序列預(yù)測(cè)模型,由自回歸(AR)整合(I)和移動(dòng)平均(MA)3部分構(gòu)成,分別對(duì)應(yīng)參數(shù) 。它通過識(shí)別歷史數(shù)據(jù)規(guī)律,構(gòu)建數(shù)據(jù)變動(dòng)模型預(yù)測(cè)未來(lái)。其中,AR反映當(dāng)前值與過去值關(guān)系;I通過差分實(shí)現(xiàn)數(shù)據(jù)平穩(wěn);MA捕捉殘差特征,利用歷史預(yù)測(cè)誤差加權(quán)平均預(yù)測(cè)未來(lái)值。數(shù)學(xué)表達(dá)式如下
前半段為AR模型,后半段是MA模型中關(guān)于波動(dòng)的部分[3。為確定ARIMA模型的3個(gè)參數(shù)及使用模型進(jìn)行預(yù)測(cè)需要實(shí)現(xiàn)的步驟流程圖如圖7所示。
2.2確定ARIMA模型參數(shù) d
為了確定參數(shù) d ,對(duì)原始數(shù)據(jù)進(jìn)行ADF和KPSS2種檢驗(yàn),以SC8為例,結(jié)果見表4。
SC8貨量數(shù)據(jù)ADF檢驗(yàn)為0、KPSS為1,均示非平穩(wěn),一階差分后兩檢驗(yàn)值變,序列平穩(wěn), d=1 。
2.3 確定ARIMA模型的參數(shù)
以分揀中心SC8為例,繪制自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)來(lái)確定 p , q 參數(shù),如圖8所示。
由圖8可知,ACF圖和PACF圖都是一階截尾,因此確定 p = 1 , q = 1 ,使用ADF和KPSS2種檢驗(yàn)方式確定差分階數(shù)為1,由此確定模型為ARIMA(1,1,1)。
2.4 ARIMA模型的檢驗(yàn)
為檢驗(yàn)上述ARIMA(1,1,1)模型的優(yōu)劣,繪制預(yù)測(cè)值與真實(shí)值之間差距的圖像,并計(jì)算相對(duì)誤差來(lái)衡量模型是否可靠,如圖9所示。
從圖9中可以看出,預(yù)測(cè)值與真實(shí)值之間的差距較小,通過計(jì)算得出的相對(duì)誤差數(shù)值為0.2586,這表
明模型的性能較為優(yōu)越。
2.5 預(yù)測(cè)結(jié)果
通過ARIMA(1,1,1)時(shí)間序列分析模型來(lái)捕捉并預(yù)測(cè)未來(lái)30天每天貨量的動(dòng)態(tài)變化趨勢(shì),得到結(jié)果如圖10所示。
由圖10可知,預(yù)測(cè)結(jié)果都在置信區(qū)間范圍內(nèi),說(shuō)明模型的預(yù)測(cè)結(jié)果較為精準(zhǔn),體現(xiàn)了其預(yù)測(cè)結(jié)果的穩(wěn)健性與可信度,預(yù)測(cè)結(jié)果良好。
3基于LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)預(yù)測(cè)模型的建立
3.1LSTM模型基本概述
LSTM是特殊RNN,擅長(zhǎng)處理時(shí)間序列數(shù)據(jù)的長(zhǎng)期依賴關(guān)系,能高效捕捉物流網(wǎng)絡(luò)中貨量預(yù)測(cè)的線性與非線性特征,提升預(yù)測(cè)準(zhǔn)確性。其遺忘門、輸入門、輸出門機(jī)制精確控制記憶細(xì)胞,增強(qiáng)記憶、學(xué)習(xí)和預(yù)測(cè)能力。作為逐點(diǎn)預(yù)測(cè)方法,LSTM減少信息遺失,更準(zhǔn)確反映數(shù)據(jù)變化趨勢(shì)。門控機(jī)制的具體結(jié)構(gòu)如圖11所示。
圖11中 × 就是操作矩陣中對(duì)應(yīng)的元素相乘, + 則代表進(jìn)行矩陣加法, x ( t ) 為當(dāng)前時(shí)刻的輸入, C ( t-1 ) 是上一時(shí)刻細(xì)胞狀態(tài), C ( t ) 為新的細(xì)胞狀態(tài), h ( t-1 ) 為上一時(shí)刻隱藏層狀態(tài), h (t)為新的隱藏層狀態(tài),sigmoid為激活函數(shù)σ(x)=1 ,非線性激活函數(shù)
遺忘門允許LSTM在處理序列時(shí)選擇性地遺忘之
前的信息,決定負(fù)責(zé)遺忘記憶單元中多少記憶得以保存。數(shù)學(xué)表達(dá)式如下
輸入門充許新的信息流入LSTM的記憶單元,并決定哪些新信息是有價(jià)值的,可以加入到記憶中。具體數(shù)學(xué)表達(dá)式如下
輸出門的輸出值決定了輸出的信息量,0則無(wú)輸出,1則全輸出當(dāng)前記憶狀態(tài)。這種機(jī)制使得LSTM能夠靈活地調(diào)整輸出信息量,以適應(yīng)不同的任務(wù)需求。數(shù)學(xué)公式如下
3.2 LSTM模型的檢驗(yàn)
使用LSTM模型進(jìn)行訓(xùn)練,輸入數(shù)據(jù)依次通過遺忘門、輸入門和輸出門,得到收斂狀態(tài)的模型訓(xùn)練結(jié)果,繪制訓(xùn)練集、測(cè)試集、預(yù)測(cè)值的圖像,結(jié)果如圖12所示。
圖12顯示預(yù)測(cè)值與真實(shí)值差距小,為驗(yàn)證模型性能,計(jì)算RMSE和SMARE衡量LSTM模型誤差。以分揀中心SC8為例,結(jié)果見表5,用于評(píng)估預(yù)測(cè)準(zhǔn)確性。
RMSE(均方根誤差)是衡量預(yù)測(cè)誤差的關(guān)鍵指標(biāo),SC8的RMSE值為327.61,表明預(yù)測(cè)誤差平均327.61個(gè)單位,相對(duì)于每小時(shí)2000左右的貨量,誤差較小。SMAPE(對(duì)稱平均絕對(duì)百分比誤差)值為0.085,顯示預(yù)測(cè)值與真實(shí)值間相對(duì)誤差極小,為高度準(zhǔn)確預(yù)測(cè)。綜上,該模型在RMSE和SMAPE指標(biāo)上均表現(xiàn)優(yōu)異,預(yù)測(cè)準(zhǔn)確性高。
3.3 預(yù)測(cè)結(jié)果
LSTM模型作為一種數(shù)據(jù)驅(qū)動(dòng)的動(dòng)態(tài)預(yù)測(cè)模型,用于捕捉并預(yù)測(cè)了時(shí)間序列數(shù)據(jù)中的關(guān)鍵特征,借助LSTM模型,我們得到57個(gè)分揀中心未來(lái)30天每小時(shí)的貨量,結(jié)果如圖13所示。
由圖13可以看出,未來(lái)30天的預(yù)測(cè)結(jié)果與歷史數(shù)據(jù)近期的波動(dòng)趨勢(shì)相似,因此模型有效地學(xué)習(xí)和捕捉了時(shí)間序列數(shù)據(jù)的內(nèi)在規(guī)律,對(duì)未來(lái)的決策提供有價(jià)值的參考。
4結(jié)論
本文著重研究物流網(wǎng)絡(luò)分揀中心的貨量預(yù)測(cè)難題,通過深入剖析歷史數(shù)據(jù),旨在精確預(yù)測(cè)未來(lái)一個(gè)月內(nèi)每一天及每一小時(shí)的貨量。為實(shí)現(xiàn)這一目標(biāo),我們建立了ARIMA模型和LSTM模型,以全面把握未來(lái)一個(gè)月的貨量動(dòng)態(tài)。預(yù)測(cè)結(jié)果的合理性分析證實(shí)了模型的有效性。這些模型的有效運(yùn)用,對(duì)提升物流網(wǎng)絡(luò)的運(yùn)輸效率、降低物流成本以及優(yōu)化運(yùn)輸流程均產(chǎn)生了積極影響。
參考文獻(xiàn):
[1]張奔.可持續(xù)城市物流發(fā)展評(píng)價(jià)與預(yù)測(cè)研究[D].西安:西安電子科技大學(xué),2022.
[2]李玲玲,辛浩.時(shí)序模型ARIMA在數(shù)據(jù)分析中的應(yīng)用[J].福建電腦,2024,40(4):25-29.
[3]程元棟,喻可欣,李先洋.基于加權(quán)馬爾科夫-ARIMA修正模型的區(qū)域物流需求預(yù)測(cè)[J].山東交通學(xué)院學(xué)報(bào),2023,31(3):22-28.
[4]WEN Z,SHANG Y,WU Y.Research on Cargo VolumePrediction and Optimisationof E-Commerce LogisticsNetwork Based on LSTM [J].World Scientific ResearchJournal,2024,10(4):62-68.