摘" 要:現(xiàn)代物流產(chǎn)業(yè)作為我國經(jīng)濟發(fā)展的支柱產(chǎn)業(yè)之一,物流產(chǎn)業(yè)發(fā)展可以提高勞動的生產(chǎn)效率降低資源消耗,是經(jīng)濟高速發(fā)展的基礎(chǔ)。為了科學(xué)合理制定物流產(chǎn)業(yè)發(fā)展規(guī)劃,需要準(zhǔn)確預(yù)測市場對物流的需求量,根據(jù)物流需求情況來制定物流發(fā)展目標(biāo),才能更好滿足經(jīng)濟發(fā)展的需求。文章對江蘇省1990—2021年經(jīng)濟發(fā)展數(shù)據(jù)進行研究分析,借助于機器學(xué)習(xí)方法,構(gòu)建了經(jīng)濟指標(biāo)與物流需求之間關(guān)系的支持向量回歸(SVR)黑箱模型。針對SVR核函數(shù)參數(shù)難以確定的問題,采用遺傳算法對其尋優(yōu),并與DE-SVR、GS-SVR和LS等方法對比貨運量回測結(jié)果,基于遺傳算法優(yōu)化的SVR黑箱模型(GA-SVR)具有精度高、訓(xùn)練速度快的優(yōu)點,更適用于當(dāng)前物流需求數(shù)據(jù)集。通過GA-SVR建立了貨運量時間序列的預(yù)測模型,對2019—2021年貨運量進行預(yù)測,預(yù)測結(jié)果與真實值之間最大誤差僅為3.45%,證明了所訓(xùn)練時間序列模型的有效性和泛化性能,并采用預(yù)測模型預(yù)測了江蘇省未來三年貨運量。
關(guān)鍵詞:物流需求;數(shù)學(xué)模型;指標(biāo)體系;預(yù)測對比
" 中圖分類號:F259.27" " 文獻標(biāo)志碼:A" " DOI:10.13714/j.cnki.1002-3100.2025.05.026
Abstract: The modern logistics industry is one of the pillar industries in China's economic development. The development of the logistics industry can improve labor productivity and reduce resource consumption, serving as the foundation for the rapid economic development. To formulate a scientific and reasonable logistics industry development plan, it is necessary to accurately predict the market demand for logistics and set logistics development goals based on the logistics demand situation, so as to better meet the requirements of economic development. By conducting research and analysis on the economic development data of Jiangsu Province from 1990 to 2021 and with the aid of machine learning methods, a support vector regression(SVR)black-box model of the relationship between economic indicators and logistics demand was constructed. In view of the difficulty in determining the parameters of the SVR kernel function, the genetic algorithm was adopted to optimize them. And by comparing the backtesting results of freight volume with methods such as DE-SVR, GS-SVR and LS, the SVR black-box model optimized by the genetic algorithm(GA-SVR)has the advantages of high precision and fast training speed, and is more suitable for the current logistics demand data set. Through GA-SVR, a prediction model for the time series of freight volume was established to predict the freight volume from 2019 to 2021. The maximum error between the predicted results and the actual values was only 3.45%, which proved the effectiveness and generalization performance of the trained time series model. Moreover, the prediction model was used to predict the freight volume of Jiangsu Province in the next three years.
Key words: logistics demand; mathematical model; index system; forecast comparison
0" 引" 言
物流行業(yè)作為國民經(jīng)濟發(fā)展的基礎(chǔ)行業(yè),近年來物流行業(yè)的快速發(fā)展,對經(jīng)濟促進、物資供應(yīng)和產(chǎn)業(yè)調(diào)整等方面起到了積極的促進作用。物流發(fā)展預(yù)測對物流行業(yè)有著重要意義,因此國內(nèi)外學(xué)者對影響物流的因素從不同的角度進行了系列研究,并采用機器學(xué)習(xí)方法預(yù)測未來物流發(fā)展趨勢。賈海成等[1]運用多元回歸分析和灰色預(yù)測法對1995—2009年江蘇物流需求量進行預(yù)測,同時結(jié)合Shapley值法進行組合預(yù)測了2010—2015年期間物流需求的變化情況,預(yù)測出具體增長值。曹志強等[2]采用支持向量回歸機結(jié)合遺傳算法(GA),優(yōu)化了系列預(yù)測參數(shù),對1990—2015年廣西貨運量進行了評價預(yù)測,通過對比驗證了構(gòu)建模型的準(zhǔn)確性。曾煜等[3]考慮了各類影響因素下的物流影響,運用RBF神經(jīng)網(wǎng)絡(luò)進行系統(tǒng)預(yù)測,并驗證了所構(gòu)建預(yù)測模型的精確度,通過對比發(fā)現(xiàn)平均絕對誤差僅為2.41%。趙文德等[4]考慮諸多影響指標(biāo)后,建立了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型對廣東省物流需求進行了預(yù)測和對比分析。吳玉國等[5]以南京市2010—2019年公路貨運周轉(zhuǎn)量為研究對象,通過構(gòu)建灰色馬爾科夫組合預(yù)測模型對物流需求進行了系統(tǒng)的預(yù)測分析。尹宗明等[6]以滄州市2012—2018年的物流數(shù)據(jù)為基礎(chǔ)構(gòu)建了灰色GM1,N模型,通過對比分析驗證了預(yù)測模型的精確度。左雷等[7]在考慮經(jīng)濟因素和非經(jīng)濟因素的基礎(chǔ)上,以湖北省孝感市的物流需求為研究對象,建立了DGM1,1模型進行了系統(tǒng)預(yù)測。諸多研究表明區(qū)域物流需求預(yù)測是指根據(jù)過去和現(xiàn)在的物流需求狀況,考慮影響物流需求變化因素之間的關(guān)系,運用科學(xué)的方法、手段,對物流需求未來的發(fā)展變化趨勢做出科學(xué)的估計和描述。
" 當(dāng)前,我國物流需求在社會發(fā)展的促進下穩(wěn)步提升,根據(jù)相關(guān)研究顯示2015—2022年中國快遞、物流服務(wù)行業(yè)業(yè)務(wù)量保持穩(wěn)定上升的趨勢。2021年由于疫情的反復(fù),中國快遞服務(wù)企業(yè)業(yè)務(wù)量以29.9%的增速增長至1 083.1億件。截至2022年6月30日,全國快遞業(yè)務(wù)量已突破512.2億件,同比增長率為3.7%。中國快遞業(yè)務(wù)累計收入達到4 982.2億元,同比增長2.9%[8]。研究區(qū)域經(jīng)濟和區(qū)域物流的預(yù)測,選取合適的研究對象十分重要,江蘇省作為全國的經(jīng)濟大省、長三角經(jīng)濟圈的重要組成部分,是國家“一帶一路”、長江經(jīng)濟帶、國家自貿(mào)區(qū)等重大戰(zhàn)略的交匯地,地區(qū)區(qū)域經(jīng)濟也與物流發(fā)展水平高度相關(guān),基于此,本文結(jié)合江蘇省物流發(fā)展現(xiàn)狀,基于江蘇省1990—2021年數(shù)據(jù)為研究基礎(chǔ)上,采用了GA-SVR構(gòu)建回歸模型,對貨運量與經(jīng)濟發(fā)展指標(biāo)建立映射關(guān)系,并進行對比驗證。同時,預(yù)測疫情后時代的未來三年江蘇省物流數(shù)據(jù),預(yù)測數(shù)據(jù)可以為政府部門、行業(yè)和企業(yè)等提供相應(yīng)決策依據(jù)。
1" 支持向量回歸及其參數(shù)尋優(yōu)
1.1" 支持向量回歸原理
1.2" 遺傳算法與參數(shù)尋優(yōu)
遺傳算法(Genetic Algorithm,GA)是一種典型的仿生學(xué)智能優(yōu)化算法。自20世紀(jì)60年代被提出之后,GA一直受到國內(nèi)外學(xué)者的廣泛關(guān)注,并逐漸發(fā)展成為兼顧解決單目標(biāo)和多目標(biāo)優(yōu)化問題的“進化算法”。在使用SVR等一系列機器學(xué)習(xí)算法訓(xùn)練黑箱模型時,若使用傳統(tǒng)的網(wǎng)格搜索法(Grid Search,GS)對模型參數(shù)或訓(xùn)練超參數(shù)尋優(yōu),其網(wǎng)格劃分間隔會影響優(yōu)化精度,過細的網(wǎng)格也會大大耗費計算時間。將GA引入到SVR參數(shù)尋優(yōu)中,可以在保證模型精度的前提下加快訓(xùn)練速度。
" 遺傳算法的優(yōu)化流程分為編碼、適應(yīng)度計算、選擇、交叉等步驟。SVR需要尋優(yōu)的參數(shù)為核函數(shù)尺度參數(shù)γ和容錯誤差ε,則基于遺傳算法的SVR參數(shù)優(yōu)化過程如圖1所示。對于該迭代過程,使用K折交叉驗證對當(dāng)前SVR模型進行評估,將交叉驗證誤差最小的模型所對應(yīng)的核函數(shù)參數(shù)選擇成為優(yōu)勢個體。
2" 模型構(gòu)建與預(yù)測
" 將1990—2021年江蘇省區(qū)域經(jīng)濟發(fā)展指標(biāo)的32組數(shù)據(jù)劃分訓(xùn)練集和測試集。從2021年開始,倒序采用等間距抽樣,選取測試集數(shù)目占總數(shù)據(jù)集的20%,即1996、2001、2006、2011、2016、2021這六年的樣本,用剩下80%樣本進行訓(xùn)練;基于遺傳算法對γ,ε參數(shù)組合尋優(yōu),編碼形式為二進制,種群數(shù)目為50,令γ
∈0.001,50,ε∈0.001,0.5,以10折交叉驗證誤差最小作為適應(yīng)目標(biāo),對所構(gòu)建SVR黑箱模型的精度進行評估。選擇差分進化算法(Differential Evolution,DE)和網(wǎng)格搜索法(Grid Search,GS)兩種優(yōu)化算法作為對比分析方法,其中差分進化算法(DE)與遺傳算法(GA)尺度參數(shù)γ和容錯誤差ε設(shè)置完全相同,網(wǎng)格搜索法(GS)由于效率較低而選取0.02為間隔進行優(yōu)化,三種方法的尋優(yōu)結(jié)果及計算時間具體如表1所示。
由表1可知,GA算法對SVR參數(shù)尋優(yōu)性能較好,GA算法和DE算法的交叉驗證誤差相近,都比GS算法精度高,GA算法比其他兩種算法的計算速度快。DE算法所得模型精度最高,但優(yōu)化耗時大,模型精度相對GA算法的提升極小??偟膩碇v,GA算法兼容了計算精度和計算效率兩個方面優(yōu)點,在后續(xù)尋優(yōu)計算過程中,采用遺傳算法(GA)作為最優(yōu)參數(shù)選擇算法。
取GA得到最優(yōu)參數(shù)組合到訓(xùn)練模型SVR黑箱模型之中,其中參數(shù)松弛變量的懲罰項系數(shù)C對支持向量回歸結(jié)果幾無影響,取C=106表示回歸過程僅容許較小誤差。用GS-SVR和最小二乘法(Least Square Method,LS)所構(gòu)建的回歸模型作對比,如圖2所示;測試集中每個樣本的具體誤差對比如表2所示??梢钥闯?,GA-SVR模型對測試集樣本的預(yù)測值更接近真實值,預(yù)測誤差更小。使用該模型對所有樣本進行預(yù)測,預(yù)測結(jié)果見圖3。圖3中SVR預(yù)測貨運量走勢與真實值較為接近,證明了所構(gòu)建地區(qū)經(jīng)濟指標(biāo)與貨運量黑箱模型的有效性。
" 本文的主要目的不僅是為了建立江蘇省區(qū)域貨運量與經(jīng)濟發(fā)展指標(biāo)的映射關(guān)系,還應(yīng)包括對未來貨運量的預(yù)測。將各年貨運量當(dāng)作一維時間序列,可以構(gòu)建貨運量與時間的回歸關(guān)系,從而達到預(yù)測未來的作用。使用RBF核函數(shù),用1990—2017年的貨運量作為樣本輸入,1991—2018年的貨運量作為樣本輸出,訓(xùn)練GA-SVR模型;以2018—2020年貨運量作為測試輸入,則作為測試輸出可以得到2019—2021年貨運量預(yù)測值(見圖4),表3是這3年貨運量預(yù)測值與真實值的誤差。然后對構(gòu)建的模型輸入2021年的貨運量,可得2022年貨運量的預(yù)測值,將該預(yù)測值繼續(xù)輸入并依次迭代,可分別對2023年、2024年貨運量進行預(yù)測,模型預(yù)測結(jié)果如表4所示。
由圖4和表3可知,基于GA優(yōu)化的SVR黑箱模型對于江蘇省區(qū)域貨運量時間序列具有良好的學(xué)習(xí)精度和泛化性。其中,使用1990—2018年數(shù)據(jù)對2019—2021年貨運量預(yù)測時,最大預(yù)測誤差僅為3.45%。基于GA優(yōu)化的SVR黑箱模型對于未來三年江蘇省區(qū)域貨運量具體見表4,為政府、企業(yè)等單位做決策提供了科學(xué)參考依據(jù)。
3" 結(jié)" 論
本文以江蘇省區(qū)域經(jīng)濟發(fā)展指標(biāo)數(shù)據(jù)為研究基礎(chǔ),分析了1990—2021年的數(shù)據(jù),結(jié)合諸多指標(biāo):地區(qū)生產(chǎn)總值、居民消費水平、第一產(chǎn)業(yè)產(chǎn)值、第二產(chǎn)業(yè)產(chǎn)值和第三產(chǎn)業(yè)產(chǎn)值等,建立了反映經(jīng)濟指標(biāo)與物流需求之間關(guān)系的SVR黑箱模型。其中,針對SVR核函數(shù)參數(shù)難以確定的問題,采用遺傳算法(GA)對其尋優(yōu)。與DE-SVR、GS-SVR和LS等方法對比貨運量回測結(jié)果,基于遺傳算法優(yōu)化的SVR黑箱模型(GA-SVR)具有模型精度高,訓(xùn)練速度快的優(yōu)點,更適用于當(dāng)前物流需求的數(shù)據(jù)集。
" 將1990—2018年間貨運量數(shù)據(jù)視為一維時間序列,使用GA-SVR建立了貨運量時間序列的預(yù)測模型,并回測了模型對2019—2021年的預(yù)測結(jié)果,最大預(yù)測誤差僅為3.45%,證明了所訓(xùn)練時間序列模型的有效性和泛化性能,并給出了對未來三年(2022—2024年)江蘇省年貨運量的預(yù)測結(jié)果。
參考文獻:
[1] 賈海成,秦菲菲. 區(qū)域物流需求預(yù)測研究——以江蘇省為例[J]. 中國物流與采購,2012(3):68-69.
[2] 曹志強,楊箏,劉放. 基于遺傳算法優(yōu)化支持向量回歸機的區(qū)域物流需求預(yù)測[J]. 系統(tǒng)科學(xué)學(xué)報,2018,26(4):79-82,90.
[3] 曾煜,朱志浩. 基于RBF神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測[J]. 綜合運輸,2020,42(6):90-93.
[4] 趙文德,黃麗娟,胡子瑜. 基于BP神經(jīng)網(wǎng)絡(luò)組合模型的廣東省區(qū)域物流需求能力預(yù)測[J]. 物流技術(shù),2020,39(12):49-56,66.
[5] 吳玉國,李曉迪. 基于灰色-馬爾科夫鏈的區(qū)域物流需求預(yù)測[J]. 南陽理工學(xué)院學(xué)報,2020,12(6):1-5.
[6] 尹宗明,杜學(xué)敏. 基于灰色GM1,N模型的區(qū)域物流需求預(yù)測研究[J]. 物流科技,2021,44(3):104-105,117.
[7] 左雷,徐柏安. 區(qū)域物流需求影響因素實證分析及總量預(yù)測——以湖北省孝感市為例[J]. 物流技術(shù),2020,39(12):39-44.
[8] 艾媒咨詢. 2022—2023年中國快遞物流行業(yè)發(fā)展現(xiàn)狀及典型案例研究報告[R]. 廣東:艾媒研究院,2022.
[9] 周志華. 機器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社,2018.