肖 紅,夏如玉,王孝坤,楊雪峰
(1. 重慶交通大學(xué) 經(jīng)濟(jì)與管理學(xué)院,重慶 400074; 2. 重慶口岸物流與航運(yùn)發(fā)展研究中心,重慶 400074; 3. 大連交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,遼寧 大連 116000; 4. 大連交通大學(xué)“一帶一路”交通互聯(lián)互通與人文交流研究院, 遼寧 大連 116003; 5. 遼寧省交通運(yùn)輸事業(yè)發(fā)展中心,遼寧 沈陽 110005)
區(qū)域物流需求預(yù)測(cè)是制訂物流發(fā)展規(guī)劃、項(xiàng)目決策并提升物流綜合效益的重要依據(jù)。用于物流需求預(yù)測(cè)的理論方法可分為定性和定量兩大類[1-2]。定性預(yù)測(cè)方法主要包括德爾菲法、專家調(diào)查法、主觀概率法等。定性預(yù)測(cè)法較靈活,預(yù)測(cè)簡單迅速,但易受主觀因素的影響,難以對(duì)物流需求作數(shù)量上的精確描述[3]。定量預(yù)測(cè)方法則是利用歷史數(shù)據(jù)或因素變量來預(yù)測(cè)未來物流需求的數(shù)學(xué)模型[4]。
物流需求定量預(yù)測(cè)方法主要有時(shí)間序列法、因果關(guān)系法、組合預(yù)測(cè)法、人工智能法等。時(shí)間序列預(yù)測(cè)法通過簡單的模型,便能對(duì)物流需求預(yù)測(cè)做出比較好的解釋[5];因果關(guān)系法是利用事物發(fā)展的因果關(guān)系來推斷事物發(fā)展趨勢(shì)的預(yù)測(cè)方法[6];組合預(yù)測(cè)方法的基本思想是將兩個(gè)及以上的單一模型預(yù)測(cè)結(jié)果通過賦權(quán)形式組合,從而減弱原預(yù)測(cè)模型的預(yù)測(cè)誤差,得到更精確的預(yù)測(cè)結(jié)果[7]。時(shí)間序列預(yù)測(cè)法通常以假設(shè)條件為前提建立模型,很難全面揭示數(shù)據(jù)內(nèi)在的復(fù)雜特性。組合預(yù)測(cè)法可以有效提高預(yù)測(cè)精度,但是采用組合預(yù)測(cè)的模型受權(quán)重系數(shù)選取的影響較大,使預(yù)測(cè)的工作量增加。
隨著信息和計(jì)算機(jī)科學(xué)的發(fā)展,智能預(yù)測(cè)方法被廣泛應(yīng)用于物流需求中。神經(jīng)網(wǎng)絡(luò)作為一種人工智能方法,能夠較好刻畫物流需求與其影響因素間的非線性映射關(guān)系。蔡婉貞等[8]為解決物流需求的非線性問題,提出了一種BP與RBF相結(jié)合的組合預(yù)測(cè)模型,結(jié)果表明神經(jīng)網(wǎng)預(yù)測(cè)模型效果更好。但神經(jīng)網(wǎng)絡(luò)所需數(shù)據(jù)量較大,實(shí)際問題中經(jīng)常遇到過學(xué)習(xí)、陷入局部極值等問題。最小二乘支持向量機(jī)(LSSVM)對(duì)物流需求預(yù)測(cè)有著獨(dú)特的優(yōu)勢(shì),它不僅解決了物流需求中的非線性問題,還降低了算法的復(fù)雜性,提高預(yù)測(cè)精度。J.A.K.SUYKENS等[9]提出LSSVM是將支持向量機(jī)(SVM)的非線性二次規(guī)劃方程組轉(zhuǎn)化為線性方程組,降低了計(jì)算復(fù)雜性,為復(fù)雜的物流需求預(yù)測(cè)提供一種新方法;耿立艷等[10]通過LSSVM智能預(yù)測(cè)模型對(duì)物流需求進(jìn)行了預(yù)測(cè),預(yù)測(cè)結(jié)果都優(yōu)于其他(WNN、SVM)組合預(yù)測(cè)模型。為進(jìn)一步提高預(yù)測(cè)精度,F.A.HASHIM等[11]提出阿基米德優(yōu)化算法(AOA),通過此算法解決數(shù)值優(yōu)化問題,并提高模型的收斂速度,可有效解決復(fù)雜問題;鄭婷婷等[12]將AOA與鯨魚優(yōu)化算法、灰狼優(yōu)化算法等進(jìn)行了比較,發(fā)現(xiàn)AOA算法對(duì)大規(guī)模優(yōu)化問題具有更高的穩(wěn)定性和尋優(yōu)能力。
以LSSVM為代表的人工智能方法,具有較高的非線性擬合精度,可用來更好解決復(fù)雜的物流需求預(yù)測(cè)問題,以獲得更高的預(yù)測(cè)精度并降低計(jì)算難度,也使得LSSVM在物流需求預(yù)測(cè)中具有較好的適用性。由于西部陸海新通道樞紐城市運(yùn)輸系統(tǒng)受到運(yùn)輸結(jié)構(gòu)調(diào)整的影響,不確定性因素影響突出。為進(jìn)一步簡化、提高物流需求預(yù)測(cè)精度,提出一種AOA和LSSVM結(jié)構(gòu)相結(jié)合的預(yù)測(cè)方法,將AOA算法應(yīng)用到LSSVM模型中。先采用灰色關(guān)聯(lián)分析(GRA)選擇物流需求主要影響因素,將其作為輸入變量,建立LSSVM預(yù)測(cè)模型,再利用AOA優(yōu)化LSSVM參數(shù),最后通過對(duì)西部陸海新通道的重要樞紐城市——重慶、成都、貴陽和南寧物流需求的實(shí)例研究檢驗(yàn)新方法的有效性。
SVM是根據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化(structural risk minimization,SRM)準(zhǔn)則與統(tǒng)計(jì)學(xué)習(xí)理論提出的[13]。 LSSVM是將SVM中的非等式方程組轉(zhuǎn)化為等式方程組,并通過最小二乘線性系統(tǒng)作為代價(jià)函數(shù),用于LSSVM模型的參數(shù)估計(jì),使得誤差的平方項(xiàng)最小化,從而提高計(jì)算精度。LSSVM具體方法如下:
給定一個(gè)訓(xùn)練樣本集合為L={(xi,yi),i=1,2,…,N},其中,xi∈R輸入變量,yi∈R為對(duì)應(yīng)的輸出變量,N為樣本個(gè)數(shù),對(duì)于y(x)=ωTφ(x)+b非線性回歸函數(shù),LSSVM基于SRM準(zhǔn)則,將構(gòu)建其目標(biāo)函數(shù)如下:
(1)
式中:ω為權(quán)重向量;b為偏置常量;γ為正則化參數(shù);ei為第i個(gè)誤差變量;φ(·)為非線性映射函數(shù)。
通過引入拉格朗日乘子向量αi和KKT條件,則將拉格朗日函數(shù)定義為:
(2)
式中:αi為拉格朗日乘子向量;ei為誤差變量。
分別對(duì)L(ω,b,e,α)中的ω,b,e和α求偏微分:
(3)
消去式(3)中的ω、ei,可最終簡化為:
(4)
式中:K(x,xi)為核函數(shù)。
AOA算法的原理是物體通過相互碰撞,不斷調(diào)整自身密度和體積,使物體達(dá)到平衡狀態(tài)。其中調(diào)整的過程即為種群尋優(yōu)過程,達(dá)到平衡狀態(tài)的個(gè)體則是全局最優(yōu)解。此算法不僅可以避免陷入局部最優(yōu)值,提高收斂速度。還可以對(duì)LSSVM模型的參數(shù)進(jìn)行尋優(yōu)迭代,以找到一個(gè)最小誤差值,使LSSVM模型整體的預(yù)測(cè)性能提高,以提高整個(gè)模型的預(yù)測(cè)精度,從而找到模型的正則化參數(shù)(γ)和核函數(shù)(σ)最優(yōu)值,具體算法如下:
1)初始化
對(duì)所有對(duì)象的位置進(jìn)行初始化處理,如式(5);對(duì)每個(gè)第i個(gè)對(duì)象的體積(vi)、密度(di)以及加速度(ai)進(jìn)行定義,令vi與di為[0,1]范圍的隨機(jī)數(shù),其余如式(6):
Oi=li+R′×(ui-li),i=1,2,…,N
(5)
ai=li+R′×(ui-li),i=1,2,…,N
(6)
式中:Oi是N個(gè)對(duì)象中的第i個(gè)物體的位置;ui和li為搜索空間的上下邊界;R′為[0,1]范圍的隨機(jī)數(shù)。
2)更新
為更好的評(píng)估初始總體,并選擇出最佳適應(yīng)度的對(duì)象vbest、dbest、abest。因此,更新密度及體積公式,得到公式(7):
(7)
式中:dbest和vbest是到目前為止發(fā)現(xiàn)的對(duì)象的最優(yōu)密度和體積;abest是對(duì)象的最優(yōu)加速度。
3)計(jì)算轉(zhuǎn)移算子(T)與密度因子(d)
對(duì)象之間發(fā)生碰撞時(shí),通過T和d的計(jì)算,使對(duì)象試圖達(dá)到平衡狀態(tài),增強(qiáng)AOA算法的局部搜索能力,如式(8):
(8)
式中:t為迭代次數(shù);tmax為最大迭代次數(shù)。
4)開發(fā)階段
若對(duì)象之間發(fā)生碰撞,當(dāng)T≤0.5,隨機(jī)選擇一個(gè)對(duì)象,使用式(9)計(jì)算t+1次迭代對(duì)象的加速度,當(dāng)T>0.5時(shí)則進(jìn)行勘探開發(fā)行為。
(9)
式中:dmr、vmr和amr是隨機(jī)對(duì)象的密度、體積和加速度。
若對(duì)象之間無碰撞,當(dāng)T≤0.5時(shí)進(jìn)行勘探開發(fā)行為,當(dāng)T>0.5時(shí),使用式(10)計(jì)算t+1次迭代對(duì)象的加速度:
(10)
將式(9)和式(10)進(jìn)行標(biāo)準(zhǔn)化,如式(11)。
(11)
5)對(duì)象位置更新
若T≤0.5,第i個(gè)t+1迭代時(shí),使用式(12)對(duì)對(duì)象位置更新:
(12)
若T>0.5,使用式(13)對(duì)第i個(gè)t+1迭代時(shí)對(duì)象位置更新:
(13)
式中:Orand是種群中對(duì)象的隨機(jī)位置;Obest為對(duì)象的最佳位置;C1、C2為常數(shù),通常取2和6;D定義為常數(shù)C3乘以轉(zhuǎn)移算子(T);F是決定對(duì)象位置更新的標(biāo)志,將其定義為:
(14)
式中:P=2×R′-C4,其中C4為常數(shù)。
根據(jù)國家發(fā)展改革委2019年頒布的《西部陸海新通道總體規(guī)劃》,重慶、成都、貴陽和南寧為通道的重要樞紐城市,筆者以此4座城市為研究對(duì)象,對(duì)其物流量進(jìn)行預(yù)測(cè)研究。4座樞紐城市物流需求預(yù)測(cè)的影響因素為經(jīng)濟(jì)發(fā)展水平、產(chǎn)業(yè)結(jié)構(gòu)、國內(nèi)外貿(mào)易、收入及消費(fèi)水平、固定資產(chǎn)投資等。
在物流需求的度量指標(biāo)中,現(xiàn)有研究主要采用貨運(yùn)量(Y1)和社會(huì)物流總費(fèi)用(Y2)兩種:①貨運(yùn)量(Y1)指標(biāo),是利用不同的預(yù)測(cè)方法將貨物量作為物流需求的預(yù)測(cè)值,但在西部陸海新通道整個(gè)物流系統(tǒng)中,貨運(yùn)量僅僅代表運(yùn)輸通道的貨物流向,并不能完全反映樞紐城市的物流需求量[14-15];②社會(huì)物流總費(fèi)用(Y2)指標(biāo),該指標(biāo)不僅從核算角度定義了物流需求,還能代表物流活動(dòng)中各項(xiàng)費(fèi)用支出[16]。將采用Y2作為西部陸海新通道的物流需求量化指標(biāo),物流需求影響因素如表1。
表1 物流需求影響因素Table 1 Influence factors of logistics demand
表2 重慶、成都、貴陽、南寧的社會(huì)物流總費(fèi)用(2010—2020年)Table 2 Total costs of social logistics in Chongqing, Chengdu, Guiyang and Nanning (2010—2020)
計(jì)算中,2010—2020年物流需求量(Y2)以及影響因素指標(biāo)代碼(x1~x11)的數(shù)據(jù)分別來源于:
1)表1中2010—2012年重慶、成都、貴陽、南寧的社會(huì)物流總費(fèi)用(Y2)數(shù)據(jù)由于相關(guān)政府部門未公開,數(shù)據(jù)來源參考文獻(xiàn)[16],通過社會(huì)物流總費(fèi)用(Y2)除以GDP值的比例逆向推導(dǎo)出社會(huì)物流總費(fèi)用(Y2)的值,具體如表(2);2013—2020年重慶、成都、貴陽、南寧的社會(huì)物流總費(fèi)用(Y2)數(shù)據(jù)來源于重慶市統(tǒng)計(jì)局、重慶市發(fā)展和改革委員會(huì)、重慶市口岸與物流辦公室、成都市統(tǒng)計(jì)局、成都市發(fā)展和改革委員會(huì)、成都市口岸與物流辦公室、貴陽市統(tǒng)計(jì)局、貴陽市發(fā)展和改革委員會(huì)、貴陽市口岸與物流辦公室、南寧市統(tǒng)計(jì)局、南寧市發(fā)展和改革委員會(huì)、南寧市口岸與物流辦公室相關(guān)資料;
2)影響因素(x1~x11)數(shù)據(jù)來源于《重慶市統(tǒng)計(jì)年鑒2021》、《成都市統(tǒng)計(jì)年鑒2021》、《貴陽市統(tǒng)計(jì)年鑒2021》、《南寧市統(tǒng)計(jì)年鑒2021》。
根據(jù)式(15)進(jìn)行灰色關(guān)聯(lián)度分析,分析如式(15),分析結(jié)果如表3。
(15)
參考文獻(xiàn)[17],設(shè)定γ0i的取值范圍。當(dāng)γ0i>0.60,該因素對(duì)樞紐城市物流需求的關(guān)聯(lián)度越大;反之,當(dāng)γ0i≤0.60,該因素對(duì)樞紐城市物流需求的關(guān)聯(lián)度越小。由表2可知,西部陸海新通道中重要樞紐城市——重慶、成都、貴陽、南寧的γ0i在0.603~0.870間,說明所有因素都具有一定關(guān)聯(lián)性,但為了提高預(yù)測(cè)準(zhǔn)確度,降低計(jì)算難度,將γ0i值最低的4項(xiàng):第三產(chǎn)業(yè)總產(chǎn)值(x4)、居民可支配收入(x6)、居民消費(fèi)水平(x7)與地區(qū)消費(fèi)品零售總額(x8)剔除;剩余7項(xiàng):地區(qū)GDP(x1)、第一產(chǎn)業(yè)總產(chǎn)值(x2)、第二產(chǎn)業(yè)總產(chǎn)值(x3)、人口規(guī)模(x5)、進(jìn)出口貿(mào)易總額(x9)、固定資產(chǎn)投資(x10)、運(yùn)輸總里程(鐵路、公路、水路)(x11)影響因素作為西部陸海新通道中重要樞紐城市的物流需求預(yù)測(cè)的主要因素。
通過2.2節(jié)的灰色關(guān)聯(lián)度分析,根據(jù)式(16)將樞紐城市的全部樣本數(shù)據(jù)進(jìn)行歸一化處理,再將歸一化后的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集。
(16)
式中:S和St分別是原始數(shù)據(jù)和歸一化后的數(shù)據(jù);Smax和Smin分別為原始數(shù)據(jù)的最大值和最小值。
將2010—2017年數(shù)據(jù)作為AOA-LSSVM模型的訓(xùn)練集,2018—2020年的數(shù)據(jù)作AOA-LSSVM模型的測(cè)試集,用于驗(yàn)證AOA-LSSVM模型的預(yù)測(cè)性能。AOA算法的自身控制參數(shù)設(shè)置如表4。
表4 參數(shù)設(shè)置Table 4 Parameter setting
表4中系數(shù)b1、b2選取依據(jù)是式(1)中的偏置常量b。?的選取依據(jù)根據(jù)文獻(xiàn)[19],其原理是物體通過不斷調(diào)整自身密度和體積,物體達(dá)到平衡狀態(tài),這個(gè)平衡狀態(tài)有一定的取值范圍,?max、?min代表的就是物體平衡狀態(tài)的最大值和最小值。
在AOA中對(duì)參數(shù)組合(γ,σ)計(jì)算過程中,會(huì)產(chǎn)生一定范圍內(nèi)的誤差。誤差越大,所對(duì)應(yīng)的LSSVM模型中的參數(shù)組合(γ,σ)越不理想,導(dǎo)致AOA-LSSVM模型預(yù)測(cè)效果不佳。筆者通過增加AOA算法優(yōu)化LSSVM的參數(shù)次數(shù),選擇相對(duì)誤差最小對(duì)應(yīng)的參數(shù)組合(γ,σ),基于此組合建立LSSVM模型并預(yù)測(cè)2018—2020年西部陸海新通道樞紐城市的物流需求,根據(jù)式(16)將預(yù)測(cè)值進(jìn)行逆歸一化處理,獲得原始物流需求的預(yù)測(cè)值。
經(jīng)過AOA算法對(duì)粒子進(jìn)行搜索迭代,使得每個(gè)粒子獲得最優(yōu)位置(Obest),最優(yōu)密度(dbest),最優(yōu)加速度(abest)。通過位置的更新,AOA-LSSVM模型也獲得了最優(yōu)的參數(shù)組合(γ,σ),基于(γ,σ)對(duì)AOA-LSSVM模型進(jìn)行迭代,迭代適應(yīng)度變化如圖1。由圖1可知,AOA算法在迭代20次,已到達(dá)最佳適應(yīng)度值。說明此算法具有良好的收斂穩(wěn)定性、尋優(yōu)搜索能力能強(qiáng)的特點(diǎn)。
圖1 適應(yīng)度曲線Fig. 1 Fitness curve
為了進(jìn)一步驗(yàn)證阿基米德算法在LSSVM模型的預(yù)測(cè)效果,將AOA-LSSVM預(yù)測(cè)結(jié)果與LSSVM預(yù)測(cè)結(jié)果相比較。選用均方根誤差(RMSE)、平均絕對(duì)誤差(MAE),以及異方差調(diào)整的均方根誤差(HRMSE)、異方差調(diào)整的平均絕對(duì)誤差(HMAE)4項(xiàng)指標(biāo)對(duì)這兩種模型進(jìn)行評(píng)估性能。如果這些指標(biāo)數(shù)值越小,表明模型的預(yù)測(cè)性能越好。
表5、表6分別列出了LSSVM和AOA-LSSVM兩種模型的誤差指標(biāo)對(duì)比及兩種模型的預(yù)測(cè)結(jié)果,可見:
表5 LSSVM與AOA-LSSVM兩種模型的誤差指標(biāo)對(duì)比Table 5 Comparison of error indicators between the two models of LSSVM and AOA-LSSVM
表6 LSSVM和AOA-LSSVM兩種模型預(yù)測(cè)結(jié)果及誤差情況Table 6 The prediction results and errors of the two models of LSSVM and AOA-LSSVM
1)由2018—2020年西部陸海新通道4大樞紐城市的物流需求預(yù)測(cè)可知,各個(gè)樞紐城市的AOA-LSSVM模型的相對(duì)誤差值均小于LSSVM模型,,說明AOA-LSSVM模型提高了預(yù)測(cè)精度。
2)AOA-LSSVM模型的預(yù)測(cè)性能也優(yōu)于LSSVM模型,其RMSE、MAE、HRMSE、HMAE值均小于LSSVM模型的對(duì)應(yīng)值,分別降低了1946.4,1206.1,0.028 4,0.039 7。這主要是由于AOA算法使物體達(dá)到平衡的最佳狀態(tài),增強(qiáng)了算法的全局搜索能力,進(jìn)而正確找到了LSSVM的最優(yōu)參數(shù),提高了LSSVM的預(yù)測(cè)性能。
利用AOA-LSSVM模型預(yù)測(cè)西部陸海新通道中重要樞紐城市的物流需求量,結(jié)果見表7。由表7可知,西部陸海新通道的樞紐城市的物流需求在2025、2030、2035年的社會(huì)物流總費(fèi)用預(yù)計(jì)將達(dá)到10 273.8、12 340.4、14 077.1億元,其預(yù)測(cè)結(jié)果為西部陸海新通道物流樞紐城市的物流建設(shè)和運(yùn)營提供了的理論依據(jù)。
表7 西部陸海新通道的樞紐城市的物流需求預(yù)測(cè)值Table 7 Predicted value of logistics demand in hub cities of the new western land-sea passage
為了提高LSSVM模型整體的預(yù)測(cè)精度,通過對(duì)傳統(tǒng)的LSSVM模型進(jìn)行改進(jìn),構(gòu)建阿基米德算法(AOA)優(yōu)化最小二乘支持向量機(jī)(LSSVM)智能預(yù)測(cè)模型,具體結(jié)論如下:
1)通過阿基米德算法對(duì)傳統(tǒng)的LSSVM模型進(jìn)行改進(jìn),使得模型得到最優(yōu)的(γ,σ)值,避免了傳統(tǒng)的LSSVM難以全面反映物流需求的變化規(guī)律,從而導(dǎo)致預(yù)測(cè)效果不佳的問題。并利用AOA-LSSVM模型對(duì)西部陸海新通道中重要樞紐城市—重慶、成都、貴陽和南寧在2025、2030、2035年的物流需求量進(jìn)行預(yù)測(cè),并得到了相關(guān)的預(yù)測(cè)值。
2)選用的AOA算法由于具有強(qiáng)大的全局搜索能力,在改善LSSVM預(yù)測(cè)性能和建模速度方面的效果尤為顯著,因此,基于AOA算法優(yōu)化的LSSVM模型是一種更為有效的物流需求預(yù)測(cè)方法,具有一定推廣應(yīng)用價(jià)值。
重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版)2024年3期