高 青
安徽理工大學(xué)經(jīng)濟(jì)與管理學(xué)院,安徽淮南,232001
基于遺傳算法優(yōu)化支持向量機(jī)的物流需求預(yù)測研究
高 青
安徽理工大學(xué)經(jīng)濟(jì)與管理學(xué)院,安徽淮南,232001
為提升物流需求預(yù)測的準(zhǔn)確度,以建立物流需求指標(biāo)為基礎(chǔ),構(gòu)建了一種遺傳算法(GA)優(yōu)化支持向量機(jī)的物流需求預(yù)測模型(GA-SVM)。首先對物流數(shù)據(jù)進(jìn)行歸一化處理,然后利用GA-SVM刻畫物流需求量與其影響因素間的非線性關(guān)系,并通過遺傳算法優(yōu)化選擇SVM參數(shù),選取1998-2014年安徽省物流數(shù)據(jù)對模型進(jìn)行測試。結(jié)果表明,GA-SVM在很大程度上提高了物流需求預(yù)測的準(zhǔn)確性,能夠精確地表征物流需求量的變化趨勢,其預(yù)測精度和相對誤差均優(yōu)于對比模型,是一種較好的物流需求預(yù)測方法。
物流需求;支持向量機(jī);遺傳算法
物流系統(tǒng)的規(guī)劃和設(shè)計必須立足于準(zhǔn)確的物流需求預(yù)測,準(zhǔn)確的物流需求預(yù)測可以幫助行業(yè)企業(yè)設(shè)計科學(xué)的物流系統(tǒng),分配有限的資源,協(xié)調(diào)物流的供需關(guān)系,進(jìn)而提高區(qū)域經(jīng)濟(jì)發(fā)展水平[1]。國內(nèi)外對物流需求預(yù)測方法的研究擁有很長的歷史,早期的預(yù)測方法主要有時間序列法、指數(shù)平滑法和回歸分析法等[2]。這幾種方法適合解決時間序列和線性數(shù)據(jù),但對于具有非線性關(guān)系或高維的物流數(shù)據(jù)預(yù)測效果不理想。同時,此類方法主要是集中在對數(shù)據(jù)本身規(guī)律的回歸分析上,忽略了對物流需求量與其影響因素之間聯(lián)系的分析,存在嚴(yán)重的數(shù)據(jù)失真現(xiàn)象[3]。近年來,神經(jīng)網(wǎng)絡(luò)在物流需求量的預(yù)測中被廣泛運用,雖然神經(jīng)網(wǎng)絡(luò)能夠很好地模擬非線性系統(tǒng),但仍存在局部最優(yōu)和過度擬合等缺點,進(jìn)而影響了預(yù)測的精確度。
支持向量機(jī)是建立在統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上的統(tǒng)計學(xué)習(xí)方法,它有效地克服了神經(jīng)網(wǎng)絡(luò)的缺點,很好地解決了非線性和高維數(shù)據(jù),很大程度上避免維災(zāi)難和過度學(xué)習(xí)等問題[4]。但和其他學(xué)習(xí)算法一樣,支持向量機(jī)訓(xùn)練參數(shù)的選擇對模型預(yù)測效果有很大的影響[3]。因此,在實踐中,選擇契合的參數(shù)成為獲得較優(yōu)模型的關(guān)鍵。
本文將遺傳算法與支持向量機(jī)相結(jié)合,提出了遺傳算法優(yōu)選支持向量機(jī)參數(shù)的方法,得到最優(yōu)的物流需求預(yù)測模型。以安徽省1998-2014年物流需求量作為試驗數(shù)據(jù)進(jìn)行研究,結(jié)果表明,相比于粒子群優(yōu)化支持向量機(jī)和普通支持向量機(jī)模型,GA-SVM模型的準(zhǔn)確度最高,誤差最小,更有效地預(yù)測了物流需求量。
孫啟鵬等從下面幾個方面定量描述了物流需求量,主要包括物流和區(qū)域經(jīng)濟(jì)發(fā)展的關(guān)系、物流作業(yè)內(nèi)容以及物流本源需求規(guī)模的大小等[5]。黃虎認(rèn)為,區(qū)域經(jīng)濟(jì)整體水平和規(guī)模、區(qū)域經(jīng)濟(jì)產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)品結(jié)構(gòu)、區(qū)域經(jīng)濟(jì)的空間網(wǎng)絡(luò)布局、物流設(shè)施和服務(wù)、物流費用的變動、技術(shù)創(chuàng)新、區(qū)域地理位置等影響區(qū)域物流需求[6]。林榮天等選取GDP、區(qū)域零售總額、人均消費水平等指標(biāo),創(chuàng)立了系統(tǒng)的物流需求預(yù)測指標(biāo)體系[7]。李雋波等采用GDP、產(chǎn)業(yè)結(jié)構(gòu)比例、人口數(shù)量等指標(biāo),利用多元線性回歸模型預(yù)測了冷鏈物流需求量,取得了較準(zhǔn)確的預(yù)測結(jié)果[8]。楊波等使用重慶空港物流園的相關(guān)數(shù)據(jù),如空港貨物吞吐量、GDP、工業(yè)總產(chǎn)值、進(jìn)出口總產(chǎn)值作為預(yù)測參數(shù),采用組合預(yù)測方法,較準(zhǔn)確地預(yù)測了2020年重慶空港物流園的物流需求量[9]。彭湖等運用主成分回歸分析方法,利用云南省2001-2013年物流數(shù)據(jù),取得了較精確的預(yù)測結(jié)果,為云南省物流行業(yè)的發(fā)展提供了借鑒[10]。
總而言之,關(guān)于選擇預(yù)測對象和預(yù)測指標(biāo),學(xué)術(shù)界沒有建立統(tǒng)一的標(biāo)準(zhǔn)??偟膩砜?,度量物流需求指標(biāo)體系主要有實物量體系和價值量體系兩類。由于缺失必要的統(tǒng)計數(shù)據(jù),在使用價值量體系時,只能憑借經(jīng)驗預(yù)測物流需求量,所以本文在實物量體系中選擇貨運量來表示物流需求量。
從以往的研究來看,大多數(shù)學(xué)者認(rèn)為,物流需求和區(qū)域物流影響因素存在著一定的函數(shù)聯(lián)系,因此,本文利用物流影響因素來預(yù)測物流需求,并且借鑒已有的研究成果,兼顧數(shù)據(jù)資料的易得性,選取以下指標(biāo)作為區(qū)域物流影響因素指標(biāo):GDP,固定資產(chǎn),第一、二、三產(chǎn)業(yè)產(chǎn)值,進(jìn)出口貿(mào)易總額,居民消費水平,貨運量和貨物周轉(zhuǎn)量等
2.1 支持向量機(jī)
支持向量機(jī)(support vector machine,SVM)是基于統(tǒng)計學(xué)習(xí)理論中的VC維理論和結(jié)構(gòu)風(fēng)險最小化理論建立的統(tǒng)計學(xué)習(xí)方法[11]。支持向量機(jī)很好地解決了非線性和高維數(shù)據(jù),很大程度上避免維災(zāi)難和過度學(xué)習(xí)等問題[11]。支持向量機(jī)已經(jīng)成為一種備受關(guān)注的分類技術(shù),它具有堅實的統(tǒng)計學(xué)理論基礎(chǔ),并廣泛地應(yīng)用于手寫數(shù)字識別、文本分類和人臉圖像識別等。
f(x)=ωTΦ(x)+b
(1)
其中,ω 表示權(quán)值向量,b表示偏置量。
為了使支持向量機(jī)在訓(xùn)練集上獲得推廣能力較好的模型,必須最小化經(jīng)驗風(fēng)險,同時最大限度地降低預(yù)測模型的復(fù)雜度,即對下面函數(shù)進(jìn)行優(yōu)化求解的過程:
(2)
(3)
引入拉格朗日函數(shù)來解決凸二次優(yōu)化問題,即:
(4)
經(jīng)過計算得到SVM預(yù)測模型為
(5)
常用的非線性核函數(shù)主要有線性核函數(shù)、BRF核函數(shù)等。本文選擇BRF核函數(shù),其定義為:
(6)
支持向量機(jī)預(yù)測模型為:
(7)
由于本文的支持向量機(jī)采用BRF核函數(shù),因此,參數(shù)σ、c對支持向量機(jī)模型的預(yù)測效果影響較大,為此,本文使用尋優(yōu)能力較強(qiáng)的GA來優(yōu)化SVM參數(shù)。
2.2 基于GA-SVM的物流需求預(yù)測流程
遺傳算法(genetic algorithm,GA)是由Holland及其學(xué)生以達(dá)爾文的進(jìn)化論和孟德爾的遺傳學(xué)說為基礎(chǔ)建立的隨機(jī)搜索和優(yōu)化算法[12]。大量研究表明,遺傳算法是一種全局尋優(yōu)能力強(qiáng)的群智化算法,具有簡單、易于實現(xiàn)等特點。鑒于此,本文選擇GA優(yōu)化SVM參數(shù),提高預(yù)測模型的精度,具體的GA-SVM物流需求預(yù)測過程如圖1所示。
圖1 基于GA-SVM模型參數(shù)優(yōu)化流程圖
2.3 預(yù)測模型對比模型與性能評價指標(biāo)
為了衡量模型的預(yù)測性能,選擇網(wǎng)絡(luò)優(yōu)化SVM和POS優(yōu)化SVM(POS-SVM)模型作為對比,并使用均方根誤差RMSE、平均絕對誤差百分比MAPE和預(yù)測準(zhǔn)確度AL來評價模型的擬合能力和泛化誤差,具體定義如下。
均方根誤差:
(8)
平均絕對誤差百分比:
(9)
預(yù)測準(zhǔn)確度:
(10)
安徽省地處我國大陸東部,同經(jīng)濟(jì)發(fā)達(dá)的長三角毗鄰,擁有發(fā)達(dá)的交通運輸網(wǎng)絡(luò),具有連接南北、承東啟西的地理優(yōu)勢。在中部發(fā)展戰(zhàn)略崛起的背景下,安徽省的經(jīng)濟(jì)發(fā)展迎來了新契機(jī),物流業(yè)作為促進(jìn)經(jīng)濟(jì)發(fā)展的重要動力也擁有巨大的發(fā)展?jié)摿?。為能平衡物流需求與供應(yīng),統(tǒng)籌規(guī)劃物流資源,對物流需求量進(jìn)行準(zhǔn)確的預(yù)測則顯得尤為重要。
3.1 數(shù)據(jù)來源與處理
選取安徽省1998-2014年相關(guān)數(shù)據(jù),以運貨
表1 物流需求指標(biāo)體系
續(xù)表1
年份社會消費品零售總額/(X6/萬元)進(jìn)出口貿(mào)易總額/(X7/億美元)居民消費水平/(X8/元)貨物周轉(zhuǎn)量/(X9/萬噸)郵電業(yè)務(wù)量/(X10/萬元)1998924822322655723709179412573314.21999979139026489425239774992789178.4200010542618334689258810761170120139820011142819836199727391093210312245672002122871204181252988124986521434890200313312492594291331213557784176941020041503078672112137071450629822346662005176497539119713888156648022840149200620294001122486044411703005535580902007240373041592978527819889759446413020082965546420435296006584349425507520200935277844156352068296322004866248472010415151722427677823771536800300324420114900639631337821005584466179361614320125685555839325271097898315954405179220136481418845633751173411158962051339862014795703334927279129441350089155860055
注:數(shù)據(jù)來自《安徽省統(tǒng)計年鑒(1999-2015)》。
量衡量安徽省物流需求規(guī)模,并根據(jù)區(qū)域物流影響因素指標(biāo),建立物流需求指標(biāo)體系(表1)。
為了提高支持向量機(jī)的數(shù)據(jù)處理速度和預(yù)測準(zhǔn)確度,依據(jù)公式(11)對表1中的數(shù)據(jù)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)如表2所示。
(11)
表2 歸一化后的物流需求指標(biāo)體系
續(xù)表2
年份社會消費品零售總額/(X6/萬元)進(jìn)出口貿(mào)易總額/(X7/億美元)居民消費水平/(X8/元)貨物周轉(zhuǎn)量/(X9/萬噸)郵電業(yè)務(wù)量/(X10/萬元)19980.0000.0000.0000.0000.00019990.0080.0080.0140.0050.04120000.0180.0230.0210.0130.11920010.0310.0290.0350.0140.12320020.0430.0410.0580.0260.16320030.0580.0780.0890.0350.22620040.0820.1050.1260.0420.31420050.1190.1460.1440.0520.42920060.1570.2120.1960.0620.56520070.2100.2910.2750.0850.73620080.2900.3870.3440.3910.93320090.3700.2840.4220.4291.14520100.4590.4680.5550.4960.46020110.5650.6180.7270.5980.57620120.6770.7880.8140.7080.65820130.7900.9230.8860.8140.86320141.0001.0001.0001.0001.000
3.2 預(yù)測結(jié)果分析
基于Matlab 7.0軟件,以1998-2010年的樣本數(shù)據(jù)作為訓(xùn)練集,用于建模與參數(shù)優(yōu)化,以2011-2014年的數(shù)據(jù)作為測試集,用于檢驗?zāi)P偷姆夯芰Α?/p>
分別使用GA-SVM、POS-SVM、SVM模型對訓(xùn)練集進(jìn)行學(xué)習(xí),各個模型對訓(xùn)練集的預(yù)測結(jié)果如圖2所示。從圖2可以看出,在上述三個模型中,GA-SVM的預(yù)測值曲線與訓(xùn)練集真實值的曲線基本一致,擬合結(jié)果最好,模型性能最優(yōu)。
利用上面最優(yōu)模型預(yù)測2011-2014年的物流需求量,得到如表3的所示物流需求量。分析表3可得,GA-SVM模型預(yù)測的結(jié)果相對誤差最小,與真實值最為接近。
圖2 三種模型對訓(xùn)練集的預(yù)測結(jié)果對比
將表3的數(shù)據(jù)繪制成散點圖,如圖3所示,可以發(fā)現(xiàn)GA-SVM的預(yù)測值與測試集的真實值更趨于一致,同時結(jié)合表4的GA-SVM模型預(yù)測精度,得知其預(yù)測精度達(dá)到了0.99983。
圖3 三種模型對測試集的預(yù)測結(jié)果對比
表3 各模型對測試集的預(yù)測結(jié)果及相對誤差
表4 GA-SVM模型預(yù)測精度
根據(jù)上述分析可知,GA-SVM模型能夠精確地表征物流需求量的變化趨勢,具有很高的實用性,是一種較好的物流需求預(yù)測方法。
物流是連接社會再生產(chǎn)過程中生產(chǎn)與消費的橋梁,物流的發(fā)展與區(qū)域經(jīng)濟(jì)的發(fā)展有十分密切關(guān)系,準(zhǔn)確地預(yù)測物流需求,可以促進(jìn)經(jīng)濟(jì)的快速發(fā)展。本文利用安徽省1998-2014年的統(tǒng)計數(shù)據(jù)資料作實證分析對象,由于物流需求量的非線性、不確定性等特點以及SVM參數(shù)優(yōu)化問題,提出了GA-SVM物流需求預(yù)測模型。結(jié)果表明,該模型預(yù)測準(zhǔn)確性很高,推廣能力強(qiáng),擁有較好的實用價值,在物流需求預(yù)測中有很好的運用前景。依據(jù)GA-SVM模型預(yù)測成果,可以描述安徽省物流需求量規(guī)律,為應(yīng)對安徽省物流業(yè)的快速發(fā)展做好必要的準(zhǔn)備。
[2]夏國恩.區(qū)域物流需求預(yù)測現(xiàn)狀和發(fā)展研究[J].中國物流與采購,2010(4):68-69
[3]孫煦,陸化普,吳娟.基于蟻群優(yōu)化支持向量機(jī)模型的公路客運量預(yù)測[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2012,35(1):124-129
[4]顧亞祥,丁世飛.支持向量機(jī)研究進(jìn)展[J].計算機(jī)科學(xué),2011,38(2):14-17
[5]孫啟鵬,丁海鷹.區(qū)域物流需求量預(yù)測理論及模型構(gòu)建[J].物流技術(shù),2004(10):27-30
[6]黃虎.區(qū)域物流需求預(yù)測模型研究[J].統(tǒng)計與決策,2008(17):62-64
[7]林榮天,陳聯(lián)誠,李紹靜,等.基于灰色神經(jīng)網(wǎng)絡(luò)的區(qū)域物流需求預(yù)測[J].價值工程,2007(2):92-94
[8]李雋波,孫麗娜.基于多元線性回歸分析的冷鏈物流需求預(yù)測[J].安徽農(nóng)業(yè)科學(xué),2011,39(11):6519-6520,6523
[9]楊波,吳涵.基于組合預(yù)測模型的物流園區(qū)物流需求預(yù)測—以重慶空港物流園為例[J].數(shù)學(xué)的實踐與認(rèn)識,2015,45(20):16-25
[10]彭湖,何民.基于主成分回歸的區(qū)域物流需求預(yù)測研究—以云南省為例[J].交通運輸研究,2015,1(3):60-64
[11]丁世飛,齊丙娟,譚紅艷.支持向量機(jī)理論與算法研究綜述[J].電子科技大學(xué)學(xué)報,2011,40(1):2-10
[12]吉根林.遺傳算法研究綜述[J].計算機(jī)應(yīng)用與軟件,2004,21(2):69-73
(責(zé)任編輯:周博)
10.3969/j.issn.1673-2006.2016.12.009
2015-09-21
高青(1989-),安徽蚌埠人,在讀碩士研究生,主要研究方向:數(shù)據(jù)挖掘與風(fēng)險決策研究。
TP391;F201
A
1673-2006(2016)12-0031-05