黃建華,陳嚴(yán)鐺,盧簫揚
(福州大學(xué) 經(jīng)濟(jì)與管理學(xué)院,福建 福州 350108)
區(qū)域物流需求預(yù)測在完善物流規(guī)劃、推動地區(qū)經(jīng)濟(jì)發(fā)展、實現(xiàn)物流資源合理配置等方面發(fā)揮著重要作用,受到地方政府和學(xué)界的廣泛關(guān)注。2003—2018年,福建省貨運量年平均增長率為10.42%,高于全國的年平均增長率(8.45%)。然而受區(qū)域經(jīng)濟(jì)發(fā)展水平、區(qū)域貿(mào)易、區(qū)域產(chǎn)業(yè)結(jié)構(gòu)等多種區(qū)域因素的影響,福建省物流需求增長呈現(xiàn)非線性增長趨勢,增幅波動大于全國平均水平,這增大了物流需求預(yù)測指標(biāo)選取和預(yù)測方法選擇的難度。單個計量模型在處理多指標(biāo)的高維度時間序列問題時,預(yù)測效果不佳,因此,如何有效地選取預(yù)測指標(biāo)和提高物流需求預(yù)測精度是福建省政府制定物流發(fā)展規(guī)劃和經(jīng)濟(jì)發(fā)展計劃的重要內(nèi)容,也是目前福建省物流領(lǐng)域研究的熱點[1]。
在物流需求預(yù)測指標(biāo)選取上,大致分為綜合指標(biāo)和細(xì)分指標(biāo),有關(guān)綜合指標(biāo)的研究主要是選取貨運量、交通運輸量等單因素自相關(guān)指標(biāo)進(jìn)行預(yù)測[2-3],取得了較好的預(yù)測效果。但單一指標(biāo)忽略了其他影響因素的作用,將增加物流需求預(yù)測的不確定性。細(xì)分指標(biāo)通過分析多因素的相互作用很好地克服了上述問題,但選取哪些指標(biāo)成為關(guān)鍵。后銳等[4]運用MLP神經(jīng)網(wǎng)絡(luò)方法揭示了區(qū)域經(jīng)濟(jì)與區(qū)域物流需求之間的映射關(guān)系,為區(qū)域物流需求指標(biāo)選取提供了新思路。欒維新等[5-6]在此基礎(chǔ)上,引入GDP、進(jìn)出口總額、固定資產(chǎn)投資額、三次產(chǎn)業(yè)產(chǎn)值等多種經(jīng)濟(jì)因素對物流需求量進(jìn)行預(yù)測,降低了物流需求預(yù)測誤差。但上述研究存在以下不足:指標(biāo)選取的主觀隨意性較大,指標(biāo)構(gòu)建框架不一,結(jié)果缺乏可泛化性和可比性;選擇多樣化的指標(biāo)會增大模型的復(fù)雜度,且各指標(biāo)間容易存在共線性問題,若不進(jìn)行降維處理則容易產(chǎn)生偽回歸現(xiàn)象,使預(yù)測結(jié)果并非最優(yōu)。
在物流需求預(yù)測方法選擇上,現(xiàn)有方法主要分為兩類,即時間序列線性預(yù)測和非線性預(yù)測。傳統(tǒng)的時間序列預(yù)測方法,如指數(shù)平滑法[7],由于數(shù)據(jù)易受異常值影響,預(yù)測誤差較大。王紅瑞等[8]將自回歸和移動平均組合,形成新的時間序列預(yù)測方法,但該研究建立在數(shù)據(jù)是平穩(wěn)的、無趨勢的假設(shè)基礎(chǔ)上,這使得該方法在處理波動數(shù)據(jù)時存在局限性。CHEN等[9]通過運用ARIMA模型將自回歸移動平均法推廣到非平穩(wěn)序列中去,使預(yù)測模型的靈活性得到提高。葛娜等[10]通過對時間序列的原始數(shù)據(jù)進(jìn)行預(yù)處理、模型識別與定階、參數(shù)估計等步驟,建立ARIMA預(yù)測模型,結(jié)果表明所建立的ARIMA模型能較好地描述需求的變化趨勢,但單個ARIMA模型無法體現(xiàn)出其他因素的作用,預(yù)測結(jié)果不確定性大。WANG等[11-12]則將時間序列ARIMA模型與神經(jīng)網(wǎng)絡(luò)算法相結(jié)合構(gòu)建了組合預(yù)測模型,提高了預(yù)測精度,然而神經(jīng)網(wǎng)絡(luò)基于大樣本數(shù)據(jù),且對模型參數(shù)選擇敏感[13-14],方法運用不當(dāng)會加大預(yù)測誤差。主成分回歸法(PCR)將多個指標(biāo)用線性組合的方式轉(zhuǎn)化為少數(shù)相互正交的新變量,可以避免單一ARIMA模型預(yù)測不確定性大和神經(jīng)網(wǎng)絡(luò)參數(shù)選擇敏感的問題,在指標(biāo)遴選和數(shù)據(jù)降維方面具有很強(qiáng)的適用性[15-16]。IMANI等[17]將PCR引入ARIMA模型進(jìn)行預(yù)測,經(jīng)檢驗所構(gòu)建的模型能合理預(yù)測里海海平面數(shù)據(jù)。MALLICK等[18]運用多個ARIMA-PCR模型預(yù)測印度市場不同期限利率的收益率及各利率間的相互作用,研究取得了良好的預(yù)測效果。目前關(guān)于ARIMA-PCR模型的研究較多集中于自然科學(xué)與經(jīng)濟(jì)學(xué)等領(lǐng)域的預(yù)測,尚未有學(xué)者將ARIMA-PCR模型應(yīng)用于物流需求預(yù)測研究,考慮到福建省物流需求具有影響因素多、數(shù)據(jù)呈時序性等特征,選取單個ARIMA模型無法體現(xiàn)出其他因素的作用。若同時對多個指標(biāo)分別建立ARIMA預(yù)測模型,再將各指標(biāo)的預(yù)測結(jié)果運用PCR進(jìn)行有機(jī)結(jié)合,則可有效提高預(yù)測的精度和預(yù)測結(jié)果的穩(wěn)定性。因此,筆者從指標(biāo)選取和預(yù)測方法選擇兩個角度出發(fā),構(gòu)建基于ARIMA-PCR模型的福建省物流需求預(yù)測模型具有一定的理論和現(xiàn)實意義。
物流需求是派生性需求,物流需求量受到多種因素的影響和制約。以福建省1981—2017年的統(tǒng)計數(shù)據(jù)為基礎(chǔ),從多維度選取影響因素,并運用相關(guān)分析[19-20]檢驗已選指標(biāo)的合理性,篩選出數(shù)量少、相關(guān)性高的影響因素構(gòu)建指標(biāo)體系。
考慮到指標(biāo)的可量化性,結(jié)合國內(nèi)外研究現(xiàn)狀,用貨運量表示物流需求量,分別從區(qū)域經(jīng)濟(jì)發(fā)展水平、區(qū)域貿(mào)易和區(qū)域產(chǎn)業(yè)結(jié)構(gòu)3個維度選取影響因素,構(gòu)建指標(biāo)體系。
圖1 1981—2017年福建省貨運量與GDP數(shù)據(jù)對比
(1)區(qū)域經(jīng)濟(jì)發(fā)展水平。區(qū)域經(jīng)濟(jì)發(fā)展速度越快、規(guī)模越大、效率越高,經(jīng)濟(jì)發(fā)展水平越好,則物流需求量就越大。1981—2017年福建省GDP與貨運量經(jīng)標(biāo)準(zhǔn)化處理后的數(shù)據(jù)對比如圖1所示,可知兩組數(shù)據(jù)隨時間變化的趨勢非常接近,用簡單的線性回歸方法得到貨運量與GDP的相關(guān)系數(shù)為0.995,回歸方程擬合程度R2為0.987,說明簡單線性回歸方程擬合程度好,兩指標(biāo)存在強(qiáng)線性相關(guān)關(guān)系。但GDP并不是決定地區(qū)物流需求量的唯一因素。福建省貨運量增速的變化幅度明顯大于GDP增長的變化幅度,說明物流需求并不只受GDP因素的影響,還與其他因素如固定資產(chǎn)投資額、工業(yè)總產(chǎn)值等有關(guān)。
(2)區(qū)域貿(mào)易。區(qū)域貿(mào)易包括對內(nèi)貿(mào)易和對外貿(mào)易,主要指標(biāo)有社會消費品零售總額、進(jìn)出口貿(mào)易額等。據(jù)福建省統(tǒng)計局?jǐn)?shù)據(jù)分析可知,2018年福建省全年社會消費品零售總額達(dá)14 317.43億元,較上年增長10.8%,全年進(jìn)出口總額為12 354.30億元,同比增長6.6%。區(qū)域貿(mào)易成為福建省區(qū)域經(jīng)濟(jì)發(fā)展的重要組成部分,區(qū)域貿(mào)易活動有力促進(jìn)了福建省物流需求的增長。
(3)區(qū)域產(chǎn)業(yè)結(jié)構(gòu)。區(qū)域物流需求來源于區(qū)域經(jīng)濟(jì)社會各個產(chǎn)業(yè),是對區(qū)域內(nèi)初始品、半成品、成品的多重測度,涉及經(jīng)濟(jì)活動的全過程,需要各產(chǎn)業(yè)結(jié)構(gòu)的可量化指標(biāo),即第一產(chǎn)業(yè)產(chǎn)值、第二產(chǎn)業(yè)產(chǎn)值、第三產(chǎn)業(yè)產(chǎn)值。
為了檢驗所選指標(biāo)是否合理,選取常用的Pearson相關(guān)系數(shù)法[21-22]檢驗變量間的相關(guān)程度和顯著性水平,由式(1)計算變量間的相關(guān)系數(shù)r。
(1)
貨運量與各指標(biāo)相關(guān)性分析如表1所示,可知各項指標(biāo)與貨運量之間的Pearson相關(guān)系數(shù)均在0.950以上,且均在0.001水平下顯著,表明所選指標(biāo)與物流需求存在顯著的相關(guān)關(guān)系,可有效預(yù)測福建省物流需求?;诖耍瑯?gòu)建福建省物流需求量影響因素指標(biāo)體系,如表2所示。各指標(biāo)原始數(shù)據(jù)如表3所示,數(shù)據(jù)來源為福建省統(tǒng)計年鑒。
表1 貨運量與各指標(biāo)相關(guān)性分析
注:***表示P<0.001
ARIMA模型是時間序列方法的一種變形,是將差分、自回歸、移動平均方法組合起來,基于歷史數(shù)據(jù)進(jìn)行預(yù)測,在短期區(qū)域物流預(yù)測中具有較高的精度。運用多個ARIMA模型可以綜合考慮多因素的作用,增加預(yù)測穩(wěn)定性。考慮到各指標(biāo)間的交叉、重疊或相互共線的問題,需對指標(biāo)進(jìn)行降維。PCR方法是在損失少量原有信息的前提下,將多個指標(biāo)用線性組合的方式轉(zhuǎn)換為相互正交的少數(shù)主成分變量,并進(jìn)行主成分回歸,在降低模型復(fù)雜度和減少共線性問題上應(yīng)用廣泛。因此,針對福建省物流需求的特征,構(gòu)建ARIMA-PCR模型對物流需求進(jìn)行預(yù)測,建模流程如圖2所示。
表2 物流需求量影響因素指標(biāo)體系
表3 福建省物流需求預(yù)測原始數(shù)據(jù)
圖2 基于ARIMA-PCR模型的預(yù)測流程圖
將表3中數(shù)據(jù)拆分為訓(xùn)練集(1981—2015年)和測試集(2016—2017年),訓(xùn)練集用于建模,測試集用于檢驗?zāi)P陀行?。建模步驟如下:
(1)對指標(biāo)X11的原始數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗,若不平穩(wěn),經(jīng)d階差分,將數(shù)據(jù)轉(zhuǎn)化為平穩(wěn)序列。
(2)運用自回歸AR(p)和移動平均MA(q)模型對平穩(wěn)化后的新序列進(jìn)行建模,稱滿足如下形式的模型為ARIMA(p,d,q)模型:
ΔdXj=φ1ΔdXj-1+φ2ΔdXj-2+…+φpΔdXj-p+
εj+θ1εj-1+θ2εj-2+…+θqεj-q
(2)
經(jīng)檢驗確定X11的最優(yōu)模型為ARIMA(1,1,1),標(biāo)準(zhǔn)化后模型的實際值、擬合值與殘差序列如圖3所示,可看出在經(jīng)過1階差分后,殘差圍繞0值上下隨機(jī)波動,可認(rèn)為數(shù)據(jù)干擾隨機(jī),預(yù)測值與擬合值變動趨勢一致,說明所建立的模型能較好地擬合數(shù)據(jù)的真實情況。
圖3 ARIMA(1,1,1)模型殘差、實際值與擬合值
(3)其他指標(biāo)的建模步驟與上述類似,分別建立各指標(biāo)的ARIMA模型及各模型2016年和2017年的預(yù)測值,如表4所示。
表4 指標(biāo)的模型及預(yù)測值
(1)將各個ARIMA模型的預(yù)測數(shù)據(jù)(見表4)與訓(xùn)練數(shù)據(jù)集組成新的時間序列矩陣,經(jīng)標(biāo)準(zhǔn)化后得到無量綱的數(shù)據(jù)矩陣X,將其作為主成分回歸的輸入矩陣。
(3)
其中,xij為第i年第j個指標(biāo)的原始數(shù)據(jù)。
(2)計算矩陣X的相關(guān)系數(shù)矩陣R=(rij)m×n,其中rij的計算公式為:
(4)
經(jīng)計算可得知前兩個主成分累計包含了原始數(shù)據(jù)99.634%的信息,因此提取前兩個主成分,即:
Z1=0.113x1+0.111x2+0.113x3+0.113x4+
0.110x5+0.111x6+0.113x7+0.112x8
(5)
Z2=-0.062x1-1.777x2-0.079x3-0.597x4+
1.843x5+1.481x6+0.117x7-0.552x8
(6)
(4)將所提取的主成分Z1和Z2對貨運量Y進(jìn)行最小二乘線性回歸,得到回歸方程Y=33 812.882Z1+189.427Z2+43 081.297?;貧w方程檢驗結(jié)果如表5所示,可看出方差膨脹因子VIF<10,表明主成分指標(biāo)不共線,所建立的回歸方程有效,擬合優(yōu)度R2為0.994,接近于1,回歸系數(shù)落于95%置信區(qū)間內(nèi),說明模型擬合程度好。
表5 回歸系數(shù)檢驗表
(5)將提取的兩個主成分分別代入回歸方程后,得到2016年和2017年福建省的貨運量分別為117 213萬t和124 037萬t。
為了驗證所構(gòu)建ARIMA-PCR模型的有效性,借鑒李赤林等[23]的研究,引用相同的數(shù)據(jù)集對各指標(biāo)建立BP神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)的參數(shù)如表6所示,對建立的模型訓(xùn)練10次,加權(quán)平均得到預(yù)測值。各模型2016和2017年的預(yù)測結(jié)果與實際值對比如圖4所示,由圖4可知,ARIMA-PCR模型的預(yù)測值最接近實際值。
表6 BP神經(jīng)網(wǎng)絡(luò)參數(shù)
圖4 各模型預(yù)測結(jié)果對比圖
(7)
(8)
由表7可知:①BP-PCR模型、ARIMA-PCR模型的預(yù)測效果分別優(yōu)于BP模型、ARIMA模型,說明選取多種影響因素對物流需求進(jìn)行預(yù)測比選取貨運量單一指標(biāo)進(jìn)行預(yù)測的結(jié)果具有更高的精度;②在預(yù)測方法上,基于主成分回歸的組合模型預(yù)測效果要優(yōu)于單一模型和基于多元線性回歸的組合模型,這是因為主成分回歸降低了指標(biāo)間的多重共線性問題,減少誤差,從而精度得到提升。這也是整體上ARIMA-PCR模型取得了最好預(yù)測效果的原因。
表7 各種預(yù)測方法比較
以1981—2017年統(tǒng)計數(shù)據(jù)為訓(xùn)練集,代入已建好的ARIMA-PCR模型,預(yù)測2018—2022年福建省物流需求量,結(jié)果分別如圖5和表8所示。由表8可知,2022年福建省貨運量需求將達(dá)178 607萬t,較2017年的132 252萬t增長近35%。由圖5和表8可知,未來5年,福建省物流需求量將進(jìn)一步擴(kuò)大。
圖5 ARIMA-PCR預(yù)測值與實際值對比
表8 基于ARIMA-PCR模型的貨運量預(yù)測結(jié)果(2018—2022年)
為了精準(zhǔn)地預(yù)測福建省物流需求,為福建省物流業(yè)發(fā)展提供數(shù)據(jù)支撐和決策參考,筆者構(gòu)建了ARIMA-PCR組合預(yù)測模型。首先,從多維度選取影響因素,構(gòu)建物流需求預(yù)測指標(biāo)體系;其次,利用ARIMA模型對各指標(biāo)分別進(jìn)行建模預(yù)測;最后,將預(yù)測結(jié)果進(jìn)行主成分回歸分析,建立貨運量與所提取主成分之間的多元回歸關(guān)系。結(jié)果表明,對福建省物流需求的預(yù)測,ARIMA-PCR模型相較于其他模型能取得更好的預(yù)測效果,并得到以下主要研究結(jié)論:
(1)在指標(biāo)選取上,從多角度出發(fā)選取影響因素進(jìn)行組合預(yù)測,其結(jié)果具有更高的精度,但是在指標(biāo)選取時也要進(jìn)行適當(dāng)?shù)暮Y選和數(shù)據(jù)降維,減少多重共線性等問題對預(yù)測結(jié)果的干擾。
(2)在預(yù)測方法上,通過對比ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型及各組合預(yù)測模型的預(yù)測效果可知,ARIMA-PCR模型更能真實準(zhǔn)確地反映福建省物流需求量的變化特征。
(3)根據(jù)模型預(yù)測結(jié)果可知,未來5年福建省物流需求量將保持持續(xù)增長趨勢,物流業(yè)對經(jīng)濟(jì)的貢獻(xiàn)度將逐年提升?;诖?,福建省政府部門可以依據(jù)未來5年的物流需求量進(jìn)行物流系統(tǒng)科學(xué)規(guī)劃,加快物流節(jié)點和交通線路的投資,加強(qiáng)各種交通運輸方式的銜接,進(jìn)一步促進(jìn)物流業(yè)高效率運轉(zhuǎn)。物流企業(yè)要提高服務(wù)水平,轉(zhuǎn)變經(jīng)濟(jì)發(fā)展方式,增強(qiáng)與制造企業(yè)等的協(xié)調(diào)聯(lián)動能力。
(4)筆者側(cè)重于從經(jīng)濟(jì)角度出發(fā)選取指標(biāo),在未來的研究中,可以從更多層面綜合選取指標(biāo),構(gòu)建指標(biāo)體系進(jìn)行物流需求量預(yù)測。