葉雪強(qiáng),桂預(yù)風(fēng)
(武漢理工大學(xué)理學(xué)院,武漢430070)
長江是我國內(nèi)河水運(yùn)最重要、運(yùn)輸規(guī)模最大的通航河流。自2003年三峽船閘投入運(yùn)行以來,過閘貨運(yùn)量快速增長,2014年三峽船閘過閘貨運(yùn)量達(dá)到近1.2億噸。長江三峽船閘過閘貨運(yùn)量常應(yīng)用于各種經(jīng)濟(jì)規(guī)劃分析中,并作為衡量內(nèi)河航運(yùn)發(fā)展程度的一項(xiàng)重要指標(biāo)[1]。
目前,貨運(yùn)量的預(yù)測方法主要有時(shí)間序列分析法,回歸分析法,彈性系數(shù)法,平均增長率法,灰色系統(tǒng)預(yù)測法等。杜嘉[1]采用彈性系數(shù)法、平均增長率法、回歸分析法、曲線擬合法分別預(yù)測三峽過閘貨運(yùn)量,并根據(jù)各種預(yù)測方法的特點(diǎn)及適用場合,最終確定四種過閘貨運(yùn)量預(yù)測方法的權(quán)重系數(shù)。趙奇志[2]采用回歸分析模型、二次指數(shù)平滑法、抽象方式選擇模型、增長系數(shù)法分別預(yù)測廣西內(nèi)河貨運(yùn)總量,最后通過綜合比較分析,最終預(yù)測出西津水利樞紐過閘貨運(yùn)量。馬海峰[3]采用平均增長率法預(yù)測三峽船閘過閘貨運(yùn)量。
本文根據(jù)三峽船閘過閘貨運(yùn)量的歷史數(shù)據(jù),建立了GM(1,1)預(yù)測模型和線性回歸預(yù)測模型,并提出了熵值法組合預(yù)測模型。由于熵值法確定組合預(yù)測權(quán)系數(shù)不可避免地會碰到一些極端值,如相對誤差為零,或者數(shù)據(jù)出現(xiàn)異常點(diǎn)等,而熵值法確定組合預(yù)測權(quán)系數(shù)要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,從而提出了改進(jìn)熵值法組合預(yù)測模型,并對三峽船閘過閘貨運(yùn)量進(jìn)行預(yù)測。
1.2.1 基于熵值法的組合預(yù)測模型權(quán)系數(shù)的確定方法[4]
組合預(yù)測綜合利用各種單項(xiàng)預(yù)測方法所提供的信息,以適當(dāng)?shù)募訖?quán)平均形式得出組合預(yù)測模型。組合預(yù)測核心的問題就是如何求出組合預(yù)測加權(quán)平均系數(shù),使得組合預(yù)測模型更加有效地提高預(yù)測精度。本文從信息論的觀點(diǎn)出發(fā),根據(jù)各單項(xiàng)預(yù)測方法預(yù)測誤差序列的變異程度,利用信息熵的概念。計(jì)算出組合預(yù)測加權(quán)平均系數(shù)。
設(shè)第i種單項(xiàng)預(yù)測方法第t時(shí)刻相對誤差為:
用熵值法確定組合預(yù)測加權(quán)系數(shù)的步驟如下:
(1)將各種單項(xiàng)預(yù)測方法預(yù)測相對誤差序列歸一化。即計(jì)算第i種單項(xiàng)預(yù)測方法第t時(shí)刻的預(yù)測相對誤差的比重:
(2)計(jì)算第i種單項(xiàng)預(yù)測方法的預(yù)測相對誤差的熵值hi:
其中k>0為常數(shù)。對第i種單項(xiàng)預(yù)測方法而言,如果pit全部相等,即,那么hi取得極大值klnN,這里取k=1 lnN,則有0≤hi≤1。
(3)計(jì)算第i種單項(xiàng)預(yù)測方法的預(yù)測相對誤差序列的變異程度系數(shù):
(4)計(jì)算各種預(yù)測方法的加權(quán)系數(shù):
(5)計(jì)算組合預(yù)測值:
1.2.2 基于改進(jìn)熵值法的組合預(yù)測模型權(quán)系數(shù)的確定方法
傳統(tǒng)的熵值法確定權(quán)系數(shù)不可避免地會碰到一些極端值,如相對誤差為零,或者數(shù)據(jù)出現(xiàn)異常點(diǎn)等。而傳統(tǒng)的熵值法確定權(quán)系數(shù)要求相對誤差必須全部大于零,否則不能求相對誤差的熵值,或者人為主觀的定義0ln0=0,是為了保證數(shù)據(jù)的完整性和確定權(quán)系數(shù)的客觀性,等于零的數(shù)值又不能直接刪去,因此需要對該相對誤差進(jìn)行變換,從而對熵值法進(jìn)行改進(jìn)。為了縮小極端值對權(quán)系數(shù)的影響,并保證賦權(quán)的客觀性,可以對相對誤差序列進(jìn)行變換,然后再按照傳統(tǒng)熵值法的步驟(1)至步驟(5)進(jìn)行計(jì)算。相對誤差變換公式為:
其中:
Markov鏈?zhǔn)且环N特殊的隨機(jī)過程[5],其可以根據(jù)系統(tǒng)當(dāng)前時(shí)刻的狀態(tài)推求下一時(shí)刻的狀態(tài)概率分布,進(jìn)而得到下一時(shí)刻的狀態(tài)。其基本原理是:每個(gè)系統(tǒng)的狀態(tài)可用隨機(jī)變量表示,并對應(yīng)一定的狀態(tài)概率,當(dāng)某一時(shí)刻狀態(tài)轉(zhuǎn)移到下一時(shí)刻狀態(tài)時(shí),同時(shí)在這個(gè)過程中存在概率的轉(zhuǎn)移,即轉(zhuǎn)移概率[6]。
假設(shè)有個(gè)n狀態(tài),并且狀態(tài)的個(gè)數(shù)是可數(shù)的,那么狀態(tài)Ei經(jīng)一步轉(zhuǎn)移到狀態(tài)Ej都有可能發(fā)生,則這個(gè)過程可能發(fā)生的概率稱為一步轉(zhuǎn)移概率pij。所有的狀態(tài)一步轉(zhuǎn)移概率構(gòu)成一步轉(zhuǎn)移矩陣P(1)。Markov鏈預(yù)測模型[7]可表示為:
其中,P0為初始時(shí)刻的概率分布,Pt+1是t+1時(shí)刻的概率分布,P(1)為一步轉(zhuǎn)移概率矩陣,其表達(dá)式為:
式中:pij為一步轉(zhuǎn)移概率,
根據(jù)改進(jìn)熵值法組合預(yù)測模型預(yù)測結(jié)果,選擇適合的指標(biāo)(這里采用預(yù)測結(jié)果的相對誤差)劃分狀態(tài)空間;計(jì)算其一步轉(zhuǎn)移頻數(shù)矩陣,求出其一步轉(zhuǎn)移概率矩陣;利用Markov鏈預(yù)測模型對改進(jìn)熵值法的預(yù)測結(jié)果進(jìn)行修正。
本文根據(jù)三峽船閘過閘貨運(yùn)量2003—2014年數(shù)據(jù)的變化趨勢,先利用GM(1,1)模型和線性回歸預(yù)測模型分別進(jìn)行預(yù)測;之后再利用組合預(yù)測模型對年過閘貨運(yùn)量進(jìn)行預(yù)測,并對各種方法的預(yù)測結(jié)果進(jìn)行對比分析;最后通過Markov鏈模型對預(yù)測結(jié)果進(jìn)行修正。三峽船閘過閘貨運(yùn)量2003—2014年數(shù)據(jù)(記為y,單位:萬噸)見表1所示。
表1 預(yù)測方法的預(yù)測擬合值
3.1.1 GM(1,1)模型
灰色系統(tǒng)建模是通過數(shù)據(jù)序列建立微分方程來擬合給定的時(shí)間序列,從而對數(shù)據(jù)的發(fā)展趨勢進(jìn)行預(yù)測[8]。
設(shè)為原始數(shù)據(jù)序列:
將原始序列進(jìn)行一次累加,得到:
GM(1,1)模型的時(shí)間響應(yīng)序列為:
還原值為:
利用GM(1,1)模型建??梢缘贸鋈龒{船閘過閘貨運(yùn)量的GM(1,1)模型的時(shí)間響應(yīng)序列為:
利用GM(1,1)模型的時(shí)間響應(yīng)序列進(jìn)行預(yù)測并對預(yù)測結(jié)果進(jìn)行一次累減后的數(shù)列即為運(yùn)用GM(1,1)模型對過閘貨運(yùn)量的預(yù)測估計(jì)值(記為x1),見表1所示。
通過對模型的檢驗(yàn),得出以下結(jié)果:
(1)殘差檢驗(yàn):相對殘差φˉ=6.94%>10%,認(rèn)為其預(yù)測精度較高。
(2)關(guān)聯(lián)度檢驗(yàn):關(guān)聯(lián)度r=0.7243>0.6,認(rèn)為其模型可以接受。
(3)后驗(yàn)差檢驗(yàn):小殘差概率p=1>0.95,認(rèn)為其模型為小殘差概率合格模型。
3.1.2 線性回歸模型
一元線性回歸模型[9]的數(shù)學(xué)形式:
其中,ε是隨機(jī)誤差,通常假定ε~N(0,σ2)。
由于過閘貨運(yùn)量數(shù)據(jù)隨年份呈線性趨勢,故建立一元線性回歸模型:
通過對模型的檢驗(yàn),得出以下結(jié)果:
(1)回歸系數(shù)的顯著性檢驗(yàn):β1顯著性檢驗(yàn)的t值為t=13.6953,其對應(yīng)的p值p=0<0.05,認(rèn)為β1顯著性不為零。
(2)線性回歸方程的顯著性檢驗(yàn):線性回歸方程的顯著性檢驗(yàn)的F值為F=187.5624,其對應(yīng)的p值p=0<0.05,認(rèn)為線性回歸方程顯著。
3.2.1 基于熵值法確定權(quán)系數(shù)的組合預(yù)測模型
在利用以上兩種單項(xiàng)預(yù)測模型計(jì)算出預(yù)測擬合值后,根據(jù)熵值法來確定兩種單項(xiàng)預(yù)測模型的組合權(quán)系數(shù),得到的權(quán)系數(shù)向量為:
ω=(0.4562,0.5438)
從而得到相應(yīng)的熵值法組合模型為:
利用熵值法組合預(yù)測模型(記為組合模型1)得到的預(yù)測擬合值(記為x3)見表1所示。
3.2.2 基于改進(jìn)熵值法確定權(quán)系數(shù)的組合預(yù)測模型
根據(jù)改進(jìn)熵值法來確定兩種單項(xiàng)預(yù)測模型的組合權(quán)系數(shù),得到的權(quán)系數(shù)向量為:
ω=(0.6054,0.3946)
從而得到相應(yīng)的改進(jìn)熵值法組合預(yù)測模型為:利用改進(jìn)熵值法組合模型得到的預(yù)測擬合值(記為x4)見表1所示。
比較兩種單項(xiàng)預(yù)測模型和兩種組合模型的擬合精度,以預(yù)測誤差平方和作為反映預(yù)測精度的一個(gè)指標(biāo)。通過計(jì)算兩種單項(xiàng)預(yù)測模型和兩種組合模型的預(yù)測誤差平方和(結(jié)果見表2所示)可以得出,熵值法組合預(yù)測模型精度低于改進(jìn)熵值法組合預(yù)測模型精度,但高于兩種單項(xiàng)預(yù)測模型的精度,由此可見,改進(jìn)熵值法能有效的減少預(yù)測誤差,提高預(yù)測精度。預(yù)測誤差平方和公式為:
表2 各種預(yù)測模型的預(yù)測誤差平方和
計(jì)算改進(jìn)熵值法組合預(yù)測模型對過閘貨運(yùn)量的預(yù)測相對誤差,計(jì)算結(jié)果見表3所示。根據(jù)預(yù)測相對誤差的具體數(shù)值,劃分的Markov狀態(tài)空間間為:(1)狀態(tài)空間E1為預(yù)測相對誤差ε∈[-18%,-6%),屬于預(yù)測偏低狀態(tài);(2)狀態(tài)空間E2為預(yù)測相對誤差ε∈[-6%,6%),屬于預(yù)測正常狀態(tài);(3)狀態(tài)空間E3為預(yù)測相對誤差ε∈[6%,18%),屬于預(yù)測偏高狀態(tài)。并以此對改進(jìn)熵值法組合預(yù)測模型的預(yù)測相對誤差進(jìn)行狀態(tài)劃分,結(jié)果見表3所示。
表3 2003—2014年過閘貨運(yùn)量的預(yù)測相對誤差及狀態(tài)分類
由表3可計(jì)算出其一步轉(zhuǎn)移頻數(shù)矩陣Q,從而計(jì)算出一步狀態(tài)轉(zhuǎn)移概率矩陣P(1),其中:
同理,
轉(zhuǎn)移矩陣的不變分布為:
根據(jù)Markov鏈預(yù)測模型,由轉(zhuǎn)移概率矩陣可以得出預(yù)測值的狀態(tài)空間及其相對應(yīng)的概率,從而可以計(jì)算出基于Markov鏈修正的改進(jìn)熵值法組合預(yù)測模型的預(yù)測結(jié)果。由不變分布可以得出,若干年之后Markov鏈處于狀態(tài)E1,E2和E3的概率分別0.5455,0.2727和0.1818。表4(見下頁)列出了2015—2020年基于Markov鏈修正的改進(jìn)熵值法組合預(yù)測模型的預(yù)測結(jié)果。
本文采用了熵值法組合預(yù)測模型對三峽船閘過閘貨運(yùn)量進(jìn)行預(yù)測,針對熵值法確定組合預(yù)測權(quán)系數(shù)的不足,提出了改進(jìn)熵值法組合預(yù)測模型,并且預(yù)測精度比熵值法組合預(yù)測模型的預(yù)測精度更高。最后利用Markov鏈預(yù)測模型對改進(jìn)熵值法的預(yù)測結(jié)果進(jìn)行修正,進(jìn)一步增加了預(yù)測的精度和可信度。
表4 改進(jìn)熵值法組合預(yù)測結(jié)果的Markov鏈修正值
[1]杜嘉.長江三峽樞紐水路客貨運(yùn)輸量預(yù)測[D].重慶:重慶交通大學(xué)碩士學(xué)位論文,2008.
[2]趙奇志.西津樞紐貨運(yùn)量預(yù)測及二線船閘通航條件研究[D].重慶:重慶交通大學(xué)碩士學(xué)位論文,2013.
[3]馬海峰.三峽樞紐過閘貨運(yùn)量預(yù)測分析及對策研究[J].中國水運(yùn),2015,38(3).
[4]陳華友.組合預(yù)測方法有效性理論及其應(yīng)用[M].北京:科學(xué)出版社,2008.
[5]朱新國,張展羽,祝卓.基于改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)馬爾科夫模型的區(qū)域需水量預(yù)測[J].水資源保護(hù),2010,26(2).
[6]景亞平,張鑫,羅艷.基于灰色神經(jīng)網(wǎng)絡(luò)與馬爾科夫鏈的城市需水量組合預(yù)測[J].西北農(nóng)林科技大學(xué)學(xué)報(bào),2011,39(7).
[7]付長賀,鄧甦.馬爾科夫鏈在傳染病預(yù)測中的應(yīng)用[J].沈陽師范大學(xué)學(xué)報(bào):自然科學(xué)版,2009,27(1).
[8]許國根,賈瑛.模式識別與智能計(jì)算的MATLAB實(shí)現(xiàn)[M].北京:北京航空航天大學(xué)出版社,2012.
[9]何曉群,劉文卿.應(yīng)用回歸分析[M].北京:中國人民大學(xué)出版社,2011.