鄭芷雪,鄭 列
(湖北工業(yè)大學(xué)理學(xué)院,湖北 武漢 430068)
灰色GM(1,1)模型的亮點(diǎn)為樣本數(shù)據(jù)少、原理易理解、計(jì)算簡便、短時期預(yù)估準(zhǔn)確率高、測試較容易。用修改初始值方法改進(jìn)GM(1,1)模型,可以使模型擬合以及預(yù)測準(zhǔn)確度有很大改善[1-2]。然而,由于灰色預(yù)測基于GM(1,1)模型對波動較大數(shù)據(jù)列擬合效果偏差大且預(yù)測準(zhǔn)確度低。但是馬爾可夫概率矩陣基于狀態(tài)間的轉(zhuǎn)移概率來預(yù)測將來發(fā)展,所以能預(yù)測波動大的數(shù)據(jù)列。將兩個模型組合成改進(jìn)的灰色馬爾可夫預(yù)測模型,能有效使用數(shù)據(jù),使得隨機(jī)波動大的數(shù)據(jù)列預(yù)測準(zhǔn)確度提高[3]。研究上海入境旅游歷史數(shù)據(jù),并預(yù)測上海入境旅游未來發(fā)展,可幫助我們從另一個角度和另一個層面了解上海的入境旅游市場,為上海旅游部門和旅游企業(yè)提供參考。
由于需求數(shù)據(jù)量少,本文將選取2010-2017年上海入境旅客人數(shù)為基礎(chǔ)進(jìn)行預(yù)測。為便于計(jì)算,將入境旅客人數(shù)的單位設(shè)成百萬人次(數(shù)據(jù)來源于上海旅游局)。
2.1.1 傳統(tǒng)的GM(1,1)模型設(shè)非負(fù)原始序列為
X(0)={x(0)(1),x(0)(2),…,x(0)(n)}
對其進(jìn)行一次累加生成,得其1-AGO序列為
X(1)={x(1)(1),x(1)(2),…,x(1)(n)}
(1)
解方程可得
以x(1)(1)=x(0)(1)為初始條件可得到灰色GM(1,1)模型的時間響應(yīng)函數(shù)
(2)
離散化時間響應(yīng)函數(shù)以獲得灰色GM(1,1)模型的時間響應(yīng)函數(shù)式
(3)
最小二乘原理估計(jì)灰色微分方程參數(shù)
(4)
其中,
(5)
原始數(shù)據(jù)列預(yù)測值經(jīng)一次累減還原得
(6)
2.1.2 初值修正的GM(1,1)模型傳統(tǒng)GM(1,1)模型以x(1)(1)=x(0)(1)為初始條件時,丟失了新數(shù)據(jù)帶來的信息,因此采用將初始條件和新累加生成最后一項(xiàng)預(yù)測,以提高預(yù)測精度。建立模型,分別令t=1,n,可得:
(7)
(8)
加權(quán)馬爾可夫鏈的基本原理是用一階自相關(guān)系數(shù)來運(yùn)算與用原始數(shù)據(jù)的狀態(tài)參數(shù)值來預(yù)測。用時間相關(guān)強(qiáng)度加權(quán)求和,使預(yù)測結(jié)果更科學(xué)合理。加權(quán)馬爾可夫模型[4]預(yù)測步驟如下:
1)利用均值均方差法等對原序列劃分;
2)用1)中的方法劃分狀態(tài)區(qū)間;
3)檢驗(yàn)原始隨機(jī)序列的“馬氏性”;
4)計(jì)算自相關(guān)系數(shù)
(9)
5)算出馬爾可夫鏈非同步長的權(quán)重
(10)
6)算出每階轉(zhuǎn)移概率和相關(guān)轉(zhuǎn)移概率矩陣;
7)限時段被認(rèn)為是初始狀態(tài),轉(zhuǎn)移概率矩陣是根據(jù)6)獲得的,并且可預(yù)測對應(yīng)于下一個時間段的概率,即
Pi(k),i∈E(k=1,2,…,m)
(11)
8)通過加權(quán)每個預(yù)測的概率,可獲得如下狀態(tài)的未來概率:
(12)
重復(fù)進(jìn)行1)—7),可對下一時段的概率進(jìn)行預(yù)測。
將初值修正GM(1,1)模型和加權(quán)馬爾可夫模型結(jié)合成改進(jìn)灰色馬爾可夫模型。兩個模型組合為
(13)
由于灰色模型預(yù)估值發(fā)展趨向很單一,因此無法預(yù)估數(shù)據(jù)列波動特征,而馬爾可夫模型能預(yù)測數(shù)據(jù)列的發(fā)展趨向。因此,聯(lián)合兩個模型的亮點(diǎn),執(zhí)行灰色模型初始值校正和馬爾可夫模型加權(quán),引入改進(jìn)灰色馬爾可夫模型來預(yù)測上海入境旅客人數(shù)。
3.1.1 級比檢驗(yàn)2010-2017年上海入境旅客人數(shù)建立初始序列[5]
{x(0)}=
{8.5112,8.1757,8.004,7.574,
7.913,8.0016,8.5437,8.7301}
(14)
通過計(jì)算得到該序列的級比
σ(k)=x(0)(k-1)/x(0)(k)=
{1.041,1.021,1.057,0.957,0.989,0.937,0.979}
(15)
3.1.2 初值修正的GM(1,1)模型應(yīng)用使用R軟件運(yùn)用傳統(tǒng)GM(1,1)模型和初值校正GM(1,1)模型來預(yù)測2013-2017年上海入境旅客人數(shù)(表1)。根據(jù)表1,平均相對誤差非常小,后驗(yàn)差在0.35~0.5之間,精度達(dá)到96%,在相對誤差、后驗(yàn)差比值和精度三方面中看出,初值校正GM(1,1)模型比傳統(tǒng)GM(1,1)模型預(yù)測結(jié)果好。故本文使用初值修正的GM(1,1)模型。
根據(jù)初值修正的GM(1,1)模型,可以得到參數(shù)估計(jì)值:
發(fā)展系數(shù)-a=0.0143;
灰色作用量b=7.6123。因此,灰色模型預(yù)測公式為
(16)
3.2.1 狀態(tài)劃分本文數(shù)據(jù)被分為5個狀態(tài)區(qū)間,并使用初值校正GM(1,1)模型計(jì)算原始數(shù)列相應(yīng)預(yù)測值。找出相應(yīng)的殘差序列和相對誤差,并根據(jù)相對誤差確定5個狀態(tài)區(qū)間,取區(qū)間測度為1.2%。
表1 上海入境旅客人數(shù)灰色模型預(yù)測值
狀態(tài)區(qū)間E1=[0,1.2%),E2=[1.2%,2.4%),E3=[2.4%,3.6%],E4=[3.6%,4.8%],E5=[4.8%,6%]。這5個狀態(tài)區(qū)間稱為相對誤差狀態(tài)區(qū)間,基于初始數(shù)據(jù)和相對誤差區(qū)間來確定初始數(shù)據(jù)所在的狀態(tài)具體劃分見表2。
表2 根據(jù)相對誤差劃分狀態(tài)
3.2.2 馬氏檢驗(yàn)使用MATLAB軟件,轉(zhuǎn)移頻數(shù)矩陣
概率轉(zhuǎn)移矩陣
表3 統(tǒng)計(jì)量計(jì)算表
3.2.3 改進(jìn)灰色馬爾可夫模型應(yīng)用分別算出步長為2,3,4,5對應(yīng)的轉(zhuǎn)移概率矩陣:
算出每階自相關(guān)系數(shù)與每個步長的馬爾可夫權(quán)重(表4)。
根據(jù)相對誤差狀態(tài)區(qū)間,結(jié)合加權(quán)思想,權(quán)重由狀態(tài)邊界值確定,因此,三個狀態(tài)下對應(yīng)的預(yù)測結(jié)果不同,結(jié)果表示成M(K+1),使用此模型預(yù)測上海入境旅客人數(shù),具體形式運(yùn)算如下。
表4 每階自相關(guān)系數(shù)與每個步長的馬爾可夫權(quán)重
狀態(tài)1
狀態(tài)2
狀態(tài)3
(17)
狀態(tài)4
狀態(tài)5
在預(yù)測之前,有必要確定與目標(biāo)年份數(shù)據(jù)相對應(yīng)的狀態(tài),并預(yù)測下一年中相應(yīng)值的狀態(tài),該狀態(tài)由狀態(tài)轉(zhuǎn)移概率確定[7](表5)。
表5 2018年上海入境旅客人數(shù)概率預(yù)測表
從表5知,max{pi}=0.5674,2018年上海入境旅客人數(shù)的最大概率在狀態(tài)3,即k=8時,用改進(jìn)馬爾可夫預(yù)測模型,2018年上海入境旅客人數(shù)為:
(18)
可以基于預(yù)測的2018年預(yù)測值的狀態(tài)來計(jì)算2019年的狀態(tài),以此類推。根據(jù)上述計(jì)算步驟,2018-2020年上海入境旅游的人數(shù)可以依次預(yù)測,但預(yù)測的目標(biāo)年份不能太大,由于政策等無法解釋的因素可能會對灰色預(yù)測范圍之外的數(shù)據(jù)產(chǎn)生影響,因此預(yù)測不準(zhǔn)確。
使用改進(jìn)灰色馬爾可夫模型預(yù)測出2018-2020年上海入境旅客人數(shù)與相對誤差,并使用改進(jìn)GM(1,1)模型,預(yù)測2018-2020年上海入境旅客人數(shù)和相對誤差,然后比較兩者結(jié)果。
改進(jìn)灰色馬爾可夫相比改進(jìn)GM(1,1)模型預(yù)測的相對誤差小,前者平均相對誤差是0.3048%,而后者平均相對誤差為2.8129%。將2018年預(yù)測值與真實(shí)值比較,發(fā)現(xiàn)改進(jìn)灰色馬爾可夫模型預(yù)測值更加靠近真實(shí)值。因此,改進(jìn)灰色馬爾可夫模型在預(yù)測上海入境旅客人數(shù)方面結(jié)果更為準(zhǔn)確。
表6 上海入境旅客人數(shù)的改進(jìn)灰色馬爾可夫預(yù)測表
1)上海入境旅客人數(shù)滿足級比檢驗(yàn),可用傳統(tǒng)GM(1,1)模型與改進(jìn)GM(1,1)模型分別預(yù)測數(shù)據(jù)。在相對誤差、后驗(yàn)差比值與精度三方面,可見初始值校正GM(1,1)模型比傳統(tǒng)GM(1,1)模型預(yù)測結(jié)果更好。因此,可采用初始值校正的GM(1,1)模型。
2)通過測試獲得的數(shù)據(jù)列具有馬爾可夫?qū)傩?,因?yàn)轳R爾可夫模型預(yù)測結(jié)果僅是一個區(qū)間而不是特定值。故將初值校正GM(1,1)模型和加權(quán)馬爾可夫模型一起組合用于預(yù)測。組合模型比初值校正GM(1,1)模型預(yù)測結(jié)果的相對誤差小,結(jié)果更精確。