楊小芬
(西南大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,重慶400715)
近年來,旅游業(yè)對各國的經(jīng)濟發(fā)展,環(huán)境保護等有著重要的影響. 隨著我國社會經(jīng)濟的高速發(fā)展,國際地位的顯著提高,我國更加注重旅游業(yè)的發(fā)展,旅游業(yè)已經(jīng)成為我國第三產(chǎn)業(yè)的重要組成部分,許多城市也希望借助旅游業(yè)的發(fā)展帶動整個社會經(jīng)濟的發(fā)展. 旅游人數(shù)是旅游業(yè)的重要環(huán)節(jié)之一,科學(xué)準確地預(yù)測旅游需求,能夠準確把握其發(fā)展趨勢,從而制定相應(yīng)的政策來確保旅游業(yè)健康持續(xù)發(fā)展,進一步提升我國的綜合實力和國際影響力,同時也促進我國各地區(qū)的經(jīng)濟發(fā)展和文化交流.
目前,國內(nèi)外旅游需求預(yù)測的主要方法包括回歸模型、時間序列、BP 神經(jīng)網(wǎng)絡(luò)、灰色模型,指數(shù)平滑法、組合模型等,但是哪種方法更好尚無定論,因此要結(jié)合實際問題綜合考慮模型的選擇,以達到較高的預(yù)測效果. 由于灰色GM(1,1)模型的預(yù)測圖形是一條平滑的指數(shù)型曲線,所以它不能充分提取數(shù)據(jù)的波動性,因而對波動性較大的數(shù)據(jù)序列擬合較差,且預(yù)測精度較低. 而馬爾科夫模型的研究對象是一個隨機變化的動態(tài)系統(tǒng),它是根據(jù)狀態(tài)之間的轉(zhuǎn)移概率來預(yù)測系統(tǒng)未來的發(fā)展情況,轉(zhuǎn)移概率反映了各種隨機因素的影響程度,反映了各狀態(tài)之間轉(zhuǎn)移的內(nèi)在規(guī)律性[1]. 所以,把兩者進行組合,形成一個灰色馬爾科夫模型,其中GM(1,1)模型用來揭示數(shù)據(jù)序列的發(fā)展變化趨勢,而馬爾科夫模型用來確定狀態(tài)的轉(zhuǎn)移規(guī)律,從而組合后的模型能充分提取數(shù)據(jù)中的信息,提高擬合和預(yù)測精度.
灰色馬爾科夫模型已經(jīng)在糧食產(chǎn)量預(yù)測,客流量預(yù)測,房價預(yù)測等方面得到了廣泛應(yīng)用,但是多數(shù)學(xué)者在使用灰色馬爾科夫模型時并沒有對用來劃分狀態(tài)的序列進行平穩(wěn)性檢驗和馬氏性檢驗,缺乏嚴謹性. 關(guān)于旅游需求的預(yù)測,我國學(xué)者主要集中在對我國入境游客量或某一地區(qū)旅游人數(shù)預(yù)測的研究,而對國內(nèi)游客量的預(yù)測研究甚少.因此,本文基于灰色馬爾科夫模型,對我國國內(nèi)游客數(shù)進行預(yù)測研究,并且在方法的使用上更為科學(xué)嚴謹.
選取我國2004-2015 年國內(nèi)游客數(shù)據(jù)建立模型,利用2016年和2017年的數(shù)據(jù)檢驗?zāi)P偷念A(yù)測精度,全部數(shù)據(jù)來源于國家統(tǒng)計局.
1.1.1 灰色GM(1,1)模型
(1)原始數(shù)據(jù)的檢驗及處理[2]
建立灰色模型之前,首先要對原始數(shù)據(jù)進行級比檢驗和光滑度檢驗.
設(shè)原始數(shù)據(jù)序列為:
計算光滑比:
對我國2004-2015年國內(nèi)游客數(shù)據(jù)進行級比檢驗和光滑度檢驗,發(fā)現(xiàn)級比并沒有全部落入(e)=(0.8574,1.1663)范圍之內(nèi),且光滑比不是k 的減函數(shù),因此原始數(shù)據(jù)沒有通過級比檢驗和光滑度檢驗,如表1所示.
表1 2004-2015年原始數(shù)據(jù)級比檢驗和光滑度檢驗
對我國2004-2015 年國內(nèi)游客數(shù)據(jù)做開方處理,并對開方數(shù)據(jù)進行級比檢驗和光滑度檢驗,級比全部落入(=(0.8574,1.1663)范圍之內(nèi),且光滑比是k 的減函數(shù)(見表2),兩種檢驗都通過,可進一步對開方數(shù)據(jù)建立灰色模型.
表2 2004-2015年開方數(shù)據(jù)級比檢驗和光滑度檢驗
(2)建立灰色GM(1,1)模型
根據(jù)灰色模型的理論,利用R編寫程序,對我國2004-2015 年國內(nèi)游客開方數(shù)據(jù)建立灰色GM(1,1)模型,并對模型進行殘差檢驗,后驗差檢驗和模型預(yù)測.結(jié)果如表3所示.
表3 對2004-2015年開方數(shù)據(jù)建立灰色GM(1,1)模型結(jié)果
其中X?(0)(1)=X(0)(1).
②殘差檢驗中,平均相對誤差為1.2668%,模型精度為98.7332%,模型精度較高;后驗差檢驗中,小誤差概率P=1 >0.95,方差比C=0.0770 <0.35,參照表4,可得模型精度等級為優(yōu);再計算關(guān)聯(lián)度r=0.6031 >0.6,模型較好. 所以該灰色GM(1,1)模型通過了三種檢驗.
表4 后驗差檢驗判別參照表
將灰色GM(1,1)模型的擬合值還原后,與真實值比較,利用平均相對誤差計算公式:
計算擬合平均相對誤差為2.5350%,模型精度為97.4650%,模型精度較高.
(3)灰色GM(1,1)模型預(yù)測精度的檢驗
利用灰色GM(1,1)模型預(yù)測我國2016年和2017年國內(nèi)游客數(shù)據(jù)的開方值,并將其還原后和真實值比較,計算預(yù)測平均絕對殘差為182.986 4(表5).
表5 灰色GM(1,1)模型預(yù)測精度的檢驗
1.1.2 無偏灰色模型
灰色GM(1,1)模型的參數(shù)估計值為:
計算無偏灰色模型的參數(shù)值為:
則無偏灰色模型的序列預(yù)測方程為:
利用無偏灰色模型擬合我國2004-2015年國內(nèi)游客開方數(shù)據(jù),并將擬合值還原,利用式(3)和(4)計算擬合平均相對誤差為2.5316%,模型精度為97.4684%,模型精度較高.
利用無偏灰色模型預(yù)測我國2016 年和2017 年的開方值,將預(yù)測值還原后和真實值比較,計算預(yù)測平均絕對殘差為182.357 0(表6).與灰色GM(1,1)模型相比,降低了0.629 4.
表6 無偏灰色模型預(yù)測精度的檢驗
1.1.3 灰色馬爾科夫模型
灰色馬爾科夫模型是利用馬爾科夫模型對灰色模型的預(yù)測值進行修正,從而提高擬合和預(yù)測精度.具體步驟如下:
①對原始數(shù)據(jù)建立灰色模型,并求出擬合值X?(0)(k),計算殘差的相對值:
②馬爾科夫模型要求用于劃分狀態(tài)的數(shù)據(jù)序列具有近似平穩(wěn)的過程,因此,對殘差相對值序列進行平穩(wěn)性檢驗.
③當殘差相對值序列的平穩(wěn)性檢驗通過后,對其進行狀態(tài)劃分,并確定原始序列所處的狀態(tài).
④計算轉(zhuǎn)移頻數(shù)矩陣和一步轉(zhuǎn)移概率矩陣,并對序列進行馬氏性檢驗.
⑤如果序列沒有通過馬氏性檢驗,則不能建立馬爾科夫模型;反之,則計算n步轉(zhuǎn)移概率矩陣來確定下一時刻所處狀態(tài).
⑥利用式(6)修正灰色模型的擬合預(yù)測值.
其中,X?(0)(k)為灰色模型的擬合預(yù)測值,ε1(k)和ε2(k)分別取序列值所處狀態(tài)區(qū)間的左端點值和右端點值.
(1)傳統(tǒng)灰色馬爾科夫模型
①利用灰色GM(1,1)模型擬合我國2004-2015年國內(nèi)游客開方數(shù)據(jù),根據(jù)式(5)計算出殘差相對值序列.
②利用ADF 方法檢驗得殘差相對值序列為平穩(wěn)序列(α=0.05),所以可以對該序列進行狀態(tài)劃分,如表7所示.
表7 差相對值序列平穩(wěn)性檢驗(傳統(tǒng)灰色馬爾科夫模型)
③殘差相對值序列的狀態(tài)劃分為:E1=(-3.1%,-1%],E2=(-1%,1%],E3=(1%,3%],表8為殘差相對值序列所處狀態(tài).
表8 殘差相對值序列所處狀態(tài)(傳統(tǒng)灰色馬爾科夫模型)
④根據(jù)殘差相對值序列所處狀態(tài),計算得轉(zhuǎn)移頻數(shù)矩陣和一步轉(zhuǎn)移概率矩陣分別為:
對序列進行馬氏性檢驗,首先計算邊際概率值:
表9 邊際概率值
表10 統(tǒng)計量χ2=2計算表
表10 統(tǒng)計量χ2=2計算表
狀態(tài)1 2 3合計fi1| |||| |||ln pi1 p?1 1.212 3 0.597 8 0.087 0 1.897 1 fi2| |||| |||ln pi2 p?2 0 1.502 3 0.087 0 1.589 3 fi3| |||| |||ln pi3 p?3 0.200 7 0.310 2 0.200 7 0.711 6合計1.412 9 2.410 3 0.374 7 8.395 9
⑤利用式(6)對灰色GM(1,1)模型2004-2015 年開方數(shù)據(jù)的擬合值進行修正,將修正值還原后,利用式(3)和(4)計算得擬合平均相對誤差為0.8978%,模型精度為99.1022%. 可見,與灰色GM(1,1)模型相比,模型精度提高了1.6372%;與無偏灰色模型相比,模型精度提高了1.6338%.
⑥利用傳統(tǒng)灰色馬爾科夫模型預(yù)測我國2016年和2017 年國內(nèi)游客數(shù),預(yù)測平均絕對殘差為11.022 3(表11). 與灰色GM(1,1)模型相比,減少171.964 1;與無偏灰色模型相比,減少171.334 7.
表11 傳統(tǒng)灰色馬爾科夫模型預(yù)測精度的檢驗
2016 年和2017 年國內(nèi)游客數(shù)計算的具體步驟如下:
①2015 年的殘差相對值所處狀態(tài)為1,故初始向量為v0=(1,0,0),由一步轉(zhuǎn)移概率得到2016 年的狀態(tài)分布為:
由灰色GM(1,1)模型預(yù)測出2016年的開方數(shù)據(jù)為67.875 94,對該值進行修正得:
將此修正值還原后,得到我國2016年國內(nèi)游客為4 424.840 8百萬人次.
②計算兩步轉(zhuǎn)移概率矩陣. 因為殘差相對值序列平穩(wěn),所以可以視為齊次馬氏鏈,n步轉(zhuǎn)移概率矩陣就是一步轉(zhuǎn)移概率矩陣的n次方.
計算得兩步轉(zhuǎn)移概率矩陣為:
由兩步轉(zhuǎn)移概率得到2017年的狀態(tài)分布為:
所以2017 年所處的狀態(tài)為max(0.5556,0.1111,0.3333),即為狀態(tài)E1:(-3.1%,-1%].
由灰色GM(1,1)模型預(yù)測出2017年的開方數(shù)據(jù)為72.102 91,對該值進行修正得:
將此修正值還原后,得到我國2017年國內(nèi)游客為4 993.114 5百萬人次.
(2)無偏灰色馬爾科夫模型
①利用無偏灰色模型擬合我國2004-2015年國內(nèi)游客開方數(shù)據(jù),根據(jù)式(5)計算出殘差相對值序列.
②利用ADF 方法檢驗得殘差相對值序列為平穩(wěn)序列,所以可以對該序列進行狀態(tài)劃分,如表12所示.
表12 殘差相對值序列平穩(wěn)性檢驗(無偏灰色馬爾科夫模型)
③確定劃分狀態(tài)為:E1=(-3%,-1%],E2=(-1%,1%],E3=(1%,3%],表13 為殘差相對值序列所處狀態(tài).
表13 殘差相對值序列所處狀態(tài)(無偏灰色馬爾科夫模型)
④根據(jù)殘差相對值序列所處狀態(tài),計算得轉(zhuǎn)移頻數(shù)矩陣和一步轉(zhuǎn)移概率矩陣分別為:
⑤利用式(6)對無偏灰色模型2004-2015年開方數(shù)據(jù)的擬合值進行修正,將修正值還原后和真實值比較,利用式(3)和(4)計算擬合平均相對誤差為0.8838%,模型精度為99.1162%. 與傳統(tǒng)灰色馬爾科夫模型相比,模型精度提高了0.0140%.
⑥利用無偏灰色馬爾科夫模型預(yù)測我國2016年和2017年國內(nèi)游客數(shù)(計算方法同傳統(tǒng)灰色馬爾科夫模型),預(yù)測平均絕對殘差為7.101 6(見表14).與傳統(tǒng)灰色馬爾科夫模型相比,減少了3.920 8.
表14 無偏灰色馬爾科夫模型預(yù)測精度的檢驗
通過比較各模型的精度,擬合平均相對誤差和預(yù)測平均絕對殘差,選出相對最優(yōu)模型為無偏灰色馬爾科夫模型(表15).
表15 各模型精度比較
繪制無偏灰色馬爾科夫模型的擬合預(yù)測圖,發(fā)現(xiàn)擬合值與真實值幾乎完全重合,無偏灰色馬爾科夫模型充分提取了原始數(shù)據(jù)中存在的波動性.利用無偏灰色馬爾科夫模型預(yù)測我國2018-2020年的國內(nèi)游客數(shù)分別為5 639.366 8 百萬人次,6 363.854 百萬人次,7 181.415 7百萬人次,表明我國未來三年國內(nèi)游客數(shù)仍呈現(xiàn)增長趨勢(圖1).
在對我國2004-2015年國內(nèi)游客數(shù)據(jù)建模的實例中,與灰色GM(1,1)模型和無偏灰色模型相比,傳統(tǒng)灰色馬爾科夫模型和無偏灰色馬爾科夫模型的建立,都取得了非常高的擬合和預(yù)測精度. 尤其是無偏灰色馬爾科夫模型,模型精度為99.1162%,擬合平均相對誤差為0.8838%,它充分提取了數(shù)據(jù)的發(fā)展趨勢和波動性;同時也取得了較高的預(yù)測效果,預(yù)測平均絕對殘差為7.101 6. 因此,在預(yù)測旅游人數(shù)時可以考慮該模型;同時在研究人口問題,或是數(shù)據(jù)序列波動比較大的問題時,都可以嘗試擬合灰色馬爾科夫模型來充分提取已知數(shù)據(jù)中的信息,還可以對其進行修正以獲得更高的擬合和預(yù)測精度,從而更好地掌握和解決實際問題.
圖1 無偏灰色馬爾科夫模型擬合預(yù)測圖
從預(yù)測結(jié)果來看,我國2018-2020 年的國內(nèi)游客數(shù)分別為5 639.366 8 百萬人次、6 363.854 百萬人次、7 181.415 7 百萬人次,數(shù)據(jù)呈現(xiàn)增長態(tài)勢. 國家統(tǒng)計局最新公布的2018年國內(nèi)游客數(shù)為5 540百萬人次,2018 年的模型預(yù)測值比實際值高99.366 8 百萬人次,相對誤差為1.7936%. 因此,無偏灰色馬爾科夫模型的實際預(yù)測效果很好.