劉 夏,李苑輝,歐志鵬,陳 磊,陳明銳
(1.三亞航空旅游職業(yè)學院,海南 三亞 572000;2.海南大學 計算機與網絡空間安全學院,???570228)
預測交通客流量的方法較多,國內學者在時間序列方面:孫泗龍(2014)[1]、宋子房(2014)[2]、芮少權(2010)[3]、張嘉成(2016)[4]均構建了時間序列ARIMA模型用于客流量預測,但預測精度仍可提高。在在灰色理論方面:李克昭(2016)構建了優(yōu)化后的灰色馬爾科夫模型[5],樊冬雪(2015)構建了粒子群無偏灰色馬爾科夫鏈模型[6],張國帥(2011)將累積法引入到傳統(tǒng)灰色馬爾科夫模型[7],楊軍(2013)構建基于累積法的灰色馬爾科夫模型[8],朱念(2017)構建灰色馬爾科夫模型進行了預測[9],顧炯(2014)建立基于灰色預測的城市軌道交通短期客流預測模型[10]。此外,曾冬玲(2016)[11]用馬爾科夫模型修正灰色模型,預測了云南旅游市場未來3年的客流。湯銀英(2018)邵夢汝(2016)、王慧勇(2016)、付建飛(2014)、安然(2015)等學者也從不同的角度將灰色理論分別改進馬爾科夫模型[12]、神經網絡模型[13]、線性回歸模型[14]并用于預測。在國外的研究方面,Liu X(2017)在使用了ARMA、灰色預測GM(1,1)以及ARMA改進回歸模型對客流量進行了預測[15]。Xia L(2017)運用灰色預測方法對航線客流量的預測的精確度較高,對航空公司預估客流量和制訂銷售政策有直接的指導意義[16]。Nieto María Rosa構建了基于ARIMA+GARCH的模型用于客流預測[17]。IslamB將改進的反向傳播神經網絡與混沌搜索遺傳算法和模擬退火算法相結合用于電力預測。
選取了三亞市旅游政務網公布的2012—2017每年1月—12月的三亞市旅游統(tǒng)計月度數據,在經過清洗后,選取了來自機場和火車站的客流數據總量作為研究對象。
1.2.1 ARIMA
Box與Jenkins在20世紀70年代首先提出了ARIMA模型。ARIMA模型在時間序列預測方面適用十分廣泛,它的全稱是自回歸積分滑動平均模型[1]。ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR代表的是自回歸,p則為自回歸項;MA用于代表移動平均,當中的q則用于表示移動平均的具體項數,字母d則代表時間的序列,即表示移動平均,q代表的是MA移動平均的項數,d表示時間的序列,用于表示在平穩(wěn)狀態(tài)下需要進行差分分析的次數。ARIMA模型作為一種回歸分析模型,具體是針對非平穩(wěn)時間序列進行轉化,使其變成平穩(wěn)時間序列,在此基礎上分析因變量、隨機誤差項對應的滯后值以及隨現值等?;谠蛄械钠椒€(wěn)性與回歸包括因素角度,能夠將ARIMA模型劃分成多個過程。
1.2.2 灰色馬爾科夫介紹
依據過去的已有探究能夠知道,對于灰色預測來講,遇到那些具備一定規(guī)律,同時變化率相對較小的數據序列,其預測的精準度相對較高,然而當遇到那些變化沒有規(guī)律的數據序列時,很難將其預測的精準度控制在相對較小的范圍里。對于馬爾科夫鏈而言,其預測的對象是隨機變化的,是一個呈動態(tài)變化的系統(tǒng),對于數據的未來變化趨勢是依據當下呈現狀態(tài)的轉移概率來進行推測的,側面體現了預測結果受每個影響因素所影響的程度,所以,對于那些原始數據起伏變化的系統(tǒng)開展預測,馬爾科夫鏈是最適合的。要想對灰色預測模型具有的缺陷加以彌補,就要把馬爾科夫鏈和其加以整合,充分發(fā)揮兩者的優(yōu)勢,預測的精準度才能得以大幅提升。灰色馬爾科夫模型可以劃分成灰色轉移狀態(tài)與灰色轉移概率兩類模型,所采用的是前者,即灰色轉移狀態(tài)馬爾科夫模型,常規(guī)而言,它有3個步驟:
第1步,預測狀態(tài)的劃分。
第2步,狀態(tài)轉移概率矩陣的創(chuàng)建,如式(1)與式(2)所示:
(1)
(2)
在式(2)當中:Pij對應的是一步轉移概率,其范圍在狀態(tài)i至狀態(tài)j之間,Mij對應的是一步轉移次數,其范圍也是在狀態(tài)i至狀態(tài)j之間,Mi對應的是狀態(tài)數量,該數量歸屬于狀態(tài)i。
(3)
針對以上論述的月旅客數量,運用傳統(tǒng)的時間序列模型ARIMA對其加以預測與擬合。
用傳統(tǒng)的時間序列ARIMA模型,對上述的每月旅客數進行擬合和預測。要在ARIMA模型創(chuàng)建之前,先做出航線的時序圖,得到的結果如圖1所示。
圖1 每月客流量時序圖
根據圖1能夠獲取月旅客量,顯示出其季節(jié)因素極為顯著,每一年旅客數量較少的月份是7、8、9三個月,旅客數量較多的月份在1、2、3三個月。旅客數量的季節(jié)調整可運用X-12季節(jié)調整法來得以開展,所得到的每月季節(jié)指數具體可見表1:
表1 每月季節(jié)指數列表
接著對調整后的月旅客數量進行單位根檢驗,檢驗的結果如表2所示。
表2 調整之后的旅客數量單位根檢驗列表
根據表2可得調整后的每月旅客數是一階單整序列,所以,創(chuàng)建的模型要是ARIMA(p,1,q)模型。
針對NUM具體情況,將其ACF與PACF圖畫出,識別p和q,得到的結果如圖2所示。
圖2 D(passenger_num)的ACF和PACF圖
根據圖2的ACF和PACF可以得出,D(passenger_num)所對應的PACF圖顯示出的現象是1期“截尾”,相對于ACF圖而言,其顯示出的現象則是“拖尾”,結合AIC值最小原則。最后對交通旅客數初步建立ARIMA(1,1,0)?;诙啻握{試,最后得出和表3顯示出的ARIMA(1,1,0)模型的結果。
表3 ARIMA的結果
從表2、表3所提供的數據可知,在0.05的顯著水平情況下,模型總似然比檢驗和ARIMA(1,1,0)的各項系數都是顯著的,因此可獲得方程:
D(passenger_num)t=189.381 4-
0.919 1D(passenger_num)t-1
(4)
針對以上論述模型的殘差加以檢驗的基礎上,將殘差的ACF與PACF圖畫出,對其模型進行觀察,看旅客數序列的有效信息有沒有全部提取,圖3顯示的就是所獲取的結果:
圖3 殘差對應的ACF與PACF圖
殘差序列的ACF和PACF通過圖3可知大體都在兩個標準差之后,顯示出以上所述的模型對序列的全部信息都進行了有效提取。在此基礎上,月旅客數可運用所創(chuàng)建的ARIMA(1,1,0)模型加以預測。
(5)
其中YF1表示每月旅客數的預測序列,Sj表示每月的季節(jié)指數。計算預測的平均絕對百分誤差。
(6)
按照以上創(chuàng)建的ARIMA(1,1,0)來針對每月交通旅客量進行預測,其MAPE=4.42%。
依照圖1可以看出2012—2017年交通旅客量具有明顯的季節(jié)趨勢,采用2012—2017年的每個月擁有的旅客數量作為原始數據,在此基礎上創(chuàng)建出灰色馬爾科夫預測模型,分組展開預測,這樣季節(jié)效應對預測所產生的影響就可得以有效規(guī)避。
先進行灰色預測,以2012—2017-01的旅客數作為例子建立具體的灰色馬爾科夫預測模型。
表4 灰色預測值
第三,對灰色預測的殘差進行狀態(tài)劃分,對預測誤差進行劃分3個不同的狀態(tài)空間E1,E2,E3,具體劃分如下所示:
E1=(36.44,-13.69),E2=(-13.69,9.07),E3=(9.07,31.82)
根據上述的劃分,可以得出在2012—2017-01月E1狀態(tài)有1次,E2狀態(tài)有3次,E3狀態(tài)有1次。
最后,將預測值計算出來,按照狀態(tài)的劃分,將預測值狀態(tài)所屬殘差的組中值取出,然后和以上灰色預測的值進行相加,精準度更高的灰色馬爾科夫預測模型的預測值就能夠獲取。以2012-02的預測值計算為例:
Y=138.448 4+(36.44-13.69)/2=149.82
以此類推可以得到灰色馬爾科夫預測模型對2012—2017每年1月—12月的預測值,見表5。
表5 預測值列
根據表5可得,選用灰色馬爾科夫模型對2012-01—2017-01預測MAPE=3.70%,灰色預測模型的預測MAPE=8.13%,可知就兩者的預測精準度而言,灰色預測模型與灰色馬爾科夫模型相比明顯落后。因此,應用灰色馬爾科夫預測模型針對2012—2017-02-12的交通旅客量進行預測,計算出的MAPE=3.78%。
比較ARIMA模型與灰色馬爾科夫模型對2012-01—2017-12的交通旅客量進行預測,得到的預測時序如圖4:
圖4 兩個模型預測值
并且計算兩個模型的預測精度得到的值如表6所示:
表6 兩個模型預測精度比較
通過上述兩種模型的預測精度比較,選用預測精度較好的灰色馬爾科夫的模型對2018-01—12月的交通旅客量進行預測。
首先計算2012—2017年每年1月的狀態(tài)轉移概率矩陣:
可以得到2012年1月交通旅客量所處的是E2狀態(tài),則初始向量:
得到2018-01的轉移概率為
計算得到2018-01的交通旅客量處在E1和E2的狀態(tài)的概率各為1/2。通過計算可以得到2018-01的交通旅客量為373.260 7萬人。根據同樣的計算方式得到2018-02-12的交通旅客量如表7。
表7 2018年旅客數的預測
通過使用不同的模型進行建模及分析,在針對不同模型對應的預測精度進行對比之后,最后選擇的是灰色馬爾科夫預測模型,主要是因為模型的樣本預測精準度相對較高,能夠對未來一年交通旅客量比較精準加以預測。根據預測情況,可以看出在每年2月作為三亞旅游的旺季,其交通旅客量可能突破400萬次,這對當地交通、旅游等部門提前進行工作部署具有重要的意義?;疑R爾科夫模型的方法和結果簡單易懂,可以推廣到其他相關領域客流量的預測。
從“吃住行游購娛”的旅游六要素來看,交通是決定著一個城市旅游質量的重要因素。與此同時,交通不僅服務于游客,也服務于市民,關乎每一個人的居住舒適度。對于一個常住人口61萬的小城,在旅游旺季單月接待超過400萬次的游客,對任何一座城市都是一個不小的挑戰(zhàn)。因此,三亞應積極在建設外連交通的同時,逐步完善好自己的交通“內動脈”,利用水資源和橋梁建設等手段完成城市交通一體化建設。積極利用數據手段進行實時觀測,提前把握客流量的趨勢,向交通組織部門和運力部門提前提供科學的數據,充分做到提前部署、提前把控,全面提高交通管理能力。