符方健,陳福川
(瓊臺師范高等??茖W校 數(shù)理系,海南 ???571100)
?
基于馬爾可夫鏈模型的游客流預測
——以海南國際旅游島為例
符方健,陳福川
(瓊臺師范高等??茖W校 數(shù)理系,海南 ???571100)
以海南國際旅游島為例,應用馬爾可夫鏈構造游客流動態(tài)模型,對未來幾年海南旅游人數(shù)進行預測,為海南省建設國際旅游島進程中做好交通、賓館等基礎設施提供參考。
馬爾可夫鏈;轉移概率;海南國際旅游島;游客人數(shù)
2010年1月4日,國務院發(fā)布《國務院關于推進海南國際旅游島建設發(fā)展的若干意見》。至此,海南國際旅游島建設正式步入正軌,海南將迎來國內外眾多游客。能否對未來幾年游客人數(shù)變化進行科學預測,關系到交通、賓館等基礎設施建設和旅游景點門票設定,而對這些資源的最大合理利用,更關系到海南省經濟增長和外匯收入。
定義1[1]如果隨機序列{Xn,n≥0}對任意i0,i1,…,in,in+1∈S,n∈N0,及P{X0=i0,X1=i1,…,Xn=in}>0,有
p{Xn+1=in+1|X0=i0,X1=i1,…,Xn=in}=P{Xn+1=in+1|Xn=in},
(1)
則稱其為馬爾可夫鏈.(1)式刻畫了馬爾可夫鏈特性,稱為馬爾可夫性(或無后效性)。
π(n+1)=π(n)p;π(n)=π(0)Pn
對于旅游人數(shù)預測,不同學者采用不同方法[2-3],各有利弊.筆者認為境內外來海南國際旅游島旅游的人數(shù)隨著客源地和島內氣候、管理以及我國政治、經濟、文化等諸多因素影響而變化,所以都是隨機變量。且由經驗知,某年來海南島旅游的某類客源地旅游人數(shù)多少只受到前一年影響,且與大前年等無關。因此根據(jù)馬爾可夫鏈特性,各類客源地來海南國際旅游島旅游人數(shù)可分別被視作一個齊次馬爾可夫鏈。于是可應用馬爾可夫鏈建立如下模型:
本文中,m=0表示2012年度,所以瞬時概率分布P(1)、P(2)和P(3),分別表示2013、2014和2015年度。下面主要工作是計算出P(1)、P(2)和P(3),通過對P(1)、P(2)和P(3)進行數(shù)據(jù)分析,對未來兩年2014和2015年來海南國際旅游島旅游的人數(shù)做出概率預測。
將游客分為國內旅游者,外國人,港澳同胞,臺灣同胞,最后進行總人數(shù)統(tǒng)計。
根據(jù)海南省統(tǒng)計局數(shù)據(jù)[4],我們提取了海南省1995—2012年來瓊旅游人數(shù),統(tǒng)計情況見表1。
(表1) 1995年至2012年來瓊旅游人數(shù)統(tǒng)計表 (單位:萬人次)
(一)國內旅游者
經計算x1中a1=328.24,β1=3238.80,組距為:d1=970.19。分組區(qū)間為:[328.24,1298.4)[1298.43,2268.62),[2268.62,3238.80]。初始狀態(tài)概率分布為P(0)=(0.5,0.3333,0.1667),m步轉移概率矩陣分別為:
P(1)=(0.4444,0.3333,0.2223),
P(2)=(0.3951,0.3271,0.2778)
P(3)=(0.3512,0.3164,0.3324).
數(shù)據(jù)分析:觀察P(1),P(2) 和P(3)中數(shù)據(jù)落在各組的概率,發(fā)現(xiàn)數(shù)據(jù)落在第一組[328.24,1298.4)的概率最大,分別為0.4444,0.3951和0.3512。但是從逐年發(fā)展趨勢看,數(shù)據(jù)落在第一組和第二組的概率都是逐年減少,但是數(shù)據(jù)落在第三組[2268.62,3238.80]的概率是逐年增大的,分別為0.2223,0.2778和0.3324。再觀察表1,從2003年起,國內旅游人數(shù)是逐年遞增的,因此本文認為2014和2015年,來海南國際旅游島旅游的國內旅游人數(shù)應多于2268.62萬人次。
(二)外國人
經計算x2中a2=7.29,β2=73.13,組距為:d2=21.95。分組區(qū)間為:[7.29,29.24)[29.24,51.19),[51.19,73.13]。初始狀態(tài)概率分布為P(0)=(0.6111,0.1667,0.2222),m步轉移概率矩陣分別為:
所以m時瞬時概率分布分別為:
P(1)=(0.5555,0.1 667,0.2778) ,
P(2)=(0.5051,0.1755,0.3194),
P(3)=(0.4591,0.1843,0.3566) 。
數(shù)據(jù)分析:觀察P(1),P(2) 和P(3)中數(shù)據(jù)落在各組的概率,發(fā)現(xiàn)數(shù)據(jù)落在第一組[7.29,29.24)的概率最大,分別為0.5555,0.5051和0.4591。其次是第三組[51.19,73.13],概率分別為0.2778,0.3194和0.3566。但是從逐年發(fā)展趨勢看,數(shù)據(jù)落在第一組的概率是逐年減少,而落在第三組的概率是逐年增大的,且隨著海南國際旅游島各項工作的完善,應越來越吸引外國人來旅游。因此本文將分別以概率0.3194和0.3566認為2014和2015年,來海南國際旅游島旅游的外國人人數(shù)應介于51.19和73.13萬人次之間。
(三)港澳同胞
經計算x3中a3=8.11β3=32.54,組距d3=8.14。分組區(qū)間為[8.11,16.25),[16.25,24.39),[24.39,32.54],初始狀態(tài)概率分布為P(0)=(0.6111,0.2222,0.1667),m步轉移概率矩陣分別為:
所以m時瞬時概率分布分別為:
P(1)=(0.611102,0.222209,0.166689) ,
P(2)=(0.611146,0.2222197,0.166657),
P(3)=(0.611106,0.222174,0.166720) .
數(shù)據(jù)分析:觀察P(1),P(2) 和P(3)中數(shù)據(jù)落在各組的概率,發(fā)現(xiàn)數(shù)據(jù)落在第一組[8.11,16.25)的概率最大,分別為0.611102,0.611146,0.611106,并且明顯大于第一和第二組概率,因此本文將分別以概率0.611146和0.611106認為2014和2015年,來海南國際旅游島旅游的港澳游客人數(shù)應介于8.11和16.25萬人次之間。
(四)臺灣同胞
經計算x4中a4=3.32,β4=17.77,組距d4=4.82,分組區(qū)[3.32,8.14),[8.14,12.96),[12.96,17.77],初始狀態(tài)概率分布為P(0)=(0。7222,0。1111,0。1667),m步轉移概率矩陣分別為:
P(1)=(0.7222,0.0 556,0.2222) ,
P(2)=(0.7406,0.0556,0.2038),
P(3)=(0.7515,0.0570,0.1915) .
數(shù)據(jù)分析:觀察P(1),P(2) 和P(3)中數(shù)據(jù)落在各組的概率,發(fā)現(xiàn)數(shù)據(jù)落在第一組[3.32,8.14)的概率最大,分別為0.7222,0.7406,0.7515,并且明顯大于第一和第二組概率,因此本文將分別以概率0.7406和0.7515認為2014和2015年,來海南國際旅游島旅游的臺灣游客人數(shù)應介于3.32和8.14萬人次之間。
(五)總人數(shù)
經計算x5中a5=361.01 ,β5=3320.37,組距d5=986.45,分組區(qū)間為[361.01,1347.46)[1347.46,23 33.91),[2333.91,33 2037]。初始狀態(tài)概率分布為P(0)=(0.5,0.3333,0.1667),m步轉移概率矩陣分別為:
所以m時瞬時概率分布分別為:
P(1)=(0.4444,0.3 333,0.2223),
P(2)=(0.3951,0.3271,0.2778)
P(3)=(0.3512,0.3164,0.3324) 。
數(shù)據(jù)分析:觀察P(1),P(2) 和P(3)中數(shù)據(jù)落在各組的概率,發(fā)現(xiàn)數(shù)據(jù)落在第一組[361.01,1347.46)的概率最大,分別為0.4444,0.3951和0.3512。但是從逐年發(fā)展趨勢看,數(shù)據(jù)落在第一組和第二組的概率都是逐年減少,而數(shù)據(jù)落在第三組[2333.91,33 20.37]的概率是逐年增大的,分別為0.2223,0.2778和0.3324。再觀察表1,從2003年起,來海南旅游的總人數(shù)是逐年遞增的,因此本文認為2014和2015年,來海南國際旅游島旅游的總人數(shù)應多于2333.91萬人次。
通過對數(shù)據(jù)分析發(fā)現(xiàn),對于各年波動較大的數(shù)據(jù)組,應用馬爾可夫鏈進行預測,發(fā)生的概率還是很大的,如對港澳同胞與臺灣同胞的預測,分別大于0.6和0.7,因此應用馬爾可夫鏈對于這類波動較大的旅客流進行預測具有較大的指導價值和應用價值。但是對于逐年遞增的數(shù)據(jù)組,如國內旅游者與旅游總人數(shù)的預測,發(fā)生的概率較小,僅0.3左右,意義不是太大.實際上,通過圖1的散點圖發(fā)現(xiàn),這兩類數(shù)據(jù)接近直線上升趨勢,因此,可建立線性回歸模型進行預測。
對于國內旅游者,利用SPSS軟件可得(表2),相關系數(shù)R=0.965,擬合優(yōu)度檢驗R2=0.931,截距a=-294880.496,回歸系數(shù)b=147.923,線性回歸方程為y=147.923x-294880.496。誤差自由度dfE=18-1-1=16,回歸系數(shù)檢驗統(tǒng)計量t=14.717>2.921=t0.01(16),所以P<0.01,回歸方程非常顯著【5】。于是可用線性回歸方程進行預測:當x=2014時,y=3036.426; 當x=2015時,y=3184.349.即可預測2014與2015年來海南國際旅游島旅游的國內旅客流分別為3036.426萬人次與3184.349萬人次。
表2 國內旅游者數(shù)據(jù)回歸分析模型匯總
a.預測變量:(常量),年度*
系數(shù)a
a.因變量:國內旅游人數(shù)
對于旅游總人數(shù),利用SPSS軟件可得(表3),相關系數(shù)R=0.965,擬合優(yōu)度檢驗R2=0.932,截距a=-300604.949,回歸系數(shù)b=150.806,線性回歸方程為y=150.806x-300604.949。誤差自由度dfE=18-1-1=16,回歸系數(shù)檢驗統(tǒng)計量t=14.761>2.921=t0.01(16),所以P<0.01,回歸方程非常顯著【5】。于是可用線性回歸方程進行預測:當x=2014時,y=3118.335; 當x=2015時,y=3269.141。即可預測2014與2015年來海南國際旅游島旅游的總人數(shù)分別為3118.335萬人次與3269.141萬人次。
表3 旅游總人數(shù)回歸分析模型匯總
a.預測變量:(常量),年度*
系數(shù)a
a.因變量:總人數(shù)
海南建設國際旅游島各項工作正在如火如荼地推進中,對未來來島人數(shù)預測意義重大。文中對于波動較大的數(shù)據(jù)應用馬氏鏈構造動態(tài)模型對旅客流進行預測,對于接近直線上升的數(shù)據(jù),建立線性回歸模型進行預測,科學可靠,不僅對未來來海南國際旅游島旅游的人數(shù)預測有用,對于其他城市、景點旅游人數(shù)預測也同樣具有參考價值。
致謝:感謝中山大學郭先平教授的悉心指導!
[1]林元烈.應用隨機過程[M].北京:清華大學出版社,2002.
[2]靳巧花,李帥彪,張彬彬.基于灰色動態(tài)模型的麗江旅游人數(shù)預測研究[J].數(shù)學的實踐與認識,2012(22).
[3]陳鵬,吳玲,宋徽.基于ARIMA模型的安徽省入境旅游人數(shù)預測[J].安徽農業(yè)大學學報(社會科學版),2012(1).
[4]海南省統(tǒng)計局網站[EB/OL].http://www.hi.stats.gov.cn/.
[5]王景英.教育統(tǒng)計學[M].北京:高等教育出版社,2010.
(責任編輯:李 芬)
Prediction of Tourist Flow Based on Markov Chain Model —A Case Study of Hainan International Tourism Island
FU Fang-jian ,CHEN Fu-chuan
(Department of Mathematics and Physics ,Qiongtai Teachers College,Haikou 571100,China)
This article takes Hainan International Tourism Island as case,applies Markov Chain to construct a dynamic model for tourist flow,and further predicts the number of tourists in years.This work will be beneficial for preparing infrastructure in Hainan in the progress of the construction of Hainan International Tourism Island.
Markov chain; transition probability; Hainan international tourism island; number of tourists.
2015-03-11
符方健,男,漢族,海南瓊海人。海南瓊臺師范高等專科學校數(shù)理系教授。主要研究方向:概率與統(tǒng)計理論;通訊作者:陳福川,男,漢族,海南萬寧人。海南瓊臺師范高等專科學校數(shù)理系副教授。主要研究方向:高等數(shù)學教學。
海南省自然科學基金項目“云進化策略方法及其應用研究”(編號:114013)成果之一;瓊臺師范高等專科學校教育教學改革研究項目“《概率統(tǒng)計》教學內容、方法與手段改革研究”(編號:QTJY201301)成果之一。2015年第1期
F224
A
1009-9743(2015)01-0049-05
10.13803/j.cnki.issn1009-9743.2015.01.012