高 爽 盛宇飛
(1.湖北商貿(mào)學(xué)院 經(jīng)濟(jì)學(xué)院,湖北 武漢 430000;2.河南開封科技傳媒學(xué)院 經(jīng)濟(jì)學(xué)院,河南 開封 475001)
如今,旅游成為大眾休閑娛樂的常見方式之一。近年來,中國(guó)旅游業(yè)規(guī)模不斷擴(kuò)大,游客量顯著增加。然而,新冠肺炎疫情的暴發(fā)和蔓延對(duì)旅游業(yè)造成了巨大沖擊。因此,建立高精度的旅游需求模型,對(duì)旅游量進(jìn)行科學(xué)預(yù)測(cè),不僅可以保證資源的高效配置和優(yōu)質(zhì)服務(wù),而且有助于快速調(diào)整旅游服務(wù)的供給,避免供需不平衡(夏杰和豐曉旭,2020)[1]。
大數(shù)據(jù)背景下,互聯(lián)網(wǎng)廣泛運(yùn)用,人們?cè)诼糜吻暗乃阉餍袨橐约皩?duì)目的地的關(guān)注度,直接與旅游地區(qū)的需求緊密相關(guān)。如游客搜索地圖、住宿、景點(diǎn)信息以及天氣信息等,這些出行信息的搜索行為反映出用戶的旅游需求。因此,網(wǎng)絡(luò)搜索數(shù)據(jù)為預(yù)測(cè)旅游需求提供依據(jù),已有研究證明網(wǎng)絡(luò)搜索數(shù)據(jù)與旅游需求存在密切關(guān)系。
開封是我國(guó)首批公布的24個(gè)歷史文化名城之一,是河南省沿黃“三點(diǎn)一線”的重要旅游城市,旅游業(yè)非常發(fā)達(dá)。開封擁有全國(guó)重點(diǎn)文物保護(hù)單位7處,河南省文物保護(hù)單位28處,旅游景區(qū)(點(diǎn))22個(gè),文化資源優(yōu)勢(shì)突出。近年來,開封旅游業(yè)呈現(xiàn)出較好的發(fā)展勢(shì)頭,旅游接待人數(shù)逐年增長(zhǎng)(程遂營(yíng),2006)[2]。2020年新冠疫情暴發(fā)后,旅游接待人數(shù)有所下降(見圖1)。數(shù)據(jù)顯示,2021年五一期間,開封旅游接待總量589萬人次,總量超過了洛陽。此外,開封旅游業(yè)是開封經(jīng)濟(jì)發(fā)展的支柱產(chǎn)業(yè)之一,其旅游業(yè)的發(fā)展程度與經(jīng)濟(jì)發(fā)展有著緊密聯(lián)系,對(duì)經(jīng)濟(jì)高質(zhì)量發(fā)展有重要的推動(dòng)作用。綜上,為了獲得更高的經(jīng)濟(jì)效益,開封建立高效的旅游需求預(yù)測(cè)模型顯得尤為重要。
圖1 2007—2020年開封市旅游接待總?cè)藬?shù)
旅游需求研究一直是旅游領(lǐng)域的重要研究課題。目前關(guān)于旅游需求的預(yù)測(cè)已有不少研究,早期學(xué)者主要利用時(shí)間序列模型。如Box GEP和Jenkins GM(1970)提出利用ARMA模型預(yù)測(cè)旅游需求[3]。Goh C和LawR(2002)利用SARIMA模型預(yù)測(cè)旅游需求[4]。朱曉華和楊秀春等(2005)運(yùn)用灰色預(yù)測(cè)模型對(duì)我國(guó)入境旅游客源進(jìn)行預(yù)測(cè)[5]。隨著對(duì)旅游需求影響因素的不斷研究,不同學(xué)者在預(yù)測(cè)方法上也不斷創(chuàng)新。如賈鵬和劉瑞菊等(2013)利用BP神經(jīng)網(wǎng)絡(luò)構(gòu)建模型預(yù)測(cè)我國(guó)郵輪旅游需求[6]。郭平(2010)對(duì)城市軌道交通客流特征進(jìn)行分析[7]。隨著互聯(lián)網(wǎng)普及,搜索引擎成為獲取信息的重要途徑。相對(duì)宏觀數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)提供更多信息和價(jià)值,已經(jīng)應(yīng)用到很多方面。如利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測(cè)消費(fèi)、房?jī)r(jià)(王岱和劉寬斌等,2019)[8]。已有不少學(xué)者開始利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行旅游需求預(yù)測(cè)。龍茂興和孫根年等(2011)利用百度指數(shù)分析了四川旅游網(wǎng)絡(luò)關(guān)注度與實(shí)際旅游流量的關(guān)系,指出兩者在時(shí)間和空間維度上具有較強(qiáng)的正相關(guān)和高度的相關(guān)性[9]。秦夢(mèng)和劉漢(2019)利用百度指數(shù)預(yù)測(cè)三亞旅游需求[10]??傮w看,國(guó)內(nèi)關(guān)于旅游網(wǎng)絡(luò)搜索數(shù)據(jù)的研究還處于起步階段。從使用預(yù)測(cè)模型看,主要是時(shí)間序列模型,而旅游需求預(yù)測(cè)中會(huì)涉及多個(gè)方面、多個(gè)關(guān)鍵詞,彼此之間的關(guān)系錯(cuò)綜復(fù)雜,所以選擇合適的模型進(jìn)行預(yù)測(cè)是亟待思考的問題。
互聯(lián)網(wǎng)的快速發(fā)展,深刻影響著人們生活的各個(gè)方面。旅行前,大多數(shù)旅行者會(huì)使用搜索引擎查尋相關(guān)信息,然后做出旅行決定,因此通過獲取游客出行前的網(wǎng)絡(luò)搜索數(shù)據(jù),預(yù)測(cè)其之后的旅游活動(dòng)成為互聯(lián)網(wǎng)時(shí)代探究旅游出行特征的新方法。其中百度公司推出的百度指數(shù)就是一種優(yōu)質(zhì)網(wǎng)絡(luò)搜索數(shù)據(jù)的來源。
本文依據(jù)“食”“住”“行”“游”等多個(gè)相關(guān)關(guān)鍵詞描述來汴游客網(wǎng)絡(luò)搜索行為。最終確定選取“開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”四個(gè)關(guān)鍵詞,在百度指數(shù)輸入以上關(guān)鍵詞,得到日搜索量及衡量來汴旅游需求的相關(guān)數(shù)據(jù)。
同時(shí)搜集2020年5月1日—2021年6月30日,共計(jì)426天的“開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”的百度指數(shù)搜索數(shù)據(jù),包括電腦版和移動(dòng)版(見表1)。各關(guān)鍵詞的基本特征值差別較大。其中,“開封旅游景點(diǎn)”的均值、標(biāo)準(zhǔn)差最大,“開封住宿”的均值、標(biāo)準(zhǔn)差最小。
表1 百度指數(shù)——開封旅游關(guān)鍵詞描述統(tǒng)計(jì)
通過2020年5月—2021年6月的“開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”月平均百度指數(shù)可以看出,疫情后來汴旅游需求在不同月內(nèi)呈現(xiàn)差異性(見圖2)。以“開封旅游景點(diǎn)”關(guān)鍵詞的百度指數(shù)看,相對(duì)于2020年,2021年上半年有所增長(zhǎng)。第一高峰出現(xiàn)在2021年春節(jié)期間,第二高峰出現(xiàn)在2021年清明期間。“開封旅游”“開封美食”為關(guān)鍵詞的百度指數(shù)與“開封旅游景點(diǎn)”存在幾乎相同的變化趨勢(shì)。從高峰時(shí)間來看,開封的旅游客流量與百度指數(shù)存在相似變化趨勢(shì)。
圖2 “開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”月內(nèi)百度指數(shù)
將“開封旅游景點(diǎn)”和“開封美食”百度指數(shù)按照周相加,分別得到“開封旅游景點(diǎn)”百度指數(shù)周內(nèi)分布(見圖3)及“開封美食”百度指數(shù)周內(nèi)分布(見圖4)??梢钥闯?,兩個(gè)關(guān)鍵詞的百度指數(shù)周內(nèi)分布趨勢(shì)相似,在周末較高,而工作日較低。其中周六最高。通常來講,若人們利用周末時(shí)間出游,旅程較近,會(huì)出現(xiàn)當(dāng)天出游、當(dāng)天搜索信息的情形。相反,如旅程較遠(yuǎn),人們一般會(huì)在出游前詳細(xì)搜索信息,也就會(huì)在工作日進(jìn)行搜索。從這一點(diǎn)看,開封旅游需求多集中于省內(nèi),停留時(shí)間短。
圖3 “開封旅游景點(diǎn)”周內(nèi)百度指數(shù)
圖4 “開封美食”周內(nèi)百度指數(shù)
為了說明百度指數(shù)搜索數(shù)據(jù)能夠用于預(yù)測(cè)開封旅游需求,使預(yù)測(cè)更加精準(zhǔn),本文搜集2012—2021年百度指數(shù)“開封旅游景點(diǎn)”關(guān)鍵詞的日均值的搜索量數(shù)據(jù),并結(jié)合《河南統(tǒng)計(jì)年鑒》中年度旅游接待量進(jìn)行對(duì)比。發(fā)現(xiàn)實(shí)際接待量與百度指數(shù)對(duì)數(shù)序列變化基本一致(見圖5)。
圖5 百度指數(shù)與實(shí)際接待量年度數(shù)據(jù)對(duì)數(shù)序列對(duì)比圖
本文還搜集了2021年“元旦期間”“清明節(jié)期間”“五一期間”“端午節(jié)期間”等時(shí)期開封旅游實(shí)際接待量(見表2)。并將此數(shù)據(jù)與對(duì)應(yīng)時(shí)期的4個(gè)關(guān)鍵詞百度數(shù)據(jù)進(jìn)行皮爾遜相關(guān)性分析(見表3)。相對(duì)于實(shí)際接待量,“開封旅游”“開封旅游景點(diǎn)”“開封美食”等3個(gè)關(guān)鍵詞表現(xiàn)為極強(qiáng)相關(guān),“開封住宿”表現(xiàn)為強(qiáng)相關(guān)。這也說明開封接待的國(guó)內(nèi)游客以河南省為主,停留時(shí)間較短。
表2 2021年部分假期間開封旅游接待量
表3 關(guān)鍵詞百度指數(shù)與開封實(shí)際客流量的相關(guān)性檢驗(yàn)
綜上,互聯(lián)網(wǎng)快速發(fā)展下,大多數(shù)旅客會(huì)通過搜索引擎進(jìn)行信息搜索。通過選取關(guān)鍵詞“開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”的百度指數(shù),無論是月內(nèi)、周內(nèi)以及節(jié)假日,都能夠反映出來汴旅游實(shí)際需求,表明來汴旅游者的在線搜索行為與最終旅游體驗(yàn)之間存在一定聯(lián)系,也為接下來的需求建模與預(yù)測(cè)奠定基礎(chǔ)。
ARMA模型產(chǎn)生于20世紀(jì)20年代,由統(tǒng)計(jì)學(xué)家Mox和Jenkins提出,包括自回歸模型(AR)和移動(dòng)平均模型(MA)兩部分,是時(shí)間序列分析的重要方法。AR模型和MA模型是ARMA(p,q)模型的兩種特殊情況,若階數(shù) q=0,則為模型 AR(P);若階數(shù) p=0,則為模型MA(q)(張思成,2008)[11]。
根據(jù)上文分析,這里主要選取關(guān)鍵詞“開封旅游景點(diǎn)”和“開封美食”的百度指數(shù)數(shù)據(jù)進(jìn)行建模與預(yù)測(cè)。
1.ARMA模型的平穩(wěn)性檢驗(yàn)
由于使用數(shù)據(jù)具有時(shí)序特征,因此構(gòu)建ARMA模型前,需對(duì)數(shù)據(jù)進(jìn)行單位根檢驗(yàn),確保序列具有平穩(wěn)性。結(jié)果如表4、表5所示?!伴_封旅游景點(diǎn)”和“開封美食”序列都為平穩(wěn)序列。
表4 “開封旅游景點(diǎn)”百度指數(shù)序列單位根檢驗(yàn)
表5 “開封美食”百度指數(shù)序列單位根檢驗(yàn)
2.ARMA模型定階
根據(jù)序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)特征來判斷階數(shù)(圖6、圖7)??梢缘贸鰞蓚€(gè)序列呈現(xiàn)自相關(guān)函數(shù)拖尾,偏自相關(guān)函數(shù)截尾。因此,兩個(gè)序列應(yīng)該采取AR模型來描述動(dòng)態(tài)路徑。其中,“開封旅游景點(diǎn)”序列從第2期開始截尾,建立AR(2)模型;“開封美食”序列從第1期開始截尾,建立AR(1)模型。
圖6 “開封旅游景點(diǎn)”百度指數(shù)序列自相關(guān)函數(shù)圖和偏自相關(guān)圖
圖7 “開封美食”百度指數(shù)序列自相關(guān)函數(shù)圖和偏自相關(guān)圖
3.模型估計(jì)與診斷
由以上分析,分別建立和估計(jì)AR(2)模型、AR(1)模型。將“開封旅游景點(diǎn)”序列用y1t表示,“開封美食”序列用y2t表示。則模型估計(jì)結(jié)果如下:
由公式 4、5 可以觀察到 AR(2)模型、AR(1)模型比較好地?cái)M合了y1t序列和y2t序列,從下面圖8、圖9的回歸方程的殘差序列的相關(guān)圖可以看出不存在序列相關(guān)。
圖8 “開封旅游景點(diǎn)”百度指數(shù)序列方程殘差序列相關(guān)圖
圖9 “開封美食”百度指數(shù)序列方程殘差序列相關(guān)圖
4.模型預(yù)測(cè)
通過以上步驟建立擬合效果顯著、合理的模型,可以根據(jù)原始序列對(duì)未來旅游需求進(jìn)行估計(jì)預(yù)測(cè)。分別利用“開封旅游景點(diǎn)”(y1t)的AR(2)模型和“開封美食”(y2t)的AR(1)模型進(jìn)行預(yù)測(cè),得到未來幾天變化趨勢(shì),預(yù)測(cè)未來旅游需求的具體值。最終將預(yù)測(cè)值與真實(shí)值進(jìn)行對(duì)比,得到相應(yīng)的誤差比(見表6)。兩個(gè)序列在預(yù)測(cè)2021年7月1日—3日時(shí)誤差比均小于0.1,說明建立的模型較為準(zhǔn)確,能夠用于對(duì)來汴旅游需求的預(yù)測(cè)。
表6 預(yù)測(cè)值與真實(shí)值的比較
根據(jù)以上模型,本文利用“開封旅游景點(diǎn)”(y1t)的AR(2)模型和“開封美食”(y2t)的AR(1)模型進(jìn)行預(yù)測(cè)得到未來六個(gè)月的月變化趨勢(shì),預(yù)測(cè)未來開封旅游需求(表7)。數(shù)據(jù)顯示,9月和10月會(huì)出現(xiàn)旅游小高峰,原因一是游客利用中秋節(jié)和國(guó)慶節(jié)的假期時(shí)間,二是這個(gè)季節(jié)氣候適宜,會(huì)促使更多游客出行。
表7 2021年7月至12月的月預(yù)測(cè)值
旅游需求預(yù)測(cè)對(duì)旅游業(yè)從業(yè)者具有非常重要的意義。當(dāng)前互聯(lián)網(wǎng)快速發(fā)展,潛在游客通常會(huì)在出行前通過互聯(lián)網(wǎng)搜索目的地的相關(guān)信息,并以此來安排行程。這些搜索信息在方便游客的同時(shí),更為旅游從業(yè)者提供了解游客潛在需求的機(jī)會(huì),有利于其提高旅游服務(wù)質(zhì)量,更好推動(dòng)經(jīng)濟(jì)發(fā)展。相對(duì)于傳統(tǒng)數(shù)據(jù),這些搜索數(shù)據(jù)更加微觀、準(zhǔn)確。
本文首先依據(jù)“食”“住”“行”“游”等因素,用百度指數(shù)構(gòu)建來汴旅游需求的4個(gè)關(guān)鍵詞——“開封旅游”“開封旅游景點(diǎn)”“開封住宿”“開封美食”,搜集426天的日搜索數(shù)據(jù),用此數(shù)據(jù)反映來汴旅游需求情況。為了更好說明數(shù)據(jù)的代表性,分別通過分析月內(nèi)、周內(nèi)以及節(jié)假日的實(shí)際需求,進(jìn)而說明來汴旅游者的在線搜索行為與最終旅游體驗(yàn)之間存在一定聯(lián)系。其次,選取具有代表性的2個(gè)關(guān)鍵詞——“開封旅游景點(diǎn)”和“開封美食”,通過相關(guān)序列構(gòu)建AR模型并進(jìn)行預(yù)測(cè),發(fā)現(xiàn)誤差較低,從而得出建立的模型較為準(zhǔn)確,能夠用于來汴旅游需求預(yù)測(cè)的結(jié)論。
值得說明的是,本文提出的基于百度指數(shù)對(duì)旅游需求建模,現(xiàn)有研究多集中于討論有實(shí)際游客量的地區(qū)。雖然對(duì)于開封地區(qū)未能找到每日實(shí)際游客量,但是使用模型仍有一定的意義(任歡和劉婷等,2020)[12]。用網(wǎng)絡(luò)搜索引擎搜索信息,體現(xiàn)的是信息需求行為,反映了使用者的關(guān)注度。所以本文用百度指數(shù)反映旅游需求不僅可以了解旅客對(duì)來汴旅游的需求變化,還可以反映該地區(qū)的網(wǎng)絡(luò)關(guān)注度等。同時(shí),微博、小紅書、大眾點(diǎn)評(píng)等社交平臺(tái)也是信息載體,人們?cè)谏缃痪W(wǎng)站上表達(dá)觀點(diǎn),對(duì)某產(chǎn)品和景點(diǎn)的評(píng)價(jià)等所體現(xiàn)的是信息供給行為,所以未來的研究可以從多平臺(tái)角度入手,對(duì)互聯(lián)網(wǎng)信息內(nèi)容進(jìn)行計(jì)量分析,獲得游客的觀點(diǎn)、評(píng)價(jià)以及行為,進(jìn)一步推動(dòng)和豐富互聯(lián)網(wǎng)大數(shù)據(jù)的旅游規(guī)模預(yù)測(cè)研究。
通過百度指數(shù)反映的來汴旅游需求。首先,可以看出其總體網(wǎng)絡(luò)關(guān)注度不太高,以“清明上河園”和“少林寺”兩個(gè)搜索關(guān)鍵詞為例,2020年5月—2021年6月的月均值分別為1245和3037,網(wǎng)民對(duì)兩個(gè)景點(diǎn)的關(guān)注度差別較大。所以,提高開封旅游景點(diǎn)的網(wǎng)絡(luò)關(guān)注度顯得尤為重要。其次,從“開封住宿”“開封美食”這兩個(gè)關(guān)鍵詞可以看出游客在汴滯留時(shí)間較短。由此,可以通過增加免費(fèi)景點(diǎn)、提高旅游服務(wù)質(zhì)量、提升旅游價(jià)值等方法,進(jìn)一步吸引外省旅客、延長(zhǎng)滯留時(shí)間,增加相關(guān)產(chǎn)業(yè)收入。
受疫情影響,旅游發(fā)展受挫,這也要求景區(qū)應(yīng)做好預(yù)案,做好分流與防控,避免出現(xiàn)擁擠扎堆現(xiàn)象。同時(shí)提高公共基礎(chǔ)設(shè)施水平,完善相關(guān)安全衛(wèi)生措施,給游客提供安全健康的旅游環(huán)境。
統(tǒng)計(jì)理論與實(shí)踐2021年11期