王文祎 徐健 陳玉金 劉佳瀅 謝佳寧 袁露露 童路琳
摘 要:隨著互聯(lián)網(wǎng)及大數(shù)據(jù)技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)數(shù)據(jù)成為現(xiàn)代旅游業(yè)旅游需求精準(zhǔn)分析及預(yù)測的重要數(shù)據(jù)基礎(chǔ)。旅游需求分析迫切需要實(shí)時(shí)準(zhǔn)確的數(shù)據(jù),因此本文以北京為例,結(jié)合百度指數(shù)及資訊指數(shù),對(duì)北京游客旅游需求的時(shí)空特征進(jìn)行深入研究,首先闡述國內(nèi)外學(xué)者對(duì)互聯(lián)網(wǎng)搜索數(shù)據(jù)應(yīng)用于旅游需求分析的研究情況,其次基于百度指數(shù)進(jìn)行旅游需求的時(shí)間特征研究,再次基于百度指數(shù)進(jìn)行空間特征研究,最后綜合大數(shù)據(jù)分析結(jié)果,旨在為當(dāng)前時(shí)代旅游目的地的建設(shè)和發(fā)展提供參考。
關(guān)鍵詞:網(wǎng)絡(luò)數(shù)據(jù);旅游需求;時(shí)空特征;北京
中圖分類號(hào):F592.7 文獻(xiàn)標(biāo)識(shí)碼:A
改革開放以來,隨著人民物質(zhì)生活水平的提高,人們現(xiàn)在越來越追求精神生活的充盈,旅游成為人們?nèi)粘I畹闹匾糠?,人們?duì)旅游的需求也日益高漲。旅游的重要意義在于,一方面,能夠開闊視野,增長見識(shí),提升自己;另一方面,旅游也可以增強(qiáng)自身的自主性,更有動(dòng)力追求美好生活,旅游還能讓人心情愉悅,放松自我,調(diào)節(jié)情緒。旅游已經(jīng)成為一項(xiàng)重要的產(chǎn)業(yè),也成為一門專業(yè)的學(xué)科,現(xiàn)階段對(duì)于旅游需求的研究也非常豐富,對(duì)旅游需求進(jìn)行及時(shí)和準(zhǔn)確的分析,一直是旅游管理專業(yè)的重要研究課題。研究旅游需求的時(shí)空特征,有助于旅游管理部門建立對(duì)旅游目的地承載量及游客流量的預(yù)期判斷,根據(jù)分析結(jié)果及時(shí)制定相應(yīng)的政策,從而為旅游目的地的管理提供支持。
北京作為中國的首都,有著悠久的革命歷史傳統(tǒng),擁有豐富的旅游資源,長期有著旺盛的旅游市場需求。傳統(tǒng)的旅游管理研究以定性研究為主,而以數(shù)據(jù)為基礎(chǔ)的定量分析較少,并且旅游需求相關(guān)的數(shù)據(jù)一直是以調(diào)研統(tǒng)計(jì)為主,數(shù)據(jù)不夠及時(shí),難以產(chǎn)生市場效益。隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,基于互聯(lián)網(wǎng)產(chǎn)生的大數(shù)據(jù)已經(jīng)成為研究旅游需求時(shí)空特征的重要數(shù)據(jù)來源,這些大數(shù)據(jù)產(chǎn)生于搜索引擎、社交媒體、論壇、新聞等不同的互聯(lián)網(wǎng)平臺(tái),具有數(shù)據(jù)量大、數(shù)據(jù)類型豐富、生成速度快等特點(diǎn),具有較高的經(jīng)濟(jì)價(jià)值,并且互聯(lián)網(wǎng)數(shù)據(jù)能夠有效反映游客真實(shí)的特征及偏好,能夠在時(shí)間和空間維度上進(jìn)行統(tǒng)計(jì)分析,從而真實(shí)及時(shí)地反映旅游需求情況。本文的結(jié)論對(duì)幫助旅游管理部門、旅游企業(yè)以及旅游目的地等主體把握游客的需求走向具有現(xiàn)實(shí)意義。旅游行業(yè)應(yīng)抓住細(xì)節(jié),根據(jù)游客旅游需求的時(shí)空響應(yīng)設(shè)計(jì)更加符合當(dāng)前市場的旅游產(chǎn)品,促進(jìn)旅游業(yè)加快恢復(fù)發(fā)展,為當(dāng)前時(shí)代旅游目的地的建設(shè)和發(fā)展提供參考。
旅游產(chǎn)業(yè)已經(jīng)是成熟的產(chǎn)業(yè),國內(nèi)已經(jīng)有豐富的旅游需求方面的研究,以往的研究主要是基于統(tǒng)計(jì)調(diào)研數(shù)據(jù)為主,利用計(jì)量經(jīng)濟(jì)模型進(jìn)行建模分析,近些年大數(shù)據(jù)技術(shù)發(fā)展突飛猛進(jìn),也有很多學(xué)者運(yùn)用大數(shù)據(jù)建模及機(jī)器學(xué)習(xí)算法來研究旅游需求,預(yù)測精度已經(jīng)大有提升。其中最具有代表性的一類大數(shù)據(jù)是互聯(lián)網(wǎng)搜索數(shù)據(jù),搜索引擎指數(shù)在觀測旅游需求方面有著廣泛應(yīng)用,國外學(xué)者利用谷歌搜索數(shù)據(jù)預(yù)測美國、英國等的旅游流量,利用谷歌指數(shù)預(yù)測入境游客數(shù)量、目的地游客流量及行為,利用天巡網(wǎng)(Skyscanner)的旅客搜索研究航空旅客需求變化等;國內(nèi)學(xué)者利用百度搜索數(shù)據(jù)預(yù)測海南游客流量,證明搜索數(shù)據(jù)在提高旅游預(yù)測精度的表現(xiàn),通過提取百度搜索數(shù)據(jù)構(gòu)建綜合指數(shù)建立廣義動(dòng)態(tài)多因子模型預(yù)測北京旅游需求,利用百度搜索數(shù)據(jù)建立計(jì)量經(jīng)濟(jì)模型,預(yù)測未來旅游流量,并取得了較高的預(yù)測精度[1-2]。作為搜索引擎的數(shù)據(jù)源之一,百度指數(shù)提供從2006年至2015年的百度查詢量數(shù)據(jù),而且在預(yù)測中國旅游需求時(shí)有著比谷歌數(shù)據(jù)更高的準(zhǔn)確性[3]。
與旅游需求相關(guān)的旅游業(yè)動(dòng)態(tài)發(fā)展受到廣大學(xué)者的密切關(guān)注,多數(shù)文獻(xiàn)基于問卷調(diào)查和理論研究,網(wǎng)絡(luò)數(shù)據(jù)的應(yīng)用已經(jīng)有豐富的成果,但是仍然有巨大的發(fā)展空間。因此,本文意圖引入百度指數(shù)數(shù)據(jù),以北京旅游為案例宏觀分析旅游需求的時(shí)空特征,微觀解析游客在不同時(shí)空特征環(huán)境下的情緒變化,對(duì)其進(jìn)行更深度的數(shù)據(jù)挖掘,就游客響應(yīng)給出更具準(zhǔn)確性和針對(duì)性的答案。
(一)研究背景
北京人口密度大、人員流動(dòng)性強(qiáng),旅游業(yè)發(fā)達(dá),旅游資源豐富。北京有世界遺產(chǎn)共7處,是全球擁有世界遺產(chǎn)最多的城市,也是全球首個(gè)擁有世界地質(zhì)公園的首都城市。北京對(duì)外開放的旅游景點(diǎn)達(dá)200多處,有世界上最大的皇宮紫禁城、祭天神廟天壇、皇家園林北海公園、頤和園和圓明園,還有八達(dá)嶺長城、慕田峪長城以及世界上最大的四合院恭王府等名勝古跡。北京市共有文物古跡7 309項(xiàng),99處全國重點(diǎn)文物保護(hù)單位(含長城和京杭大運(yùn)河的北京段)、326處市級(jí)文物保護(hù)單位、5處國家地質(zhì)公園、15處國家森林公園[4]。本文選用反映不同關(guān)鍵詞在過去一段時(shí)間里的“用戶關(guān)注度”和“媒體關(guān)注度”兩個(gè)指標(biāo)進(jìn)行統(tǒng)計(jì)分析,對(duì)北京的旅游需求在時(shí)間、空間上的特征研究提供合理依據(jù),利用百度指數(shù)探討不同層面對(duì)旅游需求的時(shí)空特征,從而更好地對(duì)旅游目的地進(jìn)行管理。
(二)數(shù)據(jù)處理
從北京文旅局發(fā)布的開放景區(qū)名單(截至2021年6月26日)中挑選了所有的5A及4A景點(diǎn),以景點(diǎn)名稱為關(guān)鍵詞在百度指數(shù)庫中搜索,獲得了55個(gè)景點(diǎn)的2019年和2020年的百度指數(shù)數(shù)據(jù)。首先利用SPSS統(tǒng)計(jì)分析軟件,分析旅游需求的時(shí)間分布,接著將所得的逗號(hào)分隔值(Comma-Separated Values,CSV,有時(shí)也稱為字符分隔值,因?yàn)榉指糇址部梢圆皇嵌禾?hào))格式數(shù)據(jù)導(dǎo)入ArcMap中,依據(jù)經(jīng)緯度進(jìn)行空間插值,對(duì)各時(shí)段內(nèi)搜索指數(shù)增減進(jìn)行分析,探究旅游需求的空間分布格局。
研究選取百度搜索的初始數(shù)據(jù),利用Python(計(jì)算機(jī)編程語言)提取出所需要的數(shù)據(jù)并存儲(chǔ),通過數(shù)據(jù)分析來得到所需的結(jié)論,如圖1所示。
(一)基于百度指數(shù)的時(shí)間特征研究
為了更加直觀地觀察北京市游客的旅游需求狀態(tài),本文基于百度指數(shù),運(yùn)用SPSS進(jìn)行描述性分析、方差分析和回歸分析,探索北京市游客旅游需求的時(shí)間響應(yīng)。研究近十年(2011年8月至2021年9月)北京旅游關(guān)鍵詞百度指數(shù)變化,揭示百度搜索與北京市游客旅游需求的特征狀況和相關(guān)關(guān)系(見表1)。
1.結(jié)構(gòu)特征
利用Python獲取基于北京市旅游關(guān)鍵詞的百度搜索指數(shù),由于百度指數(shù)的標(biāo)準(zhǔn)差較大,為避免異方差,對(duì)百度指數(shù)取自然對(duì)數(shù)作為分析數(shù)據(jù):
對(duì)2011年8月至2021年9月十年的北京旅游關(guān)鍵詞百度搜索指數(shù)作折線圖進(jìn)行分析(見圖2),得出以下結(jié)論:第一,百度搜索指數(shù)總體呈現(xiàn)明顯的周期特征,呈現(xiàn)峰谷震蕩形態(tài),大高峰出現(xiàn)在小長假期間,分別是清明節(jié)、勞動(dòng)節(jié)、端午節(jié)、暑假開始和國慶節(jié),搜索數(shù)據(jù)序列的小高峰主要出現(xiàn)在周五,搜索數(shù)據(jù)的低谷出現(xiàn)在周日,搜索數(shù)據(jù)所呈現(xiàn)的特點(diǎn)正呼應(yīng)了北京游客周末旅游為主,工作日游客數(shù)量較少的特點(diǎn),旅游需求符合北京春天和秋天的天氣較為適合出行的基本規(guī)律;第二,2011年至2016年這五年,北京旅游的百度指數(shù)較活躍維持在高位,游客的旅游需求旺盛,旅游業(yè)發(fā)展繁榮,2019年至2021年這三年,北京旅游的百度指數(shù)較活躍,維持在高位,2020年以來一直低于平均線,旅游需求明顯降低;第三,資訊指數(shù)是以百度智能分發(fā)和推薦內(nèi)容數(shù)據(jù)為基礎(chǔ),將網(wǎng)民的閱讀、評(píng)論、轉(zhuǎn)發(fā)、點(diǎn)贊、不喜歡等行為的數(shù)量加權(quán)求和得出,由2019年至2020年北京旅游關(guān)鍵詞的百度資訊指數(shù)圖分析可知(見圖3),2019年初資訊指數(shù)較高,說明該階段旅游需求旺盛,此后大幅降低,一直在低位震蕩,到2021年初稍有恢復(fù)。
2.差異性特征
影響旅游需求的一個(gè)重要因素是季節(jié),為了解不同季節(jié)對(duì)于百度指數(shù)的不同影響程度,對(duì)百度指數(shù)進(jìn)行方差分析。
數(shù)據(jù)顯示,不同時(shí)期樣本對(duì)于ln百度指數(shù)均呈現(xiàn)為顯著性(P<0.05)。以上結(jié)果證明,季節(jié)對(duì)北京游客旅游需求百度指數(shù)存在顯著的影響,即夏天和冬天氣候條件不夠好,使得民眾降低了旅游意愿,旅游需求低;春天和秋天氣候條件好,使得民眾提高了旅游意愿,旅游需求高。具體影響程度為:春天>秋天>夏天>冬天。
3.影響因素
為進(jìn)一步了解天氣舒適等級(jí)、景區(qū)類型等變量對(duì)百度指數(shù)的影響程度,研究用以上因子作為自變量,ln百度指數(shù)作為因變量進(jìn)行多元線性回歸分析,結(jié)果表明,回歸模型具有顯著的統(tǒng)計(jì)學(xué)意義(F=734.659,P<0.001)
由表3分析可得,天氣舒適等級(jí)、人文景觀類景區(qū)均會(huì)對(duì)ln百度指數(shù)產(chǎn)生顯著的正向影響關(guān)系。娛樂休閑類景區(qū)對(duì)ln百度指數(shù)產(chǎn)生顯著的負(fù)向影響關(guān)系。由此可知,人們?cè)谕獬雎糜螘r(shí)會(huì)充分考慮天氣舒適程度,人文景觀類景區(qū)較自娛樂休閑類景區(qū)對(duì)百度指數(shù)有促進(jìn)作用。
(二)基于百度指數(shù)的空間特征研究
為了研究從空間分布上的全國游客對(duì)北京旅游關(guān)鍵詞的搜索指數(shù)特征,根據(jù)百度用戶對(duì)北京旅游的搜索數(shù)據(jù),采用數(shù)據(jù)挖掘方法,對(duì)關(guān)鍵詞的人群屬性進(jìn)行聚類分析,給出2013年7月至2021年9月用戶所屬的省份、城市,以及城市級(jí)別的分布與排名。北京旅游關(guān)鍵詞搜索排名前三的省份或城市依次是北京市、河北省、廣東省,北京人口眾多,對(duì)于北京本地的旅游需求更旺盛,對(duì)于北京本地的景點(diǎn)更加關(guān)注,因此搜索指數(shù)最高;此外,由于河北省毗鄰北京,對(duì)于北京的旅游資源更感興趣,搜索指數(shù)排第二;廣東省經(jīng)濟(jì)發(fā)達(dá)且人口眾多,當(dāng)?shù)鼐用裼懈嗟慕疱X和精力可以用于旅游,提升生活品質(zhì),因此對(duì)于北京旅游的搜索也非常關(guān)注。2013年7月至2021年9月的北京旅游關(guān)鍵詞的搜索指數(shù)在華北區(qū)域占比最高,華東區(qū)占比第二,而西北區(qū)占比最低,西南區(qū)占比次低,究其原因,距離因素是影響北京旅游需求空間特征分布的主要原因,距離較近的區(qū)域?qū)τ诒本┞糜涡枨蟾ⅲ淮我蚴桥c所在區(qū)域的經(jīng)濟(jì)發(fā)展水平相關(guān),經(jīng)濟(jì)發(fā)展水平高的區(qū)域?qū)τ诒本┞糜蔚男枨蟾?;此外,與區(qū)域文化差異水平、人口數(shù)量、當(dāng)?shù)芈糜钨Y源、當(dāng)?shù)芈糜螛I(yè)發(fā)展水平等因素也息息相關(guān)。
選取北京市作為研究區(qū)域,搜集2011年8月至2021年9月的百度搜索指數(shù)以及資訊指數(shù),探索基于網(wǎng)絡(luò)數(shù)據(jù)分析旅游需求的時(shí)空特征研究,以更好地把握游客的需求走向,為今后北京乃至全國旅游業(yè)的建設(shè)和發(fā)展提供參考依據(jù)。 通過時(shí)間特征分析可知:一是旅游需求呈現(xiàn)明顯的周期特征,隨著假期峰谷波動(dòng),二是2011年起的5年內(nèi),旅游需求旺盛,旅游業(yè)發(fā)展繁榮,近3年因外界因素旅游需求低迷,三是近3年北京旅游百度咨詢指數(shù)初期高末期低,具有明顯的時(shí)間差異,春天和秋天旅游需求旺盛,夏天和冬天旅游需求較低,受季節(jié)影響因素顯著。在空間響應(yīng)方面,研究運(yùn)用地理信息系統(tǒng)(Geographic Information System,GIS)進(jìn)行反距離空間插值,對(duì)北京景區(qū)的百度指數(shù)關(guān)注度做可視化處理,對(duì)各景點(diǎn)進(jìn)行熱點(diǎn)分析,得出以下結(jié)論。一是對(duì)于北京旅游的需求,北京市、河北省、廣東省三個(gè)省市排名前三;二是對(duì)于北京旅游的需求華北區(qū)域占比最高,華東區(qū)占比第二,而西北區(qū)占比最低,西南區(qū)占比次低,北京旅游需求與北京的距離、區(qū)域經(jīng)濟(jì)發(fā)展水平、區(qū)域文化差異水平、人口數(shù)量、當(dāng)?shù)芈糜钨Y源、當(dāng)?shù)芈糜螛I(yè)發(fā)展水平等因素息息相關(guān)[5]。
除了時(shí)空特征對(duì)游客的影響之外,還有很多其他的復(fù)雜影響因素,本文限于篇幅未能詳細(xì)闡述分析,仍存在許多問題與不足。由于數(shù)據(jù)來源的局限,本文僅選取了北京旅游這一關(guān)鍵詞的百度指數(shù),然而與北京旅游相關(guān)的關(guān)鍵詞還有很多,未來可結(jié)合調(diào)查問卷等方法獲取更多樣化的數(shù)據(jù),選取更大的研究范圍,進(jìn)行更加全面、更加具有代表性的時(shí)空響應(yīng)分析。
[1] 李曉炫,呂本富,曾鵬志,等.基于網(wǎng)絡(luò)搜索和CLSIEMD-BP的旅游客流量預(yù)測研究[J].系統(tǒng)工程理論與實(shí)踐,2017(1):106-118.
[2] 中國互聯(lián)網(wǎng)信息中心.第43次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[R],北京:國家圖書館研究院,2019.
[3] 張曉梅,程紹文,劉曉蕾,等.古城旅游地網(wǎng)絡(luò)關(guān)注度時(shí)空特征及其影響因素:以平遙古城為例[J].經(jīng)濟(jì)地理,2016(7):196-202.
[4] 李山,邱榮旭,陳玲.基于百度指數(shù)的旅游景區(qū)網(wǎng)絡(luò)空間關(guān)注度:時(shí)間分布及其前兆效應(yīng)[J].地理與地理信息科學(xué),2008(6):102-107.
[5] 李新,張珣.互聯(lián)網(wǎng)搜索指數(shù)構(gòu)建新方法及國際油價(jià)實(shí)證研究[J].系統(tǒng)工程理論與實(shí)踐,2016(2):319-325.