李 莼 曹艷姣 呂本富
基于網(wǎng)絡(luò)搜索指數(shù)的游客人數(shù)預(yù)測研究
——以新疆阿勒泰冰雪旅游為例
李 莼 曹艷姣 呂本富
文章主要對新疆阿勒泰地區(qū)的旅游需求進(jìn)行預(yù)測。通過選取影響阿勒泰地區(qū)旅游人數(shù)的影響因子建模,采用網(wǎng)絡(luò)搜索指數(shù)合成方法對旅游人數(shù)進(jìn)行預(yù)測,得到2013年9~12月的旅游人數(shù)預(yù)測數(shù)據(jù),較之傳統(tǒng)的時間序列模型,預(yù)測精度有一定的改進(jìn)。
影響因素 網(wǎng)絡(luò)搜索 旅游人數(shù)預(yù)測
從研究方法的角度來看,國內(nèi)對旅游需求的預(yù)測多采用時間序列的分析方法,較少使用計(jì)量模型進(jìn)行影響因素分析。所謂時間序列的分析是指以時間序列反映的社會經(jīng)濟(jì)現(xiàn)象的發(fā)展過程和規(guī)律性進(jìn)行引伸外推,進(jìn)而預(yù)測其發(fā)展趨勢。由于此方法并不考慮造成這種趨勢的內(nèi)在原因,一般不作為政策評價(jià)的依據(jù)。計(jì)量模型是基于回歸理論估計(jì)旅游需求及其決定因素之間的定量關(guān)系,其模型的構(gòu)建有著比較嚴(yán)格的理論基礎(chǔ),在一定程度上可以解釋旅游需求變化的原因,能夠?yàn)橹贫糜谓?jīng)濟(jì)政策提供決策依據(jù)。文章通過建立新疆各地區(qū)旅游人數(shù)影響因素的計(jì)量模型,借鑒得到?jīng)Q定阿勒泰旅游需求的主要影響因素,對阿勒泰地區(qū)的旅游需求進(jìn)行預(yù)測。
結(jié)合阿勒泰地區(qū)的實(shí)際情況,本文選擇的自變量包括如下維度:旅游質(zhì)量、旅游價(jià)格、替代價(jià)格、收入、特殊事件的虛擬變量、滯后一期變量(滯后因變量和自變量)、收入的平方項(xiàng)、交叉項(xiàng)等。考慮到數(shù)據(jù)的可獲得性,因變量選取新疆14個地州和烏魯木齊市2008~2012年的旅游接待人數(shù),經(jīng)過對模型不斷調(diào)整,最終得到模型(如表1)。
模型含有10個自變量,由表1可以看到,模型調(diào)整后R2為0.881,F(xiàn)值為80.440,F(xiàn)檢驗(yàn)通過,表明模型自變量的各個因素對阿勒泰地區(qū)的旅游人數(shù)有影響。模型的設(shè)定置信水平=5%,在此水平下,模型中自變量前的系數(shù)除去全疆高速公路里程、特殊事件(負(fù)向)兩個變量外,全部通過顯著性檢驗(yàn),P值幾乎都為0.000,且各變量前的符號與預(yù)期相符。
A級以上旅游景區(qū)個數(shù)變量前的系數(shù)顯著為正,說明A級以上旅游景區(qū)個數(shù)作為旅游質(zhì)量的一個重要組成部分,是影響人們出游的重要因素。在其他因素不變的情況下,旅游景區(qū)質(zhì)量越好,吸引到該地的游客越多。距離與A級以上旅游景區(qū)個數(shù)的交叉項(xiàng)系數(shù)顯著為正,說明與烏魯木齊距離受到目的地A級以上旅游景區(qū)個數(shù)的正向調(diào)節(jié)。目的地A級以上旅游景區(qū)個數(shù)作為調(diào)節(jié)變量對與烏魯木齊距離這個變量施加了正向影響。盡管與烏魯木齊距離變量前的系數(shù)顯著為負(fù),但是交叉項(xiàng)因調(diào)節(jié)變量對旅游需求的正向影響而顯示系數(shù)為正。由此可以得到旅游質(zhì)量是影響阿勒泰地區(qū)旅游業(yè)發(fā)展的重要因素,應(yīng)當(dāng)充分挖掘當(dāng)?shù)靥厣Y源,形成特色旅游產(chǎn)業(yè)鏈。
表1 模型最終結(jié)果
全疆高速公路里程變量沒有通過顯著性檢驗(yàn)。
與烏魯木齊距離變量前的系數(shù)顯著為負(fù),說明距離是影響人們出游的一個重要因素。在其他因素不變的情況下,距離烏魯木齊越遠(yuǎn),到該地的旅游人數(shù)越少。由此可以得到阿勒泰旅游業(yè)的健康發(fā)展需要道路交通設(shè)施的不斷完善及營造有利于游客觀光游覽等出行的便利條件。
旅游知名度前的系數(shù)顯著為正,說明目的地的知名度是影響人們出游的重要因素。在其他因素不變的情況下,目的地知名度越高,吸引到該地的游客越多。由此可以得到加強(qiáng)阿勒泰地區(qū)的宣傳力度有助于阿勒泰旅游產(chǎn)業(yè)的發(fā)展。阿勒泰地區(qū)旅游知名度的提高有賴于當(dāng)?shù)靥厣穆糜钨Y源、良好的服務(wù)水平和有效的宣傳手段。
全國人均可支配收入的平方項(xiàng)系數(shù)顯著說明人均收入對旅游業(yè)的影響是存在二次曲線相關(guān)的。新疆城鎮(zhèn)居民消費(fèi)指數(shù)變量前沒有通過顯著性檢驗(yàn)。
特殊事件通過設(shè)定兩個虛擬變量來實(shí)現(xiàn)。特殊事件(正向)指當(dāng)發(fā)生對旅游人數(shù)有推動作用的事件時,該變量取值為1,其余情況變量取值為0;特殊事件(負(fù)向)指當(dāng)發(fā)生對旅游人數(shù)有阻礙作用的事件時,該變量取值為1,其余情況變量取值為0。特殊事件基本不可預(yù)測。正向特殊事件變量前的系數(shù)顯著為正說明大型賽事等對阿勒泰地區(qū)旅游發(fā)展有促進(jìn)作用,負(fù)向特殊事件變量前的系數(shù)統(tǒng)計(jì)不顯著。
滯后一期旅游人數(shù)變量前的系數(shù)為正,說明阿勒泰地區(qū)旅游人數(shù)存在周期波動,前一期因變量會對后一期的因變量有正向影響。
本文采用網(wǎng)絡(luò)搜索指數(shù)合成方法對阿勒泰地區(qū)旅游人數(shù)進(jìn)行預(yù)測,所需要的阿勒泰旅游人數(shù)月度數(shù)據(jù)來自新疆阿勒泰旅游局官方統(tǒng)計(jì)網(wǎng)站,選取2011年6月到2013年9月共計(jì)27個月度數(shù)據(jù)。網(wǎng)絡(luò)搜索關(guān)鍵詞的搜索數(shù)據(jù)來源于百度指數(shù),時間范圍限制在2011年6月到2013年9月,且對搜索數(shù)據(jù)做如下限定:搜索來自中國(包含港澳臺),不包含國外的搜索。
首先,隨著信息技術(shù)的迅速發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為消費(fèi)者獲得信息的最大平臺。利用互聯(lián)網(wǎng)搜索引擎進(jìn)行搜索已經(jīng)成為消費(fèi)者獲取信息的重要工具之一。同時,搜索引擎會將消費(fèi)者搜索信息記錄下來,這些被留存下來的信息則成為未來學(xué)術(shù)研究的重要數(shù)據(jù)來源。其次,關(guān)于旅游人數(shù)預(yù)測的方法國內(nèi)已有相當(dāng)?shù)难芯?,但這些方法主要是利用已有歷史數(shù)據(jù)進(jìn)行預(yù)測,具有較大的滯后性,預(yù)測精度會受限。隨著網(wǎng)絡(luò)技術(shù)對社會行為研究的深入,針對旅游行為的預(yù)測也加入研究的行列?;诰W(wǎng)絡(luò)搜索技術(shù)的旅游行為預(yù)測研究主要集中在網(wǎng)絡(luò)關(guān)注度與旅游客流關(guān)系的研究上。綜上,基于網(wǎng)絡(luò)搜索數(shù)據(jù)合成指數(shù)方法對新疆阿勒泰地區(qū)旅游人數(shù)進(jìn)行預(yù)測具有一定的必要性和可行性。
1.網(wǎng)絡(luò)搜索關(guān)鍵詞的選取
通過對旅游基本理論和旅游者行為分析,確立了可旅游活動六要素:從衣、食、住、行、購、娛來拓展,結(jié)合阿勒泰地區(qū)旅游的具體情況,人工選擇了“阿勒泰特色食物、阿勒泰酒店、阿勒泰農(nóng)家樂、阿勒泰特色節(jié)日、阿勒泰機(jī)場、阿勒泰汽車站、阿勒泰購物、阿勒泰娛樂”等初始關(guān)鍵詞。其次,利用百度搜索推薦關(guān)鍵詞功能,獲得相關(guān)性較大的關(guān)鍵詞,并剔除重復(fù)詞語,最終得到268個關(guān)鍵詞,并組成關(guān)鍵詞詞庫(如表2所示)。
表2 部分關(guān)鍵詞
2.指數(shù)合成
首先,計(jì)算所選定的每個關(guān)鍵詞的月度搜索量與阿勒泰地區(qū)的月度旅游人數(shù)的皮爾遜相關(guān)系數(shù)(即簡單相關(guān)系數(shù)),考慮到旅游人數(shù)與關(guān)鍵詞搜索量的時滯性,為了獲得相對穩(wěn)定的簡單相關(guān)系數(shù),對每一關(guān)鍵詞計(jì)算7次相關(guān)系數(shù),即通過分別計(jì)算阿勒泰旅游人數(shù)與提前0~6期(0~6個月份)的268個關(guān)鍵詞的搜索數(shù)據(jù)可以得到。為了便于關(guān)鍵詞的篩選與最終合成指數(shù),對相關(guān)系數(shù)做如下規(guī)定:相關(guān)系數(shù)大于等于0.7的入選,相關(guān)系數(shù)小于0.7,表明關(guān)鍵詞與旅游人數(shù)的線性相關(guān)性不強(qiáng),所以暫不考慮。表3為42個相關(guān)系數(shù)大于0.7的關(guān)鍵詞及滯后期數(shù),指數(shù)合成關(guān)鍵詞如下:
表3說明阿勒泰地區(qū)旅游人數(shù)與多數(shù)關(guān)鍵詞滯后0、1、2期的搜索指數(shù)存在較強(qiáng)的相關(guān)性。說明從整體來看,游客一般會在出行前當(dāng)月或者提前一個月來搜索相關(guān)信息。
從選定的42個關(guān)鍵詞中運(yùn)用錯位相加的方法,通過相關(guān)系數(shù)選擇與旅游人數(shù)關(guān)聯(lián)性最強(qiáng)的關(guān)鍵詞,進(jìn)而合成指數(shù)用以對阿勒泰地區(qū)的月度旅游人數(shù)進(jìn)行預(yù)測。具體來講,就是基于各個關(guān)鍵詞0~6期最大的簡單相關(guān)系數(shù)確定每一個關(guān)鍵詞的滯后期數(shù),不斷選取最大相關(guān)系數(shù)的關(guān)鍵詞,對原始的、全部確定好的滯后搜索數(shù)據(jù)進(jìn)行錯位,采用擬合程度最高的關(guān)鍵詞選取方法最終合成指數(shù)(如表4所示),選定10個關(guān)鍵詞,擬合程度達(dá)到96.57%。
表3 關(guān)鍵詞相關(guān)系數(shù)及滯后期數(shù)
表4 指數(shù)合成步驟
從圖1可以直觀看到,2012年5月到2013年9月共計(jì)17個月度阿勒泰旅游人數(shù)與關(guān)鍵詞的合成指數(shù)存在趨勢一致性(峰值和低值出現(xiàn)月份一致)。因此,通過錯位相加自動篩選關(guān)鍵詞合成指數(shù)的方法預(yù)測阿勒泰地區(qū)旅游人數(shù)具有較強(qiáng)的實(shí)踐性。
利用合成指數(shù),建立阿勒泰旅游人數(shù)的時間序列模型,根據(jù)此模型預(yù)測得到阿勒泰地區(qū)2013年9~12月的旅游人數(shù)月度數(shù)據(jù)。
首先,因?yàn)楸唤忉屪兞柯糜稳藬?shù)與解釋變量合成指數(shù)都是時間序列數(shù)據(jù),因此,在建立模型之前我們需要對兩列數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn),避免模型最終出現(xiàn)偽回歸現(xiàn)象。本文采用AugmentedDickey-Fuller(ADF)單位根檢驗(yàn)。該檢驗(yàn)的原假設(shè)是該序列至少有一個單位根,即序列是不平穩(wěn)的;拒絕原假設(shè)意味著該序列是平穩(wěn)序列(檢驗(yàn)結(jié)果如表5所示)。
表5 變量的平穩(wěn)性檢驗(yàn)
從表5可以看到,變量y(旅游人數(shù))和x(合成指數(shù))在5%的顯著性水平下拒絕原假設(shè),通過了單位根檢驗(yàn),即旅游人數(shù)和合成指數(shù)是平穩(wěn)序列,因此,可直接建立時間序列模型。
其次,以旅游人數(shù)為被解釋變量,以滯后一期的旅游人數(shù)、合成指數(shù)為自變量,建立回歸模型(結(jié)果如表6)。
表6 模型結(jié)果
由表6可以看到,模型整體通過F檢驗(yàn),F(xiàn)-statistic為0.000,自變量x和y(-1)全部通過t檢驗(yàn),R2達(dá)到0.9151。整體來看,模型擬合效果較好。
最后,以2013年9~12月數(shù)據(jù)為檢驗(yàn)數(shù)據(jù),根據(jù)已得到的模型對該時段阿勒泰旅游人數(shù)進(jìn)行預(yù)測(結(jié)果如表7所示)。
由表7可看到,指數(shù)合成和ARMA(1,1)兩種模型結(jié)果相比較而言,指數(shù)合成方法計(jì)算得到的平均誤差率為9.9%,小于ARMA(1,1)的平均誤差率12.9%。雖然指數(shù)合成方法的平均誤差率略低,但就絕對值而言,指數(shù)合成計(jì)算得到的平均誤差率依然偏高,原因是多方面的。
表7 兩種模型結(jié)果對比表
首先,建立有關(guān)阿勒泰地區(qū)旅游影響因素的計(jì)量模型。該模型包括因變量——阿勒泰地區(qū)旅游人數(shù)和10個自變量。模型結(jié)果表明自變量前的系數(shù)除全疆高速公路里程、特殊事件(負(fù)向)兩個變量外,都通過顯著性檢驗(yàn),P值幾乎都為0.000,且各變量前的符號與預(yù)期相符。因此,從挖掘當(dāng)?shù)芈糜尉皡^(qū)潛力、發(fā)展特色旅游、提高服務(wù)水平、改善基礎(chǔ)設(shè)施環(huán)境、實(shí)現(xiàn)旅游業(yè)“一條龍服務(wù)”幾個維度出發(fā),有助于阿勒泰旅游業(yè)形成較為完整的產(chǎn)業(yè)鏈,實(shí)現(xiàn)可持續(xù)發(fā)展。
其次,建立阿勒泰地區(qū)旅游人數(shù)的預(yù)測模型。本文采用網(wǎng)絡(luò)搜索指數(shù)合成的方法,充分考慮社會行為對需求預(yù)測的影響,較之傳統(tǒng)的時間序列模型,如ARMA等預(yù)測精度有一定的改進(jìn)。盡管如此,模型的擬合結(jié)果有待于進(jìn)一步改善。一是關(guān)鍵詞的選取需更加準(zhǔn)確,可擴(kuò)大關(guān)鍵詞的選詞范圍。本文42個關(guān)鍵詞中僅有5個關(guān)鍵詞與旅游人數(shù)的相關(guān)系數(shù)超過90%,有18個超過80%,總體來說,關(guān)鍵詞的相關(guān)性并不是非常好。二是對游客去往國內(nèi)旅游目的地而言,通常游客會在出行前一個月對目的地相關(guān)信息進(jìn)行檢索,也就是說滯后期為0,這點(diǎn)也可以從關(guān)鍵詞相關(guān)系數(shù)即滯后期看到,滯后期為0的關(guān)鍵詞占有較大比例,這就使得本文使用網(wǎng)絡(luò)搜索合成指數(shù)方法時不能充分利用歷史數(shù)據(jù),使用該方法對旅游人數(shù)進(jìn)行預(yù)測會影響預(yù)測精度。三是應(yīng)用時間序列模型,需要較長時期的數(shù)據(jù)以保證歷史信息能夠充分利用,獲得較高的預(yù)測精度。如果能夠獲得阿勒泰地區(qū)旅游人數(shù)的周數(shù)據(jù)或日數(shù)據(jù),最終擬合結(jié)果應(yīng)該具有更高的精確度。
BurgerC.,DohnalM.,KathradaM.,etal.,APractitionersGuidetoTime-seriesMethodsforTourismDemandforEcasting-ACaseStudyofDurban,SouthAfrica,TourismManagement,2001,22(4).
Lim Christine,McAleer Michael,Time Series Forecasts of International Travel Demand for Australia,TourismManagement,2002,23.
李山、邱榮旭、陳玲:《基于百度指數(shù)的旅游景區(qū)網(wǎng)絡(luò)空間關(guān)注度:時間分布及其前兆效應(yīng)》,《地理與地理信息科學(xué)》2009年第6期。
馬麗君、孫根年、黃蕓瑪?shù)龋骸冻鞘袊鴥?nèi)客流量與游客網(wǎng)絡(luò)關(guān)注度時空相關(guān)分析》,《經(jīng)濟(jì)地理》2011年第4期。
龍茂興、孫根年、馬麗君等:《區(qū)域旅游網(wǎng)絡(luò)關(guān)注度與客流量時空動態(tài)比較分析——以四川為例》,《地域研究與開發(fā)》2011年第3期。
孫毅、呂本富:《網(wǎng)絡(luò)搜索與經(jīng)濟(jì)行為相關(guān)性研究》,《管理評論》2011年第7期。
責(zé)任編輯:王慧君
F592.745
A
1009-5330(2016)06-0046-06
李莼,中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院管理學(xué)博士(北京 100190)、新疆污染物監(jiān)控與信息中心(新疆烏魯木齊 830000);曹艷姣,中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院碩士生;呂本富,中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院教授(北京 100190)。