現(xiàn)有的旅游統(tǒng)計方式存在一些缺陷,如數(shù)據(jù)采集不全面、數(shù)據(jù)分析深度不足、數(shù)據(jù)質(zhì)量不高等問題。而大數(shù)據(jù)統(tǒng)計具有的如數(shù)據(jù)來源廣、數(shù)據(jù)量大、數(shù)據(jù)覆蓋面全、數(shù)據(jù)類型多、分析深度和精度高等特點正好可以有效地彌補傳統(tǒng)旅游統(tǒng)計的缺陷,提高旅游統(tǒng)計的客觀性、科學(xué)性和準(zhǔn)確性。
大數(shù)據(jù)技術(shù)整合和利用包括信令數(shù)據(jù)、消費數(shù)據(jù)、OTA(online travel agency)數(shù)據(jù)、政務(wù)數(shù)據(jù)等在內(nèi)的海量數(shù)據(jù),建立旅游數(shù)據(jù)分析模型,可從多個角度來理解和分析游客的需求和行為,為旅游統(tǒng)計打開新局面。
一、大數(shù)據(jù)技術(shù)如何應(yīng)用于旅游統(tǒng)計
本文從大數(shù)據(jù)的數(shù)據(jù)來源、數(shù)據(jù)處理方式以及數(shù)據(jù)安全3個部分來進行探討。
1. 數(shù)據(jù)來源
旅游統(tǒng)計主要關(guān)注旅游目的地的游客量、旅游消費這兩大類,基于這兩大類,可以進一步延伸包括游客客源地、游客出行方式、游客畫像,以及旅游六要素消費、消費偏好等?;谶@些旅游統(tǒng)計需求,可以用運營商信令數(shù)據(jù)+銀聯(lián)消費作為主要數(shù)據(jù)源,其他數(shù)據(jù)源作為輔助數(shù)據(jù)源的旅游大數(shù)據(jù)分析數(shù)據(jù)源模式。
運營商信令數(shù)據(jù)具有覆蓋面廣、可去重的特點,根據(jù)工業(yè)和信息化部2023年6月底統(tǒng)計,中國移動、中國聯(lián)通、中國電信3家運營商移動用戶數(shù)合計達到了17.1億,基本覆蓋了所有人口。由于手機號碼不會頻繁改變,可以作為游客的唯一標(biāo)識,通過技術(shù)手段對干擾數(shù)據(jù)進行識別清洗后,不會對同一個游客重復(fù)統(tǒng)計。通過建立大數(shù)據(jù)分析模型,可以準(zhǔn)確、快速地獲取各類旅游設(shè)施興趣點(point of interest,POI)的游客量,實時監(jiān)測旅游設(shè)施數(shù)據(jù)動態(tài),這也是數(shù)據(jù)時效性的保障。
中國銀聯(lián)數(shù)據(jù)中包含商家所屬行業(yè)的行業(yè)分類編碼(merchant category code,MCC)、時間、交易金額、付款方等信息,通過采集商家交易流水,結(jié)合旅游食、住、行、游、購、娛六要素的行業(yè)分類,就可以統(tǒng)計出旅游收入,實現(xiàn)對旅游消費的數(shù)據(jù)分析。
其他還包括OTA數(shù)據(jù)、交通樞紐客流、酒店住宿等數(shù)據(jù)源,可以作為大數(shù)據(jù)分析模型的校準(zhǔn)數(shù)據(jù),用于提升大數(shù)據(jù)識別的精準(zhǔn)度。
2. 數(shù)據(jù)處理方式
目前,大數(shù)據(jù)技術(shù)已經(jīng)相對成熟,廣泛應(yīng)用于數(shù)據(jù)處理、數(shù)據(jù)挖掘、可視化等方面。隨著大數(shù)據(jù)技術(shù)和算力的不斷發(fā)展,大數(shù)據(jù)提供了強大的算法框架、計算和存儲能力。然而,要在旅游統(tǒng)計領(lǐng)域應(yīng)用大數(shù)據(jù)技術(shù),還需要滿足兩個條件:匹配傳統(tǒng)旅游統(tǒng)計口徑和排除數(shù)據(jù)干擾誤差。
上述提到的數(shù)據(jù)來源中,數(shù)據(jù)本身是不具備屬性以及口徑的。但通過傳統(tǒng)的旅游統(tǒng)計口徑融合不同的數(shù)據(jù)源,建立相應(yīng)的數(shù)據(jù)模型,可以為大數(shù)據(jù)在旅游統(tǒng)計中的具體應(yīng)用提供可能性。以游客定義為例,目前文化和旅游部給出的游客定義為:報告期內(nèi)在國內(nèi)觀光游覽、度假、探親訪友、就醫(yī)療養(yǎng)、購物、參加會議或從事經(jīng)濟、文化、體育、宗教活動的本國居民,其出游的目的不是通過所從事的活動謀取報酬。而游客中又包括本地游客、外地游客、國內(nèi)一日游游客和國內(nèi)過夜游客。在建立大數(shù)據(jù)模型時,根據(jù)以上定義,利用職住地點分析與行動軌跡分析等,實現(xiàn)對于“離開慣常環(huán)境10 km,并停留6小時”的游客定義精準(zhǔn)識別;同時結(jié)合各類旅游POI的電子圍欄及游客停留時間,確認(rèn)游客出行目的,從而實現(xiàn)本地游客、外地游客、一日游游客、過夜游客的精準(zhǔn)識別,基本符合傳統(tǒng)旅游游客定義口徑的旅游統(tǒng)計需要。
在建立大數(shù)據(jù)分析模型時,由于數(shù)據(jù)定義和其本身的特性,需要相關(guān)技術(shù)手段進行數(shù)據(jù)修正,實現(xiàn)更為精確、精準(zhǔn)的統(tǒng)計,包括去除過路旅客,避免雙機雙卡游客被重復(fù)計算,合并3家運營商數(shù)據(jù),去除智能終端的SIM卡數(shù)據(jù),去除跨行政區(qū)非游客數(shù)據(jù)等。
3. 數(shù)據(jù)安全保障
雖然大數(shù)據(jù)技術(shù)具備更高效的數(shù)據(jù)處理和分析能力,但在使用過程中也涉及隱私和安全問題。因此,需要采取有效的隱私保護和安全管理措施,確保數(shù)據(jù)的合法性和安全性?;诂F(xiàn)有的安全沙箱運行機制,通過安全沙箱保障源數(shù)據(jù)在安全可控的范圍下,實現(xiàn)源數(shù)據(jù)可用不可見,并遵循數(shù)據(jù)安全原則、數(shù)據(jù)不離場原則和群體分析原則。
二、旅游大數(shù)據(jù)分析模型在旅游統(tǒng)計中的應(yīng)用
旅游大數(shù)據(jù)分析模型是通過收集包括手機信令數(shù)據(jù)、旅游設(shè)施坐標(biāo)數(shù)據(jù)、旅游設(shè)施邊界坐標(biāo)數(shù)據(jù)、基站坐標(biāo)數(shù)據(jù)和POS機等數(shù)據(jù),利用數(shù)據(jù)挖掘、機器學(xué)習(xí)等算法建立的數(shù)據(jù)分析模型。
1. 基于大數(shù)據(jù)技術(shù)游客量統(tǒng)計
大數(shù)據(jù)技術(shù)游客統(tǒng)計方法,是以“人天”作為單位進行統(tǒng)計。理論上,只要在信號基站范圍內(nèi),游客攜帶手機,就會產(chǎn)生信令數(shù)據(jù),包括手機號、接入時間和連接時長。經(jīng)過數(shù)據(jù)清洗后,結(jié)合大數(shù)據(jù)分析模型,即可統(tǒng)計得出游客數(shù)量。
表1為傳統(tǒng)旅游統(tǒng)計方法和大數(shù)據(jù)統(tǒng)計方法對廣西2023年前三季度國內(nèi)旅游游客人數(shù)統(tǒng)計結(jié)果對比情況。
兩種統(tǒng)計口徑下國內(nèi)游客數(shù)量存在一定差異,但各市游客量排名基本一致。
2. 基于大數(shù)據(jù)技術(shù)游客消費統(tǒng)計
大數(shù)據(jù)技術(shù)的游客消費統(tǒng)計方法,是以銀聯(lián)消費數(shù)據(jù)為基礎(chǔ),按照POS機種子定位算法,結(jié)合商戶類型和大數(shù)據(jù)分析模型進行關(guān)聯(lián)統(tǒng)計分析,商戶按照食、住、行、游、購、娛六要素進行分類數(shù)據(jù)統(tǒng)計,獲得旅游收入數(shù)據(jù)。
表2為傳統(tǒng)旅游統(tǒng)計方法和大數(shù)據(jù)統(tǒng)計方法對廣西2023年前三季度國內(nèi)旅游消費統(tǒng)計結(jié)果對比情況。
兩種統(tǒng)計口徑下國內(nèi)旅游收入存在較大差異,但各市旅游收入排名基本一致。
三、結(jié)論和建議
通過分析當(dāng)前旅游統(tǒng)計工作中的問題和大數(shù)據(jù)技術(shù)在旅游統(tǒng)計中應(yīng)用的潛在優(yōu)勢與可行性,并對比兩種統(tǒng)計方式下得出的數(shù)據(jù),可以發(fā)現(xiàn),傳統(tǒng)統(tǒng)計存在的數(shù)據(jù)來源單一、覆蓋率低、采集難度大、處理效率低等問題,可以通過大數(shù)據(jù)技術(shù)得以解決。大數(shù)據(jù)技術(shù)注重業(yè)務(wù)場合與數(shù)據(jù)全景,集合多維度資源,對數(shù)據(jù)以“全域、全時、全量”進行分析處理,提高了旅游統(tǒng)計數(shù)據(jù)的時效性、客觀性、科學(xué)性和準(zhǔn)確性。
實際應(yīng)用過程中,統(tǒng)計的范圍、尺度、計量單位及多源數(shù)據(jù)匯聚等細(xì)節(jié)問題上仍有待完善,因此,仍需要管理部門進一步明確指標(biāo)定義,完善數(shù)據(jù)統(tǒng)計口徑,并加大跨區(qū)域數(shù)據(jù)的融合力度,大數(shù)據(jù)技術(shù)人員應(yīng)該完善數(shù)據(jù)篩選機制,優(yōu)化數(shù)據(jù)分析模型,多方合作挖掘旅游大數(shù)據(jù)更深層次的價值。
(作者系該公司總經(jīng)理;收稿日期:2023-12-28)
[責(zé)任編輯:吳巧紅;責(zé)任校對:宋志偉]