范琴
摘要:在疫情常態(tài)化防控的當(dāng)下,各景區(qū)的安全運(yùn)營都離不開對(duì)景區(qū)人流的實(shí)時(shí)監(jiān)控,運(yùn)營商的信令數(shù)據(jù)具備規(guī)模大、實(shí)時(shí)性高、覆蓋面廣的優(yōu)點(diǎn),可快速為景區(qū)提供實(shí)時(shí)的人流監(jiān)控,但由于運(yùn)營商數(shù)據(jù)的定位原理依賴基站工參、出于成本考慮采集的信令字段有限、運(yùn)營商用戶的市場占比動(dòng)態(tài)波動(dòng)等原因?qū)е戮皡^(qū)客流統(tǒng)計(jì)不準(zhǔn)確,同時(shí)由于游客統(tǒng)計(jì)口徑的差異、景區(qū)類型的不同以及景區(qū)邊界圈選等問題,加深了基于運(yùn)營商數(shù)據(jù)實(shí)現(xiàn)客流統(tǒng)計(jì)時(shí)的誤差。本文詳細(xì)闡述了當(dāng)前各種景區(qū)客流監(jiān)控方式的優(yōu)缺點(diǎn),深入分析了基于運(yùn)營商數(shù)據(jù)實(shí)現(xiàn)客流統(tǒng)計(jì)的主客觀原因,基于可實(shí)操的層面提出了采用運(yùn)營商數(shù)據(jù)實(shí)現(xiàn)客流精準(zhǔn)統(tǒng)計(jì)的改進(jìn)方案以及每種方案的優(yōu)缺點(diǎn),以期為景區(qū)提供更便捷可靠、低成本的精準(zhǔn)客流實(shí)時(shí)監(jiān)控,助力景區(qū)實(shí)現(xiàn)數(shù)智劃轉(zhuǎn)型。
關(guān)鍵詞:人流統(tǒng)計(jì)、信令數(shù)據(jù)、運(yùn)營商、景區(qū)
一、研究背景
景區(qū)作為大型的人流量聚集地之一,體現(xiàn)著一省服務(wù)業(yè)的發(fā)展水平,加強(qiáng)景區(qū)營運(yùn)管理,利用數(shù)據(jù)實(shí)現(xiàn)對(duì)景區(qū)的監(jiān)管,對(duì)提升旅游行業(yè)服務(wù)整體品質(zhì)是非常必要的。建立景區(qū)人流量監(jiān)測(cè)系統(tǒng)目標(biāo)在于解決景區(qū)游客流量的監(jiān)控分析,為景區(qū)的規(guī)劃發(fā)展、營銷決策提供了科學(xué)的數(shù)據(jù)依據(jù)。
利用運(yùn)營商基站定位技術(shù),對(duì)游客數(shù)量、游客屬性、景區(qū)粘度等維度的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,實(shí)現(xiàn)景區(qū)客流負(fù)荷實(shí)時(shí)監(jiān)控預(yù)警、景區(qū)游客各類統(tǒng)計(jì)分析等功能,為各級(jí)旅游監(jiān)管部門的日常管理及公眾安全提供科學(xué)的決策依據(jù)[1]。由于基站統(tǒng)計(jì)方法的局限性,部分景區(qū)存在地理邊界不匹配、周邊環(huán)境復(fù)雜等原因,導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)和實(shí)際情況存在偏差。
二、現(xiàn)狀分析
1. 監(jiān)控方式
當(dāng)前部分景區(qū)還沒有開始智慧景區(qū)建設(shè),客流統(tǒng)計(jì)的主要方式還是以閘機(jī)為主,開放式景區(qū)則沒有客流統(tǒng)計(jì)的手段。閘機(jī)統(tǒng)計(jì)方式數(shù)據(jù)精準(zhǔn),能夠準(zhǔn)確反映出景區(qū)接待量,但是只能反映景區(qū)范圍內(nèi)的游客總數(shù),無法分地段進(jìn)行統(tǒng)計(jì),同時(shí)也不能對(duì)游客進(jìn)行大數(shù)據(jù)挖掘,無法分析游客的年齡、性別、客源地等信息[2]。
相較于傳統(tǒng)的閘機(jī)計(jì)數(shù)方式,部分景區(qū)著眼于建設(shè)智慧旅游平臺(tái),在客流監(jiān)控模塊采用的主要是具有前置統(tǒng)計(jì)功能的攝像頭監(jiān)控和運(yùn)營商基站監(jiān)控。
此外,還有一些景區(qū)會(huì)和互聯(lián)網(wǎng)公司進(jìn)行合作,利用游客在景區(qū)使用開啟了GPS定位功能的APP應(yīng)用來進(jìn)行游客統(tǒng)計(jì)。此種方案利用游客終端設(shè)備的GPS定位數(shù)據(jù),準(zhǔn)確性高,但是同樣無法獲取較為全面的游客屬性信息,而且數(shù)據(jù)獲取成本和后期系統(tǒng)運(yùn)維成本較高,不推薦景區(qū)使用。
四種監(jiān)控方式優(yōu)劣勢(shì)如下:
2.誤差情況
但是由于客觀原因,運(yùn)營商數(shù)據(jù)對(duì)于景區(qū)的監(jiān)控預(yù)測(cè)和實(shí)際數(shù)值仍有一定差距,下面以安徽省黃山風(fēng)景區(qū)為例:
如圖所示,系統(tǒng)摘取了2019年6月28日至7月7日黃山景區(qū)累計(jì)游客數(shù)據(jù),與對(duì)應(yīng)的黃山景區(qū)閘機(jī)數(shù)據(jù)進(jìn)行對(duì)比,可以看出,雙方系統(tǒng)數(shù)據(jù)差距較大,趨勢(shì)基本相同,比例基本相同。
(注:移動(dòng)數(shù)據(jù)暫未考慮運(yùn)營商三方占比的問題,數(shù)據(jù)來源于互聯(lián)網(wǎng)公布數(shù)據(jù))
三、誤差原因分析
針對(duì)以上事例不難發(fā)現(xiàn),單獨(dú)使用運(yùn)營商的數(shù)據(jù)很難實(shí)現(xiàn)對(duì)景區(qū)游客的精確統(tǒng)計(jì),這其中的誤差原因包含了各類分析算法本身的精度原因、也有運(yùn)營商數(shù)據(jù)定位的主觀原因等。
1.客觀原因分析
1.1運(yùn)營商數(shù)據(jù)及定位算法的原理導(dǎo)致數(shù)據(jù)統(tǒng)計(jì)的不準(zhǔn)確性
首先,用來實(shí)現(xiàn)游客統(tǒng)計(jì)的運(yùn)營商數(shù)據(jù)均來自于運(yùn)營商網(wǎng)絡(luò)側(cè)用戶與基站發(fā)生通信時(shí)的交互數(shù)據(jù)中所攜帶的位置信息,實(shí)際上定位到的是用戶所連接的基站的位置而非用戶實(shí)際準(zhǔn)確的GPS位置。
1.2運(yùn)營商數(shù)據(jù)采集不全
運(yùn)營商本質(zhì)上作為通信服務(wù)的提供商,其目標(biāo)是保證網(wǎng)絡(luò)的穩(wěn)定和高速,所以其采集的數(shù)據(jù)以能夠達(dá)到分析網(wǎng)絡(luò)質(zhì)量為基礎(chǔ)目標(biāo)。雖然某些通信數(shù)據(jù)、路測(cè)數(shù)據(jù)等所產(chǎn)生的附加價(jià)值可以被用來做人流統(tǒng)計(jì)與分析,但如果采集和存儲(chǔ)這些數(shù)據(jù)需要付出較大的成本(如MDT數(shù)據(jù)),則不在運(yùn)營商數(shù)據(jù)采集的考慮范圍內(nèi)。
1.3運(yùn)營商數(shù)據(jù)的片面性
目前國內(nèi)通信服務(wù)市場下,三家運(yùn)營商各自瓜分了一部分市場,即使作為4G市場占有率最高的移動(dòng),其用戶占比大概在60%~75%,這個(gè)數(shù)值在各個(gè)地市區(qū)縣都有一定的區(qū)別,使用運(yùn)營商數(shù)據(jù)來統(tǒng)計(jì)的游客數(shù)也只是能一部分,并且很難單純地通過一個(gè)比例來還原真實(shí)的游客數(shù)。
其次,三家運(yùn)營商的數(shù)據(jù)很難做到融合。如雙卡雙待終端插入了兩張異網(wǎng)卡時(shí),會(huì)在兩邊運(yùn)營商處重復(fù)統(tǒng)計(jì)。
2.主觀原因分析
2.1游客識(shí)別算法的精準(zhǔn)度
目前通用的方法是以駐留時(shí)間來識(shí)別游客。但不同景區(qū)游客的駐留時(shí)間不同,無法完備地枚舉各類景區(qū)的游客特征[3],導(dǎo)致了游客統(tǒng)計(jì)的不準(zhǔn)確。
2.2景區(qū)及游客的類型、行為會(huì)影響準(zhǔn)確度
某些景區(qū)的類型和游客的行為也會(huì)影響統(tǒng)計(jì)的精準(zhǔn)度[3]。如內(nèi)含酒店或民宿的景區(qū),游客跨天旅游時(shí),閘機(jī)或者門票只會(huì)在當(dāng)天記錄進(jìn)去有這名游客,而第二天則不會(huì)記錄,但是運(yùn)營商的數(shù)據(jù)仍然會(huì)在第二天將該名游客作為一名游客進(jìn)行統(tǒng)計(jì),從而導(dǎo)致運(yùn)營商統(tǒng)計(jì)的游客和景區(qū)門票統(tǒng)計(jì)的游客在某些情況下對(duì)不上。
2.3無法準(zhǔn)確圈定出景區(qū)邊界導(dǎo)致統(tǒng)計(jì)不準(zhǔn)
運(yùn)營商網(wǎng)絡(luò)管理部門在監(jiān)測(cè)到網(wǎng)絡(luò)質(zhì)量波動(dòng)后,經(jīng)過綜合分析,確定需要調(diào)整哪些基站的功率大小、方向角等參數(shù),而且各地市區(qū)縣在執(zhí)行調(diào)整策略的時(shí)候,很有可能存在“先干活再記錄”的方式,即先進(jìn)行基站參數(shù)的調(diào)整,再在系統(tǒng)上修正基站的工參信息。工餐的實(shí)際情況與記錄內(nèi)容不符導(dǎo)致景區(qū)包含的基站信息胡準(zhǔn)確,影響統(tǒng)計(jì)結(jié)果。
四、解決方案探討
為更好地挖掘運(yùn)營商數(shù)據(jù)價(jià)值,為文旅委、旅游局、景區(qū)提供更加準(zhǔn)確的游客流量統(tǒng)計(jì)數(shù)據(jù),輔助政府單位規(guī)劃省內(nèi)旅游資源,布局全域旅游戰(zhàn)略,實(shí)現(xiàn)智慧旅游的全面轉(zhuǎn)型,可以從以下三個(gè)方面著手,優(yōu)化提供的數(shù)據(jù)接口,逐步提供游客流量統(tǒng)計(jì)精度:
方案一:提升運(yùn)營商數(shù)據(jù)位置解析精度:運(yùn)用運(yùn)營商基于信令的解析能力以及大數(shù)據(jù)實(shí)時(shí)計(jì)算技術(shù)的發(fā)展,提升回填經(jīng)緯度的準(zhǔn)確性,從而提高區(qū)域人口統(tǒng)計(jì)、區(qū)域人員畫像的準(zhǔn)確性;深入地圖類APP解析,輔助精準(zhǔn)定位。
方案二:硬件輔助優(yōu)化:依靠具有前置算法的高清攝像頭、室內(nèi)小基站及其他傳感設(shè)備捕獲更精確的數(shù)據(jù),用于運(yùn)營商數(shù)據(jù)擬合和糾偏。
方案三:數(shù)據(jù)建模分析:將區(qū)域進(jìn)行細(xì)類劃分,根據(jù)不同區(qū)域的特征進(jìn)行建模優(yōu)化,提升區(qū)域人數(shù)統(tǒng)計(jì)的精準(zhǔn)度;運(yùn)用多種大數(shù)據(jù)算法和模型,擬合人員軌跡,補(bǔ)充人員畫像,優(yōu)化統(tǒng)計(jì)算法。
下面將對(duì)三類方案進(jìn)行細(xì)化,并初步估算了實(shí)施計(jì)劃及完成時(shí)間。
1.提升解析精度
1.1E-CID(TA+AOA)定位技術(shù)
適用場景:室外地區(qū)定位較準(zhǔn);
定位精度:誤差在100m~200m;
定位原理:根據(jù)TA估算基站和移動(dòng)臺(tái)(手機(jī))之間的距離,再根據(jù)AOA的角度信息獲取終端的位置信息;
數(shù)據(jù)需求:全面的基站工參數(shù)據(jù)、信令數(shù)據(jù);
實(shí)現(xiàn)難度:現(xiàn)有部分基站工參數(shù)據(jù)不全,計(jì)算復(fù)雜度較高、對(duì)資源開銷較大,定位非實(shí)時(shí),有2h以上的延遲(具體視投入資源情況而定);
實(shí)施方案:
(1)估算基站和手機(jī)之間的距離:主要是根據(jù)測(cè)量接收信號(hào)在基站和移動(dòng)臺(tái)之間的到達(dá)時(shí)間,然后轉(zhuǎn)換為距離,從而進(jìn)行定位。該方法至少需要三個(gè)基站,才能計(jì)算目標(biāo)的位置。三個(gè)基站測(cè)的與 MS 的距離分別為R1、R2、R3,以各自基站為圓心測(cè)量距離為半徑,繪制三個(gè)圓,其交點(diǎn)即為 MS 的位置。當(dāng)三個(gè)基站都是 LOS 基站時(shí),一般可以根據(jù)最小二乘(LS)算法計(jì)算 MS 的估計(jì)位置[4]。
(2)測(cè)量信號(hào)移動(dòng)臺(tái)和基站之間的到達(dá)角度:以基站為起點(diǎn)形成的射線必經(jīng)過移動(dòng)臺(tái),兩條射線的交點(diǎn)即為移動(dòng)臺(tái)的位置。該方法只需兩個(gè)基站就可以確定 MS 的估計(jì)位置。當(dāng)基站裝有天線陣列時(shí),天線陣列根據(jù)移動(dòng)臺(tái)發(fā)送的信號(hào)來確定入射角度。兩個(gè)基站的入射角分別為a1、a2,以各基站為起點(diǎn),入射角方向構(gòu)造直線的交點(diǎn),即為 MS 的位置。
(3)結(jié)合前兩步得出的數(shù)據(jù),利用矩陣計(jì)算的方式,得出最終MS(手機(jī))的位置。
1.2RF fingerprint定位技術(shù):基于指紋庫的定位方法
適用場景:更適合復(fù)雜的室內(nèi)環(huán)境,能夠較準(zhǔn)確地區(qū)分室內(nèi)外用戶,并實(shí)現(xiàn)室內(nèi)分層的定位;
定位精度:誤差在25m~200m,受室內(nèi)信號(hào)強(qiáng)度影響較大;
定位原理:通過本小區(qū)及鄰小區(qū)的信號(hào)質(zhì)量特征與覆蓋地圖特征庫進(jìn)行指紋特征匹配實(shí)現(xiàn)定位;
數(shù)據(jù)需求:MR數(shù)據(jù)、基站工參數(shù)據(jù);
實(shí)現(xiàn)難度:數(shù)據(jù)量較大,資源開銷較大,目前MR數(shù)據(jù)的采集是以月為單位,實(shí)時(shí)性較差;
實(shí)施方案:
(1)數(shù)據(jù)采集,形成指紋庫:室內(nèi)定位中的位置指紋法,就是事先把各個(gè)位置上的信號(hào)特征(各Wi-Fi的信號(hào)強(qiáng)度)測(cè)量一遍,存入指紋數(shù)據(jù)庫。定位的時(shí)候,將當(dāng)前的信號(hào)特征與指紋庫中的進(jìn)行匹配,從而確定位置。
(2)指紋匹配:是通過實(shí)際采集的數(shù)據(jù)與數(shù)組庫中保存的位置指紋進(jìn)行匹配,算出距離,比較常用的算法有 k階類聚算法,加權(quán)k階類聚算法,神經(jīng)網(wǎng)絡(luò)算法[5]。
1.3采用技術(shù)手段實(shí)時(shí)更新景區(qū)基站靜態(tài)數(shù)據(jù)
適用場景:較為通用;
定位精度:誤差在25m~3km,受基站覆蓋范圍影響較大;
定位原理:通過圈定更準(zhǔn)確的景點(diǎn)范圍,篩選出更精確的基站列表,從而統(tǒng)計(jì)游客綁定到更精確基站的數(shù)據(jù)進(jìn)行游客定位,進(jìn)而實(shí)現(xiàn)統(tǒng)計(jì);
數(shù)據(jù)需求:信令數(shù)據(jù)、基站工參數(shù)據(jù);
實(shí)現(xiàn)難度:已實(shí)現(xiàn);
實(shí)施方案:
建立省運(yùn)營商級(jí)別的位置庫平臺(tái),平臺(tái)與省運(yùn)營商的網(wǎng)絡(luò)優(yōu)化部門工單系統(tǒng)打通,盡量保證景區(qū)所對(duì)應(yīng)的基站工參信息更新能夠及時(shí)。
方案優(yōu)勢(shì):靜態(tài)數(shù)據(jù)刷新流程簡化,方便快捷,通常從實(shí)施層面預(yù)估,在提出需求后三個(gè)工作日內(nèi)即可刷新數(shù)據(jù)接口中基站數(shù)據(jù)。
方案劣勢(shì):無法判斷景區(qū)周邊及景區(qū)內(nèi)部基站分布情況;目前技術(shù)尚不能剔除周邊基站部分覆蓋情況,也無法判斷部分覆蓋的比例。
2.硬件輔助優(yōu)化
對(duì)接景區(qū)已建設(shè)的視頻監(jiān)控系統(tǒng),利用深度學(xué)習(xí)算法對(duì)視頻內(nèi)容進(jìn)行解碼,提供靜態(tài)、動(dòng)態(tài)兩種人流統(tǒng)計(jì)的手段,輔助景區(qū)進(jìn)行特定場所的人數(shù)統(tǒng)計(jì)工作,實(shí)現(xiàn)智慧景區(qū)管理。
靜態(tài)人流統(tǒng)計(jì):對(duì)攝像頭監(jiān)控的視頻內(nèi)容進(jìn)行拍照記錄,對(duì)照片進(jìn)行人臉識(shí)別,從而實(shí)現(xiàn)人流統(tǒng)計(jì)。
動(dòng)態(tài)人流統(tǒng)計(jì):將攝像頭動(dòng)態(tài)視頻數(shù)據(jù)接入現(xiàn)有的AI分析平臺(tái),實(shí)時(shí)識(shí)別視頻監(jiān)控區(qū)域內(nèi)走過的人群從而實(shí)現(xiàn)人數(shù)統(tǒng)計(jì)。
采用輔助硬件手段提供客流參考數(shù)據(jù),其結(jié)果可直接反饋給景區(qū)使用,也可作為校準(zhǔn)數(shù)據(jù),進(jìn)入基于信令數(shù)據(jù)進(jìn)行客流分析的模型[6],提升運(yùn)營商信令數(shù)據(jù)統(tǒng)計(jì)的準(zhǔn)確性。
3. 數(shù)據(jù)建模優(yōu)化
通過大數(shù)據(jù)分析的方法,在現(xiàn)有數(shù)據(jù)質(zhì)量的情況,以最少的硬件及額外資源投入,持續(xù)優(yōu)化客流量統(tǒng)計(jì)算法[7]。
(1)區(qū)分常駐、流動(dòng):常駐人口定義口徑:用戶當(dāng)前時(shí)間往前推15天,在這15天內(nèi)出現(xiàn)7天以上即定義為常駐人口。應(yīng)用場景:在最終統(tǒng)計(jì)景區(qū)游客數(shù)量時(shí),剔除常駐人口。
(2)參考停留時(shí)長:在統(tǒng)計(jì)景區(qū)游客數(shù)量時(shí),將停留半個(gè)小時(shí)以上的人群作為游客,去除那些偶然路過的人群因素。
(3)用戶軌跡擬合:底層基于位置拉鏈數(shù)據(jù)結(jié)構(gòu),存儲(chǔ)用戶行動(dòng)的軌跡;
基于隱馬爾科夫(HMM)模型,維特比(Viterbi)動(dòng)態(tài)規(guī)劃算法實(shí)現(xiàn)用戶道路軌跡的匹配,從而推測(cè)用戶在景區(qū)的駐留情況,輔助優(yōu)化基站定位的結(jié)果。
(4)第三方數(shù)據(jù)校準(zhǔn):參考閘機(jī)口售票類數(shù)據(jù)、定義為游客的在景區(qū)附近基站旅游類app(景區(qū)相關(guān)app)啟動(dòng)次數(shù)數(shù)據(jù)、地圖類app解析出來的GPS數(shù)據(jù)以及可以調(diào)用的其他數(shù)據(jù)資源,對(duì)運(yùn)營商定位數(shù)據(jù)進(jìn)行優(yōu)化。
3.1第三方數(shù)據(jù)校準(zhǔn)
采用相關(guān)性分析方法,結(jié)合各景區(qū)門票數(shù)據(jù)或經(jīng)驗(yàn)數(shù)據(jù),一次擬合或二次擬合得出基站數(shù)據(jù)與門票數(shù)據(jù)的相關(guān)性公式(相關(guān)性指數(shù)0.95以上),后期基站數(shù)據(jù)通過相關(guān)性公式計(jì)算后輸出,基本可貼合景區(qū)門票數(shù)據(jù)。
方案優(yōu)勢(shì):通過簡單線下計(jì)算即可大幅提高景區(qū)監(jiān)控準(zhǔn)確性,開發(fā)工作量較小;只要能收集到基礎(chǔ)數(shù)據(jù)的景區(qū),都可通過個(gè)性化相關(guān)性公式調(diào)增或調(diào)減景區(qū)人數(shù),而且公式還可根據(jù)不同時(shí)間段調(diào)整。
方案劣勢(shì):所有數(shù)據(jù)的計(jì)算都要基于原始景區(qū)數(shù)據(jù)的準(zhǔn)確性,風(fēng)險(xiǎn)較大;前期需要收集大量景區(qū)統(tǒng)計(jì)數(shù)據(jù),數(shù)據(jù)越多,計(jì)算公式越準(zhǔn)確,但收集工作量越大;計(jì)算過程的調(diào)增或調(diào)減無法通過實(shí)際影響因素解釋,只能體現(xiàn)準(zhǔn)確性提高,但無法找到影響景區(qū)人數(shù)的原因。
五、結(jié)束語
基于運(yùn)營商信令數(shù)據(jù)來實(shí)現(xiàn)景區(qū)客流監(jiān)控,具備投入低、見效快的優(yōu)點(diǎn),可快速幫助景區(qū)在疫情常態(tài)化防控的社會(huì)背景下實(shí)現(xiàn)景區(qū)安全生產(chǎn)經(jīng)營。但結(jié)合信令數(shù)據(jù)在各種不同情況下的統(tǒng)計(jì)誤差,需結(jié)合不同的方法加以改進(jìn),根據(jù)景區(qū)類型,采用合適的誤差修正辦法,提高景區(qū)客流監(jiān)控的準(zhǔn)確性,助力景區(qū)實(shí)現(xiàn)數(shù)智化運(yùn)營。
參考文獻(xiàn):
[1]中國移動(dòng)MDT技術(shù)應(yīng)用指導(dǎo)意見
[2]謝堅(jiān).客流量統(tǒng)計(jì)在旅游行業(yè)的應(yīng)用[J].信息系統(tǒng)工程,2015,000(009):86-87.
[3]項(xiàng)譯.基于手機(jī)信令數(shù)據(jù)的旅游交通客流特征分析研究[D].東南大學(xué),2017.
[4]柴滿,劉坤杰.一種基于信號(hào)強(qiáng)度分析的移動(dòng)端三角定位修正方法和裝置:,CN109089214A[P].2018.
[5]常建萍,楊大成,張健明.蜂窩無線網(wǎng)絡(luò)中移動(dòng)臺(tái)定位算法Fingerprint的研究[J].2013.
[6]吳秋琴.基于大數(shù)據(jù)的景區(qū)客流量統(tǒng)計(jì)評(píng)估系統(tǒng)及方法:,CN111369394A[P].2020.
[7]趙新波.基于基站位置定位的客源分析系統(tǒng)的研究[J].信息系統(tǒng)工程,2015,000(012):16-17.