曾麟婷 陳能 陳旭
[摘 要]傳統(tǒng)旅游平臺展現(xiàn)旅游信息的形式往往較為單一且交互性弱,針對目前的問題與需求,本平臺結(jié)合眾源旅游數(shù)據(jù)采集、信息可視化等技術(shù),以重慶市作為案例,在廣泛搜集現(xiàn)有網(wǎng)絡(luò)旅游平臺中用戶自發(fā)上傳的點(diǎn)評、路線等旅游信息數(shù)據(jù)的基礎(chǔ)上,為普通游客用戶、旅游規(guī)劃人員、研究人員提供一個直觀的旅游信息可視化平臺,包括POI地圖可視化、熱門旅游路線地圖可視化、點(diǎn)評熱度可視化、時序變化特征統(tǒng)計圖等,改變了傳統(tǒng)旅游信息單一的展示方式,提升了用戶體驗(yàn),能夠滿足用戶的實(shí)際應(yīng)用需求。
[關(guān)鍵詞]旅游信息平臺;信息可視化;眾源旅游數(shù)據(jù)
doi:10.3969/j.issn.1673 - 0194.2019.02.075
[中圖分類號]TP311 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673-0194(2019)02-0-04
0 引 言
目前,旅游業(yè)已成為國民經(jīng)濟(jì)的戰(zhàn)略性支柱產(chǎn)業(yè),2017年國內(nèi)游客數(shù)量達(dá)到50億人,國內(nèi)旅游收入達(dá)45 661億元。2018年,國家旅游局與文化部合并,組建文化和旅游部,這標(biāo)志著文化、旅游統(tǒng)籌管理,資源配置更合理。在智慧旅游不斷發(fā)展的背景下,旅游業(yè)已進(jìn)入大眾化、全域化時代。互聯(lián)網(wǎng)技術(shù)和自媒體平臺的迅速發(fā)展一方面為旅游者分享旅游經(jīng)歷、提供出行建議帶來了巨大的便利;另一方面為計劃出行者進(jìn)行游玩規(guī)劃提供了極具代表性和可靠性的重要參考依據(jù)。目前,在線旅游信息平臺主要有地方政府宣傳網(wǎng)站以及專業(yè)旅游服務(wù)網(wǎng)站。由政府職能部門主辦的以政務(wù)資訊、地區(qū)介紹為主的地方政府宣傳網(wǎng)站,主要發(fā)布旅游新聞、政策條例、旅游數(shù)據(jù)等信息。以旅游資訊為內(nèi)容的專業(yè)旅游服務(wù)網(wǎng)站,如攜程、去哪兒網(wǎng)等,它們主要關(guān)注旅游產(chǎn)品及相關(guān)服務(wù)的交易,在此類旅游網(wǎng)站中用戶自主上傳的攻略、心得、評價和照片等眾源數(shù)據(jù)往往是極具參考價值的信息,能夠填補(bǔ)當(dāng)前旅游數(shù)據(jù)采集過程中的空白。然而,現(xiàn)有的旅游地理信息平臺沒有充分體現(xiàn)地理信息技術(shù)在數(shù)據(jù)處理和信息集成方面的強(qiáng)大潛能,導(dǎo)致當(dāng)前地理信息技術(shù)與旅游信息化的結(jié)合面臨諸多困惑。主要問題有:第一,許多旅游宣傳網(wǎng)站的內(nèi)容僅僅展示的是地區(qū)發(fā)展動態(tài)、文件政策等信息,對于旅游數(shù)據(jù)的展示較為單調(diào)且不夠直觀,容易讓以游客為主的用戶難以尋找到其感興趣的旅游資訊,導(dǎo)致訪客的范圍和數(shù)量都較為有限;第二,宣傳網(wǎng)站在平臺設(shè)計上缺乏互動性,僅在信息宣傳方面發(fā)揮了作用,不能利用現(xiàn)有的數(shù)據(jù)庫和網(wǎng)絡(luò)技術(shù)進(jìn)行用戶交互,導(dǎo)致用戶體驗(yàn)較差。
為解決以上問題,本平臺在采集眾源旅游數(shù)據(jù)的基礎(chǔ)上,開發(fā)了一個集景點(diǎn)信息檢索、分析、展示等功能于一體的旅游信息可視化平臺。結(jié)合網(wǎng)絡(luò)爬蟲技術(shù)采集眾源數(shù)據(jù),通過對數(shù)據(jù)進(jìn)行一系列的處理和分析,使數(shù)據(jù)的展現(xiàn)形式更加直觀詳細(xì)。通過信息可視化的方式,解決了信息展示單調(diào)的問題,能夠幫助游客更好、更快地了解景點(diǎn),通過用戶交互的體驗(yàn)方式構(gòu)建可視化平臺,彌補(bǔ)了現(xiàn)有旅游宣傳網(wǎng)站用戶交互性弱的不足,能夠提升用戶體驗(yàn),對于游客了解當(dāng)?shù)匚幕吐糜尉哂兄匾囊饬x。
1 數(shù)據(jù)采集與處理
本平臺應(yīng)用于CODA重慶開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽的參賽產(chǎn)品“優(yōu)游出行”中,以重慶市作為開發(fā)案例,利用網(wǎng)絡(luò)爬蟲的方式采集了去哪兒網(wǎng)、攜程網(wǎng)、馬蜂窩網(wǎng)3家在線旅游平臺的重慶旅游景點(diǎn)信息,包括POI信息、點(diǎn)評信息、旅游路線信息,通過數(shù)據(jù)清洗、集成、變換、歸約對眾源數(shù)據(jù)進(jìn)行一系列的預(yù)處理,以此構(gòu)建眾源旅游景點(diǎn)數(shù)據(jù)庫并應(yīng)用于平臺中。
1.1 數(shù)據(jù)采集
網(wǎng)頁數(shù)據(jù)采集最常用的方法是網(wǎng)絡(luò)爬蟲,它可以按照一定的程序或者規(guī)則自動地從互聯(lián)網(wǎng)上抓取相關(guān)的資源與信息。本平臺應(yīng)用Python語言設(shè)計一個具有模塊化的網(wǎng)絡(luò)爬蟲程序,采集流程如圖1所示。
針對旅游景點(diǎn)POI、點(diǎn)評數(shù)據(jù)、旅游路線數(shù)據(jù)所需采集的內(nèi)容不同,設(shè)計了不同的采集模塊。旅游景點(diǎn)POI需要采集景點(diǎn)名稱、地址、經(jīng)緯度坐標(biāo)、景點(diǎn)簡介、景點(diǎn)評分、點(diǎn)評數(shù)量、景點(diǎn)類型、開放時間、建議游玩時間、聯(lián)系方式、官網(wǎng)以及該景點(diǎn)對應(yīng)的網(wǎng)頁鏈接,其中景點(diǎn)名稱、地址、經(jīng)緯度和網(wǎng)頁鏈接在采集的過程中不能為空值,網(wǎng)頁鏈接必須為唯一值。采集每個景點(diǎn)中所包含的每一條點(diǎn)評數(shù)據(jù),包括點(diǎn)評內(nèi)容、評分、點(diǎn)評時間以及點(diǎn)評用戶。采集的旅游路線數(shù)據(jù)包括出游天數(shù)、出游日期、途徑的旅游POI以及發(fā)表該路線的用戶。
1.2 數(shù)據(jù)處理
數(shù)據(jù)處理是構(gòu)建可視化平臺過程中不可或缺的步驟,由于數(shù)據(jù)采集的來源不同且數(shù)據(jù)質(zhì)量參差不齊,導(dǎo)致采集到的眾源數(shù)據(jù)存在許多噪聲,為了節(jié)省時間和空間,需要對數(shù)據(jù)進(jìn)行預(yù)處理操作。數(shù)據(jù)處理操作的流程圖如圖2所示。
在數(shù)據(jù)清洗的操作中對數(shù)據(jù)的缺失值、噪聲以及不一致的數(shù)據(jù)進(jìn)行處理,例如對于景點(diǎn)POI中點(diǎn)評數(shù)量字段的缺失值使用零值填充,對于表示時間日期的字段統(tǒng)一采用八位數(shù)字編寫,將多個平臺采集到的數(shù)據(jù)合并并存放至統(tǒng)一的可視化平臺數(shù)據(jù)庫中,因此需要對多個數(shù)據(jù)庫進(jìn)行集成。
由于旅游路線數(shù)據(jù)是純文字的數(shù)據(jù),在該平臺中則需要先對其進(jìn)行地理空間化,通過旅游景點(diǎn)POI將路線轉(zhuǎn)化為帶有空間地理位置信息的數(shù)據(jù),便可以實(shí)現(xiàn)路線的地圖展示功能。運(yùn)用空間匹配和空間地統(tǒng)計的手段對空間數(shù)據(jù)進(jìn)行計算,綜合考慮數(shù)據(jù)量及運(yùn)行效率,選擇開源的MySQL作為平臺數(shù)據(jù)庫,將集成及計算后的數(shù)據(jù)統(tǒng)一存入庫中。
2 構(gòu)建可視化平臺
平臺采用B/S模式開發(fā),通過引入Web服務(wù)器完成終端與數(shù)據(jù)服務(wù)器的無縫銜接,網(wǎng)頁端采用C#、ASP.NET、AJAX的終端開發(fā)技術(shù),后臺數(shù)據(jù)庫管理采用穩(wěn)定高效的MySQL實(shí)現(xiàn)。
2.1 平臺架構(gòu)設(shè)計
可視化平臺的整體架構(gòu)使用傳統(tǒng)的MVC框架進(jìn)行設(shè)計。MVC即模型(Model)—視圖(View)—控制器(Controller),是一種業(yè)務(wù)層、數(shù)據(jù)層以及控制層三層分離的開發(fā)架構(gòu)。平臺技術(shù)架構(gòu)圖如圖3所示。
數(shù)據(jù)層為整個平臺提供數(shù)據(jù)處理以及數(shù)據(jù)存儲服務(wù),起到了數(shù)據(jù)支撐的作用。數(shù)據(jù)層使用SQL語句完成業(yè)務(wù)邏輯的數(shù)據(jù)讀寫任務(wù),利用MySQL數(shù)據(jù)庫實(shí)現(xiàn)對業(yè)務(wù)數(shù)據(jù)的存儲與管理。
控制層是整個平臺的核心組件,是業(yè)務(wù)層與數(shù)據(jù)層之間的橋梁。它接收來自客戶層的數(shù)據(jù)請求,并根據(jù)具體的業(yè)務(wù)類別對該請求做出正確業(yè)務(wù)邏輯處理。同時,應(yīng)用層又是數(shù)據(jù)庫的對外窗口,用于對數(shù)據(jù)庫進(jìn)行數(shù)據(jù)處理操作。
業(yè)務(wù)層主要實(shí)現(xiàn)用戶與平臺之間的交互操作、可視化展現(xiàn)以及業(yè)務(wù)層與控制層的數(shù)據(jù)請求。詳細(xì)的技術(shù)路線包括以下幾個方面。
(1)前端可視化交互界面。業(yè)務(wù)層利用HTML結(jié)合CSS的網(wǎng)頁前端編程技術(shù)開發(fā)平臺的前端可視化交互界面,提供用戶與平臺進(jìn)行交互操作的窗口。
(2)旅游數(shù)據(jù)可視化展現(xiàn)。業(yè)務(wù)層以高德地圖JavaScript API作為本平臺的WebGIS組件。高德地圖JavaScript API可構(gòu)建功能豐富、交互性強(qiáng)的地圖應(yīng)用程序,除了基本地圖功能外,還可實(shí)現(xiàn)地點(diǎn)搜索、路線規(guī)劃、定位、地址解析、行政區(qū)查詢等數(shù)據(jù)服務(wù)。本平臺利用高德地圖JavaScript API中的地圖顯示、地圖放大縮小、鷹眼等GIS服務(wù),實(shí)現(xiàn)地圖應(yīng)用功能。結(jié)合Echarts的數(shù)據(jù)可視化框架,實(shí)現(xiàn)統(tǒng)計信息的可視化。
(3)業(yè)務(wù)層與控制層之間的數(shù)據(jù)請求。業(yè)務(wù)層利用基于AJAX的數(shù)據(jù)異步交互技術(shù)向控制層發(fā)送數(shù)據(jù)請求并接收來自數(shù)據(jù)層返回的JSON格式的返回數(shù)據(jù),通過解析該JSON格式的返回數(shù)據(jù)來獲取請求的數(shù)據(jù),這個過程是一次完整的前端數(shù)據(jù)獲取過程。
2.2 平臺數(shù)據(jù)庫設(shè)計
平臺數(shù)據(jù)庫主要設(shè)計了4張表:ScenicSpot表、Route表、Comment表以及CalComment表。ScenicSpot表為旅游景點(diǎn)表,存儲平臺中包含的重慶市旅游景點(diǎn)及其信息屬性;Route表為旅游路線表,存儲平臺中所采集到的重慶市眾源旅游路線數(shù)據(jù);Comment表為點(diǎn)評表,存儲平臺采集的有關(guān)景點(diǎn)的所有點(diǎn)評數(shù)據(jù);CalComment表為點(diǎn)評統(tǒng)計表,是用來存儲由Comment表中的點(diǎn)評數(shù)據(jù)經(jīng)過計算和處理后得到的各項(xiàng)信息,使得在調(diào)用數(shù)據(jù)庫的過程中能簡化操作和計算量,節(jié)約平臺的運(yùn)行時間和空間。
2.3 平臺功能設(shè)計與實(shí)現(xiàn)
旅游信息可視化平臺主要分為景點(diǎn)可視化和路線可視化兩大模塊,其中景點(diǎn)可視化又包含了其中的點(diǎn)評可視化。在景點(diǎn)可視化中,利用高德地圖API實(shí)現(xiàn)了景點(diǎn)分布的地圖展示,用戶可在地圖頁面查看重慶市分布的各個旅游景點(diǎn),檢索自己感興趣的景點(diǎn)。通過點(diǎn)擊某一景點(diǎn),能夠在彈窗中查看該景點(diǎn)的詳細(xì)信息。
綜合計算景點(diǎn)的點(diǎn)評、評分,利用Echarts條形圖生成景點(diǎn)綜合關(guān)注度排名統(tǒng)計圖,用戶可通過訪問此統(tǒng)計圖了解當(dāng)下熱門景點(diǎn)的排名情況。針對單個景點(diǎn),平臺還提供了景點(diǎn)評價傾向占比圖,使用戶能夠了解該景點(diǎn)正面評價、中性評價、負(fù)面評價各自在所有評價中所占的比例是多少,從另一個角度了解這個景點(diǎn)。對點(diǎn)評詞條進(jìn)行關(guān)鍵詞提取并展示,用戶可了解到該景點(diǎn)具有哪些屬性,大眾對于該景點(diǎn)的普遍評價是什么,以便在游覽景點(diǎn)的過程中可以更有側(cè)重點(diǎn)。對于最正面的評價和最負(fù)面的評價,平臺也對其進(jìn)行了信息提取和可視化以展示在用戶面前。點(diǎn)評可視化功能如圖4所示。
用戶選擇路線查看功能可訪問到所有路線信息,路線可視化模塊亦提供了景點(diǎn)選項(xiàng),選擇感興趣的景點(diǎn)即可查看包含該景點(diǎn)的旅游路線,為行程規(guī)劃提供參考。路線可視化模塊如圖5所示。
3 結(jié) 語
本平臺充分利用網(wǎng)絡(luò)技術(shù)在信息可視化方面的優(yōu)勢,研究基于眾源數(shù)據(jù)的旅游信息可視化平臺的需求與架構(gòu)。通過信息可視化的方式,實(shí)現(xiàn)地圖展示與統(tǒng)計相結(jié)合,使用戶可以直觀地了解歷史游客對目的地(重慶)的評價以及POI的關(guān)注熱度,解決了平臺表現(xiàn)形式單一的問題,將信息以一種更加直觀、更加容易被理解的形式展現(xiàn)在用戶面前。通過用戶交互的體驗(yàn)方式構(gòu)建可視化平臺,彌補(bǔ)了現(xiàn)有旅游宣傳網(wǎng)站用戶交互性弱的不足,提升了用戶體驗(yàn)。引入眾源旅游數(shù)據(jù)庫,將由真實(shí)用戶產(chǎn)生的數(shù)據(jù)應(yīng)用到平臺中,豐富數(shù)據(jù)來源,能夠使信息更為全面。普通游客用戶通過訪問平臺,可以進(jìn)一步了解城市文化,為出游提供參考建議;旅游規(guī)劃人員以及相關(guān)研究人員可通過該平臺實(shí)時了解目的地旅游現(xiàn)狀,與原有的規(guī)劃研究進(jìn)行對比分析。基于眾源旅游數(shù)據(jù)的可視化平臺不僅能夠促進(jìn)地理信息技術(shù)與文化旅游產(chǎn)業(yè)信息化深度結(jié)合,也使地理空間位置信息在旅游個性化服務(wù)中發(fā)揮重要作用。下一步的工作是繼續(xù)完善計算模型,添加輔助決策等應(yīng)用,拓寬平臺功能。
主要參考文獻(xiàn)
[1]李俊樓,馬衛(wèi).我國旅游業(yè)電子商務(wù)發(fā)展現(xiàn)狀及策略分析[J].電子商務(wù),2013(9).
[2]王守成,郭風(fēng)華,傅學(xué)慶,等.基于自發(fā)地理信息的旅游地景觀關(guān)注度研究——以九寨溝為例[J].旅游學(xué)刊,2014(2).
[3]林妙亭.新疆刀郎非物質(zhì)文化遺產(chǎn)旅游網(wǎng)絡(luò)平臺開發(fā)設(shè)計[D].上海:東華大學(xué),2014.
[4]邊馥苓.時空大數(shù)據(jù)的技術(shù)與方法[M].北京:測繪出版社,2016.
[5]柳永坡,劉雪梅,趙長海.JSP應(yīng)用開發(fā)技術(shù)[M].北京:人民郵電出版社,2005.
[6]張宜生,張樂福,梁書云.計算機(jī)網(wǎng)絡(luò)與數(shù)據(jù)庫技術(shù)及其工業(yè)應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2001.
[7]劉子軒,艾廷華.自適應(yīng)顯示環(huán)境可視化表達(dá)的線要素圖形化簡[J].測繪地理信息,2017(1).
[8]楊波,王繼周,毛曦,等.基于K-means算法的突發(fā)事件地理信息空間化研究[J].測繪通報,2018(7).
[9]谷眾源,宋喆.水平定向非開挖地下管線三維探測成像技術(shù)的應(yīng)用[J].上海電力,2010(2).
[10]肖展春.基于地理信息系統(tǒng)的湖北省主要旅游景區(qū)可視化信息發(fā)布研究[J].科技創(chuàng)業(yè)月刊,2009(11).
[12]李成,趙軍.基于Web of Science的旅游管理研究信息可視化分析[J].旅游學(xué)刊,2014(4).
[13]馮娟,張雅麗,梁棟棟.基于Echarts的居民出游時空可視化研究——以蕪湖市為例[J].電腦知識與技術(shù),2017(31).
[14]柳向東,陳錦嵐.旅游電商對產(chǎn)品區(qū)域異質(zhì)性的提升策略研究——基于大數(shù)據(jù)與數(shù)據(jù)可視化方法[J].統(tǒng)計與信息論壇,2017(8).
[15]魯天學(xué).基于知識圖譜的我國體育旅游研究領(lǐng)域可視化研究[J].南京體育學(xué)院學(xué)報:自然科學(xué)版,2017(2).
[16]包詩亮,周偉強(qiáng),祝若鑫,等.基于OpenLayers和WebSocket的旅游資源配置實(shí)時可視化設(shè)計與實(shí)現(xiàn)[J].測繪與空間地理信息, 2017(12).