張占昭,宋漢珍,衡軍山,牟學(xué)鵬,王立萍
(承德石油高等??茖W(xué)校 計算機與信息工程系,河北 承德 067000)
?
智慧旅游信息系統(tǒng)中大數(shù)據(jù)技術(shù)的應(yīng)用
張占昭,宋漢珍,衡軍山,牟學(xué)鵬,王立萍
(承德石油高等專科學(xué)校 計算機與信息工程系,河北承德067000)
智慧旅游信息系統(tǒng)一端連接數(shù)據(jù)中心,另一端連接各種終端,為其提供各種與智慧旅游相關(guān)的服務(wù)信息。顯然在智慧旅游信息系統(tǒng)中,大數(shù)據(jù)技術(shù)起著基礎(chǔ)和關(guān)鍵的作用。在對傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)以及大數(shù)據(jù)技術(shù)進行研究的基礎(chǔ)上,進而著力分析了大數(shù)據(jù)技術(shù)在智慧旅游信息系統(tǒng)中的具體應(yīng)用,力求為智慧旅游提供可行的研究思路和方法。
智慧旅游;大數(shù)據(jù)技術(shù);信息系統(tǒng)
智慧旅游是將物聯(lián)網(wǎng)技術(shù)、通信技術(shù)、互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)、云計算等現(xiàn)代先進技術(shù)運用到旅游的相關(guān)領(lǐng)域中,如旅游參與者、旅游產(chǎn)業(yè)、旅游行政管理部門等,其中大數(shù)據(jù)是實現(xiàn)智慧旅游各項功能的基礎(chǔ),起著至關(guān)重要的作用。智慧旅游信息系統(tǒng)一般由服務(wù)器端和客戶端構(gòu)成,而服務(wù)器端的重要支撐是大數(shù)據(jù)中心,服務(wù)器從數(shù)據(jù)中心獲取數(shù)據(jù),通過物聯(lián)網(wǎng)、互聯(lián)網(wǎng)、無線通信網(wǎng)等傳輸技術(shù)向客戶端傳送數(shù)據(jù)信息,用戶通過數(shù)據(jù)信息在旅游中做出智能判斷和決策,使旅游出行更加方便快捷。
1.1傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)
數(shù)據(jù)承載的信息量小、信息處理能力低下、數(shù)據(jù)分析技術(shù)和軟件有限是傳統(tǒng)數(shù)據(jù)的重要標(biāo)志,同時數(shù)據(jù)采集手段單一,導(dǎo)致隨機采樣分析在整個數(shù)據(jù)的處理過程中顯得更加重要,這種數(shù)據(jù)分析方法是對少量數(shù)據(jù)進行隨機采樣,然后通過分析這少量數(shù)據(jù)來獲取盡可能多的信息,信息本身和數(shù)據(jù)量沒有多大關(guān)系。這種分析數(shù)據(jù)的方法不可避免地會出現(xiàn)致命問題,如隨著數(shù)據(jù)量的不斷增加,分析工作越來變得越困難;隨著數(shù)據(jù)不斷深入分析,分析結(jié)果誤差越來越大,甚至出現(xiàn)錯誤;隨著新數(shù)據(jù)的不斷涌現(xiàn),需要對新數(shù)據(jù)進行重新采集、處理、分析,這顯然不能滿足現(xiàn)代信息社會發(fā)展的需要。
隨著物聯(lián)網(wǎng)產(chǎn)業(yè)以及感知技術(shù)的迅猛發(fā)展,數(shù)據(jù)的內(nèi)涵發(fā)生了本質(zhì)的變化,大數(shù)據(jù)不僅僅是大量數(shù)據(jù)的簡稱,還包含了數(shù)據(jù)類型多、數(shù)據(jù)處理速度快、采集手段多樣、數(shù)據(jù)存儲和分析技術(shù)高效等相關(guān)內(nèi)容。
1.2大數(shù)據(jù)技術(shù)
大數(shù)據(jù)技術(shù)的核心內(nèi)容是將時間上、空間上產(chǎn)生的海量數(shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)進行收集、分析、轉(zhuǎn)換、存儲、管理、挖掘、創(chuàng)新、利用等,其中為海量數(shù)據(jù)搭建數(shù)據(jù)倉庫是數(shù)據(jù)存儲的必要環(huán)節(jié),然后按照各個信息系統(tǒng)的不同要求設(shè)計相應(yīng)的數(shù)據(jù)庫,進而形成每個信息系統(tǒng)的數(shù)據(jù)中心,為信息系統(tǒng)每個模塊的智能決策提供支持[1]。數(shù)據(jù)倉庫技術(shù)是大數(shù)據(jù)技術(shù)的核心技術(shù),主要包括數(shù)據(jù)源的相關(guān)技術(shù)和海量數(shù)據(jù)存儲兩部分內(nèi)容,而數(shù)據(jù)倉庫的內(nèi)涵是數(shù)據(jù)創(chuàng)新。
在大型信息系統(tǒng)中,數(shù)據(jù)的來源十分復(fù)雜,致使數(shù)據(jù)存儲形態(tài)多樣,所以存儲之前要對數(shù)據(jù)進行有效的整合,數(shù)據(jù)整合技術(shù)是通過對海量數(shù)據(jù)(包括空間數(shù)據(jù)、屬性數(shù)據(jù)、動態(tài)數(shù)據(jù))進行集成,使之與不同的信息系統(tǒng)相對應(yīng),旨在通過數(shù)據(jù)整合,大大增加數(shù)據(jù)的利用效率,最大限度減少信息孤島的出現(xiàn)[2]??臻g數(shù)據(jù)主要包括采集和測量的數(shù)據(jù)、地圖信息數(shù)據(jù)、地名和地址數(shù)據(jù)等,整合時需要將所有信息用諸如GIS通用軟件將其轉(zhuǎn)換成數(shù)字信號;對矢量數(shù)據(jù)進行數(shù)據(jù)格式整合,可以用FME等軟件進行轉(zhuǎn)換;數(shù)據(jù)坐標(biāo)的優(yōu)化可用點線面數(shù)學(xué)模型進行轉(zhuǎn)換;數(shù)據(jù)屬性格式化操作可采用編碼方式將屬性和地理位置一對一或一對多進行對應(yīng);動態(tài)數(shù)據(jù)如流量的測試、視頻的監(jiān)控等要利用物聯(lián)網(wǎng)技術(shù)、互聯(lián)網(wǎng)技術(shù)向指定服務(wù)器上傳,服務(wù)器獲取后用軟件技術(shù)和算法進行存儲,最后供管理人員進行如景區(qū)規(guī)劃、景區(qū)建設(shè)、景區(qū)管理等方面決策時提供保障。
1.3數(shù)據(jù)挖掘Apriori算法
數(shù)據(jù)挖掘Apriori算法的設(shè)計思路是利用遞推方法和逐層迭代搜索找到所有層次的頻繁集,條件是支持度大于最小支持度,然后用找到的頻繁集生成滿足置信度的關(guān)聯(lián)規(guī)則。其中迭代函數(shù)主要任務(wù)是生產(chǎn)i層候選集,方法是通過連接i-1層頻繁集,候選集大大減少了數(shù)量的原因是判斷頻繁集的非空子集,方法是判斷該超集項中所有 i-1 子項是否完全包含于 i-1層頻繁集中,如果完全包含則該項為 i層候選集項,不包含就刪除該超集項。
2.1智慧旅游中數(shù)據(jù)的流程
在智慧旅游信息系統(tǒng)中,由于與旅游數(shù)據(jù)相關(guān)的實體種類繁雜,導(dǎo)致旅游數(shù)據(jù)具有多樣性,這些數(shù)據(jù)要經(jīng)歷采集、分析、歸類、挖掘、選取、裝載等過程,這也是大數(shù)據(jù)技術(shù)具體運用的整個流程[3]。
數(shù)據(jù)采集就是將與旅游相關(guān)實體如吃住行游購娛等進行數(shù)據(jù)收集的過程,該過程既可以用傳統(tǒng)方式如照相機、錄像機、掃描儀、檢測儀等進行采集,也可以用與物聯(lián)網(wǎng)相關(guān)的感知技術(shù)如傳感器、GPS等進行采集;數(shù)據(jù)分類和選取不僅要對傳統(tǒng)格式數(shù)據(jù)如文字和圖像進行歸類選取,也要將超媒體和多媒體信息融入到信息系統(tǒng)中去,選取后還要進行屬性的劃分;數(shù)據(jù)挖掘不是直接采集的數(shù)據(jù),不能停留在數(shù)據(jù)表達的表層意義,要對旅游數(shù)據(jù)進行選取和分類后進行,是對現(xiàn)有數(shù)據(jù)利用數(shù)據(jù)挖掘技術(shù)進行的二次、三次分析,這樣的數(shù)據(jù)可以給旅游管理部門提供智能決策支持;數(shù)據(jù)倉庫構(gòu)建符合智慧旅游相關(guān)數(shù)據(jù)結(jié)構(gòu)和關(guān)系的數(shù)據(jù)中心;數(shù)據(jù)處理是利用相關(guān)軟件對數(shù)據(jù)倉庫中的數(shù)據(jù)進行規(guī)范化處理,包含的內(nèi)容有數(shù)據(jù)格式的統(tǒng)一、誤差的消除、編碼的唯一性、精度的提高等;數(shù)據(jù)加載是將處理好的數(shù)據(jù)裝入到關(guān)系數(shù)據(jù)庫中去的過程,如oracle數(shù)據(jù)庫。
2.2智慧旅游信息系統(tǒng)中數(shù)據(jù)倉庫的設(shè)計
智慧旅游信息系統(tǒng)的主要是向旅游參與者、旅游行政管理人員等提供智能決策功能,對數(shù)據(jù)信息提出了更高的要求,如對多樣性的數(shù)據(jù)、實時動態(tài)數(shù)據(jù)、數(shù)據(jù)的準(zhǔn)確性、數(shù)據(jù)格式的規(guī)范性等方面都提出了新的要求,這些要求也促使與大數(shù)據(jù)相關(guān)的技術(shù)也得到迅速發(fā)展。如數(shù)據(jù)分析技術(shù)由傳統(tǒng)的采樣分析轉(zhuǎn)變?yōu)楹A繑?shù)據(jù)分析,由于分析結(jié)果基于全部數(shù)據(jù),致使預(yù)測結(jié)果有著先天優(yōu)勢,為智慧旅游做出更可靠決策提供保證;數(shù)據(jù)處理技術(shù)由傳統(tǒng)的單一計算機轉(zhuǎn)變?yōu)樵朴嬎?,使對海量?shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)等的處理成為了現(xiàn)實;數(shù)據(jù)存儲技術(shù)則包含了數(shù)據(jù)倉庫技術(shù)、數(shù)據(jù)存儲結(jié)構(gòu)和算法、視頻數(shù)據(jù)的維護、磁盤陣列的設(shè)計等內(nèi)容,目前海量存儲技術(shù)的關(guān)鍵是用文件系統(tǒng)來構(gòu)建共享的數(shù)據(jù)系統(tǒng)。
數(shù)據(jù)倉庫是大數(shù)據(jù)技術(shù)在智慧旅游信息系統(tǒng)中最重要的應(yīng)用,信息系統(tǒng)中每個子模塊的數(shù)據(jù)流程都與數(shù)據(jù)倉庫的設(shè)計內(nèi)容、方法、結(jié)構(gòu)有直接關(guān)系,影響數(shù)據(jù)中心中數(shù)據(jù)的利用效率。數(shù)據(jù)倉庫的搭建是建立在不斷對信息系統(tǒng)需求深入分析、不斷細(xì)化,對數(shù)據(jù)主體不斷抽象基礎(chǔ)之上,進而加載到每個模塊的關(guān)系型數(shù)據(jù)庫中去,數(shù)據(jù)庫的構(gòu)建結(jié)構(gòu)上力求功能齊全,如滿足基本的增刪改查詢等功能。而數(shù)據(jù)倉庫的著力點應(yīng)在每個子模塊的功能上,多從實際用戶需求方面考慮結(jié)構(gòu)該如何設(shè)計,將數(shù)據(jù)需求劃分成不同的子模塊,同時為了方便數(shù)據(jù)加載,也需要將數(shù)據(jù)庫分成不同的子數(shù)據(jù)庫,目的是滿足功能的同時提高數(shù)據(jù)利用效率??傮w來講,我們可以將智慧旅游數(shù)據(jù)倉庫設(shè)計成如圖1所示。
總之大數(shù)據(jù)技術(shù)將海量數(shù)據(jù)進行處理后,為旅游者、旅游管理部門、旅游產(chǎn)業(yè)等相關(guān)者提供高效、準(zhǔn)確、規(guī)范的數(shù)據(jù)支持,在智慧旅游信息系統(tǒng)中,運用數(shù)據(jù)倉庫技術(shù)和大數(shù)據(jù)整合技術(shù)等可以為構(gòu)建智慧旅游提供數(shù)據(jù)基礎(chǔ),為信息服務(wù)和智能決策提供幫助,加強智慧旅游的內(nèi)涵建設(shè)。
[1]馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013(2):10-17.
[2]劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學(xué)學(xué)報,2014,48(6):957-972.
[3]張欣.智慧旅游感知體系和管理平臺的構(gòu)建[J].江蘇人學(xué)學(xué)報(社會科學(xué)版),2013,13(6):67-75.
Analysis on Application of Big Data Technology in Intelligent Tourism Information System
ZHANG Zhan-zhao, SONG Han-zhen, HENG Jun-shan, MU Xue-peng, WANG Li-ping
(Department of Computer and Information Engineering, Chengde Petroleum College, Chengde 067000, Hebei, China)
The wisdom of tourism information system is connected with one end of a data center, and the other end is connected with a variety of terminal, to provide various service information related to intelligent tourism. Obviously in intelligent tourism information system, big data technology plays a fundamental and critical role. Based on the traditional data and big data as well as big data technology research, this paper focuses on the analysis of the specific application of big data technology in intelligent tourism information system, and strives to provide feasible research ideas and methods for intelligent tourism.
intelligent tourism;big data technology;information system
河北省高等學(xué)校自然科學(xué)青年基金項目(物聯(lián)網(wǎng)技術(shù)在承德智慧旅游系統(tǒng)的應(yīng)用研究):QN2016262
2016-03-08
張占昭(1978-),男,河北保定人,承德石油高等??茖W(xué)校計算機與信息工程系講師,碩士,主要研究方向為物聯(lián)網(wǎng)技術(shù)、嵌入式系統(tǒng)。
F59
A
1008-9446(2016)04-0049-03