鄭俊+樓佳媛
摘 要: 提出基于旅游需求模板的景區(qū)評價數(shù)據(jù)分析輿情滿意度方法。通過基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建、關(guān)鍵詞模板庫的擴充、針對景區(qū)評價數(shù)據(jù)的輿情滿意度的分析和景區(qū)輿情與滿意度分析模型的構(gòu)建,給出了具體實施方式,解決了以往游客游記、評價等非結(jié)構(gòu)化內(nèi)容難以被其他游客高效搜索利用的問題,不僅可以向游客提供某個景區(qū)的綜合滿意度值,還可以向游客提供該景區(qū)具體的關(guān)于吃、住、行、游、購、娛六個方面的滿意度值,以及比吃、住、行、游、購、娛更具體的相關(guān)內(nèi)容的滿意度值,從而讓游客快速了解該景區(qū)的各個評價參數(shù)。
關(guān)鍵詞: 關(guān)鍵詞模板庫; 景區(qū)輿情; 滿意度; 評價數(shù)據(jù)
中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2017)03-62-03
Abstract: This paper puts forward a method of analyzing public opinion and satisfaction on the evaluation data of scenic spots based on tourist demand template. By means of keywords template library building and expansion based on the template of tourism demand, the paper analyses and builds the model of the public opinion and satisfaction on the evaluation data. It solves the problem that unstructured content such as tourists' travels and evaluation cannot be efficiently searched and utilized by other tourists. It can not only provide tourists with scenic spots' comprehensive satisfaction value, but also satisfaction values in the specific area of cuisine, housing, transportation, travelling, shopping, and entertainment, and even more specific related content of the satisfaction value in those six aspects. Thus it helps visitors quickly understand the evaluation of the various parameters of the area.
Key words: template library; public opinion of scenic spots; satisfaction; evaluation data
0 引言
隨著經(jīng)濟的發(fā)展,現(xiàn)在已經(jīng)進入旅游智能化階段和大數(shù)據(jù)的時代,游客通常通過查看媒體互動分享評價來決定自己旅游計劃。然而,傳統(tǒng)游客在游記中對景區(qū)景點的評價內(nèi)容是非結(jié)構(gòu)化、離散的,即難以采用一定的算法對其進行有規(guī)律地提取和組織,從而導(dǎo)致不能采用計算機智能對其提取分類。然而游客對“吃、住、行、游、購、娛”的評價獲取需求頗為急切,因此需要采用一種新的技術(shù)來實現(xiàn)游客評價的自動化提取并對大量的數(shù)據(jù)進行高效的有價值的分析[1-3]。
1 本文提出的方法步驟及特征
本文提出一種基于旅游需求模板的景區(qū)評價數(shù)據(jù)分析輿情滿意度方法,主要有基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建(見圖1)、關(guān)鍵詞模板庫的擴充(見圖2)和針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算三個步驟。該方法的特征在于:所述的旅游需求模板主要由內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞[4-5]。
1.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
主要由基于旅游需求模板引導(dǎo)評價的內(nèi)容大類關(guān)鍵詞、內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞構(gòu)成,每個內(nèi)容大類關(guān)鍵詞下分屬有其對應(yīng)的內(nèi)容子類關(guān)鍵詞,每個內(nèi)容子類關(guān)鍵詞下分屬有其對應(yīng)的情感關(guān)鍵詞。
關(guān)鍵詞模板庫初始由列舉而成,所述的內(nèi)容大類關(guān)鍵詞包括吃、住、行、游、購、娛的六個類別;所述的內(nèi)容子類關(guān)鍵詞是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建的;所述情感關(guān)鍵詞是對內(nèi)容子類關(guān)鍵詞的描述性詞語。
1.2 關(guān)鍵詞模板庫的擴充
關(guān)鍵詞模板庫的擴充具體是采用以下方式對內(nèi)容子類關(guān)鍵詞和情感關(guān)鍵詞進行擴充:
⑴ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞所在段落文字附近搜索內(nèi)容子類關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的內(nèi)容子類關(guān)鍵詞作為新的內(nèi)容子類關(guān)鍵詞,并加入到關(guān)鍵詞模板庫中;
⑵ 在已構(gòu)建的關(guān)鍵詞模板庫基礎(chǔ)上,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容子類關(guān)鍵詞所在段落文字附近搜索情感關(guān)鍵詞,將找到的在已構(gòu)建關(guān)鍵詞模板庫中不存在的情感關(guān)鍵詞作為新的情感關(guān)鍵詞,對新的情感關(guān)鍵詞賦權(quán)值后加入到關(guān)鍵詞模板庫中。
1.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
所述針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算具體是:由擴充后的關(guān)鍵詞模板庫通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)下的文字數(shù)據(jù),抽取出內(nèi)容大類關(guān)鍵詞所在段落文字附近的內(nèi)容子類關(guān)鍵詞,再搜索抽取出每個內(nèi)容子類關(guān)鍵詞所在段落文字附近的情感關(guān)鍵詞,從而獲得所有情感關(guān)鍵詞及其每個情感關(guān)鍵詞對應(yīng)的內(nèi)容子類關(guān)鍵詞和內(nèi)容大類關(guān)鍵詞,然后構(gòu)建景區(qū)輿情與滿意度的分析模型,通過景區(qū)輿情與滿意度的分析模型獲得以平均滿意度值作為該景區(qū)的輿情滿意度值。
2 景區(qū)輿情與滿意度的分析模型
⑴ 先采用以下公式計算獲得文字數(shù)據(jù)中所有評論中的關(guān)于某一個內(nèi)容子類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的平均滿意度值,t是分值(1~5),表示i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的數(shù)量,Bij表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞,B{B11,B12,B13…B21,B22,B23…}代表內(nèi)容子類關(guān)鍵詞集合。
⑵ 再采用以下公式計算獲得文字數(shù)據(jù)中一個內(nèi)容大類關(guān)鍵詞的滿意度值:
其中,表示第i個內(nèi)容大類關(guān)鍵詞的滿意度值,表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞的權(quán)值,n表示第i個內(nèi)容大類關(guān)鍵詞下內(nèi)容子類關(guān)鍵詞的數(shù)量,A{A1,A2,…,A6}代表內(nèi)容大類關(guān)鍵詞集合。
⑶ 再采用以下公式計算獲得該景區(qū)的綜合滿意度值:
其中,Y表示景區(qū)的綜合滿意度值,i表示內(nèi)容大類關(guān)鍵詞的序號,i取值范圍是1~6,表示第i個內(nèi)容大類關(guān)鍵詞下的的權(quán)值。
3 具體實施方式
3.1 基于旅游需求模板的關(guān)鍵詞模板庫構(gòu)建
⑴ 內(nèi)容大類關(guān)鍵詞構(gòu)建,主要包括吃、住、行、游、購、娛幾個大類。
⑵ 內(nèi)容子類關(guān)鍵詞構(gòu)建,主要是在內(nèi)容大類關(guān)鍵詞的基礎(chǔ)上構(gòu)建,比如和內(nèi)容大類關(guān)鍵詞吃相關(guān)的內(nèi)容子類關(guān)鍵詞有飯店、餐館、快餐店、小吃街等。
⑶ 情感關(guān)鍵詞構(gòu)建,主要是在內(nèi)容子類關(guān)鍵詞基礎(chǔ)上構(gòu)建,比如和內(nèi)容子類關(guān)鍵詞‘吃對應(yīng)的情感關(guān)鍵詞有味道很好,價格實惠,環(huán)境優(yōu)美等。
3.2 關(guān)鍵詞模板庫的擴充
⑴ 基于需求模板引導(dǎo)評價的內(nèi)容子類關(guān)鍵詞庫擴充,通過網(wǎng)絡(luò)爬蟲工具在內(nèi)容大類關(guān)鍵詞附近搜索相關(guān)的內(nèi)容子類關(guān)鍵詞并與已有的模板庫進行對比,遇到新的內(nèi)容子類關(guān)鍵詞后,自動加入到模板庫,比如遇到與內(nèi)容大類關(guān)鍵詞吃相關(guān)的新的內(nèi)容子類關(guān)鍵詞野味店等。
⑵ 基于需求模板引導(dǎo)評價的情感關(guān)鍵詞庫擴充,通過網(wǎng)絡(luò)爬蟲工具八爪魚采集器,在內(nèi)容子類關(guān)鍵詞附近搜索相關(guān)的情感關(guān)鍵詞并與已有的模板庫進行對比,遇到新的情感關(guān)鍵詞后,自動加入到模板庫。
⑶ 情感關(guān)鍵詞均已由用戶進行賦分,給出分值(1~5),比如非常好/棒極了/美妙極了,這三個情感詞表達的滿意度是相同的,對應(yīng)的分值都是5分,一般/湊合/還行對應(yīng)的分值則都是3分;差極了/難受死了/簡直就是受罪/再也不會去了,對應(yīng)的分值則是1分。
3.3 針對景區(qū)評價數(shù)據(jù)的輿情滿意度分析計算
⑴ 根據(jù)已有模版庫構(gòu)建評價體系表。內(nèi)容大類關(guān)鍵詞和內(nèi)容子類關(guān)鍵詞的權(quán)重和情感關(guān)鍵詞的分值以及相同分值評論數(shù)量如表1所示,表中{}表示第i個內(nèi)容大類關(guān)鍵詞下第j個內(nèi)容子類關(guān)鍵詞對應(yīng)分值為t的情感關(guān)鍵詞的集合。
⑵ 通過網(wǎng)絡(luò)爬蟲工具搜索景區(qū)網(wǎng)頁的每個帖子,按內(nèi)容子類關(guān)鍵詞,搜索所有相關(guān)的情感關(guān)鍵詞,根據(jù)表1進行分類統(tǒng)計,把相應(yīng)的情感關(guān)鍵詞的數(shù)量記錄到對應(yīng)到中。
比如:通過網(wǎng)絡(luò)爬蟲工具搜到網(wǎng)頁得到1000個情感關(guān)鍵詞,有600個是與內(nèi)容大類關(guān)鍵詞‘吃A1有關(guān)的,其中300個是與內(nèi)容子類關(guān)鍵詞‘味道B11有關(guān)的,對應(yīng)的情感關(guān)鍵詞集{}及數(shù)量如表2所示。
由內(nèi)容子類關(guān)鍵詞滿意度計算公式可知該景區(qū)關(guān)于吃的味道的滿意度值為:
即:該景區(qū)關(guān)于吃的味道的滿意度值為3.6,同理可以計算其他內(nèi)容子類的關(guān)鍵詞的滿意度值。
4 結(jié)束語
通過這種方法得到滿意度值,解決了以往游客的游記、評價等非結(jié)構(gòu)化內(nèi)容難以被其他游客高效搜索利用的問題,除了可以向游客提供某個景區(qū)的綜合滿意度值外,還可以向游客提供該景區(qū)具體的關(guān)于吃、住、行、游、購、娛六個方面的滿意度值,以及比吃、住、行、游、購、娛更具體的相關(guān)內(nèi)容子類關(guān)鍵詞的滿意度值,讓游客快速了解該景區(qū)的各個評價參數(shù)。
參考文獻(References):
[1] 維克托.邁爾舍恩伯格著,盛楊燕,周濤譯.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].浙江人民出版社,2013.
[2] 馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應(yīng)用[J].國防科技,2013.2:10-11
[3] 黃先開,張麗峰,丁于思.百度指數(shù)與旅游景區(qū)游客量的關(guān)系及預(yù)測研究-以北京故宮為例[J].旅游學(xué)刊,2013.11:93-100
[4] 趙風霞.基于數(shù)據(jù)挖掘的旅游智能推薦系統(tǒng)的研究和設(shè)計[J].科技創(chuàng)新與應(yīng)用,2013.4:2-4
[5] 徐波林,李東和,錢亞林,劉燕桃.智慧旅游:一種新的旅游發(fā)展趨勢-基于現(xiàn)有研究成果的綜述[J].資源開發(fā)與市場,2013.3:7