陳煜 楊明春 張曼
摘 要:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子產(chǎn)品的普及,人們更傾向于借助網(wǎng)絡(luò)平臺(tái)來(lái)表達(dá)自己的觀點(diǎn),由此數(shù)據(jù)量急劇增加,在這些數(shù)據(jù)中隱藏著人們?cè)诂F(xiàn)實(shí)世界中的行為軌跡、情感傾向等,如何挖掘隱藏在數(shù)據(jù)中的有效信息服務(wù)于現(xiàn)實(shí)世界是當(dāng)下的研究熱點(diǎn)。目前,人們對(duì)游客情感分析大多是從總體出發(fā),對(duì)情感與產(chǎn)業(yè)規(guī)劃之間的關(guān)系未進(jìn)行深入的研究。本文以青巖古鎮(zhèn)為例,深入挖掘游客旅游評(píng)論極性,通過(guò)分析數(shù)據(jù)的特點(diǎn)為景區(qū)規(guī)劃、優(yōu)化產(chǎn)業(yè)布局提供相關(guān)的建議。
關(guān)鍵詞:情感分析;產(chǎn)業(yè)規(guī)劃;青巖古鎮(zhèn)
中圖分類(lèi)號(hào):F592.7;TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A
隨著經(jīng)濟(jì)的發(fā)展,人們更加注重精神方面的追求,旅游業(yè)開(kāi)始迅速崛起,旅游業(yè)的發(fā)展除了會(huì)受相關(guān)產(chǎn)業(yè)的制約和影響之外,也會(huì)帶動(dòng)和影響其他產(chǎn)業(yè)的發(fā)展,因此,合理開(kāi)發(fā)和規(guī)劃旅游資源是旅游業(yè)發(fā)展的重中之重。截至2020年6月,中國(guó)有9.4億網(wǎng)民,約占全球網(wǎng)民的1/5,其中有99.2%是使用手機(jī)上網(wǎng)[1]?;ヂ?lián)網(wǎng)的發(fā)展突破了傳統(tǒng)媒體時(shí)間和空間的局限性,使得網(wǎng)絡(luò)評(píng)論信息的傳播速度遠(yuǎn)勝于報(bào)紙等傳統(tǒng)媒體,在虛擬世界中,相較于物理空間的面對(duì)面交流,更有意愿展示自己內(nèi)心最真實(shí)的想法,從而加大被評(píng)價(jià)景點(diǎn)信息傳播的廣度和深度。其類(lèi)似于電子商務(wù)網(wǎng)站上的評(píng)論對(duì)企業(yè)造成的影響,基于此,重視游客評(píng)價(jià)是景區(qū)得以良性發(fā)展的重要基礎(chǔ),是整個(gè)旅游產(chǎn)業(yè)鏈的生命主線(xiàn)[2-6]。因此,如何科學(xué)、合理地設(shè)計(jì)出景區(qū)的規(guī)劃與建設(shè)方案極其重要[7]。目前,國(guó)內(nèi)外學(xué)者從不同空間尺度對(duì)旅游目的地進(jìn)行評(píng)價(jià)和比較.數(shù)據(jù)主要來(lái)源于權(quán)威機(jī)構(gòu)公開(kāi)發(fā)布以及問(wèn)卷調(diào)查,而公開(kāi)數(shù)據(jù)雖然較易獲得,但統(tǒng)計(jì)口徑和質(zhì)量的差異使數(shù)據(jù)往往缺乏可比性,問(wèn)卷調(diào)查數(shù)據(jù)又存在樣本量、信度、效度等問(wèn)題。在大數(shù)據(jù)時(shí)代背景下,旅游網(wǎng)絡(luò)信息分享已成趨勢(shì),與傳統(tǒng)的公開(kāi)數(shù)據(jù)和調(diào)研數(shù)據(jù)相比,游客根據(jù)自身體驗(yàn)得出的感受其數(shù)據(jù)真實(shí)性可靠性較強(qiáng),用于景區(qū)開(kāi)發(fā)和發(fā)展研究具有一定的參考價(jià)值[8]。方夢(mèng)靜等利用微博數(shù)據(jù)進(jìn)行研究和分析游客在杭州西溪濕地旅游時(shí)情感時(shí)空變化規(guī)律[9]。近年來(lái),隨著旅游業(yè)的發(fā)展,行業(yè)中也發(fā)生許多負(fù)面事件,這些事件經(jīng)過(guò)傳播發(fā)酵,容易降低公眾的出行意愿,甚至引起公眾對(duì)當(dāng)?shù)芈糜问袌?chǎng)的集體抵制與抗議[10]。由此可見(jiàn),旅游目的地對(duì)游客情感進(jìn)行分析,重視游客的情感體驗(yàn),及時(shí)優(yōu)化景區(qū)產(chǎn)業(yè)、服務(wù)和管理十分重要。
(一)數(shù)據(jù)采集與處理
考慮到數(shù)據(jù)的專(zhuān)業(yè)性、豐富性及廣泛性,本文選取“攜程網(wǎng)”作為數(shù)據(jù)源,采用網(wǎng)絡(luò)爬蟲(chóng)技術(shù)抓取了目標(biāo)網(wǎng)站有關(guān)青巖古鎮(zhèn)的所有評(píng)論,共2 977條,所獲取的每條數(shù)據(jù)均包括用戶(hù)名、評(píng)論詳情、評(píng)論時(shí)間、評(píng)分、點(diǎn)贊數(shù)等信息,數(shù)據(jù)結(jié)構(gòu)詳情如表1所示。
(二)樣本處理及情感分析
由于元數(shù)據(jù)存在大量噪音,數(shù)據(jù)篩選工作必不可少,文本中出現(xiàn)的多余的標(biāo)點(diǎn)符號(hào)、空格、亂碼字符等會(huì)降低數(shù)據(jù)價(jià)值,噪點(diǎn)附加在任何詞句上都會(huì)造成與其他詞句的分離,進(jìn)而影響到語(yǔ)義信息。本文主要利用Python正則表達(dá)式和NLTK庫(kù)進(jìn)行匹配,其可以以相同模式輸入模型,而不用因數(shù)據(jù)具有差異而重復(fù)修改模型,這樣數(shù)據(jù)處理工作就會(huì)簡(jiǎn)便許多。
本文采用NLP技術(shù)根據(jù)文本詞意進(jìn)行情感值計(jì)算,系統(tǒng)規(guī)定情感值大于0.5分為積極情緒,小于0.5分為消極情緒,結(jié)果如表2所示,通過(guò)可視化分析可以看出積極評(píng)論2 510條,消極評(píng)論467條,積極情感總值約是消極情感總值的4.3倍,由此可知,游客對(duì)青巖古鎮(zhèn)的整體形象感知是正向的,說(shuō)明青巖古鎮(zhèn)總體產(chǎn)業(yè)規(guī)劃布局是合理的,故其更不能忽視持消極情緒的游客感受,對(duì)于引發(fā)游客不滿(mǎn)的原因需要進(jìn)行深入挖掘。
(三)詞頻分析
筆者對(duì)467條消極評(píng)論再一次進(jìn)行人工去噪留下有效評(píng)論455條,然后利用SnowNLP模塊進(jìn)行主題詞提取。首先需要將455條評(píng)論輸入系統(tǒng)中,將評(píng)論進(jìn)行分詞清洗得到新分割后的數(shù)據(jù),然后統(tǒng)計(jì)各詞出現(xiàn)的詞頻,在此筆者節(jié)選排名前60的高頻詞對(duì)其進(jìn)行歸類(lèi)總結(jié),用以初步展示游客對(duì)青巖古鎮(zhèn)消極情緒出現(xiàn)的集中領(lǐng)域(表3),在此基礎(chǔ)上制作詞云圖用以佐證總結(jié)分類(lèi)是否合理(圖1)。
(一)景觀方面
游客認(rèn)為青巖古鎮(zhèn)商業(yè)化嚴(yán)重,缺乏古鎮(zhèn)特色,景點(diǎn)單一,文化底蘊(yùn)單薄,古建筑修葺痕跡明顯,景區(qū)結(jié)構(gòu)不合理,原始古建筑在背街方有機(jī)會(huì)看到,筆者經(jīng)過(guò)多次實(shí)地考察,發(fā)現(xiàn)確實(shí)存在此現(xiàn)象,過(guò)度商業(yè)化會(huì)造成游客流失,在消極評(píng)價(jià)中,有部分游客表示不會(huì)再去第二次,甚至勸誡其他游客不要去。
(二)交通方面
游客認(rèn)為停車(chē)場(chǎng)設(shè)置不合理,節(jié)假日車(chē)況較差,貴陽(yáng)公交信息更速緩慢,公交實(shí)際??奎c(diǎn)與網(wǎng)絡(luò)信息不匹配且存在亂收費(fèi)現(xiàn)象。筆者經(jīng)實(shí)地調(diào)查發(fā)現(xiàn),從市區(qū)乘公交去青巖耗時(shí)約2小時(shí),乘車(chē)疲憊感使游客的旅游體驗(yàn)值大打折扣。
(三)服務(wù)體驗(yàn)方面
門(mén)票定價(jià)不規(guī)范,性?xún)r(jià)比較低,景區(qū)客流量較大,基礎(chǔ)設(shè)施不完善,產(chǎn)品同質(zhì)化嚴(yán)重且物價(jià)較高,有些產(chǎn)品雖然具有當(dāng)?shù)靥厣?,但是存在種類(lèi)少、包裝服務(wù)不完善的問(wèn)題。飲食衛(wèi)生得不到保障,美食攤位大多設(shè)在主路上,灰塵較多,游客反映食用后有嘔吐、腹瀉癥狀,除此之外景區(qū)工作人員服務(wù)態(tài)度較差。
(四)管理方面
古鎮(zhèn)管理混亂,工作人員專(zhuān)業(yè)素養(yǎng)不夠,缺乏人性化管理。信息更新不及時(shí),筆者結(jié)合實(shí)地訪(fǎng)談發(fā)現(xiàn),有些游客買(mǎi)了景區(qū)套票,結(jié)果因部分小景點(diǎn)在修繕,游客不得入內(nèi),有的只買(mǎi)了街景票卻因檢票人員的疏忽進(jìn)入了套票包含的小景區(qū)。景區(qū)指示牌設(shè)置有待完善,筆者在實(shí)地考察時(shí),從南門(mén)入街至定廣門(mén),古長(zhǎng)城的入口在定廣門(mén)里面販賣(mài)機(jī)處,過(guò)于隱蔽,而門(mén)外也有小道,看著像古長(zhǎng)城入口,實(shí)則不是,存在安全隱患。
人們需要客觀地評(píng)價(jià)古鎮(zhèn)商業(yè)化問(wèn)題。從游客視角出發(fā),其既想體驗(yàn)古鎮(zhèn)的韻味,又想擁有舒適的環(huán)境;從居民視角出發(fā),他們想保留古鎮(zhèn)的原生態(tài),更想擁有美好幸福的生活。如何將兩者統(tǒng)一,需要當(dāng)?shù)卣途用襁_(dá)成共識(shí)。在進(jìn)行景區(qū)商業(yè)規(guī)劃時(shí),應(yīng)著眼整體,適度開(kāi)發(fā),突出當(dāng)?shù)靥厣钔谖幕瘍?nèi)涵。
(一)交通
從宏觀方面來(lái)看,政府要加強(qiáng)管理,完善監(jiān)督機(jī)制,加大力度打擊私自設(shè)立停車(chē)場(chǎng),亂收費(fèi)的現(xiàn)象;從微觀方面來(lái)看,對(duì)景區(qū)進(jìn)行統(tǒng)一規(guī)劃時(shí),對(duì)占地面積要求較高的場(chǎng)所將景區(qū)邊緣地區(qū)開(kāi)發(fā)為停車(chē)場(chǎng),在進(jìn)入景區(qū)時(shí)實(shí)行人車(chē)分離,開(kāi)發(fā)新路線(xiàn),增加旅游專(zhuān)線(xiàn),居民入股,按比例分紅。做好人流監(jiān)控和節(jié)假日景區(qū)分流工作。
(二)景區(qū)
景區(qū)在各大旅游網(wǎng)絡(luò)平臺(tái)及時(shí)更新套票所含景點(diǎn)信息,并在景區(qū)購(gòu)票窗口醒目位置設(shè)置游客購(gòu)票提醒欄。另外,對(duì)于旅游產(chǎn)品同質(zhì)化問(wèn)題,建議結(jié)合當(dāng)?shù)靥厣_(kāi)發(fā)一些文創(chuàng)活動(dòng),完善服務(wù)鏈。要重視衛(wèi)生安全問(wèn)題,不定時(shí)進(jìn)行檢查。政府在可控范圍內(nèi)允許自由競(jìng)爭(zhēng),維護(hù)游客利益的同時(shí)也有利于景區(qū)的良性發(fā)展,提高游客滿(mǎn)意度和重游率,間接提高居民收入。
(三)服務(wù)管理
要完善服務(wù)管理制度,定期對(duì)景區(qū)工作人員進(jìn)行培訓(xùn)。在基礎(chǔ)設(shè)施方面可以與信息技術(shù)相結(jié)合,增加游客的滿(mǎn)意度。對(duì)于重要景點(diǎn),指示牌設(shè)置合理化,如在定廣門(mén)外可以增設(shè)長(zhǎng)城入口的指示牌,對(duì)于當(dāng)?shù)鼐用裆钚〉涝O(shè)置提醒牌,防止游客走錯(cuò)。南門(mén)主街入口石板路兩側(cè)增設(shè)防護(hù)欄和安全警示牌,避免旅游旺季時(shí)發(fā)生安全事故。
本文通過(guò)攜程網(wǎng)獲取青巖古鎮(zhèn)旅游評(píng)論數(shù)據(jù),通過(guò)數(shù)據(jù)去噪、分詞,提取關(guān)鍵詞、建模、情感分析、分類(lèi)等過(guò)程,挖掘游客對(duì)青巖古鎮(zhèn)的總體感知,深入分析消極評(píng)論數(shù)據(jù)查找問(wèn)題的原因,提出針對(duì)性建議,希望能夠?yàn)榫皡^(qū)產(chǎn)業(yè)規(guī)劃、優(yōu)化、可持續(xù)發(fā)展提供一定的參考。
[1] 人民網(wǎng).中國(guó)網(wǎng)民規(guī)模達(dá)9.4億 手機(jī)上網(wǎng)比例達(dá)99.2%[EB/OL].(2020-09-30)[2021-03-02].http://media. people.com.cn/n1/2020/0930/c40606-31880397.html.
[2] ANDERSON M, MAGRUDER J. Learning from the Crowd: Regression Discontinuity Estimates of the Effects of an Online Review Database[J]. Economic Journal,2012(563):957-989.
[3] 孟美任,丁晟春.虛假商品評(píng)論信息發(fā)布者行為動(dòng)機(jī)分析[J].情報(bào)科學(xué),2013(10):100-104.
[4] 楊敏.在線(xiàn)商品虛假評(píng)論對(duì)交易雙方的影響研究[J].現(xiàn)代經(jīng)濟(jì)信息,2016(1):159.
[5] 李璐旸,秦兵,劉挺.虛假評(píng)論檢測(cè)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2018(4):946-968.
[6] 龔箭,楊舒悅.基于網(wǎng)絡(luò)評(píng)論的旅游目的地評(píng)價(jià)研究:以我國(guó)31個(gè)省市自治區(qū)為例[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2018(2):279-286.
[7] 唐明虎.旅游評(píng)論極性分析對(duì)景區(qū)服務(wù)品質(zhì)影響研究[J].電腦知識(shí)與技術(shù),2020(20):23-27.
[8] AKEHURST G.User generated content:the use of blogs for tourism organizations and tourism consumers[J].Service Business,2009(1):51-61.
[9] 方夢(mèng)靜,鄭鈺旦,夏兆煊,等.基于微博大數(shù)據(jù)的游客情感時(shí)空變化特征:以杭州西溪國(guó)家濕地公園為例[J].西南大學(xué)學(xué)報(bào)(自然科學(xué)版),2020(3):156-164.
[10] 李勇,蔣冠文,毛太田,等.基于情感挖掘和話(huà)題分析的旅游輿情危機(jī)演化特征:以“麗江女游客被打”事件為例[J].旅游學(xué)刊,2019(9):101-113.