謝紅霞 陳創(chuàng)奇
摘? 要: 抖音作為近年來新型短視頻社交APP,因其代入感強、參與性高,正發(fā)展成為一種新的旅游營銷傳播工具。隨著抖音日活用戶人數(shù)不斷地創(chuàng)出新高,平臺上的數(shù)據(jù)也迅速、大量地沉淀積累。篩選抖音上有關(guān)“西湖十景”的視頻和評論信息,通過數(shù)學(xué)建模創(chuàng)建景點的抖音熱度指數(shù),用百度指數(shù)模擬景點的實際客流量,研究抖音短視頻對提升景點客流量的影響力。數(shù)據(jù)分析結(jié)果顯示,各景點的表現(xiàn)不盡相同,希望以此為西湖旅游資源的開發(fā)和管理提供依據(jù)。
關(guān)鍵詞: 數(shù)據(jù)分析; 抖音; 旅游; 西湖十景
Abstract: As a new short video social app in recent years, TikTok is developing into a new tourism marketing communication tool due to its strong sense of substitution and high participation. With the number of daily active user of TikTok constantly reaching a new high, the data on the platform also deposited and accumulated rapidly in large quantity. Sieving the video and comment information about "Ten sceneries of West Lake" on TikTok, creating the heat index of TikTok through the mathematical modeling, the actual tourist flow of the scenic spots is simulated with Baidu Index to study the influence of TikTok on the improvement to the tourist flow of the scenic spots. The results of data analysis show that the performance of each scenic spot is different, that is hoping to provide basis for the development and management of West Lake tourism resources.
Key words: data analysis; TikTok; tourism; Ten sceneries of West Lake
0 引言
近年來短視頻平臺如雨后春筍般興起,因短視頻短小精煉、傳播速度快、制作門檻低、社交屬性強,成為時下最流行的社交方式[1]。游客在旅游過程中隨手拍攝的短視頻經(jīng)網(wǎng)絡(luò)傳播,為旅游景點形象的塑造帶來新興動力。從國外的YouTube到國內(nèi)的抖音,短視頻正在發(fā)展成為一種旅游營銷傳播工具[2]。
抖音平臺在競爭中異軍突起,在年輕人中迅速傳播和流行,由此也在平臺上積累了大量原始數(shù)據(jù),利用大數(shù)據(jù)分析技術(shù)對平臺上的視頻及評論進行分析,可以幫助旅游行業(yè)更好地服務(wù)于游客,也為旅游主管部門提供決策依據(jù)[3]。
1 研究內(nèi)容
“西湖十景”是杭州旅游的金名片,通過數(shù)據(jù)挖掘及數(shù)據(jù)分析的手段研究抖音短視頻與“西湖十景”客流量的相關(guān)性,既從時間緯度上分析抖音短視頻的熱度與景點客流量的相關(guān)性,也從每個景點的抖音視頻下的用戶評論中進行情感分析和高頻詞統(tǒng)計,得出景點的游客認知意象,并通過數(shù)據(jù)可視化方法,更好地理解數(shù)據(jù)對象。研究的內(nèi)容框架如圖1所示。
具體研究內(nèi)容如下。
⑴ “西湖”關(guān)鍵詞下抖音短視頻的用戶群分析。包括:用戶的年齡分布,用戶的性別比率,視頻發(fā)布的時間分布和評論的時間分布。
⑵ 基于文本語義分析方法,從視頻的標題信息中提取各景點的高頻詞,從而獲取“西湖十景”游客認知意象。
⑶ 基于百度AI平臺的情感分析接口,要對“西湖十景”各個景點的評論分別進行情感值計算和分類,得到正面評價和負面評價的關(guān)鍵詞。
⑷ 數(shù)學(xué)建模,創(chuàng)建抖音熱度指數(shù),根據(jù)每一條視頻的點贊數(shù)、評論數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)得到該條視頻的抖音熱度指數(shù),進而按景點分類匯總得到每個景點的抖音熱度指數(shù)。
⑸ 繪制抖音熱度指數(shù)隨時間變化的趨勢圖,與百度指數(shù)趨勢圖進行對比,從而得出抖音熱度對一個景點的客流量的相關(guān)性。
2 研究成果
2.1 用戶群體分析
爬取抖音視頻評論,截止時間2019年3月底,對獲取到的用戶信息用“西湖”關(guān)鍵詞篩選,得到6649個評論用戶,分析這些目標用戶群的分布,分別按性別和年齡分類,如圖2、圖3所示,數(shù)據(jù)顯示性別分布區(qū)別不大,年齡分布則以80、90后為主。
2.2 抖音視頻發(fā)布時間與評論發(fā)布時間分析
爬取1124條西湖視頻信息,數(shù)據(jù)顯示在三個國家法定節(jié)假日,國慶、元旦以及春節(jié)視頻數(shù)量明顯增多,說明節(jié)假日為景區(qū)帶來了流量。
數(shù)據(jù)分析進一步發(fā)現(xiàn),評論發(fā)布的時間集中在12~14點和19~24點之間。如圖4、圖5所示。
2.3 “西湖十景”游客認知意象及情感分析
研究所爬取的1124條有關(guān)西湖的視頻,對視頻標題做高頻詞統(tǒng)計,結(jié)果顯示除了“西湖”、“杭州”、“喜歡”、“美景”這些詞外,“白娘子”、“許仙”、“濟公”等詞出現(xiàn)頻率也很高,顯示傳統(tǒng)文化或神化傳說賦予景點人文藝術(shù)價值會使游客印象更深。
繼續(xù)爬取視頻下的評論,共28474條,用TF-IDF[4]文本分析算法提取“西湖十景”關(guān)鍵詞,并對這些關(guān)鍵詞用情感字典分析,得到積極和消極兩類關(guān)鍵詞,分別制作詞云[5]。挑選“湖濱晴雨”這個有代表性的景點進行正負面情感詞云對照,如圖6、圖7所示。
“西湖十景”正面詞中出現(xiàn)的高頻詞有“風(fēng)景”、“美好”、“愜意”“偶遇”等描述景色的詞。在“平湖秋月”、“龍井問茶”景點中出現(xiàn)了“媽媽”、“女兒”、“家人”這些高頻詞。在許多景點出現(xiàn)了高頻詞“去過”。
“西湖十景”中的負面詞“小心”、“掉下去”、“危險”、“護欄”等出現(xiàn)頻率較高。“收費”、“錢”、“貴”、“騙人”這些詞在“斷橋殘雪”、“蘇堤春曉”、“花港觀魚”、“龍井問茶”這些景點中出現(xiàn)。“游客”、“人人”、“擠”出現(xiàn)在“斷橋殘雪”、“靈隱禪蹤”、“花港觀魚”這幾個景點。
這些高頻詞概括了相應(yīng)景點的特征和問題所在,有明顯的區(qū)分度且和我們的認知基本符合。
2.4 抖音熱度與景區(qū)流量的相關(guān)性分析
通過數(shù)學(xué)建模計算抖音熱度指數(shù)。對所爬取的1124條視頻,根據(jù)每條視頻的點贊數(shù)、評論數(shù)、分享數(shù)、轉(zhuǎn)發(fā)數(shù)這四個指標衡量該條視頻的受歡迎程度。先對每個指標作歸一化處理,再求算術(shù)平均得到該條視頻的抖音熱度指數(shù)。通過抖音熱度指數(shù)可以看出有一些視頻的熱度指數(shù)特別高,可以稱作爆款視頻。圖8顯示“西湖十景”各景點的抖音熱度按時間的分布圖,其中每個點代表一條視頻的熱度指數(shù)。
從圖8可看出:“斷橋殘雪”爆款視頻最多(第一排第四個),“平湖秋月”(第一排第五個)、“花港觀魚”(第二排第一個)爆款視頻次之。從時間緯度上看,爆款視頻大部分集中在國家法定節(jié)假日里。
有了每條視頻的抖音熱度指數(shù),再按景點分類匯總得到每個景點的抖音熱度指數(shù)。
圖9所示,“三潭映月”、“平湖秋月”、“斷橋殘雪”排名靠前,而“龍井問茶”、“靈隱禪蹤”、“湖濱晴雨”這幾個景點的熱度指數(shù)相對較低。
由于沒有“西湖十景”的游客流量的官方數(shù)據(jù),考慮用百度指數(shù)近似代替景點流量。通過觀察百度指數(shù)的“西湖十景”圖可以發(fā)現(xiàn),除“斷橋殘雪”外,其他景點的百度指數(shù)保持一個平穩(wěn)的波動,從2018年3月開始到10月為較高的階段,而“斷橋殘雪”景點在2018年1月到2月間百度指數(shù)達到了10000,原因就是2018年的杭州第一場大雪降臨,游客爭相欣賞“斷橋殘雪”景觀,斷橋上盡是狂歡的人群。如圖10、圖11所示。
對比、觀察圖12和圖13的抖音熱度曲線可以發(fā)現(xiàn),西湖十景的抖音熱度主要出現(xiàn)在2018年底到2019年初,這和百度指數(shù)始終保持一個平穩(wěn)的波動性不太一致,顯示相關(guān)性比較弱。但是,“斷橋殘雪”在2018年1月到2月的抖音熱度曲線圖和百度指數(shù)圖高度重疊,顯示很強的相關(guān)性。究其原因:①用百度指數(shù)來模擬景點的客流量比較粗糙,需要用更精確的官方數(shù)據(jù)來印證。②抖音在杭州旅游方面的市場滲透率不夠,這從2018年與2019年的環(huán)比數(shù)據(jù)可看到。③杭州西湖作為知名旅游目的地,擁有穩(wěn)定的旅客流量,受互聯(lián)網(wǎng)沖擊的波動不大。④本研究所用數(shù)據(jù)截止時間到2019年3月底,而抖音日活人數(shù)和視頻數(shù)量以每月甚至每周的頻率更新,因此后續(xù)研究考慮用更多的數(shù)據(jù)做分析,相信會有更好的效果。
3 結(jié)束語
目前短視頻正發(fā)展成為一種旅游營銷傳播工具,通過短視頻社交平臺拉動旅游已經(jīng)成為一種新的城市景點宣傳方式,西安和重慶這兩座城市在這方面已經(jīng)有了成功的嘗試[6]。本文通過大數(shù)據(jù)分析的方法進行定量研究,希望從中挖掘抖音短視頻和景點客流量的相關(guān)性,鑒于數(shù)據(jù)量不夠多,時間跨度不夠長,分析結(jié)果還比較粗糙,但給出了一種新的研究方法和思路,建議杭州旅游管理部門重視抖音短視頻對城市文化旅游的影響,參考從抖音評論中所提煉的游客景點認知意向,挖掘景區(qū)內(nèi)的特色與優(yōu)勢,利用多種渠道吸引游客。
參考文獻(References):
[1] 千繼賢.抖音帶來的“旅游”[J].旅游縱覽(下半月),2018.8:17,19
[2] Reino D, Hay B. The use of YouTube as a tourismmarketing tool[J].Travel and Tourism Research Association,2016.
[3] 歐陽效福.基于游客微博“大數(shù)據(jù)”分析的廈門旅游環(huán)境意象研究[D].廈門大學(xué),2016.
[4] [美]麥金尼.利用Python進行數(shù)據(jù)分析[M].機械工業(yè)出版社,2014.
[5] 李湘東,高凡,丁叢.Lda模型下不同分詞方法對文本分類性能的影響研究[J].計算機應(yīng)用研究,2017.34(1):62-66
[6] 我是張小神:抖音APP競品分析報告[EB/OL].https://www.jianshu.com/p/d7911958931f