董爽 汪秋菊
[摘 要]國家礦山公園游客感知維度識別,能夠從游客感知的角度發(fā)現(xiàn)游客的心理認知,為廢棄礦區(qū)進行工業(yè)遺產(chǎn)旅游開發(fā)提供重要的參考價值。結(jié)合自然語言處理技術(shù)與隱含狄利克雷分布(LDA)主題模型方法,構(gòu)建旅游目的地游客感知維度識別的研究框架。利用旅游網(wǎng)站游客在線評論信息,識別國家礦山公園游客感知維度及各維度的構(gòu)成因子。研究發(fā)現(xiàn), 游客對國家礦山公園的感知主要側(cè)重于對功能客體(如旅游吸引物、服務、旅游目的地等)的認知,而對于工業(yè)遺產(chǎn)地所蘊含的意義與傳遞的文化等方面的解讀是十分有限的。加大國家礦山公園產(chǎn)品創(chuàng)新成為廢棄礦區(qū)旅游可持續(xù)發(fā)展的現(xiàn)實選擇。
[關(guān)鍵詞]國家礦山公園;LDA主題模型;游客感知
[中圖分類號]中圖分類號F592[文獻標志碼]A [文章編號]1672-4917(2019)02-0042-08
近年來,隨著我國工業(yè)化進程的深入和宏觀層面的“供給側(cè)改革”和“去產(chǎn)能”,廢棄礦區(qū)數(shù)量不斷增加,對廢棄礦區(qū)再利用,特別是基于旅游的再利用的需求日益迫切。廢棄礦區(qū)是工業(yè)化進程的產(chǎn)物,很多廢棄礦區(qū)見證了礦區(qū)乃至城市的發(fā)展歷程,記錄了礦工生產(chǎn)生活方式,寄托了時代精神與地方情感,蘊含了豐富的物質(zhì)文化和精神文化。把廢棄礦區(qū)開發(fā)為礦山公園已成為廢棄礦區(qū)旅游再利用的重要模式。礦山公園是以展示人類礦業(yè)遺跡景觀為主體,再現(xiàn)礦業(yè)發(fā)展歷史內(nèi)涵、喚醒記憶、傳播工業(yè)文化,供人們游覽觀賞、進行科學考察與科學知識普及的特定的空間地域。我國自2005年以來,開始利用廢棄礦區(qū)進行工業(yè)遺產(chǎn)旅游開發(fā),共批準了72個國家礦山公園,目前已建成開園31個。這些利用廢棄礦區(qū)打造的旅游目的地績效如何——能否成為真正意義上的礦山公園,能否契合游客需求已成為政府規(guī)劃者、礦區(qū)經(jīng)營者、公園管理者共同關(guān)注的焦點。
游客感知是游客對旅游目的地印象、信念及思想的綜合,也是旅游供給發(fā)展水平的直接反映。國內(nèi)外許多學者都通過識別游客感知維度,來評價旅游目的地開發(fā)的效果及經(jīng)營績效。與此同時,近些年來旅游專業(yè)網(wǎng)站的游客評論以其成本低、內(nèi)容豐富、客觀真實等優(yōu)勢,已成為分析游客對旅游目的地感知的重要數(shù)據(jù)來源。目前,國內(nèi)知名旅游網(wǎng)站如攜程、馬蜂窩、途牛、去哪兒等都擁有大量關(guān)于國家礦山公園的游客評論,為國家礦山公園游客感知的研究提供了便利。
本文在結(jié)合自然語言處理技術(shù)與隱含狄利克雷分布(Latent Dirichlet Allocation,以下簡稱LDA)主題模型的基礎上,參考目前研究成果已識別出的旅游目的地游客感知維度體系,構(gòu)建國家礦山公園游客感知維度識別的研究框架。利用網(wǎng)絡爬蟲軟件,采集攜程、途牛、去哪兒、馬蜂窩、同程、TripAdvisor(貓途鷹)、藝龍、驢媽媽等網(wǎng)站社區(qū)發(fā)布的國家礦山公園游客在線評論信息,基于已建立的研究框架,并參考目前研究成果,識別國家礦山公園游客感知維度及其構(gòu)成因子。本文研究目的在于構(gòu)建基于LDA的游客感知維度識別研究框架,形成此方面研究的統(tǒng)一范式。另外,本文通過對國家礦山公園游客感知形象維度的識別,分析廢棄礦區(qū)旅游開發(fā)的績效,將為廢棄礦區(qū)進行工業(yè)遺產(chǎn)旅游開發(fā)提供重要的參考價值。
一、文獻綜述
國外學術(shù)界早在20世紀50年代就開始了對廢棄礦區(qū)遺產(chǎn)資源的關(guān)注。美國學者斯蒂尼蘭(D. B.Steinlnan)最早從工業(yè)考古的視角,提出了礦業(yè)遺產(chǎn)保護的現(xiàn)實意義。而后隨著西方國家城市更新運動的發(fā)展,廢棄礦區(qū)數(shù)量的增加,很多學者從旅游學、文化遺產(chǎn)保護、規(guī)劃學、能源經(jīng)濟等視角,加大了對廢棄地旅游產(chǎn)品開發(fā)的研究力度。隨之,礦業(yè)遺產(chǎn)旅游資源、礦業(yè)遺產(chǎn)旅游資源價值評價、礦業(yè)遺產(chǎn)旅游開發(fā)模式與經(jīng)驗、廢棄礦區(qū)旅游開發(fā)對區(qū)域經(jīng)濟的影響等成為國內(nèi)外研究的熱點。我國廢棄礦區(qū)旅游開發(fā)利用的時間較短,目前與國家礦山公園相關(guān)的研究主要聚焦在開發(fā)現(xiàn)狀與存在問題、主題模式、評價標準與類型等方面。如武強、崔芳鵬等基于已經(jīng)建立的國家礦山公園的分析,提出了評價標準和國家礦山公園按照礦種、開采方式、主題景觀的空間位置、開發(fā)主題等進行分類的方法。[1]何小芊等運用GIS空間分析技術(shù),探討了我國國家礦山公園的空間分布特征,并分析了影響礦山公園空間分布的因素。[2]這些研究大都從供給的視角,通過保護和開發(fā)的實例,分析國家礦山公園開發(fā)的思路及經(jīng)驗啟示,而從游客視角出發(fā),系統(tǒng)識別國家礦山公園游客感知維度的研究較少。
游客感知維度識別方法的研究,一直以來是旅游目的地游客感知維度識別的難點和重點。目前研究方法主要包括:傳統(tǒng)研究方法與內(nèi)容分析法。傳統(tǒng)研究方法主要通過文獻歸納法,建立結(jié)構(gòu)型測量表,來識別旅游目的地感知維度。目前游客感知主要包括8到44個不同維度,涉及“吃、住、行、游、購、娛”旅游要素的諸多方面。然而旅游目的地游客感知是游客旅游體驗的結(jié)果,不同旅游目的地,其游客所處的情境不同,采用統(tǒng)一標準化的尺度無法捕捉目的地整體屬性和旅游者全部體驗。特別是國家礦山公園這一特殊類型的旅游目的地。內(nèi)容分析法是對研究內(nèi)容進行客觀、系統(tǒng)、量化分析的一種科學研究方法。一些學者結(jié)合旅游在線評論采用內(nèi)容分析法對旅游目的地游客感知進行研究。張文、頓雪霏根據(jù)網(wǎng)上游記的內(nèi)容分析研究大陸游客對臺灣的形象感知[3];張文亭等以永定土樓世界文化遺產(chǎn)地為研究案例,以游客網(wǎng)絡游記、在線評論,以及官方傳播文本為樣本,利用內(nèi)容分析法探討游客對福建土樓的形象感知與官方網(wǎng)站傳播的旅游形象存在的差異[4]。王路平以八路軍西安辦事處紀念館為分析對象,利用知名旅游網(wǎng)站的游客評論信息,運用內(nèi)容分析法研究旅游形象感知[5]。張春娥運用內(nèi)容分析法,通過分析網(wǎng)絡游記,了解旅游者對廣州旅游目的地形象的感知[6]。然而海量信息源賦予了旅游者更大的表達其形象感知的自由空間,而內(nèi)容分析法不足以支持旅游目的地游客感知的研究。
近年來,主題模型(topic model)方法憑借在主題識別、語義挖掘方面具有顯著的優(yōu)勢,受到了人們的廣泛關(guān)注。主題模型在機器學習和自然語言處理等領(lǐng)域是用來從一系列文檔中發(fā)現(xiàn)抽象主題的一種統(tǒng)計模型,具有較好的表示和組織文本信息的能力[7]。在眾多主題模型中,LDA主題模型是最具代表性的主題模型,由Blei(布萊)等于2003年首次提出[8],并應用于網(wǎng)絡用戶生成內(nèi)容的分析,以識別熱點主題、提取特征結(jié)構(gòu)等,取得了較好的效果。
在主題識別方面,一些學者利用LDA主題模型,從文本文件中抽取有效、新穎、有用、可理解的有價值的知識,服務于各個領(lǐng)域,如輿情監(jiān)控、情感分析和用戶偏好等,從這些分散的信息中挖掘用戶觀點,洞察大眾輿情以及消費者的意見,輔助政府、企業(yè)等的管理者進行科學決策。陳曉美等采用LDA主題模型方法,在文本層面按照主題的思想分析理解網(wǎng)絡輿情的主要觀點[9];張晨逸等基于LDA主題模型提出一種微博主題挖掘模型,用以挖掘微博的主題,而且還可以挖掘出聯(lián)系人關(guān)注的主題[10];李真等基于社會網(wǎng)絡視角,利用LDA主題模型,構(gòu)建網(wǎng)絡輿情觀點主題識別模型,以新浪網(wǎng)微博為例,識別網(wǎng)絡輿情中的觀點主題,進而把握網(wǎng)民的主流觀點[11]。
LDA主題模型在識別大規(guī)模文本數(shù)據(jù)集中潛藏的主題信息以及識別其特征結(jié)構(gòu)等細粒度信息方面優(yōu)勢更為明顯。劉三女牙等利用LDA主題模型挖掘和解析文本評論信息的特征結(jié)構(gòu)和語義內(nèi)容,以此為基礎,探究和追蹤學習者關(guān)注的熱點話題演化趨勢[12];謝永俊等建立LDA主題模型,提取北京市各熱點區(qū)域內(nèi)用戶微博的關(guān)注主題,分析北京市各熱點區(qū)域內(nèi)的文化、功能和特征,深入挖掘人們對城市熱點區(qū)域的普遍印象和認知[13];郭悅(Yue Guo)等運用LDA主題模型挖掘客戶在線評論,發(fā)現(xiàn)了潛在的酒店客戶滿意相關(guān)的19個維度[14]。
盡管應用廣泛,但目前此方法在旅游目的地游客感知方面的研究十分有限。即使有些研究成果運用了主題模型,挖掘了在線評論的主題維度,然而此研究也僅是方法的應用,并沒有把此方法應用流程全面呈現(xiàn)。二、基于LDA主題模型的旅游目的地游客感知維度識別研究框架設計
旅游目的地游客感知維度的識別是一個涉及旅游管理、人工智能、數(shù)據(jù)挖掘、自然語言處理等多學科知識的前沿領(lǐng)域,信息的釆集、處理、分析、提取需要多學科技術(shù)方法的支持。本文整合信息采集、自然語言處理、特征降維、語義挖掘等技術(shù)手段,構(gòu)建基于LDA主題模型的國家礦山公園游客感知維度識別研究框架。
本文利用自然語言處理技術(shù),采用常用于主題提取的LDA主題模型,基于所收集的游客在線評論信息,提取游客感知維度及其構(gòu)成因子,再結(jié)合文獻綜述所得到的國外研究成果,最終得到國家礦山公園游客感知識別研究框架。研究框架如圖1所示,通過理論和實踐研究的結(jié)合,最大限度地確保國家礦山公園游客感知維度識別的合理、客觀。
圖題圖1 基于LDA主題模型的國家礦山公園
游客感知識別研究框架
(一)信息采集與處理
利用八爪魚爬蟲軟件,采集攜程、途牛、去哪兒、馬蜂窩、同程、TripAdvisor(貓途鷹)、藝龍、驢媽媽等國內(nèi)著名旅游網(wǎng)站中國家礦山公園景點游客在線評論信息,形成在線評論數(shù)據(jù)。分別存儲到以各國家礦山公園名稱定義的文檔。打開文檔,進行人工檢查,判斷收集到數(shù)據(jù)為可用并保存,最后將所有可用文檔合并為本研究使用的數(shù)據(jù)集。
(二)定義相應的文本集合和感知維度集合
(三)數(shù)據(jù)預處理與特征降維
文本數(shù)據(jù)預處理與特征降維通過以下步驟完成:首先,采用中文文本挖掘系統(tǒng)V1.0(軟件著作登記號2017SR116175)對收集的文本數(shù)據(jù)集進行初步分詞,該系統(tǒng)具有中文分詞、詞性標注、同義詞詞典和停用詞詞典等功能。通過初步分詞,得出每個詞的詞性、出現(xiàn)頻數(shù),并按出現(xiàn)頻數(shù)進行升序排列。其次,更新停用詞詞典和同義詞詞典。文本挖掘與所處理的專業(yè)領(lǐng)域知識密切相關(guān),因此,文本挖掘系統(tǒng)中的停用詞詞典便于自動處理與本次挖掘項目無關(guān)的詞,同義詞詞典則有助于避免自然語言中表達的差異,依挖掘項目文本中特征詞的表達特點,將表達意義相同或相近的詞定義為同義詞,以便系統(tǒng)進行分詞處理時,識別并替換同義詞。通過更新停用詞詞典和同義詞詞典,減少文本數(shù)據(jù)集中的特征詞數(shù)量,達到特征降維的目的,從而提高下一階段主題提取的處理效率。最后,系統(tǒng)生成一個包含所有在線評論數(shù)據(jù)的特征詞向量空間矩陣。
(四)利用LDA主題模型得到在線評論數(shù)據(jù)集的主題-特征詞概率分布
將數(shù)據(jù)預處理和特征降維后得到的特征詞向量空間矩陣代入LDA主題模型,分別生成文本-主題概率分布和主題-特征詞概率分布。依據(jù)主題-特征詞概率分布,將各主題下的特征詞進行人工歸納得到各主題所代表觀點,即本文所研究的游客感知維度,與主題相對應的特征詞中概率較大且與游客感知緊密相關(guān)的即是構(gòu)成維度的因子,至此,完成對游客感知維度的抽取,如圖2模型所示。
其中,利用LDA主題模型進行游客感知維度抽取的過程主要包括在線評論文本數(shù)據(jù)預處理、特征降維、LDA主題建模等步驟,最終得到主題-特征詞概率分布矩陣,經(jīng)人工歸納得到國家礦山公園游客感知維度及其構(gòu)成因子。
在LDA主題模型建模過程中,由于LDA模型中無法直接獲得參數(shù),一般通過參數(shù)估計的方法近似推理參數(shù)值,常用的參數(shù)估計方法有Gibbs抽樣算法、變分推理(Variational Inference)、La-place近似和期望-擴散(Expectation Propagation)[15]。本文選用Gibbs抽樣算法推斷LDA模型參數(shù),該方法易于實現(xiàn)、計算速度快,且占用較小內(nèi)存。
三、實證分析
(一)樣本選取
旅游網(wǎng)站是旅游者和旅游管理者獲取游客對旅游目的地形象感知信息的主要來源,因此,本文以國內(nèi)著名旅游網(wǎng)站游客關(guān)于國家礦山公園的游客在線評論信息為研究樣本,選取攜程、途牛、去哪兒、馬蜂窩、同程、TripAdvisor(貓途鷹)、藝龍、驢媽媽等8個國內(nèi)著名的旅游網(wǎng)站,獲取這些網(wǎng)站中國家礦山公園游客的在線評論信息。由于國家礦山公園在我國還處于起步階段,以礦山公園為旅游目的地的游客數(shù)量和游客在線評論信息有限,本文的在線評論信息獲取不限定初始時間,截止時間為2017年12月31日。利用八爪魚爬蟲軟件實現(xiàn)在線評論數(shù)據(jù)的獲取。為每一家旅游網(wǎng)站建立一個文件夾,將從此網(wǎng)站上采集的關(guān)于一個國家礦山公園景點的所有游客在線評論信息,保存到以該礦山公園名字命名的excel文檔中,游客的每一條在線評論信息保存為excel文檔的一條數(shù)據(jù)。完成上述8個旅游網(wǎng)站國家礦山公園游客在線評論信息采集后,人工合并8個文件夾的所有excel文檔中的在線評論數(shù)據(jù),形成本文研究的在線評論數(shù)據(jù)集樣本。在線評論數(shù)據(jù)集共包括鳳凰山國家礦山公園、福建壽山國家礦山公園、海州露天礦國家礦山公園、湖南寶山國家礦山公園、晉華宮國家礦山公園、遂昌金礦國家公園、唐山開灤國家礦山公園、盱眙象山國家礦山公園、扎賚諾爾國家礦山公園、黃石國家礦山公園、萬山國家礦山公園、廣東韶關(guān)芙蓉山國家礦山公園、嘉陽國家礦山公園等13家礦山公園的5396條在線評論數(shù)據(jù)。
(二)數(shù)據(jù)預處理和特征降維
本研究利用中文文本挖掘系統(tǒng)V1.0(軟件著作登記號2017SR116175)完成數(shù)據(jù)預處理和特征降維。將在線評論數(shù)據(jù)集導入該系統(tǒng),對數(shù)據(jù)集進行自動分詞,輸出結(jié)果為特征詞、詞性及相應的出現(xiàn)頻數(shù),且特征詞按照頻數(shù)升序的順序排列。導出分詞輸出結(jié)果,將以下面三種類型的詞保存至停用詞詞典:(1)頻數(shù)較低的詞,如頻數(shù)小于50的詞;(2)數(shù)字,如2016、30等;(3)與感知無關(guān)的詞,如年、幾個、真的、一下、特別、其實、尤其等詞。此外,將有相同意義的詞加入同義詞詞典,如小孩:小孩子、小朋友。這樣,再次進行分詞處理時,“小孩子”和“小朋友”都會被替換為“小孩”。更新的停用詞詞典和同義詞詞典在將數(shù)據(jù)集生成向量空間時起到了特征降維的作用。在線評論數(shù)據(jù)集分詞后按頻數(shù)篩選從大到小排序前50的特征詞如表1,其中,高頻特征詞反映了國家礦山公園感知的獨特性,比如金礦、礦山、礦洞、井下、煤礦、開采、黃金、礦井、金窟等體現(xiàn)了國家礦山公園特有的礦業(yè)遺跡。
(三)結(jié)果分析
采用LDA主題模型提取主題(topic)時,主題個數(shù)K通常是自定義。從目前的研究文獻上看,旅游目的地游客感知維度主要包括8到44個不同指標,涉及“吃、住、行、游、購、娛”旅游要素的諸多方面,感知維度的特點是各維度比較獨立,相關(guān)性小。本文實驗階段首先根據(jù)旅游目的地游客感知維度文獻研究成果,分別將主題個數(shù)K定義為8、10、20、50,依次帶入LDA主題模型,得到主題個數(shù)K下每一個主題中的特征詞分布概率,分析發(fā)現(xiàn)K值越大,主題中重疊的特征詞越多,參考以往旅游目的地游客感知維度文獻研究成果,難以識別出比較獨立且相關(guān)性小的維度。我們縮小主題個數(shù)K值,分別選擇數(shù)值等3~7的K值代入LDA主題模型,再次實驗分別得到主題個數(shù)K下主題-特征詞概率分布矩陣,研究發(fā)現(xiàn)當K值從3到5增長時,特征詞在每一主題的分布概率逐步提高,但是類別較少時根據(jù)主題所包含的特征詞識別出的主題即游客感知維度之間相關(guān)性較大,區(qū)分度不強;當K值從6到7時,特征詞在各主題中的分布概率下降。比較實驗結(jié)果得到,主題個數(shù)K值為5時,主題-特征詞概率分布矩陣中特征詞分布概率相對較高,依此歸納出的主題即游客感知維度的相關(guān)性較小。因而,本研究將識別國家礦山公園游客感知維度設為5個,并從主題-特征詞概率分布矩陣中挑選每個topic維度中分布概率大且充分體現(xiàn)游客感知的前10個特征詞為游客感知維度的構(gòu)成因子,見表2。
從表2可以看出,維度1中的高概率特征詞,即不錯、值得、一般、方便、壯觀、美麗、喜歡、休閑等,主要反映游客對景點或景區(qū)以及其中的娛樂設施等體驗后的感知;維度2中的高概率特征詞,即深刻、歷史、唐代、明代、保存、當年、生活、辛苦等,主要反映游客對歷史與過去生活記憶的感知;維度3中的高概率特征詞,即門票、講解、導游、網(wǎng)上、免費、價格、排隊等,主要反映游客對景點或景區(qū)服務的感知;維度4中的高概率特征詞,即博物館、井下、知識、煤礦、地下、探秘、礦井、下井、意義、礦工等,主要反映游客對景點或景區(qū)特有的游客吸引物的感知;維度5中的高概率特征詞,即公園、礦山、國家、歷史、中國、工業(yè)、阜新、遺址、城市、文化等,主要反映游客對景點或景區(qū)目的地的感知。
本文基于目前研究文獻中識別的游客感知維度體系,并結(jié)合各維度中出現(xiàn)的高概率特征詞,歸納出國家礦山公園游客感知涵蓋的五大維度主題詞,分別為體驗、記憶、服務、旅游吸引物和旅游目的地。這五大維度主題詞反映了旅游者對國家礦山公園功能性特性的一種認識。
“吸引物”為游客感知維度中最為重要的。游客到訪旅游景區(qū)的動因是參訪旅游吸引物,旅游吸引物也就成為游客在國家礦山公園形象感知形成中最有價值的聯(lián)想物。
由表2可以看出,博物館、井下、知識、煤礦、地下、探秘、礦井、下井、意義、礦工等特征詞分布概率大。礦業(yè)遺跡包括:礦產(chǎn)地質(zhì)遺跡、礦業(yè)生產(chǎn)遺跡、礦業(yè)制品遺存、社會生活遺跡和礦業(yè)開發(fā)文獻史籍等。許多礦山公園通過博物館、生產(chǎn)場景再現(xiàn)等形式向游客呈現(xiàn)了昔日礦工在煤礦礦井進行井下作業(yè)的生產(chǎn)環(huán)境,對于游客而言,游歷國家礦山公園最為重要的是感受其特有的礦業(yè)遺跡。工業(yè)生產(chǎn)活動中的工業(yè)機器、生產(chǎn)設備、廠房建筑、生產(chǎn)場景等物質(zhì)形態(tài)的礦業(yè)遺跡自然而然成為他們關(guān)注的重點。正如一些評論提到的:
留下最深印象的是廣場邊擺放著巨大的挖掘機、蒸汽機車、潛孔鉆機、推土犁、電機車等大型礦山作業(yè)機械。很難想象這些機械在當初礦山建設中發(fā)揮了無與倫比的作用,立過汗馬功勞。去哪網(wǎng)(www.quar.com)
除了工業(yè)遺跡成為游客關(guān)注的對象以外,礦區(qū)周邊的環(huán)境也成為重要的旅游吸引物,有的游客提到:
走出礦洞,無意之間來到山上,景色秀麗,那里有處一類水源保護地:銀坑山水庫,碧波粼粼的一汪碧水宛如一顆祖母綠的翡翠鑲嵌在銀坑山澗,玲瓏通透,綠瑩幽幽,聽說里面多次發(fā)現(xiàn)過珍貴的對水質(zhì)近乎苛刻的桃花水母。①
“歷史”是游客關(guān)注的第二大維度。在“歷史”的主題中,主題詞“深刻”“歷史”“保存”“當年”“生活”“采礦”“小時候”的分布概率較高。以工業(yè)活動為目的的構(gòu)筑物,曾經(jīng)使用過的生產(chǎn)流水線和機器設備、廢棄礦區(qū)環(huán)境和周圍環(huán)境,以及所有其他有形和無形的工業(yè)遺產(chǎn)等保留了相應時期的工業(yè)發(fā)展演變序列,記錄著人類發(fā)展的歷史,蘊含了豐富的歷史信息。國家礦山公園中的很多礦業(yè)遺址,是中國在工業(yè)化進程中遺留下來的最鮮明的時代烙印。礦區(qū)的發(fā)展往往是一代人、甚至是幾代人的人生體驗。在游歷國家礦山公園時,難免會回首過去生活。“歷史”成為游客對國家礦山公園形象感知的重要組成部分。正如有游客提到的:
這里曾是中國最大的露天煤礦,曾經(jīng)為新中國的建設奉獻過,現(xiàn)在已經(jīng)資源枯竭,破產(chǎn)了,只有下當年開采剩下的大坑,然而,可以看到新中國初期礦業(yè)的水平。①
僅僅找到個人的目的或使命是不夠的,我們面臨的挑戰(zhàn)是要創(chuàng)造一個每個人都有使命感的世界,這是真正幸福的關(guān)鍵,也是保持社會進步的唯一途徑。在偌大的礦山公園中,我找到了我存在的使命,我找到了資源枯竭型城市的使命與國家的使命。①
“服務”是游客關(guān)注的第三大維度。“門票”“講解”“導游”“網(wǎng)上”和“免費”等特征詞在主題-特征詞分布矩陣中的概率值較大,與主題關(guān)聯(lián)密切。旅游目的地的服務條件對旅游活動的順利進行或在游客心目中形成美好印象起著非常重要的作用。其在游客旅行過程中,能為游客創(chuàng)造一種和諧的氣氛,產(chǎn)生一種精神的心理效應,從而觸動游客情感,喚起游客心理上的共鳴,使游客在接受服務的過程中產(chǎn)生愜意、幸福之感,進而提升游客對旅游目的地的感知形象。反之亦然。正如有游客提到的:
礦山公園一游應該算是文化之旅,適合愛國教育和科普教育。因為光看景的話,也只有“亞洲最大露天采坑”值得一看了,沒有導游的講解,很難了解這里擁有的1780年的冶金工業(yè)文化。馬蜂窩網(wǎng)(www.mafengwo.cn)
“體驗”是游客關(guān)注的第四大維度?!安诲e”“值得”“一般”“方便”“壯觀”等詞在主題-特征詞分布矩陣中概率值較大,與主題的關(guān)系密切。對礦工的生產(chǎn)與生活的體驗是構(gòu)成國家礦山公園游客感知形象的重要維度。在游客體驗此種情景時,必然與游客心理相呼應,從而產(chǎn)生碰撞和心理感應。同樣,游客置身于生產(chǎn)的特殊場景,參與模擬式地采礦、選礦、洗礦等工藝流程,在參與與互動過程中豐富了自己的旅游體驗,從而影響了入境游客的景區(qū)感知形象的形成。有的游客提到:
看到了鐵礦的采掘過程,那分明是一種記憶的再現(xiàn)。作為一個普通礦工家庭的孩子,從小對這片土地的理解只是她的富裕,她儲存的大量礦產(chǎn)不僅養(yǎng)活了我們的父母,我們自己。如今,小城的資源幾近被掏空,我們出生與成長的這座小城也漸漸改變了格局,慢慢退出經(jīng)濟發(fā)展的歷史舞臺而被人遺忘。
馬蜂窩網(wǎng)(www.mafengwo.cn)
在這樣一個世界里,一個人可以把生活當作一個連續(xù)的故事,一個“感知”的故事,這樣的故事使每一件事都成為事件的結(jié)果。每一個時代都是通往成功的道路。朝圣者的世界——身份的建造者。一定是一種鐫刻著腳印的世界。這樣就可以保存現(xiàn)在和保存過去旅行的痕跡和記錄。攜程網(wǎng)(www.ctrip.com)
“旅游目的地”是游客關(guān)注的第五大維度。旅游者景區(qū)旅游活動的實現(xiàn)離不開景區(qū)所依托的城市空間。游客在與城市旅游資源、服務與設施的互動過程中豐富了自己的旅游體驗。一則城市中的一切要素都可能成為旅游資源,吸引游客的注意,成為游客體驗的重要組成部分。二則城市的公共設施、制度和服務為旅游者出入景區(qū)創(chuàng)造了不可或缺的重要條件,從而影響了游客的景區(qū)感知形象的形成。國家礦山公園不同于其他旅游目的地,大都是依托廢棄礦區(qū)開發(fā)而建成的。這些老工業(yè)區(qū)是中國特定時代的城市工業(yè)化的產(chǎn)物,城市往往伴其而生。在相當長一段時間內(nèi),以計劃為導向,國家統(tǒng)管企業(yè),企業(yè)也承擔起政府的一些社會福利職能,如開設幼兒園、學校、醫(yī)院等,這就出現(xiàn)了廠區(qū)與城區(qū)相互依存的空間布局格局,也創(chuàng)造出了一種獨特的城市工業(yè)文化,因而游客在游歷中能感受到城市的興衰。有一游客提到:
煤炭枯竭了,城市也走向了衰落,走在破爛不堪的街道上,那建筑,那高聳的井架依稀可以看到城市過去的輝煌,然而一切輝煌遠逝了,繁忙的機器停了下來,剩下這空空的城,迷茫的人群同程旅游網(wǎng)(www.ly.com)
四、結(jié)論與建議
(一)結(jié)論
本文結(jié)合自然語言處理技術(shù)與LDA主題模型方法,構(gòu)建旅游目的地游客感知維度識別的研究框架;利用網(wǎng)絡爬蟲軟件,采集攜程、途牛、去哪兒、馬蜂窩、同程、TripAdvisor(貓途鷹)、藝龍、驢媽媽等旅游網(wǎng)站中國家礦山公園游客在線評論,基于構(gòu)建的研究框架識別國家礦山公園游客感知維度及各維度的構(gòu)成因子。通過研究得出以下結(jié)論:
構(gòu)建了旅游目的地游客感知維度識別的研究框架。本文整合旅游目的地游客感知研究中涉及的信息采集、自然語言處理、特征向量提取、語義挖掘等技術(shù)手段,在結(jié)合自然語言處理技術(shù)與LDA主題模型方法的基礎上,參考目前研究成果已識別出的旅游目的地游客感知維度體系,介入LDA主題模型維度的選取及確定游客感知維度及其構(gòu)成因子,構(gòu)建旅游目的地游客感知維度識別的研究框架。
創(chuàng)新了游客感知維度識別方法。基于LDA主題模型的國家礦山公園游客感知維度識別方法,既結(jié)合了已有研究成果旅游目的地游客感知維度構(gòu)成體系,同時又可以體現(xiàn)特定旅游目的地游客感知的特殊性,避免了使用內(nèi)容分析法可能出現(xiàn)的局限性,提高了感知維度識別的有效性,拓展了旅游目的地游客感知維度識別的研究方法,具有較高的應用價值。
識別了國家礦山公園游客感知維度。國家礦山公園游客感知維度主要包括:體驗、歷史、服務、旅游吸引物、旅游目的地等方面。其中“歷史”是國家礦山公園游客感知的特殊維度。游客在“歷史”的主題中關(guān)注“深刻”“歷史”“當年”“采礦”“辛苦”“小時候”等話題。
(二)建議
通過國家礦山公園游客感知維度的識別可以看出,游客對國家礦山公園的感知主要側(cè)重功能客體(如旅游吸引物、服務、旅游目的地等)的認知上,而對于工業(yè)遺產(chǎn)地所蘊含的意義與傳遞的文化等方面的解讀是十分有限的。另外,游客對國家礦山公園的感知更多體現(xiàn)在“游”這一要素上,對于旅游其他要素:吃、住、行、娛、購等方面較少。在游客感知維度是的限性客觀上體現(xiàn)了目前國家礦山公園產(chǎn)品供給的不足。加大國家礦山公園產(chǎn)品創(chuàng)新成為廢棄礦區(qū)旅游可持續(xù)發(fā)展的現(xiàn)實選擇。
在產(chǎn)品功能創(chuàng)新方面,國家礦山公園產(chǎn)品功能與一般旅游目的地不同,除了應具有休閑、游憩的功能外,還應肩負起傳承工業(yè)文化、喚醒地方認同感和歸屬感的社會責任,兼具遺產(chǎn)稟賦功能、文化審美功能、社區(qū)情感寄托功能。國家礦山公園不僅應是旅游目的地,還應成為礦業(yè)生產(chǎn)、地質(zhì)考察的科研基地,繼承革命傳統(tǒng)、發(fā)揚民族精神的教育空間,傳承工業(yè)文化、喚醒工業(yè)記憶的精神家園。
在產(chǎn)品結(jié)構(gòu)創(chuàng)新方面,要滿足游客多元化的需求,整合“吃、廁、住、行、游、購、娛”“文、商、養(yǎng)、學、閑、情、奇”等旅游要素,融合旅游、文化、餐飲、娛樂、購物、住宿、房地產(chǎn)等多個產(chǎn)業(yè),將國家礦山公園打造成為多功能、復合性的產(chǎn)品集合。
在產(chǎn)品形式創(chuàng)新方面,國家礦山公園要結(jié)合礦業(yè)遺產(chǎn)資源的特點,在建設展覽、展示、觀光、科普等傳統(tǒng)旅游產(chǎn)品的基礎上,著力拓展和開發(fā)新型的體驗式、互動式、文化內(nèi)涵豐富、娛樂內(nèi)容奇特等多種表現(xiàn)形式的旅游產(chǎn)品,從多角度、全方位地體現(xiàn)礦業(yè)遺產(chǎn)旅游的地域特色。
[參考文獻]
[1]武強、崔芳鵬、劉建偉等:《解讀國家礦山公園的評價標準與類型》,《水文地質(zhì)工程地質(zhì)》2007年第4期。
[2]何小芊、王曉偉:《中國國家礦山公園空間分布研究》,《國土資源科技管理》2014年第5期。
[3]張文、頓雪霏:《探討大陸游客對臺灣旅游目的地形象的感知——基于網(wǎng)上游記的內(nèi)容分析》,《北京第二外國語學院學報》2010年第11期。
[4]張文亭、絡培聰:《基于網(wǎng)絡文本的目的地旅游形象游客感知與官方傳播對比研究——以福建永定土樓為例》,《福建師范大學學報(自然科學版)》2017年第1期。
[5]王路平:《網(wǎng)絡文本分析方法在旅游形象感知研究中的應用——以八路軍西安辦事處紀念館為例》,《西安電子科技大學學報(社會科學版)》2017年第2期。
[6]張春娥:《廣州旅游目的地形象感知研究——基于網(wǎng)絡文本分析》,《華南理工大學學報(社會科學版)》2015年第4期。
[7]楊瀟、馬軍、楊同峰等:《主題模型LDA的多文檔自動文摘》,《智能系統(tǒng)學報》2010年第2期。
[8]Blei D M,Ng A Y,Jordan M I:Latent Dirichlet Allocation. Journal of Machine Learning Research,No.3,2003,pp. 993-1022.
[9]陳曉美、高鋮、關(guān)心惠:《網(wǎng)絡輿情觀點提取的LDA主題模型方法》,《圖書情報工作》2015年第21期。
[10]張逸晨、孫建伶、丁軼群:《基于MB-LDA模型的微博主題挖掘》,《計算機研究與發(fā)展》2011年第10期。
[11]李真、丁晟春、王楠:《網(wǎng)絡輿情觀點主題識別研究》,《數(shù)據(jù)分析與知識發(fā)現(xiàn)》2017年第8期。
[12]劉三女牙、彭晛、劉智等:《面向MOOC課程評論的學習者話題挖掘研究》,《電化教學研究》2017年第10期。
[13]謝永俊、彭霞、黃舟等:《基于微博數(shù)據(jù)的北京市熱點區(qū)域意象感知》,《地理科學進展》2017年第9期。
[14]Guo Y,Barnes S J,Jia Q: Mining meaning from online ratings and reviews: Tourist satisfaction analysis using latent dirichlet allocation. Tourism Management,Vol.59,No.4,2017,pp. 467-483.
[15]李湘東、張嬌、袁滿:《基于LDA模型的科技期刊主題演化研究》,《情報雜志》2014年第7期。
[16]王國華:《工業(yè)旅游如何重塑區(qū)域人文地貌——以湖北省黃石市為例》,《北京聯(lián)合大學學報(人文社會科學版)》2018年第1期。