溫 夢 甜,張 巖,陳 能 成,2,陳 澤 強
(1.武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北 武漢 430079;2.中國地質(zhì)大學(xué)(武漢)國家地理信息系統(tǒng)工程技術(shù)研究中心,湖北 武漢 430078)
旅游吸引物通常指促使人們前往某地旅游的所有因素的總和,包括旅游資源、適宜的接待設(shè)施、優(yōu)良的服務(wù)以及快速舒適的旅游交通條件等[1]。我國進入大眾旅游時代,旅游已成為人們生活的重要組成部分,各地政府更加重視旅游業(yè)發(fā)展,越來越多的城市被打造為旅游城市。通過刻畫城市旅游吸引物地理畫像,可反映城市旅游吸引物的吸引力水平,從而為提高旅游吸引物建設(shè)水平、吸引游客提供參考。
目前,關(guān)于旅游畫像構(gòu)建的研究多聚焦于游客畫像和旅游目的地畫像,較少關(guān)注旅游吸引物相關(guān)畫像的構(gòu)建。其中旅游目的地相關(guān)研究多從游客角度出發(fā),以游客發(fā)布的旅游經(jīng)歷、感知和評價等為基礎(chǔ)數(shù)據(jù),運用人工處理分析[2]、自然語言處理和數(shù)據(jù)挖掘[3-6]等方法構(gòu)建游客對旅游吸引物的認知形象、情感形象等。旅游吸引物的地理位置、集群和周邊配套設(shè)施建設(shè)情況能反映當前旅游吸引物的吸引力水平,直接影響游客的旅游意愿和對景點的認知形象,是客觀刻畫城市旅游吸引物形象的重要因子,然而,現(xiàn)有關(guān)于城市旅游吸引物畫像的研究較少考慮旅游吸引物的地理位置和配套設(shè)施等因素,不能對旅游吸引物的建設(shè)提供有力參考。興趣點(POI)包含城市中各種類別的設(shè)施點,其空間分布和頻率權(quán)重可反映當前區(qū)域的功能特征[7];此外,POI數(shù)據(jù)樣本量大、涵蓋信息詳細、位置精確度高、易于獲取,被廣泛應(yīng)用于地理分析的各方面[8]?,F(xiàn)有城市畫像研究通過POI、手機定位等方面地理空間位置數(shù)據(jù)實現(xiàn)對城市功能區(qū)、土地利用等的形象刻畫[9,10],同樣,旅游吸引物周邊區(qū)域的POI可體現(xiàn)該旅游吸引物的功能特征,反映其功能設(shè)施的建設(shè)是否完備。因此,本文利用POI數(shù)據(jù)研究旅游吸引物的功能特征,據(jù)此從地理空間和地理語義兩個角度提出一種城市旅游吸引物地理畫像的構(gòu)建方法,以期為游客對旅游目的地的選擇提供參考。
武漢市位于我國中部地區(qū),素有“九省通衢”之稱和“江城”的美名,具備豐富的自然和人文旅游資源。根據(jù)《武漢年鑒(2021年卷)》[11]顯示,武漢市有名勝古跡339處、革命紀念地103處、各級重點文物保護單位275處。本文選取武漢市旅游吸引物分布相對集中的江岸區(qū)、江漢區(qū)、硚口區(qū)、漢陽區(qū)、武昌區(qū)、青山區(qū)、洪山區(qū)7個主城區(qū)作為研究區(qū)(圖1)。
本文采用2021年武漢市百度地圖POI數(shù)據(jù),經(jīng)過投影、坐標糾偏和去除重復(fù)點后,提取武漢主城區(qū)POI數(shù)據(jù)共337806條,包括風(fēng)景名勝、生活服務(wù)、餐飲服務(wù)、交通設(shè)施服務(wù)、體育休閑服務(wù)、科教文化服務(wù)、通行設(shè)施、公司企業(yè)、商務(wù)住宅、醫(yī)療保健服務(wù)、住宿服務(wù)、政府機構(gòu)及社會團體、公共設(shè)施、金融保險服務(wù)、購物服務(wù)、汽車服務(wù)、汽車維修、汽車銷售18個基本類別。武漢市主城區(qū)旅游吸引物包括城市廣場、動物園、風(fēng)景名勝、公園、公園廣場、國家級景點、省級景點、海灘、回教寺紀念館、教堂、旅游景點、水族館、寺廟道觀、植物園等15個子類別,共1 895條POI,其空間分布如圖1所示。
圖1 武漢市主城區(qū)旅游吸引物分布
本文研究技術(shù)流程(圖2)為:首先,基于預(yù)處理后的POI數(shù)據(jù),采用隱式狄利克雷分布(Latent Dirichlet Allocation,LDA)模型提取武漢市主城區(qū)1 895 個旅游吸引物周邊設(shè)施的主題語義特征,描述旅游吸引物周邊的設(shè)施類型分布;其次,通過DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法對旅游吸引物進行空間聚類,分析旅游吸引物集群的空間分布格局和主題;最后,在旅游吸引物集群的尺度上,通過Hill Numbers多樣性指數(shù)分析旅游吸引物的主題混合模式,對比評估不同旅游吸引物配套設(shè)施的完善程度,并從空間和語義兩個角度構(gòu)建旅游吸引物地理畫像。
圖2 研究技術(shù)流程
1.2.1 隱式狄利克雷分布(LDA)模型 LDA模型是自然語言領(lǐng)域常用的主題模型,可用于挖掘隱含的主題語義[12,13]、提取事件主題[14,15]或進行文本分類[16]等,已被廣泛應(yīng)用于城市功能區(qū)提取[17]、個性化景點推薦[18]和輿情時空演化分析[19]等領(lǐng)域。本文將每個旅游吸引物緩沖區(qū)內(nèi)的各POI基本類別文本視為詞項,將所有詞項合并為文檔,通過LDA模型提取不同旅游吸引物主題。求解LDA模型可得到“主題—詞項”矩陣和“文檔—主題”矩陣:前者反映每個主題的詞項概率分布,每個主題可用其詞項概率分布表示為一個向量,從而進行主題之間的計算和對比;后者反映每個文檔的主題概率分布,相應(yīng)地,每個文檔也可用其主題概率分布表示為向量,從而進行計算對比。另外,主題數(shù)量是LDA模型的一個重要參數(shù),代表該模型描述文本的能力。主題數(shù)量越小,模型描述文本的能力就越弱,不足以描述文檔的主題分布;而主題數(shù)量過大又會導(dǎo)致主題冗余、模型過擬合、訓(xùn)練時間增加。本文選取最常用的困惑度[20]和一致性[21]作為衡量主題數(shù)量選取的標準,困惑度反映一篇文檔屬于某主題的不確定性,困惑度越小、一致性越高,則模型效果越好。
1.2.2 DBSCAN空間聚類算法 同一空間范圍內(nèi)的旅游吸引物往往有相似的主題分布,對其進行聚類即可得到旅游吸引物集群。DBSCAN算法是一種基于密度的空間聚類算法,能將具有一定密度的區(qū)域劃分為集群,并在具有噪聲的空間數(shù)據(jù)中發(fā)現(xiàn)任意形狀的集群,因此本文采用該算法對旅游吸引物進行空間聚類,進而分析旅游吸引物集群的主題語義特征和空間格局,可在集群尺度對旅游吸引物有更清晰的感知,從而為游客選擇心儀的出行目的地提供建議。
1.2.3 Hill Numbers指數(shù) 生態(tài)學(xué)中廣泛使用的多樣性度量框架模型——Hill Numbers指數(shù)能較好地解決熵指數(shù)在度量功能多樣性多維特征方面存在的缺陷[9,22-25],因此,本文采用Hill Numbers指數(shù)D(式(1))[26-28]度量各旅游吸引物的主題混合情況(即主題多樣性)。
(1)
式中:s為主題數(shù)量;pi為主題i的出現(xiàn)頻率;q為多樣性階數(shù),反映多樣性指數(shù)對物種相對豐度的敏感性。1)當q=0時,多樣性指數(shù)對所有主題均不敏感,此時為豐富度指數(shù),即該旅游吸引物周邊的主題數(shù)量,取值范圍為1~18,其值越大,表明該旅游吸引物周邊主題語義特征越豐富;2)當q=1時,多樣性指數(shù)取決于主題的出現(xiàn)頻率,其值等于對香農(nóng)熵指數(shù)取冪指數(shù),反映旅游吸引物周邊主題的混合度,較高熵值表示旅游吸引物周邊各類主題語義特征間混合較好,較低熵值表明旅游吸引物周邊功能較單一,主題混合較差;3)當q=2時,多樣性指數(shù)為逆辛普森指數(shù),反映主題的集聚度,其既考慮了主題的豐富度,也考慮了不同主題的均勻度,指數(shù)越大,表示旅游吸引物周邊各類主題語義特征之間數(shù)量分布差異越小(相對均勻)。
旅游吸引物周邊POI設(shè)施的分布可反映該旅游吸引物的主題語義特征。本研究以武漢市POI數(shù)據(jù)為基礎(chǔ)構(gòu)建訓(xùn)練語料,確定主題數(shù)量,通過LDA模型提取武漢市旅游吸引物的主題語義特征。
2.1.1 訓(xùn)練語料構(gòu)建與主題數(shù)量確定 LDA模型是一種典型的詞袋模型[12],在構(gòu)建語料時不需考慮詞項間的順序。本研究以每個旅游吸引物為中心做緩沖區(qū),將緩沖區(qū)內(nèi)的POI基本類別字段作為詞項分別組織成文檔,從而構(gòu)建LDA模型的訓(xùn)練語料。如圖3所示,當兩個旅游吸引物距離較近而緩沖區(qū)有重疊時,則對緩沖區(qū)內(nèi)的POI進行多次采樣。當緩沖區(qū)較大時,重疊部分隨之增大,大量POI被多次采樣,會導(dǎo)致語義重復(fù)、數(shù)據(jù)冗余。經(jīng)過實驗對比,本文以50 m作為旅游吸引物的緩沖距離。為選取合適的主題數(shù)量,本文計算并繪制了主題數(shù)量從2到35的“困惑度—主題數(shù)量”和“一致性—主題數(shù)量”曲線(圖4),可見困惑度隨主題數(shù)量的增加呈波動下降趨勢,且在主題數(shù)量超過17后漸趨平穩(wěn);在主題數(shù)量為17~22中,18對應(yīng)的一致性較高,為避免主題數(shù)量較多而產(chǎn)生過擬合,本文主題數(shù)量選取18。
圖3 POI采樣構(gòu)建語料示意
圖4 困惑度和一致性與主題數(shù)量的關(guān)系
2.1.2 主題語義特征提取結(jié)果 采用LDA模型可得到每個旅游吸引物周邊的主題分布及每個主題中的POI基本類別分布。不同的主題揭示了不同的POI共現(xiàn)模式,即每個主題內(nèi)的各類POI出現(xiàn)的概率不同,本文按概率從大到小排序概括主題語義特征,展示了18個主題及其前5類POI的組合(表1)。為更明確地表示各主題的POI類別構(gòu)成,將每個主題下概率較大的前5類POI詞項繪制成詞云,詞項字號越大,表示其在該主題中出現(xiàn)的概率越高(圖5)。由表1和圖5可知,不同主題下POI的組成和出現(xiàn)概率不同,通過每個主題中出現(xiàn)概率較大的特征詞項結(jié)合POI的共現(xiàn)模式,可初步判斷該主題的語義。部分主題語義特征十分鮮明,單個類別的POI出現(xiàn)概率達95%以上,如主題7、主題12和主題13分別表示風(fēng)景名勝主題、商務(wù)住宅主題和生活服務(wù)主題;主題16中科教文化服務(wù)類設(shè)施達到92%,同風(fēng)景名勝、政府機構(gòu)及社會團體和生活服務(wù)等類型的POI共同體現(xiàn)了高校主題;主題15以室內(nèi)設(shè)施類POI為主,兼顧餐飲服務(wù)、購物服務(wù)、公共設(shè)施、體育休閑服務(wù)等,共同體現(xiàn)了商場主題;主題11中的醫(yī)療保健服務(wù)、交通設(shè)施服務(wù)等共同體現(xiàn)了醫(yī)療機構(gòu)主題。為衡量主題語義特征提取是否合理,計算各主題向量間的余弦相似度,得到主題相似度矩陣(圖6)。由圖6可知:主題7和主題17之間余弦相似度高達92%,均以風(fēng)景名勝設(shè)施為主,與生活服務(wù)等POI共同出現(xiàn),體現(xiàn)了風(fēng)景名勝主題;主題2和主題6之間的余弦相似度高達88%,均為購物服務(wù)、餐飲服務(wù)、生活服務(wù)等類型的POI,凸顯了購物服務(wù)主題;其他各主題之間的余弦相似度普遍較低,說明主題之間相對獨立,重合內(nèi)容較少,主題提取結(jié)果較好。
圖6 主題間的余弦相似度
表1 LDA模型提取主題的前5類POI及出現(xiàn)概率
圖5 主題詞項詞云
對武漢市旅游吸引物進行DBSCAN聚類并去除離散點,得到旅游吸引物集群空間分布(圖7)。由圖7可知:1)通過DBSCAN聚類得到的旅游吸引物集群與武漢市景區(qū)實際分布基本吻合,如黃鶴樓景區(qū)(集群3)、東湖聽濤景區(qū)(集群7)、東湖磨山景區(qū)(集群2)、武漢植物園(集群17)、東湖落雁景區(qū)(集群30)、武漢大學(xué)(集群18和集群20)、光谷步行街(集群15)、漢口江灘(集群5)、歸元禪寺(集群12)、武漢園博園(集群14)、武漢歡樂谷(集群32)等。2)武漢市主城區(qū)的旅游吸引物集群呈多中心分布空間格局:漢口區(qū)域的旅游吸引物主要沿漢口江灘線狀分布,中山公園、解放公園和武漢園博園等集群自成中心;漢陽區(qū)域的旅游吸引物主要分布在漢江、長江交匯區(qū)域;武昌區(qū)域的黃鶴樓、東湖沿岸、光谷步行街和各個高校分別形成旅游吸引物集群。
圖7 旅游吸引物DBSCAN聚類結(jié)果
為進一步分析武漢市旅游吸引物集群的主題語義特征,本文將每個集群內(nèi)旅游吸引物的“文檔—主題”向量均值作為該集群的向量,并繪制相應(yīng)的矩陣圖(圖8)。由圖8可知,有一半的集群中風(fēng)景名勝主題出現(xiàn)的概率最大,說明這些集群內(nèi)大部分旅游吸引物周邊以風(fēng)景名勝類設(shè)施為主,集群2、7、14、17最具代表性,分別對應(yīng)東湖磨山景區(qū)、東湖聽濤景區(qū)、武漢園博園、武漢植物園這類戶外自然景區(qū),它們與城市中心功能區(qū)分離,而集群內(nèi)部風(fēng)景名勝類的旅游吸引物之間距離較近,其他類型設(shè)施較少,因此出現(xiàn)概率最大的POI仍為風(fēng)景名勝。集群32(武漢歡樂谷)中體育休閑主題出現(xiàn)的概率達32%,且餐飲服務(wù)主題概率也較高,體現(xiàn)了武漢歡樂谷附近的休閑娛樂屬性。集群18(武漢大學(xué))、集群28(中國地質(zhì)大學(xué))、集群31(華中科技大學(xué))等高校是極具特色的人文類旅游吸引物,以科教文化服務(wù)主題為主,與風(fēng)景名勝、商務(wù)住宅、體育休閑服務(wù)等主題共同出現(xiàn)。5、6、15、23等集群中,餐飲服務(wù)主題出現(xiàn)的概率在10%以上,購物服務(wù)主題出現(xiàn)的概率達20%以上,它們分別對應(yīng)漢口江灘、洪山廣場、光谷步行街、楚河漢街集群,附近均有美食集聚地和購物商鋪,說明了其商圈特征。部分集群的主題分布較均勻,如集群5(漢口江灘)、集群8(解放公園)和集群10(中山公園),說明這些集群的主題語義特征不突出,設(shè)施分布較均勻。由以上分析可知,武漢市的旅游吸引物大致分為自然景區(qū)、娛樂景區(qū)、人文景區(qū)、商圈美食和公園等類別,不同類別的旅游吸引物集群的空間分布錯落有致。結(jié)合主題語義特征對旅游吸引物進行空間布局分析,可更清晰地感知武漢市的旅游吸引物布局,且能通過不同的主題共現(xiàn)模式感知旅游吸引物配套設(shè)施的建設(shè)情況。
圖8 旅游吸引物集群向量
進一步結(jié)合語義特征和空間特征分析旅游吸引物的主題混合模式,每個旅游吸引物均可通過“文檔—主題”矩陣表示為一個向量,不同的主題組合不僅能揭示該旅游吸引物的功能分布,還能揭示其功能豐富程度。由圖8可知,各集群中各個主題的概率均不為0,因此主題豐富度(即Hill Numbers零階多樣性)均為18。本文用Hill Numbers指數(shù)計算每個旅游吸引物的一階多樣性和二階多樣性指數(shù),然后將每個集群均值作為集群的多樣性指數(shù)。
將具有代表性的旅游吸引物集群的多樣性指數(shù)從高到低排名(表2),可為游客選擇旅游目的地提供建議:對于旅游出行目的多樣的游客而言,可選擇主題語義特征多樣性較高的旅游吸引物作為旅游目的地,如漢口江灘、中山公園和解放公園等區(qū)域景點密集,配套設(shè)施豐富,可滿足游客的一站式出行需求;對于旅游出行目的較單一的游客而言,可直接選擇主題語義特征突出的旅游吸引物集群作為旅游目的地,如希望在節(jié)假日到戶外散心、感受大自然的游客可選擇以風(fēng)景名勝主題語義特征為主的武漢園博園、武漢植物園以及東湖各個景區(qū),希望購物的游客可打卡楚河漢街、光谷步行街等商圈。同類景點中,游客還可參考主題語義特征多樣性及旅游吸引物的空間位置選擇出行目的地。
表2 旅游吸引物集群主題語義特征多樣性排名
各景區(qū)中,主題混合度和優(yōu)勢度兩指數(shù)均高的區(qū)域包括漢口江灘、中山公園、解放公園等,以商圈和公園為主,主要是購物服務(wù)、餐飲、公司企業(yè)、通行設(shè)施等主題的混合模式,其主題混合度較高且主題優(yōu)勢度較好,說明這些區(qū)域POI設(shè)施豐富且分布較均勻;兩指數(shù)均低的區(qū)域主要有武漢園博園、武漢植物園、東湖聽濤景區(qū)、東湖磨山景區(qū)、東湖落雁景區(qū)等,這些區(qū)域主題構(gòu)成以風(fēng)景名勝為主,景區(qū)定位較單一,所以主題混合度和優(yōu)勢度均較低。另外,黃鶴樓、武漢大學(xué)等集群的主題混合模式主要包括風(fēng)景名勝、公司企業(yè)、餐飲、體育休閑等主題,混合度相對較高,但主題優(yōu)勢度較低,說明現(xiàn)有的主題混合不夠均勻。
經(jīng)過對主題特征混合度和優(yōu)勢度分析,發(fā)現(xiàn)每個主題在不同混合模式下作用不同。主題混合度和優(yōu)勢度均高的主題混合模式中最常出現(xiàn)的主題包括購物服務(wù)、餐飲、通行設(shè)施等,說明這些主題對其他主題的吸引力很大,從而可提高主題多樣性;而兩指數(shù)均低的混合模式中以風(fēng)景名勝主題為主,這是因為景區(qū)的定位比較明確,主題相對單一,且有一定的禁建、限建要求,因此其主題多樣性較低。根據(jù)旅游吸引物集群的不同主題語義特征和主題混合模式,可為游客提供更精細化的出行建議,也可為景區(qū)建設(shè)提供相應(yīng)參考。在自然景區(qū)建設(shè)中,可在滿足景區(qū)禁建、限建的要求下,適當引入餐飲、購物行業(yè),增設(shè)交通服務(wù)設(shè)施,如在東湖沿岸景區(qū)中,增設(shè)共享單車借還點、自動售賣機和垃圾桶,從而使景區(qū)服務(wù)更多元和便捷;在建設(shè)商圈等旅游吸引物時,可設(shè)置更明確的主題定位,從而避免商圈的同質(zhì)化競爭。
POI的空間分布與人們的活動高度相關(guān),不同的POI共現(xiàn)模式體現(xiàn)了不同的功能主題,顯示了不同旅游吸引物的特點。本文基于武漢市POI數(shù)據(jù),通過LDA模型提取旅游吸引物周邊區(qū)域的主題語義特征,對旅游吸引物進行空間聚類,分析其空間格局,并進一步計算每個集群的主題多樣性,從空間特征和語義特征兩個維度為刻畫城市旅游吸引物地理畫像提供新思路。具體結(jié)論如下:1)提取了武漢市旅游吸引物的18個主題語義特征,不同的主題表現(xiàn)為不同的POI共現(xiàn)模式。其中部分主題特征鮮明,如7、12、13等主題分別表示風(fēng)景名勝、商務(wù)住宅和生活服務(wù)主題;部分主題(如主題2和主題4)為混合主題,其各類POI的出現(xiàn)概率差別較小。2)武漢市多數(shù)旅游吸引物呈現(xiàn)明顯的空間集聚,不考慮離散的旅游吸引物,共形成具有不同主題特征的32個景點集群。武漢園博園、武漢植物園、東湖各風(fēng)景區(qū)等自然景觀景區(qū)位置較偏僻,其主題特征主要為風(fēng)景名勝,其他主題特征不明顯;武漢大學(xué)、華中師范大學(xué)等高校主要分布在洪山區(qū),其語義特征以科教文化服務(wù)主題為主,兼具生活服務(wù)和政府機構(gòu)及商務(wù)住宅主題;光谷步行街、楚河漢街等商圈交通便利,設(shè)施齊全,主題特征豐富多元。3)各個主題在不同混合模式下作用不同。購物服務(wù)、餐飲、通行設(shè)施等主題更易吸引其他主題,提高主題多樣性;而風(fēng)景名勝主題較為單一,其主題多樣性較低。在自然景區(qū)的建設(shè)中,可在滿足景區(qū)禁建、限建的政策要求下,引入適量的公共服務(wù)、餐飲服務(wù)等其他類型設(shè)施,以提升游客的游覽體驗;在城市廣場、商務(wù)區(qū)等旅游吸引物集群中,可因地制宜建設(shè)有特色的主題商圈。游客可結(jié)合旅游吸引物的主題特征、空間分布和主題多樣性選擇旅游目的地。
本研究以POI為基礎(chǔ)數(shù)據(jù),數(shù)據(jù)源較為單一,研究結(jié)果依賴POI的數(shù)據(jù)質(zhì)量,后續(xù)研究可結(jié)合用地類型、社交媒體數(shù)據(jù)[29]等多源數(shù)據(jù)提取主題特征。