馬薛騎
裘鴻菲*
景觀意象是旅游意象的重要組成部分,指的是游客主體和景觀客體之間的映射,即主體對客體的想象與感知[1]。強烈的景觀意象對游客的吸引力更強,是景觀建設(shè)的基礎(chǔ)與理論依據(jù),也是提高旅游競爭力的重要途徑。湖泊公園作為城市典型的藍(lán)綠空間,提供著重要的生態(tài)調(diào)節(jié)服務(wù)與景觀游憩服務(wù),具有多種環(huán)境及社會效益[2],對于提高人類福祉和公共健康大有裨益,已經(jīng)成為公眾休閑放松、活動娛樂的重要城市開放空間。因此研究湖泊公園的景觀意象有助于從公眾角度完善湖泊公園的景觀建設(shè),但目前缺乏對景觀意象的理論研究與系統(tǒng)化的感知挖掘分析。
隨著互聯(lián)網(wǎng)與人工智能的革新發(fā)展,使用社交媒體的人數(shù)以及來自大眾網(wǎng)絡(luò)公開數(shù)據(jù)的類型和數(shù)量呈指數(shù)級增長[3],網(wǎng)絡(luò)平臺端口的打通也為獲取公開數(shù)據(jù)提供了支持[4]?;诖蟊娋W(wǎng)絡(luò)媒介的數(shù)據(jù)源樣本量大、公眾參與程度高,能夠更全面多維度地表達(dá)公眾的感知偏好。目前來自Flicker、Panoramio、Twitter、微博、豆瓣等社交平臺以及大眾點評、攜程等旅游網(wǎng)站的多源數(shù)據(jù)已被廣泛應(yīng)用于景觀研究[5-8],在線旅游網(wǎng)站逐漸成為游客表達(dá)景區(qū)感知偏好和情感評價的重要途徑[9]。人們在各類網(wǎng)絡(luò)平臺分享的評論與照片,為相關(guān)研究貢獻(xiàn)了海量的樣本數(shù)據(jù),目前基于網(wǎng)絡(luò)文本的內(nèi)容分析已經(jīng)可以通過自然語言處理等方法實現(xiàn)自動化處理,然而基于照片數(shù)據(jù)的研究仍多依賴于手動編碼和定性分析[10],這不僅使得分析結(jié)果易受到研究人員個體偏見和主觀性的影響,還難以將其擴展到大型數(shù)據(jù)集和大尺度研究領(lǐng)域[11-13];而利用包含深度學(xué)習(xí)標(biāo)簽的大型圖片數(shù)據(jù)集的研究則存在數(shù)據(jù)難以進(jìn)行再處理,研究內(nèi)容受限的問題[14]。因此,通過計算機視覺算法處理大量圖片數(shù)據(jù)來彌補手動編碼的缺陷,目前已成為景觀視覺和景觀偏好研究的重要手段。在圖像大數(shù)據(jù)集和云計算的推動下,計算機視覺應(yīng)用程序的能力也迅速提升[15],目前可通過在線機器學(xué)習(xí)算法實現(xiàn)圖像識別的平臺包括Google Cloud Vision①、Microsoft Azure、Clarifai及百度智能云,其中Google Cloud Vision提供的圖像識別API可以通過預(yù)訓(xùn)練的機器學(xué)習(xí)算法識別圖像中的特定對象,包括人、動物、物體、標(biāo)志等,提取圖片顏色以及識別文本;除此之外,還提供了基于研究人員分類標(biāo)簽的自定義模型程序,為實現(xiàn)特定研究提供了條件。目前Google Cloud Vision在國外已被應(yīng)用于國家、城市、自然保護(hù)區(qū)、國家公園等對象的生態(tài)系統(tǒng)文化服務(wù)、景觀美學(xué)等研究[16-19],已成為實現(xiàn)大規(guī)模圖像內(nèi)容分析的前言技術(shù)方法。
鑒于此,本研究開發(fā)了一個新框架來綜合分析大規(guī)模圖像數(shù)據(jù),通過Google Cloud Vision提供的在線機器學(xué)習(xí)算法,自定義景觀標(biāo)簽,構(gòu)建Auto ML模型對武漢市7個湖泊公園的16 883張網(wǎng)絡(luò)景觀照片進(jìn)行圖像挖掘與內(nèi)容識別,歸納景觀意象的具體維度,分析研究地的景觀意象特征及感知偏好,為提升研究地的景觀吸引力提供建議。
武漢位于中國中部地區(qū),是湖北省省會,地處古云夢澤地帶,市內(nèi)湖泊眾多,素有“百湖之市”之稱,現(xiàn)有大小湖泊166個。湖泊不僅是武漢市重要的生態(tài)系統(tǒng),也是城市歷史文化的源流,是城市形象的重要標(biāo)志。本研究以武漢市為例,根據(jù)公園面積、公園類型、地理位置等公園屬性選取了7個具有代表性的湖泊公園作為研究對象(圖1,表1)。
圖1 湖泊公園地理位置
本研究的照片數(shù)據(jù)來源于在線旅游網(wǎng)站上游客的評論圖片,考慮到社交媒體平臺(微博、小紅書等)用戶數(shù)據(jù)的私密性以及平臺本身的隱私政策,在此不予考慮。本研究選取大眾點評網(wǎng)、攜程網(wǎng)、馬蜂窩旅游網(wǎng)3個受眾性高、評價數(shù)據(jù)量大的國內(nèi)主流旅游網(wǎng)站,通過網(wǎng)絡(luò)爬蟲進(jìn)行照片檢索與爬取,時間跨度為2018年4月26日—2021年4月26日,爬取7個公園所有的游客評論圖片,共21 674張。隨后對照片數(shù)據(jù)進(jìn)行預(yù)處理,剔除模糊照片、同一評論者上傳的相同照片以及以人像、食物、地圖、門票、廣告等為主的非景觀照片,最后保留16 883張景觀照片(表1)。
表1 湖泊公園名錄
本研究應(yīng)用Google Cloud Vision提供的在線機器學(xué)習(xí)算法分析網(wǎng)絡(luò)照片,運用圖像識別應(yīng)用程序編程接口(Vision API)和Vertex AI平臺來識別圖像內(nèi)容、自定義景觀標(biāo)簽以及創(chuàng)建、訓(xùn)練、評估Auto ML(Automated Machine Learning,自動機器學(xué)習(xí))模型,最后利用Auto ML模型批量預(yù)測景觀照片得到圖像識別結(jié)果,通過統(tǒng)計分析、分類總結(jié)等方法探討研究地景觀意象的特征及公眾偏好,分析其感知共性與特性。具體研究思路如圖2所示。
圖2 研究思路
將景觀照片數(shù)據(jù)集按不同公園分為7層,在各層中通過分層定比,即按2.96%的樣本比例,在各層中進(jìn)行簡單隨機抽樣,共抽樣出500張照片,用于圖像標(biāo)簽分析。根據(jù)景觀特征和相關(guān)研究,通過人工識別對500張樣本照片進(jìn)行景觀分類和空間尺度分類,通過Vision API對樣本照片進(jìn)行圖像內(nèi)容識別。
1)單標(biāo)簽-景觀要素:景觀要素可歸納總結(jié)為兩大類型、8項要素。其中自然景觀包括水體景觀、林木景觀、花卉景觀、水生植物景觀;人文景觀包括歷史文化(以傳統(tǒng)的亭臺樓閣、歷史雕像等為主的文史景觀)、景觀設(shè)施(以廣場、景觀小品等為主的硬質(zhì)景觀)、游樂設(shè)施、道路環(huán)境。
2)單標(biāo)簽-空間尺度:空間尺度可分為宏觀、中觀、微觀和微距4類,宏觀指110m見方以上的空間,中觀指25~110m見方的空間,微觀指25m見方以下的空間[20],微距在此指的是特寫照片。
3)多標(biāo)簽-圖像內(nèi)容:Vision API基于預(yù)訓(xùn)練的機器學(xué)習(xí)模型,為每張照片返回帶有置信度得分(0~1)的關(guān)鍵詞標(biāo)簽[12]。通過設(shè)定為每張照片添加最多10個關(guān)鍵詞標(biāo)簽,得到初始多標(biāo)簽數(shù)據(jù)庫。提取所有置信度>0.5分的標(biāo)簽,并對標(biāo)簽數(shù)據(jù)進(jìn)行檢查,刪除極低頻率出現(xiàn)的標(biāo)簽(flowerpot,coquelicot等)和與研究需求無關(guān)的標(biāo)簽(botany,symmetry等),歸并相似意義的標(biāo)簽(grass和meadow,building和architecture等),整合具有相同屬性的標(biāo)簽(monument,arts等),最后整理得到38個圖像內(nèi)容識別多標(biāo)簽(表2)??紤]景觀意象的復(fù)雜性和多元性,部分標(biāo)簽之間存在一定的交叉關(guān)系。
表2 圖像內(nèi)容識別多標(biāo)簽
在景觀照片數(shù)據(jù)集中按6.33%的樣本比例,在各層中進(jìn)行簡單隨機抽樣,共抽樣出1 068張照片,用于Auto ML模型的訓(xùn)練與評估。首先人工為每張照片添加單標(biāo)簽與多標(biāo)簽,并保證每項標(biāo)簽至少有50張以上照片。其次將標(biāo)記后的數(shù)據(jù)集按照80%、10%和10%的比率拆分為訓(xùn)練集、驗證集和測試集。最后Vertex AI通過監(jiān)督學(xué)習(xí),訓(xùn)練Auto ML模型。
2.3.1 景觀分類模型評估
景觀分類模型的平均精確率為0.946,在置信度閾值為0.5時,精確率為86.8%,召回率為85.2%(圖3),總體來看模型精度較高,各項指標(biāo)均大于0.85。評估結(jié)果表明模型可以較好地分類所有景觀類型,其中對游樂設(shè)施、水體景觀、花卉景觀的識別能力最好(置信度>0.95,正確預(yù)測比率>85%);但對景觀設(shè)施和歷史文化以及水生植物景觀和林木景觀之間存在一定程度的混淆,混淆比率分別為27%和25%,原因可能在于2組景觀要素的部分樣本包含了重疊或相似的景觀內(nèi)容,考慮到景觀的復(fù)雜性和人工識別誤差,該部分誤差可認(rèn)為是正常結(jié)果。
圖3 景觀分類Auto ML模型評估指標(biāo)
2.3.2 空間尺度分類模型評估
空間尺度分類模型的平均精確率為0.887,在置信度閾值為0.5時,精確率為85.7%,召回率為84.7%,且各項標(biāo)簽的模型置信度得分均大于0.85(圖4)。評估結(jié)果表明模型可以較好地分類所有空間尺度,其中對微距尺度景觀的識別能力最好(置信度得分>0.95,正確預(yù)測比率>85%)。
圖4 空間尺度分類Auto ML模型評估指標(biāo)
2.3.3 圖像內(nèi)容識別模型評估
圖像內(nèi)容識別模型的平均精確率為0.834,在置信度閾值為0.5時,精確率為87%,召回率為61.8%(圖5)。由模型置信度得分(圖6)可知所有標(biāo)簽中置信度>0.5的有35項(占92.1%),即絕大多數(shù)標(biāo)簽滿足模型用于內(nèi)容識別的要求;置信度>0.8的標(biāo)簽過半,大于0.95的標(biāo)簽超過1/4,即模型在精確識別部分標(biāo)簽方面表現(xiàn)良好。其中模型對花瓣、主題雕塑、摩天輪、臺階、纜車、夜景6項標(biāo)簽的識別能力最好(置信度=1),對水上棧道、拱橋和落葉樹幾項標(biāo)簽的識別能力較差(置信度<0.5),原因可能在于部分標(biāo)簽的樣本量較少及標(biāo)簽之間存在一定的相似度和交叉關(guān)系,使模型學(xué)習(xí)時遇到困難,導(dǎo)致正確識別該項標(biāo)簽的比率降低。
圖5 圖像內(nèi)容識別Auto ML模型評估指標(biāo)
圖6 圖像內(nèi)容識別多標(biāo)簽?zāi)P椭眯哦鹊梅?/p>
通過圖像標(biāo)簽分析得到樣本照片的景觀要素單標(biāo)簽、空間尺度單標(biāo)簽和圖像內(nèi)容識別多標(biāo)簽結(jié)果,以此作為歸納景觀意象維度結(jié)構(gòu)的依據(jù)。因此湖泊公園的景觀意象可解構(gòu)為兩大景觀類型、8類景觀要素、4層空間尺度和38項意象元素(見2.1)。
在Vertex AI平臺上通過構(gòu)建的Auto ML模型對16 883張景觀照片進(jìn)行批量預(yù)測,刪除預(yù)測數(shù)據(jù)中置信度值低于0.5分的樣本數(shù)據(jù),最后保留可用于分析研究的15 656張照片數(shù)據(jù)。
經(jīng)過整理得到7個湖泊公園景觀類型的感知分析結(jié)果(圖7)和景觀要素的感知強度分析結(jié)果(圖8)??傮w來看,湖泊公園中自然景觀(60.92%)的感知高于人文景觀(39.08%),其中沙湖公園和月湖公園的自然景觀感知強度尤其高;水體景觀、林木景觀和歷史文化是湖泊公園的核心感知要素,其占比超過所有要素的半成(55.07%)。由此可知,湖泊公園中水景作為最重要的構(gòu)景要素也是最受人們歡迎的景觀要素,這也反映了人們的親水心理以及對自然風(fēng)景的向往很大程度上影響了其感知偏好;除此之外,歷史文化得到高度感知的原因在于其代表了城市重要的景觀風(fēng)貌,武漢市作為國家歷史文化名城,楚文化的重要發(fā)祥地,城市多處旅游地的風(fēng)景、建筑都展現(xiàn)著濃厚的人文歷史風(fēng)貌,引起了游客的強烈感知。其次,由于每個公園的自身定位和景觀特色差異較大,每個公園的特性感知要素也不盡相同(表3)。
圖7 景觀類型感知分析
圖8 景觀要素感知強度分析
通過空間尺度分類模型識別景觀照片,分析游客對景觀的空間感知偏好,可得游客對7個公園中宏觀(28.92%)、中觀(28.88%)和微觀(31.52%)3種尺度的景觀感知差異不大,對微距景觀的感知略低(11.34%)。由圖9可得,人們在宏觀(81.21%)和微距(99.94%)尺度上對自然景觀的感知要明顯高于人文景觀,其中以廣闊的水體景觀和特寫花卉景觀為主;在中觀(56.19%)和微觀(56.11%)尺度上,人們對人文景觀的感知略高于自然景觀,其中以開闊的道路環(huán)境、交往尺度下的林木景觀和細(xì)節(jié)感強的歷史文化景觀為主。即在湖泊公園的空間感知層面,人們更偏好于空間廣闊深遠(yuǎn)的自然景觀和精細(xì)化設(shè)計的人文景觀。
圖9 景觀意象的空間感知特征
利用圖像內(nèi)容識別模型識別景觀照片中的意象元素,通過置信度篩選,每張照片保留1~8個標(biāo)簽,最終得到42 365個標(biāo)簽數(shù)據(jù),平均每張照片分配到2.7個標(biāo)簽。通過38項意象元素的感知頻率,可得湖泊公園景觀意象元素的感知共性為:常綠樹(25.96%)、湖泊(10.86%)、背景建筑群(7.82%)、草地(6.93%)和倒影(4.90%)的感知最強,這也契合了湖泊公園的景觀特色和現(xiàn)實情況,由于研究地均位于武漢中心城區(qū),建筑密度較高,背景建筑群入鏡景觀照片十分普遍。除去5項共性意象元素外,根據(jù)每個公園中感知較強的特性意象元素總結(jié)不同公園的感知特性并分析其感知偏好原因(表3)。
表3 湖泊公園景觀意象感知特性分析
本研究以武漢市7個湖泊公園為研究對象,對大數(shù)據(jù)網(wǎng)絡(luò)照片進(jìn)行圖像挖掘與內(nèi)容識別,歸納景觀意象的具體維度,通過在線機器學(xué)習(xí)算法構(gòu)建Auto ML模型,分析景觀意象的特征及感知偏好。主要結(jié)論如下。
1)本研究將景觀意象解構(gòu)為兩大類型、8類景觀要素、4層空間尺度和38項意象元素,從不同層面分析人們對景觀意象的感知偏好。
2)在感知共性方面,湖泊公園中自然景觀的感知高于人文景觀,其中水體景觀、林木景觀、歷史文化是湖泊公園的核心感知要素;在空間尺度層面,人們更偏好于大尺度的空間廣闊深遠(yuǎn)的自然景觀和小尺度的精細(xì)化設(shè)計的人文景觀;在意象元素層面,游客對湖泊公園中常綠樹、湖泊、背景建筑群、草地和倒影的感知最強;體現(xiàn)了人們對自然風(fēng)景的向往和對地域歷史文化的認(rèn)同。
3)在感知特性方面,不同公園的感知偏好差異較大,其中代表公園特色的特異性景觀更容易得到游客的高度感知,表明了景觀特質(zhì)挖掘與差異化景觀建設(shè)的重要性。
4)總體來看,游客對湖泊公園景觀意象的感知偏好表現(xiàn)出自然性與歷史性相結(jié)合、同質(zhì)性與異質(zhì)性相共存的特征。
景觀意象作為游客主體對景觀客體的認(rèn)知與情感寄托的載體[1],反映了游客對景觀的感知偏好,其具體內(nèi)容分析可為研究地的景觀營建與改造提供建議。1)保持自然景觀的本真性,營建開敞的濱水空間。提升濱水空間的親水性,創(chuàng)造可親近自然的休憩景觀場所。2)重視歷史底蘊,提高地域文化感。保留人文景觀的當(dāng)?shù)卦嫘?,保護(hù)公園中的歷史資源并加以改造使之成為公園核心景點,設(shè)立文史展覽區(qū)以加強人文科普教育。3)加強公園特色建設(shè),體現(xiàn)公園的異質(zhì)性。避免千篇一律的景觀建設(shè),基于不同公園的景觀風(fēng)貌與感知特性,加強差異化景觀的營建與管理。
了解游客心理及其感知偏好對于公園建設(shè)和管理至關(guān)重要,目前問卷調(diào)查是獲取游客偏好最普遍的方法,但該方法存在耗時久、樣本量受限等問題,而網(wǎng)絡(luò)開放數(shù)據(jù)則為研究者提供了一種了解游客景觀偏好的新方式[21],隨著計算機視覺算法的應(yīng)用,景觀偏好研究已向大規(guī)模定量化分析方向發(fā)展。已有研究表明計算機視覺算法是分析大量圖片內(nèi)容的有效方法,且不同算法在識別不同目標(biāo)上的表現(xiàn)存在差異,如Google Cloud Vision算法在識別景觀特征(水、植被、基礎(chǔ)設(shè)施等)方面表現(xiàn)較好[22],而Clarifai算法更擅長識別情緒[23]。因此未來可考慮結(jié)合多種方法與算法來實現(xiàn)更全面的游客感知偏好研究。
本研究利用Google Cloud Vision提供的在線機器學(xué)習(xí)算法,構(gòu)建Auto ML模型分析大量網(wǎng)絡(luò)景觀照片,來量化和推斷景觀感知偏好。本研究的結(jié)論也得到了相關(guān)研究的證實,例如Pe?a L[24]和Tieskens K F[25]等發(fā)現(xiàn)山林、草地和水體景觀更受人們歡迎,Casado-Arzuaga I[26]等表明具有更多自然景觀的地區(qū)有更高的美學(xué)價值,其他研究還表明具有農(nóng)業(yè)區(qū)、山林、水體和過渡植被的區(qū)域景觀連貫性更高,而高的景觀連貫性則有助于提高景觀美學(xué)質(zhì)量[6],這與本研究的結(jié)論相一致。除此之外,本研究的結(jié)果還表明歷史文化是人們感知偏好的重點,補充支持了Langemeyer J[27]和郭先華[28]等的研究;Junge X[29]等發(fā)現(xiàn)季相變化會影響景觀偏好,其中花卉景觀最受人們喜愛,這也與本研究的分析結(jié)果相一致。高度的一致性不僅解釋了計算機視覺算法應(yīng)用于圖像分析的合理性,也證明了網(wǎng)絡(luò)照片數(shù)據(jù)表征游客景觀偏好的有效性。
大眾網(wǎng)絡(luò)媒體可提供大數(shù)據(jù)樣本用于量化分析景觀意象特征,但由于其更常被中青年群體使用,導(dǎo)致數(shù)據(jù)存在固有抽樣偏差的局限性,可能無法代表所有公園游客[22]。因此,未來的研究可通過整合多源數(shù)據(jù)和多種方法來降低用戶偏差的影響,如加入老齡人群調(diào)查數(shù)據(jù),實現(xiàn)更全面的分析。另外,由于國內(nèi)網(wǎng)絡(luò)媒體中地理信息開源數(shù)據(jù)不夠完善,本研究使用的網(wǎng)絡(luò)照片數(shù)據(jù)未帶有地理坐標(biāo)信息,故難以進(jìn)行景觀意象感知偏好的空間分異分析,日后可深入探討如何實現(xiàn)景觀意象的可視化研究。
注:文中圖片均由作者繪制。
注釋:
① 來源:https://cloud.google.com。Google Cloud Vision提供的操作指南與教程,可參考https://cloud.google.com/vertex-ai/docs/tutorials,Vertex AI 代碼示例可參考https://github.com/googleapis/python-aiplatform/。