陳神鑫
廣州大學(xué) 廣東 廣州 510006
城市公園作為城市生態(tài)系統(tǒng)、城市景觀(guān)的重要組成部分,起著為城市居民進(jìn)行休憩、鍛煉、社交、游覽的作用。隨著現(xiàn)代化城市的發(fā)展,市民的生活節(jié)奏愈來(lái)愈快,且對(duì)城市公園的需求與日俱增。另一方面,信息技術(shù)的快速發(fā)展為人們搭建了交流平臺(tái),人們可以對(duì)網(wǎng)絡(luò)熱點(diǎn)、時(shí)事新聞等相關(guān)內(nèi)容進(jìn)行實(shí)時(shí)評(píng)論,基于這些背景,帶有情感傾向性的公園網(wǎng)絡(luò)評(píng)論大數(shù)據(jù)應(yīng)運(yùn)而生。
情感傾向分析是對(duì)帶有情感色彩的主觀(guān)性文本進(jìn)行分析、處理、歸納和推理的過(guò)程。而色彩作為景觀(guān)構(gòu)成要素的重要組成部分,是游園者感受城市公園的最為直觀(guān)的景觀(guān)要素,紀(jì)東坡等通過(guò)實(shí)地考察、問(wèn)卷調(diào)查和深度訪(fǎng)談等方法對(duì)游客的基本屬性以及游客對(duì)公園色彩景觀(guān)的傾向性?xún)蓚€(gè)方面分析游客對(duì)公園色彩景觀(guān)的意向;吳姝婷等則通過(guò)專(zhuān)家打分法確定評(píng)價(jià)因子探究閩江公園游客心理體驗(yàn)和有色景觀(guān)空間的相關(guān)性。各研究學(xué)者的探索豐富了城市公園色彩與游客心理的研究,但采用的方法容易受到較多因素的限制,例如樣本有效性不足、問(wèn)卷發(fā)放時(shí)空和數(shù)量的局限性、參與者的可訪(fǎng)問(wèn)性弱等。如今,網(wǎng)絡(luò)數(shù)據(jù)覆蓋的普遍性為分析公眾的色彩情感傾向提供了新的可能性。
本文以廣州市越秀公園的游客為研究對(duì)象,選取各類(lèi)網(wǎng)絡(luò)平臺(tái)的評(píng)論數(shù)據(jù)進(jìn)行分析,運(yùn)用情感分析方法研究游客對(duì)不同色彩的情感傾向,為今后公園色彩規(guī)劃設(shè)計(jì)提供理論依據(jù)和實(shí)證研究基礎(chǔ)。
越秀公園是廣州最大的綜合性公園,面積約為六十九萬(wàn)平方米,公園所處區(qū)域,自元代以來(lái)一直是羊城八景之一,2006年越秀公園被評(píng)為國(guó)家4A級(jí)旅游景區(qū)。選取該公園作為研究對(duì)象的原因如下:1)越秀公園使用者數(shù)量多、類(lèi)型廣,具有研究意義和優(yōu)化價(jià)值;2)越秀公園部分景點(diǎn)的用色具有代表性,但經(jīng)過(guò)實(shí)地考察,發(fā)現(xiàn)仍然存在色彩搭配不合理的現(xiàn)象,同類(lèi)型城市公園中仍然存在類(lèi)似的問(wèn)題,因此本研究具有普適性; 3)越秀公園,建成年代久,受歡迎程度高,因此在網(wǎng)絡(luò)上的評(píng)論數(shù)據(jù)較多,滿(mǎn)足樣本的選取條件,能夠?yàn)槌鞘泄珗@研究提供較為充足的基礎(chǔ)數(shù)據(jù)。
本文采用以社交媒體評(píng)論為數(shù)據(jù)源,以不同的色彩單音詞為標(biāo)簽對(duì)網(wǎng)絡(luò)評(píng)論進(jìn)行分類(lèi),利用百度AIP平臺(tái)的Sentiment Classify工具就可以在Python上可以實(shí)現(xiàn)精準(zhǔn)情感傾向分析。技術(shù)路線(xiàn)如圖1所示。研究步驟為:(1)數(shù)據(jù)收集與清洗;(2)文本分類(lèi);(3)情感傾向。
圖1 越秀區(qū)實(shí)景照片(圖片來(lái)源:網(wǎng)絡(luò))
圖2 技術(shù)路線(xiàn)圖(圖片來(lái)源:作者自繪)
本文以新浪微博、攜程網(wǎng)、馬蜂窩、去哪兒網(wǎng)以及美團(tuán)5個(gè)中文網(wǎng)絡(luò)平臺(tái)為數(shù)據(jù)源進(jìn)行分析。新浪微博作為中國(guó)最具影響力的社交媒體之一,用戶(hù)可以通過(guò)文字、圖片、短視頻等方式實(shí)時(shí)傳播信息,以越秀公園為關(guān)鍵字進(jìn)行檢索可以獲得大量信息。攜程網(wǎng)、馬蜂窩、去哪兒網(wǎng)以及美團(tuán)為專(zhuān)業(yè)點(diǎn)評(píng)網(wǎng)站,里面包含大量與景點(diǎn)有關(guān)的評(píng)論數(shù)據(jù)。利用Python的BeautifulSoup、re正則表達(dá)式等實(shí)現(xiàn)文本評(píng)論數(shù)據(jù)的爬取、解析,以2011年1月1日——2021年12月31日為時(shí)間節(jié)點(diǎn),共獲得文本評(píng)論數(shù)據(jù)13254條。
數(shù)據(jù)清洗工作是保證后期數(shù)據(jù)研究質(zhì)量的重要環(huán)節(jié)。利用python的re正則表達(dá)式對(duì)評(píng)價(jià)數(shù)據(jù)中的廣告等無(wú)關(guān)數(shù)據(jù)進(jìn)行剔除,再對(duì)重復(fù)數(shù)據(jù)以及網(wǎng)頁(yè)鏈接進(jìn)行刪減,并將表情符號(hào)進(jìn)行轉(zhuǎn)碼,最終獲得清洗之后的數(shù)據(jù)共5361條。
語(yǔ)言與色彩的聯(lián)系最終還是通過(guò)語(yǔ)言中的色彩詞得以體現(xiàn),本文采用了黑、白、紅、黃、綠、藍(lán)、紫、灰、褐9個(gè)基本色彩詞對(duì)文本數(shù)據(jù)進(jìn)行分類(lèi)。剔除含有基本色彩詞但與色彩無(wú)關(guān)的數(shù)據(jù),最終得到的分類(lèi)數(shù)據(jù)共346條,其中褐的數(shù)據(jù)過(guò)少,黑與白在語(yǔ)言表達(dá)中色彩屬性不明顯,因此將這三種顏色剔除,最后將數(shù)據(jù)總共分為六個(gè)類(lèi)別,每個(gè)類(lèi)別的評(píng)論數(shù)量如表1。
表1 評(píng)論含不同類(lèi)別單音色彩詞數(shù)量及示例(作者自繪)
本文主要采取的是基于python平臺(tái)的Sentiment Classify工具對(duì)越秀公園的關(guān)于不同類(lèi)別的評(píng)論數(shù)據(jù)進(jìn)行情感傾向分析,在python平臺(tái)調(diào)用百度API接口,對(duì)越秀公園評(píng)論數(shù)據(jù)的情感傾向進(jìn)行判斷。情感傾向主要分為消極(0~0.333)、中性(0.333~0.667)和積極(0.667~1.000)3類(lèi)。
首先對(duì)評(píng)論數(shù)據(jù)進(jìn)行整體情感傾向分析,從宏觀(guān)上感受游客對(duì)越秀公園整體色彩的滿(mǎn)意度。將收集并清洗完畢的359條評(píng)論數(shù)據(jù)進(jìn)行情感傾向分析。其中,積極評(píng)論256條,占比73.53%;中性評(píng)論63條,占比18.21%;消極評(píng)論27條,占比7.8%。
總體上看,游客對(duì)公園色彩的滿(mǎn)意度較高,利用snownlp工具對(duì)通過(guò)詞頻分析可以看出,積極情感高頻詞多以描述景點(diǎn)建筑、植被和人物心情為主。消極情感高頻詞則集中在對(duì)天氣以及燈的描述上,說(shuō)明天氣和環(huán)境光源在一定程度上會(huì)影響使用者對(duì)公園色彩的消極情緒。
圖3 整體詞頻分析(左邊積極,右邊消極,作者自繪)
對(duì)含有不同顏色單音詞的評(píng)論進(jìn)行情感傾向分析有助于了解游客對(duì)不同顏色的色彩情感傾向。在分類(lèi)情感傾向分析數(shù)據(jù)中,評(píng)論中帶單音詞“綠”的最多,占總評(píng)論數(shù)的61.85%;其次是“紅”和“藍(lán)”,占比分別為19.65%和9.25%;其他顏色的評(píng)論相對(duì)較少,“黃”、“紫”、“灰”的占比分別為2.89%、4.05%、2.31%。不同類(lèi)型的評(píng)論的情感傾向如表2。
表2 不同類(lèi)型的評(píng)論的情感傾向及占比(作者自繪)
在利用深度學(xué)習(xí)算法實(shí)現(xiàn)不同類(lèi)別的情感傾向判斷之后,通過(guò)提取不同類(lèi)別中的詞頻信息,并對(duì)照已分類(lèi)評(píng)論文本中的描述內(nèi)容,對(duì)不同類(lèi)別的評(píng)論進(jìn)行詳細(xì)分析。評(píng)論中帶單音詞“綠”的積極情感占比最高(75.70%),消極情感占比最低(5.61%),對(duì)其進(jìn)行詞頻分析可以看出積極評(píng)論主要集中在對(duì)植物花卉和一些景點(diǎn)的討論上,大部分人認(rèn)為越秀公園的綠化做得不錯(cuò)。
圖4 單音詞“綠”詞頻分析(左邊積極,右邊消極,作者自繪)
有少量消極評(píng)論則認(rèn)為對(duì)顏色過(guò)于單一,全是綠色無(wú)明顯地標(biāo)等問(wèn)題提出了看法。評(píng)論中帶單音詞“紅”的消極情感占比最高(17.65%),評(píng)論主要集中在對(duì)越秀公園春節(jié)舉辦的花燈節(jié)的花燈改成了小紅燈上,可以證明游客希望節(jié)日的越秀公園需要更多的色彩存在。帶有其他顏色的評(píng)論也多是積極情感,主要集中在對(duì)公園的帶有特殊色彩的小品以及對(duì)公園的色彩斑斕的花卉的描述上,消極評(píng)論則多認(rèn)為部分水面的水質(zhì)不好以及部分地方樹(shù)木太過(guò)茂盛導(dǎo)致過(guò)于灰暗的現(xiàn)象。
本研究利用python軟件爬取了4個(gè)專(zhuān)業(yè)公園景點(diǎn)評(píng)論網(wǎng)站及新浪微博平臺(tái)上關(guān)于越秀公園的評(píng)論數(shù)據(jù)并進(jìn)行了數(shù)據(jù)清洗,使得基礎(chǔ)數(shù)據(jù)更加豐富。同時(shí)利用自然語(yǔ)言處理的深度學(xué)習(xí)算法,對(duì)公園使用者對(duì)不同色彩類(lèi)別的情感傾向進(jìn)行了定量分析,從評(píng)論中提取含有紅、黃、藍(lán)、綠、紫、灰6個(gè)色彩單音詞的評(píng)論進(jìn)行分類(lèi)情感傾向分析,為相關(guān)研究提供了新思路。相較于傳統(tǒng)的現(xiàn)場(chǎng)訪(fǎng)談和問(wèn)卷調(diào)查方法,此方法可獲取樣本數(shù)量更多、時(shí)間跨度更大,同時(shí)調(diào)查研究的投入成本更低、效率更高,而且結(jié)果可量化。
然而研究存在如下局限:(1)數(shù)據(jù)源。網(wǎng)絡(luò)用戶(hù)只占公園實(shí)際游客的小部分,且年齡上可能更年輕、受教育程度也可能更高。針對(duì)公園色彩的評(píng)論數(shù)據(jù)也還不夠多。因此,網(wǎng)絡(luò)評(píng)論數(shù)據(jù)雖然為相關(guān)研究提供了強(qiáng)有力的數(shù)據(jù)支撐,但也存在固有弊端。(2)色彩單音詞并非全用于形容顏色。通過(guò)前期的數(shù)據(jù)篩選可以發(fā)現(xiàn)許多含有色彩單音詞的評(píng)論數(shù)據(jù)與色彩并無(wú)關(guān)系,這是中文詞語(yǔ)構(gòu)成帶來(lái)的固有弊端,需要通過(guò)深度學(xué)習(xí)的不斷訓(xùn)練最終達(dá)到機(jī)器識(shí)別出與色彩真正相關(guān)的評(píng)論數(shù)據(jù),此次研究由于評(píng)論數(shù)據(jù)數(shù)量沒(méi)有達(dá)到深度學(xué)習(xí)前期訓(xùn)練需要的模型數(shù)量,因此采用的是人工識(shí)別,今后在進(jìn)行更多數(shù)據(jù)的甄別上可以加入該方面的算法。(3)游客情感的細(xì)粒度。本研究將游客情感劃分為積極、中性、消極3類(lèi),能夠滿(mǎn)足研究需要。后續(xù)研究可依據(jù)具體研究目標(biāo)對(duì)游客情感進(jìn)行更具細(xì)粒度的分析,如憤怒、厭惡、恐懼、驚訝、快樂(lè)等。
越秀公園內(nèi)游客所發(fā)的評(píng)論經(jīng)過(guò)情感傾向分析,科學(xué)地表明了色彩對(duì)游客情緒可以產(chǎn)生積極影響,但部分設(shè)施帶來(lái)的不良影響也會(huì)通過(guò)色彩體現(xiàn)在游客的評(píng)論中。
根據(jù)研究結(jié)果,提出一些建議:(1)要提升游客在公園中的游覽體驗(yàn),應(yīng)從增加色彩斑斕的花卉等植物景觀(guān)入手,越秀公園部分活動(dòng)空間類(lèi)型較為單調(diào)、植物色彩單一、構(gòu)筑物及景觀(guān)小品缺乏趣味。在公園中,色彩與眾不同更能吸引游客。(2)公園部分設(shè)施的老化與環(huán)境的污染會(huì)給游客帶來(lái)不良印象,因此需要注重公園的設(shè)施更新以及燈光設(shè)計(jì)。(3)評(píng)論在公園舉辦活動(dòng)時(shí)會(huì)明顯變多,證明舉辦豐富多彩的旅游體驗(yàn)活動(dòng)和民俗活動(dòng),可以吸引更多游客,舉辦活動(dòng)時(shí)可以增加多種色彩,烘托節(jié)日氣氛。
提取和分析多網(wǎng)絡(luò)平臺(tái)及大時(shí)間跨度評(píng)論內(nèi)容的數(shù)字化方法可為城市公園的規(guī)劃與建設(shè)提供更加強(qiáng)大的數(shù)據(jù)支撐和更加多元的研究可能性。隨著大數(shù)據(jù)、深度學(xué)習(xí)等領(lǐng)域的相關(guān)技術(shù)在風(fēng)景園林學(xué)科中的廣泛應(yīng)用,城市公園規(guī)劃設(shè)計(jì)與研究的精細(xì)化程度將得到大幅提升。