趙宏宇 林展略 張成龍
“淺山區(qū)”是相對“深山區(qū)、高山區(qū)”而提出的,部分學者將“市域內(nèi)海拔100~300m的區(qū)域劃定為淺山區(qū)[1-3]。由于在過去城市發(fā)展中,淺山建設并不是城市關注的重點,近年來,隨著城市規(guī)模外溢,人們對旅游休閑的關注度不斷提升,作為城市主要生態(tài)區(qū)之一的城市近郊淺山區(qū)逐漸成為極具價值潛力的區(qū)域,受到關注[4]。但淺山區(qū)與城市其他地區(qū)在植物種類、基礎設施建設、開發(fā)模式與強度、景觀格局等方面均存在明顯差異,導致其可達性、觀測性較弱,淺山區(qū)建設評價較難使用與城市建設跟蹤評價相同的方法。
近年來出現(xiàn)了基于網(wǎng)絡語義挖掘的科學研究方法,利用大數(shù)據(jù)從側面證明實施現(xiàn)狀的操作,并得到學科內(nèi)的廣泛好評[5-6]。筆者試應用該方法對難以實時監(jiān)測的淺山區(qū)建設效果進行跟蹤評價,通過對淺山區(qū)區(qū)域評價的開發(fā)現(xiàn)狀特點、數(shù)據(jù)獲取特點、信息傳遞特點進行匹配,論證網(wǎng)絡語義分析方法適用于淺山景觀設計理念傳達有效性的評價,以期對淺山地區(qū)未來發(fā)展給予理論與方法支持。
淺山景觀設計中設計師的設計理念與受眾群體理解的設計理念經(jīng)常出現(xiàn)不匹配現(xiàn)象[7]。
例如,祁婧文將盱眙龍蝦景觀與青島啤酒景觀進行了景觀評價對比分析,經(jīng)過問卷調(diào)查分析及對比分析,得出兩者環(huán)境要素差距較大[8]。這類案例可以列舉較多,體現(xiàn)出景觀設計理念經(jīng)常出現(xiàn)傳達失效的現(xiàn)象。而這類現(xiàn)象也會導致后續(xù)景觀規(guī)劃方向的迷失,和投資建設的巨額損失。
吉林省長春市是知名的“森林城”,距離城市較近的城市淺山區(qū)是吉林省重要生態(tài)區(qū)之一,同時也是國內(nèi)距離省會城市最近、規(guī)模最大的生態(tài)區(qū),受到政府管理者、開發(fā)建設者及公眾高度關注。在2009年就由省旅游局授權,成立了吉林省淺山地區(qū)唯一的國家級生態(tài)旅游度假區(qū)——長春蓮花山生態(tài)旅游度假區(qū),省委強調(diào)需要在保護生態(tài)環(huán)境的基礎上進行開發(fā)建設,至今為止已10年有余,是典型的寒地城市近郊淺山區(qū)保護與開發(fā)共同建設的重要區(qū)域(圖1)。長春蓮花山生態(tài)旅游度假區(qū)管理委員會也投入大量人力、物力、財力等塑造多樣化景觀。
由于氣候條件特殊、人員流動性大、人口分散且處于經(jīng)濟欠發(fā)達地區(qū)等客觀因素使得長春蓮花山生態(tài)旅游度假區(qū)的基礎設施建設無法跟上,可達性差,調(diào)研、問卷、訪談等傳統(tǒng)形式成本較高、耗時較長、難度較大,不適宜應用,導致建設評價難度更大。長春蓮花山生態(tài)旅游度假區(qū)就是經(jīng)多年建設后,由于這些問題,難以對蓮花山淺山地區(qū)的景觀實施效果進行評價,對地廣人稀、投資分散的淺山地區(qū)下一步發(fā)展造成困惑。而蓮花山具有城市淺山區(qū)景觀評價的普遍特征,如下。
1)可達性低:經(jīng)調(diào)研,長春蓮花山生態(tài)旅游度假區(qū)由于保護開發(fā),基礎設施建設緩慢,可達性不高,同時由于其地處溫帶大陸性季風氣候區(qū),積雪期4~5個月,平均20cm①,對該區(qū)域較難進行實時觀測、問卷調(diào)查、訪談等數(shù)據(jù)搜集。
2)人口流動大:該區(qū)因其旅游屬性而具有人口流量大、流動規(guī)律不確定等特點。
3)人口分散:淺山區(qū)常住人口以村落居住形式較多,對該區(qū)進行問卷調(diào)研及訪談耗費時間長、成本費用高、采樣率低。
4)特色資源等限制因素:蓮花山包含多種生態(tài)資源,其中石頭口門水庫是長春第一大水源地,同時森林面積較大,常人難以到達,獲取數(shù)據(jù)難度較大。
近年來,隨著互聯(lián)網(wǎng)與網(wǎng)絡大數(shù)據(jù)、小數(shù)據(jù)相關理論與方法的快速發(fā)展,很多能夠對傳達效果進行有效度量的方法如雨后春筍般出現(xiàn)。這其中,通過網(wǎng)絡大數(shù)據(jù)、小數(shù)據(jù)的爬取,提取網(wǎng)絡語義的方法,可快速、精準地捕捉文本信息,從而輔助分析傳達主體向受眾傳達信息的有效性。
1 長春蓮花山生態(tài)旅游度假區(qū)淺山地貌特征示意圖Sketch map of shallow mountain landform characteristics in Changchun Lotus Mountain Eco-Tourism Resort
網(wǎng)絡語義分析方法能夠基于網(wǎng)絡數(shù)據(jù)實時抓取特定網(wǎng)絡信息,對研究對象進行使用后評價。在國外,Reilly、Tapachai等應用樣本內(nèi)容分析法,將描述旅游目的地形象的高頻次用詞作為研究的主體指標,研究旅游目的地的形象[9-13]。中國,張成龍從信息流傳播的視角下運用基于網(wǎng)絡語義分析的研究方法為深圳前海3、4單元城市設計的理念傳達績效提供了一種新的量化評價方法,并依據(jù)分析績效值及結果從而提出提升設計理念傳達績效的策略[14-16]。研究證明網(wǎng)絡語義分析方法具有以下優(yōu)勢。
1)媒介優(yōu)勢:以網(wǎng)絡為媒介,網(wǎng)絡既是政府、設計師公示信息的來源,也是受眾理解、評價的信息交流平臺,具有開源數(shù)據(jù)的優(yōu)勢,并可依據(jù)特定條件搜集與篩選文本信息。
2)不受環(huán)境、地點、時間限制,實時的文本抓?。簭膫让嬉?guī)避了由于環(huán)境條件惡劣、人口流動大、人員分散等無法對現(xiàn)場進行調(diào)研、訪談、監(jiān)測等采集信息的限制,實時抓取受眾通過網(wǎng)絡以文本形式所表達的信息。
3)能夠對傳播的信息進行綜合分析:是以文本信息為核心,對文本數(shù)據(jù)信息進行系統(tǒng)的、客觀的、定量的綜合量化分析的方法[17]。
4)具有較高的時效性:能夠在短時間內(nèi)篩選并獲取具有特定屬性的長期積累的文本信息數(shù)據(jù)。利用現(xiàn)有信息交流平臺,識別大眾交流信息的時間、地點等特有屬性,為信息的篩選、分類與有效性提供科學支持。
可以說,網(wǎng)絡語義的研究方法是快速捕捉信息防止傳達失效的有效途徑,這種方法越來越多被應用到景觀學科中。
基于城市淺山景觀特征與網(wǎng)絡語義分析方法特征可發(fā)現(xiàn)該方法能夠有效地解決城市淺山區(qū)可達性低、人口分散、人員流動性大的缺點,并且特色資源作為重點信息能夠被網(wǎng)絡有效地、準確地、快速地捕捉到,也能夠同時捕捉傳達主體(設計者)及受眾(大眾)通過網(wǎng)絡發(fā)布的文本信息,從側面解決了城市淺山區(qū)調(diào)研難、訪談難、監(jiān)測難等弱點,實現(xiàn)了科學地、客觀地、定量地對城市淺山區(qū)景觀進行使用后評價。
網(wǎng)絡大數(shù)據(jù)語義分析的核心是對詞頻的統(tǒng)計與分析,基于網(wǎng)絡大數(shù)據(jù)語義分析的景觀設計理念傳達有效性的評價可具體總結為6個部分,即構建文本數(shù)據(jù)語料庫、爬取并篩選有效的文本數(shù)據(jù)、詞頻(Term frequency,簡稱TF)-逆向文件頻率(Inverse document frequency,簡稱IDF)打分、綜合打分、最終分析結果的可視化表達與設計理念傳達有效性評價②。對應關鍵詞TF-IDF值以量化的指標形式呈現(xiàn)了該關鍵詞的關鍵程度。因此,通過對比相同關鍵詞在設計中研究報告語料庫與實施后的大眾評價語料庫的TF-IDF值,可以對該關鍵詞社會感知認同度的高低進行分析,當對應關鍵詞得到大眾的認可與支持時,其社會感知認同度較高,證明與對應關鍵詞相關的設計理念得到了有效傳達;而社會感知認同度較低時則相反[14]。
采集文獻數(shù)據(jù)需要重點關注數(shù)據(jù)來源的普遍代表性和全面性,采集設計者以及受眾兩組文本信息數(shù)據(jù),通過設計者的研究報告、技術文本及其相關學術論文從而構建設計師語料庫,受眾數(shù)據(jù)主要來自新浪微博與博客的相關博文,同時針對研究對象的旅游屬性提取馬蜂窩等旅游網(wǎng)網(wǎng)文、評論信息等數(shù)據(jù)共同構建受眾語料庫。
通過微博、博客、馬蜂窩采集網(wǎng)絡文本數(shù)據(jù)相關發(fā)文806條,中文漢字共計114 620個;設計者技術文本、研究報告等文本數(shù)據(jù),中文漢字共計631 018個(表1)。
表1 文本數(shù)據(jù)來源統(tǒng)計表Tab. 1 Statistical table of text data sources
基于TF-IDF分析算法對各關鍵詞打分;并將這些關鍵詞依據(jù)TF-IDF值在大眾語料庫與設計文本語料庫中進行排序,以此判斷其影響力[8](圖2、3)。
對比技術文本與大眾評價語料庫的各同一關鍵詞的詞頻并對其綜合打分進行分析,可對各關鍵詞相關的設計理念進行社會傳達分析[8](圖 4、5)。
應用tagxedo工具對關鍵詞的詞頻分析統(tǒng)計結果進行可視化展示③,其可視化結果直接受詞頻高低的影響,從而得到長春蓮花山旅游生態(tài)度假區(qū)設計文本詞云圖像與受眾評價詞云圖,將景觀設計理念傳達有效性表現(xiàn)值可視化,從而為景觀設計理念傳達量化提供更直觀的表達方式(圖6、7)。
為避免相同詞匯的專業(yè)內(nèi)涵與大眾認知產(chǎn)生的差異影響計算結果,根據(jù)詞頻分析確定的高詞頻詞語為關鍵詞進行語料庫的全文檢索,通過高頻詞語語義環(huán)境即上下文對這些詞語進行定性,最終識別出正向感知認同度詞語及感知認同偏離的詞語(圖8)。
基于蓮花山景觀設計成果閱讀可發(fā)現(xiàn)設計者設計理念主要體現(xiàn)在:天然氧吧、百里花海、冰雪體驗、水源涵養(yǎng)地、建成環(huán)境優(yōu)美適合宜居的生態(tài)文明建設示范區(qū)①。
從表2中可以看出,受眾群體對“滑雪”“生態(tài)”“植物”“水庫”4個核心景觀設計理念關鍵詞感知認同度較高,長春蓮花山生態(tài)旅游度假區(qū)景觀設計理念在受眾感知認同測量中均有體現(xiàn),但“建設”“規(guī)劃”“建筑”等關鍵詞感知認同度較低。
根據(jù)以上計算內(nèi)容,統(tǒng)計并對比兩類數(shù)據(jù)庫的計算結果,長春蓮花山生態(tài)旅游度假區(qū)景觀設計理念傳達有效性測值的平均數(shù)為69.58%。雖然沒有進行與其他案例的對比與分析確定有效性的具體值域,但根據(jù)統(tǒng)計與結果分析基本可以認為大眾對該地區(qū)的景觀設計理念感知沒有較大偏離[14]。
根據(jù)基于網(wǎng)絡大數(shù)據(jù)語義分析的量化結果,討論在長春蓮花山生態(tài)旅游度假區(qū)中不同類型景觀設計理念的不同傳達特征??傻贸鲆韵陆Y論。
2 技術文本詞頻前50位排序Top 50 of technical text words in frequency
5 微博博文TF-IDF打分TF-IDF scoring of Weibo blogs
1)與景觀、生態(tài)相關的設計理念:圖表中關于景觀、植物、環(huán)境、生態(tài)、旅游等指標測度是較高的,受眾對于生態(tài)保護、景觀環(huán)境有著普遍的敏感性,很容易感知這些常被提起的文化觀念,同時這也是長春蓮花山生態(tài)旅游度假區(qū)景觀設計的初衷之一,具有面積廣、資金投入高、宣傳力度大等特點,受眾直觀地感知到設計者對于景觀的建設和改造能夠引起的社會與生態(tài)影響,可以確定這些景觀空間的設計極大限度地發(fā)揮了景觀空間的文化功能。
2)與特色資源、活動相關的設計理念:圖表中關于長春蓮花山生態(tài)旅游度假區(qū)特色資源如花海、冰雪、滑雪場、藝術節(jié)等,這些景觀設計理念通過結合寒地特色資源組織大型活動,提高影響力與知名度,從而提高相關指標的測度。被認可度高于平均值,證明通過特色資源打造及活動的舉辦有效增加了受眾感知認可度[18-23],極大地發(fā)揮了景觀空間的教化功能。
3 微博博客詞頻前50位排序Top 50 Weibo blog words in frequency
6 長春蓮花山技術文本詞云圖Changchun Lotus Mountain technical text word cloud
3)與開發(fā)、建設相關的設計理念:圖表中開發(fā)、項目、建設、建筑、鄉(xiāng)村等指標的測度可以被認為是等于或低于平均值的,這些設計理念由于對文化、特色、環(huán)境的影響具有復雜的正面和負面影響,并不能很好地發(fā)揮并宣傳長春蓮花山生態(tài)旅游度假區(qū)自身的景觀特質,同時帶來的社會影響有限。建議項目支持者、管理經(jīng)營者結合當前可持續(xù)發(fā)展戰(zhàn)略、政策背景重視鄉(xiāng)村發(fā)展建設,結合本地特色文化與資源,建設打造標志建筑物或宜居生態(tài)區(qū)形成可持續(xù)的、適應本地文化與特色的特色小鎮(zhèn)、美麗鄉(xiāng)村,釋放土地資源的同時控制開發(fā)建設,結合自身優(yōu)勢資源,吸引人群,增強社會影響力。
過去,網(wǎng)絡大數(shù)據(jù)語義分析少被應用在景觀評價領域,多集中在新聞傳播學、圖書館學和社會學等領域的研究中[17],與城市淺山景觀設計理念傳達有效性評價科學問題匹配度較高,均可通過文本信息數(shù)據(jù)依據(jù)詞頻及特征詞進一步分析,從側面得出結論。
該方法在應用過程中仍然有一些瑕疵,如部分詞語在大眾理解中被泛化,例如設計者提及的“生態(tài)”,與大眾的自然語言中的“生態(tài)”泛化形容有所差異[24];多音字、多意字情況依舊存在,如“地”字,作為謂語的修飾詞時與土地的“地”字雖然是同音字,但意義不同;在未來的相關研究中應注意此類問題的修正[14]。
4 技術文本TF-IDF打分TF-IDF scoring of technical texts
7 長春蓮花山受眾評價詞云圖Changchun Lotus Mountain audience evaluation word cloud
但其評價結果與大眾評價基本一致,差異性較小,仍適合應用于城市淺山區(qū)景觀設計理念傳達有效性的研究中,由于長春蓮花山生態(tài)旅游度假區(qū)處于省會淺山區(qū)及其旅游屬性,較易收集網(wǎng)絡文本信息,建議繼續(xù)開展其他城市淺山區(qū)的景觀設計理念傳達有效性評價,以確定該方法的有效性。
表2 關鍵詞感知認同度統(tǒng)計表Tab. 2 Keyword perception recognition statistics
8 高頻詞匯感知認同度示意圖Sketch map of high-frequency vocabulary perception recognition
注釋:
① 參考長春蓮花山生態(tài)旅游度假區(qū)生態(tài)文明建設示范區(qū)建設規(guī)劃(2016——2020年)。
②參考Jiutianhe的TF-IDF及其算法(https://blog.csdn.net/jiutianhe/article/d-etails/41080487)。
③ 參考Hardy Leung的Tagxedo - About(http://www.tagxedo.com/app.html.)。
④ 文中圖表均由作者自繪。