計(jì)浩浩,張 誠(chéng),卿粼波,王正勇,韓龍玫
(1.四川大學(xué) 電子信息學(xué)院,四川 成都 610065;2.成都市規(guī)劃和自然資源局 規(guī)劃設(shè)計(jì)研究院,四川 成都 610081)
傳統(tǒng)的城市定量研究主要采用問(wèn)卷調(diào)查、現(xiàn)場(chǎng)調(diào)研等方法收集數(shù)據(jù)。如Gehl等[1]創(chuàng)建的公共空間-公共生活調(diào)查法,通過(guò)現(xiàn)場(chǎng)計(jì)數(shù)、地圖標(biāo)記和跟蹤記錄等方法獲取具體的活動(dòng)特征信息,進(jìn)而客觀評(píng)價(jià)公共空間品質(zhì)。傳統(tǒng)調(diào)研方法雖然可以獲得較為全面、詳細(xì)的信息,但是非常費(fèi)時(shí)費(fèi)力,無(wú)法進(jìn)行大規(guī)模的城市定量研究,也難以精確到街道尺度[2]。
近年來(lái)街景圖片作為直接反應(yīng)城市公共空間的圖像大數(shù)據(jù),具有真實(shí)感強(qiáng)、信息度豐富和覆蓋范圍廣等特點(diǎn),能夠有效描述城市公共空間場(chǎng)景,彌補(bǔ)非視覺(jué)數(shù)據(jù)的不足,在提取城市街道空間屬性方面具有極大的優(yōu)勢(shì)[3]。Naik等[4-6]利用計(jì)算機(jī)視覺(jué)的方法,將街景圖片應(yīng)用于城市街道安全,且通過(guò)不同時(shí)間的街景圖片識(shí)別城市外觀的變化,揭示城市物理變化的預(yù)測(cè)因子。Seiferling等[7]結(jié)合計(jì)算機(jī)視覺(jué)和街景圖片對(duì)城市綠化覆蓋率進(jìn)行自動(dòng)測(cè)度。但是,目前只有少部分研究者利用計(jì)算機(jī)視覺(jué)方法對(duì)城市街道空間品質(zhì)進(jìn)行研究[4-8],并且其中大部分研究未充分挖掘城市空間品質(zhì)屬性。研究結(jié)果表明,街道在城市生活中扮演著極為重要的角色,它不僅是交通的主要載體,也是重要的城市開(kāi)放空間,是居民認(rèn)識(shí)和城市生活的基本單元[2]。而建筑輪廓、表面裝飾和建筑物的高度等物理屬性也會(huì)對(duì)環(huán)境產(chǎn)生影響[9],同時(shí),建筑的好壞也會(huì)影響著人們的心理感受[10]。因此,本文基于街景圖像提出一種機(jī)器學(xué)習(xí)方法,選擇從街道、建筑兩個(gè)不同尺度對(duì)城市空間品質(zhì)進(jìn)行評(píng)價(jià),實(shí)現(xiàn)對(duì)城市空間品質(zhì)的大規(guī)模自動(dòng)評(píng)估。
本文使用機(jī)器學(xué)習(xí)模型來(lái)量化城市空間品質(zhì),具體技術(shù)路線如圖1所示。首先,利用騰訊街景地圖爬取城市街景圖片,并利用爬取的街景圖片制作城市空間品質(zhì)數(shù)據(jù)集。然后,訓(xùn)練街道空間品質(zhì)量化模型和建筑立面品質(zhì)量化模型。利用訓(xùn)練好的模型對(duì)城市空間品質(zhì)進(jìn)行大規(guī)模量化。最后,在Web端建立綜合可視化分析平臺(tái),完成城市空間品質(zhì)量化的友好可視化。
圖1 技術(shù)路線整體框架
由于目前僅有少量學(xué)者對(duì)此方面展開(kāi)研究,關(guān)于城市公共空間的數(shù)據(jù)集較少,常用的數(shù)據(jù)集有Cityscapes[11]、BDD[12]等。但是,這兩個(gè)數(shù)據(jù)集的數(shù)據(jù)均來(lái)自國(guó)外的街景圖片,與我國(guó)的城市空間環(huán)境存在一定差異,且數(shù)據(jù)集中街道場(chǎng)景單一,缺乏建筑部分的數(shù)據(jù),不適合用于本研究。因此,本文通過(guò)騰訊街景地圖提供的應(yīng)用程序接口爬取國(guó)內(nèi)街景圖片建立城市空間品質(zhì)數(shù)據(jù)集,制作過(guò)程主要包括4個(gè)步驟,具體流程如圖2所示。
圖2 城市空間品質(zhì)數(shù)據(jù)集制作流程
(1)數(shù)據(jù)搜集。首先,利用QGIS軟件導(dǎo)出研究區(qū)域的路網(wǎng)數(shù)據(jù),并使用ArcGIS軟件對(duì)路網(wǎng)數(shù)據(jù)進(jìn)行刪簡(jiǎn)等預(yù)處理。對(duì)簡(jiǎn)化后的路網(wǎng)數(shù)據(jù)以100 m的間隔距離提取采樣點(diǎn),然后導(dǎo)出每個(gè)采樣點(diǎn)的街道名稱、經(jīng)緯度等信息。根據(jù)導(dǎo)出的采樣點(diǎn)信息,利用騰訊地圖提供的全景靜態(tài)街景圖API進(jìn)行街景圖片的爬取,總共爬取了112 347張街景圖片。
(2)數(shù)據(jù)預(yù)處理。爬取的街景圖片由于角度、遮擋等問(wèn)題,存在大量不具有研究?jī)r(jià)值的街景圖片。為了分類出具有研究?jī)r(jià)值的街景圖像,提出了一種基于機(jī)器學(xué)習(xí)的街景圖像識(shí)別模型。本文從爬取的數(shù)據(jù)庫(kù)中隨機(jī)抽取8539張圖片,人工標(biāo)注“建筑類”、“街道類”和“不合格類”街景圖片。將標(biāo)注好的圖片用于訓(xùn)練Inception_v3[13]預(yù)訓(xùn)練模型,以遷移學(xué)習(xí)的方式將數(shù)據(jù)庫(kù)中的圖片分為3類,分別是“建筑類”、“街道類”和“不合格類”。其中,“建筑類”街景圖片用于對(duì)城市公共空間中的建筑立面品質(zhì)進(jìn)行量化評(píng)估,“街道類”街景圖像用于對(duì)城市公共空間中的街間品質(zhì)進(jìn)行量化評(píng)估,而“不合格類圖片”不用于本研究。
(3)建立數(shù)據(jù)標(biāo)簽。城市空間品質(zhì)數(shù)據(jù)集的制作分為兩個(gè)部分:街道空間品質(zhì)數(shù)據(jù)集和建筑立面品質(zhì)數(shù)據(jù)集。隨機(jī)選擇“街道類圖片”和“建筑類圖片”各3491和2960作為數(shù)據(jù)集,通過(guò)人工評(píng)分的方式為數(shù)據(jù)集建立標(biāo)簽。
(4)數(shù)據(jù)擴(kuò)充。由于我國(guó)大部分城市空間品質(zhì)處于中等水平,爬取的數(shù)據(jù)類別存在一定的不均衡問(wèn)題。本文對(duì)數(shù)據(jù)集中樣本類別不足的圖片采用鏡像、加噪等方式進(jìn)行數(shù)據(jù)增強(qiáng)。最后,獲取5157張街景圖像制作街道空間品質(zhì)數(shù)據(jù)集,3980張街景圖像制作建筑立面品質(zhì)數(shù)據(jù)集。
正如1.2節(jié)所述,城市空間品質(zhì)數(shù)據(jù)集的制作采用人工評(píng)分的形式為數(shù)據(jù)集制作標(biāo)簽。基于街景圖像的人工主觀評(píng)分的方法始于Ewing[14]。本文基于文獻(xiàn)[8,14,15]以及咨詢規(guī)劃領(lǐng)域?qū)<遥⒔Y(jié)合國(guó)內(nèi)街景圖片的不同特色,選取“開(kāi)敞度、整潔性、意象化、維護(hù)度”4個(gè)指標(biāo)用于街道空間品質(zhì)的評(píng)價(jià);選取“意象化、維護(hù)質(zhì)量”兩個(gè)指標(biāo)用于建筑立面品質(zhì)的評(píng)價(jià)。其評(píng)價(jià)體系標(biāo)準(zhǔn)見(jiàn)表1~表6,評(píng)分標(biāo)準(zhǔn)示例如圖3、圖4所示。為了盡量降低主觀性帶來(lái)的誤差,本研究選擇10名研究生并對(duì)他們進(jìn)行指標(biāo)評(píng)價(jià)體系的培訓(xùn),然后共同對(duì)數(shù)據(jù)集進(jìn)行評(píng)分,選擇大多數(shù)都認(rèn)可的分?jǐn)?shù)。
表1 開(kāi)敞度評(píng)分標(biāo)準(zhǔn)
表2 整潔性評(píng)分標(biāo)準(zhǔn)
表3 意象化評(píng)分標(biāo)準(zhǔn)
表4 維護(hù)度評(píng)分標(biāo)準(zhǔn)
表5 建筑立面設(shè)計(jì)意象化評(píng)分標(biāo)準(zhǔn)
表6 建筑立面維護(hù)質(zhì)量評(píng)分標(biāo)準(zhǔn)
圖3 建筑評(píng)分示例
圖4 街道評(píng)分示例
傳統(tǒng)圖像的描述特征(如SIFT、HOG和LBP),無(wú)法有效描述同一場(chǎng)景中圖像的細(xì)微差別,例如顏色,不同的圖像顏色在描述特征空間中可能具有相同的像素強(qiáng)度。Porzi等[16]通過(guò)實(shí)驗(yàn)結(jié)果表明,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)特征在預(yù)測(cè)人類感知方面要優(yōu)于傳統(tǒng)描述特征。而AlexNet[17]網(wǎng)絡(luò)在2012年的ImageNet圖像識(shí)別競(jìng)賽中獲得冠軍,在圖像識(shí)別方面表現(xiàn)十分出色。因此,本文采用深度學(xué)習(xí)網(wǎng)絡(luò)AlexNet提取街景圖片的CNN特征。相比于主流的使用深度學(xué)習(xí)網(wǎng)絡(luò)解決大規(guī)模非線性問(wèn)題,支持向量回歸(support vector regression,SVR)擅長(zhǎng)解決中小規(guī)模數(shù)據(jù)集的復(fù)雜非線性問(wèn)題,SVR通過(guò)尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小函數(shù)來(lái)提高學(xué)習(xí)機(jī)泛化能力,使其在輸入數(shù)據(jù)量較少的情況下,亦能獲得良好的統(tǒng)計(jì)規(guī)律。除此之外,SVR的計(jì)算復(fù)雜度不依賴于輸入空間的維數(shù),具有良好的泛化能力,預(yù)測(cè)精度高等優(yōu)點(diǎn)[18]。故本文將深度學(xué)習(xí)網(wǎng)絡(luò)與SVR進(jìn)行結(jié)合,對(duì)城市空間品質(zhì)進(jìn)行量化。
SVR使用支持向量機(jī)(support vector machines,SVM)來(lái)擬合曲線,SVM的稀疏解和良好的泛化特性使其能夠適應(yīng)回歸問(wèn)題。SVM通過(guò)在函數(shù)f(x)周圍引入一個(gè)ε-不敏感區(qū)域?qū)崿F(xiàn)對(duì)SVR的泛化,該區(qū)域稱為ε-間隔帶[18]。與傳統(tǒng)回歸模型不同,SVR能容忍輸出f(x)與實(shí)際值y之間最多有ε的偏差,即僅當(dāng)c與y之間的差別絕對(duì)值大于ε時(shí)才計(jì)算損失,如圖5所示。
圖5 SVR原理
對(duì)于回歸問(wèn)題,給定訓(xùn)練樣本,D={(x1,y1),(x2,y2),…,(xm,ym)},yi∈R,其思想為確定一個(gè)函數(shù),使得輸出f(x)與實(shí)際值y盡可能接近。
一般的SVR估計(jì)函數(shù)采用式(1)形式
f(x)=(ω·Φ(x))+b
(1)
其中,ω∈RN,b∈R, Φ表示從RN到高維空間的非線性變換。其目標(biāo)就是找到合適的ω和b的值,使得x的值可以通過(guò)最小化回歸風(fēng)險(xiǎn)來(lái)確定。于是,SVR問(wèn)題可表示為
(2)
其中,C為正則化常數(shù),lε為ε-不敏感損失函數(shù)
(3)
張婷等[19]指出融合卷積神經(jīng)網(wǎng)絡(luò)低層特征和高層特征,有助于獲取更豐富的圖像信息,能夠達(dá)到更準(zhǔn)確的分類結(jié)果。最新的DenseNet[20]網(wǎng)絡(luò)也采用類似的思想,在DenseNet網(wǎng)絡(luò)中,每一層的輸入特征都是由前面所有層的輸出并聯(lián)得到,而該層的輸出特征向量也會(huì)被直接作用于其后面的所有層。因此,本文借鑒DenseNet網(wǎng)絡(luò)的思想,對(duì)AlexNet網(wǎng)絡(luò)進(jìn)行了改進(jìn),將每一層的輸出特征與前面所有層的輸出特征進(jìn)行融合,加強(qiáng)卷積神經(jīng)網(wǎng)絡(luò)之間的特征傳遞。同時(shí),將全連接層FC8層輸出特征作為SVR的輸入特征,提出了跨連AlexNet+SVR網(wǎng)絡(luò)模型,如圖6所示。
圖6 跨連AlexNet+SVR網(wǎng)絡(luò)模型結(jié)構(gòu)
在模型性能評(píng)估方面,使用均方誤差(mean squared error,MSE)作為回歸結(jié)果的度量指標(biāo),用于衡量人工評(píng)分分?jǐn)?shù)值與機(jī)器學(xué)習(xí)預(yù)估值之間的差異度,如式(4)所示
(4)
其中,n為樣本總數(shù)量,yi和ti分別為每張圖像人工評(píng)分分?jǐn)?shù)值與機(jī)器學(xué)習(xí)預(yù)估值。
為了驗(yàn)證本文所提跨連AlexNet+SVR網(wǎng)絡(luò)模型提取空間品質(zhì)特征的有效性,本文單獨(dú)利用AlexNet網(wǎng)絡(luò)、VGG16網(wǎng)絡(luò)[21],分別在網(wǎng)絡(luò)最后的全連接層后面接一個(gè)Sigmoid層,將網(wǎng)絡(luò)的輸出向量映射為0~1的浮點(diǎn)數(shù),對(duì)應(yīng)空間品質(zhì)量化值,進(jìn)行回歸實(shí)驗(yàn)對(duì)比。同時(shí),為了驗(yàn)證CNN特征相比傳統(tǒng)描述特征的有效性,實(shí)驗(yàn)分別選取了圖像灰度值(Gray)、圖像的LBP特征和HOG特征分別作為SVR的輸入特征,進(jìn)行實(shí)驗(yàn)對(duì)比。除此之外,本文與相關(guān)文獻(xiàn)[22]的實(shí)驗(yàn)方法進(jìn)行了對(duì)比。由于量化指標(biāo)與數(shù)據(jù)集的不同,為了統(tǒng)一評(píng)估標(biāo)準(zhǔn),在基于本文所使用的數(shù)據(jù)集上,分別對(duì)本文方法和文獻(xiàn)[22]的方法進(jìn)行性能測(cè)試。
表7顯示了各方法在量化街道空間品質(zhì)測(cè)試集上的性能。如表7所示,在傳統(tǒng)圖像描述特征中,采用LBP特征進(jìn)行SVR回歸實(shí)驗(yàn)結(jié)果最好,其MSE為0.0595,但是依然高于采用圖像CNN特征進(jìn)行回歸的MSE,充分說(shuō)明了CNN特征更適合于圖像預(yù)測(cè)感知任務(wù)。相比于只利用深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行回歸量化街道空間品質(zhì),利用深度學(xué)習(xí)網(wǎng)絡(luò)提取圖像特征,并結(jié)合SVR的方法,實(shí)驗(yàn)效果最好。此外,本文提出的跨連AlexNet網(wǎng)絡(luò)進(jìn)一步優(yōu)化了提取的CNN特征,實(shí)驗(yàn)結(jié)果得到了進(jìn)一步提升,最終MSE達(dá)到0.0165。同時(shí),與文獻(xiàn)[22]提出的實(shí)驗(yàn)方法相比,本文提出的實(shí)驗(yàn)方法量化誤差更小,效果更佳,驗(yàn)證了本文提出的跨連AlexNet+SVR網(wǎng)絡(luò)對(duì)街道空間品質(zhì)評(píng)估上的有效性。
表7 街道空間品質(zhì)量化實(shí)驗(yàn)結(jié)果
同樣地,在建筑立面品質(zhì)量化模型性能評(píng)估方面采用了相同的對(duì)比實(shí)驗(yàn),表8顯示了各方法在量化建筑立面品質(zhì)測(cè)試集上的性能。結(jié)果表明,與評(píng)估街道空間品質(zhì)性能相似,使用本文所提跨連AlexNet網(wǎng)絡(luò)提取CNN特征預(yù)測(cè)建筑立面品質(zhì)效果最好,也進(jìn)一步驗(yàn)證了本文實(shí)驗(yàn)方法能夠有效評(píng)估建筑立面品質(zhì)。
表8 建筑立面品質(zhì)量化實(shí)驗(yàn)結(jié)果
本文以成都市為研究案例,利用訓(xùn)練好的模型對(duì)城市空間品質(zhì)進(jìn)行大規(guī)模量化,得到每個(gè)街道采樣點(diǎn)的街道空間品質(zhì)分?jǐn)?shù)和建筑立面品質(zhì)分?jǐn)?shù),并將每個(gè)街道采樣點(diǎn)的街道空間品質(zhì)分?jǐn)?shù)和建筑立面品質(zhì)分?jǐn)?shù)進(jìn)行融合。同時(shí),為了降低個(gè)別采樣點(diǎn)的量化誤差,本文將同一街道的多個(gè)采樣點(diǎn)進(jìn)行求和平均,以街道為單位,利用百度地圖API提供的地理坐標(biāo)系繪制成都市空間品質(zhì)量化地圖,如圖7所示。其中,利用散點(diǎn)圖表示街道采樣點(diǎn),且點(diǎn)擊每個(gè)散點(diǎn)可以查看該街道采樣點(diǎn)的經(jīng)緯度、空間品質(zhì)量化結(jié)果以及圖片等信息。同時(shí),本文基于Echarts建立了圖表分析功能,利用 ECharts插件中的餅圖、柱狀圖等功能,對(duì)城市空間品質(zhì)不同等級(jí)的占比情況以及空間品質(zhì)排名情況進(jìn)行統(tǒng)計(jì)分析。本文將量化后的空間品質(zhì)分為4個(gè)等級(jí)進(jìn)行可視化,由于在城市規(guī)劃以及城市管理中,更側(cè)重于識(shí)別出空間品質(zhì)的兩端值,故本文賦予等級(jí)兩端更寬的取值范圍,分別為(0.0-0.3], (0.3-0.5], (0.5-0.7]以及(0.7-1.0],等級(jí)越高表示空間品質(zhì)越好。
如圖7所示,成都市三環(huán)內(nèi)西邊整體的空間品質(zhì)高于東邊,南邊整體的空間品質(zhì)好于北邊。特別地,A區(qū)域是成都火車北站附近,由于該區(qū)域公共設(shè)施建造時(shí)間較久遠(yuǎn),設(shè)施老化嚴(yán)重,空間品質(zhì)較低;B區(qū)域主要是鐵路交匯的區(qū)域,公共設(shè)施較差,空間品質(zhì)也處于較低水平,這與實(shí)際的情況基本吻合。該量化地圖能夠讓城市研究者更詳細(xì)、全面地了解城市建設(shè)環(huán)境,能為城市研究提供有效的技術(shù)支持和數(shù)據(jù)支撐。當(dāng)?shù)鼐用窈陀慰鸵部梢詮倪@些地圖中受益,更多地了解高質(zhì)量的城市環(huán)境和城市住宿地點(diǎn),為日常旅行規(guī)劃更佳的路線。
圖7 成都市空間品質(zhì)量化地
需要指出的是,雖然對(duì)模型性能的分析結(jié)果表明,模型評(píng)分與人們的實(shí)際評(píng)價(jià)之間存在關(guān)聯(lián),但所量化的結(jié)果與實(shí)際情況并不完全相符,存在一定誤差。例如,等級(jí)4的街道采樣點(diǎn)可能并不總是比等級(jí)1的街道采樣點(diǎn)具有更好的空間品質(zhì),但這些采樣點(diǎn)在大多數(shù)情況下都比等級(jí)1的采樣點(diǎn)具有更好的空間品質(zhì)。我們分析了導(dǎo)致誤差可能的幾個(gè)原因——在數(shù)據(jù)預(yù)處理過(guò)程中,“街道類”“建筑類”圖片的錯(cuò)誤分類,誤將“街道類”分為“建筑類”圖片,或者誤將“建筑類”分為“街道類”圖片;由于拍攝角度的影響,圖像未完全展示街道、建筑特征;街道或者建筑受樹(shù)木、車等物體的遮擋問(wèn)題;訓(xùn)練樣本的不足,當(dāng)涉及到非常特殊的情況時(shí),模型未能充分發(fā)揮其性能等原因。典型示例如圖8所示。
圖8 量化結(jié)果誤差較大示例
本文基于機(jī)器學(xué)習(xí)技術(shù),提出了一種城市規(guī)劃領(lǐng)域研究方法,以實(shí)現(xiàn)對(duì)城市空間品質(zhì)的大規(guī)模自動(dòng)評(píng)估。本文選擇了街道尺度的開(kāi)敞度、整潔性、維護(hù)度和意象化以及建筑尺度的建筑立面維護(hù)質(zhì)量和意象化這幾個(gè)關(guān)鍵指標(biāo)作為研究的出發(fā)點(diǎn),優(yōu)化卷積神經(jīng)網(wǎng)絡(luò),并結(jié)合SVR,對(duì)城市空間品質(zhì)進(jìn)行大規(guī)模量化。本文選取成都市三環(huán)內(nèi)為研究案例,繪制城市空間品質(zhì)量化地圖。實(shí)驗(yàn)結(jié)果表明,本文提出的機(jī)器學(xué)習(xí)模型準(zhǔn)確度較高,在量化街道空間品質(zhì)任務(wù)上,MSE為0.0165,在量化建筑立面品質(zhì)任務(wù)上,MSE為0.0309,可以有效地對(duì)城市空間品質(zhì)進(jìn)行大規(guī)模量化。同時(shí),本研究為城市研究者了解案例研究區(qū)域的空間品質(zhì)提供了一種方法和數(shù)據(jù)支持。城市空間品質(zhì)可以作為城市研究者在考慮房地產(chǎn)價(jià)格、教育質(zhì)量、街道安全等社會(huì)經(jīng)濟(jì)變量時(shí)的參考指標(biāo)[3]。對(duì)于空間品質(zhì)較差的區(qū)域,規(guī)劃師可以從建筑結(jié)構(gòu)、綠化、圍護(hù)等方面考慮改善城市外觀,促進(jìn)城市發(fā)展。
本文的工作也存在數(shù)據(jù)量不足、數(shù)據(jù)質(zhì)量不佳等問(wèn)題,有待進(jìn)一步豐富數(shù)據(jù)集,提高數(shù)據(jù)集的質(zhì)量。同時(shí),本文實(shí)驗(yàn)結(jié)果需進(jìn)一步根據(jù)實(shí)際情況驗(yàn)證。后續(xù)將結(jié)合房?jī)r(jià)等經(jīng)濟(jì)數(shù)據(jù)或者問(wèn)卷調(diào)查等方式進(jìn)行驗(yàn)證。除此之外,在城市規(guī)劃以及城市管理中,更側(cè)重于識(shí)別出空間品質(zhì)的兩端值,如何設(shè)計(jì)新的誤差模型使之更適應(yīng)于城市規(guī)劃領(lǐng)域、更加準(zhǔn)確地識(shí)別空間品質(zhì)的兩端值,也是我們?cè)谖磥?lái)工作中需要研究的問(wèn)題。