鄧章,陳毅興,2?
(1.湖南大學(xué)土木工程學(xué)院,湖南長沙 410082;2.建筑安全與節(jié)能教育部重點實驗室(湖南大學(xué)),湖南長沙 410082)
隨著城鎮(zhèn)化進(jìn)程加快,建筑能耗總量不斷上升,建筑成為第三“能耗大戶”[1],因此建筑節(jié)能對城市的可持續(xù)發(fā)展尤為關(guān)鍵.建筑能耗模擬可用于評價節(jié)能技術(shù)措施[2].城市尺度的建筑群能耗模擬是國際城市能源研究領(lǐng)域的一個新興方向,可以更好地評估新區(qū)能源規(guī)劃和舊區(qū)節(jié)能改造等技術(shù)方案,從而推動節(jié)能減排目標(biāo)的實施.由于缺乏每棟建筑的詳細(xì)數(shù)據(jù),在城市建筑群能耗模擬中,圍護(hù)結(jié)構(gòu)和空調(diào)系統(tǒng)等參數(shù)一般根據(jù)典型建筑進(jìn)行假定,而建筑類型及建造年代是典型建筑參考的主要依據(jù)[3].
目前獲取數(shù)據(jù)最直接的方法是利用政府機構(gòu)公開的數(shù)據(jù)平臺,絕大部分的研究中都采用這種方式.歐美一些大城市的數(shù)據(jù)平臺存儲了大量城市建筑信息,如建筑輪廓、樓層數(shù)、建筑類型和建造年代等數(shù)據(jù)[4-5],可用于建筑群能耗模擬.公開數(shù)據(jù)平臺節(jié)省了大量收集數(shù)據(jù)的時間,但受限于特定的城市.另一種直接的方法是實地調(diào)研[6].當(dāng)調(diào)研的范圍擴大至城市級別,是極其耗時耗力的.
當(dāng)較難獲取直接的數(shù)據(jù)時,可運用相關(guān)的數(shù)據(jù)來間接推斷建筑類型及年代.對于建筑分類,首先可以利用多種數(shù)據(jù)進(jìn)行識別.Wang 等人[7]使用建筑輪廓和城市電子地圖信息點(POI)數(shù)據(jù),運用邏輯回歸的監(jiān)督學(xué)習(xí)算法識別出南京市2 275 棟商業(yè)建筑.Niu 等人[8]使用微信定位數(shù)據(jù)、出租車GPS 軌跡及POI等數(shù)據(jù),運用空間聚類算法推斷廣州天河區(qū)各建筑功能.Deng 等人[9]提出了基于POI 和區(qū)域邊界輪廓等地理信息系統(tǒng)(GIS)數(shù)據(jù),運用分類和無監(jiān)督學(xué)習(xí)聚類的方法,識別出長沙市區(qū)68 966 個建筑輪廓中69%的建筑類型.對于未識別的21 538 個建筑輪廓,其大部分為老舊住宅建筑,只含建筑輪廓面積和樓層數(shù)等幾何信息.僅已知建筑幾何信息時,Hecht等人[10]基于建筑輪廓數(shù)據(jù)的幾何特征,運用隨機森林的監(jiān)督學(xué)習(xí)算法,主要將住宅建筑分為11 種類型,非住宅建筑分為工業(yè)和商業(yè)建筑.Lu 等人[11]基于建筑輪廓的面積、周長和高度,周邊80 m內(nèi)其他建筑信息和周邊道路、停車場、植被的信息,運用決策樹和隨機森林等四種監(jiān)督學(xué)習(xí)算法,將建筑分為單戶住宅、多戶住宅和非住宅建筑,四種算法中準(zhǔn)確率最高為76.1%.
對于建造年代,Biljecki等人[12]基于3D建筑模型(CityGML)的建筑類型、高度、鄰近建筑數(shù)量及體積等9 種屬性,運用隨機森林的監(jiān)督學(xué)習(xí)算法推測建筑年代.Tooke等[13]和Rosser等[14]均基于遙感數(shù)據(jù)的建筑輪廓面積、周長、屋頂傾斜度及體積等二維和三維屬性,運用隨機森林算法分別推測3 282棟和2 553棟住宅的建筑年代.監(jiān)督學(xué)習(xí)需要大量已知的樣本進(jìn)行訓(xùn)練,更適用于城市內(nèi)的街區(qū)尺度.Zirak 等[15]根據(jù)建筑年代普查數(shù)據(jù)隨建筑類型和供熱面積的分布,指定對應(yīng)建筑的年代.Schwanebeck 等[16]根據(jù)土地普查數(shù)據(jù)獲取住宅地塊內(nèi)的建筑年代.然而這些普查數(shù)據(jù)有時較難獲得.Li等[17]和Zeppelzauer 等[18]運用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法提取街景圖像特征,對不同時期的特征進(jìn)行分類從而推斷獨戶住宅的年代.近些年來,遙感影像(航空等影像)被廣泛用于提取建筑物信息[19].Deng 等人[9]通過人工對比歷史衛(wèi)星影像數(shù)據(jù),獲取243 棟建筑年代信息.相比于街景圖像受限于地理位置,航空影像成圖范圍小,衛(wèi)星影像對整個城市具有更全面的覆蓋,因此歷史影像的自動對比對于大規(guī)模運用是省時省力的.
綜上所述,一種基于有限和公開數(shù)據(jù)來識別建筑類型和年代的方法將具有更好的適用性.本文基于長沙市區(qū)未識別的21 538 個建筑輪廓的幾何特征,運用監(jiān)督式分類學(xué)習(xí)算法識別建筑類型.本文同時利用基于深度學(xué)習(xí)的圖像識別算法,自動提取歷史衛(wèi)星影像的建筑輪廓,檢測建筑物變化,用于推斷長沙市區(qū)大量建筑的建造年代.
本文的研究區(qū)域為長沙市.在建筑類型識別方面,先前的研究通過城市地圖信息點POI 和區(qū)域邊界輪廓數(shù)據(jù)已成功識別出長沙市區(qū)68 966 個建筑輪廓中69%的建筑類型.圖1展示了21 538個沒有POI和區(qū)域邊界輪廓數(shù)據(jù)的建筑輪廓在長沙市五區(qū)的分布及示例,數(shù)據(jù)來源于2017 年.其中18 933 個建筑輪廓包含地上樓層數(shù)信息,6 層及以下建筑占比為91%.衛(wèi)星影像是指衛(wèi)星拍攝的真實地理面貌,可用來檢測地面上建筑、道路等信息.通過歷史衛(wèi)星影像的對比,可觀測地理信息的變化.目前谷歌地球免費支持查看和下載高精度的歷史影像,因此根據(jù)時間軸獲取長沙市五區(qū)2005—2014年的影像數(shù)據(jù).
圖1 長沙市五區(qū)建筑輪廓及示例Fig.1 Building footprints in five districts of Changsha
圖2 所示為建筑類型分類的流程圖.第一步是通過分析建筑輪廓和樓層數(shù)據(jù)來獲取每棟建筑的特征參數(shù),包括地上樓層數(shù)、輪廓面積、輪廓周長、近似矩形短邊寬度、近似矩形長寬比、近似矩形系數(shù).首先,地上樓層數(shù)的信息大部分來自GIS 數(shù)據(jù)庫,對于2 605 個缺少樓層信息的建筑,利用百度街景手動補全.然后,利用地理信息系統(tǒng)軟件QGIS 計算獲得每個建筑輪廓的面積和周長.建筑輪廓的形狀與建筑類型有較大關(guān)系,但是建筑輪廓的信息很難直接使用輪廓的坐標(biāo)點進(jìn)行分析,因此需要引入其他參數(shù)來反映輪廓的形狀特點,如住宅建筑大多為長條形.本文就此提出了近似矩形的概念,當(dāng)對輪廓進(jìn)行旋轉(zhuǎn)操作后,每個旋轉(zhuǎn)角度都對應(yīng)一個矩形框包圍輪廓各邊界點.選取面積最小的矩形框作為輪廓的近似矩形,如圖2 所示.輪廓面積與最小矩形面積的比值定義為近似矩形系數(shù),系數(shù)越接近1,表示輪廓形狀越近似于矩形.同時近似矩形的長寬比和短邊寬度也能描述形狀特征,因此增加了近似矩形短邊寬度、近似矩形長寬比和近似矩形系數(shù)3個特征參數(shù).
圖2 建筑分類流程圖Fig.2 Workflow of building type identification
第二步是根據(jù)百度街景對3 036 個建筑輪廓的實際建筑類型進(jìn)行標(biāo)記.通過衛(wèi)星圖發(fā)現(xiàn)建筑輪廓中絕大部分為老舊住宅建筑,由于當(dāng)時沒有小區(qū)邊界的概念而未被識別.其他類型的建筑由于數(shù)量較少,進(jìn)一步細(xì)分后將沒有足夠的數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)訓(xùn)練,因此本文將建筑輪廓的類型分為低層住宅、公寓式住宅和其他類型.標(biāo)記得到低層住宅845 個,公寓式住宅1 547個,其他類型644個.圖3所示為各類建筑輪廓的特征參數(shù)分布.從圖3 可看出低層住宅和公寓式住宅具有不同的特點,如絕大部分低層住宅的輪廓面積、輪廓周長小于公寓式住宅,低層住宅地上樓層數(shù)的中位數(shù)為2,而公寓式住宅地上樓層數(shù)的中位數(shù)為6.后續(xù)的隨機森林分類模型學(xué)習(xí)分析各類特征參數(shù)的特點,從而識別出不同類型.
圖3 標(biāo)記的3 036個建筑輪廓特征參數(shù)分布Fig.3 Characteristic parameter distribution of 3 036 labeled building footprints
本文采用了隨機森林的分類模型,將6 個參數(shù)作為模型輸入,建筑類型作為模型輸出.隨機森林是一個包含多個決策樹的分類器,決策樹是機器學(xué)習(xí)中一種常用的分類方法,基于if-then-else規(guī)則,根據(jù)待分類項中相應(yīng)的特征屬性值判斷進(jìn)入相應(yīng)的分支,直至到達(dá)葉子節(jié)點,得到分類結(jié)果,從而形成一個樹狀結(jié)構(gòu).隨機森林是用隨機的方式生成多個互不關(guān)聯(lián)的決策樹,各自獨立地學(xué)習(xí)和預(yù)測,最后統(tǒng)計多個決策樹投票結(jié)果來決定最終結(jié)果,因此優(yōu)于任何一個單分類器的分類結(jié)果.本文決策樹的數(shù)量取值為100,最大深度為10.之后采用k折交叉驗證法,評估訓(xùn)練后模型的性能,避免模型出現(xiàn)過擬合.k折交叉驗證是指將數(shù)據(jù)集等比例劃分成k份,以其中的1 份作為測試數(shù)據(jù),其他的k-1 份數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),隨機重復(fù)驗證k次,k通常取10.最后將訓(xùn)練完成的模型用于18 502個建筑輪廓的分類.
由于衛(wèi)星影像是可見光成像,極易受氣候條件影響,存在云層遮擋和光線不同等問題,因此篩選出高質(zhì)量成像且光影效果較為接近的影像,分別是2005 年、2008 年、2012 年和2014 年,地面分辨率為0.53 m,圖像格式為tiff 格式.圖4 所示為建筑建造年代識別示意圖.兩個不同年代的衛(wèi)星影像作為輸入,通過卷積神經(jīng)網(wǎng)絡(luò)方法實現(xiàn)圖像分割,分別識別和生成建筑物輪廓矢量數(shù)據(jù).由于每次衛(wèi)星拍攝影像時角度不同,導(dǎo)致不同的影像中建筑物存在一定的偏移,因此利用QGIS 的相交分析工具,考慮兩建筑相交重疊部分超過50%,判斷為同一建筑,然后檢測出變化的建筑,從而確定它們的建造年代為2013—2014年.
圖4 建造年代識別示意圖Fig.4 Workflow of built year identification
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種包含卷積計算且具有深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),屬于深度學(xué)習(xí)的范疇,在圖像識別中得到廣泛應(yīng)用.相比于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)需要讀取整幅圖像,CNN能夠有效地將大數(shù)據(jù)量的圖像降維成小數(shù)據(jù)量,且同時保留圖片特征.典型的CNN 由卷積層、池化層和全連接層3個部分構(gòu)成.卷積層通過卷積核(過濾器)的過濾提取出圖片中局部的特征;池化層用于繼續(xù)降低數(shù)據(jù)維度,可大大減少運算量;全連接層與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類似,用來輸出結(jié)果.目前CNN有FCN、U-Net等多種代表算法用于圖像語義分割,Mask R-CNN算法用于實例分割.語義分割是指為圖像中的每個像素打上類別標(biāo)簽,而實例分割是目標(biāo)檢測和語義分割的結(jié)合,能區(qū)分同類中的不同實例.影像中識別出建筑物并提取輪廓,屬于實例分割的范圍,因此本文選取Mask R-CNN算法.
Mask R-CNN 算法屬于監(jiān)督學(xué)習(xí),需要用標(biāo)記的樣本對模型進(jìn)行訓(xùn)練,我們選取了2014 年影像中的一個區(qū)域,運用已有的1 602 個建筑輪廓矢量數(shù)據(jù)作為標(biāo)記數(shù)據(jù),包含多種不同形狀,但不包括建筑的陰影,如圖5 所示.由于衛(wèi)星在拍攝影像時存在一定的傾斜角度,導(dǎo)致GIS 數(shù)據(jù)與影像存在偏差,如圖6(a)所示,神經(jīng)網(wǎng)絡(luò)對這種類型的噪聲較為敏感,為了提高標(biāo)記數(shù)據(jù)的質(zhì)量,對建筑輪廓進(jìn)行了相應(yīng)的平移調(diào)整,如圖6(b)所示.然后將影像通過滑動窗口切片成256×256 像素尺寸,并且考慮切片邊緣的重疊,再使用旋轉(zhuǎn)、縮放、平移等數(shù)據(jù)增強方法來增加有限的數(shù)量集,確保模型的識別精度和泛化能力,獲得2 145 個地圖瓦片圖片作為數(shù)據(jù)集.之后選用Python 和PyTorch 深度學(xué)習(xí)框架對模型進(jìn)行訓(xùn)練和調(diào)參.數(shù)據(jù)集按9∶1 劃分為訓(xùn)練集和驗證集,模型的骨干網(wǎng)絡(luò)(backbone)選取ResNet50,訓(xùn)練輪數(shù)(ep?ochs)選取20,并且在學(xué)習(xí)曲線中自動提取最佳學(xué)習(xí)率.最后基于訓(xùn)練好的模型輸入不同年代的影像進(jìn)行預(yù)測生成相應(yīng)的建筑輪廓.
圖5 標(biāo)記的建筑輪廓和影像Fig.5 Labeled building footprints and imagery
圖6 建筑輪廓和影像對齊調(diào)整Fig.6 Alignment and adjustment of building footprints and imagery alignment
隨機森林模型中采用C4.5 算法,以信息增益率為準(zhǔn)則選擇屬性.圖7 展示了各特征參數(shù)重要度,可見樓層數(shù)對建筑分類最為重要,其次是近似矩形短邊寬度,輪廓周長的影響最小.采用混淆矩陣對各個類型的識別效果進(jìn)行評估,如表1 所示,其中對角線上的值表示正確分類的樣本.10 折交叉驗證后結(jié)果顯示,整體準(zhǔn)確率為81.7%,與文獻(xiàn)[11]中用面積、周長等基本屬性分類得到的76.1%準(zhǔn)確率相比,該方法得到了有效提升.準(zhǔn)確率表示預(yù)測正確的結(jié)果占總樣本的百分比.除了準(zhǔn)確率外,還采用精確率和召回率評估不同類型的識別效果.精確率表示所有被預(yù)測為某類的樣本中實際為該類樣本的概率,召回率表示實際為該類樣本中被預(yù)測正確的概率.由表1 可看出,低層和公寓式住宅召回率都在98%左右,表示可以很好地被推斷正確.但低層和公寓式住宅精確率在80%左右,是由于其他類型中包含零售商店和飯店等類型,在幾何特征上與低層住宅相似,其他類型中包含學(xué)校和行政樓等類型,在幾何特征上與公寓式住宅相似,因此它們中有一部分被錯誤地推斷為其他類型.
圖7 各特征參數(shù)重要度Fig.7 Importance of each characteristic parameter
表1 隨機森林模型分類結(jié)果Tab.1 The result of random forest model
將訓(xùn)練好的模型用于預(yù)測剩下的18 502 棟建筑類型,結(jié)果見表2.數(shù)量最多的為低層住宅,共有10 428 棟,以1~3 層為主,較為密集地分布在區(qū)域內(nèi).公寓式住宅共有5 686 棟,以5~6 層為主,住宅群分布較為均勻.其他類型共有2 388 棟,分布較為分散.
表2 建筑類型預(yù)測結(jié)果Tab.2 The prediction result of building type
Mask R-CNN 模型一般選用平均精確度(aver?age precision)作為評價指標(biāo),平均精確度是對精確率-召回率曲線上的精確率求均值.結(jié)果顯示平均精確度為80%,對于相互有間隔的建筑能較好地識別,而對密集分布的低層建筑識別較弱.本文選取長沙市中心范圍為4.17 km×4.33 km 的區(qū)域作為研究區(qū)域,將訓(xùn)練完成的模型應(yīng)用于該區(qū)域進(jìn)行建筑物識別和提取.圖8 展示了2014 年、2012 年、2008 年和2005 年四個年代的示例.從圖8 可以明顯看出每棟建筑隨不同年代的變化.
圖8 各年代建筑輪廓提取示例Fig.8 The example of building footprints extraction in different ages
根據(jù)已有的2017 年建筑矢量數(shù)據(jù),依次與各個年代提取的建筑輪廓進(jìn)行交集計算,將建造年代分為2015—2017 年、2013—2014 年、2009—2012 年、2005—2008 年、2005 年之前等五個階段,結(jié)果如表3所示.在7 900 個建筑輪廓中,5 077 棟(64%)建筑的建造年代在2005 年之前,符合中心城區(qū)早期開發(fā)建設(shè)的情況.
表3 建造年代分布Tab.3 The distribution of built year
本文提出了基于GIS 和歷史衛(wèi)星影像數(shù)據(jù)識別城市建筑類型和建造年代的方法.運用隨機森林的監(jiān)督學(xué)習(xí)方法,將建筑類型分為低層住宅、公寓式住宅和其他類型.利用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法進(jìn)行歷史衛(wèi)星影像識別,成功提取各個年代建筑輪廓,然后相交分析推斷出建筑年代.主要結(jié)論如下:
1)建筑類型識別方面,針對長沙市區(qū)21 538 個建筑輪廓(不含POI 和區(qū)域邊界輪廓信息),提出近似矩形的概念,新增近似矩形短邊寬度、近似矩形長寬比、近似矩形系數(shù)作為特征參數(shù)反映輪廓形狀特征.分析顯示,樓層數(shù)和近似矩形短邊寬度是影響分類最為重要的兩個特征參數(shù).訓(xùn)練結(jié)果顯示,分類模型的整體準(zhǔn)確率為81.7%.在用于預(yù)測的18 502個建筑輪廓中,成功識別出10 428 棟低層住宅、5 686 棟公寓式住宅.
2)建造年代識別方面,訓(xùn)練結(jié)果顯示,建筑輪廓提取模型的平均精確度為80%.將其應(yīng)用于長沙市中心區(qū)域7 900 個建筑輪廓,交集計算推斷出5 077個建筑的建造年代為2005年之前,1 606個建筑的建造年代為2005—2014年,1 217個建筑的建造年代為2015—2017年.