劉賈賈,劉志輝,李 鳳
(河北省地震局,河北 石家莊 050800)
我國是一個多地震國家,歷次地震造成的人員傷亡和財產(chǎn)損失主要是由建筑物遭到破壞引起的。建筑物的結構類型多樣,不同結構類型的建筑物抗震性能也不同,尤其是老舊磚結構建筑,其建筑材料及抗震設計較差,存在很大的震害風險。現(xiàn)有的對建筑物結構類型進行數(shù)據(jù)獲取的方式主要為實地調(diào)查[1-2],建筑物結構類型實地調(diào)查需要耗費巨大的人力、物力和時間,近年來日益成熟的遙感技術為建筑物結構類型的獲取提供了一種新的方式。
遙感影像可以客觀的反映地物信息,并能快速的采集到地物信息。隨著遙感獲取技術的快速發(fā)展,高分辨率遙感影像的出現(xiàn),遙感信息提取技術不斷完善,遙感影像的研究和應用領域越來越廣泛。近年來大量學者致力于遙感影像在建筑領域的研究及應用:高分辨率遙感影像建筑物提取方法研究[3-5],通過遙感影像獲取震后建筑物震害損毀情況[6-8],利用遙感影像對建筑物進行解譯分類等。在對建筑物分類領域,鄧飛、明小娜、張文靜等[9-12]通過建筑物的解譯標志進行了遙感影像的建筑物解譯,與實際調(diào)查情況進行對比分析得出遙感目視解譯結果與實際調(diào)查結果高度一致;黨濤[13]基于多尺度分割和多特征對建筑物進行了提取,得出該方法可以得到高精度的建筑物提取成果;于書媛等[14]基于CART 決策樹的面向?qū)ο蟮姆诸惙椒▽ρ芯繀^(qū)建筑物進行了分類提取,得出該方法對建筑物的提取精度較好;劉賈賈等[15]采用面向?qū)ο蟮亩喑叨确指罘椒▽Τ擎?zhèn)建筑物進行了分類,得出該方法可以應用于城鎮(zhèn)建筑物的分類。
城鎮(zhèn)建筑物是以連片、成區(qū)的形式出現(xiàn)的,建筑物類型也以群的形式聚集出現(xiàn),目前基于遙感的建筑物信息提取大多是基于單獨建筑物進行提取,雖然精確度較高,但是在建筑物震害風險調(diào)查分析領域?qū)嵱眯暂^差。本文以建筑物群為研究對象,忽略同類建筑物間的少量空地、道路,以及一些零星的建筑物,采用面向?qū)ο蟮姆诸惙椒ǎ\用監(jiān)督分類方法對建筑物進行分類,對得到的結果與目視解譯結果進行對比分析,得出此種方法的可行性。
遙感影像分類的方法根據(jù)是否需要先驗知識分為監(jiān)督分類和非監(jiān)督分類兩種[16]。監(jiān)督分類法需要通過選取一定數(shù)量樣本,對樣本進行訓練,訓練樣本的好壞與分類方法會影響最終的分類結果;非監(jiān)督分類需要依靠影像上地物特征差別進行分類。本文是對懷來縣縣城進行建筑物提取,為了兼顧準確率和效率,采取了監(jiān)督分類方法中的決策樹(CART)、隨機森林(Random Trees)兩種分類方法。
決策樹(CART)是通過對由測試變量和目標變量組成的訓練數(shù)據(jù)集的循環(huán)分析生成二叉樹形式的決策樹結構[17-19]。通過生成的二叉樹能夠得到每次的決策過程和分類準則,其基尼系數(shù)定義如下:
(1)
(2)
式中:p(j/h)為從訓練樣本集中隨機抽取的一個樣本,當某一個測試變量值為h時屬于第j類的概率;nj(h)為訓練樣本中測試變量值h時屬于第j類的樣本個數(shù);n(h)為訓練樣本中變量值為h的樣本個數(shù);j為類別個數(shù)[17]。
隨機森林(Random Trees)算法是由Breiman等提出的以決策樹為基礎分類器的集成分類器,隨機森林算法分別為每個訓練子集建立一個決策樹,以N個生成的決策樹構建出一個“森林”,每棵樹生成的方式為隨機選取樣本、隨機選取特征,在規(guī)則內(nèi)任其生長,直到自動終止[20]。
懷來縣隸屬于河北省,東臨北京,地處燕山山脈北側,是連接北京和西北的交通樞紐。歷史上該地區(qū)地震頻發(fā),近年來小震頻繁,存在較高的地震風險隱患。因城鎮(zhèn)比農(nóng)村人口密集且建筑物結構類型多,抗震性能差異較大,地震時容易造成更大的震害及損失,以懷來縣城為研究區(qū)。通過實地調(diào)查,研究區(qū)的建筑物主要有1層的磚結構房屋,4~6層的磚混結構多層房屋,7層以上的鋼筋混凝土結構高層,1~2層大跨度廠房(圖1)。該地的建筑物結構正處在新舊更替的過程中,存在大量20世紀90年代及以前的老舊建筑,該類建筑以一層磚結構為主,屬于城中村,這些老舊建筑的抗震性能差,地震發(fā)生后極易發(fā)生危險;還存在少量2~3層沿街門臉和自建住房,該類建筑未做相應的抗震設計或構造措施,抗震性能較差,也存在震害隱患。
圖1 懷來縣城建筑物結構類型Fig.1 Building structure type in Huailai County
研究區(qū)采用谷歌三波段衛(wèi)星遙感影像,空間分辨率為2.15 m(圖2)。通過對懷來縣城遙感影像的目視解譯及實地調(diào)查,懷來縣城衛(wèi)星遙感影像主要分為4類:建筑物、裸地、道路和水體。本文通過ENVI軟件在遙感影像上對建筑物、裸地、道路和水體4類地物分別進行采樣,采集樣本共計1 025個,通過對樣本進行波段均值、方差分析得其到光譜曲線(圖3)。
圖2 懷來縣城谷歌衛(wèi)星遙感影像Fig.2 Google satellite remote sensing image of Huailai County
圖3 光譜差異統(tǒng)計Fig.3 Statistics of spectral differences
由圖3可以看出,建筑物和裸地在紅波段的光譜均值和方差差異較大,道路和建筑物在藍波段的光譜均值和方差差異較大,道路和裸地在紅波段的光譜趨于一致,建筑物、裸地、道路分別和水體的光譜均值和方差均差異較大。通過對光譜差異的分析,可以將裸地、道路、水體合為非建筑類。
我們有以下結論:地球?qū)ζ鋬?nèi)距球心為r的質(zhì)點P的引力,等效為與半徑為r的球體質(zhì)量相等且位于球心的質(zhì)點對質(zhì)點P的引力。即:
懷來縣城建筑物在遙感影像上呈片狀分布,同類建筑物以群的形式聚集在一起,形成建筑物群。本文所研究的建筑物群是以建筑物結構類型為單位進行的分類。根據(jù)實地調(diào)研得到的懷來縣建筑物結構類型及遙感影像目視解譯結果對建筑物的遙感影像特征進行解譯分類:
(1)鋼筋混凝土結構建筑:高層建筑物群,形狀多樣,顏色灰色系較多,建筑物陰影較大,樓間距較大,建筑群內(nèi)有大量空地和綠地。
(2)磚混結構建筑:多層建筑物群(大部分為5~6層),建筑物形狀單一,顏色較多,建筑物陰影一般,建筑物群內(nèi)空地有大有小,有的含有綠地。
(3)磚結構建筑:低矮建筑物群(大部分為1~3層建筑物),低矮建筑物群顏色混雜,部分上覆彩鋼板,形狀較為單一,建筑群內(nèi)的空地較小,道路較窄,建筑物陰影很小或基本沒有。
(4)大跨度廠房:低層廠房群,廠房間距較大,一般在城鎮(zhèn)邊緣地帶,屋頂顏色一般為藍色或者紅色彩鋼板,建筑群內(nèi)空地較多。
對研究區(qū)高分辨率遙感影像進行預處理,得到圖像增強的影像,在此影像上對建筑物信息進行提取、分類。根據(jù)對研究區(qū)的遙感影像分析把遙感影像地物類型分為5類:高層建筑、多層建筑、低矮建筑、廠房和非建筑。本文采用ecogniton軟件進行樣本的選取、訓練及分類。
采用了多尺度分割的方法,多尺度分割方法可以很好的解決“椒鹽”和“同物異譜”情況。多尺度分割的尺度很重要,因為建筑物存在不同的類型混雜在一起的情況,分割尺度過大,不同結構建筑物不易區(qū)分,分割尺度過小,建筑群容易被分散,經(jīng)過反復試驗,本文設置的分割尺度為400,形狀因子為0.3,緊致度因子為0.5。
監(jiān)督分類首先要選取訓練樣本,樣本選擇要根據(jù)研究區(qū)遙感影像分類地物的特點及類型選取,且樣本選取要具有準確性、典型性、代表性、分散性,共選擇5類樣本共計89個。樣本經(jīng)過光譜特征和紋理特征進行訓練,經(jīng)過多次訓練達到了較好的分類效果,分類結果見圖4。
圖4 遙感影像地物分類結果Fig.4 Remote sensing image feature classification results
2.4.1 遙感分類精度評價
對研究區(qū)遙感影像采用決策樹(CART)算法和隨機森林(Random Trees)算法分類的結果分別進行精度評價,精度評價能夠確定分類結果的好壞和可靠性,運用混淆矩陣進行精度評價,結果見表1。對比精度評價結果,兩種分類算法在研究區(qū)的分類結果總體精度均達到了0.8以上,Kappa系數(shù)達到了0.6以上,說明這兩種方法均能較好的對建筑物群進行提取及分類,精度評價結果從高到低為:隨機森林>CART決策樹。
表1 混淆矩陣精度評價對比Table1 Comparison of accuracy evaluation of confusion matrix
2.4.2 研究區(qū)目視解譯
根據(jù)實地調(diào)查及遙感影像目視解譯,用arcgis軟件進行了地物類別標繪,得到研究區(qū)的目視解譯結果(圖5)。對比機器解譯結果可以看出,機器提取結果和目視結果基本保持一致,監(jiān)督分類方法可以滿足建筑物群的分類。
圖5 研究區(qū)地物目視解譯結果Fig.5 Visual interpretation results of features in the study area
2.4.3 數(shù)據(jù)分析
對目視解譯及機器解譯的結果進行數(shù)據(jù)分析,分別計算出各類地物的占比情況,見表2。通過各類地物占比情況進行對比,CART決策樹和隨機森林分類方法中各類地物占比與目視解譯方法保持一致。從表中可以看出CART決策樹分類算法對高層建筑的提取較差,隨機森林分類算法對低矮建筑的提取較差。
表2 解譯結果地物占比情況Table2 Proportion of ground features in interpretation results %
本文以河北省懷來縣城為例進行遙感影像建筑物群分類提取的研究,通過監(jiān)督分類算法中的決策樹(CART)算法分類和隨機森林(Random Trees)算法分類進行試驗,并和實際調(diào)查結果進行對比分析得出決策樹(CART)算法和隨機森林(Random Trees)算法均可用于遙感影像建筑物群結構類型的分類,隨機森林分類算法的精度高于CART決策樹。
對建筑物結構進行分類可用于對建筑物群進行風險分析,根據(jù)解譯結果地物占比情況表(表2)可以看出低矮建筑在懷來縣城建筑物中的占地面積占比超過了50%,經(jīng)實際調(diào)查可知,該地區(qū)低矮建筑以單層建筑物為主,多層以6層建筑物為主,高層層數(shù)主要分布在11~31層之間,數(shù)量不均,可以平均按照20層計算,則很快能計算出懷來縣城大致的建筑物比例,從而得到該地區(qū)的建筑物風險情況,可用于城鎮(zhèn)建筑物的管理和規(guī)劃,為城鎮(zhèn)的防災減災提供數(shù)據(jù)支撐。