韓 建,李 林,曹志民,段朝輝,萬 川
(1.東北石油大學(xué)物理與電子工程學(xué)院,黑龍江 大慶 163318;2.東北石油大學(xué)黑龍江省高校共建測試計(jì)量技術(shù)及儀器儀表研發(fā)中心,黑龍江 大慶 163318)
隨著遙感技術(shù)的快速發(fā)展,人們對(duì)三維城市模型構(gòu)建的需求和興趣不斷擴(kuò)大。由于具有較高的空間信息獲取精度以及不受陰影影響等優(yōu)點(diǎn),機(jī)載激光雷達(dá)系統(tǒng)已經(jīng)成為智能城市及基礎(chǔ)設(shè)施建設(shè)等相關(guān)應(yīng)用的重要數(shù)據(jù)源[1-10]。機(jī)載LiDAR空間信息獲取的本質(zhì)是測距,如圖1所示,結(jié)合GPS、INS和激光測距系統(tǒng),可以快速獲取大量具有精確三維坐標(biāo)的點(diǎn)云數(shù)據(jù)。然而,所獲取數(shù)據(jù)點(diǎn)信息間是相互獨(dú)立的,語義信息缺失。為此,為了更好地利用LiDAR點(diǎn)云數(shù)據(jù),對(duì)應(yīng)的分類或分割操作即成為語義信息補(bǔ)償?shù)谋匾侄巍?/p>
圖1 機(jī)載LiDAR系統(tǒng)數(shù)據(jù)采集示意圖
LiDAR點(diǎn)云分類的目的是能有效地將原始數(shù)據(jù)分為具有不同語義意義的類別。為了解決這一問題,無論是先分割后分類,還是采用深度學(xué)習(xí)方法,所利用特征大多集中于數(shù)據(jù)點(diǎn)局部強(qiáng)度、強(qiáng)度差、梯度等直接數(shù)值信息或局部紋理、植被指數(shù)等統(tǒng)計(jì)信息。如在文獻(xiàn)[11]中,作者對(duì)建筑物、植被和地形采用了基于分割的分類方法,采用的特征有:分段邊界梯度、高度紋理、回波強(qiáng)度差、強(qiáng)度等。文獻(xiàn)[12]的作者采用的特征有:高度、高度變化、回波強(qiáng)度差、亮度和強(qiáng)度。文獻(xiàn)[13]利用了高程、表面變化率、強(qiáng)度和歸一化植被指數(shù)等特征。文獻(xiàn)[14]利用點(diǎn)云位置信息和強(qiáng)度信息建立條件隨機(jī)場,并利用XGBoost對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行了分類。通過相關(guān)研究的對(duì)比發(fā)現(xiàn),從曲面結(jié)構(gòu)特征的角度充分挖掘樹木及建筑物點(diǎn)云表征的本質(zhì)區(qū)別方面進(jìn)行特征提取的研究很少,關(guān)鍵結(jié)構(gòu)信息挖掘不充分。
為了解決以上問題,本文提出在點(diǎn)云局部二次曲面結(jié)構(gòu)表征的基礎(chǔ)上,構(gòu)建局部表征特征向量,該特征向量充分考慮了目標(biāo)點(diǎn)及鄰域點(diǎn)的語義特征,能夠?qū)崿F(xiàn)點(diǎn)云局部結(jié)構(gòu)信息的充分挖掘,在此基礎(chǔ)上,利用模糊邏輯技術(shù)即可實(shí)現(xiàn)目標(biāo)區(qū)域建筑物、植被及地面的分類任務(wù)。
當(dāng)前利用LiDAR點(diǎn)云數(shù)據(jù)進(jìn)行分類或分割的操作中,所利用特征大多僅反映了平面特征[15-18],因?yàn)槿藗兛偸顷P(guān)注由許多平面部分組成的建筑屋頂或其他人造結(jié)構(gòu)。這里,本文同時(shí)考慮建筑物及主要干擾和高大樹木等植被,特別是關(guān)于二者的局部結(jié)構(gòu)差異的觀察,即用高階特征代替平面特征的擬合。在計(jì)算機(jī)視覺領(lǐng)域,散亂點(diǎn)云的曲面擬合通常采用多項(xiàng)式模型和徑向基函數(shù)(RBF)模型。本文采用二次多項(xiàng)式模型有2個(gè)方面的考慮:
1)高階多項(xiàng)式模型能更準(zhǔn)確地?cái)M合曲面。由于高階模型必須使用更多的點(diǎn)來擬合,而LiDAR點(diǎn)云數(shù)據(jù)中存在稍小植被遮擋、高大樹木遮擋建筑物和部分枝葉遮擋而導(dǎo)致潛在點(diǎn)數(shù)不充足的問題,而二次多項(xiàng)式模型已能反映擬合曲面的曲率等結(jié)構(gòu)特性。
2)RBF模型由一個(gè)低階多項(xiàng)式(通常是二次多項(xiàng)式)和所選基函數(shù)的線性組合組成。要使用它,就必須確定許多參數(shù)。因此,所使用的擬合模型在公式(1)中描述為:
Z=P00+P10X+P01Y+P11XY+P20X2+P02Y2
(1)
其中,X、Y、Z為LiDAR點(diǎn)云數(shù)據(jù)的三維空間坐標(biāo)值。
為了獲取局部結(jié)構(gòu)表征的特征值,針對(duì)建筑物目標(biāo)和樹木目標(biāo),首先從WG III/4數(shù)據(jù)集中人工選擇不同大尺度區(qū)域樹木和建筑物目標(biāo),然后隨機(jī)采樣建筑物和樹木局部結(jié)構(gòu)樣本各1000個(gè),類別標(biāo)簽分別為建筑物為“1”和樹木為“0”,為實(shí)現(xiàn)局部結(jié)構(gòu)精細(xì)分析,對(duì)各局部結(jié)構(gòu)進(jìn)行6類聚類,得到了6類典型建筑物和樹木局部數(shù)據(jù),即T1~T6和B1~B6,圖2給出了局部目標(biāo)的代表樣本。
圖2 局部目標(biāo)樣本示意圖
對(duì)每類局部結(jié)構(gòu)進(jìn)行二次多項(xiàng)式擬合,可以得到表1所示的擬合參數(shù)均值結(jié)果。
表1 典型目標(biāo)局部結(jié)構(gòu)二次多項(xiàng)式擬合結(jié)果
從表1可以看出,樹木和建筑物樣本集得到的二次系數(shù)(P20,P11,P02)有明顯的差異。顯然,可以直接利用這3個(gè)系數(shù)組成一個(gè)三元組特征向量。然而,就像使用PCA方法進(jìn)行特征值分析一樣,直接利用所獲取特征值進(jìn)行信息挖掘不是最優(yōu)的,需要根據(jù)實(shí)際情況對(duì)特征值進(jìn)行組合。為此,以二次多項(xiàng)式擬合的二次系數(shù)為基礎(chǔ),本文設(shè)計(jì)了一個(gè)二元組特征向量,即:
Features=[Feature_1 Feature_2]
(2)
其中:
Feature_1=∑|quadratic coeff|=|P20|+|P11|+|P02|
(3)
Feature_2=max(|quadratic coeffs|)/∑|quadratic coeff|
=max(|P20|,|P11|,|P02|)/(|P20|+|P11|+|P02|)
(4)
圖3給出了表1對(duì)應(yīng)的各類目標(biāo)二次擬合均值的二元特征圖,可以看到,所提特征能夠顯著實(shí)現(xiàn)樹木和建筑物目標(biāo)的線性區(qū)分。
圖3 表1數(shù)據(jù)對(duì)應(yīng)二元特征顯示示意圖
為了將LiDAR點(diǎn)云數(shù)據(jù)分為地面和非地面2個(gè)部分,有幾種濾波方法,包括基于形態(tài)學(xué)的方法、基于主動(dòng)TIN的方法、基于分割的方法等[19-21],這些方法的主要假設(shè)是地面點(diǎn)總是低于其他物體。如果能更準(zhǔn)確地估計(jì)出局部的地面高度,最簡單的方法就是用一個(gè)精確的高度閾值對(duì)輸入的激光雷達(dá)數(shù)據(jù)進(jìn)行濾波。基于這種考慮,按照面積閾值大小大于建筑物寬度乘長度的原則,將輸入的LiDAR點(diǎn)云數(shù)據(jù)劃分為多個(gè)正方形子網(wǎng)格。具體地,在考慮局部未遮擋區(qū)塊及低矮屋體的情況下,本文將輸入LiDAR點(diǎn)云數(shù)據(jù)的水平面劃分為4 m×4 m的網(wǎng)格網(wǎng)絡(luò)。
為了得到點(diǎn)云濾波的閾值,在相應(yīng)的子網(wǎng)格中按高度值給定的順序?qū)c(diǎn)進(jìn)行排序。然后,每個(gè)子網(wǎng)格的閾值可以設(shè)置為:
T=HTid, Tid=ρ×N
(5)
其中,N表示子網(wǎng)格中點(diǎn)的個(gè)數(shù),ρ表示與地面占有率相關(guān)的參數(shù),Tid為高度閾值索引。
在確定了用于分類或分割的特征向量之后,主要有2種模式識(shí)別方法:
1)無監(jiān)督方法(clustering)。即僅依賴于特征向量和選定的距離度量將輸入數(shù)據(jù)分類為不同的類別。然后利用先驗(yàn)知識(shí)判斷提取的類別。
2)有監(jiān)督分類法。即通過訓(xùn)練一些具有已知類別標(biāo)簽的樣本集,將輸入數(shù)據(jù)分類為一些預(yù)定義的類別。無論選擇哪種方法,鄰域形狀和大小的選擇將嚴(yán)重影響計(jì)算結(jié)果。
Di=(dij=‖F(xiàn)i,FCj‖E)j=1,2,…,12
(6)
其中,‖X,Y‖E表示向量X和Y的歐氏距離;FCj,j=1,2,…,12表示表1中給出的12個(gè)目標(biāo)局部類別的特征中心。利用式(6)得到每個(gè)點(diǎn)的歐氏距離向量后,通過反距離加權(quán)的方式對(duì)每個(gè)點(diǎn)屬于不同目標(biāo)局部的情況進(jìn)行投票,可得到每個(gè)點(diǎn)被分為樹木或建筑物的次數(shù),定義為Nv_tree和Nv_building。最終,可以根據(jù)如下目標(biāo)隸屬度進(jìn)行點(diǎn)類別判定:
(7)
(8)
(9)
本文實(shí)驗(yàn)所用原始激光雷達(dá)數(shù)據(jù)和相應(yīng)的航空彩色圖像分別如圖4(a)和圖4(b)所示。這是從ISPRS委員會(huì)第三委員會(huì)第III/4工作組獲得的數(shù)據(jù)的一個(gè)子集。該激光雷達(dá)數(shù)據(jù)由徠卡地球系統(tǒng)公司于2008年8月21日使用徠卡ALS50系統(tǒng)獲得,該系統(tǒng)具有45°視場,平均離地飛行高度為500 m。中間點(diǎn)密度為6.7點(diǎn)/m2。從圖4可以看出,在這個(gè)數(shù)據(jù)集中,建筑物周圍有許多不同高度的樹木。
(a) 航拍真彩圖像
為了驗(yàn)證所提出的基于二次多項(xiàng)式擬合區(qū)域結(jié)構(gòu)特征的城市分類方法的有效性,使用Matlab 2018A開發(fā)了所有相應(yīng)的算法,使用的計(jì)算機(jī)配置為Pentium i5雙核CPU i5-7500@3.4 GHz,8 GB內(nèi)存。
首先,需要將原始數(shù)據(jù)分為地面點(diǎn)和非地面點(diǎn)。那么,必須確認(rèn)式(5)中的關(guān)鍵參數(shù),對(duì)于實(shí)驗(yàn)所用的LiDAR點(diǎn)云數(shù)據(jù),此參數(shù)設(shè)置為0.35。相應(yīng)的地面點(diǎn)與非地面點(diǎn)實(shí)驗(yàn)結(jié)果如圖5(a)所示。在圖5(b)中,給出了非地面點(diǎn)。此步驟所用平均時(shí)間為0.00763 s。
(a) 分類結(jié)果
接下來,對(duì)得到的非地面點(diǎn)利用本文所提方法進(jìn)行樹木植被點(diǎn)和建筑物點(diǎn)的分類。具體地,二元結(jié)構(gòu)特征利用式(7)和式(8)進(jìn)行局部點(diǎn)類別模糊隸屬度計(jì)算,并根據(jù)式(9)完成最終分類。圖6給出了最終的分類結(jié)果。實(shí)驗(yàn)平均用時(shí)90.6 s。
(a) 建筑物和樹木植被分類結(jié)果
在具體分析前,圖7對(duì)建筑物和植被分類結(jié)果進(jìn)行了一些標(biāo)識(shí)。圖7中,圓圈標(biāo)記處為很難分類的建筑物屋頂?shù)囊徊糠郑玫搅苏_分類;圓角矩形框內(nèi)為人工修剪平整的高大灌木,被誤分為建筑物;直角矩形框中為較難分類的小型低矮屋體,得到了正確分類。顯然,本文方法通過二次多項(xiàng)式擬合構(gòu)建局部結(jié)構(gòu)特征較好地從結(jié)構(gòu)角度區(qū)分了樹木和建筑物。對(duì)于結(jié)構(gòu)模糊度較高的人工修剪平整的灌木,利用結(jié)構(gòu)特征一般難于分辨,需要借助強(qiáng)度、光譜等其他特征。
圖7 建筑物及樹木植被分類討論
針對(duì)當(dāng)前機(jī)載LiDAR點(diǎn)云數(shù)據(jù)城區(qū)建筑物及高大樹木植被分類難的問題,提出了表征能力優(yōu)異的局部結(jié)構(gòu)描述特征,并基于此實(shí)現(xiàn)了一種基于模糊邏輯的城區(qū)機(jī)載LiDAR點(diǎn)云快速分類方法。該方法實(shí)現(xiàn)原理簡單,易于實(shí)現(xiàn),通過現(xiàn)有后期數(shù)據(jù)編輯技術(shù)的引入,可向智能交通及自動(dòng)駕駛等領(lǐng)域進(jìn)行推廣。