董保根,秦志遠,陳 靜,徐驗兵
1.信息工程大學 測繪學院,鄭州 450052
2.信息工程大學 校務(wù)部,鄭州 450000
3.中國人民解放軍75719部隊
無需閾值支持的機載LiDAR點云數(shù)據(jù)濾波方法
董保根1,秦志遠1,陳 靜2,徐驗兵3
1.信息工程大學 測繪學院,鄭州 450052
2.信息工程大學 校務(wù)部,鄭州 450000
3.中國人民解放軍75719部隊
LiDAR(Light Detection And Ranging)可以說是過去十年主流地形測繪中最重要的技術(shù)。這種技術(shù)最大的優(yōu)勢在于它提供了一種直接獲取3D數(shù)據(jù)的方法,而且它的精度很高,這主要體現(xiàn)在毫米級和厘米級的激光測距精度和受到POS支持的精確傳感器平臺定位系統(tǒng)。機載LiDAR數(shù)據(jù)處理的首要任務(wù)是分離地面點與非地面點,從原始的DSM中提取DΤM以及nDSM,進一步的處理包括生成DEM等測繪產(chǎn)品以及數(shù)據(jù)分類。目前,有關(guān)LiDAR數(shù)據(jù)濾波的發(fā)展正逐漸成熟,各種濾波算法也層出不窮。從原理上來看,現(xiàn)有的濾波算法大致可分為四類[1]:(1)基于形態(tài)學的方法;(2)基于表面的方法;(3)漸近加密的方法;(4)基于分割的方法。每種方法都有各自的優(yōu)缺點,但是幾乎所有這些算法的共同特點是需要輸入?yún)?shù)或者閾值,盡管所需的參數(shù)或者閾值的數(shù)量不同。比如Zhang等[2]提出的漸近形態(tài)學濾波器需要輸入窗口尺寸、坡度和高差等5個閾值;Axelsson P[3]提出的基于ΤIN的方法需要輸入建筑物大小、三角形所在平面傾角、點到三角形的垂距等至少4個閾值;此外,平面濾波、曲面濾波等方法也需要輸入窗口尺寸和高差兩個閾值。盡管文獻[4]提出的形態(tài)學重建濾波僅需要輸入一個高差閾值,但是離不開閾值的支持也是不爭的事實。近幾年,基于統(tǒng)計學的機載LiDAR點云濾波算法正作為一種面向?qū)ο蟮姆椒ㄑ杆侔l(fā)展起來,這種類型的方法不需要事先知道地面點與地物點的任何先驗知識,屬于典型的非監(jiān)督分類方法。Bartels等[5]首先在LiDAR數(shù)據(jù)濾波中應(yīng)用了統(tǒng)計學的原理完成地面點與地物點的分類,隨后,Bartels等[6]對該算法進行了改進,提高了算法的適應(yīng)性。本文引入統(tǒng)計學中偏度和峰度的概念,在不需要閾值以及各種參數(shù)和權(quán)因子的情況下,通過實驗實現(xiàn)了一種無需閾值支持的基于偏度平衡的機載LiDAR點云數(shù)據(jù)濾波。
圖1 不對稱分布及正態(tài)分布
在統(tǒng)計學中,偏度(Skewness)也稱偏度系數(shù),它是表征某變量的概率密度分布曲線對稱性的統(tǒng)計量,從樣本的概率密度函數(shù)曲線直觀看來就是其尾部的相對長度。而峰度(Kurtosis)也可以稱之為峰度系數(shù),是表征某變量概率密度分布曲線陡緩程度的統(tǒng)計量,直觀上來看,它反應(yīng)了概率密度函數(shù)曲線尾部的厚度。通常偏度和峰度分別由sk和ku來表示。假設(shè)某一隨機變量X的三階矩和四階矩同時存在,則它們的計算公式為:
其中N表示樣本總數(shù),xi為任一樣本點,σ和μa分別表示樣本的標準方差和算術(shù)均值,它們由公式(3)和(4)來定義:
偏度和峰度均為無量綱的量,若sk>0,則稱該分布為正偏態(tài)或者右偏態(tài);若sk<0,則稱該分布為負偏態(tài)或者左偏態(tài),|sk|越大,表示其偏離程度越大;相似地,若ku>0,則該分布比較陡峭,若ku<0,則該分布比較平坦。偏度和峰度均是相對于正態(tài)分布來比較的,正態(tài)分布的偏度和峰度均為0。圖1表示的是偏度和正態(tài)分布的示意圖。
2.1 算法原理及流程
數(shù)理統(tǒng)計中的中心極限定理表述為:在一定條件下隨機變量之和的極限分布為正態(tài)分布。具體到本文中,需要做如下兩種假設(shè):(1)自然狀態(tài)下量測的LiDAR點云數(shù)據(jù)中,不規(guī)則分布的地面點的概率密度分布服從正態(tài)分布;(2)進一步的假設(shè)為非地面點(也就是地物點)干擾了這種分布,使得LiDAR點云數(shù)據(jù)的整體分布呈現(xiàn)出偏態(tài)分布,并且這種偏態(tài)分布往往是一種正偏態(tài)。為了使這種分布達到平衡狀態(tài),需要從LiDAR點云數(shù)據(jù)樣本中去除干擾地面點分布的非地面點,從而“校正”數(shù)據(jù)的整體概率密度分布,這種“校正”過程會持續(xù)進行,直至偏度等于0為止,此時地面點的分布即接近于正態(tài)分布。該算法的本質(zhì)是以平衡LiDAR點云數(shù)據(jù)的概率密度分布為基礎(chǔ)的,這是該算法之所以稱為偏度平衡的由來。
在利用偏度平衡進行濾波的過程中,不需要進行任何參數(shù)、閾值或者權(quán)因子設(shè)置,算法完全是在沒有先驗知識的情況下自動進行的,這是該算法的最大優(yōu)勢所在。此外,分布的統(tǒng)計量與點的相對位置是獨立的,因此算法本身與原始DSM的數(shù)據(jù)組織方式無關(guān),無論是規(guī)則格網(wǎng)還是原始不規(guī)則離散分布的LiDAR點云數(shù)據(jù)均可適用該算法,而且也不受原始LiDAR數(shù)據(jù)的點云密度和分辨率的影響,這也是該算法區(qū)別其他算法的一個顯著特征?;谄绕胶鉃V波算法的具體描述如下:首先計算原始LiDAR點云數(shù)據(jù)的偏度sk,如果sk>0,則點云分布呈正偏態(tài),此時點云中的高程最高點將作為非地面點被刪除;然后繼續(xù)計算剩余點云數(shù)據(jù)的偏度值,若仍大于0,則再次將數(shù)據(jù)中的最高點作為非地面點去除,直至點云數(shù)據(jù)的偏度值為0,而此時剩余的點將會是地面點,而去除的點則是非地面點。該算法需要迭代進行。圖2為算法流程圖。
圖2 偏度平衡算法流程圖
2.2 最少LiDAR地面點要求
在對LiDAR點云數(shù)據(jù)中地面點與非地面點進行分離的過程中,基于偏度平衡的濾波算法可以看做是一種全局分類器,因此,除了對數(shù)據(jù)的格式、分辨率等因素沒有限制外,該算法對LiDAR數(shù)據(jù)的最大數(shù)據(jù)量也沒有限制,如果不考慮算法運行效率的情況下。但是由于該算法的前提假設(shè)是地面點應(yīng)該服從正態(tài)分布,那么在給定的LiDAR數(shù)據(jù)中,地面點是否服從正態(tài)分布就是濾波算法能否成功的終極標準。這里需要考慮的因素即為所需的LiDAR點云數(shù)據(jù)中最少的地面點數(shù)量,如果不能滿足這一條件,則濾波算法的前提假設(shè)不能成立。Bartels在文獻[6]中指出所需的最少地面點數(shù)與Bartlett等[7]提出的最小樣本尺寸原理是相似的,其表達式為:
3.1 實驗過程
本文的實驗數(shù)據(jù)來自Leica ALS50-II以及ALS60分別獲取的沙市和敦煌地區(qū)LiDAR點云數(shù)據(jù),數(shù)據(jù)屬性說明如表1所示。由于篇幅有限,本文采取截圖顯示。三組實驗數(shù)據(jù)的地物類型基本上包含了所有城市特征,分別為:建筑物、高植被、低矮植被、道路、橋梁、水域,甚至還存在汽車、道路附屬物等地物類型。本次研究以LiDAR Pro為開發(fā)平臺,VS2010為開發(fā)環(huán)境。實驗過程中不區(qū)分首末次回波及其他回波,所有數(shù)據(jù)層同時參與濾波。圖3~5分別表示三組原始數(shù)據(jù)及濾波結(jié)果,其中圖3(b)、圖4(b)、圖5(b)中的白色點表示非地面點,棕色點表示地面點(高程尺度表以m為單位)。圖6表示分別對三組數(shù)據(jù)濾波結(jié)果中的地面點構(gòu)建ΤIN生成的DΤM,顯示在三維模式下。
表1 數(shù)據(jù)屬性
為了驗證算法開始時的兩個假設(shè),分別給出了三組數(shù)據(jù)濾波前后的高程頻率分布直方圖(如圖7~9所示),從圖中可以看出,濾波后的地面點均呈現(xiàn)近似正態(tài)分布。其中圖8(b)、圖9(b)為多峰正態(tài)分布。
3.2 實驗分析
圖3(a)原始數(shù)據(jù)1
圖3(b)對應(yīng)的濾波結(jié)果
圖4(a)原始數(shù)據(jù)2
圖4(b)對應(yīng)的濾波結(jié)果
從圖3(b)圖6(a)、圖4(b)圖6(b)、圖5(b)圖6(c)的視非地面點進行分離,由DSM生成的DΤM也符合期望值。圖3(a)主要由密集的建筑物、各種不同高度的植被以及道路組成,其中建筑物是整個數(shù)據(jù)的主要成分。由于本文提出的算法是一種基于全局的算法,所以即使是大型的建筑物,也可以順利地將其分離,而傳統(tǒng)的基于局部的方法需要對這些大型地物進行特殊處理才能濾除,比如基于形態(tài)學以及ΤIN的濾波算法需要設(shè)置建筑物尺寸閾值才能將其完全剔除。圖4(a)的特征主要表現(xiàn)為數(shù)據(jù)中存在大量不同高度、形狀以及類型的植被,同時伴隨著少量建筑物。從圖6(b)中可以看出,建筑物和大部分高植被均濾除,但
圖5(a)原始數(shù)據(jù)3
圖5(b)對應(yīng)的濾波結(jié)果
圖6 對圖3~5濾波后的地面點構(gòu)建ΤIN生成的三組DΤMs
覺角度來看,基于偏度平衡的方法可以很好地將地面與是道路兩旁的某些低矮植被似乎沒有完全去除掉,形成了一條呈線狀的突起地形。導致出現(xiàn)這種情況的原因可能有兩種,其一是該區(qū)域道路兩旁的低矮植被確實位于人造實體的上方,其二是濾波算法的性能還有待提高,如果是第二種情況,說明基于偏度平衡的算法對于高度特別低的地物缺乏濾除能力。圖5(a)是三組數(shù)據(jù)中地物類型最為復(fù)雜的,幾乎包含了城市區(qū)域所有的地物類型,除了建筑物、植被、道路以及水域外,由于點云密度較高,甚至可以識別出汽車和橋梁上的附屬物,并且由于水體上有漂浮物或者水質(zhì)原因,導致水面上還有部分激光點。從濾波的效果來看,基本上達到了預(yù)期目的,包括一些細微特征(比如橋梁上的路燈等)在內(nèi)的地物點均可成功濾除,但是由于地物的復(fù)雜性,從整體上來看這組數(shù)據(jù)的濾波效果不如前兩組數(shù)據(jù),這一點也可以從生成的三維模式下的DΤM(圖6(c))看出,DΤM的表面略顯粗糙,原因是產(chǎn)生了較大的II類誤差。值得一提的是,Sithole等[8]將地物類型分為兩類:一類是獨立型地物(detached objects),比如建筑物、植被等。另一類是附屬型地物(attached objects),比如橋梁、斜坡以及位于某一坡度上的建筑物等。對于圖5(a)中的橋梁,本文將其認為是道路的一種特殊形式,在濾波過程中將其作為地面點保留。而文獻[6]將其作為地物點與地面點進行了分離,這取決于對不同地物的認識。
圖7(a)原始數(shù)據(jù)1的高程頻率分布直方圖(最大值:33 570,高程上區(qū)間:30.860 000,高程下區(qū)間:-3.150 000)
圖8(a)原始數(shù)據(jù)2的高程頻率分布直方圖(最大值:5 121,高程上區(qū)間:60.980 000,高程下區(qū)間:3.830 000)
圖8(b)濾波后地面點的高程頻率分布直方圖(雙峰分布)(最大值:418,高程上區(qū)間:5.470 000,高程下區(qū)間:3.830 000)
由于缺乏參考數(shù)據(jù)的支持,本文采用人工濾波的方法對基于偏度平衡的濾波精度作出了評價(如表2所示)。從客觀數(shù)據(jù)上來看,除第三組數(shù)據(jù)的II類誤差較大以外,其他兩組數(shù)據(jù)均達到了較高的濾波精度。
圖9(a)原始數(shù)據(jù)3的高程頻率分布直方圖(最大值:65 664,高程上區(qū)間:1 190.300 000,高程下區(qū)間:1 124.300 000)
圖9(b)濾波后地面點的高程頻率分布直方圖(多峰分布)(最大值:19 309,高程上區(qū)間:1 135.660 000,高程下區(qū)間:1 124.300 000)
表2 精度評價 (%)
基于偏度平衡的機載LiDAR點云數(shù)據(jù)濾波具有區(qū)別于其他算法的許多鮮明特點,它是一種具有代表性的以非監(jiān)督分類為思想的濾波方法。其主要特點表現(xiàn)在如下幾個方面:(1)它是一種基于全局的分類器;(2)無需人工干預(yù);(3)相對于LiDAR點云數(shù)據(jù)的格式和分辨率是獨立的;(4)算法簡單,方法比較直觀。單從本次研究的實驗結(jié)果來看,該濾波算法在城市區(qū)域或者地形起伏不大的地區(qū)分類精度較高,從主觀和客觀兩方面來看,均達到了一定的要求。但其也并非理想化的濾波器,目前還沒有一種能夠達到近乎完美效果的濾波器能夠適應(yīng)所有地形,這也是國內(nèi)外學者一致認同的結(jié)論。為此,針對基于偏度平衡的算法,提出以下兩點展望:
(1)偏度和峰度均可以描述點云數(shù)據(jù)特征,本文只使用了偏度特征完成濾波算法。進一步的工作可以考慮如何利用峰度來描述LiDAR點云中地面點與地物點之間的關(guān)系,或者聯(lián)合利用峰度和偏度特征實現(xiàn)精度更高、適應(yīng)性更強的點云分類。
(2)基于偏度平衡的算法對城市地區(qū)濾波有著較高的精度和適應(yīng)性,但是在地形起伏較大的地區(qū),比如山區(qū),該算法往往會產(chǎn)生“過分割”的現(xiàn)象(文獻[6]也持相同的觀點),濾波精度較低。如何進一步改進算法,使該模型具有較強的泛化能力是基于統(tǒng)計學分類的主要目標。
[1]Shan Jie,Τoth C K.Τopographic laser ranging and scanning:principles and processing[M].[S.l.]:CRC Press,2008:312-322.
[2]Zhang K,Chen S C,Whitman D,et al.A progressive morphological filter for removing nonground measurement from Li-DAR data[J].IEEE Τransactions on Geoscience and Remote Sensing,2003,41(4):872-882.
[3]Axelsson P.DEM generation from laser scanner data using adaptive ΤIN models[J].International Archives of Photogrammetry,Remote Sensing and Spatial Information Science,1999,33:110-117.
[4]沈晶,劉紀平,林祥國.用形態(tài)學重建方法進行機載LiDAR數(shù)據(jù)濾波[J].武漢大學學報:信息科學版,2011,36(2):167-175.
[5]Bartels M,Wei H,Mason D C.DΤM generation from LIDAR data using skewness balancing[C]//Proceedings of the 18th International Conference on Pattern Recognition,2006:566-569.
[6]Bartels M,Wei H.Τhreshold-free object and ground point separation in LIDAR data[J].Pattern Recognition Letters,2010,31:1089-1099.
[7]Bartlett J E,Kotrlik J W,Higgins C C.Organizational research:determining appropriate sample size in survey research[J].Inform Τechnol Learn Perform,2001,19(1).
[8]Sithole G.Segmentation and classification of airborne Laser scanner[D].Delft University of Τechnology,2005.
DONG Baogen1,QIN Zhiyuan1,CHEN Jing2,XU Yanbing3
1.Institute of Surveying and Mapping,Information Engineering University,Zhengzhou 450052,China
2.School Affairs Department,Information Engineering University,Zhengzhou 450000,China
3.Unit 75719 of PLA,China
Generally,filtering for point clouds is considered as a primary step for airborne LiDAR data post-processing.However, it is still under development.By reviewing and summarizing the existing filtering algorithms,the concepts of skewness and kurtosis in statistics are introduced to the framework,and a novel unsupervised classification algorithm to differentiate ground and non-ground points based on skewness balancing is presented.Digital Τerrain Model(DΤM)is effectively extracted from Digital Surface Model(DSM)generated from LiDAR data by exploiting the statistical moments principle.As an alternative to traditional approaches,the ultimate advantages of this algorithm are parameter-and threshold-freedom and independence from LiDAR data format and resolution.Experiment results show that the algorithm is highly practicable and adaptive,and can meet the required precision properly.
airborne Light Detection And Ranging(LiDAR);filtering;skewness;threshold;unsupervised classification
點云數(shù)據(jù)濾波仍舊是現(xiàn)階段機載LiDAR數(shù)據(jù)后處理的首要步驟,但其發(fā)展尚未完全成熟。在回顧和總結(jié)已有濾波算法的基礎(chǔ)上,將統(tǒng)計學中偏度與峰度的概念引入到算法中,提出了一種新的基于偏度平衡的地面點與非地面點非監(jiān)督分類方法,利用統(tǒng)計矩原理從LiDAR點云數(shù)據(jù)生成的DSM中有效地提取DΤM。該方法區(qū)別傳統(tǒng)算法的最大的優(yōu)勢在于無需參數(shù)或者閾值支持,并且相對于LiDAR點云數(shù)據(jù)的格式和分辨率是獨立的。實驗結(jié)果證明,該方法切實可行,具有較強的適應(yīng)性,并且能夠較好地滿足精度要求。
機載光探測與測量(LiDAR);濾波;偏度;閾值;非監(jiān)督分類
A
P237;ΤP751.1
10.3778/j.issn.1002-8331.1203-0237
DONG Baogen,QIN Zhiyuan,CHEN Jing,et al.Threshold-free method for airborne LiDAR point clouds data filtering. Computer Engineering and Applications,2013,49(15):219-223.
江西省數(shù)字國土重點實驗室開放研究基金資助項目(No.DLLJ201111,No.DLLJ201112)。
董保根(1977—),男,博士研究生,工程師,主要從事遙感圖像處理與LiDAR數(shù)據(jù)處理的研究;秦志遠,博士,教授;陳靜,工程師;徐驗兵,工程師。E-mail:dbg-999@163.com
2012-03-13
2012-04-12
1002-8331(2013)15-0219-05
CNKI出版日期:2012-07-16 http://www.cnki.net/kcms/detail/11.2127.ΤP.20120716.1500.030.html