彭耀霖,李榮冰*,何梓君
(1.南京航空航天大學 自動化學院 導航研究中心,江蘇 南京 211106; 2.空軍駐南京地區(qū)第四軍事代表室,江蘇 南京 210000)
毫米波雷達被廣泛應(yīng)用于智能家居、智慧養(yǎng)老和患者監(jiān)護等領(lǐng)域[1-2],當雷達系統(tǒng)檢測到目標的多個點跡時,首先考慮的是聚類問題。目前,聚類算法根據(jù)原理主要分為5類,包括劃分、層次、密度、網(wǎng)格和模型。毫米波雷達獲取的是目標徑向信息,點云數(shù)據(jù)沿徑向發(fā)散,存在角分辨率低、輸出稀疏、分布不均勻等缺點,同時還存在噪聲雜波和虛假目標影響。為方便處理量測信息,需要對雷達點云數(shù)據(jù)進行精確劃分聚類和去除雜波噪聲,特別是在人多密集的情況下,點云分布沒有一個明顯的分界線,存在多目標點云數(shù)據(jù)密集分布的現(xiàn)象,點云聚類劃分難度更大。目前在針對人員檢測的毫米波雷達應(yīng)用中,沒有較好的點云聚類方法,因此,很有必要采取適當?shù)牟呗詠硖岣吆撩撞ɡ走_點云聚類算法性能。
針對毫米波雷達數(shù)據(jù)的特性,國內(nèi)外學者提出許多相關(guān)的聚類算法。Smith等[8]引入加權(quán)密度函數(shù),提出一種橢圓聚類算法,使點云簇以橢圓結(jié)構(gòu)進行擴展,取得了與標準聚類算法相當?shù)男阅?。Scheiner等[9]對雷達數(shù)據(jù)進行了二次聚類,第1次聚類使用自適應(yīng)調(diào)整核心點數(shù)閾值的DBSCAN(Density-Based Spatial Clustering of Applications with Noise)算法,第2次聚類仍使用DBSCAN算法,但參數(shù)不同,取得了較好的數(shù)據(jù)聚類效果。該算法僅自適應(yīng)調(diào)節(jié)核心點數(shù)閾值參數(shù),未能較好地優(yōu)化雷達均勻性問題。蔣留兵等[10]利用卡爾曼濾波算法對DBSCAN算法進行改進,實現(xiàn)聚類算法參數(shù)自適應(yīng)和增量聚類,但改進算法存在誤差時域傳遞問題。
現(xiàn)有這些研究大都是對雷達二維數(shù)據(jù)進行聚類[11-13],具有局限性,同時現(xiàn)有的基于密度原理改進的聚類算法沒有考慮密度擴張的影響[14-15]。因此,針對室內(nèi)人員檢測環(huán)境的毫米波雷達點云數(shù)據(jù)特性,并考慮多目標點云密集的復雜情況,本文提出一種毫米波雷達點云的密度和劃分聯(lián)合聚類方法。針對毫米波雷達點云數(shù)據(jù)特性,該方法首先采用基于DBSCAN改進的參數(shù)自適應(yīng)聚類算法,根據(jù)K個近鄰點判斷目標點處密度分布來自適應(yīng)調(diào)整聚類參數(shù);然后針對密度聚類對密度相似的空間點間會出現(xiàn)無限制地幾何擴張問題,對異常數(shù)據(jù)簇使用K均值聚類算法進行二次聚類。改進的點云聚類方法更加適應(yīng)毫米波雷達點云數(shù)據(jù)的特性,聚類效果更加細膩和準確。
針對人員目標檢測需求,對毫米波雷達數(shù)據(jù)輸出的點云特征進行分析,并根據(jù)數(shù)據(jù)特征設(shè)計雷達點云聚類算法。實時視頻畫面記錄如圖1(a)所示,該場景為相鄰2人以0.35~0.75 m/s速度靠近雷達行進;雷達傳感器在片上經(jīng)過恒虛警檢測等信號鏈處理后,通過串口通信在上位機接收到的點云數(shù)據(jù)如圖1(b)所示。
圖1 毫米波雷達人員目標點云數(shù)據(jù)示例
從圖1中可以看出,室內(nèi)人員目標的雷達點云特征有:① 雷達點云輸出稀疏,且存在噪聲;② 點云分布沿徑向發(fā)散,均勻性差;③ 雷達對擴展目標的檢測包含許多局部輪廓信息;④ 多目標密集情況下,點云無明顯的分界線。
常用的單一經(jīng)典算法都不太適用于毫米波雷達數(shù)據(jù)特性[7],針對毫米波雷達點云數(shù)據(jù)特性和室內(nèi)人員檢測應(yīng)用場景,本文設(shè)計一種毫米波雷達點云密度和劃分聯(lián)合聚類方法,框架如圖2所示。
圖2 雷達多目標點云聚類方法框架
為解決雷達點云輸出稀疏問題,可采用多幀數(shù)據(jù)融合處理方法。從方法框架中可以看出,該方法主要分為2個部分。
① 為解決雷達點云數(shù)據(jù)點云分布不均勻和存在大量噪點雜波的影響,采用基于DBSCAN改進的參數(shù)自適應(yīng)聚類算法對雷達單/多幀數(shù)據(jù)進行聚類。
② 為解決密度聚類算法會對密度相似空間點進行無限制地幾何擴張,從而導致數(shù)據(jù)簇屬性不具備單一性問題,將聚好的數(shù)據(jù)簇通過CART(Classification and Regression Tree)決策樹進行目標數(shù)歸類,對目標數(shù)大于1的異常數(shù)據(jù)簇使用k均值聚類算法進行二次劃分。
毫米波雷達點云數(shù)據(jù)為非凸數(shù)據(jù)集且存在雜波和噪聲,適合采用密度聚類方法處理。由于雷達點云數(shù)據(jù)均勻性差,需對傳統(tǒng)的DBSCAN聚類算法進行改進,改進的聚類算法能夠根據(jù)K個最近鄰點判斷目標點處密度的分布來自適應(yīng)調(diào)整聚類半徑參數(shù),解決雷達點云數(shù)據(jù)存在的分布不均勻問題。
DBSCAN是基于密度的聚類算法,該算法對噪聲點不敏感,有較好的濾除噪點能力,能發(fā)現(xiàn)任意形狀的簇。DBSCAN算法需給定2個參數(shù):鄰域半徑Eps和核心點數(shù)閾值pts,這2個算法參數(shù)用來定義數(shù)據(jù)的密集特征,原算法中這2個參數(shù)均為固定值,這導致了DBSCAN算法對數(shù)據(jù)均勻性要求較高,數(shù)據(jù)的稀疏程度會直接影響聚類的效果。
雷達點云數(shù)據(jù)沿徑向發(fā)散,存在角分辨率低、輸出稀疏、均勻性差等缺點,因此需針對原算法中的固定參數(shù)鄰域半徑Eps進行自適應(yīng)調(diào)整。鄰域半徑參數(shù)自適應(yīng)的工作原理如圖3所示。
圖3 鄰域半徑參數(shù)自適應(yīng)工作原理
鄰域半徑Eps的選取需要考慮目標點i處空間點的密度分布,基于KNN(K-Nearest Neighbor)算法思想,選取目標點i處的K個近鄰點來研究空間點間的拓撲關(guān)系,K值一般稍大于或等于核心點數(shù)閾值pts。圖3中,選用了目標點i處的4個近鄰點進行空間密度特征分析,即K=4,圖中標注為A、B、C、D,并分別計算目標點i與第j個近鄰點的歐式距離為
(1)
式中:xi、yi、zi為目標點i的空間三維坐標;xj、yj、zj為目標點i的第j個最近鄰點的空間三維坐標,0 用目標點i與2個相鄰近點的距離差大小來判斷近鄰點之間的相似度。 (2) 如果εj,j-1大于發(fā)散閾值ε,則認為兩近鄰點的相似度小,同時通過傳遞性可認為目標點i與第j個最近鄰點相似度小,則選取目標點i的第j-1個最近鄰點距離作為鄰域半徑Eps的決定因素之一。 同時,針對毫米波雷達點云數(shù)據(jù)在徑向距離方向的發(fā)散,還需要考慮目標點i與m個近鄰點間的發(fā)散程度為 (3) 式中:0 改進的密度聚類算法對鄰域半徑Eps參數(shù)分別根據(jù)目標點與第k個最近鄰點距離和目標點近鄰空間點的發(fā)散程度來進行自適應(yīng)地調(diào)整。 Eps,i=Eps,knn+Eps,ε (4) 由圖3可以看出,ε3,4明顯大于發(fā)散閾值,因此k值取3,紅色圓形實線即為目標點i的鄰域半徑參數(shù)自適應(yīng)結(jié)果。 在改進的DBSCAN聚類算法中,參數(shù)鄰域半徑Eps由目標點自適應(yīng)確定,會導致數(shù)據(jù)處理存在不對稱性[7],即初始點選擇的不同可能出現(xiàn)聚類效果不同的情況,如圖4所示。為此,在改進算法中添加一條規(guī)則:核心點之間密度可達的同時需要滿足對稱性,即核心點之間需要相互密度可達才能聚成一類。 圖4 自適應(yīng)處理存在的數(shù)據(jù)不對稱性 通過上述改進的聚類算法雖可解決毫米波雷達點云數(shù)據(jù)存在噪點雜波和點云分布不均勻的缺點,但還存在著多人密集情況下點云劃分困難的問題。由上述算法聚類的數(shù)據(jù)簇會對密度相似的空間點間進行無限制地幾何擴張,如圖5所示,導致數(shù)據(jù)簇屬性不具備單一性,甚至出現(xiàn)多人密集情況下多個目標源點云數(shù)據(jù)聚成一類的現(xiàn)象,圖5(c)中通過密度聚類形成的點云簇1包含了2個目標源的量測信息。 圖5 密集點云聚類幾何擴張示例 同時,在擴展目標檢測中,目標不同部位的數(shù)據(jù)屬性也不同。因此,不能只單從空間點間的拓撲關(guān)系來聚類,還需要對聚類數(shù)據(jù)簇進行實際目標數(shù)的歸類分析,對異常數(shù)據(jù)簇進行更加精準的二次劃分。 由改進的聚類算法對密度相似的空間點間進行幾何擴張可能導致異常數(shù)據(jù)簇沒有一個明顯的數(shù)據(jù)分界線,因此需要使用先驗知識對數(shù)據(jù)簇進行目標數(shù)歸類分析。本文采用CART算法來構(gòu)建決策樹,針對不同目標、環(huán)境和幀數(shù)疊加的應(yīng)用背景,分別采集不同目標群的數(shù)據(jù)簇作為訓練樣本數(shù)據(jù),用數(shù)據(jù)簇的三維空間輪廓長度、面積和所包含的點云數(shù)目構(gòu)造樣本特征向量,參照實時同步圖像樣本數(shù)據(jù)簇所包含的實際目標源是否為單一目標源來賦予樣本類標簽,通過分析每個結(jié)點處樣本特征的基尼指數(shù),選擇基尼指數(shù)最小的特征及其對應(yīng)切分點作為最優(yōu)特征與最優(yōu)切分點。依據(jù)最優(yōu)特征與最優(yōu)切分點,從現(xiàn)結(jié)點生成2個子結(jié)點,將數(shù)據(jù)集往下細分,最終形成二叉樹形式的決策樹。 采用K均值聚類算法(K-means Clustering Algorithm)對異常數(shù)據(jù)簇進行二次劃分,通過不斷迭代求解的劃分聚類算法,以距離度量作為數(shù)據(jù)相似度的依據(jù),根據(jù)與k個已知類質(zhì)心的相似度將數(shù)據(jù)分為k類。將密度聚類后的數(shù)據(jù)簇送入構(gòu)建好的決策樹中,由決策樹給出異常數(shù)據(jù)簇中的目標數(shù),并作為K-means算法的k值入?yún)ⅰ?/p> 對于K-means算法,需要注意的是k值準確性和k個初始類質(zhì)心選取,k個初始類質(zhì)心的位置選擇對最后的聚類結(jié)果和運行時間都有很大影響。判斷異常數(shù)據(jù)簇附近是否存在鄰近的跟蹤目標,如果存在,則將鄰近跟蹤目標位置信息作為算法初始類質(zhì)心的位置;否則在異常數(shù)據(jù)簇最大輪廓方向選取距離差異較大的k個特殊點作為初始質(zhì)心的位置。選用歐式距離作為距離度量,將異常數(shù)據(jù)簇的數(shù)據(jù)子集根據(jù)相似度大小歸類到k個集合中,然后分別對每個集合求均值(更新類質(zhì)心),重復迭代使得每個樣本和所屬集合的類質(zhì)心的距離平方誤差最小。 以圖5中密集點云幾何擴張聚類所生成的異常數(shù)據(jù)簇為例,對該數(shù)據(jù)簇進行二次聚類,結(jié)果如圖6所示。其通過決策樹得到的目標數(shù)為2,由于不存在相鄰的2個跟蹤目標,在點云簇X-Y平面上的X軸輪廓方向進行初始質(zhì)心位置選擇,分別為k1和k2。由圖6(b)可以看到,通過二次聚類,可有效且準確地劃分開多目標密集點云。與其他雷達聚類算法相比[14-15],通過K-means算法對異常數(shù)據(jù)簇進行二次劃分有效地解決了由于空間點間的密度相似所導致幾何擴張過大、不能代表單一屬性和多目標數(shù)據(jù)聚成一簇等難題。 圖6 異常數(shù)據(jù)簇的二次聚類 改進的雷達點云聚類算法中,需要設(shè)置的參數(shù)主要有核心點數(shù)閾值pts、K個近鄰點的K值、發(fā)散閾值ε。各個參數(shù)的定義和設(shè)置如下。 (1) 核心點數(shù)閾值pts:是定義核心點對象的重要指標,如圖7所示,為單個人員目標雷達探測點數(shù)的統(tǒng)計,參考均值分布曲線可將pts數(shù)值區(qū)間設(shè)置為3~6。 圖7 單個人員目標的雷達探測點數(shù)統(tǒng)計 (2)K個近鄰點的K值:K近鄰點的K值依據(jù)核心點數(shù)閾值選取,一般稍大于或等于核心點數(shù)閾值。 (3) 發(fā)散閾值ε:近鄰點距離差εj,j-1的發(fā)散閾值,若小于發(fā)散閾值則數(shù)據(jù)的相似性大,視為同類,否則數(shù)據(jù)的相似性小,視為異類。發(fā)散閾值ε可用函數(shù)表示為 (5) 式中:α0為給定的距離閾值;β為隨徑向距離變化的線性漸變量。具體數(shù)值選取依據(jù)人員目標距離特性和雷達距離分辨率dres。 (6) 式中:c為光速;Bw為雷達信號調(diào)制帶寬。 將雷達單/多幀點云數(shù)據(jù)經(jīng)過坐標系轉(zhuǎn)換得到算法的入?yún)?shù)據(jù)集D={d1,d2,d3,…,dn},其中包含了n個目標點對象,每個目標點對象具有3個維度的屬性dn={rnx,rny,rnz}。算法出參數(shù)據(jù)集為F={f1,f2,…,fm},其中,fm={rmx,rmy,rmz,llabel,m},llabel,m為對應(yīng)的點云簇標簽,基于毫米波雷達的密集目標點云聚類方法具體步驟如下。 ① 雷達數(shù)據(jù)預處理,對雷達單/多幀點云數(shù)據(jù)進行時空校準和野值剔除,形成點云數(shù)據(jù)集作為算法的入?yún)ⅰ?/p> ② 使用基于DBSCAN改進的參數(shù)自適應(yīng)聚類算法對數(shù)據(jù)集進行遍歷聚類。 ③ 將聚類好的數(shù)據(jù)簇送入決策樹中進行目標數(shù)歸類。 ④ 對于目標數(shù)大于1的數(shù)據(jù)簇進行二次劃分聚類,生成最終聚類結(jié)果。 為評估改進算法及對比算法,引用2個評價指標[6]:聚類精確度(Accuracy,AC)和聚類正確率(Accuracy Rate,AR)。聚類精確度用于比較輸出聚類簇標簽和數(shù)據(jù)提供的標簽,對于原始點云數(shù)據(jù)中人員目標的多個局部量測可拆分成多個信號源看待,其中局部信號源可分為上下肢體和軀干,則聚類精確度為 (7) (8) 聚類正確率用于比較正確聚類簇數(shù)與實際探測目標個數(shù)。目標聚類正確的定義:目標聚類形成的聚類簇與實際探測目標一一對應(yīng)。聚類正確的量化標準為:單目標AC≥70%。實驗中使用同步記錄畫面作為真實結(jié)果對聚類效果進行驗證,聚類正確率公式為 (9) 式中:S為目標聚類正確個數(shù);P為有量測信號前提下的實際探測目標個數(shù)。 實驗雷達選用美國德州儀器(TI)生產(chǎn)的IWR6843-ISK型雷達傳感器,該型號雷達的工作頻率為60~64 GHz,雷達天線為3發(fā)4收,對于IWR6843的參數(shù)配置如表1所示。測量時雷達傳感器安置在距地面高度為2.5 m處,向下傾斜30°。 表1 IWR6843參數(shù)配置 為驗證改進點云聚類方法的有效性,在室內(nèi)場景進行了多次人員檢測實驗分析,同時采用2幀雷達數(shù)據(jù)融合方式以顯示更全面的人員目標量測信息。在核心點數(shù)閾值pts統(tǒng)一的條件下進行了多次檢測實驗并分別與Eps=0.2 m、Eps=0.5 m的DBSCAN算法聚類效果進行對比,結(jié)果如圖8所示。從圖8(c)中可以看出,參數(shù)Eps=0.2 m時的DBSCAN聚類算法只能有效檢測到4個人員目標的數(shù)據(jù)簇,將其中1個目標量測信息當作噪聲濾除,導致出現(xiàn)了漏檢情況,聚類效果與實際情況存在較大的偏差;觀察圖8(d)可知,參數(shù)Eps=0.5 m時的DBSCAN聚類算法可以檢測到5個人員目標,但是聚類效果粗糙,點云簇1中包含了人員目標多個肢體部位的量測信息,數(shù)據(jù)簇屬性缺乏單一性,并且包含了大量的噪聲信息,沒有較好地濾除噪聲;從圖8(e)中可以看出,使用本文改進的點云聚類方法所得的聚類效果相對更精準,既可以有效地濾除噪聲雜波,又能最大程度上利用真實的量測信息,同時還保證了數(shù)據(jù)簇屬性的單一性,其中點云簇5和點云簇6是通過第2次聚類所得到的,分別代表了人員目標的胸腔和肢體信息。 針對該實驗場景共300幀數(shù)據(jù)進行量化統(tǒng)計,使用上文聚類效果評價指標評估本文改進的點云聚類方法的有效性,并分別與參數(shù)為Eps=0.2 m、Eps=0.5 m的DBSCAN算法聚類效果評估進行對比,聚類效果量化統(tǒng)計結(jié)果如表2所示。 表2 聚類效果量化統(tǒng)計結(jié)果 在多人密集情況下,Eps=0.5 m的DBSCAN算法聚類效果粗糙,容易出現(xiàn)誤檢導致聚類精確度較低。Eps=0.2 m的DBSCAN算法在多人密集情況下聚類精確度表現(xiàn)較好,但隨著人數(shù)增加,單目標點云數(shù)減少且稀疏,容易出現(xiàn)漏檢導致聚類正確率較低。而與其他算法對比,改進方法的聚類精確度和聚類正確率均為最高,分別為93.8%、96.5%,聚類精確度的提升最為明顯。 綜合以上實驗結(jié)果可以看出,傳統(tǒng)的DBSCAN聚類算法在固定的參數(shù)下無法適應(yīng)毫米波雷達點云數(shù)據(jù)稀疏、均勻性差的特點,如果為追求精度將Eps鄰域半徑設(shè)置地較小,雖然可以很好地濾除噪聲,但同時會忽略大量真實的量測信息,導致目標漏檢;而Eps鄰域半徑設(shè)置地較大的時候,聚類結(jié)果會包含了大量的噪聲和虛假目標信息,聚類粗糙且數(shù)據(jù)簇屬性缺乏單一性,導致目標誤檢。而本文改進的點云聚類方法是有效的,更加適應(yīng)毫米波雷達點云數(shù)據(jù)的特性,所采用的基于DBSCAN的自適應(yīng)參數(shù)聚類算法既可有效地濾除噪聲雜波,又能最大程度地利用真實的量測信息,而對異常數(shù)據(jù)簇的二次聚類又保證了數(shù)據(jù)簇屬性的單一性,聚類效果更加細膩和準確,同時也更適用于多目標密集的復雜情況。 針對毫米波雷達點云數(shù)據(jù)特性,同時考慮多目標點云密集的復雜情況,提出一種毫米波雷達點云的密度和劃分聯(lián)合聚類方法,通過實驗分析改進的點云聚類方法可以得到如下結(jié)論。 ① 采用基于DBSCAN改進的參數(shù)自適應(yīng)聚類算法可以自適應(yīng)地尋找聚類過程中所需要的最佳參數(shù)并實現(xiàn)聚類,解決了聚類過程中毫米波雷達點云數(shù)據(jù)存在噪點雜波和點云分布不均勻的影響。 ② 通過對異常數(shù)據(jù)簇進行劃分聚類,解決了密度聚類算法會對密度相似的空間點進行無限制地幾何擴張,從而導致數(shù)據(jù)簇屬性不具備單一性的問題,同時也解決了多目標密集情況下多個目標源的點云數(shù)據(jù)聚成一類的問題,實現(xiàn)了對多目標點云數(shù)據(jù)精準聚類劃分的效果。 在未來的工作中,將通過多傳感器數(shù)據(jù)融合解決目標遮擋、探測盲區(qū)等情況所導致的目標量測數(shù)據(jù)丟失問題,并進行數(shù)據(jù)簇與跟蹤目標之間數(shù)據(jù)關(guān)聯(lián)性的研究,構(gòu)建完整有效的目標識別跟蹤與姿態(tài)檢測系統(tǒng)。3 異常數(shù)據(jù)簇的劃分聚類
3.1 決策樹歸類
3.2 數(shù)據(jù)簇二次劃分
4 聚類算法設(shè)置與評估指標
4.1 聚類參數(shù)設(shè)定及聚類過程
4.2 聚類效果評估指標
5 實驗對比與結(jié)果分析
6 結(jié)束語