何 穎,莫愿斌
(廣西民族大學(xué)人工智能學(xué)院,廣西 南寧 530006)
近年來,無源定位在電子作戰(zhàn)中占據(jù)重要地位,成為軍事領(lǐng)域的熱門話題。無論是戰(zhàn)略觀察,還是給予對(duì)手干擾,都離不開無源目標(biāo)定位技術(shù)。該技術(shù)可以在不暴露自身位置的情況下,準(zhǔn)確獲取目標(biāo)位置,憑借作用距離長(zhǎng)、不容易受到外界干擾等優(yōu)勢(shì)被廣泛應(yīng)用,對(duì)提高作戰(zhàn)能力有很大作用[1]。對(duì)于三維無源目標(biāo)定位而言,采集越多位置信息定位越精準(zhǔn),但面對(duì)海量數(shù)據(jù)時(shí),會(huì)適得其反,不僅定位速度下降,而且還影響定位精度。
廣大學(xué)者針對(duì)上述問題展開了廣泛研究,并找到一些合理的解決辦法。例如有學(xué)者提出了一種基于聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)的無源定位算法。構(gòu)建聯(lián)合概率關(guān)聯(lián)架構(gòu),在該架構(gòu)基礎(chǔ)上獲取關(guān)聯(lián)數(shù)據(jù)的后驗(yàn)概率密度函數(shù),計(jì)算此函數(shù)和高斯函數(shù)之間的散度值;結(jié)合后驗(yàn)密度函數(shù)實(shí)現(xiàn)對(duì)目標(biāo)方位的估計(jì)。文獻(xiàn)[2]研究一種無源目標(biāo)位置代數(shù)解算法,針對(duì)波達(dá)方向與到達(dá)時(shí)差方程做線性處理,分析方程誤差,利用加權(quán)最小二乘算法求解,通過矩陣不斷迭代,定位到目標(biāo)位置。
隨著計(jì)算機(jī)視覺技術(shù)的不斷發(fā)展,深度學(xué)習(xí)算法逐漸應(yīng)用到定位技術(shù)中[3]。其中,卷積神經(jīng)網(wǎng)絡(luò)在三維目標(biāo)定位技術(shù)中顯現(xiàn)出較大優(yōu)勢(shì),此種網(wǎng)絡(luò)結(jié)構(gòu)有很好的特征提取能力,可提高定位精度。但三維無源目標(biāo)定位的數(shù)據(jù)采集一般來自激光雷達(dá),數(shù)據(jù)存在一定稀疏性,如果使用經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)處理數(shù)據(jù),則會(huì)降低網(wǎng)絡(luò)運(yùn)行速度,甚至產(chǎn)生定位誤差。為解決這一問題,本文提出一種面向三維無源目標(biāo)定位的深度學(xué)習(xí)算法優(yōu)化研究。在卷積網(wǎng)絡(luò)(CNN)架構(gòu)基礎(chǔ)上生成卷積稀疏并行算法,通過構(gòu)造多個(gè)中間矩陣改善密集卷積[4],加快網(wǎng)絡(luò)處理速度;設(shè)置損失函數(shù),減少定位誤差。
本文使用激光雷達(dá)傳感器采集定位目標(biāo)的三維數(shù)據(jù)。此種采集技術(shù)具有非接觸性,可以直接獲取目標(biāo)表面數(shù)據(jù),且數(shù)據(jù)質(zhì)量較高,另外采樣頻率和分辨率都能滿足要求。針對(duì)該技術(shù)構(gòu)建如圖1所示的數(shù)據(jù)采集架構(gòu)。
圖1 數(shù)據(jù)采集架構(gòu)示意圖
由圖1可以看出,該檢測(cè)架構(gòu)是在二維檢測(cè)器和三維邊界框的基礎(chǔ)上建立的,通過采集二維圖像,生成三維點(diǎn)云數(shù)據(jù)。但是生成后的點(diǎn)云數(shù)據(jù)還不能直接用于深度學(xué)習(xí)算法的分析,還需做進(jìn)一步處理。
要想確保深度學(xué)習(xí)算法能夠很好地實(shí)現(xiàn)目標(biāo)定位,就需要在三維空間內(nèi)完成數(shù)據(jù)配準(zhǔn),即剛體運(yùn)動(dòng)[5]。這是一種簡(jiǎn)單的平移、旋轉(zhuǎn)變換,結(jié)合齊次坐標(biāo)系方法,將點(diǎn)云集合的變換轉(zhuǎn)換為所有采樣點(diǎn)的變換,具體操作如下:
假設(shè)S代表點(diǎn)云數(shù)據(jù)集合,行數(shù)和列數(shù)分別表示為X和Y。此時(shí)集合S就是由X行Y列的點(diǎn)構(gòu)成的矩陣,如果Q是其中任意一點(diǎn),則數(shù)據(jù)集S即可描述為:
S={Q(m,n),m=1,2,3,…,X,n=1,2,3,…,Y}
(1)
式中,m和n分別代表點(diǎn)Q在矩陣中的行、列索引值。則有Q(m,n)=(x,y,z),其為此點(diǎn)的三維信息,(x,y,z)就是坐標(biāo)值。
如果點(diǎn)Q的坐標(biāo)表示為(x,y,z,1),假設(shè)其平移變換后的坐標(biāo)為(x′,y′,z′,1),則平移后Q′的坐標(biāo)可通過下述公式計(jì)算得出:
(2)
式中,x′、y′和z′代表不同坐標(biāo)的偏移量。
在旋轉(zhuǎn)變換中,如果旋轉(zhuǎn)角度為θ,則數(shù)據(jù)空間旋轉(zhuǎn)描述為
(3)
上述旋轉(zhuǎn)矩陣對(duì)于所有直線的旋轉(zhuǎn)都適用[6]。經(jīng)過處理后,采集到的點(diǎn)云信息都能夠被深度學(xué)習(xí)算法所識(shí)別,為目標(biāo)定位提供更高質(zhì)量的數(shù)據(jù)。
在眾多深度學(xué)習(xí)算法中,選用卷積神經(jīng)網(wǎng)絡(luò)對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行分析,提取目標(biāo)位置特征,實(shí)現(xiàn)快速、精準(zhǔn)定位。
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
CNN網(wǎng)絡(luò)是在人工神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上生成的,屬于一種處理數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu)[7],具體結(jié)構(gòu)組成如下:
1)卷積層
卷積運(yùn)算是利用滑動(dòng)窗口方式實(shí)現(xiàn)的,可提取數(shù)據(jù)特征,輸出形式通常如下:
(4)
式中,zi,j和xi,j分別為網(wǎng)絡(luò)輸出和輸入,Pi,j是不同大小的卷積核,i和j代表不同點(diǎn)云數(shù)據(jù)。
輸出值通常受到卷積核大小、采樣步數(shù)等影響[8],為減少填充信息對(duì)初始數(shù)據(jù)的干擾,選擇填充“0”方法。則輸出的點(diǎn)云圖像表達(dá)式如下:
(5)
式中,Hout與Hin代表輸入和輸出圖像的高,Wout和Win則為輸入、輸出圖像的寬,S屬于步長(zhǎng),Ph和Pw描述水平與垂直方向上的填充寬度,kh和kw代表卷積核高與寬。
填充寬度Pw和Ph的計(jì)算公式如下:
(6)
2)池化層
池化層的計(jì)算也是依靠滑動(dòng)窗口完成的,具體作用是減少參數(shù)種類,避免網(wǎng)絡(luò)過于擬合[9]。在特征提取過程中,池化操作能夠有效防止背景特征進(jìn)入到下層網(wǎng)絡(luò),提高圖像特征的不變性。
3)全連接層
該網(wǎng)絡(luò)層能夠起到降維與信息表達(dá)的作用,可以將學(xué)習(xí)到的特征傳輸?shù)綐?biāo)簽空間[10]。單個(gè)全連接層并不能很好解決非線性問題,所以網(wǎng)絡(luò)層數(shù)通常大于兩層。
3.1.2 三維無源目標(biāo)定位
利用上述構(gòu)建的CNN模型完成數(shù)據(jù)訓(xùn)練和定位,將處理好的圖像輸入到網(wǎng)絡(luò)中,通過網(wǎng)絡(luò)判斷圖像中是否包含目標(biāo),確定邊界框位置。具體過程如下:
將圖像劃分為s×s的網(wǎng)格,所有網(wǎng)格都會(huì)估計(jì)出各邊界框和其對(duì)應(yīng)的置信度[11]。任意邊界框中都存在五個(gè)預(yù)測(cè)值:X′,Y′,w,h,si。其中,(X′,Y′)是邊框中心和網(wǎng)格中心的距離,w,h描述邊框?qū)捄透?si為置信度評(píng)分,其計(jì)算公式如下:
(7)
3.2.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化
上述方法雖然能夠確定目標(biāo)邊框的位置,但是因點(diǎn)云數(shù)據(jù)存在一定稀疏性,卷積神經(jīng)網(wǎng)絡(luò)針對(duì)稀疏數(shù)據(jù)會(huì)出現(xiàn)處理速度過慢的問題[12]。為此,本文在此基礎(chǔ)上提出稀疏卷積并行算法。引入檢測(cè)器網(wǎng)絡(luò)提高原始網(wǎng)絡(luò)的運(yùn)算速度,即使在數(shù)據(jù)稀疏情況下,也能很好提取目標(biāo)的位置特征[13]。
(8)
式中,Wu,v代表檢測(cè)器獲得的坐標(biāo)結(jié)果。
(9)
式中,Ru,v為匹配矩陣,在已知該矩陣的情況下,通過Ru,v來獲取檢測(cè)器空間內(nèi)的中間矩陣,再利用矩陣乘法去除矩陣中的零值,提高計(jì)算效率。
3.2.2 邊界框約束
在沒有約束條件時(shí),網(wǎng)絡(luò)的訓(xùn)練會(huì)不穩(wěn)定。為了提高邊界框預(yù)測(cè)精度,設(shè)置如下約束條件[14]:
(10)
式中,cX′和cY′是網(wǎng)格左上角的坐標(biāo)值,(tX′,tY′)代表預(yù)測(cè)邊界框上的坐標(biāo)。t0與置信度作用相似,能夠提高網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定性,σ為激活函數(shù),(pw,ph)描述錨點(diǎn)寬高。
3.2.3 損失函數(shù)設(shè)置
通過設(shè)置損失函數(shù),可實(shí)現(xiàn)網(wǎng)絡(luò)端與端之間的訓(xùn)練效果,提高位置特征提取能力[15]。損失函數(shù)包括如下三部分:
loss=Ecoord+EIOU+Eclass
(11)
式中,Ecoord和EIOU分別為邊框位置和置信度誤差,Eclass是定位誤差。三種誤差計(jì)算公式分別如下:
(12)
(13)
(14)
此外,針對(duì)邊界框的寬度與高度誤差,添加比例因子α,計(jì)算公式為:
(15)
針對(duì)小的目標(biāo)而言,結(jié)合該比例因子能夠更好的調(diào)整置信誤差,提高三維無源目標(biāo)定位精度。
實(shí)驗(yàn)中選用Velodyne-HDL-64E型號(hào)的激光雷達(dá),該雷達(dá)具有64個(gè)發(fā)射器與接收器,是當(dāng)前世界上較為先進(jìn)的雷達(dá)設(shè)備。所有激光器都設(shè)置在相同的垂直角度,在不斷旋轉(zhuǎn)下獲得高密度點(diǎn)云數(shù)據(jù),可保證數(shù)據(jù)的實(shí)時(shí)性與密度。激光雷達(dá)的性能參數(shù)如表1所示。
表1 激光雷達(dá)性能參數(shù)表
對(duì)于激光雷達(dá)傳感器的部署如下:
1)有障礙物情況下算法定位性能分析
精度是體現(xiàn)定位算法性能最關(guān)鍵的指標(biāo),在上述實(shí)驗(yàn)環(huán)境下,利用本文方法、聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)和位置代數(shù)解算法進(jìn)行對(duì)比,不同算法的定位效果如圖2所示。
圖2 不同算法定位精度效果圖
針對(duì)圖2顯示的測(cè)試結(jié)果,利用交并比指標(biāo)來衡量不同算法的定位具體精度。該指標(biāo)表示實(shí)際目標(biāo)位置和定位結(jié)果之間的交集合并集之比,可以計(jì)算出二者重合程度,計(jì)算公式表示為:
(16)
式中,area(pred)和area(gt)分別代表實(shí)際區(qū)域和定位區(qū)域。并設(shè)定閾值為0.5,如果計(jì)算結(jié)果高于閾值,則說明目標(biāo)定位效果較好,反之不能準(zhǔn)確識(shí)別目標(biāo)位置,該值越大,定位精度越高。
經(jīng)過計(jì)算,交并比的平均值為:本文方法為0.92,聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)算法為0.64,位置代數(shù)解算法為0.79。根據(jù)計(jì)算結(jié)果和圖2可知,本文的定位精度最高,其它兩種方法雖然能夠滿足定位精度要求,雖然在障礙物影響下,數(shù)據(jù)變得稀疏,會(huì)造成定位誤差,但是優(yōu)化后的稀疏卷積并行算法有效解決了這一問題。
2)點(diǎn)云密度不同時(shí)算法定位性能分析
假設(shè)區(qū)域中不存在障礙物,各方法均不受障礙物的影響,在每次定位過程中改變點(diǎn)云密度。此種情況下不同方法的定位效果如圖3所示。
圖3 點(diǎn)云密度不同時(shí)算法定位誤差測(cè)試圖
由圖3可知,本文方法并沒受到點(diǎn)云密度影響,誤差始終保持平穩(wěn)狀態(tài),而其它兩種方法的誤差曲線走勢(shì)大致相同,當(dāng)點(diǎn)云密度較小時(shí),定位誤差較大。這說明本文方法即使在數(shù)據(jù)量較少時(shí),也能準(zhǔn)確提取目標(biāo)的位置特征,證明了優(yōu)化后的算法特征提取能力更強(qiáng)。
3)算法收斂性能分析
算法收斂性能也體現(xiàn)著定位執(zhí)行速度,通過損失值判斷收斂速度,則三種方法的收斂性能測(cè)試結(jié)果見圖4。
圖4 不同算法收斂性能測(cè)試結(jié)果圖
觀察圖4可以發(fā)現(xiàn),本文方法在4s時(shí)損失值已經(jīng)趨于平穩(wěn)狀態(tài),位置代數(shù)解算法在8s后才逐漸平穩(wěn)。此外,所提方法在收斂時(shí)能夠保證損失值最低,說明優(yōu)化后的卷積神經(jīng)網(wǎng)絡(luò)不僅具備超快的數(shù)據(jù)處理性能,還有較強(qiáng)的學(xué)習(xí)能力。
本文面向三維無源目標(biāo)定位問題,對(duì)深度學(xué)習(xí)算法進(jìn)行優(yōu)化。構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型,確定網(wǎng)絡(luò)結(jié)構(gòu),分析定位過程,設(shè)置損失函數(shù);為改善該網(wǎng)絡(luò)模型必須依賴高密度數(shù)據(jù)問題,提出改進(jìn)稀疏卷積并行算法,使網(wǎng)絡(luò)在稀疏數(shù)據(jù)下也能具備較強(qiáng)的學(xué)習(xí)能力,提高定位速度和精度。實(shí)驗(yàn)結(jié)果也驗(yàn)證了該方法的定位誤差較小,收斂速度較快。但在大數(shù)據(jù)時(shí)代,信息種類豐富較為關(guān)鍵,尤其在定位技術(shù)中,只通過激光傳感器采集數(shù)據(jù)未免單一,今后研究中應(yīng)引入更多的無線傳感器設(shè)備,擴(kuò)大數(shù)據(jù)集規(guī)模,進(jìn)一步提高定位準(zhǔn)確性。