樓奇哲 劉 樂 姚 元
(南京電子技術(shù)研究所,江蘇南京 210039)
海雜波環(huán)境下的多目標(biāo)檢測是艦載雷達(dá)的核心功能之一,在現(xiàn)代戰(zhàn)爭中具有十分重要的意義。目前常用的海面多目標(biāo)檢測方法主要有恒虛警檢測和背景擬合等技術(shù)。單元平均恒虛警檢測技術(shù)[1-3]根據(jù)海雜波先驗(yàn)分布信息進(jìn)行參數(shù)估計(jì)從而計(jì)算檢測門限,存在因分布模型與實(shí)際雜波的非高斯特性不符而導(dǎo)致檢測效果下降的問題,同時(shí)容易因臨近目標(biāo)進(jìn)入?yún)⒖紗卧斐蓹z測困難。背景擬合技術(shù)[4]將數(shù)據(jù)映射到擬合空間,根據(jù)擬合空間的海雜波幅度產(chǎn)生門限曲線并根據(jù)海況進(jìn)行適應(yīng)性調(diào)整,能夠消除臨近目標(biāo)的影響,但門限的局部值與復(fù)雜環(huán)境較難符合,且在多變的海況環(huán)境下適應(yīng)能力有限。因此,迫切需要一種更加有效的海面多目標(biāo)檢測方法。
近年來,深度學(xué)習(xí)理論在模式識別領(lǐng)域掀起了一股研究熱潮,相關(guān)的理論和研究成果不斷涌現(xiàn)。卷積神經(jīng)網(wǎng)絡(luò)[5](CNN,Convolutional Neural Network)是深度學(xué)習(xí)的常用網(wǎng)絡(luò)之一,最早由加拿大多倫多大學(xué)LeCun教授提出,較好地解決了網(wǎng)絡(luò)訓(xùn)練過程中的梯度不穩(wěn)定問題,并且具備由淺入深的層次性特征自適應(yīng)學(xué)習(xí)能力,在模式識別領(lǐng)域取得了較多成功的應(yīng)用[6]。卷積神經(jīng)網(wǎng)絡(luò)在雷達(dá)領(lǐng)域的應(yīng)用主要集中在雷達(dá)圖像識別[7- 8],即用于二維圖像分類,目前針對雷達(dá)一維數(shù)據(jù)的多目標(biāo)檢測方面未見公開報(bào)道。
基于卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn),本文嘗試將其應(yīng)用于海雜波環(huán)境下的多目標(biāo)檢測。首先采集某型對海相控陣?yán)走_(dá)的實(shí)測數(shù)據(jù)作為網(wǎng)絡(luò)訓(xùn)練輸入。通過優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),使其適用于多目標(biāo)檢測問題,提高目標(biāo)檢測概率。同時(shí)提出定向懲罰方法,加速網(wǎng)絡(luò)訓(xùn)練。最后采用ROC曲線和信雜比改善因子考察網(wǎng)絡(luò)的綜合性能。實(shí)驗(yàn)結(jié)果表明,本文的方法具有良好的海面多目標(biāo)檢測能力,證明了其有效性。
卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、池化層、全連接層和輸出層組成,可以實(shí)現(xiàn)從輸入到輸出的任意非線性映射[9]。網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.1 Basic structure of convolutional neural network
輸入層的作用在于接收原始輸入圖像,其大小與輸入圖像的維度一致。
卷積層通過卷積操作提取特征,若用al表示第l層特征圖,wl表示該層卷積核,bl表示該層偏置,σ(x)表示其非線性激活函數(shù),則前一層圖像al-1通過該層后的輸出即為第l層特征圖,可表示為
al=σ(al-1*wl+bl)
(1)
(2)
池化層通常設(shè)置在卷積層之后,用于對特征圖的局部區(qū)域進(jìn)行下采樣操作,常用的方法有均值池化和最大值池化,分別取池化范圍內(nèi)數(shù)據(jù)的均值和最大值。池化范圍為2×2時(shí),池化后的圖像變?yōu)樵瓐D的1/4。
全連接層位于特征提取之后,接收經(jīng)過多個(gè)卷積層和池化層交替?zhèn)鬟f后的特征圖,有針對性地進(jìn)行高層特征的映射。用wl表示全連接層權(quán)值,則該層的輸出為
al=σ(wl·al-1+bl)
(3)
輸出層也是全連接層的一種,其形式面向具體任務(wù),該層常見的激活函數(shù)包括sigmoid函數(shù)、softmax函數(shù)等。
卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目標(biāo)是最小化代價(jià)函數(shù)。輸入圖像經(jīng)過各層的前向傳播后根據(jù)代價(jià)函數(shù)計(jì)算與期望值之間的差異。常見的代價(jià)函數(shù)有均方差代價(jià)函數(shù)、交叉熵代價(jià)函數(shù)等[10]。均方差代價(jià)函數(shù)按下式進(jìn)行計(jì)算。
(4)
其中,y表示期望輸出值,L表示總層數(shù),aL為最后一層即輸出層的輸出值,n表示訓(xùn)練樣本總數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)一般采用隨機(jī)梯度下降[11]算法進(jìn)行訓(xùn)練。該方法能夠進(jìn)行誤差的反向傳播計(jì)算,通過下一層誤差反向計(jì)算得到上層誤差,從而計(jì)算各層權(quán)值和偏置的梯度。
最后,根據(jù)權(quán)值和偏置的梯度,按梯度下降的方向進(jìn)行權(quán)值和偏置更新,更新公式為
(5)
(6)
其中,η表示學(xué)習(xí)速率,用于控制梯度下降的步長。m為隨機(jī)梯度下降算法的小批量數(shù)據(jù)樣本總數(shù)。
相控陣?yán)走_(dá)每隔一定角度對海域進(jìn)行搜索,每一角度稱為一個(gè)波位,形成一幀一維回波數(shù)據(jù),包含海雜波及若干目標(biāo),從中檢測各目標(biāo)位置。雷達(dá)一維數(shù)據(jù)與圖像分類中的二維數(shù)據(jù)有很大區(qū)別,主要特點(diǎn)是一維數(shù)據(jù)帶寬更小,分辨目標(biāo)的能力較低,包含更少的目標(biāo)細(xì)節(jié)。因此,本文針對一維數(shù)據(jù)的實(shí)際特點(diǎn),在常用的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,采用數(shù)據(jù)驅(qū)動(dòng)的方法研究適合于多目標(biāo)檢測的模型,提升目標(biāo)的發(fā)現(xiàn)概率,增強(qiáng)模型的泛化能力。
多目標(biāo)檢測網(wǎng)絡(luò)的輸出與圖像分類網(wǎng)絡(luò)有較大區(qū)別。圖像分類網(wǎng)絡(luò)輸出圖像類別,常用softmax輸出層,將不同類別的輸出值對應(yīng)為各類別的概率分布[10]。對于一維回波數(shù)據(jù),網(wǎng)絡(luò)輸出需要包含每個(gè)數(shù)據(jù)點(diǎn)有無目標(biāo)的信息。由于每個(gè)點(diǎn)是否有目標(biāo)的獨(dú)立性,無法使用概率分布型的輸出層。本文采用sigmoid輸出層,網(wǎng)絡(luò)輸出值域?yàn)閇0,1]。對于目標(biāo)點(diǎn),提升目標(biāo)幅度,使其輸出接近網(wǎng)絡(luò)輸出的最大值1。對于非目標(biāo)點(diǎn)則抑制其幅度,使其輸出接近網(wǎng)絡(luò)輸出的最小值0。這種輸出類型的網(wǎng)絡(luò)本質(zhì)上依托于神經(jīng)網(wǎng)絡(luò)對從輸入到輸出的任意非線性映射的強(qiáng)大擬合能力[9]。
網(wǎng)絡(luò)的代價(jià)計(jì)算采用均方差代價(jià)函數(shù),如公式(4)所示,每個(gè)點(diǎn)對總代價(jià)的貢獻(xiàn)比例相同。由于目標(biāo)在整幀數(shù)據(jù)中的比例往往較小,導(dǎo)致達(dá)到網(wǎng)絡(luò)收斂的速度較慢;而當(dāng)虛警產(chǎn)生時(shí),同樣不能快速學(xué)習(xí)虛警導(dǎo)致的代價(jià)差異。針對該缺點(diǎn),本文提出定向懲罰的方法,在兩個(gè)方面影響代價(jià)計(jì)算:一是目標(biāo)點(diǎn)的輸出值偏離理想輸出時(shí),網(wǎng)絡(luò)在該點(diǎn)產(chǎn)生一個(gè)較大的誤差;二是產(chǎn)生虛警時(shí),網(wǎng)絡(luò)在該點(diǎn)產(chǎn)生較大的誤差。定向懲罰將輸出誤差分為三部分,包含目標(biāo)的誤差點(diǎn)集Ed,包含虛警的誤差點(diǎn)集Efa,以及剩余的誤差點(diǎn)集Eb,用定向懲罰因子α作為調(diào)節(jié)參數(shù),總代價(jià)的計(jì)算方法如下:
C=α·Ed+α·Efa+(1-α)·Eb
(7)
定向懲罰使目標(biāo)點(diǎn)的誤差以及虛警點(diǎn)的誤差對總代價(jià)的貢獻(xiàn)比例增大,能夠加快訓(xùn)練速度,使網(wǎng)絡(luò)更易于達(dá)到最優(yōu)。
網(wǎng)絡(luò)的池化層具有降低數(shù)據(jù)量和特征選擇的作用,然而在一維回波檢測中,以池化區(qū)域?yàn)?×1的最大值池化為例,池化之后數(shù)據(jù)長度變?yōu)樵瓉淼囊话耄覠o論目標(biāo)在池化區(qū)域兩個(gè)點(diǎn)中的哪一個(gè),均輸出相同結(jié)果,因此池化過程模糊了目標(biāo)位置信息,使網(wǎng)絡(luò)無法實(shí)現(xiàn)準(zhǔn)確的目標(biāo)位置辨別,故上述模型在卷積層之后取消池化層,以消除池化帶來的不利影響,在實(shí)際訓(xùn)練過程中得到了證實(shí)。
網(wǎng)絡(luò)的卷積層數(shù)量常和輸入數(shù)據(jù)的層次結(jié)構(gòu)相關(guān),而每層的卷積核數(shù)量則和數(shù)據(jù)的待檢特征數(shù)目相關(guān)。對于一維回波數(shù)據(jù),其單個(gè)目標(biāo)的細(xì)節(jié)較少,而整幀的層次結(jié)構(gòu)主要體現(xiàn)在待檢目標(biāo)與鄰近目標(biāo)及海雜波的關(guān)系。本文通過輸入實(shí)測數(shù)據(jù),并不斷迭代改變網(wǎng)絡(luò)結(jié)構(gòu),考察檢測效果,從而搜尋網(wǎng)絡(luò)的最佳結(jié)構(gòu)狀態(tài)。具體實(shí)施中,采用窮舉式的循環(huán)搜索方法,設(shè)置具有不同網(wǎng)絡(luò)層數(shù)、卷積核數(shù)量、卷積核長度的網(wǎng)絡(luò)結(jié)構(gòu),針對每一種結(jié)構(gòu)進(jìn)行超參數(shù)優(yōu)化,并以測試集上發(fā)現(xiàn)概率最大的網(wǎng)絡(luò)作為最優(yōu)結(jié)構(gòu)。
經(jīng)過實(shí)驗(yàn)探索,最終確定的多目標(biāo)檢測網(wǎng)絡(luò)具有四層網(wǎng)絡(luò)結(jié)構(gòu),分別是輸入層、卷積層1、卷積層2、全連接輸出層,如圖2所示。其中輸入層輸入值為幀長500的一維數(shù)據(jù);卷積層1卷積核大小為11×1,數(shù)量為5個(gè),特征圖大小為490×1,共5幅;卷積層2卷積核大小為15×1,接收上層的5幅特征圖,卷積核數(shù)量為5×5個(gè),特征圖大小為476×1,共5幅;輸出層為包含476個(gè)神經(jīng)元的全連接層。網(wǎng)絡(luò)從輸入到輸出的幀長減小24個(gè)點(diǎn),為兩次卷積后首尾的舍去點(diǎn)數(shù)。
圖2 多目標(biāo)檢測網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of multi-targets detection network
D=10·log10(I2+Q2)
(8)
Dnormalize=(D-Dmin)/(Dmax-Dmin)
(9)
在不同時(shí)段搜索該海域,采集有船只目標(biāo)的數(shù)據(jù),得到100幀基礎(chǔ)數(shù)據(jù)集。為了實(shí)現(xiàn)海雜波下的多目標(biāo)檢測,本文采用數(shù)據(jù)驅(qū)動(dòng)的方法提升網(wǎng)絡(luò)性能,使訓(xùn)練樣本具備較大的容量,并且盡可能多地涵蓋不同目標(biāo)及目標(biāo)相鄰的情景。因此按以下步驟對基礎(chǔ)數(shù)據(jù)集進(jìn)行擴(kuò)展[10]:
(1)標(biāo)記并提取基礎(chǔ)數(shù)據(jù)集中的目標(biāo)數(shù)據(jù),建立目標(biāo)庫;
(2)將不含目標(biāo)或去除目標(biāo)的數(shù)據(jù)作為海雜波背景,建立背景庫;
(3)隨機(jī)選取多個(gè)目標(biāo)和一個(gè)背景,并將目標(biāo)置于隨機(jī)位置以生成新的幀,其中一半的幀限制目標(biāo)間距,使目標(biāo)隨機(jī)間隔1至10個(gè)距離單元。
同時(shí),擴(kuò)展過程中需要使測試集與訓(xùn)練集、驗(yàn)證集完全分離,確保網(wǎng)絡(luò)泛化能力的測試不受訓(xùn)練集影響。因此,基礎(chǔ)數(shù)據(jù)集的前90幀用于產(chǎn)生訓(xùn)練集和驗(yàn)證集,擴(kuò)展后共計(jì)3000幀。后10幀用于產(chǎn)生測試集,擴(kuò)展后共計(jì)100幀,如圖3所示。
圖3 測試集數(shù)據(jù)Fig.3 Test data set
網(wǎng)絡(luò)訓(xùn)練時(shí),取3000幀數(shù)據(jù)中的100幀作為驗(yàn)證集,余下的2900幀作為訓(xùn)練集。采用附加動(dòng)量[12]的隨機(jī)梯度下降算法用于訓(xùn)練,并用正則化[13]技術(shù)減輕過擬合影響。每次輸入20幀作為一個(gè)小批量數(shù)據(jù),進(jìn)行權(quán)值和偏置的一次更新。使用完整個(gè)訓(xùn)練集為一個(gè)迭代周期,并計(jì)算驗(yàn)證集上的發(fā)現(xiàn)概率。當(dāng)代價(jià)函數(shù)值在一定迭代周期內(nèi)不再下降或驗(yàn)證集上的發(fā)現(xiàn)概率不再上升時(shí),網(wǎng)絡(luò)達(dá)到收斂狀態(tài),結(jié)束訓(xùn)練。訓(xùn)練結(jié)束后計(jì)算測試集上的發(fā)現(xiàn)概率和虛警概率,并考察網(wǎng)絡(luò)的綜合性能。
網(wǎng)絡(luò)的超參數(shù)包括學(xué)習(xí)速率、附加動(dòng)量系數(shù)、正則化系數(shù)、定向懲罰因子、輸出層檢測門限等。采用超參數(shù)搜索方法設(shè)置最優(yōu)值,本文使用隨機(jī)搜索[10]算法,在超參數(shù)具有不同耦合情況時(shí)均能達(dá)到較好效果。最終設(shè)置學(xué)習(xí)速率為0.615,附加動(dòng)量系數(shù)為0.337,正則化系數(shù)為0.003,定向懲罰因子為0.7,輸出層檢測門限為0.5。
1.4 統(tǒng)計(jì)學(xué)分析 采用SPSS 20.0軟件進(jìn)行數(shù)據(jù)檢測分析,采用χ2檢驗(yàn)、t檢驗(yàn),用[例(%)]表示計(jì)數(shù)資料,用均數(shù)±標(biāo)準(zhǔn)差表示計(jì)量資料。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
多目標(biāo)檢測網(wǎng)絡(luò)的一次訓(xùn)練按以下步驟進(jìn)行:
(1)初始化權(quán)值和偏置。采用基于高斯分布的初始化方法[14],該方法按本層輸入輸出維度對參數(shù)范圍進(jìn)行限制,是一種有效的初始化方法。
(2)輸入訓(xùn)練樣本集合。由于網(wǎng)絡(luò)輸入定義域?yàn)閇0,1],需要首先對訓(xùn)練集、驗(yàn)證集和測試集進(jìn)行歸一化,采用每幀單獨(dú)歸一化的方式進(jìn)行。
(3)網(wǎng)絡(luò)前向傳播計(jì)算。按公式(1)至(3)進(jìn)行輸入數(shù)據(jù)的前向傳播計(jì)算,得到網(wǎng)絡(luò)輸出。
(4)反向誤差和梯度計(jì)算。采用隨機(jī)梯度下降算法進(jìn)行誤差的反向傳播計(jì)算,得出各層權(quán)值和偏置的梯度。
(5)權(quán)值和偏置更新。按公式(5)至(6)進(jìn)行各層的權(quán)值和偏置更新。
多目標(biāo)檢測網(wǎng)絡(luò)經(jīng)過100次迭代訓(xùn)練過程,達(dá)到收斂狀態(tài)。訓(xùn)練過程中的代價(jià)函數(shù)變化如圖4所示。當(dāng)訓(xùn)練完成時(shí),網(wǎng)絡(luò)在訓(xùn)練集上的發(fā)現(xiàn)概率達(dá)到98.5%,在驗(yàn)證集上的發(fā)現(xiàn)概率為94.6%。采用測試集進(jìn)行測試,發(fā)現(xiàn)概率達(dá)到91.7%,虛警概率為7.8e-3。
圖4 代價(jià)函數(shù)變化曲線Fig.4 Curve of the cost function
為了評價(jià)神經(jīng)網(wǎng)絡(luò)的檢測性能,考察系統(tǒng)在一定性雜比下的工作特性,即ROC(Receiver Operating Characteristic)曲線。ROC曲線是發(fā)現(xiàn)概率和虛警概率的關(guān)系曲線,當(dāng)改變檢測門限時(shí)可得不同的Pd和Pfa,從而繪制出該曲線。對于本網(wǎng)絡(luò)而言,改變輸出層的檢測門限,繪制出ROC曲線如圖5所示。
圖5 ROC曲線Fig.5 Receiver operating characteristic curve
同時(shí),引入信雜比改善因子,并提出背景抑制因子的概念,從而進(jìn)行神經(jīng)網(wǎng)絡(luò)檢測性能的進(jìn)一步分析。信雜比改善因子ISCR定義如下:
(10)
提出背景抑制因子IC,其定義如下:
(11)
由于神經(jīng)網(wǎng)絡(luò)的輸出值域?yàn)?至1,首先采用公式(9)的逆運(yùn)算對神經(jīng)網(wǎng)絡(luò)的輸出值進(jìn)行逆歸一化,之后對每一幀測試集數(shù)據(jù)進(jìn)行信雜比改善因子和背景抑制因子的計(jì)算。測試集數(shù)據(jù)的信雜比如圖6所示,均值為24.0 dB,分布于10至42 dB范圍內(nèi)。信雜比改善因子如圖7所示,均值為18.1 dB,其中95%的數(shù)據(jù)在一定程度上改善了信雜比。背景抑制因子如圖8所示,均值為25.0 dB,所有數(shù)據(jù)在一定程度上抑制了海雜波。可見多目標(biāo)檢測網(wǎng)絡(luò)能夠優(yōu)化檢測環(huán)境,具備良好的目標(biāo)檢測能力。
對信雜比改善因子最高的第99組進(jìn)行分析,如圖9、10所示,平均信雜比改善為29.0 dB,平均背景抑制為25.6 dB。虛線為原始輸入數(shù)據(jù),實(shí)線為輸出數(shù)據(jù),點(diǎn)劃線為輸出數(shù)據(jù)檢測門限,下同。距離單元185~186、251~255、379的不同長度的目標(biāo)均過檢測門限??梢娚窠?jīng)網(wǎng)絡(luò)在一定程度上提升了目標(biāo)強(qiáng)度,并有效抑制海雜波,能夠較好地改善信雜比,以提高檢測性能。
圖6 測試集信雜比Fig.6 SCR of the test data
圖7 測試集信雜比改善因子Fig.7 SCR improvement factor of the test data
圖8 測試集上的背景抑制因子Fig.8 Background suppression ratio in the test data
圖9 第99組數(shù)據(jù)Fig.9 The 99th data set
圖10 第99組局部放大圖Fig.10 Partial enlarged images of the 99th data set
對包含距離較近目標(biāo)的第7組數(shù)據(jù)進(jìn)行分析,如圖11、12所示,平均信雜比改善為19.3 dB。目標(biāo)1位于距離單元381~385,目標(biāo)2位于392~393,目標(biāo)3在400~405,間隔均為6個(gè)距離單元,從網(wǎng)絡(luò)輸出可知上述目標(biāo)均過檢測門限。而采用單元平均CFAR時(shí),若單側(cè)保護(hù)單元少于目標(biāo)覆蓋范圍,此處為25個(gè),則目標(biāo)點(diǎn)落入?yún)⒖紗卧獙⒁饳z測門限抬高,從而造成檢測困難??梢姸嗄繕?biāo)檢測網(wǎng)絡(luò)能夠降低臨近目標(biāo)對檢測的不利影響,是一種更加通用的檢測技術(shù)。
圖11 第7組數(shù)據(jù)Fig.11 The 7th data set
圖12 第7組局部放大圖Fig.12 Partial enlarged images of the 7th data set
對改善因子最低的第65組進(jìn)行分析,如圖13、14所示,平均信雜比改善為-3.97 dB。距離單元133的目標(biāo)1未過檢測門限,而134產(chǎn)生虛警,等效為檢測結(jié)果錯(cuò)位1個(gè)單元。355處的目標(biāo)2提升幅度不明顯,產(chǎn)生漏檢,而418處的雜波產(chǎn)生虛警。由于目標(biāo)點(diǎn)數(shù)較少,漏檢使目標(biāo)信號平均幅度大幅降低,使改善因子成為負(fù)值??梢娫谔囟ǖ臏y試數(shù)據(jù)下,雖然網(wǎng)絡(luò)有效抑制了海雜波,但對個(gè)別目標(biāo)的強(qiáng)度提升效果不足,或?qū)⒎绕蟮碾s波識別為目標(biāo),從而產(chǎn)生漏檢或虛警。
圖13 第65組數(shù)據(jù)Fig.13 The 65th data set
圖14 第65組局部放大圖Fig.14 Partial enlarged images of the 65th data set
針對海雜波環(huán)境下的多目標(biāo)檢測問題,本文提出了一種采用卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法。通過研究適用于多目標(biāo)檢測的網(wǎng)絡(luò)結(jié)構(gòu),優(yōu)化代價(jià)函數(shù),基于實(shí)測數(shù)據(jù)對該方法進(jìn)行了驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,該方法達(dá)到了較高的發(fā)現(xiàn)概率,具有良好的泛化能力,能夠有效改善海面目標(biāo)信雜比,提升多目標(biāo)檢測性能。針對虛警和漏檢現(xiàn)象,從信號處理全過程而言,結(jié)合背景估計(jì)、MTI、時(shí)間去相關(guān)等技術(shù)能夠消除輸入數(shù)據(jù)中部分海雜波的影響;從網(wǎng)絡(luò)檢測而言,使用更完善的訓(xùn)練數(shù)據(jù)庫或采用集成檢測方法能夠提升網(wǎng)絡(luò)性能。綜上所述,卷積神經(jīng)網(wǎng)絡(luò)在海面多目標(biāo)檢測領(lǐng)域具有一定的應(yīng)用價(jià)值,值得進(jìn)一步深入研究。