余春祥,王 彪,朱雨男,吳承希,徐 晨
(江蘇科技大學(xué) 電子信息學(xué)院,江蘇 鎮(zhèn)江 212100)
水下波達(dá)方向估計(jì)是水下陣列數(shù)據(jù)處理的主要任務(wù),相比于空間波達(dá)估計(jì),水下聲環(huán)境更為復(fù)雜。近年來(lái),隨著科技的發(fā)展,人類水下活動(dòng)急劇增多導(dǎo)致水下噪聲水平上升,同時(shí)潛艇和水面船艦的制造工藝提升,使得目標(biāo)信號(hào)強(qiáng)度減弱,進(jìn)一步降低水下信噪比。如何在低信噪比條件下,快速高效的進(jìn)行方位估計(jì)是水下陣列信號(hào)處理的核心任務(wù)。
相比于標(biāo)量水下陣列,矢量水下陣列不僅能獲取聲壓?jiǎn)瓮ǖ佬畔?,在空間共點(diǎn)同步拾取聲場(chǎng)的振速信息。因而矢量水聽(tīng)器成為水下聲吶技術(shù)中一個(gè)快速發(fā)展的新方向[1]。在矢量陣列信號(hào)處理領(lǐng)域,傳統(tǒng)波束形成算法面臨著瑞利限的分辨率限制[2]?;谧涌臻g和特征分解算法的提出解決了分辨率限制,形成了包括MUSIC 在內(nèi)多種子空間類DOA 估計(jì)方法[3],具有較好的估計(jì)性能。但是基于子空間和特征分解算法面臨著矢量水聽(tīng)器聲壓與振速通道接收噪聲功率不一致的問(wèn)題[4],隨著信噪比逐漸減小,信號(hào)子空間與噪聲子空間的劃分變得逐漸困難,算法性能急劇下降。同時(shí)信號(hào)空間分解計(jì)算復(fù)雜,不能滿足DOA 估計(jì)快速性要求。
隨著深度學(xué)習(xí)的快速發(fā)展,多種類型的神經(jīng)網(wǎng)絡(luò)被應(yīng)用于水下DOA 估計(jì)[5-8]。相比于傳統(tǒng)DOA 估計(jì)算法,在神經(jīng)網(wǎng)絡(luò)中,不用考慮對(duì)水聲陣列采集數(shù)據(jù)進(jìn)一步處理,而是將DOA 估計(jì)看作數(shù)據(jù)分類問(wèn)題。神經(jīng)網(wǎng)絡(luò)的應(yīng)用克服了對(duì)陣列模型誤差敏感,低信噪比下效果不佳等問(wèn)題,同時(shí)訓(xùn)練生成的網(wǎng)絡(luò)模型,能夠?qū)崿F(xiàn)DOA 的實(shí)時(shí)估計(jì)[9]。卷積神經(jīng)網(wǎng)絡(luò)在DOA 估計(jì)中的應(yīng)用已取得良好效果,但由于池化層丟失部分位置信息,同時(shí)神經(jīng)元輸出采用標(biāo)量形式導(dǎo)致細(xì)節(jié)特征提取不充分,需要大數(shù)據(jù)樣本才能更好提取詳細(xì)特征。
本文采用Hinton 等于2017 年提出的膠囊網(wǎng)絡(luò)模型[10],其核心思想是將神經(jīng)網(wǎng)絡(luò)中輸出形式由標(biāo)量輸出變?yōu)槭噶枯敵觯釛壋鼗瘜咏Y(jié)構(gòu),保留網(wǎng)絡(luò)中的位置特征信息,從而實(shí)現(xiàn)更好的特征提取效果。采用膠囊神經(jīng)網(wǎng)絡(luò)作為訓(xùn)練模型,利用膠囊神經(jīng)網(wǎng)絡(luò)基于矢量特征輸出特性,證明了在不同信噪比噪聲環(huán)境下,膠囊網(wǎng)絡(luò)DOA 估計(jì)性能優(yōu)于傳統(tǒng)子空間類算法和卷積神經(jīng)網(wǎng)絡(luò)模型。
如圖1 所示,在二維平面情況下,建立一個(gè)含有N個(gè)矢量陣元的均勻線陣,相鄰陣元間距為半波長(zhǎng)d=λ/2。在遠(yuǎn)場(chǎng)條件下,以位于坐標(biāo)系原點(diǎn)的陣元1 為參考陣元,假設(shè)有一個(gè)波長(zhǎng)為 λ的窄帶入射信號(hào),入射水平方位角為θ。理想情況下省略時(shí)間因子和波阻抗,則矢量線陣接收到1 個(gè)聲壓通道信息P和2 個(gè)相互正交的振速分量vx和vy,可以表示為:
圖1 矢量水聽(tīng)器陣列模型Fig. 1 Model of vector hydrophone array
式中,x(t)為該平面波波形。由單個(gè)矢量陣元的單位幅度響應(yīng)可定義:
矢量線陣的空間相位延遲向量表達(dá)為:
則矢量水聽(tīng)器陣列導(dǎo)向矢量為:
式中, ?表示為Kronecker 積。在J次快拍下,這個(gè)遠(yuǎn)場(chǎng)窄帶信號(hào)入射到均勻矢量線陣的輸出數(shù)據(jù)為:
式中:X為 3N×J維數(shù)據(jù)矩陣,表示矢量水聽(tīng)器對(duì)該信號(hào)J次快拍下的輸出向量;A=a(θ) 為 3N×1維陣列流型;S=[x1(t)...xJ(t)] 是1 ×J維信號(hào)矩陣;N=[n1(t)...nJ(t)]是 3N×J維高斯噪聲矩陣。矢量陣列輸出數(shù)據(jù)的協(xié)方差矩陣可以表示為:
式中, ( ·)H和 E [·]表示為共軛轉(zhuǎn)置和數(shù)學(xué)期望。
在傳統(tǒng)子空間分類算法中可以將Rx看作是由信號(hào)子空間US和噪聲子空間UN構(gòu)成:
式中:US代表信號(hào)子空間;UN代表噪聲子空間,ΛS; ΛN代表著對(duì)應(yīng)的特征值對(duì)角矩陣。在理想的條件下,信號(hào)子空間與噪聲子空間是相互正交的,所以信號(hào)的陣列流型與噪聲子空間也是相互正交,即
Schmidt 利用這個(gè)特性構(gòu)造了經(jīng)典MUSIC 算法空間譜:
仿真實(shí)驗(yàn)中由于聲波包含幅值與相位角兩部分信息,所得到的Rx矩陣存在復(fù)數(shù)數(shù)值。由于神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中不能處理復(fù)值數(shù)據(jù),不能將Rx直接作為數(shù)據(jù)輸入。需要對(duì)Rx進(jìn) 行相應(yīng)數(shù)學(xué)處理。已知Rx=Re{Rx}+Im{Rx}i, 常見(jiàn)方式為將Rx分為實(shí)虛部?jī)刹糠郑?/p>
式中: Re{·} 表示復(fù)數(shù)實(shí)部, I m{·}表示復(fù)數(shù)虛部。將Rx的實(shí)虛部Q,P看作2 個(gè)獨(dú)立實(shí)值矩陣作為數(shù)據(jù)輸入。實(shí)虛部分離法可視作將協(xié)方差矩陣分為2 個(gè)維度數(shù)據(jù)并行輸入神經(jīng)網(wǎng)絡(luò),已在卷積神經(jīng)網(wǎng)絡(luò)中取得了良好效果。但實(shí)虛部分離法削弱了相位與幅值間關(guān)聯(lián),考慮到聲波信息中幅值相位相互關(guān)聯(lián),采用幅值相位角法進(jìn)行數(shù)據(jù)變換輸入。已知對(duì)任意復(fù)數(shù)有:
通過(guò)將數(shù)據(jù)變換為幅值與相位角輸入,最大限度保留幅值與相位角的相關(guān)性,使得網(wǎng)絡(luò)更好地提取相關(guān)位置信息特征,進(jìn)一步提升模型性能。
2017 年,Hinton 等提出了膠囊網(wǎng)絡(luò)概念。核心思想為采用動(dòng)態(tài)路由方式,將神經(jīng)元標(biāo)量輸入輸出變?yōu)橄蛄枯斎胼敵?。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),向量輸出的膠囊網(wǎng)絡(luò),具有更豐富的特征表達(dá)能力。
在膠囊網(wǎng)絡(luò)中,由不同神經(jīng)元組成的膠囊包含多個(gè)特征信息,從而擁有包含空間方向位置等多特征提取能力。膠囊網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。
圖2 膠囊網(wǎng)絡(luò)結(jié)構(gòu)Fig. 2 Capsule network structure
其主要結(jié)構(gòu)包括,卷積特征提取層,主膠囊層,數(shù)字膠囊層。卷積層主要功能在于通過(guò)卷積運(yùn)算提取輸入數(shù)據(jù)中的特征,輸出特征圖。主膠囊層是由卷積層產(chǎn)生的特征圖經(jīng)過(guò)卷積操作后,將生成的標(biāo)量轉(zhuǎn)化為所需要的向量膠囊結(jié)構(gòu)。數(shù)字膠囊層與卷積神經(jīng)網(wǎng)絡(luò)中全連接層相似,但不再是由神經(jīng)元求和后以標(biāo)量形式輸出,而是改造為膠囊結(jié)構(gòu)進(jìn)行分類輸出。通過(guò)輸出的向量模大小進(jìn)行分類,以模值最大的向量作為輸出類別。
膠囊網(wǎng)絡(luò)動(dòng)態(tài)路由算法與卷積神經(jīng)網(wǎng)絡(luò)激活方式對(duì)比如圖3 所示。其算法過(guò)程如下:
圖3 卷積神經(jīng)網(wǎng)絡(luò)激活方式與膠囊網(wǎng)絡(luò)激活方式Fig. 3 Convolution neural network activation mode and capsule network activation mode
1)初始化,l層膠囊i到l+1層 膠囊j的特征傳遞系數(shù)為bi j←0。
2)在膠囊網(wǎng)絡(luò)中引入新的膠囊權(quán)重耦合系數(shù)cij,由動(dòng)態(tài)softmax 方式獲取,具體公式為:
3)上層膠囊特征ui傳遞至下層膠囊,得到下層膠囊特征sj,公式為:
4)膠囊的輸出向量的長(zhǎng)度來(lái)表示某些特征的概率大小。因此,使用一個(gè)非線性的“Squashing”函數(shù)保證上層膠囊進(jìn)行特征壓縮得到下層特征,公式為:
實(shí)踐發(fā)現(xiàn)權(quán)值1 改為0.5,可以將模長(zhǎng)接近0 的向量放大輸出,加強(qiáng)了特征提取能力。
5)動(dòng)態(tài)迭代更新l層膠囊i到l+1層膠囊j的特征傳遞系數(shù),其公式為:
膠囊網(wǎng)絡(luò)中損失函數(shù)采用類似支持向量機(jī)算法中的邊緣損失函數(shù),其具體公式為:
式中:k為分類數(shù);Tk為分類的指示函數(shù) (存在為 1,不存在為 0);m+=0.9為上界,代表著若數(shù)據(jù)分類后輸出屬于第k類中,則其對(duì)應(yīng)數(shù)字膠囊輸出向量的模長(zhǎng)至少>0.9,反之則若數(shù)據(jù)分類輸出不屬于第k類中,則膠囊輸出的是一個(gè)很短的向量,其模長(zhǎng)<0.1; λ 為比例系數(shù),調(diào)整兩者比重,本文取 λ=0.5??倱p失是所有數(shù)字膠囊損失之和。
為驗(yàn)證本文所提膠囊網(wǎng)絡(luò)算法的性能,進(jìn)行數(shù)值仿真??紤]到增強(qiáng)算法結(jié)果對(duì)比以及水下陣列布放難度,采用陣元數(shù)較少的均勻線陣。該線陣由3 個(gè)矢量水聽(tīng)器組成,陣元間距為半波長(zhǎng),信號(hào)源搜索范圍為[-90°,+90°] , 每隔1°取一個(gè)樣本,快拍數(shù)為500,對(duì)每個(gè)角度進(jìn)行1 000 次Monte-Carlo 仿真實(shí)驗(yàn)。以信噪比為0 dB 時(shí)為例,仿真得到181 000 個(gè)大小為9×9 的二維協(xié)方差矩陣。將數(shù)據(jù)進(jìn)行幅值相位處理,以對(duì)應(yīng)入射角度為標(biāo)簽,得到訓(xùn)練所需要的訓(xùn)練集數(shù)據(jù) (|Rx|,θ)。
實(shí)驗(yàn)中,采用卷積神經(jīng)網(wǎng)絡(luò)與膠囊神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真對(duì)比。為了保證實(shí)驗(yàn)結(jié)果準(zhǔn)確性,2 個(gè)網(wǎng)絡(luò)中卷積核相同,步長(zhǎng)為1,模型均采用Relu 激活函數(shù),優(yōu)化方法為Adam,學(xué)習(xí)率為率為0.001,訓(xùn)練過(guò)程中單次數(shù)據(jù)讀入量為32,最大迭代次數(shù)設(shè)置為50。卷積神經(jīng)網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò)具體結(jié)構(gòu)如圖4 所示。
圖4 卷積神經(jīng)網(wǎng)絡(luò)模型與膠囊網(wǎng)絡(luò)模型Fig. 4 Convolution neural network model and capsule network model
相鄰陣元間距為半波長(zhǎng)d=λ/2,假設(shè)有一個(gè)角度為 θ ,波長(zhǎng)為 λ的窄帶入射信號(hào)下得到信噪比為-5 dB,0 dB,5 dB,10 dB,15 dB 的5 組樣本數(shù)據(jù)。將樣本按照9∶1 的比例隨機(jī)劃分為訓(xùn)練集核驗(yàn)證集。
圖5為MUSIC,CNN,CapsNet 等3 種算法在不同信噪比條件下的準(zhǔn)確率??梢钥闯觯捎诖嬖谠肼晽l件影響,3 種方法不同程度的受到影響。其中,傳統(tǒng)子空間分解所受影響最大,MUSIC 算法的DOA 估計(jì)效果較差。卷積神經(jīng)網(wǎng)絡(luò)具有一定抗噪效果,較MUSIC 算法準(zhǔn)確率有一定提升。膠囊網(wǎng)絡(luò)在低信噪比條件下,DOA 估計(jì)效果優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)。證明膠囊網(wǎng)絡(luò)通過(guò)動(dòng)態(tài)路由方式,有效地進(jìn)行了多特征提取,加強(qiáng)了的網(wǎng)絡(luò)分類能力。
圖5 不同信噪比下準(zhǔn)確率Fig. 5 Accuracy rate of different SNR
圖6為幾種算法的估計(jì)角度均方根誤差統(tǒng)計(jì),其公式為:
圖6 不同信噪比下均方根誤差Fig. 6 Accuracy rate of different RMSE
式中:y為真實(shí)波達(dá)角度;y?為估計(jì)的波達(dá)角度;m代表需要估計(jì)的數(shù)據(jù)個(gè)數(shù)。均方根誤差統(tǒng)計(jì)可以較好的反應(yīng)出算法的精度和穩(wěn)定性??梢钥闯?,膠囊網(wǎng)絡(luò)算法分辨率總體優(yōu)于卷積神經(jīng)網(wǎng)絡(luò)和MUSIC 算法,且隨著信噪比降低,算法性能優(yōu)勢(shì)更加明顯。高信噪比情況下,3 種算法均能提供較好的分辨能力。總體來(lái)說(shuō),膠囊網(wǎng)絡(luò)在廣泛的信噪比范圍下具有比其他算法更加穩(wěn)定算法精度與分辨能力。
表1 為快拍數(shù)為500 時(shí),各算法單次估計(jì)角度的消耗時(shí)長(zhǎng)。運(yùn)行時(shí)長(zhǎng)為測(cè)試1 000 所取平均時(shí)間。由表1 可知單次估計(jì)時(shí),使用網(wǎng)絡(luò)模型估計(jì)時(shí)長(zhǎng)低于子空間類算法20 倍左右。卷積神經(jīng)網(wǎng)絡(luò)與膠囊網(wǎng)絡(luò)消耗時(shí)長(zhǎng)相差較小。綜上,膠囊網(wǎng)絡(luò)在保證算法估計(jì)性能同時(shí)在運(yùn)行時(shí)間上有著明顯優(yōu)勢(shì)。
表1 不同估計(jì)方法的單次運(yùn)行時(shí)間Tab. 1 Single run time of different estimation methods
本文提出了一種基于膠囊網(wǎng)絡(luò)的水下波達(dá)估計(jì)算法。結(jié)合矢量水下均勻陣列仿真實(shí)驗(yàn),對(duì)比不同信噪比環(huán)境下膠囊網(wǎng)絡(luò),多重空間分類法與卷積神經(jīng)網(wǎng)絡(luò)3 種方法的方位估計(jì)準(zhǔn)確率與穩(wěn)定性能。實(shí)驗(yàn)結(jié)果表明,低信噪比環(huán)境下,各算法預(yù)測(cè)均受嚴(yán)重影響。相比較其他算法,膠囊網(wǎng)絡(luò)所擁有向量動(dòng)態(tài)路由方式,降低了噪聲影響同時(shí)加強(qiáng)了特征能力提取能力,使得在低信噪比環(huán)境下,方位估計(jì)模型準(zhǔn)確率與穩(wěn)定性能均有較大提升,同時(shí)滿足DOA 估計(jì)的快速性要求??紤]到本文使用信號(hào)均為單個(gè)信源,如何利用膠囊網(wǎng)絡(luò)進(jìn)行多信源方位估計(jì)將是下一步工作中心。