姚琦海 汪 勇 黎佳藝 楊益新
(西北工業(yè)大學(xué)航海學(xué)院 西安 710072)
水下目標(biāo)定位利用基陣接收到的聲信號(hào)來探測目標(biāo)聲源的位置,一直以來是水聲信號(hào)處理領(lǐng)域的熱點(diǎn),本文研究其中的一個(gè)方面——目標(biāo)距離估計(jì)[1?3]。在軍事和民用領(lǐng)域中,隱蔽性較好的被動(dòng)定位技術(shù)有著廣泛的應(yīng)用。傳統(tǒng)的被動(dòng)定位方法大多為基于匹配場處理(Matched field processing,MFP)的方法。1976年,Bucker[4]推導(dǎo)出了線性匹配場處理器,使用實(shí)際環(huán)境模型,引入了距離深度的模糊函數(shù)。1988年,Baggeroer[5]建立水平分層的海洋環(huán)境波導(dǎo)模型,將MFP 技術(shù)應(yīng)用在低信噪比場景中,研究表明增加帶寬可以提升匹配場算法的定位性能。1996年,Michalopoulou等[6]提出利用非相關(guān)方法對(duì)各個(gè)頻點(diǎn)的窄帶模糊度函數(shù)疊加,驗(yàn)證了寬帶匹配場定位算法中非相關(guān)方法的可行性。2003年,Soares 等[7]利用各個(gè)頻點(diǎn)之間的相關(guān)信息,建立了歸一化相關(guān)處理器、匹配相位相關(guān)處理。2006年,楊坤德等[8]針對(duì)環(huán)境失配條件下的強(qiáng)干擾問題,提出了一種線性匹配場干擾抑制算法。2018年,賈雨晴等[9]提出了一種在聲速剖面時(shí)變環(huán)境下的自適應(yīng)匹配場定位算法,結(jié)果表明該算法的定位性能較常規(guī)匹配場算法有較大提升。MFP 方法利用水聲信道特性將聲傳播模型和陣列信號(hào)結(jié)合起來,實(shí)現(xiàn)水下目標(biāo)被動(dòng)定位。但此類模型驅(qū)動(dòng)方法需要海深、聲速剖面等參數(shù),在低信噪比和缺少環(huán)境參數(shù)的情況下,會(huì)嚴(yán)重影響定位性能。隨著機(jī)器學(xué)習(xí)技術(shù)的迅速發(fā)展,以神經(jīng)網(wǎng)絡(luò)為代表的數(shù)據(jù)驅(qū)動(dòng)方法在水聲領(lǐng)域得到了廣泛的應(yīng)用。
基于數(shù)據(jù)的機(jī)器學(xué)習(xí)模型不需要海洋環(huán)境參數(shù),而基于聲場理論的模型會(huì)受到環(huán)境失配的影響。1991年Steinberg等[10]建立單層神經(jīng)網(wǎng)絡(luò)模型對(duì)均勻介質(zhì)中的點(diǎn)聲源進(jìn)行深度估計(jì),但受限于當(dāng)時(shí)的機(jī)器學(xué)習(xí)技術(shù)發(fā)展不成熟,加之傳統(tǒng)的MFP方法為當(dāng)時(shí)主流的被動(dòng)定位算法,因此,在之后的很長一段時(shí)間,機(jī)器學(xué)習(xí)方法在水聲被動(dòng)定位領(lǐng)域的發(fā)展較為緩慢。2017年,Niu 等[11]利用前饋神經(jīng)網(wǎng)絡(luò)(Feed forward neural networks,FFNN)、支持向量機(jī)模型,結(jié)合海試實(shí)測數(shù)據(jù)驗(yàn)證了機(jī)器學(xué)習(xí)算法的定位性能。2018年,Wang等[12]引入了廣義回歸神經(jīng)網(wǎng)絡(luò)(Generalized regression neural network,GRNN)方法,實(shí)現(xiàn)了淺海高信噪比環(huán)境下有效的目標(biāo)距離估計(jì);Huang 等[13]將聲場模型數(shù)據(jù)用于訓(xùn)練,建立多層深度卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural networks,CNN)模型估計(jì)淺海聲源位置。2019年,Liu 等[14]在深度范圍大致確定的前提下,利用一維CNN 和集成學(xué)習(xí)實(shí)現(xiàn)了水下目標(biāo)距離估計(jì);Niu 等[15]在不確知環(huán)境下,采集單水聽器接收到的聲壓值,利用50 層殘差CNN 探測聲源。2020年,Liu 等[16]將實(shí)際數(shù)據(jù)和仿真數(shù)據(jù)的組合作為訓(xùn)練數(shù)據(jù),并利用CNN 估計(jì)聲源的深度和距離;張巧力等[17]搭建了單隱藏層的FFNN,并利用SWellEX-96實(shí)驗(yàn)S5航次的垂直陣數(shù)據(jù)進(jìn)行驗(yàn)證。以上研究利用CNN、支持向量機(jī)等模型對(duì)水下單目標(biāo)進(jìn)行了位置估計(jì),但大多相關(guān)研究是在沒有強(qiáng)干擾的高信噪比下的海洋環(huán)境中實(shí)現(xiàn)的。
機(jī)器學(xué)習(xí)在低信噪比的海洋環(huán)境中的應(yīng)用相對(duì)較少,2016年,Niu 等[18]輸入歸一化互譜密度矩陣,訓(xùn)練僅有一個(gè)隱藏層的FFNN,實(shí)現(xiàn)在訓(xùn)練樣本較少和低信噪比下的距離估計(jì)。2018年,Ozanich等[19]使用KRAKEN 模型生成垂直陣列在低信噪比下接收到的聲壓幅值和相位,利用CNN 在多頻復(fù)聲壓場中訓(xùn)練距離特征,研究表明通過增加訓(xùn)練數(shù)據(jù),可提升低信噪比下的定位性能。2020年,Ozanich 等[20]利用FFNN 進(jìn)行方位估計(jì),用SWellEX-96 實(shí)驗(yàn)中在強(qiáng)干擾下的S59 航次數(shù)據(jù)進(jìn)行驗(yàn)證,并與支持向量機(jī)方法進(jìn)行了對(duì)比,結(jié)果證明了深層FFNN 模型在水平陣被動(dòng)定位中應(yīng)用的可行性。
在實(shí)際淺海中,往往存在著強(qiáng)度較大的水面干擾聲源,比如大型的船舶,對(duì)水下目標(biāo)聲源的定位造成了很大的考驗(yàn),傳統(tǒng)的MFP 方法在此場景下性能較差,因此,在淺海強(qiáng)干擾下的目標(biāo)距離估計(jì)中,研究和建立基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)模型有重要意義和價(jià)值。本文利用美國海洋物理實(shí)驗(yàn)室1996年5月在距Point Loma 約12 km 處進(jìn)行的一次淺海實(shí)驗(yàn)(SWellEX-96 實(shí)驗(yàn))中的S59 航次數(shù)據(jù)研究強(qiáng)干擾下的垂直陣定位問題[21],為研究兩類驅(qū)動(dòng)方法在強(qiáng)干擾下距離估計(jì)性能的差異,本文對(duì)基于數(shù)據(jù)驅(qū)動(dòng)的GRNN和CNN方法和基于簡正波模型的傳統(tǒng)MFP方法的性能進(jìn)行了比較。
通過簡正波模型以及環(huán)境參數(shù),可以計(jì)算出聲源在特定位置情況下接收陣位置的復(fù)聲壓,作為拷貝向量。在簡正波模型下,(0,zs)處單頻點(diǎn)聲源在(r,z)處產(chǎn)生的聲壓表達(dá)式[22]為
其中,ρ為介質(zhì)密度,Ψm(z)和krm分別為第m號(hào)簡正波的模深函數(shù)(特征函數(shù))和水平波數(shù)。
對(duì)水聽器陣列接收到的數(shù)據(jù)與拷貝向量進(jìn)行匹配,在計(jì)算得到的距離-深度模糊表面中尋找最大值,該點(diǎn)對(duì)應(yīng)位置即為估計(jì)位置[23]。由互譜密度矩陣R和拷貝向量ω計(jì)算MFP 的定位模糊度平面B:
其中,pl為拷貝場下基陣接收到的復(fù)聲壓,?為聲源位置參數(shù),(·)H為共軛轉(zhuǎn)置,L為快拍數(shù),Pl為第l個(gè)快拍下基陣頻域數(shù)據(jù)向量。
對(duì)寬帶信號(hào),累加平均各個(gè)頻率對(duì)應(yīng)的模糊度平面,即可得到寬帶信號(hào)的模糊度平面。
基于核回歸分析的GRNN 是一種前向神經(jīng)網(wǎng)絡(luò),且有著優(yōu)良的非線性映射能力。GRNN 通過計(jì)算訓(xùn)練數(shù)據(jù)的輸入輸出和測試數(shù)據(jù)的輸入,得到條件概率密度函數(shù),從而進(jìn)一步得到測試數(shù)據(jù)的輸出[24]。GRNN只需要選擇一個(gè)網(wǎng)絡(luò)參數(shù),而其他神經(jīng)網(wǎng)絡(luò)一般需要選擇多個(gè)參數(shù),因此GRNN在網(wǎng)絡(luò)搭建上有著較強(qiáng)的優(yōu)勢。
GRNN 包含輸入層、模式層、求和層、輸出層,其結(jié)構(gòu)如圖1所示。輸入層將輸入向量傳遞給模式層。模式層神經(jīng)元個(gè)數(shù)和訓(xùn)練樣本個(gè)數(shù)N一致,每個(gè)訓(xùn)練樣本均有相對(duì)應(yīng)的神經(jīng)元。神經(jīng)元Gi為訓(xùn)練數(shù)據(jù)輸入Xi和測試數(shù)據(jù)輸入X間的歐式距離平方的指數(shù):
圖1 GRNN 結(jié)構(gòu)圖Fig.1 GRNN structure chart
其中,σ即為需要選擇的擴(kuò)展因子。
模式層包含一個(gè)D神經(jīng)元和K個(gè)S神經(jīng)元,D神經(jīng)元為所有模式層神經(jīng)元的算數(shù)求和,S神經(jīng)元為其對(duì)應(yīng)的加權(quán)求和(模式層的第i個(gè)神經(jīng)元和求和層的第k個(gè)神經(jīng)元之間的權(quán)重為yik),即
輸出層神經(jīng)元個(gè)數(shù)為輸出向量的維度K,對(duì)應(yīng)神經(jīng)元的輸出由對(duì)應(yīng)模式層Sk除以D計(jì)算得到:
GRNN的輸入特征為采樣協(xié)方差矩陣(Sample covariance matrices,SCMs)[25]。由于存在聲源振幅的影響,將陣元數(shù)為L的基陣接收的頻域復(fù)聲壓P(f)=[p1,p2,···,pl,···,pL]T進(jìn)行范數(shù)歸一化:
利用歸一化后的復(fù)聲壓,采樣協(xié)方差矩陣根據(jù)Ns個(gè)快拍數(shù)據(jù)平均計(jì)算得到,即
GRNN 模型的輸入為采樣協(xié)方差矩陣的上三角矩陣對(duì)應(yīng)復(fù)數(shù)元素的實(shí)部和虛部。單頻信號(hào)的輸入特征維數(shù)為1×L(L+1),將多個(gè)頻點(diǎn)的特征連接起來得到寬帶信號(hào)的輸入特征,其維數(shù)為1×L(L+1)Nf,其中Nf為頻點(diǎn)數(shù)。
GRNN只有一個(gè)網(wǎng)絡(luò)參數(shù),只需優(yōu)化擴(kuò)展因子,即可提高網(wǎng)絡(luò)的訓(xùn)練性能,本文使用k折交叉驗(yàn)證來確定最優(yōu)擴(kuò)展因子,方法如下:
(1)確定擴(kuò)展因子的取值范圍,比如如0.01,0.02,···,0.1,步長為0.01。
(2)將平均絕對(duì)百分比誤差(Mean absolute percentage error,MAPE)作為定位性能的衡量指標(biāo)
其中,Rgi為神經(jīng)網(wǎng)絡(luò)預(yù)測數(shù)據(jù),Rti為實(shí)際數(shù)據(jù)。
(3)對(duì)k折交叉驗(yàn)證,隨機(jī)地將訓(xùn)練數(shù)據(jù)分成k折,驗(yàn)證集為其中的1 折,訓(xùn)練集為其他的k ?1 折,本研究選擇10折。
(4)對(duì)每一個(gè)擴(kuò)展因子,首先將訓(xùn)練集用于訓(xùn)練,再測試驗(yàn)證集,并計(jì)算對(duì)應(yīng)的MAPE;將每一折訓(xùn)練樣本均作為一次驗(yàn)證集,重復(fù)上述過程,統(tǒng)計(jì)并計(jì)算k個(gè)MAPE的均值,即平均MAPE。
(5)對(duì)所有擴(kuò)展因子,重復(fù)步驟(4),將平均MAPE的最小值對(duì)應(yīng)的擴(kuò)展因子左右均設(shè)置一個(gè)步長的區(qū)間,再將步長調(diào)整為之前的1/10,即0.001,再重復(fù)步驟(4),將平均MAPE 的最小值對(duì)應(yīng)的擴(kuò)展因子作為最優(yōu)擴(kuò)展因子,該方法可將最優(yōu)擴(kuò)展因子的精度提高至0.001,從而進(jìn)一步提高網(wǎng)絡(luò)的訓(xùn)練性能。
SWellEX-96共包含S5和S59兩個(gè)航次,圖2為海試環(huán)境參數(shù),圖3為該實(shí)驗(yàn)S59航次地圖,圖中藍(lán)線表示目標(biāo)聲源軌跡,紅線表示干擾聲源(水面艦船)軌跡。本文將該實(shí)驗(yàn)中有強(qiáng)干擾的S59 航次的垂直陣接收的數(shù)據(jù)用于網(wǎng)絡(luò)的訓(xùn)練和測試。實(shí)驗(yàn)船共拖曳了深(54 m)和淺(9 m)兩個(gè)聲源,其速度約為2.5 m/s,共采集了65 min 數(shù)據(jù),發(fā)射在49~400 Hz 之間多個(gè)頻點(diǎn)的連續(xù)波(Continuous wave,CW)信號(hào)。實(shí)驗(yàn)使用共有22 個(gè)水聽器的垂直陣,采樣頻率為1.5 kHz,布放的深度為94.125~212.25 m 之間,在實(shí)驗(yàn)中有一個(gè)水聽器出現(xiàn)故障,因此僅使用其他21 個(gè)水聽器的測量數(shù)據(jù),干擾信號(hào)由水面艦船發(fā)出,頻段為62~401 Hz[21]。
圖2 SWellEX-96 實(shí)驗(yàn)淺海環(huán)境參數(shù)模型Fig.2 Swellex-96 experiment shallow sea environment parameter model
圖3 SWellEX-96 實(shí)驗(yàn)S59 航次地圖[21]Fig.3 Swellex-96 experiment S59 voyage map[21]
3.2.1 MFP定位
本文對(duì)深(54 m)聲源進(jìn)行距離估計(jì),窄帶聲源的中心頻率為235 Hz,{112 235 388}Hz 三個(gè)頻點(diǎn)(SWellEX-96實(shí)驗(yàn)中發(fā)射聲源級(jí)最大的一組頻點(diǎn)中取得)作為寬帶聲源頻率,設(shè)置海域的搜索距離范圍是0~10 km,間隔為10 m;深度范圍1~200 m,間隔為1 m,從而計(jì)算拷貝場。測試海域?yàn)闇\海,且為距離不相關(guān)的波導(dǎo)環(huán)境,聲源發(fā)射信號(hào)為低頻,因此使用基于簡正波模型的Kraken程序進(jìn)行仿真,聲壓場的互譜密度矩陣由3 個(gè)1 s 的快拍數(shù)據(jù)計(jì)算得到,基于Bartlett 算法估計(jì)出水下目標(biāo)聲源的空間位置。圖4 為以實(shí)際距離3.93 km 處為例的窄帶和寬帶模糊度平面圖,圖5 為窄帶和寬帶的距離估計(jì)結(jié)果。結(jié)果表明:在強(qiáng)干擾下,MFP 無法得到有效的距離估計(jì),由于簡正波模型不適合近場聲場建模,導(dǎo)致在0~2 km 之間的聲源定位效果較差。相比窄帶聲源,寬帶聲源的距離估計(jì)性能略好。
圖4 MFP 模糊度平面圖Fig.4 Ambiguity surface of MFP
圖5 MFP 在測試集上的距離估計(jì)結(jié)果Fig.5 Range estimation results of MFP on the test set
3.2.2 CNN
該實(shí)驗(yàn)共記錄了65 min 數(shù)據(jù),每1 min 給出了該時(shí)刻的空間位置信息,將該66個(gè)位置的對(duì)應(yīng)數(shù)據(jù)作為測試樣本。在相鄰的兩個(gè)測試樣本間,每間隔5.0 m(約為2 s)作為一個(gè)訓(xùn)練樣本,距離值通過插值獲得,各個(gè)選取頻率及各位置下的SCMs 由3 個(gè)1 s 快拍數(shù)據(jù)平均計(jì)算獲得,共1775 個(gè)插值點(diǎn)作為訓(xùn)練樣本(為避免測試集泄漏,剔除距離測試樣本5.0 m 的訓(xùn)練樣本),窄帶和寬帶聲源的特征數(shù)分別為462和1386,網(wǎng)絡(luò)輸入分別為1×462和1×1386的一維序列。隱藏層由卷積層和全連接層組成,其中卷積層使用卷積核大小為5,在3 個(gè)階段中,步長分別為1、2、2,濾波器個(gè)數(shù)分別為5、10、20。卷積之后通過批規(guī)劃化層使得卷積輸出滿足0 均值和1 標(biāo)準(zhǔn)差,批規(guī)范化后使用修正線性函數(shù)ReLU 作為激活函數(shù)。卷積層之間使用殘差連接來訓(xùn)練深層網(wǎng)絡(luò),卷積層之后為全局平均池化層、全連接層、ReLU 激活層、比率為0.5 的Dropout層和回歸層[26]。
網(wǎng)絡(luò)輸出為距離值,因此輸出層僅有一個(gè)神經(jīng)元。作為回歸問題,網(wǎng)絡(luò)訓(xùn)練使用
作為損失函數(shù),采用Sgdm算法作為優(yōu)化算法,學(xué)習(xí)率為0.0001,最大迭代次數(shù)為500,圖6 為網(wǎng)絡(luò)的總體結(jié)構(gòu)。圖7 為CNN 在測試集上的距離估計(jì)結(jié)果,可得到CNN 方法相比MFP,可以在環(huán)境失配下的0~2 km 下有較好的估計(jì)性能,但其精度和穩(wěn)健性相比GRNN 方法較差,網(wǎng)絡(luò)參數(shù)較多,訓(xùn)練時(shí)間較長,并且容易過擬合。
圖6 CNN 結(jié)構(gòu)圖Fig.6 CNN structure chart
圖7 CNN 在測試集上的距離估計(jì)結(jié)果Fig.7 Range estimation results of CNN on test set
3.2.3 GRNN回歸器
GRNN的輸入和CNN一致,圖8為窄帶聲源和寬帶聲源在不同擴(kuò)展因子下的預(yù)測結(jié)果,可得到窄帶聲源和寬帶聲源的最佳擴(kuò)展因子分別為0.005 和0.006。窄帶聲源和寬帶聲源的驗(yàn)證集在GRNN 方法下的距離估計(jì)結(jié)果如圖9所示,可得到:和MFP相比,GRNN對(duì)窄帶和寬帶聲源的距離估計(jì)性能均明顯提升,尤其是在0~2 km 間的聲源距離估計(jì)。
圖8 GRNN 在驗(yàn)證集上不同擴(kuò)展因子的距離估計(jì)結(jié)果Fig.8 Range estimation results of different extension factors of GRNN on the validation set
圖9 GRNN 在測試集上的距離估計(jì)結(jié)果Fig.9 Range estimation results of GRNN on the test set
窄帶和寬帶聲源的距離分別在MFP、CNN和GRNN 三種方法估計(jì)下的MAPE 如表1所示。由表1 的橫向?qū)Ρ瓤傻玫剑瓗曉春蛯拵曉丛贕RNN 方法下的MAPE 均遠(yuǎn)小于CNN 和MFP,GRNN 估計(jì)性能明顯優(yōu)于CNN 和MFP; 相比MFP,CNN 方法下的MAPE 較小,CNN 的估計(jì)性能較為優(yōu)良。由表1 的縱向?qū)Ρ瓤傻玫?,GRNN、CNN 和MFP 三種方法對(duì)寬帶聲源的MAPE 均小于窄帶聲源,由于和窄帶聲源相比,寬帶聲源的輸入特征較多,因此其估計(jì)性能會(huì)更好。
表1 寬帶聲源和窄帶聲源在不同方法下的MAPETable 1 MAPE of broadband and narrowband sources under different methods
寬帶聲源的距離在3 種方法下估計(jì)結(jié)果的絕對(duì)誤差如圖10所示。MFP、CNN 和GRNN 的平均絕對(duì)誤差分別為1.121 km、0.310 km 和0.058 km,CNN 和GRNN 均大幅度地減小了距離估計(jì)的絕對(duì)誤差,且GRNN 具有最高的估計(jì)精度和最好的穩(wěn)定性。
圖10 寬帶聲源在3 種方法下距離估計(jì)結(jié)果的絕對(duì)誤差Fig.10 Absolute error of range estimation results for broadband sound sources under three methods
機(jī)器學(xué)習(xí)在水聲被動(dòng)定位領(lǐng)域的結(jié)合日益密切,本文研究其中的目標(biāo)距離估計(jì)方面,大多相關(guān)研究是在高信噪比下的目標(biāo)距離估計(jì),而機(jī)器學(xué)習(xí)在強(qiáng)干擾下的低信噪比海洋環(huán)境中應(yīng)用相對(duì)較少。本文提出了基于優(yōu)化擴(kuò)展因子的GRNN,并利用SWellEX-96 實(shí)驗(yàn)中在強(qiáng)干擾下的S59 航次數(shù)據(jù)進(jìn)行了方法的驗(yàn)證,對(duì)比了MFP、CNN、GRNN 三種方法的水下目標(biāo)聲源距離估計(jì)性能。可得到,數(shù)據(jù)驅(qū)動(dòng)的GRNN和CNN方法距離估計(jì)性能明顯優(yōu)于傳統(tǒng)模型驅(qū)動(dòng)的MFP 方法,在已知海洋環(huán)境參數(shù)的條件下,GRNN、CNN和MFP三種方法對(duì)寬帶聲源的估計(jì)性能均優(yōu)于窄帶聲源,且對(duì)窄帶和寬帶聲源,GRNN 均具有最優(yōu)的估計(jì)性能,在海洋環(huán)境參數(shù)出現(xiàn)失配時(shí),MFP方法已不適用,CNN方法的精度和穩(wěn)健性較差,而GRNN方法仍可以較好地實(shí)現(xiàn)距離估計(jì)。在實(shí)際應(yīng)用中,GRNN 方法需要獲得一定數(shù)量的陣列實(shí)際測量數(shù)據(jù)來訓(xùn)練網(wǎng)絡(luò),無需海洋環(huán)境參數(shù),有著較好的可行性和穩(wěn)健性。