摘 要:船舶輻射噪聲的目標識別是水下目標識別領域的關鍵。然而,目前缺乏能夠準確反映真實水聲條件的多目標船舶數(shù)據(jù)庫。為了解決這一問題,我們進行實驗數(shù)據(jù)采集,構(gòu)建綜合水聲多目標數(shù)據(jù)庫。為驗證數(shù)據(jù)庫可用性進行了兩個實驗任務。任務一是評估船舶輻射噪聲的存在性,任務二是識別多目標場景中特定船舶。實驗結(jié)果表明,在超過99%的情況下,可以成功從背景噪聲中辨識船舶輻射噪聲?;谘芯拷Y(jié)果提出了選擇合適特征和深度學習網(wǎng)絡的建議。
關鍵詞:水下聲學數(shù)據(jù)庫;水下目標識別;水下聲學;深度學習
引言
首先,通過實驗收集并構(gòu)建了觀山湖湖區(qū)高質(zhì)量水聲數(shù)據(jù)庫。該數(shù)據(jù)庫模擬真實識別環(huán)境,為研究人員綜合評估和改進其水下聲目標識別算法提供寶貴資源。其次,本文利用觀山湖湖區(qū)數(shù)據(jù)庫,區(qū)分船舶信號和背景噪聲信號,并成功識別出三種特定類型的船舶信號,證明了數(shù)據(jù)庫的實用性。最后,通過提取三個頻譜特征,簡化了對多目標船舶信號中特定船舶信號的識別。這些特征使用三種流行的深度學習分類器進行測試,為研究人員提供算法評估的基準,并提供選擇合適特征和深度學習網(wǎng)絡的建議。
一、研究背景
自1913年美國費森登發(fā)明聲納以來,水下輻射噪聲作為重要信息來源已有百年歷史。因此,水聲技術逐步應用于各種目標類型的探測,并使環(huán)境信號的分析成為可能。值得注意的是,由于其增強了隱蔽性和安全性,研究重點已轉(zhuǎn)向船舶輻射噪聲。然而,用于水聲目標研究的公開數(shù)據(jù)庫非常稀缺,常用的數(shù)據(jù)庫如ShipsEar和DeepShip主要包含單目標船舶數(shù)據(jù),缺乏多目標場景的復雜性。為解決這一問題,采集了觀山湖湖區(qū)數(shù)據(jù)庫,包含21小時58分鐘的背景噪聲和9小時28分鐘的多目標船舶噪聲數(shù)據(jù)。數(shù)據(jù)庫于2023年6月在本溪觀山湖風景區(qū)的水聲環(huán)境中采集,使用數(shù)碼SR-1自電容水聽器確保高質(zhì)量的船舶噪聲記錄。水下聲學目標識別重點在于從背景噪聲中辨識船舶輻射噪聲,并通過二元分類確定船舶目標是否存在,將接收到的信號分類為船舶輻射信號或背景信號[1],此外DEMON頻譜特征能更好地對船舶螺旋槳葉片數(shù)量等信息有響應[2],這種初步分類簡化了后續(xù)任務。
二、數(shù)據(jù)庫介紹
(一)記錄系統(tǒng)和記錄方法
數(shù)據(jù)收集于2023年6月24日至28日,地點在本溪關山湖旅游風景區(qū),利用y2cqYsA1A42sAekzQvnuZM7ruZj/fx1pqqfhxKVupbM=兩個主要部署地點,在部署區(qū)域的中心使用配重和浮標系統(tǒng)固定安裝一個水聽器。水深約30米~50米,水聽器的定位深度為10米~15米。另外安裝一個專用的水聽器用于收集數(shù)據(jù),位于航行通道附近的獨立裝置,以捕獲更廣泛的船舶輻射噪聲。所使用的水聽器型號是HydSR-1,其關鍵規(guī)格為采樣頻率52734Hz,采樣分辨率為16位,可用的聲學頻帶為1kHz~25.8kHz,接收靈敏度為-162.2dB re 1V/μPa~-126.1dB re 1V/μPa,輸入聲壓級范圍為46.3dB re 1μPa ~172.5dB re 1μPa。操作深度可達100米,由塑鋼建造,重量約0.77kg,在溫度范圍0~40℃內(nèi)工作。該設備由一個可充電的鋰離子電池供電,可以連續(xù)收集長達12小時的數(shù)據(jù)。聲學數(shù)據(jù)以WAV格式存儲在一個可移動的存儲卡上,保留所有配置參數(shù)以便后續(xù)數(shù)據(jù)分析。
首先,從收集的水聲數(shù)據(jù)中識別船舶輻射噪聲和背景噪聲。提取了三個一維特征(頻譜、功率譜密度、DEMON頻譜)和兩個二維特征(LOFAR頻譜、Log Mel頻譜)用于多目標船舶識別。其次,采用不同的深度神經(jīng)網(wǎng)絡,包括CNN(卷積神經(jīng)網(wǎng)絡)、CRNN(卷積循環(huán)神經(jīng)網(wǎng)絡)和BiLSTM(雙向長短期記憶網(wǎng)絡)進行分類。最后,成功從多目標船舶信號中識別出三類特定船舶信號:快艇、觀光客船和無人潛航器。此外,筆者還探討了數(shù)據(jù)庫的標記和格式化細節(jié)。
(二)數(shù)據(jù)庫結(jié)構(gòu)
為了在水聽器部署之后觀察船只通過湖區(qū)航行,記錄了一艘船接近大約1公里外的水聽器的時間,以及這些時刻的船號和名稱。后續(xù)的數(shù)據(jù)對齊包括識別波形峰值處的時刻,并將其與相應的船號相關聯(lián),從而將該特定節(jié)段的標簽和數(shù)據(jù)關聯(lián)起來。實驗周期與旅游季節(jié)正好吻合,導致有記錄的船只輻射噪聲主要來自觀光船和快艇。由于水聽器靠近航道,通過的船只,包括觀光船、快艇和其他船只,會造成復合輻射噪聲。其他目標包括大型旅游船、衛(wèi)生船、小船、研究船和環(huán)境噪聲。根據(jù)實驗記錄的文檔信息、信號振幅和頻譜特征,可以確定每個音頻段的開始和結(jié)束時間節(jié)點。根據(jù)聽覺、距離和標記數(shù)據(jù)對每個數(shù)據(jù)塊進行標記,并將信息記錄在一個文本文檔中。在此過程中,數(shù)據(jù)被分割成3秒的間隔,以方便后續(xù)處理。最終的數(shù)據(jù)庫由10,611條WAV格式的記錄組成,總計9小時28分鐘13秒的船舶輻射噪聲數(shù)據(jù)。每個音頻文件及其相應的數(shù)據(jù)在觀山湖湖區(qū)數(shù)據(jù)中形成一個記錄?;跇撕灥囊恢滦裕泊_定143個包含單個和多個船舶目標的錄音。這些數(shù)據(jù)主要包括7類船舶目標,通過選擇沒有船舶目標和其他干擾的時間片構(gòu)成背景噪聲數(shù)據(jù)做對比,最終共獲得了21小時58分鐘,包括25,900條背景噪聲數(shù)據(jù)記錄,每條記錄的持續(xù)時間為3秒。
三、船舶噪聲檢測實驗任務及結(jié)果分析
水下聲學目標檢測的重點是識別目標的存在,并將接收信號分類為水下目標輻射噪聲或非目標噪聲。因此,使用這個數(shù)據(jù)庫承擔了兩個任務。任務一涉及從采集的水聲信號數(shù)據(jù)中識別船舶信號,其中包括背景噪聲信號。任務二的目標是從混合的多目標船舶輻射噪聲信號中識別出三種特定類型的船舶信號,分別是快艇、觀光船和工作船。
(一)確定音頻中是否包含船舶輻射噪聲(任務 一)
任務一的目標是確定音頻是否包含船舶輻射的噪聲。通過選擇前5000個船舶噪聲記錄,以及來自第一天的最初30個錄音和來自第二天的20個錄音,組成最終的數(shù)據(jù)庫。使用70%的數(shù)據(jù)庫進行訓練,15%用于驗證,15%用于測試。對數(shù)據(jù)提取Log Mel頻譜特征,采用深度學習網(wǎng)絡進行特征分類。每個實驗進行10次,計算均值和方差。除了BiLSTM(雙向長短期記憶網(wǎng)絡),其他方法的分類準確率超過99%。值得注意的是,CRNN(卷積循環(huán)神經(jīng)網(wǎng)絡)表現(xiàn)出最穩(wěn)健的分類性能,準確率達到99.79%。實驗結(jié)果表明,船舶輻射噪聲數(shù)據(jù)與背景噪聲數(shù)據(jù)之間具有較高的可區(qū)分性,顯示了數(shù)據(jù)庫的重要應用價值。
(二)確定是否有任何感興趣的目標多船混合數(shù)據(jù)(任務二)
在任務二中,主要目標確定在多船混合數(shù)據(jù)中是否存在任何感興趣的目標。所選擇的研究對象包括快艇、觀光客船和工作船。為每個研究對象構(gòu)建相應的數(shù)據(jù)庫,為了方便不同特征之間的性能比較,將特征維度限制在16384(128×128)到16900(130×130)的范圍內(nèi)。采用深度學習網(wǎng)絡進行特征分類,其網(wǎng)絡結(jié)構(gòu)與任務一一致。對于一維特征(頻譜、功率譜密度、DEMON頻譜),CNN、CRNN和BiLSTM專門用于比較實驗。使用復原率、精度、準確率評估模型性能。對于所建立的三個目標數(shù)據(jù)庫,用不同的特征和網(wǎng)絡進行各種比較實驗,從不同角度以更好地分析與總結(jié)實驗結(jié)果。
1.網(wǎng)絡的比較
在本節(jié)中,為了比較不同網(wǎng)絡的性能,我們分別計算在使用同一網(wǎng)絡不同數(shù)據(jù)庫的實驗中,一維和二維特征的平均指標。
在大多數(shù)情況下,工作船實驗和觀光客船實驗的結(jié)果為性能優(yōu)于快艇實驗,這可能由于快艇實驗中包含的船只范圍不同,導致不同船只更復雜的組合。我們記錄了三個實驗數(shù)據(jù)庫中每種船舶對應的范圍,快艇實驗共包含2309個數(shù)據(jù)點,涉及四人座、六人座、十人座、摩托艇等13種船舶;觀光客船實驗包括649個數(shù)據(jù)點,包括觀山湖風景區(qū)的三種觀光船舶;工作船實驗只有300個數(shù)據(jù)點,包含打撈、漁船等船只。在相同特征和網(wǎng)絡條件下,模型在較小、較不復雜的數(shù)據(jù)庫上表現(xiàn)出更好的分類性能,導致工作船實驗的表現(xiàn)優(yōu)于觀光客船實驗,進而優(yōu)于快艇實驗。
一維數(shù)據(jù)的網(wǎng)絡分類結(jié)果表明,CNN網(wǎng)絡的表現(xiàn)優(yōu)于CRNN和BiLSTM。在觀光客船實驗中,CNN基于復原率、精度、準確率都優(yōu)于CRNN。在快艇實驗中,CNN比CRNN表現(xiàn)出更好的準確性,而CRNN在復原率、精度指標方面都優(yōu)于CNN。兩者在精度方面具有相對的可比性。值得注意的是,BiLSTM在所有實驗中始終表現(xiàn)出較差的性能。除基于BiLSTM的快艇實驗外,其他所有網(wǎng)絡的分類結(jié)果均達到90%以上。結(jié)合以上實驗結(jié)果,推斷一維特征包含相對簡單的信息,通過直接使用網(wǎng)絡分類可以獲得令人滿意的結(jié)果。因此,基于一維特征的水聲目標識別任務,提出對于小規(guī)模數(shù)據(jù)庫(工作船),可以使用CNN網(wǎng)絡進行分類,而對于中大型數(shù)據(jù)庫(觀光客船,快艇),可以使用CRNN網(wǎng)絡進行分類。
二維數(shù)據(jù)的網(wǎng)絡分類結(jié)果表明,網(wǎng)絡性能從好到壞,分別是CRNN、CNN、BiLSTM。在使用CRNN網(wǎng)絡進行的平均識別準確率可達97.78%,包含工作船目標的數(shù)據(jù)中有96.96%被準確識別,而網(wǎng)絡預測的數(shù)據(jù)中有97.93%是正確的目標。結(jié)合實驗結(jié)果,二維特征分類整體性能最好的網(wǎng)絡是CRNN,此外,CNN在對大規(guī)模和復雜的數(shù)據(jù)庫(快艇)進行分類方面具有更明顯的優(yōu)勢,而分類性能最差的網(wǎng)絡是BiLSTM。
2.特征比較
在特征比較分析中,為了適用于不同環(huán)境和神經(jīng)網(wǎng)絡識別,直接對每個特征得到的結(jié)果進行平均。LOFAR頻譜在二維特征中表現(xiàn)最好,準確率超過95%。實驗結(jié)果表明,船舶輻射噪聲的頻譜和功率譜密度在分類中起著至關重要的作用。船舶輻射噪聲的頻譜由連續(xù)譜、線譜和調(diào)制譜組成,提供關于船舶操作、發(fā)動機狀態(tài)和水下環(huán)境的基本信息[3]。同時,基于人類聽覺感知設計的功率譜密度,通過Mel濾波器對信號進行處理,并采用對數(shù)縮放和離散余弦變換(DCT)等方法減少冗余特征。這種方法能更好地捕捉船舶輻射噪聲中不同頻率的特征。
對于其他特征,在Log Mel頻譜中利用冪律非線性,而不是傳統(tǒng)的對數(shù)非線性,引入一種基于非對稱濾波的噪聲抑制背景激勵的抑制算法和一種實現(xiàn)時間掩蔽的模塊。然而,這些調(diào)整不利于識別船舶噪聲信號,所以更換成伽馬通濾波器,增強對脈沖信號的識別,由于船舶噪聲包含的脈沖信號很少,它們的識別效果魯棒性(Robust)較差。DEMON頻譜特征對船舶螺旋槳葉片數(shù)量等信息有響應,但由于本文識別的信號是多目標信號,這種特征不能很好地區(qū)分不同的信號。
結(jié)論
根據(jù)原始的實驗結(jié)果可以觀察到,在觀光客船實驗和快艇中,表現(xiàn)最好的識別網(wǎng)絡都是結(jié)合了具有頻譜特征的CRNN網(wǎng)絡。在工作船實驗中,性能最好的識別網(wǎng)絡都是將CNN網(wǎng)絡與頻譜特征結(jié)合起來。頻譜特征在三個實驗中都表現(xiàn)良好,在三次實驗中,包含目標特征的最高準確率分別達到97.15%、95.40%和99.56%。此外,它們在十個測試中表現(xiàn)出極端的穩(wěn)定性,絕大多數(shù)的方差幾乎接近于零。即使像BiLSTM這樣的網(wǎng)絡表現(xiàn)出相對較差的整體性能,使用頻譜特性仍然可以產(chǎn)生較高的精度。這也間接地表明,在水下目標識別領域,特征決策的重要性可能超過網(wǎng)絡決策。
基于實驗結(jié)果,我們提出了以下針對水聲目標識別任務的特征和深度學習網(wǎng)絡選擇策略。首先,特征選擇比網(wǎng)絡選擇更重要。頻譜是一維特征的首選,而LOFAR特征是二維特征的首選。其次,對于一維特征分類,CNN可以用于小規(guī)模數(shù)據(jù)庫,而CRNN適用于中、大規(guī)模數(shù)據(jù)庫;對于二維特征分類,CRNN推薦用于中小型數(shù)據(jù)庫。
參考文獻:
[1]劉忠東,劉雨東,劉文帥,等.艦船噪聲特性數(shù)據(jù)庫系統(tǒng)的設計和實現(xiàn)[J].艦船電子工程,2004,24(04):68-71.
[2]戴衛(wèi)國,程玉勝,王易川.支持向量機對艦船噪聲DEMON譜的分類識別[J].應用聲學,2010(03):206-211.
[3]冉磊,李慶民,申志偉,等.艦船噪聲模型可信度評估方法[J].海軍工程大學學報,2011,23(01):94-99.