劉夏揚(yáng),李晶,*,于華鵬,趙國(guó)新,楊淑潔
(1.北京石油化工學(xué)院信息工程學(xué)院,北京 102617; 2.軍事科學(xué)院國(guó)防創(chuàng)新研究中心,北京 100071; 3.浙江海洋大學(xué)海洋工程裝備學(xué)院,浙江 舟山 316022)
船舶噪聲信號(hào)的分類識(shí)別方向作為海洋勘測(cè)研究中不可或缺的技術(shù)之一,用各種神經(jīng)網(wǎng)絡(luò)對(duì)船舶噪聲信號(hào)進(jìn)行分類和處理的相關(guān)研究也日漸豐富[1]。能否在水下對(duì)各類目標(biāo)進(jìn)行快速無(wú)誤地識(shí)別,很大程度上影響了未來(lái)海軍艦艇的作戰(zhàn)能力。
船只噪聲信號(hào)的特征提取和分類中取得了大量高質(zhì)量的研究成果[2-5]。由于聲波在水中傳播時(shí),水介質(zhì)的折射及聲波在水面、水底的反射,自發(fā)射點(diǎn)至接收點(diǎn)存在多個(gè)傳播途徑的現(xiàn)象,船只噪聲信號(hào)通常體現(xiàn)為時(shí)變信號(hào)[6],且船只在行進(jìn)過(guò)程中受到復(fù)雜環(huán)境的干擾,對(duì)于船舶噪聲特征提取帶來(lái)了一定難度。以往的船舶噪聲大多都是以單一特征進(jìn)行目標(biāo)識(shí)別,但對(duì)于完整地表述船舶的特征信息這一要求,單一特征有部分局限性。利用不同方法對(duì)船舶信號(hào)特征進(jìn)行提取,可以從不同方面反應(yīng)船舶的特征。排列熵(Permutation Entropy, PE)由于其良好的魯棒性和精確性以及能夠捕獲所分析的時(shí)間序列的底層動(dòng)態(tài),近年來(lái)已被應(yīng)用在特征提取方面。但PE只比較相鄰值,不考慮振幅,同時(shí)受等值的影響也很大,導(dǎo)致計(jì)算值與真實(shí)值存在偏差。為了解決這一問(wèn)題,F(xiàn)adlallah Bila[7]提出了加權(quán)排列熵(Weighted Permutation Entropy, WPE),引入考慮信號(hào)波動(dòng)的加權(quán)因子。與PE相比,WPE對(duì)振幅信息更敏感,能有效檢測(cè)到信號(hào)的停滯區(qū)和突變區(qū),并在許多領(lǐng)域得到了實(shí)際應(yīng)用[8]。
長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是目前實(shí)際應(yīng)用中高效的序列模型,該網(wǎng)絡(luò)對(duì)于解決循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)長(zhǎng)時(shí)序樣本梯度爆炸及梯度消失的問(wèn)題有著很好的效果。張亮[9]基于LSTM設(shè)計(jì)了自動(dòng)區(qū)分計(jì)算機(jī)和人的圖靈測(cè)試,并取得較高的識(shí)別率;Debashis Das Chakladar等[10]提出了一種基于雙向長(zhǎng)短期記憶(Bi-directional Long-Short Term Memory,BLSTM)和LSTM相結(jié)合的深度混合模型來(lái)處理腦電頻譜功率分類,效果甚佳。
針對(duì)船舶噪聲信號(hào)的特點(diǎn),并利用排列熵對(duì)時(shí)序性信號(hào)的敏感性,筆者提出了基于時(shí)頻域特征和排列熵的船舶噪聲信號(hào)識(shí)別方法。利用小波新閾值去噪和希爾伯特-黃變換(Hilbert-Huang Transform,HHT)對(duì)信號(hào)進(jìn)行預(yù)處理,采用反向加權(quán)排列熵對(duì)IMF進(jìn)行篩選,繼而將保留的IMF的加權(quán)排列熵以及瞬時(shí)頻率等進(jìn)行特征提取并篩選的方式得到信號(hào)特征,通過(guò)構(gòu)建LSTM網(wǎng)絡(luò),得到了理想的分類精度。
船舶噪聲信號(hào)包括機(jī)械噪聲、螺旋槳噪聲、水動(dòng)力噪聲等。為了提高后續(xù)訓(xùn)練速率和測(cè)試準(zhǔn)確度,需要對(duì)信號(hào)進(jìn)行預(yù)處理。
小波降噪的核心是:小波分解將原始信號(hào)分解出各層系數(shù),給定特定閾值,系數(shù)的模大于或小于特定閾值時(shí)分別進(jìn)行處理,處理完的小波系數(shù)再進(jìn)行反變換重構(gòu)得到降噪后的信號(hào)[11]。小波閾值去噪過(guò)程如圖1所示。
圖1 小波閾值去噪過(guò)程Fig.1 Flow chart of wavelet domain denoising
有用信號(hào)的小波系數(shù)幅值較大,噪聲的小波系數(shù)賦值較小,選擇合適的閾值處理小波系數(shù)極為重要。經(jīng)典閾值函數(shù)為硬閾值函數(shù)和軟閾值函數(shù),硬閾值函數(shù)[13]:
(1)
軟閾值函數(shù):
(2)
(3)
式中:n為信號(hào)長(zhǎng)度;σ為噪聲標(biāo)準(zhǔn)差。閾值可以保持局部特征,但重構(gòu)信號(hào)平滑度不夠。軟閾值法可以得到平滑的信號(hào)曲線,但往往會(huì)使信號(hào)產(chǎn)生失真。采用一種新的閾值法,由Gao和Bruce引入收縮函數(shù)的變化,其克服了硬閾值和軟閾值的缺點(diǎn)。因此具有良好的去噪性能。公式如下[14]:
(4)
由于傳播過(guò)程的多途效應(yīng),往往體現(xiàn)的是時(shí)變信號(hào),故在宏觀上是不平穩(wěn)的。為了準(zhǔn)確描述信號(hào)特征,使用經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)將信號(hào)分解為有限個(gè)本征模函數(shù)IMF,再求出各個(gè)IMF的瞬時(shí)頻率構(gòu)建特征向量組[15-18]。
EMD可以看作是一個(gè)對(duì)原始信號(hào)的篩選過(guò)程,根據(jù)原始信號(hào)的特點(diǎn)及規(guī)則分為多個(gè)IMF。IMF要滿足以下2個(gè)條件:
(1)信號(hào)的極值點(diǎn)數(shù)量與零點(diǎn)數(shù)相等或兩者數(shù)量差值為1;
(2)信號(hào)的上包絡(luò)線和下包絡(luò)線得到的局部均值為0.
對(duì)信號(hào)x(t)具體分解過(guò)程如下:
(1)求取原始信號(hào)的極大值點(diǎn)和極小值點(diǎn);
(2)用樣條差值法對(duì)極小值形成下包絡(luò)線xd(t),對(duì)極大值形成上包絡(luò)線xu(t),計(jì)算上下包絡(luò)的均值函數(shù)公式為[15]:
(5)
(3)檢查h1(t)=x(t)-m1(t)是否滿足IMF的條件,如果滿足則繼續(xù)下一步,否則對(duì)h1(t)繼續(xù)進(jìn)行上面兩步操作,直到第n步結(jié)果h1n(t)滿足IMF條件,則可求得第1個(gè)IMF,即c1=h1n(t);
(4)得到第1個(gè)殘余函數(shù)r1(t)=x(t)-c1,接著以此類推,直到rk(t)為單調(diào)函數(shù)或者只有1個(gè)極值點(diǎn)為止。
(5)經(jīng)過(guò)以上步驟的分解,原始信號(hào)可以表示為:
(6)
1.3.1 加權(quán)排列熵
加權(quán)排列熵(WPE)是對(duì)排列熵(PE)的一種改進(jìn),其計(jì)算步驟如下[7]:
輸入1個(gè)長(zhǎng)度為N的時(shí)間序列X,嵌入尺寸m>2,延遲時(shí)間τ,然后從時(shí)間序列X中提取長(zhǎng)度為m的所有可能的N-(m-1)個(gè)子序列,則X可以映射到:
=1,2,…,N-(m-1)τ
(7)
接著X按照遞增順序重新排列:
x(i+(j1-1)τ)≤x(i+(j2-1)τ)≤…≤
x(i+(jm-1)τ)
(8)
如果有2個(gè)元素相等:
(i+(j1-1)τ)=x(i+(j2-1)τ)
(9)
則他們的順序?yàn)椋?/p>
x(i+(j1-1)τ)≤x(i+(j2-1)τ),(j1≤j2)
(10)
計(jì)算出每個(gè)子序列的權(quán)重值ωi:
(11)
(12)
Pω(πk)=
(13)
則WPE計(jì)算式為:
(14)
1.3.2 反向加權(quán)排列熵
反向加權(quán)排列熵(Reverse Weighted Permutation Entropy, RWPE)保持了WPE和反向排列熵(Reverse Permutation Entropy, RPE)的優(yōu)勢(shì),是一種包含距離和振幅信息的復(fù)雜性度量方法,其中RPE代表時(shí)序信號(hào)與白噪聲之間的距離[18]。EMD將信號(hào)分解為若干個(gè)IMF后,有效船舶信號(hào)占較大比重,但仍有部分IMF與原始信號(hào)的相關(guān)性較低,故通過(guò)計(jì)算每一個(gè)IMF的反向加權(quán)排列熵來(lái)確定每一個(gè)IMF是否包含重要信息。其定義如下[5]:
(15)
加權(quán)相對(duì)頻率的計(jì)算式為:
(16)
反向加權(quán)排列熵表示觀測(cè)信號(hào)與高斯白噪聲之間的距離[5],此時(shí)RWPE定義為:
(17)
其中:τ為延遲時(shí)間;m為嵌入維數(shù);ωj為時(shí)序信號(hào)的權(quán)值。
與排列熵和加權(quán)排列熵相比,RWPE融合了振幅信息和距離信息,比PE具有更強(qiáng)的噪聲識(shí)別能力[18]。
對(duì)保留的IMF進(jìn)行希爾伯特變換[19]:
(18)
接著構(gòu)造解析信號(hào):
zt(t)=ci(t)+jH[ci(t)]=ai(t)ejφi(t)
(19)
得到的幅值函數(shù)和相位函數(shù)分別為:
(20)
(21)
各IMF的瞬時(shí)頻率計(jì)算方法為:
(22)
將提取的瞬時(shí)頻率和瞬時(shí)幅值經(jīng)過(guò)統(tǒng)計(jì)得到加權(quán)平均瞬時(shí)頻率,其計(jì)算式為:
(23)
式中:IFi(k)為第i個(gè)IMF中第k個(gè)點(diǎn)的瞬時(shí)頻率;Ai(k)表示第i個(gè)IMF中第k個(gè)點(diǎn)的瞬時(shí)振幅。
利用長(zhǎng)短期記憶算法對(duì)預(yù)處理后的信號(hào)進(jìn)行分類訓(xùn)練。LSTM是在RNN的基礎(chǔ)上增加了一個(gè)單元狀態(tài)C。
LSTM記憶單元組織圖如圖2所示。
圖2 LSTM記憶單元組織圖Fig.2 Chart of Memory Cells of LSTM
由圖2可知,在T時(shí)刻,LSTM的輸入有3個(gè):上一時(shí)刻的輸出值ht-1、上一時(shí)刻的單元狀態(tài)Ct-1以及當(dāng)前網(wǎng)絡(luò)的輸入值xt;輸出有2個(gè):t時(shí)刻的輸出值ht和當(dāng)前時(shí)刻的單元狀態(tài)Ct。在t時(shí)刻,輸入門(mén)和輸出門(mén)都是關(guān)閉狀態(tài),于是記憶單元把之前的狀態(tài)傳遞到t+1時(shí)刻,這樣就把第1個(gè)狀態(tài)記錄了下來(lái)。以此類推,時(shí)間步t時(shí)的記憶單元就被記錄了下來(lái),解決了梯度消失的問(wèn)題。
以上為單向LSTM的計(jì)算方式,其相比單向LSTM,雙向LSTM的隱藏層要保存2個(gè)單元狀態(tài)A、A′,A參與正向計(jì)算,A′參與反向計(jì)算,最終的輸出y取決于2個(gè)值。雙向LSTM的訓(xùn)練單元如圖3所示。
圖 3 雙向LSTM訓(xùn)練單元Fig.3 Training Unit of BILSTM
利用雙向LSTM進(jìn)行訓(xùn)練,相比單向LSTM訓(xùn)練精度更好。
按照上述理論分析,船舶噪聲信號(hào)分類識(shí)別總體流程如圖4所示。
圖4 分類識(shí)別總體流程Fig.4 Flow chart of classification and identification
為了驗(yàn)證船舶噪聲識(shí)別方法的有效性,使用了維戈大學(xué)提供的名為ShipsEar的真實(shí)水下船只噪聲數(shù)據(jù)庫(kù)。
實(shí)驗(yàn)涉及四類船只目標(biāo),簡(jiǎn)稱為A、B、C、D類,2 000個(gè)噪聲樣本作為實(shí)驗(yàn)數(shù)據(jù)集。每個(gè)樣本分別采集于不同時(shí)間和環(huán)境,信號(hào)采樣率為50 kHz。選取的各類數(shù)據(jù)的原始時(shí)域波形如圖5所示。
圖5 四類信號(hào)類時(shí)域分析圖Fig.5 Four Class time domain waveform
為驗(yàn)證新閾值的去噪能力,將原始信號(hào)視為未加噪聲信號(hào)x(t),加噪信號(hào)由原始信號(hào)和白噪聲疊加,信噪比為10 dB。利用小波變換將x(t)劃分為4階小波信號(hào),sym4作為小波函數(shù),并使用新閾值函數(shù)去噪。最后,將去噪后小波信號(hào)進(jìn)行組合得到去噪后的信號(hào)s(t)。原始信號(hào)與去噪信號(hào)如圖6所示。以信噪比和均方根誤差來(lái)評(píng)價(jià)去噪效果。信噪比的計(jì)算式為:
(31)
圖6 原始信號(hào)與去噪信號(hào)Fig.6 Original signal and denoised signal
不同閾值方法的去噪能力如表1所示。
表1 不同閾值方法去噪能力比較
從表1中可以看出,新閾值法在保持較低RMSE值的同時(shí),可以得到較高的信噪比。故新閾值法去噪性能更佳。某一信號(hào)去噪前后EMD分解圖如圖7所示。
圖7 原始信號(hào)和除噪后EMD分解對(duì)比圖Fig.7 Comparison between the EMD decomposition of original signal and the original signal after denoising
在經(jīng)過(guò)信號(hào)分解算法處理的有噪信號(hào)得到的IMF中,并不是每個(gè)IMF都能對(duì)原始信號(hào)進(jìn)行表征。有些成分是噪聲,需要在特征提取前排除。由文獻(xiàn)[18]可知,RWPE值越大,觀測(cè)值與白噪聲的距離越小。四類信號(hào)在求取IMF后每一類隨機(jī)選取100組IMF信號(hào)求RWPE平均值。四類船只信號(hào)中IMF的RWPE結(jié)果直方圖如圖8所示。該去噪方法區(qū)分原始信號(hào)中噪聲IMF是可行的。為了進(jìn)一步驗(yàn)證該方法的有效性,選取RWPE閾值為2和4的本征函數(shù)重構(gòu)新信號(hào)。不同取值下加噪信號(hào)和重構(gòu)信號(hào)的信噪比如表2所示。加噪信號(hào)的信噪比為10 dB。從表2中可以看出,當(dāng)RWPE取值為4時(shí),可以得到較高的信噪比。
表2 不同RWPE值下原始信號(hào)與重構(gòu)信號(hào)的信噪比
圖8 EMD的RWPE結(jié)果的直方圖Fig.8 The histogram of the RWPE results for EMD
從數(shù)據(jù)集中隨機(jī)選出80%的信號(hào)作為訓(xùn)練集,在訓(xùn)練前使用訓(xùn)練集的均值和標(biāo)準(zhǔn)差來(lái)標(biāo)準(zhǔn)化訓(xùn)練集和測(cè)試集。由于輸入信號(hào)各有2個(gè)維度,將輸入序列大小設(shè)置為2;指定雙向LSTM層輸出大小為500;每次訓(xùn)練迭代的小批量的數(shù)量設(shè)置為50;最大訓(xùn)練次數(shù)設(shè)置為50。
為了進(jìn)一步檢驗(yàn)特征提取方法的性能,選用IMF與原始信號(hào)的能量比以及WPE加權(quán)能量比構(gòu)建特征向量[25],進(jìn)行分類實(shí)驗(yàn)。
處理后的結(jié)果對(duì)應(yīng)的識(shí)別結(jié)果如表3所示, 目標(biāo)識(shí)別的結(jié)果混淆矩陣如圖9所示。
圖9 測(cè)試集效果混淆矩陣Fig.9 Test set classification effect of confusion matrix of Class A、B、C、D
表3 不同特征提取方法識(shí)別率對(duì)比
由表3中可以看出,以IMF和原始信號(hào)能量比為特征進(jìn)行識(shí)別在多類的情況下并不實(shí)用,平均識(shí)別率為50%。在相同樣本的情況下,利用WPE對(duì)能量比進(jìn)行加權(quán)后作為特征進(jìn)行訓(xùn)練,系統(tǒng)的平均識(shí)別率提升到92.12%,而特征提取方法訓(xùn)練后的平均識(shí)別率為99.40%,說(shuō)明提出的特征具有更好的性能。
使用提出的特征提取方法,A類船只的識(shí)別率達(dá)到100.0%,B類船只的識(shí)別率為99.3%,C類船只的識(shí)別率為98.5%,D類船只的識(shí)別率為99.8%。故對(duì)于船舶噪聲識(shí)別的效果是比較理想的。
提出了一種基于時(shí)頻域特征與排列熵的識(shí)別方法,經(jīng)驗(yàn)?zāi)B(tài)分解可以根據(jù)局部特征將多分量信號(hào)分解為一系列的IMF,并利用原始信號(hào)的時(shí)頻域特征有效提取船舶噪聲特征,并利用加權(quán)排列熵與加權(quán)平均瞬時(shí)頻率組成特征向量,并利用LSTM對(duì)不同類型的船舶噪聲信號(hào)進(jìn)行識(shí)別。分析了不同特征識(shí)別的特點(diǎn),并通過(guò)實(shí)驗(yàn)證明了該方法的可行性。