摘 要: 大黃魚在繁殖期各階段所發(fā)出的聲音信號一般能夠反映其生理和行為狀態(tài),然而在實際養(yǎng)殖環(huán)境中采集到的聲音信號往往混雜多種噪聲,需要對原始信號進行降噪預(yù)處理。提出了一種改進小波閾值?CEEMDAN 的降噪算法,首先將原始信號分解為多個本征信號分量,然后使用改進的小波閾值函數(shù)對每個本征信號分量進行處理,最后將處理后的有效信號分量進行重構(gòu)。開展大黃魚發(fā)聲信號降噪效果測試試驗,結(jié)果表明,使用該研究提出的降噪算法后檢測系統(tǒng)信噪比提高到14.53 dB,均方根誤差降低到0.001 96 dB。相較于傳統(tǒng)降噪算法,改進后的算法具有更好的降噪效果,更有利于分析和研究大黃魚繁殖期間的發(fā)聲行為。
關(guān)鍵詞:大黃魚;CEEMDAN;小波閾值;聲信號處理;繁殖狀態(tài)監(jiān)測
中圖分類號:S24;S96 文獻標(biāo)識碼:A 文章編號:2095-1795(2024)09-0027-07
DOI:10.19998/j.cnki.2095-1795.2024.09.005
0 引言
大黃魚(Larimichthys crocea)是名貴的食用海水養(yǎng)殖經(jīng)濟魚種之一,具有較高的經(jīng)濟價值。20 世紀(jì)50—70 年代的過度捕撈,使大黃魚的數(shù)量急劇減少。目前大黃魚主要采用網(wǎng)箱養(yǎng)殖,是我國最大的海水網(wǎng)箱養(yǎng)殖魚種。
大黃魚以其極具特色的叫聲被人們所熟知,在繁殖季節(jié)中其發(fā)聲行為尤其普遍[1]。黃昏或夜間時,大黃魚還會出現(xiàn)“合唱”現(xiàn)象,魚群所發(fā)出的聲音非常大,并且持續(xù)時間較長。為了選育出更優(yōu)質(zhì)的養(yǎng)殖大黃魚,育種工作顯得尤為關(guān)鍵。不同繁殖階段下的大黃魚發(fā)聲特征存在差異性,因此大黃魚在繁殖過程中發(fā)出聲音的特征變化情況可以在一定程度上反映大黃魚的繁殖狀態(tài)信息[2]。
對大黃魚聲信號的采集工作通常在自然水下環(huán)境中進行。水下聲信號采集過程中不可避免地會受到多種噪聲源的干擾,其中包括自然水下環(huán)境噪聲和人為活動產(chǎn)生的噪聲,這些噪聲不僅會影響聲信號的清晰度,而且也會對后續(xù)的信號分析和研究帶來極大困擾。因此,有必要開發(fā)一種高效的新型降噪算法,以有效消除這些噪聲,確保獲得的大黃魚聲信號盡可能清晰準(zhǔn)確,為研究提供可靠的數(shù)據(jù)支持。
目前對聲信號使用的降噪方法主要有譜減法[3]、線性濾波器[4] 及基于神經(jīng)網(wǎng)絡(luò)模型的降噪方法[5] 等。譜減法是通過從原始信號的頻譜中減去估計的噪聲頻譜實現(xiàn)降噪,具有運算量小、實現(xiàn)簡單的優(yōu)點,但是效果一般,并且可能會降低聲信號的清晰度[6]。線性濾波器有維納濾波器、卡爾曼濾波器等。維納濾波器通過求解最優(yōu)化均方根誤差從而獲取降噪信號,相比譜減法具有更優(yōu)秀的降噪性能,但是不能有效地應(yīng)用在非平穩(wěn)信號上[7]。卡爾曼濾波器在此基礎(chǔ)上進行了改進,通過引入遞歸形式的狀態(tài)空間模型、實施預(yù)測、更新步驟及動態(tài)調(diào)整估計準(zhǔn)確性的機制,有效地改進了對非平穩(wěn)信號的處理能力[8]。
基于神經(jīng)網(wǎng)絡(luò)的降噪方法近年來被廣泛應(yīng)用,其中具體的方法有RNNoise[9]、U-Net[10] 等。RNNoise 主要實現(xiàn)原理是在對音頻信號進行特征提取后,使用噪聲追蹤方法建立噪聲模型, 并使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進一步區(qū)分和抑制噪聲,從而高效地保留原始信號中的聲音部分,并實現(xiàn)實時噪聲抑制。U-Net 最初是為醫(yī)學(xué)影像分割設(shè)計,但因其獨特的架構(gòu)和對細(xì)節(jié)的高度敏感性也被用于聲音降噪領(lǐng)域;其主要實現(xiàn)原理是將聲音信號從時域轉(zhuǎn)換到頻域,并利用深度卷積網(wǎng)絡(luò)的強大特征提取能力來捕獲聲音不同層次的信息。通過編碼器逐步下采樣以捕獲全局特征后,瓶頸層進一步提煉信息,然后解碼器上采樣恢復(fù)信號細(xì)節(jié)。整個過程中通過跳躍連接確保細(xì)節(jié)信息不丟失,最終通過逆變換將頻域的輸出轉(zhuǎn)換回時間域,得到清晰的聲音信號[11]。
其他比較經(jīng)典的聲音降噪方法還有高斯混合模型(GMM)[12]、支持向量機(SVM)[13] 等。GMM 基于多個高斯分布的混合通過構(gòu)建聲音信號的概率模型來實現(xiàn)降噪;SVM 采用的是一種判別式的方法,通過構(gòu)建一個決策邊界來區(qū)分噪聲和語音信號。
以上降噪方法各有優(yōu)點,但都存在著明顯的不足之處。RNNoise 主要應(yīng)用于人聲信號,對于非人聲的信號降噪效果不太理想。U-Net 需要大量的標(biāo)記數(shù)據(jù)進行訓(xùn)練,并且訓(xùn)練和推理過程需要較大的計算資源。GMM 在處理非高斯分布噪聲時的表現(xiàn)可能會受到限制,并且計算的復(fù)雜度較高。SVM 的性能高度依賴于核函數(shù)的選擇和參數(shù)設(shè)置,因此非常需要先驗知識。
在對實際環(huán)境中采集到的大黃魚繁殖發(fā)聲信號進行降噪處理時,需要一種降噪性能好、不依賴于先驗數(shù)據(jù)、不需要大量計算資源,以及大規(guī)模數(shù)據(jù)集、多場景應(yīng)用、適應(yīng)性強的降噪方法,以確保在各種環(huán)境條件下都能有效地提取清晰的大黃魚繁殖發(fā)聲信號。
TORRES M E 等[14] 提出了改進的完全自適應(yīng)噪聲集合經(jīng)驗?zāi)B(tài)分解方法(complete EEMD with adaptivenoise,CEEMDAN),也被稱為完全集合經(jīng)驗?zāi)B(tài)分解法。這種方法能夠同時考慮到信號的時域和頻域特性,適應(yīng)信號的非線性和非平穩(wěn)特性,通常用以結(jié)合合適的小波濾噪算法[15],對原始信號分解并加以進行小波去噪再重構(gòu)信號,有效消除了信號中的噪聲成分,提取原始信號的有效特征,自提出以來被廣泛地運用到圖像處理[16]、語音處理[17]、振動分析[18] 等領(lǐng)域中。然而,過去提出的小波閾值算法在降噪的過程中依然存在著可以改進的地方[19]。針對不同場景下的去噪工作,往往需要找出更為適合的小波去噪閾值函數(shù),使去噪性能得到提升。本研究提出了一種新的小波閾值函數(shù),能夠?qū)氪簏S魚聲信號進行更有效地去噪,新算法相比舊算法有更高的信噪比。
1 信號處理過程與方法
1.1 CEEMDAN 原理
為了解決EMD 算法分解信號存在的模態(tài)混疊問題,EEMD 分解算法通過在待分解信號中加入成對正負(fù)高斯白噪聲來減輕,但是使用這兩種算法得到的本征模態(tài)分兩種總會殘留一定的白噪聲,這會對后續(xù)的信號分析和處理產(chǎn)生消極影響[20]。CEEMDAN 算法并非將高斯白噪聲直接添加在原始信號中,而是加入經(jīng)EMD分解后含輔助噪聲的IMF 分量,并且在得到的第1 階IMF 分量后就進行總體平均計算,得到最終的第1 階IMF 分量,然后對殘余部分重復(fù)進行如上操作,從而有效地解決了白噪聲從高頻到低頻的轉(zhuǎn)移傳遞問題。其迭代過程詳細(xì)如下[21]。