葉安琪 魏晨琦 鄧汝杰 張蓉
摘 要:現(xiàn)實(shí)中,一般的語音信號(hào)都是帶噪的,電子偽裝語音也不例外。電子偽裝語言的識(shí)別,需要提取特征參數(shù)。噪音干擾對(duì)特征提取影響很大,故應(yīng)做到信噪分離以恢復(fù)原始信號(hào)波形[7]。傳統(tǒng)基于傅里葉變換的FIR濾波器去噪算法存在保護(hù)信號(hào)局部性和抑制噪音之間的矛盾,而小波變換具有更好的時(shí)頻局域化特性,能較好區(qū)分高頻信號(hào)和噪聲[3]。本文原始語音采用10s男聲語音,加入六種不同強(qiáng)度的噪聲后通過MATLAB編程工具計(jì)算語音去噪后的信噪比。與傳統(tǒng)FIR濾波器去噪的算法得到的信噪比相比,小波變換去噪的算法能更為明顯的提高信噪比。因此小波變換去噪的效果較傳統(tǒng)傅里葉變換去噪有大幅度提升,可以優(yōu)化電子偽裝音識(shí)別效果。
關(guān)鍵詞:小波變換;信噪比;語音降噪處理
引言
電子偽裝音常常伴隨著噪音,在進(jìn)行偽裝檢測(cè)前,需經(jīng)過一系列預(yù)處理,以提高鑒別率。在預(yù)處理中,去噪的效果好壞會(huì)直接影響偽裝語音的鑒別率[7],所以選擇一種信噪比更高的去噪算法,在偽裝音識(shí)別中是非常重要的。傳統(tǒng)傅里葉變換后濾波的去噪方法很難將語音信號(hào)與噪聲信號(hào)分離開。隨著語音去噪研究的深入和新思想的引入,產(chǎn)生了很多新的語音去噪方法,如信號(hào)子空間分解[5]、人工神經(jīng)網(wǎng)絡(luò)、人耳聽覺掩蔽[6]和基于小波變換等語音去噪算法。
本文采用了小波變換的方法進(jìn)行語音去噪處理。波分析的理論是由數(shù)學(xué)發(fā)展而來的,它是數(shù)學(xué)快速發(fā)展產(chǎn)生的新領(lǐng)域,1986年建立的Mallat算法實(shí)現(xiàn)了小波分析從數(shù)學(xué)到技術(shù)的轉(zhuǎn)變。由于語言信號(hào)的非平穩(wěn)特性,用傳統(tǒng)傅里葉變換的方法不能很好地展現(xiàn)出來,而使用小波變換能很好的體現(xiàn)出信號(hào)的相關(guān)性,比傳統(tǒng)傅里葉變換有更大的優(yōu)勢(shì)[3],在語音去噪方面的應(yīng)用也不例外。電子偽裝音伴隨著大量的噪聲,而傳統(tǒng)的基于傅立葉變換的FIR濾波器利用噪聲一般集中在高頻的特點(diǎn),去噪只能去除明顯的高頻噪聲,處理低頻段的噪聲效果卻不佳。由于小波變換具有良好的時(shí)頻局域化性質(zhì),在高頻部分能很好地區(qū)分高頻信號(hào)與噪聲,保留更多的信號(hào)細(xì)節(jié)[4],所以本文使用的基于小波變換的語音降噪算法能夠很好地彌補(bǔ)基于傅里葉變換去噪的缺陷。
2 語音去噪算法
2.1 FIR低通濾波器去噪法
數(shù)字濾波器去噪法一般利用FIR低通濾波器去噪,通過窗函數(shù)的參數(shù)設(shè)計(jì),將低頻信號(hào)保留,高頻噪聲信號(hào)濾去,使得信號(hào)在頻域上趨于平滑,達(dá)到語音去噪的效果[9]。窗函數(shù)的設(shè)計(jì)如下:首先,根據(jù)過渡帶寬及阻帶衰減要求,選擇窗函數(shù)的類型并估計(jì)窗口長(zhǎng)度N,在確定窗函數(shù)類型以后,根據(jù)過渡帶寬小于給定指標(biāo)確定所擬用的窗函數(shù)的窗口長(zhǎng)度N,設(shè)待求濾波器的過渡帶寬為Δω,它與窗口長(zhǎng)度N近似成反比,根據(jù)待求濾波器的理想頻率響應(yīng)求出理想單位脈沖響應(yīng)hd (n),假設(shè)待求濾波器頻率應(yīng)為Hd (ejw),則理想的單位脈沖響應(yīng)可以用下面的傅里葉反變換式求出:
(1)
一般情況下,hd (n)不能用封閉公式表示,需要采用數(shù)值方法表示。
窗函數(shù)設(shè)計(jì)法的基本原理是用有限長(zhǎng)單位脈沖響應(yīng)序列h(n)逼近hd (n)。由于hd (n)往往是無限長(zhǎng)序列,而且是非因果的,故用窗函數(shù)ω(n)將hd (n)截?cái)啵⑦M(jìn)行加權(quán)處理,得到:
(2)
h(n)就是實(shí)際設(shè)計(jì)的FIR數(shù)字濾波器的單位脈沖響應(yīng)序列,其頻率響應(yīng)函數(shù)H(ejw)為
(3)
式中,N為所選窗函數(shù)ω(n)的長(zhǎng)度。
2.2小波去噪法
小波去噪的本質(zhì)是將信號(hào)和噪聲的小波變換在小波域進(jìn)行有效的分離,在小波域有效信號(hào)對(duì)應(yīng)的系數(shù)很大,噪聲對(duì)應(yīng)的系數(shù)很小,高頻噪聲與信號(hào)易區(qū)分。小波變換繼承和發(fā)展了短時(shí)傅里葉變換局部化的思想,同時(shí)又克服了窗口大小不隨頻率變化等缺點(diǎn),能給出一定頻率的信號(hào)隨時(shí)間變化的能量分布。
如圖1所示,待處理語音被處理為平均信息(低頻信息)與細(xì)節(jié)信息(高頻信息),用平均信息可近似的表示原語音信號(hào)的壓縮結(jié)果[2],它保留了信號(hào)最基本的信息。丟失的細(xì)節(jié)信息將不會(huì)對(duì)最終信號(hào)的重構(gòu)造成大的影響。
小波去噪的算法為以下四個(gè)步驟:
(1)小波正交變換:選取合適的小波基進(jìn)行小波分解,得到各尺度小波系數(shù)。小波基函數(shù)在處理信號(hào)時(shí)各有特點(diǎn),沒有任何一種小波基函數(shù)可以對(duì)所有類型信號(hào)都取得最優(yōu)的去噪效果[10],此文采用Haar與db4兩種小波基。
Haar小波是具有緊支撐的正交小波函數(shù),它的支撐域在tε[0,1]范圍內(nèi)的單個(gè)矩形波,定義為
db4小波是非對(duì)稱的正交小波,其相應(yīng)的濾波器組為共軛正交鏡像濾波器組。尺度函數(shù)φ(t)的支撐范圍在t=0~7,φ(t)的支撐范圍在-3~4。
連續(xù)小波變換表示為以下式子,其中,τ:位移 α:尺度因子:
(2)對(duì)小波系數(shù)進(jìn)行N層小波分解:N取得越大,噪聲和信號(hào)表現(xiàn)的不同特性越明顯,越有利于二者的分離;但分解層數(shù)越大,重構(gòu)到的信號(hào)失真也會(huì)越大,在一定程度上又會(huì)影響最終去噪的效果。
(3)對(duì)分解得到的小波系數(shù)進(jìn)行非線性閾值處理:保留所有低頻變換系數(shù)以保持信號(hào)的整體形狀不變,對(duì)每個(gè)小波系數(shù)進(jìn)行閾值處理,如可對(duì)小于閾值的收縮或置零,大于閾值的保留。此文采用Matlab全局默認(rèn)閾值。
(4)小波逆變換重構(gòu)信號(hào):對(duì)經(jīng)過上述步驟的小波系數(shù)做小波逆變換,得到去噪信號(hào)。
3 分析及仿真結(jié)果
本實(shí)驗(yàn)使用的編程工具為美國(guó)MathWorks公司出品的數(shù)學(xué)軟件MATLAB R2017a,通過仿真給出具體的實(shí)驗(yàn)結(jié)果(信噪比)。實(shí)驗(yàn)通過不同去噪算法所得去噪語音信噪比如表1所示。
其中,隨機(jī)高斯噪聲由MATLAB中randn()函數(shù)生成,噪聲babble來自Perception-TNO研究所的NoiseX-92噪聲庫(kù),內(nèi)容為100人在食堂說話,房間半徑超過2米。將兩種噪聲分別降低10dB和15dB,對(duì)比不同強(qiáng)度噪聲下的信噪比。
實(shí)驗(yàn)采用的原始語音信號(hào)為10s的男聲,普通話。
通過實(shí)驗(yàn)發(fā)現(xiàn),在同一噪聲下,小波去噪算法的信噪比明顯高于傳統(tǒng)FIR濾波器去噪算法的信噪比。使用db4小波進(jìn)行去噪處理的信噪比也高于使用haar小波處理后的信噪比。
由去噪前后的時(shí)域波形圖可看出,db4小波去噪后的語音波形更為平滑,而haar小波的波形圖鋸齒形明顯,因此使用db4小波去噪的失真度較小。
4 結(jié)束語
通過實(shí)驗(yàn)得到的信噪比表格(表1)可知,與傳統(tǒng)FIR濾波器去噪的算法相比, 利用小波變換去噪的算法能更為明顯的提高信噪比效果,即對(duì)原始語音的降噪的效果更好。小波變換可以針對(duì)不同的應(yīng)用需求,靈活地選擇小波基,本文采用了haar和db4兩種小波基,由圖2可知,db4小波與haar小波相比之下,信號(hào)波形更平滑,失真度更小,信噪比也更大[1],是本文采用的三種語言去噪算法中最優(yōu)的。