文小方,張玲華,高婉貞
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
基于小波去噪的自適應(yīng)波束形成算法研究
文小方,張玲華,高婉貞
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
語音增強算法是數(shù)字助聽器的一項關(guān)鍵技術(shù)。廣義旁瓣抵消器自適應(yīng)波束形成算法對受固定干擾源影響的目標(biāo)語音有良好的消噪效果。針對廣義旁瓣抵消器自適應(yīng)波束形成算法帶來的語音泄漏以及殘留噪聲問題,在分析語音泄漏原因的基礎(chǔ)上,引進了小波閾值去噪技術(shù),提出了基于小波去噪的自適應(yīng)波束形成算法。該算法在對原始語音進行小波閾值去噪后,將去噪后的語音信號通過GSC結(jié)構(gòu),從而得到輸出語音信號。因小波閾值去噪既能提高語音通過GSC結(jié)構(gòu)前的信噪比,又能使通過GSC結(jié)構(gòu)后的語音更加準(zhǔn)確,一定程度上減少了語音的泄漏,降低了殘留噪聲的發(fā)生,提高了語音的辨識度。實驗結(jié)果表明,所提出的算法使得算法性能有所提高,從而達到了增強語音的目的。
廣義旁瓣抵消器;語音泄漏;小波閾值去噪;語音辨識度
隨著科技的不斷發(fā)展,人類的生活環(huán)境變得復(fù)雜起來。在各種通訊領(lǐng)域,如:手機通信、固定電話、助聽器等,語音信號都不可避免地受到各種噪聲的干擾,這些干擾降低了語音的質(zhì)量[1]。因此需要用去噪來達到語音增強的效果。目前,語音增強方法有很多種,根據(jù)麥克風(fēng)的數(shù)目可分為單麥克風(fēng)系統(tǒng)和麥克風(fēng)陣列系統(tǒng)[2]?,F(xiàn)如今由于實際環(huán)境噪聲的復(fù)雜性,單麥克風(fēng)系統(tǒng)已經(jīng)無法實現(xiàn)很好的消噪效果。麥克風(fēng)陣列信號[3]采用的是廣義旁瓣對消的思想:用“電子瞄準(zhǔn)”的形式從聲源位置獲取高品質(zhì)的語音信號,同時抑制其他聲音以及環(huán)境噪聲,具有很好的空間選擇性。目前關(guān)于語音增強的研究工作主要集中于麥克風(fēng)陣列信號處理[4],包括固定波束形成(Fixed Beamforming,FBF)、自適應(yīng)波束形成[5]算法(Adaptive Beamforming,ABF)和帶有后置濾波器的波束形成算法。其中自適應(yīng)波束形成算法又包括最小方差無失真響應(yīng)(MVDR)波束形成算法、廣義旁瓣抵消器(GSC)結(jié)構(gòu)的波束形成算法以及Hoshuyama的GSC結(jié)構(gòu)波束形成算法。在實際應(yīng)用中,GSC結(jié)構(gòu)波束形成算法應(yīng)用廣泛,由三個部分組成:固定波束形成器(FBF)、阻塞矩陣(Blocking Matrix,BM)、多輸入抵消器(Multiple-input Canceller,MC)。然而該算法在MC模塊存在殘留噪聲和語音泄漏問題。針對該問題,Hoshuyama曾提出了基于GSC結(jié)構(gòu)的魯棒自適應(yīng)約束波束形成(CCAF-NCAF)結(jié)構(gòu),以減少語音泄漏[6];文獻[7]提出了一種多通道補償算法,對共振峰結(jié)構(gòu)進行保護,同樣減少了語音泄漏。
為此,在對GSC結(jié)構(gòu)原理進行分析的基礎(chǔ)上,圍繞語音泄漏的原因,提出在GSC結(jié)構(gòu)處理前添加小波閾值去噪算法[8]。實驗結(jié)果表明,改進算法可以提高語音辨識率,改善語音質(zhì)量,達到語音增強[9]的效果。
廣義旁瓣抵消器[10]的波束形成器實際上是自適應(yīng)波束形成的一般模型,該系統(tǒng)結(jié)構(gòu)可以分為上下兩支路,即將算法分為三個模塊。該算法無論是理論研究還是工程應(yīng)用中都很普及,因為GSC結(jié)構(gòu)的波束形成算法中沒有線性約束,算法消噪效果較好。其算法模型結(jié)構(gòu)如圖1所示。
圖1 廣義旁瓣抵消波束形成結(jié)構(gòu)框架圖
GSC結(jié)構(gòu)的基本原理如下:假設(shè)輸入原始語音信號有M路,上支路通過時延估計[11]得到信號的時延以及角度。對各路麥克風(fēng)接收到的信號進行時延補償,使各路通道語音信號盡可能達到同步。再將陣列接收信號分別向兩個正交的子空間投影,上支路對各路信號進行加權(quán)求和,權(quán)重為a(θ0),得到初步增強的語音信號,即d0(k)。
根據(jù)圖1可得:
(1)
(2)
(3)
X0(k)=B0X(k)
(4)
(5)
GSC結(jié)構(gòu)算法中很關(guān)鍵的一部分就是阻塞矩陣的設(shè)計[12],使Ba(θ0)=0,即必須滿足B0的每行元素之和為0,在這里選用常用的一個阻塞矩陣:
由于麥克風(fēng)陣列位置的偏差,麥克風(fēng)增益的不同,以及環(huán)境中存在混響、干擾,目標(biāo)方向估計存在誤差等因素,使得在BM模塊中,阻塞矩陣只濾除了大部分的純語音信號,同時屏蔽了少部分的噪聲。在MC模塊中,存在部分的語音和參考噪聲混在一起。這樣就不可避免地導(dǎo)致參考噪聲不可能完全抵消原語音信號中混有的噪聲,因此最終的語音信號存在殘留噪聲和部分的語音泄漏,這也是GSC結(jié)構(gòu)固有的弊端。文中直接選用語音庫一段比較純凈的語音,其中采樣頻率為16 kHz,在信噪比SNR=-5 dB的白噪聲環(huán)境下,原語音方向是0°,干擾源方向是30°,有方向估計誤差為3°條件下進行仿真實驗。
圖2是將原始語音通過GSC結(jié)構(gòu)處理后得到的仿真圖。
其中,(a)是一段純凈的語音波形“中央革命根據(jù)地”;(b)是加入SNR=-5 dB的白噪聲;(c)是經(jīng)過GSC結(jié)構(gòu)處理后的波形,其中方向估計誤差為3°;(d)是因為目標(biāo)方向估計誤差產(chǎn)生的泄露語音。
通過分析比較GSC結(jié)構(gòu)處理前后的語音信號頻譜圖和語譜圖,找出語音泄漏的地方,以及GSC結(jié)構(gòu)處理后輸出語音的受損程度,進而提出改進算法。
圖2 傳統(tǒng)GSC結(jié)構(gòu)語音增強仿真圖
為了能更有效地消除殘留噪聲,減少原語音的泄漏,提高語音的辨識度,提出在GSC結(jié)構(gòu)處理前,對原始語音進行小波閾值去噪,信噪比有所提高,此時再將去噪后的語音信號通過GSC結(jié)構(gòu)時,結(jié)果會更加準(zhǔn)確,因此能有效消除殘留噪聲并且減少語音的泄漏。其關(guān)鍵是提高含噪語音的信噪比。算法主要分為五個部分:
(1)將含噪信號進行預(yù)處理,包括分幀、預(yù)加重、端點檢測。
(2)使用小波函數(shù)對信號進行多尺度分解,得出各尺度小波系數(shù)。常見的小波基有Haar小波基、db系列小波基、Coiflets小波基、Symlets小波基等。文中選取Symlets小波基。
(3)對各尺度小波系數(shù)進行閾值處理。
(4)利用小波逆變換重構(gòu)語音信號。
(5)將小波閾值去噪后的語音信號通過GSC結(jié)構(gòu),得到最終輸出的語音信號。
原理框圖如圖3所示。
圖3 小波閾值去噪結(jié)構(gòu)框圖
2.1 小波閾值去噪算法
Donoho提出的小波閾值去噪是目前工程運用中最廣泛的方法。由于有用信號和混有的噪聲經(jīng)過小波變換后統(tǒng)計特性不一樣,即信號能量集中在一些大的小波系數(shù)中,而噪聲能量分散在整個小波域中。在小波域小波系數(shù)幅值大一點的對應(yīng)有用信號,幅值小一點的對應(yīng)噪聲信號。即經(jīng)過小波分解后,噪聲系數(shù)小于信號系數(shù)。因此找到一個臨界值th為閾值,如果分解系數(shù)大于閾值,則主要由信號引起;反之,主要由噪聲引起[8]。把主要由信號引起的這一部分保留下來,用得到的小波系數(shù)進行小波重構(gòu),得到去除噪聲之后的信號[8]。傳統(tǒng)的小波閾值去噪方法[13]分為兩種:
(1)硬閾值法。
當(dāng)小波系數(shù)絕對值小于閾值th時,則將其置為0;當(dāng)小波系數(shù)絕對值大于等于閾值th時,則小波系數(shù)保持不變。
(6)
(2)軟閾值法。
當(dāng)小波系數(shù)絕對值小于閾值th時,則將其置為0;當(dāng)小波系數(shù)絕對值大于等于閾值th時,則取小波系數(shù)絕對值與閾值的差值。
(7)
在文獻[13]中,通過比較硬閾值法,軟閾值法以及提出的改進多項式插值法,發(fā)現(xiàn)改進多項式插值法消噪效果更佳。因此,文中選用改進多項式插值法:
(8)
(9)
通過式(9)可以看出,改進的多項式法在整個定義域內(nèi)既連續(xù)也可導(dǎo),避免了硬閾值法的不連續(xù)性,同時,在|Wj,k|>t的范圍內(nèi),由于Wi,j是無偏估計,因此改進的多項式法也同樣避免了軟閾值法的不足。
2.2 實驗與仿真
通過Matlab仿真實現(xiàn)文中改進算法,如圖4和圖5所示。
圖4 GSC結(jié)構(gòu)處理后的語音以及語音泄漏
圖5 改進算法處理后的語音以及語音泄漏
經(jīng)過圖4和圖5比較可知,小波閾值去噪相對傳統(tǒng)算法而言,提高了語音信號的信噪比,減少通過GSC結(jié)構(gòu)產(chǎn)生的殘留噪聲,并且減少了語音泄漏。另外,在文獻[7]的基礎(chǔ)上,文中進行了聽力辨別試驗[14]。搜集200個含清輔音的詞語,如果聽力正常的試驗者能準(zhǔn)確說出每個詞語,那么就能正確辨識。先將這150個詞語分別在信噪比為-5,-3,0,5的環(huán)境下通過GSC結(jié)構(gòu)后,讓一組試驗者辨識;同理,將這200個詞語分別在同樣的信噪比情況下通過改進算法后,讓另一組試驗者辨識。兩組計算平均辨識率,如圖6所示。
由上述實驗可知,改進算法確實提高了語音的辨識度,改善了語音質(zhì)量,達到了語音增強[15]的目的。
為達到提高語音增強算法的目的,將小波閾值去噪與GSC自適應(yīng)波束形成算法進行了有機結(jié)合,提出了一種改進算法。該算法提高了通過GSC結(jié)構(gòu)前語音信號的信噪比,使得通過GSC結(jié)構(gòu)會更加準(zhǔn)確,減少了殘留噪聲以及語音泄漏。實驗測試結(jié)果表明,改進算法提高了語音的辨識度和語音增強效果。
[1] 姚 瑤.基于小波分析的語音信號增強的研究[J].信息通信,2010,5(3):59-61.
[2] 洪 鷗.麥克風(fēng)陣列語音增強技術(shù)及其應(yīng)用[J].微計算機信息,2006,22(1-1):142-144.
[3] 徐 進,趙益波,郭業(yè)才.一種新的麥克風(fēng)陣列自適應(yīng)語音增強方法[J].應(yīng)用科學(xué)學(xué)報,2015,33(2):187-193.
[4] Cornelis B,Doclo S,Tim V D B,et al.Theoretical analysis of binaural multi-microphone noise reduction techniques[J].IEEE Transactions on Audio,Speech,and Language Processing,2010,18(2):342-355.
[5] McCowan I A, Moore D C, Sridharan S. Near-field adaptive beamformer for robust speech recognition[J].Digital Signal Processing,2002,12(1):87-106.
[6] Hoshuyama O,Sugiyama A,Hirano A.A robust adaptive be-amformer for micro-phone arrays with a blocking matrix using constrained adaptive filters[J].IEEE Transactions on Signal Processing,1999,47(10):2677-2684.
[7] 高婉貞,張玲華,曹旭來,等.基于GSC結(jié)構(gòu)的多通道語音補償算法研究[J].南京郵電大學(xué)學(xué)報:自然科學(xué)版,2014,34(4):51-56.
[8] 吳光文,王昌明,包建東,等.基于自適應(yīng)閾值函數(shù)的小波閾值去噪方法[J].電子與信息學(xué)報,2014,36(6):1340-1347.
[9] Lallouani A, Gabrea M, Gargour C S.Wavelet based speech enhancement using two different threshold based denoising algorithms[C]//Canadian conference on electrical and computer engineering.[s.l.]:[s.n.],2004:315-318.
[10] Gannot S,Cohen I.Speech enhancement based on the general transfer function GSC and postfiltering[J].IEEE Transactions on Speech and Audio Processing,2004,12(6):561-571.
[11] Rui Y,Florencio D.Time delay estimation in the presence of correlated noise and reverberation[C]//IEEE international conference on acoustics,speech,and signal processing.[s.l.]:IEEE,2004:133-136.
[12] Nordebo S,Claesson I,Nordholm S.Adaptive beamforming: spatial filter designed blocking matrix[J].IEEE Journal of Oceanic Engineering,1994,19(4):583-590.
[13] 李海東,李 青.基于閾值法的小波去噪算法研究[J].計算機技術(shù)與發(fā)展,2009,19(7):56-58.
[14] 楊 琳,張建平,顏永紅.單通道語音增強算法對漢語語音可懂度影響的研究[J].聲學(xué)學(xué)報,2010,35(2):248-253.
[15] Fukane A R,Sahare S L.Enhancement of noisy speech singnals for hearing aids[C]//International conference on computational intelligence & communication networks.[s.l.]:[s.n.],2011:648-652.
Investigation on Adaptive Beamforming Algorithm with Wavelet Denoising
WEN Xiao-fang,ZHANG Ling-hua,GAO Wan-zhen
(College of Telecommunication & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Speech enhancement algorithm is a key technique in digital hearing aid.The Generalized Sidelobe Canceller (GSC) adaptive beamforming algorithm can effectively remove the fixed interference source noise in the target speech.Aimed at the residual noise and speech leakage problems caused by the generalized sidelobe canceller adaptive beamforming algorithm,on the basis of analysis on the reasons for speech leakage and introduction of wavelet threshold denoising technology,the adaptive beamforming algorithm based on wavelet denoising has been proposed.After the denoising of wavelet threshold value has employed to deal with original speech,the outputs of audio signal through GSC structure obtained.Since wavelet threshold,value denoising can improve the SNR of the speech signal effectively and can reduce speech leakage with certain content,and enhance the speech recognition.The experimental results show that performance of the improved algorithm and the effects of speech enhancement have been achieved.
generalized sidelobe canceller;speech leakage;wavelet threshold denoising;speech recognition
2016-06-16
2016-10-19 網(wǎng)絡(luò)出版時間:2017-04-28
江蘇省教育自然科學(xué)研究重大項目(13KJA510003);江蘇高校優(yōu)勢學(xué)科建設(shè)工程資助項目(PAPD)
文小方(1991-),女,碩士研究生,研究方向為現(xiàn)代語音處理與通信技術(shù);張玲華,教授,博士生導(dǎo)師,通信作者,研究方向為語音處理與現(xiàn)代語音通信技術(shù)、無線通信中的信號處理。
http://kns.cnki.net/kcms/detail/61.1450.TP.20170428.1702.026.html
TP301.6
A
1673-629X(2017)06-0169-04
10.3969/j.issn.1673-629X.2017.06.035