暢江++張雪英++李鳳蓮
摘 要: 針對(duì)應(yīng)用壓縮感知理論對(duì)含噪語音進(jìn)行去噪其信噪比低的問題,以及應(yīng)用譜減法對(duì)含噪語音去噪后語音信號(hào)仍不清晰的情況,提出幀間自適應(yīng)的壓縮感知譜減去噪方法。同時(shí),由于傳統(tǒng)壓縮感知理論不能使語音信號(hào)在重構(gòu)時(shí)實(shí)現(xiàn)幀間自適應(yīng)的去噪效果,對(duì)此缺陷提出一種改進(jìn)算法,并且將該算法應(yīng)用到譜減法的去噪過程中。相比于經(jīng)典的譜減法,實(shí)驗(yàn)結(jié)果表明,所提算法對(duì)含噪語音進(jìn)行去噪不僅可以提高含噪語音的去噪效果,還可以有效地解決譜減法無法去除背景噪聲及音樂噪聲的問題。
關(guān)鍵詞: 壓縮感知; 譜減法; 語音去噪; 正交匹配追蹤算法
中圖分類號(hào): TN912.3?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)09?0014?04
Abstract: Since the noisy speech denoising based on compressed sensing theory has low signal?to?noise ratio, and the spectrum subtraction used to denoise the noisy speech still has poor speech signal, a speech denoising method based on adaptive inter?frame compressed sensing of spectrum subtraction is put forward. The traditional compressed sensing theory can′t realize the adaptive inter?frame denoising effect while reconstructing the speech signal, so an improved algorithm is proposed, and applied to the denoising process of the spectrum subtraction. The experimental results show that, in comparison with the classical spectrum subtraction, the proposed algorithm used to denoise the noisy speech can improve the denoising effect of the noisy speech, and effectively eliminate the background noise and music noise that the spectrum subtraction can′t do.
Keywords: compressed sensing; spectrum subtraction; speech denoising; orthogonal matching pursuit algorithm
0 引 言
目前,有越來越多的研究已證明壓縮感知(Compressed Sensing,CS)理論[1]能夠使語音信號(hào)在較大的壓縮比下達(dá)到較好的重構(gòu)效果[2?4]。此外,還有研究指出該理論可以提高語音信號(hào)的抗噪性能,例如文獻(xiàn)[5]指出,若噪聲分布已知時(shí),通過修改壓縮感知的約束條件,用基追蹤(Basis pursuit,BP)算法就可抑制噪聲。文獻(xiàn)[6?8]提出可采用自適應(yīng)基追蹤的方法對(duì)語音信號(hào)進(jìn)行去噪。雖然CS理論可以被用來進(jìn)行語音去噪,但對(duì)于噪聲較強(qiáng)的語音信號(hào),單獨(dú)使用CS理論無法獲得理想的去噪效果,因此要想采用CS理論對(duì)語音信號(hào)進(jìn)行去噪,就需要對(duì)該理論本身進(jìn)行改進(jìn),或結(jié)合其他理論[9]。
本文根據(jù)譜減法[10]能簡(jiǎn)單有效地去除語音信號(hào)中多數(shù)噪聲的優(yōu)點(diǎn)以及去噪后的語音仍含有大量背景噪聲和音樂噪聲的缺點(diǎn),提出幀間自適應(yīng)的壓縮感知譜減(Adaptive Inter?frame Compressed Sensing of Spectrum Subtraction,AICSSS)去噪方法,并將該方法用于含噪語音的去噪處理中,其中CS的重構(gòu)算法采用正交匹配追蹤(Orthogonal Matching Pursuit,OMP)算法,但OMP算法在重構(gòu)時(shí)必須根據(jù)預(yù)先估計(jì)好的稀疏度進(jìn)行重構(gòu),而實(shí)際上,稀疏度通常不可知,對(duì)于語音信號(hào)而言,語音信號(hào)經(jīng)分幀進(jìn)行稀疏化處理后,其每一幀的稀疏度都是完全不同的,所以不能用一個(gè)固定的稀疏個(gè)數(shù)對(duì)每一幀語音信號(hào)進(jìn)行重構(gòu)。為此本文進(jìn)一步提出了一種幀間自適應(yīng)的OMP算法,并將該算法與譜減法結(jié)合對(duì)含噪語音進(jìn)行去噪處理。實(shí)驗(yàn)結(jié)果表明,本文的方法能有效修正應(yīng)用譜減法對(duì)含噪語音去噪后存在背景噪聲和音樂噪聲的缺陷,并且還能改進(jìn)單獨(dú)使用CS理論對(duì)含噪語音信號(hào)的處理效果。
1 壓縮感知理論模型
2 語音信號(hào)的幀間自適應(yīng)OMP算法
2.1 幀間自適應(yīng)OMP算法的基本原理
雖然傳統(tǒng)的OMP[12?13]算法具有重構(gòu)效果好,算法復(fù)雜度低的優(yōu)點(diǎn),但它卻無法在稀疏度未知的情況下進(jìn)行重構(gòu)。在實(shí)際的仿真實(shí)驗(yàn)中,語音信號(hào)經(jīng)分幀稀疏化處理以后,不僅稀疏個(gè)數(shù)是未知的,而且對(duì)于每一幀的語音信號(hào)來說,其稀疏度都有很大不同。為此,本文對(duì)傳統(tǒng)的OMP算法進(jìn)行改進(jìn),提出一種幀間自適應(yīng)的OMP算法。
所謂的幀間自適應(yīng)就是在應(yīng)用CS理論重構(gòu)語音信號(hào)時(shí),根據(jù)每幀語音信號(hào)稀疏度的不同,自動(dòng)估算出語音信號(hào)重構(gòu)時(shí)所需要的稀疏個(gè)數(shù)從而達(dá)到自適應(yīng)重構(gòu)語音信號(hào)的目的。
幀間自適應(yīng)OMP算法是在傳統(tǒng)OMP算法的基礎(chǔ)上去掉預(yù)先設(shè)定好的稀疏度,并在每次重構(gòu)信號(hào)時(shí)采用殘差逐步逼近的方法自動(dòng)終止迭代,而程序的迭代次數(shù)即為所需要的稀疏度。
圖1為該算法的流程框圖,其中,為每次迭代時(shí)重構(gòu)信號(hào)的殘差,如果殘差小于某個(gè)設(shè)定值則停止迭代,但為了防止迭代過程中殘差未能小于某個(gè)設(shè)定值而出現(xiàn)反復(fù)迭代的現(xiàn)象,又設(shè)定了一個(gè)迭代次數(shù)的最大值作為終止條件,這樣就完成了語音信號(hào)的幀間自適應(yīng)重構(gòu)。
2.2 幀間自適應(yīng)OMP算法的去噪原理
由于語音信號(hào)經(jīng)稀疏化后,其噪聲信號(hào)的稀疏度非常大,且明顯大于其有用信號(hào)的稀疏度,為了能使改進(jìn)后的OMP算法在重構(gòu)時(shí)就達(dá)到對(duì)語音信號(hào)進(jìn)行去噪的目的,需要分別進(jìn)行兩方面的操作:一是在信號(hào)進(jìn)行稀疏化時(shí),通過設(shè)置信號(hào)的壓縮比,就可先濾除部分噪聲;二是在重構(gòu)語音信號(hào)時(shí),需要估算出信號(hào)的稀疏個(gè)數(shù),若當(dāng)某一幀的稀疏個(gè)數(shù)遠(yuǎn)小于其他幀的稀疏個(gè)數(shù)時(shí),則可認(rèn)為該段語音幀為噪聲幀,可通過限制其稀疏度閾值的方式將噪聲濾除。
通過上述原理就可以濾除語音信號(hào)中的部分噪聲,經(jīng)實(shí)驗(yàn)發(fā)現(xiàn),在低噪聲背景下,采用OMP算法去噪可以得到更高的PESQ值,這說明其主觀質(zhì)量評(píng)價(jià)要好于經(jīng)典的譜減法,從實(shí)際聽覺效果來說它能有效濾除背景噪聲,但是對(duì)于背景噪聲較強(qiáng)的語音噪聲,OMP算法去噪重構(gòu)后的效果并不好。
3 譜減法去噪模型
4 AICSSS去噪方法
由于譜減法計(jì)算簡(jiǎn)單,去噪后的信噪比較高,但主觀語音質(zhì)量評(píng)價(jià)較低,而CS重建后的語音雖然在強(qiáng)噪聲環(huán)境下信噪比較低,但其主觀質(zhì)量評(píng)價(jià)要高于譜減法去噪?;诙叩膬?yōu)缺點(diǎn),本文提出AICSSS去噪方法。該方法能夠有效改善上述兩種方法的缺點(diǎn),提高語音信號(hào)的抗噪性能。
原始語音信號(hào)經(jīng)過譜減法去噪后仍然含有大量背景噪聲,而這些噪聲經(jīng)變換域變換后得到的稀疏個(gè)數(shù)要遠(yuǎn)小于有效信號(hào)的稀疏個(gè)數(shù),根據(jù)這個(gè)原理,就可以依據(jù)CS理論,調(diào)整稀疏度的閾值對(duì)語音信號(hào)進(jìn)行去噪。該閾值的選取為實(shí)驗(yàn)得出,閾值選取的越大,去噪效果也就越明顯,但閾值太大就會(huì)影響到所需語音的重構(gòu)效果,因此在選取閾值方面要根據(jù)噪聲的強(qiáng)度而定,噪聲強(qiáng)度大那么設(shè)定的閾值就大,噪聲強(qiáng)度小,設(shè)定的閾值就小。該方法的具體步驟為:
步驟1:將讀入的語音信號(hào)進(jìn)行分幀加窗,采用DCT矩陣對(duì)信號(hào)進(jìn)行稀疏化,調(diào)節(jié)其壓縮比,并求出帶噪語音的功率譜和噪聲功率譜
步驟2:用得到降噪后語音的功率譜開方后即為譜減法初步降噪的語音幅度譜
步驟3:采用高斯隨機(jī)矩陣對(duì)初步降噪的語音幅度譜進(jìn)行觀測(cè),得到觀測(cè)值同時(shí)初始化殘差索引集為空集,迭代次數(shù)設(shè)置迭代終止條件
步驟4:找出殘差和感知矩陣乘積中最大值所對(duì)應(yīng)的位置;根據(jù)噪聲強(qiáng)度,設(shè)置稀疏度的閾值,并且更新索引集
步驟5:通過最小二乘法得到的系數(shù)逼近并求出每幀信號(hào)的稀疏度,把稀疏度大于的信號(hào)幀置零,同時(shí)更新殘差和迭代次數(shù)
步驟6:判斷是否滿足若滿足則停止迭代,不滿足則跳至步驟(4)。
5 實(shí)驗(yàn)的仿真結(jié)果及分析
本文采用信噪比SNR和PESQ值的方法評(píng)估去噪后的語音質(zhì)量,其中壓縮比和信噪比SNR的公式為:
實(shí)驗(yàn)的測(cè)試軟件為Matlab,對(duì)象為10個(gè)男生和10個(gè)女生的語音。由于實(shí)際的噪聲經(jīng)白化及同態(tài)濾波處理后,都可以轉(zhuǎn)化為高斯白噪聲,所以本文采用Noisex92數(shù)據(jù)庫中的高斯白噪聲作為噪聲語音。
實(shí)驗(yàn)1:取512個(gè)樣點(diǎn)為語音信號(hào)的幀長,當(dāng)含噪語音的信噪比為0 dB,5 dB,10 dB,15 dB,20 dB時(shí),分別考察譜減法、幀間自適應(yīng)OMP算法以及AICSSS去噪方法的去噪效果,得到的實(shí)驗(yàn)結(jié)果如表1所示,在本實(shí)驗(yàn)中,除譜減法外,剩下兩種算法的壓縮比統(tǒng)一設(shè)定為0.3。
由表1可知,雖然譜減法的信噪比都優(yōu)于幀間自適應(yīng)OMP算法的信噪比,然而對(duì)于語音質(zhì)量而言,當(dāng)原始語音的信噪比大于15 dB時(shí),即使譜減法的信噪比好于幀間自適應(yīng)OMP算法的信噪比,幀間自適應(yīng)OMP算法的主觀語音質(zhì)量PESQ值都要好于譜減法?;谶@個(gè)原因,本文提出AICSSS方法就可以有效改善它們的缺陷,從表1最后一列可以看出AICSSS方法不論是從信噪比方面還是從PESQ值上效果都有所提高,在20 dB時(shí),AICSSS方法在信噪比方面提高不大,這是因?yàn)樵颊Z音信號(hào)進(jìn)行去噪以后語音的噪聲強(qiáng)度低,所以對(duì)含噪語音信號(hào)去噪后的信噪比改善不明顯。
圖2為上述三種方法在信噪比為5 dB時(shí)的效果圖,其中語音信號(hào)的壓縮比仍然為0.3,從圖中可以看出,AICSSS去噪后的效果明顯好于其他兩種方法,在實(shí)際的主觀聽音測(cè)試時(shí),語音信號(hào)的背景噪聲大大減小,并且無不連續(xù)的聲音狀態(tài)存在。
實(shí)驗(yàn)2:在與實(shí)驗(yàn)1相同的條件下,設(shè)置原始語音噪聲的信噪比為10 dB,改變壓縮比分析AICSSS算法的實(shí)驗(yàn)結(jié)果。當(dāng)原始語音的信噪比固定為10 dB時(shí),由于單獨(dú)使用譜減法時(shí)不會(huì)考慮壓縮比的變化,所以,這時(shí)單獨(dú)使用譜減法的信噪比恒為16.688,PESQ值恒為1.633。
從表2可以看出,在原始語音的信噪比為10 dB的情況下,本文算法在壓縮比為0.4時(shí)的效果最好,PESQ值最高,在壓縮比沿著0.4增大或減小時(shí),語音質(zhì)量都會(huì)逐步下降,這是因?yàn)楫?dāng)增大時(shí),含噪語音的一部分噪聲信號(hào)也被重構(gòu)出來??梢娫趬嚎s比不同時(shí),AICSSS方法的去噪效果也會(huì)有所變化。
6 結(jié) 論
本文進(jìn)一步證明了壓縮感知理論在語音信號(hào)去噪領(lǐng)域中的可行性,基于經(jīng)典的譜減法和壓縮感知的去噪重構(gòu)方法的不同優(yōu)缺點(diǎn),本文提出一種幀間自適應(yīng)的壓縮感知譜減去噪方法,該方法不僅克服了譜減法具有背景噪聲和音樂噪聲的缺點(diǎn),同時(shí)也相對(duì)的改善了壓縮感知理論在較大背景噪聲下重構(gòu)效果不理想的情況。另外,本文還比較了在不同壓縮比的情況下本文算法的實(shí)驗(yàn)效果,實(shí)驗(yàn)結(jié)果表明,在相同的背景噪聲下,信號(hào)重構(gòu)時(shí)壓縮比不同會(huì)對(duì)語音信號(hào)的去噪效果有直接影響。關(guān)于壓縮感知理論在含噪語音中的應(yīng)用還有待進(jìn)一步的研究。
參考文獻(xiàn)
[1] DONOHO D. Compressive sampling [J]. IEEE transactions on information theory, 2006, 52(4): 1289?1306.
[2] LOW S Y, PHAM D S, VENKATESH S. Compressive speech enhancement [J]. Speech communication, 2013, 55(6): 757?768.
[3] DONOHO D L, ELAD M, TEMLYAKOV V N. Stable recovery of sparse overcomplete representations in the presence of noise [J]. IEEE transactions on information theory, 2006, 52(1): 6?18.
[4] SHARMA P, ABROL V, SAO A K. Compressed sensing for unit selection based speech synthesis [C]// Proceedings of 2015 23rd European Signal Processing Conference. [S.l.]: IEEE, 2015: 1731?1735.
[5] TSAIG Y, DONOHO D L. Extension of compressed sensing [J]. Signal processing, 2006, 86(3): 549?571.
[6] 孫林慧,楊震.基于自適應(yīng)基追蹤去噪的含噪語音壓縮感知[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,31(5):1?6.
[7] 程經(jīng)士.壓縮感知理論在語音信號(hào)去噪中的應(yīng)用[J].現(xiàn)代電子技術(shù),2012,35(7):84?85.
[8] DO T T, LU G, NAM N, et al. Sparsity adaptive mating pursuit algorithm for practical compressed sensing [C]// Proceedings of 2008 42nd Asilomar Conference on Signals, Systems and Computers. Pacific Grove: IEEE, 2008: 581?587.
[9] 李鳳蓮,暢江,張雪英,等.基于壓縮感知的語音盲稀疏重構(gòu)算法及其去噪應(yīng)用[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(1):164?170.
[10] PARDEDE H, IWANO K, SHINODA K. Spectral subtraction based on non?extensive statistics for speech recognition [J]. IEICE transactions on information & systems, 2013, 96(8): 1774?1782.
[11] JI Y, YANG Z. Study on adaptive compressed sensing & reconstruction of quantized speech signals [J]. Journal on advances in signal processing, 2012(1): 1?21.
[12] TROPP J, GILBERT A C. Signal recovery from random measurements via orthogonal matching pursuit [J]. IEEE transactions on information theory, 2008, 53(12): 4655?4666.
[13] 劉記紅,黎湘,徐少坤,等.基于改進(jìn)正交匹配追蹤算法的壓縮感知雷達(dá)成像方法[J].電子與信息學(xué)報(bào),2012,34(6):1344?1350.
[14] YKHLEF F. An efficient solution to improve the spectral noise suppression rules [J]. Digital signal processing, 2013, 23(5): 1578?1584.
[15] 高留洋,朱文,桑振夏,等.一種基于改進(jìn)的譜減法的語音增強(qiáng)算法[J].現(xiàn)代電子技術(shù),2012,35(7):60?62.