張連俊 朱金如
語音增強(qiáng)的目的可分為:一是降低噪聲的干擾,提高信噪比,使聽者容易識別出說者所說的內(nèi)容,這是對語音質(zhì)量的一種主觀評價;二是提高語音的可懂度,使聽者容易明白,這是對語音質(zhì)量的一種客觀評價。本文采用譜減法與小波相結(jié)合的方法對語音增強(qiáng)。
譜減法可分為:根據(jù)幅度進(jìn)行抑制噪聲的方法,稱為幅度譜減法;根據(jù)功率進(jìn)行抑制噪聲的方法,稱為功率譜減法,本文主要采用功率譜減法。
假設(shè)純凈的語音信號為s(n),噪聲信號為d(n),帶噪語音為y(n),語音信號為平穩(wěn)信號,同時噪聲信號和語音信號為加性信號,并且d(n)和y(n)不相關(guān),滿足
其中N 為信號長度,0≤n≤N-1。根據(jù)幅度譜減法的工作原理,需要對信號進(jìn)行加窗處理,經(jīng)過加窗處理后,帶噪語音y(n)在時域內(nèi)可以表示為若語音信號和噪聲信號具有不相關(guān)性,則帶噪語音信號的功率譜可用式(3)表示
原始語音的功率譜估值可以用式(4)所表示
其中|Dw(w)|2是在無語音段估計(jì)而來。功率譜減法的原理如圖1。
圖1 功率譜減法原理圖
譜減法實(shí)現(xiàn)語音增強(qiáng)需要在頻域內(nèi)用帶噪語音的短時功率譜減去相應(yīng)的噪聲譜,因此譜減法具有一定的優(yōu)點(diǎn),即算法簡單。由于減去噪聲譜后得到的增強(qiáng)后的語音會存在一些功率譜分量的殘余部分,使其在頻域上會出現(xiàn)一些尖峰,這些尖峰相應(yīng)的就會在時域上顯示出類似于正弦信號的疊加,這種殘留噪聲類似于“音樂”,也稱為“音樂噪聲”,因此譜減法具有一定的缺點(diǎn),即具有音樂噪聲。
小波變換法是近年來發(fā)展迅速的一種時頻域局部分析方法,在低頻部分具有較高的頻率分辨率和較低的時間分辨率,在高頻部分具有較高的時間分辨率和較低的頻率分辨率,能夠?qū)⑿盘栐诙喑叨榷喾直媛噬线M(jìn)行小波分解,各尺度上分解得到的小波系數(shù)代表信號在不同分辨率上的信息,比較適合分析非平穩(wěn)信號,小波去噪原理圖,如圖2。
圖2 小波變換去噪
根據(jù)譜減法原理,在語音增強(qiáng)時先讀入一段語音,并給語音加入隨機(jī)白噪聲,再對其進(jìn)行譜減法運(yùn)算,得到增強(qiáng)語音信號。仿真結(jié)果看出,使用譜減法對帶噪語音進(jìn)行增強(qiáng)后,可去除一些明顯的噪聲信號,但仍存在一些殘留噪聲。
使用小波進(jìn)行語音增強(qiáng),使用的小波函數(shù)為‘db6’,并利用函數(shù)wavedec 對信號進(jìn)行3 層分解;利用函數(shù)wnoisest 對其進(jìn)行估計(jì)得到噪聲標(biāo)準(zhǔn)偏差;利用函數(shù)wbmpen 獲得消噪過程中的閾值;利用函數(shù)wdencmp 對信號進(jìn)行增強(qiáng)處理。以上流程操作以后,得到比較平滑的增強(qiáng)信號,失真比較小。
通過實(shí)驗(yàn)發(fā)現(xiàn)將譜減法處理后的語音,再進(jìn)行小波增強(qiáng)后的語音效果更好,可以克服兩者的不足,仿真結(jié)果如圖3。
圖3 語音增強(qiáng)的Matlab 仿真
仿真結(jié)果可顯示譜減法對帶噪語音進(jìn)行增強(qiáng)后,去除了一些明顯的噪聲信號,但也存在一些殘留噪聲,再小波增強(qiáng)后得到比較平滑的信號,同時使一些語音的尖峰點(diǎn)消除。通過實(shí)驗(yàn)發(fā)現(xiàn)將譜減法處理后的語音,再進(jìn)行小波增強(qiáng),得到的語音效果更好。