李思嘉 趙婧 蔡樹(shù)陽(yáng)
摘要:基于小波去噪理論實(shí)現(xiàn)了閾值法語(yǔ)音增強(qiáng)算法,傳統(tǒng)的軟閾值法與硬閾值法在去噪處理上均有不足,經(jīng)過(guò)軟閾值法處理的語(yǔ)音信號(hào)與原始信號(hào)相比存在恒定誤差,經(jīng)過(guò)硬閾值法處理的語(yǔ)音信號(hào)不夠光滑,且附加震蕩的存在。在軟硬閾值法的基礎(chǔ)上提出了一種改進(jìn)的軟硬閾值折衷算法,提出的改進(jìn)軟硬閾值折衷算法和傳統(tǒng)的閾值算法相比其適應(yīng)性更優(yōu),克服了硬閾值函數(shù)不連續(xù)的缺點(diǎn),減小了軟閾值函數(shù)中估計(jì)小波系數(shù)與分解小波系數(shù)的恒定偏差,仿真結(jié)果說(shuō)明,根據(jù)噪聲信號(hào)的不同,通過(guò)修改式中系數(shù),可得到比傳統(tǒng)閾值法去噪更優(yōu)的結(jié)果。
關(guān)鍵詞:語(yǔ)音去噪;語(yǔ)音增強(qiáng);閾值函數(shù);小波變化
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)志碼:A文章編號(hào):1008-1739(2022)08-60-4
從帶有噪聲干擾的語(yǔ)音中提取純凈的語(yǔ)音為語(yǔ)音增強(qiáng)的目的,但是就目前的科技水平而言,從帶有噪聲干擾的語(yǔ)音中提取完全純凈的語(yǔ)音的可能性為零。近年來(lái),隨著科技的發(fā)展、生活質(zhì)量的提高,人們對(duì)通信質(zhì)量的要求也越來(lái)越高,為此必須增強(qiáng)系統(tǒng)抗噪聲干擾的能力,盡可能地從帶有噪聲干擾的語(yǔ)音中提取純凈的語(yǔ)音,提高系統(tǒng)的處理性能。
語(yǔ)音信號(hào)由于受噪聲的影響,且噪聲的來(lái)源很復(fù)雜,可能與接收環(huán)境有關(guān),也可能來(lái)自發(fā)送端或者設(shè)備內(nèi)部處理信號(hào)產(chǎn)生的噪聲等,這些噪聲必然影響語(yǔ)音源信號(hào)的質(zhì)量。如何從攜帶噪聲干擾的語(yǔ)音中提取純凈的語(yǔ)音是語(yǔ)音增強(qiáng)的目的[1]。20世紀(jì)70年代中期Windrow B等[2]應(yīng)用自適應(yīng)相消法去噪,隨后幾年Limhe等[3]提出維納濾波法,Boll[4]提出譜相減法,80年代初Maulay和Malpass[5]提出軟判決噪聲抑制法,80年代中期Ephraim和Malah[6]提出了基于最小均方誤差(MMSE)短時(shí)譜語(yǔ)音增強(qiáng)法,而在80年代末,Paliwal[7]將卡爾曼濾波算法思想應(yīng)用在語(yǔ)音增強(qiáng)算法中,進(jìn)入90年代后,Ephraim[8]將信號(hào)子空間分解法應(yīng)用于語(yǔ)音增強(qiáng)算法,而在2004年,Hu Yi和Loizou[9]將基于小波變換閾值函數(shù)的多窗口譜用于語(yǔ)音增強(qiáng)。經(jīng)過(guò)多年的發(fā)展,語(yǔ)音增強(qiáng)算法已經(jīng)逐步完善,已經(jīng)變成整個(gè)語(yǔ)音系統(tǒng)中不可或缺的環(huán)節(jié)。
不同場(chǎng)景會(huì)產(chǎn)生不同的噪聲,不同的噪聲又有不同的特性,目前還沒(méi)有一種適用于所有噪聲類(lèi)型的語(yǔ)音增強(qiáng)算法,因此需要結(jié)合不同的噪聲提出與之相對(duì)應(yīng)的語(yǔ)音增強(qiáng)算法。
1.1語(yǔ)音信號(hào)的特征
發(fā)聲系統(tǒng)中不同位置發(fā)出的聲源是不同的,因此語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)的時(shí)變隨機(jī)過(guò)程,但人體中發(fā)聲器官的變化有限,聲帶和聲道處于一種相對(duì)穩(wěn)定的狀態(tài),語(yǔ)音信號(hào)的基本特征保持不變,可在語(yǔ)音增強(qiáng)算法中用語(yǔ)音信號(hào)的短平穩(wěn)性對(duì)其進(jìn)行分析。
1.2噪聲的特性
根據(jù)具體環(huán)境的不同,噪聲的特性差異很大,有些噪聲具有穩(wěn)定性,有些噪聲是非平穩(wěn)的,依據(jù)環(huán)境和語(yǔ)音信號(hào)之間的聯(lián)系,基本可以分為加性噪聲和非加性噪聲兩大類(lèi),本文著重于對(duì)加性噪聲的分析。
1.3語(yǔ)音增強(qiáng)算法的評(píng)判標(biāo)準(zhǔn)
1.3.1主觀(guān)評(píng)價(jià)法
平均意見(jiàn)(Mean Opinion Score,MOS)得分法和判斷韻字測(cè)試(Diagnostic Rhyme Test,DRT)得分法是2種主觀(guān)評(píng)價(jià)的基本方法。
(1)MOS得分法
這種評(píng)價(jià)方法采用5級(jí)評(píng)價(jià)標(biāo)準(zhǔn),需要大量測(cè)試者的評(píng)價(jià)數(shù)據(jù),并且需要足夠多的評(píng)測(cè)語(yǔ)音,最后去除所有測(cè)試者的平均評(píng)級(jí)等級(jí)即為最終的MOS得分,MOS評(píng)價(jià)標(biāo)準(zhǔn)如表1所示。
(2)DRT得分法
這種評(píng)價(jià)方法一般需要對(duì)大量測(cè)試者進(jìn)行測(cè)試,對(duì)測(cè)試者播放多對(duì)相同韻母的同一韻字中的某音節(jié),測(cè)試者根據(jù)所聽(tīng)到的音節(jié)選出相應(yīng)的字,采取全部測(cè)試者的正確百分比做為DRT得分,DRT評(píng)價(jià)標(biāo)準(zhǔn)如表2所示。
1.3.2客觀(guān)評(píng)價(jià)法
當(dāng)人對(duì)語(yǔ)音質(zhì)量敏感程度達(dá)不到算法要求時(shí),主觀(guān)評(píng)價(jià)方法就不再繼續(xù)適用,客觀(guān)評(píng)價(jià)法一般有2種:信噪比(SNR)和分段信噪比(SEGSNR)。
(1)SNR
2.1小波基和閾值選取
利用閾值法去噪的依據(jù)是語(yǔ)音信號(hào)和噪聲信號(hào)在小波系數(shù)幅值上的不同,利用閾值法去噪,可以保留幅值較大的小波系數(shù),這類(lèi)系數(shù)一般為語(yǔ)音信號(hào)的小波系數(shù),可將幅值小的小波系數(shù)減為零,這種小波系數(shù)一般為噪聲信號(hào)的語(yǔ)音系數(shù)。
將實(shí)驗(yàn)仿真進(jìn)行錄音,并將其作為原始語(yǔ)音信號(hào),通過(guò)awgn函數(shù)對(duì)原始語(yǔ)音信號(hào)加入高斯白噪聲,將分解層數(shù)選為5,通過(guò)對(duì)軟閾值法、硬閾值法以及改進(jìn)的軟硬閾值折衷算法的仿真,表明了改進(jìn)算法的優(yōu)勢(shì)。依據(jù)主觀(guān)評(píng)價(jià)法中的MOS得分法來(lái)評(píng)價(jià)閾值法的處理效果,仿真結(jié)果對(duì)比如圖2所示。
對(duì)比圖像可知,改進(jìn)的軟硬閾值折衷算法對(duì)比軟閾值法和硬閾值法更好地還原了原始語(yǔ)音信號(hào),經(jīng)過(guò)硬閾值法處理后的語(yǔ)音信號(hào)平滑度不夠,而軟閾值法與原始語(yǔ)音信號(hào)有所偏差。并且,通過(guò)仿真實(shí)驗(yàn)中播放處理后的語(yǔ)音信號(hào),可以明顯地感受到本文提出的改進(jìn)折衷算法的處理效果要優(yōu)于傳統(tǒng)的軟閾值法以及硬閾值法。
通過(guò)理論分析,在Matlab中對(duì)基于小波變換的軟閾值法以及硬閾值法的語(yǔ)音增強(qiáng)算法予以實(shí)現(xiàn),并提出了一種基于軟硬閾值算法的折衷算法。提出了一種基于軟硬閾值算法的折衷算法即改進(jìn)軟硬閾值折衷算法,仿真結(jié)果表明,和傳統(tǒng)的閾值算法相比其適應(yīng)性更優(yōu),克服了硬閾值函數(shù)不連續(xù)的缺點(diǎn),減小了軟閾值函數(shù)中估計(jì)小波系數(shù)與分解小波系數(shù)的恒定偏差,可以根據(jù)噪聲信號(hào)的不同,通過(guò)修改式中系數(shù),得到比傳統(tǒng)閾值法去噪更優(yōu)的結(jié)果。
參考文獻(xiàn)
[1]趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2009.
[2] WIDROW B,GLOVER JR J R,MCCOOL J M,et al. Adaptive Noise Cancelling:Principles and Application[J].Proceedings of the IEEE,1975,63(12):1692-1716.
[3] LIM J S,OPPENHEIM A V.All-pole Modeling of Degraded Speech[J].Acoustics,Speech and Signal Processing,IEEE Transactions on,1978,26(3):197-210.
[4] BOLL S F.Suppression of Acoustic Noise in Speech Using Spectral Subtral[J].IEEE Transactions on ASSP, 1979,27(2):113-120.
[5] MCAULAY R,MALPASS M.Speech Enhancement Using A Soft-decision Noise Suppression Filter[J]. Acoustics, Speech and Signal Processing,IEEE Transaction on,1980,28(2):137-145.
[6] EPHRAIM Y,MALAH D.Speech Enhacement Using A Minimum-mean Square Error Short-time Spectral Amplitude Estimator[J].Acoustics,Speech and Signal Processing,IEEE Transactions on,1984,32(6):1109-1121.
[7] KALMAN R E. A New Approach to Linear Filtering and Prediction Problems[J]. Journal of Basic Engineering,1960,82(1):35-45.
[8] YARIV E, HARRY Van L.A Signal Subspace Approach for Speech Enhancement[J].IEEE Transactions.on Speech and Audio Processing,1995,3(4):251-266.
[9] HU Y,LOIZOU P C.Speech Enhancement Based on Wavelet Thresholding the Multitaper Spectrum[J].IEEE Trans.on Speech and Audio Processing, 2004,12(1):59-67.
[10]高迎東,王宏力,由四海,等.基于小波基函數(shù)選取與改進(jìn)閾值函數(shù)的脈沖星信號(hào)去噪算法研究[J].電光與控制, 2020,27(4):15-19.
[11]崔公哲,張朝霞,楊玲珍,等.一種改進(jìn)的小波閾值去噪算法[J].現(xiàn)代電子技術(shù),2019,42(19):50-53.