王小標(biāo),王 錯(cuò),劉 君
(西安理工大學(xué)機(jī)械與精密儀器工程學(xué)院,陜西西安 710048)
原始語音信號在傳輸過程中不可避免地會(huì)受到背景噪聲信號的干擾,因此,語音信號接收端接收到的是包含背景噪聲信號的語音信號[1].由于語音信號中的背景噪聲會(huì)嚴(yán)重影響語音識別的精度[2],并且會(huì)增加語音信號處理的計(jì)算復(fù)雜度,因此在語音識別和處理過程中,需要進(jìn)行語音增強(qiáng),消除語音信號中的背景噪聲,進(jìn)一步提高語音識別的精度[3-4].目前,語音增強(qiáng)算法有很多,按時(shí)間順序可分為傳統(tǒng)算法和新型算法.傳統(tǒng)語音增強(qiáng)算法包括譜減法、卡爾曼濾波法、自適應(yīng)濾波法等[5].傳統(tǒng)語音增強(qiáng)算法已很成熟,并且通過不斷改進(jìn),語音增強(qiáng)效果也得到了進(jìn)一步提升[6].隨著計(jì)算機(jī)和信號處理技術(shù)的發(fā)展,許多新型語音增強(qiáng)算法相繼涌現(xiàn),如小波變換法、基于經(jīng)驗(yàn)?zāi)B(tài)分解的語音增強(qiáng)算法、最大似然估計(jì)法等[7].新型語音增強(qiáng)算法更加注重噪聲特征分析和統(tǒng)計(jì),根據(jù)噪聲特性分析結(jié)果,使噪聲信號和原始語音信號分離,從而進(jìn)一步得到原始語音信號[8-9].
目前,傳統(tǒng)語音增強(qiáng)算法仍然應(yīng)用于語音信號處理中.譜減法是研究者最為青睞的語音增強(qiáng)算法之一,是一種非參數(shù)語音增強(qiáng)算法,屬于傳統(tǒng)算法中的經(jīng)典算法[10].譜減法的核心在于噪聲的處理部分,理解和分析噪聲的類型和特征是使用譜減法的前提,該算法計(jì)算簡單、實(shí)時(shí)性高、語音信號的輸出信噪比高.但是,在使用譜減法進(jìn)行語音增強(qiáng)的過程中會(huì)產(chǎn)生“音樂噪聲”問題,這一直是研究的熱點(diǎn)問題[11].本文提出一種譜減法和自適應(yīng)濾波法相結(jié)合的方法,采用該方法可以進(jìn)一步提高語音增強(qiáng)效果,并且解決“音樂噪聲”問題.
設(shè)定處理語音信號的時(shí)間序列為x(n),經(jīng)過加窗與分幀處理后,得到第i幀語音信號xi(m),幀長設(shè)定為N.任何一幀語音信號xi(m)的離散傅里葉變換(Discrete Fourier Transform,DFT)為[12]:
要對Xi(k)求出每幀語音信號的幅值與相角,幅值是|Xi(k)|,相角為:
已知前導(dǎo)無話段(噪聲段)時(shí)長為IS,對應(yīng)的幀數(shù)為NIS,可以求出該噪聲段的平均能量值為:
譜減算法為:
(4)式中,a與b是兩個(gè)常量,a稱為過減因子常量,b稱為增益補(bǔ)償因子常量[12].
圖1 譜減法的原理示意圖
自適應(yīng)濾波器使用前段的信號參數(shù)來分析濾波器參數(shù),然后自動(dòng)調(diào)整下一時(shí)刻濾波器參數(shù),將有用信號與不需要的信號進(jìn)行分離,從而獲得有用信號,這是自適應(yīng)濾波器的去噪原理[13].
自適應(yīng)濾波器算法流程如圖2所示.算法的核心是根據(jù)前段語音信號噪聲的特性不斷修改濾波器的參數(shù),從而達(dá)到最優(yōu)濾波.其中,n為時(shí)間變量,x(n)為原始信號輸入,經(jīng)過自適應(yīng)濾波器以后系統(tǒng)輸出信號為y(n),d(n)為期望響應(yīng),信號的誤差信號為e(n).設(shè)計(jì)濾波器時(shí),合理選擇收斂因子參數(shù)和梯度的計(jì)算是該算法的重點(diǎn)和難點(diǎn),這需要大量的計(jì)算來確定[14].
圖2 自適應(yīng)濾波器的原理流程圖
本文提出的新型語音增強(qiáng)算法是將譜減法和自適應(yīng)濾波法相結(jié)合進(jìn)行語音增強(qiáng)的一種算法,稱為新型譜減算法.該算法首先使用傳統(tǒng)譜減算法對帶噪聲的語音信號進(jìn)行語音增強(qiáng),得到含有“音樂噪聲”的語音信號,然后根據(jù)語音信號前段無聲段的“音樂噪聲”的特性進(jìn)一步調(diào)整自適應(yīng)濾波器的參數(shù),從而消除語音增強(qiáng)過程中譜減法產(chǎn)生的“音樂噪聲”,實(shí)現(xiàn)最優(yōu)濾波.新型譜減算法的原理流程圖如圖3所示.
圖3 新型譜減算法的原理流程圖
為了驗(yàn)證本文提出的新型譜減算法的語音增強(qiáng)效果,本文使用MATLAB軟件進(jìn)行仿真實(shí)驗(yàn).語音庫數(shù)據(jù)由不同信噪比的語音信號組成,語音信號的采樣頻率為8 kHz,語音預(yù)處理包括分幀、加窗,幀長為200 ms,幀移為80 ms,相鄰幀之間有75%重疊,即幀間疊加128個(gè)采樣點(diǎn).通過對比語音增強(qiáng)前后語音信號的信噪比和語譜圖來說明語音增強(qiáng)效果的優(yōu)劣[15-16].圖4和圖5分別是原始語音信號和噪聲語音信號的語譜圖.通過觀察可以發(fā)現(xiàn),純語音信號的語譜圖的頻率分布是非常規(guī)則的,由于沒有背景噪聲干擾,所以純語音信號的語譜圖只有有聲段有頻率的分布,在無聲段沒有頻率的分布;含有背景噪聲的語音信號的語譜圖,在整個(gè)時(shí)域上都會(huì)出現(xiàn)頻率分布并且有原始語音信號丟失的現(xiàn)象.因此,根據(jù)語譜圖中頻率在有聲段和無聲段的分布情況可以判斷使用新型譜減算法進(jìn)行語音增強(qiáng)之后是否能夠去除殘留的“音樂噪聲”.
圖4 原始語音信號的語譜圖
圖5 噪聲語音信號的語譜圖
對純凈原始語音信號疊加0 dB寬帶噪聲信號并且使用傳統(tǒng)譜減法進(jìn)行語音增強(qiáng)之后,輸出信號的信噪比為8.666 3 dB,效果圖和語譜圖分別如圖6和圖7所示.通過分析可以得出結(jié)論,采用傳統(tǒng)的譜減法進(jìn)行語音增強(qiáng)會(huì)產(chǎn)生“音樂噪聲”問題.
圖6 傳統(tǒng)譜減算法的效果圖
圖7 傳統(tǒng)譜減算法的語譜圖
使用本文提出的新型譜減算法進(jìn)行語音增強(qiáng)之后,效果圖如圖8所示,輸出信噪比增加到了12.365 4 dB.
從語譜圖(見圖9)可以看出,采用新型譜減算法進(jìn)行語音增強(qiáng)之后,語音信號只在有聲段有頻率分布.
圖8 新型譜減算法的效果圖
圖9 新型譜減算法的語譜圖
建立不同信噪比的仿真語音庫,分別使用傳統(tǒng)譜減法和本文提出的新型譜減算法進(jìn)行語音增強(qiáng)處理,然后對傳統(tǒng)算法和新型譜減算法的輸出信噪比進(jìn)行統(tǒng)計(jì)分析,通過對比兩種算法的語音增強(qiáng)語譜圖和輸出信噪比,可以得出結(jié)論,對于仿真語音庫數(shù)據(jù)而言,新型的譜減算法比傳統(tǒng)的譜減算法的輸出信噪比要高(見圖10).
本文提出的新型譜減算法是針對真實(shí)的語音環(huán)境條件設(shè)計(jì)的,所以需要使用真實(shí)環(huán)境語音庫數(shù)據(jù)來驗(yàn)證新型譜減算法的有效性.本次驗(yàn)證實(shí)驗(yàn)語音庫數(shù)據(jù)如表1所示.
真實(shí)環(huán)境語音庫中的語音信號初始信噪比大小未知,因此,不能采用比較信噪比大小的方法來評定語音增強(qiáng)效果的優(yōu)劣.在實(shí)際應(yīng)用中,可以根據(jù)語音質(zhì)量評分標(biāo)準(zhǔn)來判斷算法的語音增強(qiáng)效果優(yōu)劣.語音質(zhì)量評分準(zhǔn)則見表2.
表1 真實(shí)環(huán)境語音庫
表2 語音質(zhì)量評分標(biāo)準(zhǔn)
按以上標(biāo)準(zhǔn),分別采用傳統(tǒng)譜減算法和新型譜減算法求得每一個(gè)場景下的語音質(zhì)量評分,并取其平均值,結(jié)果見圖11.從圖11可以看出,新型譜減算法的語音增強(qiáng)效果明顯優(yōu)于傳統(tǒng)譜減算法的效果.
圖10 輸出信噪比的對比圖
圖11 語音質(zhì)量評分對比圖
本文提出一種將自適應(yīng)濾波法和譜減法相結(jié)合的語音增強(qiáng)算法——新型譜減算法.該方法首先采用譜減法對噪聲語音進(jìn)行處理,然后根據(jù)信號前段無聲段的噪聲特性來進(jìn)一步確定自適應(yīng)濾波算法的收斂因子和梯度,從而解決了使用傳統(tǒng)譜減算法進(jìn)行語音增強(qiáng)過程中產(chǎn)生的“音樂噪聲”問題,并且進(jìn)一步提高了語音信號的輸出信噪比.仿真語音庫數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明,采用新型譜減算法能夠輸出更高信噪比的語音信號,并且能夠解決“音樂噪聲”的問題,進(jìn)一步提高語音增強(qiáng)效果.采用真實(shí)環(huán)境語音庫數(shù)據(jù)對新型譜減算法語音增強(qiáng)效果進(jìn)行驗(yàn)證,結(jié)果表明,采用新型譜減算法比采用傳統(tǒng)譜減算法輸出的語音質(zhì)量要好,真實(shí)生活環(huán)境中語音信號的背景噪聲可以采用新型譜減算法去除.