武田甜, 李 靜
(中北大學(xué), 山西 太原 030051)
人類聽覺系統(tǒng)可依據(jù)音頻在兩耳間的聲級(jí)差、聲音到達(dá)兩耳的時(shí)間判斷聲音源位置和距離[1],例如視頻觀看、電話會(huì)議、汽車免提系統(tǒng)、音樂會(huì)和演唱會(huì)等,但是目前在聲音傳播和接收過程中[2],環(huán)境中會(huì)存在大量噪聲,干擾聲音的質(zhì)量,因此通常會(huì)采用單聲道音頻抵消器進(jìn)行噪聲處理[3],但是該方式無法利用左右聲道差還原真實(shí)空間化聽覺感受。為提升聽覺感受,降低噪聲干擾,雙聲道音頻回波抵消器被重點(diǎn)研究[4]。該抵消器能夠提供更佳的聽覺感受,并且能夠提升遠(yuǎn)端說話人員的分辨率,還原真實(shí)空間化聽覺感受。雙聲道音頻回波抵消器是在單聲道音頻抵消器的基礎(chǔ)上演變而來的,在應(yīng)用時(shí)雙聲道系統(tǒng)中輸入信號(hào)之間會(huì)發(fā)生較強(qiáng)的關(guān)聯(lián)性,從而導(dǎo)致抵消器中的濾波收斂速度下降[5],甚至發(fā)生收斂路徑失調(diào)以及混疊等現(xiàn)象。文獻(xiàn)[6]為實(shí)現(xiàn)聲音干擾抑制,采用深度學(xué)習(xí)構(gòu)建聲音回波抑制模型,該模型在應(yīng)用過程中可完成干擾信號(hào)的抑制,但是對(duì)于遠(yuǎn)端人員說話的分辨率無法進(jìn)行優(yōu)化。文獻(xiàn)[7]為保證回波信號(hào)的聽覺質(zhì)量,獲取音頻的頻域先驗(yàn)信息后進(jìn)行稀疏分解;構(gòu)建頻域先驗(yàn)稀疏矩陣后進(jìn)行音頻信號(hào)重構(gòu)。該方法能夠有效降低音頻中的噪聲干擾,但還是無法提升聲音的空間化感受。
為提升雙聲道音頻回波抵消器的應(yīng)用效果,保證真實(shí)空間化聽覺感受效果,提升聲音質(zhì)量,本文構(gòu)建了噪聲環(huán)境下的雙聲道音頻回波抵消模型,并通過實(shí)驗(yàn)驗(yàn)證了該模型的有效性。測(cè)試結(jié)果表明:所設(shè)計(jì)模型可有效處理音頻信號(hào)中的噪聲信號(hào),抵消后的音頻信號(hào)信噪比均在3.5 dB 以上,音頻信號(hào)的振幅誤差均在0.2 V 以下,能夠提升遠(yuǎn)端人員說話的分辨率,保證音頻質(zhì)量。
為實(shí)現(xiàn)雙聲道回波抵消,并避免發(fā)生收斂路徑失調(diào)以及混疊等現(xiàn)象[8],基于子帶分解設(shè)計(jì)雙聲道回波抵消結(jié)構(gòu),如圖1 所示。
圖1 基于子帶分解的雙聲道回波抵消結(jié)構(gòu)
所設(shè)計(jì)的雙聲道回波抵消結(jié)構(gòu)在應(yīng)用過程中,主要依據(jù)下采樣的方式并結(jié)合子帶自適應(yīng)濾波器組設(shè)計(jì)消除音頻混疊信號(hào)之間的干擾[9],極大程度地提升音頻質(zhì)量以及遠(yuǎn)端說話人員的分辨率,保證聲音的空間化感受。
1.2.1 子帶自適應(yīng)濾波器組結(jié)構(gòu)
考慮到噪聲環(huán)境中的雙聲道音頻回波信號(hào)在不同頻率上具有變化特性,而利用子帶分解可以將原始信號(hào)分解成多個(gè)子帶,使得每個(gè)子帶可以獨(dú)立進(jìn)行處理,以更好地抵消回波信號(hào)對(duì)主信號(hào)的影響,因此,在雙聲道音頻回波抵消前,優(yōu)先設(shè)計(jì)子帶自適應(yīng)濾波器組結(jié)構(gòu)?;谧訋Х纸獾碾p聲道回波抵消結(jié)構(gòu)在應(yīng)用過程中,子帶自適應(yīng)濾波器組是模型的重要部分,其能夠保證音頻回波抵消效果[10],對(duì)于消除音頻混疊信號(hào)之間的干擾具有重要作用。因此,本文結(jié)合雙聲音頻回波抵消需求設(shè)計(jì)子帶自適應(yīng)濾波器組,其結(jié)構(gòu)如圖2 所示。
圖2 子帶自適應(yīng)濾波器組結(jié)構(gòu)
子帶自適應(yīng)濾波器組可通過均勻或者非均勻兩種方式將音頻信號(hào)進(jìn)行分解,使其形成若干個(gè)子頻帶信號(hào),其可在子帶域內(nèi)完成原始音頻回波信號(hào)的處理,同時(shí)依據(jù)人耳聽覺特性的回波抵消方法實(shí)現(xiàn)音頻信號(hào)處理,消除音頻混疊;并且能夠顯著提升音頻回波信號(hào)處理效率。
1.2.2 依據(jù)人耳聽覺特性的回波抵消方法
利用子帶自適應(yīng)濾波器組對(duì)音頻回波抵消時(shí),需以人耳聽覺特性為依據(jù),結(jié)合噪聲環(huán)境特性[11],采用依據(jù)人耳聽覺特性的Bark 域子帶回波抵消方法實(shí)現(xiàn)音頻回波噪聲處理,消除音頻混疊。該方法整體分為兩個(gè)部分,分別為噪聲干擾閾值計(jì)算和回波抵消,詳細(xì)內(nèi)容如下所述。
1) 噪聲干擾閾值計(jì)算
噪聲是影響音頻回波質(zhì)量的主要因素[12],因此,為實(shí)現(xiàn)音頻回波的有效處理,先進(jìn)行噪聲干擾閾值計(jì)算。依據(jù)頻帶頻率范圍完成音頻信號(hào)臨界頻帶劃分,計(jì)算臨界頻帶功率譜Pl(f),公式為:
式中:Re 表示變換幅值;Vl(f)表示音頻信號(hào)變換結(jié)果;Im 表示變換能量。
計(jì)算各個(gè)臨界頻帶內(nèi)的信號(hào)能量Bl,公式為:
式中:f0和f1分別表示臨界頻帶的下、上邊界。
不同臨界頻帶之間的音頻信號(hào)也存在相互混疊情況,因此在完成Bl的計(jì)算后,文中引入擴(kuò)散函數(shù)S進(jìn)行擴(kuò)散譜的計(jì)算。如果sij為S中的元素,其中i表示本地臨界頻段,j表示擴(kuò)散頻段,擴(kuò)散譜C的計(jì)算公式為:
完成擴(kuò)散譜C的計(jì)算后,確定噪聲閾值。正常情況下音頻回波信號(hào)存在兩種閾值,即噪聲混疊語(yǔ)音[13]和語(yǔ)音混疊噪聲,文中主要是以語(yǔ)音混疊噪聲為主,將語(yǔ)音中的噪聲進(jìn)行區(qū)分,以此降低雙聲道系統(tǒng)中輸入信號(hào)之間較強(qiáng)的關(guān)聯(lián)性。噪聲閾值的計(jì)算公式為:
式中l(wèi)′表示臨界頻段頻率中值。
2) 回波抵消
完成噪聲干擾閾值計(jì)算后,通過人耳聽覺特性子帶雙聲道回波抵消算法進(jìn)行回波抵消處理。輸入雙聲道信號(hào)x1和x2,通過子帶自適應(yīng)濾波器組進(jìn)行處理后,抽取信號(hào)的下采樣抽取因子s0~s3。
依據(jù)公式(4)計(jì)算噪聲閾值,分別用ξ1l和ξ2l表示,依據(jù)閾值的計(jì)算結(jié)果對(duì)噪聲進(jìn)行獨(dú)立分布白噪聲的疊加[14],在此基礎(chǔ)上進(jìn)行各個(gè)子帶的回波抵消,其抵消結(jié)果計(jì)算公式為:
子帶自適應(yīng)濾波器組在進(jìn)行回波抵消過程中,其穩(wěn)態(tài)收斂速度較慢,并且誤差抑制能力也存在一定不足。此外,因噪聲環(huán)境隨時(shí)間發(fā)生變化,導(dǎo)致回波信號(hào)的特性發(fā)生對(duì)應(yīng)的變化。通過優(yōu)化子帶自適應(yīng)濾波器組的參數(shù),可以及時(shí)適應(yīng)回波信號(hào)的變化,以保持回波抵消效果的準(zhǔn)確性和穩(wěn)定性。本文為提升音頻回波抵消效果,采用改進(jìn)最小均方算法進(jìn)行濾波器組優(yōu)化,在優(yōu)化過程中,引入步長(zhǎng)補(bǔ)償因子和反饋控制理念提升抵消效果。
在優(yōu)化過程中,需要通過不斷調(diào)整濾波器參數(shù)來逼近最優(yōu)解,而合適的步長(zhǎng)因子可以加快濾波器組收斂速度,使優(yōu)化過程更快地達(dá)到最佳參數(shù)配置。為此,首先對(duì)迭代步長(zhǎng)因子μ(n)進(jìn)行更新,計(jì)算公式為:
依據(jù)上述公式完成優(yōu)化后,進(jìn)行歸一化處理,獲取子帶自適應(yīng)濾波器組參數(shù)優(yōu)化結(jié)果w′,公式如下:
式中τ表示常數(shù)。
依據(jù)上述步驟完成子帶自適應(yīng)濾波器組參數(shù)優(yōu)化,以此提升濾波器組的收斂速度和回波抵消效果。
為驗(yàn)證本文模型的應(yīng)用效果,進(jìn)行實(shí)驗(yàn)測(cè)試。
本文選擇某企業(yè)語(yǔ)音會(huì)議音頻作為測(cè)試對(duì)象,該音頻的采集環(huán)境為正常會(huì)議室環(huán)境,該環(huán)境中存在其他人員聲音以及空調(diào)聲音,將這些聲音作為噪聲,根據(jù)圖3的流程進(jìn)行測(cè)試。
圖3 實(shí)驗(yàn)測(cè)試流程
圖3 中,采樣過程中的音頻采樣頻率為44 kHz,音頻信號(hào)長(zhǎng)度為40 000 B。子帶自適應(yīng)濾波器組的初始步長(zhǎng)因子為0.01,迭代次數(shù)為100 次,濾波器階數(shù)為32,環(huán)境中的噪聲為20 dB。
為驗(yàn)證本文模型的信號(hào)噪聲處理效果,采用本文模型對(duì)采集的音頻信號(hào)進(jìn)行濾波降噪處理,獲取濾波降噪前后的音頻信號(hào)結(jié)果,如圖4 所示。
圖4 濾波降噪前后音頻處理結(jié)果
依據(jù)圖4 測(cè)試結(jié)果可知:采集的原始信號(hào)中存在一定噪聲信號(hào),對(duì)于音頻信號(hào)產(chǎn)生較大影響;采用本文模型進(jìn)行處理后,音頻信號(hào)中的噪聲信號(hào)被有效處理,為音頻回波抵消處理提供了可靠的音頻信號(hào)基礎(chǔ)。
為驗(yàn)證本文模型的音頻回波抵消效果,文中采用信噪比ψR(shí)SN作為評(píng)價(jià)指標(biāo),獲取回波抵消優(yōu)化前后音頻信號(hào)的信噪比結(jié)果,該值越大表示抵消效果越好。ψR(shí)SN的計(jì)算公式為:
式中:x(n)表示未知信號(hào);x~(n)表示處理后信號(hào)。
依據(jù)上述公式計(jì)算本文模型在不同大小輸入信噪比的情況下濾波器組的輸出結(jié)果,如表1 所示。
表1 濾波器組的輸出結(jié)果 dB
依據(jù)表1 測(cè)試結(jié)果可知:隨著輸入信號(hào)中信噪比的不斷增加,本文模型進(jìn)行回波抵消優(yōu)化前,輸出的ψR(shí)SN結(jié)果均在3.5 dB 以下;本文模型優(yōu)化后,輸出的ψR(shí)SN結(jié)果均在12.3 dB 以下,最小ψR(shí)SN結(jié)果為3.5 dB。本文模型優(yōu)化后的回波抵消應(yīng)用效果顯著提升,能夠更好地實(shí)現(xiàn)音頻回波抵消處理,保證音頻信號(hào)的真實(shí)空間化聽覺感受效果,提升聲音質(zhì)量。
遠(yuǎn)端說話人員的分辨率是描述真實(shí)空間化聽覺感受效果的重要標(biāo)準(zhǔn),該分辨率可通過音頻振幅進(jìn)行描述,振幅的偏差越小,表示音頻回波抵消效果越佳,真實(shí)空間化聽覺感受效果越佳。因此,為進(jìn)一步驗(yàn)證本文模型的應(yīng)用效果,獲取本文模型對(duì)不同大小音頻信號(hào)進(jìn)行回波抵消后的誤差結(jié)果,如圖5 所示,期望誤差低于0.2 V。
圖5 回波抵消后的誤差結(jié)果
依據(jù)圖5 測(cè)試結(jié)果可知:采用本文模型進(jìn)行不同大小信噪比的人聲音頻回波抵消處理后,音頻信號(hào)的振幅誤差結(jié)果均在0.2 V 以下,其中最大誤差僅為0.14 V。因此,本文模型具有較好的雙聲道音頻回波抵消效果,可提升遠(yuǎn)端人員說話的分辨率,并且能夠極大程度上避免信號(hào)混疊現(xiàn)象。
為提升接聽者的聽覺感受以及音頻信號(hào)質(zhì)量,本文提出一種噪聲環(huán)境中的雙聲道音頻回波抵消模型。該模型主要以子帶自適應(yīng)濾波器組為核心,并結(jié)合參數(shù)優(yōu)化方法獲取最佳的音頻信號(hào)濾波效果,實(shí)現(xiàn)音頻回波抵消處理。測(cè)試結(jié)果表明:本文模型具有較好的應(yīng)用效果,能夠有效處理音頻信號(hào)中的噪聲信號(hào),保留有效的音頻信號(hào),更好地保證音頻質(zhì)量,提升真實(shí)空間化聽覺感受效果。