韓 哲 鄭成詩 柯雨璇 李曉東
(1 中國科學(xué)院噪聲與振動重點實驗室(聲學(xué)研究所)北京 100190)
(2 中國科學(xué)院大學(xué) 北京 100049)
隨著現(xiàn)代微電子技術(shù)(Micro-electro-mechanical systems, MEMS)與無線通信傳輸技術(shù)的發(fā)展,低功耗、模塊化的無線傳感網(wǎng)絡(luò)(Wireless sensor network, WSNs)開始普及[1]。本文主要討論的分布式無線聲傳感網(wǎng)絡(luò)(Wireless acoustic sensor networks, WASNs)具有多個節(jié)點,每個節(jié)點由一個或多個傳聲器以及數(shù)據(jù)處理模塊與通信模塊構(gòu)成,分別實現(xiàn)信號拾取、運算和與其他節(jié)點通訊的功能。由于靠近聲源可以采集到更高信噪比(Signal-to-noise ratio, SNR)或者信混比(Signalto-reverberant ratio, SRR)的信號,相較于傳統(tǒng)固定位置的集中式傳聲器陣列,WASNs 可實現(xiàn)更大空間內(nèi)的聲源語聲拾取。此外,通過各節(jié)點的數(shù)據(jù)處理模塊進行去中心化運算,可增強系統(tǒng)的擴展性與魯棒性。
在WASNs 中,如果存在數(shù)據(jù)中心可以接收所有傳聲器拾取的信號并進行運算,就可以采用集中式算法,理論上可獲得最優(yōu)解,但傳輸與運算能耗較大;若每個節(jié)點僅使用局部信號,則對應(yīng)單節(jié)點算法,性能會有不同程度的降低。在WASNs中通過節(jié)點分布式計算,以盡可能少通道數(shù)的信號傳輸,達到集中式算法最優(yōu)性能的分布式語聲增強算法的開發(fā),變得越來越重要[2?8]。
截止至今,已有多種應(yīng)用于WASNs 的分布式語聲增強算法。文獻[3]在雙耳無線助聽器系統(tǒng)中,基于多通道維納濾波(Multi-channel wiener filter,MWF)提出了降低傳輸帶寬的分布式多通道維納(Distributed MWF, DB-MWF)語聲增強算法,該算法在單個聲源被穩(wěn)態(tài)噪聲干擾的情況下,將兩節(jié)點間傳輸通道降為1,并被驗證了其性能隨迭代收斂于集中式算法。文獻[4]中考慮了更一般的更多節(jié)點情況,提出了分布式自適應(yīng)節(jié)點特定信號估計(Distributed adaptive node-specific signal estimation, DANSE)算法,該算法通過控制約束,實現(xiàn)各節(jié)點彼此不同的特定輸出。文獻[5]介紹了通過在DANSE 算法中引入廣義特征值分解MWF(Generalized eigenvalue decomposition MWF,GEVD-MWF)得到的GEVD-DANSE算法,并利用WASNs 中節(jié)點的先驗信息,提升了GEVDDANSE算法的收斂速度。文獻[6]中基于廣義旁瓣消除(Generalized sidelobe canceler, GSC)算法提出了分布式GSC(Distributed multiple constraints GSC, DGSC)算法,該文獻在WASNs 中所有節(jié)點保持同約束、同輸出的假設(shè)下,基于一種特殊變換,證明了集中式GSC 算法可以等效為多個節(jié)點GSC輸出之和。文獻[7]在WASNs中對節(jié)點間傳輸數(shù)據(jù)的碼率而非通道數(shù)進行限制,提出了碼率分配分布式線性約束最小方差(Rate-distributed linearly constrained minimum variance, RD-LCMV)算法,達到了降低傳輸成本的目的。文獻[8]同樣基于LCMV 算法,通過隨機排列交替方向乘子法(Randomly permuted alternating direction method of multiplier, RP-ADMM)對LCMV 進行逐塊優(yōu)化,從而實現(xiàn)了分布式LCMV算法的構(gòu)造。
除了噪聲,混響也會造成聲源定位誤差以及語聲質(zhì)量下降[9?10]。在室內(nèi)應(yīng)用場景,例如智能家居的語聲控制、電話會議等遠場應(yīng)用,傳聲器除了直達聲,往往也會拾取到被稱為混響的墻壁與其他物體的反射聲波,混響可以營造空間感[11],但也會造成語聲質(zhì)量下降,降低語聲識別準確性和語聲聽感。為了抑制混響,許多去混響的算法及其改進算法被提出[12?16]。文獻[17]中提出的加權(quán)預(yù)測誤差(Weighted prediction error, WPE)算法是一種基于自適應(yīng)多通道線性預(yù)測模型的盲去混響算法,通常使用遞歸最小二乘(Recursive least squares, RLS)算法進行濾波器系數(shù)的自適應(yīng)更新,該算法性能穩(wěn)定,通??勺鳛椴ㄊ纬苫蛘邌瓮ǖ澜翟氲念A(yù)處理,因而得到了廣泛使用。文獻[18] 便利用了WPE算法與基于神經(jīng)網(wǎng)絡(luò)的波束形成器結(jié)合,在低信噪比下獲得了更好的語聲增強效果。文獻[19]對去混響算法的更新方式進行了討論,引入了豪斯霍爾德RLS(Householder RLS, HRLS)與豪斯霍爾德最小二乘格型(Householder least squares lattice, HLSL)算法來代替RLS,在保持系統(tǒng)快速收斂能力的同時增強了穩(wěn)定性。
在WASNs 中,去混響算法也同樣被關(guān)注。文獻[20–21]中提出了應(yīng)用于自組織無線聲傳感網(wǎng)絡(luò)中的多通道去混響算法,通過在網(wǎng)絡(luò)中選擇拾取信號混響程度低的傳聲器子集來實現(xiàn)混響抑制,但這兩種算法均未考慮分布式運算以及傳輸與能量限制。為解決以上問題,本文提出一種應(yīng)用于WASNs的分布式WPE(Distributed WPE, DWPE)算法。考慮在高混響空間內(nèi)單個聲源的情況,通過調(diào)整各節(jié)點內(nèi)濾波器系數(shù)的更新流程,可在顯著降低節(jié)點傳輸信號通道數(shù)與節(jié)點內(nèi)運算復(fù)雜度的同時,實現(xiàn)與集中式算法相同的去混響性能。本文提出的分布式算法無需預(yù)先已知房間的聲學(xué)傳遞函數(shù)(Acoustic transfer function, ATF)、聲源信號統(tǒng)計特性等信息,延續(xù)了集中式WPE算法的優(yōu)點。
本文將按如下結(jié)構(gòu)展開。第1節(jié)中介紹WASNs中的信號模型。WPE 算法的簡介以及DWPE算法的具體介紹將會在第2節(jié)中給出,包括WASNs中信號的發(fā)送與接收、各節(jié)點RLS 更新流程等。第3 節(jié)通過仿真與主客觀實驗驗證了DWPE 算法對于集中式算法性能的收斂性,并對比了分布式算法與集中式算法在擴散噪聲場景下的穩(wěn)定性。
如圖1所示,一個WASN包含若干個任意分布節(jié)點,每個節(jié)點中含有不同數(shù)目的傳聲器,在全連接模型中每個節(jié)點都可以與其余所有節(jié)點使用無線傳輸?shù)姆绞浇粨Q信息,每個節(jié)點均具有屬于自己的處理器,可以處理本地與從其他節(jié)點接收的數(shù)據(jù)。
圖1 分布式無線聲傳感網(wǎng)絡(luò)示例Fig.1 Example of an WASN
本節(jié)中考慮一個由M個傳聲器組成的J個節(jié)點的WASN(M≥J),每個節(jié)點中的傳聲器個數(shù)為Mj,j ∈{1,···,J},則。設(shè)s(k,n)為純凈語聲的短時傅里葉變換(Short-time Fourier transform, STFT)域表示,n表示幀索引,k ∈{1,···,K}表示頻帶索引,共有K個頻帶,可得第m個傳聲器拾取的帶混響信號在時頻域可被建模為
其中,hm(k,l)為聲源到第m個傳聲器的ATF,Lh由混響時間、STFT 窗長及幀移決定,該模型對語聲逐頻帶運算,為了表達簡潔,下文中將省略頻帶索引(k)。由式(1)模型,可證明混響信號可被表示為多通道自回歸(Multi-channel autoregressive,MCAR)系統(tǒng)的輸出,這是自適應(yīng)去混響算法的理論基礎(chǔ)[22?23]。由MCAR 系統(tǒng)可知,各通道信號可被寫成多通道線性預(yù)測(Multi-channel linear prediction, MCLP)的形式:
其中,[·]H表示共軛轉(zhuǎn)置,[·]ref代表從所有傳聲器中任意選取的參考信號;gm(l)為聲源到第m個傳聲器的空間回歸系數(shù)(Room regression coefficient),在特定房間靜態(tài)聲源場景下不隨時間改變,其長度Lg與Lh有關(guān);為直達聲與早期混響的和,表示目標信號;τ為預(yù)測時延,它的存在可避免語聲處理中的過白化[23]。為了表達方便,式(2)可轉(zhuǎn)化為矩陣形式:
其中,g=[g1(0),···,g1(Lg ?1),···,gM(0),···,gM(Lg ?1)]T∈CMLg×1與q(n)=[x1(n?τ),···,x1(n?τ ?Lg+1),···,xM(n?τ),···,xM(n?τ ?Lg+1)]∈CMLg×1表示空間回歸系數(shù)gm(l)與存儲延時信號xm(n)按照時間與傳聲器順序構(gòu)成的數(shù)據(jù)矢量。同時由上可得,在MCLP模型中,對傳聲器拾取信號進行去混響的過程即為對空間回歸系數(shù)g自適應(yīng)估計的過程,去混響后的輸出的目標信號估計為
在WASNs 中拾取到的信號可按照節(jié)點為單位被表示為
其中,[·]T表示轉(zhuǎn)置,(n)代表第j個節(jié)點的全部Mj個傳聲器所拾取到的信號,xji(n)代表第j個節(jié)點的第i個傳聲器所拾取到的信號。類似的,式(3)和式(4)中的矢量被表示為
其中,gji= [gji(0),···,gji(Lg ?1)]T與qji(n)=[xji(n ?τ),···,xji(n ?τ ?(Lg ?1))]T分別代表對應(yīng)于第j個節(jié)點的第i個傳聲器的空間回歸系數(shù)與所存儲的延時信號。
WPE 算法是一種基于MCLP 的算法,估計位置參數(shù)g時,對目標語聲STFT 域信號采用時變高斯模型(Time-varying Gaussian, TVG)進行建模[24]。假設(shè)目標語聲信號d(n)可被建模為零均值的復(fù)高斯模型,則期望信號的概率密度函數(shù)可被表示為
其中,λ(n)表示期望信號在n時刻概率密度函數(shù)的方差,是一個未知量。由概率密度函數(shù)可以寫出一段時間內(nèi)的似然函數(shù):
其中,參數(shù)g和λ(n)的估計可以通過最大化式(6)中的似然函數(shù)得到,對其取負對數(shù),可得到優(yōu)化目標函數(shù)[23]:
g和λ(n)的聯(lián)合優(yōu)化是困難的,在離線算法中采用兩個參數(shù)交替優(yōu)化的方法,兩個參數(shù)在每個時頻點交替優(yōu)化直到收斂或達到最大迭代次數(shù),得到參數(shù)g的估計后使用式(4)得到目標信號估計。由于計算量較大,這種算法較難在線使用,實時算法中通常選取參考信號直接估計λ(n)[25?27],λ(n)的估計可寫作:
在線算法中當(dāng)λ(n)已經(jīng)估計得到,則式(7)中的優(yōu)化目標轉(zhuǎn)化為
使用形如式(9)的優(yōu)化目標對參數(shù)進行估計的算法即為WPE算法,通常使用RLS對其求解,具體過程見表1[26,28]。
表1 在線WPE 算法實現(xiàn)細節(jié)Table 1 The details of the online WPE method
表1中,k(n)被稱為增益向量,P(n)為輸入信號q(n)的協(xié)方差矩陣的逆,α為平滑因子,用于保持算法的自適應(yīng)性。在穩(wěn)定環(huán)境中,經(jīng)過迭代g會收斂到一個穩(wěn)定值,通過式(4)輸出增強后信號。在RLS 濾波器中有先驗估計誤差與后驗估計誤差的概念,其中先驗誤差為即為式(11)中得到的估計值(n)。設(shè)后驗誤差為(n),可表達為
進一步定義后驗估計誤差(n)與先驗估計誤差(n)的比值稱為收斂因子γ(n),可得
其值由各通道的延時信號q(n)以及其協(xié)方差矩陣的逆P唯一確定。需要注意在RLS 算法中是以優(yōu)化后驗誤差的均方和為目的[28]。顯然αλ(n)>0,且由于P為正定矩陣,則qH(n)P(n ?1)q(n)>0,γ(t)期望值小于1,這表明了RLS算法是收斂的。下文中將依此分析DWPE算法的收斂性。
WPE算法在估計空間回歸系數(shù)與目標信號時,一定范圍內(nèi)增加所獲取的傳聲器信號通道數(shù)會提升去混響效果[27,29]。在分布式系統(tǒng)中若各節(jié)點使用第2.1 節(jié)介紹的集中式算法,可以獲得最優(yōu)的結(jié)果,但傳輸與運算能耗會相當(dāng)可觀,失去分布式系統(tǒng)的意義。本節(jié)將會介紹應(yīng)用于WASNs中的DWPE算法,并給出其收斂性證明。第3 節(jié)中的仿真測試表明,通過分布式運算,DWPE 可在傳聲器節(jié)點之間傳輸更少通道的信號的同時,達到與集中式算法相當(dāng)?shù)娜セ祉懶阅堋?/p>
2.2.1 分布式算法構(gòu)造
由于考慮單個說話人的情況,因此在分布式算法中,WASNs 每個節(jié)點采用相同的參考信號xref,該參考信號從M個傳聲器通道中選擇,該傳聲器被稱為“參考傳聲器”,其所在的節(jié)點被稱為“參考節(jié)點”,參考信號由此節(jié)點分發(fā)給其他節(jié)點。參考信號的選擇可以使用文獻[6]中的方法,選擇信噪比或信混比最高的通道;各節(jié)點輸出分發(fā)給其他所有節(jié)點,求和之后得到(n)作為輸出的同時,也用于各節(jié)點濾波器系數(shù)的更新。分布式系統(tǒng)中各節(jié)點之間的傳輸關(guān)系由圖2表示,算法具體過程見表2。
表2 在線DWPE 算法實現(xiàn)細節(jié)Table 2 The details of the proposed online DWPE method
圖2 分布式WPE 算法框架Fig.2 Framework of DWPE
表3總結(jié)了單節(jié)點WPE(SN-WPE)、集中式WPE(Cen-WPE)和本文中提出的DWPE 三種方式的傳輸通道數(shù)和節(jié)點內(nèi)濾波器維度。表4中展示了3 種方法的計算復(fù)雜度,其中一次復(fù)數(shù)加法或一次復(fù)數(shù)乘法都被算作一次浮點運算(Floating point operation, FLOP)[30]。
從表3可以看出,與集中式WPE 相比,DWPE需要的傳輸數(shù)據(jù)和濾波器維度數(shù)明顯減小。由表4可以看出,由于濾波器維數(shù)的減少,DWPE 算法復(fù)雜度相較集中式算法明顯降低,以一個M= 9、Mj= 3、Lg= 4、J= 3 的WASN 為例,單節(jié)點、集中式與分布式算法各節(jié)點每運算100個時頻點所需計算FLOPs次數(shù)分別約為4.315×105、1.006×107與4.319×105,且易得運算次數(shù)降低幅度會隨著網(wǎng)絡(luò)規(guī)模以及Lg的增大而進一步擴大。
表3 節(jié)點j 濾波器系數(shù)維度與每時頻點收發(fā)通道數(shù)Table 3 Filter dimensions and the numbers of channels transmitted per TF-bin of the three methods at the j-th node
表4 第j 個節(jié)點每個時頻點運算復(fù)雜度Table 4 Computational complexity of the three methods per TF-bin at the j-th node
2.2.2 收斂性證明
本節(jié)將通過分析DWPE 算法中先驗誤差與后驗誤差之間的關(guān)系,證明DWPE算法可以利用所有通道數(shù)據(jù)的信息,具有與集中式算法相同的收斂性。本節(jié)中為了區(qū)分集中式算法和分布式算法,對部分參數(shù)添加下標,如(n)代表集中式算法輸出的去混響信號,(n)代表分布式算法中輸出的去混響信號。
使用(n)和(n)替換式(16)中的(n)和(n),則式(16)可重新寫作:
由文獻[28]可知,在RLS 算法中使代價函數(shù)降低時,后驗誤差相較于先驗誤差具有更大的意義。在2.2.1 節(jié),由表2中DWPE 算法具體過程中可以看出,分布式各節(jié)點輸出的去混響語聲信號為
節(jié)點j濾波器系數(shù)(n)的更新過程為
將式(25)代入式(26)可得
可得節(jié)點1更新時分布式算法的收斂因子為
由(28)可見,雖然在節(jié)點1 更新時只使用了本節(jié)點數(shù)據(jù)構(gòu)造增益向量(n),但得益于使用了所有節(jié)點輸出之和(n)作為更新參數(shù),單個節(jié)點參數(shù)更新產(chǎn)生的影響使得整個分布式系統(tǒng)后驗輸出與先驗輸出之間存在著與集中式算法相似的關(guān)系,收斂因子由(n)與(n)唯一確定,保持了穩(wěn)定性。當(dāng)所有節(jié)點同步更新時收斂因子表示為
在γdis(n)中同樣為正定矩陣,類似于對式(16)的分析,DWPE算法在時間平均意義上同樣是收斂的,同時從式(29)中求和項可知,在DWPE算法對濾波器系數(shù)進行更新時可以如集中式算法一樣利用全局信息。在第3 節(jié)的仿真實驗測試中,將進一步證明DWPE 算法可使系統(tǒng)達到與集中式算法相當(dāng)?shù)男阅堋?/p>
本節(jié)對DWPE進行仿真測試,并使用其輸出進行主客觀實驗,驗證了所提出的分布式算法對于集中式算法性能的收斂性。首先在3.1 小節(jié)對仿真設(shè)置進行介紹;3.2小節(jié)將會在仿真環(huán)境中對比集中式算法與分布式算法的性能和運算復(fù)雜度;3.3小節(jié)將會在環(huán)境噪聲較高時對比集中式算法與分布式算法的穩(wěn)定性,3.4 小節(jié)將會進行主觀性測聽實驗。本節(jié)內(nèi)若不做特殊說明,為便于比較算法性能,均默認選擇參考節(jié)點進行單節(jié)點算法測試。
如圖3所示,共設(shè)置兩種房間大小。圖3(a)房間尺寸為5 m×5 m×3 m,對應(yīng)兩種混響時間,分別為T60= 450 ms與T60= 650 ms,共有3 個節(jié)點,設(shè)置2 個說話人位置,Position 1 模擬說話人在房間內(nèi)的一般狀況,Position 2 模擬說話人在角落的情況;圖3(b)房間尺寸為7.5 m×7.5 m×3 m,對應(yīng)T60= 900 ms 與T60= 1100 ms 兩種較高的混響時間,共有4 個節(jié)點,設(shè)置2 個說話人位置,Position 3模擬說話人在房間內(nèi)的一般狀況,Position 4 模擬說話人距離所有節(jié)點距離相似的狀況。每個節(jié)點是一個具有3 個傳聲器的均勻線陣,傳聲器之間距離為5 cm。以上設(shè)置可驗證在房間大小、混響時間、節(jié)點數(shù)量與說話人位置等參數(shù)發(fā)生變化時,所提出的分布式算法的普適性。聲源語聲信號從TIMIT 數(shù)據(jù)庫中取得,抽取30 名男性與30 名女性,共計60人語聲,每人25 s。各傳聲器拾取到的信號為純凈語聲與說話人位置到傳聲器的房間沖激響應(yīng)函數(shù)(Room impulse response,RIR)卷積得到,RIR通過鏡像法[31]計算獲得。
圖3 測試仿真房間設(shè)置Fig.3 Room setup for evaluation
每個傳聲器設(shè)置固定的30 dB 的本底噪聲,信號STFT長度為512,幀疊為50%,Lg=8,τ=1。性能測試指標為客觀語聲質(zhì)量評價(Perceptual evaluation of speech quality, PESQ)[32]、短時客觀可懂度(Short-time objective intelligibility, STOI)[33]、語聲混響調(diào)制能量比(Speech-to-reverberation modulation energy ratio, SRMR)[34]。運行算法的計算機處理器為i7-8750H,內(nèi)存為16 GB。
在算法的運算復(fù)雜度與收斂性測試中,選取兩種設(shè)置。分別為說話人位于位置1、T60= 650 ms以及說話人位于位置3、T60= 900 ms 兩種情況。使用已有語聲進行60 次測試。表5展示了仿真實驗中單個節(jié)點在運行單節(jié)點(SN-WPE)、集中式(Cen-WPE)與分布式(DWPE)算法處理25 s 混響語聲所需的平均時間,測試中保持節(jié)點算力一致,且忽略數(shù)據(jù)傳輸時間。
圖4展示了單節(jié)點WPE 算法(Single Node1-WPE、Single Node2-WPE 與Single Node3-WPE)、集中式(Cen-WPE)與分布式(DWPE)算法輸出語聲在PESQ分數(shù)的提升幅度隨時間變化的趨勢。由于收斂速度會受到空間相對位置影響,所以在圖4中對所有節(jié)點的單節(jié)點算法收斂性均進行了展示。由表5耗時情況可知,分布式算法處理時間與單節(jié)點算法相似并低于集中式算法,且WASN 規(guī)模越大,耗時降低幅度會越明顯,這一結(jié)果與2.2 小節(jié)中運算復(fù)雜度分析相吻合。由圖4可知單節(jié)點WPE算法最快收斂至穩(wěn)定,但語聲質(zhì)量提升性能不及集中式算法與分布式算法;由于分布式算法中每節(jié)點的濾波器系數(shù)維度小于集中式,因此在更新初期性能與收斂速度上均優(yōu)于集中式算法,分布式算法于3 s 左右達到穩(wěn)定,集中式算法于6 s 左右達到穩(wěn)定,兩者穩(wěn)定后客觀指標性能處于同一水平。
圖4 各算法隨時間的收斂性Fig.4 Convergence of the tested methods over time
表5 各算法在不同設(shè)置下處理時間Table 5 Processing time of the tested methods in different settings
圖5展示了聲源分別布置在位置1、位置2 與位置3、位置4 時在不同混響情況下單節(jié)點(SNWPE)、集中式(Cen-WPE)及分布式(DWPE)算法結(jié)果各項指標相對于原始信號(Ref)的提升值。每個位置、每種混響時間同樣進行60 次實驗。由圖5可知,分布式算法能夠達到集中式算法的性能,且明顯優(yōu)于使用通道數(shù)較少的單節(jié)點WPE算法。
圖5 隨混響時間增加各算法在不同位置下的性能對比測試Fig.5 Performance comparison of the three methods along increasing reverberation times at different positions
假設(shè)環(huán)境為球各向同性噪聲聲場(Spherically isotropic noise filed),除30 dB 本底噪聲外,給傳聲器注入不同程度的擴散噪聲[35]。圖6展示了分別注入10 dB、15 dB、20 dB、25 dB、30 dB 擴散噪聲時,說話人位于位置1、T60= 650 ms 以及說話人位于位置3、T60= 900 ms 兩種情況下,集中式(Cen-WPE)、分布式(DWPE)及單節(jié)點(SN-WPE)算法結(jié)果的各項評價指標。大部分情況下,分布式算法與集中式算法依舊好于單節(jié)點算法輸出,但由于WPE 算法無降噪能力,隨著噪聲量的增加,λ的估計準確度下降、各算法輸出結(jié)果在混響部分的差異降低,3 種算法的性能逐漸接近;此外,從所有測試指標均可看出,隨噪聲量增加,分布式算法的穩(wěn)定性優(yōu)于集中式算法。
圖6 不同噪聲情況下各算法性能對比測試Fig.6 Performance comparison of the three methods with different levels of noise
為了進一步測試DWPE 算法性能,借鑒文獻[36]的方法,采用主觀測聽的方法進行了DWPE算法與集中式算法以及DWPE 算法與單節(jié)點算法對混響語聲處理性能的對比測試。從TIMIT 數(shù)據(jù)庫中選取6 名女性、6 名男性,共12 名說話人語聲,生成650 ms、900 ms 或1100 ms 三種程度的混響信號,使用3 種算法進行去混響處理,從處理結(jié)果中抽取生成測試材料。實驗共16 名被試,每人的聽力材料由12組對比測試組成,其中有4組為DWPE與單節(jié)點算法(SN-WPE)的對比,其余8 組為DWPE與集中式算法(Cen-WPE)的對比。每組測試需要先聽一遍未處理混響語聲,再測聽兩種算法處理結(jié)果,選擇主觀感受混響更低的進行記錄,如果不能聽出差異,選擇“無差異”。所有測試數(shù)據(jù)均是被打亂過的,測試結(jié)果以百分比的形式在表6與表7中展示,“Equal”表示無差異。從測試結(jié)果可見,DWPE效果顯然優(yōu)于單節(jié)點算法,且大多數(shù)結(jié)果都指向了DWPE 算法與集中式算法的等效性。這證明了DWPE算法充分利用整合了多節(jié)點的數(shù)據(jù),并且性能收斂于集中式算法。
表6 DWPE 與SN-WPE 處理結(jié)果主觀測聽實驗偏好度對比Table 6 Comparison of preferences for the subjective listening test between DWPE and SN-WPE results
表7 DWPE 與Cen-WPE 處理結(jié)果主觀測聽實驗偏好度對比Table 7 Comparison of preferences for the subjective listening test between DWPE and Cen-WPE results
本文將WPE算法應(yīng)用到WASNs上,提出了一種實時分布式運算的自適應(yīng)去混響DWPE 算法。在該方法中,所有節(jié)點共享相同的參考信號,并交換本地輸出,進行并行分布式計算。文中以理論推導(dǎo)的方式證明了DWPE算法的收斂性,在第3 節(jié)通過仿真以及主客觀實驗,證明了DWPE算法在顯著降低計算和傳輸成本的同時,能夠達到與集中式算法相當(dāng)?shù)娜セ祉懶阅?。此外,收斂速度與噪聲測試實驗結(jié)果表明,提出的方法比集中式方法具有更快的收斂速度和更高的穩(wěn)定性。