章康寧,王星稚,劉康,高志華,孫科學(xué)
?
基于可控波束響應(yīng)的球形傳聲器陣列定位方法研究
章康寧1,王星稚1,劉康1,高志華1,孫科學(xué)2,3
(1. 南京郵電大學(xué)通信與信息工程學(xué)院,江蘇南京 210023;2. 南京郵電大學(xué)電子科學(xué)與工程學(xué)院,江蘇南京 210023; 3. 江蘇省射頻集成與微組裝工程實(shí)驗(yàn)室,江蘇南京 210023)
球形傳聲器陣列因其完全對(duì)稱的結(jié)構(gòu),可在三維空間內(nèi)實(shí)現(xiàn)有效的聲源定位。文章重點(diǎn)關(guān)注基于球諧函數(shù)展開的可控波束響應(yīng)算法,推導(dǎo)了算法的實(shí)現(xiàn)流程,并通過仿真驗(yàn)證了可控波束響應(yīng)算法的性能。建立了包含8個(gè)傳聲器單元的實(shí)驗(yàn)系統(tǒng),其中球形結(jié)構(gòu)在8個(gè)單元的條件下可以視為立方結(jié)構(gòu),通過低階球諧展開實(shí)驗(yàn)驗(yàn)證了可控波束算法的性能。在視聽室的實(shí)驗(yàn)結(jié)果充分驗(yàn)證了定位算法的有效性,定位誤差小于10°。
聲源定位;球型傳聲器陣列;可控波束響應(yīng);定位算法
聲源定位通常是指通過聲場(chǎng)分析獲得噪聲的方位和頻譜信息,其在故障診斷和噪聲治理等領(lǐng)域有廣泛的應(yīng)用。在較為復(fù)雜的聲學(xué)環(huán)境中,聲信號(hào)往往來源于多個(gè)不同的聲源,如果各個(gè)聲源不能獨(dú)立工作,簡(jiǎn)單的聲學(xué)測(cè)量就無法對(duì)源信息做準(zhǔn)確的分析。有時(shí)甚至同一個(gè)聲源也會(huì)因體積較大或分割振動(dòng)等原因呈現(xiàn)出較為復(fù)雜的聲輻射特性,這同樣給聲源識(shí)別帶來較大困難。在這些復(fù)雜條件下,可以借助傳聲器陣列的聲源定位特性對(duì)聲源進(jìn)行識(shí)別。傳聲器陣列是指按一定空間分布放置的一組傳聲器。通過利用聲波抵達(dá)陣列中每個(gè)單元之間的幅度和相位差異,傳聲器陣列可以實(shí)現(xiàn)對(duì)聲源的有效定位[1,2]。球形傳聲器陣列因其完全對(duì)稱的結(jié)構(gòu),可在三維空間內(nèi)實(shí)現(xiàn)有效的聲源定位,因此受到研究者的廣泛重視。
基于可控波束響應(yīng)的聲源定位技術(shù)對(duì)傳聲器所接收到的聲源信號(hào)濾波并求加權(quán)和來形成波束,調(diào)節(jié)傳聲器陣列的波束方向,在整個(gè)接收空間內(nèi)掃描,最終使波束輸出功率最大的點(diǎn)就是聲源的位置[3]??煽夭ㄊ憫?yīng)的定位技術(shù)主要有延遲累加波束算法和球諧函數(shù)波束算法[4,5]。延遲累加波束算法較為簡(jiǎn)單,通過利用陣列單元間的時(shí)延信息進(jìn)行相應(yīng)的加權(quán)累加,形成單一方向的波束,但波束的主瓣寬度較大,導(dǎo)致定位的分辨率較低。針對(duì)球形傳聲器陣列的特點(diǎn),可以借助球諧函數(shù)對(duì)入射聲波做正交分解[6],并對(duì)陣列單元的信號(hào)做空間域上的變換加權(quán),最終得到特定的波束。當(dāng)球諧函數(shù)展開階數(shù)較高時(shí),可控波束響應(yīng)的主瓣較窄,使定位結(jié)果較為精確。
球諧函數(shù)的展開階數(shù)與傳聲器個(gè)數(shù)需要滿足一定的關(guān)系[7]:
(1) 傳聲器等角分布:即球坐標(biāo)中的水平角和仰角在相鄰兩個(gè)傳聲器是固定的,此時(shí)與的關(guān)系為:。這種分布的優(yōu)勢(shì)在于其角度差是固定的,有利于球陣列的等角轉(zhuǎn)動(dòng)。其劣勢(shì)在于需要較多的傳聲器并有隨之而來的信息處理量。
(2) 傳聲器高斯分布:即球坐標(biāo)中的水平角在相鄰兩個(gè)傳聲器是固定的,而仰角并不固定,但仰角方向上的相鄰兩個(gè)傳聲器的距離是相等的,此時(shí)與的關(guān)系為:。相對(duì)于等角分布,其優(yōu)勢(shì)是減少了傳聲器的個(gè)數(shù),但由于在仰角方向的角度差不相等,會(huì)帶來測(cè)量的不便。
(3) 傳聲器均勻分布:即球坐標(biāo)中的水平角和仰角在相鄰兩個(gè)傳聲器都不是固定的,但兩傳聲器間的距離都相等,此時(shí)與的關(guān)系為:。這種分布的優(yōu)點(diǎn)是更大地減少了傳聲器的個(gè)數(shù),但由于兩傳聲器的角度差不相等,會(huì)導(dǎo)致測(cè)量不方便,而且此種分布下的FFT計(jì)算也會(huì)受到影響。根據(jù)以上所述,均勻分布的陣列雖然測(cè)量時(shí)會(huì)不太方便,但所需要的傳聲器單元數(shù)最少,因此本論文討論的是均勻分布的陣列單元。盡管球諧函數(shù)展開波束算法需要進(jìn)行全局搜索,運(yùn)算量較大,且要依賴于聲源信號(hào)的頻譜特性,但其有較高的分辨率,能精確定位聲源,而且還能適用于多聲源場(chǎng)合,實(shí)際應(yīng)用較為廣泛。
本文針對(duì)可控波束響應(yīng)定位算法在球形傳聲器陣列中的應(yīng)用展開討論,分析和推導(dǎo)了在球諧域?qū)崿F(xiàn)可控波束響應(yīng)的算法流程,并通過仿真和實(shí)驗(yàn)驗(yàn)證了定位結(jié)果的有效性。
理想情況下,由可控波束響應(yīng)算法得到的波束是一個(gè)在空間上的沖激信號(hào),此時(shí)的波束主瓣無限小,旁瓣為零,則波束的分辨率可以無限精確,用公式表示為
由于球諧函數(shù)滿足正交完備性[6]:
(3)
對(duì)式(1)做球諧函數(shù)展開,再根據(jù)沖激信號(hào)的積分特性,可得:
實(shí)際應(yīng)用中,階數(shù)不可能為無限大,取階數(shù)為,則波束響應(yīng)為:
(5)
其中
(7)
表1 不同球陣列結(jié)構(gòu)的參數(shù)
另外在數(shù)值計(jì)算中,公式(7)無法計(jì)算積分,但可以通過近似得到
(9)
最后,結(jié)合以上討論和公式,計(jì)算某個(gè)角度下的響應(yīng)公式為
(11)
根據(jù)式(11),搜索空間的所有水平角和仰角(),可以得到全空間不同方向上的波束響應(yīng),響應(yīng)最大值對(duì)應(yīng)的角度即為聲源的入射方向。
理論上傳聲器的個(gè)數(shù)越多,球諧函數(shù)展開的階數(shù)越高,則最終的定位結(jié)果的分辨率就越高。為保證仿真精度,選擇展開階數(shù)為6階。采用的陣列為以坐標(biāo)原點(diǎn)為球心、半徑為0.5 m的球陣列(選擇較大半徑的球陣列是因?yàn)楫?dāng)球諧函數(shù)展開的階數(shù)較高時(shí),陣列半徑和聲信號(hào)的主要頻譜成分之間需要滿足一定的約束條件[8]。這是由球諧函數(shù)近似而產(chǎn)生的正交誤差所決定的。傳聲器位置采用均勻分布(兩傳聲器間隔接近相等,位置計(jì)算采用文獻(xiàn)[9]提到的非線性規(guī)劃方法),單元個(gè)數(shù)為64(滿足傳聲器個(gè)數(shù)和展開階數(shù)的關(guān)系),如圖1所示。
假設(shè)聲源位于水平角為80°、仰角為30°(即球坐標(biāo)為60°),距離坐標(biāo)原點(diǎn)2 m的地方。聲源信號(hào)為播音員標(biāo)準(zhǔn)測(cè)試語音信號(hào),采樣率為44100 Hz,各傳聲器接收信號(hào)可以利用鏡像模型計(jì)算聲源到達(dá)各傳聲器的傳遞函數(shù)來獲得。以下所有仿真環(huán)境如未說明即為自由場(chǎng),且不添加任何噪聲。根據(jù)Spherical Harmonic Beam(SHB)的算法流程,定位的結(jié)果如圖2所示。
由于實(shí)際環(huán)境中混響和噪聲的影響,需要對(duì)算法做魯棒性分析(假設(shè)房間中心在原點(diǎn),長(zhǎng)寬高分別為8、6和4 m,聲源及陣列位置保持不變)。評(píng)測(cè)六面墻相等的反射系數(shù)從小到大變化導(dǎo)致的定位方向的偏差,即混響的影響。由于全空間搜索間隔為20°,所以偏差以10°近似(下文仿真搜索間隔相同),結(jié)果如表2所示。
表2 混響對(duì)SHB算法的影響
較高混響下,不同方向上會(huì)出現(xiàn)偽聲源,這些峰值是由各反射面的反射造成的。由于聲源和陣列均處于房間中心附近,距離墻壁較遠(yuǎn),混響對(duì)定位的影響不是很明顯,所以當(dāng)混響較高的時(shí)候才出現(xiàn)定位出錯(cuò)。在一般混響下,定位結(jié)果可有效反映實(shí)際聲源的位置。
信噪比(Signal Noise Ratio, SNR)從大變小導(dǎo)致定位方向的平均偏差(多次偏差的絕對(duì)值求平均),可反映噪聲的影響。結(jié)果如表3所示。
表3 噪聲對(duì)SHB算法的影響
可見在一般噪聲影響下,算法的定位誤差較小。在較強(qiáng)噪聲背景下,定位的偏差也不是很大,這是因?yàn)榉抡婕尤氲脑肼暿侵苯犹砑拥叫盘?hào)接收端,并沒有附加位置的信息。假如噪聲是來源于一固定位置的噪聲源,定位的等高線圖會(huì)出現(xiàn)聲源方向和噪聲源方向上的多個(gè)峰值。
由于受到實(shí)驗(yàn)條件的限制,實(shí)驗(yàn)中無法用到64個(gè)傳聲器,而是用8個(gè)傳聲器構(gòu)建了一個(gè)基本的球陣列,三維陣列實(shí)際的邊長(zhǎng)為0.16 m,半徑約為0.14 m。實(shí)驗(yàn)的信號(hào)采集設(shè)備為丹麥B&K公司的B&K Pulse 3560D,采樣頻率為65536 Hz。聲源為TANNOY同軸揚(yáng)聲器,測(cè)試信號(hào)使用白噪聲與播音員標(biāo)準(zhǔn)測(cè)試語音信號(hào)。實(shí)驗(yàn)環(huán)境為混響時(shí)間約0.3 s的視聽室。實(shí)驗(yàn)時(shí),可以旋轉(zhuǎn)陣列三腳架的旋鈕上下轉(zhuǎn)動(dòng)或者左右轉(zhuǎn)動(dòng),等效于改變聲源的方位而不需要移動(dòng)聲源。但從三腳架刻度得到的水平角和仰角并不能完全等同于坐標(biāo)的水平角和仰角,需要進(jìn)行幾何上的轉(zhuǎn)換。另外,轉(zhuǎn)動(dòng)時(shí),由于轉(zhuǎn)動(dòng)點(diǎn)不在陣列中心,需要實(shí)時(shí)地對(duì)聲源進(jìn)行微調(diào),使聲源與陣列中心保持在同一水平面上,并且確保相互距離不變。實(shí)驗(yàn)中信噪比均高于40 dB,實(shí)現(xiàn)重復(fù)次數(shù)為5次。
3.1 實(shí)驗(yàn)1(測(cè)試信號(hào):白噪聲)
聲源距離陣列1 m,定位頻率為655 Hz時(shí)的定位偏差如表4所示,表4中定位誤差小于10°時(shí)記為0。
表4 噪聲源與球陣列形成不同角度時(shí)的定位偏差 (聲源距離球陣列1 m)
3.2 實(shí)驗(yàn)2 (測(cè)試信號(hào):語音信號(hào))
聲源距離陣列1 m,定位頻率為655 Hz時(shí)的定位偏差如表5所示,表5中定位誤差小于10°時(shí)記為0。
從實(shí)驗(yàn)結(jié)果可以看出,除了極個(gè)別情況,球陣列可控波束響應(yīng)算法的定位誤差都在10°以內(nèi),考慮到陣列單元的個(gè)數(shù)較少,只能做低階球諧展開,這是一個(gè)很高的定位精度。此外,算法對(duì)不同種類的信號(hào)有很強(qiáng)的適應(yīng)性。
表5 語音聲源與球陣列形成不同角度時(shí)的定位偏差 (聲源距離球陣列1 m)
本文討論在球形傳聲器陣列中利用球諧函數(shù)正交展開,使用可控波束響應(yīng)方法進(jìn)行聲源定位的算法,給出了算法的理論推導(dǎo)流程,并通過仿真和實(shí)驗(yàn)驗(yàn)證了算法的有效性。實(shí)驗(yàn)結(jié)果表明:球陣列可控波束響應(yīng)算法在具有一定混響的聲學(xué)場(chǎng)景中有較高的定位效果。
[1] Benesty J, Chen J D, Huang Y T. Microphone array signal processing[M]. Springer, 2008.
[2] Koretz A, Rafaely B. Dolph–Chebyshev beampattern design for spherical arrays[J]. IEEE Trans. Signal Processing, 2009, 57(6): 2417-2420.
[3] Petersen S O. Localization of sound sources using 3D microphone array, University of Southern Denmark, 2004.
[4] Thushara A, Prasanga S. Analysis and synthesis of room transfer function over a region of space using distributed spherical microphone arrays[J]. J. Acoust. Soc. Am., 2012, 131(4): 3209-3215.
[5] Epain N, Jin C T. Independent component analysis using spherical microphone arrays[J]. Acta Acustica united with Acustica, 2012, 98(1): 91-102.
[6] Park M, Rafaely B. Sound-field analysis by plane-wave decomposition using spherical microphone array[J]. J. Acoust. Soc. Am. 2005, 118(5): 3094-3102.
[7] Rafaely B. Analysis and Design of Spherical Microphone Arrays[J]. IEEE Trans. Speech, Audio Proc. 2005, 13(1): 135-143.
[8] Li Z, Duraiswami R. Flexible and optimal design of spherical microphone arrays for beamforming[J]. IEEE Trans. Audio, Speech, Lang. Proc. 2007, 15(2): 702-714.
[9] Fliege J, Maier U. The distribution of points on the sphere and corresponding cubature formulae[M]. IMA J. Numer. Anal. 1999, 19(2): 317-334.
Study of controllable beam response algorithm for spherical microphone arrays
ZHANG Kang-ning1, WANG Xing-zhi1, LIU Kang1, GAO Zhi-hua1, SUN Ke-xue2,3
(1. College of Telecommunications & Information, Nanjing University of Posts and Telecommunications, Nanjing 210023, Jiangsu, China;2. College of Electronics Science and Engineering, Nanjing University of Posts and Telecommunications, Nanjing 210023, Jiangsu, China;3. Jiangsu Province Engineering Laboratory of RF Integration & Micropackage, Nanjing 210023, Jiangsu, China)
Spherical microphone arrays can realize effective beamforming and localization in 3-D space because of its completely symmetrical structure. This paper focuses on the controllable beam response algorithm based on spherical harmonic function expansion. The implementation process of the algorithm is derived, and the performance of the algorithm is verified by simulation.An experimental system containing eight microphone units is established. The spherical structure under the condition of 8 units can be seen as a cubic structure.Through the experiment of low order spherical harmonic expansion,the performance of the controllable beam algorithm is verified. The experimental results in the audiovisual room validate the effectiveness of the localization algorithm, and the error of localization is less than 10 degrees.
sound source localization; spherical microphone array; controllable beam response; location algorithm
TN912.16
A
1000-3630(2015)-06-0489-04
10.16300/j.cnki.1000-3630.2015.06.003
2015-05-25;
2015-08-20
國(guó)家級(jí)大學(xué)生創(chuàng)新訓(xùn)練計(jì)劃(SZDG2014002)、南京郵電大學(xué)自然科學(xué)基金(NY214049)、江蘇省高校自然科學(xué)研究面上項(xiàng)目(15KJD510001)資助。
章康寧(1994-), 男, 江蘇南京人, 研究方向?yàn)橥ㄐ殴こ獭⑿盘?hào)處理。
孫科學(xué), E-mail: sunkx@njupt.edu.cn