劉海濤 陳永華 周家盛 程賢福 肖乾
摘要 基于到達(dá)時差(Time Difference of Arrival, TDOA)的多聲源定位中,由于麥克風(fēng)陣列對測量的TDOA值無法與目標(biāo)聲源進(jìn)行關(guān)聯(lián),聲源定位過程會產(chǎn)生關(guān)聯(lián)模糊,從而影響多聲源定位結(jié)果的精度。針對這一問題,提出基于陣列重構(gòu)的多聲源關(guān)聯(lián)模糊消除方法。通過廣義互相關(guān)(Generialized Cross?Correlation, GCC)算法估計麥克風(fēng)陣列的TDOA值,再利用排序算法獲得定位麥克風(fēng)陣列所有可能的TDOAs序列,并基于Chan算法估計所有可能的聲源。通過輪換定位麥克風(fēng)陣列的參考麥克風(fēng),構(gòu)造多組校驗子陣列,利用真實聲源與陣列麥克風(fēng)的相對位置關(guān)系來濾除虛假聲源。對于不同校驗子陣列篩選出的所有聲源位置,以出現(xiàn)頻數(shù)最大化原則再次進(jìn)行冗余校驗,從而提升最終篩選真實聲源的準(zhǔn)確性。仿真及實驗結(jié)果表明,該方法能夠以最少數(shù)量常規(guī)麥克風(fēng)有效消除多聲源定位中的虛假聲源。在同等麥克風(fēng)數(shù)量的情況下,該方法的定位精度及定位魯棒性高于對比方法。
關(guān)鍵詞 多聲源定位; 到達(dá)時差(TDOA); 關(guān)聯(lián)模糊; 互相關(guān)算法; Chan算法
引 言
聲源定位在人機(jī)交互、噪聲源識別和應(yīng)急響應(yīng)等領(lǐng)域得到廣泛的應(yīng)用。到達(dá)時差(TDOA)[1?4]是一種經(jīng)典的聲源定位方法,其數(shù)學(xué)模型實質(zhì)是一組非線性多元方程組,通過求解非線性多元方程組來確定目標(biāo)聲源位置。非線性方程組的求解方法主要有迭代方法[5?6]和閉式方法[7?8],迭代的方法需要設(shè)定初始值,而閉式求解不需要設(shè)定初始值且計算效率高。閉式求解方法在傳感器誤差較小的情況下,能實現(xiàn)克拉美羅下界(CRLB)[8]。
近些年來,多聲源定位引起較多研究者的關(guān)注,Wu等[9]采用TDOA方法進(jìn)行了兩個聲源的定位。Yang等[10]提出一種基于TDOA的多聲源定位算法,該算法是將單聲源定位方法直接擴(kuò)展來實現(xiàn)多聲源定位,然而,在實際場景中往往不成立。對于多聲源定位,TDOA序列可通過觀察兩路信號的互相關(guān)函數(shù)獲得,TDOA的行向量元素是根據(jù)互功率譜中峰值的幅值遞減依次排列。實際定位場景中確定TDOA的估計值與相應(yīng)聲源之間的唯一映射十分困難,會出現(xiàn)時差錯序[11],即TDOA方法對多聲源定位會產(chǎn)生關(guān)聯(lián)模糊[12]問題。
目前,有研究人員提出了一些消除關(guān)聯(lián)模糊的方法。Simon等[13]利用測量信號值和麥克風(fēng)位置構(gòu)造一致性函數(shù),通過快速搜索算法可以找到該函數(shù)的最大值,函數(shù)最大值對應(yīng)的位置為估計目標(biāo)位置,但該方法計算效率低,且沒有直接處理關(guān)聯(lián)模糊問題,導(dǎo)致位置估計不準(zhǔn)確。Stotts等[14]基于結(jié)構(gòu)分析對多聲源定位,在定位區(qū)域上構(gòu)建搜索網(wǎng)格,利用射線模型獲得到達(dá)時間(TOA),以實際到達(dá)時間與假設(shè)模型到達(dá)時間誤差的最小值來確定聲源位置,該方法的計算時間隨著監(jiān)測區(qū)域的增大而增加,定位精度在很大程度上取決于網(wǎng)格大小。Shen等[15]基于凸優(yōu)化方法來消除多聲源定位關(guān)聯(lián)模糊問題,該方法的本質(zhì)是同種聲源中對應(yīng)到達(dá)時間(TOA)向量的每列測量值相同或者近似相同。Venkateswaran等[16]采用并行和分層的方法來解決多聲源關(guān)聯(lián)模糊問題,但此種多聲源定位方法的精度會受到傳播距離的影響,且計算效率較低。以上消除關(guān)聯(lián)模糊定位方法都存在定位精度不高和計算效率低等問題。但佳壁[17]提出利用冗余TDOA信息消除定位模糊,即將陣列分成兩個子集合:第一個集合選取5個傳聲器估計TDOA,并用于定位計算;而另外一個集合中的麥克風(fēng)陣列用于TDOA的排序和校驗。此方法利用真實聲源與陣列麥克風(fēng)的相對位置關(guān)系來對虛假聲源進(jìn)行濾除,并對篩選的結(jié)果進(jìn)行聚類處理,獲得真實聲源位置,可以較好地消除關(guān)聯(lián)模糊,但是在定位精度、魯棒性方面還有改進(jìn)空間。
本文提出基于陣列重構(gòu)的多聲源關(guān)聯(lián)模糊消除方法。通過輪換定位麥克風(fēng)陣列的參考麥克風(fēng),構(gòu)造了多組校驗子陣列?;诙ㄎ畸溈孙L(fēng)陣列TDOA矩陣及任一校驗子陣列TDOA矩陣構(gòu)造可信度評價函數(shù),利用可信度評價函數(shù)最小化原則篩選出聲源位置,對于不同校驗子陣列篩選的所有聲源位置,以出現(xiàn)頻數(shù)最大化原則篩選出最后的聲源。本文方法最大化利用麥克風(fēng)數(shù)量,并利用冗余校驗篩選真實聲源,使篩選結(jié)果更加穩(wěn)定。
1 多聲源定位模型
首先構(gòu)建多聲源定位模型。定位模型中,Nm個麥克風(fēng)分布于三維空間區(qū)域,并由列向量mj=[xjm,yjm,zjm]T, j∈[1,Nm]表示其坐標(biāo)位置。待定位聲源共Ns個,坐標(biāo)位置由si=[xi,yi,zi]T,i∈[1,Ns]表示。多聲源定位場景如圖1所示。
不同的聲源到各個麥克風(fēng)的距離差向量為:
式中 c為聲速;τ(i)j1為第i個聲源到mj和m1兩個麥克風(fēng)的到達(dá)時差;ri為第i個聲源到任意兩個麥克風(fēng)的距離差;r0i為第i個聲源到任意兩個麥克風(fēng)的真實距離差; r0i,Nm1=r0i,Nm?r0i,1;ni是一個具有協(xié)方差矩陣的零均值高斯隨機(jī)噪聲向量。
聲源到麥克風(fēng)陣列的TDOA主要通過廣義互相關(guān)(GCC)[18]算法獲得。TDOA定位測量過程中受到的噪聲干擾通常可由高斯白噪聲模型描述。本文中為方便檢驗定位算法,在仿真過程中通過距離差與聲速的比值來獲取TDOA序列,同時采用零均值高斯噪聲來模擬實際測量中產(chǎn)生的各類隨機(jī)噪聲。
空間聲源定位模型由一組非線性多元方程組成,通常是將其轉(zhuǎn)化為線性多元方程組來求解。對式r0i,Nm1=r0i,Nm?r0i,1的兩邊進(jìn)行平方處理,得到:
式中 Kj=x2jm+y2jm+z2jm,? K1=x21m+y21m+z21m, xj1=xjm?x1m,? yj1=yjm?y1m,? zj1=zjm?z1m,j∈[1,Nm]。
式(4)可寫成矩陣形式:
Chan等[7]提出了一種精度合理的、有效的求解算法,該算法使用兩次加權(quán)最小二乘法給出較準(zhǔn)確的聲源位置。因此,本文采用文獻(xiàn)[7]的方法求解來獲取聲源位置。由式(1)每一行選擇一個元素獲得的時差矩陣用T?P來表示:
式中 NP=NsNm?1。
基于文獻(xiàn)[7]的算法求解出的所有聲源位置用集合SP來表示:
式中 sP表示聲源坐標(biāo);SP表示所有聲源坐標(biāo)的集合,包括真實聲源和虛假聲源。
2 多聲源關(guān)聯(lián)模糊消除方法
本文提出的多聲源定位關(guān)聯(lián)模糊消除方法具體實施可分解為如下三個步驟:
步驟一:基于GCC?PHAT算法估計TDOAs和聲源數(shù)量,獲得消除關(guān)聯(lián)模糊過程中需要的聲源數(shù)量先驗知識。
步驟二:基于陣列重構(gòu),構(gòu)建不同的校驗子陣列。不同麥克風(fēng)陣列定位的真實聲源的估計位置存在特定的信賴域,而虛假聲源的估計位置是不確定的,此原理可用來濾除虛假聲源。
步驟三:將不同校驗子陣列各自所獲得的定位結(jié)果以頻數(shù)最大化作為篩選原則,獲得最終的真實聲源定位結(jié)果。
2.1 基于GCC?PHAT算法估計TDOAs和聲源數(shù)量
理想情況下,可以通過檢測兩個混合信號的互相關(guān)函數(shù)來獲得聲源的TDOA。然而,GCC方法容易受到混響和背景噪聲的干擾,從而影響TDOA估計的準(zhǔn)確性。在實際應(yīng)用中提出了多種GCC估計方法,其中GCC?PHAT算法[18]經(jīng)過歸一化處理,可從兩個混合聲信號中估計聲源個數(shù)和TDOA值。GCC的一般表達(dá)式如下:
式中 Xi(ω)X*j(ω)為混合聲信號xi(t)和xj(t)的交叉功率譜密度;Ψi,j(ω)為加權(quán)函數(shù);F?1[?]表示傅里葉逆變換。
對于GCC?PHAT算法,加權(quán)函數(shù)Ψi,j(ω)的表達(dá)式如下:
式(9)結(jié)果中的顯著峰值代表聲源,從而可以估計聲源的數(shù)量,即峰值的數(shù)量等于聲源的數(shù)量。有效峰值對應(yīng)的橫坐標(biāo)是TDOA的估計值,表達(dá)式如下:
2.2 基于陣列重構(gòu)和冗余校驗消除關(guān)聯(lián)模糊
為了消除多聲源定位中產(chǎn)生的虛假聲源,通過輪換定位麥克風(fēng)陣列的參考麥克風(fēng)來構(gòu)造多組校驗子陣列。根據(jù)聲源與陣列麥克風(fēng)的空間位置關(guān)系,可以計算出所有可能聲源SP到校驗子陣列的TDOA序列,同時校驗子陣列采集的聲信號經(jīng)過GCC?PHAT和時差錯序處理,可以獲得校驗子陣列關(guān)聯(lián)真實聲源的另一組TDOA序列?;诖藘山MTDOA序列,構(gòu)造關(guān)于校驗子陣列的可信度評價函數(shù),同時根據(jù)可信度評價函數(shù)最小化的原則確定真實聲源。圖2為定位麥克風(fēng)陣列和多組校驗子陣列的結(jié)構(gòu)示意圖。
選取陣列2為校驗子陣列,使用GCC?PHAT算法估計出的目標(biāo)聲源到陣列2的TDOAs由矩陣T?C表示:
從矩陣T?C的每一行中選擇一個元素,可以得到一個新的矩陣T?C,如下式所示:
式中 向量?的前Ns個最小的元素包含真實聲源信息。通過按從小到大排序,選擇前Ns個元素,索引計算這些元素相對應(yīng)T? C矩陣的列數(shù)作為下標(biāo)號放入集合U2rs中,陣列2在集合SP中獲得的真實聲源位置為S2rs。
式中 S2rs為基于陣列2的真實聲源集合;U2rs為基于陣列2所篩選的真實聲源相關(guān)的下標(biāo)數(shù)字。
在信噪比較低的定位場景,僅選擇一個校驗子陣列篩選出的真實聲源會有很高的出錯率。為了使消除虛假聲源的過程更加穩(wěn)定,可以使用其他校驗子陣列重復(fù)上述過程來篩選真實聲源。所有校驗子陣列可以得出一個真實聲源集合Snrs:
式中 Snrs是校驗子陣列n所對應(yīng)的真實聲源集合;Unrs是基于校驗子陣列n所篩選出的真實聲源相關(guān)的下標(biāo)數(shù)字。
對集合Snrs,可以將所有聲源出現(xiàn)的頻數(shù)作為篩選原則,按聲源位置出現(xiàn)頻數(shù)由大到小排列,選擇前Ns個頻數(shù)對應(yīng)的聲源位置即為最終真實聲源。通過對多個校驗子陣列的可信度評估,可以顯著提高虛假聲源濾除的穩(wěn)定性。
3 仿真分析
分析本文方法在三種定位場景的有效性,同時,將本文方法與文獻(xiàn)[17]方法在不同信噪比下的定位精度、定位魯棒性進(jìn)行對比分析。
3.1 陣列結(jié)構(gòu)和定位場景
文獻(xiàn)[7]算法求解三維空間分布的聲源,定位過程至少要用5個麥克風(fēng)。在文獻(xiàn)[17]校驗子陣列中至少需要4個麥克風(fēng),可共用一個參考麥克風(fēng),則至少需要8個麥克風(fēng),而本文方法針對三維空間分布的聲源至少需要5個麥克風(fēng)。仿真過程中麥克風(fēng)位置如表1所示。表2給出了三種定位場景,其中包括聲源數(shù)、空間位置及其頻率信息。
3.2 本文方法有效性分析
構(gòu)造不同頻帶的聲源信號,使得本文提出的方法具有頻率適用性。聲源定位過程噪聲干擾的來源有許多,而GCC估計誤差為影響因素之一。仿真實驗中,設(shè)置采樣頻率fs=80000 Hz,麥克風(fēng)陣列的最大間距為0.5 m。圖3為Nm=5,對場景3利用GCC?PHAT算法估計定位麥克風(fēng)陣列的TDOAs。同時基于GCC?PHAT算法估計校驗子陣列的TDOAs,再利用本文方法獲得定位結(jié)果如圖4所示,其中圖4(a),(c),(e)為所有可能的聲源位置;圖4(b),(d),(f)為本文方法估計的真實聲源結(jié)果。
將m1作為參考麥克風(fēng),其他麥克風(fēng)mj,j=2~5與m1可以組成麥克風(fēng)對,每個麥克風(fēng)對(mj,m1)可以估計出4個TDOA值,如圖3所示。每個麥克風(fēng)對估計的TDOA值的個數(shù)與場景3的聲源數(shù)量相等。從圖4中可以看出,本文方法僅用最少麥克風(fēng)數(shù)即可消除虛假聲源,估計出的聲源定位效果良好,誤差合理。
3.3 定位精度對比
將本文方法與對比方法在不同信噪比(SNR)下的定位精度對比分析。多聲源定位精度評價函數(shù)表達(dá)式如下:
式中 ea為均方誤差;si為目標(biāo)聲源位置;s?i為估計的真實聲源位置;Ns為聲源數(shù)。
為了消除隨機(jī)噪聲對單次定位結(jié)果的影響,仿真過程采用蒙特卡羅循環(huán)處理。經(jīng)蒙特卡羅過程可以表示為:
式中 MLE為經(jīng)蒙特卡羅處理后的多聲源定位誤差;q為仿真實驗過程中蒙特卡羅次數(shù),仿真過程令q=1000。
定位精度可用MLE來表示,MLE越小,定位精度越高。將本文方法與文獻(xiàn)[17]提出的方法在不同信噪比進(jìn)行定位精度對比。文獻(xiàn)[17]中提出的方法是通過循環(huán)定位麥克風(fēng)陣列的參考麥克風(fēng),構(gòu)成多種定位子陣列,將最后的定位結(jié)果進(jìn)行聚類處理,通過增加計算量來提升定位精度。不同信噪比下的多聲源定位誤差對比結(jié)果如圖5所示。
由圖5可以看出,在三種定位場景下,隨著信噪比的增加,不同定位方法的定位精度將逐漸提升。在高信噪比條件下,如SNR>0時,不同定位方法的定位精度均處于同一水平。當(dāng)SNR<0時,在同等麥克風(fēng)數(shù)量的情況下,本文方法相比對比方法的定位精度有所提升;一共用5個麥克風(fēng)數(shù)量的本文方法的定位精度比一共用8個麥克風(fēng)數(shù)量的對比方法稍差些。在信噪比較低情況下,如SNR<0時,關(guān)聯(lián)過程可能會出錯,篩選出的所有真實聲源中可能存在虛假聲源。對比方法通過聚類來獲得最終的聲源,這些可能的虛假聲源將會影響聚類結(jié)果。而本文方法引入頻數(shù)篩選,通過冗余校驗可有效減少出錯率。另外,本文方法充分利用定位麥克風(fēng)數(shù),定位麥克風(fēng)數(shù)相比對比方法更多,通過增加定位麥克風(fēng)數(shù)量來提升定位精度。
3.4 定位魯棒性對比
定位魯棒性的評價函數(shù)表達(dá)式如下:
式中 er表示僅運(yùn)行一次的多聲源定位魯性;RM表示經(jīng)蒙特卡羅循環(huán)后的多聲源定位魯棒性;仿真過程令q=1000。
RM越小,定位魯棒性越好。將本文方法與對比方法在不同信噪比下進(jìn)行定位魯棒性對比,三種定位場景對比結(jié)果如圖6所示。
從圖6中可以看出,定位魯棒性與定位精度的變化總體趨勢大體相同,定位魯棒性也隨著SNR的增加而增加。在低信噪比和較多聲源數(shù)量的定位場景中,某一信噪比區(qū)間段的定位魯棒性存在幅度較小的上下波動,如場景3中?10 dB
4 實驗分析
為了驗證本文提出的多聲源定位方法,在空曠的運(yùn)動場上搭建實驗測試系統(tǒng)對算法進(jìn)行驗證。實驗與仿真的麥克風(fēng)位置及聲源位置不變,陣列間距不變,采樣頻率改為fs=100 kHz。實驗場景如圖7所示。對三種定位場景,利用最少數(shù)量常規(guī)麥克風(fēng)驗證本文方法的定位效果,另外在設(shè)置同樣的麥克風(fēng)數(shù)的情況下,對本文方法與對比方法進(jìn)行定位精度和魯棒性對比。圖8是在Nm=5的情況下,對每個通道經(jīng)傅里葉變換獲得的頻譜圖。圖9是在同等麥克風(fēng)數(shù)下,本文方法與文獻(xiàn)[17]方法在三種定位場景下的實驗定位精度和定位魯棒性的對比結(jié)果。
由圖8可以看出,測試采集的聲信號主頻帶在300~1650 Hz之間,與仿真過程構(gòu)造的聲信號頻帶相同。然而,聲信號中也出現(xiàn)了一些其他頻率成分,說明測試環(huán)境存在背景噪聲。從圖9中可以看出,在同等麥克風(fēng)數(shù)的情況下,本文方法的定位精度比對比方法性能更好,實驗與仿真結(jié)論一致。從評估定位魯棒性的RM值大小可以發(fā)現(xiàn),當(dāng)聲源數(shù)量較少時,本文方法定位魯棒性與對比方法接近,如場景1;當(dāng)增加聲源的數(shù)量,本文方法的定位精度和定位魯棒性相比對比方法性能更好,如場景2和3。從實驗結(jié)果中可以看出,本文提出的多聲源定位方法比對比方法具有更好的定位精度和定位魯棒性,且在聲源數(shù)量增多時表現(xiàn)更為顯著。
5 結(jié) 論
針對基于TDOA多聲源定位中存在的關(guān)聯(lián)模糊問題,本文提出基于陣列重構(gòu)的多聲源關(guān)聯(lián)模糊消除方法。通過構(gòu)造多組校驗子陣列,利用聲源與陣列麥克風(fēng)之間的空間位置關(guān)系來消除虛假聲源,同時利用冗余校驗來提升篩選真實聲源過程的穩(wěn)定性。通過仿真及實驗獲得以下結(jié)論:
(1)本文方法以最少數(shù)量的常規(guī)麥克風(fēng)消除多聲源定位的關(guān)聯(lián)模糊,獲得真實聲源位置;
(2)在同等麥克風(fēng)情況下,本文方法比對比方法的定位精度和定位魯棒性均有所提升;
(3)在低信噪比和較多聲源數(shù)量的定位場景下,本文方法的定位精度和定位魯棒性的性能優(yōu)勢更明顯。
參考文獻(xiàn)
1Zhu N, Wu S F. Sound source localization in three-dimensional space in real time with redundancy checks[J]. Journal of Computational Acoustics, 2012, 20(1): 1250007.
2Wang Y, Ho K C. TDOA positioning irrespective of source range[J]. IEEE Transactions on Signal Processing, 2017, 65(6): 1447-1460.
3Yin J H, Wan Q, Yang S W, et al. A simple and accurate TDOA-AOA localization method using two stations[J]. IEEE Signal Processing Letters, 2016, 23(1):144-148.
4Ho K C. Bias reduction for an explicit solution of source localization using TDOA[J]. IEEE Transactions on Signal Processing, 2012, 60(5): 2101-2114.
5Torrieri D J. Statistical theory of passive location systems[J]. IEEE Transactions on Aerospace & Electronic Systems, 1984, 20(2): 183?198.
6Carevic D. Automatic estimation of multiple target positions and velocities using passive TDOA measurements of transients[J].IEEE Transactions on Signal Processing, 2007, 55(2): 424-436.
7Chan Y T, Ho K C. A simple and efficient estimator for hyperbolic location[J]. IEEE Transactions on Signal Processing, 1994, 42(8): 1905-1915.
8Ho K C, Lu X N, Kovavisaruch L. Source localization using TDOA and FDOA measurements in the presence of receiver location errors: analysis and solution[J]. IEEE Transactions on Signal Processing, 2007, 55(2): 684-696.
9Wu S F, Zhu N. Locating arbitrarily time-dependent sound sources in three dimensional space in real time[J]. The Journal of the Acoustical Society of America, 2010, 128(2): 728-739.
10Yang L, Ho K C. An approximately efficient TDOA localization algorithm in closed-form for locating multiple disjoint sources with erroneous sensor positions[J]. IEEE Transactions on Signal Processing, 2009, 57(12): 4598-4615.
11Mazur R, Mertins A. An approach for solving the permutation problem of convolutive blind source separation based on statistical signal models[J]. IEEE Transactions on Audio, Speech and Language Processing, 2009, 17(1): 117-126.
12Ma W K, Vo B N, Singh S S, et al. Tracking an unknown time-varying number of speakers using TDOA measurements: a random finite set approach[J]. IEEE Transactions on Signal Processing, 2006, 54(9): 3291-3304.
13Simon G, Maróti M, Lédeczi ?, et al. Sensor network-based countersniper system[A].Proceedings of the 2nd International Conference of Embedded Networked Sensor System[C]. Baltimore, USA, 2004: 1?12.
14Stotts S A, Martin J L. Multiple-source localization using GPS technology and received arrival time structure analysis in an air-deployed system[J]. IEEE Journal of Oceanic Engineering, 1997, 22(3): 576-582.
15Shen H, Ding Z, Dasgupta S, et al. Multiple source localization in wireless sensor networks based on time of arrival measurement[J]. IEEE Transactions on Signal Processing, 2014, 62(8): 1938-1949.
16Venkateswaran S, Madhow U. Localizing multiple events using times of arrival: a parallelized, hierarchical approach to the association problem[J]. IEEE Transactions on Signal Processing, 2012, 60(10): 5464-5477.
17但佳壁. 汽車排氣外聲場可視化方法研究[D]. 北京:清華大學(xué),2017.
DAN Jiabi. Visualization techniques on exterior acoustic field of vehicle tailpipe[D]. Beijing: Tsinghua University, 2017.
18Knapp C, Carter G. The generalized correlation method for estimation of time delay[J]. IEEE Transactions on Acoustics, Speech and Signal Processing, 1976, 24(4): 320-327.
Method of association ambiguity elimination for multi-source localization
LIU Hai-tao 1,2 ?CHEN Yong-hua 1,3ZHOU Jia-sheng 1CHENG Xian-fu 1XIAO Qian 1
1. School of Mechanotronics and Vehicle Engineering, East China Jiaotong University, Nanchang 330013, China;
2. Tsinghua University Suzhou Automotive Research Institute, Suzhou 215131, China;
3. School of Civil Engineering and Transportation, South China University of Technology, Guangzhou 510640, China
Abstract For the multi-source localization based on TDOA, because the measured TDOA values from the microphone array cannot associate with the target sources, the process of source localization will produce association ambiguity, thus affecting the accuracy of multi-source localization results. The GCC algorithm is used to estimate TDOA values of microphone array. Then all possible TDOAs sequences of microphone array are obtained by permutation algorithm, and all possible sound sources can be estimated based on Chan algorithm. A group of check sub-arrays is constructed by switching the reference microphone in the array, and the phantom sound sources are filtered out by the relative position relationship between the true sound sources and the array microphones. For all sound source locations screened by different check sub-arrays, redundancy check is carried out again according to the principle of maximum occurrence frequency, so as to improve the accuracy of the final real sound sources. The simulation and experiment results show that the proposed method can effectively eliminate the phantom sound sources in multi-sources localization by using the least number of conventional microphones. The localization accuracy and localization robustness of the proposed method are higher than that of the comparison method with the same number of array microphones.
Keywords multi-source location; time difference of arrival (TDOA); association ambiguity; GCC algorithm; Chan algorithm