鄭 輝,王 鵬,張 濤
(天津市計量監(jiān)督檢測科學(xué)研究院,天津300192)
聲源識別定位系統(tǒng)技術(shù)廣泛應(yīng)用于軍用[1]和民用[2]領(lǐng)域,在民用領(lǐng)域中主要用于環(huán)保、無損檢測和交通運(yùn)輸行業(yè)。近年來,在麥克風(fēng)陣列基礎(chǔ)上衍生的定位技術(shù)成為研究熱點(diǎn)。其基本原理比較簡單,是通過具有一定幾何擴(kuò)展結(jié)構(gòu)的陣列采集聲源信號,通過相應(yīng)的陣列信號處理技術(shù)對語音信號進(jìn)行系統(tǒng)的分析和處理,確定聲源的位置和方向?;邴溈孙L(fēng)陣列的聲源定位技術(shù)在學(xué)術(shù)界有著非常突出的研究價值和十分廣泛的應(yīng)用前景。由于不一樣的場合下聲源所發(fā)出的聲音信號類別不同,周圍環(huán)境也不同,然而聲源定位的思路方法是相同的,所以在不同的領(lǐng)域中也可以使用部分關(guān)于聲源定位的核心算法。本文將分析基于麥克風(fēng)陣列的聲源定位技術(shù)的不同算法。
在這個聲源定位系統(tǒng)中,麥克風(fēng)陣列處于最前端,在整個信號采集及后續(xù)處理過程中起著十分重要的作用。將陣列模擬成一個空間模型,它顯示的聲源信號將對應(yīng)陣列的空間信息。根據(jù)不同的聲源距離,將陣列模型可以分為近場和遠(yuǎn)場兩種不同的類型。信號輸入為遠(yuǎn)處聲源時,陣列直徑忽略不計,傳聲器收到的聲波信號為平面波,如圖1所示,此時僅需要確定聲波的入射方向即可,無需考慮具體的距離和方位。信號輸入為近處聲源時,則需考慮聲源與陣列之間的距離,傳聲器收到的聲波信號為球面波,如圖2所示。近處聲源模型更貼近實(shí)際情況,提供了更多的聲源信息,提高了定位準(zhǔn)確度。
圖1 遠(yuǎn)處聲源示意圖
圖2 近處聲源示意圖
根據(jù)聲源定位技術(shù),總結(jié)了不同的定位算法,包括可控波束形成、高分辨率譜估計和時延估計等定位算法。
可控波束形成技術(shù)是比較成型的技術(shù),地位也比較重要,被廣泛應(yīng)用于雷達(dá)等通信領(lǐng)域。波束形成法的使用原理:在基于麥克風(fēng)陣列的聲源定位技術(shù)中是加權(quán)求和各個陣元輸出,得到基陣的輸出,在利用改變加權(quán)的系數(shù)在其余的方向上產(chǎn)生較小的響應(yīng),而在希望的方向上形成較強(qiáng)的波束。確定出聲源信號的方位信息則是利用對整個觀測空間的波束進(jìn)行掃描。定位算法包括以下兩種。
延遲求和波束算法。這是一種基本波束形成方法,該方法利用信號之間的相位延遲來改變波的方向,該計算方法計算量小、信號失真度小,但這種方法有個缺點(diǎn)就是對噪聲的魯棒性較差,需要更多的陣列來彌補(bǔ)。
自適應(yīng)濾波算法。在上述技術(shù)的基礎(chǔ)上增加了自適應(yīng)濾波技術(shù)。該方法根據(jù)相應(yīng)的決策依據(jù)調(diào)整權(quán)重,得到相應(yīng)的最優(yōu)波束形成器。常用的標(biāo)準(zhǔn)有最小均方誤差等。自適應(yīng)濾波算法計算量小、信號失真小,但對噪聲魯棒性強(qiáng),所需陣列少[3]。
高分辨率譜估計的定位算法的基本原理是通過計算相關(guān)矩陣的空間之譜,利用每個元素信號的相關(guān)擬合矩陣得到聲源的方向。該算法主要包括Characteristic Subspace算法和Subspace Fitting算法。
Characteristic Subspace算法的基本原理是從陣列接收到的各種聲音信號中提取自相關(guān)矩陣,然后將其分解為信號和噪聲兩個不同的特征值,通過比較兩個子空間的特征值,對其進(jìn)行空間譜搜索,完成位置估計。該算法包括多信號分類算法、旋轉(zhuǎn)不變子空間算法等。
Subspace Fitting算法的基本原理是在陣列收到的信息數(shù)據(jù)的子空間與陣列形狀之間建立擬合關(guān)系。這種算法包括SSF算法、NSF算法等,應(yīng)用也較為廣泛。
上述兩種不同的定位算法主要針對的是區(qū)間較窄的信號,在過去普通的陣列信號處理過程得到了廣泛的應(yīng)用。但由于聲源信號大多使用的較寬的區(qū)間信號,因此定位算法的實(shí)用性方面不強(qiáng)。另外,該信號需要統(tǒng)計特別平穩(wěn)的信號在時域中巧妙地估計相關(guān)矩陣。然而,對于聲音、語言等不平穩(wěn)信號,在極短平穩(wěn)時間內(nèi)很難采集到足夠及充分的數(shù)據(jù)來滿足高分辨率譜估計準(zhǔn)確度的要求。因此,這種定位算法在實(shí)際應(yīng)用中并沒有得到廣泛的應(yīng)用。
此種類型的定位算法,其基本原理是依據(jù)信號從初始位置到達(dá)不同距離和位置接受器的時間之差,通過一系列算法算出信號位置所對應(yīng)的特征面,多種接收器可以同步接收不同種的特征面,各特征面的交匯處就是信號源的位置,該方法在當(dāng)前應(yīng)用最為廣泛。
時延估計法具有方法簡單、運(yùn)算量小等優(yōu)點(diǎn),在基于麥克風(fēng)陣列的聲源定位算法中較受歡迎。在該系統(tǒng)中,定位確定過程大致分為兩個不同階段:時延估計階段和定位階段。由于特征面的幾何特性,時延值估計的誤差在定位階段被放大,導(dǎo)致定位的成功率低下,定位誤差也隨之增大。因此,如何提高時延估計的成功率和準(zhǔn)確度便成了聲源定位系統(tǒng)的關(guān)鍵。同時,時延估計的技術(shù)和理論也由于各種新型技術(shù)的出現(xiàn)得到了快速發(fā)展,各種基于時延估計的改進(jìn)算法也隨之涌現(xiàn)。
此種類型的算法是比較實(shí)用的時延估計算法,它主要手段是利用互相關(guān)函數(shù)來進(jìn)行計算。在該系統(tǒng)中,陣列的每個接收器接收到的信號都可能來源于同一處,并且信號之間有很強(qiáng)的相關(guān)性。在最理想的條件下,每兩個信號之間的時間延遲可以通過計算每兩個信號之間的相關(guān)函數(shù)來確定。
在上述GCC算法中,信號的產(chǎn)生使用的是理想模型,沒有加入室內(nèi)混響噪聲的影響因素,因此,混響噪聲影響到一定程度時,GCC計算方法的結(jié)果并不理想。而本辦法最小均方算法中使用的信號是根據(jù)實(shí)際情況建立的模型。通過自身的適應(yīng)性濾波,在房間內(nèi)產(chǎn)生單位的脈沖響應(yīng)函數(shù),然后根據(jù)響應(yīng)函數(shù)得到估計值。此計算方法從噪聲混響以及屋內(nèi)的沖擊反饋出發(fā),能有效地減少混響。
本文首先介紹了麥克風(fēng)陣列聲源定位系統(tǒng)的研究意義,其次總結(jié)了聲源定位算法的研究現(xiàn)狀及發(fā)展趨勢,最后根據(jù)當(dāng)前主流麥克風(fēng)聲源定位的方法,總結(jié)了不同的定位技術(shù)及算法,并系統(tǒng)地分析了三種定位算法的優(yōu)缺點(diǎn),為本項(xiàng)目組日后開展聲源定位系統(tǒng)校準(zhǔn)裝置的開發(fā)奠定了理論基礎(chǔ)。