董曉紅 康平
摘?要:聲源定位技術(shù)是當(dāng)今人們研究的熱門問題,廣泛應(yīng)用于醫(yī)療、交通、雷達、遠程會議、航天、機器人等先進領(lǐng)域。其原理是通過麥克風(fēng)來獲取語音信號,分析并處理數(shù)字信號,來確定聲源的位置。本文用麥克風(fēng)樹時延估計聲源定位法確定聲源的位置。先介紹麥克風(fēng)樹的原理,按照麥克風(fēng)樹離聲源的遠近,將模型分類。
關(guān)鍵詞:麥克風(fēng)樹;近場模型;遠場模型
1 問題分析
語音信號通過麥克風(fēng)拾取,然后通過數(shù)字信號處理技術(shù)把拾取出的語言信號進行處理和分析,來確定聲源的位置。通常使用單個麥克風(fēng)來識取,但其拾音范圍很有限,拾取信號的效果不是很好,如果我們把若干(≥1)只同樣型號的麥克風(fēng)固定安裝在一個剛性的枝形架子上(可水平移動),組成一個麥克風(fēng)樹,不同的麥克風(fēng)所處位置的不同,錄制到的聲音也有細微的不同,進而通過對數(shù)個麥克風(fēng)識取的聲音進行對比分析,得到許多有關(guān)聲源的信息,就可以確定聲源的位置。
2 問題的求解
2.1 麥克風(fēng)樹語音信號處理模型概述
將一組不同位置的聲學(xué)傳感器(麥克風(fēng)),按一定規(guī)則或形狀,排成一個陣列,采集聲音的空間特性叫做麥克風(fēng)樹。
用來采集聲音信號,來獲取聲源的位置信息。按照麥克風(fēng)樹離聲源的遠近,將模型分類,通常分為進場和遠場。
聲波由發(fā)聲體(聲源)產(chǎn)生振動,借助空氣等各種介質(zhì)向四面八方傳播,是一種縱波。也屬于是球面波。
根據(jù)麥克風(fēng)樹距聲源的不同,將聲場模型分為兩類:近場和遠場。近場模型將聲波歸類為球面波,因此需要考慮不同陣元間的相位差;而另一種遠場模型,則是把聲波發(fā)出的近似為平面波,相反的是不考慮麥克風(fēng)不同陣元間接收信號時產(chǎn)生的相位差,而把不同陣元接收信號看成時延關(guān)系。因此遠場模型可看做被簡化的實際模型,這樣就可以最大限度的簡化處理不同信號的難度,一些語音增強法就是在此基礎(chǔ)上產(chǎn)生的。
一般來說遠場模型,即麥克風(fēng)樹距聲源較遠,聲源傳導(dǎo)至麥克風(fēng)樹各不同陣元件的幅度差較小,可以不做考慮,看做平面波模型;近場模型,即麥克風(fēng)樹距聲源的較近,不同陣元間接收信號時產(chǎn)生的幅度差無法忽略,此時看作球面波模型。
遠場模式和遠場近場通常使用下面這個公式對近場遠場進行區(qū)別:
r是參考陣元與聲源距離,λ為聲波波長,L為陣列長度。在現(xiàn)實運用時,式中的r與參考陣元與聲源距離r0相比,確定近遠場:若r0
2.2 近場模型的實際運用
假設(shè)本次模型試驗對象處于近場位,和遠場位有所不同的是,近場位模型需要考慮到聲音發(fā)出的位置與每個麥克風(fēng)之間的相位差,聲音發(fā)出位置和各個麥克風(fēng)的距離不再是等距,定位的空間從原來的一維拓展的二維。聲音發(fā)出位置到每個麥克風(fēng)的聲波幅度減弱也相當(dāng)重要,不可被忽略。根據(jù)聲波傳播特性可以知道:聲波隨著傳播距離的增高,聲波的聲壓也會隨之降低,故聲波傳播距離與其幅度的變化成反比。
圖2引入了任意一個發(fā)聲源Si(t)和各個麥克風(fēng)的距離的參數(shù)rji,以陣列中心為參照點,Si(t)到參照點的距離為ri其他的參照數(shù)與圖2一樣,只要將rji求出,便可以得到型號傳輸方向矢量A,因此得出一個結(jié)構(gòu)關(guān)系式圖1:
近場的均勻線陣接收到的信號可以如圖2:
在這條假設(shè)中使用的近場均勻線陣模型用時延估計法是無法研究,所以這條近場均勻線陣模型不在繼續(xù)進行研究。
2.3 求解遠場模型
若聲源處于遠場,則麥克風(fēng)樹成直線排列,且每個麥克風(fēng)間隔為半個信號波長。通常來講,語言信號的頻率往往在101~3401HZ間,在空氣中傳播的波長一般都在100~340cm,由此可得,每個麥克風(fēng)的距離一般在6~15cm之間。
因為遠場模型中麥克風(fēng)收集到的聲波為平面波,所以每個麥克風(fēng)接受到的信號相對相位相同。聲源s(θ,r),麥克風(fēng)接受到的信號與信號的入射角和信號的頻率都有關(guān)系,因此遠場模型還能表示為均勻線陣:
在該式中,ω為角頻率,公式中的τji是第i個信號傳導(dǎo)第j個麥克風(fēng),與第i個信號傳導(dǎo)第1個麥克風(fēng)達的延時參數(shù)。τji可表示為:
假設(shè)知道在該模型中聲音在空氣中的傳播速度為v,時延TDOA為s,因此l=s*v,根據(jù)這些從而求出θ2=arcsin*l/2d,θ1=π/2-θ2??纱_定該模型中發(fā)聲源人的位置,并用廣義互相關(guān)時延估計算法算出。
該方法的陣列由兩個麥克風(fēng)構(gòu)成,并接收信號,可列函數(shù)為:
2.4 麥克風(fēng)聲源定位的研究與設(shè)計
流程設(shè)計。本文算法簡易,計算量小,應(yīng)用廣泛。廣義互相關(guān)函數(shù)的原理是:首先是求出x1(w)和x2(w)之間的互功率譜函數(shù),通過一些考慮權(quán)重的計算,然后經(jīng)傅里葉反變換法,變換到時域,這樣我們就能求出x1(w)和x2(w)的互相關(guān)函數(shù),求出極大值,然后兩個極大值相減后的絕對值,求出兩組信號的時延。
廣義互相關(guān)時延的估計法相對其他時延估計法簡單很多,該方法方法先估計時延,再通過一簡單運算就即可確定聲源位置。本文的麥克風(fēng)聲源定位是遠場定位在二維平面上實現(xiàn)的,只需要把聲源與麥克風(fēng)樹的角度求出即可,然而這個角度需要測出兩個時延估計值,三維空間要求測出三個時延估計值,這里不做過多講解。本文研究二維只需要測量兩個獨立的時間延遲估計值。每個時間延遲估計值對應(yīng)于一二個方程,把這些方程求出來就可以求出時延估計,所以進行麥克風(fēng)樹聲源定位只需要求出時延估計,再進行一些數(shù)學(xué)計算,就可以確定聲源的位置。根據(jù)上面的描述,基于時延估的計算法的運算量比較小,在實際應(yīng)用中很廣泛。
3 結(jié)論
本文研究的方法“遠場定位法”,以及“廣義互相關(guān)時延估計法”來確定聲源的位置。“遠場定位法”,只需測出聲音信號到達各個麥克風(fēng)的時延(TDOA),然后完成簡單的數(shù)學(xué)公式推導(dǎo)即可。該方法計算量小,易于實現(xiàn),實際應(yīng)用性強。
參考文獻:
[1]吳俁.基于麥克風(fēng)陣列的聲源定位技術(shù)的研究.百度文庫,2008-5-1.
[2]王君培.基于麥克風(fēng)陣列的進場聲源定位與跟蹤.百度文庫,2014-6.
[3]孫韶杰,孫紹俊,李國輝,李紅梅.一種改進的聲測定位時延估計算法[J].計算機應(yīng)用,2006,(11).
基金項目:內(nèi)蒙古自治區(qū)教育科學(xué)“十三五規(guī)劃課題”數(shù)學(xué)建模推進高職院校數(shù)學(xué)課程教學(xué)改革的研究NZJGH2019159
作者簡介:董曉紅(1983—),女,內(nèi)蒙古包頭人,理學(xué)碩士,講師,主要從事高等數(shù)學(xué)的教學(xué)與研究工作。