夏加高, 李文新, 曹靚姝, 李泰國
(蘭州空間技術(shù)物理研究所,蘭州 730000)
?
空間飛行器內(nèi)聲源定位算法研究
夏加高, 李文新, 曹靚姝, 李泰國
(蘭州空間技術(shù)物理研究所,蘭州 730000)
空間飛行器內(nèi)空間狹小,存在較大的語音混響現(xiàn)像,飛行器內(nèi)乘員不帶專用耳戴進(jìn)行語音通話時(shí),混響信號影響通話質(zhì)量。利用聲源方位的信號進(jìn)行語音增強(qiáng)的方法可以抑制混響的干擾,獲得較好的通話效果。常用的聲源定位算法由于受混響的影響,很難對乘員的語音進(jìn)行有效地定位。通過研究空間飛行器的語音傳輸特性,提出了基于相關(guān)系數(shù)波束形成算法,該算法利用波形的相似性來抑制混響的干擾。實(shí)驗(yàn)證明:算法具有較好的聲源定位效果,為語音增強(qiáng)提供聲源方位參數(shù)。
飛行器;聲源定位;相關(guān)系數(shù);波束形成;語音增強(qiáng)
隨著我國航天事業(yè)的發(fā)展,載人的空間飛行器已經(jīng)在太空中在軌運(yùn)行??臻g飛行器內(nèi)乘員與地面人員的通話是通過語音單元完成的。由于空間飛行器內(nèi)空間狹小,存在較大的混響現(xiàn)象,乘員可通過專用的耳戴來減少混響的影響。但是乘員在飛行器內(nèi)長時(shí)間工作、生活,與不同艙段的乘員通話都要使用專用的耳戴,從而引起諸多不便。因此,研發(fā)消除混響的語音通話單元使乘員無需使用專用耳戴就可進(jìn)行語音通話,給乘員帶來了極大的方便。
空間飛行器語音單元由麥克風(fēng)陣列采集語音信號,當(dāng)獲取聲源的方向時(shí),可以通過增強(qiáng)聲源方向的語音信號來抑制混響的干擾[1],從而獲得較好的通話效果。由于密閉狹小空間的混響較為嚴(yán)重,混響信號對聲源信號的幅值和相位都有較大干擾,常規(guī)的波束形成算法、MUSIC算法等[2-8]都很難對聲源進(jìn)行準(zhǔn)確的定位。
通過研究空間飛行器內(nèi)混響聲波的傳輸特性,利用聲源信號的相似性和波束形成的原理,提出了基于相關(guān)系統(tǒng)的波束形成算法。
1.1 定位條件和模型
為方便算法描述,定位模型是基于二維平面的。并應(yīng)滿足以下條件:① 聲源是點(diǎn)聲源或近似點(diǎn)聲源,若聲源的振動面直徑遠(yuǎn)遠(yuǎn)小于其聲波的波長可近似地看作點(diǎn)聲源;② 在提取的麥克風(fēng)陣列中各陣元的信號無靜音情況;③ 各聲源在頻域上是非相干的。
如圖1所示,該定位模型麥克風(fēng)等間距地排列在一條直線上,間距為d,設(shè)定麥克風(fēng)T4為均勻線性麥克風(fēng)陣列的中心,即聲源對于麥克風(fēng)陣列的相對位置均以T4為參考點(diǎn)。聲源Si在單位模型中的坐標(biāo)用角度和距離來表示,即(αi,ri),αi為聲源到T4并與麥克風(fēng)線陣所成的夾角,其范圍為0~180°,ri為聲源Si到陣列中心T4的距離。rin是聲源Si到第n個(gè)麥克風(fēng)陣元的距離,dn是第n個(gè)麥克風(fēng)陣元到陣列中心的距離。圖1中麥克風(fēng)陣列中有7個(gè)麥克風(fēng),在工程應(yīng)用中麥克風(fēng)陣列的陣元越多,定位的分辨率越高,通常以陣列中心的麥克風(fēng)為定位參考點(diǎn)。此算法中陣元數(shù)目M可以為奇數(shù),也可以為偶數(shù),但是基于陣列中心陣元對稱性的考慮,M為奇數(shù)效果較好。
圖1 聲源定位模型Fig.1 Sound source positioning model
(1)
(2)
1.2 均勻線陣的近場和遠(yuǎn)場模型
根據(jù)聲源到達(dá)麥克風(fēng)陣列的距離,聲音信號的傳播模型可以分為近場模型和遠(yuǎn)場模型。
一般情況下,對于均勻線性陣列,當(dāng)滿足式(3)的條件時(shí),聲源可以視為遠(yuǎn)場模型來處理,反之則視為近場模型。
(3)
式中:r是聲源到陣列中心陣元的距離,L為陣列孔徑的大小,也就是均勻線陣的長度,λ是聲源信號最高頻率的波長,R為聲源近場與遠(yuǎn)場臨界距離。
近場模型中,聲源到達(dá)麥克風(fēng)陣列各陣元的入射角、幅值均不同,應(yīng)采用球面波模型,需要考慮幅度衰減的因素。遠(yuǎn)場模型中,聲源到麥克風(fēng)陣列各陣元的入射角和幅值是相同的,聲波可視為平面波。因此,空間飛行器內(nèi)聲源近場模型中。
1.3 混響條件下麥克風(fēng)陣元的信號分析
圖2 混響模型Fig.2 Reverberation model
圖2是密閉空間聲源混響模型,麥克風(fēng)i采集的聲波信號不僅有直接來自聲源的信號,還有來自其混響的聲波信號,式(4)麥克風(fēng)i在無混響環(huán)境下的數(shù)學(xué)表達(dá)式,式(5)是在兩次聲源反射條件下的數(shù)學(xué)表達(dá)式。
xi(t)=hi(t)*s(t)+wi(t)
(4)
(5)
式(4)中,s(t)是聲源信號,hi(t)是無混響條件下的沖擊響應(yīng),*是卷積,wi(t)是噪聲。式(5)中s′是聲源的一次反射信號,h′是其對應(yīng)的混響沖擊響應(yīng);s″是聲源的二次反射信號,h″是其對應(yīng)的混響沖擊響應(yīng)。通過式(4)和式(5)對比發(fā)現(xiàn),在混響條件下,第i個(gè)麥克風(fēng)采集的聲音信號是相當(dāng)復(fù)雜的,混響信號對聲源信號的幅值和相位都有影響,且很難進(jìn)行信號分離,因?yàn)榛祉懶盘柵c聲源信號是相干的。如果用式(5)代替式(4)進(jìn)行聲源定位運(yùn)算,不論使用什么算法,都不能得出正確的定位結(jié)果。
混響的大小與兩個(gè)因素有關(guān)系,一是聲源與阻擋物的距離,二是阻擋物與麥克風(fēng)的距離。在狹小空間內(nèi),這兩者的距離都很小,所以混響的能量較大。另一方面,麥克風(fēng)陣列每個(gè)陣元到阻擋物的距離是不同的,所以混響占聲源信號的能量比重也不相同。
雖然在混響環(huán)境中麥克風(fēng)采集的聲源信號的幅值和相位受到混響的很大干擾,但是聲源信號的能量還是信號的主要部分,所以聲源信號的基本形狀沒有改變。
1.4 波形相似性度量
本算法是利用波形的相似性來作為波束形成的對象,而波形相似性度量的主要方法是信號的相關(guān)分析。
信號的相關(guān)分析主要通過自、互相關(guān)函數(shù)、相關(guān)系數(shù)函數(shù)來完成。
(6)
(7)
(8)
自相關(guān)函數(shù)如式(6)所示,反映了同一信號在不同時(shí)刻的取值之間的相關(guān)程度?;ハ嚓P(guān)函數(shù)如式(7)所示,反映了兩個(gè)不同信號在不同時(shí)刻的相關(guān)程度,當(dāng)兩個(gè)信號在不同時(shí)刻完全相關(guān)時(shí),其函數(shù)值最大。兩個(gè)不同信號的函數(shù)取值的大小影響相關(guān)函數(shù)的計(jì)算結(jié)果,因而比較不同的成對的信號的相關(guān)度時(shí),僅看其互相關(guān)函數(shù)值是不準(zhǔn)確的。為了避免信號的幅值對其相關(guān)程度度量的影響,將相關(guān)函數(shù)作了歸一化處理,這就是相關(guān)系數(shù)函數(shù),見式(8)。
相關(guān)系數(shù)ρxx(τ)的值域?yàn)閇-1,1],ρxx(τ)為0時(shí),認(rèn)為兩個(gè)信號完全不相關(guān);ρxx(τ)為1時(shí),表明兩個(gè)信號完全相關(guān);ρxx(τ)為-1時(shí),表明兩個(gè)信號完全負(fù)相關(guān)。相關(guān)系數(shù)越趨于1,說明兩個(gè)信號越相似。
1.5 基于相關(guān)系數(shù)的波束形成定位原理
基于相關(guān)系數(shù)的波束形成算法的基本思想是:在聲源搜索區(qū)域內(nèi),麥克風(fēng)陣列各陣元信號通過延時(shí)估計(jì),與中心陣元信號進(jìn)行相關(guān)系數(shù)運(yùn)算并進(jìn)行累加,得到一個(gè)關(guān)于相關(guān)系數(shù)的二維函數(shù)。當(dāng)延時(shí)估計(jì)符合聲源傳播特性時(shí),相似程度是最大的,此時(shí)取得極大值。即二維函數(shù)的極大值處,就是聲源的位置。該算法是利用陣元信號的相似性識別聲源方位,麥克風(fēng)陣列各陣元信號均可作為參考信號,為數(shù)學(xué)表達(dá)方便,取中心陣元信號作為基準(zhǔn)信號。
圖3 基于相關(guān)系數(shù)波束形成算法Fig.3 Beamforming algorithm based on correlation coefficient
(9)
ρi(θ)=CORR(x(M+1)/2(t),xn(t-τn(θ)))
(10)
(11)
圖3為基于相關(guān)系數(shù)的波束形成算法框圖。xn(t)是麥克風(fēng)陣列第n個(gè)陣元的聲壓信號。假設(shè)聲源相對于麥克風(fēng)陣列中心的入射角為θ,τn(θ)是麥克風(fēng)陣列中第n個(gè)陣元相對中心位置麥克風(fēng)的相對時(shí)延,ρn(θ)是麥克風(fēng)陣列中第n個(gè)陣元經(jīng)過時(shí)延操作后與中心位置麥克風(fēng)信號的相關(guān)系數(shù),ρsum(θ)是各陣元與參考信號的相關(guān)系數(shù)之和。
時(shí)延估計(jì)是通過搜索的方法得到的,角度的范圍為0~180°,距離的范圍為0~R。搜索的聲源角度和距離通過時(shí)延估計(jì)、相關(guān)系數(shù)累加運(yùn)算即可得到一個(gè)相關(guān)系數(shù)之和,稱之為相關(guān)系數(shù)波束值,從而可以得到一個(gè)二維的相關(guān)系數(shù)波束圖。單個(gè)聲源定位時(shí),相關(guān)系數(shù)波束圖中的極大值對應(yīng)的位置是聲源方位;當(dāng)多聲源定位時(shí),相關(guān)系數(shù)的波束圖中相關(guān)系數(shù)極大值的個(gè)數(shù)即是聲源的個(gè)數(shù)。
核心算法的偽指令程序如下:
FORD=0~RSTEP 10
搜索距離為0~R,步長為10 cm。
FORθ=0~180°
搜索角度為0~180°,步長為1°。
FORn=1~7n≠4
依次計(jì)算各陣元與中心陣元的相關(guān)系數(shù)
Tn的時(shí)延估計(jì)τ,并進(jìn)行時(shí)序移動
與中心陣元做相關(guān)得到相關(guān)系數(shù)ρn(θ)
NEXTn
ρsum(θ)=ρ1(θ)+ρ2(θ)+ρ3(θ)+
ρ5(θ)+ρ6(θ)+ρ7(θ)
相關(guān)系數(shù)求和
NEXTθ
CORR (D:0~180°)=ρsum(θ)
給二維數(shù)組賦值
NEXTD
因?yàn)樾盘栔g的相似度與幅值沒有關(guān)系,所以在以信號相似度為波束搜索目標(biāo)時(shí),各陣元的權(quán)重是相同的。
基于相關(guān)系數(shù)的波束形成算法的聲源定位主要有以下幾個(gè)步驟:布置麥克風(fēng)陣列,數(shù)據(jù)采集及濾波,數(shù)據(jù)序列截取,相關(guān)系數(shù)波束形成,波束圖平滑處理及峰值搜索。
2.1 布置麥克風(fēng)陣列模型
根據(jù)圖1的定位模型布置麥克風(fēng)的位置,確定麥克風(fēng)的數(shù)量、間距。在硬件允許的條件下,麥克風(fēng)的數(shù)量越多,定位精度越高;麥克風(fēng)的間距越小,其可以定位的聲源信號帶寬越大。麥克風(fēng)的間距應(yīng)小于聲源最高頻率的λ(波長)。如果麥克風(fēng)的間距為10 cm,那么可以定位的聲源頻率范圍應(yīng)小于3 400 Hz。
2.2 數(shù)據(jù)采集及濾波
為了能更精確地定位,應(yīng)使用高AD轉(zhuǎn)換位、高采樣率的數(shù)據(jù)采集裝置。在進(jìn)行數(shù)據(jù)采樣時(shí),為了方便后續(xù)的時(shí)延估計(jì)和信號處理,應(yīng)選擇合適的采樣率,即合適的采樣間隔,如采樣間隔取10 us、20 us、40 us等。
在選擇AD轉(zhuǎn)換的采樣率時(shí),不僅要考慮滿足時(shí)域信號采樣要求,還要滿足空域信號的采樣要求。假設(shè)相鄰麥克風(fēng)的間距為10 cm,則兩麥克風(fēng)信號的最大時(shí)延約為290 us,如果采樣間隔為100 us,時(shí)延估計(jì)的誤差將接近100 us,如果采樣間隔為10 us,時(shí)延估計(jì)的誤差僅為10 us左右。
麥克風(fēng)信號中不僅有聲源信號、混響信號,還混入了一些白噪聲,這些白噪聲將影響定位精度,必須對這些白噪聲進(jìn)行濾波處理。由于聲音信號的頻率較低,在工程應(yīng)用中一般選擇低通數(shù)字濾波器。為使濾波后的信號不產(chǎn)生相位失真,這里選用FIR低通濾波器。
2.3 數(shù)據(jù)序列的截取
數(shù)量采集裝置每次采集的數(shù)據(jù)長度較大,不可能完全參與相關(guān)運(yùn)算和波束形成運(yùn)算,因此必須要截取一定長度的數(shù)據(jù)序列。但是截取的數(shù)據(jù)長度不是任意的。
首先,截取的數(shù)據(jù)序列長度與麥克風(fēng)陣列的長度有關(guān),根據(jù)麥克風(fēng)陣列的長度和AD采樣率,可以得到一個(gè)最小截取長度。設(shè)麥克風(fēng)陣列的長為L,則聲波通過此陣列最大時(shí)長為:τ=L/v,設(shè)數(shù)據(jù)采集卡的采樣間隔為t,麥克風(fēng)陣列的各陣元與中間的陣元做相關(guān)系數(shù)運(yùn)算,最小截取長度不少于τ/2t個(gè)數(shù)據(jù)點(diǎn)。如果麥克風(fēng)陣列的陣元為7,陣元間距為10 cm,采樣間隔為20 us,聲速為340 m/s,則截取的數(shù)據(jù)長度應(yīng)不少于45個(gè)點(diǎn)。
其次,所截取的數(shù)據(jù)不能有過多的靜音信號。如果截取數(shù)據(jù)的靜音信號較長,等于是加入非聲源信號數(shù)據(jù)參與運(yùn)算,定位肯定不準(zhǔn)確。在定位過程中,應(yīng)在聲源連續(xù)發(fā)聲時(shí)進(jìn)行數(shù)據(jù)采集,這樣才能保證截取的信號不含有過多的靜音信號。
2.4 得到相關(guān)系數(shù)波束數(shù)據(jù)
根據(jù)截取的數(shù)據(jù),利用相關(guān)系數(shù)形成算法,得到一個(gè)相關(guān)系數(shù)波束的二維數(shù)組。
離散數(shù)據(jù)序列的相關(guān)系數(shù)計(jì)算公式如:
(12)
2.5 波束圖處理及峰值搜索
在復(fù)雜聲場中,得到的波束圖往往是不平滑的,在進(jìn)行自動峰值搜索時(shí)會得到虛假的峰值,會出現(xiàn)虛假定位的情況,因此要對波束圖進(jìn)行平滑處理,這里采用的是移動加權(quán)平均法。波束圖中的峰值所對應(yīng)的角度即是聲源的方位。這里的峰值不是波束圖的最大值,而是極大值。
3.1 單聲源定位仿真
根據(jù)圖1的定位模型,麥克風(fēng)陣列有7個(gè)陣元,陣元間隔為10 cm。設(shè)聲源Si到陣列中心與麥克風(fēng)陣列的夾角為30°,到陣列中心的距離為60 cm。設(shè)聲源信號中含有400 Hz、600 Hz、800 Hz頻率成分,各頻率成分的幅值和相位均不相同。根據(jù)聲波的傳播原理,從而得出每個(gè)傳感器的聲壓信號,并疊加混響和噪聲?;祉懼泻幸粋€(gè)一次聲源反射源和一個(gè)二次聲源反射源,其模型如圖2所示。xi(t)是第i個(gè)陣元含混響和噪聲的信號,見式(13)。在近聲場中,聲波為球面波,聲速為340 m/s,si(t)是聲源到第i個(gè)陣元的信號,ri是聲源到第i個(gè)陣元的距離,見式(14)。式(15)是第i個(gè)陣元一次反射聲源信號表達(dá)式,A是一次聲源的衰減系數(shù),同理式(16)是第i個(gè)陣元二次反射聲源信號表達(dá)式,A′是二次反射聲源的衰減系數(shù)。
(13)
(14)
φ1=2×400π*20/340+0.25π
φ2=2×600π*20/340+0.5π
φ3=2×800π*20/340
(15)
γ1=2×400π*(20+60)/340+0.25π
γ2=2×600π*(20+60)/340+0.5π
γ3=2×800π*(20+60)/340
(16)
假定每個(gè)麥克風(fēng)通道的采樣率均為50 kHz。圖4是合成后的第i個(gè)陣元的聲壓信號,橫坐標(biāo)為時(shí)間(s),縱坐標(biāo)為聲壓(V)。
圖4 聲壓信號Fig.4 Sound pressure signal
每個(gè)陣元信號的截取長度為1 ms,50個(gè)采樣點(diǎn),與陣元中心信號做相關(guān)系數(shù)運(yùn)算。根據(jù)相關(guān)系數(shù)波束形成算法,得到一個(gè)相關(guān)系數(shù)波束形成二維數(shù)組。圖5是相關(guān)系數(shù)波束形成的三維圖形,為了使三維圖形更加直觀,對三維圖形做了銳化處理。
從圖5中可以看出,在20°~40°之間出現(xiàn)了一個(gè)“山脊”,這個(gè)“山脊”所對應(yīng)的角度即是聲源到陣列中心的入射角。同時(shí)在這個(gè)“山脊”之上,有一個(gè)“山峰”, “*”號標(biāo)識處即為“山峰”,“山峰”在xoy平面上的投影即是聲源的位置。
圖5 相關(guān)系數(shù)三維波束形成圖Fig.5 3D beamforming chart based on correlation coefficient
表1和表2是不同信混比的聲源定位結(jié)果。A是一次反射聲源的衰減系數(shù),A′是二次反射聲源的衰減系數(shù),α,r分別是聲源到陣列中心的角度和距離。仿真實(shí)驗(yàn)表明:一次反射聲源對定位結(jié)果影響較大,當(dāng)一次聲源衰減系數(shù)A<0.3時(shí),定位結(jié)果的角度、距離有較好的精度;當(dāng)一次聲源衰減系數(shù)A>0.3時(shí),相關(guān)系數(shù)三維波束圖會出現(xiàn)多個(gè)山峰,即會搜索出多個(gè)聲源,定位精度下降;當(dāng)一次聲源衰減系數(shù)A>0.5時(shí),則無法進(jìn)行聲源定位。
表1 不同信混比的定位結(jié)果
表2 不同信混比的定位結(jié)果
3.2 算法改進(jìn)
在實(shí)際工程應(yīng)用中,如果得到一個(gè)二維相關(guān)系數(shù)波束形成數(shù)據(jù),計(jì)算量是很大的,實(shí)時(shí)性就較差,因此必須對算法進(jìn)行改進(jìn)。
通過以上的仿真數(shù)據(jù)可以發(fā)現(xiàn),不同的搜索距離,得到的入射角是不同的,見表3和表4所示。但是可以發(fā)現(xiàn)一個(gè)規(guī)律,當(dāng)搜索距離大于聲源實(shí)際距離時(shí),得到的入射角度基本不變。這是因?yàn)樗阉骶嚯xD大于聲源距離ri時(shí),τn(θ)的變化不大。因此,D可以先定位為R,得到一個(gè)入射角,根據(jù)這個(gè)入射角搜索ri,然后用ri再搜索入射角,就是準(zhǔn)確的聲源位置。這樣就大大減小了運(yùn)算量。
表3 不同搜索距離的聲源入射角
表4 不同搜索距離的聲源入射角
設(shè)麥克風(fēng)陣列的陣元數(shù)為M,參與相關(guān)運(yùn)算的的數(shù)據(jù)個(gè)數(shù)為N,角度搜索范圍為0~180°,距離搜索次數(shù)為L次。根據(jù)式(12)的離散數(shù)據(jù)的相關(guān)系數(shù)計(jì)算公式得,兩組N個(gè)數(shù)據(jù)做相關(guān)得到的計(jì)算量為:(N×N+2)次實(shí)數(shù)乘法運(yùn)算。所以未改進(jìn)算法的計(jì)算量為(M-1)×180×L×(N×N+2)次實(shí)數(shù)乘法運(yùn)算,加上180×L次比較運(yùn)算。改進(jìn)算法的計(jì)算量為(M-1)×180×(N×N+2)次實(shí)數(shù)乘法運(yùn)算,加上180+L次比較運(yùn)算。因此,改進(jìn)算法節(jié)省了大量運(yùn)算步驟。
在工程應(yīng)用中,麥克風(fēng)陣列的陣元數(shù)為7,參與運(yùn)算的數(shù)據(jù)長度為50,角度搜索范圍為0~180°,距離搜索次數(shù)為30。CPU型號為TMS320C6415,主頻為500 MHz,1個(gè)時(shí)鐘周完成1次實(shí)數(shù)乘法算法,改進(jìn)算法所需時(shí)間為5.4 ms,見式(17)。空間飛行器的語音單元每60 s搜索一次聲源方位并進(jìn)行語音參數(shù)修正,式(17)的計(jì)算結(jié)果可以滿足工程應(yīng)用中的實(shí)時(shí)性要求。
t=5.4 ms
(17)
4.1 單聲源定位實(shí)驗(yàn)
單聲源定位實(shí)驗(yàn)主要是驗(yàn)證算法的工程應(yīng)用的可行性,并對算法進(jìn)行改進(jìn)。麥克風(fēng)陣列由7個(gè)間隔為10 cm的麥克風(fēng)陣元組成,麥克風(fēng)的數(shù)據(jù)采樣率為50 kHz。
聲源定位環(huán)境如圖6所示,聲源和麥克風(fēng)陣列周圍有工作臺,混響較大,表3為聲源在麥克風(fēng)陣列60°方位的定位結(jié)果。
表5 不同截取位置的定位結(jié)果
圖6 單聲源定位實(shí)驗(yàn)Fig.6 Single sound source localization experiment
從表5的實(shí)驗(yàn)結(jié)果中可以看出,截取不同位置的數(shù)據(jù)進(jìn)行聲源定位,會得到不同定位結(jié)果。圖7是麥克風(fēng)陣列中間陣元的信號,圖中采樣數(shù)據(jù)的開始處為靜音信號,此信號不是聲源發(fā)出的信號,要得到準(zhǔn)確的定位結(jié)果,必須將靜音信號的影響降到最低。簡單的辦法是增加參與定位運(yùn)算的數(shù)據(jù)長度,以減小靜音信號的比重。但這種方法會大大增加運(yùn)算量。最好的辦法是增加靜音檢測,不在靜音信號處截取信號進(jìn)行聲源定位運(yùn)算。
圖7 聲源信號Fig.7 Sound source signal
通過實(shí)驗(yàn)發(fā)現(xiàn),聲源的入射角在麥克風(fēng)陣列的90°附近時(shí),定位精度較差。通過分析知,聲源在麥克風(fēng)陣列90°附近時(shí),聲源到各陣元的距離差較小,50 kHz采樣率不足以分辨較小距離差的信號差別,所以,會出現(xiàn)定位精度較差的情況,如表6所示。解決的方法是提高麥克風(fēng)信號的AD采樣率。
表6 不同聲源入射角的定位結(jié)果
4.2 多聲源定位實(shí)驗(yàn)
多聲源定位是聲源定位的難點(diǎn),可以檢驗(yàn)算法的有效性。室內(nèi)混響環(huán)境中,在距離麥克風(fēng)陣列中心1 m、入射角度為120°處,放置一個(gè)喇叭;在距離麥克風(fēng)陣列中心1.4 m、入射角度為50°處,放置另一個(gè)喇叭。兩個(gè)喇叭播放不同的音樂,用聲源定位系統(tǒng)對兩個(gè)聲源進(jìn)行定位。實(shí)驗(yàn)場景見圖8所示,圖9是聲源定位結(jié)果。定位結(jié)果表明:基于相關(guān)系統(tǒng)的波束形成算法在混響環(huán)境中具有較好的多聲源分辨能力。
圖8 雙聲源定位實(shí)驗(yàn)Fig.8 Localization experiment of double sound sources
圖9 雙聲源定位結(jié)果Fig.9 Localization results of double sound sources
本文針對狹小空間內(nèi)聲源定位的難題,提出了基于相關(guān)系數(shù)的波束形成算法,并對算法進(jìn)行了改進(jìn),提高了定位的實(shí)時(shí)性。實(shí)驗(yàn)結(jié)果表明:該算法可以在混響環(huán)境中進(jìn)行聲源定位。但是為獲得較好的定位精度,需要滿足以下兩個(gè)條件:① 消除靜音信號對定位結(jié)果的影響;② 提高麥克風(fēng)信號的AD采樣率。
[1] 王冬霞,殷福亮. 基于近場波束形成的麥克風(fēng)陣列語音增強(qiáng)方法[J].電子信息學(xué)報(bào),2007,29(1):67-70. WANG Dongxia, YIN Fuliang. A nearfield beamforming method for microphone array based on speech enhancement[J]. Journal of Electronics & Information Technology, 2007, 29(1):67-70.
[2] 李芳蘭,周躍海,童峰,等. 采用可調(diào)波束形成器的GSC麥克風(fēng)陣列語音增加方法[J].廈門大學(xué)學(xué)報(bào)(自然科學(xué)版),2013, 52(2):186-189. LI Fanglan, ZHOU Yuehai, TONG Feng,et al. Microphone array speech enhancement based on adjustable beamformer generalized sidelobe canceller [J]. Journal of Xiamen University(Natural Science), 2013, 52(2):186-189.
[3] YO HAN K O, YEUNG J K, HYUN I Y, et al. 2-D DOA estimation with cell searching for a mobile relay station with uniform circular array[J]. IEEE Trans Communication,2010,58(10):2805-2809.
[4] VOLODYMYR V. Improving the performance of root-MUSIC via pseudo-noise resampling and conventional beamformer[J]. Microwaves, Redar and Remote Sensing Symposium, 2011, 25(8):309-312.
[1] 王楷,宗志亞,孫小惟,等. 改進(jìn)的自適應(yīng)特征值分解聲源定位算法研究[J].儀器儀表學(xué)報(bào), 2013, 34(6):1241-1246. WANG Kai, ZONG Zhiya, SUN Xiaowei,et al. Study on improved adaptive eigenvalue decomposition algorithm for acoustic source localization[J]. Chinese Journal of Scienfic Instrument, 2013, 34(6):1241-1246.
[6] WIDROW B, LUO F L. Microphone arrays for hearing aid: an overview[J].Speech Communication,2003,39(1/2): 139-146.
[7] BELOUCHRANI A, AMIN M G. Time-frequency MUSIC[J]. IEEE Signal Processing Letters, 1999, 6(5): 109-110.
[8] 蔡晶晶,李鵬, 趙國慶,等. RD-MUSIC的二維DOA估計(jì)方法[J]. 西安電子科技大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 40(3): 81-86. CAI Jingjing, LI Peng,ZHAO Guoqing,et al. Two-dimensional DOA estimation with reduced-dimension MUSIC[J]. Journal of Xidian University(Natural Science), 2013, 40(3): 81-86.
Localization algorithm for sound sources in space aircrafts
XIA Jiagao, LI Wenxin, CAO Jinshu, LI Taiguo
(Lanzhou Institute of Physics, Lanzhou 730000, China)
There is a larger sound reverberation phenomenon because of a narrow space in a space aircraft. The reverberation signal influences call quality when crew members don’t wear the special earphone for voice calls within the aircraft. The use of a sound source location signal for speech enhancement can suppress reverberation interference to achieve a better call effect. Due to influences of reverberation, a common sound source localization algorithm is very difficult to get an effective location for the voice of a crew member. Here, through studying the speech transmission characteristics of the space aircraft, the beamforming algorithm based on correlation coefficient was proposed and the waveform similarity was used to suppress reverberation interference. Experimental results showed that the algorithm has a better effect of sound source localization to supply source orientation parameters for speech enhancement.
aircraft; sound source localization; correlation coefficient; beamforming; speech enhancement
中國載人航天工程重大專項(xiàng)(RWZY640601);國家自然科學(xué)基金(61125101)
2015-12-31 修改稿收到日期:2016-03-19
夏加高 男,博士生,工程師,1978年9月生
李文新 男,研究員,博士生導(dǎo)師,1966年生
TN912.3
A
10.13465/j.cnki.jvs.2016.21.032