卓瑞巖,向 陽,李勝揚
雙通道定位與盲分離結(jié)合的噪聲分離方法
卓瑞巖1,2,向陽1,2,李勝揚1,2
(1.武漢理工大學(xué) 能源與動力工程學(xué)院,武漢 430063;2.武漢理工大學(xué) 船舶動力系統(tǒng)運用技術(shù)交通行業(yè)重點實驗室,武漢 430063)
探索雙通道定位算法與盲源分離相結(jié)合進行噪聲分離的可能。根據(jù)雙通道空間定位理論,以聲音傳播過程中在雙通道間產(chǎn)生的延時差和強度差為線索對混合信號進行分離。當待分離的輻射噪聲中存在時頻混疊或同一位置多個源時,雙通道定位分離算法能分離出不同位置處源信號,然后利用盲源分離方法對同一位置處的多個源信號進行再分離。在Roomsim中進行分離方案的可行性驗證,假設(shè)房間六個壁能100%吸收所有頻率信號,不存在反射與混響,對比分析聲源位置及個數(shù)對分離結(jié)果的影響。結(jié)果表明,當源位置的個數(shù)不大于3時,雙通道定位分離算法能有效分離出不同位置的聲源信號,用盲源分離方法可進一步分離出相同位置處的不同源信號,但當源位置個數(shù)大于等于4時雙通道定位分離算法的分離性能降低。
聲學(xué);雙通道定位;延時;衰減;盲源分離;噪聲分離
內(nèi)燃機噪聲源的識別定位研究方法主要包括基于聲陣列技術(shù)的噪聲源識別方法和基于現(xiàn)代信號處理技術(shù)的噪聲源識別方法[1]。聲陣列技術(shù)中的波束形成可以識別表面輻射噪聲源,Pengxiao Teng、Rilin Chen等用螺旋形傳聲器陣列技術(shù)對風(fēng)力渦輪發(fā)電機主要噪聲源產(chǎn)生部位進行了識別和可視化研究[2]?,F(xiàn)代信號處理中的盲源分離能對混合噪聲進行分離,得到單一聲源。李林潔等結(jié)合EMD和ICA對內(nèi)燃機噪聲源進行了識別研究并進行試驗驗證[3]。根據(jù)計算聽覺場景分析[4-5]基本理論,Scott Richard等提出雙通道定位分離算法,以雙通道信號間的延時差和衰減差為分離組織線索進行聚類分析,結(jié)合時頻掩蔽重構(gòu)出單一位置源信號,達到分離效果[6-7]。
聲陣列技術(shù)能夠得到聲壓云圖,不能達到分離的目的,盲源分離技術(shù)要求源信號滿足高斯性假設(shè),且存在幅值不確定性,雙通道定位分離算法不存在高斯性假設(shè),但無法分離同一位置處的多個源。針對上述問題,本文將結(jié)合雙通道定位分離算法與盲源分離算法,首先用雙通道定位分離出不同位置聲源信號,進一步對同一位置存在混疊的分量進行盲源分離,探索此分離方案的可行性。
1.1混合模型
算法假設(shè)不存在信號源反射造成的干擾,因源信號的混合方式基本滿足無反射混合模型。假設(shè)有N個源信號sj(t),j=1,…,N,經(jīng)過一段傳播途徑,被兩個傳聲器接收的混合信號分別為x1(t)和x2(t),考慮到兩個接收信號之間的衰減和延時,則無反射混合模型可表示如下
其中N是源信號數(shù),δj為源信號Sj到達兩傳聲器的延時,αj為源信號Sj到達兩傳聲器時產(chǎn)生的相對衰減。
1.2聲源定位
由傅里葉變換的時移性質(zhì)有
因此,無反射混合模型轉(zhuǎn)變成時頻域表達式為
根據(jù)信號時頻點的正交性,每個時頻點上至多只有一個源信號占優(yōu)。因此,對于其中某一確定的時頻點(τω),混合信號可以表述為下式
根據(jù)上式,對某一時頻點,雙通道信號時頻域的比值決定了該時頻點上占優(yōu)能量的衰減和延時屬性,因此對每個時頻點作雙通道信號的比值計算
由此可以計算得到各個時頻點上延時和衰減的計算公式
計算出混合參數(shù)對后,由最大似然估計(Maximum-Likelihood,ML)算子式得到每個時頻點的加權(quán)幅值
其中,一般取p=1,q=0。且每個幅值都對應(yīng)一個衰減和延時參數(shù)對,將具有相同對稱衰減和延時參數(shù)對幅值進行累加,即可得到二維直方圖矩陣的幅值
△α、△δ為衰減和延時分辨率寬度,I(α,δ)為屬于某一聲源的衰減-延時集合。聲源位置與直方圖中峰值坐標相對應(yīng),圖1是將三個聲源布置不同位置時得到的直方圖,三個峰值即代表三個聲源。
圖1 三個不同位置處聲源的衰減-延時聚類圖
1.3聲源分離
由于聲源位置信息與衰減-延時坐標相對應(yīng),因此用時頻掩蔽的方法將聲源分離。以據(jù)峰值中心坐標的歐氏距離作為最大相似度,將峰值附近的時頻點歸為一類,使用二進制時頻掩蔽將屬于一類的時頻點標記如下
其中αn和δn是第n個聲源的衰減和延時區(qū)間。用上式將同一源信號的時頻單元提取出來,再由傅里葉逆變換將提取的時頻域下的源信號恢復(fù)到時域,以此達到不同位置處聲源的分離目的。
綜上所述,雙通道定位分離算法的計算流程如表1所示。
雙通道定位分離方法可將不同位置處源信號分離開來,但對同一位置存在多個源信號的情況,此處分量仍為混合信號,這就構(gòu)成了欠定盲源分離問題。解決盲源分離問題的基本方法是獨立分量分析(ICA),而ICA要求輸入為多通道信號。因此將數(shù)據(jù)分解和ICA相結(jié)合可以解決多輸入要求的難題[9]。集總經(jīng)驗?zāi)B(tài)分解(EEMD)根據(jù)信號本身的時頻域特性,將其分解成為若干個本征模態(tài)函數(shù)和一個單調(diào)殘余量,分解結(jié)果充分保留信號本身非平穩(wěn)和非線性特征,具有很好的自適應(yīng)性,同時可以有效抑制模態(tài)混疊現(xiàn)象[10]。因此,用EEMD作為ICA的數(shù)據(jù)前處理方法,具體流程見圖2。
表1 雙通道定位算法的計算過程
圖2 EEMD+ICA分離流程圖
仿真試驗在Roomsim中進行,分析聲源個數(shù)及聲源位置(見表2)對分離效果的影響。房間尺寸設(shè)為6.25 m×3.75 m×2.5 m,六個壁面對所有聲音頻率具有相同的吸聲系數(shù),即六個吸聲壁能100%吸收所有頻率信號,不存在反射與混響。兩個全指向性麥克風(fēng)連線中點位于(1.6 m、1.9 m、.1 m)處,麥克風(fēng)間距設(shè)為4 cm,聲源處于同一正半平面的不同方位角,如圖3所示。
圖3 試驗結(jié)構(gòu)示意圖
表2 聲源個數(shù)及位置
3.1聲源個數(shù)對分離效果的影響
經(jīng)仿真試驗得出,聲源數(shù)目小于等于3時,雙通定位分離算法可得到峰值與聲源清晰對應(yīng)的直方圖,分離效果較為理想,而聲源數(shù)目大于3時,直方圖中峰值與源信號對應(yīng)不明顯,難以得到理想的分離結(jié)果。以3個聲源(試驗3)和4個聲源(試驗6)為例,選取相同長度語音信號作為源信號進行混合,文中所用語音信號均來自TIMIT語音庫,為經(jīng)歸一化處理后的無量綱數(shù)據(jù),如圖4所示。
圖4 源信號時域波形圖
雙通道定位算法對混合信號進行分離,得到圖5所示直方圖,其中(a)直方圖清晰顯示出三個峰值,對應(yīng)三個源信號,而(b)直方圖只有一個較為突出峰值,其他峰值不明顯,無法較好分離出源信號。
其中(a)三聲源分離結(jié)果中y1對應(yīng)源信號S1,y2對應(yīng)源信號S3,y3對應(yīng)源信號S2,分離效果理想。而(b)四聲結(jié)合時頻掩蔽,將峰值對應(yīng)源信號進行分離,結(jié)果如圖6所示。
圖5 不同聲源數(shù)目延時衰減聚類直方圖
圖6 分離分量時域波形圖
源分離結(jié)果中y1、y2與源信號S1、S2對應(yīng),y3、y4與S3、S4源信號差別較大。由此可見,雙通道定位分離算法對于源數(shù)目大于3的混合信號分離性能較差。
3.2聲源位置對分離效果的影響
試驗中發(fā)現(xiàn),當聲源數(shù)目一定時,其所處位置對雙通道定位分離性能同樣存在較大影響,聲源位置分布包括無聲源位置重疊和有聲源位置重疊兩種情況。
3.2.1無聲源位置重疊
以試驗5、試驗6為例進行對比,聲源分別位于(-90°、-30°、30°、90°)和(-60°、-20°、20°、60°)處,如下圖7所示,聲源信號為圖4(b)中所示四段語音信號。
圖7 聲源與麥克風(fēng)位置示意圖
雙通道定位算法對兩路混合信號進行分離,得到圖8所示延時和衰減的聚類直方圖。
由圖8可得,當聲源數(shù)目相同,而聲源分布位置不相同時,所得分離結(jié)果有明顯差異。試驗5所得直方圖存在一個主峰值和較多雜亂的小峰值,峰值個數(shù)明顯大于聲源個數(shù),結(jié)合時頻掩蔽無法達到分離效果。圖8(b)顯示出一個主峰值和三個較小峰值,結(jié)合時頻掩蔽可以分離出與源數(shù)目相等的分量,分量波形如圖6(b)所示,分離效果較好。
3.2.2有聲源位置重疊
當同一位置存在多個聲源時,雙通道定位分離算法無法將這些聲源分離開,需要結(jié)合盲源分離進行分離。以試驗4為例,設(shè)置兩個聲源位于相近的空間角如S1和S2,如圖9所示。
圖8 不同聲源位置延時聚類直方圖
圖9 聲源位置混疊示意圖
源信號S1、S2和S3時域波形如圖10所示。
圖10 源信號的時域波形
首先用雙通道定位算法對兩路混合信號進行分離,得到如圖11的延時和衰減的聚類表示。從圖中看出,由于源信號S1和S2布置在很近的空間位置,其對應(yīng)的直方圖峰值統(tǒng)計能量較大;圖中僅出現(xiàn)兩個峰值說明算法無法將三個源信號分離出來。
圖11 雙通道定位分離的特征聚類表示
雙通道定位分離得到兩個分量y1和y2,如圖12所示。
圖12 雙通道算法分離得到的兩個分量
從定量判斷的角度對信號進行包絡(luò)相關(guān)分析,計算各分量與不同源信號相關(guān)系數(shù),結(jié)合主觀判斷,得出分量y2對應(yīng)源信號中的S3,y1是位于相近位置的S1和S2的混合信號,針對上述分離的分量y1,盲源分離方法進行分離,得到兩個分量Z1和Z2,如圖13所示。由于盲源分離本身存在的幅值不確定性,分離結(jié)果與源信號存在一些差異,但可以看出,分量Z1對應(yīng)源信號中的S1,而分量Z2對應(yīng)S2。因此,仿真分析達到了分離全部源信號的效果,也驗證了前述雙通道定位算法與盲源分離相結(jié)合的噪聲分離方案的可行性。
圖13 盲源分離得到的兩個分量
(1)基于雙通道定位理論的噪聲分離方法可以分離出不同位置處聲源,再借助EEMD和ICA相結(jié)合的盲源分離方法,可將同一位置處的多個源信號分離出來。
(2)當源信號數(shù)目不大于3時,雙通道定位分離算法分離性能較好,算法的分離性能隨著聲源數(shù)目的增加而降低。源信號位置以及對混合信號進行時頻分解時窗函數(shù)和頻率間隔對算法性能均有影響,這是否是導(dǎo)致算法不適用于大于3個聲源的原因以及對雙通道定位分離算法的優(yōu)化有待進一步探索。
[1]胡伊賢,李舜酩,張袁元,等.車輛噪聲源識別方法綜述[J].振動與噪聲控制,2012,32(5):11-15.
[2]TENG PENG XIAO,CHEN RI LIN,YANG YI CHUN. Noise source identification applied in electric power industry using microphone arrays[J].Scientific Research Engineering,2013(5):152-156.
[3]李林潔.EMD和ICA在內(nèi)燃機振聲信號分析中的應(yīng)用研究[D].天津:天津大學(xué),2012.
[4]BERGMAN A S.Auditory scene analysis:The peceptual organization of sound[M].Boston:The MIT Press,1990.
[5]WANG D L,BROWN G J.Computational auditory scene analysis:principles,algorithms,andapplications[M]. Wiley-IEEE PRESS,Hoboken,N J,2006.
[6]SCOTT RICKARD.The DUET blind source separation algorithm[M].BlindSpeechSeparation,Springer Netherlands,2007:217-241.
[7]ALEXANDER JOURJINE,SCOTT RICKARD,OZGIIR YZLMAZ.Blind separation of disjoint orthogonal signals:demixing n sources from 2 mixtures[J].IEEE,2000:2985-2988.
[8]付寧,曹離然,彭喜元,等.基于局部峰值方差檢測的改進DUET算法研究[J].電子測量與儀器學(xué)報,2010,24(5):437-442.
[9]谷千偉,金煒東,余志斌.基于EEMD和ICA的單通道列車信號盲分離[J].計算機應(yīng)用研究,2014,31(5):1551-1553.
[10]鄭旭,郝志勇,金陽,等.基于EEMD與廣義S變換的內(nèi)燃機噪聲源識別研究[J].內(nèi)燃機工程,2011,32(5):68-73.
Noise Separation Based on Dual-channel Source Localization and Blind Source Separation
ZHUO Rui-yan1,2,XIANGYang1,2,LI Sheng-yang1,2
(1.School of Energy and Power Engineering,Wuhan University of Technology,Wuhan 430063,China;2.Key Laboratory of Marine Power Engineering and Technology,Ministry of Communications,Wuhan 430063,China)
The noise source identification based on dual-channel localization algorithm and blind source separation(BSS)is studied.According to the principle of the dual-channel localization algorithm,the noise sources in different places can be separated based on time-delay difference and intensity difference between the two channels in sound propagation process.When the radiation noise has a time-frequency overlap or multiple excitation sources appear in a same place,the dual-channel localization algorithm can separate the source signals in different places.Then,the BSS method is adopted to re-separate the multiple source signals at the same place.Finally,the feasibility of this method is verified in Roomsim,and the influence of source number and location on separation performance is analyzed.The results show that the separation method combining the dual-channel localization algorithm with BSS can separate the sources efficiently and is independent of the noise from the other positions.However,the dual-channel localization algorithm does not work well when the source number is larger than 3.
acoustics;dual-channel localization;time-delay difference;intensity difference;blind source separation(BSS);noise separation
TK421+.6
ADOI編碼:10.3969/j.issn.1006-1335.2016.03.028
1006-1355(2016)03-0137-05+163
2015-12-29
國家自然科學(xué)基金資助項目(51279148)
卓瑞巖(1990-),男,河南省新鄉(xiāng)市人,碩士研究生,主要研究方向為噪聲控制、數(shù)字信號處理。E-mail:15516585566@163.com
向陽(1962-),女,博士,教授,博士生導(dǎo)師,主要研究方向為振動噪聲分析與控制、動力機械狀態(tài)檢測與故障診斷。E-mail:yxiang@whut.edu.cn