李偉
摘要:基于時(shí)延估計(jì)的聲源定位算法是先求得時(shí)延,再根據(jù)時(shí)延來(lái)計(jì)算出聲源的位置。因此時(shí)延估計(jì)的準(zhǔn)確性決定了聲源定位的準(zhǔn)確性,而時(shí)延估計(jì)的精度會(huì)受到室內(nèi)混響和噪聲的影響,因此本文提出了一種改進(jìn)后的PHAT加權(quán)算法。通過(guò)傳感器矩陣模型采集聲源的音頻信號(hào)傳到上位機(jī)并在Matlab進(jìn)行算法仿真。結(jié)果表明改進(jìn)后的PHAT加權(quán)算法結(jié)合牛頓迭代定位算法能夠比較準(zhǔn)確的對(duì)聲源進(jìn)行定位。
關(guān)鍵詞:時(shí)延估計(jì);廣義互相關(guān);聲源定位;牛頓迭代
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)07-0220-03
Abstract: Based on the time-delay estimation of the sound source localization algorithm is to find the delay, and then calculate the sound source according to the delay position. Therefore, the accuracy of the delay estimation determines the accuracy of the sound source localization, and the accuracy of the delay estimation will be affected by the indoor reverberation and noise. Therefore, this paper presents an improved PHAT weighting algorithm. Through the sensor matrix model, the audio signal of the sound source is collected and transmitted to the host computer and the algorithm is simulated in Matlab. The results show that the improved PHAT weighting algorithm combined with Newton iterative positioning algorithm can accurately estimate the sound source Positioning.
Key words: Delay estimation; Generalized mutual correlation; Source localization; Newton iteration
麥克風(fēng)陣列聲源定位在語(yǔ)音識(shí)別、視頻會(huì)議、回聲消除等方面都有著十分重要的廣泛應(yīng)用?;邴溈孙L(fēng)陣列的聲源定位算法主要分三類:基于最大輸出功率的可控波束形成方法[1]、基于高分辨率譜估計(jì)的聲源定位方法[2]和基于時(shí)延估計(jì)的定位方法。三類定位方法中,基于時(shí)延估計(jì)的定位方法有良好的實(shí)時(shí)性和較高的定位精度,被作為聲源定位中的常用方法。其中基于時(shí)間估計(jì)的聲源定位方法分為兩步[3]:第一步時(shí)延估計(jì),根據(jù)陣元的間距和不同陣元之間接受同一聲源信號(hào)的之間的延遲關(guān)系,求解出聲源到達(dá)不同陣元的時(shí)延。第二步聲源定位,利用搜索算法或幾何算法得到聲源所處的位置。其中時(shí)延估計(jì)研究廣義互相關(guān)法和最小均方自適應(yīng)濾波法,聲源定位研究牛頓迭代定位算法[4]。本文通過(guò)介紹不同的時(shí)延估計(jì)算法并在Matlab上進(jìn)行仿真分析,結(jié)果表明利用改進(jìn)后的PHAT相位加權(quán)算法結(jié)合牛頓迭代定位算法能夠?qū)崿F(xiàn)更加精確的定位效果。
4 總結(jié)
本文通過(guò)介紹不同時(shí)延估計(jì)算法以及定位算法,以傳感器矩陣為模型,在Matlab軟件進(jìn)行仿真測(cè)試,仿真說(shuō)明改進(jìn)后的PHAT加權(quán)算法比傳統(tǒng)的自適應(yīng)算法具有更好的抗混響和噪聲的能力,結(jié)合牛頓迭代定位算法也具有好的定位能力。因此結(jié)合這兩種算法能夠更好的進(jìn)行聲源定位,同時(shí)能確保較高的準(zhǔn)確性。
參考文獻(xiàn):
[1] 郭業(yè)才,朱賽男,張寧.自適應(yīng)多通道雙L型麥克風(fēng)陣列聲源定位算法[J].系統(tǒng)仿真學(xué)報(bào),2015(7):1556-1562.
[2] 張雷岳,張興敢,劉超.麥克風(fēng)陣列聲源定位中時(shí)延估計(jì)的改進(jìn)[J].南京大學(xué)學(xué)報(bào):自然科學(xué)版,2015(1):25-30.
[3] 葉誠(chéng),楊淑瑩.基于到達(dá)時(shí)間差的聲源定位算法與實(shí)現(xiàn)[J].天津理工大學(xué)學(xué)報(bào),2015(4):50-54.
[4] 劉霞,吳崧.牛頓迭代算法在聲場(chǎng)定位中的應(yīng)用[J].武漢工程大學(xué)學(xué)報(bào),2014,36(7):64-67.
[5] 茅惠達(dá),張玲華.聲源定位中廣義互相關(guān)時(shí)延估計(jì)算法的研究[J].計(jì)算機(jī)工程與應(yīng)用,2015(7):138-142.
[6] 陳向陽(yáng),劉松,劉培.時(shí)延估計(jì)的聲源定位算法及Matlab實(shí)現(xiàn)[J].武漢工程大學(xué)學(xué)報(bào),2014,36(10):42-45.
[7] 劉慧珠.基于麥克風(fēng)陣列的聲源方法估計(jì)算法研究[D].西南交通大學(xué),2015.
[8] 郭亞峰,陳弘宇.多通道近場(chǎng)廣義互相關(guān)算法研究[J].聲學(xué)與電子工程,2013(1):19-21.
[9] 屈軍鎖,侯曉寧,張繼榮.四基站時(shí)差和牛頓迭代法的三維定位算法[J].西安郵電大學(xué)學(xué)報(bào),2015(3):36-40.
[10] 彭迎標(biāo),楊尊先,林志賢.基于傳聲器陣列的改進(jìn)的PHAT-GCC語(yǔ)音定位算法[J].電聲技術(shù).2013,2(17):62-65.