• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于稀疏堆疊降噪自編碼器深層神經(jīng)網(wǎng)絡(luò)的語音DOA估計算法

      2021-04-27 00:25:14郭業(yè)才
      實驗室研究與探索 2021年3期
      關(guān)鍵詞:麥克風(fēng)聲源信噪比

      郭業(yè)才,侯 坤

      (1.南京信息工程大學(xué)電子與信息工程學(xué)院,南京 210044;2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京 210044;3.南京信息工程大學(xué)濱江學(xué)院,江蘇無錫 214105)

      0 引言

      波達方位(Direction of Arrival,DOA)估計是通過信號的空間特征參數(shù),確定信號在空間域中的位置信息,如距離、方位角、俯仰角等[1-6]。聲源定位技術(shù)是波達方位估計的一種重要手段,其中多重信號分類(Multiple Signal Classification,MUSIC)算法[7]和旋轉(zhuǎn)不變性子空間(Estimating Signal Parameter Via Rotational Invariance Techniques,ESPRIT)算法[8]是傳統(tǒng)的DOA技術(shù)。它們在低信噪比環(huán)境下定位誤差大。隨著計算機技術(shù)的發(fā)展和智能算法的出現(xiàn),聲源定位技術(shù)得到了發(fā)展。文獻[9]中提出基于局部保持投影和徑向基(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)的DOA估計算法,利用局部保持投影對神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本進行降維,加快了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,但定位精度不高;文獻[10]中提出從廣義互相關(guān)(Generalized Cross Correlation,GCC)向量中提取方位特征送入多層感知器(Multi-layerperceptron,MLP)網(wǎng)絡(luò)學(xué)習(xí)的DOA估計算法定位準(zhǔn)確,但抗噪性較差。

      1 DOA 估計模型[11-12]

      假設(shè)空間中有M個陣元組成的線性均勻陣列,窄帶聲源信號為θi(i∈[1,2,…,k]),每個信號源互不相干的入射到麥克風(fēng)陣列上,第m個麥克風(fēng)接收的信號為

      式中:m =1,2,…,M;δm為第m個陣元對信號的增益;s(t)為t時刻聲源入射信號;τm為第m個陣元接收聲源信號相對于參考陣元的時延;vm(t)為t時刻第m個陣元的噪聲。式(1)的矩陣形式為

      式中:A為信號的導(dǎo)向向量。假設(shè)噪聲均值為0、方差為σ2的高斯白噪聲,則麥克風(fēng)陣列接收信號的協(xié)方差矩陣為

      式中:*表示共軛。R的矩陣形式為

      將協(xié)方差矩陣R的上三角陣中元素的實部、虛部分開后作為SSDAE-DNN的輸入,即

      式中:Re(·)為取實部;Im(·)為取虛部。

      2 SSDAE-DNN網(wǎng)絡(luò)框架

      本文網(wǎng)絡(luò)框架由SSDAE與DNN網(wǎng)絡(luò)組成,如圖1所示。通過SSDAE網(wǎng)絡(luò)進行抗噪訓(xùn)練,將訓(xùn)練得到的最優(yōu)權(quán)重遷移給DNN網(wǎng)絡(luò)作為輸出訓(xùn)練權(quán)重,通過損失函數(shù)優(yōu)化DNN網(wǎng)絡(luò)模型,建立語音信號特征yn和方位角θ之間的非線性映射關(guān)系。將語音DOA估計問題視作分類問題,通過SSDAE-DNN網(wǎng)絡(luò)對yn進行分類,根據(jù)分類結(jié)果選取對應(yīng)的角度標(biāo)簽,實現(xiàn)對方位角θ的估計。

      圖1 SSDAE-DNN網(wǎng)絡(luò)結(jié)構(gòu)

      2.1 堆疊稀疏自編碼器

      文獻[13-15]中提出的去噪自編碼器(De-noising Self Encoder,DAE),由輸入層、隱藏層和輸出層組成。在DAE的損失函數(shù)中加入稀疏因子ρ就構(gòu)成稀疏去噪自編碼器(Sparse De-noising Self-encoder,SDAE)。SDAE同時具有稀疏性和魯棒性,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

      日前,在美國舉行的世界啤酒品評大賽“世界啤酒錦標(biāo)賽”中,青島黑啤以出色的口味與品質(zhì)征服評委味蕾,一路“過關(guān)斬將”奪得金獎。無獨有偶,11月14日,“2018歐洲啤酒之星”大賽頒獎儀式在德國南部城市紐倫堡會展中心舉行,青島啤酒皮爾森從來自全球51個國家、2344款啤酒產(chǎn)品中脫穎而出,榮獲“歐洲啤酒之星”大獎。

      圖2 SDAE算法流程圖

      預(yù)處理過的訓(xùn)練樣本yn分配給輸入層,隱藏層單元為

      式中:Z為隱藏層單元數(shù);W∈RM×N為編碼器權(quán)重矩陣;be為編碼偏置。輸出層單元為:

      式中:f(·)為非線性激活函數(shù);WT∈RM×N為解碼器權(quán)重;bd為解碼偏置。SDAE網(wǎng)絡(luò)的損失函數(shù)為

      式中:NT為數(shù)據(jù)集數(shù)量;β為超參數(shù),其值在訓(xùn)練過程中通過調(diào)整最優(yōu)參數(shù)時決定;KL為Kullback-Leibler散度;ρz為第z個隱藏單元的平均激活度,且

      SSDAE網(wǎng)絡(luò)由多個SDAE堆疊而成,前一個SDAE隱藏層的輸出作為下一個SDAE的輸入,網(wǎng)絡(luò)結(jié)構(gòu)如圖3示。

      圖3 SSDAE網(wǎng)絡(luò)結(jié)構(gòu)

      SSDAE網(wǎng)絡(luò)采用貪婪逐層進行訓(xùn)練,單獨訓(xùn)練每一個SDAE網(wǎng)絡(luò)得到最優(yōu)權(quán)值后作為SSDAE網(wǎng)絡(luò)的初始權(quán)值,通過反向傳播(BP)整體微調(diào),直至得到最優(yōu)參數(shù),微調(diào)階段的損失函數(shù)為與式(10)相比,式(13)無稀疏約束項,是由于訓(xùn)練單個SDAE時已包括稀疏約束。

      用SSDAE網(wǎng)絡(luò)對語音定位進行預(yù)訓(xùn)練時,添加了抗噪訓(xùn)練,優(yōu)化了特征選擇,稀疏因子ρ將包含無用信息的特征權(quán)重置為0,降低了訓(xùn)練復(fù)雜度,提升了算法的抗噪性能與收斂速度,且可從有限的樣本中提取到更多的特征信息。

      2.2 DNN網(wǎng)絡(luò)框架

      本文采用的DNN網(wǎng)絡(luò)如圖1(b)所示,有3層全連接隱藏層。將SSDAE網(wǎng)絡(luò)預(yù)訓(xùn)練模型的最優(yōu)權(quán)值作為DNN的初始權(quán)值,減少了DNN網(wǎng)絡(luò)模型的訓(xùn)練時間。同時,因SSDAE網(wǎng)絡(luò)在編碼過程中加入了高斯白噪聲進行抗噪訓(xùn)練,采取遷移策略遷移權(quán)重后,一定程度上提升了DNN網(wǎng)絡(luò)的抗噪性能。通過3層全連接隱藏層強化特征提取和非線性映射能力,建立DNN學(xué)習(xí)特征與DOA估計之間的非線性映射關(guān)系,獲得一個抗噪性強的穩(wěn)健DOA估計系統(tǒng)。隱藏層為

      式中,l為隱藏層的層數(shù),l∈{1,2,3}。

      DNN網(wǎng)絡(luò)框架的損失函數(shù)為

      2.3 性能評價指標(biāo)

      以均方根誤差(Root Mean Square Error,RMSE)作為算法性能評價指標(biāo),比較本文算法、基于多層感知器(Multilayerperceptron,MLP)、徑向基函數(shù)(Radial Basis Function,RBF)和MUSIC的DOA估計算法的準(zhǔn)確性和穩(wěn)定性。RMSE定義為

      式中,θi、分別為真實值與估計值。

      3 算法仿真

      3.1 仿真條件

      房間尺寸為5.5 m ×3.3 m ×2.3 m,麥克風(fēng)陣列陣元間距為5 cm,第一個陣元為參考陣元,聲源與麥克風(fēng)相距1.5 m,均勻陣列的高度為1.2 m,如圖4所示。房間內(nèi)墻面(普通石灰墻)的反射系數(shù)為0.95,地板的反射系數(shù)為0.90,麥克風(fēng)陣元個數(shù)為8。

      圖4 仿真條件示意圖(m)

      數(shù)據(jù)集聲源信號取為純凈語音信號,入射角度為0.1°,信號遍歷各個分組的定位范圍,按8∶2的比例隨機抽取制作訓(xùn)練集和數(shù)據(jù)集,數(shù)據(jù)集規(guī)模約為3.6×104個。將音響放置在參考陣元的四周作為聲源,實驗數(shù)據(jù)由一個8陣元線性麥克風(fēng)陣列采集。

      3.2 迭代時間對比

      以基于SSDAE-DNN、MLP和RBF神經(jīng)網(wǎng)絡(luò)的DOA估計算法為互比對象,分別使用4 500、9 000和18 000個訓(xùn)練樣本。3種算法的運行時間見表1。表1表明,基于SSDAE-DNN和MLP網(wǎng)絡(luò)的DOA估計算法的運行速度遠遠快于基于RBFNN網(wǎng)絡(luò)的DOA估計算法,而本文算法的運行速度又快于基于MLP網(wǎng)絡(luò)的DOA算法。

      表1 3種算法的運行時間 s

      3.3 信噪比對系統(tǒng)性能的影響

      在不同信噪比下,比較基于SSDAE-DNN、MUSIC、MLP和RBFNN的DOA估計算法的抗噪性能。信噪比范圍為-5~15 dB,其余仿真條件與前面相同。圖5表明,3種DOA估計算法的RMSE均隨信噪比增大而逐漸減小,而本文算法的RMSE均小于其他算法,有更好的精確性和抗噪性。

      圖5 信噪比對系統(tǒng)性能的影響

      圖6 陣元數(shù)對系統(tǒng)性能的影響

      3.4 陣元數(shù)對系統(tǒng)性能的影響

      在不同陣元數(shù)下,比較基于SSDAE-DNN、MUSIC、MLP和RBFNN的DOA估計算法的RMSE。麥克風(fēng)陣元個數(shù)分別為4、6、8、10和12,其余仿真條件與前面相同。圖6表明,3種算法的RMSE均隨陣元個數(shù)及輸入網(wǎng)絡(luò)特征個數(shù)增加而逐漸降低且變化也趨于平緩,而本文算法的RMSE在4個陣元時大于基于RBF的DOA估計算法,但隨著陣元個數(shù)的增加,RMSE逐漸減小且小于其他算法。

      4 結(jié)語

      針對低信噪比時傳統(tǒng)的DOA估計算法定位誤差大問題,提出了基于SSDAE-DNN神經(jīng)網(wǎng)絡(luò)的語音DOA估計算法。該算法通過SSDAE增強了網(wǎng)絡(luò)框架的抗噪性能,通過遷移學(xué)習(xí)轉(zhuǎn)移權(quán)重提升了DNN網(wǎng)絡(luò)框架的泛化性。仿真與實驗結(jié)果表明,在低信噪比下,本文算法的性能上優(yōu)于基于MLP、RBF和MUSIC的DOA估計算法。

      猜你喜歡
      麥克風(fēng)聲源信噪比
      虛擬聲源定位的等效源近場聲全息算法
      基于深度學(xué)習(xí)的無人機數(shù)據(jù)鏈信噪比估計算法
      Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
      基于GCC-nearest時延估計的室內(nèi)聲源定位
      電子制作(2019年23期)2019-02-23 13:21:12
      基于數(shù)字麥克風(fēng)的WIFI語音發(fā)射機
      電子測試(2018年23期)2018-12-29 11:11:24
      低信噪比下LFMCW信號調(diào)頻參數(shù)估計
      電子測試(2018年11期)2018-06-26 05:56:02
      低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
      麥克風(fēng)的藝術(shù)
      運用內(nèi)積相關(guān)性結(jié)合迭代相減識別兩點聲源
      麥克風(fēng)
      阿拉善右旗| 高唐县| 民丰县| 临夏县| 镇坪县| 巴彦淖尔市| 新巴尔虎左旗| 吉木乃县| 慈溪市| 永丰县| 永靖县| 隆回县| 庄河市| 石首市| 遂川县| 大同市| 穆棱市| 上饶市| 仁化县| 金溪县| 揭东县| 吴川市| 靖江市| 平湖市| 宣城市| 南安市| 常山县| 崇明县| 江源县| 红桥区| 正蓝旗| 靖江市| 高州市| 通河县| 卓资县| 阿拉善盟| 阿坝| 宁阳县| 衡山县| 青龙| 阿坝县|