董添輝,張玲華
(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;2.江蘇省通信與網(wǎng)絡(luò)技術(shù)工程研究中心,江蘇 南京 210003)
粒子群優(yōu)化徑向基函數(shù)網(wǎng)絡(luò)的語音轉(zhuǎn)換
董添輝1,張玲華2
(1.南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003;2.江蘇省通信與網(wǎng)絡(luò)技術(shù)工程研究中心,江蘇 南京 210003)
徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡單和學(xué)習(xí)速度快等特點(diǎn),因此常被用作語音轉(zhuǎn)換的模型。隱層核函數(shù)的中心是影響徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)性能的重要參數(shù),而傳統(tǒng)的K-均值聚類算法受初值影響大,全局優(yōu)化的效果不佳。所以,選擇合適的優(yōu)化算法來調(diào)整RBF網(wǎng)絡(luò)核函數(shù)的中心參數(shù),能改善整個(gè)網(wǎng)絡(luò)的性能,從而提升語音轉(zhuǎn)換的效果。而粒子群算法是一種基于迭代的優(yōu)化算法,具有容易實(shí)現(xiàn)、算法參數(shù)少、收斂快和突出的全局尋優(yōu)能力等特點(diǎn)。提出了一種改進(jìn)的粒子群算法,優(yōu)化了徑向基函數(shù)的中心以提高網(wǎng)絡(luò)性能,便于更準(zhǔn)確地獲得說話人與目標(biāo)人之間譜包絡(luò)的映射關(guān)系。實(shí)驗(yàn)結(jié)果表明,提出的方法能夠有效提高神經(jīng)網(wǎng)絡(luò)的性能,使轉(zhuǎn)換后的聲音更接近于目標(biāo)聲音。
語音轉(zhuǎn)換;徑向基函數(shù)中心;改進(jìn)的粒子群算法;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
語音轉(zhuǎn)換技術(shù)是指在不改變說話內(nèi)容的前提下,轉(zhuǎn)化源說話人聲音的個(gè)性特征,使轉(zhuǎn)換的語音更接近目標(biāo)人。語音轉(zhuǎn)換分為訓(xùn)練階段和轉(zhuǎn)換階段。在訓(xùn)練階段,通過模型對源說話人和目標(biāo)說話人進(jìn)行訓(xùn)練,得出相應(yīng)的轉(zhuǎn)換規(guī)則。在轉(zhuǎn)換階段,先提取源語音的個(gè)性特征,再根據(jù)訓(xùn)練階段得到的轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)化,得到目標(biāo)語音[1-2]。
常用的語音轉(zhuǎn)換模型包括矢量量化法(Vector Quantization,VQ)、高斯混合模型(Gaussian Mixture Model,GMM)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)等[3]。徑向基網(wǎng)絡(luò)作為一種簡單的人工神經(jīng)網(wǎng)絡(luò),具有計(jì)算量少、結(jié)果簡單、學(xué)習(xí)速度快以及逼近任何非線性函數(shù)等特點(diǎn)[4]。重點(diǎn)研究人工神經(jīng)網(wǎng)絡(luò)在語音轉(zhuǎn)換中的應(yīng)用。
RBF神經(jīng)網(wǎng)絡(luò)是一個(gè)類似于遺傳網(wǎng)絡(luò)的三層前饋型神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)有三個(gè)非常重要的參數(shù):隱層核函數(shù)的中心和寬度以及隱層到輸出層的連接權(quán)值。針對徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的核函數(shù)參數(shù)經(jīng)傳統(tǒng)K-均值聚類算法訓(xùn)練存在收斂速度慢、易陷入局部最優(yōu)、泛化性能不佳等問題,引入改進(jìn)的粒子群優(yōu)化算法(ParticleSwarmOptimization,PSO)來訓(xùn)練隱層核函數(shù)的中心,并研究其在語音轉(zhuǎn)換系統(tǒng)中起到的作用[5]。
為更準(zhǔn)確地獲得說話人與目標(biāo)人之間譜包絡(luò)的映射關(guān)系,提出了一種改進(jìn)的粒子群算法,以優(yōu)化徑向基函數(shù)的中心并提高網(wǎng)絡(luò)性能。對基于傳統(tǒng)GMM,基于K-均值聚類、基于PSO算法以及基于改進(jìn)PSO算法的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行了語音轉(zhuǎn)換實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,提出方法相較于其他方法能夠有效提高神經(jīng)網(wǎng)絡(luò)的性能,使轉(zhuǎn)換后的聲音更接近于目標(biāo)聲音。
RBF神經(jīng)網(wǎng)絡(luò)對任意的非線性函數(shù)具有良好的適應(yīng)性,可以分析系統(tǒng)內(nèi)一些難以解析的規(guī)律,具有良好的泛化和快速學(xué)習(xí)的能力[6]。因此,該網(wǎng)絡(luò)被廣泛用于語言轉(zhuǎn)換領(lǐng)域。RBF神經(jīng)網(wǎng)絡(luò)具有三層前向結(jié)構(gòu),包括輸入層、隱層、輸出層[7]。其結(jié)構(gòu)如圖1所示。
圖1 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
一般采用n維的高斯函數(shù)作為徑向基函數(shù):
(1)
其中,‖x-ci‖為歐氏幾何范數(shù),ci為第i個(gè)核函數(shù)的中心,σi為第i個(gè)核函數(shù)的寬度。
RBF神經(jīng)網(wǎng)絡(luò)的輸出為:
(2)
其中,x為輸出向量;wij為相對應(yīng)的連接權(quán)值。
RBF神經(jīng)網(wǎng)絡(luò)由兩類參數(shù)組成:一類是隱層核函數(shù)的中心和寬度;另一類是隱層到輸出層的連接權(quán)值[8]。常規(guī)K-均值聚類算法的步驟如下:
Step1:初始化設(shè)置網(wǎng)絡(luò)和各參數(shù)。
Step2:聚類中心ci(i=1,2,…,k)由隨機(jī)選擇k個(gè)訓(xùn)練樣本構(gòu)成。
Step3:輸入樣本xp,按照近鄰規(guī)則分組;根據(jù)歐氏距離(見式(3))將xp分給離其最近的中心形成聚類。
(3)
Step4:重新調(diào)配聚類中心,計(jì)算每個(gè)聚類的均值來尋找新聚類中心。若隨著迭代次數(shù)的增加聚類中心不再改變,則得到的聚類中心就是核函數(shù)的中心,否則返回Step2。
Step5:計(jì)算核函數(shù)的寬度σ:
(4)
其中,dmax為所選中心的最大距離。
Step6:由最小二乘法可得隱層與輸出層連接權(quán)值,計(jì)算公式如下:
(5)
其中,P為樣本總數(shù)。
隱層核函數(shù)的中心是影響RBF神經(jīng)網(wǎng)絡(luò)性能的重要參數(shù),而傳統(tǒng)K-均值聚類算法受初值影響大,全局優(yōu)化的效果不佳[9]。所以,選擇合適的優(yōu)化算法來調(diào)整RBF網(wǎng)絡(luò)核函數(shù)的中心參數(shù),能改善整個(gè)網(wǎng)絡(luò)的性能。而粒子群算法是一種基于迭代的優(yōu)化算法,具有容易實(shí)現(xiàn)、算法參數(shù)少、收斂快和突出的全局尋優(yōu)能力等特點(diǎn)。因此,引入一種改進(jìn)的PSO算法調(diào)整RBF神經(jīng)網(wǎng)絡(luò)的核函數(shù)中心,并將優(yōu)化過的RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于語音轉(zhuǎn)換,以提高轉(zhuǎn)換語音的相似度。
2.1 改進(jìn)的粒子群算法
粒子群優(yōu)化算法模擬鳥群覓食行為,通過粒子群的運(yùn)動進(jìn)行全局搜索。每個(gè)粒子都有一個(gè)相對應(yīng)的適度值和速度矢量,分別表示距離及運(yùn)動方向。在迭代算法中,通過比較每個(gè)粒子的全局極值Gbest和個(gè)體極值Pbest,對其位置和速度進(jìn)行迭代更新[10]。
假設(shè)粒子群中有N個(gè)粒子,則第i個(gè)粒子在D維度空間中的位置表示為Xi=(xi1,xi2,…,xiD),i=1,2,…,N,速度記為Vi=(vi1,vi2,…,viD),i=1,2,…,N。
通過每一次的迭代尋找Pbest和Gbest,找到極值后再根據(jù)式(6)更新粒子的位置和速度。
(6)
(7)
其中,i=1,2,…,N,d=1,2,…,D;k為迭代次數(shù);pid和pgd分別為粒子個(gè)體極值和全局極值的位置;c1,c2為加速因子;rand()為0到1之間的隨機(jī)數(shù);w為慣性權(quán)值,通過合適的調(diào)節(jié)方法可以在局部尋優(yōu)與全局尋優(yōu)之間找到平衡,慣性權(quán)值越小則局部尋優(yōu)能力增強(qiáng),全局尋優(yōu)能力減弱,慣性權(quán)值越大則效果相反[10]。
采用一種非線性策略來調(diào)整w,從而改進(jìn)粒子群算法。
(8)
其中,wmax,wmin分別為慣性權(quán)值的初始值和迭代結(jié)束值;kmax為最大迭代次數(shù);k為當(dāng)前迭代次數(shù)。
當(dāng)最優(yōu)位置的適度值符合最小適應(yīng)閾值或迭代次數(shù)等于最大值時(shí),該P(yáng)SO算法結(jié)束[11]。
2.2 基于改進(jìn)粒子群算法的RBF神經(jīng)網(wǎng)絡(luò)
將核函數(shù)的聚類中心ci看作是PSO算法的粒子,通過PSO算法優(yōu)化網(wǎng)絡(luò),從而提高網(wǎng)絡(luò)性能[12],步驟如下:
Step1:初始化網(wǎng)絡(luò)。設(shè)定粒子個(gè)數(shù)及每個(gè)粒子大小并隨機(jī)初始化各個(gè)粒子的位置和速度,設(shè)置慣性權(quán)值的初始值和結(jié)束值,最大迭代次數(shù)。
Step2:粒子空間位置優(yōu)劣只能由適應(yīng)度函數(shù)衡量,函數(shù)決定著整個(gè)算法的優(yōu)化效果,根據(jù)實(shí)際問題,采用的適應(yīng)度函數(shù)為:
(9)
Step3:將通過RBF網(wǎng)絡(luò)計(jì)算得到的樣本實(shí)際輸出與相應(yīng)的預(yù)期輸出代入式(9),得到該粒子的個(gè)體極值;計(jì)算各個(gè)粒子的適度值并進(jìn)行比較,得出最優(yōu)值并將其作為粒子的全局極值。
Step4:通過式(6)~(8)分別更新粒子的速度、位置和權(quán)值。
Step5:如果重新計(jì)算更新后粒子的適應(yīng)度值優(yōu)于以前位置的適應(yīng)度值,則新位置取代以前位置成為下次迭代的起點(diǎn),否則下一次迭代的起點(diǎn)不變。
Step6:若全局極值滿足小于設(shè)定的閾值或者迭代次數(shù)達(dá)到最大,則改進(jìn)PSO算法結(jié)束。否則,轉(zhuǎn)至Step3,繼續(xù)進(jìn)行迭代。
Step7:將改進(jìn)粒子群算法得到全局最優(yōu)值的位置作為RBF神經(jīng)網(wǎng)絡(luò)的核函數(shù)中心。
2.3 基于改進(jìn)粒子群優(yōu)化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換
在語音轉(zhuǎn)換系統(tǒng)中,常用提取加濾波的短時(shí)線譜模型來計(jì)算聲音參數(shù),從而得到線性預(yù)測系數(shù)(Linear Predictive Coefficient,LPC)。這些系數(shù)通常轉(zhuǎn)化成其他形式的參數(shù),以適應(yīng)所需的性質(zhì)。線譜頻率(Line Spectrum Frequency,LSF)參數(shù)是通過一系列的計(jì)算由LPC參數(shù)得來的[13]。LSF參數(shù)能夠客觀反映共振峰的位置和帶寬,具有良好的插值特征,并且特征參數(shù)的某一部分失真對合成譜參數(shù)影響較小,因此廣泛用于語音信號處理[14]。實(shí)驗(yàn)采用自適應(yīng)加權(quán)譜內(nèi)插(STRAIGHT)模型來獲得LSF參數(shù)和基音頻率,以及合成轉(zhuǎn)換語音。
語音轉(zhuǎn)換系統(tǒng)由訓(xùn)練階段和轉(zhuǎn)換階段兩部分組成。在訓(xùn)練階段,提取源和目標(biāo)說話人聲音的基頻和線譜頻率參數(shù);再運(yùn)用動態(tài)時(shí)間規(guī)劃將源與目標(biāo)的特征參數(shù)對齊;將源聲音的參數(shù)作為RBF網(wǎng)絡(luò)的輸入,目標(biāo)聲音參數(shù)作為輸出,通過人工神經(jīng)網(wǎng)絡(luò)建立轉(zhuǎn)換規(guī)則[15]。在轉(zhuǎn)換階段,將源測試聲音同樣通過STRAIGHT模型提取LSF參數(shù)和基頻,再利用訓(xùn)練階段得到的轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換。最后,利用STRAIGHT模型合成聲音。圖2為語音轉(zhuǎn)換框圖。
圖2 語音轉(zhuǎn)換框圖
對基于傳統(tǒng)GMM,基于K-均值聚類、基于PSO算法以及基于改進(jìn)PSO算法的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行語音轉(zhuǎn)換實(shí)驗(yàn)。另外,由文獻(xiàn)[7]可知基頻在語音轉(zhuǎn)換中起著重要的作用,將譜包絡(luò)參數(shù)與基頻聯(lián)合通過徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換后的基頻含有更多目標(biāo)人個(gè)性特征。實(shí)驗(yàn)中采用的數(shù)據(jù)庫包含2個(gè)男子和2個(gè)女子的語音,每人的語音由141個(gè)單字和6句短語組成。采樣率均為16kHz,并以16bit量化。
3.1 主觀評價(jià)
采用ABX和MOS對測試轉(zhuǎn)換語音的效果進(jìn)行主觀評價(jià)。
ABX法主要是對轉(zhuǎn)換語音與目標(biāo)語音的相似程度進(jìn)行評價(jià),A和B分別代表源說話人聲音和目標(biāo)說話人聲音,X代表轉(zhuǎn)換而來的聲音。實(shí)驗(yàn)中,隨機(jī)選擇10位測評人對轉(zhuǎn)換后的30個(gè)詞語和6句短語進(jìn)行評價(jià),要求聽眾選擇A或B哪個(gè)更接近X,然后統(tǒng)計(jì)結(jié)果。表1給出了3種轉(zhuǎn)換方法的“ABX”的測試結(jié)果。
表1 ABX測試結(jié)果 %
由表1結(jié)果可知,基于改進(jìn)PSO算法的RBF網(wǎng)絡(luò)所得到的轉(zhuǎn)換語音相對于其他三種方法得到的語音更接近于目標(biāo)語音,轉(zhuǎn)換效果也較其他兩種方法有顯著提升。
平均主觀意見分(Mean Opinion Score,MOS)將語音分為差、較差、尚可、好、極好這五個(gè)聽覺質(zhì)量等級,分別記為1~5分。實(shí)驗(yàn)中,同樣隨機(jī)選擇10位測評人對轉(zhuǎn)換后的30個(gè)詞語和6句短語進(jìn)行評價(jià)和打分,測試結(jié)果如表2所示
表2 MOS測試結(jié)果
由表2可知,通過改進(jìn)PSO算法的RBF網(wǎng)絡(luò)得到的轉(zhuǎn)換語音MOS分都有不同程度的提高,說明轉(zhuǎn)換語音的清晰度和自然度都有所提高,性能優(yōu)于其他三種方案。
3.2 客觀評價(jià)
實(shí)驗(yàn)采用以女生到男生聲音的轉(zhuǎn)換為例作為客觀評價(jià)。為了更加直觀地了解提出的改進(jìn)PSO算法對RBF網(wǎng)絡(luò)的優(yōu)化情況,采用譜失真率作為衡量客觀評價(jià)的標(biāo)準(zhǔn),如式(10):
(10)
其中,xi,con,xi,targ和xi,sour分別為轉(zhuǎn)換后的聲音、源聲音和目標(biāo)聲音的包絡(luò)參數(shù);N為聲音的幀數(shù)。rsd的值越小,網(wǎng)絡(luò)的性能越好。
圖3給出了頻率失真圖。
圖3 頻率失真圖
由圖3可知,基于改進(jìn)PSO算法優(yōu)化RBF網(wǎng)絡(luò)的語音轉(zhuǎn)換的譜失真率最低,擁有更好的轉(zhuǎn)換性能,在轉(zhuǎn)換語音的質(zhì)量上得帶了進(jìn)一步的提高。
為了進(jìn)一步比較基于改進(jìn)PSO算法優(yōu)化的RBF網(wǎng)絡(luò)轉(zhuǎn)換的方法與其他方法之間譜包絡(luò)的不同,將實(shí)驗(yàn)中得到的LSF系數(shù)通過一系列變換得到譜包絡(luò),如圖4所示。
由圖4可知,基于改進(jìn)粒子群優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換得到的譜包絡(luò)更接近目標(biāo)聲音的包絡(luò),顯著提高了捕捉共振峰的能力,所以能更好反映人說話聲音的特性。
圖4 包絡(luò)的比較
為了更加準(zhǔn)確地建立語音轉(zhuǎn)換的映射關(guān)系,改善語音轉(zhuǎn)換的效果,提出了一種改進(jìn)粒子群算法,以優(yōu)化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)性能,從而使得到的轉(zhuǎn)換語音更接近目標(biāo)聲音。通過對四組實(shí)驗(yàn)的主客觀評價(jià)結(jié)果進(jìn)行比較可知,該方法能夠更加準(zhǔn)確地映射源聲音與目標(biāo)聲音的關(guān)系,使得轉(zhuǎn)換后的聲音具有更多目標(biāo)人聲音的個(gè)性特征。
[1] 張玲華,姚紹芹,解偉超.基于自適應(yīng)粒子群優(yōu)化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的語音轉(zhuǎn)換[J].數(shù)據(jù)采集與處理,2015,30(2):336-343.
[2] 李 波,王成友,蔡宣平,等.語音轉(zhuǎn)換及相關(guān)技術(shù)綜述[J].通信學(xué)報(bào),2004,25(5):109-118.
[3] 簡志華,楊 震.語聲轉(zhuǎn)換技術(shù)發(fā)展及展望[J].南京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2007,27(6):88-94.
[4] 解偉超,張玲華.基于自組織聚類和改進(jìn)粒子群算法的語音轉(zhuǎn)換方法[J].聲學(xué)學(xué)報(bào),2014,39(1):130-136.
[5]ValbretH,MoulinesE,TubachJP.VoicetransformationusingPSOLAtechnique[C]//Internationalconferenceonacoustics,speech,andsignalprocessing.[s.l.]:IEEE,1992:145-148.
[6] 郭 通,蘭巨龍,李玉峰,等.基于量子自適應(yīng)粒子群優(yōu)化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測[J].電子與信息學(xué)報(bào),2013,35(9):2220-2226.
[7]ChenXiantong,ZhangLinghua.AnimprovedANNmethodbasedonclusteringoptimizationforvoiceconversion[C]//Internationalconferenceonaudio,language&imageprocessing.[s.l.]:IEEE,2014:464-469.
[8]ManChuntao,WangKun,ZhangLiyong.AnewtrainingalgorithmforRBFneuralnetworkbasedonPSOandsimulationstudy[C]//ProceedingsofIEEEinternationalconferenceoncomputerscienceandinformationengineering.[s.l.]:IEEE,2009:641-645.
[9]XieFenglong,YaoQian,SoongFK,etal.Pitchtransformationinneuralnetworkbasedvoiceconversion[C]//Chinesespokenlanguageprocessing.[s.l.]:IEEE,2014:197-200.
[10] 何隆玲.基于改進(jìn)PSO-RBF神經(jīng)網(wǎng)絡(luò)的高分辨率雷達(dá)目標(biāo)檢測研究[D].南寧:廣西大學(xué),2013.
[11]AndrewsPS.Aninvestigationintomutationoperatorsforparticleswarmoptimization[C]//IEEEcongressonevolutionarycomputation.[s.l.]:IEEE,2006:1044-1051.
[12]BrattonD,KennedyJ.Definingastandardforparticleswarmoptimization[C]//IEEEinternationalconferenceonswarmintelligencesymposium.[s.l.]:IEEE,2007:120-127.
[13]QiaoY,MinematsuN.Mixtureofprobabilisticlinearregressions:aunifiedviewofGMM-basedmappingtechniques[C]//ProceedingsofIEEEinternationalconferenceonacoustics,speechandsignalprocessing.Taipei,Taiwan:IEEE,2009:3913-3916.
[14]TodaT,SaruwatariH,ShikanoK.VoiceconversionalgorithmbasedonGaussianmixturemodelwithdynamicfrequencywarpingofSTRAIGHTspectrum[C]//IEEEinternationalconferenceonacoustics,speech,andsignalprocessing.[s.l.]:IEEE,2001:841-844.
[15]DesaiS,BlackA,YegnanarayanaB,etal.SpectralmappingusingartificialneuralNetworksforvoiceconversion[J].IEEETransactionsonAudio,SpeechandLanguageProcessing,2010,18(5):954-964.
Voice Conversion of Radial Basic Function Neural Network of ParticleSwarm Optimization
DONG Tian-hui1,ZHANG Ling-hua2
(1.College of Telecommunications & Information Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;2.Jiangsu Provincial Engineering Research Center of Telecommunications and Network Technology,Nanjing 210003,China)
Due to simple structure and fast learning,Radial Basis Function (RBF) neural network is used commonly in voice conversion system.The center of kernel function in hidden layer is the important parameter of influencing the RBF neural network,but traditionalK-meansclusteringalgorithmreliesontheinitialvalue,whichisineffectiveinglobaloptimization.Therefore,itissignificancetoselectasuitablealgorithmtomodulatethecenteroffunctionandenhancetheeffectofvoiceconversion.Particleswarmalgorithmisanoptimizedonebasedoniteration,withthecharacteristicsofeasyimplementation,muchlessparameters,fastconvergenceandbetterglobaloptimizationandsoon.AnimprovedparticleswarmoptimizationisproposedtooptimizetheRBF’scentersforimprovementoftheperformanceofRBFnetwork,thusenhancingthetransformationofspeechparameters.Theresultsacquiredbymodelingandsimulationshowthattheproposedmethodhaseffectivelyimprovedtheperformanceofneuralnetworkandtheeffectofconvertedvoicesismuchclosertothegoal.
voice conversion;centers of RBF;improved particle swarm optimization;radial basis function neural network
2016-06-06
2016-09-21 網(wǎng)絡(luò)出版時(shí)間:2017-03-13
江蘇省高校自然科學(xué)研究重大項(xiàng)目(13KJA510003);江蘇高校優(yōu)勢學(xué)科建設(shè)工程(PAPD)
董添輝(1991-),男,碩士,研究方向?yàn)檎Z音信號的研究與應(yīng)用;張玲華,博士生導(dǎo)師,通信作者,研究方向?yàn)檎Z音信號的研究與應(yīng)用、無線傳感網(wǎng)絡(luò)、數(shù)字助聽器。
http://kns.cnki.net/kcms/detail/61.1450.tp.20170313.1546.042.html
TN
A
1673-629X(2017)05-0064-05
10.3969/j.issn.1673-629X.2017.05.014