• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      語音識(shí)別的SVM模型選擇分析

      2015-12-08 13:10:12趙海君
      電腦知識(shí)與技術(shù) 2015年25期
      關(guān)鍵詞:語音識(shí)別支持向量機(jī)

      趙海君

      摘要:針對(duì)現(xiàn)有SVM模型選擇方法中,人為指定核函數(shù)類型可能使得SVM性能難以達(dá)到最優(yōu)化,分析了現(xiàn)有核函數(shù)類型對(duì)語音分類率的影響。并把K-交叉驗(yàn)證思想與網(wǎng)格搜索法、遺傳算法、粒子群優(yōu)化算法相結(jié)合進(jìn)行參數(shù)尋優(yōu),應(yīng)用到語音識(shí)別中。并對(duì)語音特征數(shù)據(jù)處理問題進(jìn)行了研究。分析結(jié)果表明[-1,1]內(nèi)對(duì)語音特征參數(shù)歸一化,且采用徑向基核函數(shù)、網(wǎng)格搜索法對(duì)參數(shù)尋優(yōu),能達(dá)到最優(yōu)的語音分類率。

      關(guān)鍵詞:語音識(shí)別;語音特征參數(shù);SVM(支持向量機(jī));模型選擇;歸一化;交叉驗(yàn)證

      中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)25-0133-02

      Speaker Recognition Model Selection Analysis Based on SVM

      ZHAO Hai-jun

      (College of Information, Shanxi Agricultural University, Taigu 030800, China)

      Abstract: For existing SVM model selection method, specified the type of man-made kernel may make it difficult to optimize the performance of SVM, it analyses the impact of existing kernel type to speech classification. Combining K-fold cross validation with grid searching and GA and PSO are used parameter optimization in speech recognition. Also it studies speech characteristic processing problem .Analysis results show that the normalization of [-1, 1] and using Radial Basis Function(RBF) and grid searching can achieve the best speech classification rate.

      Key words: speaker recognition; voice feature parameter; Support Vector Machine(SVM); model selection; normalization; cross validation

      1概述

      語音識(shí)別(speaker recognition,SR)技術(shù)(也成聲紋識(shí)別技術(shù)),是生物認(rèn)證技術(shù)的一種,是一項(xiàng)根據(jù)語音波形中反映說話人生理和行為特征的語音參數(shù),自動(dòng)識(shí)別說話人身份的技術(shù)[1]。語音識(shí)別技術(shù)的核心是通過預(yù)先錄入說話人的樣本,提取說話人獨(dú)一無二的語音特征并保存在數(shù)據(jù)庫中,應(yīng)用時(shí)將待驗(yàn)證的聲音和數(shù)據(jù)庫中的特征進(jìn)行匹配,從而決定說話人的身份。語音識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性受到世人矚目。

      在語音識(shí)別中最常用的特征參數(shù)是基于聲道的LPCC、運(yùn)用基于等響度曲線和臨界帶的PLP以及基于聽覺特性的MFCC[2-3],本文選取MFCC特征進(jìn)行仿真實(shí)驗(yàn)。首先分析了對(duì)特征參數(shù)的預(yù)處理問題,接著將現(xiàn)有的核函數(shù)類型對(duì)語音分類率的影響作了分析,然后還對(duì)分類器訓(xùn)練中懲罰因子c和核函數(shù)參數(shù)[γ]進(jìn)行優(yōu)化,從而來提高語音分類率。

      2支持向量機(jī)原理

      對(duì)于非線性可分問題,SVM的基本思想是:利用核函數(shù)將輸入特征的樣本點(diǎn)映射到高維特征空間中,數(shù)據(jù)被超平面分割,在高維空間中變得線性可分,轉(zhuǎn)化為線性可分模式,然后再對(duì)應(yīng)于低維空間的非線性分類[4]。

      對(duì)于線性可分模式,考慮訓(xùn)練樣本[xi,yiNi=1],其中[xi]是輸入模式的第[i]個(gè)樣本,[yi∈-1,+1]。設(shè)用于分離的超平面:[w?x+b=0]其中w是超平面的法向量,b是超平面的常數(shù)項(xiàng)。SVM的主要思想是建立一個(gè)超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。即最優(yōu)分類超平面等價(jià)于求最大間隔。滿足下面條件的特殊數(shù)據(jù)點(diǎn)[xi,yi]稱為支持向量:[w?xi+b=-1,yi=-1]or[w?xi+b=1,yi=1]。支持向量是那些最靠近決策面的數(shù)據(jù)點(diǎn)。

      3實(shí)驗(yàn)結(jié)果與分析

      Timit Database語音數(shù)據(jù)庫中,選取6個(gè)不同男性的聲音,都是說的相同的話。對(duì)每個(gè)語句提取相應(yīng)的MFCC參數(shù),且選取前400組變換參數(shù)數(shù)據(jù),其中350組樣本數(shù)據(jù)作為實(shí)驗(yàn)訓(xùn)練樣本,50組樣本數(shù)據(jù)作為實(shí)驗(yàn)測(cè)試樣本。識(shí)別模型為SVM支持向量機(jī);MFCC特征維數(shù)為20;mel濾波器的組數(shù)為24;測(cè)試人數(shù):2、4、6人;測(cè)試次數(shù):每次識(shí)別運(yùn)行10次。

      實(shí)驗(yàn)1

      本實(shí)驗(yàn)部分采用SVM默認(rèn)下徑向基核函數(shù),用不同歸一化方式[5]作對(duì)比,最后測(cè)試集預(yù)測(cè)分類準(zhǔn)確率如表1所示:

      表1 不同歸一化方式對(duì)比表

      從表1中數(shù)據(jù)可以看出,需要對(duì)原始數(shù)據(jù)先進(jìn)行歸一化處理,才能提高最后的分類準(zhǔn)確率,而且不同的歸一化方式對(duì)最后的準(zhǔn)確率也會(huì)有一定影響。[-1,1]歸一化處理下2、4、6人的語音分類率比[0,1]歸一化處理的分別提高了4.84%、6.29%、9.03%。

      實(shí)驗(yàn)2

      對(duì)于SVM中不同的核函數(shù)[6-8],測(cè)試集預(yù)測(cè)分類率的對(duì)比(統(tǒng)一采用[-1,1]歸一化)如表2所列:

      4結(jié)束語

      本文采用SVM方法用于語音分類,對(duì)提取的MFCC參數(shù)是否數(shù)據(jù)預(yù)處理進(jìn)行了分析,并且對(duì)SVM的兩個(gè)關(guān)鍵要素:核函數(shù)、核參數(shù)問題進(jìn)行了分析。由于語音特征參數(shù)的訓(xùn)練樣本參數(shù)多、維數(shù)高,在樣本特征空間上分布廣,因此選擇徑向基核函數(shù)較為合適。本文把K-CV與網(wǎng)格搜索法、GA、PSO結(jié)合比較,也說明了網(wǎng)格搜索法運(yùn)用到高維數(shù)、大樣本的語音數(shù)據(jù)中有明顯的優(yōu)勢(shì)。

      參考文獻(xiàn):

      [1] 吳朝暉,楊瑩春.說話人識(shí)別模型與方法[M].北京:清華大學(xué)出版社,2009.

      [2] 余建潮,張瑞林.基于MFCC和LPCC的說話人識(shí)別[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2009,30(5):1189-1191.

      [3] CAO H,GAO L M.Research on sound fields generated by laster-induced liquid breakdown[J].Optica Applicata,2010,40(4):897-907.

      [4] 李書玲,劉蓉,劉紅,等.基于改進(jìn)型SVM算法的語音情感識(shí)別[J].計(jì)算機(jī)應(yīng)用,2013,33(7):1938-1941.

      [5] 史峰,王輝,郁磊,胡斐,等.MATLAB智能算法30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010,112-132.

      [6] 陳剛,王宏琦,孫顯.基于核函數(shù)原型和自適應(yīng)遺傳算法的SVM模型選擇方法[J].中國科學(xué)院研究生院學(xué)報(bào),2012,29(1):62-69.

      [7] 劉華福.支持向量機(jī)Mercer核的若干性質(zhì)[J].北京聯(lián)合大學(xué)學(xué)報(bào),2005,19(1):45-56.

      [8] 李盼池,許少華.支持向量機(jī)在模式識(shí)別中的核函數(shù)特性分析[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,26(2):302-304.

      猜你喜歡
      語音識(shí)別支持向量機(jī)
      通話中的語音識(shí)別技術(shù)
      動(dòng)態(tài)場(chǎng)景中的視覺目標(biāo)識(shí)別方法分析
      論提高裝備故障預(yù)測(cè)準(zhǔn)確度的方法途徑
      基于熵技術(shù)的公共事業(yè)費(fèi)最優(yōu)組合預(yù)測(cè)
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      面向移動(dòng)終端的語音簽到系統(tǒng)
      農(nóng)業(yè)物聯(lián)網(wǎng)平臺(tái)手機(jī)秘書功能分析與實(shí)現(xiàn)
      基于Android手機(jī)語音和Arduino控制板的機(jī)器人控制系統(tǒng)
      定兴县| 抚宁县| 霍州市| 贵南县| 太保市| 老河口市| 当阳市| 吐鲁番市| 福建省| 赤峰市| 资兴市| 芷江| 嘉荫县| 汕尾市| 都安| 清水河县| 肥东县| 新密市| 奉节县| 普兰店市| 鱼台县| 东乡族自治县| 祁门县| 行唐县| 平乐县| 南通市| 买车| 民勤县| 江达县| 岳阳市| 从化市| 河西区| 当雄县| 公安县| 海口市| 林西县| 怀仁县| 玉田县| 建始县| 和林格尔县| 白河县|