白靜,楊利紅,張雪英
(太原理工大學(xué) 信息工程學(xué)院,山西 太原,030024)
語(yǔ)音識(shí)別技術(shù)是人機(jī)接口應(yīng)用的前沿技術(shù)之一,目的是使計(jì)算機(jī)能夠聽(tīng)懂人類語(yǔ)言,實(shí)現(xiàn)人機(jī)語(yǔ)音通信。但目前多數(shù)實(shí)際語(yǔ)音識(shí)別系統(tǒng)只適合識(shí)別“干凈”的語(yǔ)音,當(dāng)存在背景噪聲或訓(xùn)練和測(cè)試環(huán)境不同時(shí),系統(tǒng)性能會(huì)急劇下降。作為模式識(shí)別的新型方法之一,支持向量機(jī)(SVM)[1]能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等實(shí)際問(wèn)題,比基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的隱馬爾可夫模型(HMM)[2]、人工神經(jīng)網(wǎng)絡(luò)[3]等方法具有更好的泛化能力和分類精確性[4],更適合用于語(yǔ)音識(shí)別。關(guān)于支持向量機(jī)的理論研究在逐漸增多,但應(yīng)用研究相對(duì)滯后,只在一些領(lǐng)域得到較好應(yīng)用,如文本自動(dòng)分類、圖像識(shí)別、視頻編碼[5-6]等,近些年 SVM應(yīng)用研究開(kāi)始擴(kuò)展到語(yǔ)音識(shí)別領(lǐng)域,但還很不夠。文獻(xiàn)[7-8]是早期的國(guó)內(nèi)將支持向量機(jī)應(yīng)用于孤立詞和漢語(yǔ)數(shù)字語(yǔ)音識(shí)別的文獻(xiàn),取得了與隱馬爾可夫模型相當(dāng)?shù)淖R(shí)別效果,但采用的是最基本的核函數(shù),核參數(shù)選用的是經(jīng)驗(yàn)值,并未對(duì) SVM 中的參數(shù)選擇進(jìn)行描述,而且實(shí)驗(yàn)是在非噪音環(huán)境下進(jìn)行的;Liu等[9]將SVM與段長(zhǎng)分布HMM融合起來(lái),構(gòu)造出一種混合系統(tǒng),將該系統(tǒng)應(yīng)用到普通話數(shù)字語(yǔ)音識(shí)別系統(tǒng)中,實(shí)驗(yàn)是在不同信噪比下進(jìn)行的,結(jié)果僅優(yōu)于使用段長(zhǎng)分布HMM的結(jié)果。在信噪比較高時(shí),能有效改善系統(tǒng)性能,但在信噪比低于15 dB時(shí),效果不好,且整個(gè)系統(tǒng)算法比較復(fù)雜。李攀等[10-11]將動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法嵌入支持向量機(jī)常用的核函數(shù)中,解決了語(yǔ)音段時(shí)長(zhǎng)不一致的問(wèn)題, 實(shí)現(xiàn)了支持向量機(jī)對(duì)語(yǔ)音的分類識(shí)別,但這僅是一種進(jìn)行語(yǔ)音識(shí)別的方法,SVM的核參數(shù)仍然是最基本的經(jīng)驗(yàn)值。Maldonado等[12]在不同信噪比下對(duì)西班牙語(yǔ)的孤立數(shù)字進(jìn)行實(shí)驗(yàn),結(jié)果優(yōu)于使用HMM的結(jié)果,但在低信噪比環(huán)境下識(shí)別率仍不高,未對(duì)SVM算法部分進(jìn)行深入研究。將 SVM 應(yīng)用于語(yǔ)音識(shí)別有著巨大的研究潛力。已有研究表明:SVM核參數(shù)及懲罰因子的選擇嚴(yán)重影響著其分類性能,當(dāng)其值選取合適時(shí),SVM的分類能力明顯增強(qiáng),然而,其參數(shù)的選取目前仍沒(méi)有較有效的方法。人工魚(yú)群算法[13]是一種基于模擬魚(yú)群行為的優(yōu)化算法,其結(jié)構(gòu)簡(jiǎn)單、參數(shù)調(diào)整簡(jiǎn)單易行,更適合計(jì)算機(jī)編程處理。本文在分析SVM模型抗噪性的基礎(chǔ)上,提出一種改進(jìn)的人工魚(yú)群算法——基于小生境共享機(jī)制的并行結(jié)構(gòu)人工魚(yú)群算法(PAFSA),對(duì)支持向量機(jī)中核參數(shù)及懲罰因子進(jìn)行優(yōu)化,并用基于優(yōu)選參數(shù)的支持向量機(jī)進(jìn)行語(yǔ)音識(shí)別實(shí)驗(yàn)。
根據(jù)SVM定義,對(duì)于空間Rn上的線性可分的2類分類問(wèn)題,有最大間隔原則,即最大化相應(yīng)的2個(gè)支持超平面形成的間隔。由該原則出發(fā),設(shè)有l(wèi)個(gè)線性可分的訓(xùn)練樣本集 T={(x1,y1),(x2,y2),…,(xl,yl)}∈(X,Y)l,輸入樣本空間 xi∈X=Rn,輸出 yi∈Y,Y=(-1,1)(其中,i=1,…,l),標(biāo)明它所對(duì)應(yīng)的樣本向量xi屬于兩類中的哪一類,由這一組樣本可以確定一個(gè)分類超平面 w·x+b=0,使得離它最近的每類點(diǎn)與它的距離達(dá)到最大值,則所得到的最優(yōu)化問(wèn)題為對(duì)法向量w和截距b的凸二次規(guī)劃問(wèn)題[14]:
這種解法硬性地要求所有樣本點(diǎn)都滿足和超平面間的距離必須大于 1,因此也叫“硬間隔”分類法。對(duì)于某些“離群點(diǎn)”,就無(wú)法滿足這個(gè)硬性的條件,從而使得整個(gè)問(wèn)題無(wú)解。若繼續(xù)使用超平面進(jìn)行分劃,則需引入“容錯(cuò)性”,“軟化”對(duì)分劃超平面的要求,即允許有不滿足約束條件 yi(w·xi+b)≥1的訓(xùn)練點(diǎn)存在?!败浕奔s束條件的方法是給式(1)中1這個(gè)硬性閾值加一個(gè)松弛變量,ξi≥0(i=1,…,l),即:
只有“離群點(diǎn)”才有1個(gè)松弛變量ξi與其對(duì)應(yīng),沒(méi)離群的點(diǎn)松弛變量都等于 0。松弛變量ξi實(shí)際上表示對(duì)應(yīng)點(diǎn)到底離群有多遠(yuǎn),其值越大,則點(diǎn)就越遠(yuǎn)。當(dāng)ξi充分大時(shí),訓(xùn)練點(diǎn)總可以滿足上述約束條件。但應(yīng)該設(shè)法避免ξi取太大,因此,在目標(biāo)函數(shù)里引入懲罰因子C對(duì)其進(jìn)行懲罰,體現(xiàn)重視離群點(diǎn)帶來(lái)?yè)p失的程度。這樣,上述原始最優(yōu)化問(wèn)題變?yōu)椋?/p>
正因?yàn)橛辛俗畲箝g隔原則、松弛變量、懲罰因子,才使得支持向量機(jī)具有魯棒性。在對(duì)支持向量機(jī)魯棒性正確分析的基礎(chǔ)上,當(dāng)信噪比降低時(shí),語(yǔ)音識(shí)別系統(tǒng)抗噪性的研究就是可行的。
SVM中的非線性分類問(wèn)題是通過(guò)核函數(shù)解決的,通過(guò)引入核函數(shù)技術(shù)把低維空間的輸入數(shù)據(jù)通過(guò)非線性變換映射到高維特征空間,從而在低維空間的非線性問(wèn)題可以在高維空間用線性方法來(lái)解決,并且不用知道非線性變換以及其對(duì)應(yīng)特征空間的形式。SVM由核函數(shù)和訓(xùn)練集完全刻畫,SVM分類性能、核函數(shù)的選擇以及核參數(shù)的取值起著非常關(guān)鍵的作用。
采用不同的核函數(shù)可以構(gòu)造不同的支持向量算法。在實(shí)際應(yīng)用中,通常要根據(jù)問(wèn)題的具體情況選擇合適的核函數(shù)及其參數(shù)。高斯核具有較好的適應(yīng)性,無(wú)論是低維、高維、小樣本和大樣本等情況均適用,是較理想的分類依據(jù)函數(shù)。因此,本文采用高斯函數(shù)作為核函數(shù),其表達(dá)式為
引入核函數(shù)K(xi,xj)后,使用Lagrange乘子法可將式(3)的最優(yōu)化問(wèn)題轉(zhuǎn)化為一個(gè)二次規(guī)劃問(wèn)題:
其中:?i為與第i個(gè)樣本對(duì)應(yīng)的Lagrange乘子,實(shí)質(zhì)上是凸優(yōu)化問(wèn)題的解,?i不為零對(duì)應(yīng)的樣本點(diǎn)xi就是支持向量。對(duì)式(5)求解后,得到相應(yīng)的決策函數(shù):
由式(5)可知:SVM分類性能的優(yōu)劣取決于參數(shù)C和γ最小值的求解。核參數(shù)γ主要影響樣本數(shù)據(jù)在高維特征空間中分布的復(fù)雜程度,但因?yàn)榫唧w學(xué)習(xí)對(duì)象的不同,特征相差較大且沒(méi)有固定的規(guī)律,目前參數(shù)選擇還沒(méi)有形成統(tǒng)一的模式[15-16],因此,本文提出一種基于小生境共享機(jī)制的并行人工魚(yú)群算法 PAFSA來(lái)優(yōu)化C與γ。并將優(yōu)選的參數(shù)用于語(yǔ)音識(shí)別系統(tǒng)。
人工魚(yú)群算法是應(yīng)用動(dòng)物自治體模型提出的一種自下而上的尋優(yōu)策略,該算法利用魚(yú)群的覓食、聚群和追尾行為,從構(gòu)造單條魚(yú)的底層行為做起,通過(guò)魚(yú)群中個(gè)體的局部尋優(yōu),達(dá)到全局最優(yōu)值在群體中凸顯的目的。人工魚(yú)群算法具有較強(qiáng)的克服局部極值、取得全局極值的能力,并且算法中只使用目標(biāo)函數(shù)值,無(wú)需目標(biāo)函數(shù)的梯度等特殊信息,對(duì)搜索空間具有一定的自適應(yīng)能力。
人工魚(yú)群算法的出現(xiàn)為解決尋優(yōu)問(wèn)題提供新的具有競(jìng)爭(zhēng)力的求解算法,但是其強(qiáng)大的全局搜索能力可能會(huì)使之漏掉最優(yōu)個(gè)體而且搜索的隨機(jī)性,也使得求解精度不高。針對(duì)這一問(wèn)題,本文將基于共享機(jī)制的小生境技術(shù)[17]引入人工魚(yú)群算法,小生境技術(shù)可以維持樣本個(gè)體的多樣性從而避免最優(yōu)個(gè)體的流失。具體算法是將每1代個(gè)體劃分為若干類,每個(gè)類中選出若干適應(yīng)度較大的個(gè)體作為1個(gè)類的優(yōu)秀代表組成1個(gè)群,再在種群中以及不同種群中之間雜交、變異產(chǎn)生新一代個(gè)體群,同時(shí)選擇分享機(jī)制完成任務(wù)?;谶@種小生境的人工魚(yú)群算法可以更好的保持個(gè)體的多樣性,同時(shí)具有很強(qiáng)的全局尋優(yōu)能力。
由于基本人工魚(yú)群算法的主體循環(huán)中僅選擇追尾、聚群和覓食3種行為中的1種執(zhí)行,這使得優(yōu)化結(jié)果停滯不前或者錯(cuò)過(guò)較優(yōu)解的概率增大,優(yōu)化結(jié)果不理想。本文對(duì)魚(yú)群算法在循環(huán)主體處進(jìn)行改進(jìn),提出一種并行人工魚(yú)群算法,進(jìn)一步降低錯(cuò)過(guò)較優(yōu)解的概率。在初始化后直接分2條路徑執(zhí)行:一條路徑執(zhí)行追尾行為,其中覓食行為設(shè)置為隨機(jī)行為;另一條路徑執(zhí)行聚群行為,同樣設(shè)置覓食行為為隨機(jī)行為。最后比較兩者的適應(yīng)值,取最優(yōu)的結(jié)果,記錄于公告板,同時(shí)更新個(gè)體,繼續(xù)迭代尋優(yōu)。圖1所示為小生境并行人工魚(yú)群算法PAFSA的流程圖。
引入小生境共享機(jī)制的基本思想是:通過(guò)反映個(gè)體之間相似程度的共享函數(shù)來(lái)調(diào)節(jié)群體中各個(gè)個(gè)體的適應(yīng)度,使得在這之后的群體進(jìn)化過(guò)程中,算法能夠依據(jù)這個(gè)調(diào)整后的新適應(yīng)度來(lái)進(jìn)行選擇運(yùn)算,以維持群體的多樣性,創(chuàng)造出小生境的進(jìn)化環(huán)境。共享函數(shù)是表示群體中2個(gè)個(gè)體之間密切關(guān)系程度的1個(gè)函數(shù),表示個(gè)體i和j之間的關(guān)系,可記為s(i, j)。共享度是某個(gè)個(gè)體在群體中共享程度的一種度量,它定義為該個(gè)體與群體內(nèi)其它各個(gè)個(gè)體之間的共享函數(shù)值之和,用S表示:
其中:xi為樣本當(dāng)前狀態(tài);fsh(xi)為xi的共享適應(yīng)度;f(xi)為 xi的適應(yīng)度;n為種群個(gè)數(shù)。依據(jù)式(6)和式(7)調(diào)整各個(gè)個(gè)體的適應(yīng)度,由于每個(gè)個(gè)體的更新比例是由其適應(yīng)度來(lái)控制的,所以,這種調(diào)整適應(yīng)度的方法就能夠限制群體中個(gè)別個(gè)體大量增加,從而維護(hù)群體的多樣性,并造就一種小生境的進(jìn)化環(huán)境,防止流失最優(yōu)個(gè)體的情況。
圖1 小生境并行人工魚(yú)群算法PAFSA流程圖Fig.1 Flow diagram of PAFSA based on niche sharing mechanism
為檢驗(yàn)PAFSA算法的性能,選取以下2個(gè)典型的測(cè)試函數(shù)進(jìn)行算法性能測(cè)試。
測(cè)試函數(shù)1:Goldstein-Price(GP)函數(shù)(n=2)。
該函數(shù)在定義域范圍內(nèi)的全局最小值為 3,最優(yōu)點(diǎn)為(0,-1)。其三維函數(shù)圖像如圖2所示。
測(cè)試函數(shù)2:Rastrigin(RA)函數(shù)(n=2)。
該函數(shù)的表達(dá)式包含多項(xiàng)式及典型三角函數(shù),其在定義域范圍內(nèi)的全局最小值為-2,最優(yōu)點(diǎn)為(0,0)。其三維函數(shù)圖像如圖3所示。
實(shí)驗(yàn)中引入基本粒子群優(yōu)化算法 PSO,將基本AFSA與PAFSA 2個(gè)算法的結(jié)果進(jìn)行比較。均選取函數(shù)GP和函數(shù)RA作為測(cè)試函數(shù),通過(guò)進(jìn)行30次獨(dú)立運(yùn)行得到平均最小函數(shù)值和最小值,實(shí)驗(yàn)結(jié)果如表 1所示。
圖2 Goldstein-Price(GP)函數(shù)圖像Fig.2 Image of Goldstein-Price (GP) function
圖3 Rastrigin(RA)函數(shù)圖像Fig.3 Image of Rastrigin (RA) function
表1 PAFSA與PSO和AFSA算法優(yōu)化結(jié)果比較Table 1 Comparison of optimized results of PAFSA, PSO and FASA
表1表明:PAFSA的優(yōu)化實(shí)驗(yàn)結(jié)果比 AFSA和PSO的穩(wěn)定,平均最小值和獨(dú)立運(yùn)行最小值更接近理論最優(yōu)值。圖4和圖5所示為上述3種優(yōu)化算法分別對(duì)2個(gè)測(cè)試函數(shù)的1次尋優(yōu)過(guò)程對(duì)比截圖,顯示各自的收斂過(guò)程。從圖4和圖5可以看出:PAFSA算法在搜索最優(yōu)解質(zhì)量方面要優(yōu)于AFSA和PSO,即PAFSA能在較少的迭代次數(shù)下較快地找出全局最優(yōu)解,具有較好的收斂性。
圖4 對(duì)Goldstrein-Price函數(shù)的優(yōu)化過(guò)程Fig.4 Goldstrein-Price function optimization processes of PAFSA, PSO and AFSA
圖5 對(duì)Rastrigin函數(shù)的優(yōu)化過(guò)程Fig.5 Rastrigin Function optimization processes of PAFSA, PSO and AFSA
將PAFSA產(chǎn)生的初始種群作為SVM參數(shù),代入這些參數(shù)進(jìn)行 SVM 模型訓(xùn)練和測(cè)試。文中將語(yǔ)音詞庫(kù)分為2部分并分別作為訓(xùn)練樣本和測(cè)試樣本,試驗(yàn)后返回一系列訓(xùn)練樣本識(shí)別率。然后,通過(guò)聚群、追尾、覓食等行為尋優(yōu)產(chǎn)生下一代參數(shù)種群,再利用新生子群重復(fù)上述操作。在達(dá)到一定的代數(shù)時(shí),對(duì)尋優(yōu)得到的種群進(jìn)行分析,依據(jù)個(gè)體的共享度調(diào)整對(duì)應(yīng)個(gè)體的適應(yīng)度,再選取最優(yōu)個(gè)體,進(jìn)行迭代,直到滿足人工魚(yú)群算法中設(shè)計(jì)的終止條件為止,并將得到的最優(yōu)參數(shù)、最優(yōu)參數(shù)模型作為最終預(yù)測(cè)模型。圖6所示為PAFSA優(yōu)化SVM參數(shù)流程。
圖6 PAFSA優(yōu)化SVM參數(shù)流程圖Fig.6 Flow diagram of SVM parameters optimization by PAFSA
高斯核函數(shù) SVM 的參數(shù)優(yōu)化可看作是尋找合適的誤差懲罰因子C和核參數(shù)γ,C與γ構(gòu)成的二維數(shù)組,使 SVM 有較好的分類性能,即讓適應(yīng)值最大。運(yùn)用PAFSA在參數(shù)C和γ構(gòu)成的二維平面上尋優(yōu),建模的步驟如下。
步驟1:初始化,產(chǎn)生初始種群,確定SVM參數(shù)向量(C,γ)的范圍及算法中其他參數(shù)值。
步驟2:代入SVM模型,利用初始種群對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,由訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行測(cè)試,將總體測(cè)試樣本識(shí)別率轉(zhuǎn)換成該模型的適應(yīng)值。
步驟3:依據(jù)適應(yīng)值,對(duì)(C,γ)進(jìn)行覓食、聚群、追尾等行為進(jìn)行尋優(yōu),產(chǎn)生下一代參數(shù)(C,γ)種群。
步驟4:利用得到的子代參數(shù)(C,γ)種群,重新對(duì)SVM 進(jìn)行訓(xùn)練和測(cè)試并計(jì)算相應(yīng)的適應(yīng)值,進(jìn)行判斷,若達(dá)到一定的迭代次數(shù),則依據(jù)個(gè)體的共享度調(diào)整對(duì)應(yīng)個(gè)體的適應(yīng)度,再選取最優(yōu)個(gè)體。
步驟5:運(yùn)用已得到的子代參數(shù),重新對(duì)SVM進(jìn)行訓(xùn)練和測(cè)試并計(jì)算相應(yīng)的適應(yīng)值,進(jìn)行判斷,若滿足人工魚(yú)群算法中訓(xùn)練停止準(zhǔn)則,則轉(zhuǎn)到步驟 5;否則,返回步驟3繼續(xù)執(zhí)行。
步驟6:結(jié)束訓(xùn)練,此時(shí)得到的參數(shù)(C,γ)為最終模型的參數(shù)。
實(shí)驗(yàn)中,直接把由采樣系統(tǒng)得到的語(yǔ)音數(shù)據(jù)文件作為處理對(duì)象,所采用的語(yǔ)音樣本為孤立詞。語(yǔ)音信號(hào)采樣頻率為11.02 kHz,幀長(zhǎng)N為256點(diǎn),幀移M為128點(diǎn)。
實(shí)驗(yàn)使用9人在不同信噪比(SNR)(0,5,10,15,20,25和30 dB,無(wú)噪音)下的發(fā)音作為訓(xùn)練數(shù)據(jù)庫(kù),噪聲為常見(jiàn)的Gaussian白噪聲,其他噪聲可通過(guò)語(yǔ)音識(shí)別系統(tǒng)的前端預(yù)處理濾波器濾除掉。語(yǔ)音樣本數(shù)據(jù)的詞匯量分別為10,20,30,40和50個(gè)詞,每人每個(gè)詞發(fā)音3次,因此,整個(gè)數(shù)據(jù)集在不同SNR下分別有10,20,30,40和50個(gè)類別,對(duì)應(yīng)的訓(xùn)練樣本分別有270,540,810,1 080和1 350個(gè)。測(cè)試樣本由另外7人在相應(yīng)的SNR和詞匯量下,對(duì)每個(gè)詞發(fā)音3次得到,對(duì)應(yīng)的測(cè)試樣本分別有210,420,630,840和1 050個(gè)。
實(shí)驗(yàn)輸入的語(yǔ)音特征為改進(jìn)的 MFCC特征參數(shù)(MFDWCs)[18],該特征的提取符合人耳的聽(tīng)覺(jué)特性,具有較好的魯棒性。表2所示為相同實(shí)驗(yàn)條件、不同信噪比和不同詞匯量下,基于PAFSA,AFSA的SVM語(yǔ)音識(shí)別正確率與HMM的識(shí)別率比較結(jié)果。表3所示是與表2相對(duì)應(yīng)的錯(cuò)分樣本數(shù)。
觀察實(shí)驗(yàn)結(jié)果可知:基于本文提出的 PAFSASVM 模型語(yǔ)音識(shí)別結(jié)果與基本 AFSA-SVM 模型、HMM 識(shí)別結(jié)果相比較,在不同信噪比和不同詞匯量下,識(shí)別率均有不同程度提高,即錯(cuò)分樣本數(shù)均有不同程度減少,尤其在信號(hào)的信噪比較低時(shí),PAFSA-SVM錯(cuò)分?jǐn)?shù)比HMM均有減少,最大減少95個(gè)(5 dB 50詞和10 dB 50詞條件下)。這說(shuō)明SVM具有很強(qiáng)的抗噪能力,進(jìn)一步表明本文提出的小生境共享機(jī)制并行人工魚(yú)群算法是一個(gè)較為有效的 SVM參數(shù)優(yōu)化方法,可使 SVM 具有良好的推廣能力和較好的魯棒性。
表2 基于AFSA,PAFSA的SVM與HMM語(yǔ)音識(shí)別率比較Table 2 Comparison of speech recognition rates of SVM based on AFSA, PAFSA and HMM %
表3 基于AFSA,PAFSA的SVM與HMM語(yǔ)音識(shí)別錯(cuò)分樣本數(shù)Table 3 Comparison of error classification samples based on AFSA, PAFSA and HMM 個(gè)
(1) 提出一種并行的人工魚(yú)群算法PAFSA,并引入小生境共享機(jī)制技術(shù),降低錯(cuò)過(guò)較優(yōu)解的概率。通過(guò)對(duì) PAFSA算法中的個(gè)體的新局部最優(yōu)位置以及全局最優(yōu)位置應(yīng)用小生境,以維持樣本個(gè)體的多樣性,避免最優(yōu)個(gè)體的流失,保證了PAFSA的求解精度。
(2) 采用測(cè)試函數(shù)對(duì)該算法進(jìn)行測(cè)試和比較,驗(yàn)證了其有效性。運(yùn)用該算法對(duì)高斯核支持向量機(jī)參數(shù)組(C,γ) 進(jìn)行優(yōu)化,并將其用到一個(gè)非特定人、孤立詞、中等詞匯量的語(yǔ)音識(shí)別系統(tǒng)中,通過(guò)與基于普通AFSA-SVM和HMM的語(yǔ)音識(shí)別結(jié)果進(jìn)行比較,證明PAFSA是一種較好的面向語(yǔ)音識(shí)別的抗噪SVM參數(shù)優(yōu)化算法,同時(shí)也說(shuō)明 SVM 在語(yǔ)音識(shí)別領(lǐng)域?qū)?huì)有廣闊的發(fā)展前景。
[1] Cortes C, Vapnik V. Support vector networks [J]. Machine Learning, 1995, 20(3): 273-297.
[2] 黃景德, 郝學(xué)良, 王明. 基于HMM的多態(tài)系統(tǒng)狀態(tài)識(shí)別模型研究[J]. 測(cè)試技術(shù)學(xué)報(bào), 2012, 26(2): 154-157.Huang Jingde, Hao Xueliang, Wang Ming. Study of multi-state system states recognition model based on HMM[J]. Journal of Test and Measurement Technology, 2012, 26(2): 154-157.
[3] 毛健, 趙紅東, 姚婧婧. 人工神經(jīng)網(wǎng)絡(luò)的發(fā)展及應(yīng)用[J]. 電子設(shè)計(jì)工程, 2011, 19(24): 62-65.MAO Jian, ZHAO Hongdong, YAO Jingjing. Application and prospect of artificial neural network[J]. Electronic Design Engineering, 2011, 19(24): 62-65.
[4] Arun K M, Gopal M. Reduced one-against-all method for multiclass SVM classification[J]. Expert Systems with Application, 2011, 38: 14238-14248. Acta Electronica Sinica,2010, 38(7): 1626-1633.
[5] Domenico C, Rostita G. Kernel based support vector machine via semidefinite programming: Application to medical diagnosis[J].Computer & Operations Research, 2010, 37: 1389-1394.
[6] 呂卓逸, 賈克斌, 蕭允治. 低復(fù)雜度的快速降尺寸視頻轉(zhuǎn)碼算法[J]. 通信學(xué)報(bào), 2012, 33(1): 160-166.LV Zhuoyi, JIA Kebin, XIAO Yunzhi. Fast and low-complexity video down-sizing transcoder[J]. Journal on Communications,2012, 33(1): 160-166.
[7] 蘇毅, 吳文虎, 鄭方, 等. 基于支持向量機(jī)的語(yǔ)音識(shí)別研究[C]//第六屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集, 深圳: 哈爾濱工業(yè)大學(xué), 2001: 223-226.SU Yi, WU Wenhu, ZHENG Fang, et al. Research of speech recognition based on support vector machine[C]// Proceedings of Sixth China Human-machine Speech Communication Conference, Shenzhen: Harbin Institute of Technology, 2001:223-226.
[8] XIE Xiang, KUANG Jingming. Mandarin digits speech recognition using support vector machines[J]. Journal of Beijing Institute of technology, 2005, 14(1): 9-12.
[9] Liu J, Wang Z, Xiao X. A hybrid SVM/DDBHMM decision fusion modeling for robust continuous digital speech recognition[J]. Pattern Recognition Letters, 2007, 28(8):912-920.
[10] 李攀, 楊瑋龍, 厲劍. 基于 DTW/SVM 的語(yǔ)音識(shí)別系統(tǒng)在DSP中的實(shí)現(xiàn)[J]. 電聲技術(shù), 2006(9): 40-44.LI Pan, YANG Weilong, LI Jian. DSP Implementation of speech recognition based on DTW/SVM[J]. Audio Engineering, 2006(9):40-44.
[11] Solera-Ure?a R, Martín-Iglesias D, Gallardo-Antolín A, et al.Robust ASR using support vector machines[J]. Speech Communication, 2007, 49(4): 253-267.
[12] Maldonado S, Weber R, Basak J. Simultaneous feature selection and classification using kernel-penalized support vector machines[J]. Information Sciences, 2011, 181(1): 115-128.
[13] Huang C M, Lee Y J, Dennis K, et al. Model selection for support vector machines via uniform design[J]. Computational Statistics & Data Analysis, 2007, 52(1): 335-346.
[14] 鄧乃楊, 田英杰. 支持向量機(jī)-理論、算法與拓展[M]. 北京:科學(xué)出版社, 2009: 45-48.DENG Nanyang, TIAN Yingjie. Support vector machine- theory,algorithms and expansion[M]. Beijing: Science Press, 2009:45-48.
[15] Wang Z P, Zhao L, Zou C R. Support vector machines for emotion recognition in Chinese speech[J]. Journal of Southeast University, 2003, 19(4): 307-310.
[16] TANG Tao, GUO Qing, YANG Mingchuan. Support vector machine based particle swarm optimization localization algorithm in WSN[J]. Journal of Convergence Information Technology, 2012, 7(1): 497-503.
[17] 秦涵書, 魏延, 曾紹華. 一種基于小生境遺傳算法的 SVM參數(shù)優(yōu)化方法[J]. 重慶理工大學(xué)學(xué)報(bào), 2011, 25(12): 89-93.QIN Hanshua, WEI Yana, ZENG Shaohua. Parameter optimization of SVM for classification based on NGA[J].Journal of Chongqing University of Technology: Natural Science,2011, 25(12): 89-93.
[18] BAI Jing, ZHANG Xueying, GUO Yueling. Different inertia weight PSO algorithm optimizing SVM kernel parameters applied in a speech recognition system[C]// International Conference on Mechatronics and Automation, Changchun: IEEE,2009: 4754-4759.