孫護(hù)軍
(西安航空學(xué)院電子工程學(xué)院 西安 710077)
基于能量的端點(diǎn)檢測(cè)、基于墑的語(yǔ)音端點(diǎn)檢測(cè)、基于倒譜的語(yǔ)音端點(diǎn)檢測(cè)等,都屬于傳統(tǒng)的語(yǔ)音端點(diǎn)檢測(cè)算法,因?yàn)樗崛〉恼Z(yǔ)音特征量比較單一,所以檢測(cè)計(jì)算結(jié)果容易出現(xiàn)較大的誤差,而基于組合特征的語(yǔ)音端點(diǎn)檢測(cè)算法,雖然可以在一定程度上提高檢測(cè)計(jì)算的精準(zhǔn)性,但是容易出現(xiàn)冗余特征量造成干擾。隨著對(duì)語(yǔ)音端點(diǎn)檢測(cè)算法研究的不斷深入及長(zhǎng)期實(shí)踐,發(fā)現(xiàn)運(yùn)行小波神經(jīng)網(wǎng)絡(luò)算法完成語(yǔ)音端點(diǎn)檢測(cè)計(jì)算,存在較小的誤差,具有較高的推廣應(yīng)用價(jià)值。
語(yǔ)音端點(diǎn)檢測(cè)的本質(zhì)含義,是通過識(shí)別輸入系統(tǒng)的含噪語(yǔ)音信號(hào),以噪聲門限閾值為主要依據(jù),通過對(duì)比含噪語(yǔ)音信號(hào)與其之間的不同,進(jìn)而判斷出語(yǔ)音信號(hào)的正確起始位置,得到有價(jià)值的語(yǔ)音信息,實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的快速處理及傳遞。基于小波神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)主要由語(yǔ)音信號(hào)預(yù)處理、語(yǔ)音信號(hào)特征量提取以及神經(jīng)網(wǎng)絡(luò)處理三部分組成,在構(gòu)建運(yùn)算模型時(shí),需要對(duì)這三部分進(jìn)行詳細(xì)分析。
語(yǔ)音預(yù)處理是進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)計(jì)算的第一步工作,是準(zhǔn)確識(shí)別語(yǔ)音的基礎(chǔ)。人在說(shuō)話時(shí)所發(fā)出的語(yǔ)音信號(hào)屬于模擬信號(hào),不滿足計(jì)算機(jī)處理信號(hào)要求,難以實(shí)現(xiàn)對(duì)其直接的識(shí)別和處理,只有將人的說(shuō)話語(yǔ)音信號(hào)轉(zhuǎn)化為數(shù)字信號(hào),才符合計(jì)算機(jī)處理語(yǔ)音信號(hào)的要求,所以,便需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,完成語(yǔ)音信號(hào)的A/D變換,將轉(zhuǎn)換得到的數(shù)字信號(hào)進(jìn)行存儲(chǔ)和處理,為語(yǔ)音信號(hào)的準(zhǔn)確識(shí)別提供方便[1]。在得到轉(zhuǎn)換后的數(shù)字語(yǔ)音信號(hào)之后,就需要從其中提取特征量,將其作為語(yǔ)音識(shí)別的主要依據(jù)。因?yàn)檎Z(yǔ)音信號(hào)中的語(yǔ)音段和非語(yǔ)音段所反映出來(lái)的信號(hào)特征是不一樣的,所以特征值的提取會(huì)直接影響到語(yǔ)音端點(diǎn)檢測(cè)計(jì)算結(jié)果,僅僅是在信噪比較高的情況下,可以通過語(yǔ)音信號(hào)能量特征分辨出語(yǔ)音段和非語(yǔ)音段,而信噪比較低時(shí),很難準(zhǔn)確將兩者劃分開,所以便需要提取語(yǔ)音信號(hào)的特征量,明確語(yǔ)音信號(hào)和噪聲信號(hào)之間的不同,準(zhǔn)確分辨出語(yǔ)音段和非語(yǔ)音段。在得到語(yǔ)音信號(hào)特征量之后,便需要通過小波神經(jīng)網(wǎng)絡(luò)算法對(duì)采集到的語(yǔ)音信號(hào)進(jìn)行計(jì)算處理,這也是語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)的核心工作,計(jì)算模型可以在不設(shè)定噪聲門限閾值的情況下,根據(jù)所提取的特征值判斷是否是語(yǔ)音信號(hào)段,進(jìn)而有效提高了語(yǔ)音端點(diǎn)檢測(cè)計(jì)算的準(zhǔn)確性[2]。
圖1 基于小波神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)系統(tǒng)結(jié)構(gòu)
語(yǔ)音信號(hào)在傳播過程中經(jīng)常存在噪聲信號(hào),容易對(duì)語(yǔ)音信號(hào)的高效、準(zhǔn)確處理造成干擾,嚴(yán)重影響了語(yǔ)音信號(hào)的處理結(jié)果,所以在進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)計(jì)算的時(shí)候,就需要對(duì)語(yǔ)音信號(hào)和噪聲信號(hào)進(jìn)行綜合分析。在利用小波神經(jīng)網(wǎng)絡(luò)模式構(gòu)建語(yǔ)音端點(diǎn)檢測(cè)計(jì)算模型的時(shí)候,是以語(yǔ)音與噪聲的頻域差異和語(yǔ)音與噪聲的統(tǒng)計(jì)自相似性作為理論依據(jù)的,通過了解并區(qū)分兩者之間的不同,來(lái)實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)端點(diǎn)檢測(cè)的準(zhǔn)確計(jì)算。
高斯白噪聲在自然界最為常見,也是語(yǔ)音信號(hào)在傳播過程中必然出現(xiàn)的一種噪聲信號(hào),該類型噪聲具有平穩(wěn)隨機(jī)性特點(diǎn),通過比較語(yǔ)音信號(hào)與高斯白噪聲信號(hào)的頻域差異,可以為語(yǔ)音端點(diǎn)檢測(cè)計(jì)算提供可靠依據(jù)。對(duì)采樣得到的語(yǔ)音信號(hào)與噪聲信號(hào)頻譜進(jìn)行觀察,可以發(fā)現(xiàn)在兩者的頻譜中,能量分布及波動(dòng)幅度情況存在較大差別,其中語(yǔ)音信號(hào)頻譜中能量多集中在0~4kHz的低頻區(qū),能量波動(dòng)起伏變化劇烈,最大值和最小值之間存在較大差距[3]。而高斯白噪聲信號(hào)頻譜中的能量,在各個(gè)頻段的分布都是比較均勻的,沒有出現(xiàn)大幅度波動(dòng)變化,最大值和最小值之間的差值較小。所以,可以根據(jù)語(yǔ)音和噪聲的頻域差異,找出語(yǔ)音信號(hào)中的噪聲,準(zhǔn)確分辨出語(yǔ)音信號(hào)中的語(yǔ)音段和非語(yǔ)音段,使語(yǔ)音端點(diǎn)檢測(cè)的精準(zhǔn)性得到顯著提升。
語(yǔ)音信號(hào)的統(tǒng)計(jì)自相似性具有隨機(jī)性,語(yǔ)音信號(hào)的波形變化不會(huì)影響到其自相似性,即通過小波轉(zhuǎn)換之后,在一定時(shí)域內(nèi),可以發(fā)現(xiàn)語(yǔ)音信號(hào)小波系數(shù)的統(tǒng)計(jì)特征是一模一樣的,此時(shí)可以用1/f來(lái)表示語(yǔ)音信號(hào)的統(tǒng)計(jì)自相似性。在對(duì)語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè)的時(shí)候,可以根據(jù)語(yǔ)音信號(hào)的這種特點(diǎn),將其與噪聲信號(hào)區(qū)分開,以小波系數(shù)的方差作為辨別語(yǔ)音信號(hào)和噪聲信號(hào)的主要依據(jù),明確兩者統(tǒng)計(jì)自相似性之間的不同,進(jìn)而實(shí)現(xiàn)語(yǔ)音識(shí)別的目的。通過對(duì)語(yǔ)音信號(hào)和噪聲信號(hào)的時(shí)域波形進(jìn)行分析,可以發(fā)現(xiàn)兩者之間具有顯著差異,采用小波分解法對(duì)兩種信號(hào)的時(shí)域波形進(jìn)行處理之后,可以發(fā)現(xiàn)處理后語(yǔ)音信號(hào)幅度雖然在原來(lái)的基礎(chǔ)上有所變大,但是其統(tǒng)計(jì)自相似性卻沒有發(fā)生變化,與原來(lái)的特征完全相同,其時(shí)域波形變化滿足1/f。同樣道理,噪聲信號(hào)的時(shí)域波形在經(jīng)過小波分解處理后,其統(tǒng)計(jì)特征不會(huì)隨著波形的變化而發(fā)生改變,仍然與處理之前的保持一致[4]。
因?yàn)檎Z(yǔ)音信號(hào)和噪聲信號(hào)在經(jīng)過小波分解處理后,其時(shí)域波形的統(tǒng)計(jì)自相似性都負(fù)符合1/f特點(diǎn),所以其統(tǒng)計(jì)特性在時(shí)域內(nèi)不隨波形的擴(kuò)充或壓縮而變化,在對(duì)統(tǒng)計(jì)自相似性的平均值和協(xié)方差進(jìn)行分析之后,依據(jù)小波基理論,以互為獨(dú)立的零均值為依據(jù),可以構(gòu)建數(shù)學(xué)模型,來(lái)區(qū)分語(yǔ)音信號(hào)和噪聲信號(hào)兩者之間的不同,語(yǔ)音端點(diǎn)檢測(cè)計(jì)算結(jié)果的準(zhǔn)確性將會(huì)得到顯著提高[5]。
在使用小波神經(jīng)網(wǎng)絡(luò)算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)計(jì)算時(shí),應(yīng)該參照基礎(chǔ)理論依據(jù),提取語(yǔ)音信號(hào)中的特征量,并選擇滿足計(jì)算要求的最為合適的特征量,構(gòu)建相應(yīng)的計(jì)算模型,按照標(biāo)準(zhǔn)、規(guī)范的運(yùn)算程序進(jìn)行計(jì)算,得到最終檢測(cè)結(jié)果。
語(yǔ)音特征量的提取是語(yǔ)音端點(diǎn)檢測(cè)的首要工作,是確保語(yǔ)音識(shí)別精準(zhǔn)性的基礎(chǔ)和前提,從語(yǔ)音信號(hào)中提取相應(yīng)的特征量之后,要從中選擇最為合適的語(yǔ)音特征量,既要保證語(yǔ)音特征的全面性,又要避免對(duì)語(yǔ)音識(shí)別造成干擾,所以在使用小波神經(jīng)網(wǎng)絡(luò)算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)時(shí),就必須要做好語(yǔ)音特征量的提取與選擇工作。
1)語(yǔ)音特征量的提取
語(yǔ)音特征量的提取是分三步完成的,首先要對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,其次再采用小波分解法對(duì)分幀處理后的語(yǔ)音信號(hào)進(jìn)行二次處理,最后才可以從中提取語(yǔ)音特征量。在不同時(shí)間段,語(yǔ)音信號(hào)的特征量是存在一定差異的,隨著時(shí)間的推移,語(yǔ)音信號(hào)的穩(wěn)定性將會(huì)被打破,其特征量也會(huì)發(fā)生相應(yīng)的變化,語(yǔ)音信號(hào)的特征量?jī)H僅可以在較短時(shí)間內(nèi)保持不變,該時(shí)間段一般情況下為20ms,此時(shí),可以采用分幀處理法,將該段時(shí)間定義為語(yǔ)音信號(hào)的一幀,認(rèn)定一幀內(nèi)語(yǔ)音信號(hào)的特征量保持一致,然后以一幀作為單位,對(duì)語(yǔ)音信號(hào)的特征量進(jìn)行逐幀分析[6]。在對(duì)語(yǔ)音信號(hào)進(jìn)行逐幀分析的時(shí)候,可以采用小波分解法,即將每幀語(yǔ)音信號(hào)分為5層小波,如果用函數(shù)關(guān)系則可以表示為
此時(shí),語(yǔ)音信號(hào)可以分解為高頻空間和低頻空間,每一個(gè)高頻空間又可以進(jìn)行再次分解,得到更低一級(jí)的高頻空間和低頻空間,然后依次向下對(duì)每一級(jí)的高頻空間進(jìn)行分解,經(jīng)過5次小波分解處理之后,便可以由原有的一個(gè)語(yǔ)音信號(hào)得到6個(gè)不同頻率的信號(hào),而此時(shí)得到的信號(hào)頻率分量總個(gè)數(shù)一共有10個(gè),用分解之后得到的10個(gè)語(yǔ)音信號(hào)頻率分量,便可以得到完整的信號(hào)頻譜。在得到語(yǔ)音信號(hào)完整的頻譜之后,依據(jù)語(yǔ)音與噪聲的頻域差異理論知識(shí),可以知道語(yǔ)音信號(hào)頻譜中能量多集中在0~4kHz的低頻區(qū),能量波動(dòng)起伏變化劇烈,而噪聲信號(hào)頻譜中的能量,則均勻的分布在各個(gè)頻段中,數(shù)值變化幅度較小,此時(shí)可以用公式來(lái)表示各層小波子帶系數(shù)的平均能量,在公式中和N分別表示小波系數(shù)和小波系數(shù)個(gè)數(shù)。因?yàn)榻?jīng)過小波分解后可以得到6個(gè)不同頻率的信號(hào),所以便存在6個(gè)小波子帶,將具體數(shù)值代入公式后,對(duì)各個(gè)小波子帶平均能量的方差進(jìn)行計(jì)算,可以得到,其中 σ2表示各個(gè)小波子帶平均能量的方差,E表示不同小波子帶的平均能量,此時(shí)便可以從語(yǔ)音信號(hào)中提取特征量,經(jīng)過計(jì)算后,每幀語(yǔ)音信號(hào)一共可以得到8個(gè)特征矢量[7]。
2)語(yǔ)音特征量的選擇
得到語(yǔ)音特征量之后,并不意味著所有的語(yǔ)音特征量都可以用于語(yǔ)音端點(diǎn)檢測(cè)計(jì)算中,一些具有互補(bǔ)性的語(yǔ)音特征量對(duì)語(yǔ)音端點(diǎn)檢測(cè)具有幫助作用,但同時(shí)也會(huì)存在一些無(wú)用、多余的語(yǔ)音特征量,不僅無(wú)法對(duì)語(yǔ)音端點(diǎn)檢測(cè)具有幫助作用,還會(huì)對(duì)其造成干擾,影響計(jì)算結(jié)果的準(zhǔn)確性。為了提高語(yǔ)音端點(diǎn)檢測(cè)計(jì)算效率和精準(zhǔn)性,所以便需要從得到的8個(gè)特征矢量中選擇具有利用價(jià)值的語(yǔ)音特征量,以最具代表性的語(yǔ)音特征量為計(jì)算依據(jù),來(lái)完成語(yǔ)音端點(diǎn)檢測(cè)。語(yǔ)音特征量的選取過程具體分為四個(gè)步驟,第一步先計(jì)算得到與8個(gè)特征矢量相照應(yīng)的矩陣,第二步利用不同特征矢量矩陣的特征值和特征向量,對(duì)特征矢量相照應(yīng)的矩陣進(jìn)行變化,第三步按照從大到小的順序,對(duì)變換之后的特征矢量矩陣中的特征值進(jìn)行排序,最后一步,將排序之后得到的語(yǔ)音信號(hào)特征值序列的前幾個(gè)特征量作為代表性特征量,以此作為依據(jù),實(shí)現(xiàn)語(yǔ)音端點(diǎn)檢測(cè)計(jì)算[8~10]。
在提取語(yǔ)音特征量,并從中選取具有代表性的特征量數(shù)據(jù)之后,便可以利用小波神經(jīng)網(wǎng)絡(luò)算法構(gòu)建語(yǔ)音端點(diǎn)檢測(cè)模型,并按照相應(yīng)的步驟進(jìn)行計(jì)算,得到較為準(zhǔn)確的語(yǔ)音識(shí)別結(jié)果。
1)小波神經(jīng)網(wǎng)絡(luò)
在對(duì)小波神經(jīng)網(wǎng)絡(luò)算法進(jìn)行分析的時(shí)候,可以以徑向基神經(jīng)網(wǎng)絡(luò)為代表。徑向基神經(jīng)網(wǎng)絡(luò)又叫做RBF神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)結(jié)構(gòu)形式為前向網(wǎng)絡(luò),基礎(chǔ)理論為非線性函數(shù)的無(wú)線逼近理論,具體結(jié)構(gòu)組成分為輸入層、隱藏層和輸出層三部分。與BP神經(jīng)網(wǎng)絡(luò)相比,RBF神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近能力、分類能力和學(xué)習(xí)速度等特性都比較良好,其中BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示意圖如圖2所示,在RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,信號(hào)源節(jié)點(diǎn)是輸入層的核心組成,RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的最大不同在隱含層部分,在RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,隱含層所用到的變換函數(shù)類型為徑向基函數(shù),這也是RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的主要優(yōu)勢(shì)所在。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示意圖
2)小波神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化
在RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,影響其分類性能的因素主要有三種,分別為RBF神經(jīng)網(wǎng)絡(luò)的參靈敏、隱含節(jié)點(diǎn)的中心以及隱含節(jié)點(diǎn)的寬度。采用小波神經(jīng)網(wǎng)絡(luò)算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)計(jì)算時(shí),需要從這三種因素進(jìn)行考慮,采用遺傳算法對(duì)小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行全局搜索,以此來(lái)實(shí)現(xiàn)對(duì)其參數(shù)的優(yōu)化,具體優(yōu)化流程如圖3所示。
圖3 RBF神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化流程
3)語(yǔ)音端點(diǎn)檢測(cè)具體過程
小波神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化完畢之后,便可以進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),具體分為五步來(lái)實(shí)現(xiàn)。第一步先將RBF神經(jīng)網(wǎng)絡(luò)參數(shù)、小波分析和遺傳算法等各項(xiàng)參數(shù)進(jìn)行初始化處理。第二步將選取的有效語(yǔ)音信號(hào)特征量輸入計(jì)算模型中,經(jīng)過分析之后得到語(yǔ)音段和噪聲段,并用不同數(shù)字對(duì)兩者進(jìn)行標(biāo)注,將其區(qū)分開,完成訓(xùn)練樣本的構(gòu)建。第三步對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使其可以根據(jù)輸入的語(yǔ)音特征量,正確分辨出語(yǔ)音段和噪聲段,在這一步檢測(cè)過程中,對(duì)RBF神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化至關(guān)重要,只有經(jīng)過不斷優(yōu)化之后,才可以將實(shí)際輸出值和理論輸出值之間的差值降到最低。第四步需要對(duì)計(jì)算模型的性能進(jìn)行檢驗(yàn),對(duì)RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練之后,設(shè)定一個(gè)門限值作為區(qū)分語(yǔ)音段和噪聲段的依據(jù),比較人工標(biāo)注結(jié)果和實(shí)際輸出結(jié)果,判斷計(jì)算模型是否精準(zhǔn)可靠。如果此時(shí)兩者之間存在較大出入,則認(rèn)為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練工作失敗,需要進(jìn)行二次訓(xùn)練。最后,在檢測(cè)計(jì)算模型具有良好的精準(zhǔn)性之后,便可以對(duì)語(yǔ)音端點(diǎn)進(jìn)行檢測(cè),將語(yǔ)音信號(hào)輸入模型中,提取并選擇有效的特征量,經(jīng)過分析后得到具體檢測(cè)結(jié)果,根據(jù)輸出的結(jié)果區(qū)分語(yǔ)音段和非語(yǔ)音段,實(shí)現(xiàn)語(yǔ)音識(shí)別的目的。
為了對(duì)基于小波神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)算法的精準(zhǔn)性進(jìn)行檢驗(yàn),從TIMIT語(yǔ)音庫(kù)中提取部分?jǐn)?shù)據(jù)進(jìn)行了仿真實(shí)驗(yàn)。在對(duì)語(yǔ)音信號(hào)進(jìn)行分析和標(biāo)記時(shí),所用方法分為Cool Edit Pro和手式法,并設(shè)置四種不同噪聲條件,信噪比分別為15dB、10dB、-0dB、-5dB,對(duì)計(jì)算模型的精準(zhǔn)性進(jìn)行測(cè)試。為了保證語(yǔ)音端點(diǎn)檢測(cè)結(jié)果的準(zhǔn)確性,在保證其他實(shí)驗(yàn)條件不變的情況下,分別選擇小波分析+RBF神經(jīng)網(wǎng)絡(luò)算法、小波分析+主成分分析+線性分類算法、短時(shí)能量檢測(cè)算法進(jìn)行分別實(shí)驗(yàn),其中第一種算法沒有進(jìn)行主成分分析。并將語(yǔ)音端點(diǎn)檢測(cè)的正確率、虛檢率、漏檢率和檢測(cè)速度作為算法性能的評(píng)價(jià)標(biāo)準(zhǔn)。
經(jīng)過仿真實(shí)驗(yàn),可以得到不同算法語(yǔ)音端點(diǎn)檢測(cè)的正確率。對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析,可以發(fā)現(xiàn)當(dāng)語(yǔ)音信號(hào)中沒有噪聲信號(hào)時(shí),各個(gè)算法得到的語(yǔ)音端點(diǎn)檢測(cè)正確率都是比較高的,當(dāng)語(yǔ)音信號(hào)中存在少量噪聲信號(hào)時(shí),各個(gè)算法得到的語(yǔ)音端點(diǎn)檢測(cè)正確率會(huì)出現(xiàn)不同程度的下降,其中線性檢測(cè)模型已經(jīng)無(wú)法滿足實(shí)際需求,而小波分析+RBF神經(jīng)網(wǎng)絡(luò)算法具有優(yōu)勢(shì)互補(bǔ)特性,端點(diǎn)漏檢率較低,語(yǔ)音端點(diǎn)檢測(cè)正確率下降不明顯,并且還可以消除語(yǔ)音信號(hào)的冗余特征量。同時(shí),小波分析+RBF神經(jīng)網(wǎng)絡(luò)算法和小波分析+主成分分析+線性分類算法的訓(xùn)練時(shí)間有所增長(zhǎng),但是其檢測(cè)性能得到大幅度提高,同時(shí)小波分析+主成分分析+線性分類算法的運(yùn)行時(shí)間要少于小波分析+RBF神經(jīng)網(wǎng)絡(luò)算法,由此可知采用小波分析+主成分分析+線性分類算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)可以得到比較滿意的效果。
基于小波神經(jīng)網(wǎng)絡(luò)的語(yǔ)音端點(diǎn)檢測(cè)算法具有較高的精準(zhǔn)性,彌補(bǔ)了多種傳統(tǒng)算法的不足,經(jīng)過仿真實(shí)驗(yàn)證明,采用小波分析+主成分分析+線性分類算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),其正確性、抗噪性以及魯棒性都得到了明顯提高,具有較高的推廣應(yīng)用價(jià)值,在推動(dòng)我國(guó)語(yǔ)音識(shí)別技術(shù)發(fā)展過程中起到了重要作用。