?
一種改進閾值函數(shù)的EMD-CIIT語音去噪算法
引文格式: 鐘金良,景新幸,楊海燕.一種改進閾值函數(shù)的EMD-CIIT語音去噪算法[J].桂林電子科技大學(xué)學(xué)報,2016,36(1):9-13.
鐘金良,景新幸,楊海燕
(桂林電子科技大學(xué) 信息與通信學(xué)院,廣西 桂林541004)
摘要:為了克服基于傳統(tǒng)經(jīng)驗?zāi)B(tài)分解語音去噪算法在閾值去噪時閾值函數(shù)處理不平滑的缺點,對EMD-CIIT(EMD重復(fù)間隔閾值)語音去噪方法的閾值函數(shù)進行改進,并在Matlab平臺搭建的語音識別系統(tǒng)進行仿真實驗。實驗結(jié)果表明,改進閾值函數(shù)的EMD-CIIT去噪算法具有較高的識別率及良好的魯棒性。
關(guān)鍵詞:語音去噪;EMD;改進閾值
語音信號是一種非線性、非平穩(wěn)的信號。歷年來,學(xué)者們一直致力于研究語音去噪的算法?;谧V減法的語音去噪方法假設(shè)語音信號短時平穩(wěn),其在實際應(yīng)用中有一定的局限性[1]。1995年,Donoho在小波變換的基礎(chǔ)上提出閾值去噪的方法[2],但基函數(shù)一經(jīng)選定,整個分解和重構(gòu)過程都已確定,無法再更改。文獻[3-4]提出經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,簡稱EMD)算法。傳統(tǒng)EMD算法將信號分解為一系列固有模態(tài)函數(shù)(intrinsic mode function,簡稱IMF)分量和一個殘余分量,分解的各個IMF分量突出了數(shù)據(jù)的局部特征,殘余分量則體現(xiàn)了信號變化趨勢。受小波閾值去噪方法的啟發(fā),文獻[5]提出了EMD重復(fù)間隔閾值(EMD clear iterative interval thresholding,簡稱EMD-CIIT)語音去噪算法,但其在間隔閾值上未考慮閾值選取的問題。為此,本研究對閾值函數(shù)進行改進,提出一種改進的EMD-CIIT語音去噪算法。
1經(jīng)驗?zāi)B(tài)分解原理
EMD算法是一種先進的信號處理方法,能有效處理非平穩(wěn)、非線性的信號。分解的固有模態(tài)分量必須滿足2個條件:1)零點數(shù)和極點數(shù)必須相等或至多相差1個;2)極大值和極小值組成的上下包絡(luò)線關(guān)于時間軸局部對稱,即上下包絡(luò)均值為0。具體步驟為:假設(shè)原始信號為s(t),找出s(t)的所有極大值和極小值;依據(jù)極大值和極小值構(gòu)造上下包絡(luò)線;計算均值m11(t),求差值h11(t)=s(t)-m11(t);用h11(t)替換原始s(t);若h1,k-1與h1,k之間的差值小于設(shè)定值,則認為h1,k是一個IMF分量,記c1(t)=h1,k,r1(t)=s(t)-c1(t);再令s(t)=rn(t),直到rn(t)為常量或一個單調(diào)函數(shù)時,EMD分解結(jié)束,即得到原信號s(t)的分解式為
(1)
(2)
認為滿足零均值的條件。其中ε為篩分門限,取值為0.2~0.3。
2基于EMD的去噪方法
對實測信號進行EMD分解,得到一系列IMF分量。對分解的IMF分量進行EMD直接閾值去噪(EMD direct-thresholding,簡稱EMD-DT),此方法的去噪思想類似于小波閾值去噪。EMD-DT方法的硬閾值函數(shù)為:
(3)
軟閾值函數(shù)為:
(4)
其中Ti為i層IMF所用的閾值。為克服EMD-DT去噪不佳的缺點,利用Kopsinis等[5]提出的間隔閾值(EMD-IT)方法去噪。EMD-IT方法的硬閾值函數(shù)為:
(5)
軟閾值函數(shù)為:
(6)
2專用式建筑學(xué)專業(yè)教室是通過一個單獨的空間作為主要個體的教學(xué)空間類型,具有安靜、封閉的空間特點,為學(xué)生進行獨立的學(xué)習(xí)和思考提供了很好的空間。
(7)
3改進的閾值函數(shù)
由式(5)、(6)可知,當閾值大于極值點值,相當于在原來子波上與加權(quán)系數(shù)相乘[6]。用式(6)處理,發(fā)現(xiàn)其有間斷現(xiàn)象,為使處理平滑,受文獻[7]啟發(fā),提出一種改進的閾值函數(shù)。設(shè)計閾值函數(shù)為:
(8)
(9)
3.1改進閾值函數(shù)的奇偶性
(11)
(12)
可見,改進的閾值函數(shù)為奇函數(shù),函數(shù)關(guān)于原點對稱,因此,只需分析閾值函數(shù)為正數(shù)的部分,另一部分可根據(jù)奇偶對稱性得出。
3.2改進閾值函數(shù)的單調(diào)性
對函數(shù)F進行一階求導(dǎo),得
(13)
其中,α的取值范圍為(0,1],又因j恒大于1,則1-j<0,可得一階導(dǎo)數(shù)在整個區(qū)間上恒為正數(shù),故改進后的閾值函數(shù)在區(qū)間上單調(diào)遞增。
3.3改進閾值函數(shù)的連續(xù)性
(14)
(15)
(16)
可見,改進的函數(shù)在閾值Ti處是連續(xù)的。
(17)
(18)
(19)
可見,改進的閾值函數(shù)在Ti/2同樣也是連續(xù)不間斷的。
分解得到的EMD分量為7層(j=7)時,調(diào)節(jié)系數(shù)α=0.88,改進的加權(quán)函數(shù)和軟、硬閾值加權(quán)函數(shù)的函數(shù)圖形如圖1所示。
圖1 不同閾值對比Fig.1 The comparison of different thresholds
改進的閾值函數(shù)克服了硬閾值函數(shù)在間斷點處不連續(xù)性及軟閾值函數(shù)存在的恒定偏差問題。當子波極值大于閾值時,改進的閾值函數(shù)逐漸逼近硬閾值函數(shù),而不像硬閾值函數(shù)不作改變。通過引入IMF分解層數(shù)j來減小加權(quán)子波與原始子波之間的偏差,使重構(gòu)后得到的信號更加逼近原始信號。引入調(diào)節(jié)系數(shù)α目的是為了保證連續(xù)性,在實際應(yīng)用中可根據(jù)具體情況,在(0,1]選取合適的α來提高硬閾值函數(shù)的逼近速度。
4改進閾值函數(shù)的EMD-CIIT語音去噪
當噪聲較嚴重時,直接對第一個IMF分量進行多次隨機改變,然后進行EMD-IT語音去噪,這種方法叫做重復(fù)間隔閾值語音去噪(EMD-IIT)。但當噪聲較小時,直接對第一個IMF分量進行隨機改變,會導(dǎo)致有用信號也包含在第一個IMF分量中,有用信號被一起濾除[9],改進閾值函數(shù)的EMD-CIIT語音去噪算法則可克服這一缺陷。算法步驟為:
1)對帶噪語音進行EMD分解,獲得IMF分量ci(t),i=1,2,…,L;對ci(t)進行傳統(tǒng)的直接閾值去噪(EMD-DT),得到去噪后的IMF分量ci(t)。
步驟1)是利用小波閾值去噪的方法來處理帶噪信號[10],然而,小波閾值去噪時,需要準確選取小波基函數(shù)。為此,利用EMD-DT進行噪聲估計,由于IMF分量的第一個分量大部分由噪聲構(gòu)成[11],對其進行EMD-DT后可得到較好的噪聲估計。
5仿真及結(jié)果分析
為了驗證改進的EMD-CIIT算法的有效性和優(yōu)越性,利用改進的EMD-CIIT算法處理不同信噪比的帶噪語音信號。分別對未改進的EMD分解進行EMD-IIT語音去噪、改進算法的EMD-IT語音去噪、傳統(tǒng)的EMD語音去噪和所提出的方法進行實驗仿真。實驗所用的語音信號來自NOIZEUS語料庫,其采樣頻率為8 kHz,量化為16 bit。通過采集實際車載環(huán)境中的噪聲,根據(jù)不同的信噪比(5、0、-5 dB)進行仿真實驗,改進的EMD-CIIT算法去噪效果對比如圖2所示。
圖2 去噪效果對比Fig.2 The comparison of denoising effect
由圖2可知,在不同信噪比下,特別是在信噪比為-5 dB時,改進的EMD-CIIT算法也有較強的語音還原能力。為了驗證處理后的語音信號在語音識別系統(tǒng)的識別率,對“開窗”、“關(guān)窗”、“開燈”、“關(guān)燈”進行訓(xùn)練,分別設(shè)為[R0,R1,R2,R3],并對這些語音信號進行加噪,然后進行降噪處理,作為測試模板,最終識別結(jié)果為[T0,T1,T2,T3],其在Matlab界面顯示如圖3所示。
在不同信噪比下,分別對含噪聲語音信號采用不處理、傳統(tǒng)EMD多尺度法語音去噪、EMD-IT語音去噪、EMD-CIIT語音去噪、改進EMD-CIIT語音去噪進行處理,并分別計算出系統(tǒng)在不同情況下的識別率。計算識別率的公式為:
圖3 識別過程Fig.3 Recognition process
其中:C為語音識別系統(tǒng)的識別率;N為語音庫總的詞匯數(shù);H為正確識別的次數(shù)。不同算法的識別率對比如表1所示。從表1可看出,不同算法都可在語音識別系統(tǒng)上進行識別,但不同信噪比下識別率差距很大。經(jīng)語音去噪處理后的語音識別率都有不同程度的提升,在信噪比較低的情況下,未處理的語音識別系統(tǒng)的識別率很低,傳統(tǒng)的降噪算法對系統(tǒng)的識別率有所提高,但不很明顯,改進的算法在提高語音識別系統(tǒng)的識別率上效果顯著,即使在信噪比較低的情況下也有較大提高。
表1 不同算法的識別率
6結(jié)束語
為了克服傳統(tǒng)基于經(jīng)驗?zāi)B(tài)分解語音去噪算法在閾值去噪時閾值函數(shù)處理不平滑的缺點,提出了一種改進閾值函數(shù)的EMD-CIIT算法,該算法可應(yīng)用于語音識別系統(tǒng)中。較于其他傳統(tǒng)算法,改進閾值函數(shù)的EMD-CIIT算法大大提高了語音識別系統(tǒng)的識別率。但本算法未考慮EMD在分解過程中產(chǎn)生的端點效應(yīng)以及模態(tài)混迭的問題,這會使EMD分解過程中產(chǎn)生虛假分量,有待今后研究中加以改進。
參考文獻:
[1]劉志坤,唐小明,朱洪偉.基于改進譜減法的語音增強研究[J].計算機仿真,2009.26(6):363-366.
[2]DONOHO D L.De-noising by soft-thresholding[J].IEEE Transactions on Information Theory,1995,41(3):613-627.
[3]HUANG N E,SHEN Z.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-tationary time series analysis[J].Proceedings of the Royal Society of London A,1998,454(1971):903-995.
[4]WU Z,HUANG N E.A study of the characteristics of white using the empirical mode decomposition method[J].Proceedings of the Royal Society of London A,2004,460:1597-1611.
[5]KOPSINIS Y,MCLAUGHLIN S.Development of EMD-based denoising methods inspired by wavelet thresholding[J].IEEE Transactions on Signal Processing,2009,57(4):1351-1362.
[6]李洋,景新幸,楊海燕.基于改進小波閾值和EMD的語音去噪方法[J].計算機工程與設(shè)計,2014,35(7):2462-2466.
[7]戴亮.非平穩(wěn)噪聲環(huán)境下的語音增強算法研究[D].長沙:中南大學(xué),2012:31-36
[8]張雄偉,陳亮,楊吉斌. 現(xiàn)代語音處理技術(shù)及應(yīng)用[M].北京:機械工業(yè)出版社,2003:111-124
[9]MANUEL B V,WENG B W,BARNER k E.ECG signal denoising and baseline wander correction based on the empirical mode decomposition[J].Computers in Biology and Medicine,2008,38(1):1-13.
[10]BOUDRAA A O,CEXUS J C.EMD-based signal filtering[J].IEEE Transactions on Instrumentation and Measurement,2007,56(6):2196-2202.
[11]曲從善,路廷鎮(zhèn),譚營.一種改進型經(jīng)驗?zāi)B(tài)分解及其在信號消噪中的應(yīng)用[J].自動化學(xué)報,2010,36(1):67-73.
編輯:黎仁惠
An improved threshold function EMD-CIIT speech denoising algorithm
ZHONG Jinliang, JING Xinxing, YANG Haiyan
(School of Information and Communication Engineering, Guilin University of Electronic Technology, Guilin 541004, China)
Abstract:The threshold process of speech denoising method based on empirical mode decomposition is not smooth, so the threshold function of EMD-CIIT (EMD clear iterative interval thresholding) speech denoising algorithm is improved. A speech recognition system is built by Matlab simulation platform. The experimental results show that compared with other algorithms, there are higher recognition rate and good robustness in the improved threshold EMD-CIIT algorithm.
Key words:speech denoising; EMD; improved threshold
中圖分類號:TN929.5
文獻標志碼:A
文章編號:1673-808X(2016)01-0009-05
通信作者:景新幸(1960-),男,湖北武漢人,教授,博士,研究方向為語音信號處理、非線性電路、集成電路設(shè)計。E-mail:jingxinxing@guet.edu.cn
基金項目:廣西自然科學(xué)基金(2012GXNSFAA053221)
收稿日期:2015-03-23