鄭尊凱
(長江大學電子信息學院,湖北 荊州 434023)
文暢
(長江大學計算機科學學院,湖北 荊州 434023)
謝凱
(長江大學電子信息學院,湖北 荊州 434023)
賀建彪
(中南大學信息科學與工程學院,湖南 長沙 410083)
語音信號是人類信息溝通重要媒介,隨著現(xiàn)代技術的發(fā)展,語音信號的應用領域在廣泛的擴展:語音的通信、語音合成以及語音的識別等技術[1]不僅提高了人們的生活體驗,而且還解決了很多實際的工程問題。但在實際采集中,語音信號常常會遭受各種噪聲的干擾,因此,抑制語音的背景噪聲,實現(xiàn)語音有效增強,是各種語音處理技術不可或缺的過程。
語音信號由于能量幅度和頻率隨時間非線性的變化,小波變換等傳統(tǒng)的時頻法由于需要預先設定固定的基函數(shù),面對復雜的非穩(wěn)態(tài)信號,傳統(tǒng)時頻法便無法精細地描述其信號的時頻屬性。經(jīng)驗性時頻分析法,如Huang等提出的經(jīng)驗模態(tài)分解(EMD)[2]解決該類信號是將非穩(wěn)態(tài)信號分解成若干具有穩(wěn)態(tài)特性的本征模態(tài),再對其進行處理變換,求得完整的時頻譜[3]。EMD在分解過程中由于使用三次樣條差值法[4]求取信號上下包絡容易形成過包絡和欠包絡[5],這種誤差破壞了信號細節(jié)的構建。局部均值分解(LMD)算法在分解迭代過程中通過計算局部均值函數(shù)和局部包絡函數(shù),再通過移動平均算法處理得到包絡信號,避免該類誤差。但LMD分解仍然存在模態(tài)混淆的問題。為此,在處理LMD的模態(tài)混淆方面,筆者引入高斯白噪聲輔助分析[6],根據(jù)高斯白噪聲在時頻域均勻分布的特點,在分解時不同尺度的信號會映射到相應的參考尺度從而可以減輕模態(tài)混疊。分解得到各PF(product function ,乘積函數(shù))分量,選用粒子群優(yōu)化算法尋找相應的最優(yōu)小波閾值,粒子群具有強大的搜索能力,通過各個粒子信息共享,相互協(xié)作尋找到最優(yōu)解。去噪處理后的PF分量通過信號重構完成去噪過程,該方法對提高信號去噪精度有著良好的效果。
LMD算法就是不斷迭代從原始信號中分離頻率單一穩(wěn)態(tài)成分,進而對其進行時頻分析得到瞬時頻率[7]。在原信號分解迭代過程中獲得PF分量可以求取具有物理意義的瞬時頻率[8],迭代此過程分解獲得所有的PF分量和整個時頻譜。因為LMD分解仍然存在模態(tài)混淆的問題,在分解信號前,對原信號添加不同的單位均方差高斯白噪聲改進[9],即形成ELMD算法。
ELMD算法詳細步驟如下:
1)在原始信號x(t)中添加高斯白噪聲得到一個新的合成信號xn(t)。
2)確定出xn(t)所有的局部極值點ni,按照式(1)求出鄰近極值點的均值mi:
(1)
將求得的均值點mi連接后用移動平均法處理,所得平滑曲線為局部均值函數(shù)m11(t)[10]。
3)類似的按照式(2)計算出局部包絡估計值ai:
(2)
同樣平滑處理得到包絡估計函數(shù)a11(t)。
4)從信號xn(t)減去局部均值函數(shù)m11(t),得到剩余信號成分為r11(t):
r11(t)=x(t)-m11(t)
(3)
再用r11(t)除以包絡估計函數(shù)a11(t) , 得到調(diào)頻信號s11(t):
(4)
s11(t)為標準調(diào)頻信號,若不是標準調(diào)頻信號,則將s11(t)作為新的信號替換x(t),重新執(zhí)行步驟1)~步驟4),直至s11(t)為標準調(diào)頻信號為止。s11(t)為標準調(diào)頻信號的判斷條件是其包絡估計函數(shù)a1n(t)等于1,即可以滿足迭代停止條件。
5)包絡信號a1(t)由迭代過程中的局部包絡估計函數(shù)相乘得到:
(5)
6)步驟5)獲取的包絡信號a1(t)與之前得到的標準調(diào)頻信號s1n(t)的乘積即為第1個PF分量:
PF1(t)=a1(t)s1n(t)
(6)
7)從原始信號中分離第1個PF分量出來,獲得一個剩余信號u1(t):
u1(t)=xn(t)-PF1(t)
(7)
8)在步驟7)中得到的剩余信號u1(t)當作x(t)繼續(xù)分解,直到uk(t)能量小于設定條件,完成整個分解過程,將分解獲得k個PF分量和殘差信號uk(t)重構成信號y(t):
(8)
ELMD分解得到PF分量作時頻分析處理,為避免用希爾伯特黃變換對PF分量求瞬時頻率可能出現(xiàn)的負頻率問題,可根據(jù)ELMD分解過程中得到的相關參數(shù)求取瞬時頻率。由每個PF分量相對應標準調(diào)頻函數(shù)sn(t)由式(9)求出瞬時相位φ(t),進而對其求導可得到對應PF分量的瞬時頻率ωn(t)[11]:
φ(t)=arccos(sn(t))
(9)
(10)
在求得每個PF分量的瞬時頻率后,結(jié)合其包絡函數(shù),得到關于時間和頻率的時頻函數(shù)。將所有的PF分量的時頻函數(shù)組合起來即可求得信號的瞬時譜。
小波閾值的原理是小波變換將信號分解成小波系數(shù),噪聲和信號的有效成分根據(jù)其特性分解后在小波系數(shù)上的分布位置被區(qū)分出來。一般情況下,噪聲成分的能量占據(jù)著高頻部分,有效信號在小波系數(shù)上分布的特性是分布在較大幅值位置。閾值去噪的方法就是設置合適的閾值,濾除含噪的小波系數(shù),然后將剩余小波系數(shù)進行重構達到信號去噪目的。閾值的選擇好壞影響噪聲的去除效果,筆者采用粒子群優(yōu)化算法來選擇最優(yōu)小波閾值,針對語音分解后的含噪PF進行濾波處理,再進行信號重構。具體流程如圖1所示。
圖1 閾值去噪算法流程圖
粒子群算法是在研究鳥群覓食過程中受到啟發(fā)提出的一種群體智能算法[12],其思想原理是個體保持最優(yōu)的距離在解空間展開同步搜索,并且相互分享經(jīng)驗信息以尋求最優(yōu)的解。
在粒子群算法中,首先確定一定數(shù)量M的粒子組成的粒子群,初始化每個粒子運動的位置xi和速度vi。粒子的適應度值根據(jù)優(yōu)化函數(shù)確定,然后通過迭代更新粒子當前的位置和速度。粒子群中第i個粒子當前的所在位置為xi(t),速度為vi(t),搜索歷史中最好位置為pib(t)(局部極值),整個粒子群當前所搜索到的最佳位置為pgb(t)(全局極值)。每次迭代過程中,粒子會向著這2個極值位置移動以更新當前狀態(tài),從而盡快的尋找到最優(yōu)解。粒子狀態(tài)更新公式為:
vi(t+1)=ω(t)vi(t)+c1r(pib(t)-xi(t))+c2r(pgb(t)-xi(t))
(11)
xi(t+1)=xi(t)+vi(t)
(12)
式中,ω(t)為引入的慣性權重因子,用以調(diào)整粒子的運動速度,粒子群的全局搜索能力與ω(t)值成正比,局部搜索能力與之成反比;c1和c2為加速度因子,一般取值為2;r為隨機取值參數(shù),取值區(qū)間為[0,1]。
圖2 粒子群優(yōu)化小波閾值去噪流程圖
粒子群優(yōu)化小波閾值算法的具體步驟如下:
1)粒子群的初始化。確定粒子群中粒子的個數(shù)M,粒子群的維數(shù)N為小波分解的層數(shù),初始化粒子群的速度和位置。
2)由優(yōu)化函數(shù)計算粒子的適應度值。
3)將粒子的當前位置適應度值與歷史局部最優(yōu)值比較,若更好,則更新為局部最優(yōu)值pib(t);將所有的粒子的當前適應度值與歷史全局最優(yōu)值比較,若更好,則將最好的粒子適應值更新為全局最優(yōu)pgb(t)。
3)由式(11)和式(12)更新粒子群中粒子的速度和位置。
4)判斷是否滿足停止條件,若滿足則可得到最優(yōu)值pbest。如果還沒有達到停止條件,則繼續(xù)迭代運算。
5)將上述過程中得到的最優(yōu)小波閾值pbest對小波的分解系數(shù)進行閾值量化處理,最后將去噪后的小波系數(shù)進行重構,完成去噪過程。
粒子群優(yōu)化小波閾值算法去噪流程如圖2所示。
去噪驗證試驗數(shù)據(jù)為一段時長為20s的wav格式的錄音文件,加入高斯白噪聲。采樣頻率為8kHz,采樣點數(shù)為187840,采樣的位數(shù)為8bit,并與Heursure啟發(fā)式閾值小波濾波器、EMD經(jīng)驗模態(tài)分解等語音去噪方法的試驗結(jié)果進行對比。
圖(3)是對原始語音信號中截取的采樣點為110000~125000的一段信號分別用EMD和ELMD方法分解后得到的分量圖譜。由圖3分解結(jié)果中紅圈處對比可知,圖3(a)中分解的IMF分量波形存在異常能量波動,圖3(b)中PF分量波形信號較為平穩(wěn)。EMD在迭代分解過程產(chǎn)生模態(tài)混疊現(xiàn)象,在同一模態(tài)中存在差異時間尺度的成分,使得分解結(jié)果失去了時頻分析的物理意義。而ELMD在分解原始信號過程中添加單位均方差的高斯白噪聲作為輔助分析法,有效減輕了模態(tài)混疊現(xiàn)象。
圖3 語音信號分解圖譜
圖4為3種去噪算法實際語音信號的去噪效果圖,圖4 (a)為原始語音信號,圖4 (b) 中采用‘Heursure’啟發(fā)式自適應閾值選擇函數(shù),小波基為Haar,分解層數(shù)為3層,軟閾值。由圖4(b)可以看出,該方法有較強的去噪能力,但是在濾除噪聲的同時也存在著有效信息損失較多的缺點。圖4(c)中經(jīng)驗模態(tài)分解(EMD)能夠很好地自適應分解非線性非穩(wěn)態(tài)的復雜信號,將語音信號分解成若干IMF分量,將含有噪聲成分較多的IMF分量舍去,重構干凈IMF分量得到去噪信號。但由于其存在算法的缺陷,限制了其去噪效果。圖4(d)中ELMD分解很好地減輕了EMD中存在的模態(tài)混疊和端點效應,能夠?qū)⒃夹盘柗纸鉃橐恍┓€(wěn)態(tài)的分量,更好地稀疏表示原始語音信號。對于分解得到乘積分量,使用小波閾值濾去噪聲,在閾值的選擇上采用粒子群優(yōu)化算法獲得最優(yōu)閾值,在有效濾去噪聲成分的同時,盡可能避免損失有效信號。
圖4 3種去噪算法實際語音信號的去噪效果圖
圖5 3種去噪方法不同的輸入信噪比下去噪效果
通過對原始語音信號添加不同的高斯白噪聲,獲得不同輸入信噪比的待處理信號作去噪分析,通過計算信噪比定量分析驗證去噪能力。圖5是3種去噪方法不同的輸入信噪比下去噪效果圖,筆者提出的去噪算法較對比算法效果更好。
使用來自NOIZEX-92噪聲庫不同的背景噪聲:白噪聲(Whitenoise),工廠噪聲(Factoryfloornoise1),車內(nèi)噪聲(volvo)以及餐廳內(nèi)嘈雜噪聲(speechbabble)分別測試3種方法對不同的背景噪聲的去噪效果,設定輸入信噪比為10dB,去噪結(jié)果如表1所示。結(jié)果表明,筆者提出的方法在處理不同噪聲時性能比其他方法優(yōu)越。
表1 3種方法對不同的背景噪聲的去噪效果
由于隨機語音信號具有非穩(wěn)態(tài)特性難以用傳統(tǒng)方法分析,為此筆者提出ELMD聯(lián)合粒子群優(yōu)化小波閾值對語音信號進行去噪處理,ELMD能夠?qū)碗s語音信號分解成穩(wěn)態(tài)PF分量,通過粒子群優(yōu)化獲得相應的最優(yōu)的小波閾值對含噪穩(wěn)態(tài)分量進行噪聲抑制。與傳統(tǒng)的幾種去噪算法對比可以看出,筆者提出的算法能夠取得良好的去噪效果,同時減輕對有效信號的破壞。在使用粒子群優(yōu)化算法選擇最優(yōu)閾值時,相關參數(shù)是通過經(jīng)驗設定,這還有待進一步研究,以提高算法的去噪精度。
[1]王瀟涵. 語音信號去噪研究[J]. 數(shù)字技術與應用,2017,34(6):76~77,79.
[2]張啟帆,侯力,魏永峭,等.LMD與小波閾值降噪結(jié)合的軸承故障識別[J]. 組合機床與自動化加工技術,2017,48(3):105~108.
[3]李其建,徐海波. 改進EMD閾值小波濾波方法[J]. 機械科學與技術,2017,36(8):1~4.
[4]劉霞,黃陽,黃敬,等. 基于經(jīng)驗模態(tài)分解(EMD)的小波熵閾值地震信號去噪[J]. 吉林大學學報(地球科學版),2016,46(1):262~269.
[5]程軍圣,張亢,楊宇,等. 局部均值分解與經(jīng)驗模式分解的對比研究[J]. 振動與沖擊,2009,28(5):13~16,201.
[6]YangYu,ChengJunsheng,ZhangKang,Anensemblelocalmeansdecompositionmethodanditsapplicationtolocalrub-impactfaultdiagnosisoftherotorsystems[J].Measurement,2012,45(3):561~570.
[7]LiuZhiwen,HeZhengjia,GuoWei,etal.Ahybridfaultdiagnosismethodbasedonsecondgenerationwaveletde-noisingandlocalmeandecompositionforrotatingmachinery[J].ISATransactions, 2016, 61:211~220.
[8]李晉,彭沖,湯井田,等. 局域均值分解和小波閾值在大地電磁噪聲壓制中的應用[J]. 振動與沖擊,2017,36(5):134~141,156.
[9]SunJiedi,PengZhitao,WenJiangtao.Leakageaperturerecognitionbasedonensemblelocalmeandecompositionandsparserepresentationforclassificationofnaturalgaspipeline[J].Measurement,2017,108:91~100.
[10]鞠萍華,秦樹人,趙玲. 基于LMD的能量算子解調(diào)方法及其在故障特征信號提取中的應用[J]. 振動與沖擊,2011,30(2):1~4,23.
[11]張雪冰,劉財,劉洋,等. 基于局部均值分解的地震信號時頻分解方法[J]. 吉林大學學報(地球科學版),2017,47(5):1562~1571.
[12]吳炬卓,牛海清,葉開發(fā). 基于粒子群優(yōu)化的最佳閾值法在局部放電信號去噪中應用[J]. 電測與儀表,2015,52(10):100~104.
[13]陸真,裴東興,劉莉,等. 基于改進小波閾值函數(shù)和PSO的語音增強算法[J]. 激光雜志,2016,37(2):141~145.