陽(yáng)衛(wèi)+陳進(jìn)軍
摘要:語(yǔ)音信號(hào)去噪音處理以及濁音、清音的辨別,對(duì)智能機(jī)器人人機(jī)語(yǔ)音交互系統(tǒng)有著重要意義。利用MATLAB軟件平臺(tái)設(shè)計(jì)了巴特沃斯FIR數(shù)字濾波器,進(jìn)行語(yǔ)音信號(hào)去噪音濾波處理。由于原始語(yǔ)音信號(hào)的時(shí)域波形圖與頻譜圖變化小,分析較難,為便于波形分析,對(duì)原始語(yǔ)音信號(hào)進(jìn)行4千赫茲和8千赫茲重采樣,通過(guò)短時(shí)平均過(guò)零率與短時(shí)自相關(guān)函數(shù)法對(duì)語(yǔ)音信號(hào)進(jìn)行清、濁音的辨別和基音周期提取。仿真結(jié)果表明,基于切比雪夫窗函數(shù)設(shè)計(jì)的濾波器對(duì)語(yǔ)音信號(hào)濾波效果良好。
關(guān)鍵詞:濾波器;MATLAB;語(yǔ)音信號(hào);重采樣
DOIDOI:10.11907/rjdk.172014
中圖分類號(hào):TP319
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2017)012-0155-03
Abstract:There are about to deal with noise and distinguish between voiced, unvoiced speech signal, has important significance for the intelligent robot human-computer interaction system. This paper is the use of MATLAB software platform designed by Butterworth FIR digital filter for speech signal to noise filtering, because the original speech signal time-domain waveform and frequency spectrum analysis is difficult to change, in order to facilitate the waveform analysis, the original voice signal of 4 thousand Hz and 8 thousand Hz sampling. Finally, a brief overview is given to the recognition of speech signals and the extraction of pitch period by means of short-time average zero crossing rate and short-time autocorrelation function. The simulation results show that the filter designed by Chebyshev window function is good for speech signal filtering.
Key Words:filter;MATLAB;speech signal;resampling
0 引言
語(yǔ)言是人與人工智能進(jìn)行交流的基礎(chǔ)。為獲得清晰的語(yǔ)言信息,用數(shù)字信號(hào)處理技術(shù)對(duì)語(yǔ)音信號(hào)進(jìn)行處理非常重要。處理語(yǔ)音的基本理論以及處理算法研究主要在兩個(gè)方面:①?gòu)恼Z(yǔ)音的產(chǎn)生和語(yǔ)音感知進(jìn)行研究;②為獲得有效的語(yǔ)音信號(hào)對(duì)語(yǔ)音進(jìn)行去噪聲處理[1-4]。
語(yǔ)音處理技術(shù)是多學(xué)科、多領(lǐng)域相結(jié)合的高新技術(shù),其中包括數(shù)字信號(hào)處理、語(yǔ)言學(xué)、語(yǔ)音學(xué)、模式識(shí)別等,現(xiàn)已成為人工智能實(shí)現(xiàn)人機(jī)對(duì)話的重要基礎(chǔ)[3-5]。
本文利用MATLAB設(shè)計(jì)了FIR數(shù)字濾波器進(jìn)行語(yǔ)音信號(hào)去噪處理,主要采用切比雪夫窗函數(shù)設(shè)計(jì)FIR數(shù)字濾波器。為便于分析,將原始語(yǔ)音信號(hào)進(jìn)行4千赫茲和8千赫茲重采樣,然后根據(jù)濾波的性能指標(biāo)對(duì)含有噪音的語(yǔ)音信號(hào)進(jìn)行濾波處理,最后將濾波前后的時(shí)域波形與頻譜波形進(jìn)行了比較。
1 數(shù)字濾波器設(shè)計(jì)
數(shù)字濾波器(DF,即Digital Filter)分為兩大類:經(jīng)典濾波器和現(xiàn)代濾波器,其中輸入端的信號(hào)中不僅有可用的頻率成分,還有無(wú)用的頻率成分,在經(jīng)典濾波器中占有不同的頻率寬帶,通過(guò)一個(gè)合適的選頻濾波器濾除干擾,就可得到純凈信號(hào),達(dá)到濾波目的[6]。數(shù)字濾波器功能是指把一系列輸入信號(hào)通過(guò)一定的運(yùn)算變換成輸出信號(hào)。
在設(shè)計(jì)數(shù)字濾波器時(shí),采用的運(yùn)算處理方法不同,決定了運(yùn)用濾波器的結(jié)構(gòu)也不同。FIR數(shù)字濾波器基本網(wǎng)絡(luò)結(jié)構(gòu)主要有直接型、級(jí)聯(lián)型、線性型和頻率采樣型[7]幾種,本文簡(jiǎn)要介紹前兩種結(jié)構(gòu)的系統(tǒng)函數(shù)及結(jié)構(gòu)。
3 語(yǔ)音信號(hào)處理方案
人在說(shuō)話時(shí)與環(huán)境以及說(shuō)話人的狀態(tài)有關(guān),人機(jī)交互更是如此,在相對(duì)安靜的環(huán)境里錄制一段時(shí)間為10秒的語(yǔ)音信號(hào)作為本文待處理信號(hào),圖3為處理流程。
(1)利用GoldWave錄音軟件錄制,保存格式為.wav后綴,利用MATLAB軟件中的wavread()函數(shù)讀取錄制好的語(yǔ)音信號(hào),并繪制出該語(yǔ)音信號(hào)的時(shí)域與頻譜波形圖[4]。
(2)MATLAB給信號(hào)加噪聲的方法很多,如可以添加白噪聲、隨機(jī)噪聲等。本文直接通過(guò)MATLAB軟件給原始信號(hào)疊加指定的噪音,該噪聲為幅值A(chǔ)z=0.02,噪聲頻率為ωz=10的正弦信號(hào)噪聲,即Z=0.02*sin(10*n)。模擬原始語(yǔ)音信號(hào)被噪聲干擾,然后繪制出疊加噪音后的時(shí)域與頻譜波形圖。
(3)濾波性能指標(biāo)為ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,MATLAB中濾波器設(shè)計(jì)采用切比雪夫窗函數(shù)。采用FIR數(shù)字濾波器,對(duì)疊加有噪音的語(yǔ)音信號(hào)進(jìn)行濾波處理,然后繪制出含有噪聲的語(yǔ)音信號(hào)頻譜。
(4)根據(jù)MATLAB所繪制的波形圖,分析語(yǔ)音信號(hào)濾波前后的變化。
4 實(shí)驗(yàn)結(jié)果與分析
(1)圖4為原始語(yǔ)音信號(hào)的時(shí)域、頻譜圖。由于原始信號(hào)的頻譜圖在0~0.2千赫茲和1.8~2千赫茲范圍內(nèi)波動(dòng)較小,為便于分析,將原始語(yǔ)音信號(hào)進(jìn)行4KHz和8KHz的重采樣處理,繪制出如圖5、圖6的時(shí)域波形圖與頻譜圖。endprint
(2)圖7為噪音信號(hào)時(shí)域波形與頻譜圖,該噪音在頻率為8kHz和1.2kHz時(shí)的噪音最明顯。根據(jù)濾波性能指標(biāo)ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,巴特沃斯濾波器濾除含有加噪音的信號(hào)。圖8為加噪音濾波后時(shí)域與頻譜圖,從圖中可以看出,該濾波器將頻率為8kHz和1.2kHz時(shí)的噪音成功濾除了,這表明該濾波器滿足濾波性能要求。
(3)在進(jìn)行語(yǔ)音辨別時(shí),需要對(duì)清音、濁音及噪音進(jìn)行區(qū)別。由于語(yǔ)音屬于非平穩(wěn)的寬帶信號(hào),利用短時(shí)平均過(guò)零率來(lái)辨別清音與濁音,根據(jù)過(guò)零次數(shù)的高低來(lái)辨別清、濁音,如圖9所示。過(guò)零次數(shù)最高的語(yǔ)音信號(hào)在幀數(shù)為1 480幀左右時(shí)達(dá)到最高,為清音。過(guò)零次數(shù)最高時(shí),對(duì)應(yīng)語(yǔ)音信號(hào)波形中幅度變化最劇烈處。
(4)為便于語(yǔ)音系統(tǒng)診斷與識(shí)別說(shuō)話人,提取語(yǔ)音基音至關(guān)重要。語(yǔ)音基音檢測(cè)技術(shù)有時(shí)域自相關(guān)函數(shù)法、頻域倒譜法及將兩者相結(jié)合的小波變換分析法。考慮到濾波器的性能指標(biāo),在截取原始語(yǔ)音信號(hào)的基音周期時(shí)采用短時(shí)自相關(guān)函數(shù)法,該方法在檢測(cè)時(shí)域波形周期性與同步性上效果好且相對(duì)容易。
5 結(jié)語(yǔ)
本文設(shè)計(jì)的巴特沃斯FIR數(shù)字濾波器具有較好的濾除效果,在時(shí)域波形上,濾波后的波形與原始語(yǔ)音信號(hào)波形變化較小,從兩者的頻譜圖上可較明顯看出濾波去噪音前后的變化。通過(guò)短時(shí)過(guò)零率能分辨出清音、濁音。短時(shí)自相關(guān)函數(shù)可從信號(hào)本身檢測(cè)到基音周期。
參考文獻(xiàn):
[1] 趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 梁曉輝,周權(quán).語(yǔ)音信號(hào)處理方法的可靠性研究[J].電聲技術(shù),2010,34(4):58-62.
[3] 宋毅郡,朱艷萍,宋耀良.基于分?jǐn)?shù)階濾波器的ADPCM預(yù)測(cè)誤差信號(hào)處理[J].電聲技術(shù),2010,34(5):52-55.
[4] 付大麗,黨幼云.數(shù)字濾波器在語(yǔ)音信號(hào)處理中的應(yīng)用[J].電聲技術(shù),2012,36(8):62-72.
[5] 王淑嬌.數(shù)字濾波器的設(shè)計(jì)與參數(shù)的選擇[J].科技資訊,2011,35(12):32-33.
[6] 文德仲.淺析數(shù)字濾波器原理及其設(shè)計(jì)過(guò)程[J].技術(shù)與應(yīng)用,2016:161-162.
[7] 王兵鋒.FIR數(shù)字濾波器設(shè)計(jì)與仿真研究[D].哈爾濱:哈爾濱理工大學(xué),2009.
(責(zé)任編輯:杜能鋼)endprint