張學(xué)敏,王秀艷,張建紅
(長(zhǎng)春工程學(xué)院電氣與信息工程學(xué)院,長(zhǎng)春 130012)
語(yǔ)音信號(hào)是隨時(shí)間變化的隨機(jī)信號(hào),它屬于非平穩(wěn)信號(hào)。但由于人的聲道形狀及其變化規(guī)律具有一定慣性,因此在一段時(shí)間間隔內(nèi)語(yǔ)音信號(hào)保持相對(duì)穩(wěn)定,因此對(duì)語(yǔ)音信號(hào)的分析和處理應(yīng)建立在“短時(shí)”概念上。本文利用短時(shí)傅里葉變換方法,采用FIR數(shù)字低通、帶通和高通濾波器對(duì)原始語(yǔ)音信號(hào)在不同頻率范圍內(nèi)進(jìn)行提取,得到感興趣區(qū)的敏感語(yǔ)音。處理后的語(yǔ)音在低音、中音和高音段音效明顯,達(dá)到了敏感語(yǔ)音提取的目的。語(yǔ)音提取流程如下圖所示:
圖1 敏感語(yǔ)音提取流程圖
語(yǔ)音的感知過(guò)程與人類(lèi)聽(tīng)覺(jué)系統(tǒng)的頻譜分析功能是密切相關(guān)的,因此對(duì)語(yǔ)音信號(hào)進(jìn)行譜分析是認(rèn)識(shí)語(yǔ)音信號(hào)和處理語(yǔ)音信號(hào)的重要方法。傅里葉變換可將時(shí)域上較復(fù)雜的運(yùn)算轉(zhuǎn)換為相對(duì)簡(jiǎn)單的頻域運(yùn)算,所以通過(guò)傅里葉變換可以使信號(hào)的某些感興趣的特性變得明顯,而在時(shí)域信號(hào)中這些特性是無(wú)法體現(xiàn)出來(lái)的。由于語(yǔ)音信號(hào)在短時(shí)間內(nèi)是局部平穩(wěn)的,所以可對(duì)某一幀語(yǔ)音進(jìn)行傅里葉變換,即短時(shí)傅里葉變換,定義如下:
式中:w(n-ω)——窗函數(shù)序列。
針對(duì)不同窗函數(shù)序列,可以得到不同傅里葉變換結(jié)果。
由短時(shí)傅里葉變換的表達(dá)式可知,短時(shí)傅里葉變換有2個(gè)重要的變量n和ω,所以它是時(shí)間和頻率的函數(shù)。當(dāng)n固定不變時(shí),它僅是頻率ω的函數(shù),即序列x(n)的標(biāo)準(zhǔn)傅里葉變換。
短時(shí)平均過(guò)零率是一種短時(shí)處理技術(shù),短時(shí)平均過(guò)零率的定義為:
w(n)仍為窗函數(shù),一般取矩形窗
由于語(yǔ)音信號(hào)是隨時(shí)間變化的,在短時(shí)間間隔內(nèi),語(yǔ)音信號(hào)的時(shí)間特性是固定不變的,因此可將語(yǔ)音信號(hào)進(jìn)行短時(shí)分析。語(yǔ)音信號(hào)短時(shí)分析的一個(gè)重要問(wèn)題是采樣點(diǎn)數(shù)的選取。短時(shí)范圍內(nèi),采樣頻率、采樣點(diǎn)數(shù)和持續(xù)時(shí)間之間的對(duì)應(yīng)關(guān)系見(jiàn)表1。
表1 采樣頻率與采樣點(diǎn)數(shù)選擇對(duì)應(yīng)表
通常,童聲高音頻率范圍在260~880 Hz,低音范圍在190~700 H z;女性高音范圍在220 Hz~1.1 kHz,低音范圍在200~700 H z;男性高音范圍在160~523H z,低音范圍在80~358H z。所以,按照奈奎斯特準(zhǔn)則,采樣頻率8 000 Hz足以滿足要求。比如采樣頻率是8 000 Hz,持續(xù)時(shí)間是16 m s,則采樣點(diǎn)數(shù)N=16×10-3×8 000=128點(diǎn)。
圖形用戶(hù)界面(即Graphic User Interface,以下簡(jiǎn)稱(chēng)GUI)是Matlab的用戶(hù)與計(jì)算機(jī)之間通信聯(lián)系的平臺(tái)。使用GUI應(yīng)用程序,用戶(hù)可以方便地通過(guò)鼠標(biāo)與程序進(jìn)行信息交互,控制程序運(yùn)行。M atlab作為功能強(qiáng)大的軟件開(kāi)發(fā)工具,提供了豐富的GUI設(shè)計(jì)功能,特別是M atlab7.0所提供的控件種類(lèi)更豐富,使用更方便,用戶(hù)利用Matlab提供的圖形用戶(hù)界面設(shè)計(jì)工具,可以設(shè)計(jì)各種要求的GUI,并在其基礎(chǔ)上完成應(yīng)用程序的開(kāi)發(fā)。
敏感語(yǔ)音提取的GUI界面如圖2所示,現(xiàn)將主要控件介紹如下:5個(gè)坐標(biāo)軸,用來(lái)畫(huà)語(yǔ)音信號(hào)的時(shí)、頻域波形和濾波器的幅頻特性;1個(gè)彈出式菜單,用來(lái)選擇濾波器的類(lèi)型;4個(gè)動(dòng)態(tài)文本框,用來(lái)輸入頻率和錄音時(shí)間;7個(gè)按鈕,其功能如其標(biāo)識(shí)所示。
圖2 敏感語(yǔ)音提取的空GUI界面
在敏感語(yǔ)音提取前,先對(duì)待提取的純凈語(yǔ)音做短時(shí)傅里葉變換。這里選的聲音文件為M ATLAB自帶的聲音文件bluetooth.wav。
點(diǎn)擊圖1中的控件“原始語(yǔ)音播放及繪圖”按鈕,在聽(tīng)到原始語(yǔ)音的同時(shí),在圖1的左上角會(huì)出現(xiàn)一個(gè)對(duì)話框(在圖形用戶(hù)界面里設(shè)置此對(duì)話框,增加了對(duì)待處理聲音的靈活性),如圖3所示:
圖3 選擇聲音文件的GUI界面
在對(duì)話框里輸入要處理的聲音文件bluetooth.wav,點(diǎn)擊“打開(kāi)”按鈕,則 bluetooth.wav的時(shí)域和頻域波形會(huì)出現(xiàn)在圖形用戶(hù)界面的第1和第2個(gè)坐標(biāo)軸里,如圖4所示,可以根據(jù)此頻譜的分布情況,對(duì)感興趣區(qū)的語(yǔ)音進(jìn)行提取。
圖4 語(yǔ)音的時(shí)域和頻域波形的GUI界面
分別在Fs、FL和 FH的動(dòng)態(tài)文本框里輸入8 kH z、1 500 H z和 0 H z,選擇彈出式菜單中的“FIR低通濾波器”,則在第3個(gè)坐標(biāo)軸里會(huì)出現(xiàn)FIR低通濾波器的幅頻特性圖,如圖5所示:
圖5 語(yǔ)音的時(shí)域、頻域和低通濾波器的GUI界面
再點(diǎn)擊“處理語(yǔ)音播放及繪圖”按鈕,則bluetooth.wav低頻部分的時(shí)域和頻域波形會(huì)出現(xiàn)在最后2個(gè)坐標(biāo)軸內(nèi),如圖6所示,同時(shí)聽(tīng)到低沉的語(yǔ)音。
圖6 提取低音的GUI界面
點(diǎn)擊“清除圖形”,則圖5中的所有波形均被清除,然后分別在 FL和 FH的動(dòng)態(tài)文本框里輸入1 500 H z和2 500 Hz,選擇彈出式菜單中的“FIR帶通濾波器”,其他操作同上,則中音頻段的語(yǔ)音提取如圖7所示,同時(shí)可以聽(tīng)到中音效果的語(yǔ)音。
圖7 提取中音的GUI界面
清除圖形后,分別在FL和FH的動(dòng)態(tài)文本框里輸入 0 H z和 2 500 Hz,選擇彈出式菜單中的“FIR高通濾波器”,其他操作同上,則高音頻段的語(yǔ)音提取如圖8所示,同時(shí)可以聽(tīng)到高音效果的語(yǔ)音。
圖8 提取高音的GU I界面
在敏感語(yǔ)音提取的界面內(nèi),還可以實(shí)時(shí)處理現(xiàn)場(chǎng)錄制的語(yǔ)音。點(diǎn)擊“清除圖形”按鈕,清除所有圖形后,在空的GUI界面內(nèi),輸入錄音時(shí)間,點(diǎn)擊“錄音”按鈕,然后對(duì)話筒講話或錄入一段音樂(lè),再點(diǎn)擊“錄制語(yǔ)音播放及繪圖”,根據(jù)頻域波形特點(diǎn),分別在FH和FL內(nèi)輸入自己感興趣的頻率值(這里輸入2 000 H z和3 500 H z),選擇相應(yīng)的濾波器,再點(diǎn)擊控件,則自錄的聲音的時(shí)域和頻域波形如圖9所示。
圖9 自錄語(yǔ)音高音段的GU I界面
語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)隨機(jī)信號(hào)。因此適用于周期、瞬變或平穩(wěn)隨機(jī)信號(hào)的標(biāo)準(zhǔn)傅里葉變換不能直接用來(lái)分析語(yǔ)音信號(hào)。本文利用短時(shí)分析,FIR濾波,對(duì)敏感語(yǔ)音進(jìn)行提取,并通過(guò)圖形用戶(hù)界面仿真實(shí)現(xiàn)之。結(jié)果表明:用圖形用戶(hù)界面實(shí)現(xiàn)敏感語(yǔ)音提取效果直觀、操作方便、靈活。
[1]Sun ll Bhooshan,V inay Kumar.A novel Approach Towards the Design of Chebyshev FIR Filter with Linear Phase[J].WSEAS Transactions on Signal Processing,2008,3(2):179-184.
[2]Duane Hanselman,Bruce Littlefield.Proficiency of MATLAB7.0[M].T ranslated by Renfeng Zhu.Beijing:Tinghua University Press,2006:57-59.
[3]王默玉,宗偉.基于M atlab的圖形用戶(hù)界面的構(gòu)造方式與應(yīng)用[J].現(xiàn)代電力,2002,19(1):76-82.
[4]張學(xué)敏.基于圖形用戶(hù)界面的FIR濾波器的設(shè)計(jì)與仿真[J].長(zhǎng)春工程學(xué)院學(xué)報(bào):自然科學(xué)版,2009,(4):33-35.
[5]張學(xué)敏.M ATALB基礎(chǔ)及應(yīng)用[M].北京:中國(guó)電力出版社,2009:226-233.
[6]李麗,王振領(lǐng).Matlab工程計(jì)算及應(yīng)用[M].北京:人民郵電出版社,2007:132-137.
[7]張明照,劉政波.應(yīng)用Matlab實(shí)現(xiàn)信號(hào)分析與處理[M].北京:科學(xué)出版社,2006:79-83.
[8]陳亞勇.M ATLAB信號(hào)處理詳解[M].北京:人民郵電出版社,2005:49-51.