華北電力大學(xué)電氣與電子工程學(xué)院 蘇欣美
隨著現(xiàn)代通信技術(shù)的發(fā)展,MATLAB對(duì)語音信號(hào)的處理識(shí)別也不斷的發(fā)展。本文基于語音信號(hào)時(shí)域和頻域相互轉(zhuǎn)換的傅里葉變換原理,運(yùn)用MATLLAB軟件對(duì)不同性別聲音信號(hào)進(jìn)行時(shí)域和頻域的信號(hào)處理并提取了不同性別聲音信號(hào)的特征頻率,對(duì)不同聲音的時(shí)域和頻域特性進(jìn)行深度分析和研究。
語言是人類進(jìn)行交流的重要工具,隨著信息技術(shù)的快速發(fā)展,語音通信技術(shù)是信號(hào)處理與分析的重要發(fā)展方向之一,而聲音信號(hào)的特征提取與檢測(cè)是語音信號(hào)采集、分析與處理中的一個(gè)重要方面。如何采集聲音信號(hào)并對(duì)采集后的聲音信號(hào)的特征進(jìn)行有效的提取對(duì)識(shí)別和處理聲音信號(hào)有著重要意義。通過對(duì)男生、女生不同的音頻信號(hào)進(jìn)行采集,利用MATLAB實(shí)現(xiàn)對(duì)聲音信號(hào)的頻譜分析,得到男女生 性別不同的頻率特征點(diǎn),有效地區(qū)分了男女聲音的不同,并通過實(shí)驗(yàn)驗(yàn)證了該方法的可行性和有效性。
聲音是由物體的機(jī)械振動(dòng)產(chǎn)生的并以波的形式進(jìn)行傳播。人耳可聽到的聲音頻率在20-10000Hz之間。人類的語言首先是經(jīng)過大腦對(duì)對(duì)所要表達(dá)的思想信息進(jìn)行語言編碼,這些語言編碼通過大腦的神經(jīng)網(wǎng)絡(luò)控制相應(yīng)的聲帶肌肉產(chǎn)生有節(jié)律的機(jī)械震動(dòng)從而產(chǎn)生聲音。聲音是一種聲波,具有音質(zhì)、音調(diào)、響度和音長等物理特征。其中音調(diào)和響度主要取決于聲音信號(hào)的頻率特征和時(shí)域特征。音調(diào)取決于聲音的頻率即聲音的頻譜特征,聲音信號(hào)的頻率數(shù)值越大音調(diào)越高;相反頻率數(shù)值越小音調(diào)越低。響度主要取決于聲音信號(hào)的幅值大小即聲音信號(hào)的時(shí)域幅值,聲音信號(hào)的時(shí)域幅值越大響度就越大,反之則越小。
從前面的分析中可以看出聲音的響度與音調(diào)可以通過聲音信號(hào)的時(shí)域特征和頻域特征進(jìn)行分析。這里設(shè)計(jì)了語音信號(hào)的采集系統(tǒng)如圖1所示。從圖1可以看出聲音信號(hào)通過語音麥克風(fēng)的拾取送到計(jì)算機(jī)的聲卡中,這部分為聲音信號(hào)的采集。采集出來的聲音信號(hào)的幅值隨時(shí)間發(fā)生變化,即通常所說的信號(hào)的時(shí)域采集,可以用來分析信號(hào)的響度特征。為了分析信號(hào)的音調(diào)特征,必須對(duì)采集的信號(hào)進(jìn)行頻譜分析。利用傅里葉變換得到聲音信號(hào)的頻譜,通過MATLAB軟件實(shí)現(xiàn)聲音信號(hào)頻譜的顯示,從而提取男生與女生不同聲音信號(hào)的特征。
圖1 聲音信號(hào)采集系統(tǒng)簡圖
由麥克風(fēng)采集的聲音信號(hào)為模擬時(shí)域信號(hào)x(t),該信號(hào)經(jīng)過聲卡進(jìn)行抽樣、量化,由模擬時(shí)域信號(hào)轉(zhuǎn)換為離散時(shí)域聲音信號(hào)x(n)。
根據(jù)離散傅里葉變換公式將時(shí)域離散聲音信號(hào)轉(zhuǎn)換為頻域離散聲音信號(hào):
式中:X(k)—時(shí)域離散聲音信號(hào)的傅里葉變換
N—聲音信號(hào)的采樣序列值
由于DFT運(yùn)算較為復(fù)雜,復(fù)乘運(yùn)算需要進(jìn)行N2次,與N2成正比,因此運(yùn)算時(shí)間過長。所以利用FFT快速傅里葉變換,復(fù)乘運(yùn)算次數(shù)僅為Nlog2N,與N成正比,大大減少DFT的復(fù)乘運(yùn)算,快速有效計(jì)算離散傅里葉變換,得到聲音信號(hào)的頻域波形。
聲音信號(hào)的獲取是通過麥克風(fēng)和聲卡對(duì)男生和女生的聲音進(jìn)行采集。由Windows自帶的錄音系統(tǒng)來存儲(chǔ),存儲(chǔ)的聲音文件形式為(*.wav),然后利用MATLAB的文件調(diào)用指令和繪圖指令來繪制男生和女生的聲音時(shí)域信號(hào)如圖2和圖3所示。
從圖2和圖3男生和女生的時(shí)域音頻信號(hào)可以識(shí)別出信號(hào)幅值的大小,即聲音信號(hào)的響度。從聲音信號(hào)的幅值隨時(shí)間變化的情況很難區(qū)分男聲和女聲,也就是無法通過聲音信號(hào)的響度特征來來提取男聲和女聲的聲音信號(hào)特征。
圖2 男生語音信號(hào)時(shí)域波形
圖3 女生語音信號(hào)時(shí)域波形
圖4 男生語音信號(hào)頻譜圖
圖5 女生語音信號(hào)頻譜圖
為更好地識(shí)別男聲和女聲的聲音信號(hào)特征,對(duì)采集到的語音信號(hào)進(jìn)行頻譜分析。利用matlab編程實(shí)現(xiàn)前述聲音信號(hào)的時(shí)域-頻域轉(zhuǎn)換原理,男聲和女聲的語音信號(hào)頻譜圖像如圖4和圖5所示。
分析圖4圖5可知,男生和女生的頻譜圖特征區(qū)別較大。男生的聲音頻率主要集中在200Hz-300Hz左右的頻率范圍,而女生的聲音頻率集中在500Hz-700Hz的頻率范圍內(nèi),女生的聲音頻率普遍比男生要高,即可以通過提取不同性別聲音的音調(diào)特征來區(qū)分男生和女生的聲音。因此,可以利用不同聲音所集中的頻率范圍對(duì)聲音進(jìn)行性別識(shí)別判斷。
結(jié)語:本文介紹了一種男女生性別不同的聲音識(shí)別方法,利用MATLAB的強(qiáng)大的編程功能對(duì)采集到的語音信號(hào)進(jìn)行時(shí)域和頻域的分析處理,并通過仿真實(shí)驗(yàn)驗(yàn)證了該方法的有效性,這一技術(shù)的實(shí)現(xiàn)為特定語言環(huán)境下男女生聲音特征識(shí)別提供一種實(shí)用的方法。