摘要:基音是語音信號的一個重要參數(shù),它是指發(fā)濁音時聲帶振動所引起的周期性?;舻奶崛∈钦Z音處理中的重要任務(wù)。目前對基音的檢測方法有很多,典型的就有自相關(guān)法,AMDF(短時平均幅度差)法,倒譜法等等。這里介紹一種自相關(guān)和倒譜相結(jié)合的算法,較傳統(tǒng)的自相關(guān)法有一定的改進(jìn)和優(yōu)化。
關(guān)鍵詞:自相關(guān);倒譜;三電平中心削波
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2009)36-10611-02
The Autocorrelation Function based on MATLAB Optimization of Pitch Detection
WANG Li
(Qinghai Normal University Physics Department Pronunciation and Image Laboratory, Xi'ning 810008, China)
Abstract: Pitch is an important parameter of speech signals, which is when the hair dullness caused by the cyclical nature of vocal fold vibration. Pitch extraction is an important task of speech processing. Currently there are a lot of pitch detection methods, typically there is self-correlation method, AMDF (short-time average magnitude difference) method, cepstrum, etc. Here are a self-correlation and cepstrum combination of algorithms, the more traditional autocorrelation have some improvements.
Key words: autocorrelation; cepstrum; the three-level center clipping
基音是語音信號處理中的一個非常重要的參數(shù)。準(zhǔn)確地檢測出基音周期對語音的分析,合成,以及語音的壓縮編碼,語音識別等有重要的意義。
自相關(guān)法和倒譜分析是基音周期估計比較常用的方法,濁音信號的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值。文獻(xiàn)[3]采用對濁音信號的預(yù)處理,改進(jìn)自相關(guān)函數(shù),文獻(xiàn)[4]采用自相關(guān)函數(shù)與短時平均幅度差函數(shù)的結(jié)合,改進(jìn)自相關(guān)函數(shù)。本文提出自相關(guān)法和倒譜分析相結(jié)合的處理方法,獲得優(yōu)于傳統(tǒng)自相關(guān)函數(shù)的檢測效果。
1 各種函數(shù)應(yīng)用于基音檢測的原理
1.1 自相關(guān)函數(shù)應(yīng)用于基音檢測的原理
對于時間離散化的確定性信號,自相關(guān)函數(shù)定義為:
(1)
對于周期性信號序列,自相關(guān)函數(shù)定義為:
,式中k為延遲點數(shù)。 (2)
自相關(guān)反映了信號和其自身作了一段延遲后的相似程度,一個周期信號的自相關(guān)函數(shù)也是周期的,并且和原信號的周期相同,有R(k)=R(k+Np)。濁音是聲帶的周期性開啟,閉合產(chǎn)生的,具有周期性。所以它的自相關(guān)的周期就代表著濁音的周期,且在周期整數(shù)倍位置上出現(xiàn)峰值,一般情況取最大峰值點作為基頻點;清音是不由聲帶振動產(chǎn)生的,因而不具周期性。自相關(guān)法就是通過這個性質(zhì)來檢測基音的。
1.2 倒譜應(yīng)用于基音檢測的原理
倒譜定義為時間序列的z變換的模的對數(shù)的逆z變換。具體說,序列x(n)的倒譜c(n)定義為:
(3)
或表示成傅立葉變換形式:
(4)
語音產(chǎn)生模型是一個由周期脈沖序列(濁音)或白噪聲序列(清音)激勵的線性濾波器,在一幀內(nèi)近似認(rèn)為濾波器是時不變的,因此,語音信號序列是激勵源和濾波器的沖激響應(yīng)的卷積。倒譜將卷性語音變換為加性語音,分離出激勵源和濾波器。
1.3 三電平中心削波的原理
三電平中心削波的輸入輸出函數(shù)為:
(5)
即削波器的輸出在x(n)>CL時為1,x(n)<-CL時為-1,除此以外都為0。這樣可以增加剛剛超過電平的峰的重要性,濾除大多數(shù)次要的峰,只保留了明顯的具有周期性的峰,避免了對清音段不必要的分析處理,這對后期處理有很大的好處。
2 改進(jìn)的算法的提出與實現(xiàn)
改進(jìn)的算法主要包含一下幾個方面:分幀加窗及低通濾波,濁音信號預(yù)處理(三電平中心削波),作自相關(guān)變換,倒譜分析,基音檢測6個部分。
語音是不平穩(wěn)的時變信號,在時間足夠短的情況下,可以近似認(rèn)為是平穩(wěn)的,這就涉及到分幀,一般要求一幀至少包含2個以上的周期,基于自相關(guān)和倒譜分析,折中選擇窗長為180。語音的基頻一般都在500HZ以下,即使女高音C調(diào)最高也不會超過1kHZ[2]。所以從只保留基頻的角度出發(fā),用一個1kHZ帶寬的低通濾波器對語音事先濾波是有好處的。估計基音周期真正有用的是出現(xiàn)在周期處的振幅高的自相關(guān)峰,其他較低的諧波峰都是多余的?;谶@種認(rèn)識,用三電平中心削波,去除大多數(shù)次要的峰,保留具有周期性的峰。然后作自相關(guān),在自相關(guān)的基礎(chǔ)上再進(jìn)行倒譜分析,以防止自相關(guān)出現(xiàn)的半頻和倍頻的錯誤,使基音檢測更準(zhǔn)確。本文采用一段8kHZ采樣的純凈語音的一幀為例來說明本文算法的優(yōu)越性。應(yīng)用自相關(guān)和倒譜分析相結(jié)合的算法,較傳統(tǒng)的自相關(guān)有所改進(jìn)。
3 實驗驗證
語音采樣為8kHZ,幀長為180,幀移為60,取出其中一幀濁音幀,如圖1。
從圖1我們可以大致估計一下基音周期,180個樣點大致包含了5個周期,那么周期就應(yīng)該在30左右。
圖2是用傳統(tǒng)方法作的自相關(guān)函數(shù),根據(jù)自相關(guān)函數(shù)中的周期是在第一最高峰所對應(yīng)的位置,得出周期為16。這就出現(xiàn)了與圖1中的結(jié)論不一致,出現(xiàn)了倍頻現(xiàn)象。圖3是經(jīng)過低通濾波和三電平中心削波后作的自相關(guān)函數(shù),它的最高峰在第二個峰上,讀出周期為32,符合圖1中的結(jié)論,說明是準(zhǔn)確的。
圖4是傳統(tǒng)的倒譜圖,在n=0的附近有很高的峰起,它的周期性表現(xiàn)在具有同樣周期的沖激上。在0~40之間,存在著兩個沖激,峰值相差不大,就很難判斷是哪個沖激是我們需要的,這就給基音檢測增加了難度。圖5是經(jīng)過低通濾波和三電平中心削波后的自相關(guān)的倒譜,它與圖4相比較,具有明顯的沖激,可以很容易得讀出周期32。圖5具有較圖2,圖3,圖4更好的檢測周期的性能。本文所提出的算法較傳統(tǒng)的自相關(guān)函數(shù)和倒譜分析均有改進(jìn)之處,并取得了較好的實驗結(jié)果。
4 總結(jié)
該文提出了一種結(jié)合自相關(guān)函數(shù)和倒譜分析的算法,并通過實驗證明了它較傳統(tǒng)的自相關(guān)和倒譜分析的準(zhǔn)確性更高,有更好的檢測效果。
參考文獻(xiàn):
[1] 胡航.語音信號處理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2002.
[2] 姚天任.數(shù)字語音處理[M].武漢:華中科技大學(xué)出版社,2007.
[3] 楊森斌,陳硯圃,李真.一種改進(jìn)的自相關(guān)函數(shù)基音檢測算法[J].現(xiàn)代電子技術(shù),2008,272(9):135-137.
[4] 李娟,張雪英.一種改進(jìn)的抗噪基音檢測算法[J].太原理工大學(xué)學(xué)報,2008,39(2):116-118.
[5] 胡瑛,陳寧,夏旭.一種改進(jìn)的自相關(guān)基音檢測算法[J].電子科技,2007(2):25-28.
[6] 付青青,吳愛平.基于Matlab的語音信號自相關(guān)基音檢測[J].長江大學(xué)學(xué)報:自然科學(xué)版,2006,3(4):99-102.