摘要:提出了一種基于頻域信噪比和復(fù)雜信號檢測的語音活動檢測方法(VAD)。首先對每一幀語音信號進(jìn)行傅利葉變換。將頻域內(nèi)信號劃分成幾個頻帶,求得每一個頻帶的信噪比,利用估計得到的噪聲能量產(chǎn)生一個閾值,并進(jìn)行VAD的預(yù)判,得到一個判定結(jié)果。其次,利用音樂信號的相關(guān)性,將高通后自相關(guān)系數(shù)與閾值進(jìn)行比較,得出另一個判定結(jié)果。最后,聯(lián)合兩個判定結(jié)果,得出最終的判定。實(shí)驗表明,這種算法可以較好地應(yīng)用于復(fù)雜語音活動檢測。
關(guān)鍵詞:語音活動檢測;信噪比;復(fù)雜信號;自相關(guān)系數(shù)
引言
語音活動檢測是語音通信中的一項重要技術(shù)。在噪聲抑制、語音增強(qiáng)中,正確地檢測語音和噪聲,直接影響到這些算法的性能。在VoIP(voice overIP)中,VAD也擔(dān)當(dāng)著重要的角色,通過VAD檢測,可以節(jié)省帶寬,在有限帶寬中,提供更好質(zhì)量的語音。
VAD算法一般是利用語音信號與噪聲信號的特性不同,提出一些特征值,并與閾值進(jìn)行比較,從而得到判定結(jié)果。現(xiàn)在VAD算法中,有短時能量檢測、過零率檢測、自適應(yīng)能量檢測、線性預(yù)測模型檢測、基音周期檢測、概率檢測等方法。
本文提出的基于頻域和復(fù)雜信號檢測相結(jié)合的方法,語音信號被劃分成不同的頻帶,算出每一個頻帶的信號能量和背景噪聲,結(jié)合高通自相關(guān)系數(shù),可較好地完成VAD檢測。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文