鮑楓,劉鑫,賈懋王申,鮑長春
音頻帶寬擴展技術(shù)分析與展望?
鮑楓,劉鑫,賈懋王申,鮑長春
(北京工業(yè)大學電子信息與控制工程學院語音與音頻信號處理研究室,北京100124)
對音頻帶寬擴展中的非盲目式和盲目式高頻重建技術(shù)進行了分析、對比,給出了非盲目式高頻重建中的6種技術(shù)及盲目式高頻重建中的4種技術(shù)的基本原理,并對它們各自的優(yōu)劣性進行了評價,指出盲目式高頻重建法將是未來頻帶擴展技術(shù)發(fā)展中關(guān)注和研究的熱點。
音頻信號處理;音頻編碼;帶寬擴展;高頻重建
相對于音頻信號的高頻信息,人耳對音頻信號的低頻信息更敏感,所以,在很多低比特率音頻編碼方法中,為了提高編碼效率,高頻信息幾乎被截去,而只對低頻信息編碼,如MP3[1]、MPEG-2 AAC[2]等編碼方法,這使得重建音頻信號的明亮度與自然度喪失許多,導致整體音頻質(zhì)量下降。
為了還原音頻信號的帶寬,提高音頻解碼質(zhì)量,人們通常將帶寬擴展技術(shù),即高頻重建技術(shù)引入到音頻解碼器中來恢復截去的高頻信息。高頻重建是指碼流中不包含高頻編碼信息時,通過低頻解碼信息來恢復高頻信息的一種技術(shù),其主要目的是拓寬原始編碼信號的有效頻帶,提高解碼音頻信號的質(zhì)量。帶寬擴展方法[3-15]可分為非盲目式高頻重建法[3-11]和盲目式高頻重建法[12-15]。在非盲目式高頻重建法中,編碼器除對低頻信息編碼外,還需對高、低頻相關(guān)參數(shù)、高頻子帶諧波/噪聲屬性和高頻能量包絡(luò)等邊信息進行編碼,解碼器則根據(jù)低頻信息和隱含高頻信息的邊信息來恢復高頻信息;而在盲目式高頻重建法中,編碼器不提取任何隱含高頻信息的參數(shù),解碼器直接用低頻信息來恢復高頻信息。
本文將分別介紹音頻帶寬擴展的非盲目式和盲目式高頻重建方法的基本原理,對相關(guān)技術(shù)進行分析,最后得出結(jié)論。
目前,非盲目式高頻重建法主要包括頻帶復制(Spectral Band Replication,SBR)法[3-6]、簡化參數(shù)的帶寬擴展(Simplified Parameters Bandwidth Extension,SPBE)法[7]、PlusV高頻重建法[8]、Bark帶頻譜建模(Bark Band Spectrum Modeling,BBSM)[9]、基于BBSM的簡化參數(shù)高頻重建[10]和基于最小熵的音頻信號高頻重建法[11]。
2.1 頻帶復制(SBR)法[3-6]
在編碼端,SBR方法首先借助正交鏡像濾波器(Quadrature Mirror Filter,QMF)將輸入信號劃分為64個子帶,并定義前32個子帶包含低頻信息,后32個子帶包含高頻信息。其次,對各高頻子帶進行諧波和噪聲屬性分析,最后將高頻各子帶的諧波和噪聲屬性及能量包絡(luò)參數(shù)隨同低頻信息參數(shù)一同寫入碼流。
在解碼端,首先借助QMF,將解碼后的低頻時域信號分為32個子帶;其次,將各低頻子帶信息復制到各高頻子帶;最后,根據(jù)解碼后高頻各子帶的諧波和噪聲屬性及能量包絡(luò)恢復高頻各子帶信息,即若某一高頻子帶為諧波屬性,則用正弦發(fā)生器生成該頻帶的時域信號;若該頻帶為噪聲屬性,則由白噪聲生成器生成該頻帶的時域信號。
通過上述原理介紹我們可以看出,SBR方法的主要優(yōu)點是直接將低頻子帶的信息復制到高頻子帶,并借助高頻子帶的諧波和噪聲屬性及能量包絡(luò)重建高頻信息。但其缺點是需對原始音頻信號進行分帶處理,并提取高頻子帶的諸多參數(shù),這使得復雜度和加入比特流的參數(shù)信息量很大。為此,文獻[7]提出了一種簡化SBR參數(shù)的方法,下面對其原理進行概要介紹。
2.2 簡化參數(shù)的帶寬擴展(SPBE)法[7]
在編碼端,SPBE方法首先對輸入音頻信號進行修正的離散余弦變換(Modified Discrete Cosine Transform,MDCT),將得到的一組MDCT系數(shù)等分到N個子帶中,并定義前N/2個子帶包含低頻信息,后N/2個子帶包含高頻信息;其次,利用各子帶中的MDCT系數(shù)計算各低頻子帶與各高頻子帶的相關(guān)系數(shù)及各高頻子帶能量;最后,將各高頻子帶的能量參數(shù)、高低頻子帶相關(guān)系數(shù)隨同低頻MDCT系數(shù)一同寫入碼流。
在解碼端,首先將解碼后的低頻時域信號分為N/2個子帶;其次,根據(jù)高低頻子帶相關(guān)系數(shù),判斷是否存在與高頻子帶相關(guān)的低頻子帶,如果有,則將對應(yīng)的低頻子帶信息復制到對應(yīng)的高頻子帶;如果沒有,則將對應(yīng)的高頻子帶填充隨機白噪聲;最后,利用高頻子帶能量信息調(diào)整時域幅度,完成高頻重建。
通過上述的原理介紹我們可以看出,SPBE方法與SBR相比,避免了分帶處理,而是利用MDCT建立起的高低頻子帶相關(guān)性及高頻子帶能量進行低頻子帶信息復制或噪聲填充來實現(xiàn)高頻信息重建,該方法具有復雜度低和邊信息少的優(yōu)勢。
2.3 PlusV高頻重建法[8]
在編碼端,首先將輸入音頻信號的有效帶寬一分為二,并將高頻帶等分為N個子帶。然后依次檢測各高頻子帶是否存在類正弦峰值,如果存在,則記錄該峰值的能量及對應(yīng)頻率。接下來則去除各高頻子帶的類正弦峰值,使各高頻帶只剩下類噪聲成分,并分別計算每個高頻子帶的類噪聲能量。最后,將類正弦峰值的能量與其對應(yīng)的頻率及高頻各子帶類噪聲能量參數(shù)隨同低頻信息參數(shù)一同寫入碼流。
在解碼端,首先將高頻帶等分為N個子帶,然后用白噪聲填充各高頻子帶,并用解碼的高頻各子帶類噪聲能量調(diào)整各子帶能量。最后,利用解碼的類正弦峰值的能量及其所對應(yīng)的頻率,在各高頻子帶加入正弦峰值,完成最終的高頻信息重建。
通過上述原理分析可以看出,PlusV方法利用了音頻信號的高頻信息由噪聲和類正弦信號混合組成的特點。該方法主要以噪聲來填充高頻帶,這對于高頻帶以噪聲為主要成分的信號而言,高頻重建效果較好,人耳很難聽出解碼信號與輸入信號的差別。但是由于其重建所得的高頻頻譜并不精細,對于諧波成分多、噪聲成分少的音頻信號而言,難免會引入人工噪聲,人耳對此噪聲會有所感知,造成音頻質(zhì)量下降。
2.4 Bark帶頻譜建模(BBSM)法[9]
在編碼端,首先對輸入音頻信號進行FFT變換,并計算高頻帶與本地解碼的低頻帶信息之間的相關(guān)系數(shù);其次,將輸入信號的高頻幅度譜與本地解碼的低頻幅度譜分別按Bark尺度進行子帶劃分,并將高頻Bark子帶分為N個組,低頻前M個Bark子帶歸為一個組,這里N應(yīng)是M的倍數(shù)。最后,計算各高頻子帶組與低頻子帶組的能量比隨同低頻信息參數(shù)一同寫入碼流。
在解碼端,首先對低頻解碼信息進行采樣,并利用Bark尺度進行子帶劃分;其次,根據(jù)解碼的相關(guān)系數(shù)進行高低頻相關(guān)性判斷,當相關(guān)系數(shù)小于給定閾值時,用隨機白噪聲填充高頻各Bark子帶;反之,將解碼的前M個低頻Bark子帶信息復制到各高頻子帶組;最后,根據(jù)解碼的高頻子帶組與低頻子帶組的能量比,對高頻Bark子帶的能量進行調(diào)整,完成最終的高頻重建。
通過上述原理分析可以看出,BBSM方法借助Bark尺度進行非均勻分帶[16],使得子帶寬度呈指數(shù)增長,避免了前面3種方法對頻帶進行均勻劃分的缺陷,有效減少了分帶數(shù)目及表示高頻信息的參數(shù)。但是,由于該方法使用一組相同的Bark帶低頻信息去重建各組Bark帶高頻信息,并沒有使用與高頻子帶相關(guān)性最大的低頻子帶去重建高頻信息,因此得到的不是最佳的重構(gòu)信息。
2.5 基于BBSM的簡化參數(shù)高頻重建方法[10]
在編碼端,首先將輸入信號等分為N個子帶;其次,根據(jù)子帶能量差異和過零率,對相鄰兩幀信號相同低頻子帶進行相關(guān)性判斷,并提取相關(guān)性最強的M個低頻子帶,作為高頻重建單元;接著,比較相鄰兩幀高頻各子帶的能量差異,只有當差異值大于給定門限時,才傳遞高、低頻子帶能量比;最終將提取的M個低頻子帶的索引值、高頻子帶的能量差異與高、低頻子帶能量比參數(shù)隨同低頻信息參數(shù)一同寫入碼流。
在解碼端,首先,將解碼的低頻信號等分為N/2個子帶;其次,利用相鄰兩幀高頻各子帶的能量差異進行頻帶復制判斷,當差異值大于給定門限時,則將M個低頻子帶復制到高頻帶,并利用高、低頻子帶能量比對其進行能量調(diào)整得到高頻信息;反之,則填充隨機白噪聲得到高頻信息。
通過上述原理分析可以看出,此方法避免了BBSM中使用固定的低頻信息重建高頻信息的缺陷,通過選擇相關(guān)性最好的低頻子帶對高頻帶進行重建,進一步減少了表示高頻的參數(shù),有利于提升重建質(zhì)量。
2.6 基于最小熵的音頻信號高頻重建法[11]
在編碼端,輸入音頻信號經(jīng)FFT變換后被等分為N個子帶,將提取的高頻各子帶的包絡(luò)能量信息隨同低頻信息參數(shù)一同寫入碼流。
在解碼端,將信號等分為N個子帶,低頻解碼信息填入對應(yīng)的低頻子帶,高頻子帶均賦為零值,同時加入直流信息,構(gòu)成一個全頻帶信號。經(jīng)IFFT變換后,得到時域信號。將此時域信號作為初始全頻帶信號,結(jié)合高頻包絡(luò)能量信息,用最小熵算法[11,17]循環(huán)迭代不斷得到新的全頻帶信號。每次恢復出全頻帶信號后,都將其與初始全頻帶信號做相關(guān)性檢測,當相關(guān)系數(shù)小于某個門限值時,迭代停止,此時恢復的全頻帶信號即為解碼信號。
通過上述原理分析可以看出,該方法利用了最小熵準則來對低頻信息進行譜外推得到高頻信息,其核心思想是利用信息熵來度量信號的頻譜分辨率,通過求取最小信息熵來提高信號的頻譜分辨率,使得外推得到的高頻譜信息更加準確。其重建音頻信號的高頻譜信息更加豐富,從而使得重建信號更加飽滿自然。但是,由于本方法沒有對高頻細節(jié)譜進行精確恢復,當處理高頻能量較強的信號時,難免會引入輕微的噪聲。
目前,盲目式高頻重建法主要包括線性外推(Linear Extrapolation,LE)[12]、有效高頻帶寬擴展(Efficient High-frequency Bandwidth Extension,EHBE)[13,14]、混合信號外推(Hybrid Signal Extrapolation,HSE)[15]和非線性預測[18]等。
3.1 線性外推(LE)法[12]
LE法利用音頻信號的對數(shù)幅度譜包絡(luò)呈近似線性遞減關(guān)系來進行高頻重建。
在解碼端的高頻重建中,需要恢復的高頻信息包括兩部分內(nèi)容,即高頻譜包絡(luò)和高頻譜細節(jié)。高頻譜包絡(luò)借助幅度譜的線性關(guān)系獲得,高頻譜細節(jié)通過復制低頻帶的諧波結(jié)構(gòu)獲得。具體步驟如下:
首先,對低頻解碼信號進行時頻變換得到其譜包絡(luò);其次,采用線性最小二乘法將該包絡(luò)在對數(shù)域擬合成一條直線,得到該直線的最佳斜率和截距;最后,將低頻譜信息進行復制得到高頻譜細節(jié),并利用擬合直線的斜率對高頻譜細節(jié)進行包絡(luò)衰減,完成最后的高頻重建。
通過上述原理分析可以看出,LE方法利用了強制譜包絡(luò)遞減的方法來保證重構(gòu)的高頻信息不會淹沒低頻信息,但當實際的音頻頻譜包絡(luò)在對數(shù)域不呈下降趨勢時,重構(gòu)高頻信息將與原始譜有較大差別。
3.2 有效高頻帶寬擴展(EHBE)法[13,14,19]
在解碼端的高頻重建中,EHBE法首先將低頻解碼的信號(截止頻率為fcut)進行帶通濾波,得到此低頻解碼信號的最高八度音信號(截止頻率為起始頻率兩倍的帶限音頻信號[19]),將其定義為基波B1(fcut/2~fcut)。然后經(jīng)非線性手段產(chǎn)生基波B1的二次諧波B2(fcut~2fcut)、三次諧波B3(2fcut~3fcut)等一系列諧波,將包含這些諧波的信號記為S。接著將信號S經(jīng)另一個帶通濾波器處理,得到所需的諧波集合BS(fcut~fhigh),并將其作為重建高頻信息。這里,fhigh為頻帶展寬后信號的截止頻率。最后調(diào)整此高頻信息的增益,并與低頻解碼信號結(jié)合,得到全頻帶音頻信號。
通過上述原理分析可以看出,EHBE法是一種基于八度音信號的高頻重建方法,其優(yōu)點是計算復雜度低,針對不同帶寬的信號,只需更改濾波器系數(shù)和諧波增益就可進行高頻重建。其缺點是,帶通濾波器的過渡帶會使八度音信號的截止頻率不精準,從而導致重建高頻信息的準確性下降。
3.3 混合信號外推(HSE)法[15]
在解碼端的高頻重建中,HSE法首先對每幀低頻解碼信號進行線性預測,并利用預測系數(shù)將每幀信號進行前向和后向外推,以增加時域信號的長度。這樣做的目的是為了提高每幀信號的頻域分辨率,保證頻域外推的準確性。其次,將增長的時域信號加窗,經(jīng)FFT變換得到頻域系數(shù),并對這些系數(shù)進行動態(tài)估計,得出截止頻率。在處理截止頻率未知或變化的音頻信號時,此操作避免了信號低頻譜與重建高頻譜之間產(chǎn)生譜間隙。最后,將FFT系數(shù)轉(zhuǎn)換到對數(shù)域進行線性預測,并利用預測系數(shù)外推得到高頻譜信息,完成最終的高頻重建。
通過上述原理分析可以看出,HSE法是一種時域外推和頻域外推相結(jié)合的高頻重建方法。由于截止頻率檢測模塊的存在,使得此方法適用于未知截止頻率或可變截止頻率音頻信號的高頻重建,從而擴大了應(yīng)用范圍。但是,如果此方法處理的是瞬態(tài)信號,如鼓聲等,增加樣點數(shù)的時域外推步驟將導致信號動態(tài)特性的丟失,從而在反變換后將無法精確恢復出瞬態(tài)信息。
3.4 非線性預測法[18]
在解碼端的高頻重建中,非線性預測法首先將截去高頻信息的時域信號進行分幀處理,并對相鄰兩幀的信號進行MDCT變換,得到低頻MDCT系數(shù);其次,求取此低頻MDCT系數(shù)的嵌入維和延遲量來重構(gòu)音頻非線性動力系統(tǒng)的相空間;接著在重構(gòu)相空間中,利用Lyapunov指數(shù)對MDCT系數(shù)序列的混沌特性進行檢測,一旦MDCT系數(shù)具有混沌特性后,則利用局部自適應(yīng)非線性預測結(jié)合低頻MDCT系數(shù)預測得到高頻MDCT系數(shù);而后再根據(jù)人耳的聽覺特性與高、低頻MDCT系數(shù)間的相關(guān)性,對高頻MDCT系數(shù)譜信息的諧波成分進行調(diào)整;最后,將原有的低頻MDCT系數(shù)與重建所得高頻MDCT系數(shù)結(jié)合,利用逆MDCT變換將其變換到時域,得到經(jīng)過頻帶擴展后的全頻帶時域信號。
通過上述原理分析可以看出,該非線性預測法是一種利用音頻信號的非線性動力學特性及人耳的聽覺特性的盲目式頻帶擴展方法,更符合音頻變化的一般規(guī)律,一但找到了理想的相空間,則會產(chǎn)生高質(zhì)量的高頻信息。這是一項暫新的課題,有待進一步研究。
通過分析上述兩類音頻高頻重建方法可以看出,利用頻帶擴展技術(shù)能夠在較低的碼率下實現(xiàn)對高質(zhì)量音頻的良好重建,對降低高帶寬音頻處理、存儲和傳輸成本具有重要的意義。
本文描述了目前主流的音頻頻帶擴展技術(shù),分別針對盲目式和非盲目式兩類高頻重建法的關(guān)鍵技術(shù)進行了詳細闡述。非盲目式高頻重建法需要編碼端提取額外的邊信息,邊信息越豐富,重建高頻的質(zhì)量越好,但這些邊信息會增加編碼的比特數(shù),降低整個編碼器的編碼效率。而盲目式高頻重建法則不需要編碼端提供任何邊信息,解碼端只根據(jù)低頻信息就可得到高頻信息。因缺少相應(yīng)的高頻邊信息,盲目式高頻重建法的性能通常要遜色于非盲目式高頻重建法,但盲目式高頻重建法可大大節(jié)省編碼比特數(shù),有效提高編碼效率。因此,在未來頻帶擴展技術(shù)發(fā)展的過程中,盲目式高頻重建法會同時受到客戶和制造企業(yè)的青睞,其研究工作也將日益成為人們關(guān)注的熱點。
參考文獻:
[1]ISO/IEC 11172-3,Coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbit/s——Part 3 Audio[S].
[2]ISO/IEC 13818-7,Information technology-Generic coding of moving pictures and associated audio information-Part 7:Advanced Audio Coding(AAC)[S].
[3]ISO/IEC,WD Text for Backward Compatible Bandwidth Extension for General Audio Coding[S].
[4]Per Ekstrand,Andreas Ehret,Manfred Lutzky,et al.Enhancing mp3 with SBR:Features and Capabilities of the new mp3PRO Algorithm[C]//Proceedings of the 112th AES Convention.Munich,Germany:AES,2002:1-7.
[5]Martin Dietz,Lars Liljeryd,Kristofer Kj?rling,et al.Spectral Band Replication,a novel approach in audio coding[C]//Proceedings of the 112th AES Convention.Munich,Germany:AES,2002:1-8.
[6]Per Ekstrand.Bandwidth extension of audio signals by spectral band replication[C]//Proceedings of the 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio.Leuven,Belgium:IEEE,2002:53-58.
[7]黃遠軍,胡劍凌.一種簡化參數(shù)的音頻信號譜擴展技術(shù)[J].電聲技術(shù),2007,31(4):45-48.
HUANG Yuan-jun,HU Jian-ling.Research on the Bandwidth Extension Algorithm for the Audio Signal Using the Simplified Parameters[J].Audio Engineering,2007,31(4):45-48.(in Chinese)
[8]VLSI Solution Oy.PlusV Specification:VLSI Solution PlusV[R].Finland:VLSI,2001.
[9]Jeongil Seo,Daeyoung Jang,Jinwoo Hong,et al.A Simple Method for Reproducing High Frequency Components at Low-Bit Rate Audio Coding[C]//Proceedings of the 113th AES Convention.Los Angeles,California:AES,2002:1-7.
[10]潘政彥.節(jié)省參數(shù)并提升音質(zhì)之改良式高頻重建方法[D].臺灣:大葉大學,2005. PAN Jeng-yan.A Solution of High Frequency Reconstruction for Saving more Parameters and Improving Quality[D]. Taiwan:Da-Yeh University,2005.(in Chinese)
[11]白曉亮,胡劍凌,徐盛.基于最小熵的音頻信號高頻重建[J].電聲技術(shù),2006,30(2):37-40.
BAI Xiao-liang,HU Jian-ling,XU Sheng.Minimum Entropy Based High Frequency Reconstruction of Audio Signal[J]. Audio Engineering,2006,30(4):37-40.(in Chinese)
[12]Chi-Min Liu,Wen-Chieh Lee,Han-Wen Hsu.High frequency reconstruction for band-limited audio signals[C]//Proceedings of the 6th International Conference on Digital Audio Effects.London,UK:IEEE,2003:1-6.
[13]Erik Larsen,Ronald M Aarts,Michael Danessis.Efficient high-frequency bandwidth extension of music and speech[C]//Proceedings of the 112th AES Convention.Munich,Germany:AES,2002:1-5.
[14]Ronald M Aarts,Erik Larsen,Dani?l Schobben.Improving perceived bass and reconstruction of high frequencies for band limited signals[C]//Proceedings of the 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio.Leuven,Belgium:IEEE,2002:59-71.
[15]Chatree Budsabathon,Akinori Nishihara.Bandwidth Extension with Hybrid Signal Extrapolation for Audio Coding[J]. IEICE Transactions on Fundamentals,2007,E90-A(8):1564-1569.
[16]Julius O Smith,Jonathan S Abel.Bark and ERB Bilinear Transforms[J].IEEE Transactions on Speech and Audio Processing,1999,7(6):697-708.
[17]Mauricio D Sacchi,Danilo R Velis,Alberto H Cominguez. Minimum entropy deconvolution with frequency-domain constraints[J].Geophysics,1994,59(6):938-945.
[18]Yong-tao Sha,Chang-chun Bao,Mao-shen Jia,et al. High frequency reconstruction of audio signal based on chaotic prediction theory[C]//Proceedings of IEEE International conference on Acoustics speech and signal processing. Dallas,Texas,USA:IEEE,2010:381-384.
[19]沙永濤,鮑長春,賈懋王申.一種基于重構(gòu)八度音的音頻信號高頻重建方法[C]//第十四屆全國信號處理學術(shù)年會(CCSP-2009)論文集.長沙:[s.n.],2009:139-142.
SHA Yong-tao,BAO Chang-chun,JIA Mao-shen.A Method of High Frequencies Reconstruction of Audio signal based on Reconstructed Octave[C]//Proceeding of the 14th Annually Academic Conference on Signal Processing.Changsha,China:[s.n.],2009:139-142.(in Chinese)
BAO Feng was born in Changchun,Jilin Province,in 1990.He is now a principal investigator of National Innovation Research and Training Program for Beijing University of Technology.His research concerns audio information processing.He holds an excellent award for course study and a top award for Embedded System Design Competition of Yu-xing Cup.
劉鑫(1986-),男,北京人,北京工業(yè)大學碩士研究生,主要研究方向為音頻信號處理;
LIU Xin was born in Beijing,in 1986.He is now a graduate student.His research direction is audio signal processing.
賈懋王申(1982-),男,河北張家口人,2010年獲北京工業(yè)大學博士學位,現(xiàn)為講師,主要研究方向為語音與音頻編碼;
JIA Mao-shen was born in Zhangjiakou,Hebei Province,in 1982.He received the Ph.D.degree in Electrical Engineering from Beijing University of Technology in 2010.He is now a lecturer.His research direction is speech and audio coding.
鮑長春(1965-),男,內(nèi)蒙古赤峰人,北京工業(yè)大學教授、博士生導師,主要研究方向為語音與音頻信號處理。
BAO Chang-chun was born in Chifeng,Neimonggol Autonomous Region,in 1965.He is now a professor and also the Ph.D.supervisor. His research direction is speech and audio signal processing.
Email:chchbao@bjut.edu.cn
Analysis and Forecast of Audio Bandwidth Extending Techniques
BAO Feng,LIU Xin,JIA Mao-shen,BAO Chang-chun
(Speech and Audio Signal Processing Lab,School of Electronic Information and Control Engineering,Beijing University of Technology,Beijing 100124,China)
The non-blind and blind high frequency reconstruction methods for extending audio bandwidth are introduced and compared in this paper.The basic principles of six specific methods related to the non-blind one and four specific methods related to the blind one are given,respectively.Their advantages and disadvantages of these methods are evaluated as well.Finally,it is pointed out that the blind high frequency reconstruction will be the research focus in the development of bandwidth extending.
audio signal processing;audio coding;bandwidth extension;high frequency reconstruction
The National Natural Science Foundation of China(No.60872027,61072089);The Natural Science Foundation of Beijing(No.4082006);The Funding Project for Academic Human Resources Development in Institutions of Higher Learning Under the Jurisdiction of Beijing Municipality;National Innovation Research and Training Program for Beijing University of Technology(No.101000506)
TN912.3
A
10.3969/j.issn.1001-893x.2011.02.025
鮑楓(1990-),男,吉林長春人,北京工業(yè)大學國家大學生創(chuàng)新性實驗項目負責人,主要研究興趣為音頻信息處理,曾獲北京工業(yè)大學學習優(yōu)秀獎和北京工業(yè)大學“裕興杯”嵌入式系統(tǒng)設(shè)計競賽一等獎;
1001-893X(2011)02-0122-05
2010-11-08;
2011-01-17
國家自然科學基金資助項目(60872027,61072089);北京市自然科學基金資助項目(4082006);北京市屬高等學校人才強教計劃;北京工業(yè)大學國家大學生創(chuàng)新性實驗項目(101000506)