王晶, 劉寶光, 費(fèi)澤松, 張劍寅
(1.北京理工大學(xué) 信息與電子學(xué)院, 北京 100081;2.中國(guó)移動(dòng)通信集團(tuán)公司研究院, 北京 100053)
?
基于AMR-WB編解碼器的移動(dòng)網(wǎng)絡(luò)話(huà)音傳輸抗丟包算法
王晶1, 劉寶光1, 費(fèi)澤松1, 張劍寅2
(1.北京理工大學(xué) 信息與電子學(xué)院, 北京 100081;2.中國(guó)移動(dòng)通信集團(tuán)公司研究院, 北京 100053)
針對(duì)移動(dòng)通信網(wǎng)絡(luò)中AMR-WB編解碼器在話(huà)音分組傳輸中的抗丟包問(wèn)題,提出了一種與VoLTE系統(tǒng)中語(yǔ)音編碼速率相匹配的AMR-WB抗丟包實(shí)現(xiàn)方案. 通過(guò)實(shí)驗(yàn)分析AMR-WB編解碼器中經(jīng)過(guò)錯(cuò)誤隱藏恢復(fù)的各個(gè)參數(shù)對(duì)語(yǔ)音質(zhì)量的影響,利用多描述編碼(multiple description coding,MDC)技術(shù)設(shè)計(jì)了AMR-WB抗丟包方案,并進(jìn)一步結(jié)合刪余卷積編碼提出了雙重差錯(cuò)保護(hù)的增強(qiáng)型抗丟包算法,實(shí)現(xiàn)了多碼率下的差錯(cuò)保護(hù)和速率匹配,該方案可兼容原有AMR-WB編碼模式下的語(yǔ)音編碼速率. 仿真結(jié)果表明,提出的新方案能夠增強(qiáng)AMR-WB的抗丟包能力,并且不需要增加額外的信令開(kāi)銷(xiāo),兼容現(xiàn)有系統(tǒng)網(wǎng)絡(luò)中的多速率語(yǔ)音編碼.
AMR-WB;MDC;刪余卷積編碼;移動(dòng)網(wǎng)絡(luò)
自適應(yīng)多速率寬帶語(yǔ)音編解碼器(adaptive multi rate-wide band,AMR-WB),憑借其優(yōu)異的性能在2001年3月被3GPP采納,成為用于GSM和第三代移動(dòng)通信WCDMA系統(tǒng)的寬帶語(yǔ)音編碼器[1]. 由于AMR-WB編碼器參數(shù)之間具有很強(qiáng)的依賴(lài)性,丟失的語(yǔ)音包不但影響本幀語(yǔ)音的解碼,還會(huì)造成錯(cuò)誤傳播,影響到隨后語(yǔ)音幀的正確解碼. 另外AMR-WB自帶的差錯(cuò)隱藏模塊只在較低的丟包率條件下才能夠保證語(yǔ)音質(zhì)量,所以進(jìn)一步增強(qiáng)AMR-WB的抗丟包能力是十分必要的.
本文利用MDC技術(shù)增強(qiáng)AMR-WB的抗丟包能力,并結(jié)合刪余卷積編碼技術(shù)調(diào)整編碼速率,在此基礎(chǔ)上提出了一種與移動(dòng)網(wǎng)絡(luò)話(huà)音編碼速率相融合的新型AMR-WB抗丟包方法. 本文的算法在實(shí)際應(yīng)用中只需要在移動(dòng)終端中加入兩個(gè)單獨(dú)的處理模塊,而不需要修改移動(dòng)網(wǎng)絡(luò)協(xié)議或者增加額外的信令即可增強(qiáng)移動(dòng)網(wǎng)絡(luò)的抗丟包能力,實(shí)現(xiàn)起來(lái)較為方便.
1.1 AMR-WB簡(jiǎn)介
AMR-WB編碼器所采用的是代數(shù)碼本激勵(lì)線性預(yù)測(cè)編碼(algebraic code excited linear prediction,ACELP)結(jié)構(gòu),如圖1所示. 它基于分析-合成結(jié)構(gòu),從固定碼本(代數(shù)碼本)和自適應(yīng)碼本中分別搜索出最佳碼矢量,乘以各自的最佳增益后相加,其和即是ACELP激勵(lì)信號(hào)源. 提取的ACELP模型參數(shù)包括兩部分:按幀提取的線性預(yù)測(cè)(linear prediction,LP)系數(shù);以及每子幀提取一次的固定碼本,固定碼本增益,基音周期和自適應(yīng)碼本增益[2].
1.2 AMR-WB幀結(jié)構(gòu)
AMR-WB編碼器共有9種編碼模式,每一種編碼模式的速率分別為23.85,23.05,19.85,18.25,15.85,14.25,12.65,8.85和6.60 kbit/s[3]. 其中編碼速率12.65 kbit/s及以上碼率模式都能夠提供高質(zhì)量的寬帶語(yǔ)音,專(zhuān)門(mén)設(shè)計(jì)的兩個(gè)低碼率模式6.60和8.85 kbits主要用于惡劣的無(wú)線信道環(huán)境或者網(wǎng)絡(luò)擁塞的場(chǎng)合.
如圖2所示為AMR-WB一般的幀格式,幀類(lèi)型占4 bits,表示從0~15共16個(gè)數(shù)字,其中0~8分別表示9種編碼模式,9、14、15分別用于表示AMR-WB靜默幀、語(yǔ)音丟失指示、沒(méi)有數(shù)據(jù)(沒(méi)有發(fā)送或者接收),10~13用于將來(lái)的使用. 在所提出的方案中利用10來(lái)指示這一幀信號(hào)是否為MDC幀信號(hào),這樣就不需要額外的信令信息,只需要利用幀格式中的一個(gè)比特來(lái)進(jìn)行判斷所傳語(yǔ)音信號(hào). 幀質(zhì)量指示(frame quality indicator,F(xiàn)QI)占用1 bit,F(xiàn)QI為1表示幀無(wú)誤,F(xiàn)QI為0表示幀信息出現(xiàn)錯(cuò)誤.
帖類(lèi)型4bits幀質(zhì)量指示1bit幀模式指示4bits模式需求指示4bits校驗(yàn)比特8bitsA類(lèi)B類(lèi)
圖2 一般的AMR-WB幀格式
Fig.2 General frame format of AMR-WB
A類(lèi)比特會(huì)存放一些對(duì)語(yǔ)音質(zhì)量恢復(fù)比較重要的比特?cái)?shù)據(jù),如果接收到數(shù)據(jù)信息以后,檢測(cè)到A類(lèi)信息出錯(cuò),在解碼端就會(huì)對(duì)A類(lèi)信息進(jìn)行錯(cuò)誤隱藏,對(duì)B類(lèi)信息不需要改變. 以編碼模式2為例,表1為AMR-WB在編碼速率為12.65 kbit/s時(shí)的比特分配,A類(lèi)比特分布如表2所示,其中因?yàn)镮SP參數(shù)和基音周期都是采用的矢量量化編碼,所以A類(lèi)比特保存了ISP參數(shù)和基音周期的高比特位,對(duì)低比特位歸為B類(lèi)信息.
表1 AMR-WB 12.65 kbit/s速率模式下的比特分配
表2 AMR-WB 12.65 kbit/s速率模式下的A類(lèi)比特分布
1.3 AMR-WB各個(gè)參數(shù)對(duì)語(yǔ)音質(zhì)量的影響
為了測(cè)試AMR-WB編解碼器中各個(gè)參數(shù)重要性,采用仿真實(shí)驗(yàn)的方法分別測(cè)試ISP參數(shù)、LTP-filtering長(zhǎng)時(shí)濾波參數(shù)、基音周期、增益、FCB固定碼本對(duì)語(yǔ)音質(zhì)量的影響. 測(cè)試方法:假設(shè)在不同的丟包概率下,只對(duì)測(cè)試參數(shù)進(jìn)行錯(cuò)誤隱藏恢復(fù),其它參數(shù)保持正確解碼,在測(cè)試不同參數(shù)時(shí),確保丟包位置一樣. 利用寬帶PESQ(perceptual evaluation of speech quality)[4]對(duì)解碼出來(lái)的語(yǔ)音信號(hào)進(jìn)行MOS評(píng)分. 在每一種丟包概率下每一種參數(shù)測(cè)試40條標(biāo)準(zhǔn)漢語(yǔ)語(yǔ)料(20條男聲,20條女聲)的PESQ分?jǐn)?shù),計(jì)算所有語(yǔ)料PESQ分?jǐn)?shù)的平均值. 實(shí)驗(yàn)中采用AMR-WB的編碼模式2(語(yǔ)音編碼速率為12.65 kbit/s),測(cè)試結(jié)果如圖3所示. 丟包模型分別采用Bernoulli模型和Gilbert模型.
從圖3中分析7條曲線,得出在AMR-WB編解碼器中,Ltp-filtering參數(shù)對(duì)語(yǔ)音質(zhì)量影響較小,相對(duì)來(lái)說(shuō)影響最不重要,Ltp-filtering占用的比特?cái)?shù)也是相對(duì)最少;影響最大的是基音周期和增益,固定碼本和ISP參數(shù)影響程度差不多.
2.1 MDC技術(shù)在AMR-WB的應(yīng)用
分集技術(shù)能夠利用多徑效應(yīng)來(lái)提高無(wú)線通信系統(tǒng)性能. 分集思想既可以用來(lái)設(shè)計(jì)信道編碼,也可以用來(lái)設(shè)計(jì)信源編碼. 當(dāng)這種思想運(yùn)用到信源編碼時(shí),就產(chǎn)生了多描述編碼技術(shù)[5]. 如圖4所示為一個(gè)典型的多描述編碼系統(tǒng). 語(yǔ)音信號(hào)首先被分解到同等重要的描述中,每個(gè)描述在信道上單獨(dú)傳輸.
新一代移動(dòng)通信TD-LTE系統(tǒng)是基于多載波技術(shù),在每一個(gè)子載波上信號(hào)可以看作是平穩(wěn)的,但是每一個(gè)子載波的衰落也是不一樣的. 在發(fā)送信號(hào)時(shí)可以把每一個(gè)子載波看作是不同衰落的信號(hào),各個(gè)子載波之間是不同衰落信號(hào),子載波間的丟失也是不相關(guān)的,在TD-LTE系統(tǒng)中分組語(yǔ)音業(yè)務(wù)可以采用MDC技術(shù)來(lái)增強(qiáng)AMR-WB抗丟包能力.
目前基于AMR-WB的多描述編碼有多種實(shí)現(xiàn)方法,根據(jù)前面分析不同參數(shù)對(duì)語(yǔ)音質(zhì)量的影響,可以得到基音周期和增益對(duì)語(yǔ)音質(zhì)量的恢復(fù)最為重要,固定碼本和ISP參數(shù)的重要性相對(duì)較小一點(diǎn). 另外固定碼本占用的比特?cái)?shù)的比重最大,所以在多描述編碼中會(huì)考慮不同參數(shù)的重要性及各個(gè)參數(shù)所占用的比特?cái)?shù)的比重,來(lái)合理進(jìn)行多描述編碼. 而文獻(xiàn)[6]中對(duì)各個(gè)參數(shù)重要性的處理滿(mǎn)足前面的分析,所以選用文獻(xiàn)[6]中多描述編碼的實(shí)現(xiàn)方法.
以AMR-WB編碼模式2編碼速率為12.65 kbit/s為例,文獻(xiàn)[6]的編碼參數(shù)在各子幀和兩個(gè)描述中的比特分配如表3所示.
表3 比特分配方案
其中VAD話(huà)音激活檢測(cè)參數(shù)是分布在兩個(gè)描述中,ISP參數(shù)的一級(jí)矢量量化分布在兩個(gè)描述中,而第二級(jí)ISP矢量量化索引中,用20比特編碼的前三個(gè)矢量分配到描述1中,用10個(gè)比特編碼的后兩個(gè)矢量分配到描述2中;對(duì)于參數(shù)LTP-filtering,第1、3子幀放在描述1里面,第2、4子幀放在描述2里面;將基音周期都調(diào)整為9 bits表示,對(duì)于基音周期和增益都是把1、3子幀的放在描述1里,2、4子幀的放在描述2里面;固定碼本中,每子幀中奇數(shù)位上的脈沖分解到描述1中,偶數(shù)位上的脈沖分解到描述2中,這樣當(dāng)一個(gè)描述丟失時(shí),每個(gè)子幀仍然有脈沖信息可以恢復(fù). 并且由于采用子幀脈沖交織的算法,所以需要重新計(jì)算每一個(gè)描述里面的增益,會(huì)多傳入2個(gè)交織碼本增益.
2.2 利用刪余卷積編碼技術(shù)調(diào)整編碼速率
刪余卷積編碼是文獻(xiàn)[7]提出的一種可以實(shí)現(xiàn)不同比率的卷積編碼方案,本文利用刪余卷積編碼對(duì)不同的編碼模式采用不同的卷積編碼比率,來(lái)實(shí)現(xiàn)比特速率匹配. 利用文獻(xiàn)[6]實(shí)現(xiàn)的MDC方法,對(duì)不同的AMR-WB編碼模式采用多描述算法時(shí),不同模式下的比特占用如表4所示.
表4 AMR-WB和MDC算法下不同模式占用的比特?cái)?shù)
Tab.4 The number of bits occupied by different modes under AMR-WB and MDC algorithm
模式AMR?WBMDC013211772162253292328532443173565365639743674618477
采用低模式下的MDC算法來(lái)匹配高模式下的AMR-WB編碼,例如模式2的MDC算法占用292 bits,來(lái)匹配AMR-WB的模式4,這樣就不會(huì)出現(xiàn)占用比特多的情況,為達(dá)到與已有移動(dòng)通信系統(tǒng)相同的話(huà)音編碼比特,反而會(huì)有多余的比特?cái)?shù)據(jù)沒(méi)有得到利用.
本文提出由低模式下的MDC算法來(lái)匹配AMR-WB的高模式編碼,然后多余的比特?cái)?shù)據(jù)通過(guò)進(jìn)行刪余卷積編碼實(shí)現(xiàn)不同的碼率匹配. 比如AMR-WB模式4占用317 bits,而模式2的MDC技術(shù)需要292 bits,這樣MDC方法需要補(bǔ)25 bits才會(huì)和AMR-WB模式4占用相同的比特資源. 通過(guò)對(duì)這25 bits數(shù)據(jù)采取不同碼率的卷積編碼來(lái)實(shí)現(xiàn)語(yǔ)音編碼速率匹配. 由于多余的比特并不是很多,如果對(duì)所有的比特?cái)?shù)據(jù)都進(jìn)行保護(hù),碼率會(huì)比較高,實(shí)驗(yàn)結(jié)果表明這樣做的效果并不好,甚至語(yǔ)音質(zhì)量還會(huì)出現(xiàn)下降的現(xiàn)象. 最終采用不等差錯(cuò)保護(hù)方式,對(duì)重要的比特?cái)?shù)據(jù)進(jìn)行保護(hù),對(duì)不重要的比特?cái)?shù)據(jù)不進(jìn)行操作. 通過(guò)1.3的實(shí)驗(yàn)分析可以得到不同參數(shù)對(duì)語(yǔ)音質(zhì)量的影響不同,所以最終多余的比特?cái)?shù)據(jù)只對(duì)ISP參數(shù)和基音周期進(jìn)行保護(hù),其它參數(shù)不進(jìn)行保護(hù).
所提方案的整體實(shí)現(xiàn)流程如圖5所示,在發(fā)送端首先會(huì)根據(jù)CQI(channel quality indicator)值來(lái)判斷下一步的操作,如果信道質(zhì)量不好,則會(huì)選擇AMR-WB編碼模式下對(duì)應(yīng)的MDC編碼模式,保持語(yǔ)音編碼速率和之前的速率一樣,如果信道質(zhì)量較好,則保持編碼模式不變. 在接收端會(huì)根據(jù)幀頭指示比特來(lái)判斷是否經(jīng)過(guò)MDC和刪余卷積編碼處理,然后再進(jìn)行下一步操作. 對(duì)于實(shí)際移動(dòng)網(wǎng)絡(luò),通過(guò)在移動(dòng)終端加入語(yǔ)音編碼后處理的模塊和語(yǔ)音解碼前處理的模塊,即可實(shí)現(xiàn)語(yǔ)音傳輸?shù)目箒G包功能,而不需要修改終端中其它部分.
本文對(duì)3種抗丟包算法進(jìn)行對(duì)比,包括AMR-WB本身的丟包隱藏算法,文獻(xiàn)[6]中MDC算法,以及本文所提的新方案,其中AMR-WB采用編碼模式4,文獻(xiàn)[6]中MDC算法對(duì)應(yīng)AMR-WB的編碼模式2,本文對(duì)參數(shù)進(jìn)行保護(hù)的MDC算法也對(duì)應(yīng)AMR-WB的編碼模式2. 這樣所提算法的語(yǔ)音編碼速率與AMR-WB的編碼速率一致,而MDC算法的語(yǔ)音編碼速率相對(duì)低一點(diǎn). 實(shí)驗(yàn)中按照Bernoulli模型和Gilbert模型兩種模型來(lái)得到丟包數(shù)據(jù),測(cè)試每一種算法的丟包位置保持一致. 實(shí)驗(yàn)中的原始語(yǔ)音文件來(lái)自NTT-AT寬帶中文語(yǔ)音數(shù)據(jù)庫(kù). 選取的語(yǔ)料數(shù)目為40條(20男,20女),每條語(yǔ)料的長(zhǎng)度為8 s,采用16 kHz采樣和16 bit PCM量化. 對(duì)處理后的語(yǔ)音信號(hào)采用寬帶PESQ來(lái)進(jìn)行測(cè)試,對(duì)比出各個(gè)算法的語(yǔ)音質(zhì)量.
實(shí)驗(yàn)結(jié)果如圖6所示,在沒(méi)有丟包的情況下由于AMR-WB的編碼模式較高,且沒(méi)有任何損傷,所以恢復(fù)出來(lái)的語(yǔ)音質(zhì)量比另外兩種算法相對(duì)較好一點(diǎn). 在本次實(shí)驗(yàn)中丟包率大于3%的情況下,AMR-WB的丟包隱藏效果沒(méi)有另外兩種算法的效果好,并且對(duì)基音周期和ISP進(jìn)行保護(hù)的MDC算法比單純的MDC實(shí)現(xiàn)的語(yǔ)音質(zhì)量要好. 這說(shuō)明當(dāng)移動(dòng)網(wǎng)絡(luò)發(fā)生丟包時(shí),本文提出的新的抗丟包方案可發(fā)揮較好的作用.
本文提出了一種在不改變?cè)幸苿?dòng)網(wǎng)絡(luò)系統(tǒng)傳輸協(xié)議的情況下,通過(guò)對(duì)AMR-WB編碼器加入MDC處理和刪余卷積編碼兩個(gè)模塊實(shí)現(xiàn)對(duì)丟包的恢復(fù),并保持與原有話(huà)音編碼速率的匹配,其實(shí)現(xiàn)方法簡(jiǎn)單,算法復(fù)雜性較低,且不會(huì)產(chǎn)生額外的處理時(shí)延. 經(jīng)過(guò)仿真實(shí)驗(yàn)與分析,新的抗丟包方法相比于AMR-WB本身的丟包隱藏算法和單純的MDC算法對(duì)語(yǔ)音質(zhì)量的恢復(fù)有所提高,并且不會(huì)增加移動(dòng)網(wǎng)絡(luò)的信令開(kāi)銷(xiāo).
[1] 3rd Generation Partnership Project (3GPP). TS 26.190 AMR wideband speech codec: transcoding functions[S]. [S.l.]: 3GPP, 2001.
[2] Schroeder M R, Atal B. Code-excited linear prediction (celp): high quality speech at very low bit rates[C]∥Proceedings of the IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP’85). Tampa, Florida: IEEE, 1985:937-940.
[3] 3rd Generation Partnership Project (3GPP). TS 26.190. AMR wideband speech codec: frame structure[S]. [S.l.]: 3GPP, 2001.
[4] ITU Telecommunication Standardization Sector (ITU-T). Recommendation P.862.3. Application guide for objective quality measurement based on recommendation P.862[S]. [S.l.]: ITUT, 2005.
[5] Goyal V K. Multiple description coding: compression meets the network[J]. Signal Processing Magazine, 2001:74-93.
[6] Lang Yue, Zhao Shenghui, Kuang Jingming. A multiple description speech coder based on AMR-WB[C]∥Proceedings of the IEEE Conference on Information Technology & Applications (ICITA2007). Harbin, China: IEEE, 2007:697-700.
[7] Host S,Johannesson R, Zyablov V V. A first encouter with binary woven convolutional codes[C]∥Proceedings of the 4th Int Symp Communication Theory and Application. U.K:[s.n.],1997:13-18.
(責(zé)任編輯:李兵)
The Anti Packet Loss Algorithm for Voice Transmission in the Mobile Network
WANG Jing1, LIU Bao-guang1, FEI Ze-song1, ZHANG Jian-yin2
(1.School of Information and Electronics,Beijing Institute of Technology, Beijing 100081,China;2.Research Institute of China Mobile Communication Corporation, Beijing 100053, China)
In mobile communication network, there exists anti packet loss problem in adaptive multi rate-wide band(AMR-WB) codec when transmitting voice packet. In order to settle the problem, AMR-WB anti packet loss implementation approach matching the rate of speech coding in VoLTE system was proposed. Firstly, the impacts of each parameter in the AMR-WB codec on voice quality after the recovery of error concealment was analyzed through experiment. Then an AMR-WB anti packet loss scheme was designed by taking advantage of MDC(multiple description coding) technology. Furthermore, combing with punctured-convolution coding, an enhanced anti packet algorithm with double error protection was proposed to implement error protection and rate matching under multi-rate situation. The scheme is compatible with the rate of voice coding under the original AMR-WB coding model. Simulation results show that the proposed novel scheme can strengthen anti packet loss capability of AMR-WB without the need of increasing signaling overhead in mobile network, and it is compatible with the multi-rate voice coding in existing mobile network.
adaptive multi rate-wide band; multiple description coding algorithm; punctured-convolution coding; mobile network
2014-04-10
國(guó)家自然科學(xué)基金資助項(xiàng)目(61571044,11461141004);國(guó)家教育部-中國(guó)移動(dòng)科研基金資助項(xiàng)目(MCM201240113)
王晶(1980—),女,博士,副教授,E-mail:wangjing@bit.edu.cn.
TN 911
A
1001-0645(2016)10-1048-05
10.15918/j.tbit1001-0645.2016.10.012