楊曉東 鄭樹強(qiáng)
(太原衛(wèi)星發(fā)射中心山西太原030027)
語(yǔ)音編碼在IP調(diào)度系統(tǒng)中的應(yīng)用研究
楊曉東 鄭樹強(qiáng)
(太原衛(wèi)星發(fā)射中心山西太原030027)
IP調(diào)度系統(tǒng)是航天任務(wù)中重要的新型指揮系統(tǒng),結(jié)合系統(tǒng)工作實(shí)際,簡(jiǎn)述了IP調(diào)度系統(tǒng)的基本組成、基本原理和語(yǔ)音傳輸過(guò)程。根據(jù)語(yǔ)音編碼技術(shù)的基本特征,選取相關(guān)的3種主流語(yǔ)音編碼標(biāo)準(zhǔn)G.711、G.723和G729,從編碼質(zhì)量、編碼速率、時(shí)延和帶寬占用率等方面對(duì)其在IP調(diào)度系統(tǒng)中的應(yīng)用進(jìn)行了分析和比較,總結(jié)了各自的優(yōu)點(diǎn)和不足,為IP調(diào)度系統(tǒng)工程實(shí)踐中的編碼標(biāo)準(zhǔn)選擇提供了技術(shù)依據(jù)。
語(yǔ)音編碼 IP網(wǎng)絡(luò) 指揮調(diào)度
指揮調(diào)度系統(tǒng)是航天發(fā)射場(chǎng)組織指揮發(fā)射試驗(yàn)任務(wù)的基礎(chǔ)性系統(tǒng)之一,其系統(tǒng)性能與運(yùn)行質(zhì)量直接影響著任務(wù)指揮流程的順利進(jìn)行。發(fā)射場(chǎng)歷來(lái)都將調(diào)度系統(tǒng)作為重點(diǎn)試驗(yàn)設(shè)施進(jìn)行發(fā)展和建設(shè),先后經(jīng)歷了模擬系統(tǒng)和大容量數(shù)字化系統(tǒng)。
隨著信息技術(shù)的發(fā)展,業(yè)務(wù)承載網(wǎng)逐步向IP化發(fā)展,多種通信業(yè)務(wù)將逐步通過(guò)IP信道進(jìn)行傳輸。數(shù)字指揮調(diào)度系統(tǒng)也將適應(yīng)形勢(shì)發(fā)展,依托IP網(wǎng)絡(luò)進(jìn)行改造,并將逐步建設(shè)完全I(xiàn)P化的指揮調(diào)度系統(tǒng),統(tǒng)一納入到任務(wù)IP網(wǎng)絡(luò)中進(jìn)行語(yǔ)音信號(hào)的傳輸。
IP調(diào)度系統(tǒng)在傳輸方式上與其他通信業(yè)務(wù)共享IP網(wǎng)絡(luò)的帶寬,提高了信道資源的利用率。由于IP網(wǎng)絡(luò)的開放性和標(biāo)準(zhǔn)化,以及發(fā)射場(chǎng)任務(wù)IP網(wǎng)絡(luò)雙路由的結(jié)構(gòu)特點(diǎn),IP調(diào)度系統(tǒng)具有更高的靈活性、擴(kuò)充性和可靠性。
IP調(diào)度系統(tǒng)與傳統(tǒng)的模擬和數(shù)字調(diào)度系統(tǒng)相比,同樣具備通播、越級(jí)、分割和屏蔽等控制功能,最主要的變化是:將語(yǔ)音信號(hào)的傳輸模式由點(diǎn)對(duì)點(diǎn)傳輸改變?yōu)榫W(wǎng)絡(luò)傳輸,由基于專線電路的數(shù)字信號(hào)傳輸改變?yōu)榛贗P網(wǎng)絡(luò)的數(shù)據(jù)包傳輸。IP調(diào)度系統(tǒng)的基本組成如圖1所示,系統(tǒng)主要由調(diào)度主機(jī)、網(wǎng)絡(luò)設(shè)備(包括交換機(jī)、防火墻和路由器等)、傳輸設(shè)備(包括衛(wèi)星通信設(shè)備和光纖通信設(shè)備等)和調(diào)度終端組成。
圖1 IP調(diào)度系統(tǒng)基本組成圖
IP調(diào)度語(yǔ)音信號(hào)傳輸?shù)幕驹砣鐖D2所示,語(yǔ)音通過(guò)麥克風(fēng)進(jìn)入調(diào)度終端后,首先由調(diào)度終端對(duì)模擬語(yǔ)音信號(hào)進(jìn)行抽樣、量化和壓縮編碼,將其轉(zhuǎn)換為語(yǔ)音數(shù)據(jù),數(shù)字化過(guò)程可以采用多種語(yǔ)音壓縮編碼算法實(shí)現(xiàn),然后把這些語(yǔ)音數(shù)據(jù)按TCP/IP等相關(guān)協(xié)議進(jìn)行打包送到IP網(wǎng)絡(luò),在IP網(wǎng)絡(luò)上再經(jīng)過(guò)交換機(jī)、防火墻及路由器等網(wǎng)絡(luò)設(shè)備和光纖通信及衛(wèi)星通信等通信信道傳輸?shù)侥康恼{(diào)度終端,再把這些語(yǔ)音數(shù)據(jù)包串起來(lái),經(jīng)過(guò)解碼解壓處理后,恢復(fù)成原來(lái)的語(yǔ)音信號(hào),從而達(dá)到由IP網(wǎng)絡(luò)傳輸調(diào)度話音的目的[1]。
圖2 IP調(diào)度系統(tǒng)語(yǔ)音傳輸基本原理圖
根據(jù)IP調(diào)度系統(tǒng)的基本組成和話音傳輸?shù)幕驹砜芍?,影響語(yǔ)音質(zhì)量的主要因素是語(yǔ)音壓縮編碼算法的性能和傳輸網(wǎng)絡(luò)的性能。語(yǔ)音壓縮編碼的目的是用盡可能低的編碼速率獲得盡可能好的合成語(yǔ)音質(zhì)量,同時(shí)又使編碼過(guò)程的計(jì)算代價(jià)盡可能小。降低編碼速率的實(shí)質(zhì)就是降低占用的頻帶寬度,而編碼速率低意味著算法的復(fù)雜度增加,時(shí)延變大。在傳輸網(wǎng)絡(luò)性能一定的條件下,不同的語(yǔ)音壓縮編碼算法具有不同的計(jì)算復(fù)雜度、算法時(shí)延和帶寬占用率等性能指標(biāo),從而影響話音傳輸?shù)馁|(zhì)量[2]。
語(yǔ)音編碼方法主要分為3類:波形編碼、參數(shù)編碼和混合編碼[3]。
①波形編碼方法主要是基于語(yǔ)音信號(hào)的波形,力圖使經(jīng)過(guò)編碼壓縮、傳輸和解碼恢復(fù)后的合成語(yǔ)音信號(hào)與原始語(yǔ)音信號(hào)的波形誤差最小。由于語(yǔ)音信號(hào)的全部信息都蘊(yùn)含在原始波形里,所以這種方法編碼后的合成語(yǔ)音質(zhì)量非常好,且信道適應(yīng)能力強(qiáng)。國(guó)際電報(bào)電話咨詢委員會(huì)CCITT于1972年制定的G.711 64 kbps的脈沖編碼調(diào)制(PCM)和ITU在1984年公布的G.721 32 kbps的自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)都屬于這一類編碼器;
②參數(shù)編碼是通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)進(jìn)行提取及編碼,通常每隔20 ms到40 ms就會(huì)從語(yǔ)音信號(hào)中提取和量化特征參數(shù),最大優(yōu)點(diǎn)是編碼速率低,在理想條件下合成語(yǔ)音聽起來(lái)和原始語(yǔ)音相似,但對(duì)環(huán)境噪音特別敏感,在背景噪音較大的情況下就不能再生原始波形,其合成的語(yǔ)音質(zhì)量較差且時(shí)延值大;
③混合編碼融入了波形編碼和參數(shù)編碼的優(yōu)點(diǎn),能獲得自然度較高的話音,并且有著非常低的比特率,但時(shí)延較大。目前VOIP系統(tǒng)中使用的語(yǔ)音壓縮編碼方式大多數(shù)是基于混合編碼方法的,比如G.723和G.729。
G.7XX系列語(yǔ)音編碼標(biāo)準(zhǔn)都是基于以上3類不同的編碼方法而定制的,語(yǔ)音編碼方法的基本原理決定了每種標(biāo)準(zhǔn)的編碼速率和話音質(zhì)量等具體特點(diǎn),也決定了每種編碼標(biāo)準(zhǔn)適用于不同的應(yīng)用環(huán)境。
以上列舉的G.711、G.723和G.729為目前較為主流的幾種語(yǔ)音編碼標(biāo)準(zhǔn),各自有著不同的技術(shù)特點(diǎn)。以此3種編碼技術(shù)為研究對(duì)象,比較其在IP網(wǎng)絡(luò)環(huán)境下的語(yǔ)音編碼性能,分析其在發(fā)射場(chǎng)IP調(diào)度通信網(wǎng)中的適用性。衡量語(yǔ)音編碼標(biāo)準(zhǔn)技術(shù)優(yōu)劣的主要指標(biāo)有:編解碼語(yǔ)音質(zhì)量、編解碼速率、復(fù)雜度、時(shí)延和帶寬占用率等[4]。
①G.711是使用最為普遍的語(yǔ)音編碼標(biāo)準(zhǔn),采用波形編碼方法,包括A律和u律2個(gè)變型。其數(shù)據(jù)采樣率為8 KHZ,編碼速率為64 kbps,由于其采用波形編碼算法,具有高質(zhì)量和低時(shí)延的特點(diǎn),編碼速率高,獲得的話音質(zhì)量最好,MOS等級(jí)都在4.3左右,有著適應(yīng)能力強(qiáng)、話音質(zhì)量好和抗噪抗誤碼能力強(qiáng)等特點(diǎn),最大的缺點(diǎn)是同其他的編解碼器相比,要使用大量的帶寬,當(dāng)其用于低帶寬時(shí),話音質(zhì)量下降得非???;
②G.723是一個(gè)雙速率語(yǔ)音編碼協(xié)議,2種速率分別是5.3 kbps和6.3 kbps,編碼延遲為37.5 ms[5]。就目前而言,與ITU-T的其他編碼標(biāo)準(zhǔn)相比,G.723之中G.723.1的編碼速率是最低的。2種速率的編解碼基本原理是一樣的,只是對(duì)信號(hào)的量化方法有差別,2種速率下都能獲得很好的語(yǔ)音質(zhì)量,MOS值約為3.8。ITU建議其應(yīng)用于低速率多媒體服務(wù)中話音或其他音頻信號(hào)的壓縮,優(yōu)點(diǎn)在于僅需要很窄的語(yǔ)音帶寬便可具有較高的語(yǔ)音質(zhì)量,缺點(diǎn)在于編碼時(shí)延達(dá)到37.5 ms;
③G.729協(xié)議能夠?qū)崿F(xiàn)很高的話音質(zhì)量和很低的算法時(shí)延,可將經(jīng)過(guò)采樣的64 kbps話音以幾乎不失真的質(zhì)量壓縮至8 kbps,合成語(yǔ)音和原始語(yǔ)音之間的誤差很小,總的算法時(shí)延為15 ms,而且在有隨機(jī)比特誤碼、幀丟失和多次轉(zhuǎn)接等情況下仍然具有很好的穩(wěn)定性,特別是這種編碼方式在一定的背景噪聲下仍然可以保持較好的語(yǔ)音質(zhì)量。
3種語(yǔ)音編碼標(biāo)準(zhǔn)的具體性能指標(biāo)對(duì)比如表1所示[6]。
表1 編碼標(biāo)準(zhǔn)指標(biāo)比較
采用MOS分值法評(píng)價(jià)編碼語(yǔ)音質(zhì)量,可以看出,3種編碼方式的聽音質(zhì)量都比較高,其中,G.711與G.729的語(yǔ)音編碼質(zhì)量最好。從編碼速率來(lái)看,G.723的比特率最低,G.729的編碼速率僅高于G.723,G.711的編碼速率遠(yuǎn)遠(yuǎn)高于G.729和G. 723。
編解碼的復(fù)雜度與語(yǔ)音編碼的質(zhì)量有著密切的關(guān)系,在同樣的碼率下,采用復(fù)雜的算法將能獲得更好的語(yǔ)音質(zhì)量,但對(duì)硬件的計(jì)算能力要求也更高。由表1可知,在復(fù)雜度方面,G.723相對(duì)G.729較優(yōu),G.711最佳。增加算法復(fù)雜度可以提高語(yǔ)音的質(zhì)量,但同時(shí)也帶來(lái)了編解碼的時(shí)延,在實(shí)時(shí)語(yǔ)音通信中對(duì)通信質(zhì)量有著很大的影響。在編解碼時(shí)延方面G.711時(shí)延最小,G.729較G.723為優(yōu)。
在IP調(diào)度系統(tǒng)中,語(yǔ)音編碼是把話音轉(zhuǎn)換成數(shù)據(jù)方式來(lái)傳輸,傳輸協(xié)議中包含了RTP和UDP,與IP一起成為一個(gè)完整的語(yǔ)音協(xié)議。在Ipv4里,IP包占20 Bytes,UDP包占8 Bytes,RTP包頭占12 Bytes,則包頭共占40 Bytes,此外,以太網(wǎng)占14 Bytes,在每秒20 ms的語(yǔ)音負(fù)荷的情況下,以G.729編碼為例,實(shí)際要傳輸?shù)淖止?jié)數(shù)為:20+8+12+20+14=74 Bytes;傳輸速度應(yīng)為:74 Bytes/20 ms=29.6 kbps;而在相同的環(huán)境下,G.711編碼卻需要85.6 kbps的帶寬。
表2 編碼算法帶寬占用率比較
3種編碼算法的帶寬占用率比較如表2所示[7]。
根據(jù)帶寬占用率比較的結(jié)果,G.723的壓縮比最大,最節(jié)省帶寬,G.729次之,G.711的壓縮比最低,對(duì)帶寬的要求最高。
3種編碼技術(shù)從編碼質(zhì)量、編碼速率、編解碼復(fù)雜度、編解碼時(shí)延和帶寬占用率等這幾個(gè)方面綜合比較,可以得出以下結(jié)論:
①G.711的編碼質(zhì)量最好,編碼復(fù)雜度最低,編碼時(shí)延最小,但對(duì)帶寬的要求最高;
②G.723的編碼質(zhì)量次于G.711和G.729,編碼復(fù)雜度較高,時(shí)延值也較大,但最節(jié)省帶寬資源;
③G.729的編碼質(zhì)量較好,時(shí)延值也較小,均介于G.711和G.723之間,對(duì)帶寬的要求也較小。
在帶寬資源足夠豐富的情況下,選擇G.711可以獲得最佳的調(diào)度語(yǔ)音質(zhì)量;如果帶寬資源較為緊張,并可以接受一定程度的話音質(zhì)量損失,可以選擇G.723;如果不能接受較大的話音質(zhì)量損失和一定的通話時(shí)延,而帶寬資源又不是足夠富裕,則可以選擇G.729。從話音質(zhì)量和通信成本等多方面綜合考慮,3種編碼技術(shù)中,G.729為最佳編碼方案。
根據(jù)以上的分析和比較,3種編碼技術(shù)在語(yǔ)音質(zhì)量、編碼速率、時(shí)延大小和帶寬占用率等方面有著各自的優(yōu)點(diǎn)或不足,不能絕對(duì)的評(píng)價(jià)一種技術(shù)的優(yōu)劣。在具體的工程實(shí)踐中,應(yīng)該根據(jù)通信的指標(biāo)要求和IP網(wǎng)絡(luò)環(huán)境的實(shí)際情況等因素綜合考慮,選擇適用的編碼技術(shù)。
[1]牛曉華,高山.VoIP語(yǔ)音壓縮技術(shù)在IP指揮調(diào)度系統(tǒng)中的應(yīng)用[J].數(shù)據(jù)通信,2011(5):44.
[2]韓紀(jì)慶,張磊,鄭鐵然.語(yǔ)音信號(hào)處理[M].北京:清華大學(xué)出版社,2004.
[3]楊會(huì)彩,樊延虎.幾種低速率語(yǔ)音編碼算法分析[J].延安大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,28(1):44-46.
[4]徐作庭,李來(lái)勝.多媒體通信[M].北京:人民郵電出版社,2011.
[5]鞠鳴.VoIP中語(yǔ)音壓縮編碼技術(shù)的研究與性能分析[J].江蘇通信技術(shù),2007,23(2):36-37.
[6]李娜,王中元,胡瑞敏.數(shù)字語(yǔ)音編碼技術(shù)和標(biāo)準(zhǔn)介紹[J].中國(guó)新通信(技術(shù)版),2007(13):39-43.
[7]唐峰.數(shù)字音頻壓縮技術(shù)研究[J].中國(guó)傳媒科技,2008(5):43.
Research on Application of Speech Coding in IP Command Dispatching System
YANG Xiao-dong,ZHENG Shu-qiang
(Taiyuan Satellite Launch Center,Taiyuan Shanxi 030027,China)
The IP command dispatching system is a new important command system for space mission.Combined with practical system operation,this paper summarizes the basic composition,basic principle and voice transmission process of IP command dispatching system.Based on the basic characteristics of speech coding technology,such three kinds of mainstream speech coding standards as G.711, G.723 and G729 are selected,the applications of these standards in IP command dispatching system are analyzed and compared from such aspects of coding quality,coding rate,delay and bandwidth occupation,and their advantages and disadvantages are summarized,which provides the technical basis for coding standard selection in the engineering practice of IP command dispatching system.
speech coding;IP network;command dispatching
TP305
A
1008-1739(2014)06-61-3
定稿日期:2014-02-26