鐘其柱+羅耀滿+楊彬
【摘 要】為了熟悉VoLTE復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)、發(fā)展趨勢和解決用戶感知問題,通過對(duì)VoLTE的發(fā)展現(xiàn)狀及其技術(shù)原理與優(yōu)勢進(jìn)行梳理和總結(jié),分析了網(wǎng)絡(luò)升級(jí)改造中提出并選定的幾種關(guān)鍵技術(shù)方案,研究了在語音質(zhì)量優(yōu)化上提出的幾種基于MOS值的評(píng)估方法。結(jié)果表明,基于深度神經(jīng)網(wǎng)絡(luò)DNN-MOS的評(píng)估方法是更佳的語音質(zhì)量評(píng)估方法,可以有效地評(píng)估和提升用戶感知。
【關(guān)鍵詞】VoLTE 網(wǎng)絡(luò)優(yōu)化 MOS值 DNN-MOS
Overview and Quality Evaluation Method of VoLTE Networks
[Abstract] In order to know the complex network structure and development trend of VoLTE and deal with the user perception, the developmental status, technical principle and advantages of VoLTE were arranged and summarized. Several key technical solutions which are proposed and selected in the network update and reform were analyzed. Several evaluation methods based the MOS value to optimize voice quality were studied. Results show that DNN-MOS method based on the deep neural network is the better evaluation method of voice quality, which can effectively evaluate and enhance the user perception.
[Key words]VoLTE network optimization MOS value DNN-MOS
1 背景介紹
2014年LTE網(wǎng)絡(luò)進(jìn)入商用元年,這標(biāo)志著4G時(shí)代的正式來臨。目前TD-LTE網(wǎng)絡(luò)主要承載數(shù)據(jù)業(yè)務(wù),經(jīng)過3GPP制定的VoLTE網(wǎng)絡(luò)技術(shù)方案、R8版本到R10版本的標(biāo)準(zhǔn)化工作以及IMS(IP Multimedia Subsystem,IP多媒體子系統(tǒng))網(wǎng)絡(luò)相關(guān)技術(shù),使得VoLTE技術(shù)逐漸完善。該技術(shù)對(duì)比CSFB(Circuit Switched Fallback,電路域回落)有較明顯優(yōu)勢,VoLTE將是LTE語音發(fā)展的必然趨勢[1]。VoLTE網(wǎng)絡(luò)的發(fā)展進(jìn)程如圖1所示。
1.1 VoLTE的發(fā)展形勢
VoLTE已成為國際運(yùn)營商共識(shí)并納入發(fā)展路線,主要分為:
路線1:VoLTE/eSRVCC(Enhanced Single Radio Voice Call Continuity,增強(qiáng)的單一無線語音呼叫連續(xù)性)。主要由于2G/3G網(wǎng)絡(luò)積累較好或VoLTE推動(dòng)初期難以快速實(shí)現(xiàn)LTE全覆蓋。
路線2:無線廣覆蓋實(shí)現(xiàn)VoLTE without eSRVCC。2G/3G為CDMA的運(yùn)營商全部選擇路線2。
韓國三大運(yùn)營商均已在2012年下半年商用;北美和日本幾大運(yùn)營商在2014年商用;歐洲幾大運(yùn)營商在2014年至2015年商用。而中國移動(dòng)采用的是路線1的方案,2016年廣東省VoLTE已全面實(shí)現(xiàn)商用,圖2是VoLTE網(wǎng)絡(luò)在2015年的工作進(jìn)度情況。
1.2 VoLTE的技術(shù)原理
相比LTE網(wǎng)絡(luò),VoLTE是在LTE網(wǎng)絡(luò)的基礎(chǔ)上新增了IMS域,VoLTE用戶的所有業(yè)務(wù)觸發(fā)均由IMS域來進(jìn)行控制。
終端同一時(shí)刻只能在一個(gè)網(wǎng)絡(luò)上進(jìn)行業(yè)務(wù)(LTE或者2G/3G)。在LTE覆蓋區(qū),數(shù)據(jù)/語音業(yè)務(wù)都承載在LTE網(wǎng)絡(luò)[2];在非LTE覆蓋區(qū),由2G/3G網(wǎng)絡(luò)為其提供服務(wù),支持LTE網(wǎng)絡(luò)到2G/3G網(wǎng)絡(luò)的切換。
VoLTE的技術(shù)原理示意圖如圖3所示。
2 技術(shù)優(yōu)勢
VoLTE是一種IP數(shù)據(jù)傳輸技術(shù),全部業(yè)務(wù)承載于4G網(wǎng)絡(luò)上,與目前在2G/3G網(wǎng)絡(luò)下通話相比,其帶給4G用戶最直接的感受就是接通等待時(shí)間更短[3]、更高質(zhì)量以及更自然的音視頻通話效果。VoLTE和3G網(wǎng)絡(luò)的技術(shù)優(yōu)勢對(duì)比如表1所示。
3 方案選擇
相比2G/3G或者CSFB網(wǎng)絡(luò),VoLTE網(wǎng)絡(luò)具有明顯的優(yōu)勢。但這些優(yōu)勢是需要相應(yīng)的技術(shù)支撐的,因此需要規(guī)劃一套較為完善的VoLTE技術(shù)方案。
3.1 LTE語音解決方案
4G網(wǎng)絡(luò)的技術(shù)演進(jìn)歷經(jīng)雙待機(jī)、CSFB和VoLTE這幾個(gè)階段。CSFB和雙待機(jī)都是VoLTE演進(jìn)的過渡性技術(shù),也將在一段時(shí)期內(nèi)與VoLTE共存。其中,在支持國際漫游的前提下,CSFB的生命周期會(huì)相對(duì)較長,同時(shí)雙待機(jī)方案作為一種終端形態(tài)將長期存在[4]。
下面將對(duì)雙待機(jī)、CSFB和VoLTE三種LTE語音解決方案進(jìn)行對(duì)比,具體如表2所示。
基于IMS控制的VoLTE是LTE語音的目標(biāo)方案,中國移動(dòng)商用VoLTE目前選擇的就是這種方案,此方案的前提是LTE網(wǎng)絡(luò)實(shí)現(xiàn)連續(xù)覆蓋要求。而在LTE網(wǎng)絡(luò)覆蓋邊緣,將利用SRVCC(Single Radio Voice Call Continuity,單一無線語音呼叫連續(xù)性)切換技術(shù)來回落到2G網(wǎng)絡(luò),以確保用戶語音通話不會(huì)中斷。
3.2 SRVCC切換方案
在VoLTE語音方案中,涉及到從LTE網(wǎng)絡(luò)切換到2G網(wǎng)絡(luò)的場景,該場景下所使用的技術(shù)為SRVCC切換技術(shù)[5]。3GPP R9階段已經(jīng)標(biāo)準(zhǔn)化SRVCC方案,R10階段標(biāo)準(zhǔn)化eSRVCC方案。這兩種切換方案的特點(diǎn)如下:
(1)SRVCC
SRVCC的媒體切換點(diǎn)是對(duì)端網(wǎng)絡(luò)設(shè)備(如對(duì)端UE),發(fā)生切換后需要在IMS網(wǎng)絡(luò)中創(chuàng)建新的承載。SRVCC切換導(dǎo)致的語音中斷時(shí)長在800 ms左右。
(2)eSRVCC
eSRVCC的媒體切換點(diǎn)改為更靠近本端的設(shè)備[6],具體方案就是在SBC(Session Border Control,會(huì)話邊界控制器)增加ATCF(Acess Transfer Control Functionality,接入轉(zhuǎn)移控制功能)/ATGW(Access Transfer Gateway,接入轉(zhuǎn)移網(wǎng)關(guān))功能實(shí)體作為媒體錨定點(diǎn)。發(fā)生eSRVCC切換時(shí),只需要?jiǎng)?chuàng)建UE與ATGW之間的承載通道,對(duì)端設(shè)備與ATGW之間的媒體流還是通過原承載通道傳輸[7]。eSRVCC切換導(dǎo)致的語音中斷時(shí)長小于300 ms。
3.3 錨定方案
錨定(Anchoring)是指將呼叫從CS網(wǎng)絡(luò)路由到IMS網(wǎng)絡(luò)進(jìn)行業(yè)務(wù)處理的過程[8],也就是確定主被叫各自由哪個(gè)域的哪個(gè)網(wǎng)元來實(shí)現(xiàn)信令接續(xù)流程。在以下兩種場景中,與LTE用戶相關(guān)的呼叫請(qǐng)求需要通過錨定功能路由到IMS網(wǎng)絡(luò):
場景一:LTE用戶通過CS網(wǎng)絡(luò)接入,并且簽約了IMS網(wǎng)絡(luò)業(yè)務(wù);
場景二:LTE用戶作為被叫用戶,通過LTE網(wǎng)絡(luò)接入,并且主叫用戶為CS網(wǎng)絡(luò)用戶。
關(guān)于錨定,目前可供選擇的方案分別是:ICS(IMS Centralized Services,IMS集中業(yè)務(wù))、主被叫全錨定、被叫錨定、國際漫游不錨定以及協(xié)同方案(主被叫都不錨定)。中國移動(dòng)目前使用主叫不錨定、被叫錨定到IMS域的策略。如果主叫錨定,則效率較低,特別是主叫多數(shù)不存在一致性問題仍迂回IMS域,初期存在媒體面迂回,呼叫時(shí)延增加1~3 s;若采取主叫不錨定,由于主叫補(bǔ)充業(yè)務(wù)較少,即便存在業(yè)務(wù)一致性問題,市場也可以接受。
4 網(wǎng)絡(luò)優(yōu)化
VoLTE的部署演進(jìn)是一個(gè)復(fù)雜的系統(tǒng)工程,涉及除3G無線網(wǎng)絡(luò)之外的所有專業(yè)領(lǐng)域,全網(wǎng)改造量巨大,其主要改造內(nèi)容如表3所示。
改造升級(jí)后的VoLTE網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,如何準(zhǔn)確、高效、全面評(píng)估端到端用戶感知,進(jìn)而保障網(wǎng)絡(luò)質(zhì)量,提升用戶體驗(yàn),將成為巨大挑戰(zhàn)。語音質(zhì)量評(píng)價(jià)方法可以分為主觀評(píng)價(jià)和客觀評(píng)價(jià)兩種。根據(jù)是否需要參考話音信號(hào),客觀評(píng)價(jià)方法又分為全參考模型(雙邊評(píng)估)評(píng)價(jià)和無參考模型(單邊評(píng)估)評(píng)價(jià),具體如下:
(1)全參考模型適用于定點(diǎn)撥測或路測場景,從最早的PSQM(Perceptual Speech Quality Measure,感知通話質(zhì)量測量)算法到后面的PESQ(Perceptual Evaluation of Speech Quality,感知評(píng)估通話質(zhì)量測量)算法,再到目前普遍使用的POLQA(Perceptual Objective Listening Quality Analysis,感知客觀語音質(zhì)量評(píng)估)算法,各有各的優(yōu)缺點(diǎn)。
(2)無參考模型適用于實(shí)時(shí)的全網(wǎng)范圍評(píng)估,ITU目前僅推出P.563算法,且該算法僅支持窄帶語音,而在評(píng)價(jià)寬帶語音質(zhì)量方面仍未有統(tǒng)一標(biāo)準(zhǔn),這是需要后續(xù)去努力研究的一個(gè)重點(diǎn)方向。
MOS(Mean Opinion Score,平均意見值)評(píng)估算法的發(fā)展歷程示意圖如圖4所示。
4.1 基于全參考模型的算法介紹及應(yīng)用
基于全參考的客觀的語音感知質(zhì)量評(píng)估方法中,目前最常用的是PESQ和POLQA,前者基于P.862算法,后者基于P.863算法。PESQ算法從初期適應(yīng)窄帶語音的評(píng)估發(fā)展到目前適用寬帶語音的PESQ-WB算法,但該算法不支撐超寬帶語音的質(zhì)量評(píng)估。為了解決PESQ的局限性,ITU發(fā)展了新的POLQA標(biāo)準(zhǔn),這種算法支持窄帶、寬帶和超寬帶語音,是目前普遍使用的路測標(biāo)準(zhǔn)。
實(shí)際上,PESQ和POLQA這兩種算法都具有共同的缺點(diǎn),那就是僅適用于一些定點(diǎn)撥測或路測的場景,適用的場景局限性較大,不能大范圍地實(shí)時(shí)評(píng)估網(wǎng)絡(luò)的語音質(zhì)量。這兩種算法的對(duì)比如表4所示。
鑒于以上兩種算法的局限性,為了達(dá)到實(shí)時(shí)性地評(píng)估全網(wǎng)范圍語音質(zhì)量的目的,ITU推出了一種基于無參考模型(單邊評(píng)估)的P.563算法。
4.2 基于無參考模型的算法介紹及應(yīng)用
P.563算法是基于無參考模型的適用于窄帶語音的話音質(zhì)量評(píng)估方法。該算法采用一個(gè)二元邏輯分類器判別話音信號(hào)的失真類型,將語音信號(hào)失真劃分為6個(gè)類型:強(qiáng)背景噪聲、信號(hào)靜音與間斷、乘性噪聲、話音機(jī)械化、不自然男聲及不自然女聲。P.563算法通過提取話音信號(hào)的43維特征參數(shù),并根據(jù)8個(gè)關(guān)鍵參數(shù)來判決話音信號(hào)的主要失真類型,得到話音質(zhì)量的粗略估計(jì)值,再結(jié)合11維話音特征矢量映射得到最終的話音質(zhì)量評(píng)價(jià)結(jié)果。
P.563算法的優(yōu)點(diǎn)是實(shí)時(shí)性好,僅需網(wǎng)絡(luò)側(cè)樣本即可完成評(píng)估,并可進(jìn)行全網(wǎng)范圍評(píng)估;缺點(diǎn)是僅適用于窄帶語音,使用8個(gè)關(guān)鍵特征進(jìn)行判決,模型不夠完善且評(píng)價(jià)體系不夠穩(wěn)定。
下面將介紹一種新型的無參考算法,它是基于深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)[9]的DNN-MOS評(píng)估方法。DNN即深度神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)(Deep Learning)是機(jī)器學(xué)習(xí)研究中的一個(gè)新領(lǐng)域[10]。DNN-MOS評(píng)估方法提取72維語音特征,共有5層非線性變化,同時(shí)適用于窄帶、寬帶語音,并高度擬合POLQA路測的結(jié)果,只需退化語音便可實(shí)時(shí)、大范圍分析,既彌補(bǔ)了P.563算法在寬帶語音質(zhì)量分析的缺陷,又彌補(bǔ)了POLQA算法的高成本、低效率、單場景的不足。與P.563算法相比,DNN算法與時(shí)俱進(jìn),優(yōu)勢明顯。在實(shí)踐數(shù)據(jù)驗(yàn)證中,基于DNN算法的MOS值與傳統(tǒng)路測的MOS值相比,擬合度高達(dá)0.89,平均誤差僅0.17,這兩項(xiàng)數(shù)據(jù)比P.563算法和E-Model模型算法均有明顯的優(yōu)勢。
DNN-MOS評(píng)估方法實(shí)際上就是基于DNN來進(jìn)行數(shù)學(xué)建模,其基本原理如圖5所示。
在實(shí)際應(yīng)用方面,利用DNN-MOS評(píng)估方法,結(jié)合用戶、終端、小區(qū)等維度數(shù)據(jù),與大數(shù)據(jù)平臺(tái)的網(wǎng)管/Gn/IMEI/信令數(shù)據(jù)通過多維度數(shù)據(jù)聚合分析,可進(jìn)行MOS質(zhì)量監(jiān)控、獲取質(zhì)差用戶/終端、劣化小區(qū)、投訴定位以及終端質(zhì)量評(píng)估等分析結(jié)果,為端到端業(yè)務(wù)優(yōu)化提供有力支撐。
5 結(jié)論
VoLTE技術(shù)在國際上都是一種解決LTE語音接續(xù)的目標(biāo)方案,而且近年來發(fā)展迅猛。廣東移動(dòng)通過對(duì)終端側(cè)、無線網(wǎng)側(cè)、核心網(wǎng)側(cè)以及承載網(wǎng)側(cè)等各種網(wǎng)絡(luò)設(shè)備改造升級(jí)后,已于2016年實(shí)現(xiàn)全省VoLTE商用的目標(biāo)。隨著VoLTE的用戶日益增多,語音質(zhì)量將會(huì)成為關(guān)注的重點(diǎn)?;诖耍疚耐ㄟ^研究幾種評(píng)估語音質(zhì)量(MOS)算法的優(yōu)缺點(diǎn),提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的DNN-MOS評(píng)估方法,該方法是基于無參考模型且適用于寬帶語音的評(píng)估算法。經(jīng)過實(shí)踐證明,該方法已完全可以輔助或者替代傳統(tǒng)的路測,并有望成為ITU在無參考模型的寬帶語音質(zhì)量評(píng)估方面的新標(biāo)準(zhǔn)。
參考文獻(xiàn):
[1] 周晶,葉丹. 運(yùn)營商LTE語音解決方案研究[J]. 集成技術(shù), 2013(3): 79-81.
[2] 夏曉威,周雄. LTE語音業(yè)務(wù)解決方案[J]. 中國新通信, 2014(17): 88-89.
[3] 顏軍,徐皓. 運(yùn)營商VoLTE發(fā)展策略探討[J]. 科技創(chuàng)新與應(yīng)用, 2015(35): 26-27.
[4] 劉燁瑋,張爍,彭巖,等. TDS/TDL系統(tǒng)互操作方案研究[J]. 信息通信, 2013(8): 252-253.
[5] 宗序梅,吳曉波. 中國移動(dòng)TD-LTE語音模式優(yōu)化解決方案研究[J]. 電信技術(shù), 2015(1): 77-85.
[6] 周晶,師瑜. LTE終端語音解決方案現(xiàn)狀及下一步演進(jìn)[J]. 電信科學(xué), 2015(3): 14-22.
[7] 葉衛(wèi)明,鐘正泉,朱震海,等. VoLTE核心網(wǎng)組網(wǎng)及其VPN互通研究[A]. 中國移動(dòng)通信集團(tuán)設(shè)計(jì)院第19屆新技術(shù)論壇[C]. 2013.
[8] 蔡家鵬,計(jì)寧,王遜. VoLTE信令和媒體流路徑優(yōu)化方法研究[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化, 2015(7): 58-61.
[9] 撖書良,蔣嶷川,張世永. 基于神經(jīng)網(wǎng)絡(luò)的高效智能入侵檢測系統(tǒng)[J]. 計(jì)算機(jī)工程, 2004(10): 69-70.
[10] 梅林. 視頻結(jié)構(gòu)化描述(VSD)技術(shù)及在安檢中的應(yīng)用[J]. 中國安防, 2014(20): 98-102.