文/王燕飛(中國(guó)移動(dòng)通信集團(tuán)北京有限公司)
VoLTE即長(zhǎng)期演進(jìn)語(yǔ)言承載,是一個(gè)高速無(wú)線通信標(biāo)準(zhǔn),基于IMS網(wǎng)絡(luò),在LTE上利用控制層和服務(wù)層形成特制的配置文件,這使得語(yǔ)音服務(wù)作為數(shù)據(jù)流在LTE數(shù)據(jù)承載網(wǎng)絡(luò)上傳輸,無(wú)須電路交換網(wǎng)絡(luò)。
VoLTE語(yǔ)音全稱為Voice over Long-Term Evolution,其本質(zhì)是運(yùn)營(yíng)商推出的4G高清語(yǔ)音視頻通訊業(yè)務(wù)。作為一種基于IMS的語(yǔ)音業(yè)務(wù),VoLTE語(yǔ)音也是一種IP數(shù)據(jù)傳輸技術(shù),無(wú)須2G、3G,所有業(yè)務(wù)都由4G支持,實(shí)現(xiàn)了數(shù)據(jù)和語(yǔ)音業(yè)務(wù)共處在同一網(wǎng)絡(luò)。4G網(wǎng)絡(luò)本身能夠提供高速率的數(shù)據(jù)業(yè)務(wù),而高質(zhì)量的語(yǔ)音視頻通話則需要VoLTE技術(shù)實(shí)現(xiàn)。在網(wǎng)絡(luò)移動(dòng)通訊快速發(fā)展的時(shí)代背景下,網(wǎng)速也大幅提升,將語(yǔ)音通話搭載在高速網(wǎng)絡(luò)上是語(yǔ)音業(yè)務(wù)發(fā)展的必然趨勢(shì),而VoLTE語(yǔ)音也就是在4G高帶寬的基礎(chǔ)上,重新制作的語(yǔ)音視頻系統(tǒng)。從運(yùn)營(yíng)商角度來(lái)看,LTE本身的頻譜利用效率遠(yuǎn)強(qiáng)于傳統(tǒng)制式,可達(dá)到GSM的4倍以上,可以有效提高無(wú)線頻譜的利用率,降低網(wǎng)絡(luò)成本。對(duì)用戶而言VoLTE不僅可以為其提供更高質(zhì)量的語(yǔ)音服務(wù),也有著更少的接入延遲以及接近于零的掉線率,極大地保障和提升了語(yǔ)音視頻質(zhì)量。
人工智能技術(shù)的快速發(fā)展為VoLTE語(yǔ)音質(zhì)量評(píng)測(cè)提供了技術(shù)支持,能夠幫助相關(guān)人員進(jìn)一步了解用戶的語(yǔ)音體驗(yàn),幫助相關(guān)人員解決VoLTE語(yǔ)音出現(xiàn)的一些問(wèn)題,從而提高VoLTE語(yǔ)音質(zhì)量,更好地滿足用戶需求。利用智能語(yǔ)音分析技術(shù)可構(gòu)建相應(yīng)的VoLTE語(yǔ)音質(zhì)量評(píng)測(cè)指標(biāo),以此實(shí)現(xiàn)對(duì)VoLTE語(yǔ)音質(zhì)量的準(zhǔn)確評(píng)價(jià)。
VoLTE語(yǔ)音系統(tǒng)構(gòu)建需要根據(jù)聲學(xué)特征和人工神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行建模,將兩者收集和分析得到的大量數(shù)據(jù)融入整個(gè)系統(tǒng)。整個(gè)系統(tǒng)由采集層、處理層、數(shù)據(jù)層和應(yīng)用層構(gòu)成,通過(guò)科學(xué)合理的層次架構(gòu)來(lái)保證用戶語(yǔ)音通話質(zhì)量,提升用戶體驗(yàn),以此評(píng)估用戶反饋的內(nèi)容。采集層由數(shù)據(jù)倉(cāng)庫(kù)話單數(shù)據(jù)、用戶定位和GM口用戶數(shù)據(jù)組成;處理層則是將無(wú)線測(cè)量、RTP、通話信令進(jìn)行處理得到相應(yīng)的語(yǔ)音質(zhì)量;數(shù)據(jù)層將得到的語(yǔ)音質(zhì)量文件經(jīng)過(guò)XDR輸送至應(yīng)用層;應(yīng)用層以此為基準(zhǔn),分析終端、質(zhì)量、用戶等問(wèn)題。
依托于人工智能的VoLTE語(yǔ)音系統(tǒng)是從海量測(cè)試樣本中提取特征信息,再運(yùn)用大數(shù)據(jù)技術(shù)分析算法,客觀評(píng)價(jià)MOS質(zhì)量,并模擬出不同的聲學(xué)特征與MOS數(shù)值的關(guān)系,建立相關(guān)的聲學(xué)特性信息模型,然后將后臺(tái)收集的用戶信息導(dǎo)入進(jìn)行,解析用戶媒體載荷情況,實(shí)現(xiàn)評(píng)估的準(zhǔn)確性,而MOS算法則依托于人工智能網(wǎng)絡(luò)的深度學(xué)習(xí),逐漸從海量信息中接近實(shí)際情況。
模型在構(gòu)建完成后使用單邊數(shù)據(jù)便能夠?qū)θW(wǎng)通話進(jìn)行精準(zhǔn)評(píng)估,其中感知評(píng)測(cè)指標(biāo)分為MOS、單通、斷續(xù)、RTP丟包等,只針對(duì)語(yǔ)音通話質(zhì)量,無(wú)須識(shí)別語(yǔ)音內(nèi)容,既保證了客戶信息安全,又能夠高效開(kāi)展工作??梢酝ㄟ^(guò)SBC與P-GW之間的SGi口采集用戶信息,利用VoIP協(xié)議傳輸語(yǔ)音數(shù)據(jù),并將所有語(yǔ)音載荷封裝在RTP當(dāng)中,再將過(guò)濾出的RTP信息發(fā)送至解析系統(tǒng)即可[1]。
VoLTE語(yǔ)音關(guān)鍵評(píng)測(cè)技術(shù)是人工智能評(píng)定語(yǔ)音質(zhì)量的核心,其包括利用MOS,根據(jù)人耳聽(tīng)覺(jué)特性提取的聲學(xué)特征,評(píng)估出語(yǔ)言MOS分;利用VAD檢測(cè)技術(shù)獲取單通判斷關(guān)鍵內(nèi)容;基于大數(shù)據(jù)訓(xùn)練下人工神經(jīng)網(wǎng)絡(luò)構(gòu)建的斷續(xù)判斷技術(shù);以及支撐新型網(wǎng)絡(luò)評(píng)測(cè)體系,同時(shí)結(jié)合多種外在因素,使評(píng)價(jià)結(jié)果體現(xiàn)用戶真實(shí)感知的分段評(píng)估技術(shù)。VoLTE語(yǔ)音關(guān)鍵評(píng)測(cè)技術(shù)的相互結(jié)合使用基本能夠覆蓋到語(yǔ)音視頻業(yè)務(wù)的全部區(qū)域,根據(jù)實(shí)際情況、用戶級(jí)別實(shí)現(xiàn)語(yǔ)音感知質(zhì)量的綜合評(píng)估。
語(yǔ)音視頻質(zhì)量檢測(cè)可以通過(guò)VAD檢測(cè)技術(shù)對(duì)聲波進(jìn)行量化,并基于關(guān)鍵字匹配來(lái)讓人工智能學(xué)習(xí)語(yǔ)音特征,從斷續(xù)的語(yǔ)言段中分析得到相應(yīng)的有效算法,以達(dá)到較高的準(zhǔn)確率和判斷規(guī)則。
首先是VAD檢測(cè)技術(shù),通過(guò)周期性檢測(cè)獲取RTP采樣得到的解碼片段,之后將采樣的語(yǔ)音信號(hào)分段計(jì)算每幀所含有的能量值,借此計(jì)算出整個(gè)片段的平均能量值。根據(jù)此平均能量值為采樣點(diǎn)狀態(tài)賦值。在信息安全方面應(yīng)當(dāng)利用關(guān)鍵字匹配技術(shù)來(lái)使人工智能進(jìn)行準(zhǔn)確檢索和匹配,結(jié)合HMM-Filler+融合置信度的判別方式,可以快速檢索匹配,并且無(wú)須識(shí)別語(yǔ)義,保證用戶通話內(nèi)容安全。
其次,在單通判斷規(guī)則中,若語(yǔ)音視頻其中一端沒(méi)有聲音,上行無(wú)聲段丟包率低于閾值,且另一端同時(shí)沒(méi)有識(shí)別到語(yǔ)音活動(dòng)或關(guān)鍵字語(yǔ)譜,便可以判斷為單通。而在無(wú)聲段中丟包率大于閾值,且有聲段滿足至少一個(gè)關(guān)鍵字語(yǔ)譜,則判斷為高丟包單通,可重新設(shè)置閾值。若無(wú)聲段丟包率低于閾值,且有聲段滿足至少一個(gè)關(guān)鍵字語(yǔ)譜,則證明是全程無(wú)能量的單通。
最后是斷續(xù)判斷規(guī)則,斷續(xù)判斷較為容易,根據(jù)關(guān)鍵字匹配技術(shù)和人工智能深度學(xué)習(xí)語(yǔ)音特征的方式,配置大量斷續(xù)檢測(cè)樣本,使人工智能具備一定的斷續(xù)判斷邏輯,便能進(jìn)行具有較高準(zhǔn)確率的斷續(xù)判斷。
VoLTE語(yǔ)音質(zhì)量評(píng)測(cè)優(yōu)化的基礎(chǔ)是用戶的各類信息。先從用戶位置信息進(jìn)行探討。在使用計(jì)費(fèi)單元和GX接口原始碼流等方式進(jìn)行語(yǔ)音業(yè)務(wù)的用戶位置可以較為容易獲取開(kāi)啟基站的用戶位置信息,并且網(wǎng)內(nèi)X2、S1切換位置更新均能捕捉,其關(guān)聯(lián)正確率可達(dá)95%以上。而在使用RX接口的用戶,可獲取號(hào)碼及IP四元組,將GX接口包含的用戶位置信息及IP四元組聯(lián)系起來(lái),獲得更為完整的用戶話單及位置信息。而在網(wǎng)絡(luò)覆蓋下人工智能對(duì)用戶感知評(píng)估及各類通話故障判斷的優(yōu)化,可結(jié)合MR位置信息及小區(qū)無(wú)線信標(biāo),利用GIS等方法,快速分析出因無(wú)線質(zhì)量問(wèn)題引發(fā)的用戶感知問(wèn)題,借此規(guī)避其他影響因素對(duì)質(zhì)量評(píng)測(cè)的干擾,達(dá)到語(yǔ)音質(zhì)量評(píng)測(cè)優(yōu)化[2]。
現(xiàn)階段,人工智能技術(shù)已經(jīng)廣泛應(yīng)用于移動(dòng)通訊網(wǎng)絡(luò)之中,而基于4G的VoLTE語(yǔ)音也可以結(jié)合人工智能,對(duì)語(yǔ)音視頻業(yè)務(wù)的通話質(zhì)量進(jìn)行評(píng)測(cè)及優(yōu)化。通過(guò)對(duì)人工智能在VoLTE語(yǔ)音評(píng)測(cè)中的系統(tǒng)、技術(shù)、算法分析,可以明確人工智能技術(shù)對(duì)提高語(yǔ)音感知質(zhì)量評(píng)測(cè)有著重要作用,能夠深度覆蓋VoLTE語(yǔ)音問(wèn)題,進(jìn)一步提升VoLTE語(yǔ)音業(yè)務(wù)質(zhì)量。