杜宸罡,李 博,畫芊昊
(中北大學(xué) 儀器科學(xué)與動(dòng)態(tài)測試教育部重點(diǎn)實(shí)驗(yàn)室,太原 030051)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,高性能的嵌入式流媒體技術(shù)應(yīng)用更加廣泛,具體包括視頻直播、遠(yuǎn)程會(huì)議、遠(yuǎn)程教育和視頻監(jiān)控領(lǐng)域等多媒體應(yīng)用,教育是一個(gè)國家根本的事業(yè),重要程度不言而喻。
隨著我國高速推進(jìn)“互聯(lián)網(wǎng)+”在高校領(lǐng)域的推進(jìn),全國應(yīng)用范圍巨大,改善流媒體的用戶體驗(yàn)質(zhì)量顯得愈發(fā)關(guān)鍵。碼率自適應(yīng)算法可以根據(jù)動(dòng)態(tài)選擇進(jìn)一步改善流媒體的用戶體驗(yàn),文獻(xiàn)[1]提出了一種DASH標(biāo)準(zhǔn)的基于緩存補(bǔ)償?shù)拇a率自適應(yīng)切換(BASBC)算法,通過提高帶寬利用率,從而提高用戶的體驗(yàn)質(zhì)量(QoE);文獻(xiàn)[2]提出一種基于深度強(qiáng)化學(xué)習(xí)的碼率自適應(yīng)(DRLA,deep reinforcement learning based ABR)算法,用實(shí)際網(wǎng)絡(luò)帶寬數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),通過收集客戶端緩沖區(qū)占用率和網(wǎng)絡(luò)吞吐量向視頻服務(wù)器請求最佳碼率的視頻,從而提高了用戶的體驗(yàn)質(zhì)量(QoE);文獻(xiàn)[3]提出了一種名為NIA(Data-free Network-environmental Imitation-based Rate Adaptation Framework)的新型無數(shù)據(jù)蒸餾框架,生成了具有更好泛化性能的決策樹ABR算法,NIA通過網(wǎng)絡(luò)環(huán)境生成模塊構(gòu)建多個(gè)人工網(wǎng)絡(luò)環(huán)境,并在每次迭代訓(xùn)練前使用環(huán)境選擇模塊來選擇適合的網(wǎng)絡(luò)場景,然后與該場景進(jìn)行交互,利用基于學(xué)生驅(qū)動(dòng)的模仿學(xué)習(xí)算法完成決策樹的蒸餾過程,從而提高用戶的體驗(yàn)質(zhì)量(QoE)[4]。然而本實(shí)驗(yàn)在音視頻流媒體直播的應(yīng)用場景下,MPC(Model Predictive Control)[5]結(jié)合音視頻同步算法來提高用戶體驗(yàn)質(zhì)量。通過實(shí)驗(yàn)仿真對比分析,不同網(wǎng)絡(luò)環(huán)境下,本實(shí)驗(yàn)所得的平均QoE數(shù)據(jù)更加良好,從而使得本實(shí)驗(yàn)更有意義。
由于本實(shí)驗(yàn)涉及音視頻同步技術(shù)嵌入式流媒體系統(tǒng)平臺開發(fā),因此,依托B/S架構(gòu)[6]搭建流媒體服務(wù)器,優(yōu)點(diǎn)便是無需構(gòu)建大的網(wǎng)絡(luò)服務(wù)器便可形成流媒體應(yīng)用平臺,通過編制相應(yīng)的軟件確保系統(tǒng)功能的實(shí)現(xiàn)并同時(shí)保證系統(tǒng)的正常運(yùn)行。流媒體服務(wù)器采用HTTP/TCP[7]來傳輸控制信息,用實(shí)時(shí)傳輸協(xié)議/用戶數(shù)據(jù)報(bào)協(xié)議(RTP/UDP)傳輸實(shí)時(shí)數(shù)據(jù)。
嵌入式流媒體系統(tǒng)主要是構(gòu)建小型的流媒體服務(wù)器在保證流媒體通信質(zhì)量的前提下,針對流媒體音視頻在互聯(lián)網(wǎng)上質(zhì)量較低具體包括視頻不清晰、卡頓、音視頻不同步等問題,采用最新標(biāo)準(zhǔn)的H.265[8]視頻編碼標(biāo)準(zhǔn)進(jìn)行算法優(yōu)化、實(shí)時(shí)網(wǎng)絡(luò)傳輸技術(shù)確保流媒體通信的實(shí)時(shí)性,在音視頻同步技術(shù)提高流媒體音視頻通信質(zhì)量,采用嵌入式平臺開發(fā)針對不同的應(yīng)用要求進(jìn)行模塊化設(shè)計(jì),通過模型預(yù)測控制,實(shí)現(xiàn)更多的應(yīng)用場景需求。
本文算法分為兩部分,第一部分分為MPC、音視頻同步技術(shù)、碼率自適應(yīng)技術(shù)以及QoE指標(biāo)模型4個(gè)板塊,第二部分為算法仿真分析。本文算法具體流程如圖1所示。
圖1 算法流程
MPC是一種多變量控制策略,可以通過控制系統(tǒng)中被控平臺所得到的當(dāng)前系統(tǒng)狀態(tài)信息,再加上之后的控制輸入變量,預(yù)測到之后的被控平臺的狀態(tài)。預(yù)測模型的形式?jīng)]有固定的標(biāo)準(zhǔn)形式,狀態(tài)空間方程、傳遞函數(shù)、階躍響應(yīng)模型、脈沖響應(yīng)模型、模糊模型等都可以作為預(yù)測模型的形式。
2.2.1 MPC對AAC的優(yōu)化測試
為了得到更加良好的數(shù)據(jù)指標(biāo),將MPC應(yīng)用到AAC編碼[9]策略中去,建立了相對應(yīng)的目標(biāo)函數(shù)與約束,具體優(yōu)化流程如圖2所示。
圖2 MPC對AAC的優(yōu)化流程圖
具體優(yōu)化流程為:AAC編碼的狀態(tài)量和控制量通過被控平臺進(jìn)行狀態(tài)估計(jì),利用MPC的目標(biāo)函數(shù)與約束以及預(yù)測模型得到AAC編碼的最佳解并傳輸數(shù)據(jù)給被控平臺,被控平臺再進(jìn)行音頻信號的加窗處理、信號分塊[10]、FFT變換[11]、當(dāng)前頻譜線形預(yù)測[12],分別計(jì)算文獻(xiàn)[1-3]與本文的最大噪聲掩蔽功率[13]、高頻部分能量比值[14]、譜線掩蔽能力[15]以及感知熵PE[16],如表1所示。
表1 MPC對AAC優(yōu)化后各參數(shù)測試結(jié)果
由表1可知,經(jīng)過MPC對AAC編碼優(yōu)化改進(jìn)后,最大噪聲掩蔽功率明顯更高,掩蔽效果更好;高頻部分的能量也明顯變高,高頻能量缺失的減少使得音質(zhì)明顯增強(qiáng),從而更容易被人耳感知接收,譜線掩蔽能力相比文獻(xiàn)[1-3]來說明顯提高;感知熵PE的值為4.5,介于3~5之間,大大降低了音視頻的失真率,進(jìn)一步提升了音視頻的質(zhì)量。因此,MPC預(yù)測模型控制對AAC編碼優(yōu)化后使得各項(xiàng)指標(biāo)數(shù)據(jù)均更加優(yōu)良。
2.2.2 確定預(yù)測模型的測試
往往是通過被控制的對象和即將進(jìn)行預(yù)測的狀態(tài)來選擇合適的預(yù)測模型,對于本文所需的研究而言,模型預(yù)測控制選擇狀態(tài)空間模型[17]比較合適。狀態(tài)空間模型是一種以時(shí)間為自變量的動(dòng)態(tài)時(shí)域模型,這種狀態(tài)模型的優(yōu)點(diǎn)在于不僅能反映系統(tǒng)內(nèi)部狀態(tài),而且能揭示系統(tǒng)內(nèi)部狀態(tài)與外部的輸入和輸出變量之間的聯(lián)系;狀態(tài)空間模型也可以將多個(gè)變量時(shí)間序列處理為向量時(shí)間序列,這種從變量到向量的轉(zhuǎn)變更適合解決多輸入輸出變量情況下的建模問題;狀態(tài)空間模型還無需大量的歷史資料,能夠用現(xiàn)在和過去的最小信息形式描述系統(tǒng)的狀態(tài),因此既省時(shí)又省力。
建立狀態(tài)空間方程式:
(1)
Y=Cx
(2)
其中:u為輸入變量,x為狀態(tài)變量。
假設(shè)在t時(shí)刻預(yù)測t+i時(shí)刻的輸入值為u(t+ilt),在預(yù)測區(qū)間W內(nèi)。
(3)
在t時(shí)刻預(yù)測第t+i時(shí)刻的系統(tǒng)狀態(tài)為x(t+ilt)。
(4)
MPC預(yù)測控制的優(yōu)化采用的是滾動(dòng)式有限時(shí)域,憑借每時(shí)每刻的優(yōu)化性能指標(biāo),得到每時(shí)每刻的有限時(shí)段的最優(yōu)控制率,優(yōu)化過程也不是一次離線完成的,而是反復(fù)在線完成,優(yōu)化性能指標(biāo)每一采樣點(diǎn)只涉及這一時(shí)刻到未來有限時(shí)間內(nèi)的下一個(gè)采樣時(shí)刻點(diǎn)。預(yù)測控制求解屬于一種開環(huán)優(yōu)化,在反饋校正環(huán)節(jié),不斷根據(jù)系統(tǒng)的實(shí)際輸出對預(yù)測輸出做出校正利用反饋信息,讓滾動(dòng)優(yōu)化不僅停留在模型,更構(gòu)成閉環(huán)優(yōu)化控制。據(jù)狀態(tài)空間方程式進(jìn)行進(jìn)一步滾動(dòng)優(yōu)化及反饋矯正,假設(shè)預(yù)測時(shí)域?yàn)镹f,控制時(shí)域?yàn)镹V,Nf≥Nv,則:
G(t+1)=αG(t)+βu(t|t)
(5)
G(t+2)=α2G(t+1)+αβG(t|t)+βG(t+1|t)
(6)
G(t+3)=α3G(t)+α2βG(t|t)+αβG(t+1|t)+
βG(t+2|t)|
(7)
?
依次列推:
G(t+Nf)=αNfG(t)+αNf-1βG(t|t)+
αNf-2βG(t+1|t)+…+βG(t+Nf-1)
(8)
G(t+Nv)=αNvG(t)+αNv-1βG(t|t)+
αNf-2βG(t+1|t)+…+βG(t+Nf-1)
(9)
在Simulink和Carsim平臺上搭建仿真,實(shí)現(xiàn)預(yù)測控制優(yōu)化,MPC-AAC 在實(shí)現(xiàn)仿真測試過程中,通過AAC的預(yù)測時(shí)域Nf以及控制時(shí)域Nv進(jìn)行迭代從而得到最少迭代次數(shù)和個(gè)體最優(yōu)值。迭代曲線如圖3所。
圖3 迭代曲線
圖4 接收端對音頻的處理框圖
圖5 接收端對視頻的處理框圖
通過圖3可知,AAC的預(yù)測時(shí)域Nf和控制時(shí)域Nv在MPC迭代過程中,預(yù)測時(shí)域Nf和控制時(shí)域Nv均取26時(shí)有最優(yōu)解,最佳解為19。
流媒體通信質(zhì)量好壞的一個(gè)重要標(biāo)準(zhǔn)之一就是音視頻是否同步。音視頻同步[18]是多媒體系統(tǒng)服務(wù)質(zhì)量(QoS Qualityof Service)研究中的一項(xiàng)重要內(nèi)容。音視頻同步可以保證音視頻文件的時(shí)間連續(xù)性,在視頻會(huì)議、可視電話、視頻點(diǎn)播等多媒體應(yīng)用中,由于網(wǎng)絡(luò)傳輸中的延遲、抖動(dòng)、時(shí)間偏差、網(wǎng)絡(luò)傳輸條件的變化以及發(fā)送端的發(fā)送速度與接收端的接收速度的不匹配等問題,使得接收端的媒體存在異步現(xiàn)象。通過媒體同步技術(shù)可以解決這些問題,其中音視頻的同步是一個(gè)關(guān)鍵性技術(shù)。
由于處理器對音視頻編碼的差異,對視頻處理的時(shí)間相比音頻較長,針對音視頻分開采集之間沒有關(guān)聯(lián)性,直接傳輸會(huì)造成視頻滯后于音頻的問題,對此本文進(jìn)行了優(yōu)化,采取動(dòng)態(tài)緩存技術(shù)在服務(wù)器端分別設(shè)置音視頻動(dòng)態(tài)緩存區(qū),傳輸時(shí)進(jìn)行同步控制保證音視頻交替?zhèn)鬏?,再從服?wù)器輸出時(shí)打上時(shí)間戳建立關(guān)聯(lián)性,在接收端設(shè)置動(dòng)態(tài)緩存區(qū),同時(shí)解析音視頻碼流,通過對比時(shí)間戳實(shí)現(xiàn)音視頻同步。為了能夠更好地應(yīng)對復(fù)雜網(wǎng)絡(luò)環(huán)境下確保音視頻同步效果,另外建立通信反饋機(jī)制,實(shí)現(xiàn)服務(wù)器端自動(dòng)通過降低視頻碼率、視頻分辨率、調(diào)整動(dòng)態(tài)緩沖區(qū)等措施確保音視頻同步效果。
2.3.1 檢測影響因素
時(shí)延抖動(dòng)[19]和時(shí)延偏移[20]是影響音視頻是否同步的重要因素,表2通過與文獻(xiàn)[1-3]對比測試分析了音視頻文件、壓縮視頻文件、數(shù)據(jù)文本的時(shí)延抖動(dòng)情況;表3通過與文獻(xiàn)[1-3]對比測試分析了視頻文件、圖像文件、緊密型音頻文件、寬松型音頻文件、文本文件的時(shí)延偏移情況。
表2 時(shí)延抖動(dòng)測試數(shù)據(jù)結(jié)果 ms
表3 時(shí)延偏移測試數(shù)據(jù)結(jié)果 ms
由表2和表3測試結(jié)果可知,經(jīng)過音視頻同步方案的優(yōu)化,相比文獻(xiàn)[1-3]的方案,在時(shí)延抖動(dòng)和時(shí)延偏移兩方面均在數(shù)值上得到了大幅度的降低,從而使得音視頻同步效果得到了質(zhì)的飛躍。
2.3.2 音視頻同步壓縮的測試
音視頻同步壓縮[21]是基于H.264或者AVC壓縮算法利用Zig-zag掃描[22]方法實(shí)現(xiàn)的,系統(tǒng)采集到音視頻數(shù)據(jù)后經(jīng)過壓縮處理傳輸?shù)椒?wù)器,由于這種技術(shù)本身具有先低頻系數(shù)后跟隨高頻系數(shù)的特點(diǎn)且人們對聽覺比視覺相對更加敏感,因此在原有的音視頻同步技術(shù)基礎(chǔ)上,可以用DCT變化系數(shù)[23]與音頻相匹配。
設(shè)碼率流為W,拖尾系數(shù)為H,解碼時(shí)最后一位拖尾系數(shù)為Y,解析音頻流為Z。在嵌入編碼時(shí),當(dāng)W=1時(shí),H=Y=1;當(dāng)W=0時(shí),H=Y=-1;在解碼時(shí),當(dāng)H≠0時(shí),H=Y=1時(shí),Z=1;當(dāng)H=Y=-1時(shí),Z=0;當(dāng)H=0時(shí),當(dāng)H=Y>0時(shí),Z=1;當(dāng)H=Y<0時(shí),Z=0。
由于在圖像壓縮過程中有亮度塊需要嵌入,需要引入音視頻圖像峰值信噪比PSNR[26]。
(10)
其中:MSE為壓縮圖像和之前圖像的誤差,圖6為峰值信噪比PSNR的Y分量測量對比分析圖,縱坐標(biāo)單位為dB,橫坐標(biāo)單位為個(gè)數(shù)。
圖6 PSNR-Y測試結(jié)果圖
根據(jù)圖6原視頻、文獻(xiàn)[1-3]、本文嵌入后音頻的20幀對比測試結(jié)果可知,文獻(xiàn)[1-3]的20幀PSNR-Y分量數(shù)據(jù)均介于原視頻和本文嵌入后音頻的數(shù)據(jù)。因此,本文嵌入后視頻圖像PSNR-Y分量影響最小,即本文算法嵌入后視頻的同步壓縮過程最為良好。
碼率自適應(yīng)測試[24](ABR,adaptive bitrate streaming)可以分為3種類型。Rate-based類型是通過歷史分片下載時(shí)的網(wǎng)絡(luò)情況來預(yù)測之后的網(wǎng)絡(luò)帶寬,從而驅(qū)動(dòng)視頻碼率決策,這種類型相對簡單,但一般單個(gè)噪音的干擾信號非常強(qiáng)波動(dòng)也非常明顯,探測數(shù)據(jù)既會(huì)浪費(fèi)帶寬,歷史數(shù)據(jù)預(yù)判性也非常低;Buffer-based類型是根據(jù)客戶端的播放緩沖區(qū)的buffer情況決定下一片段的碼率檔位,這種類型的缺點(diǎn)是一般在低延遲環(huán)境下不適合更多數(shù)據(jù)量的緩存,buffer量的大小也非常難控制,而且不適合UDP環(huán)境;Hybrid類型屬于一種混合模式,既考慮buffer的信息決策下一片段的碼率檔位,也考慮預(yù)測吞吐量情況,本文的算法即是這種混合模式類型,在原本HTTP的動(dòng)態(tài)自適應(yīng)流標(biāo)準(zhǔn)的視頻流媒體架構(gòu)下引入了MPC控制算法。
2.4.1 切片約束條件的對比測試
設(shè)x為第x個(gè)視頻切片編碼和處理,St(xt)為第x個(gè)視頻切片所對應(yīng)xt碼率的視頻大小,tx為視頻編碼和切片處理前所下載信息的吞吐量,Tx為第x個(gè)視頻被下載所用的時(shí)間,服務(wù)器所需等待時(shí)間為Wt,視頻切片時(shí)長為l。當(dāng)x為0時(shí)數(shù)據(jù)開始采集、編碼和切片處理,切片約束條件如下:
(11)
當(dāng)?shù)趚+1個(gè)視頻切片開始下載時(shí),
(12)
Wt=0
(13)
當(dāng)?shù)趚+1個(gè)視頻切片還沒開始下載時(shí),
(14)
對于直播場景而言,視頻切片所需時(shí)長l越短,視頻更穩(wěn)定更流暢,表4對比了文獻(xiàn)[1-3]以及本文文獻(xiàn)視頻切片l所需時(shí)長。
表4 切片時(shí)長測試結(jié)果 s
通過表4可知,與文獻(xiàn)[1-3]相比,本文在原本架構(gòu)下引入MPC后使得切片時(shí)長明顯變短,進(jìn)一步提升了視頻流暢度、清晰度和穩(wěn)定度。
2.4.2 跳幀時(shí)延的對比測試
為了進(jìn)一步降低時(shí)延執(zhí)行跳幀操作,設(shè)定了兩個(gè)兩組緩沖區(qū)閾值,一組為(T最小1,T目標(biāo)1、T最大1)和(T最小2,T目標(biāo)2,T最大2),一組為(T最小3,T目標(biāo)3,T最大3)和(T最小4,T目標(biāo)4,T最大4),其中滿足T最小1 表5為分別測試對比了第一組和第二組緩沖區(qū)閾值的幀率以及碼率情況。 表5 緩沖區(qū)閾值幀率及碼率測試結(jié)果 由表5可知,當(dāng)緩沖區(qū)閾值為1時(shí),幀率和碼率均最低,即播放速度相對最慢,視頻會(huì)產(chǎn)生嚴(yán)重卡頓情況;當(dāng)緩沖區(qū)閾值為4時(shí),播放速度相對較快,視頻最為清晰流暢。 2.4.3 視頻跳幀的對比測試 視頻跳幀[25]又叫視頻丟幀,當(dāng)顯示器顯示的次數(shù)和刷新的次數(shù)不一致時(shí),顯示器刷新率達(dá)不到視頻FPS的要求,往往會(huì)自動(dòng)舍棄一部分畫質(zhì),這種現(xiàn)象被稱為視頻跳幀。為了進(jìn)一步優(yōu)化流媒體視頻的畫質(zhì),解決跳幀現(xiàn)象,假定顯示器刷新率均為90 Hz且CPU內(nèi)存相同情況下,對比原始視頻和降低視頻分辨率后經(jīng)過選取更為合適的跳幀閾值后視頻的情況,進(jìn)一步測試十組播放器緩存時(shí)間,測試結(jié)果如圖7所示。 圖7 視頻跳幀測試結(jié)果圖 由圖7可知,本文算法通過降低視頻分辨率選取合適的跳幀閾值后視頻的緩存時(shí)間曲線明顯更趨近于穩(wěn)定,既不會(huì)出現(xiàn)跳幀情況,也不會(huì)影響視頻的實(shí)時(shí)性,視頻效果最好。 2.4.4 QoE指標(biāo)模型的測試 QoE指標(biāo)可以很好地反映該種碼率自適應(yīng)算法的優(yōu)劣性,影響QoE指標(biāo)的因素有很多,比如端與端之間的時(shí)延、卡頓以及跳幀時(shí)長、碼率切換頻次、視頻質(zhì)量等等。 QoE目標(biāo)函數(shù)為: (15) 其中:QoE目標(biāo)為全部X個(gè)視頻切片的QoE之和,Ax為第x個(gè)視頻切片的碼率,Bx為x個(gè)視頻切片跳幀時(shí)間總長,Cx為視頻切片端與端之間的時(shí)延,Dx為卡頓時(shí)間總長,f(Ax)為判斷視頻好壞的函數(shù),|Ax+1-Ax|為視頻切片碼率[26-27]的幅度值,σa,σb,σc,σd,σe分別為各參數(shù)指標(biāo)權(quán)重。 QoE指標(biāo)的好壞可以充分反應(yīng)出用戶對服務(wù)質(zhì)量的評價(jià),盡可能地解決跳幀、時(shí)延、卡頓等情況。 本實(shí)驗(yàn)在音視頻流媒體直播競賽的ACM Multimedia的仿真開發(fā)環(huán)境下完成,利用公式(15)可以計(jì)算出QoE指標(biāo)的大小,再求出其平均值。為了很好地驗(yàn)證本文算法的性能,與文獻(xiàn)[1-3]進(jìn)行各性能上的仿真測試與比較。 本文在原有的碼率自適應(yīng)算法基礎(chǔ)上引入了MPC與音視頻同步算法,通過前文的測試發(fā)現(xiàn),本文算法各項(xiàng)相關(guān)數(shù)據(jù)均得到了大幅度的提升,文獻(xiàn)[1-3]與本文算法的平均QoE的CDF曲線如圖8所示。 圖8 平均QoE的CDF曲線 通過本文算法與文獻(xiàn)[1-3]的平均QoE的CDF曲線的測試對比分析可知,本文算法的QoE指標(biāo)明顯更高,即本文算法的綜合性能更好。 網(wǎng)紅帶貨、才藝表演、體育比賽、風(fēng)景打卡是當(dāng)今互聯(lián)網(wǎng)直播環(huán)境中最受歡迎的其中幾個(gè)板塊,因此分別用文獻(xiàn)[1-3]以及本文算法對這幾個(gè)板塊分別進(jìn)行QoE指標(biāo)仿真測試,測試結(jié)果如圖9所示。 圖9 不同直播場下的幾種算法的平均QoE 圖9中,曲線從上到下依次為本文算法、文獻(xiàn)[1-3],由圖中測試結(jié)果可知,網(wǎng)絡(luò)直播環(huán)境下在網(wǎng)絡(luò)帶貨、才藝表演、體育比賽、風(fēng)景打卡等方面,本文所采用的算法的平均QoE指標(biāo)最大,即用戶評價(jià)指標(biāo)最高,因此本文算法相對更加優(yōu)良。 直播環(huán)境中是否卡頓是影響直播感受非常重要的因素之一,因此對視頻卡頓、微卡頓、適中、流暢4種情況分別對比文獻(xiàn)[1-3]以及本文算法進(jìn)行仿真測試分析,測試結(jié)果如圖10所示。 圖10 不同網(wǎng)絡(luò)環(huán)境下幾種算法的平均QoE 圖10中,曲線從上到下依次為本文算法、文獻(xiàn)[1-3],根據(jù)圖中測試結(jié)果可知,對于卡頓、微卡頓、適中、流暢情況下,本文算法的QoE指標(biāo)明顯比文獻(xiàn)[1-3]的QoE指標(biāo)高很多,意味著本文算法使得不同網(wǎng)絡(luò)環(huán)境下的QoE指標(biāo)都得到了很大的提高。 視頻質(zhì)量、卡頓時(shí)長、平均時(shí)延均嚴(yán)重影響著直播環(huán)境中QoE指標(biāo)的大小,分別用文獻(xiàn)[1-3]、本文算法對這幾個(gè)方面進(jìn)行測試對比分析,數(shù)據(jù)結(jié)果如表6所示。 表6 平均QoE指標(biāo)測試結(jié)果 由表6可知,本文算法很好地降低了時(shí)延與卡頓時(shí)長,大幅度優(yōu)化了視頻質(zhì)量,極大地提升了平均QoE用戶評價(jià)指標(biāo)值的大小。 本文在原本碼率自適應(yīng)算法基礎(chǔ)上引入了MPC與音視頻同步技術(shù)并與之相結(jié)合。在HTTP的動(dòng)態(tài)自適應(yīng)流標(biāo)準(zhǔn)的視頻流媒體架構(gòu)下,首先通過對AAC編碼的優(yōu)化,將MPC應(yīng)用到AAC編碼中,從而得到AAC編碼的最佳解。 經(jīng)過被控平臺后續(xù)實(shí)驗(yàn)與前人的測試對比分析,掩蔽能力得到了大幅度提升,可接收到更多的高頻能量被人耳感知,感知熵PE也得到了大幅提升,大大降低了失真率;隨后進(jìn)行了預(yù)測模型的確定,并通過預(yù)測時(shí)域與控制時(shí)域進(jìn)行迭代從而得到最少的迭代次數(shù)和個(gè)體最優(yōu)值;再隨后對音視頻同步的影響因素進(jìn)行了探索與仿真測試對比分析,時(shí)延抖動(dòng)和時(shí)延偏移是最大的兩個(gè)影響因素,時(shí)延抖動(dòng)分別從音視頻文件、壓縮視頻文件、數(shù)據(jù)文本3個(gè)方面與前人的算法進(jìn)行仿真對比測試,時(shí)延偏移分別從視頻文件、圖像文件、緊密型音頻文件、寬松型音頻文件、文本文件這幾個(gè)方面與前人的算法進(jìn)行仿真對比測試,經(jīng)對比分析,本文算法在數(shù)據(jù)上均有了大幅度的優(yōu)化體現(xiàn);再隨后利用zig-zag掃描方法進(jìn)行了音視頻同步壓縮,將前人的算法與本實(shí)驗(yàn)算法分別對20幀PSNR-Y分量進(jìn)行對比測試,由仿真測試圖可知本文算法在嵌入后視頻壓縮效果最佳;再隨后測試切片時(shí)長與跳幀時(shí)延,與前人的算法進(jìn)行測試對比分析,本文算法具有更低的切片時(shí)長、相對較快的播放速度、更為穩(wěn)定的視頻緩存時(shí)間;最后獲取最終的QoE用戶評價(jià)指標(biāo)來進(jìn)一步檢測音視頻流媒體技術(shù)的優(yōu)劣,并在音視頻流媒體直播競賽的ACM Multimedia的仿真開發(fā)環(huán)境下分別從QoE的CDF曲線、不同直播場下平均QoE指標(biāo)、不同網(wǎng)絡(luò)環(huán)境下的平均QoE指標(biāo)、各指標(biāo)對比的平均QoE四個(gè)方面與前人算法進(jìn)行仿真測試對比分析,測試結(jié)果表明本文算法相較而言具有最高的平均QoE指標(biāo),即本文算法各項(xiàng)性能最好。 在當(dāng)今互聯(lián)網(wǎng)高速發(fā)展的時(shí)代,音視頻流媒體技術(shù)具有無限的發(fā)展?jié)摿Γ貏e是本實(shí)驗(yàn)著重側(cè)重于音視頻流媒體直播的應(yīng)用場景,網(wǎng)紅帶貨、才藝表演、體育比賽、風(fēng)景打卡等等應(yīng)用場景,均與我們的工作和生活息息相關(guān),非常需要我們深入研究與探索,除此之外,騰訊會(huì)議網(wǎng)絡(luò)授課、專家作報(bào)告等方面即教育行業(yè)、事業(yè)單位開會(huì)也是音視頻流媒體直播非常廣泛的應(yīng)用場景,因此,視頻加密技術(shù)顯得極其重要,下一步將本文中的算法嘗試應(yīng)用到更多領(lǐng)域進(jìn)行仿真測試分析進(jìn)一步驗(yàn)證該算法的優(yōu)越性以及進(jìn)一步試圖探索更加優(yōu)良的音視頻流媒體算法來獲取更高的QoE用戶評價(jià)值,從而得到更大的社會(huì)價(jià)值。3 QoE指標(biāo)仿真結(jié)果
3.1 幾種算法的平均QoE的CDF曲線
3.2 不同直播場下的幾種算法的平均QoE指標(biāo)的測試
3.3 不同網(wǎng)絡(luò)環(huán)境下幾種算法的平均QoE指標(biāo)的測試
3.4 多種算法每種指標(biāo)的比較測試
4 結(jié)束語