楊培楨
(91917部隊(duì),北京 100089)
隨著互聯(lián)網(wǎng)技術(shù)在現(xiàn)代社會(huì)中應(yīng)用范圍的不斷擴(kuò)大和應(yīng)用層次的不斷深化,網(wǎng)絡(luò)視頻通信在遠(yuǎn)程視頻會(huì)議、遠(yuǎn)端視頻醫(yī)療、遠(yuǎn)程視頻教育、網(wǎng)絡(luò)視頻游戲以及互動(dòng)電視等領(lǐng)域的應(yīng)用也越來(lái)越廣泛[1]。為了進(jìn)一步提高網(wǎng)絡(luò)視頻通信的應(yīng)用質(zhì)量與數(shù)據(jù)傳輸效率,優(yōu)化網(wǎng)絡(luò)視頻通信終端用戶的使用體驗(yàn),需要改善網(wǎng)絡(luò)視頻通信的數(shù)據(jù)傳輸流暢度與視頻畫質(zhì)清晰度。網(wǎng)絡(luò)視頻通信主要包括視頻源數(shù)據(jù)采集、視頻數(shù)據(jù)編碼、視頻數(shù)據(jù)傳輸、接收端的視頻數(shù)據(jù)解析以及視頻顯示等流程,其數(shù)據(jù)交換是雙向的,即通信的雙方可以同時(shí)作為數(shù)據(jù)的接收端與輸出端。通常情況下,提高網(wǎng)絡(luò)視頻通信的畫質(zhì)會(huì)占用更多的帶寬[2]。如果網(wǎng)絡(luò)帶寬資源足夠豐富,則可以通過(guò)提高視頻傳輸碼率來(lái)優(yōu)化視頻通信的質(zhì)量?,F(xiàn)代網(wǎng)絡(luò)用戶數(shù)量不斷增加,同時(shí)用戶對(duì)網(wǎng)絡(luò)的要求越來(lái)越高,網(wǎng)絡(luò)帶寬資源越來(lái)越緊張?;诖?,通過(guò)優(yōu)化網(wǎng)絡(luò)視頻通信編碼方案,同時(shí)配套科學(xué)的網(wǎng)絡(luò)視頻通信質(zhì)量評(píng)價(jià)方案,在不增加傳輸帶寬的情況下實(shí)現(xiàn)高質(zhì)量、高效率的視頻通信。
按照空間環(huán)境與人的相對(duì)關(guān)系,網(wǎng)絡(luò)視頻通信的場(chǎng)景通??梢苑譃榻啊⒅芯耙约斑h(yuǎn)景。近景場(chǎng)景多為人物特寫或集中在人物的面部區(qū)域,通信雙方可以清楚地看到對(duì)方的面部表情;中景場(chǎng)景通常覆蓋整個(gè)人物的影像,更加突出的是人物的整體肢體動(dòng)作;遠(yuǎn)景場(chǎng)景除了覆蓋人物本身外,還會(huì)切入一定比例的空間環(huán)境影像,通信雙方的關(guān)注點(diǎn)主要表現(xiàn)為識(shí)別對(duì)方生物身份與基本環(huán)境概況[3]。針對(duì)不同場(chǎng)景的視頻通信編碼,在空間維度與時(shí)間維度上有所區(qū)別。
確定網(wǎng)絡(luò)視頻通信編碼方案時(shí),應(yīng)遵循視頻通信或流媒體傳輸碼率低于網(wǎng)絡(luò)端到端有效帶寬的基本原則。高清商務(wù)會(huì)議等網(wǎng)絡(luò)視頻通信場(chǎng)景中,應(yīng)考慮在限制帶寬不超過(guò)2 Mb/s的前提下提高服務(wù)質(zhì)量[4]。同時(shí),由于帶寬受現(xiàn)實(shí)網(wǎng)絡(luò)環(huán)境影響較大,因此可以從 300 kb/s、600 kb/s、1 Mb/s、1.5 Mb/s或 2 Mb/s等參數(shù)中選取合適的帶寬值,并在相應(yīng)編碼方案下設(shè)定合適的帶寬限制值。綜合考慮既往網(wǎng)絡(luò)視頻通信場(chǎng)景與視頻窗口大小的設(shè)定情況,由于高分辨率會(huì)造成編碼難度與碼率增加,同時(shí)其應(yīng)用場(chǎng)景較少,因此可以從360P、480P、720P以及1 080P等分辨率參數(shù)中進(jìn)行選擇。在確定幀率時(shí),由于增大幀率會(huì)大幅提高編碼碼率,而且超過(guò)30 fps的幀率在常規(guī)性主流視頻通信場(chǎng)景中并無(wú)顯著應(yīng)用優(yōu)勢(shì)與應(yīng)用價(jià)值,因此設(shè)定編碼參數(shù)時(shí)擬采用低于30 fps的幀率,從10 fps、15 fps以及25 fps中選擇合適的幀率參數(shù)。
確定以上參數(shù)的范圍后,還需要注意在碼率較低時(shí)網(wǎng)絡(luò)視頻通信的幀率與分辨率均會(huì)受到較為明顯的限制,且編碼所致的量化矩陣會(huì)造成視頻在傳輸過(guò)程中出現(xiàn)較為明顯的失真現(xiàn)象。綜合以上分析,確定碼率后應(yīng)選擇合適的分辨率與幀率,結(jié)合實(shí)際網(wǎng)絡(luò)條件與視頻通信質(zhì)量要求配置相應(yīng)的編碼參數(shù)。網(wǎng)絡(luò)視頻通信編碼參數(shù)組合如表1所示。
表1 網(wǎng)絡(luò)視頻通信編碼參數(shù)組合
壓縮解碼也是網(wǎng)絡(luò)視頻通信的重要流程,可以利用專門的開源計(jì)算機(jī)程序FFmpeg來(lái)完成。該程序可以實(shí)現(xiàn)數(shù)字音視頻的記錄與轉(zhuǎn)化,得到流化音視頻。FFmpeg程序中內(nèi)嵌了libvpx與libx264等多種類型的視頻編碼庫(kù)與解碼庫(kù),其兼容Windows、MacOS以及Linux等主流操作系統(tǒng),能夠便捷地完成H.264、VP8、AV1以及VP9等多種格式視頻的編碼與解碼。如果編碼器未特別說(shuō)明,則默認(rèn)為x264編碼器。
目前,較為主流的網(wǎng)絡(luò)視頻通信質(zhì)量評(píng)價(jià)方法主要有絕對(duì)分類評(píng)級(jí)(Absolute Category Rating,ACR)法、具有隱藏參考的絕對(duì)分類評(píng)級(jí)(Absolute Category Rating with Hidden Reference,ACR-HR)法、損傷分類評(píng)級(jí)(Damage Classification Rating,DCR)法以及成對(duì)比較(Paired Comparison,PC)法等[5]。其中,ACR法與ACR-HR法均是通過(guò)測(cè)試者觀看并對(duì)每一個(gè)視頻進(jìn)行打分來(lái)完成評(píng)價(jià),ACR-HR法附加了測(cè)試視頻中需包含源參考視頻的條件。DCR法要求測(cè)試者比較測(cè)試視頻與源參考視頻的差別來(lái)進(jìn)行評(píng)價(jià)。應(yīng)用PC法時(shí),測(cè)試視頻為兩兩一組連續(xù)播出,測(cè)試者對(duì)比兩者的差別并進(jìn)行評(píng)價(jià)[6]。
在某種程度上,對(duì)源視頻進(jìn)行壓縮編碼時(shí)造成圖像質(zhì)量降低在所難免,如果在相應(yīng)的場(chǎng)景下視頻圖像質(zhì)量處于可接受的區(qū)間內(nèi),則認(rèn)為視頻通信編碼的方案可行。在視頻通信編碼的質(zhì)量評(píng)價(jià)方法中,ACR法的實(shí)現(xiàn)難度更低且更容易操作,而PC法在相近視頻的質(zhì)量區(qū)分方面具有更加顯著的優(yōu)勢(shì)。
當(dāng)網(wǎng)絡(luò)帶寬受限時(shí),經(jīng)過(guò)編碼的視頻難免會(huì)出現(xiàn)圖像質(zhì)量或播放流暢度降低的問(wèn)題,在相應(yīng)場(chǎng)景下能夠滿足用戶使用要求與標(biāo)準(zhǔn)的即為可行性編碼方案,開展視頻通信編碼的質(zhì)量評(píng)價(jià)時(shí)也應(yīng)遵循這一原則[7]。結(jié)合《多媒體設(shè)備用主觀視頻質(zhì)量評(píng)估方法》(ITU-T P.910—2008),可以將網(wǎng)絡(luò)視頻通信編碼質(zhì)量分為很差(1級(jí))、較差或有明顯不適感(2級(jí))、一般(3級(jí))、可以接受(4級(jí))以及舒適(5級(jí))。
控制視頻播放環(huán)境的光照與播放設(shè)備保持不變,選擇30名普通工作人員開展基于網(wǎng)絡(luò)通信編碼的視頻質(zhì)量測(cè)試。其中,A測(cè)試視頻為單人視頻會(huì)議場(chǎng)景,B測(cè)試視頻為多人視頻會(huì)議場(chǎng)景,C測(cè)試視頻為多人舞蹈遠(yuǎn)程教學(xué)場(chǎng)景。按照一定的標(biāo)準(zhǔn)對(duì)得到的數(shù)據(jù)進(jìn)行篩選,以剔除偶然性數(shù)據(jù)。通過(guò)計(jì)算平均值,得到部分測(cè)試數(shù)據(jù)對(duì)比結(jié)果如表2所示。
表2 部分測(cè)試數(shù)據(jù)評(píng)價(jià)對(duì)比
對(duì)于A測(cè)試視頻而言,當(dāng)碼率限制為300 kb/s時(shí),幀率為10 fps具有更好的應(yīng)用效果。當(dāng)碼率限制提高到1 500 kb/s時(shí),兩種編碼策略均具有較高的評(píng)分。在單人視頻會(huì)議場(chǎng)景下,人物的面部細(xì)節(jié)與畫面清晰度要求相對(duì)較高,而畫面并不會(huì)出現(xiàn)頻繁的變化,選定10 fps的幀率可較好地匹配高碼率與低碼率。當(dāng)視頻分辨率提高到720P時(shí),會(huì)造成量化步長(zhǎng)顯著增大且畫面精細(xì)程度大幅降低。基于此,針對(duì)A類視頻通信場(chǎng)景,低碼率條件下應(yīng)選擇低分辨率、低幀率以及小窗播放模式,高碼率條件下應(yīng)選擇高分辨率播放模式。
對(duì)于B測(cè)試視頻而言,當(dāng)碼率限制為300 kb/s時(shí),幀率為10 fps具有更好的應(yīng)用效果。在多人視頻會(huì)議場(chǎng)景下,人物較多,視頻通信對(duì)畫面的連貫度要求相對(duì)較高,而對(duì)個(gè)人面部細(xì)節(jié)變化的捕捉要求相對(duì)較低。當(dāng)碼率提高到300 kb/s時(shí),分辨率為720P的應(yīng)用效果更好。無(wú)論選擇高碼率或低碼率,均應(yīng)優(yōu)先設(shè)置相對(duì)較高的播放分辨率。
對(duì)于C測(cè)試視頻而言,碼率限制為300 kb/s且分辨率為360P時(shí)的評(píng)價(jià)得分最低,這兩種方案應(yīng)被判定為失敗的編碼參數(shù)配置方案。當(dāng)碼率限制為1 500 kb/s或者300 kb/s時(shí),幀率為25fps具有更好的應(yīng)用效果。在多人舞蹈遠(yuǎn)程教學(xué)場(chǎng)景下,人物動(dòng)作跨度較大,整體運(yùn)動(dòng)軌跡較為復(fù)雜,視頻接收方對(duì)畫面的連貫性要求較高,而對(duì)人物的表情要求較低。在25 fps的幀率條件下,選擇720P的分辨率和1 500 kb/s的碼率得到了較高的評(píng)價(jià)得分?;诖?,高分辨率與高碼率的配置方案較為合適。
綜上所述,針對(duì)網(wǎng)絡(luò)視頻通信的編碼方案,若碼率受到顯著的限制,則視頻經(jīng)編碼后會(huì)出現(xiàn)不可避免的分辨率降低或幀率損失問(wèn)題,需要合理配置分辨率與幀率才能得到較高的用戶評(píng)價(jià)得分。針對(duì)不同的網(wǎng)絡(luò)視頻通信場(chǎng)景,用戶的需求也存在較大差異,合理設(shè)計(jì)編碼方法的評(píng)價(jià)方案,以用戶的實(shí)際體驗(yàn)為導(dǎo)向優(yōu)化各編碼配置方案。未來(lái)應(yīng)繼續(xù)深化對(duì)網(wǎng)絡(luò)視頻通信編碼方案的評(píng)價(jià)研究,以推動(dòng)視頻通信技術(shù)的發(fā)展。