張嘉琪 雷萌 馬思偉
摘要:超高清(UHD)視頻能為用戶帶來質(zhì)量更高、沉浸感更強(qiáng)的視覺體驗(yàn),但高帶寬成本限制了其推廣和應(yīng)用。為解決超高清視頻傳輸和存儲的難題,中國數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)(AVS)工作組制定了新一代視頻編碼標(biāo)準(zhǔn)——AVS3,并在超高清產(chǎn)業(yè)化應(yīng)用方面取得重要進(jìn)展。介紹了AVS3視頻編碼關(guān)鍵技術(shù),以及其與AVS2、多功能視頻編碼(VVC)、開放媒體聯(lián)盟視頻(AV1)等標(biāo)準(zhǔn)的性能對比情況。
關(guān)鍵詞:視頻編碼;AVS3;超高清
Abstract: Ultra-high definition (UHD) videos can provide users a higher quality and more immersive visual experiences. However, the application of UHD is limited by high bandwidth cost. To solve the transmission and storage problem of UHD, China Audio and Video Coding Standard (AVS) workgroup established a new generation of video coding standard—AVS3. Currently, AVS3 has made a great contribution to the development of UHD industries in China. Key technologies of AVS3 are described, and a comprehensive comparison with AVS2, versatile video coding (VVC) and alliance for open media video 1 (AV1) is conducted.
Keywords: video coding; AVS3; UHD
視覺是人類獲取信息的重要來源,視頻承載了海量非結(jié)構(gòu)化視覺信息,是應(yīng)用最廣泛的多媒體數(shù)據(jù)格式,它與人們的生活息息相關(guān),是人類獲取信息的重要途經(jīng)之一。目前,互聯(lián)網(wǎng)70%以上的流量來自于圖片和視頻,并且這個比例仍在持續(xù)攀升[1],視頻已成為網(wǎng)絡(luò)上體量最大的數(shù)據(jù)格式。據(jù)統(tǒng)計[1],2017年標(biāo)清和高清視頻內(nèi)容約各占視頻流量的一半;2019年標(biāo)清內(nèi)容的占比約下降到1/3,高清內(nèi)容成為主流,而超高清內(nèi)容的占比正在逐步攀升;預(yù)計到2022年,超高清內(nèi)容的占比約提升到1/4。
超高清視頻具有更高的空間和時間分辨率、更廣的色域和更寬的動態(tài)范圍,是繼視頻數(shù)字化、高清化之后的新一輪重大技術(shù)革新。視頻技術(shù)從高清向超高清的演進(jìn),不僅引發(fā)了內(nèi)容制播、芯片制造、網(wǎng)絡(luò)傳輸?shù)犬a(chǎn)業(yè)鏈各環(huán)節(jié)的升級換代,而且驅(qū)動了廣播電視、安防監(jiān)控、智能交通等以視頻為核心的行業(yè)服務(wù)轉(zhuǎn)型。自2018年起,中國超高清視頻產(chǎn)業(yè)已達(dá)萬億元級別。預(yù)計到2022年,中國超高清視頻產(chǎn)業(yè)總體規(guī)模將超過4萬億元[2]。
成倍增長的數(shù)據(jù)量給超高清視頻的高效傳輸和存儲帶來了巨大的挑戰(zhàn)。以8K、10 bit、120幀/秒的YUV(一種顏色編碼方法)420格式的超高清視頻為例,其原始數(shù)據(jù)的碼率會達(dá)到約88.99 Gbit/s。若采用第2代數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)(AVS2)/高效視頻編碼(HEVC)[3-4]標(biāo)準(zhǔn)對原始數(shù)據(jù)進(jìn)行壓縮,壓縮碼率約310 Mbit/s,帶寬傳輸壓力極大。因此,超高清視頻應(yīng)用迫切需要更加高效的壓縮技術(shù)。
為解決超高清視頻帶寬需求大、存儲難等問題,中國AVS工作組率先展開了具有自主知識產(chǎn)權(quán)的、針對超高清視頻的視頻編碼標(biāo)準(zhǔn)的制定工作。在2017年12月舉行的會議中,AVS工作組決定開展面向超高清視頻應(yīng)用的新一代數(shù)字視頻編碼標(biāo)準(zhǔn)(以下簡稱AVS3)的制定工作。AVS3的制定工作分為兩個階段:第1階段(基準(zhǔn)檔次)是從2018年3月到2019年6月,制定面向復(fù)雜度優(yōu)先的應(yīng)用,其性能相較于AVS2提升30%;第2階段(增強(qiáng)檔次)是從2019年6月到2021年12月,目標(biāo)是編碼效率比AVS2提升1倍以上,同時編碼性能超越同時代的其他國際標(biāo)準(zhǔn)。2020年5月13日,AVS3基準(zhǔn)檔次標(biāo)準(zhǔn)正式獲批并被頒布為團(tuán)體標(biāo)準(zhǔn)。
1 AVS3視頻編碼關(guān)鍵技術(shù)
AVS工作組自2002年成立以來,一直致力于制定高壓縮率和友好專利政策的視頻編碼標(biāo)準(zhǔn)。經(jīng)歷了19年的發(fā)展,AVS工作組已經(jīng)制定從AVS1到AVS3這3代視頻編碼標(biāo)準(zhǔn)。面向超高清視頻應(yīng)用,AVS3沿用了基于塊的預(yù)測變換混合編碼框架,具體如圖1所示。AVS3包括塊劃分、幀內(nèi)預(yù)測、幀間預(yù)測、變換量化、熵編碼、環(huán)路濾波等模塊。相較于AVS2,AVS3在保留部分編碼工具的同時,針對不同模塊引入了一些新的編碼工具[5],并采用了更靈活的塊劃分結(jié)構(gòu)、更精細(xì)的預(yù)測模式、更具適應(yīng)性的變換核,實(shí)現(xiàn)了約30%的碼率節(jié)省,顯著提升了編碼效率。
1.1 塊劃分
如圖2(a)所示,AVS2采用了基于四叉樹(QT)的遞歸劃分編碼框架,每個編碼單元(CU)的尺寸都是方形且允許被進(jìn)一步劃分為不同形狀的預(yù)測單元(PU)。為提升劃分的靈活性,AVS3引入了基于四叉、二叉(QTBT)和擴(kuò)展四叉樹(EQT)的劃分方式,如圖2(b)。QTBT加EQT的劃分方式允許出現(xiàn)非方形編碼單元,編碼單元是后續(xù)預(yù)測、變換和量化的基礎(chǔ),非方形劃分更加符合紋理精細(xì)和為了便于硬件實(shí)現(xiàn),AVS3采用了局部分離樹(LST)。LST技術(shù)為了避免色度出現(xiàn)邊長等于2像素的變換塊,在亮度塊劃分時,如果亮度塊出現(xiàn)邊長等于4像素的邊,則僅對亮度塊劃分,無須對色度塊劃分。為提高硬件流水處理效率,AVS3對一些小塊添加了模式限制。當(dāng)塊大小滿足限制后,該節(jié)點(diǎn)及其劃分得到的編碼塊的編碼模式只能全部選擇同一種預(yù)測模式,如幀間預(yù)測或幀內(nèi)預(yù)測。
1.2 幀間預(yù)測
幀間預(yù)測工具可以分為3類:一類是針對跳過模式和直接模式候選項(xiàng)的擴(kuò)充,一類是差分運(yùn)動矢量(MVD)編碼,最后一類則是基于子塊的運(yùn)動補(bǔ)償。
跳過模式和直接模式是一項(xiàng)使用相鄰編碼塊的運(yùn)動矢量(MV)進(jìn)行預(yù)測的高效編碼技術(shù)。AVS2中的跳過模式和直接模式候選項(xiàng)只有4個相鄰模式和1個時域模式,對圖像非相鄰結(jié)構(gòu)性和紋理多變性的區(qū)域編碼效率不高。AVS3引入了基于歷史運(yùn)動矢量的預(yù)測(HMVP)和高級運(yùn)動矢量表達(dá)(UMVE)等技術(shù)。HMVP利用非局部相似性的原理獲取更多非相鄰的運(yùn)動矢量候選,如圖3(a)所示。HMVP通過動態(tài)更新運(yùn)動候選矢量列表,保留了與當(dāng)前塊運(yùn)動相關(guān)性最高的候選項(xiàng),提高了跳過模式和直接模式、處理非局部相似性運(yùn)動的能力。UMVE通過對跳過模式和直接模式候選項(xiàng)加入運(yùn)動矢量偏移,對運(yùn)動矢量進(jìn)行更精細(xì)的表達(dá),可以更好地消除視頻場景中因劇烈運(yùn)動而帶來的匹配誤差。
自適應(yīng)運(yùn)動矢量精度(AMVR)和擴(kuò)展運(yùn)動矢量精度(EMVR)的引入提升了MVD的編碼效率。在AVS2中,運(yùn)動矢量精度只有1/4像素和1/2像素,且無法靈活選擇。AVS3中的AMVR使用了1/4、1/2、1、2、4像素精度的運(yùn)動矢量,根據(jù)視頻內(nèi)容自適應(yīng)地選擇預(yù)測精度,提高了幀間預(yù)測在不同區(qū)域的適應(yīng)性。EMVR提供了不同的運(yùn)動搜索起始點(diǎn),擴(kuò)大了運(yùn)動矢量的搜索空間,有效提升了運(yùn)動估計的準(zhǔn)確性。
雙向光流(BIO)[6]、仿射運(yùn)動(AFFINE)和解碼端運(yùn)動矢量修正(DMVR)[7]等技術(shù)采用基于子塊的運(yùn)動補(bǔ)償,提高了幀間預(yù)測準(zhǔn)確度?;谖矬w運(yùn)動軌跡是平滑的這一假設(shè),BIO通過最小化每個子塊的前向和后向預(yù)測樣本之間的差異來計算運(yùn)動細(xì)化差,然后使用運(yùn)動細(xì)化差來調(diào)整每個子塊的預(yù)測樣本值。如圖3(b)所示,AFFINE根據(jù)仿射變換模型,利用2個(四參數(shù))或3個(六參數(shù))控制點(diǎn)的運(yùn)動矢量導(dǎo)出當(dāng)前編碼塊的運(yùn)動矢量場。AFFINE運(yùn)動模型相對于AVS2中的平移運(yùn)動模型,可以有效提升具有縮放、旋轉(zhuǎn)、透視和其他不規(guī)則運(yùn)動等性能的視頻序列編碼。DMVR將編碼區(qū)域劃分為若干個不重疊的子塊,以初始MV為起始位置,使用最小化均方誤差的模板匹配方法對當(dāng)前MV進(jìn)行偏移,進(jìn)一步修正雙向預(yù)測樣本值。
1.3 幀內(nèi)預(yù)測
幀內(nèi)預(yù)測方面的新技術(shù)包括幀內(nèi)預(yù)測模式擴(kuò)展(EIPM)、預(yù)測像素濾波、跨分量預(yù)測等。
EIPM[8]擴(kuò)展了幀內(nèi)預(yù)測的角度,如圖4(a)所示。幀內(nèi)預(yù)測模式從33種擴(kuò)展到66種,包括62種角度模式和4種特殊模式,提高了對方向性紋理的預(yù)測能力,可以適應(yīng)紋理豐富的超高清視頻內(nèi)容。
幀內(nèi)預(yù)測濾波包含分像素插值濾波和預(yù)測像素值濾波。多組濾波(MIPF)根據(jù)塊內(nèi)像素點(diǎn)的個數(shù)和所在位置[9] ,使用4組不同的插值濾波器生成預(yù)測像素。多組濾波適用于不同的顏色分量和像素平滑程度,在復(fù)雜度極低的情況下,取得了可觀的性能增益。MIPF得到預(yù)測像素后,還可以對預(yù)測像素進(jìn)行幀內(nèi)預(yù)測濾波(IPF)。IPF使用高斯平滑濾波器,根據(jù)參考像素、預(yù)測模式和與參考像素的距離對預(yù)測像素做進(jìn)一步的修正,如圖4(b)所示??绶至款A(yù)測是指在色度預(yù)測編碼過程中,通過兩步預(yù)測模式(TSCPM)對色度進(jìn)行預(yù)測編碼。其原理是假定亮度和色度分量之間線性相關(guān),通過最小二乘法求解對應(yīng)線性回歸的參數(shù),在求得參數(shù)后,使用亮度重構(gòu)像素以精細(xì)重建對應(yīng)位置的色度像素,在色度上取得了顯著的增益。
1.4 變換與量化
變換可以集中能量,利于熵編碼進(jìn)行系數(shù)壓縮。離散余弦變換(DCT)具有很好的去相關(guān)能力[10],且由于其對稱性有利于軟硬件實(shí)現(xiàn),因此能夠在視頻壓縮領(lǐng)域得到廣泛的應(yīng)用。在上一代視頻編碼標(biāo)準(zhǔn)中,DCT-II作為主要應(yīng)用的變換核,適用于均勻分布的殘差變換,但缺乏處理不均勻殘差分布的能力。在AVS3中,隱則變換(IST)和子塊變換(SBT)引入了新的變換核DST-VII和DCT-VIII,能夠聚集不均勻分布?xì)埐畹哪芰?。IST[11]通過量化塊中偶數(shù)系數(shù)個數(shù)的奇偶性隱式地導(dǎo)出變換核的類型,在提高變換靈活性的同時,沒有引入額外的比特消耗?;趲g預(yù)測殘差分布的局部性,SBT把預(yù)測殘差分布的位置限制在殘差塊的1/2或者1/4區(qū)域,如圖5(a)所示,從而降低變換系數(shù)的局部分量,并減少了全零塊的編碼代價,提高了壓縮性能。
在系數(shù)編碼中,AVS3采用了一種基于掃描區(qū)域的系數(shù)編碼方案(SRCC)[12]。SRCC使用參數(shù)(SRx,SRy)控制量化系數(shù)非零的區(qū)域。為了達(dá)到碼率和失真之間的平衡以及提高系數(shù)編碼的靈活性,SRCC使用率失真優(yōu)化選擇最優(yōu)掃描區(qū)域。在掃描編碼區(qū)域內(nèi)的非零系數(shù)時,SRCC采取了從右下到左上的反Z形掃描方式,如圖5(b)所示;非零系數(shù)采用了分層編碼,不同層級使用多套上下文,根據(jù)系數(shù)在掃描區(qū)域的位置和掃描區(qū)域的面積確定上下文模型。精確的上下文建模顯著提升了壓縮效率。
1.5 基于卷積神經(jīng)網(wǎng)絡(luò)的環(huán)路濾波
為了探索神經(jīng)網(wǎng)絡(luò)在編碼標(biāo)準(zhǔn)中的可實(shí)現(xiàn)性,AVS3工作組設(shè)立了智能編碼專題小組,對基于卷積神經(jīng)網(wǎng)絡(luò)的環(huán)路濾波(CNNLF)[13]進(jìn)行了深入探索研究。CNNLF能夠代替?zhèn)鹘y(tǒng)的去塊(Deblock)濾波和樣本自適應(yīng)偏移(SAO)濾波,并取得了6%左右的性能增益。
CNNLF使用神經(jīng)網(wǎng)絡(luò)探索視頻信號之間的非線性關(guān)系和變化規(guī)律,對視頻信號的全局信息和局部關(guān)系進(jìn)行了聯(lián)合建模。得益于海量的訓(xùn)練數(shù)據(jù)和算力的提升,CNNLF的網(wǎng)絡(luò)泛化能力要遠(yuǎn)高于傳統(tǒng)濾波方式。CNNLF訓(xùn)練時以殘差塊為單位,加速了網(wǎng)絡(luò)收斂過程,并且設(shè)置不同量化參數(shù)(QP)段為訓(xùn)練單元,增強(qiáng)了網(wǎng)絡(luò)對QP的泛化能力。如圖6(a)所示,CNNLF的網(wǎng)絡(luò)由全局殘差、殘差塊、卷積層和激活層組成,采用亮度、色度分量分離訓(xùn)練的方式,且亮度分量指導(dǎo)色度分量濾波,進(jìn)一步提升色度分量的重建質(zhì)量,如圖6(b)所示。
1.6 性能對比
本文中,我們首先對AVS3與AVS2進(jìn)行了性能對比,測試時使用的參考軟件版本分別為參考設(shè)計模型19.5(RD 19.5)、高性能平臺4.0(HPM 4.0)和高性能平臺9.0(HPM 9.0),其中HPM 4.0和HPM 9.0分別用于測試AVS3第1階段和第2階段。測試配置為隨機(jī)訪問(RA)配置,測試結(jié)果見表1。可以看出AVS3第1階段相比AVS2平均可以獲得24%的性能提升,且對4K分辨率序列的提升更為明顯,達(dá)到了平均25%的性能提升。AVS3第2階段是基于第1階段的進(jìn)一步推進(jìn)。相比第1階段,AVS3第 2階段實(shí)現(xiàn)了約8%的性能提升;相比AVS2,實(shí)現(xiàn)了平均31%的性能提升,同時各分辨率序列的性能提升較為均衡,在部分4K序列上可以達(dá)到超40%的性能提升。此外,我們還測試了AVS3采用了CNNLF后的性能,如表1最右側(cè)所示可以再獲得近3%的性能提升。
我們還將AVS3和VVC[14]、開放媒體聯(lián)盟視頻標(biāo)準(zhǔn)(AV1)[15]進(jìn)行了對比。我們選取了5個2K序列及6個4K序列進(jìn)行測試,測試平臺分別為通用編碼測試平臺(VTM 10.0)、開放媒體聯(lián)盟視頻標(biāo)準(zhǔn)測試平臺(AOMOct)、HPM 4.0和HPM 9.0。如表2所示,VVC、AVS3和AV1相較于HEVC,在客觀性能上都有較大的提升,尤其是VVC的性能提升最為顯著,平均達(dá)到了40%;其他各標(biāo)準(zhǔn)中,AV1平均提升了25.5%的性能,對于AVS3,第1階段和第2階段分別達(dá)到了平均23%和30%的性能提升。綜合來看,VVC、AV1和AVS3在超高清序列方面都表現(xiàn)出了優(yōu)異的性能,達(dá)到了平均25%及以上的性能提升。VVC和AVS3更是達(dá)到了超30%的性能提升,個別序列能達(dá)到40%的性能提升。
2 AVS3超高清產(chǎn)業(yè)應(yīng)用
隨著超高清、全景視頻等應(yīng)用的高速發(fā)展,8K超高清,乃至16K、32K等更高分辨率的視頻內(nèi)容將進(jìn)一步流行。2019年,中國發(fā)布的《超高清視頻產(chǎn)業(yè)行動計劃(2019—2022)》明確指出超高清視頻將成為未來視頻產(chǎn)業(yè)的重要發(fā)展方向。
AVS3標(biāo)準(zhǔn)的頒布顯著加速了超高清產(chǎn)業(yè)鏈的升級革新。為了縮短標(biāo)準(zhǔn)制定和成果落地的時間,AVS3工作組在標(biāo)準(zhǔn)制定過程中,采用了分檔制定與芯片集成技術(shù)協(xié)同研發(fā)的推進(jìn)方式,同步推進(jìn)全產(chǎn)業(yè)鏈應(yīng)用開源合作。2019年6月,AVS3第1階段基準(zhǔn)檔次完成;2019年9月,在阿姆斯特丹舉辦的第五十屆荷蘭廣播電視設(shè)備展覽會上,海思發(fā)布了首個基于AVS3標(biāo)準(zhǔn)的8K端到端解決方案,同時推出了全球首顆基于AVS3標(biāo)準(zhǔn)的支持8K分辨率、120幀的超高清解碼芯片Hi3796CV300,如圖7(a)所示;隨后,北京大學(xué)、北京博雅睿視科技有限公司和英特爾合作推出了SVTAVS3 8K實(shí)時編碼器,并搭建了8K端到端實(shí)時編解碼系統(tǒng),如圖7(b)所示。北京大學(xué)深圳研究生院開發(fā)了支持AVS3標(biāo)準(zhǔn),8K分辨率、60幀實(shí)時解碼器uAVS3d。2020年5月,當(dāng)虹科技AVS3 8K超高清編碼器和上海海思AVS3 8K超高清解碼板完成了AVS3+5G+8K全國直播首測,主要測試在5G鏈路下的8K超高清節(jié)目直播傳輸應(yīng)用。近期,中央廣播電視總臺啟動“5G+4K/8K超高清制播示范平臺”項(xiàng)目,其中包括搭建AVS2/AVS3標(biāo)準(zhǔn)超高清電視影院直播系統(tǒng)以及5G和超高清相關(guān)的測試體系。中央廣播電視總臺會將AVS3 8K超高清現(xiàn)場直播運(yùn)用在2022年北京冬季奧運(yùn)會中。
3 結(jié)束語
本文簡要介紹了新一代視頻編碼標(biāo)準(zhǔn)AVS3的關(guān)鍵技術(shù)和AVS3超高清應(yīng)用情況。與AVS2視頻編碼標(biāo)準(zhǔn)相比,AVS3編碼效率顯著提升。AVS3標(biāo)準(zhǔn)在技術(shù)創(chuàng)新、專利政策與生態(tài)建設(shè)方面已有全面的布局,為中國8K超高清視頻產(chǎn)業(yè)的發(fā)展奠定了堅實(shí)的基礎(chǔ)??梢灶A(yù)見的是,隨著5G的快速發(fā)展和超高清時代的來臨,AVS3標(biāo)準(zhǔn)前景廣闊,將獲得更廣泛的應(yīng)用。
參考文獻(xiàn)
[1] FORECAST G. Cisco visual networking index: global mobile data traffic forecast update, 2017-2022 [R]. 2017
[2] 工信部等三部門聯(lián)合印發(fā)《超高清視頻產(chǎn)業(yè)發(fā)展行動計劃(2019-2022年)》 [EB/OL]. [2020-12-22]. http://www.gov.cn/gongbao/content/2019/content_5419224.htm
[3] MA S W, HUANG T J, READER C, et al. AVS2 ? making video coding smarter [standards in a nutshell] [J]. IEEE signal processing magazine, 2015, 32(2): 172-183. DOI:10.1109/msp.2014.2371951
[4] SULLIVAN G J, OHM J R, HAN W J, et al. Overview of the high efficiency video coding (HEVC) standard [J]. IEEE transactions on circuits and systems for video technology, 2012, 22(12): 1649-1668. DOI:10.1109/ tcsvt.2012.2221191
[5] ZHANG J Q, JIA C M, LEI M, et al. Recent development of AVS video coding standard: AVS3[C]//2019 Picture Coding Symposium (PCS). Ningbo, China: IEEE, 2019: 1-5. DOI:10.1109/ pcs48520.2019.8954503
[6] 王凡, 歐陽曉, 呂卓逸, 等. CE: BIO 雙向光流 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第六十九次會議. 成都, 中國: AVS工作組, 2019
[7] 徐巍煒, 趙寅, 楊海濤. CE3.1: 簡化DMVR方案[C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第七十次會議. ???, 中國: AVS工作組, 2019
[8] 雷萌, 羅法蕾, 王苫社, 等. CE2-related: 幀內(nèi)角度模式擴(kuò)展 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第七十次會議. ??冢?中國: AVS工作組, 2019
[9] 王英彬, 許曉中, 李一鳴, 等. CE1-related: 幀內(nèi)預(yù)測參考像素濾波設(shè)計方法 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第七十次會議. ???,中國: AVS工作組, 2019
[10] NUSSBAUMER H J. The fast Fourier transform [M]//Fast fourier transform and convolution algorithms. Berlin, Heidelberg: Springer Berlin Heidelberg, 1981: 80-111
[11] 張玉槐, 張凱, 張莉, 等. 幀內(nèi)自適應(yīng)變換 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第六十九次會議. 成都, 中國: AVS工作組, 2019
[12] 王凡, 歐陽曉, 呂卓逸, 等. SRCC基于掃描區(qū)域的系數(shù)編碼 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組第七十次會議. ??冢?中國: AVS工作組, 2019
[13] 林凱, 賈川民, 趙政輝, 等. CE: 基于殘差網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)濾波 [C]//數(shù)字視音頻編解碼技術(shù)標(biāo)準(zhǔn)化工作組視頻組2020年1月加會. 北京, 中國: AVS工作組, 2020
[14] BROSS B, CHEN J, LIU S, et al. Versatile video coding (Draft 10): ITU-T and ISO/IEC JVET-S2001 [S]. 2020
[15] CHEN Y, MURHERJEE D, HAN J N, et al. An overview of core coding tools in the AV1 video codec [C]//2018 Picture Coding Symposium(PCS). San Francisco, CA, USA: IEEE, 2018: 41-45. DOI:10.1109/pcs.2018.8456249
作者簡介
張嘉琪,中國科學(xué)院計算技術(shù)研究所在讀博士研究生;主要研究方向?yàn)橐曨l編碼及處理;所提多項(xiàng)標(biāo)準(zhǔn)提案已被AVS3、VVC等標(biāo)準(zhǔn)采納。
雷萌,北京大學(xué)信息科學(xué)技術(shù)學(xué)院在讀博士研究生;主要研究方向?yàn)橐曨l編碼及處理;發(fā)表論文2篇。
馬思偉,北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師,國家杰出青年科學(xué)基金獲得者,現(xiàn)擔(dān)任AVS視頻組組長;主要研究方向?yàn)橐曨l編碼及處理;曾主持“863”計劃、科技支撐計劃、國家自然科學(xué)基金重點(diǎn)項(xiàng)目等多項(xiàng)國家級課題;曾獲國家技術(shù)發(fā)明獎二等獎、國家科學(xué)技術(shù)進(jìn)步獎二等獎、中國電子學(xué)會特等獎等獎勵;已發(fā)表SCI論文70余篇,已獲得授權(quán)發(fā)明專利50余項(xiàng)。