[張萍 劉曉玲]
H.265關(guān)鍵技術(shù)研究
[張萍 劉曉玲]
H.265是新一代視頻編碼標(biāo)準(zhǔn),沿用了H.264的混合視頻編碼框架,但又有新的技術(shù)亮點(diǎn)。對比H.264標(biāo)準(zhǔn),H.265的壓縮效率有了顯著提高,編碼同等質(zhì)量的視頻較H.264可節(jié)省約一半的碼流,并增加了更多的并行機(jī)制和網(wǎng)絡(luò)傳輸機(jī)制。對H.265的關(guān)鍵技術(shù)進(jìn)行綜述,著重分析編碼結(jié)構(gòu)、幀內(nèi)/幀間預(yù)測、自適應(yīng)補(bǔ)償、并行編碼及對H.264的關(guān)鍵改進(jìn)。
H.265 H.264 視頻編碼
張萍
碩士,中國電信股份有限公司廣州研究院,研究方向:視頻編解碼算法、云視頻轉(zhuǎn)碼、互聯(lián)網(wǎng)應(yīng)用、云計算。
劉曉玲
碩士,中國電信股份有限公司廣州研究院,研究方向:視頻編解碼算法、視頻云轉(zhuǎn)碼,自然語言處理、知識管理。
伴隨高清、超高清4K乃至8K視頻的興起,海量的高清、超高清視頻數(shù)據(jù)對存儲提出新要求,其傳輸及點(diǎn)播應(yīng)用對網(wǎng)絡(luò)帶寬也提出了諸多挑戰(zhàn)。當(dāng)前普遍采用的H.264視頻壓縮標(biāo)準(zhǔn)已無法滿足需求,亟需一種更高分辨率、更高壓縮率、更高質(zhì)量的編碼標(biāo)準(zhǔn)。
2013年ITU-T視頻編碼專家組與ISO/IEC動態(tài)圖像專家組聯(lián)合成立了視頻編碼聯(lián)合協(xié)作組(JCT-VC),并推出H.265/HEVC標(biāo)準(zhǔn)[1]。相比H.264標(biāo)準(zhǔn),H.265的壓縮效率有了顯著提高,編碼同等質(zhì)量的視頻較H.264可節(jié)省40%~50%的碼流,并增加了更多的并行機(jī)制和網(wǎng)絡(luò)傳輸機(jī)制。例如,采用H.264標(biāo)準(zhǔn)需4M碼率才能保證圖像質(zhì)量的1080P視頻,采用H.265標(biāo)準(zhǔn)碼率可降到2M左右,顯而易見采用H.265能有效降低高清視頻的存儲成本和傳輸時對網(wǎng)絡(luò)帶寬的要求。此外,H.265還支持4K、8K等超高清視頻格式。
H.265沿用了H.264的混合視頻編碼框架[2],但又有新的技術(shù)特點(diǎn),如圖1所示,其核心編碼模塊包括:幀內(nèi)/幀間預(yù)測、變換及量化、去塊濾波器、熵編碼等。針對超高清清視頻的編碼及并行處理,H.265定義了靈活的塊結(jié)構(gòu),同時對各個編碼模塊進(jìn)行了優(yōu)化和改進(jìn),又增加了新的編碼模塊(如SAO),使得壓縮效率得到顯著提高。
圖1 H.265編碼框架
2.1 樹型編碼結(jié)構(gòu)
類似H.264宏塊,H.265把一幀圖像分割成互不重疊的編碼樹單元(CTU)。與傳統(tǒng)宏塊不同,CTU的大小可從16x16擴(kuò)展到64x64,在高分辨率視頻編碼中,大尺寸的CTU可獲得更好的壓縮效率。CTU可通過四叉樹遞歸分解成多個編碼單元(CU),如圖2所示編碼樹單元的四叉樹分解[3]。四叉樹結(jié)構(gòu)使得H.265能夠根據(jù)當(dāng)前塊的局部特性自適應(yīng)地進(jìn)行分塊處理,在平滑區(qū)域采用較大的編碼單元,而在紋理細(xì)節(jié)區(qū)域采用較小的編碼單元。
圖2 編碼樹單元的四叉樹分解
在幀內(nèi)/幀間預(yù)測模式下,一個CU又可劃分成多個預(yù)測單元(PU),在變換和量化模式下,一個CU同樣可以劃分成多個轉(zhuǎn)換單元(TU)。CU、PU和TU三個單元的相互獨(dú)立,使得編碼、預(yù)測、變換及量化各環(huán)節(jié)可分別優(yōu)化,整體更加靈活高效。
2.2 幀內(nèi)預(yù)測技術(shù)
幀內(nèi)預(yù)測是利用已編碼的相鄰塊的重構(gòu)圖像預(yù)測當(dāng)前塊,H.265擴(kuò)展了幀內(nèi)預(yù)測模式,提供了33種方向性幀內(nèi)預(yù)測方式,以及DC和Planar兩種平面預(yù)測方式[3]。與H.264相比較,H.265中方向性幀內(nèi)預(yù)測的角度劃分更細(xì),可以增加預(yù)測的精度,減小圖像殘差數(shù)據(jù)的產(chǎn)生,增加數(shù)據(jù)壓縮效率。
2.3 幀間預(yù)測技術(shù)
運(yùn)動補(bǔ)償是幀間預(yù)測的重要方法,插值方法用于計算運(yùn)動補(bǔ)償中非整數(shù)位置的像素值。H.264對1/4像素采用二次插值,先通過6階插值濾波器計算1/2像素值,再采用線性插值得到1/4像素值。而H.265對1/2像素的插值采用對稱的8階濾波器,對1/4像素采用非對稱的7階濾波器。H.265這種采用高階濾波器的單次插值方法,避免了中間過程的取整操作,提高了插值運(yùn)算的精度。
H.265利用時域/空域運(yùn)動向量的相關(guān)性,設(shè)計了更為復(fù)雜幀間預(yù)測模式,定義了Skip、Merge、Inter三種模式,其中Skip模式和Merge模式的每個預(yù)測單元(PU)的運(yùn)動參數(shù)可直接由相鄰的已編碼塊導(dǎo)出,因而只需編碼一個指向參考塊位置的索引。
2.4 采樣自適應(yīng)補(bǔ)償
與H.264類似,H.265在編碼環(huán)路內(nèi)采用了去塊濾波器減少塊效應(yīng)、振鈴效應(yīng),但在去塊濾波器之后引入了采樣自適應(yīng)補(bǔ)償(SAO)技術(shù)。SAO對重建并經(jīng)環(huán)路濾波后的圖像進(jìn)行處理,對不同類別的像素加上一個偏移值,從而降低原始圖像與重構(gòu)圖像間的整體失真,提高壓縮率并減少碼率。
2.5 并行編碼技術(shù)
為增強(qiáng)并行處理能力,H.265標(biāo)準(zhǔn)引入了Tile并行、錯峰并行(WPP)、Slice并行等新特性。Tile并行中,圖像按水平和垂直兩個方向劃分成很多矩形區(qū)域,即Tile,Tile間相互獨(dú)立并可實(shí)現(xiàn)并行處理。Slice并發(fā),一個Slice允許劃分成多個子條帶,每個子條帶可獨(dú)立編碼。WPP并行,上一行的第二個LCU處理完畢,允許對當(dāng)前行進(jìn)行編碼操作,從而進(jìn)一步提高編碼器的并行處理能力。
2.6 對H.264的關(guān)鍵改進(jìn)
針對視頻高清化和編碼并行化,H.265對各模塊進(jìn)行了大幅改進(jìn),提高了算法復(fù)雜度以獲得更好的壓縮效率,對H.264的關(guān)鍵改進(jìn)如表1所示[4]。
表1 H.265對H.264的關(guān)鍵改進(jìn)
H.265是繼H.264之后的新一代視頻編碼標(biāo)準(zhǔn),具有優(yōu)良的網(wǎng)絡(luò)適應(yīng)性、并行處理能力及壓縮效率。但H.265的算法復(fù)雜度相比H.264提高了2~10倍,采用H.265的實(shí)時編碼對計算機(jī)硬件性能提出更高要求。
目前國內(nèi)外主要的編碼設(shè)備廠商正在積極參與H.265標(biāo)準(zhǔn)的研究,隨著H.265編解碼芯片的推出,H.265標(biāo)準(zhǔn)將逐漸取代H.264廣泛應(yīng)用到高清、超高清視頻的壓縮編碼、網(wǎng)絡(luò)傳輸,促進(jìn)高清、超高清電視節(jié)目、網(wǎng)絡(luò)視頻的普及。
1High Efficiency Video Coding,Rec.ITU-T H.265 And ISO/ IEC23008-2,2013 G.J.Sullivan,J.Ohm,W.Han,T.Wiegand,“Overview of
2the High Efficiency Video Coding,” in IEEE TCSVT,vol.22,no.12,pp.1649-1668,2012
3新一代視頻編碼標(biāo)準(zhǔn)HEVC的關(guān)鍵技術(shù).數(shù)據(jù)采集與處理.Vol.29,No.01,2014
4下一代視頻編碼標(biāo)準(zhǔn)H.265的核心技術(shù)研究.計算機(jī)技術(shù)與發(fā)展.Vol.24,No.04,2014
10.3969/j.issn.1006-6403.2016.10.011
(2016-09-14)