袁國良,陳 慧
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
一種基于HEVC幀內(nèi)預(yù)測(cè)模式快速選擇算法
袁國良,陳 慧
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
在保證編碼性能前提下減少幀內(nèi)編碼復(fù)雜度是當(dāng)前研究的熱點(diǎn)。因此一種幀內(nèi)預(yù)測(cè)模式快速選擇算法被提出。首先基于邊緣方向強(qiáng)度,將幀內(nèi)預(yù)測(cè)模式按照基本方向進(jìn)行初篩,然后結(jié)合累積梯度和最終確定幀內(nèi)預(yù)測(cè)模式,從而降低了率失真優(yōu)化所帶來的計(jì)算復(fù)雜度。實(shí)驗(yàn)結(jié)果表明,整體編碼時(shí)間相對(duì)于參考算法減少大約20%~25%。
HEVC;幀內(nèi)預(yù)測(cè);率失真性能;方向強(qiáng)度
2013年1月25日,國際電信聯(lián)盟ITU正式宣布推出新一代視頻編解碼標(biāo)準(zhǔn)ITU-T H.265 / ISO/IEC 23008-2。H.265又名HEVC(High Efficiency Video Coding),基于ITU-T H.264 / MPEG-4 AVC標(biāo)準(zhǔn),由ITU與MPEG兩大組織合作開發(fā),提供了更加靈活、可靠和穩(wěn)定的視頻解決方案。HEVC繼承了H.264/AVC基于塊的混合編碼結(jié)構(gòu),同時(shí)對(duì)一些技術(shù)作了改進(jìn),其中包括靈活的編碼塊結(jié)構(gòu)、采樣點(diǎn)自適應(yīng)偏移、自適應(yīng)環(huán)路濾波、并行化設(shè)計(jì)等技術(shù)。在保證視頻編碼性能的同時(shí),降低編碼計(jì)算復(fù)雜度、節(jié)省編碼時(shí)間是當(dāng)前視頻編碼領(lǐng)域的研究熱點(diǎn)。
針對(duì)這一研究熱點(diǎn),國內(nèi)外學(xué)者提出了大量的幀內(nèi)預(yù)測(cè)模式快速算法。文獻(xiàn)[1]通過Sobel算子獲得圖像的邊緣方向信息,并以此為依據(jù)確定相應(yīng)的最優(yōu)、次優(yōu)預(yù)測(cè)模式,有效減少了候選模式數(shù)。文獻(xiàn)[2]提出了一種基于邊緣方向強(qiáng)度檢測(cè)的快速幀內(nèi)預(yù)測(cè)模式?jīng)Q策算法,將35種預(yù)測(cè)模式按方向強(qiáng)度減少為11種。上述的幾種算法都只是從減少幀內(nèi)預(yù)測(cè)模式數(shù)量的角度進(jìn)行性能優(yōu)化的。本文進(jìn)一步引入累積梯度和,從而減少了耗時(shí)的率失真代價(jià)計(jì)算過程,達(dá)到了降低整體幀內(nèi)預(yù)測(cè)計(jì)算復(fù)雜度的目的。
1.1幀內(nèi)預(yù)測(cè)模式
幀內(nèi)預(yù)測(cè)技術(shù)是利用相鄰像素之間的空間相關(guān)性對(duì)當(dāng)前編碼塊進(jìn)行預(yù)測(cè)的一種編碼技術(shù),能夠有效地去除空間冗余信息。在H.264視頻編碼標(biāo)準(zhǔn)中,幀內(nèi)預(yù)測(cè)模式采用的是16×16和4×4兩種預(yù)測(cè)模式,且分別只有9種和4種預(yù)測(cè)方向。而在HEVC 視頻標(biāo)準(zhǔn)中,為了能夠提供更精確的預(yù)測(cè)并提高幀內(nèi)預(yù)測(cè)的編碼效率,增加了多種幀內(nèi)預(yù)測(cè)模式,分別包括33種角度預(yù)測(cè)模式、DC模式以及平面(planar)模式。各模式的編號(hào)[3]如圖1所示。
圖1 幀內(nèi)預(yù)測(cè)模式編號(hào)
1.2預(yù)測(cè)模式的分組劃分
由于幀內(nèi)預(yù)測(cè)模式與視頻圖像塊內(nèi)的邊緣方向是密切相關(guān)的,因此可以將33種角度預(yù)測(cè)模式根據(jù)邊界方向劃分為4類,每類包含9種角度預(yù)測(cè)模式[4],如表1所示。
表1 預(yù)測(cè)模式分類
接下來利用邊界方向強(qiáng)度來為當(dāng)前待編碼塊選定邊界方向。
1.3邊界方向的選定
由于PU塊的紋理方向與預(yù)測(cè)模式方向具有相似性[5]。因此,可以計(jì)算出各PU塊的紋理方向來確定最終的預(yù)測(cè)方向。邊界方向強(qiáng)度可以很好地體現(xiàn)圖像塊的紋理方向,其算法過程如下:
首先將4×4的PU塊劃分成4個(gè)2×2的塊,每個(gè)子塊灰度值可以用其中包含的4個(gè)像素的平均值Sxy表示[6]。計(jì)算過程如式(1):
(1)
其中:p()表示4×4 PU塊的各像素值。
每個(gè)方向角度分組的邊界方向強(qiáng)度的計(jì)算[7]依次如下:
E0=|(S00+S11)/2-(S01+S10)/2|
(2)
Eπ/4=max{|S00-(S01+S10+S11)/3|,
|S11-(S00+S10+S01)/3|}
(3)
Eπ/2=|(S00+S10)/2-(S01+S11)/2|
(4)
E3π/4=max{|S01-(S00+S10+S11)/3|,
|S10-(S00+S01+S11)/3|}
(5)
分別計(jì)算4個(gè)方向角度分組的邊界方向強(qiáng)度值,最大值所對(duì)應(yīng)的方向角度分組即為選定的模式分組。
經(jīng)上述計(jì)算過程后,將候選預(yù)測(cè)模式從35種減少到11種,本文接下來采用累積梯度和的方法進(jìn)一步確定最終預(yù)測(cè)模式。
1.4最終預(yù)測(cè)模式的選定
根據(jù)待編碼原始?jí)K的方向性,與待編碼原始?jí)K有相同方向的預(yù)測(cè)模式則有可能是最優(yōu)預(yù)測(cè)模式[8]。本文中,首先通過計(jì)算每個(gè)預(yù)測(cè)方向上的累計(jì)梯度和來判斷原始?jí)K的方向。
dxij=pi-1, j+1+2pi,j+1+pi+1,j+1-pi-1,j-1-2pi,j-1-pi+1,j-1
(6)
dyij=pi+1,j-1+2pi+1,j+pi+1,j+1-pi-1,j-1-2pi-1,j-pi-1,j+1
(7)
(8)
(9)
表2 幀內(nèi)預(yù)測(cè)模式的角度區(qū)間
通過查表來確定各個(gè)像素的預(yù)測(cè)方向,然后根據(jù)式(8)分別計(jì)算每個(gè)像素的梯度,并根據(jù)查表結(jié)果計(jì)算每個(gè)預(yù)測(cè)方向上像素的梯度和,稱為累積梯度和AGM。如式(10)所示:
(10)
其中,M表示1.3節(jié)中選定的11種預(yù)測(cè)方向。在計(jì)算過程中可能會(huì)出現(xiàn)預(yù)測(cè)方向不在上述的11種之內(nèi),這種預(yù)測(cè)方向?qū)⒉挥栌?jì)算在內(nèi)。
接下來,計(jì)算每個(gè)預(yù)測(cè)方向模式對(duì)應(yīng)預(yù)測(cè)塊的SATD值,計(jì)算方法如式(11)所示:
(11)
其中M為方陣的大小,X為預(yù)測(cè)模式對(duì)應(yīng)的預(yù)測(cè)塊,H為歸一化的M×MHadamard矩陣。
通常情況下,SATD值越小,AGM越大,其對(duì)應(yīng)的預(yù)測(cè)方向越接近實(shí)際的預(yù)測(cè)方向。因此,本文利用SATD值與累積梯度和來聯(lián)合確定最終的預(yù)測(cè)模式。定義S為某個(gè)預(yù)測(cè)模式對(duì)應(yīng)預(yù)測(cè)塊的SATD值與整體11種預(yù)測(cè)模式的SATD值總和的比,G為某個(gè)預(yù)測(cè)模式的累積梯度和的倒數(shù)與整體11種預(yù)測(cè)模式的倒數(shù)和的比。如式(12)所示:
(12)
其中k、j的取值為所對(duì)應(yīng)的預(yù)測(cè)方向模式。由式(12)可以看出Sj正比于SATD,Gj反比于AGM。進(jìn)而定義一個(gè)特征向量fj=[Sj,Gj]T,計(jì)算特征向量的歐幾里得范數(shù)。如式(13)所示:
(13)
其中fj=(Sj,Gj)T。則范數(shù)越小,對(duì)應(yīng)的預(yù)測(cè)模式為最可能的預(yù)測(cè)模式。
1.5本文算法流程
根據(jù)前面的分析,本文算法的具體流程如下:
(1)首先根據(jù)1.2節(jié)所描述的先將預(yù)測(cè)模式按邊界方向劃分為4組。
(2)然后通過邊界強(qiáng)度的計(jì)算(見1.3節(jié))來確定邊界方向,將預(yù)測(cè)方向從35種減少到11種。
(3)根據(jù)1.4節(jié)所述,首先通過式(10)計(jì)算出累積梯度和,通過式(11)計(jì)算對(duì)應(yīng)預(yù)測(cè)塊的SATD值。
(4)根據(jù)式(12)與式(13)的計(jì)算結(jié)果來選定最佳的預(yù)測(cè)模式。
仿真采用的是HM10.0代碼,實(shí)驗(yàn)平臺(tái)為CPU 2.4 GHz Intel Core i5、內(nèi)存6 GB、操作系統(tǒng)為Windows 7的32位計(jì)算機(jī),運(yùn)行環(huán)境是Microsoft Visual Studio 2010,分別在QP值為28、32、36三種情況下對(duì)5組視頻序列進(jìn)行測(cè)試,各
序列的分辨率如表3所示。
表3 5組視頻序列分辨率測(cè)試結(jié)果
對(duì)每個(gè)序列的前50幀進(jìn)行編碼。比較編碼效率的參數(shù)指標(biāo)有PSNR增量(ΔPSNR),碼率增量(ΔBitrate)和編碼時(shí)間(ΔTime),計(jì)算公式如下:
從表4中可以看出,本文算法和文獻(xiàn)[8]算法相對(duì)于HM10.0,在保證率失真性能沒有明顯下降的前提下,整體編碼時(shí)間都大大縮短。本文算法相比于文獻(xiàn)[8],由于采用了SATD值與累積梯度和來聯(lián)合確定最終的預(yù)測(cè)模式,避免了率失真優(yōu)化過程帶來的高計(jì)算復(fù)雜度,因此編碼時(shí)間進(jìn)一步減少,與HM10.0相比降低了大約15%~23%。
表4 實(shí)驗(yàn)結(jié)果
本文首先將35種預(yù)測(cè)模式按方向進(jìn)行分類,根據(jù)邊界方向強(qiáng)度將預(yù)測(cè)模式限定在11種以內(nèi),在此基礎(chǔ)之上利用SATD與累積梯度和來聯(lián)合確定最優(yōu)幀內(nèi)預(yù)測(cè)模式,省去了對(duì)預(yù)測(cè)模式的率失真優(yōu)化(RDO-Cost)計(jì)算,從而降低了視頻編碼的計(jì)算復(fù)雜度。仿真結(jié)果表明,在確保率失真性能的條件下,大大減少了編碼時(shí)間。
[1] 王嵩,王青,薛全. 幀內(nèi)預(yù)測(cè)的模式選擇快速算法研究及其實(shí)現(xiàn)[J]. 浙江理工大學(xué)學(xué)報(bào), 2005,22(1):57-60.
[2] 雷海軍,危雄,楊張,等.一種快速HEVC幀內(nèi)預(yù)測(cè)模式?jīng)Q策算法[J].計(jì)算機(jī)工程,2014,40(5):270-273.
[3] SULLIVAN G J, OHM J R, HAN W J, et al. Overview of the high efficiency video coding(HEVC) standard[J]. IEEE Trans. Circuits Syst. Video Technol., 2012, 22(12): 1649-1668.
[4] 趙曉燕,李金良.一種用于H.264的快速幀內(nèi)預(yù)測(cè)模式判別方法[J].計(jì)算機(jī)工程與設(shè)計(jì), 2005,26(4): 1031-1035.
[5] 揭月馨, 劉浩, 王登程,等.基于SATD準(zhǔn)則的HEVC快速幀內(nèi)預(yù)測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(11):185-189.
[6] LAINEMA J, BOSSEN F, HAN W J, et al. Intra coding of the HEVC standard[J]. IEEE Transactionson Circuits and Systems for Video Technology, 2012, 22(12): 1792-1801.
[7] AHMED N, NATARAJAN T, RAO K R. Discrete cosine transform[J]. IEEE Transactions on Computers, 1974, 23(1): 90-93.
[8] CHANG K, MEN A D, ZHANG W H. Fast intra-prediction mode decision for H.264/AVC[J].ISECS International Colloquium on Computing, Communication, Control and Management, 2009, 3(14): 69-73.
A fast-intra prediction mode selection algorithm based on HEVC
Yuan Guoliang, Chen Hui
(College of Information Engineering, Shanghai Maritime University, Shanghai 201306, China)
In the premise of ensuring encoding performance, reducing intra-frame coding complexity is a current research focus. This paper presents a fast intra prediction mode selection algorithm. Based on edge directional strength, the intra-prediction mode is screened in accordance with the basic direction of the prediction modes. Then, combined with the accumulated gradient to finalize the intra-prediction mode, which reduces the computational complexity caused by rate distortion optimization. Experimental results show that the overall encoding time reduces by about 20% to 25% compared with the reference algorithm.
HEVC; intra prediction; rate distortion performance; direction of strength
TN919.81
A
10.19358/j.issn.1674- 7720.2017.19.015
袁國良,陳慧.一種基于HEVC幀內(nèi)預(yù)測(cè)模式快速選擇算法[J].微型機(jī)與應(yīng)用,2017,36(19):52-54,61.
2017-03-07)
袁國良(1965-),男,碩士,副教授,碩士研究生導(dǎo)師,主要研究方向:視頻壓縮編碼及多媒體通信。陳慧(1991-),通信作者,女,碩士,主要研究方向:視頻壓縮編碼及多媒體通信。E-mail:630998214@qq.com。