艾達(dá) 盧雪磊 高陽(yáng) 董久軍
摘 要: 高效率視頻編碼(HEVC)存在幀內(nèi)預(yù)測(cè)計(jì)算復(fù)雜度過(guò)高的情況,而機(jī)器學(xué)習(xí)方法在HEVC快速幀內(nèi)預(yù)測(cè)算法的研究取得了一定的進(jìn)展。對(duì)近年來(lái)常用的機(jī)器學(xué)習(xí)算法在幀內(nèi)預(yù)測(cè)快速深度決策和模式?jīng)Q策兩方面的應(yīng)用進(jìn)行詳述,總結(jié)比較不同文獻(xiàn)提出的機(jī)器學(xué)習(xí)方法在編碼性能上的優(yōu)劣,最后分析機(jī)器學(xué)習(xí)算法在幀內(nèi)編碼應(yīng)用中存在的問(wèn)題,為下一步研究提供參考性建議。
關(guān)鍵詞: 高效視頻編碼; 幀內(nèi)預(yù)測(cè); 深度決策; 模式?jīng)Q策; 機(jī)器學(xué)習(xí); 計(jì)算復(fù)雜度
中圖分類(lèi)號(hào): TN919.81?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)18?0178?04
Advances in research of HEVC fast intra?frame prediction algorithm
based on machine learning
AI Da1, LU Xuelei1, GAO Yang2, DONG Jiujun2
(1. The Key Laboratory of Electronic Information Site?Survey Application Technology of The Ministry of Public Security, Xian University of Posts and Telecommunications, Xian 710121, China;
2. School of Communications and Information Engineering, Xian University of Posts and Telecommunications, Xian 710121, China)
Abstract: In view of the high computational complexity of intra?frame prediction in high efficiency video coding (HEVC), and a certain progress that the machine learning method has made in research of the HEVC fast intra?frame prediction algorithm, the application of common machine learning algorithms in recent years to the depth decision and mode decision of fast intra?frame prediction is discussed in detail. The coding performance advantages and disadvantages of the machine learning methods proposed in different literatures are summarized and compared. The intra?frame coding application problems of machine learning algorithm are analyzed, which can provide reference suggestions for further research.
Keywords: HEVC; intra?frame prediction; depth decision; mode decision; machine learning; computational complexity
0 引 言
為了適應(yīng)高清視頻在應(yīng)用中對(duì)數(shù)據(jù)處理能力的迫切需求,新一代視頻壓縮編碼標(biāo)準(zhǔn)高效視頻編碼(High Efficiency Video Coding,HEVC)[1]應(yīng)運(yùn)而生。HEVC引入了一些新的編碼技術(shù):基于四叉樹(shù)劃分的編碼單元(CU)、預(yù)測(cè)單元(PU)和變換單元(TU)[2]、35種幀內(nèi)預(yù)測(cè)方向[3]、先進(jìn)的運(yùn)動(dòng)矢量預(yù)測(cè)技術(shù)(AMVP)和運(yùn)動(dòng)信息融合技術(shù)(Merge)以及像素自適應(yīng)補(bǔ)償技術(shù)等,這些新技術(shù)的應(yīng)用使HEVC可節(jié)省近50%比特率[4] 。但在提供相同視頻質(zhì)量前提下比上一代視頻編碼標(biāo)準(zhǔn)H.264,相應(yīng)的編碼復(fù)雜度[5]提高了2~4倍。如何在保證視頻質(zhì)量前提下降低HEVC編碼復(fù)雜度問(wèn)題已成為研究熱點(diǎn)。
幀內(nèi)編碼作為高效視頻編碼中一個(gè)重要環(huán)節(jié),采用了靈活的四叉樹(shù)分割[6]技術(shù)和多角度幀內(nèi)預(yù)測(cè)技術(shù),導(dǎo)致幀內(nèi)編碼復(fù)雜度極高。目前國(guó)內(nèi)外關(guān)于快速幀內(nèi)編碼算法研究主要是從CU快速劃分決策和快速幀內(nèi)預(yù)測(cè)模式?jīng)Q策[7]兩方面進(jìn)行的。傳統(tǒng)方法根據(jù)圖像相鄰塊的紋理特性與時(shí)空域相關(guān)性跳過(guò)或終止當(dāng)前不必要的深度劃分,在最優(yōu)模式的選擇上主要也是利用此方法,從而減少了大量率失真代價(jià)的計(jì)算。
近年來(lái)隨著人工智能的興起,機(jī)器學(xué)習(xí)已成為一個(gè)熱點(diǎn),其廣泛應(yīng)用于人工智能、模式識(shí)別和信號(hào)處理。它能從復(fù)雜情況的大數(shù)據(jù)中學(xué)習(xí)[8],并給出最優(yōu)的解決方案。有了這些優(yōu)良的特性,國(guó)內(nèi)外從事視頻編碼的研究人員,將機(jī)器學(xué)習(xí)的理論和方法應(yīng)用到HEVC幀內(nèi)編碼的研究領(lǐng)域。用機(jī)器學(xué)習(xí)的方法替代復(fù)雜的率失真計(jì)算過(guò)程,從而起到保證視頻質(zhì)量的前提下,降低了編碼計(jì)算的復(fù)雜度,取得了一定的成果。
本文詳細(xì)敘述了常用的機(jī)器學(xué)習(xí)方法在HEVC幀內(nèi)CU快速劃分決策和快速預(yù)測(cè)模式?jīng)Q策兩方面的應(yīng)用。對(duì)各種方法取得編碼性能做了總結(jié)與比較,提出了機(jī)器學(xué)習(xí)方法在快速幀內(nèi)編碼應(yīng)用中面臨的一些問(wèn)題,為下一步研究提供參考性建議。
1 機(jī)器學(xué)習(xí)方法在HEVC幀內(nèi)CU快速劃分決策中的應(yīng)用
機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉融合的學(xué)科,其是人工智能的核心,主要使用歸納、綜合,而不是演繹。常見(jiàn)的機(jī)器學(xué)習(xí)算法有許多,根據(jù)算法的功能和形式的類(lèi)似性,把算法分類(lèi)為支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)算法、回歸算法、聚類(lèi)算法、樸素貝葉斯算法等。以上算法已廣泛應(yīng)用在HEVC幀內(nèi)預(yù)測(cè)快速算法的研究中。本節(jié)具體介紹了幾種常用的機(jī)器學(xué)習(xí)方法在CU快速劃分決策中的應(yīng)用。
1.1 CU快速劃分SVM算法
由Vapnik提出的支持向量機(jī)(Support Vector Machine,SVM)算法是一種解決模式識(shí)別的方法[9]。該算法將樣本點(diǎn)映射到一個(gè)高維特征空間中,通過(guò)最大化兩個(gè)類(lèi)之間的邊界來(lái)尋找最佳的分離超平面。將SVM用在幀內(nèi)編碼CU快速劃分決策中,主要舍去復(fù)雜的率失真計(jì)算,降低編碼的復(fù)雜度。
文獻(xiàn)[10]中首先分析了HEVC中CU深度決策過(guò)程,將CU深度決策過(guò)程建模為三級(jí)分層決策問(wèn)題;其次提出了一種改進(jìn)的CU深度決策結(jié)構(gòu),允許每個(gè)CU深度決策的性能在編碼復(fù)雜度和RD性能之間取得均衡;最后,針對(duì)最優(yōu)訓(xùn)練參數(shù)確定得到了復(fù)雜的RD復(fù)雜度模型。該算法比特率增加了1.98%,平均編碼時(shí)間減少了51.45%。
文獻(xiàn)[11]對(duì)CU多重紋理信息分析進(jìn)而對(duì)CU四叉樹(shù)劃分進(jìn)行了剪枝,從而縮小深度劃分的區(qū)間。第一步應(yīng)用自定義的圖像紋理提取方法提取出編碼單元多重紋理特征;第二步利用SVM訓(xùn)練提取的特征參數(shù)得到?jīng)Q策函數(shù),在訓(xùn)練過(guò)程對(duì)訓(xùn)練數(shù)集進(jìn)行標(biāo)記;第三步使用決策函數(shù)對(duì)測(cè)試集進(jìn)行預(yù)測(cè),根據(jù)決策函數(shù)跳過(guò)前面不必要的劃分和提前終止劃分。該算法比特率增加了0.84%,平均編碼時(shí)間減少43.23%。
文獻(xiàn)[12]應(yīng)用SVM將CU分區(qū)決策建模為一個(gè)二進(jìn)制分類(lèi)問(wèn)題。為了減少異常值的影響以及在發(fā)生錯(cuò)誤分類(lèi)時(shí)保持率失真(RD)性能,由于錯(cuò)誤分類(lèi)引起的RD損失將作為SVM訓(xùn)練中的權(quán)重引入。該算法在隨機(jī)訪問(wèn)模式(RA)下比特率增加了1.35%,平均編碼時(shí)間減少44.7%,低延時(shí)模式(LD)模式下比特率增加了1.66%,平均編碼時(shí)間減少了41.9%。
文獻(xiàn)[13]應(yīng)用SVM提取圖像有效特征后,SVM將每個(gè)CU分類(lèi)為均勻、復(fù)雜和不確定三類(lèi)。然后,均勻CU可以提前終止,復(fù)雜的CU可以跳過(guò),這大大降低了幀內(nèi)編碼的計(jì)算復(fù)雜度。該算法比特率增加了1.2%,平均編碼時(shí)間減少了53%。
文獻(xiàn)[14]通過(guò)使用拉普拉斯透明復(fù)合模型(LPTCM)從原始幀中提取二值化異常值系數(shù)(SBOC)向量的特征,然后發(fā)送到在線(xiàn)訓(xùn)練SVM。 將兩個(gè)SVM組合以預(yù)測(cè)CU分區(qū)決策,使得編碼過(guò)程可以顯著加快。在全幀內(nèi)模式(AI)下該算法比特率增加了0.78%,平均編碼時(shí)間減少了48%。
通過(guò)上述對(duì)不同文獻(xiàn)應(yīng)用SVM算法編碼性能的比較分析可以得到,文獻(xiàn)[14]利用SVM將提取的圖像特征直接分為三類(lèi),從而根據(jù)三類(lèi)不同圖像特征確定CU劃分情況。與其他技術(shù)比較,比特率增加最少,平均編碼時(shí)間減少符合預(yù)期。而文獻(xiàn)[10]平均編碼時(shí)間減少最多,但其比特率增加相應(yīng)最多。
1.2 CU快速劃分決策樹(shù)算法
決策樹(shù)算法廣泛應(yīng)用在CU快速分區(qū)決策中。決策樹(shù)算法與支持向量機(jī)和邏輯回歸算法類(lèi)似,都是經(jīng)典的分類(lèi)方法。前期對(duì)收集到的數(shù)據(jù)處理,利用歸納算法得到?jīng)Q策樹(shù),利用生成的決策樹(shù)對(duì)數(shù)據(jù)進(jìn)行分析。
文獻(xiàn)[15]使用低復(fù)雜度屬性(例如CU塊的均值和方差)實(shí)現(xiàn)決策樹(shù),提前終止CU劃分,避免對(duì)整個(gè)大小的RDO評(píng)估。該算法比特率增加少于0.6%,平均編碼時(shí)間減少了28%。
文獻(xiàn)[16]針對(duì)視頻紋理特征,選擇灰度差分統(tǒng)計(jì)(GDS)的熵和絕對(duì)轉(zhuǎn)換差值(SATD)的最小值作為兩個(gè)重要特征,可以在計(jì)算復(fù)雜度和分類(lèi)性能之間取得平衡。根據(jù)所選擇的特征,可以通過(guò)離線(xiàn)訓(xùn)練為不同大小的CU構(gòu)建自適應(yīng)決策樹(shù)。所提出的算法在編碼效率幾乎無(wú)損失的情況下,比特率增加忽略不計(jì),平均編碼時(shí)間減少了34%。
文獻(xiàn)[17]使用了一個(gè)加權(quán)和方法來(lái)進(jìn)行分區(qū)決策。利用鄰近的CU作為一個(gè)參考分區(qū),為當(dāng)前的CU設(shè)置尺寸大小范圍。然后,引入隨機(jī)森林來(lái)預(yù)測(cè)CU尺寸64×64或32×32。在編碼之前,在隨機(jī)森林方案中輸入圖像塊中的像素,并輸出決策過(guò)程是否停留在當(dāng)前深度,或者直接跳過(guò)當(dāng)前的CU大小,并開(kāi)始預(yù)測(cè)更高的深度。該算法比特率增加了0.80%,平均編碼時(shí)間減少了48.31%。
通過(guò)對(duì)不同文獻(xiàn)應(yīng)用SVM算法編碼性能的比較分析可以得到,文獻(xiàn)[17]通過(guò)相鄰CU作為參考與隨機(jī)森林預(yù)測(cè)相結(jié)合。與其他技術(shù)比較,比特率增加與平均編碼時(shí)間減少均達(dá)到最優(yōu)。文獻(xiàn)[16]雖然編碼比特率增加小于0.6%,但平均編碼時(shí)間減少最少。
1.3 CU快速劃分神經(jīng)網(wǎng)絡(luò)算法
神經(jīng)網(wǎng)絡(luò) (Neural Networks) 是一種非參量化的分析技術(shù),使用自適應(yīng)學(xué)習(xí)技術(shù)來(lái)提取異常行為的特征,通過(guò)對(duì)廣泛數(shù)據(jù)集的訓(xùn)練與測(cè)試得出計(jì)算機(jī)能識(shí)別的正常行為。神經(jīng)網(wǎng)絡(luò)由大量的處理單元組成,單元間通過(guò)帶有權(quán)值的連接來(lái)進(jìn)行交互。目前,神經(jīng)網(wǎng)絡(luò)已有多種模型在HEVC幀內(nèi)預(yù)測(cè)中應(yīng)用。
文獻(xiàn)[18]為了預(yù)測(cè)最佳的編碼樹(shù)單元(CTU)分區(qū),采用3個(gè)小神經(jīng)網(wǎng)絡(luò)分別應(yīng)用在各個(gè)分區(qū)層級(jí)上,由各自的有限狀態(tài)機(jī)控制。神經(jīng)網(wǎng)絡(luò)從編碼線(xiàn)程中經(jīng)過(guò)不斷的訓(xùn)練,并在訓(xùn)練完成后立即應(yīng)用。由于計(jì)算復(fù)雜度的降低,采用準(zhǔn)牛頓訓(xùn)練法[19],為了減少訓(xùn)練時(shí)間,采樣采用非零CU深度層次。該算法比特率增加可以忽略不計(jì),編碼時(shí)間最大可減少65%。
文獻(xiàn)[20]利用當(dāng)前塊豐富的圖像紋理,因此能夠提高預(yù)測(cè)當(dāng)前塊的準(zhǔn)確性。與此同時(shí),對(duì)最近三個(gè)塊的重建也可以加以改進(jìn)。該算法比特率增加0.70%。
2 機(jī)器學(xué)習(xí)方法在HEVC快速幀內(nèi)預(yù)測(cè)模式?jīng)Q策中的應(yīng)用
2.1 幀內(nèi)快速預(yù)測(cè)模式?jīng)Q策樹(shù)算法
決策樹(shù)算法已經(jīng)在幀內(nèi)CU劃分中廣泛應(yīng)用,同樣的在幀內(nèi)編碼快速模式選擇上也取得了一定研究進(jìn)展。
文獻(xiàn)[21]利用參考像素的方差表示平滑程度,并根據(jù)PU參考像素值的平滑程度,自定義三種不同的情況,并根據(jù)不同的情況規(guī)定其對(duì)應(yīng)的預(yù)測(cè)模式數(shù)量,然后使用機(jī)器學(xué)習(xí)軟件平臺(tái)Weka運(yùn)行出模式選擇的決策樹(shù)。在訓(xùn)練過(guò)程中將PU塊作為輸入信息,利用所生成的分類(lèi)決策樹(shù)預(yù)測(cè)出各個(gè)PU塊需要遍歷的預(yù)測(cè)模式,從而不必要每一個(gè)PU都遍歷35種預(yù)測(cè)模式,降低了幀內(nèi)編碼的計(jì)算復(fù)雜度。該算法在高碼率情況下,比特率增加了0.25%,平均編碼時(shí)間減少了大約16.18%,相當(dāng)于BD?PSNR平均降低大約0.02 dB;在低碼率情況下,比特率增加了0.04%,平均編碼時(shí)間減少了大約20.75%,相當(dāng)于BD?PSNR平均降低大約0 dB。
2.2 幀內(nèi)快速預(yù)測(cè)模式邏輯回歸算法
回歸算法是采用對(duì)誤差的衡量來(lái)探索變量之間的關(guān)系的一類(lèi)算法。應(yīng)用邏輯回歸算法將幀內(nèi)編碼復(fù)雜的幀內(nèi)運(yùn)算過(guò)程化為分類(lèi)問(wèn)題區(qū)解決,從而減少了計(jì)算量。
文獻(xiàn)[22]將CU劃分建模為二進(jìn)制分類(lèi)問(wèn)題。邏輯回歸方法為劃分和不劃分提供合適的分類(lèi),邏輯回歸分類(lèi)器是通過(guò)離線(xiàn)學(xué)習(xí)預(yù)先構(gòu)建的。此外,考慮了不同的特征,應(yīng)用基于F?分?jǐn)?shù)的特征選擇方法來(lái)選擇最佳特征。該算法比特率增加了1.29%,平均編碼計(jì)算復(fù)雜度降低了55.5%。
2.3 幀內(nèi)快速預(yù)測(cè)模式神經(jīng)網(wǎng)絡(luò)算法
卷積神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中一種高效的識(shí)別方法。卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一。由于該網(wǎng)絡(luò)避免了對(duì)圖像的復(fù)雜前期預(yù)處理,可以直接輸入原始圖像內(nèi)容,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行特征提取,以達(dá)到更高的神經(jīng)網(wǎng)絡(luò)識(shí)別準(zhǔn)確率,因而得到更為廣泛的應(yīng)用。近年來(lái)學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)這一特征與幀內(nèi)編碼結(jié)合,取得了一定成果。
文獻(xiàn)[23]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)分析源圖像塊的紋理結(jié)構(gòu),然后減少CU模式的最大數(shù)量。在CNN的結(jié)構(gòu)設(shè)計(jì)中,通過(guò)考慮量化對(duì)編碼成本的影響,引入了量化參數(shù)。進(jìn)一步優(yōu)化了CNN訓(xùn)練策略,提高了預(yù)測(cè)精度。該算法比特率增長(zhǎng)了2.66%,節(jié)省了63%的編碼時(shí)間。
文獻(xiàn)[24]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)對(duì)一個(gè)CU的紋理進(jìn)行了分析,經(jīng)過(guò)兩個(gè)卷積層特征提取之后,提高了分類(lèi)的準(zhǔn)確率。最后確定了最優(yōu)的CU/PU模式的候選模式,以進(jìn)行詳盡的率失真優(yōu)化處理。該算法比特率增加3.39%,平均節(jié)省了61.1%的編碼時(shí)間。
文獻(xiàn)[25]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)對(duì)源視頻序列像素內(nèi)容的訓(xùn)練得出對(duì)應(yīng)的35種預(yù)測(cè)模式。因此,在沒(méi)有對(duì)所有可用模式進(jìn)行優(yōu)化的情況下,將選定的內(nèi)部預(yù)測(cè)模式作為一種分類(lèi)的問(wèn)題。該算法編碼效率的損失可以忽略不計(jì)。
文獻(xiàn)[26]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)分析了一個(gè)CU的紋理特征,然后在32×32/16×16和8×8/4×4 CU/PU模式對(duì)中決定出最可能的候選模式,從而代替了復(fù)雜的率失真代價(jià)計(jì)算過(guò)程。該算法比特率增加了2.67%,平均編碼時(shí)間減少61.1%。通過(guò)上述對(duì)不同文獻(xiàn)應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的方法可以得知,與其他方法相比,此方法取得平均編碼時(shí)間減少最多。文獻(xiàn)[26]通過(guò)直接訓(xùn)練原始圖像得出預(yù)測(cè)模式的結(jié)果比特率增加最少,平均編碼時(shí)間減少最多,是最優(yōu)方法。
3 結(jié) 論
本文詳細(xì)論述了各種典型機(jī)器學(xué)習(xí)方法在幀內(nèi)編碼快速深度決策與模式選擇兩方面的應(yīng)用。通過(guò)對(duì)各種應(yīng)用方法的歸納和比較,總結(jié)得出,機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法在HEVC幀內(nèi)編碼應(yīng)用中平均編碼時(shí)間減少最多,省去了前期對(duì)源圖像復(fù)雜特征的分類(lèi),直接對(duì)源圖像進(jìn)行分析。同時(shí)目前方法的應(yīng)用也面臨一些問(wèn)題,如前期對(duì)圖像紋理進(jìn)行分類(lèi)方法仍存在通用性和閾值選擇方面的問(wèn)題;用機(jī)器學(xué)習(xí)方法在訓(xùn)練過(guò)程中存在參數(shù)選擇和個(gè)數(shù)問(wèn)題。為此,在下一步研究提出以下參考性建議:
1) 神經(jīng)網(wǎng)絡(luò)算法的應(yīng)用關(guān)鍵是提高預(yù)測(cè)準(zhǔn)確率,對(duì)前期輸入網(wǎng)絡(luò)圖像特征要求很高,利用圖像處理方法對(duì)輸入圖像做一些基本處理,有利于提高預(yù)測(cè)的準(zhǔn)確率。
2) 應(yīng)用深層次的卷積網(wǎng)絡(luò)對(duì)輸入圖像做特征提取也能在一定程度上提高分類(lèi)的準(zhǔn)確性,從而在減少編碼時(shí)間的同時(shí),降低比特率的開(kāi)銷(xiāo)。
機(jī)器學(xué)習(xí)作為科學(xué)研究的熱門(mén)領(lǐng)域,在眾多研究人員不懈的努力下,更多符合人工智能的快速幀內(nèi)編碼算法會(huì)不斷涌現(xiàn),從而推動(dòng)視頻編碼技術(shù)快速發(fā)展。
參考文獻(xiàn)
[1] SULLIVAN G J, OHM J R, HAN W J, et al. Overview of the high efficiency video coding (HEVC) standard [J]. IEEE transactions on circuits and systems for video technology, 2013, 22(12): 1649?1668.
[2] KIM I K, MIN J, LEE T, et al. Block partitioning structure in the HEVC standard [J]. IEEE transactions on circuits and systems for video technology, 2012, 22(12): 1697?1706.
[3] LAINEMA J, BOSSEN F, HAN W J, et al. Intra coding of the HEVC standard [J]. IEEE transactions on circuits and systems for video technology, 2012, 22(12): 1792?1801.
[4] OHM J, SULLIVAN G J, SCHWARZ H, et al. Comparison of the coding efficiency of video coding standards: including high efficiency video coding (HEVC) [J]. IEEE transactions on circuits and systems for video technology, 2013, 22(12): 1669?1684.
[5] BOSSEN F, BROSS B, SUHRING K, et al. HEVC complexity and implementation analysis [J]. IEEE transactions on circuits and systems for video technology, 2013, 22(12): 1685?1696.
[6] CORREA G, ASSUNCAO P, AGOSTINI L, et al. Complexity control of HEVC through quadtree depth estimation [C]// Proceedings of EUROCON. Zagreb: IEEE, 2013: 81?86.
[7] MERCAT A, ARRESTIER F, HAMIDOUCHE W, et al. Constrain the docile CTUs: an in?frame complexity allocator for HEVC intra encoders [C]// Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. New Orleans: IEEE, 2017: 1163?1167.
[8] 顏松遠(yuǎn).機(jī)器學(xué)習(xí)理論及應(yīng)用[J].計(jì)算機(jī)工程與科學(xué),2012,34(9):201.
YAN Songyuan. Theory and application of machine learning [J]. Computer engineering and science, 2012, 34(9): 201.
[9] CHERKASSKY V. The nature of statistical learning theory [J]. IEEE transactions on neural networks, 1997, 8(6): 1564.
[10] ZHANG Y, KWONG S, WANG X, et al. Machine learning?based coding unit depth decisions for flexible complexity allocation in high efficiency video coding [J]. IEEE transactions on image processing, 2015, 24(7): 2225?2238.
[11] 張峻,董蘭芳,余家奎.高效率視頻編碼快速幀內(nèi)預(yù)測(cè)算法[J].計(jì)算機(jī)應(yīng)用,2015,35(8):2327?2331.
ZHANG Jun, DONG Lanfang, YU Jiakui. Fast intra prediction algorithm for high efficiency video coding [J]. Journal of computer applications, 2015, 35(8): 2327?2331.
[12] SHEN X, YU L. CU splitting early termination based on weighted SVM [J]. EURASIP journal on image & video processing, 2013(1): 1?11.
[13] LIU D, LIU X, LI Y. Fast CU size decisions for HEVC intra frame coding based on support vector machines [C]// Proceedings of International Conference on Dependable, Autonomic and Secure Computing. Auckland: IEEE, 2016: 594?597.
[14] SHAN Y, YANG E H. Fast HEVC intra coding algorithm based on machine learning and Laplacian transparent composite model [C]// Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. New Orleans: IEEE, 2017: 2642?2646.
[15] RUIZ?COLL D, ADZIC V, FERN?NDEZ?ESCRIBANO G, et al. Fast partitioning algorithm for HEVC intra frame coding using machine learning [C]// Proceedings of IEEE International Conference on Image Processing. Paris: IEEE, 2015: 4112?4116.
[16] ZHENG X, ZHAO Y, BAI H, et al. Fast algorithm for intra prediction of HEVC using adaptive decision trees [J]. KSII transactions on internet and information systems, 2016, 10(7): 3286?3300.
[17] DU B, SIU W C, YANG X. Fast CU partition strategy for HEVC intra?frame coding using learning approach via random forests [C]// Proceedings of Asia?Pacific Signal and Information Processing Association Annual Summit and Conference. Hong Kong: IEEE, 2016: 1085?1090.
[18] MOMCILOVIC S, ROMA N, SOUSA L, et al. Run?time machine learning for HEVC/H.265 fast partitioning decision [C]// Proceedings of IEEE International Symposium on Multimedia. Miami: IEEE, 2016: 347?350.
[19] SETIONO R, HUI L C K. Use of a quasi?Newton method in a feedforward neural network construction algorithm [J]. IEEE transactions on neural networks, 1995, 6(1): 273?277.
[20] CUI W, ZHANG T, ZHANG S, et al. Convolutional neural networks based intra prediction for HEVC [C]// Proceedings of Data Compression Conference. Snowbird: IEEE, 2017: 436.
[21] 祝世平,張春燕.基于機(jī)器學(xué)習(xí)的HEVC幀內(nèi)模式快速?zèng)Q策算法[J].光電子·激光,2016,27(11):1199?1207.
ZHU Shiping, ZHANG Chunyan. A fast HEVC intra mode decision algorithm based on machine learning [J]. Journal of optoelectronics·laser, 2016, 27(11): 1199?1207.
[22] HU Q, SHI Z, ZHANG X, et al. Fast HEVC intra mode decision based on logistic regression classification [C]// Proceedings of IEEE International Symposium on Broadband Multimedia Systems and Broadcasting. Nara: IEEE, 2016: 1?4.
[23] LIU Z, YU X, CHEN S, et al. CNN oriented fast HEVC intra CU mode decision [C]// Proceedings of IEEE International Symposium on Circuits and Systems. Montreal: IEEE, 2016: 2270?2273.
[24] YU X, LIU Z, LIU J, et al. VLSI friendly fast CU/PU mode decision for HEVC intra encoding: leveraging convolution neural network [C]// Proceedings of IEEE International Conference on Image Processing. Quebec: IEEE, 2015: 1285?1289.
[25] LAUDE T, OSTERMANN J. Deep learning?based intra prediction mode decision for HEVC [C]// Proceedings of Picture Coding Symposium. Nuremberg: IEEE, 2017: 1?5.
[26] LIU Z, YU X, GAO Y, et al. CU partition mode decision for HEVC hardwired intra encoder using convolution neural network [J]. IEEE transactions on image processing, 2016, 25(11): 5088?5103.