陳靈生
浙江廣電集團(tuán),浙江杭州 310005
由于視頻信號(hào)數(shù)據(jù)量巨大,必須經(jīng)過壓縮才有可能在有線電視網(wǎng)或互聯(lián)網(wǎng)等網(wǎng)絡(luò)中傳輸,因此視頻壓縮編碼是實(shí)現(xiàn)視頻信號(hào)數(shù)字化傳輸?shù)那疤?。提起視頻壓縮編碼,人們首先想到的是MPEG-2、H.264等視頻壓縮編碼標(biāo)準(zhǔn)。但這些標(biāo)準(zhǔn)毫無例外都是國外的標(biāo)準(zhǔn)化組織提出的,知識(shí)產(chǎn)權(quán)也屬于國外的研究機(jī)構(gòu)。國內(nèi)的企業(yè)和用戶要使用這些專利技術(shù)需要支付高昂的專利費(fèi)用。
但是從2006年3月份起,我國也有了自己的視頻壓縮編碼標(biāo)準(zhǔn),這就是AVS標(biāo)準(zhǔn)。它的正式名稱為《信息技術(shù)先進(jìn)音視頻編碼》,它是國內(nèi)第一個(gè)具有自主知識(shí)產(chǎn)權(quán)、并且達(dá)到國際先進(jìn)水平的數(shù)字視頻壓縮編碼標(biāo)準(zhǔn),適用于地面數(shù)字電視廣播、有線數(shù)字電視、交互存儲(chǔ)媒體以及直播衛(wèi)星視頻等多個(gè)業(yè)務(wù)領(lǐng)域[1]。
AVS包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)管理等9個(gè)部分,其中關(guān)于視頻壓縮編碼的有兩個(gè)獨(dú)立的部分AVS-P2和AVS-P7。AVS-P2主要針對(duì)數(shù)字視頻的高端應(yīng)用,比如高、標(biāo)清數(shù)字電視廣播以及高密度激光數(shù)字存儲(chǔ)媒體應(yīng)用;AVS-P7主要針對(duì)低碼率、低圖像分辨率的低端數(shù)字視頻應(yīng)用[2]。
AVS視頻標(biāo)準(zhǔn)采用了與H.264類似的混合編碼的技術(shù)框架,包括變換、量化、熵編碼、幀內(nèi)預(yù)測、幀間預(yù)測、環(huán)路濾波等模塊。它的核心技術(shù)的主要包括以下幾點(diǎn):8×8整數(shù)變換、量化、幀內(nèi)預(yù)測、去塊效應(yīng)環(huán)內(nèi)濾波等、變塊大小運(yùn)動(dòng)補(bǔ)償、多參考幀預(yù)測、二維熵編碼、1/4精度像素插值等。
AVS標(biāo)準(zhǔn)具有與H.264標(biāo)準(zhǔn)相同的編碼框架,如圖1所示,其視頻編碼器框圖如圖2所示[3]。
圖1 AVS視頻編碼框架
圖2 AVS視頻編碼器框圖
下面對(duì)AVS標(biāo)準(zhǔn)視頻編碼中的核心技術(shù)作簡要的介紹。
AVS-P2視頻標(biāo)準(zhǔn)采用8×8整數(shù)余弦變換(ICT),而沒有采用傳統(tǒng)的離散余弦變換(DCT)。這樣就避免了復(fù)雜的浮點(diǎn)運(yùn)算,可以用加法和移位簡單地實(shí)現(xiàn)。與DCT相比,ICT的計(jì)算復(fù)雜度降低了,然而它的性能與DCT相比卻非常接近。同時(shí),由于ICT是整數(shù)運(yùn)算,每個(gè)系數(shù)可以精確地定義到二進(jìn)制的每一位,因此它的正變換和反變換之間完全沒有失配,這也是它的一大優(yōu)點(diǎn)。
采用ICT時(shí),8×8變換矩陣中各個(gè)基矢量的模大小不統(tǒng)一,因此有必要對(duì)這些系數(shù)進(jìn)行歸一化處理。在這一處理環(huán)節(jié),H.264采用了編、解碼端平衡的處理方式,即在編碼端將正向縮放和量化結(jié)合在一起,在解碼端將反向縮放和反量化結(jié)合在一起。在AVS標(biāo)準(zhǔn)則采用編、解碼端不平衡的處理方式,即在編碼端把正向縮放、量化和反向縮放結(jié)合在一起,而在解碼端只需進(jìn)行反量化的處理。這樣做的理由是,在實(shí)際的應(yīng)用中解碼端設(shè)備的數(shù)量往往要遠(yuǎn)遠(yuǎn)大于編碼端設(shè)備的數(shù)量,減少解碼端的技術(shù)復(fù)雜度從經(jīng)濟(jì)方面考量是非常合算的。
與H.264類似,AVS-P2也采用了幀內(nèi)預(yù)測技術(shù)。與H.264不同的是,AVS-P2采用8×8的像素塊,而不是4×4的像素塊。雖然像素塊的大小增加后,會(huì)降低預(yù)測精度,進(jìn)而影響壓縮率,不過在高分辨率的條件下這一點(diǎn)并不明顯。但是它的好處是降低了一幀圖像內(nèi)像素塊的數(shù)目,因而降低了運(yùn)動(dòng)估計(jì)、補(bǔ)償?shù)瓤傮w的技術(shù)復(fù)雜度。同時(shí)AVS-P2的亮度預(yù)測模式從H.264的9種降到只有5種,色度預(yù)測模式則和H.264一樣為4種。由于預(yù)測模式的減少,模式選擇的復(fù)雜度也就相應(yīng)地降低。但實(shí)驗(yàn)表明,這種因預(yù)測模式減少而引起的性能損失十分有限。
由于活動(dòng)圖像的前后幀之間存在著很大的相關(guān)性和冗余度,通過幀間預(yù)測去除這種相關(guān)性和冗余度可以極大提高信源的壓縮比。與H.264的多參考幀不同,AVS-P2只支持P幀(前向預(yù)測幀)和B幀(雙向預(yù)測幀)這兩種幀間預(yù)測方案。P幀至多采用2個(gè)前向參考幀,B幀采用前、后各一個(gè)參考幀。AVS-P2之所以限定最多采用兩個(gè)參考幀,其目的在于簡化參考幀緩沖區(qū)管理機(jī)制(H.264的參考幀緩沖區(qū)管理機(jī)制非常繁瑣),在不增加存儲(chǔ)、數(shù)據(jù)帶寬等條件下提高編碼效率。
AVS-P2和H.264一樣,運(yùn)動(dòng)補(bǔ)償?shù)木榷歼_(dá)到了1/4像素精度,但兩者的實(shí)現(xiàn)方式則有不同。H.264采用6個(gè)抽頭的濾波器進(jìn)行1/2像素插值,在AVS-P2中則把抽頭數(shù)目降為4個(gè)。H.264采用雙線性濾波器進(jìn)行1/4像素插值,而AVS-P2則分為兩種情況:4個(gè)二維1/4像素插值也用雙線性濾波器,但是另外8個(gè)一維1/4像素插值用4抽頭濾波器(濾波系數(shù)和1/2像素插值不同)。
基于像素塊分塊壓縮的視頻編碼有一個(gè)共同的缺點(diǎn),就是重建后的圖像存在方塊效應(yīng),必須用環(huán)路濾波去除這種方塊效應(yīng)。在AVS-P2中,由于像素塊的大小事8×8的,環(huán)路濾波也只在8×8塊邊緣進(jìn)行。與H.264大小為4×4的像素塊相比,AVS-P2的像素塊數(shù)量和像素塊邊界數(shù)量要少得多。同時(shí)由于AVS-P2環(huán)路濾波器的濾波點(diǎn)數(shù)(左右各3個(gè)像素)比H.264(左右各4個(gè)像素)中的少,因此降低了環(huán)路濾波的計(jì)算復(fù)雜度。
熵編碼是壓縮編碼的重要組成部分。AVS-P2中的熵編碼吸收了H.264中利用上下文信息進(jìn)行自適應(yīng)編碼的策略,對(duì)不同類型的變換塊用不同的可變長度碼(VLC)碼表編碼。同時(shí)又采用了MPEG-2中的二維編碼機(jī)制,即采用上下文自適應(yīng)的2D-VLC。這樣AVS-P2綜合了H.264和MPEG-2的優(yōu)點(diǎn),編碼效率與H.264的CAVLC大致相當(dāng),但計(jì)算復(fù)雜度卻大大降低。
AVS標(biāo)準(zhǔn)和H.264都采用了類似的混合編碼框架。H.264標(biāo)準(zhǔn)中運(yùn)動(dòng)補(bǔ)償預(yù)測和變換的最小單元是4×4像素塊,而AVS標(biāo)準(zhǔn)中則為8×8像素塊;AVS標(biāo)準(zhǔn)的幀內(nèi)預(yù)測模式和幀間預(yù)測模式都比H.264標(biāo)準(zhǔn)要少;AVS-P2的熵編碼和環(huán)路濾波的計(jì)算復(fù)雜度比H.264的要低??偟膩碚f,AVS-P2的主要優(yōu)點(diǎn)在于在較低的復(fù)雜度下,實(shí)現(xiàn)了與H.264基本相當(dāng)?shù)募夹g(shù)性能指標(biāo)。大致估算,AVS的編碼復(fù)雜度相當(dāng)于H.264的70%,而AVS的解碼復(fù)雜度僅僅相當(dāng)于H.264的30%。解碼復(fù)雜度大大降低,這一點(diǎn)是非常有意義的,因?yàn)榻獯a端對(duì)應(yīng)的是數(shù)量廣大的終端用戶。
一個(gè)標(biāo)準(zhǔn)要取得成功,技術(shù)上的先進(jìn)只是必要的基礎(chǔ),更重要的是要在激烈的競爭中得到市場的認(rèn)可。而要得到市場的認(rèn)可,相關(guān)因素就非常多了,其中經(jīng)濟(jì)因素是非常重要的一個(gè)因素,如果一個(gè)標(biāo)準(zhǔn)的專利費(fèi)用過高,則會(huì)明顯阻礙該標(biāo)準(zhǔn)在市場中的推廣。AVS標(biāo)準(zhǔn)在制定之初就對(duì)這一問題有充分地考慮,通過分析國內(nèi)外標(biāo)準(zhǔn)制定和知識(shí)產(chǎn)權(quán)領(lǐng)域的經(jīng)驗(yàn)教訓(xùn),走出一條有自己特色的技術(shù)、標(biāo)準(zhǔn)、知識(shí)產(chǎn)權(quán)相互協(xié)調(diào)發(fā)展的道路。為了防止標(biāo)準(zhǔn)制訂和專利授權(quán)割裂的弊端,AVS標(biāo)準(zhǔn)采用了以下兩個(gè)基本原則:一方面,為保證標(biāo)準(zhǔn)的先進(jìn)性,AVS標(biāo)準(zhǔn)采用專利技術(shù);但另一方面,又對(duì)進(jìn)入AVS標(biāo)準(zhǔn)制定了一定的限制條件,即把專利擁有方的利益限制在一個(gè)比較合理的水平以內(nèi)。這一帶有公益性色彩的標(biāo)準(zhǔn)原則是AVS的一大特色,對(duì)于市場接受這一編碼領(lǐng)域的后起之秀是有力的推動(dòng)。相比于國外H.264以及MPEG-2等標(biāo)準(zhǔn)高額的專利費(fèi), AVS標(biāo)準(zhǔn)的專利費(fèi)用要低得多。
如果AVS標(biāo)準(zhǔn)取得市場認(rèn)可,無疑會(huì)巨大推動(dòng)我國數(shù)字音視頻產(chǎn)業(yè)在國際上的核心競爭力。但是我們必須看到,畢竟AVS標(biāo)準(zhǔn)只是后起之秀,目前的數(shù)字電視制播和傳輸領(lǐng)域還是MPEG-2占主導(dǎo)地位。要想在短時(shí)間內(nèi)一步登天是不現(xiàn)實(shí)的,AVS的推廣策略可以從外圍開始,即從傳輸環(huán)節(jié)和客戶端入手。對(duì)于目前國內(nèi)的數(shù)字電視傳輸系統(tǒng),只需要在節(jié)目傳輸端,用AVS編碼器替換MPEG-2編碼器,在客戶接收端,機(jī)頂盒的整體設(shè)計(jì)不需改變,只需把解碼芯片替換層支持AVS標(biāo)準(zhǔn)的。這樣雖然付出了一定的代價(jià),但是由于AVS優(yōu)于MPEG-2的壓縮編碼效率,卻可以節(jié)省一半的傳輸帶寬。這意味著可以增加一倍的節(jié)目容量,從長遠(yuǎn)來看是非常合算的。
目前,三網(wǎng)融合入試點(diǎn)階段,IPTV的市場競爭非常激烈,而作為IPTV的關(guān)鍵技術(shù)之一,視頻源的編解碼技術(shù)也必面臨激烈的競爭。當(dāng)前IPTV編解碼技術(shù)主要包括MPEG2、MPEG4、H.264、AVS等。為應(yīng)對(duì)競爭和挑戰(zhàn),贏得更多企業(yè)和客戶的支持,AVS開源社區(qū)已正式對(duì)外開放,為企業(yè)和用戶提供AVS編碼、轉(zhuǎn)碼、解碼軟件源代碼等服務(wù)。 AVS開源社區(qū)首期對(duì)外開放的主要是實(shí)時(shí)AVS編碼、實(shí)時(shí)AVS轉(zhuǎn)碼和實(shí)時(shí)AVS解碼三個(gè)項(xiàng)目,它們都可在常規(guī)計(jì)算平臺(tái)上實(shí)現(xiàn)實(shí)時(shí)編解碼,企業(yè)和用戶可以直接拿來使用,用于開發(fā)AVS視聽產(chǎn)品以及提供AVS視聽服務(wù)。
總之,AVS標(biāo)準(zhǔn)的技術(shù)性能已經(jīng)處于國際先進(jìn)水平,但要想占領(lǐng)市場,還需要付出很大的努力。對(duì)AVS標(biāo)準(zhǔn)來說,好消息是2011年11月1日起實(shí)施的《地面數(shù)字電視接收機(jī)通用規(guī)范》國家標(biāo)準(zhǔn)正式確認(rèn),到2012年11月1日,在我國銷售的所有數(shù)字電視機(jī)都將內(nèi)置AVS功能。但是在市場經(jīng)濟(jì)條件下,政府的推動(dòng)不能取代市場的競爭,AVS標(biāo)準(zhǔn)依舊任重而道遠(yuǎn)。
[1]GB/T 20090.2-2006 信息技術(shù)先進(jìn)音視頻編碼 第2部分:視頻.
[2]盧官明,宗昉.數(shù)字電視原理[M].機(jī)械工業(yè)出版社,2008.
[3]王鐵軍.我視頻編碼國家標(biāo)準(zhǔn)AVS與國際標(biāo)準(zhǔn)MPEG的比較.