徐琨然 王 娟 聶 鵬
近年來,數(shù)字電視中AVS+、H.265編碼技術(shù)的高速發(fā)展,極大提升了視頻質(zhì)量,同時降低了運(yùn)營帶寬?,F(xiàn)在隨著科技的發(fā)展,媒體已經(jīng)進(jìn)入飛速變革和發(fā)展階段,信息傳播正從圖文向視頻過渡,呈現(xiàn)出大量的視頻網(wǎng)站,我們已進(jìn)入大視頻時代。
視頻是媒體的核心,視頻信息相對于其他信息來說,有著直觀、確定、高效等獨(dú)一無二的優(yōu)點(diǎn)。因此對視頻質(zhì)量的評價估量就成為了一個關(guān)鍵。在視頻采集、視頻編碼、視頻壓縮、視頻的傳輸和記錄過程中,由于采集系統(tǒng)、編碼方法、壓縮損失、傳輸介質(zhì)和記錄設(shè)備不完備的情況,再加上各種噪聲污染,不可避免地帶來不定的視頻的失真和質(zhì)量下降,這給大家的視頻體驗帶來嚴(yán)重的障礙。
當(dāng)下視頻質(zhì)量評價有主觀和客觀兩種。主觀評價力圖追求真實的人眼視覺感知,以個人角度對視頻進(jìn)行評價,其中又分為絕對主觀評價方法和相對主觀評價方法兩類。客觀評價是靠測試系統(tǒng)依據(jù)特定算法,對源視頻和測量視頻相比,給出基于數(shù)字計算的結(jié)果,最后評定視頻品質(zhì)的方法,根本目的是儀器代替人眼去觀看和評價視頻。
主觀評價是以人作為觀察者,對視頻的優(yōu)劣得出定性評價,為保證視頻主觀評價在統(tǒng)計上有意義,參加評價的觀察者應(yīng)該足夠多。一般來說,主觀評價的觀察者要么都會挑選訓(xùn)練有素的“內(nèi)行”,要么就挑選未受過培訓(xùn)的“外行”。但是測試視頻的質(zhì)量、觀看距離、觀看亮度、觀看位置、顯示尺寸、對比度以及測試人員的經(jīng)驗都決定了主觀評價的結(jié)果,因此評價結(jié)果差異大、重復(fù)性差、還存在一定的隨機(jī)性。
客觀評價中,系統(tǒng)廣泛用1個用于參考的源視頻,和1個經(jīng)過設(shè)備或系統(tǒng)的測量視頻,用于對比評價。它考慮到了人眼的視覺特性是一個受神經(jīng)系統(tǒng)調(diào)節(jié)的模型,建立了特殊的算法策略,把源視頻和測量視頻中人眼敏感的特性提取出來經(jīng)過上述算法,在時間域以及空間域中對這兩種不同的視頻序列進(jìn)行校準(zhǔn),展開視頻質(zhì)量分析,一般情況下,質(zhì)量測試的結(jié)果會正比于主觀評測。
對于數(shù)字電視信號的特點(diǎn),TR 101 290標(biāo)準(zhǔn)中將錯誤分為3種級別錯誤。前兩級會出現(xiàn)黑屏和馬賽克等現(xiàn)象,人眼很容易發(fā)現(xiàn),但第三級錯誤難以用人眼識別,且在數(shù)字電視系統(tǒng)中,視頻采集、視頻編碼、視頻壓縮等設(shè)備都是專業(yè)級別的,靠人眼對視頻品質(zhì)很難作出細(xì)致準(zhǔn)確的評價。由于隨機(jī)性大這個客觀原因?qū)χ饔^評價的影響,所以當(dāng)前評價數(shù)字電視視頻質(zhì)量基本是采用客觀評價,這樣不止消除了個人差異和其余條件對主觀評價的影響,還可以極大減少時間和費(fèi)用的浪費(fèi)。目前的儀器系統(tǒng)基本上可以客觀評測視頻的整體質(zhì)量。這種視頻質(zhì)量測分析系統(tǒng)提供的客觀視頻質(zhì)量測服務(wù)不僅可以重復(fù),更可以做到與人眼主觀視覺評估非常的相近。類似系統(tǒng)不僅可以在高清下變換的質(zhì)量評估中應(yīng)用,還能夠應(yīng)用在不同分辨率視頻的質(zhì)量測量中進(jìn)行。
一般數(shù)字電視視頻質(zhì)量客觀測試有以下三個常用的算法指標(biāo)。
PQR(視頻質(zhì)量測計分),基于視覺差模型研發(fā),測量校準(zhǔn)數(shù)據(jù)是從和視覺敏感性試驗匹配的主觀評價中收集而來的,保證測量結(jié)果1 PQR=1 JND。(JND,是最小可覺差。)
參考分值:計分值從0至無窮大*。
0=理想質(zhì)量(不能察覺與源間的差異)
1=幾乎不能察覺損傷
3-4=可以看出損傷,但不明顯(類似于復(fù)合視頻)
5=類似于10 Mb/s SD MPEG-2
7-8=類似于4 Mb/s SD MPEG-2
10=可明顯觀察到的損傷(類似于2 Mb/s SD MPEG-2)
>10=與人眼測試的相關(guān)性很弱
DMOS(差異平均主觀評分)是在ITU-R BT.500 條件下,參考人眼視覺特性顯示源視頻和測量視頻之間的差異。此算法模擬了人眼發(fā)現(xiàn)的源視頻和測量視頻之間差異。
參考分值:評分在0–100間(相對于質(zhì)量最差的視頻片斷)。
0=理想質(zhì)量(與源幾乎無差異)
0-20=好
20-40=中間值
40-100=差
100+ =非常差(如同質(zhì)量最差的參考視頻片斷一樣甚至更差)
PSNR即峰值信噪比,PSNR 表示信號幅度峰值與信號中雜波之間的RMS比值,它是源和測量序列之間的均方誤差相對于(2^n-1)^2的對數(shù)值,是一種客觀標(biāo)準(zhǔn)。PSNR僅為最大值信號和背景噪音之間的對比,局限性較大,但是又是最廣泛使用的客觀量測法。PSNR值無法正比于人眼視覺系統(tǒng)的主觀評價已經(jīng)得到了大量的實驗證明,因為人眼的視覺特性是一個多信道模型,人眼的其感知結(jié)果會受到許多因素的影響而產(chǎn)生變化(例如:給一個較長時間的光刺激后,人眼對同樣的刺激就降低,但對其它不同頻率段的刺激靈敏變卻不受影響,頻率越低,人眼的分辨能力就越高,人眼對于高亮度的區(qū)域所附加的噪聲其敏感性較小,人類視覺系統(tǒng)對于平滑區(qū)域的敏感性要遠(yuǎn)高于紋理密集區(qū)域)。
參考分值:PSNR值一般在30~40 dB,視頻峰值信噪比越高,PSNR值越高。如果源視頻和測試視頻是相同的,PSNR測量結(jié)果等于80分貝。
通過視頻質(zhì)量評價,能對視頻設(shè)備、系統(tǒng)的研發(fā)提供方向;通過科學(xué)合理的測試,能反饋最高效精準(zhǔn)的參考;視頻質(zhì)量評價盡可能驗證在不同觀看距離、不同觀看亮度、不同觀看位置、不同顯示尺寸、不同對比度下的表現(xiàn),力求讓視頻設(shè)備、系統(tǒng)在各種情況下都表現(xiàn)優(yōu)異,極大保障用戶體驗,滿足我們對高質(zhì)量視頻的需要。
目前,客觀評價方法應(yīng)用日趨廣泛。但是一種評價算法只是對少數(shù)幾類失真比較敏感,而對其他類型的失真反應(yīng)效果并不好。因此在視頻質(zhì)量測試中,盡量采取準(zhǔn)確刻畫視頻狀態(tài)的,又符合人眼特征的算法尤其重要,此類算法的開發(fā)仍舊是此后研發(fā)的主要方向。