張雅茹
(連云港開放大學(xué) 信息工程系,江蘇 連云港 222000)
近年來,智能產(chǎn)品的飛速發(fā)展,對圖像傳輸、獲取以及存儲都有了更高的要求,需要開發(fā)越來越多的用于自動預(yù)測圖像質(zhì)量的技術(shù)。圖像質(zhì)量評價算法可以分成兩種:主觀質(zhì)量評價算法及客觀質(zhì)量評價算法[1]。兩者的區(qū)別在于是否有人的參與。主觀質(zhì)量評價算法是由人在經(jīng)過繁瑣的過程后基于一些因素及視覺效果來直接對圖像進行打分[2]??陀^質(zhì)量評價算法不需要人的直接參與,只需要通過計算機完成一系列的運算來預(yù)測圖像質(zhì)量[3]。主觀質(zhì)量評價算法雖然精確度較高,但是由于考慮因素眾多,過程繁瑣,在一些需要嚴(yán)格的實時應(yīng)用場合中難以適用??陀^質(zhì)量評價算法主要分成三類,分別為依賴原始圖像的全參考質(zhì)量評價算法、部分依賴原始圖像的部分參考質(zhì)量算法和無參考質(zhì)量評價算法[4]。其中,無參考算法與前兩者的區(qū)別在于預(yù)測圖像質(zhì)量時不需要任何的原始圖像信息[5]。設(shè)計目標(biāo)無參考質(zhì)量評價算法是一個非常困難的任務(wù)。由于HVS(human visual system,視覺系統(tǒng))的理解是有限的,只有當(dāng)已經(jīng)知曉到圖像失真類型并且可以供人們使用時,才認(rèn)為有效的無參考圖像質(zhì)量評估是可行的[6]。本文設(shè)計了一種實用的無參考圖像質(zhì)量評價算法。該算法可以有效地預(yù)測感知JPEG圖像質(zhì)量。以模糊和塊失真作為JPEG壓縮過程中產(chǎn)生的最主要的失真,從而提出了一種有效的提取特征方法,可以用來反映失真程度相對大小。
圖1 基于DCT的JPEG壓縮流程圖Fig.1 JPEG compression flow chart based on DCT
1.1.1JPEG壓縮圖像原理
JPEG是一種用來壓縮圖像的公共標(biāo)準(zhǔn),主要是針對色調(diào)連續(xù)的圖像[7]。這種標(biāo)準(zhǔn)可以應(yīng)用于各種存儲或者使用的圖像壓縮文件,因為連續(xù)色調(diào)圖像不僅指的是同一色調(diào)的圖像。圖1是JPGE壓縮時的處理框圖。
從圖1可以看出,壓縮圖片的編碼過程大致由三部分組成:1)對原始圖像的處理;2) 基本DCT編碼器的處理;3) 編碼。JPEG的編碼過程需要進行基于離散余弦變換(DCT).而在基本DCT編碼器中包含了量化和熵編碼操作。
1.1.2JPEG圖像失真類型
JPEG圖像的壓縮算法是一種集合了以上兩種算法的綜合性算法。在DCT的壓縮算法中,會舍去一些無用且多余的數(shù)據(jù)來達到壓縮的目的[8]。可以根據(jù)它所去除的數(shù)據(jù)類型將其分成三類:編碼冗余、像素間冗余和心理視覺冗余。為了達到很高的壓縮比,JPEG圖像會有損一些圖片的質(zhì)量,并且在圖像壓縮、傳輸和存儲的過程中引入各種失真效應(yīng)[8]。這些失真效應(yīng)會不可避免地引起不同程度的圖片質(zhì)量的降低。導(dǎo)致JPEG壓縮所造成失真的主要原因是塊狀效應(yīng)以及模糊;而JPEG壓縮主要的失真效應(yīng)是振鈴和模糊。
由于量化操作適用于每8×8編碼塊的DCT系數(shù),所以它并不是無損的。在量化過程中,可以創(chuàng)建模糊和阻塞工件。DCT系數(shù)使每一塊的圖像變得平滑,而損失高頻率的DCT系數(shù)會使圖像變得模糊。JPEG圖片中的量化是基于塊,并且塊是量化的獨立的[7];而塊效應(yīng)的產(chǎn)生是塊邊界的不連續(xù)性造成的。將信號變換到頻域是檢查模糊和阻塞效應(yīng)的一種有效方法。本文將測試圖像信號設(shè)為x(m,n),其中m∈[1,M],n∈[1,N]并計算每個水平線的差分信號。
dh(m,n)=x(m,n+1)-x(m,n),n∈[1,N-1]
(1)
其中,dh(m,n)為脈沖輸出信號;x(m,n)為n時刻的輸入信號;x(m,n+1)為n+1時刻的輸入信號。由于M為固定值,使fm(n)=|dh(m,n)|成為一個1-D水平信號,獲得功率譜fm(n),m=1,…,M,并計算其平均值,然后得到估計的功率譜ph(l),如圖2.阻塞效應(yīng)可以很容易地識別峰值的特征頻率(1/8,2/8,3/8,4/8)的模糊效應(yīng),其特征在于能量從高頻到低頻波段的轉(zhuǎn)變。頻域方法的一個缺點是參與的快速傅立葉變換(FFT),它必須為每個圖像計算多次,因此是很耗時的。FFT還需要更多的存儲空間。
圖2 功率譜Fig.2 Power spectrum
本文為了設(shè)計一個計算成本低,內(nèi)存高效的特征提取方法,不僅進行水平計算,還進行垂直計算。首先,塊效應(yīng)是在塊邊界估計平均差異,塊效應(yīng)的計算如式(2)所示:
(2)
其次,估計圖像信號的活動。雖然在沒有參考圖像時,使得信號活性下降,并且結(jié)合塊和活動的措施讓看到的圖像變得更加模糊。
本文采用兩因素測量,首先是整體圖像樣本之間的平均絕對差:
(3)
接著活性測定是過零(ZC)率。定義N∈[1,N-2],
(4)
然后橫向ZC率可估計為:
(5)
使用類似的方法,計算垂直特征Bv、AV、ZV.最后,給出了總體特征:
(6)
結(jié)合公式(3)-(6)及特征構(gòu)成質(zhì)量評價模型,得到一種可以給出了良好的預(yù)測性能的方法:
S=α+βBγ1Aγ2Zγ3
(7)
本文選擇LIVE圖像質(zhì)量評價數(shù)據(jù)庫[5]29幅原始圖像以及與其對應(yīng)的5類失真圖像為研究對象。數(shù)據(jù)庫中每一類失真圖像有5級失真程度:即JPEG、JP2K、白噪聲(WN)、高斯模糊(Blur)和快衰落(FF),這種圖像庫有利于評價無參考質(zhì)量評價算法的性能,并且更為細(xì)致地比較評價算法的準(zhǔn)確度。將數(shù)據(jù)庫中圖片分為兩組,分別為組1(Group1)和組2(Group2),如圖3所示。
圖3 LIVE圖像庫中圖組Fig.3 Image group in the LIVE image library
為了驗證基于DCT的無參考圖像質(zhì)量評價方法的有效性。本文利用MATLAB軟件(8.0版本)采用非線性回歸方法,分別使用圖組1(Group1)、圖組2(Group2)以及圖組1(Group1)和圖組2(Group2)為訓(xùn)練集,對應(yīng)圖組2(Group2)、圖組1(Group1)為測試集,按照公式(7)進行建模,并計算模型的最佳參數(shù)。所有測試圖像獲得的參數(shù)分別是α=-245.9,β=261.9,γ1=0.024 0,γ2=0.016 0,γ3=0.006 4.所以,得到質(zhì)量評價模型為:
S=-245.9+261.9B0.024 0A0.016 0Z0.006 4
(8)
為了評價模型的預(yù)測能力,分別對模型進行非線性擬合。需要注意的是模型不能夠過度訓(xùn)練,盡管具有較好的擬合能力,但該模型的泛化能力受到影響。因此,分別使用不同圖組作為測試圖像進行比較分析,結(jié)果如圖4所示。
各個模型的MOS與模型的預(yù)測值均分布比較均勻,線性一致。如表1所示,除了測試集和訓(xùn)練集均為Group2的模型外,其余模型的預(yù)測均方根均大于0.600 0,說明模型具有較好的預(yù)測能力。其中以Group2為訓(xùn)練集和Group1為測試集時,模型具有最高預(yù)測能力均方根達到0.894 7,選擇該模型作為全部圖像的無參考圖像質(zhì)量評價模型。
表1 MOS與模型預(yù)測的均方根Table 1 RMS of MOS and model prediction
本文提出了一種可感知JPEG壓縮圖像的無參考質(zhì)量評價方法。設(shè)計的方法由于沒有復(fù)雜的變換計算,而且結(jié)合水平計算(整體圖像樣本之間的平均絕對差、過零率)和垂直計算(垂直特征)降低圖像局部信息誤差,所以該方法計算效率高,這使得嵌入式實現(xiàn)更容易。本文所提出的基本方法還可以被用來評估H.26x/MPEG格式的圖像的無參考圖像質(zhì)量[8]。