蔣銘,馬兆豐,辛宇,鈕心忻,楊義先
(1.北京郵電大學(xué) 網(wǎng)絡(luò)與交換技術(shù)國家重點(diǎn)實驗室信息安全中心,北京 100876;2.北京郵電大學(xué) 網(wǎng)絡(luò)與信息攻防技術(shù)教育部重點(diǎn)實驗室,北京 100876;3.天柏寬帶網(wǎng)絡(luò)科技(北京)有限公司,北京 100086)
圖像質(zhì)量評價是圖像處理中??紤]到問題,如圖像傳輸、處理及壓縮等技術(shù)中圖像降質(zhì)問題,人們越來越注意研究結(jié)合基于人眼視覺特性的圖像質(zhì)量評價方法。
圖像質(zhì)量主觀的評價方法由于具有耗時長、費(fèi)用高、穩(wěn)定性差等固有缺點(diǎn)的限制,很少在圖像質(zhì)量評價中被采用。圖像質(zhì)量客觀評價方法仍有許多不完善之處,但其仍是圖像質(zhì)量評價的主流發(fā)展方向。傳統(tǒng)的圖像質(zhì)量客觀評價方法,主要通過計算圖像的統(tǒng)計誤差來實現(xiàn)圖像質(zhì)量的評價,如均方差(MSE, mean square error)、峰值信噪比(PSNR[1],peak signal noise ratio),還有包括基于圖像的高階累積量的無參考的圖像質(zhì)量客觀評價方法。然而對于最終接收者是人的應(yīng)用場合,采用以上純粹的基于統(tǒng)計量的客觀評價方法得到的結(jié)果與由主觀方法得到的結(jié)果存在著一定的差異。如文獻(xiàn)[2]直接指出了峰值信噪比不宜用來評價信息隱藏技術(shù)[3],因為PSNR在評價信息隱藏中數(shù)字水印技術(shù)的不可感知性指標(biāo)上存在缺陷。因此更加符合實際需要的客觀圖像評價標(biāo)準(zhǔn)還有待建立和完善。
Eskicioglu等人指出[4],在客觀評價方法中引入一些簡單的視覺模型,可以提高客觀評價方法與主觀評價方法的關(guān)聯(lián)度。這表明,圖像質(zhì)量的評價與人眼的視覺模型是兩個不可分割的部分。因此,在實現(xiàn)圖像質(zhì)量的客觀評價方法時,如果能將人眼的視覺特性考慮進(jìn)去,將提高評價效果。
Mannos等人最先利用人眼視覺特性,建立相應(yīng)的模型,并應(yīng)用于圖像質(zhì)量的客觀評價中[5]。之后很多研究者對Mannos等人的方法進(jìn)行了擴(kuò)展,深化,提出了很多基于人眼視覺模型的圖像質(zhì)量客觀評價方法。M.iyahara M等人[6]基于人的視覺特性[7]和大量的工程實驗,給出了用于圖像編碼質(zhì)量評價的PQS(picture quality scale)方法[8],該方法是建立在 CCIR500系列圖像質(zhì)量評價標(biāo)準(zhǔn)定義的圖像質(zhì)量尺度的基礎(chǔ)上的圖像質(zhì)量客觀評價方法,既考慮了全局特征,如隨機(jī)誤差,也考慮了局部化的干擾,如塊效應(yīng)、關(guān)聯(lián)誤差及邊緣誤差。它是通過求各種失真因子來最后給出評判值,其不足是對很好和很差圖像的質(zhì)量評價結(jié)果同MOS方法不十分一致。Wang Zhou和Bovik等人在2002年首次提出了結(jié)構(gòu)信息的概念[9],并給出了一種通用圖像質(zhì)量指數(shù)UIQI(universal image quality index),該方法考慮了3個誤差因素:相關(guān)性丟失、亮度失真、對比度失真。作者認(rèn)為:人眼視覺的主要功能是提取背景中的結(jié)構(gòu)信息,而且人眼視覺系統(tǒng)能高度自適應(yīng)地實現(xiàn)這一目標(biāo),因此對圖像結(jié)構(gòu)失真的度量應(yīng)是圖像感知質(zhì)量的最好近似。在此基礎(chǔ)上給出一種符合人眼視覺系統(tǒng)特性的圖像質(zhì)量客觀評判標(biāo)準(zhǔn):結(jié)構(gòu)相似指數(shù)SSIM(structural sIMilarity)[10,11]。同時SSIM也考慮了3個誤差因素:相關(guān)性丟失、亮度失真、對比度失真。但結(jié)果比 UIQI穩(wěn)定,性能好。還有一些邊緣的圖像質(zhì)量客觀評價方法,如馬苗等人在文獻(xiàn)[12]中給出了一種基于灰關(guān)聯(lián) GL(grey correlation)的圖像質(zhì)量評價方法等。
由小波分析理論可知,對圖像進(jìn)行小波變換后,在小波域可以得到圖像的多個頻帶的信息,各頻帶都是原圖像不同分辨率的子圖,保持著原圖像的基本輪廓。由人眼的視覺特性曲線可知,人眼最為敏感的就是圖像的輪廓信息。因此小波分析的多分辨率特性適合人類的視覺特性。考慮到HVS對圖像信號的空間方向敏感性不一致,而原圖像的整體信息又和各子圖像小波系數(shù)的大小關(guān)系密切,由此出發(fā),本文提出了一種新的客觀質(zhì)量評價算法——基于小波變換的視覺加權(quán)峰值信噪比(WVWPSNR,wavelet and vision_weighted peak signal noise ratio)。該方法將圖像的DWT和HVS特性相結(jié)合,利用子圖分解以及視覺加權(quán)處理實現(xiàn)圖像質(zhì)量的客觀評價。
其中,1≤l≤L,L=1 000。這里x(l)為選取的原始DCT交流系數(shù),w(l)為符合高斯分布的偽隨機(jī)水印序列,a為水印強(qiáng)度,x1(l)為嵌入水印后的序列。為了簡化起見,這里定義一個稱為嵌入偏移參數(shù)的量m,用于指定水印嵌入起始點(diǎn)相對于最大交流系數(shù)的偏移。因此,對于Cox的算法,m=0。這里選取m=0,m=10 000及m=50 000這3種情況,選取的水印強(qiáng)度a都是300,根據(jù)劉瑞禎等人的結(jié)果[14],這3種
圖像質(zhì)量的評價廣泛應(yīng)用于醫(yī)學(xué)成像系統(tǒng)技術(shù)、圖像視頻壓縮技術(shù)、人臉識別技術(shù)等多種場合。這里選取一個數(shù)字水印的例子,來說明基于統(tǒng)計量的圖像質(zhì)量評價方法存在的缺陷。水印算法采用Cox等人提出的基于擴(kuò)頻通信的數(shù)字水印算法[13]。
由于這個例子主要是為了證明基于統(tǒng)計量的圖像質(zhì)量評價方法存在的缺陷,而并沒有考慮數(shù)字水印方面的要求,比如不可感知性和頑健性,因此很多參數(shù)的選取都是為了證明基于統(tǒng)計量的圖像質(zhì)量評價方法存在的缺陷的需要而設(shè)定。在Cox的水印算法中,將圖像進(jìn)行DCT變換,然后將DCT系數(shù)按絕對值大小排列成一維序列,選取系數(shù)最大的1 000個交流系數(shù)作為嵌入水印的宿主媒體,按式(1)嵌入水印。情況下的MSE應(yīng)該相等,實驗中有些偏差,認(rèn)為是量化誤差,所得結(jié)果如圖1所示。
圖1 MSE評價圖像質(zhì)量的缺陷
圖1可以看出,幾乎相同的MSE表現(xiàn)出的圖像質(zhì)量的主觀評價存在很大差異,圖1(d)的主觀評價分肯定要比圖1(b)高。根據(jù)本文后述算法得出的3幅失真圖像與原始圖像之間的質(zhì)量評價值分別為:27.173dB、33.536dB和37.949dB。結(jié)果更為符合主觀評價值。因此,研究人眼視覺系統(tǒng)及其特性,建立相應(yīng)的人眼視覺模型并將其應(yīng)用于圖像質(zhì)量評價中,將是一件很有意義的事情。
算法的立論依據(jù)是將圖像的DWT和人眼視覺特性有機(jī)地結(jié)合起來。由于 HVS對加載于不同空間方向和頻率子圖像上的噪聲具有不同的敏感度。結(jié)合小波分析理論,圖像經(jīng)從DWT最終可被分解為一系列相互獨(dú)立的,對應(yīng)于不同空間位置和方向的空間頻率通道。研究[15]表明,五到六級的小波分解與 HVS的低級信息處理機(jī)制最為接近,更加符合人眼視覺特性,但過大的數(shù)據(jù)運(yùn)算量抵消了其實用價值,因此,一般認(rèn)為四級小波變換是一種兼顧計算復(fù)雜性和精確性的折衷方案。
算法實現(xiàn)步驟如下。
1) 對標(biāo)準(zhǔn)圖像與降質(zhì)的目標(biāo)圖像分別進(jìn)行四級DWT變換,各分成13個子圖圖像。
2) 每次只將原始圖像的一個子圖置換為目標(biāo)圖像對應(yīng)子圖而保持原始圖像其余子圖不變,然后進(jìn)行逆DWT變換,得到修改過的圖像。將它與原始圖像通過MSE算法進(jìn)行計算,得到一個MSE值。
3) 由于四級DWT變換將圖像分成了13個子圖像,所以依次按步驟2執(zhí)行,即可以得到13個MSE,分別用MSE(j,θ)表示。
MSE(j,θ)是指子圖像(j,θ)對應(yīng)的單子圖目標(biāo)圖像的MSE值,其中j代表小波分解級數(shù)(j=1,2,3,4);θ代表每層小波分解后子圖對應(yīng)的 4個方向(θ=1,2,3,4),以3級小波分解為例,每層分解產(chǎn)生的子圖及其對應(yīng)的方向示意圖如圖2所示。
圖2 圖像三級小波分解及對應(yīng)方向示意圖
4) 加權(quán)值的計算:對圖像進(jìn)行小波變換后,各子圖圖像質(zhì)量對原始圖像質(zhì)量的影響不盡相同,低頻成分影響最大,這里用子圖的F(j,θ)(式(2))來表征子圖像系數(shù)的能量大小。
F(j,θ)的計算公式如下:
其中,fxy(j,θ)代表子圖像(j,θ)的小波系數(shù),M、N分別表示小波子圖的長與寬。α參數(shù)為控制比例參數(shù),經(jīng)過實驗分析,α一般取值為0.5~1。由于小波分解為四級,所以F(4,4)值最大,對應(yīng)著DWT變換的低頻子圖像。并通過(式(3))計算各個子圖像與四級小波低頻子圖像在圖像能量上的比例因子,即歸一化系數(shù)W(j,θ),并將此系數(shù)作為該子圖像質(zhì)量影響原始圖像質(zhì)量的歸一化權(quán)重系數(shù)。容易發(fā)現(xiàn),W(j,θ)=1,即第四級小波低頻子帶影響最大,符合小波理論知識。其中W(j,θ)計算公式如下:
計算結(jié)果見表1。
表1 lena圖像加權(quán)系數(shù)W(j,θ)
5) 確定各子圖的視覺加權(quán)值后,計算原始圖像和降質(zhì)目標(biāo)圖像的加權(quán)均方誤差WMSE,公式如下:
對于位深度為8bit的圖像,其等效視覺加權(quán)峰值信噪比WVWPSNR為
分別用主觀評價方法,PSNR、SSIM、PQS、UIQI、GL和文獻(xiàn)[16]中的WWPSNR方法及本文提出的 WVWPSNR客觀評價方法對一系列降質(zhì)圖像進(jìn)行質(zhì)量評價,通過比較圖像質(zhì)量的主、客觀評價結(jié)果來進(jìn)一步驗證本文方法的性能。
1) 實驗?zāi)康摹?/p>
驗證WVWPSNR方法的可行性和有效性。
實驗中選取LIVE圖像質(zhì)量估計庫,由美國德州大學(xué)(The University of Texas)圖像視頻工程實驗室(LIVE, laboratory for image and video engineering)免費(fèi)提供[17]。該圖片庫包括多幅彩色的原始圖像,還包括5 類失真圖像:JPEG、JPEG 2000、White Noise (白噪聲)、Gaussian Blur(高斯模糊)、FastFading(在fastfading 通道傳輸JPEG 2000碼流的過程中發(fā)生錯誤而失真的圖像) 。同時圖像庫還給出了平均主觀評分差值(DMOS),DMOS 是主觀評分均值(MOS, mean opinion score) 和滿分(100) 的差值(DMOS= 100?MOS),且 DMOS的取值范圍為[0,100]。本文通過DMOS計算出相應(yīng)的MOS來作為主觀評價值。考慮到前面所述圖像質(zhì)量客觀評價方法都是在灰度圖像上進(jìn)行的,因此在實驗中都是將算法作用于彩色圖像中提取出來的灰度部分所得到的結(jié)果。
2) 實驗方法與步驟。
分別采用傳統(tǒng)的PSNR、SSIM、PQS、UIQI、GL等客觀評價方法、WWPSNR方法以及本文的WVWPSNR客觀評價方法對目標(biāo)圖像進(jìn)行評價。
3) 實驗結(jié)果。
采用上述方法獲得的MOS值與客觀評價結(jié)果如圖3所示,橫坐標(biāo)表示測試圖像序號,縱坐標(biāo)表示對該圖像進(jìn)行質(zhì)量評價的結(jié)果及 MOS值。由于各種圖像質(zhì)量的評價值區(qū)間不統(tǒng)一,為了能夠較好地進(jìn)行圖示比較,部分評價值倍乘了部分常數(shù)。如0.5×MOS表示MOS值倍乘0.5。
圖3 buildings圖像質(zhì)量主、客觀評價對比
圖3可以看出,隨著圖像主觀視覺質(zhì)量的升高,WVWPSNR評價結(jié)果表現(xiàn)出與圖像質(zhì)量主觀分?jǐn)?shù)MOS結(jié)果變化趨勢一致的評價結(jié)果,驗證了算法的可行性和可靠性。根據(jù)引言部分各種圖像質(zhì)量評價方式的分析表明,SSIM方法和UIQI方法性能優(yōu)于其他評價方法,本文 WVWPSNR方法表現(xiàn)出與以上 2種方法變化趨勢相似程度較高的結(jié)果,且WVWPSNR評價值與 MOS分?jǐn)?shù)變化趨勢更加接近,驗證了本算法的有效性。
圖4 圖像質(zhì)量評價對比
1) 實驗?zāi)康摹?/p>
比較各種圖像質(zhì)量客觀評價方法性能,將其作用于上述圖片庫,將得到的客觀評價值與已知的MOS分?jǐn)?shù)進(jìn)行了相關(guān)分析,驗證客觀評價結(jié)果與圖像主觀視覺質(zhì)量的相符程度及算法的優(yōu)越性、穩(wěn)定性。
2) 實驗方法與步驟。
將實驗1中測得的目標(biāo)圖像的各種測試結(jié)果分別與 MOS進(jìn)行相關(guān)性計算,求出圖像質(zhì)量客觀評價方法與主觀評價方法的相關(guān)系數(shù)。其公式如下:
其中,n為圖像個數(shù),MOS(i)表示MOS值,X(i)表示各種客觀評價方法的測試結(jié)果。歸一化相關(guān)系數(shù)NC越接近1,表示客觀評價值與主觀MOS值越具有線性相關(guān)性,即圖像質(zhì)量客觀評價結(jié)果與圖像主觀視覺質(zhì)量越相符。圖4是評價圖像質(zhì)量對比圖。
橫坐標(biāo)表示庫中圖像的種類數(shù),縱坐標(biāo)表示對各種圖像進(jìn)行的質(zhì)量評價值與MOS值之間的相關(guān)系數(shù)。
以上質(zhì)量評價對比圖結(jié)果表明:PQS算法較差(由于該算法相關(guān)系數(shù)(如表2所示)與其他測試值相距甚遠(yuǎn),不利于曲線顯示),GL算法性能不夠優(yōu)良,SSIM算法和UIQI算法在對待White Noise處理的圖像性能較弱,這是由于White Noise攻擊的特殊性造成的,其余評價結(jié)果均符合主觀評價標(biāo)準(zhǔn)。本文算法在各種方式處理后的圖像質(zhì)量評價中均和主觀評價接近,主要由于本文算法所采用的小波分解特性更加符合人眼視覺特性。而對以上較常見的圖像處理方式,PSNR算法具有一定的普遍性,但是性能普遍低于WWPSNR、UIQI及本文的算法。但由于其復(fù)雜度最低,因此應(yīng)用廣泛。
3) 實驗數(shù)據(jù)分析。
對相關(guān)系數(shù)NC進(jìn)行均值統(tǒng)計(如表2所示)和標(biāo)準(zhǔn)差統(tǒng)計(如表3所示)。
均值分析表顯示本文所述方法的結(jié)果與主觀評價方法的結(jié)果較為一致,所得的客觀評價值與MOS值關(guān)聯(lián)度更高,算法優(yōu)越性更佳。標(biāo)準(zhǔn)差分析表達(dá)數(shù)據(jù)顯示本文算法所得到的結(jié)果穩(wěn)定性更加好。
比較上述各種圖像質(zhì)量客觀評價方法性能特征,主要表現(xiàn)在算法是否與人類視覺特性 HVS相結(jié)合以及算法的復(fù)雜度。算法復(fù)雜度體現(xiàn)在以上各種算法對圖像質(zhì)量評價的時間。
表2 均值統(tǒng)計
表3 標(biāo)準(zhǔn)差統(tǒng)計
表4 算法時間統(tǒng)計
表5 算法性能特征
時間統(tǒng)計數(shù)據(jù)(如表4所示)表明PQS算法過于復(fù)雜,計算量大,速度慢,不適合實際應(yīng)用。PSNR、SSIM、UIQI、及GL算法復(fù)雜度較小。本文算法復(fù)雜度不大,和WWPSNR相當(dāng)。算法性能數(shù)據(jù)(如表5所示)表明除PSNR和UIQI算法,WWPSNR、SSIM、PQS、GL及本文算法均有效地結(jié)合了HVS。
綜合考慮,本文算法復(fù)雜度不大,且結(jié)合了HVS,性能較好。
雖然目前圖像質(zhì)量客觀評價方法仍然有許多不完善之處,但客觀評價方法仍然是圖像質(zhì)量評價的發(fā)展方向。本文利用了圖像的四級 DWT變換和 HVS思想實現(xiàn)了一種客觀圖像質(zhì)量評價方法,評價結(jié)果與主觀評價結(jié)果具有更好的關(guān)聯(lián)度。目前還沒有一種很好的,能夠與 MOS完全一致的圖像質(zhì)量客觀評價方法,因此,這需要進(jìn)一步的研究。研究的方向包括繼續(xù)提高現(xiàn)有的各種基于灰度圖像的圖像質(zhì)量客觀評價方法,尋找新的方法,以及研究基于彩色圖像的圖像質(zhì)量客觀評價方法等。圖像質(zhì)量的正確評價對于視頻圖像質(zhì)量的評估有著重要的指導(dǎo)意義,在最新的視頻壓縮標(biāo)準(zhǔn) H.264[18]中,在編碼過程中對視頻幀數(shù)據(jù)的質(zhì)量評價除了傳統(tǒng)的PSNR方法外,已經(jīng)引進(jìn)了 SSIM 的方法。對于整體圖像信息工程的發(fā)展具有十分重要的意義,隨著多媒體信息技術(shù)的高速發(fā)展,對圖像質(zhì)量評價的研究將越來越受到人們的重視。
[1]KATZENBEISSER S, PETITCOLAS F A P.Information Hiding Techniques for Steganography and Digital Watermarking[Z].Artech House, Inc.,2000
[2]尤新剛,郭云彪,周琳娜.峰值信噪比不宜用來評價信息隱藏技術(shù)[A].信息隱藏全國學(xué)術(shù)研討會(CIHW2000/2001)論文集[C].西安: 西安電子科技大學(xué)出版,2001.129 -134.YOU X G, GUO Y B, ZHOU L N.PSNR is improper to evaluate steganography technique[A].China Inform a tion Hiding Workshop(CIHW2000/2001)Ana Lects[C].Xian: Xidian University Press,2001.292-134.
[3]鈕心忻.信息隱藏與數(shù)字水印[M].北京:北京郵電大學(xué)出版社 2004.NIU X X.Information Hiding and Digital Watermarking[M].Beijing: Beijing University of Psots and Telecommunications Press 2004.
[4]ESKICIOGLU A M, FISHER P S.Image quality measures and their performance[J].IEEE Trans on Communication, 1995, 43: 2959-2965.
[5]MANNOS J L, SAKRISON D J.The effects of a visual fidelity criterion on the encoding of images[J].IEEE Trans Information Theory,1974, 4: 525-536.
[6]MIYAHARA M.Quality assessments for visual service[J].IEEE Communications Magazine, 1988, 26(10): 51-60.
[7]林仲賢、孫秀如編著.視覺及測色應(yīng)用[M].科學(xué)出版社, 1987.6.LIN Z X, SUN X R.Vision and Color Measurement Application[M].Science Press.1987.6.
[8]MIYAHARA M, KOTANI K, ALGAZIV R.Objective picture quality scale (PQS) for image coding[J].IEEE Transactions on Communications, 1998, 46(9): 1215-1226.
[9]WANG Z, BOVIK A C.A universal image quality index[J].IEEE Signal Processing Letters, 2002 , 9(3): 81-84.
[10]WANG Z, BOVIK A C, SHEIKH H R,et al.Image quality assessment: From error visibility to structural similarity[J].IEEE Transactions on Image Processing, 2004, 13(4): 600-612.
[11]WANG Z, BOVIK A C, SIMONCELLI E P.Structural approaches to image quality assessment[A].Bovik A C.Handbook of Image and Video Processing(Second Edition)[C], New York, USA: Academic Press,2005:1-33.
[12]馬苗, 丁力, 郝重陽.數(shù)字水印的透明性的灰評判[J].計算機(jī)工程與應(yīng)用, 2003.22:22-23.MA M, DING L, HAO C Y.Judgment of the imperceptibility of digital watermarking based on gray correlation degree[J].Computer Engineering and Applications, 2003.22:22-23
[13]COX I, KILIAN J.Secure spread spectrum watermarking for mulitmedia[J].IEEE Trans on Image Processing, 1997, 6(12): 1673-1687.
[14]劉瑞禎, 譚鐵牛.水印能量估計的一般性框架[J].計算機(jī)學(xué)報,2001, 24: 242-247.LIU R Z, TAN T N.A general watermarking framework for optimal energy estimation[J].Chinese Journal of Computers, 2001, 24: 242 -247
[15]BRADLEY A P.A wavelet visible difference predictor[J].IEEE Trans on Image Processing, 1998, 8(5): 717-730.
[16]丁藝芳.基于小波變換和視覺系統(tǒng)的圖像質(zhì)量綜合評價新算法[D].上海: 上海大學(xué), 2001.DING Y F.A New Algorithm for Integrated Image Quality Measurement Base on Wavelet Transform and Human Visual System[D].Shanghai: Shanghai University, 2001.
[17]SHE I H, WANG Z, CORMACK L,et al.LIVE image quality assessment database[DB/OL].http://live.ece.utexas.edu/research/ quality, 2006.
[18]畢厚杰.新一代視頻壓縮編碼標(biāo)準(zhǔn)——H.264/AVC[M].北京: 人民郵電出版社, 2005.BI H J.A New Generation of Video Compression Coding Standard H.264/AVC[M].Beijing: Posts and Telecom Press, 2005.