李紅芳
摘要:數(shù)字圖像在實際的應用中會引入各種各樣的失真,識別接受圖像的是人的眼,所以圖像質量的評價結果必須要與人眼的視覺效果相吻合。隨著對人眼視覺系統(tǒng)的研究的不斷深入與提高,研究人員根據(jù)HVS的特性建立圖像質量評價模型來,這種模型大大的提高了圖像質量主觀評價和客觀評價的一致性。文章詳細地介紹了PSNR、SSIM、MSSIM、IFC、VIF、FSlM等幾種典型的全參考圖像質量評價方法分析探討圖像質量評價研究的發(fā)展趨勢。關鍵詞:結構相似度(SSIM);梯度加權;視覺掩蓋效應
1引言
隨著通信技術的飛速發(fā)展,“數(shù)字”逐漸成為時代“寵兒”,在今后的發(fā)展中,數(shù)字化必將成為一種常態(tài)化技術,其應用也將更加廣泛。長期以來,人類依托圖像獲取有價值信息,圖像信息技術得以廣泛應用,然而,圖像在一系列處理過程中,極易因方式方法的不完備,造成圖像失真或降質,這些失真或降質影射在人類視觀上就是圖像質量的改變。列舉一個簡單的例子,比如公司的指紋識別系統(tǒng),假如之前錄入系統(tǒng)的指紋是清晰的,在下次打卡的時候假如手指上沾染了墨漬之類的模糊物品,那么指紋識別系統(tǒng)是否還能再與原錄入指紋對比的情況下識別該指紋?類似于這樣的問題在人們的生活中有很多,等待著全參考圖像質量的評價方法去解決并將之應用于實踐中。因此,圖像質量的合理評估具有非常重要的應用價值。
圖像質量評價應用極為廣泛:(1)對圖像質量的狀況進行動態(tài)檢測和調整。比如,圖像視頻時,利用評價模型獲得圖像質量,反映當前視頻的質量效果,進而進行合理調節(jié),獲取最佳視頻效果。(2)對圖像處理技術性能進行快速評估,也可適用于不同方案的圖像處理技術性能比較。
就圖像系統(tǒng)來說,對圖像失真程度的定量描述(即對圖像質量的評價)至關重要,它可以直接管理、控制和提高圖像質量。深入研究圖像質量評價方法,能為圖像后期處理提供更加準確的技術支持,對圖像處理技術的發(fā)展和應用來說意義重大。
2全參考圖像質量評價方法發(fā)展
現(xiàn)代應用中,利用原始圖像的全部信息,計算失真圖像與原始圖像間的誤差,并通過綜合誤差進而獲取對失真圖像質量綜合評價的方法,稱之為全參考型圖像質量評價方法。全參考型評價方法是當前最值得信任的質量評價方法。
全參考圖像質量評價需要原始圖像,經過數(shù)十年的發(fā)展已經形成了較為完整的理論體系和成熟的評價框架。將待評價的圖像信號的質量可以通過與原圖像的信號做對比之后所獲取的誤差信號來分析,圖像質量的下降與誤差信號的強弱有關。
最原始的圖像質量評價方法就是峰值信噪比(PSNR)和均方差(MSE)。MSE和PSNR這2種方法易于計算,容易實現(xiàn),但是MSE沒有利用圖像像素之間的相關性,和人眼感知到的數(shù)值相差較大。因而,人們基于HVS提出了很多客觀質量評價方法來提高和主觀評價的一致性。其中典型代表有Sarnoff提出的JND(Just Noticeable Difference)模型以及Stefan Winkler提出的PDM(Perceptual DistortionMetric)模型,這些模型很好的將人眼視覺合并為一個簡單的算法,由于當時的技術發(fā)展的局限性,HVS系統(tǒng)的一些理論尚未成熟。目前新的主流的全參考圖像質量評價方法在2002年由Zhou Wang等人提出——結構相似度(SSIM),它有效模擬了人眼提取視覺場景中結構信息的能力,大量實驗證明SSIM的評價性能優(yōu)于PSNR及MSE,引領圖像質量的評價走進了新的領域。SSIM現(xiàn)在已經成為了應用最廣泛的評價方法,但是這個方法對于模糊圖像的質量評價存在缺陷,這極大的限制了它的實際應用。近年來國內外很多研究人員對SSIM算法進行了改進,例如葉盛楠等人做出對結構信息的新解釋,提出了基于結構信息提?。╯tructural InformationExtraction)的評價方法;Santiago Aja-Fernandez等人在SSIM的基礎上提出了基于局部對比度的質量評價方法(QILV),圖1為SSIM結構相似度模型的系統(tǒng)框圖。
2006年,Hamid Sheikh~IFC的基礎上,提出了一種新的模型VIF(Visual Information Fidelity Fidelity),他從信息通信和共享的角度來解決圖像質量評估問題。
對比所有算法,VIF算法無疑表現(xiàn)最好,它在評價快速蛻變、高斯模糊、高斯白噪聲、JPEG失真、JPEG2000失真以及其他失真的表現(xiàn)上都要好于其他算法,但是,VIF算法也是目前的所有算法中復雜度最高的,因此,實用性就不如SSIM強。
3結語
全參考圖像質量評價方法的優(yōu)點是:準確性高、最可靠、最可行;缺點是:在實際應用中,對原始圖像的依賴程度太高,而原始圖像大多數(shù)情況下不容易獲取,而且存儲和傳輸過程中的數(shù)據(jù)量較大,這就限制了其在許多領域中的應用。