沈陽理工大學(xué)信息科學(xué)與工程學(xué)院 王亞清 石振剛
圖像是人類社會活動中最常用的信息載體,是人們最主要的信息來源。但是,圖像在其形成、傳輸記錄和存儲的過程中,經(jīng)常會受到各種各樣的噪聲污染和影響從而使圖像質(zhì)量嚴(yán)重下降,以至于人們無法正常識別,不能獲取圖像中的有效信息,這給圖像的后續(xù)處理增加了很大難度。因此,去除圖像在采集、傳輸及存儲過程中產(chǎn)生的噪聲,成為數(shù)字圖像處理領(lǐng)域中的重要部分。本文主要介紹了加權(quán)核范數(shù)最小化去噪算法的基本原理以及利用MATLAB軟件進(jìn)行算法的仿真實現(xiàn)。實驗證明,該方法可以有效地去除噪聲。并且通過多次實驗,分析了噪聲強(qiáng)度對于圖像去噪效果的影響。
21世紀(jì)已進(jìn)入信息化時代,信息的形式也多種多樣,不再只是簡單的語音形式,還有數(shù)據(jù)、文字、圖像、視頻等多種形式。事實上,人們主要通過視覺來獲取外界信息,因而直觀明了的圖像是主要信息來源之一。
由于圖像在拍攝和傳輸過程中受到各種噪聲污染,使圖像質(zhì)量嚴(yán)重下降,妨礙了圖像信息的正常傳輸與接收。所以,為了進(jìn)行圖像后續(xù)更高層次的處理、提高圖像質(zhì)量,對圖像進(jìn)行去噪處理是必不可少的重要環(huán)節(jié)。圖像去噪就是在去除圖像噪聲的同時盡可能多的保留圖像中的原有信息。圖像去噪不僅提高人們視覺識別信息的準(zhǔn)確性,還對圖像進(jìn)一步處理提供可靠保證。噪聲去除的效果直接影響到圖像的后續(xù)處理效果。
自然圖像具有極高的結(jié)構(gòu)性,表現(xiàn)在圖像的像素間存在著很強(qiáng)的相關(guān)性。物體表面亮度信息與照度和反射系數(shù)相關(guān),且場景中物體的結(jié)構(gòu)與照度是獨(dú)立的,反射系數(shù)與物體有關(guān)。結(jié)構(gòu)相似性從亮度、對比度、結(jié)構(gòu)三個對比模塊進(jìn)行測量,如圖1所示。
圖1 SSIM測量系統(tǒng)
對于給定的兩張圖像x和y,結(jié)構(gòu)相似性可按如下公式求出:
其中,μx是x的平均值,μy是y的平均值,是x的方差,是y的方差,σxy是x和y的協(xié)方差。c1=(k1L)2,c2=(k2L)2是維持穩(wěn)定的常數(shù)。L是圖像像素值的動態(tài)范圍,k1=0.01,k2=0.03。當(dāng)兩張圖像完全相同時,SSIM值為1。
峰值信噪比(PSNR)是衡量圖像失真或噪聲水平的客觀標(biāo)準(zhǔn)。PSNR公式如下:
其中,Peak是指8bits二進(jìn)制位表示的最大值255,MSE指Mean Square Error,是原始圖像與處理圖像之間均方誤差。PSNR的單位為dB,所以PSNR值越大,就代表圖像失真越少。PSNR是最普遍、最廣泛使用的評鑒畫質(zhì)的客觀測量法。
在一個自然圖像中選取一個局部塊,可以在整個圖像中搜索到多個與此圖像塊相似的塊。由于這些相似的塊分布在圖像的不同區(qū)域,學(xué)術(shù)界稱這種相似性為非局部相似性(non-local Similarity)。為了能夠有效地將非局部相似性與圖像在特定變換域的稀疏性充分結(jié)合,可以通過歐氏距離的方法將相似圖像塊聚類,而后組合構(gòu)成一個矩陣。由于矩陣的每一列之間存在相似性,因而此矩陣具有低秩的特性,所以有稀疏的奇異值。
低秩矩陣近似(Low Rank Matrix-Approximation,LRMA)旨在從退化觀測中恢復(fù)潛在的低秩矩陣并且在計算機(jī)視覺和機(jī)器學(xué)習(xí)中有廣泛應(yīng)用?;陟o態(tài)攝像機(jī)拍攝的視頻片段具有明顯的低階特性,可以進(jìn)行背景建模和前景提取。研究還表明,自然圖像中的非局部相似性塊組成的矩陣是低秩的,這一點可以用于高性能圖像的恢復(fù)任務(wù)。
低秩矩陣近似方法大致可分為兩類:低秩矩陣分解(Low Rank Matrix Factorization,LRMF)和核范數(shù)最小化(Nuclear Norm Minimization,NNM)方法。對于一個矩陣Y,低秩矩陣近似方法旨在找到一個矩陣X,此矩陣在確切的數(shù)據(jù)保真度函數(shù)下盡可能接近矩陣Y,同時能被分解為兩個低秩矩陣的乘積;低秩矩陣近似的另一種研究是核范數(shù)最小化,核范數(shù)最小化是指用矩陣X接近矩陣Y,同時使矩陣X的核范數(shù)最小。
矩陣X的核范數(shù),記為,定義為其奇異值的總和,即,其中σi(X)表示矩陣X的第i次奇異值。NNM是用矩陣X逼近矩陣Y,同時使矩陣X的核范數(shù)最小。NNM一個很明顯的優(yōu)勢在于它是對具有一定數(shù)據(jù)保真度的非凸LRMF問題有最嚴(yán)格的凸松弛。一方面,Candes和Recht證明了可以通過求解NNM問題完全恢復(fù)最低秩矩陣。另一方面,Cai等證明了基于低秩矩陣近似具有F范數(shù)數(shù)據(jù)保真度問題的NNM問題可以通過對觀測矩陣的的奇異值的軟閾值運(yùn)算解決。得到NNM模型如下:
NNM為了追求凸性,標(biāo)準(zhǔn)核范數(shù)平等對待每一個奇異值,因此,軟閾值算子以相同的量λ收縮每一個奇異值。然而,這一點忽略了對于矩陣奇異值的先驗知識。例如,矩陣中的列(或者行)向量常位于一個低維度的子空間;較大的奇異值通常與主要投影方向相關(guān)聯(lián),因此它們最好減少收縮以保存主要的數(shù)據(jù)組成部分。很顯然,NNM以及相應(yīng)的軟閾值操作并沒有充分利用先驗知識,盡管(3)中的模型是凸的,但是對于處理許多實際問題來說,它還是不夠靈活。為了提升核范數(shù)的靈活性,我們提出加權(quán)核范數(shù)并研究它的最小值。
由于不同的奇異值有不同的重要性,NNM同等對待矩陣X的奇異值是不合理的,因此應(yīng)區(qū)別對待。于是提出加權(quán)核范數(shù)最小化(WNNM)模型,WNNM在一般情況下是非凸的而且比NNM更難解決。矩陣X的加權(quán)核范數(shù)定義為:
當(dāng)權(quán)重在不同情況下時,問題(6)的優(yōu)化解隨之不同。這里,我們考慮了三種不同的權(quán)重情況:
為了測試不同噪聲強(qiáng)度對算法去噪效果的影響,實驗采用了monarch、hill、Barbara、mandrill、Lena、boat、fingerprint、couple、man這九幅不同的圖像,分別在噪聲強(qiáng)度為σn=10、σn=20、σn=50、σn=100這四種情況下進(jìn)行試驗。經(jīng)過比較試驗數(shù)據(jù),可以得到隨著噪聲強(qiáng)度的增大,去噪效果明顯降低。并且在噪聲強(qiáng)度為σn=10時,圖像的PSNR數(shù)值和SSIM數(shù)值最高,去噪效果最好。仿真試驗數(shù)據(jù)如表1所示:
表1 不同噪聲強(qiáng)度去噪結(jié)果
本文中WNNM去噪算法顯示出強(qiáng)大的去噪能力,在強(qiáng)噪聲情況下依然有較好的視覺效果。在MATLAB仿真下進(jìn)行的大量實驗表明WNNM算法具有較強(qiáng)的細(xì)節(jié)保持能力,可以預(yù)期WNNM將在計算機(jī)視覺問題上有更為成功的應(yīng)用。