楊 華
(南充職業(yè)技術(shù)學(xué)院 電子信息工程系,四川 南充 637000)
數(shù)字圖像在成像、壓縮和傳輸過程中經(jīng)常會引入噪聲,進(jìn)而導(dǎo)致圖像可視程度降低和信息的丟失[1-2]。為了提高圖像成像質(zhì)量,圖像處理領(lǐng)域的研究者提出了多種算法[3-6]。對很多圖像處理算法來說,在進(jìn)行圖像處理時,需預(yù)先估計圖像噪聲的分布模型和噪聲的相關(guān)參數(shù)。
在大多數(shù)情況下,圖像噪聲服從高斯分布,為高斯白噪聲。高斯白噪聲一般為零均值。因此圖像噪聲估計參數(shù)一般為標(biāo)準(zhǔn)差或者方差。常用的噪聲方差估計方法包括奇異值分解[7]、主成分分析[8]和小波變換[9]等。圖像噪聲來源主要包括傳感器噪聲、電路失穩(wěn)、傳輸過程中的壓縮等[10]。Li等人[11]認(rèn)為圖像中的信息可以被視為能量,被噪聲污染之后的圖像信息的部分損失可以歸結(jié)為能量損失。稀疏主成分分析對數(shù)字圖像這類矩陣數(shù)據(jù)的能量變化尤為敏感。在實驗中,我們觀察到噪聲圖像的高斯白噪聲標(biāo)準(zhǔn)差等級與稀疏主成分分析得到的部分主成分負(fù)載向量均值呈現(xiàn)較為良好的線性關(guān)系?;谠撘?guī)律,本文提出了一種基于稀疏主成分分析的圖像高斯噪聲估計方法。該方法計算復(fù)雜度低且具有較強(qiáng)的魯棒性和精確性。
主成分分析(Principal Component Analysis, PCA)目的是在將每個樣本屬性值數(shù)量極大程度減小的前提下,保證原始數(shù)據(jù)矩陣的原始信息得以最大程度保留。
求解主成分(Principal Component)主要有兩種方法[12]。
第一種方法利用了協(xié)方差矩陣的特性:
設(shè)有包含n個樣本、p個屬性值的矩陣Xn×p。
將矩陣進(jìn)行中心化和標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化即每一個屬性向量內(nèi)的元素除以該向量內(nèi)所有元素的標(biāo)準(zhǔn)差。其協(xié)方差矩陣為:
(1)
可以發(fā)現(xiàn),協(xié)方差矩陣的對角線依次排列各屬性方差,非對角線上的元素是所有屬性兩兩之間的協(xié)方差。因此使用主成分分析得到的降維后的低維矩陣的協(xié)方差矩陣必須滿足這兩個條件:對角線元素盡可能大、非對角線元素為0。
設(shè)使用PCA對矩陣X降維得到矩陣Z,X、Z的協(xié)方差矩陣分別為C、D,P為一組正交基,有Z=XP。則有:
(2)
因此,優(yōu)化目標(biāo)變?yōu)閷ふ沂沟迷紨?shù)據(jù)矩陣X的協(xié)方差矩陣C對角化且對角線元素從上到下降序排列的矩陣P。由于協(xié)方差矩陣為實對稱矩陣,在線性代數(shù)上,實對稱矩陣有一系列極有實用價值的性質(zhì)[13]。若某實對稱矩陣大小為p行p列,則一定可以找到p個互相正交的單位特征向量,設(shè)這p個特征向量組成矩陣E:
E=(e1,e2,…,ep),
則對協(xié)方差矩陣C有:
取 1 mL 樣品溶液加入5 mL 試劑甲混勻,于20~25 ℃放置10 min,再加0.5 mL試劑乙(Folin-酚),立即搖勻,記錄反應(yīng)總體積為6.5 mL。在 20~25 ℃保溫30 min,然后于500 nm 處比色,以 0 mL標(biāo)準(zhǔn)蛋白代替作空白對照。
(3)
若將特征值向量按照降序排列,每個特征值對應(yīng)的特征向量矩陣E也進(jìn)行對應(yīng)的重排。則式(3)得到的對角陣從上到下各元素的大小也為降序排列。
因此,主成分分析所求的P就是原始數(shù)據(jù)矩陣X的協(xié)方差矩陣C的特征向量E。按照特征值大小取前K個特征值對應(yīng)的特征向量按列排序,構(gòu)成PCA前k個主成分對應(yīng)的負(fù)載矩陣βp×k,前K個主成分為:
Zn×k=Xn×pβp×k.
(4)
第二種方法是對Xn×p進(jìn)行奇異值(Singular Value Decomposition, SVD)分解:
X=UDβT,
(5)
Zn×k=UD為X通過主成分分析降維后得到的前k個主成分矩陣,βp×k為前k個主成分對應(yīng)的負(fù)載矩陣,Dp×p為對角陣,對角線元素為降序排列的原始矩陣的奇異值。
上述兩種方法適用不同類型數(shù)據(jù)矩陣。若以數(shù)據(jù)矩陣的每一行代表一個樣本,每一列代表一種屬性,第一種方法適用于樣本數(shù)量遠(yuǎn)大于屬性數(shù)量的數(shù)據(jù)矩陣,第二種方法適用于樣本數(shù)量遠(yuǎn)小于屬性數(shù)量的矩陣。
各個主成分對原數(shù)據(jù)矩陣的解釋程度不同,一般通過主成分的方差貢獻(xiàn)率(也稱方差解釋率)來衡量其在原始數(shù)據(jù)矩陣中所占的比重。對方法一、二,主成分的方差貢獻(xiàn)率分別使用式(6)、(7)計算,前k個主成分的累計方差貢獻(xiàn)率分別使用式(8)、(9)計算。
(6)
式中,λi為原始矩陣Xn×p的協(xié)方差矩陣的第i個特征值(按降序排列)。
(7)
(8)
(9)
稀疏主成分分析是在主成分分析的基礎(chǔ)上,將主成分分析所得負(fù)載矩陣作為系數(shù)矩陣,與原始數(shù)據(jù)矩陣通過最小二乘法逼近主成分矩陣,同時引入L1正則化和L2正則化作為約束[14]。如式(10)所示:
(10)
以圖1所示的8幅尺寸均為512 pixel×512 pixel的灰度圖進(jìn)行線性關(guān)系測試。對8幅圖分別添加標(biāo)準(zhǔn)差δ=5,10,20,30,…,70的高斯白噪聲,使得每一幅圖均對應(yīng)生成8幅新的高斯白噪聲圖像。對噪聲標(biāo)準(zhǔn)差等級δ使用多個稀疏負(fù)載向量均值的加權(quán)平均進(jìn)行線性擬合,如式(11)所示。
(11)
式中,δi代表第i幅噪聲圖像所對應(yīng)的高斯白噪聲標(biāo)準(zhǔn)差等級。使用式(11)反復(fù)迭代計算之后確定r1=1,r2=5,ωj=1(j=1,2,…,5)時擬合效果最好。此時式(11)可重寫為式(12)。
(12)
此時各圖的擬合結(jié)果如圖2所示。
在實際應(yīng)用中,對單個圖像而言,因未知量過多,因此式(12)無法求出唯一收斂解。為解決此問題,本文采用構(gòu)造超定方程組的方式求解單個圖像的未知量。方法如下所述:
設(shè)原始圖像的像素矩陣為X0,添加了未知標(biāo)準(zhǔn)差等級δ0的高斯白噪聲n0之后得到的新圖像為X0+n0=Y0。對X0和Y0有:
D(Y0)=D(X0+n0)=D(X0)+δ02.
(13)
然后分別對Y0添加已知標(biāo)準(zhǔn)差等級δi(i=1,2,…,N)的高斯白噪聲ni(i=1,2,…,N),分別得到Y(jié)i(i=1,2,…,N)。對Yi(i=1,2,…,N)有:
D(Yi)=D(X0+n0+ni)=D(X0)+δ02+δ2i,
(14)
則結(jié)合式(12)與(14)可得到:
(15)
(16)
圖1 用于線性關(guān)系測試的圖像Fig.1 Images for linear relationship testing
圖2 參數(shù)最優(yōu)時的擬合結(jié)果Fig.2 Fitting results of the optimal parameters
N)之后生成的Yi(i=1,2,…,N)進(jìn)行稀疏主成分分析所得到的第j個稀疏負(fù)載向量均值。
Lena標(biāo)準(zhǔn)灰度圖像被用于進(jìn)行噪聲估計測試。文中所提出的噪聲估計方法與文獻(xiàn)[11,15]中提出的方法進(jìn)行了比較。設(shè)δ0為圖像高斯白噪聲的真實標(biāo)準(zhǔn)差等級,δ1為使用估計方法得出的高斯白噪聲標(biāo)準(zhǔn)差等級的最優(yōu)估計。實驗結(jié)果如圖3和表1所示。
圖3 不同噪聲等級下3種噪聲估計方法的噪聲估計誤差Fig.3 Estimation error of three noise estimation methods under different noise levels
從圖4和表1可以看出,相比于其他兩種算法,本方法的精確度更高且更具有魯棒性。
彩色圖像包含R、G、B 3個像素矩陣。在實驗中,分別對R、G、B 3個像素矩陣采用所提出的噪聲估計方法進(jìn)行噪聲估計。實驗所使用的Lena圖像的3個通道如圖4所示。與文獻(xiàn)[11,15]的比較結(jié)果如圖5和表2所示。
表1 不同噪聲等級下3種噪聲估計方法的估計結(jié)果
Tab.1 Estimation results of three noise estimation methods under different noise levels
δ0文獻(xiàn)[11]文獻(xiàn)[15]本文方法54.124.324.78109.609.2410.112021.0221.3120.573032.4231.5530.734041.5841.0840.365051.3652.7750.396063.8364.1961.027072.6671.8670.62
從圖5和表2可以看出,本文方法在3個通道都達(dá)到了最高的精確度,且估計效果不受噪聲等級影響。
(a)R通道(a) R channel
(b)G通道(b) G channel
(c)B通道(c) B channel圖4 Lena圖像的R、G、B 3個通道Fig.4 R, G, B channels of Lena image
(a)R通道(a) R channel
(b) G channel(b)G通道
(c)B通道 (c) B channel
高斯噪聲圖像的噪聲標(biāo)準(zhǔn)差等級與稀疏主成分分析得到的部分主成分負(fù)載向量均值呈現(xiàn)較為良好的線性關(guān)系,基于此特征,本文中提出了一種基于稀疏主成分分析的圖像高斯噪聲估計方法。在該方法中,經(jīng)過實驗確定了前5個稀疏負(fù)載向量均值之和與噪聲等級的線性度最優(yōu);同時通過在圖像中依次添加已知噪聲等級的高斯白噪聲的方式構(gòu)造超定方程組,在反復(fù)迭代之后求解出噪聲等級的最優(yōu)估計量。在標(biāo)準(zhǔn)圖像Lena的灰度圖和彩色圖像三個通道的測試中,該方法展現(xiàn)出了相比于其他兩種算法更高的精確度,在低噪聲(δ0=5)到高噪聲(δ0=70)條件下均具有較高的估計精度和較強(qiáng)的魯棒性,具有一定的工程實用價值。