楊永鵬,楊真真,李建林,樂(lè) 俊
1.南京信息職業(yè)技術(shù)學(xué)院 網(wǎng)絡(luò)與通信學(xué)院,南京 210023
2.南京郵電大學(xué) 通信與網(wǎng)絡(luò)技術(shù)國(guó)家工程研究中心,南京 210023
低秩稀疏分解(Low Rank and Sparse Decomposition,LRSD)[1-3]是一種將已知數(shù)據(jù)矩陣分解為低秩成分和稀疏成分的技術(shù),目前被廣泛應(yīng)用于視頻的前景和背景分離、圖像去噪等方向。該技術(shù)是在主成分分析(Principal Components Analysis,PCA)[4-5]的基礎(chǔ)上發(fā)展起來(lái)的。PCA 在數(shù)據(jù)降維等方面[6]有著顯著的優(yōu)勢(shì),但是由于PCA往往會(huì)丟失數(shù)據(jù)的某些特征,導(dǎo)致對(duì)損壞較嚴(yán)重的數(shù)據(jù)處理時(shí)存在較大的局限性。在過(guò)去相當(dāng)長(zhǎng)的一段時(shí)間內(nèi),人們?yōu)榱嗽鰪?qiáng)PCA的魯棒性,提出了很多改進(jìn)算法[7-8],但這些算法仍然存在著許多問(wèn)題,例如,在多項(xiàng)式時(shí)間內(nèi)不能有效求解和不能有效處理惡劣環(huán)境下的數(shù)據(jù)矩陣等問(wèn)題。近年來(lái),為了進(jìn)一步改進(jìn)PCA 算法的魯棒性,LRSD 算法被提出并引起了人們的廣泛關(guān)注,成為計(jì)算機(jī)視覺等領(lǐng)域研究的熱點(diǎn)。LRSD算法能夠在數(shù)據(jù)矩陣嚴(yán)重?fù)p壞的情況下,魯棒地恢復(fù)出低秩成分和稀疏成分,故又稱為魯棒主成分分析(Robust Principal Component Analysis,RPCA)[9-11]。傳統(tǒng)的LRSD模型如下所示:
其中,M∈?m×n為待處理的數(shù)據(jù)矩陣,L∈?m×n為低秩矩陣,S∈?m×n為稀疏矩陣,rank(L)表示低秩矩陣L的秩函數(shù)為稀疏矩陣S的l0范數(shù),表示矩陣S的稀疏度,λ為折中參數(shù)。該模型是非凸的,且是一個(gè)NP-難問(wèn)題,一般難以直接求解。在這種情況下,主成分追蹤(Principal Component Pursuit,PCP)[12-13]算法被提出,其采用凸松弛逼近的方式解決該問(wèn)題,即采用核范數(shù)逼近傳統(tǒng)LRSD模型中的秩函數(shù),采用l1范數(shù)逼近傳統(tǒng)LRSD模型中的l0范數(shù),成為解決傳統(tǒng)LRSD模型的有效算法,并成為人們推進(jìn)LRSD相關(guān)算法發(fā)展的基石。
隨著計(jì)算機(jī)視覺等領(lǐng)域的飛速發(fā)展,PCP算法在處理數(shù)據(jù)矩陣時(shí)的缺陷也日漸凸顯,主要體現(xiàn)在凸逼近程度不高、魯棒性弱、極少考慮數(shù)據(jù)矩陣的時(shí)空特性等方面[14]?;谶@些問(wèn)題,許多改進(jìn)的LRSD 算法被陸續(xù)提出,并取得了一定的進(jìn)展。按照逼近方法,可以將常見的LRSD改進(jìn)算法分為以下兩大類:
(1)采用凸函數(shù)逼近傳統(tǒng)LRSD的改進(jìn)算法,例如主成分追蹤(Principal Component Pursuit,PCP)算法、截?cái)嗪朔稊?shù)(Truncated Nuclear Norm,TNN)算法[15-20]、去分解(Go Decomposition,GoDec)算法[21]、低秩結(jié)構(gòu)化稀疏分解(Low-Rank and Structured Sparse Decomposition,LSD)算法[22-27]、運(yùn)動(dòng)信息輔助低秩稀疏分解(Motion-Assisted Matrix Restoration,MAMR)算法及魯棒運(yùn)動(dòng)信息輔助的低秩稀疏分解(Robust Motion-Assisted Matrix Restoration,RMAMR)[28-30]算法等;
(2)采用非凸函數(shù)逼近傳統(tǒng)LRSD 的改進(jìn)算法,例如非凸非光滑非利普希茨優(yōu)化(Nonconvex Nonsmooth and Non-Lipschitz Optimization,NNNOP)算法[31-32]、非凸非光滑加權(quán)核范數(shù)(Nonconvex Nonsmooth Weighted Nuclear Norm,NNWNN)算法[33]、非凸低秩稀疏分解(Nonconvex Low Rank and Sparse Decomposition,NonLRSD)算法[34]、廣義核范數(shù)和拉普拉斯尺度混合(Generalized Nuclear Norm and Laplacian Scale Mixture,GNNLSM)算法[35-38]、廣義非凸魯棒主成分分析(Generalized Nonconvex Robust Principal Component Analysis,GNRPCA)算法[39-43]等。
近年來(lái),常見的針對(duì)低秩稀疏分解模型求解的算法包括迭代閾值(Iterative Thresholding,IT)算法[44]、加速近端梯度算法(Accelerated Proximal Gradient Approach,APG)[45]、增廣拉格朗日乘子法(Augmented Lagrange Multipliers,ALM)[46]、交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)[47]等。其中,IT 算法是最早用于解決PCP問(wèn)題的算法,該算法的優(yōu)點(diǎn)是運(yùn)算簡(jiǎn)單且收斂,但是運(yùn)算時(shí)間長(zhǎng);APG算法的提出是為了改善IT 算法的缺陷,該算法的主要思路是將低秩稀疏分解的模型包含的約束條件松弛到目標(biāo)函數(shù)中,最終提高了低秩稀疏分解模型求解的速度;之后,ALM算法被提出來(lái)并取得了較好的效果,但該算法使得低秩稀疏分解的問(wèn)題失去可分解性,對(duì)大規(guī)模問(wèn)題不能較好地進(jìn)行求解;為了解決ALM 存在的缺陷,ADMM 算法被提出,并采用分而治之的思想將原始問(wèn)題分解成多個(gè)可求解的子問(wèn)題來(lái)進(jìn)行求解,并更新乘子。值得一提的是,本文所介紹的低秩稀疏分解模型的求解算法都是采用ADMM算法。
在深入和系統(tǒng)地研究了LRSD 技術(shù)的理論和國(guó)內(nèi)外現(xiàn)有算法的基礎(chǔ)上,本文分析了諸多采用凸函數(shù)和非凸函數(shù)逼近傳統(tǒng)LRSD 的改進(jìn)算法,以PCP、TNN、GoDec、LSD、MAMR、RMAMR、NNNOP、NNWNN、NonLRSD、GNNLSM 和 GNRPCA 算法為研究對(duì)象,給出了各個(gè)算法的模型及其優(yōu)缺點(diǎn),并將這些算法應(yīng)用于視頻前背景分離的實(shí)驗(yàn)中,最終通過(guò)實(shí)驗(yàn)提取的前景效果圖、F-measure 值和時(shí)間的比較,分別從視覺效果和定量評(píng)價(jià)兩個(gè)角度驗(yàn)證了各個(gè)算法的優(yōu)缺點(diǎn)。同時(shí),本文也將上述算法應(yīng)用于圖像去噪實(shí)驗(yàn)中,通過(guò)各種算法對(duì)不同圖像的去噪效果圖、圖像去噪的PSNR 值和FSIM 值,從視覺和量化兩個(gè)角度驗(yàn)證了各個(gè)算法在圖像去噪應(yīng)用中的優(yōu)缺點(diǎn)。
低秩稀疏分解算法根據(jù)其對(duì)傳統(tǒng)LRSD 模型中秩函數(shù)和稀疏度函數(shù)的替代函數(shù)的凹凸特性,將其分為凸低秩稀疏分解算法和非凸低秩稀疏分解算法。本章將從這兩方面對(duì)經(jīng)典的低秩稀疏分解算法展開介紹。
凸低秩稀疏分解算法是最早提出的用于解決傳統(tǒng)LRSD 模型的算法,此類算法憑借其簡(jiǎn)單易求解、時(shí)間成本低、效果較好等優(yōu)勢(shì)、成為L(zhǎng)RSD 類算法發(fā)展之初的主流算法,并在視頻前背景分離[48-50]、圖像去噪[51]等領(lǐng)域取得了較好的應(yīng)用效果。典型的凸低秩稀疏分解算法包括主成分追蹤(PCP)算法、截?cái)嗪朔稊?shù)(TNN)算法、去分解(GoDec)算法、低秩結(jié)構(gòu)化稀疏分解(LSD)算法、運(yùn)動(dòng)信息輔助的低秩稀疏分解(MAMR)算法和魯棒的運(yùn)動(dòng)信息輔助的低秩稀疏分解(RMAMR)算法。接下來(lái)將具體介紹這些算法的模型和優(yōu)缺點(diǎn)。
(1)主成分追蹤算法
主成分追蹤(PCP)算法是最早提出用于解決傳統(tǒng)LRSD問(wèn)題的凸松弛算法。該算法分別采用核范數(shù)和l1范數(shù)逼近傳統(tǒng)LRSD模型中的秩函數(shù)和稀疏度函數(shù),其模型如下所示:
(2)截?cái)嗪朔稊?shù)算法
截?cái)嗪朔稊?shù)(TNN)算法是針對(duì)PCP 算法模型中核范數(shù)對(duì)所有奇異值同時(shí)最小化,均等對(duì)待所有奇異值的問(wèn)題提出的一種新的算法。該算法是在矩陣的秩與前r個(gè)較大的奇異值相關(guān)性不大的理論基礎(chǔ)上提出的,它采用截?cái)嗪朔稊?shù)即min(m,n)-r個(gè)奇異值之和替代PCP算法模型中的核范數(shù)。TNN算法模型如下所示:
其中,σi(L)表示矩陣L的第i個(gè)奇異值。由于上式中的截?cái)嗪朔稊?shù)是非凸函數(shù),是一個(gè)NP-難問(wèn)題,為了求解該問(wèn)題,TNN 算法將式(3)轉(zhuǎn)換為如下所示問(wèn)題:
其中,A∈?m×r是矩陣L的前r個(gè)左奇異向量,B∈?n×r是矩陣L的前r個(gè)右奇異向量,tr(ATLB)是矩陣ATLB的跡。相對(duì)于PCP算法,TNN算法采用截?cái)嗪朔稊?shù)取得了比核范數(shù)更優(yōu)的逼近程度,低秩稀疏分解的效果更佳,但是在該算法中對(duì)r較難做出一個(gè)合適的選擇決策,最終導(dǎo)致算法不夠穩(wěn)定。
(3)去分解算法
去分解(GoDec)算法是用來(lái)解決當(dāng)數(shù)據(jù)矩陣在被環(huán)境噪聲污染的情況下的低秩稀疏分解問(wèn)題。同時(shí),該算法還采用雙邊隨機(jī)投影(Bilateral Random Projections,BRP)算法加速數(shù)據(jù)矩陣的分解。GoDec算法的模型如下所示:
其中,rank(L)為矩陣L的秩,card(S)為矩陣S的勢(shì)即稀疏度,G為噪聲項(xiàng),r和k分別為秩和稀疏度的最大值。因?yàn)樵撍惴ㄊ褂昧薆RP,所以極大地降低了低秩稀疏分解算法的復(fù)雜度,減少了整個(gè)算法的運(yùn)行時(shí)間;同時(shí),該算法模型引入了對(duì)噪聲項(xiàng)的處理,增加了算法的魯棒性。但是因?yàn)樗惴ㄖ袑?duì)于r和k值的選擇依賴性比較強(qiáng),所以算法對(duì)基于低秩稀疏分解的實(shí)際應(yīng)用場(chǎng)景難以獲得一個(gè)統(tǒng)一的較好的效果,算法不夠穩(wěn)定。
(4)低秩結(jié)構(gòu)化稀疏分解算法
低秩結(jié)構(gòu)化稀疏分解(LSD)算法認(rèn)為在許多實(shí)際的場(chǎng)景中,數(shù)據(jù)矩陣中的稀疏部分并不是像素級(jí)稀疏的,而是結(jié)構(gòu)化稀疏的,基于這個(gè)理論,該算法采用結(jié)構(gòu)化稀疏誘導(dǎo)范數(shù)(Structured Sparsity-Inducing Norm,SSIN)來(lái)描述數(shù)據(jù)矩陣的稀疏度。從而最終將數(shù)據(jù)矩陣?yán)斫鉃榈椭瘸煞趾徒Y(jié)構(gòu)化稀疏成分的疊加,并在PCP算法模型的基礎(chǔ)上提出了LSD算法模型,具體模型如下所示:
(5)魯棒運(yùn)動(dòng)信息輔助低秩稀疏分解算法
運(yùn)動(dòng)信息輔助(Motion-Assisted Matrix Restoration,MAMR)低秩稀疏分解算法主要是用于視頻前背景分離問(wèn)題。該算法認(rèn)為當(dāng)稀疏部分占整個(gè)數(shù)據(jù)矩陣的比例較小,且變化較快的時(shí)候,上述低秩稀疏分解算法具有較好的低秩稀疏分解效果,而在其他情況下,分離效果有限。為了提高在其他情況下的低秩稀疏分解效果,MAMR算法引入了根據(jù)運(yùn)動(dòng)信息構(gòu)造的加權(quán)矩陣W,該加權(quán)矩陣用于最大概率地指示視頻對(duì)應(yīng)的數(shù)據(jù)矩陣的每一個(gè)像素是屬于低秩的背景還是屬于稀疏的前景。在該理論的基礎(chǔ)上,MAMR 算法的模型變?yōu)槿缦滦问剑?/p>
其中,W為根據(jù)運(yùn)動(dòng)信息構(gòu)建的加權(quán)矩陣,°表示兩個(gè)矩陣對(duì)應(yīng)元素的乘積。在生成加權(quán)矩陣W的時(shí)候,該算法采用了與光流法不一樣的機(jī)制。光流法判斷某個(gè)像素屬于前景還是背景的依據(jù)是比較相鄰兩幀之間該元素是否移動(dòng)。MAMR算法分兩步進(jìn)行判斷:首先,選取參考幀,該參考幀不一定為相鄰的兩幀;其次,在判斷某個(gè)像素是前景和背景的時(shí)候,是基于離它最近的參考幀,通過(guò)判斷該像素是否移動(dòng),而最終生成運(yùn)動(dòng)信息,并映射為加權(quán)矩陣W。由于該算法在處理過(guò)程中引入了運(yùn)動(dòng)信息映射成的加權(quán)矩陣,提高了視頻前背景判斷的準(zhǔn)確度,在一定程度上提高了低秩稀疏分解的效果。但是由于在生成加權(quán)矩陣的過(guò)程中,引入了諸多參數(shù),這些參數(shù)在選擇過(guò)程中,較難達(dá)到統(tǒng)一,使得該算法的效果有限。
另外,在實(shí)際應(yīng)用場(chǎng)景中,無(wú)處不在的噪聲往往會(huì)影響低秩稀疏分解的效果,為了提高M(jìn)AMR 算法的魯棒性,文獻(xiàn)[28]將MAMR算法進(jìn)行擴(kuò)展,并提出了魯棒運(yùn)動(dòng)信息輔助(Robust Motion-Assisted Matrix Restoration,RMAMR)低秩稀疏分解算法。該算法將噪聲項(xiàng)引入到MAMR模型中,具體模型如下所示:
其中,γ >0 為參數(shù),G為噪聲項(xiàng)為 Frobenius 范數(shù)。RMAMR 算法雖然在一定程度上提高了算法的魯棒性,增強(qiáng)了模型的抗噪聲性,但是沒有從根本上解決參數(shù)的選擇問(wèn)題,導(dǎo)致在實(shí)際場(chǎng)景中低秩稀疏分解效果一般。
采用凸替代函數(shù)解決傳統(tǒng)LRSD 模型的方法憑借其求解簡(jiǎn)單等優(yōu)點(diǎn)成為L(zhǎng)RSD 發(fā)展之初人們研究的熱點(diǎn),但在研究過(guò)程中,人們逐漸發(fā)現(xiàn)這些凸替代的方法本質(zhì)上是一種松弛逼近方法,經(jīng)常會(huì)導(dǎo)致過(guò)懲罰問(wèn)題,使得對(duì)秩函數(shù)或/和稀疏度函數(shù)逼近效果有限。在這種情況下,人們逐漸把研究的重心逐漸轉(zhuǎn)向非凸逼近的技術(shù)。近幾年來(lái),許多典型的非凸低秩稀疏分解算法相繼提出并取得了較好的性能,例如非凸非光滑非利普希茨優(yōu)化(NNNOP)算法、非凸非光滑加權(quán)核范數(shù)(NNWNN)算法、非凸低秩稀疏分解(NonLRSD)算法、基于廣義核范數(shù)和拉普拉斯尺度混合(GNNLSM)的非凸低秩稀疏分解算法、廣義非凸魯棒主成分分析(GNRPCA)算法等。接下來(lái),將對(duì)這些非凸算法模型進(jìn)行具體的描述,并給出各種非凸算法的優(yōu)缺點(diǎn)。
(1)非凸非光滑非利普希茨優(yōu)化算法
非凸非光滑非利普希茨優(yōu)化(NNNOP)算法采用了非凸懲罰函數(shù)逼近傳統(tǒng)LRSD模型中的l0范數(shù),并提出采用通用雙步長(zhǎng)方法來(lái)求解該模型的方法,其模型如下所示:
其中,Ψ(·)和Φ(·)是正常的、閉的、非負(fù)函數(shù),Ψ(·)是凸函數(shù),用于替代傳統(tǒng)LRSD 的秩函數(shù),一般采用低秩矩陣L的核范數(shù),Φ(·)是非凸、非光滑和非利普希茨函數(shù),用于替代傳統(tǒng)LRSD 模型中的l0范數(shù),其表達(dá)為其中,φ(·)為非負(fù)連續(xù)函數(shù),通常可以取lp(0<p <1)罰函數(shù)、分?jǐn)?shù)罰函數(shù)、log 罰函數(shù)、硬閾值罰函數(shù)和Concave 罰函數(shù)等。 A、B 和C 均為線性映射。在視頻前背景分離的實(shí)際應(yīng)用中,該模型的A、B和C 均為單位映射,約束條件退化為M=L+S。
NNNOP 算法采用非凸非光滑和非利普希茨函數(shù)Φ(·)替代傳統(tǒng) LRSD 的l0范數(shù),逼近程度高,與基于凸函數(shù)逼近類算法相比,低秩稀疏分解效果好。但是,該方法只考慮了l0范數(shù)的替代問(wèn)題,對(duì)于秩函數(shù)的逼近仍然采用核范數(shù),該方法存在局限性,稀疏低秩分解效果存在可待提升的空間。
(2)非凸非光滑加權(quán)核范數(shù)算法
非凸非光滑加權(quán)核范數(shù)(NNWNN)算法認(rèn)為核范數(shù)是傳統(tǒng)LRSD模型的凸替代,會(huì)引起對(duì)所有奇異值同時(shí)最小的缺陷,在此基礎(chǔ)上,提出了采用非凸非光滑加權(quán)核范數(shù)逼近傳統(tǒng)LRSD的秩函數(shù),其模型如下所示:
由于0 ≤ω1≤ω2≤…≤ωmin(m,n)是非凸的,式(11)的最優(yōu)化問(wèn)題為非凸非光滑問(wèn)題,能較好地逼近傳統(tǒng)LRSD 模型中的秩函數(shù)。但是該算法采用加權(quán)核范數(shù)逼近秩函數(shù),不是秩函數(shù)的一個(gè)較緊的逼近。此外,該模型仍然采用l1范數(shù)替代傳統(tǒng)LRSD 模型中的稀疏部分,低秩稀疏分解效果仍然存在可以提升的余地。
(3)非凸低秩稀疏分解算法
非凸低秩稀疏分解(NonLRSD)算法為了進(jìn)一步提高對(duì)傳統(tǒng)LRSD算法模型中秩函數(shù)的替代程度,采用廣義非凸代理函數(shù)替代秩函數(shù),其模型如下所示:
其中,g(·):?+→?+是連續(xù)的、凹的、非遞減的函數(shù),可以取Logarithm、平滑切片絕對(duì)偏差(Smoothly Clipped Absolute Deviation,SCAD)等罰函數(shù)。給出了該算法的收斂性分析,最終通過(guò)人工數(shù)據(jù)、低秩圖像去噪聲和視頻前背景分離等實(shí)驗(yàn)驗(yàn)證了NonLRSD算法模型比其他凸的和非凸的算法模型更有效。雖然該算法模型用逼近效果更優(yōu)的連續(xù)的、凹的、非遞減的替代函數(shù)逼近了傳統(tǒng)LRSD模型的秩函數(shù),但是仍沒有考慮稀疏部分的最優(yōu)替代問(wèn)題。
(4)基于廣義核范數(shù)和拉普拉斯尺度混合的非凸低秩稀疏分解算法
基于廣義核范數(shù)和拉普拉斯尺度混合(GNNLSM)的非凸低秩稀疏分解算法針對(duì)傳統(tǒng)求解LRSD 模型的方法中存在的逼近度非最優(yōu)的問(wèn)題,分別采用廣義核范數(shù)(Generalized Nuclear Norm,GNN)和拉普拉斯尺度混合(Laplacian Scale Mixture,LSM)來(lái)替代傳統(tǒng)LRSD模型中的秩函數(shù)和稀疏函數(shù),提出了GNNLSM 算法模型,其格式如下所示:
其中,Λj是尺度為1的拉普拉斯分布,乘子變量Θj是一個(gè)正的隨機(jī)變量,ε是一個(gè)很小的正的常數(shù)。理論表明,LSM比l1范數(shù)能更有效地對(duì)稀疏度函數(shù)進(jìn)行逼近,同時(shí)廣義核范數(shù)能夠取得比核范數(shù)更好的逼近秩函數(shù)的效果,并且該模型無(wú)需手動(dòng)選擇折中參數(shù)λ。
(5)廣義非凸魯棒主成分分析算法
廣義非凸魯棒主成分分析(GNRPCA)算法主要是應(yīng)用于視頻前背景分離中,該算法針對(duì)當(dāng)前低秩稀疏分解算法對(duì)秩函數(shù)和稀疏度函數(shù)逼近程度低的問(wèn)題,分別采用了廣義核范數(shù)(GNN)和廣義范數(shù)(Generalized Norm,GN)逼近傳統(tǒng)LRSD模型中的低秩部分和稀疏部分,其模型如下所示:
其中,g(·):?+→?+是非凸的、閉的、正常的下半連續(xù)函數(shù),可以選Logarithm、lp-norm(0<p <1)、SCAD、最小-最大非凸(Minimax Concave Penalty,MCP)、Geman 和Laplace等罰函數(shù)。GNRPCA算法用于視頻前背景分離,在實(shí)現(xiàn)視頻背景建模的同時(shí)提取了視頻的前景信息。
隨著大數(shù)據(jù)時(shí)代的到來(lái),視頻已經(jīng)成為信息處理和傳輸?shù)闹饕畔⑤d體。視頻前背景分離為視頻處理的高層應(yīng)用提供了基礎(chǔ),具有較高的實(shí)用價(jià)值。低秩稀疏分解理論認(rèn)為,視頻的背景部分幀與幀之間的變化是較小的,滿足低秩特性,前景部分僅占整個(gè)視頻較小一部分,滿足稀疏特性,并且前景和背景的關(guān)系不大。因此視頻前背景分離問(wèn)題可以轉(zhuǎn)化為低秩稀疏分解問(wèn)題。
本文為了更具體地描述各低秩稀疏分解算法的優(yōu)劣,將各算法應(yīng)用到視頻前背景分離實(shí)驗(yàn)中,展示了各算法提取的前景圖和對(duì)應(yīng)視頻前背景分離的F-measure值,不僅從視覺上體現(xiàn)各算法的優(yōu)劣,更從量化的角度展示各算法的不同,同時(shí)提供了各算法進(jìn)行視頻前背景分離的運(yùn)行時(shí)間,驗(yàn)證了各算法的時(shí)間復(fù)雜度。
實(shí)驗(yàn)所使用的計(jì)算機(jī)硬件環(huán)境為i5-5287U CPU@2.9 GHz,實(shí)驗(yàn)仿真工具為MATLAB R2018a。實(shí)驗(yàn)中所使用的算法為本文介紹的PCP、TNN、GoDec、LSD、MAMR、RMAMR、NNNOP、NNWNN、NonLRSD、GNNLSM、GNRPCA 模型。實(shí)驗(yàn)用視頻為CDnet 數(shù)據(jù)集[52-53]和I2R數(shù)據(jù)集[54-55]中的公共視頻,包括Shoppingmall、Watersurface、Escalator、Fountain、Switchlight、Curtain、Highway。
首先,本文采用各算法對(duì)不同視頻進(jìn)行視頻前背景分離,隨機(jī)選取各視頻對(duì)應(yīng)提取前景的某一幀作為效果展示示例,從視覺角度比較各算法的效果,如圖1所示。
從圖1可以看出,非凸低秩稀疏分解算法提取的前景噪聲較少,例如,從Fountain 視頻提取的前景中可以看出,非凸低秩稀疏分解算法提取的前景比凸低秩稀疏分解算法的噪聲要少。非凸低秩稀疏分解算法提取的前景信息更加完整,例如,從Curtain視頻提取的前景中可以看出,非凸的低秩稀疏分解算法提取的前景中人的信息比凸低秩稀疏分解算法更加完整,尤其是GNRPCA算法提取的前景效果更優(yōu)。
其次,本文采用F-measure值對(duì)各算法處理不同視頻的效果進(jìn)行量化,從量化角度比較各算法的效果。其中F-measure 值為用來(lái)評(píng)價(jià)視頻前背景分離效果的標(biāo)準(zhǔn),其形式為:
圖1 各算法提取的視頻前景對(duì)比圖
從表1的量化數(shù)據(jù)可以看出,非凸低秩稀疏分解算法的效果要優(yōu)于凸低秩稀疏分解算法。例如,表1中最高的平均F-measure值為非凸的GNRPCA算法,比最低的凸LRSD的TNN算法提高10%左右。同時(shí),本文五種非凸LRSD 算法提取視頻前景的平均F-measure 值為0.592 48,五種凸LRSD 算法提取視頻前景的平均F-measure值為0.557 37,進(jìn)一步驗(yàn)證了非凸LRSD算法的優(yōu)勢(shì)。
另外,實(shí)驗(yàn)給出了各LRSD算法在視頻前背景分離中的運(yùn)行時(shí)間,如表2所示。
從表2可以看出,GoDec算法由于使用了BRP算法,加速了低秩稀疏分解算法,在時(shí)間上占有絕對(duì)的優(yōu)勢(shì);LSD算法由于引入了結(jié)構(gòu)化信息,并對(duì)結(jié)構(gòu)化信息進(jìn)行相應(yīng)的處理,其運(yùn)算時(shí)間非常長(zhǎng),是所有算法中執(zhí)行速度最慢的。
表1 各算法進(jìn)行視頻前背景分離的F-measure值
表2 各算法進(jìn)行視頻前背景分離對(duì)應(yīng)的每幀運(yùn)行時(shí)間 s
綜上所述,仿真實(shí)驗(yàn)結(jié)果表明非凸低秩稀疏分解算法比凸低秩稀疏分解算法具有更好的視頻前背景分離效果。
圖像在存儲(chǔ)和傳輸?shù)冗^(guò)程中難免會(huì)受到噪聲的污染,隨之產(chǎn)生的圖像去噪問(wèn)題[56-58]便成為人們研究的熱點(diǎn)。由于圖像本身具有非常強(qiáng)的自相關(guān)性,故可以采用非局部低秩正則化模型[37]將圖像進(jìn)行轉(zhuǎn)換,使其滿足低秩特性,而自然界中的很多噪聲例如脈沖噪聲等滿足稀疏特性,因此可以將低秩稀疏分解[59]方法用于圖像去噪。
在圖像去噪實(shí)驗(yàn)中,本文采用的LRSD算法分別為PCP、TNN、GoDec、LSD、MAMR、RMAMR、NNNOP、NNWNN、NonLRSD、GNNLSM、GNRPCA 算法。實(shí)驗(yàn)的對(duì)象為加入噪聲密度為10%脈沖噪聲的Baboon、Boat、Cameraman、Couple、Fruits、Lena 和 Peppers 圖像,尺寸大小均為256×256。
為了評(píng)價(jià)每種算法對(duì)不同加噪圖像的去噪效果,本文首先展示了各種算法對(duì)不同加噪圖像的去噪效果對(duì)比圖,從視覺角度來(lái)評(píng)價(jià)各種算法的優(yōu)缺點(diǎn),如圖2 所示。從圖2可以看出,基于非凸低秩稀疏分解算法效果優(yōu)于基于凸低秩稀疏分解算法,主要體現(xiàn)在兩方面:一方面是基于非凸低秩稀疏分解算法比基于凸低秩稀疏分解算法對(duì)圖像的去噪效果好,例如TNN、GoDec 算法的去噪效果較差,這兩種算法處理的去噪圖像仍然存在肉眼可見的大量噪聲;另一方面體現(xiàn)在基于非凸低秩稀疏分解算法對(duì)圖像去噪之后,仍能保持原圖像的清晰度,而基于凸低秩稀疏分解算法存在過(guò)度去噪現(xiàn)象,例如基于非凸的NNNOP、NNWNN、NonLRSD、GNNLSM和GNRPCA恢復(fù)出的圖像清晰度比其他基于凸低秩稀疏分解算法恢復(fù)出的圖像更好。
為了進(jìn)一步評(píng)價(jià)各算法在圖像去噪方面的優(yōu)缺點(diǎn),本文采用峰值信噪比(Peak Signal to Noise Ratio,PSNR)[60]和特征相似度(Feature Similarity,F(xiàn)SIM)[61]對(duì)各算法的去噪效果進(jìn)行量化,其中PSNR和FSIM值越大,表明算法的圖像去噪效果越好。表3 為各算法對(duì)不同圖像去噪的PSNR 值。從表3 可以看出,所有的基于非凸低秩分解算法都比基于凸低秩分解算法的PSNR值要高,其中基于非凸低秩稀疏分解算法的GNRPCA具有最高的PSNR 值。另外,基于非凸低秩分解算法的PSNR 平均值為28.0,而基于凸低秩稀疏分解算法的PSNR 平均值僅為23.5,前者比后者高4.5。表4為各算法圖像去噪的FSIM 值。從表4 同樣也可以看出,所有的基于非凸低秩分解算法都比基于凸低秩分解算法的FSIM 值要高,其中基于非凸低秩稀疏分解算法GNNLSM具有最高的FSIM值。另外,基于非凸低秩分解算法的總的FSIM平均值為0.90,而基于凸低秩稀疏分解算法的總的FSIM平均值為0.77,前者比后者高0.13。
綜上所述,通過(guò)對(duì)上述實(shí)驗(yàn)結(jié)果的分析,可以得到非凸低秩稀疏分解算法比凸低秩稀疏分解算法具有更好的圖像去噪效果。
本文將當(dāng)前低秩稀疏分解算法分為凸低秩稀疏分解算法和非凸低秩稀疏分解算法兩類,分別給出各具體算法的模型及其優(yōu)缺點(diǎn)。同時(shí),為了體現(xiàn)低秩稀疏分解算法的實(shí)用意義,首先,本文將各種低秩稀疏分解算法應(yīng)用到視頻前背景分離中,從視覺效果和定量評(píng)價(jià)兩個(gè)角度展示了各種算法的優(yōu)缺點(diǎn);另外,本文也將各個(gè)低秩稀疏分解算法應(yīng)用到圖像去噪實(shí)驗(yàn)中,并分別從圖像的去噪效果對(duì)比圖、PSNR 值和FSIM 值展示了各種低秩稀疏分解算法在圖像去噪中的優(yōu)缺點(diǎn)。在后續(xù)的工作中,將根據(jù)當(dāng)前低秩稀疏分解算法的現(xiàn)狀和發(fā)展趨勢(shì),設(shè)計(jì)逼近度更高的、魯棒性更強(qiáng)的和時(shí)間復(fù)雜度更低的低秩稀疏分解算法,以此來(lái)改善視頻前背景分離和圖像去噪等的效果,進(jìn)一步提高LRSD類算法的實(shí)用價(jià)值。
圖2 各算法對(duì)加噪圖像的去噪效果對(duì)比圖
表3 各算法圖像去噪的PSNR值 dB
表4 各算法圖像去噪的FSIM值