張璐璐,吳月勤,張 婷
(1.安徽糧食工程職業(yè)學(xué)院信息技術(shù)系,安徽合肥 230011;2.安徽大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽合肥 230039)
基于稀疏表示的圖像復(fù)原問題模型研究
張璐璐1,2,吳月勤1,張 婷1,2
(1.安徽糧食工程職業(yè)學(xué)院信息技術(shù)系,安徽合肥 230011;2.安徽大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽合肥 230039)
過完備稀疏表示模型是繼小波變換和多尺度幾何分析之后圖像表示理論最重要的理論成果,給圖像處理帶來新的研究思路。本文在該模型下研究典型圖像復(fù)原問題,以圖像修復(fù)為應(yīng)用實(shí)例,研究模型求解方法并進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果驗(yàn)證了稀疏表示處理圖像復(fù)原問題的有效性。
稀疏表示;圖像復(fù)原;字典學(xué)習(xí);過完備字典
傳統(tǒng)的圖像表示模型基于調(diào)和分析理論,采用正交線性變換,圖像表示為有限項(xiàng)的單一基函數(shù)的組合,如傅里葉變換、離散余弦變換以及小波變換等。傅里葉變換對(duì)一維平穩(wěn)信號(hào)非常有效,但對(duì)非平穩(wěn)奇異信號(hào)無法形成稀疏表示。小波變換在處理一維和二維的具有點(diǎn)狀奇異性的非平穩(wěn)信號(hào)時(shí),表現(xiàn)出良好的性能,但是處理線狀奇異性信號(hào)時(shí)效果并不是很好。多尺度幾何分析方法(如曲線波、輪廓波以及方向波等變換)較好地克服了小波變換的不足,具有更高的方向分辨率,同時(shí)具備各向異性特征,從而能夠更加有效地表示和處理圖像中的邊緣輪廓信息等,但是這些固定的基函數(shù)僅適用于具有特定幾何結(jié)構(gòu)的圖像表示,而自然界圖像通常是具有豐富的紋理和多樣性的形態(tài),多尺度幾何分析仍存在不足。
圖像過完備冗余稀疏表示模型,是近十年來繼多尺度幾何分析后信號(hào)表示領(lǐng)域最重要的研究成果,對(duì)信號(hào)及圖像處理產(chǎn)生了深刻影響。其基本思想是:信號(hào)在合適的過完備字典下總存在稀疏的表示,即大部分表示系數(shù)為零,只有很少的非零系數(shù);字典的原子通過變換增強(qiáng)了系統(tǒng)的冗余性,這樣可以為信號(hào)的自適應(yīng)稀疏擴(kuò)展提供了更多的選擇,提高信號(hào)逼近的靈活性,進(jìn)而提高對(duì)復(fù)雜圖像幾何結(jié)構(gòu)的表示能力;而非零系數(shù)刻畫了圖像信號(hào)的本質(zhì)屬性和內(nèi)在結(jié)構(gòu),具有顯式的物理意義,在許多的圖像處理任務(wù)中得到了很好的驗(yàn)證。本文在稀疏表示理論框架下,研究典型的圖像復(fù)原模型及求解問題,并通過實(shí)驗(yàn)驗(yàn)證其有效性。
1.1 稀疏表示
設(shè)D∈n×K(n (1) 此時(shí),也稱信號(hào)是T-稀疏的。其中,α∈K為表示系數(shù),其稀疏性由l0范數(shù)‖α‖0來描述,表示具有非常少(T?K)的非零元素。對(duì)于該式的求解,通常采用如下的拉格朗日乘子形式: (2) 其中,λ用以平衡表示系數(shù)的稀疏程度和分解誤差精度。 1.2 圖像復(fù)原問題描述 圖像復(fù)原的目標(biāo)是從退化的觀測(cè)圖像y中重構(gòu)出理想的高質(zhì)量圖像x,這在數(shù)學(xué)上是個(gè)典型的病態(tài)反問題,對(duì)于這類問題,其數(shù)學(xué)模型可以定義為: y=MHx+v. (3) 其中,M和H為圖像降質(zhì)算子;v為符合某種概率分布的噪聲,通常用加性高斯白噪聲來描述,M和H的不同形式描述了不同的圖像復(fù)原任務(wù)。由于圖像復(fù)原問題的病態(tài)性,僅用式(2)中l(wèi)2范數(shù)的保真度進(jìn)行求解會(huì)導(dǎo)致解的不唯一或不穩(wěn)定。對(duì)于這樣的問題求解,通常是利用圖像的先驗(yàn)知識(shí)構(gòu)造正則化項(xiàng),從而使病態(tài)問題變?yōu)榱紤B(tài)以獲得穩(wěn)定的唯一解,一種常見的正則化模型是總變分模型(Total Variation,TV): (4) y=MHDα+v. (5) 而a可以由觀測(cè)圖像進(jìn)行稀疏編碼求得,與TV模型相似,在稀疏表示下,根據(jù)式(2)有: (6) 在式(6)中,M和H取不同的值時(shí)圖像處理任務(wù)是不同的,相應(yīng)的問題求解也不一樣。將不同的M和H值與式(2)的求解結(jié)合起來,就可以構(gòu)造出稀疏表示下典型的圖像復(fù)原和重建問題模型。 2.1 圖像壓縮 對(duì)于未壓縮的含噪圖像y∈n,假設(shè)圖像噪聲v的能量有限,滿足‖v‖2≤δ,在分解殘差參數(shù)ε(ε≤δ)的約束下,通過求解: (7) 得到的壓縮表示系數(shù)αδ含有T(T?n)個(gè)非零元素,那么圖像就可以y=Daδ進(jìn)行壓縮逼近表示,而逼近誤差上限是δ。在此情況下,通過調(diào)節(jié)δ可以得到更高的壓縮率,同時(shí)誤差也會(huì)增加,這樣,就可以得到反映某種壓縮系統(tǒng)性能的壓縮-失真曲線圖。 2.2 壓縮感知 信號(hào)壓縮感知理論認(rèn)為,圖像在滿足圖像x在字典D下的表示系數(shù)是稀疏的,且在表示系統(tǒng)D中獲得T-稀疏系數(shù)的情況下,如果由觀測(cè)系統(tǒng)Φ所確定的壓縮感知算子A=ΦD滿足任意2T列都是線性無關(guān)的,那么僅需要T+1觀測(cè)就可以將n維的T-稀疏圖像精確地重構(gòu)。假設(shè)觀測(cè)系統(tǒng)Φ∈T×n是具有高斯獨(dú)立同分布的隨機(jī)矩陣,直接進(jìn)行圖像測(cè)量得到y(tǒng)=Φx=ΦDa,顯然,y是T維而不是n維(T?n)。那么通過求解: (8) 即得到稀疏表示系數(shù)αε,理想圖像則由x=Daε重構(gòu)。因此,圖像的表示系數(shù)越稀疏,精確重構(gòu)所需的觀測(cè)數(shù)目就越少。 2.3 形態(tài)成分分析 假設(shè)由兩種不同的子成分圖像重疊在一起構(gòu)成了觀測(cè)圖像,即y=y1+y2,且每個(gè)子圖像可以在各自的基字典下稀疏表示,例如,將圖像的卡通成分和紋理成分分開或者將語音信號(hào)從脈沖噪聲中分離。在稀疏表示下,通過求解: (9) 可以得到(α1,α2),由此重建y1=D1a1,y2=D2a2,于是,兩種重疊在一起的子圖像得到了分離。由于圖像是結(jié)構(gòu)復(fù)雜的多形態(tài)二維信號(hào),模型在圖像處理中又稱為形態(tài)成分分析,如文獻(xiàn)[4]將該模型用于超分辨率重建,取得了較好的效果。 2.4 去噪、去模糊及修復(fù)等逆問題 考慮更一般的形式y(tǒng)=Mx+v,也就是觀測(cè)圖像是由理想圖像x在降質(zhì)系統(tǒng)M和噪聲v的共同影響下獲得的。當(dāng)M分別定義為單位矩陣、模糊矩陣(點(diǎn)擴(kuò)散函數(shù))和掩碼矩陣時(shí),此時(shí)的IR問題就分別對(duì)應(yīng)著圖像去噪、圖像去模糊和圖像修復(fù)等具體問題。通過求解: (10) 根據(jù)得到的圖像稀疏表示系數(shù)αε來逼近理想圖像x=Daε。 2.5 圖像超分辨率重建 在下采樣矩陣M的作用下,低分辨率的觀測(cè)圖像y∈n的維度小于高分辨率的理想圖像x∈m的維度,即n y=MHx=Lx. (11) 其中,H為高通線性濾波器,表示某種模糊退化。顯然,與上述圖像處理任務(wù)不同的是,超分辨率重建所需的圖像編碼和重建的字典需要在不同的維度空間進(jìn)行。記高分辨率字典為Dh,可以由高質(zhì)量的樣本圖像學(xué)習(xí)獲得,那么理想圖像可以由其稀疏表示系數(shù)來線性表示,即x=Dha,超分辨率重建問題就變成了從低分辨率觀測(cè)圖像中求解其稀疏表示系數(shù)α: y=Lx=LDhα. (12) 而低分辨率字典Dl=LDh可以由高分辨率字典進(jìn)行樣本下采樣獲得。此時(shí),通過求解: (13) 則理想的高分辨率圖像可由x=Dha重建獲得。 需要說明的是,在以上的基于稀疏表示的圖像復(fù)原模型中,基于編碼效率考慮,通常不是對(duì)整幅圖像進(jìn)行處理,而是將圖像分割成部分重疊的小的圖像塊進(jìn)行稀疏編碼。 本節(jié)以2.4節(jié)的圖像修復(fù)模型為例,通過模型求解、算法設(shè)計(jì)以及仿真實(shí)驗(yàn),驗(yàn)證稀疏表示模型在圖像復(fù)原問題中的有效性。 3.1 圖像修復(fù)方法 對(duì)于式(10),當(dāng)M定義為掩碼矩陣,它就是已知的待修復(fù)區(qū)域的污損部分,在最大后驗(yàn)概率估計(jì)下,圖像修復(fù)問題可以描述為: (14) 其中,右側(cè)第一項(xiàng)為觀測(cè)圖像y與修復(fù)圖像x的逼近誤差;第二項(xiàng)和第三項(xiàng)為修復(fù)圖像的每個(gè)圖像塊pi=Rix的稀疏表示αi在一定的誤差邊界內(nèi)。 在字典D通過學(xué)習(xí)已經(jīng)獲得的情況下,對(duì)于上式雙參數(shù)優(yōu)化問題的求解,通常采用固定一個(gè)而更新另一個(gè)的策略反復(fù)迭代完成。 第一步,固定x,對(duì)圖像塊進(jìn)行稀疏分解: (15) 該式避免了式(14)中的參數(shù)μi的選擇,并且圖像塊表示殘差Dα-pi只和本圖像塊的像素值有關(guān),σ2是噪聲方差,而ni是將圖像塊的掩碼部分考慮進(jìn)去,ni=1TMi1。 第二步,當(dāng)?shù)玫剿械摩羒后,固定αi,對(duì)待修復(fù)圖像x進(jìn)行更新: (16) 在上述的稀疏編碼和圖像更新中,均假設(shè)字典D是已知的,在實(shí)現(xiàn)過程中,字典需要預(yù)先準(zhǔn)備。事實(shí)上,字典的學(xué)習(xí)是稀疏表示的核心問題之一,可以采用傳統(tǒng)的變換,如通過離散余弦變換得到,也可以采用機(jī)器學(xué)習(xí)的方法(如K-SVD字典學(xué)習(xí))從圖像中學(xué)習(xí)獲得。 3.2 實(shí)驗(yàn)結(jié)果與分析 為了驗(yàn)證本文方法的有效性,利用標(biāo)準(zhǔn)測(cè)試圖像進(jìn)行仿真實(shí)驗(yàn)。實(shí)驗(yàn)過程中,圖像塊大小取8×8(圖像塊要大于污損區(qū)域面積),字典分別采用離散余弦變換(以下簡稱DCT)和K-SVD字典學(xué)習(xí)方法,并與TV模型方法進(jìn)行對(duì)比分析。對(duì)于實(shí)驗(yàn)結(jié)果,主觀上從視覺效果及細(xì)節(jié)信息、客觀上從峰值信噪比PSNR和均方根誤差RMSE等指標(biāo)進(jìn)行圖像修復(fù)質(zhì)量評(píng)價(jià)。實(shí)驗(yàn)結(jié)果如圖1所示,限于篇幅并便于細(xì)節(jié)信息對(duì)比,本文只給出Lena圖像的局部修復(fù)結(jié)果。 圖1 Lena圖像修復(fù)結(jié)果(局部) 圖1(a)為待修復(fù)的污損圖像,其中的涂鴉文字為待修復(fù)區(qū)域(占總圖像區(qū)域的13.76%)。實(shí)驗(yàn)過程中,污損圖像由涂鴉文字圖像與原始圖像點(diǎn)乘獲得。圖1(b)是利用DCT字典修復(fù)結(jié)果,圖1(c)是利用K-SVD字典修復(fù)結(jié)果。從圖1中可以看出,在稀疏表示下,無論用DCT字典還是用K-SVD字典,都能夠取得較好地修復(fù)效果。在大部分的待修復(fù)區(qū)域,圖像的紋理結(jié)構(gòu)信息都能夠較好地得到修復(fù),除了部分待修復(fù)紋理與圖像紋理方向一致的區(qū)域外,圖像細(xì)節(jié)信息較為完整、逼真。為進(jìn)一步評(píng)價(jià)圖像修復(fù)質(zhì)量,計(jì)算其峰值信噪比RSNR和均方根誤差RMSE等指標(biāo),進(jìn)行客觀評(píng)價(jià),結(jié)果如表1所示。 表1 不同圖像的RSNR(dB)和RMSE值(13.76%丟失) 由表1中數(shù)據(jù)可知,本文提出的方法能夠較好地保持圖像的峰值信噪比,修復(fù)的均方根誤差較小,這與圖1中的主觀視覺效果相符合,從客觀上驗(yàn)證了稀疏表示模型在圖像復(fù)原問題中的有效性。 綜上所述,本文在過完備冗余字典稀疏表示模型下,較為完整地研究了典型圖像復(fù)原問題模型,并以圖像修復(fù)為例,給出了實(shí)現(xiàn)方法。通過實(shí)驗(yàn),驗(yàn)證了稀疏表示在圖像復(fù)原問題中的有效性。雖然稀疏表示已經(jīng)在圖像處理中展現(xiàn)出良好的效果,隨著稀疏表示理論的研究深入,該方法還有很大的提升空間,尤其是稀疏編碼精度、字典表達(dá)能力等對(duì)圖像復(fù)原效果有重大影響。另外,處理速度也是其面向?qū)嶋H應(yīng)用必需解決的問題。 [1]A.M.Bruckstein,D.L.Donoho,M.Elad.From Sparse solutions of systems of equations to sparse modeling of signals and images[J].SIAM Review,2009(1):34-81. [2]M.Elad.Sparse & redundant representation modeling of images:theory and applications[C].The 7th International Conference on Curves and Surfaces,Avignon:France,2010(6):24-30. [3]李民.基于稀疏表示的超分辨率重建和圖像修復(fù)研究[D].西安:電子科技大學(xué),2011:23-36. [4]孫玉寶,韋志輝,肖亮,等.多形態(tài)稀疏性正則化的圖像超分辨率算法[J].電子學(xué)報(bào),2010(12):2898-2903. [5]薛模根.聚類字典下集中式稀疏表示的幻覺臉重建方法[J].系統(tǒng)工程與電子技術(shù),2014(1):187-193. [6]T.Chan,J.H.Shen.Mathematical models for local non-texture inpaintings[J].SIAM Journal on Applied Mathematics,2002(3):1019-1043. Research of Sparse Representation-based Image Restoration Problem Model ZHANG Lu-lu1,2,WU Yue-qin1,ZHANG Ting1,2 (1.Anhui Vocational College of Grain Engineering, Hefei Anhui 230011,China; 2.Anhui University,Hefei Anhui 230039,China) A sparse representation model is complete after wavelet transformation and multistage geometric analysis, image representation theory is the most important theoretical results, bring new research idea to image processing. Under the model of typical image restoration problem, based on image restoration application examples, the model solving method and the simulation experiment,the experimental results verify the effectiveness of the sparse representation processing image restoration problem. sparse representation; image restoration; dictionary to learn; complete dictionary 2016-09-28 安徽省教育廳2014年度高等學(xué)校省級(jí)質(zhì)量工程項(xiàng)目“計(jì)算機(jī)網(wǎng)絡(luò)安全與管理專業(yè)綜合改革”(2014zy134)。 張璐璐(1983- ),女,講師,碩士,從事計(jì)算機(jī)教育與數(shù)據(jù)挖掘研究。 TP391;TN911.73 A 2095-7602(2017)02-0017-052 圖像復(fù)原模型
3 圖像修復(fù)方法與實(shí)驗(yàn)
4 結(jié)語