李浩,畢翔,豆?jié)申?/p>
(中國傳媒大學 理學院,北京 100024)
基于Mumford-Shah模型的圖像處理
李浩,畢翔,豆?jié)申?/p>
(中國傳媒大學 理學院,北京 100024)
講述了偏微分方程的基礎數(shù)學理論,諸如:梯度、散度、變分定理、歐拉-拉格朗日方程等知識;然后重點介紹了Mumford-Shah模型及Ambrosio-Tortorelli的近似求解,最后進行了數(shù)值試驗并展開分析。
數(shù)字圖像;偏微分方程方法;變分定理;Mumford-Shah模型
我們處在圖像的世界里,圖像是客觀事物在人眼中的表現(xiàn),可以幫助人們理解外部事物的變化。由于圖像的重要性日益凸顯,數(shù)字圖像處理應運而生。數(shù)字圖像處理是指通過計算機對圖像的處理和加工,使人們得到重要的信息。在最初,圖像處理主要在天文、軍事、醫(yī)學等實際方面應用,這也是數(shù)字圖像處理發(fā)展的源頭。隨著社會的發(fā)展,尤其是人們邁入了信息社會,圖像的產(chǎn)生來源成爆炸式增長,數(shù)字圖像處理更得到了飛速的發(fā)展。隨處可見的智能手機、平板電腦、數(shù)碼相機等設備都應用了數(shù)字圖像處理技術。隨著圖像處理和其他科學研究的不斷發(fā)展并由此產(chǎn)生出更加吸引人的領域,如人工智能、機器視覺、機器學習等。
數(shù)字圖像處理主要包括圖像去噪、圖像增強、圖像壓縮、圖像恢復、圖像分割等,這些圖像處理技術又稱為低層的圖像處理技術。但正是這些低層的處理技術制約著計算機視覺等領域的發(fā)展,所以對于低層處理技術的研究得到國際上的廣泛關注。圖像處理發(fā)展至今已經(jīng)產(chǎn)生了很多的分支,主要為三種:隨機過程建模、小波理論、偏微分方程方法(簡稱PDE方法)[1]。近年來,PDE方法處理圖像問題得到了飛速的發(fā)展,諸如熟知的P-M模型、ROF模型、C-V模型以及本文討論的Mumford-Shah模型等。PDE作為一門基礎的數(shù)學學科,理論較為復雜,對于非數(shù)學背景的研究人員來說理解較為困難。但不可否認的是,PDE處理圖像問題的一個優(yōu)勢在于:有嚴謹?shù)臄?shù)學理論做基礎。我們可以把具體的圖像處理問題抽象為數(shù)學模型,用穩(wěn)定的、成熟的數(shù)值計算方法求解。在講述模型之前,先了解一些PDE處理圖像問題的數(shù)學理論基礎。
PDE圖像處理涉及到的知識有平面微分幾何、變分學、數(shù)學物理方程、計算方法等,由于變分學、偏微分方程數(shù)值解等知識都可以分別的當做獨立的數(shù)學知識,所以在這里都不會進行詳盡的討論,重點放在了之后的圖像處理模型上面,這里只是簡要闡述這些知識。
2.1 梯度與散度
原圖像F 梯度分量Fx 梯度分量Fy 梯度模|▽F|圖1 原圖像及其梯度分量和梯度模圖像
2.2 變分問題
對泛函求極值的問題稱為變分問題,得到的解即為變分問題的解,也稱為極值點,這里就與一般空間上的函數(shù)求極值問題所對應上了,所不同的就是求解方法問題,這也是變分學所研究的內(nèi)容,下面引入變分定理。
定理1變分定理
有泛函:
F(u)=∫Cφ(x,y,u(x,y),ux(x,y),uy(x,y))dC
(1)
它的極值必滿足以下的方程:
(2)
稱為泛函F(u)的歐拉-拉格朗日方程。
2.3 梯度下降法求解變分問題
直接求解歐拉-拉格朗日方程十分困難,我們求得的解很多時候也不是解析解,最常用的方法就是梯度下降迭代法。梯度下降法的基本原則簡要說是:某函數(shù)從初始位置u0出發(fā),沿著其負梯度方向進行搜索,最終達到函數(shù)的局部極小值點。上述變分定理中,(2)式可以看做是(1)式的求梯度,故由梯度下降法,求解歐拉-拉格朗日方程極值點的方法可以寫為:
(3)
3.1Mumford-Shah模型
在圖像分割的任務中,我們要求分割出圖像中的同性質(zhì)的區(qū)域,劃分出圖像的組成部分,提取信息。而圖像恢復中,我們要求得光滑圖像,更好的復原圖像的原本面貌。在1985,Mumford-Shah提出了以他們名字命名的模型Mumford-Shah模型[3],即M-S模型,此模型能同時完成圖像分割和圖像恢復的任務。
M-S模型是一種能量極小化泛函,函數(shù)u:→R,是有界開區(qū)域,不連續(xù)邊界集K?。
minF(u,K)=∫(u-g)2dx+p∫|▽u|2dx+τ∮Kds
(4)
F(u,K)中u表示要求得的圖像,K表示求得的邊界集,g是初始的圖像,一般為帶噪聲的圖像,p與τ為正整數(shù)參數(shù)。在M-S極小化泛函中,第一積分項為保真項,這使得求得的新圖像與初始圖像最接近;第二積分項使得解到的新圖像在不連續(xù)的集合外盡可能的光滑;第三積分項使得不連續(xù)的邊界集合的長度最小。在這三個積分項的約束下,就可以得到原圖像的光滑圖像和分割圖像。
3.2 Ambrosio-Tortorelli近似模型
在(4)式中的第三積分項是不連續(xù)的點集K的Hausdroff測度的幾何項,而K的離散化非常復雜,由于該項的存在,使得M-S模型求解非常麻煩[1]。一般的求解方法是在sobloev空間尋找正則泛函序列Fδ來逼近F(u,K),這里討論的就是Ambrosio-Tortorelli提出的橢圓逼近方法。所謂的橢圓逼近方法就是不去直接離散化M-S模型,而是通過求取它的橢圓逼近來近似求解M-S模型的解。Ambrosio-Tortorelli提出的方法為[4]:
minF(u,v)=∫(u-g)2dx+p∫|▽u|2dx+τ∫(ε|▽
(5)
下面開始對(5)式進行求解,我們需要用到歐拉-拉格朗日方程式(2),得:
即:
(8)
在上式中,為了使梯度下降格式更加穩(wěn)定我們分別加入了系數(shù)θu、θv?,F(xiàn)在需要用有限差分方法來離散求解(8)式,并應用的是高斯-賽德爾迭代[5]。我們規(guī)定區(qū)域是一個(0,m)×(0,n)的矩形區(qū)域,讓xi=ih,yj=jh是區(qū)域里步長為h的離散格式。
規(guī)定:
ui,j→u(xi,yj),vi,j→v(xi,yj),gi,j→g(xi,yj)
△u→(ui+1,j+ui-1,j+ui,j+1+ui,j-1)/(h2);
對于vi,j也是同樣的離散方法。
(8)式可變?yōu)椋?/p>
在開始迭代之前,ui,j是給定的初始圖像gi,j,vi,j中的值全部為1。
3.3 數(shù)值試驗
通過調(diào)節(jié)ρ,τ,ε這些系數(shù),可以達到對大多數(shù)圖像的分割和去噪,SNR曲線和分割效果如下所示,SNR曲線中第一步是初始圖像的信噪比,第二步是第一次迭代的信噪比,如此類推。
下面令ρ=0.008,τ=1,ε=0.015,分別對lena圖像和man圖像處理。
初始圖像 去噪圖像 嗓聲圖像 分割圖像圖2 lena圖像處理結(jié)果
圖3 去噪的lena圖像snr曲線
初始圖像 去噪圖像 嗓聲圖像 分割圖像圖4 man圖像處理結(jié)果
圖5 去噪的man圖像snr曲線
圖2和圖4表明:對不同的圖像進行試驗得到的結(jié)果,匯總了分割效果圖和去噪效果圖,圖3和圖4是關于這兩幅圖像的去噪的SNR曲線示意圖,橫軸表示了迭代次數(shù),縱軸表示了SNR大小。由以上4幅圖像可以看出,在上述的系數(shù)確定的情況下,迭代次數(shù)在6次之后,圖像的結(jié)構趨于平穩(wěn),得到了這兩個解:分割圖像和去噪圖像。同樣也試了一些其他的灰度圖像,如:pepper圖像和grid圖像,圖6、圖7為實驗結(jié)果。
初始圖像 去噪圖像 嗓聲圖像 分割圖像圖6 pepper圖像處理結(jié)果
初始圖像 去噪圖像 嗓聲圖像 分割圖像圖7 grid圖像處理結(jié)果
本文在對數(shù)學基礎理論討論的基礎上,對PDE圖像處理的模型Mumford-Shah泛函進行闡述,讓讀者有了大致的了解,并知道了在M-S模型中不連續(xù)邊界點集在離散化方面十分困難,所以接著討論了Ambrosio-Tortorelli提出用橢圓型方程近似代替M-S模型的方法,利用歐拉-朗格朗日方程和梯度下降流來實現(xiàn)方程的求解,并用有限差分法來離散,最后用Matlab進行了數(shù)值實驗。由以上實驗可見,本文討論的方法可以說是雙變量系統(tǒng),在變分引理的條件下進行求解,得到了兩個“最優(yōu)解”,即:去噪圖像和分割圖像,在這個情況下,調(diào)節(jié)各個系數(shù)的取值可以得到更優(yōu)的結(jié)果。由此可見,PDE圖像處理的方法是十分清晰的,理論的證明也是十分的嚴謹,在實現(xiàn)上也比較簡單,并且對許多的圖像都有很好的處理效果。
[1]朱才志.基于偏微分方程的數(shù)字圖象處理的研究[D].合肥:中國科學技術大學論文集,2007.
[2]Alfonso Vitti.The Mumford-Shah variational model for image segmentation:An overview of the theory,implementation and use[J].Journal of Photogrammetry and Remote Sensing(ISPRS),2012,69(3):50-64.
[3]Mumford D,Shah J.Optimal approximation by piecewise smooth functions and associated variational problem[J].Comm Pure Appl Math,1989,42(5):577-685.
[4]Ambrosio L,Tortorelli V.Approximation of functionals depending on jumps by elliptic functionals via C-convergence[J].Communications on Pure and Applied Mathematics,1990,43 (8):999-1036.
[5]Antonin Chambollet.Image segmentation by variational methods:mumford and shah functional and the discrete approximations[J].Society for Industrial and Applied Mathematics,1995,55(3):827-863.
(責任編輯:王謙)
The Image Processing Based on Mumford-Shah Model
LI Hao,BI Xiang,DOU Ze-yang
(School of Science,Communication University of China,Beijing 100024,China)
this paper introduces some mathematic theories,such as gradient,divergence,variational theorem,the Euler-Lagrange equation and so on.Then we discuss the Mumford-Shah model and its approximation,named Ambrosio-Tortorelli model.At last we implement the model and analysis the result.
digital image;partial differential equation;variational theorem;Mumford-Shah model
2015-04-12
李浩(1990-),男(漢族),山東濟寧人,中國傳媒大學碩士研究生.E-mail:imagelihao@163.com
O24
A
1673-4793(2015)06-0056-07