潘改 高立群
(東北大學(xué)信息科學(xué)與工程學(xué)院,遼寧沈陽110819)
參數(shù)活動(dòng)輪廓模型又稱為Snake模型[1],是偏微分方程應(yīng)用在圖像分割中的一種經(jīng)典模型,主要用于邊緣提?。?-5]和目標(biāo)跟蹤[6-9],其基本思想是將分割問題轉(zhuǎn)化為求取能量泛函最小值問題,通過求取能量泛函的最小值來驅(qū)使輪廓曲線運(yùn)動(dòng)到目標(biāo)的邊界,并停止在目標(biāo)的邊界上.
經(jīng)典參數(shù)活動(dòng)輪廓模型具有如下特點(diǎn):①外力場(chǎng)作用范圍小,輪廓曲線難以進(jìn)入凹陷區(qū)域,曲線的初始位置必須接近目標(biāo)邊緣;②難以得到弱邊界的梯度信息,使梯度信息難以向四周擴(kuò)散,能量泛函的最小值難以驅(qū)使輪廓曲線停止在目標(biāo)的弱邊界上,因而容易造成誤分割;③噪聲擴(kuò)散的作用范圍小,具有較強(qiáng)的抗噪性.
為擴(kuò)大參數(shù)活動(dòng)輪廓模型外力場(chǎng)的作用范圍,學(xué)者們提出了許多改進(jìn)的方法.如Xu等[10]提出了梯度矢量流(GVF)模型,該模型從圖像邊界開始向光滑區(qū)域擴(kuò)散,逐漸形成一個(gè)全局的向量場(chǎng);Li等[11-12]將卷積向量場(chǎng)(VFC)作為參數(shù)活動(dòng)輪廓模型的外力場(chǎng),即向量場(chǎng)的核函數(shù)卷積梯度圖像;文獻(xiàn)[13-14]中將由向量場(chǎng)的核函數(shù)卷積Harris矩陣得到的梯度圖像作為活動(dòng)輪廓模型的外力場(chǎng)(HVFC).GVF、VFC和HVFC模型均擴(kuò)大了Snake模型外力場(chǎng)的捕獲范圍,能夠驅(qū)使輪廓曲線進(jìn)入凹陷區(qū)域.相對(duì)于GVF模型,VFC和HVFC模型的計(jì)算更簡(jiǎn)單,能夠克服噪聲對(duì)強(qiáng)邊界分割效果的影響;相對(duì)于VFC模型,HVFC模型既能很好地獲取弱邊界的梯度信息,使其向光滑區(qū)域擴(kuò)散,又能分割含有弱邊界的目標(biāo).GVF、VFC和HVFC模型均是改進(jìn)的參數(shù)活動(dòng)輪廓模型,但無法解決含有噪聲和弱邊界的分割問題,難以驅(qū)使輪廓曲線停止在目標(biāo)邊界上.
為擴(kuò)大Snake模型外力場(chǎng)的捕獲范圍,解決噪聲對(duì)弱邊界分割效果的影響,文中結(jié)合Snake模型的外力場(chǎng)可以限制噪聲擴(kuò)散和VFC模型的外力場(chǎng)可以擴(kuò)大邊界向光滑區(qū)域擴(kuò)散的特點(diǎn),提出了一種新的參數(shù)活動(dòng)輪廓模型,即融合Snake模型的外力場(chǎng)和卷積向量場(chǎng)作為文中模型的外力場(chǎng).該模型首先采用Harris矩陣計(jì)算梯度圖像,然后估計(jì)局部區(qū)域的噪聲概率,確定Snake模型的外力場(chǎng)和卷積向量場(chǎng)在文中外力場(chǎng)的作用權(quán)重,最后得到相應(yīng)的全局向量場(chǎng)驅(qū)使輪廓曲線進(jìn)行運(yùn)動(dòng).
Kass等[1]提出的參數(shù)活動(dòng)輪廓模型通過給定的一條輪廓曲線 C(p)=(x(p),y(p)),p∈[0,1],構(gòu)建關(guān)于輪廓曲線的能量泛函,將分割問題轉(zhuǎn)化為求取能量泛函最小值問題,其能量泛函為
式中,Eint(C(p))是依賴于輪廓曲線C(p)的內(nèi)部能量項(xiàng),Eext(C(p))是依賴于圖像特征的外部能量項(xiàng).
Eint(C(p))是關(guān)于輪廓曲線伸縮和彎曲的能量泛函,定義為
Eext(C(p))是關(guān)于梯度圖像的能量泛函,定義為式中,是固定系數(shù),是梯度算子,I是要分割的灰度圖像.
由變分原理知,要使Esnake最小,輪廓曲線C(p)應(yīng)滿足歐拉方程:
式中:fint=αC″(p)-βC?(p),是輪廓曲線C(p)的內(nèi)力;fext=- Eext,是輪廓曲線C(p)的外力.
最小化Eint(C(p))就是要求輪廓曲線盡可能短并且盡可能光滑,最小化Eext(C(p))就是要求輪廓曲線盡可能停止在達(dá)到極大值的位置,即圖像目標(biāo)的邊界上.參數(shù)活動(dòng)輪廓模型采用梯度圖像作為外力場(chǎng),捕獲范圍小,難以驅(qū)使輪廓曲線進(jìn)入凹陷區(qū)域,對(duì)輪廓曲線的初始位置比較敏感,即初始位置必須設(shè)置在目標(biāo)的邊緣處.由于外力場(chǎng)的捕獲范圍小,噪聲的捕獲范圍也小,因此參數(shù)活動(dòng)輪廓模型具有較強(qiáng)的抗噪性.
Li等[11-12]將VFC作為參數(shù)活動(dòng)輪廓模型的外力場(chǎng),通過梯度圖像卷積向量場(chǎng)核函數(shù)實(shí)現(xiàn),即式中:f(x,y)是梯度圖像;*代表卷積;k(x,y)是向量場(chǎng)核函數(shù),定義為
uk(x,y)和 vk(x,y)分別是向量場(chǎng)核函數(shù) k(x,y)的水平分量和垂直分量;n(x,y)是指向k(x,y)到點(diǎn)(0,0)的單位向量)是像素點(diǎn)(x,y)到點(diǎn)(0,0)的距離;m(x,y)是像素點(diǎn)(x,y)的向量模,m(x,y)=(r+ ε)-γ,γ 是給定的系數(shù),調(diào)節(jié)向量模m(x,y)的遞減程度.
由VFC模型的核函數(shù)卷積梯度圖像能夠得到全局向量場(chǎng),擴(kuò)大了Snake模型外力場(chǎng)的捕獲范圍,但同時(shí)也擴(kuò)大了噪聲的捕獲范圍.雖然強(qiáng)邊界的捕獲范圍大于噪聲,一定程度上降低了噪聲對(duì)分割的干擾,但當(dāng)待分割的圖像目標(biāo)同時(shí)含有噪聲和弱邊界時(shí),弱邊界的捕獲范圍小于噪聲,噪聲嚴(yán)重干擾圖像分割,難以得到理想的分割效果.相對(duì)于VFC模型,HVFC模型能更好地獲得弱邊界的梯度信息,但難以解決噪聲對(duì)弱邊界分割的影響.
經(jīng)典參數(shù)活動(dòng)輪廓模型采用梯度圖像作為外力場(chǎng),雖然捕獲范圍小,但能很好地限制噪聲的擴(kuò)散,一定程度上可以減少噪聲對(duì)圖像分割的影響,具有較強(qiáng)的抗噪性;采用卷積向量場(chǎng)作為活動(dòng)輪廓模型的外力場(chǎng),擴(kuò)大了外力場(chǎng)的捕獲范圍,但同時(shí)也擴(kuò)大了噪聲的捕獲范圍.為擴(kuò)大參數(shù)活動(dòng)輪廓模型外力場(chǎng)的捕獲范圍,同時(shí)盡量縮小噪聲的捕獲范圍,減少噪聲對(duì)圖像分割的影響,文中結(jié)合參數(shù)活動(dòng)輪廓模型和卷積向量場(chǎng)的優(yōu)點(diǎn),提出了一種新的參數(shù)活動(dòng)輪廓模型,融合Snake模型的外力場(chǎng)和卷積向量場(chǎng)作為文中模型的外力場(chǎng),即
式中,μ是局部區(qū)域的噪聲概率,用于調(diào)節(jié)fVFC和fext在文中外力場(chǎng)的作用.當(dāng)μ=1時(shí),fPVFC=fext,參數(shù)活動(dòng)輪廓模型的外力場(chǎng)是文中向量場(chǎng)的一個(gè)特例,難以得到理想的分割效果;當(dāng)μ=0時(shí),fPVFC=fVFC,卷積向量場(chǎng)是文中向量場(chǎng)的一個(gè)特例,難以得到理想的分割效果.
向量場(chǎng)fVFC和fext的形成都與圖像梯度有關(guān).為了更好地得到弱邊界的梯度信息,文中采用Harris矩陣[13-14]來求取梯度圖像.Harris矩陣為
記Harris矩陣M對(duì)應(yīng)的特征值分別為1和,則
任意像素點(diǎn)(x,y)的噪聲概率μ(x,y)應(yīng)該滿足以下條件:
(1)噪聲概率 μ(x,y)應(yīng)該與點(diǎn)(x,y)的局部區(qū)域(即均值和方差)有關(guān),均值表示局部區(qū)域期望的灰度值,方差表示局部區(qū)域灰度值與均值的偏離程度,偏離程度越小,噪聲概率μ(x,y)越小,偏離程度越大,噪聲概率μ(x,y)越大;
(2)當(dāng)局部區(qū)域的中心像素點(diǎn)(x,y)是噪聲時(shí),μ(x,y)的取值較大,否則,μ(x,y)的取值較?。?5].
采用高斯函數(shù)計(jì)算μ(x,y)能夠滿足噪聲概率的條件,因此,概率μ(x,y)的計(jì)算公式為
從式(10)可以看出:當(dāng) I(x,y)≈ (x,y)時(shí),接近于 0,這說明局部區(qū)域的中心像素點(diǎn)是噪聲的概率非常低;而當(dāng)I(x,y)> (x,y)或者 I(x,y)< (x,y)時(shí),接近于 1,這說明局部區(qū)域的中心像素點(diǎn)是噪聲的概率非常高.
文中外力場(chǎng)融合了參數(shù)活動(dòng)輪廓模型的外力場(chǎng)和卷積向量場(chǎng),因此如何確定參數(shù)活動(dòng)輪廓模型的外力場(chǎng)和卷積向量場(chǎng)在文中模型中的作用非常重要,應(yīng)使其既可以擴(kuò)大外力場(chǎng)的捕獲范圍,又可以縮小噪聲的作用范圍,減少噪聲對(duì)圖像分割的影響.根據(jù)局部區(qū)域的均值和方差計(jì)算噪聲的概率,能夠有效地調(diào)節(jié)參數(shù)活動(dòng)輪廓模型和卷積向量場(chǎng)在文中模型中的作用:當(dāng)平坦區(qū)域沒有噪聲時(shí),參數(shù)活動(dòng)輪廓模型的外力場(chǎng)忽略不計(jì),卷積向量場(chǎng)起主要作用,擴(kuò)大外力場(chǎng)的捕獲范圍;當(dāng)平坦區(qū)域存在噪聲時(shí),參數(shù)活動(dòng)輪廓模型外力場(chǎng)的作用增強(qiáng),卷積向量場(chǎng)的作用減弱,起到限制噪聲擴(kuò)散的效果.
為說明文中模型的有效性,分別對(duì)合成梯度圖像和醫(yī)學(xué)圖像(http:∥www.china-radiology.com/portal.php)進(jìn)行仿真對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)平臺(tái)是操作系統(tǒng)為Windows XP的個(gè)人計(jì)算機(jī)(Intel D820 CPU、2GB內(nèi)存),采用Matlab 7.04編寫程序.
在仿真試驗(yàn)中,對(duì)于給定相同位置的輪廓曲線,將文中模型的分割效果與GVF、VFC和HVFC模型的分割效果進(jìn)行了對(duì)比,其中參數(shù)設(shè)置如下:α=0.5,β =0.1,r=1.8,局部區(qū)域的大小是3 ×3.
為說明噪聲對(duì)弱邊界分割的影響,對(duì)于給定相同位置的初始輪廓曲線、密度為0.045的脈沖噪聲和不同目標(biāo)邊界的梯度(目標(biāo)邊界的梯度值是噪聲梯度值的0.5倍,目標(biāo)邊界的梯度值等于噪聲的梯度值),采用GVF、VFC、HVFC和文中模型對(duì)合成梯度圖像進(jìn)行分割,結(jié)果如圖1所示.圖1表明:GVF模型得到了錯(cuò)誤的分割結(jié)果,說明強(qiáng)邊界和弱邊界的捕獲范圍等于或者小于噪聲,難以克服噪聲的干擾;VFC和HVFC模型的分割效果較理想,說明強(qiáng)邊界的捕獲范圍大于噪聲的捕獲范圍,而弱邊界的捕獲范圍小于強(qiáng)邊界的捕獲范圍,噪聲的捕獲范圍相對(duì)增大,容易吸引輪廓曲線停留在噪聲上而得到錯(cuò)誤的分割結(jié)果;文中模型得到了準(zhǔn)確的分割結(jié)果,說明強(qiáng)邊界或弱邊界的捕獲范圍均大于噪聲的捕獲范圍.文中模型能夠準(zhǔn)確地分割含有凹形的圖像目標(biāo),說明其外力場(chǎng)能夠擴(kuò)散到凹形區(qū)域,從而解決圖像的凹陷問題.
圖1 幾種模型對(duì)合成梯度圖像的分割結(jié)果比較Fig.1 Comparison of segmentation results for synthetic edge images among several models
圖2 原始的醫(yī)學(xué)圖像Fig.2 Initial medical images
輪廓曲線1的初始位置設(shè)置在圖2(a)所示的腦膜瘤內(nèi)部(腦膜瘤是待分割的目標(biāo)),幾種模型的分割結(jié)果如圖3(a)所示.該圖像目標(biāo)灰度不均勻,存在噪聲和弱邊界,噪聲產(chǎn)生不需要的梯度信息,而弱邊界難以得到需要的梯度信息,從而影響圖像的分割.從圖3(a)可知:在GVF模型中,噪聲的擴(kuò)散能夠吸引輪廓曲線向噪聲方向運(yùn)動(dòng),而弱邊界的擴(kuò)散難以吸引輪廓曲線向弱邊界方向運(yùn)動(dòng)并停止在弱邊界上,故得到錯(cuò)誤的分割結(jié)果;雖然VFC和HVFC模型的目標(biāo)邊界在一定程度上能夠限制噪聲梯度的擴(kuò)散,但目標(biāo)邊界是弱邊界或噪聲距離目標(biāo)邊界較遠(yuǎn)時(shí),目標(biāo)邊界限制噪聲梯度擴(kuò)散的能力有限,因而得到錯(cuò)誤的分割結(jié)果;文中模型采用參數(shù)活動(dòng)輪廓模型的外力場(chǎng)來擴(kuò)散噪聲的梯度,因此能夠限制噪聲梯度的擴(kuò)散,得到準(zhǔn)確的分割效果.
圖3 幾種模型對(duì)醫(yī)學(xué)圖像的分割結(jié)果比較Fig.3 Comparison of segmentation results for medical images among several models
輪廓曲線2的初始位置設(shè)置在圖2(b)所示的腦膜瘤的外部(腦膜瘤是待分割的目標(biāo)),存在噪聲,目標(biāo)邊界距離脊髓液的邊界較近,而脊髓液是強(qiáng)邊界.從圖3(b)可知:在 GVF、VFC和 HVFC模型中,脊髓液邊界的擴(kuò)散范圍不同程度地大于目標(biāo)邊界的擴(kuò)散范圍,從而吸引輪廓曲線運(yùn)動(dòng)到脊髓液的邊界上;文中模型能夠吸引輪廓曲線向目標(biāo)邊界運(yùn)動(dòng),從而得到準(zhǔn)確的分割效果.
為說明噪聲對(duì)文中模型的影響,對(duì)于給定相同位置的初始輪廓曲線,分別添加密度為0.10、0.15、0.20和0.30的脈沖噪聲,然后采用文中模型進(jìn)行分割,結(jié)果如圖4所示.從圖中可以看出,文中模型具有一定的抗噪性,但隨著噪聲的增多,圖像的分割效果越來越差.
圖4 噪聲對(duì)文中模型分割結(jié)果的影響Fig.4 Effect of noise on segmentation results obtained by the proposed model
為進(jìn)一步比較GVF、VFC、HVFC和文中模型的優(yōu)劣,將這4種模型的分割結(jié)果與理想的分割結(jié)果進(jìn)行比較,計(jì)算其準(zhǔn)確率,結(jié)果如表1所示.準(zhǔn)確率越高,誤分割越少,分割效果越好.準(zhǔn)確率的定義為
式中,SP為分割出來的目標(biāo)輪廓圖像中像素點(diǎn)集合與理想輪廓圖像中像素點(diǎn)集合的交集,SN為分割出來的背景像素點(diǎn)集合與理想輪廓圖像中背景像素點(diǎn)集合的交集,STP為理想輪廓圖像中目標(biāo)像素點(diǎn)集合,STN為理想輪廓圖像中背景像素點(diǎn)集合,P(S)表示集合S中的元素個(gè)數(shù).
表1 幾種模型對(duì)圖2的分割準(zhǔn)確率比較Table1 Comparison of segmentation accuracies for Fig.2 among several models
從表1可知,文中模型的分割準(zhǔn)確率高于GVF、VFC、HVFC模型,因此其分割效果更優(yōu).
綜合上述分析可知,對(duì)于合成梯度圖像和醫(yī)學(xué)圖像,文中模型能夠準(zhǔn)確地分割出目標(biāo),即輪廓曲線停止在目標(biāo)邊界上,分割準(zhǔn)確率優(yōu)于GVF、VFC和HVFC模型.因此,文中模型既能擴(kuò)大外力場(chǎng)的捕獲范圍,驅(qū)使輪廓曲線進(jìn)入凹陷區(qū)域,又能分割出含有弱邊界的目標(biāo),同時(shí)消除噪聲對(duì)弱邊界分割的影響.
為擴(kuò)大Snake模型外力場(chǎng)的捕獲范圍,解決噪聲對(duì)弱邊界分割效果的影響,文中提出了一種新的參數(shù)活動(dòng)輪廓模型,融合了Snake模型的外力場(chǎng)和卷積向量場(chǎng)作為文中模型的外力場(chǎng),使其能夠擴(kuò)大外力場(chǎng)的捕獲范圍,縮小噪聲的捕獲范圍,進(jìn)而得到全局向量場(chǎng).文中模型能夠驅(qū)使輪廓曲線向凹陷區(qū)域運(yùn)動(dòng),對(duì)輪廓曲線的初始位置有很好的適應(yīng)性,同時(shí)克服了噪聲對(duì)弱邊界分割效果的影響.仿真實(shí)驗(yàn)結(jié)果表明,文中模型能夠解決傳統(tǒng)參數(shù)活動(dòng)輪廓模型無法解決的含有噪聲和弱邊界的分割等問題,獲得更準(zhǔn)確的分割結(jié)果.將文中模型的外力場(chǎng)應(yīng)用于圖像跟蹤,擴(kuò)大其應(yīng)用范圍,是下一步研究的重點(diǎn).
[1]Kass M,Witkin A,Terzopolos D.Snake:active contour models[J].International Journal of Computer Vision,1988,1(4):321-331.
[2]Vard AliReza,Monadjemi AmirHassan,Jamshidi Kamal,et al.Fast texture energy based image segmentation using directional Walsh-Hadamard transform and parametric active contour models[J].Expert Systems with Applications,2011,38(9):11722-11729.
[3]Das Sitansu Kumar,Mukherjee Dipti Prasad.Parametric active membrane for segmentation of multiple objects in an image[J].Pattern Recognition,2011,44(2):173-186.
[4]Zhang Fan,Li Rui,Liu Shuai.Contour extraction of gait recognition [J].Procedia Engineering,2010,7:275-279.
[5]Zhang Fan,Zhang Xinhong,Cao Kui,et al.Contour extraction of gait recognition based on improved GVF snake model[J].Computers and Electrical Engineering,2012,38(4):882-890.
[6]江焯林,黎紹發(fā),賈西平,等.基于非參數(shù)聚類和多尺度圖像的目標(biāo)跟蹤[J].華南理工大學(xué)學(xué)報(bào):自然科學(xué)版,2009,37(1):34-41.Jiang Zhuo-lin,Li Shao-fa,Jia Xi-ping,et al.Target tracking based on nonparametric clustering[J].Journal of South China University of Technology:Natural Science Edition,2009,37(1):34-41.
[7]Tsechpenakis G,Rapantzikos K,Tsapatsoulis N,et al.A snake model for object tracking in natural sequences[J].Signal Processing:Image Communication,2004,19(3):219-238.
[8]Sun Zheng.An intensive restraint topology adaptive snake model and its application in tracking dynamic image sequence[J].Information Sciences,2010,180(16):2940-2959.
[9]Gai Jiading,Stevenson Robert L.Robust contour tracking based on a coupling between geodesic active contours and conditional random fields[J].Journal of Visual Communication and Image Representation,2011,22(1):33-47.
[10]Xu Chenyang,Prince J L.Snakes,shapes,and gradient vector flow [J].IEEE Transactions on Image Processing,1998,7(3):359-369.
[11]Li Bing,Acton Scott T.Active contour external force using vector field convolution for image segmentation[J].IEEE Transactions on Image Processing,2007,16(8):2096-2106.
[12]Li Bing,Acton Scott T.Automatic active model initialization via poisson inverse gradient[J].IEEE Transactions on Image Processing,2008,17(8):1406-1420.
[13]Li Yibo,Li Junjun.Harris corner detection algorithm based on improved contourlet transform [J].Procedia Engineering,2011,15:2239-2243.
[14]Kovacs Andrea,Sziranyi Tamas.Harris function based active contour external force for image segmentation[J].Pattern Recognition Letters,2012,33(9):1180-1187.
[15]Ghita Ovidiu,Whelan Paul F.A new GVF-based image enhancement formulation for use in the presence of mixed noise[J].Pattern Recognition,2010,43(8):2646-2658.