劉莉, 談文蓉, 傅春常
(西南民族大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院, 四川 成都 610041)
基于PCNN模型的區(qū)域生長圖像分割
劉莉, 談文蓉, 傅春常
(西南民族大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院, 四川 成都 610041)
提出了一種結(jié)合區(qū)域生長算法和脈沖耦合神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分割的方法. 該方法將待分割圖像的像素點映射為PCNN模型中的神經(jīng)元, 把改進(jìn)的脈沖耦合神經(jīng)網(wǎng)絡(luò)模型的點火頻率同區(qū)域生長的理論結(jié)合起來進(jìn)行圖像分割. 實驗表明該方法分割的圖像與傳統(tǒng)的分割法相比具有邊緣信息更加完整, 區(qū)域劃分更加準(zhǔn)確, 分割效果更能符合人眼視覺的識別特征.
數(shù)值圖像處理; 圖像分割; 區(qū)域生長; PCNN模型
圖像分割(Image Segmentation)是圖像處理領(lǐng)域研究與應(yīng)用的最重要的工作之一, 幾乎圖像處理的所有領(lǐng)域都受到圖像分割的影響, 受到人們的高度重視和深入研究. 圖像分割是目標(biāo)識別、圖像分析、計算機(jī)視覺研究中最基本、最重要的處理環(huán)節(jié),是基礎(chǔ)性的、關(guān)鍵性的技術(shù), 分割的精確與否決定著其后續(xù)計算分析過程的成敗[1].圖像分割的目標(biāo)是根據(jù)具體應(yīng)用的需要和具體圖像的內(nèi)容把圖像分成不同的、互不重疊的具有獨特性質(zhì)的區(qū)域,各個區(qū)域內(nèi)部的特征性質(zhì)是相同的或相近的, 而不同類區(qū)域之間, 是具有不同的圖像特征性質(zhì)的. 這些特征包括如像素的灰度值、物體的顏色、輪廓紋理, 變換的系數(shù)等, 也可以是空間頻譜, 直方圖特征等.
按照不同的分類標(biāo)準(zhǔn), 圖像分割方法可以劃分為不同的種類, 目前圖像分割技術(shù)包括基于特征領(lǐng)域內(nèi)的像素分割和基于空間領(lǐng)域的像素分割等, 后者主要包括邊緣分割和區(qū)域分割. 基于特征領(lǐng)域的分割方法, 如: 閾值法和聚類法, 主要是利用圖像灰度等特征的概率分布特性來進(jìn)行分割, 由于忽略了圖像特征間的空間聯(lián)系 , 單一地從統(tǒng)計意義上進(jìn)行像素的劃分, 常常得不到理想的分割效果[2]. 基于空間領(lǐng)域的邊緣檢測分割方法試圖通過檢測不同區(qū)域之間的邊界來實現(xiàn)對圖像的分割, 通常區(qū)域的邊緣是灰度強(qiáng)度有階躍變化的那些像素, 這是邊緣檢測法得以實現(xiàn)的主要假設(shè)之一. 邊緣提取一般采用經(jīng)典的邊緣檢測算子來檢測目標(biāo)的邊界以實現(xiàn)分割, 如Canny、Sobel、PrewittH和Laplacian算子等. 但這些算子對噪聲敏感, 抗噪能力較差, 一般只適合于噪聲較小且不太復(fù)雜的圖像.
一般情況下, 圖像中同一區(qū)域的像素具有某種相似性質(zhì), 比如相似的灰度、紋理、顏色等, 而不同區(qū)域的像素特征性質(zhì)具有明顯的差異. 區(qū)域分割的實質(zhì)就是將圖像分成許多較小的區(qū)域, 把具有某種相似特征的像素連通和集合起來構(gòu)成分割區(qū)域. 這類方法在考慮了像素自身的灰度因素的基礎(chǔ)上, 還考慮了像素與像素之間, 區(qū)域與區(qū)域之間特征的相似性、分布空間連續(xù)性和鄰接性, 有利于對連通區(qū)域的逐個選取, 與其他分割方法相比,可以有效地消除孤立噪聲的干擾, 總體性能更加優(yōu)秀, 因此能得到更符合人類視覺特性的分割效果.
本文利用脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN模型)捕獲特性, 即一個神經(jīng)元點火, 會捕獲其同一區(qū)域與其相似性質(zhì)的神經(jīng)元也同步發(fā)放脈沖的特性作為分類思想, 定義生長準(zhǔn)則和停止規(guī)則, 利用PCNN模型進(jìn)行區(qū)域生長可以使小區(qū)域就較好地連成了一片的特征,提出了一種基于與人類視覺機(jī)理相符合的區(qū)域生長圖像分割方法, 較好地實
現(xiàn)了感興趣區(qū)域的提取, 有效地改進(jìn)了傳統(tǒng)分割方法固有的缺點, 如: 過度分割或簡單分割, 對噪聲敏感區(qū)域內(nèi)有空洞等.
有兩種基本形式的區(qū)域法分割技術(shù): 區(qū)域生長法和分裂合并法. 前者是由單個像素出發(fā), 逐步合并以形成所需的分割結(jié)果; 后者是從整個圖像出發(fā), 逐步分裂切割到所需的分割結(jié)果.
區(qū)域生長算法基本思想是把具有相似特征的像素聚集在一起構(gòu)成分割區(qū)域, 把不同性質(zhì)的區(qū)域分開. 算法實現(xiàn)過程如下:
1)、對每個需要分割的區(qū)域找一個或多個“種子像素”作為生長的起點(根據(jù)經(jīng)驗, 它或者是最亮或最暗的點,或者是位于點簇中心的點. )
2)、確定區(qū)域生長或相似準(zhǔn)則,將種子像素周圍鄰域(4-鄰域/8-鄰域)中與其有相同或相似性質(zhì)的但還不屬于任何一個區(qū)域像素, 根據(jù)某種事先確定的準(zhǔn)則進(jìn)行判定, 是否合并到種子像素所在的區(qū)域內(nèi)
3)、將這些被合并的新像素作為新的種子繼續(xù)執(zhí)行1、2, 直到?jīng)]符合條件的像素并入?yún)^(qū)域為止.
其中在區(qū)域生長過程中將相鄰象素合并進(jìn)來的生長準(zhǔn)則的選取至關(guān)重要, 因為不同的準(zhǔn)則對區(qū)域生長的最終結(jié)果會產(chǎn)生較為關(guān)鍵的影響, 當(dāng)然種子點的選擇和生長停止規(guī)則也是極其重要的. 根據(jù)不同的生長準(zhǔn)則人們提出了不同的區(qū)域生長法, 最經(jīng)典的有: 簡單生長法、質(zhì)心生長法和混合生長法.
1990年Eckhorn和他的團(tuán)隊在對貓大腦視覺皮層視覺區(qū)神經(jīng)元內(nèi)部機(jī)理的研究中發(fā)現(xiàn)到貓眼神經(jīng)元同步脈沖發(fā)送現(xiàn)象, 并提出了脈沖耦合神經(jīng)網(wǎng)絡(luò)模型(Pulse Coupled Neural Network)[3],簡稱PCNN. Eckhorn等提出的PCNN基本神經(jīng)元模型如圖1所示.
由圖1可見, 脈沖耦合神經(jīng)元是一個非線性的積分系統(tǒng), 包括三個功能單元: 第一部分是突觸樹(接受部分),由外部輸入和其他神經(jīng)元的輸出形成,第二部分是內(nèi)部行為部分(調(diào)制部分),它調(diào)制輸入部分并構(gòu)成神經(jīng)元的內(nèi)部活動, 第三部分是脈沖發(fā)生部分, 包括閾值產(chǎn)生器和脈沖產(chǎn)生器.[4]
Johnson和Ranganath提出了改進(jìn)的PCNN模型[5], 其離散迭代方程描述為:
圖1 PCNN基本神經(jīng)元模型Fig.1 The neurons model of pulse coupled neural network
在神經(jīng)元Nij的模型中, 其中Fij是反饋輸入部分, Sij是外部輸入脈沖信號, β是鏈接常數(shù), Lij是耦合連接輸
入, θij是動態(tài)閾值, Uij是內(nèi)部活動項. 反饋輸入域F中放大系數(shù)和衰減時間常數(shù)分別為VF和αF, 耦合鏈接域的L的放大系數(shù)和衰減時間常數(shù)分別為VL和αL, 權(quán)值矩陣Mijkl和Wijkl分別為反饋輸入域和耦合連接域的連接矩陣反饋輸入部分F和耦合連接輸入部分L以Fij (1 +βLij)調(diào)制相乘的方式形成神經(jīng)元內(nèi)部活動Uij. 當(dāng)Uij大于動態(tài)閾值θij時, 神經(jīng)元點火產(chǎn)生脈沖輸入Yij, 否則處于抑制狀態(tài), 停止發(fā)放脈沖. 如果處于抑制狀態(tài), θij按指數(shù)規(guī)律隨時間下降, 直到點火為止; 反之點火后θij通過反饋迅速得到提高, 然后再按指數(shù)衰減, 使得神經(jīng)元不能立刻再次興奮而輸出脈沖, 這樣隨著迭代次數(shù)n的增加, 輸出了一個點火輸出序列, 記為Y(n)用PCNN進(jìn)行處理圖像時, PCNN是一個平面二維神經(jīng)元矩陣, 圖像像素與神經(jīng)元一一對應(yīng). 即一個二維M×N圖像對應(yīng)一個M×N的PCNN模型矩陣, 上面的PCNN神經(jīng)元模型參數(shù)較多, 參數(shù)選取困難, 在本文的方法中, 模型得到了簡化, 反饋輸入部分Fij只接收外部輸入信號Sij, 我們把每個像素的歸一化了的灰度值作為相應(yīng)神經(jīng)元的外部輸入Sij,簡化模型描述如下:
在這里只對模型的反饋輸入域做了簡化,其余部分未做改變,在原有模型的重要特性得到保持的前提下簡化了模型[6].
在β不等于0的耦合連接中, Uij的值除了由本身的像素灰度值Sij確定外, 同時也會得到周圍鄰近神經(jīng)元的鏈接域輸入Lij的貢獻(xiàn), 因此, 某個或某些像素神經(jīng)元點火時, 它們會對周圍鄰近神經(jīng)元的內(nèi)部活動產(chǎn)生貢獻(xiàn),使得鄰近空間中如果有灰度值相近的像素存在時, 這些像素將提前被點火, 這稱為被其他神經(jīng)元捕獲. 這就意味著具有空間鄰近、灰度值相似的神經(jīng)元會在同一時刻點火, 這樣相似灰度的多個神經(jīng)元就構(gòu)成了一個同步發(fā)放脈沖的神經(jīng)元集群, 這稱為PCNN模型的捕獲現(xiàn)象.
在研究中我們發(fā)現(xiàn)較亮象素的神經(jīng)元可以比暗象素的神經(jīng)元更快地點火, 經(jīng)過一定的次數(shù)的迭代后, 灰度值大亮的像素點火的次數(shù)就越多, 而灰度值低的暗的像素, 點火頻率相對也低, 而且相似灰度的神經(jīng)元的點火次數(shù)是相似的. 這正是圖像的區(qū)域劃分所需要的信息, 一般來說, 同一區(qū)域內(nèi)圖像的像素的具有灰度值相近的特征, 這樣導(dǎo)致由PCNN捕獲的神經(jīng)元集群對應(yīng)著圖像中性質(zhì)相似的閉合區(qū)域, 利用由PCNN的捕獲特性就可以把圖像分割成不同的封閉區(qū)域[7]. 這種方法能夠修正輸入圖像的空間不連貫性, 忽略圖像灰度幅度上的微小變化, 從而能夠更完整地保留圖像的區(qū)域信息, 這從理論上論證了該方法能夠很好地分割圖像的可行性
本文利用PCNN模型導(dǎo)出的點火頻率代替像素灰度值來進(jìn)行區(qū)域劃分. 每個點的點火頻率除了由本身的灰度值和鄰域內(nèi)相鄰點點火情況決定外, 也會影響其鄰域內(nèi)其他像素點的點火次數(shù), 導(dǎo)致同一區(qū)域內(nèi)具有相似特征的像素點具有相同或相近的點火次數(shù), 根據(jù)點火次數(shù)矩陣的值合并生產(chǎn)區(qū)域中的點, 捕獲大量的同一區(qū)域中具有相似特征的點, 這樣的效果將改善傳統(tǒng)分割法中少量噪聲點或孤立點導(dǎo)致的空洞和過度分割的缺點. 算法描述如下:
1)如果是彩色圖像, 先對彩色圖像做灰度化處理, 否則直接對圖像的灰度矩陣做歸一化處理
2)計算PCNN的點火頻矩陣:
初始化PCNN的參數(shù), 設(shè)定時間常數(shù)、閾值 θij、連接強(qiáng)度β和連接權(quán)系數(shù)矩陣W等各項參數(shù). 設(shè)定循環(huán)次數(shù)N, 同時令每個神經(jīng)元處于抑制狀態(tài), 點火頻率矩陣Y清0, 然后按前面定義的簡化模型, 對灰度圖像中每個神經(jīng)元的3階鄰域矩陣內(nèi), 計算反饋輸入部分Fij和耦合連接輸入部分Lij, 以Fij (1 +βLij)調(diào)制相乘的方式算出神經(jīng)元內(nèi)部活動Uij. 當(dāng)Uij大于動態(tài)閾值θij時, 神經(jīng)元Yij點火輸出為1, 否則為0, 再進(jìn)行閾值衰減計算, 把
圖像每個像素的點火的結(jié)果累加到矩陣Y, 重復(fù)迭代N次, 算出點火頻率矩陣Y[6].
3)對每個需要分割的圖像區(qū)域采用人機(jī)交互方式找一個或多個“種子像素”作為生長的起點.
4)使用前面點火頻率矩陣Y, 將種子像素周圍鄰域(4-鄰域/8-鄰域)中與其有相同點火次數(shù)或次數(shù)相差小于設(shè)定范圍, 但還不屬于任何一個區(qū)域像素, 合并到種子像素所長的區(qū)域內(nèi).
5)將這些被合并的新像素作為新的種子繼續(xù)執(zhí)行3、4, 直到?jīng)]符合條件的像素并入?yún)^(qū)域為止.
我們采用上面的算法對圖像進(jìn)行分割, 取連接權(quán)系數(shù)矩陣W為歐式距離平方的倒數(shù). 在實驗中發(fā)現(xiàn), 矩陣W的階數(shù)會對圖像分割的結(jié)果產(chǎn)生較大的影響, 矩陣階數(shù)較小時圖像被分割成的區(qū)域數(shù)很多, 本身邊緣信息會被破壞, 圖像被過度分割, 但可以得到圖像的細(xì)節(jié). 較大時又會只將圖像簡單分割(也叫欠分割), 把不同的區(qū)域合并在一塊, 圖像只被分成簡單的幾個區(qū)域. 其次鏈接權(quán)重β同樣也會對分割結(jié)果產(chǎn)生相似的影響, β的大小決定了PCNN的捕獲范圍, 在PCNN其他參數(shù)確定不變的情況下, β越大, 同步脈沖發(fā)送的區(qū)域就越大, 捕獲的神經(jīng)元灰度的范圍也就越大, 但區(qū)域分割的精度同樣受到影響. 因此可以根據(jù)分割效果的需求尋找一個合適尺寸的連接權(quán)系數(shù)矩陣和鏈接權(quán)重β.
到目前為止, 對圖像分割效果進(jìn)行評判的標(biāo)準(zhǔn)尚不統(tǒng)一[1],大部分通過目測分割結(jié)果的方法來給出評價. 一般而言,圖像的分割是為了后續(xù)的目標(biāo)識別、圖像分析、計算機(jī)視覺研究等做準(zhǔn)備, 如果分割結(jié)果能更符合人眼的特征,并讓后續(xù)處理更順利、正確地進(jìn)行下去, 就是更好的分割方法.
我們選擇MATLAB語言編程, 用Matlab 7.0做實驗軟件, 對多幅圖像進(jìn)行計算機(jī)仿真實驗, 下面是分別用傳統(tǒng)的區(qū)域生長法、基于PCNN模型的區(qū)域生長圖像分割以及直方圖閾值法分割LENA圖像和電子顯微鏡下放大的花粉圖像的結(jié)果:
圖2 LENA圖像的分割Fig.2 segmentation of LENA image
圖3 電子顯微鏡下放大700倍的花粉圖像的分割Fig.3 segmentation of Pollen image magnified 700 times by electron microscope
從圖中可以看出, 直方圖閾值法和區(qū)域生長法都有對于圖像有過度分割或破壞邊緣細(xì)節(jié)以及把不同的區(qū)域
誤分為同一區(qū)域的缺點, 而本文提出的算法能夠保留更多圖像細(xì)節(jié)特征.邊緣信息保持得最完整, 區(qū)域輪廓和分割更加準(zhǔn)確. 與傳統(tǒng)圖像分割算法相比, 該算法的分割結(jié)果更符合人眼的視覺特征, 克服了傳統(tǒng)算法過度分割或欠分割的缺點, 可以更加有效分割目標(biāo)圖像
圖像分割是個經(jīng)典難題, 尤其存在與人類視覺機(jī)理相脫節(jié)的問題[1]. 具有哺乳動物視覺背景的PCNN 為解決此問題提供了新的思路. 本文提出了一種結(jié)合PCNN模型和區(qū)域生長的圖像分割方法, 在原有的傳統(tǒng)的區(qū)域生長圖像分割方法基礎(chǔ)上, 利用脈沖耦合神經(jīng)網(wǎng)絡(luò)PCNN模型的一個神經(jīng)元點火, 會捕獲其同一區(qū)域與其相似性質(zhì)的神經(jīng)元也同步發(fā)放脈沖的特性作為分類思想, 使用PCNN模型導(dǎo)出的點火頻率代替像素灰度值來進(jìn)行區(qū)域劃分, 由理論分析和實驗結(jié)果均表明, 該方法能保留更多圖像細(xì)節(jié)特征, 邊緣信息保持得更加完整, 區(qū)域分割更加準(zhǔn)確, 分割效果更能符合人眼視覺的識別特征. 但是在計算量方面, 由于要事先計算出圖像的PCNN點火頻率矩陣,計算時間會比傳統(tǒng)區(qū)域生長法長, 這是下一步要重點解決的問題.
[1] 馬義德, 李廉. 脈沖耦合神經(jīng)網(wǎng)絡(luò)與數(shù)字圖像處理[M]. 北京: 科學(xué)出版社, 2003.
[2] 譚洪波, 侯志強(qiáng), 劉榮. 基于人類視覺模型的區(qū)域生長圖像分割[J]. 中國圖象圖形學(xué)報, 2010, 15( 9) : 1352-1356.
[3] ECKHORN R, REITBOECK H J, ARNDTETAL M.Feature linkingvia synchronization among distributed assemblies: simulation of results from cat cortex[J]. Neural Computation, 1990, 2(3): 293-307.
[4] 張北斗. PCNN在生物醫(yī)學(xué)圖像處理中的應(yīng)用研究[D]. 蘭州: 蘭州大學(xué), 2007.
[5] L JOHNSON, H RANGANATH, G KUNTIMAD, et al. Pulse-coupled neural networks, in: Neural Networks and Pattern Recognition[M]. SanDiego, CA: Academic Press, 1998: 1-56.
[6] 劉莉,談文蓉, 一種基于PCNN的有效去除高斯噪聲的方法[J]. 西南民族大學(xué)學(xué)報: 自然科學(xué)版, 2012, 38: 132-137.
[7] 毛瑞全, 宮霄霖, 劉開華. 基于PCNN區(qū)域分割的圖像鄰域去噪算法[J]. 光電工程, 2010, 37(2): 122-127.
Region growing image segmentation based on PCNN model
LIU Li, TAN Wen-rong, FU Chun-chang
(School of Computer Science & Technology, Southwest University for Nationalities, Chengdu610041, P.R.C.)
An image segmentation method is proposed which combines region growing algorithm with Pulse Coupled Neural Network (PCNN) model. In this method, the pixels of image are mapped onto the neurons in PCNN.The improved PCNN model’s ignition frequency matrix and the regional growing theory are combined together to form this method. Experimental results show that the segmentation images in this method can keep more complete edge information and more accurate regional divisions, and the results are more in line with the recognition feature of human vision compared with some traditional segmentation methods.
digital image processing; image segmentation; region growing; Pulse Coupled Neural Network
TP391.41
: A
: 1003-4271(2014)03-0434-05
10.3969/j.issn.1003-4271.2014.03.20
2014-03-31
劉莉(1965-), 女, 四川簡陽人, 副教授, 碩士, 研究方向: 數(shù)字圖像處理.基金項目:四川省應(yīng)用基礎(chǔ)研究計劃項目《基于PCNN的醫(yī)學(xué)圖像處理關(guān)鍵技術(shù)研究》(項目編號: 2013JY0188)
西南民族大學(xué)學(xué)報(自然科學(xué)版)2014年3期