楊 旭,何鴻宇,李金鎖,廖 源,周同馳
(1.河南省工業(yè)物聯(lián)網(wǎng)應用工程技術(shù)研究中心,河南 南陽 473005;2.河南工業(yè)職業(yè)技術(shù)學院,河南 南陽 473005;3.中原工學院,河南 鄭州 451191)
脈沖耦合神經(jīng)網(wǎng)絡(pulse coupled neural networks,PCNN)主要通過非線性方式將反饋通道、鏈接進行耦合作為狀態(tài)信息,之后與學習的閾值比較,最終實現(xiàn)神經(jīng)元的激活和抑制。目前,基于該模型的應用主要有圖像分割、去噪、增強、融合以及小目標檢測等[1-7]。從理論上講,PCNN模型抑制噪聲的能力優(yōu)于其他分割方法,如k-means、FCM、GMM以及Otsu等。但PCNN模型參數(shù)眾多,除學習動態(tài)閾值外,其他參數(shù)通常依據(jù)經(jīng)驗或?qū)嶒炘O置,同時,對于不同類型的圖像,參數(shù)的普適性較差。
2002年,馬義德等[7]首次將香農(nóng)熵理論應用到PCNN模型中。在分析與研究無耦合和耦合連接2種狀態(tài)數(shù)學模型的基礎(chǔ)上,鄧翔宇等[8]提出基于PCNN模型圖像分割參數(shù)自適應設定方法。趙彥明[9]對參數(shù)自適應設置及模型改進,在圖像檢索領(lǐng)域取得了良好效果。李瀚等[10]解決PCNN模型中多個參數(shù)需憑經(jīng)驗設定的問題,改進參數(shù)尋優(yōu)網(wǎng)格搜索算法。徐亮等[11]采用熵和能量作為適應度函數(shù),通過PSO優(yōu)化PCNN模型參數(shù)。錢煒等[12]將PCNN中3個參數(shù)當作粒子,采用圖像熵作為PSO優(yōu)化算法的適應度函數(shù)。廖傳柱等[13]利用人工蜂群算法優(yōu)化PCNN模型的3個參數(shù),即輸出、連接系數(shù)和閾值參數(shù),該方法是一種改進的自適應PCNN模型,采用可視圖像和醫(yī)學圖像驗證其優(yōu)越性。同樣,為解決多參數(shù)設定以及評價準則單一的問題,張坤華等[14]采用單調(diào)遞增閾值搜索策略,采用自動尋優(yōu)方式學習PCNN模型的時間衰減因子、連接系數(shù)以及迭代次數(shù),最終實現(xiàn)圖像的自適應分割。
在以上方法的基礎(chǔ)上,針對脈沖耦合神經(jīng)網(wǎng)絡模型參數(shù)眾多的問題,本文采用粒子群算法(particle swarm optimization ,PSO)優(yōu)化學習PCNN模型的參數(shù),通過仿真實驗,比較分析了PSO優(yōu)化二參數(shù)(耦合系數(shù)、閾值)、三參數(shù)PCNN模型(耦合系數(shù)、時間衰減因子以及脈沖輸出乘積系數(shù))在圖像分割中的性能。
粒子群算法(PSO)、遺傳算法 (genetic algorithm,GA)、蟻群、模擬退火和蛙跳算法(SFLA)等是一族經(jīng)典的群體智能優(yōu)化算法[12,15-16],其中,PSO是一個發(fā)展較早、理論成熟的群體智能優(yōu)化算法。該優(yōu)化算法采用虛擬粒子方式,根據(jù)粒子位置、速度信息,通過適應度函數(shù)逐步逼近目標。因此,該算法有5個重要參數(shù),分別為自適應函數(shù)、粒子坐標、速度、種群大小、迭代次數(shù)或終止條件。適應度函數(shù)是結(jié)合應用和場景而制定的學習結(jié)果評價準則,用來評價當前粒子狀態(tài)的優(yōu)劣。依據(jù)評價,篩選優(yōu)異的個體粒子和種群粒子,分別記作Pbest和Gbest,根據(jù)篩選的結(jié)果,重新制定粒子飛行的規(guī)則。當?shù)K止時,Gbest作為最佳解,用以表示獲得最佳結(jié)果時的模型參數(shù)。粒子位置和速度維度是由優(yōu)化學習模型參數(shù)的個數(shù)決定,粒子位置即為在解空間的求解,粒子的初始位置通常采用隨機化初始或其他算法的結(jié)果作為粒子的初始位置。粒子速度由解空間的大小等決定。種群大小和迭代次數(shù)依據(jù)求解問題的復雜度,根據(jù)經(jīng)驗設置。迭代終止條件由設定次數(shù)或相鄰迭代適應度值的差值決定。
對于PSO求解一個非凸優(yōu)化問題,通常情況下,假設參數(shù)z和v表示PSO優(yōu)化模型的2個重要參數(shù),其中,zi=(zi1,zi2,…,zid)表示某時刻粒子的位置,vi=(vi1,vi2,…,vid)表示某一時刻或迭代第i個粒子的速度,d為信息數(shù)據(jù)的維度。對于每個粒子,根據(jù)實際應用需求的標準,定義一個合適的適應度函數(shù)(或目標函數(shù)),評價每個虛擬粒子的優(yōu)劣。若某一粒子通過評價函數(shù),其適應度值優(yōu)于其在前一時刻的適應度值,則將當前粒子作為最優(yōu)個體;否則,將該粒子在上一時刻或迭代的位置信息作為當前粒子的位置信息(不考慮其在上一時刻的速度信息)。所有粒子經(jīng)適應度函數(shù)評價后,選出最優(yōu)粒子,并將其作為該種群中最優(yōu)粒子,即當前的全局最優(yōu)。在這里,采用pi=(pi1,pi2,…,pid)表示第i個粒子在某一時刻或迭代過程中搜索到的最優(yōu)位置;pg=(pg1,pg2,…,pgd)為種群搜索到的全局最優(yōu)位置。根據(jù)迭代、適應度評價獲取的個體最優(yōu)和全局最優(yōu),第i個粒子的速度和位置可由式(1)更新,即獲取粒子在下時刻或迭代的速度和位置信息。
(1)
PCNN模型對圖像像素空間相鄰、灰度相似具有并行點火特性,該方法對圖像局部微小、間斷以及孤立噪聲的影響有彌補作用,這種現(xiàn)象符合人類大腦皮層視覺特點。因此,基于PCNN模型的研究在視覺圖像分割、織物疵點檢測、其他目標檢測、圖像融合和圖像降噪等領(lǐng)域具有一定的研究價值。然而,傳統(tǒng)的PCNN模型參數(shù)較多,搭建的網(wǎng)絡比較復雜,同步優(yōu)化模型的參數(shù)成了一個較難解決的問題。通常情況,模型中大量的參數(shù)需要依據(jù)經(jīng)驗或大量實驗確定,該設置方法限制了PCNN模型在應用領(lǐng)域的靈活性和效果。
本文在原模型的基礎(chǔ)上進行了改進,降低了模型的參數(shù)數(shù)量,即為3個參數(shù)或2個參數(shù),能夠很好地滿足圖像信號處理的需要。簡化的PCNN數(shù)學模型為:
Fi,j(n)=Ii,j
(2)
(3)
Ui,j(n)=Fi,j(n)[1+βLi,j(n)]
(4)
(5)
Yi,j(n)=step(Ui,j(n)-Yi,j(n))=
(6)
F為PCNN模型的反饋通道,用于接受外部激勵輸入Ii,j;L為PCNN模型的鏈接通道,融入鄰域信息;Wk,l為對應神經(jīng)元分配的鄰域鏈接權(quán),同時決定了鏈接通道的鄰域大小,鏈接關(guān)系如圖1所示。對于圖像數(shù)據(jù),激勵輸入Ii,j表示圖像在(i,j)位置的像素值。反饋通道F和鏈接通道L經(jīng)式(4)非線性組合構(gòu)成了PCNN模型的接受域。在式(4)中,系數(shù)β為鏈接通道L輸出的鏈接強度。反饋輸入Fi,j和鏈接輸入Li,j經(jīng)過非線性相乘,形成神經(jīng)元內(nèi)部狀態(tài)U。在脈沖發(fā)生階段,若內(nèi)部狀態(tài)U的值大于神經(jīng)元的閾值θi,j,神經(jīng)元被激發(fā),否則設置為0,如式(6)所示。在迭代過程中,閾值θi,j做非線性的a指數(shù)衰減。在發(fā)出脈沖后,除了θi,j與上一時刻有關(guān)外,還疊加了脈沖輸出和一個幅值系數(shù)Vθ的乘積。
圖1 PCNN神經(jīng)元之間的鏈接
對于PCNN模型,優(yōu)化算法如基于迭代的群體智能優(yōu)化學習模型的2參數(shù)(耦合權(quán)重β、閾值θ)或3參數(shù)(β、a、V),其中,θ、a、V的關(guān)系如式(5)所示。傳統(tǒng)PCNN模型在進行圖像分割時,分割圖像的評價標準一般采用信息熵、交叉熵和類間方差。對于PSO優(yōu)化二參數(shù)PCNN模型,學習耦合權(quán)重和閾值,而三參數(shù)學習耦合權(quán)重、時間衰減和幅值。通過PCNN模型構(gòu)建的閾值,該方法針對圖像的每個像素,分割門限是與圖像尺度一樣的閾值數(shù)值矩陣。
在I7,16 GB內(nèi)存的主機上,通過MATLAB2014a編程實現(xiàn)PSO優(yōu)化PCNN模型參數(shù),并將其應用到圖像分割領(lǐng)域。對于PSO算法,采用線性遞減的慣性權(quán)重系數(shù)w,w0=0.9,wt=w0-(0.5t)/Iter,c1=c2=1.49,粒子數(shù)N為30,迭代次數(shù)Iter為20。在約束條件下,采用隨機初始化的方法分配粒子速度和位置。依據(jù)相關(guān)文獻,PCNN模型的鏈接權(quán)重矩陣設置為W=[0.5 1 0.5;1 0 1;0.5 1 0.5][5]。調(diào)制部分的耦合系數(shù)β、脈沖產(chǎn)生部分的時間衰減系數(shù)α和幅度V作為粒子的三維位置信息。對于二參數(shù)PCNN模型,將時間衰減系數(shù)α和幅度V構(gòu)建的閾值θ作為一個優(yōu)化參數(shù),即θ取代α和V,直接優(yōu)化閾值。在這里,只分析與分割結(jié)果直接相關(guān)的參數(shù),對于耦合系數(shù),不作分析,它是由粒子群優(yōu)化算法在約束范圍內(nèi)根據(jù)更新機制學習得到。
在這里,做了2個實驗。實驗1通過細節(jié)、紋理豐富的“l(fā)ena”圖像和織物疵點圖像證驗證PSO優(yōu)化PCNN模型的有效性;實驗2采用“l(fā)ena”圖像,比較二參數(shù)PCNN、三參數(shù)PCNN與傳統(tǒng)的k-means和Otsu算法的分割結(jié)果。
采用紋理、細節(jié)較豐富的“l(fā)ena”圖像,比較不同方法的分割結(jié)果,驗證智能優(yōu)化算法學習PCNN模型參數(shù)的有效性及優(yōu)勢。圖2a為原始圖像,圖2b為傳統(tǒng)的k-means二分類結(jié)果,圖2c為經(jīng)典的Otsu分割結(jié)果,圖2d為本文提出的PCNN模型的圖像分割結(jié)果。與k-means、Otsu算法相比,從視覺效果的角度看,采用PSO優(yōu)化學習PCNN模型在圖像分割應用中獲得了相對較好的結(jié)果。Otsu算法是普遍認為最優(yōu)圖像分割算法,本文分割結(jié)果在某些方面差于k-means分割結(jié)果,如實線框內(nèi)的人背部、頭發(fā)出現(xiàn)了錯誤分割。在PSO+PCNN分割算法中,帽子、頭發(fā)和臉部五官輪廓基本完整,分割邊緣完整、清晰,紋理和細節(jié)相對較豐富,而對于k-means和Otsu算法的分割結(jié)果,帽子與背景存在部分黏連現(xiàn)象,如虛線方框。
圖2 “l(fā)ena”圖像的分割結(jié)果
對于織物疵點圖像,疵點種類有對色點、玷污、破洞和粗紗等,織物圖像紋理豐富,具有規(guī)則、周期性。在該實驗中,根據(jù)相關(guān)文獻對分割結(jié)果的評價標準[6],選擇基于熵的目標函數(shù)作為PSO的適應度函數(shù),仍然采用PSO優(yōu)化三參數(shù)PCNN模型實現(xiàn)織物疵點檢測,并與Otsu方法作比較。結(jié)果如圖3和圖4所示。
圖3a和圖4a為光照不均勻、紋理豐富的原始織物疵點圖像,圖3b為Otsu分割結(jié)果,圖3c、圖3d和圖4c、圖4d為PSO優(yōu)化三參數(shù)PCNN模型在不同迭代次數(shù)下的分割結(jié)果。從圖3 和圖4可以看出,與其他方法相比,經(jīng)過迭代,PSO優(yōu)化PCNN模型獲得了相對較好的分割結(jié)果,能夠很好地抑制背景紋理信息。
采用“l(fā)ena”圖像分析、評價PSO優(yōu)化不同參數(shù)PCNN模型圖像分割結(jié)果。PSO優(yōu)化二參數(shù)、三參數(shù)PCNN模型采用相同的PSO適應度函數(shù)評價標準(最大類間方差法)和隨機初始粒子群作為比較分析的基準。
對于二參數(shù)PCNN模型的圖像分割算法,PSO優(yōu)化的模型參數(shù)為(β,θ),分別表示耦合系數(shù)和閾值。考慮到參數(shù)β的取值較小,而圖像的像素取值為[0,255],為避免優(yōu)化算法搜索空間過于不均衡,圖像歸一化處理,即灰度值轉(zhuǎn)化為[0,1]取值范圍,同時作為閾值的搜索空間約束。圖5給出了PSO優(yōu)化二參數(shù)PCNN模型的圖像分割結(jié)果和適應度值曲線。在圖5中,經(jīng)過4次迭代達到了迭代終止的標準,圖5a~圖5d分別表示第1、2、3、4次迭代分割的結(jié)果,圖5e給出了適應度值曲線。對于分割結(jié)果圖5a~圖5d,隨著迭代次數(shù)的增加,分割輪廓的邊緣清晰,與背景黏連部分越來越少,如虛線方框帽頂部分。但是,背部和頭發(fā)的細節(jié)、紋理信息丟失,如實線方框區(qū)域。結(jié)合迭代次數(shù)與適應度評價標準,如圖5e所示,圖像分割的整體性能得到了提高。
圖5 PSO優(yōu)化二參數(shù)PCNN模型分割結(jié)果以及迭代次數(shù)與適應度值的關(guān)系
對于三參數(shù)PCNN模型的圖像分割算法,PSO優(yōu)化的參數(shù)為(β,a,V),分別表示耦合系數(shù)β、時間衰減參數(shù)a和幅值V。時間衰減參數(shù)a和幅值V通過式(5)可求得閾值。
圖6給出了PSO優(yōu)化三參數(shù)PCNN模型的圖像分割結(jié)果和適應度值曲線。在圖6中,通過隨機初始化粒子群,經(jīng)過5次迭代,分割結(jié)果如圖6a~圖6e所示,分別表示第1、2、3、4、5次迭代分割圖像,圖6f給出了適應度值曲線。從圖6d、圖6e可以看出,隨著迭代次數(shù)的增加,圖像分割的輪廓變的清晰,保留的紋理、細節(jié)準確,如標記的方框區(qū)域。另外,從圖5d、圖6e視覺的角度可以看出,優(yōu)化模型不同參數(shù)直接影響分割的最終結(jié)果,主要表現(xiàn)在2個方面:對于二參數(shù)模型如圖5d的分割結(jié)果,獲得了準確的部分邊緣和區(qū)域信息,如人的背部、下嘴唇以及圖像右下角區(qū)域,但是分割的輪廓、細節(jié)較差,如帽頂出現(xiàn)部分黏連;在圖6e中,三參數(shù)PCNN分割圖像獲得了較好的輪廓、紋理信息(如頭發(fā)等)。通過圖5和圖6的最終分割結(jié)果可以看出,單閾值圖像分割和像素閾值分割之間存在差異性,主要表現(xiàn)在輪廓、紋理和細節(jié)等方面。事實上,通過設置模型參數(shù),從理論角度可以看到,二參數(shù)PCNN模型與三參數(shù)模型之間有一個最大區(qū)別,即二參數(shù)PCNN模型學習的閾值是針對整幅圖像,而三參數(shù)PCNN模型通過學習衰減系數(shù)和幅度組建閾值是針對圖像的每個像素。
圖6 PSO優(yōu)化三參數(shù)PCNN模型分割結(jié)果以及適應度值與迭代次數(shù)的關(guān)系
本文研究了群體智能優(yōu)化算法PSO學習不同參數(shù)個數(shù)的PCNN模型在圖像分割中的性能。采用不同類型的圖像,通過仿真驗證,表明PSO優(yōu)化PCNN模型分割圖像的有效性及優(yōu)勢,之后,針對不同參數(shù)個數(shù)的PCNN模型,通過PSO優(yōu)化學習模型參數(shù),分析參數(shù)對圖像分割結(jié)果的影響。與二參數(shù)PCNN模型相比,三參數(shù)PCNN在圖像分割方面獲得了較好的輪廓和紋理信息,但是圖像的邊緣和部分細節(jié)信息稍差于二參數(shù)PCNN模型的分割結(jié)果。