張 軍,溫秀平,陳 巍
(南京工程學(xué)院 工業(yè)中心,江蘇 南京 211167)
目前,圖像分割方法[1]主要包括:邊界分割法、區(qū)域分割法、聚類分割法和閾值分割法[2,3]。閾值分割法因?yàn)榫哂行阅芊€(wěn)定、計(jì)算效率較高的優(yōu)勢(shì),是目前最主流的圖像分割方法。該方法的關(guān)鍵任務(wù)是基于圖像像素點(diǎn)灰度級(jí)的比較,確定分割圖像的最優(yōu)閾值。閾值分割法又可分為單閾值分割和多閾值分割。單閾值分割僅通過一個(gè)閾值根據(jù)圖像灰度直方圖將圖像分割為目標(biāo)和背景區(qū)域。對(duì)于噪點(diǎn)較多的圖像,該方法分割效果較差。多閾值分割則利用多個(gè)閾值將圖像分割為若干類別,使各類別間的類間方差或熵值達(dá)到最優(yōu),分割效果明顯優(yōu)于單閾值分割法。
群體智能優(yōu)化算法因?yàn)閱l(fā)式的搜索原理可以大幅降低計(jì)算代價(jià),已經(jīng)廣泛應(yīng)用于求解圖像分割的多閾值問題中。如:文獻(xiàn)[4]結(jié)合了鯨魚優(yōu)化算法和飛蛾撲火算法的優(yōu)勢(shì),求解了圖像分割的多級(jí)閾值,但算法的依賴算法較多,計(jì)算復(fù)雜度較高。文獻(xiàn)[5]提出了基于灰狼優(yōu)化算法的多閾值圖像分割算法,并結(jié)合Kapur熵和類間方差最優(yōu)進(jìn)行了實(shí)驗(yàn)對(duì)比,但受限于傳統(tǒng)灰狼優(yōu)化算法尋優(yōu)精度的不足,最終的圖像分割效率不高。文獻(xiàn)[6]利用改進(jìn)蜻蜓優(yōu)化算法求解了彩色圖像的最優(yōu)分割閾值,利用差分進(jìn)化機(jī)制提升了傳統(tǒng)蜻蜓算法的求解精度,圖像分割效果較為穩(wěn)定。文獻(xiàn)[7]設(shè)計(jì)了基于改進(jìn)鯨魚優(yōu)化算法的多閾值圖像分割模型,算法的全局搜索能力有所提升,適應(yīng)度更高,閾值求解更加準(zhǔn)確。文獻(xiàn)[8]設(shè)計(jì)了基于蜘蛛優(yōu)化算法的多閾值圖像分割方法,在雙模和多模閾值分割中有效提升了算法的計(jì)算效率和尋優(yōu)精度。
以上基于不同群體智能優(yōu)化算法的圖像分割方法都具有一定效果,但智能算法本身的尋優(yōu)過程主要由全局的粗粒度搜索到局部的精細(xì)開發(fā)過程組成。若算法的尋優(yōu)效率和尋優(yōu)精度沒有得到根本改善,勢(shì)必要影響圖像分割閾值求解的準(zhǔn)確性,甚至存在求解精度低或已得到局部最優(yōu)的可能。
鬣狗優(yōu)化算法SHO是目前最新的一種群智能優(yōu)化算法[9],受啟發(fā)于非洲地區(qū)斑點(diǎn)鬣狗種群的捕食行為。SHO算法因?yàn)榉€(wěn)定的尋優(yōu)性能和高效的操作已經(jīng)在工程優(yōu)化[10]、特征選擇[11]、資源系統(tǒng)調(diào)度[12]和MIMO-OFDM系統(tǒng)資源調(diào)度[13]等領(lǐng)域得到了廣泛應(yīng)用。不足的是,SHO算法的全局搜索和局部開采僅利用兩個(gè)隨機(jī)參數(shù)控制,導(dǎo)致在多峰值問題中易得到局部最優(yōu)解、求解精度不足的劣勢(shì)。
基于以上分析,本文將首先提出一種改進(jìn)的鬣狗優(yōu)化算法ISHO,然后結(jié)合Tsallis熵進(jìn)行多閾值圖像分割。通過利用混沌映射優(yōu)化初始種群,使初始具備更多的多樣性;對(duì)算法的收斂因子使用非線性的調(diào)節(jié)機(jī)制,從而均衡算法的全局搜索和局部開采過程;引入鄰域重心對(duì)立學(xué)習(xí)機(jī)制計(jì)算個(gè)體的領(lǐng)域重心對(duì)立點(diǎn),并擇優(yōu)保存,提高算法的全局尋優(yōu)能力。以Tsallis熵為評(píng)估標(biāo)準(zhǔn),利用ISHO算法求解分割最優(yōu)閾值,并通過實(shí)驗(yàn)驗(yàn)證算法的有效性。
鬣狗是一類強(qiáng)悍的中型猛獸,也是動(dòng)物界有名的“機(jī)會(huì)主義者”,它們可以集體獵食瞪羚、斑馬、角馬等大中型食草動(dòng)物。鬣狗優(yōu)化算法SHO就是一種模擬了非洲斑點(diǎn)鬣狗種群捕食行為的新型群體智能優(yōu)化算法。SHO算法對(duì)獵物的搜索過程由4步組成:包圍獵物、狩獵、攻擊獵物和搜索獵物。
(1)包圍獵物
鬣狗種群具備判斷獵物位置并對(duì)其實(shí)施包圍的能力,其數(shù)學(xué)模型為
X(t+1)=Xp(t)-E·Dh
(1)
Dh=|F·Xp(t)-X(t)|
(2)
其中,Dh為獵物與鬣狗間的距離,t為當(dāng)前迭代,F(xiàn)、E分別為搖擺系數(shù)和收斂系數(shù),Xp(t)為迭代t時(shí)的獵物位置,X(t)為迭代t時(shí)鬣狗個(gè)體的位置。兩個(gè)控制系數(shù)分別定義為
F=2·r1
(3)
E=2h·r2-h
(4)
h=5-t·5/Tmax
(5)
其中,r1、r2∈[0,1] 為均勻分布隨機(jī)值,Tmax為最大迭代數(shù),h為收斂因子,隨迭代從5線性遞減至0。
如圖1所示為二維空間中鬣狗種群的捕食模型。鬣狗種群可以通過式(1)和式(2),首先判斷并確定獵物(斑馬)的位置信息,位置(A,B)上的鬣狗可以向著位置(A*,B*)的鬣狗的方向更新自己的位置以更加接近于獵物。同時(shí),搜索過程中,通過調(diào)整兩個(gè)控制系數(shù)F、E,可以使鬣狗遍布在獵物周圍不同的位置,以形成包圍之勢(shì)。依此模型,還可以將其擴(kuò)展至d維空間的搜索中。
圖1 二維空間中的鬣狗種群搜索過程
(2)狩獵
鬣狗可以通過建立可靠的種群網(wǎng)絡(luò),并結(jié)合獵物位置的判斷進(jìn)行分組獵殺,其數(shù)學(xué)模型為
Dh=|F·Xh-Xk|
(6)
Xk=Xh-E·Dh
(7)
Gh=Xk+Xk+1+…+Xk+N
(8)
其中,Xh為每一個(gè)最優(yōu)鬣狗個(gè)體位置,Xk為其它搜索個(gè)體的位置,N為群組中的鬣狗數(shù)量,定義為
N=countnos(Xh,Xh+1,Xh+2,…,(Xh+σ))
(9)
式中:σ為[0.5,1]間的隨機(jī)值,添加σ后,nos為可行解數(shù)量并計(jì)算所有侯選解,其與給定搜索區(qū)域的最優(yōu)解相似,Gh為N個(gè)最優(yōu)解組成的群組。
(3)攻擊獵物
該過程相當(dāng)于SHO算法的局部開發(fā)過程,該過程通過收斂因子h的遞減實(shí)現(xiàn)。當(dāng)h減小時(shí),收斂系數(shù)E隨之減小。而 |E|<1時(shí),鬣狗即會(huì)對(duì)獵物進(jìn)行攻擊。其位置數(shù)學(xué)模型為
(10)
式中:X(t+1) 用于保存最優(yōu)解,同時(shí),其它個(gè)體的位置將根據(jù)該最優(yōu)解進(jìn)行動(dòng)態(tài)更新。
(4)搜索獵物
該過程相當(dāng)于SHO算法的全局搜索過程。一般情況下,鬣狗將根據(jù)Gh中保存的最優(yōu)解群組的位置來搜索目標(biāo)獵物。但當(dāng) |E|>1時(shí),鬣狗就會(huì)隨機(jī)分散,并遠(yuǎn)離當(dāng)前獵物,從遠(yuǎn)離獵物的方向?qū)ζ渌鼌^(qū)域進(jìn)行搜索,以此避免生成局部最優(yōu)解。
(5)SHO算法過程
輸入:鬣狗種群Xi,i=1,2,…,n
輸出:最優(yōu)個(gè)體位置
(1) 參數(shù)初始化,包括:h、F、E、N、Tmax,并初始化種群
(2) 計(jì)算種群中每個(gè)鬣狗個(gè)體的適應(yīng)度
(3) 記錄當(dāng)前最優(yōu)個(gè)體Xh
(4) 根據(jù)式(8)、式(9),構(gòu)建最優(yōu)個(gè)體組成的群組Gh
(5) whilet (6) for 每個(gè)個(gè)體 do (7) 根據(jù)式(10)更新個(gè)體位置 (8) end for (9) 更新參數(shù)h、F、E、N (10) 越界檢查 (11) 重新計(jì)算個(gè)體適應(yīng)度 (12) 若有更優(yōu)個(gè)體, 則更新Xh (13) 根據(jù)Xh更新群組Gh (14)t=t+1 (15) end while (16) 返回Xh 群體智能優(yōu)化算法具有初值敏感特征,初始種群分布的合理性對(duì)算法尋優(yōu)精度和收斂速度都具有重要影響。如果初始種群鄰近最優(yōu)解所在區(qū)域,算法尋優(yōu)精度會(huì)更高,收斂速度也更快;反之亦然。傳統(tǒng)的鬣狗優(yōu)化算法以Rand函數(shù)產(chǎn)生隨機(jī)數(shù)的方式隨機(jī)初始化種群部署,缺乏多樣性?;煦缦到y(tǒng)是非線性環(huán)境中的一種普遍現(xiàn)象,看似混亂,實(shí)則綜合具有規(guī)律性、遍歷性和隨機(jī)性,可以不重復(fù)遍歷到所有狀態(tài)。通過混沌映射規(guī)則將混沌變量映射至混沌空間,在混沌空間內(nèi)搜索后,再將結(jié)果映射回原始問題解空間中,可以克服隨機(jī)化分布的遍歷不足、種群多樣性缺失等問題。 目前,Logistic混沌映射比較常見,但根據(jù)其分布曲線圖可知,其混沌值在邊界兩端([0,0.1]和[0.9,1]兩個(gè)區(qū)域)取值率過高,遍歷過程均勻性缺乏,會(huì)降低算法收斂速度。Tent混沌映射證明比Logistic遍歷性更好,能夠在[0,1]區(qū)間生成分布更均勻的初值,且不缺乏遍歷性。因此,ISHO算法結(jié)合Tent混沌映射生成初始的鬣狗種群位置。Tent映射表達(dá)式為 (11) 式中:u為混沌參數(shù),y(t)是迭代t時(shí)的Tent混沌值。u=1/2是混沌Tent映射的典型形式,此時(shí)生成的混沌序列分布均勻,對(duì)不同初值參數(shù)可以生成近似一致的分布密度。 確定混沌序列后,通過下式將混沌序列映射為個(gè)體位置 X(t)=UL+y(t)×(UB-UL) (12) 式中: [UL,UB] 為個(gè)體搜索的區(qū)間,對(duì)應(yīng)種群搜索范圍。由于混沌序列的生成值取決于初始值,初始值發(fā)生微小變化也會(huì)帶來混沌值的巨大變化,此時(shí)生成的初始種群將兼具隨機(jī)、遍歷等特征,多樣性更好。 根據(jù)SHO算法的包圍獵物機(jī)制,收斂系數(shù)E控制著鬣狗的搜索方向。當(dāng) |E|>1時(shí),鬣狗將從遠(yuǎn)離獵物的方向進(jìn)行搜索;當(dāng) |E|<1時(shí),鬣狗將對(duì)確定的目標(biāo)進(jìn)行攻擊。前者對(duì)應(yīng)于全局搜索過程,后者則對(duì)應(yīng)于局部開采過程。E的變化則由收斂因子h控制。根據(jù)h的計(jì)算公式(5)可知,其值將隨著迭代線性地從5遞減至0。對(duì)于SHO算法,迭代初期,h值較大可以增大搜索步長(zhǎng),拓展搜索空間,避免尋優(yōu)過程過快收斂;迭代后期,h值較小可以減小搜索步長(zhǎng),提高算法的局部精細(xì)開采能力,加快算法收斂。 然而,全局搜索與局部開采之間并非完全線性切換,尤其在多峰值情形的尋優(yōu)過程中,極容易出現(xiàn)局部最優(yōu)解。為此,ISHO算法將基于正切函數(shù)引入一種非線性的收斂因子調(diào)整方法,具體公式如下 (13) 式中:hinitial、hfinal分別為h的初值和終值,Tmax為最大迭代數(shù),μ為收斂因子的衰減因子,μ>0。根據(jù)式(13)可知,h將隨迭代次數(shù)呈非線性遞減,相應(yīng)E值也將呈非線性遞減。迭代初期,h取值較大,但遞減緩慢,可以更大步長(zhǎng)實(shí)現(xiàn)更充分的全局搜索。迭代晚期,h值變小,但遞減加快,此時(shí)可以較小步長(zhǎng)更快的靠近最優(yōu)解,加速算法收斂。這種以不同速率遞減的收斂因子調(diào)整策略更加符合鬣狗的搜索行為,將有助于算法的局部開發(fā)與全局搜索的協(xié)調(diào)進(jìn)行,也可以確保鬣狗種群更高的狩獵成功率。 此外,正切函數(shù)只是收斂因子非線性調(diào)整的一種方式,指數(shù)函數(shù)、正余弦函數(shù)均可以實(shí)現(xiàn)對(duì)收斂因子的非線性調(diào)整,由于不同函數(shù)在曲線上表現(xiàn)出的衰減都有所不同,因此,這就決定了全局搜索與局部開采之間切換時(shí)機(jī)的不同,選擇正切函數(shù)是本文改進(jìn)算法的一種思路,其它幾種非線性切換函數(shù)能否得到更好的分割效果需要在后續(xù)實(shí)驗(yàn)中通過對(duì)比分析才可以確定。 對(duì)立學(xué)習(xí)OBL可以通過評(píng)估當(dāng)前解及其對(duì)立解的方式,以擇優(yōu)形式加速群體智能優(yōu)化方法的尋優(yōu)過程。但傳統(tǒng)的對(duì)立學(xué)習(xí)機(jī)制在計(jì)算對(duì)立點(diǎn)時(shí)僅利用了維度空間的邊界值,忽略了群體整體尋優(yōu)的搜索經(jīng)驗(yàn)。而重心對(duì)立學(xué)習(xí)則是以群組重心為參考點(diǎn)計(jì)算對(duì)立點(diǎn),融合了群體的搜索經(jīng)驗(yàn)[14]。相關(guān)定義如下: 定義1 重心。令 (X1,X2,…,Xn) 為d維空間中的n個(gè)點(diǎn),則其重心為 (14) 則 (15) 定義2 重心對(duì)立點(diǎn)。令M為一個(gè)群組的重心,則群組中的某位置點(diǎn)Xi的對(duì)立點(diǎn)為 X′i=2×M-Xi,i=1,2,…,n (16) 由于對(duì)立點(diǎn)位于動(dòng)態(tài)邊界的搜索區(qū)間,可將其記為Xi,j∈[aj,bj]。 而動(dòng)態(tài)邊界可以不斷縮小搜索區(qū)間,即 aj=min(Xi,j),bj=max(Xi,j) (17) 若對(duì)立點(diǎn)超出搜索邊界值,則按以下方式重新計(jì)算重心對(duì)立點(diǎn) (18) 重心對(duì)立點(diǎn)雖然可以借助群體搜索經(jīng)驗(yàn),依靠群體重心的方式計(jì)算對(duì)立點(diǎn),但由于所考慮的重心僅有一個(gè),導(dǎo)致對(duì)立解缺乏多樣性。為此,改進(jìn)算法ISHO進(jìn)一步將利用鄰域重心對(duì)立學(xué)習(xí)的方式計(jì)算對(duì)立點(diǎn)。令Xi為種群n中的個(gè)體i,Mi為個(gè)體i所在鄰域的重心,則鄰域重心對(duì)立點(diǎn)定義為 X′i=2×k×Mi-Xi,i=1,2,…,mi (19) 式中:mi為鬣狗i所有鄰域中的個(gè)體數(shù)量,k∈[0,1] 為均勻分布隨機(jī)數(shù)。 ISHO算法在計(jì)算鄰域重心對(duì)立點(diǎn)時(shí),采用的是利用隨機(jī)拓?fù)浣Y(jié)構(gòu)進(jìn)行鄰域劃分,即:為鬣狗個(gè)體隨機(jī)性地選擇其鄰居個(gè)體。若種群最優(yōu)解未發(fā)生更新,則需要重新選擇其鄰居。此外,當(dāng)隨機(jī)拓?fù)浣Y(jié)構(gòu)造成鄰域個(gè)體僅包含自身、或除自身外的另一個(gè)鬣狗個(gè)體時(shí),若仍按原始重心對(duì)立點(diǎn)的計(jì)算公式,會(huì)出現(xiàn)對(duì)立點(diǎn)與自身重合的情況,同時(shí)造成重復(fù)評(píng)估,影響尋優(yōu)收斂速度。而引入隨機(jī)值k后,可以避免出現(xiàn)對(duì)立點(diǎn)重復(fù),拓展對(duì)立點(diǎn)范圍,避免個(gè)體重合帶來的重復(fù)評(píng)估。 圖2是ISHO算法的流程。 圖2 ISHO算法流程 ISHO算法的時(shí)間復(fù)雜度。令鬣狗種群規(guī)模為n,搜索空間的位置維度為d。種群初始化過程需要根據(jù)搜索個(gè)體的數(shù)量、搜索位置上下界生成初始種群的初始位置,其時(shí)間復(fù)雜度為O(n×d)。 接下來,計(jì)算種群適應(yīng)度的時(shí)間復(fù)雜度為O(n×d×Tmax),Tmax為ISHO算法的最大迭代次數(shù)。定義鬣狗群組的時(shí)間復(fù)雜度為O(N×Tmax),N為組成群組的最優(yōu)解數(shù)量。鄰域重心對(duì)立學(xué)習(xí)機(jī)制需要遍歷n個(gè)個(gè)體的所有維度位置,且需迭代進(jìn)行,故該過程的時(shí)間復(fù)雜度為O(n×d×Tmax)。 綜上,ISHO算法的時(shí)間復(fù)雜度為O(N×n×d×Tmax)。 與標(biāo)準(zhǔn)SHO算法的時(shí)間復(fù)雜度保持一致,說明改進(jìn)算法并未增加計(jì)算代價(jià)。 令圖像I擁有L個(gè)灰度級(jí),nt個(gè)閾值構(gòu)成的集合th={th1,th2,…,thnt},th將圖像I分割為K個(gè)類別 {C1,C2,…,CK},nt=1,2,…,K-1, 且th1 Tsallis熵是香農(nóng)熵的擴(kuò)展形式,也稱非廣延熵[15]。該熵值考慮了圖像中的非疊加信息,可以實(shí)現(xiàn)在噪聲圖像中的健壯圖像分割。在單閾值情形下,閾值th將圖像分割為目標(biāo)區(qū)域和背景區(qū)域。則Tsallis熵的目標(biāo)函數(shù)為最大化圖像類別的信息量,可表示為 f(th)=max[Sq,1(th)+Sq,2(th)+(1-q)Sq,1(th)Sq,2(th)] (20) 式中:q為熵系數(shù),用于衡量熵值的非廣延度,Sq,1、Sq,2分別表示目標(biāo)區(qū)域和背景區(qū)域的熵值,計(jì)算為 (21) 式中:w1(th)、w2(th) 為兩個(gè)類別的累積分布函數(shù),定義為 (22) 式中:Phi為灰度級(jí)i的概率分布。若令H為圖像的灰度直方圖,NP為圖像像素?cái)?shù),Hi為圖像灰度級(jí)i包含的像素?cái)?shù),則 (23) 對(duì)于多閾值圖像分割問題,閾值集合為th,則Tsallis熵目標(biāo)函數(shù)為 f(th)=max[Sq,1(th)+Sq,2(th)+…+Sq,K(th)+ (1-q)Sq,1(th)Sq,2(th)…Sq,K(th)] (24) 其中 (25) 各類別的累積分布函數(shù)為 (26) ISHO算法以Tsallis熵目標(biāo)函數(shù)(24)作為評(píng)估鬣狗個(gè)體位置優(yōu)劣的適應(yīng)度函數(shù),以迭代尋優(yōu)的方式求解圖像分割的最優(yōu)閾值。算法的搜索空間為圖像的灰度級(jí)空間,即灰度級(jí)L。若分割閾值為th={th1,th2,…,thn t}, 則閾值thi滿足0 且為整數(shù)。以Tsallis熵最大為目標(biāo)評(píng)估鬣狗個(gè)體的適應(yīng)度,通過若干次的迭代尋優(yōu),求解滿足式(24)最大的分割閾值解向量th?;诟倪M(jìn)鬣狗優(yōu)化算法的Tsallis熵多閾值圖像分割的過程如圖3所示。 圖3 圖像分割流程 實(shí)驗(yàn)驗(yàn)證分兩部分進(jìn)行,第一部分驗(yàn)證ISHO的標(biāo)準(zhǔn)函數(shù)上的尋優(yōu)性能,第二部分以ISHO算法求解Tsallis熵最優(yōu)的圖像分割閾值,再做圖像分割。實(shí)驗(yàn)平臺(tái)都在MATLAB 2019a下進(jìn)行,系統(tǒng)環(huán)境為Windows 7操作系統(tǒng),CPU為Intel Pentium 3.2 G,內(nèi)存為8 G。實(shí)驗(yàn)部分先利用表1的基準(zhǔn)函數(shù)測(cè)試驗(yàn)證ISHO算法的尋優(yōu)性能,4個(gè)基準(zhǔn)函數(shù)即為需要尋優(yōu)最優(yōu)解的目標(biāo)函數(shù),搜索空間為尋優(yōu)時(shí)個(gè)體的尋優(yōu)范圍,fmin為函數(shù)理論可達(dá)的最優(yōu)值。前兩個(gè)基準(zhǔn)函數(shù)是單峰函數(shù),僅存在一個(gè)全局最優(yōu)值,比較容易搜索;后兩個(gè)基準(zhǔn)函數(shù)是多峰函數(shù),存在多個(gè)深入內(nèi)部的極值點(diǎn),且有一定振蕩特征,較單峰函數(shù)搜索空間更為復(fù)雜,易于陷入局部最優(yōu)處。 表1 基準(zhǔn)函數(shù) 再選擇伯克利圖像庫(kù)中3幅圖像Persons、House、Coins進(jìn)行圖像分割實(shí)驗(yàn)(可擴(kuò)展至其它圖像上實(shí)驗(yàn))。如圖4所示,Persons圖像為室內(nèi)人物圖,且室內(nèi)背景較為復(fù)雜,物品擺設(shè)、家具繁多,House圖像為近景建筑圖,房屋墻面形狀及與背景樹林的分割是難點(diǎn),Coins圖像為近景相似物圖,其硬幣表現(xiàn)的紋理分割是其重點(diǎn)。不同類型的圖像有助于測(cè)試改進(jìn)算法ISHO的全面分割性能。 圖4 測(cè)試圖像樣本 算法參數(shù)中,最大迭代數(shù)Tmax=400,種群規(guī)模n=30,個(gè)體搜索空間[UL,UB]為[0,255](對(duì)應(yīng)圖像的灰度級(jí)范圍),混沌參數(shù)u=1/2, 收斂因子h的初值hinitial=5,終值hfinal=0,收斂因子的衰減因子μ=2。同時(shí),圖像分割閾值數(shù)nt分別選取K=2、3、4、5進(jìn)行計(jì)算。選擇引言部分提到的改進(jìn)鯨魚優(yōu)化算法IWOA[7]、灰狼優(yōu)化GWO[5]以及標(biāo)準(zhǔn)鬣狗優(yōu)化算法SHO[9]進(jìn)行實(shí)驗(yàn)對(duì)比分析。對(duì)于IWOA算法,收斂因子從2遞減至0。對(duì)于GWO算法,收斂因子同樣從2遞減至0。SHO算法的參數(shù)與ISHO算法設(shè)置基本相同。 為驗(yàn)證算法性能,需要對(duì)圖像分割質(zhì)量進(jìn)行評(píng)估。選擇峰值信噪比PSNR、特征相似度FSIM進(jìn)行定量分析。其中 (27) (28) 其中,I(i,j) 表示原始圖像,I′(i,j) 為分割圖像,ε、ξ分別對(duì)應(yīng)圖像像素的行、列數(shù)。該指標(biāo)根據(jù)圖像分割前后的像素點(diǎn)間的均方差比較圖像相似性??梢栽u(píng)估圖像失真,值越大,圖像失真越小 (29) 式中:Ω為整體圖像像素域,SL(x) 為相似度分值,PCm(x) 為相位一致性度量,定義為 PCm(x)=max{PC1(x),PC2(x)} (30) 式中:PC1(x) 和PC2(x) 分別為兩個(gè)區(qū)域的相位一致性,分別為 SL(x)=[SPC(x)]α·[SG(x)]β (31) (32) (33) 其中,SPC(x) 為相位一致性的相似度量,SG(x) 為兩個(gè)區(qū)域G1(x) 和G2(x) 的梯度級(jí),α、β、R1和R2均為常量。該指標(biāo)根據(jù)人的視覺觀感與圖像的低級(jí)特征評(píng)估圖像特征的相似性。FSIM范圍為[0,1],取值越大,說明分割越接近原始圖像,質(zhì)量也越好。 表2統(tǒng)計(jì)了在20次實(shí)驗(yàn)中GWO算法、IWOA算法、標(biāo)準(zhǔn)SHO算法以及本文的改進(jìn)算法ISHO在4種基準(zhǔn)函數(shù)上尋優(yōu)得到的函數(shù)均值、標(biāo)準(zhǔn)方差、最小值和最大值。基準(zhǔn)函數(shù)中,f1(x)、f2(x) 是單峰函數(shù),f3(x)、f4(x) 是多峰函數(shù)。前者在整個(gè)搜索區(qū)域內(nèi)僅有一個(gè)峰值(最優(yōu)解),可以測(cè)試算法的收斂速度和求解精度;后者在整個(gè)搜索區(qū)域內(nèi)存在多個(gè)峰值,可以測(cè)試算法擺脫局部最優(yōu)的能力。均值和標(biāo)準(zhǔn)方差結(jié)果可以同步觀察算法的尋優(yōu)精度和穩(wěn)定性。測(cè)試結(jié)果表明,ISHO算法在兩種類型的基準(zhǔn)函數(shù)測(cè)試中的尋優(yōu)精度和穩(wěn)定性都是表現(xiàn)最好的,這說明ISHO算法利用混沌映射初始化、收斂因子非線性調(diào)整、鄰域重心對(duì)立學(xué)習(xí)機(jī)制對(duì)標(biāo)準(zhǔn)SHO算法的種群多樣性改善、搜索與開發(fā)能力間的均衡,以及提升收斂速度和尋優(yōu)精度的改進(jìn)是切實(shí)有效可行的。 表2 算法在基準(zhǔn)函數(shù)上的統(tǒng)計(jì)結(jié)果對(duì)比 圖5是算法在基準(zhǔn)函數(shù)上的尋優(yōu)曲線,縱軸是目標(biāo)函數(shù)均值的變化情況??梢钥闯?,ISHO算法在4種基準(zhǔn)函數(shù)上具有最快的收斂速度,在單峰函數(shù)和多峰函數(shù)中都取得了很好的性能。最終的尋優(yōu)精度ISHO算法也是最高的,算法可以以最少的迭代次數(shù)使其收斂在最優(yōu)解處。同時(shí),在多峰函數(shù)的測(cè)試中可以看到,ISHO算法明顯可以跳離局部最優(yōu),而對(duì)比算法則會(huì)收斂在局部最優(yōu)解處而無法進(jìn)一步提高尋優(yōu)精度。 圖5 收斂曲線 表3是4種算法計(jì)算的最優(yōu)分割閾值??梢?,分割閾值數(shù)較少時(shí),3種算法在最優(yōu)閾值選取上基本是保持一致的,這說明在較少閾值分割時(shí)圖像分割的精度相差不大,但隨著分割閾值數(shù)的增加,改進(jìn)算法ISHO求解的閾值變得有所不同。然而,這無法表明算法所求解的閾值就是更加準(zhǔn)確的,還需要進(jìn)一步通過可量化的評(píng)估指標(biāo)對(duì)算法的求解精度進(jìn)行驗(yàn)證,即需要比較前文中的峰值信噪比PSNR和特征相似度FSIM兩個(gè)指標(biāo)。 表3 圖像分割閾值 如圖6、圖7所示是3幅圖像分割的PSNR和FSIM結(jié)果,為20次實(shí)驗(yàn)結(jié)果的均值折線圖。從圖6可以看出,分割閾值數(shù)從2~5時(shí),ISHO算法的PSNR均值明顯高于另外3種算法,且在不同閾值數(shù)下保持著優(yōu)勢(shì),這說明ISHO算法具有較好的穩(wěn)定性,算法求解的閾值更加準(zhǔn)確,分割圖像與原始圖像具有更高的相似性,失真信息最少,可以更準(zhǔn)確實(shí)現(xiàn)對(duì)目標(biāo)區(qū)域的分割。對(duì)于House圖和Coins圖,GWO算法在選擇較大閾值數(shù)時(shí),得到的PSNR均值已經(jīng)出現(xiàn)降低,說明算法的穩(wěn)定性不足。在Persons圖中,SHO算法的較大閾值數(shù)時(shí),PSNR均值增長(zhǎng)幾乎停滯。從圖7可以看出,ISHO算法的FSIM均值也明顯高于另外3種算法。綜合兩項(xiàng)指標(biāo)的統(tǒng)計(jì)結(jié)果,可以證明本文設(shè)計(jì)的ISHO算法應(yīng)用在圖像分割中,可以更加準(zhǔn)確分割圖像的目標(biāo)區(qū)域,分割質(zhì)量更高。 圖6 峰值信噪比PSNR 圖7 特征相似度FSIM 圖8是3閾值時(shí)算法的圖像分割效果??梢钥闯?,ISHO算法的圖像分割圖失真是最少的,保留了原始圖像中更多的細(xì)節(jié)信息,與原始圖像的特征最為接近。具體地,在Persons圖中,人物與背景中的家具邊界分割顯得更加清晰,家具的輪廓、邊緣更加清晰。在House圖中,房屋的磚塊紋路更加明顯清楚;Coins圖中,各個(gè)硬幣都被清晰的分割出來,且硬幣的紋理效果有明顯的提升。相比而言,GWO算法對(duì)Persons圖分割效果較差,人物與背景模糊,Coins圖中的部分硬幣邊界不清,紋理模糊。對(duì)于House圖中,磚塊邊緣無法有效分割。IWOA算法和SHO算法在House圖中的分割效果接近。而SHO算法對(duì)于Coins圖的分割更好,硬幣紋理比IWOA算法清晰。 圖8 閾值數(shù)為3時(shí)不同算法的圖像分割結(jié)果 圖9是20次求解結(jié)果均值的關(guān)于Tsallis熵的收斂曲線圖。黑實(shí)線條為本文的ISHO算法求解的結(jié)果??梢钥吹?,在標(biāo)準(zhǔn)SHO算法的基礎(chǔ)上,本文的ISHO算法實(shí)現(xiàn)了性能改進(jìn),同時(shí)穩(wěn)定性較好。ISHO算法也是所有算法中得到的Tsallis熵值最大的,即適應(yīng)度最大。SHO算法、IWOA算法、GWO算法較大可能會(huì)陷入局部?jī)?yōu)解,無法獲取更好的適應(yīng)度。從收斂曲線趨勢(shì)觀察,ISHO算法用了最小的迭代次數(shù)達(dá)到最優(yōu)解,且后期一直保持平滑趨勢(shì),說明已經(jīng)收斂。GWO算法和IWOA算法曲線趨勢(shì)整體波動(dòng)較大,部分曲線接近于階梯形,而非上升式平滑曲線,說明算法性能穩(wěn)定性欠佳。傳統(tǒng)SHO算法多數(shù)迭代下處于平滑曲線,更新速度較慢,說明求解已經(jīng)陷入局部最優(yōu)??傮w來說,ISHO算法不僅求解質(zhì)量更高,而且收斂速度更快。 圖9 Tsallis熵的收斂曲線 為提高圖像分割的準(zhǔn)度和精度,結(jié)合改進(jìn)的鬣狗優(yōu)化算法,設(shè)計(jì)了一種融合Tsallis熵的多閾值圖像分割算法。首先,為了提高傳統(tǒng)鬣狗優(yōu)化算法的尋優(yōu)精度和效率,利用混沌Tent映射生成初始種群,豐富種群多樣性;引入非線性收斂因子調(diào)節(jié)機(jī)制,均衡全局搜索和局部開采能力;利用鄰域重心對(duì)立學(xué)習(xí)機(jī)制計(jì)算對(duì)立解,以提高算法的全局尋優(yōu)能力,避免算法陷入局部最優(yōu)。然后,將設(shè)計(jì)的改進(jìn)鬣狗優(yōu)化算法應(yīng)用于多閾值圖像分割問題上,引用Tsallis熵作為評(píng)估搜索個(gè)體優(yōu)劣和質(zhì)量的適應(yīng)度函數(shù),通過啟發(fā)式搜索的迭代尋優(yōu)得到最優(yōu)分割閾值。大規(guī)模圖像分割實(shí)驗(yàn)結(jié)果表明,改進(jìn)算法無論在圖像分割直觀圖還是在定量指標(biāo)上,都取得了預(yù)期效果。2 基于鄰域重心對(duì)立學(xué)習(xí)的混沌鬣狗優(yōu)化算法ISHO
2.1 混沌優(yōu)化初始種群
2.2 收斂因子非線性調(diào)整
2.3 鄰域重心對(duì)立學(xué)習(xí)
2.4 ISHO算法實(shí)現(xiàn)過程
3 基于Tsallis熵的圖像分割模型
4 融合ISHO算法和Tsallis熵的圖像分割
5 實(shí)驗(yàn)分析
5.1 實(shí)驗(yàn)環(huán)境及圖像樣本
5.2 圖像分割指標(biāo)
5.3 ISHO算法尋優(yōu)實(shí)驗(yàn)結(jié)果
5.4 圖像分割實(shí)驗(yàn)結(jié)果
6 結(jié)束語(yǔ)
計(jì)算機(jī)工程與設(shè)計(jì)2022年12期