賈鶴鳴 姜子超 彭曉旭 康立飛 李 瑤 孫康健
(東北林業(yè)大學(xué)機(jī)電工程學(xué)院 黑龍江 哈爾濱 150040)
圖像分割是圖像分析的關(guān)鍵步驟,是圖像標(biāo)識(shí)和描述的必要前提和基礎(chǔ),因此分割方法的選擇和分割精度是極為重要的[1]?,F(xiàn)有的分割算法多基于邊緣、區(qū)域、閾值及特定理論等。閾值圖像分割法運(yùn)算效率高、性能較穩(wěn)定,是目前最廣泛應(yīng)用的一種分割方法。閾值分割法的基本理論是依據(jù)某一準(zhǔn)則求出最佳閾值,并進(jìn)行像素點(diǎn)比較,將目標(biāo)和背景區(qū)域區(qū)分出來(lái)。單閾值分割基本思想是按閾值把直方圖分割成目標(biāo)和背景兩類,而多閾值分割則是將圖像分成多個(gè)類,使得多個(gè)類的類間方差最大[2]。因?yàn)閱伍撝捣指顖D像效果不夠理想,所以近些年研究學(xué)者多采用迭代的方式將其研究領(lǐng)域延伸至多閾值分割。
經(jīng)典Otsu算法本質(zhì)上是進(jìn)行窮舉搜索,如果采用窮舉法進(jìn)行多閾值的搜索,總計(jì)算量較大。利用類間方差最大化思想,可以將圖像的多閾值分割問(wèn)題轉(zhuǎn)化為求最優(yōu)閾值的目標(biāo)函數(shù)優(yōu)化問(wèn)題,因此,為縮短運(yùn)算時(shí)間,提升效率,可選用算法優(yōu)化思想進(jìn)行多閾值選取過(guò)程。但由于優(yōu)化算法本身的局限性,在分割圖像時(shí)仍存在求解質(zhì)量低、容易陷入局部最優(yōu)等問(wèn)題。
鬣狗算法(SpottedHyenaOptimizer,SHO)是印度塔帕爾大學(xué)GauravDhiman教授于2018年基于非洲斑點(diǎn)鬣狗種群覓食機(jī)制提出的一種新型群智能優(yōu)化算法,主要通過(guò)模擬斑點(diǎn)鬣狗種群的捕食行為特性來(lái)達(dá)到優(yōu)化搜索的目的。SHO算法操作簡(jiǎn)單、設(shè)置參數(shù)少、穩(wěn)定性強(qiáng)、求解精度更高,因其性能良好,已經(jīng)開(kāi)始被應(yīng)用于解決非線性連續(xù)優(yōu)化問(wèn)題等多個(gè)工程領(lǐng)域。但由于其全局搜索能力和局部搜索能力僅通過(guò)B和E兩個(gè)隨機(jī)參數(shù)進(jìn)行動(dòng)態(tài)調(diào)節(jié),且這兩個(gè)階段種群位置更新公式未進(jìn)行明顯區(qū)分,SHO算法不可避免地存在易陷入局部最優(yōu)解、求解質(zhì)量低等類似缺陷,而在復(fù)雜優(yōu)化問(wèn)題中,大多要求優(yōu)化算法盡可能遍歷到全局最優(yōu)解可能的分布范圍[3]。所以SHO仍存在局部最優(yōu)、復(fù)雜優(yōu)化效果不良等缺陷。
針對(duì)標(biāo)準(zhǔn)SHO算法受隨機(jī)因子的影響而導(dǎo)致的全局優(yōu)化效果差、收斂效率不良、求解速率與質(zhì)量低等問(wèn)題,本文提出一種改進(jìn)鬣狗算法ISHO,并將其應(yīng)用到多閾值圖像分割領(lǐng)域。通過(guò)引入混沌初始化策略、非線性收斂因子調(diào)整策略、萊維飛行策略以及精英反向?qū)W習(xí)策略,來(lái)提高算法在解決復(fù)雜性問(wèn)題時(shí)的尋優(yōu)效率及求解精度。為檢驗(yàn)鬣狗優(yōu)化算法及改進(jìn)的鬣狗優(yōu)化算法在圖像多閾值分割方面的可行性及分割精度的優(yōu)越性,選取6幅經(jīng)典伯克利圖像進(jìn)行多閾值分割實(shí)驗(yàn),利用分割時(shí)間、適應(yīng)度值、PSNR值、FISM值等指標(biāo)評(píng)價(jià)分割效果,對(duì)比粒子群優(yōu)化算法(particleswarmoptimization,PSO)、正余弦優(yōu)化算法(sine-cosineoptimizationalgorithm,SCA)、灰狼優(yōu)化算法(greywolfoptimizationalgorithm,GWO)、鯨魚(yú)優(yōu)化算法(whaleoptimizationalgorithm,WOA)、標(biāo)準(zhǔn)SHO等五種優(yōu)化算法,實(shí)驗(yàn)結(jié)果表明:ISHO算法在分割速度及效率上具有明顯優(yōu)勢(shì),且圖像失真度較小,分割效果較好,有利于圖像提取的后續(xù)處理。
(1)
(2)
(3)
則目標(biāo)函數(shù)可以描述為:
(4)
Otsu最佳閾值的定義為:
(5)
鬣狗種群的捕食機(jī)制包括搜索、包圍、狩獵和攻擊獵物四個(gè)過(guò)程[5]。鬣狗算法的基本原理如下:
(1) 包圍機(jī)制:鬣狗具有熟悉并判斷獵物的位置,從而包圍它們的能力。該行為的數(shù)學(xué)模型為:
Dh=|B·Pp(t)-P(t)|
(6)
B=2·r1
(7)
式中:Dh表示鬣狗個(gè)體與獵物之間的距離;t表示當(dāng)前迭代次數(shù);Pp表示獵物的位置;P(t)表示鬣狗種群中的個(gè)體位置;B表示搖擺因子;r1表示[0,1]之間均勻分布的隨機(jī)數(shù)。
鬣狗的個(gè)體位置更新如下所示:
P(t+1)=Pp(t)-E·Dh
(8)
E=2·h·r2-h
(9)
(10)
式中:E表示收斂因子;r2表示[0,1]之間均勻分布的隨機(jī)數(shù);h表示控制因子,隨迭代次數(shù)的增加線性遞減,變化范圍為[0,5];Iteration表示算法運(yùn)行當(dāng)前迭代數(shù)目,其中Iteration=1,2,…,NI;NI表示最大迭代次數(shù)。
(2) 狩獵機(jī)制:斑點(diǎn)鬣狗通常依靠可信賴的種群網(wǎng)絡(luò)及識(shí)別獵物位置的能力來(lái)生活和分組捕殺。該機(jī)制的具體描述如下:
Dh=|B·Pp(t)-Pk|
(11)
Pk=Ph-E·Dh
(12)
Ch=Pk+Pk+1+…+Pk+N
(13)
式中:Ph定義了第一個(gè)最佳斑點(diǎn)鬣狗的位置;Pk表示其他斑點(diǎn)鬣狗的位置;N表示斑點(diǎn)鬣狗的數(shù)量;Ch是N個(gè)最優(yōu)解的集群。其中N計(jì)算如下:
N=Countnos(Ph,Ph+1,Ph+2,…,(Ph+M))
(14)
式中:M是[0.5,1]中的隨機(jī)向量,在添加M之后,nos定義可行解的數(shù)量并計(jì)算所有候選解,其與給定搜索空間中的最優(yōu)解相似。
(3) 攻擊獵物(局部搜索):鬣狗在獵食的最后階段開(kāi)始攻擊獵物,當(dāng)收斂因子|E|<1時(shí),鬣狗個(gè)體便會(huì)向獵物發(fā)動(dòng)攻擊。全局最優(yōu)解通過(guò)求取當(dāng)前最優(yōu)解集的平均值來(lái)確定鬣狗搜索個(gè)體的更新趨勢(shì)。攻擊獵物的數(shù)學(xué)公式具體描述如下:
(15)
式中:Ph(t+1)為保存最優(yōu)解;Ch表示最優(yōu)解群集。
(4) 搜索機(jī)制(全局探索):鬣狗大多根據(jù)位于最優(yōu)解群集Ch中的鬣狗群或群集的位置來(lái)搜尋獵物,當(dāng)收斂因子|E|>1時(shí),鬣狗會(huì)分散并遠(yuǎn)離當(dāng)前獵物,搜索更適合的獵物的位置,這種機(jī)制使得SHO算法能夠在全局進(jìn)行搜索。
混沌理論因?yàn)榫哂袕?qiáng)大的遍歷性、敏感性和非重復(fù)性而被廣泛引入群智能算法中用以增強(qiáng)種群多樣性以改善其優(yōu)化性能。與隨機(jī)搜索相比,它可以以更高的概率和速度對(duì)搜索空間進(jìn)行徹底搜索。目前群智能算法文獻(xiàn)多采用Logistic映射產(chǎn)生混沌序列,但均勻性較差。相比Logistic映射,Tent映射結(jié)構(gòu)簡(jiǎn)單,迭代速度快,具有更好的遍歷均勻性[6]。
因此,本文在鬣狗算法迭代初期進(jìn)行混沌初始化,選用Tent映射產(chǎn)生的混沌序列來(lái)改進(jìn)SHO算法,基于混沌Tent映射理論產(chǎn)生鬣狗種群的初始位置,使其均勻地分布在搜索空間內(nèi),以增加個(gè)體的多樣性,增大跳出局部最優(yōu)的概率和對(duì)解空間進(jìn)行深入搜索的能力,有助于提高求解效率和質(zhì)量[7]。Tent映射數(shù)學(xué)表達(dá)式為:
(16)
經(jīng)伯努利位移變換后可得:
yt+1=(2yt)mod1
(17)
標(biāo)準(zhǔn)鬣狗優(yōu)化算法的控制因子h采用的是線性遞減策略,但是算法迭代過(guò)程實(shí)質(zhì)上是非線性變化的,控制因子h線性遞減的方式不能準(zhǔn)確地體現(xiàn)出實(shí)際的優(yōu)化搜索過(guò)程。因此,本文引入一種新的遞減方式,具體描述如下所示:
(18)
式中:t為當(dāng)前迭代次數(shù);NI表示最大迭代次數(shù);Q表示衰減系數(shù),取值范圍為[0,10]并取整,Q越大,對(duì)應(yīng)的控制因子h衰減越劇烈。改進(jìn)后的控制因子h隨著迭代次數(shù)從5到0呈非線性遞減。在迭代初期,改進(jìn)后的控制因子h遞減緩慢,呈漸進(jìn)搜索狀態(tài),衰減性優(yōu)于原始的控制因子,便于更好地尋找全局最優(yōu)解。在后期,改進(jìn)的控制因子h的衰減程度開(kāi)始提高,搜索速度加快,并向最優(yōu)解靠近,有助于提高搜索到的局部最優(yōu)解的精確性。因此,這種非線性收斂因子更符合算法的實(shí)際收斂過(guò)程,進(jìn)一步增強(qiáng)了算法全局尋優(yōu)能力[8]。
萊維飛行策略屬于一類非高斯隨機(jī)過(guò)程,其特點(diǎn)是隨機(jī)性比較強(qiáng),飛行的步長(zhǎng)滿足一個(gè)重尾的穩(wěn)定分布。在飛行過(guò)程中,前期大步長(zhǎng)后期小步長(zhǎng),不僅擴(kuò)大了種群的多樣性,也使種群在小范圍內(nèi)可以更好地收斂于全局最優(yōu)解。萊維飛行位置更新公式為:
xi(t+1)=xi(t)+α⊕Levy(s)i=1,2,…,n
(19)
Levy(s)~u=t-1-β
(20)
式中:s表示步長(zhǎng),指數(shù)變量取值范圍一般為0<β≤2,本文取值β=1.5。
(21)
式中:u、v均服從標(biāo)準(zhǔn)正態(tài)分布:
(22)
(23)
式中:Γ為積分運(yùn)算,是標(biāo)準(zhǔn)的Gamma函數(shù)。
研究表明,萊維飛行可以避免出現(xiàn)局部徘徊現(xiàn)象,引入萊維飛行,可以擴(kuò)大種群的多樣性以及種群搜索范圍,有助于算法跳出局部最優(yōu),提高算法的尋優(yōu)能力,從而達(dá)到提高全局最優(yōu)的目的[9]。因此,為了增強(qiáng)鬣狗個(gè)體之間的信息交流,將萊維飛行策略引入鬣狗優(yōu)化算法中,并作用于隨機(jī)因子r1和r2中。鬣狗優(yōu)化算法引入萊維飛行策略后的包圍機(jī)制具體描述如下:
Dh=|B·Pp(x)-P(x)|
(24)
P(x+1)=Pp(x)-E·Dh
(25)
搖擺因子:
B=2·Levy·r1
(26)
收斂因子:
E=2·h·Levy·r2-h
(27)
(28)
(29)
式中:常數(shù)因子α∈U(0,1);(LBj,UBj)表示第j個(gè)決策變量的動(dòng)態(tài)邊界。
LBj=min(xi,j)
(30)
UBj=max(xi,j)
(31)
式中:min(xi,j)、max(xi,j)分別表示鬣狗種群中第j維個(gè)體的最小值和最大值。
在精英反向?qū)W習(xí)策略中,可通過(guò)對(duì)常數(shù)因子α隨機(jī)取值生成多個(gè)不同的反向精英鬣狗個(gè)體來(lái)構(gòu)造反向精英鬣狗種群,這樣有利于搜索反向精英鬣狗個(gè)體所處的領(lǐng)域空間,提高算法的局部搜索能力。當(dāng)反向解超出范圍(LBj,UBj)失效時(shí),需要在邊界內(nèi)生成一個(gè)隨機(jī)位置來(lái)進(jìn)行越界復(fù)位操作,具體描述為:
xj=rand(0,1)·(LBj,UBj)
(32)
算法執(zhí)行過(guò)程中,EOBL策略擇優(yōu)保留最優(yōu)鬣狗個(gè)體,不代表每一次迭代都會(huì)進(jìn)行更新。重復(fù)無(wú)篩選地進(jìn)行反向?qū)W習(xí),會(huì)增加計(jì)算量,影響算法收斂速度,此時(shí)最優(yōu)鬣狗個(gè)體更新效果會(huì)下降。因此,本文引入執(zhí)行精英反向?qū)W習(xí)的概率p1對(duì)反向?qū)W習(xí)的執(zhí)行前提加以有效控制,取值為0.6。改進(jìn)后的鬣狗優(yōu)化算法基本思想是:當(dāng)隨機(jī)數(shù)小于p1設(shè)置值時(shí),則執(zhí)行精英反向?qū)W習(xí)策略,反之則不執(zhí)行。此時(shí)的新解更新機(jī)制具體描述如下:
(33)
式中:rand表示[0,1]上均勻分布的隨機(jī)數(shù)。
改進(jìn)的鬣狗算法流程圖如圖1所示。
圖1 改進(jìn)鬣狗優(yōu)化算法
采用改進(jìn)鬣狗優(yōu)化算法結(jié)合Otsu多閾值分割思想對(duì)伯克利彩色圖像進(jìn)行有效處理,并將該方法與PSO、SCA、GWO、SHO及WOA等算法的分割效果進(jìn)行對(duì)比,驗(yàn)證所選改進(jìn)算法的可行性。
(1) 峰值信噪比(PSNR)。計(jì)算比較分割后圖像與原圖的PSNR值,PSNR值越大,則失真越少,說(shuō)明該算法在多閾值分割應(yīng)用上的性能越好[12-13]。PSNR計(jì)算過(guò)程如下:
(34)
(35)
(2) 特征相似性(FSIM)。特征相似性為一種基于圖像的相位一致性與圖像的空域梯度特征來(lái)評(píng)價(jià)圖像質(zhì)量的指標(biāo)[14]。
(36)
式中:SL(x,y)用來(lái)評(píng)價(jià)圖像的相似性;PCm(x,y)表示相位相似性;x∈X、y∈Y表示圖像的整個(gè)空域。
為減小算法隨機(jī)性的影響,提高實(shí)驗(yàn)的公平性,實(shí)驗(yàn)仿真環(huán)境均設(shè)置為Windows7系統(tǒng),Intel(R)pentium(R)CPUG3260,內(nèi)存均為3.30GHz,仿真軟件為MATLAB R2014b。實(shí)驗(yàn)中測(cè)試函數(shù)決策變量的維數(shù)均設(shè)置為30,最大迭代次數(shù)設(shè)置為10000,種群規(guī)模設(shè)置為30。所有算法的參數(shù)設(shè)置如表1所示。
表1 算法參數(shù)設(shè)置
為檢驗(yàn)鬣狗優(yōu)化算法及改進(jìn)的鬣狗優(yōu)化算法在圖像多閾值分割方面的可行性及分割精度的優(yōu)越性,選取6幅伯克利經(jīng)典圖像進(jìn)行多閾值分割實(shí)驗(yàn),采用優(yōu)化算法對(duì)最佳閾值分割點(diǎn)進(jìn)行尋優(yōu),獲得每幅圖像的最佳閾值及其他評(píng)價(jià)指標(biāo)值,并與PSO、SCA、GWO、WOA、SHO等算法進(jìn)行比較。通過(guò)算法的分割時(shí)間、最佳適應(yīng)度值、PSNR值和FSIM值四種性能指標(biāo)來(lái)評(píng)估ISHO算法的性能與其他五種的差異。伯克利測(cè)試圖像如圖2所示。
(a) Starfish (b) Dog (c) Horse
(d) Tiger (e) Bridge (f) Flower圖2 伯克利經(jīng)典圖像
所有圖像分割后的實(shí)驗(yàn)結(jié)果依次為閾值n={2,3,4,5}時(shí)采用PSO、SCA、GWO、WOA、SHO及ISHO算法分割后的結(jié)果,表2、表3、表4及表5分別為基于Otsu的PSO、SCA、GWO、WOA、SHO及ISHO算法的分割時(shí)間、最佳適應(yīng)度值、PSNR值和FSIM值。
表2 各算法分割時(shí)間 s
表3 各算法最佳適應(yīng)度值
續(xù)表3
表4 各算法PSNR值
表5 各算法FSIM值
(1) 分割時(shí)間:對(duì)比分析表2的算法分割時(shí)間可以發(fā)現(xiàn),6種算法的分割時(shí)間在閾值數(shù)目相同時(shí),GWO算法分割時(shí)間最短,WOA、SHO和ISHO算法時(shí)間相近,PSO算法耗費(fèi)時(shí)間遠(yuǎn)長(zhǎng)于其他算法。隨著閾值數(shù)目的增加,計(jì)算量增大,算法復(fù)雜度呈指數(shù)次冪增長(zhǎng)趨勢(shì),運(yùn)行時(shí)間也隨之增加,當(dāng)閾值數(shù)目n=3、4、5時(shí),PSO算法所用時(shí)間明顯增加,依舊大于其他算法,ISHO算法分割時(shí)間和效率仍保持一定優(yōu)勢(shì)。實(shí)驗(yàn)表明,同PSO、SCA、GWO、WOA及SHO算法相比,ISHO算法在分割速度及效率上具有明顯優(yōu)勢(shì),能夠快速完成彩色圖像多閾值分割的任務(wù)。
(2) 適應(yīng)度值:由表3可知,分割閾值數(shù)目相同時(shí),6種算法的求解質(zhì)量(適應(yīng)度值)相近,其中PSO和ISHO的適應(yīng)度值差距極小,求得的最優(yōu)閾值基本相同。
(3) PSNR值:結(jié)合表4可知,當(dāng)閾值數(shù)目n=2時(shí),所有算法的PSNR值基本一致,分割后圖像效果基本一致,差別不明顯,隨著閾值數(shù)目的增多,當(dāng)閾值數(shù)目n等于3、4、5時(shí),6種算法的PSNR值大小順序?yàn)镮SHO>SHO>GWO>SCA>PSO>WOA,ISHO算法的分割性能優(yōu)于其他算法。
(4) FSIM值:由表5可知,隨著閾值的增加,6種算法分割后圖像的FSIM數(shù)值均逐漸增加,ISHO算法分割后的特征相似性指標(biāo)FSIM數(shù)值較大,說(shuō)明分割后的圖像與原圖的相似度較高,圖像失真度較小,分割效果較好。
實(shí)驗(yàn)結(jié)果表明,改進(jìn)鬣狗優(yōu)化算法能取得與粒子群等群智能算法等同的分割效果,在閾值較多時(shí)不易早熟,穩(wěn)定性更好。與PSO、SCA、GWO、SHO及WOA算法相比,收斂速度更快,閾值尋優(yōu)質(zhì)量較高,且不易陷入局部最優(yōu),彩色圖像多閾值分割效果較好,分割后的目標(biāo)圖像更加適合后續(xù)的圖像處理。
鬣狗優(yōu)化算法具有原理簡(jiǎn)單、收斂速度快等優(yōu)點(diǎn),同時(shí)也存在諸多不足,如在高維復(fù)雜優(yōu)化問(wèn)題時(shí)存在全局搜索能力差、易早熟,以及傳統(tǒng)多閾值圖像分割方法中存在的閾值選擇不準(zhǔn)確、求解效率低等問(wèn)題。針對(duì)這些不足,本文通過(guò)引入混沌初始化策略、非線性收斂因子調(diào)整策略、萊維飛行策略及精英反向?qū)W習(xí)策略,提出了改進(jìn)的鬣狗優(yōu)化算法,并通過(guò)伯克利經(jīng)典圖像分割測(cè)試,驗(yàn)證改進(jìn)后算法的高效性和可行性。實(shí)驗(yàn)結(jié)果表明ISHO具有較強(qiáng)的工程實(shí)用性。