賈鶴鳴,李 瑤,姜子超,孫康健
(1.三明學院信息工程學院,福建三明 365004;2.東北林業(yè)大學機電工程學院,哈爾濱 150040)
(*通信作者電子郵箱jiaheminglucky99@126.com)
森林火災是指超出了人的控制范圍后,在林場內肆意擴散的林火行為,這種自然災害因其突發(fā)性高、破壞力強等特點,導致撲滅和救援工作較為困難。它不僅會對森林造成巨大破壞,還會對整個森林生態(tài)系統(tǒng)和附近的居民造成災難性打擊,所以森林防火的重要性不言而喻[1]。為觀察森林情況,人們從傳統(tǒng)的人力巡山到使用輕便靈活的無人機,或在林場安置紅外攝像頭等方式對森林實時監(jiān)控,其中絕大多數技術手段都需要對圖像中火源部分進行分割提取,從而分辨出火災確切位置及火勢蔓延程度[2]。圖像分割是從圖像處理到圖像分析的重要過程,其目的在于將給定的圖像分成若干個特定區(qū)域并分割出感興趣的目標,其分割質量將對后續(xù)識別分析產生重要影響[3]。目前,常用的圖像分割方法主要有:閾值分割、區(qū)域生長、邊緣檢測等,其中,閾值分割由于其簡單高效且性能穩(wěn)定的特點,被廣泛應用在林火圖像分割領域。2018年,胡加鑫等[4]為監(jiān)測森林火災的狀況,使用鯨魚算法結合的Otsu法對林火圖像進行多閾值分割;2019年,胡鑫等[5]將因子分析與深度學習的長短期記憶網絡結合對林火圖像分割,提取火焰及背景圖像的特征進行訓練得到分類結果,分割效果較好。
為解決多閾值圖像分割算法存在的計算量大、運算時間較長等問題,諸多學者采用元啟發(fā)式優(yōu)化算法對多閾值圖像分割進行研究:程述立等[6]提出了群智能算法優(yōu)化結合熵的最大類間方差法,既降低了計算復雜度又具有較好的抗噪能力;謝亮[7]則提出基于粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法和信息熵的圖像分割方法,從而實現對醫(yī)學圖像的準確分割,具有較好的分割效果;石玲玉等[8]利用和聲搜索算法(Harmony Search Algorithm,HSA)實現對木材死節(jié)的圖像分割,使得木材缺陷的識別能力得到增強;文獻[9]中提出基于蝙蝠算法(Bat Algorithm,BA)的多閾值圖像分割,通過結合遺傳交叉操作和智能慣性權重,增強搜索能力使閾值的選取更為準確;文獻[10]通過改進花授粉算法(Flower Pollination Algorithm,FPA)提高算法的局部搜索能力并將其應用到多閾值圖像分割中,提高了所選閾值的質量并加快圖像分割速度。雖然上述研究所采用的元啟發(fā)式算法均有一定優(yōu)勢,但在實際應用中依舊存在著由于林火圖像復雜而造成閾值選取不準確、圖像分割效果不足的問題。為更好地對林火圖像進行分割,本文提出一種基于精英反策略和萊維飛行的改進共生生物搜索優(yōu)化(Modified Symbiotic Organisms Search,MSOS)算法的多閾值RGB圖像分割方法。
共生生物搜索(Symbiotic Organisms Search,SOS)算法是Cheng 等[11]提出的一種基于生物學中共生現象的啟發(fā)式搜索算法。該算法具有控制參數少、操作簡單、容易實現、穩(wěn)定性好且優(yōu)化能力強的特點,但也存在易早熟、后期搜索遲滯等問題,因此需要進一步優(yōu)化。精英反策略(Elite Opposite Based Learning,EOBL)概念由Tizhoosh[12]首先提出,主要是從精英反向解和原精英解中選取優(yōu)秀的解作為下一代的種群,將其作為策略引入到其他算法中能夠避免算法易早熟的問題并提高算法的收斂精度。萊維飛行(Levy Flight)本質是一種滿足萊維分布的隨機步長,將其應用到其他算法中可以在擴大搜索范圍、跳出局部最優(yōu)的同時保持較快的收斂速度[13]。
本文主要研究內容如下:首先,將萊維飛行引入到SOS算法中,提高優(yōu)化算法的收斂精度;其次,將精英反策略引入到SOS 的共棲階段,豐富種群的多樣性并擴大算法的搜索空間;然后,將MSOS 算法應用到圖像分割中最佳閾值的選取問題上,通過優(yōu)化算法尋優(yōu)找到RGB 圖像的最佳閾值,從而實現對林火圖像的準確分割;最后,對4 幅林火圖像進行實驗測試,采用峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)、特征相似性指數(Feature SIMilarity index,FSIM)和函數收斂曲線圖等指標來評價優(yōu)化效果,實驗結果表明,本文提出的基于MSOS 算法的多閾值圖像分割方法可以清晰完整地對各環(huán)境下的火源區(qū)域進行分割,并且在各項指標上也十分優(yōu)異,具有良好的分割效果,能夠為后續(xù)圖像分析奠定基礎。
標準SOS模擬了自然界中的個體間交互行為[11]。共生指兩種或多種不同生物物種之間的長期相互作用,可以是兩個個體完全依賴,也可以是個體有選擇地生活在一起使彼此都能獲益,或是某個體寄生于另一個體中。SOS 算法主要分為互利階段、共棲階段和寄生階段,其基本原理為:
1)互利階段。
個體Xi被認為是生態(tài)系統(tǒng)的第i個成員。另一個體Xj從生態(tài)系統(tǒng)中隨機選擇以用來和Xi交互。在生態(tài)系統(tǒng)中,兩個個體都保持著交互關系。Xi和Xj在交互后的更新公式分別由式(1)和式(2)表示,其中互利向量RMV(Mutual Vector,MV)的表達式如式(3)所示:
式中:RMV代表了Xi和Xj的交互關系;rand(0,1)是[0,1]的隨機數;Xbest為最優(yōu)個體;bf1和bf2為利益因子,代表著個體從相互關系中獲得的利益水平。bf1和bf2的值可以隨機選擇為1或2,表示可能得到部分受益或完全受益。
2)共棲階段。
指從生態(tài)系統(tǒng)中隨機選擇一個單獨的Xj與Xi交互,這種交互使得Xi受益,而Xj既不受益也不受到傷害。由這種相互作用產生的新個體則用式(4)所描述:
其中:Xbest-Xj表示Xj對Xi提供的好處,即Xj幫助Xi提高對生態(tài)系統(tǒng)的適應程度。
3)寄生階段。
從生態(tài)系統(tǒng)中選取Xi作為寄生向量,利用隨機向量對自身進行復制和修改,生成變異載體RPV(Parasite Vector,PV)。如果變異載體比宿主Xi具有更好的適應值,它可能會破壞宿主并將其替代,若相反則說明宿主對變異載體具有免疫性從而被保留下來,變異載體被淘汰,具體如式(5)和(6)所示:
其中:pick為變異體,ub為搜索上界,lb為搜索下界。
精英反策略是進化計算領域的一個搜索策略,其主要思想為:同時對搜索空間內的精英解及其反向映射解進行評價,并從這兩個備選解中選取較好的解作為下一代個體[12];同時,將個體生物中最優(yōu)適應度值對應的解定義為最優(yōu)個體,表示為xi=(Xi1,Xi2,…,XiD)。共生生物群體中經過反向映射得到的個體可以表示為另外,xn和滿足式(7):
其中:n是種群個數,D是搜索空間的維度,k∈U(0,1),daj和dbj是第j個決策向量的動態(tài)邊界,使用式(8)進行計算:
由于收縮邊界可能導致算法陷入局部最優(yōu),因此在本文中每100次迭代更新一次daj和dbj。同時,動態(tài)邊界可能使反向映射個體生物跳出邊界,當xi,j<dai或者>dbj則應用式(9)進行約束:
在共生生物搜索算法中引入精英反策略,豐富了種群的多樣性,擴大了算法的搜索空間,提高了其鄰域搜索能力和得到優(yōu)秀解的概率,從而使優(yōu)化算法的綜合性能得到增強。
萊維飛行最早由Levy 提出,由Benoit Mandelbrot 對其進行補充描述完成的搜索機制[13]。萊維飛行是一種特殊的隨機步長方法,它的步長總是很小,但是偶爾也會出現大的跳動,其位置更新公式可以用式(10)表示:
其中:β為步長因子,RLevy決定行進方向和步長,運算符⊕表示點對點的乘法,當前位置是由之前位置更新的概率決定的。關于RLevy隨機分布如式(11):
其中s為隨機的萊維步長,而由Mantegna 提出的算法中,萊維飛行的隨機步長s可以用式(12)進行描述:
參數β=1.5,μ~(0,,ν~N(0,1)都表示gamma 函數,σμ的數學表達式如(13)所示:
引入萊維飛行策略后,前期長步長的飛行提高了種群多樣性,擴大了搜索范圍,避免其陷入局部最優(yōu);后期短步長的飛行使得種群在局部最優(yōu)解附近收斂。
精英反策略能夠在最優(yōu)解的基礎上更好地對未知區(qū)域進行探索,可以有效增加SOS算法的局部搜索能力,并且可以預防局部最優(yōu)問題。因此,由精英反策略核心公式(7)對SOS算法的共棲階段進行改進,由式(7)可知,精英反向映射解應為=k*(daj+dbj)-xn,j,而根據式(4)知共棲階段產生的新個體=Xi+rand(-1,1) ×(Xbest-Xj),因此,第i個共生生物在搜索空間中的精英反向解,如式(14)所示:
其中:ub和lb為共生生物搜索域的上界和下界,Xbest為當前的最優(yōu)共生生物個體,r為[0,1]的隨機數。
同時,對于處理高維和多模態(tài)優(yōu)化問題時,為了提高全局搜索能力,本文提出了將萊維飛行引入共生生物搜索算法中,提高其全局搜索能力。根據式(10)可知,萊維飛行主要是隨機步長,因此本文將Xbest與Xj的差值作為步長因子,即β=Xbest-Xj,改進的數學公式如下:
萊維飛行軌跡方法的引入明顯擴大共生生物的搜索范圍,增強搜索軌跡的隨機性,大幅提高SOS 算法的搜索能力,從而避免進入局部最優(yōu)值。這種方法不僅提高了SOS的搜索強度,也提高了算法的收斂速度。
基于最大熵法的圖像多閾值分割法最先由Pun[14]提出,將圖像的灰度直方圖視為一種概率分布,計算出它的最大熵來對應圖像的最優(yōu)閾值。而Kapur 等對基于最大熵的閾值分割算法提出改進,將信息論中Shannon 熵的概念引入到圖像的閾值分割中,以灰度直方圖中的灰度作為變量,計算灰度直方圖的熵,找出使得各類總熵最大時的閾值組合[15]。這種方法不僅計算更加簡單,還能夠得到較好的多閾值分割結果,因此應用較為廣泛。
當灰度值處于[0,1,…,L-1]內時,圖像的熵見式(16):
假設任意選定一組已知的閾值組合[t1,t2,…,tn](0 ≤t1≤t2≤…≤tn≤L-1),將圖像劃分為n+1 部分,則其每一部分均可用熵表示其對應的概率分布,表示方法如式(17)~(19):
此時,圖像灰度值的最大熵如式(20):
即使式(20)取得最大值時對應的n個閾值[t1,t2,…,tn]即為分割閾值的最優(yōu)解。
為解決多閾值Kapur 熵圖像分割算法運算時間長、分割精度低的問題,本文對多閾值的搜索過程進行優(yōu)化,改進算法應用于多閾值Kapur圖像分割算法的數學模型如式(21):
本文采用共生生物搜索算法對閾值的搜索過程求解最優(yōu)值,將對圖像進行多閾值分割的問題轉化為對目標函數求取最優(yōu)解的問題。所以,本文將式(20)作為共生生物搜索算法的適應度函數,將式(21)中的Xj作為共生生物搜索的食物源,通過共生生物對食物搜索捕食,更加快速找到式(16)的最大值,此時,得到的[t1,t2,…,tn]即為圖像分割出的多個閾值。由于共生生物搜索算法存在容易陷入局部最優(yōu)的問題,對其加入萊維飛行,增強原有算法的全局搜索能力,使共生生物搜索算法能夠跳出局部最優(yōu),更好地找到全局最優(yōu)解。關于本文閾值分割算法的整體流程如圖1所示。
圖1 本文圖像分割算法流程Fig.1 Flowchart of the proposed image segmentation algorithm
實驗利用4 幅林火圖像作為實驗樣本評價混合算法的性能。如圖2所示,圖(a)為白天無遮擋的近距離火源(fire1);圖(b)為夜間煙塵、森林遮擋的遠距離火源(fire2);圖(c)為白天以森林為背景的遠距離火源(fire3);圖(d)為夜間背景簡單的近距離火源(fire4)。
圖2 林火測試圖像Fig.2 Forest fire test images
在實驗中,種群大小設置為30,最大迭代次數取500。選擇標準SOS 算法與引言所提到的PSO 算法、HSA、BA、FPA 作為對比算法,其參數設置列在表1 中。實驗仿真環(huán)境均為Windows 7 系統(tǒng),仿真軟件為Matlab2016b,內存微處理器CPU為2.7 GHz。
表1 所有對比算法實驗參數Tab.1 Experimental parameters of all comparison algorithms
為驗證圖像分割的質量,需要對分割效果圖進行圖像質量評價。對于客觀評價方式,通常采用的兩種方法是峰值信噪比(PSNR)和特征相似性指數(FSIM)[16]。
1)峰值信噪比(PSNR):基于分割前后圖像中對應像素點間的均方差(Mean Square Error,MSE)來比較對應圖像相似性的圖像評價指標。PSNR 值越大,說明失真越少。PSNR 和MSE的公式定義如(22)、(23)所示:
2)特征相似度(FSIM):基于人類視覺系統(tǒng)和圖像的低級特征來理解圖像的一種較新的特征相似性指標。FSIM 越接近1,說明分割后的圖像與原圖像越相似。
其中:Ω表示全部圖像空間域,PCm(x)表示相位一致性,SL(x)為圖像相似性。
PC1(x)和PC2(x)分別表示參考圖像和被測圖像的相位一致性。
式中:SPC(x)代表圖像的特征相似性;SG(x)代表圖像的梯度相似性;G1(x)和G2(x)分別代表參考圖像和被測圖像的梯度幅值,α、β、T1和T2均為常量。
由于閾值較低時各算法的分割效果均較差,并不能很好地解決圖像分割任務,因此對林火圖像的閾值設置為7。同時,為更直觀地觀察數據之間的差異性,圖3 和圖4 給出基于30次平均結果的PSNR和FSIM的曲線。
圖3 林火圖像的PSNR曲線Fig.3 PSNR curves of forest fire images
圖4 林火圖像的FSIM曲線Fig.4 FSIM curves of forest fire images
從圖3 可以明顯看出,閾值從4~7 時,MSOS 算法得到的數值均明顯高于其他算法,說明MSOS 算法的穩(wěn)定性較高,得到的閾值更加精準,分割后的圖像與原圖相似度更高,對目標區(qū)域的分割更加準確。由圖3 可看出,fire2 和fire4 中的FPA在閾值較高時得到的PSNR 值明顯降低,說明其穩(wěn)定性較差;由圖4 可看出,PSO 算法在各閾值時的FSIM 值均較低,MSOS算法在各閾值時得到的FSIM 值均高于其他算法。因此,可以證明本文算法應用到識別森林中的火源識別問題時,可以又快又準地發(fā)現火源,有效地預防大規(guī)模森林火災的發(fā)生。
MSOS算法與其他算法的30次平均收斂曲線如圖5所示,其中MSOS 的收斂曲線用黑色實線標記以區(qū)分。從圖中可以看出,MSOS 在SOS 算法的基礎之上取得了很大的改進,并且具有很好的魯棒性。其他算法如FPA、PSO、BA,容易陷入局部最優(yōu),很難確定最優(yōu)適應度函數值。收斂曲線方面:從圖可以看到,在第200 代中,MSOS 算法比其他算法更快地獲得最大目標值或接近理論最大目標值;在第250 代之后,改進的MSOS曲線始終是一條平滑的曲線,其他算法也基本上停止更新;傳統(tǒng)的SOS 種群更新速度較慢,且有一定的時間間隔,收斂曲線是階梯形的,而不是上升的平滑曲線;FPA 和BA 整體波動較大,而PSO算法波動較小,它們所得到的最優(yōu)值偏差較大,有的屬于局部最優(yōu)值??偟膩碚f,與其他元啟發(fā)式優(yōu)化算法相比,MSOS提供了一個有競爭力的解決方案。
圖5 林火圖像的Kapur熵函數收斂曲線Fig.5 Convergence curves of Kapur entropy function of forest fire images
圖6 為各算法分割后的效果,從圖(a)和(d)的分割結果圖可以看出,火源區(qū)域在林火圖像中較為突出時,基于PSO和FPA 的圖像分割結果未分割出完整火源,相比之下只得到了小部分火源區(qū)域,存在欠分割現象,效果較差;從圖(b)的分割結果圖可以看出,當林火圖像亮度較低、背景較為復雜時,MSOS 以外算法分割出的圖像未能很好地將煙、火分割開,無法準確獲取具體火源區(qū)域,存在過分割現象;從圖(c)和(d)的分割結果圖可以看出,火源顏色較為明亮導致背景與目標區(qū)域亮度相差較大時,基于FPA 分割出的圖像能較好地分出大面積火源,但仍不完整。通過比較可以得出本文算法分割精度較高,可以精確地將火源從復雜的煙塵、森林背景中分割出來。綜合對比,基于MSOS 的圖像多閾值分割方法在不同環(huán)境下均能完整地分割出火源區(qū)域,對森林火災圖像的分割效果較好。
圖6 閾值為7時各算法分割結果Fig.6 Segmentation results of different algorithms when the threshold value is 7
綜上所述,與其他算法相比MSOS 具有更高的優(yōu)化精度、更好的魯棒性和穩(wěn)定性,也證明了該算法的有效性和優(yōu)越性,實現了對標準SOS 算法的改進。對于選取的林火圖像,使用分割方法只能將圖像分割為多個區(qū)域,無法得到所有的火源區(qū)域。因此為得到每個獨立、完整的火源區(qū)域,需要對多閾值分割后的圖像進行處理,所以為從分割后的圖像中分割出具體火源部分,本文進行了如下操作:
1)從分割得到的n+1 個區(qū)域中選取火災主體區(qū)域并將其轉化為邏輯陣。
2)對選取的區(qū)域進行腐蝕、膨脹等形態(tài)學操作。
3)將得到的圖像與原圖像矩陣點乘,即可得到分割后的火焰圖像如圖7所示。
圖7 火源的RGB圖像Fig.7 RGB images of fire sources
由圖7 可以觀察到,本文算法能夠準確地將火源區(qū)域從圖像中提取出來,方便后續(xù)研究。同時本文算法能夠有效地對圖像中不同形態(tài)、背景的火源區(qū)域進行分割,說明該算法處理復雜圖像的分割性能較強。實驗證明,MSOS能夠有效地將林火區(qū)域分割并顯示出來,也說明MSOS 算法能夠勝任復雜林火圖像的分割問題,更加準確地找到火源。
針對傳統(tǒng)的SOS 算法在高維度時易陷入局部最優(yōu)等問題,本文將精英反策略和萊維飛行引入到SOS 算法,得到MSOS 并將該方法應用于林火圖像分割中。通過對比標準SOS 和PSO、HSA、BA、FPA 等算法,可以證明相較于其他優(yōu)化算法來說,MSOS 算法能更好地分割林火圖像,其跳出局部最優(yōu)的能力和分割能力也更強。通過使用形態(tài)學優(yōu)化獲得了每幅林火圖像中獨立完整的火源區(qū)域,證明了MSOS 在實際工程問題中的實用性。在未來的研究中還可以針對擴大搜索范圍并保留精英個體的問題,嘗試引入其他策略來調整動態(tài)邊界。