馬大勇,李安卓
(沈陽航空航天大學(xué),遼寧 沈陽 110136)
圖像分割就是依照?qǐng)D像的特征將圖像中的目標(biāo)區(qū)域進(jìn)行分割的一種手段,利用該方法可有效地對(duì)圖像進(jìn)行分析以及理解,其中圖像的閾值分割是圖像分割最常用的手段,在圖像灰度值的基礎(chǔ)上得出最優(yōu)閾值,根據(jù)閾值對(duì)圖像進(jìn)行區(qū)域劃分,從而分段提取所需內(nèi)容,圖像分割是機(jī)器視覺等領(lǐng)域的重要基礎(chǔ),因?yàn)閳D像中帶有色彩以及紋理等其它復(fù)雜因素,無法簡單地提取出目標(biāo)信息,因此必須在用戶的幫助下提取圖像的目標(biāo)信息,即交互式圖像分割。目前交互式圖像分割的閾值選取較為簡單,但無法保證信息的完整,為提高圖像分割性能,就多閾值交互式圖像分割展開研究。
呂福起等人在模糊熵的基礎(chǔ)上構(gòu)建目標(biāo)函數(shù),將目標(biāo)函數(shù)視為優(yōu)化手段,并在粒子群優(yōu)化算法的基礎(chǔ)上設(shè)計(jì)多層次圖像閾值分割方法,以此實(shí)現(xiàn)香農(nóng)熵或模糊熵最大化,完成圖像分割優(yōu)化。雷翔霄等人首先利用等價(jià)三維熵法進(jìn)行計(jì)算,并保證其中不含對(duì)數(shù),其次將此算法中的等價(jià)性能進(jìn)行計(jì)算并驗(yàn)證,最后利用鯨魚優(yōu)化算法運(yùn)算出圖像分割的最優(yōu)閾值,從而加強(qiáng)閾值分割效率,實(shí)現(xiàn)圖像分割優(yōu)化。曲蘊(yùn)慧等人利用人工蜂群優(yōu)化的目標(biāo)函數(shù)對(duì)圖像分割進(jìn)行優(yōu)化,其中將圖像離散度矩陣跡視為目標(biāo)函數(shù),以此計(jì)算出二維OSTU的最優(yōu)分割閾值,基于最優(yōu)閾值進(jìn)行圖像分割,實(shí)現(xiàn)圖像分割優(yōu)化。
以上三種圖像分割優(yōu)化方法沒有在圖像分割前進(jìn)行圖像預(yù)處理,導(dǎo)致圖像中的噪聲過多,圖像邊緣十分不清晰,即使利用其它算法進(jìn)行優(yōu)化,仍不能有效地將圖像目標(biāo)區(qū)域與背景進(jìn)行分離,存在圖像分割效果差與圖像分割性能不佳的問題。
為了解決上述方法中存在的問題,提出基于Prewitt算法的多閾值交互式圖像分割優(yōu)化方法。期望通過該方法實(shí)現(xiàn)對(duì)圖像的精準(zhǔn)分割,提升分割效果。
圖像分割的一大難點(diǎn)就是圖像中存在紋理以及顏色等復(fù)雜信息,目前大多分割方法為簡化運(yùn)算會(huì)忽略這些因素,導(dǎo)致分割結(jié)果出現(xiàn)過分割的情況,因此在進(jìn)行圖像分割前需要對(duì)圖像進(jìn)行去噪等預(yù)處理,以此保證分割效果。
對(duì)于圖像去噪,最常用的方法就是平滑濾波處理,該方法可最大程度地完成去噪,還可去除較小的紋理,但該方法不能有效地處理較大紋理,且會(huì)虛化圖像邊緣,而圖像分割預(yù)處理的目的就是保存圖像的邊緣區(qū)域,將內(nèi)部偽邊緣進(jìn)行抑制處理,進(jìn)而獲取更好的圖像分割效果,本文利用自適應(yīng)算法對(duì)圖像進(jìn)行預(yù)處理。
假設(shè)圖像中有一像素點(diǎn),其坐標(biāo)為(,),在自適應(yīng)原理的基礎(chǔ)上得出點(diǎn)的梯度值調(diào)節(jié)表達(dá)式為
()=|?()|×()
(1)
式中,()代表點(diǎn)的灰度值,|?()|代表點(diǎn)的梯度值,()代表梯度調(diào)節(jié)因子。
梯度值調(diào)節(jié)因子()跟隨像素點(diǎn)的變化而發(fā)生改變,若像素點(diǎn)處于較中心位置,則()較小,反之則較大,因此得出點(diǎn)越處于邊緣位置,()越大。
經(jīng)以上總結(jié)即可得出像素點(diǎn)的位置確定是整個(gè)圖像預(yù)處理過程的關(guān)鍵,因此采用像素距離誤差判斷像素點(diǎn)是處于圖像中心還是預(yù)想邊緣。假設(shè)以像素點(diǎn)為中心的×的圖像區(qū)域?yàn)?,在像素點(diǎn)特征的基礎(chǔ)上將共劃分為類,則某一類內(nèi)的點(diǎn)=(,)到中心與該點(diǎn)到其類別中心的差值表達(dá)式為
()=|(,)-(,)|
(2)
式中,代表類別中的一點(diǎn),且∈,代表類別的中點(diǎn),()代表點(diǎn)到的距離與到的距離之差,(,)代表點(diǎn)到像素點(diǎn)的距離,(,)代表點(diǎn)到點(diǎn)的距離。
其中,中點(diǎn)的表達(dá)式為
(3)
假設(shè)類別內(nèi)全部點(diǎn)的()均值為(),其表達(dá)式為
(4)
式中,()代表類別在區(qū)域內(nèi)的分布情況與像素點(diǎn)的相對(duì)位置關(guān)聯(lián)。
()的數(shù)值越小代表類別內(nèi)點(diǎn)的劃分情況越接近理想狀態(tài),即類別大部分分布在圖像邊緣,其中心點(diǎn)靠近圖像中心,使得圖像邊緣得到增強(qiáng)。
為進(jìn)一步判斷像素點(diǎn)的分布情況,可計(jì)算區(qū)域內(nèi)所有類別的()均值,其表達(dá)式為
(5)
式中,()代表全部類別()的均值,代表區(qū)域的類別個(gè)數(shù)。
均值()的數(shù)值越大代表區(qū)域內(nèi)類別的像素點(diǎn)越來越偏離圖像邊緣,而像素點(diǎn)的位置越接近圖像邊緣,即圖像邊緣得到增強(qiáng),完成圖像的去噪與增強(qiáng)處理。
假設(shè)圖像為(,),其灰度級(jí)最大為(,),最小為()。在照射-反射模型的基礎(chǔ)上可知圖像(,)可利用照射光與反射光進(jìn)行計(jì)算,其表達(dá)式為
(,)=(,)·(,)
(6)
式中,(,)代表自然光線等帶來的照射光,(,)代表反射光。
通常情況下,(,)的光線較均勻,其光線不會(huì)出現(xiàn)強(qiáng)烈的變化,但由于紋理等因素的影響(,)光線會(huì)出現(xiàn)較大的變化,在此特性上得出圖像邊緣以及紋理等特征,進(jìn)而證明(,)與圖像的目標(biāo)區(qū)域的關(guān)聯(lián)較大,將圖像進(jìn)行直方圖均衡化處理可無限接近于(,)的形態(tài)。
圖像的直方圖均衡化變換函數(shù)的表達(dá)式為
(7)
式中,=0,1,∧,-1,代表圖像(,)的灰度級(jí)數(shù)值,代表圖像(,)中灰度級(jí)為的像素值。
基于閾值的圖像分割方法實(shí)質(zhì)就是計(jì)算出閾值,對(duì)圖像特征進(jìn)行劃分,得出目標(biāo)與背景圖像,但這種方法局限性較大,因此在圖像照射-反射模型的基礎(chǔ)上對(duì)閾值圖像分割進(jìn)行優(yōu)化。
為增強(qiáng)圖像的分割效果,在交互式分割方法的基礎(chǔ)上對(duì)圖像的前景以及背景進(jìn)行標(biāo)記,標(biāo)記后對(duì)圖像進(jìn)行訓(xùn)練與擴(kuò)展處理,在此基礎(chǔ)上利用閾值進(jìn)行圖像分割。
交互式圖像分割的主要內(nèi)容就是用戶標(biāo)記與合并兩部分。
1)用戶標(biāo)記
假設(shè)經(jīng)過預(yù)處理后的圖像為描繪出圖像*同質(zhì)量區(qū)域的輪廓,并將其傳送給用戶,用戶可依據(jù)個(gè)人情況進(jìn)行目標(biāo)區(qū)域個(gè)數(shù)的劃分,并利用不同的指令對(duì)其進(jìn)行標(biāo)記,完成圖像的標(biāo)記后得出圖像的表達(dá)式為
(8)
式中,*代表經(jīng)預(yù)處理后圖像中各個(gè)區(qū)域構(gòu)成的頂點(diǎn)集合,(*)代表各個(gè)區(qū)域頂點(diǎn)的標(biāo)記情況,代表被標(biāo)記的頂點(diǎn),-1代表未被標(biāo)記的頂點(diǎn)。
2)合并
將標(biāo)記后的圖像進(jìn)行合并,在合并過程中需要符合以下兩個(gè)要求:
第一點(diǎn),當(dāng)區(qū)域頂點(diǎn)未被標(biāo)記,則該點(diǎn)與最相鄰的鄰近頂點(diǎn)進(jìn)行合并,同時(shí)更新標(biāo)記情況。
第二點(diǎn),當(dāng)區(qū)域頂點(diǎn)被標(biāo)記,該點(diǎn)只能與自己完全相同且被標(biāo)記的頂點(diǎn)進(jìn)行合并。
在算法中,需要在直方圖中找出圖像(,)的雙峰點(diǎn),并計(jì)算出雙峰點(diǎn)中的谷底點(diǎn)相對(duì)應(yīng)的灰度級(jí)值,假設(shè)三個(gè)谷底點(diǎn)為1、2和,其中,閾值=,在此基礎(chǔ)上,對(duì)圖像進(jìn)行分割處理。為進(jìn)一步優(yōu)化圖像分割,在此算法中首先提取雙峰點(diǎn)相應(yīng)的灰度級(jí)中間值,將其視為原始的預(yù)測(cè)閾值,其表達(dá)式為
′=(2+1)2
(9)
式中,′代表原始閾值。
在對(duì)圖像直方圖的分析后可利用圖像均衡化處理進(jìn)行閾值的選取,首先對(duì)原始預(yù)測(cè)閾值進(jìn)行均衡化處理,處理后的閾值表達(dá)式為:
(10)
式中,′代表經(jīng)均衡化處理后的分割閾值。
在式(10)的基礎(chǔ)上即可完成圖像的分割。
為了驗(yàn)證基于Prewitt算法的多閾值交互式圖像分割優(yōu)化方法的有效性,需對(duì)其性能進(jìn)行測(cè)試,選取圖像增強(qiáng)情況、圖像分割效果以及圖像分割性能三個(gè)指標(biāo)進(jìn)行測(cè)試,將文獻(xiàn)[4]方法與文獻(xiàn)[5]方法作為對(duì)比方法,測(cè)試結(jié)果如下所示。在實(shí)驗(yàn)中,為了保證實(shí)驗(yàn)結(jié)果的準(zhǔn)確性與可靠性,通過Matlab軟件對(duì)實(shí)驗(yàn)圖像與數(shù)據(jù)進(jìn)行處理。
圖像受光線等影響會(huì)出現(xiàn)失真等現(xiàn)象,導(dǎo)致圖像邊緣不清晰,以及圖像本身清晰度降低等情況,因此在進(jìn)行圖像分割處理前需對(duì)圖像本身進(jìn)行增強(qiáng)處理,在同一環(huán)境下選取某張圖像利用三種方法對(duì)其進(jìn)行增強(qiáng)處理,其結(jié)果如圖1所示。
圖1 三種方法圖像增強(qiáng)情況
根據(jù)圖1可知,原圖像邊緣十分不清晰,圖像分割對(duì)圖像的清晰度,尤其是圖像目標(biāo)區(qū)域邊緣的清晰度要求較高,在三種方法的增強(qiáng)處理下,圖像清晰度均有所上升,但清晰度最佳的是所提方法,且該方法增強(qiáng)后的圖像邊緣十分清晰,文獻(xiàn)[4]方法、文獻(xiàn)[5]方法的圖像邊緣較原始圖像有所改善。所提方法的圖像增強(qiáng)效果較好的原因是利用自適應(yīng)算法對(duì)像素點(diǎn)中心進(jìn)行準(zhǔn)確定位,將其向邊緣擴(kuò)散,保證了圖像邊緣的清晰度。
圖像分割的目的就是將目標(biāo)區(qū)域與背景有效分割,得出用戶所需內(nèi)容,簡化數(shù)據(jù),判斷圖像分割方法的優(yōu)劣最直觀的實(shí)驗(yàn)就是對(duì)圖像進(jìn)行分割,對(duì)比每種方法得出的圖像分割結(jié)果,隨機(jī)選擇一幅圖像,保證所有條件均相同的情況下,利用三種方法對(duì)其進(jìn)行分割,得出的結(jié)果如圖2所示。
圖2 三種方法的圖像分割結(jié)果
根據(jù)圖2可知,所提方法的圖像分割結(jié)果是最精準(zhǔn)的,將三種分割方法的分割結(jié)果經(jīng)過對(duì)比后發(fā)現(xiàn),文獻(xiàn)[4]分割后的圖像清晰度雖高,但該方法的邊緣分割不出,只能分割出大致輪廓,文獻(xiàn)[5]方法分割出的圖像邊緣過于模糊,不能有效獲取所需內(nèi)容,經(jīng)實(shí)驗(yàn)結(jié)果驗(yàn)證所提方法是最優(yōu)的圖像分割方法。
圖像分割在保證精度的同時(shí)也需要保證分割的效率,即盡可能地縮短圖像分割所消耗的時(shí)間,為保證實(shí)驗(yàn)質(zhì)量,現(xiàn)在同一環(huán)境下選取十組不同數(shù)據(jù),在三種方法的基礎(chǔ)上對(duì)其進(jìn)行分割,并記錄每種方法在分割過程中所消耗的時(shí)間,其結(jié)果如表1所示。
表1 三種方法圖像分割所耗費(fèi)時(shí)間(s)
經(jīng)比較發(fā)現(xiàn),每組實(shí)驗(yàn)中均為所提方法的用時(shí)最短,其圖像分割耗時(shí)最低僅為632s,其余兩種方法分割所消耗的時(shí)間均遠(yuǎn)遠(yuǎn)高于所提方法,進(jìn)一步證明所提方法的高效性。
在圖像分割過程中總會(huì)出現(xiàn)分割失敗的情況,不同的方法其分割成功率也不相同,為驗(yàn)證所提方法的真實(shí)有效性,任選5組實(shí)驗(yàn),每組實(shí)驗(yàn)中共有100幅圖像需要分割,利用三種方法進(jìn)行實(shí)驗(yàn),得出成功率最高的方法即為最優(yōu)分割方法,其實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 不同方法的圖像分割成功率
根據(jù)圖3可知,所提方法的圖像分割成功率是三種方法中最高的,且其成功率較穩(wěn)定,文獻(xiàn)[4]方法和文獻(xiàn)[5]方法的成功率不僅遠(yuǎn)遠(yuǎn)低于所提方法,且這兩種方法的成功率十分不穩(wěn)定,非常不利于圖像的分割,通過對(duì)比驗(yàn)證了所提方法的性能較好。
在網(wǎng)絡(luò)模式識(shí)別與機(jī)器視覺領(lǐng)域中,經(jīng)常會(huì)應(yīng)用到圖像分割方法,模型識(shí)別的最終方式需要根據(jù)圖像分割結(jié)果進(jìn)行判斷。圖像分割的本質(zhì)是提取相應(yīng)的圖像特征數(shù)據(jù)當(dāng)成機(jī)器學(xué)習(xí)的根本,為增強(qiáng)圖像分割性能,提出基于Prewitt算法的多閾值交互式圖像分割優(yōu)化方法,該方法首先對(duì)圖像進(jìn)行去噪和圖像增強(qiáng)處理,其次在Prewitt算法的基礎(chǔ)上優(yōu)化閾值的選取,實(shí)現(xiàn)多閾值交互式圖像分割,解決了圖像增強(qiáng)程度低、圖像分割效果差以及圖像分割性能不佳的問題。