宋亞玲,歐聰杰
(華僑大學(xué) 信息科學(xué)與工程學(xué)院,福建 廈門361021)
Shannon 熵作為描述系統(tǒng)信息量的一種量度,是通信與信號(hào)處理領(lǐng)域的基石[1]。在圖像的閾值分割處理上,以Shannon 熵函數(shù)為優(yōu)化目標(biāo)的方法因其簡(jiǎn)潔、高效的特性吸引了廣泛的關(guān)注[2]。針對(duì)不同的圖像屬性,現(xiàn)已發(fā)展出交叉熵、模糊熵、倒數(shù)熵等不同的理論分支,均有廣泛成功的應(yīng)用[3~5]。近年來,隨著對(duì)圖像成像規(guī)律的深入研究,Albuquerque M P 等人首次在Shannon 熵的基礎(chǔ)上引入Tsallis熵并應(yīng)用于圖像分割[6]。Tsallis 熵具有非廣延性并通過一個(gè)附加參數(shù)q 來描述,在參數(shù)q 趨近于1 時(shí),它將自然退化為Shannon 熵[7],因此,以它為目標(biāo)函數(shù)所構(gòu)造的分割方法要比Shannon 熵具有更大的靈活性和普適性[8],近年來已被廣泛應(yīng)用于醫(yī)學(xué)影像處理[9],儲(chǔ)糧蟲害檢測(cè)[10]等各個(gè)領(lǐng)域。對(duì)于一幅數(shù)字圖片,任意兩個(gè)像素點(diǎn)的灰度之間存在的可能關(guān)聯(lián),將在很大程度上影響整個(gè)圖像的統(tǒng)計(jì)性質(zhì)。因此,采用更一般化的Tsallis 熵對(duì)圖像進(jìn)行統(tǒng)計(jì)分析與閾值分割具有數(shù)理上的合理性。
近年來的大量研究均顯示采用Tsallis 熵的確可以提高圖像的分割質(zhì)量[8~10],本文考慮圖像內(nèi)部灰度值的長(zhǎng)程關(guān)聯(lián),分析q 參數(shù)所產(chǎn)生的影響。同時(shí),針對(duì)一些特定的圖片給出有效的分割方案。
假設(shè)一幅具有n 級(jí)灰度階的圖像大小為M×N 像素點(diǎn),則{pi=ki/(MN),i=1,2,…,n}為該圖像的灰度分布,其中,ki為圖像中灰度值為i 的像素點(diǎn)數(shù)量,則該分布所對(duì)應(yīng)的Tsallis 熵定義如下
其中,q 即為前述的附加參數(shù)。由式(1)可知在q→1時(shí)Sq將還原為Shannon 熵。目前有多種基于Tsallis 熵的圖像閾值分割方法,均能體現(xiàn)q 參數(shù)對(duì)閾值結(jié)果的調(diào)節(jié)作用。但很多時(shí)候該參數(shù)的取值依靠經(jīng)驗(yàn)判斷,并無明確的取值界限,這里以Albuquerque 法[6]為例分析這個(gè)問題。
設(shè)一幅圖像的分割閾值為t(t∈[1,n]),則圖像灰度分布被該閾值分割為兩個(gè)部分,A 和B,它們的Tsallis 熵分別如下
其中
最佳的閾值t*由下列判據(jù)給出[6]
式(5)說明閾值的選取遵循熵極大化的原則,因此
式(6)即為q 參數(shù)取值的下限,是開區(qū)間,因?yàn)?/p>
則不同圖像的灰度分布(具有相同的灰度階n)在q=0 時(shí)將得到相同的Tsallis 熵,基于Tsallis 熵的所有閾值分割法都將失效。另外,由式(1)得
式(8)說明q 的取值過大同樣無法準(zhǔn)確區(qū)分圖像灰度分布中所包含的信息。隨機(jī)選擇四幅常見的測(cè)試圖片(如圖1(a)所示),對(duì)比在不同q 參數(shù)下由式(5)得到的各自分割閾值,如圖1(b)所示。
圖1 q 參數(shù)的有效范圍Fig 1 Effective range of parameter q
圖1 (b)在q→0 的情況下,互不相關(guān)的圖片的分割閾值趨向于一個(gè)固定的值,這與圖像的隨機(jī)性相違背。此外,在2 <q <5 區(qū)間還可看出:四幅圖片的分割閾值幾乎不再對(duì)q 參數(shù)的變化做出響應(yīng),此時(shí)算法已然失效。在q >5 之后,因子pqi 將趨于無窮小量,此時(shí)任意一個(gè)微小的計(jì)算誤差都將對(duì)閾值選取造成顯著影響,由此產(chǎn)生隨機(jī)震蕩的偽閾值。為充分保證Tsallis 熵的有效性,在本文選擇的q 參數(shù)范圍定為0.1≤q≤1.5。
自然界圖片種類繁多,因此,式(5)無法全部適用。例如:在某個(gè)固定背景下的影像系列,因?yàn)槟繕?biāo)的出現(xiàn)具有隨機(jī)性,不會(huì)與固定的背景之間產(chǎn)生像素上的關(guān)聯(lián)。同時(shí),目標(biāo)類的像素點(diǎn)和背景類的像素點(diǎn)各自之間的灰度關(guān)聯(lián)性仍然存在,而且這兩種關(guān)聯(lián)性的強(qiáng)弱未必相同,故這兩部分的熵可分別表示如下
其中,q1,q2分別為目標(biāo)類A 與背景類B 的像素點(diǎn)各自灰度關(guān)聯(lián)的強(qiáng)度。因此,構(gòu)造目標(biāo)函數(shù)如下
即對(duì)A,B 兩部分的熵進(jìn)行比較,選擇的最優(yōu)閾值是讓較小的那個(gè)熵極大化,則另一個(gè)熵即使沒有最大化,也不會(huì)太小,從而實(shí)現(xiàn)兩部分熵極大化的一種均衡。
為了驗(yàn)證上述算法的有效性,針對(duì)特定類型的圖片進(jìn)行分割實(shí)驗(yàn)。這種圖片應(yīng)具有如下特征:1)所要提取的目標(biāo)具有任意性;2)背景與目標(biāo)各自的成像因素具有獨(dú)立性?;诖?,紅外成像的圖片序列是比較合適的類型。圖2 分別展示了Kapur 法[2]、Albuquerque 法[6]以及本文的方法所得的結(jié)果。
為進(jìn)一步定量闡述分割效果,引入錯(cuò)分類誤差因子ME,定義如下
圖2 閾值分割結(jié)果(其中,(d)q=0.1 和(e)q1=0.6,q2=0.4)Fig 2 Threshold segmentation results,where(d)q=0.1(e)q1=0.6,q2=0.4
其中,OGT和OT分別為基準(zhǔn)圖和分割結(jié)果中目標(biāo)像素的集合,BGT和BT分別為基準(zhǔn)圖和分割結(jié)果中背景像素的集合。
圖3 顯示了Albuquerque 法在不同q 參數(shù)取值下的輸出結(jié)果,這里采用圖2(a),(b)作為原圖和基準(zhǔn)圖。可以看出:閾值僅在參數(shù)接近于1 時(shí)產(chǎn)生一次較明顯的跳躍,然而相應(yīng)的誤差也隨之明顯增加,分割失敗。
圖3 Albuquerque 法產(chǎn)生的閾值t 隨q 參數(shù)的變化關(guān)系,以及相應(yīng)閾值結(jié)果所對(duì)應(yīng)的MEFig 3 Threshold t generated by Albuquerque method varies with parameter q,as well as corresponding ME
實(shí)際上,圖2(a)是紅外成像視頻幀序列中的一個(gè)單幀,通過與基準(zhǔn)圖的對(duì)比,找到一組恰當(dāng)?shù)?q1,q2)用于實(shí)現(xiàn)對(duì)目標(biāo)的提取。在短時(shí)拍攝過程中,可以認(rèn)為目標(biāo)與背景的紅外輻射強(qiáng)度穩(wěn)定,第一幀圖像的(q1,q2)取值對(duì)于后續(xù)幀幅同樣有效。圖4 的視覺效果證明了這一點(diǎn),定量測(cè)試數(shù)據(jù)如表1 所示。
圖4 紅外視頻后續(xù)幀幅的分割結(jié)果對(duì)比Fig 4 Segmentation results comparison of subsequent frames of infrared video
表1 針對(duì)圖2 與圖4 的定量數(shù)據(jù)Tab 1 Quantitative datas of fig 2 and fig 4
本文通過對(duì)Tsallis 熵性質(zhì)的分析確定q 參數(shù)的合理取值范圍,將紅外成像圖片的目標(biāo)與背景視為兩個(gè)相互獨(dú)立的集合,提出了一種包含兩個(gè)可調(diào)節(jié)參數(shù)q1和q2的新的閾值分割方法,實(shí)現(xiàn)目標(biāo)與背景的自動(dòng)分割。實(shí)驗(yàn)結(jié)果表明:該方法在處理目標(biāo)與背景無明顯關(guān)聯(lián)的圖片序列時(shí)更加有效。
[1] Shannon C E.A mathematical theory of communication[J].The Bell System Technical Journal,1948,27:379-423.
[2] Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Comput Vision Graphics Image Process,1985,29:273-285.
[3] Sezgin M,Sankur B.Survey over image thresholding techniques and quantitative performance evaluation[J].Journal of Electronic Imaging,2004,13:146-165.
[4] Sarkar S,Das S,Chaudhuri S S.A multilevel color image thresholding scheme based on minimum cross entropy and differential evolution[J].Pattern Recognition Letters,2015,54:27-35.
[5] 吳一全,殷 駿,畢碩本.最大倒數(shù)熵/倒數(shù)灰度熵多閾值選?。跩].信號(hào)處理,2013,29(2):143-151.
[6] Albuquerque M P,Esquef I A,Mello A,et al.Image thresholding using Tsallis entropy[J].Pattern Recognition Letters,2004,25:1059-1065.
[7] Tsallis C.Possible generalization of Boltzmann-Gibbs statistics[J].J Stat Phys,1988,52:480-487.
[8] Lin Q,Ou C.Tsallis entropy and the long-range correlation in image thresholding[J].Signal Processing,2012,92:2931-2939.
[9] 李積英,黨建武,王陽萍.融合量子克隆進(jìn)化與二維Tsallis 熵的醫(yī)學(xué)圖像分割算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2014,26(3):465-471.
[10]吳一全,王 凱,曹鵬祥.蜂群優(yōu)化的二維非對(duì)稱Tsallis 交叉熵圖像閾值選?。跩].智能系統(tǒng)學(xué)報(bào),2015,10(1):103-112.