謝旻旻,鐘小莉
(青海民族大學計算機學院,青海 西寧 810007)
圖像分割是把圖像分為多個不重合且各具特征的同質區(qū)域,再將其從背景中提取目標的過程[1]。立體圖像化層次分割是在其基礎上發(fā)展而來,其在分割過程中,不僅能將目標分成幾大塊,進行粗略分割,還可以對目標進行精細劃分。將所有分割結果組合在一起,構成一種層次化結構,體現(xiàn)從概況到細節(jié)的特征?,F(xiàn)階段,大多數(shù)分割方法在像素基礎上進行,分割結果太過碎片化,且分割結果對噪聲影響較為敏感,獲取的像素通常存在跨區(qū)域等問題,導致同質區(qū)劃分不準確,影響分割效果,且計算量大、實時性較差[2]。為解決這一問題,該領域相關學者進行了大量的研究。
文獻[3]提出基于局部特征的多目標圖像分割方法。此方法通過雙目攝像機獲取目標圖像,對圖像做預處理,利用立體匹配方法獲得場景深度數(shù)據,根據這些數(shù)據定義目標范圍,設置動態(tài)閾值尺度,提取目標局部特性,將局部特性變換為特征約束,并將約束條件與空間信息構成特征向量,利用此向量得到最后分割結果,并且可完成對任意一個目標區(qū)域有效識別。但該方法在分割立體圖像時計算量較大且操作過程復雜。文獻[4]提出基于逆向遞推的快速Otsu閾值分割方法。該方法將目標圖像灰度值設置成逆向推導的原始閾值,獲取逆向推導公式;引入遞推Otsu算法,在減小灰度級范圍內利用背景方差取代背景均值確定最優(yōu)閾值,通過該閾值對圖像進行分割。該方法易于操作,但在閾值的計算過程中易受外界因素干擾,導致閾值準確度不高,進而造成圖像分割效果不佳。
鑒于上述缺陷,利用三維直方圖方法對立體圖像進行層次分割。通過直方圖加強圖像特征信息,結合像素點灰度信息與其鄰域均值和中值數(shù)據,劃分目標與背景區(qū)域,更準確地對圖像進行閾值判定,并將圖像經過小波變換進行去噪處理提高算法抗噪性能,改善分割準確度。相比傳統(tǒng)方法存在的層次分割精度差,分割耗時長等問題,所提方法的分割效果優(yōu)于傳統(tǒng)方法,具有一定可行性。
為了實現(xiàn)立體圖像層次化分割,首先結合模糊集特性,將一幅大小是M×N、灰度級表示為L的立體圖像X=[x(i,j)]M×N描述為一個M×N的模糊矩陣[5],即
(1)
式中,元素μij/xij代表圖像中像素(i,j)的灰度值,xij代表針對于任意一個固定灰度級x的隸屬度,則隸屬度和灰度值存在如下聯(lián)系
(2)
式中,u和v代表隸屬度函數(shù)μij形狀的兩個參數(shù),其取值范圍視情況而定,但通常范圍在0~1之間。
假設論域X上的模糊集表示為A,其隸屬度函數(shù)符合μA(x)∈[0,1],x∈X,可能性分布公式為
(3)
可能性分布因子計算公式為
(4)
由式(4)可知,可能性分布因子實則為隸屬度函數(shù)的加權平均值,與概率論中均值概念相同,體現(xiàn)出可能性分布的平均可能性,因此存在0 首先,生成大小為p=h×w的模板Bh×w,將模板中灰度值集合作為論域,則模糊集Ahw的可能性分布由式(3)得出,即 (5) 此時可能性分布因子表示為 (6) G=[g(i,j)]M×N (7) 綜上所述,模糊均值本質是對均值做合理調節(jié)。詳細過程可描述為:確定隸屬度函數(shù),將該函數(shù)特征灰度值當作模板中像素平均灰度;以像素灰度值集合為論域確定一個模糊集;利用可能性分布因子獲取分布情況,根據隸屬度函數(shù)的逆變形式得到模糊均值。 假設u表示像素灰度中值,若v=2,同理可形成模糊中值圖像 Y=[y(i,j)]M×N (8) 利用自適應閾值[7]去除圖像噪聲,其過程為: 步驟一:對存在噪聲的圖像通過小波變換進行多尺度分解; 步驟二:獲取噪聲方差σ2,即 (9) 式中,Yuj=subbandHH1,σ2代表從子帶HH1中預測的噪聲方差。 步驟三:獲取任意一級計算尺度參數(shù)β (10) 式中,j=1,…,J,Lk表示級子帶長度,J代表分解的全部層數(shù),由于J的變化,每一級尺度參數(shù)都會出現(xiàn)自適應變化。 步驟四:運算1到J層存在的高頻系數(shù)標準方差σy; 步驟五:通過計算得出閾值T (11) 利用上述閾值結果對圖像進行重構,獲得去噪處理后的圖像。 假設在目標圖像中(i,j)位置像素局部對比度表示為σi,j,其表達式如下所示 (12) 式中,Im,n代表圖像(m,n)處亮度值,μi,j為窗口中像素平均值,此處窗口尺寸為(2d+1)×(2d+1)。通過式(12)得出歸一化處理后的像素局部對比度為 (13) 在立體圖像化層次分割過程中,窗口的選擇很大程度上決定最終分割結果準確度,利用固定窗口往往不能達到所需分割精度要求。常用的窗口選擇方法包括:自適應窗口方法、權重法與立體匹配算法[8]。為取得高精度視差預測結果,這些方法的重點之處在于從相對鄰域中挑選和待計算目標存在同樣視差值的像素點當作支撐像素,利用這些支撐區(qū)域對像素進行限制。所提方法使用立體匹配方法,選取視差預測值最佳窗口。 像素局部梯度是對圖像中將任意像素作為中心,部分區(qū)域亮度不連續(xù)的表述,可通過下述公式表示 (14) 式中,Gv與Gh分別代表垂直與水平兩個方向上的梯度,即 Gv=(Im-1,n+1+2Im,n+1+Im+1,n-1)- (Im-1,n-1+2Im,n-1+Im+1,n-1) (15) Gh=(Im-1,n-1+2Im-1,n+Im-1,n+1)- (Im+1,n-1+2Im+1,n+Im+1,n+1) (16) 由式(14)計算歸一化后的像素局部梯度值為 (17) 針對上述獲取的局部對比度與局部梯度做進一步處理,將二者有機結合形成像素在局部空間中同一性特征,利用該特征表示像素分布的一致性,以便在亮度級與邊緣級上有效區(qū)分不同種類像素,根據下述公式可獲得像素同一性特征為 (18) 假設待分割圖像像素點灰度值變換區(qū)間為[0,L-1],圖像(m,n)的灰度值表示為f(m,n),其鄰域平均值為 (19) 式中,0 (20) 式中,m、n、k取值范圍與上述相同。 針對M×N的灰度圖像f(m,n)而言,利用(f(m,n),g(m,n),h(m,n))的矢量代表其三維直方圖中三個坐標點位置,此直方圖確定在L×L×L的正方體范圍內,三個坐標分別描述像素點灰度值、鄰域平均灰度以及鄰域中值灰度。在三維直方圖中某點值表示為pijk,代表矢量(i,j,k)出現(xiàn)次數(shù),此處(i,j,k)指(f(m,n),g(m,n),h(m,n)),并且滿足0≤i,j,k≤L-1條件,三維單元(f(m,n),g(m,n),h(m,n))出現(xiàn)的頻數(shù)為cijk,故三維單元頻率為 (21) 待分割立體圖像的三維直方圖如圖1 所示。 圖1 圖像三維直方圖 圖1(a)定義了三維直方圖定義域,利用閾值(s,t,q)分割為圖1(b)所示的8個立方體小區(qū)域。在立體圖像中,目標與背景內部像素存在較強關聯(lián)性,像素點的灰度值與鄰域平均值、中值灰度值之間非??拷?,但在目標與背景邊界處的像素點存在明顯區(qū)別。在直方圖中,0與目標相對,1與背景相對,而區(qū)域2~7代表邊界處像素點與噪聲分布情況。大多數(shù)情形下,邊界點與整個圖像相比,數(shù)目較少,所以假定在區(qū)域2~7中,全部的pijk≈0。通過直方圖隨機閾值量(s,t,q)分割圖像,則目標與背景兩個區(qū)域中發(fā)生概率公式[9]分別為 (22) (23) 綜合分析目標與背景的先驗概率w0(s,t,q)與w1(a,t,q),基于三維直方圖圖像分割評價函數(shù)準則[10]為 (24) 當J(s,t,q)最大時,與其相對的閾值(s*,t*,q*)為最優(yōu)閾值,此時目標與背景分離效果最好,圖像得到最佳分割。將三維直方圖評價函數(shù)當作閾值分割標準,其閾值確定為 (s*,t*,q*)=max{J(s,t,q)} (25) 根據計算得出的最佳閾值(s*,t*,q*)完成圖像分割。 為驗證所提方法的有效性,進行仿真分析。仿真在Matlab 平臺上進行,操作系統(tǒng)為Windows XP,其運行內存為8 GB。 從BC Berkeley圖像庫中隨機挑選一幅人物立體圖像作為樣本圖像。圖像尺寸為481×345。第一層區(qū)域分割總數(shù)為9,第二層子區(qū)域分割總數(shù)為55。如圖2 所示。 圖2 樣本圖像 4.3.1 不同方法圖像分割效果分析 為了驗證所提方法的綜合有效性,實驗對比所提方法、等價三維熵與鯨魚優(yōu)化算法以及快速Otsu閾值分割算法圖像分割的效果,實驗結果如圖3 所示。 圖3 不同方法分割效果對比圖 分析圖3 可以看出,三種方法對立體圖像層次化分割后的效果存在一定差異。在視覺效果方面,等價三維熵與鯨魚優(yōu)化算法的圖像分割方法以及快速Otsu閾值分割算法獲得的超像素形狀比較規(guī)整,但存在較為嚴重的跨邊緣現(xiàn)象,而所提方法雖獲得的超像素形狀不夠整齊,但圖像邊緣擬合度高于其它兩種方法。這是由于所提方法經過圖像去噪處理后,獲得更加準確的分割閾值,提高了邊緣擬合度,進而提升了圖像分割的效果。 4.3.2 不同方法圖像欠分割誤差率分析 欠分割錯誤率可以衡量超像素溢出值程度,其計算方式為 (26) 式中,Sk與Gi分別代表分割圖像中第v個單子超像素與標記圖中第i標記。為了驗證所提方法的可靠性,分析了所提方法、等價三維熵與鯨魚優(yōu)化算法的圖像分割方法以及快速Otsu閾值分割算法分割圖像的欠分割誤差率,實驗結果如圖4 所示。 圖4 不同方法欠分割錯誤率對比 分析圖4 可以看出,在相同實驗環(huán)境下,采用三種算法對樣本圖像進行分割的欠分割誤差率存在一定差異。其中,所提方法的欠分割誤差率相較其它兩種方法最低,最低約為4 %,而其它兩種方法的誤差率約為23 %和24 %,遠高于所提方法的欠分割誤差率。且所提方法呈現(xiàn)下降趨勢。這是由于所提方法構建的原始模糊圖像,獲取的背景與目標信息量較大,因此分割效果更優(yōu)、更穩(wěn)定,驗證了所提方法的科學有效性。 基于三維直方圖的立體圖像層次化分割算法,利用三維直方圖確定最佳閾值,提取像素同一性特征,實現(xiàn)對立體圖像化層次分割。與傳統(tǒng)方法相比,得出以下結論: 1)在相同實驗條件下,對樣本圖像進行分割,分割后的圖像效果最佳。 2)在對樣本圖像進行分割時圖像的欠分割誤差率最低,僅約為4 %,遠低于所提方法。 所提方法不需要事先確定分割區(qū)域數(shù)量,對于低信噪比圖像也有良好分割效果。但分割過程中由于警戒參數(shù)設置不恰當會出現(xiàn)過分割現(xiàn)象;在今后研究中將重點分析參數(shù)設置問題。2.3 模糊中值圖像實現(xiàn)
2.4 基于自適應閾值的圖像去噪
3 同一性特征提取及圖像分割
3.1 局部對比度
3.2 局部梯度
3 .3 圖像分割
4 仿真分析
4.1 仿真環(huán)境
4.2 仿真參數(shù)
4.3 結果分析
5 結論