楊澤楠 牛海鵬,2 黃 亮 王梟軒 劉 軻
(1.河南理工大學測繪與國土信息工程學院, 焦作 454005; 2.黃河流域耕地保護與城鄉(xiāng)高質(zhì)量發(fā)展研究中心, 焦作 454005;3.昆明理工大學國土資源工程學院, 昆明 650093; 4.云南省高校高原山區(qū)空間信息測繪技術應用工程研究中心, 昆明 650093;5.四川省農(nóng)業(yè)科學院遙感應用研究所, 成都 610066)
為了將影像像元按照一定的標準分割成不同的連通區(qū)域,簡化影像的表達形式,從復雜的影像信息中提取出簡化的并且利于后續(xù)處理分析的有用信息[1-5]。目前提出了較多的影像分割算法,但由于高空間分辨率遙感影像中地物多樣性引起的噪聲、背景、信噪比和強度不均勻性等因素,使得采用傳統(tǒng)分割方法完成復雜影像分割任務仍具有難度[6]。
近年來,研究的主要影像分割方法為基于邊緣的分割、基于閾值的分割和基于區(qū)域的分割。基于邊緣的分割可以表現(xiàn)不同物體邊界的物理現(xiàn)象,作為影像后期加工的重要依據(jù)。國內(nèi)外學者對其進行了相應的研究,文獻[7-9]的方法對噪聲都比較敏感,在檢測邊緣的同時很難較好地去除噪聲,而且并不能準確檢測出地物邊緣。
基于閾值的分割可以根據(jù)地物灰度進行影像分割,該方法實現(xiàn)簡單,對于不同類的物體灰度或其他特征值相差很大時,能有效地對影像進行分割。因此,選取合適的閾值是關鍵。國內(nèi)外學者對閾值的選取進行了研究[10-12],但受到噪聲和影像灰度的影響,當灰度直方圖沒有明顯的峰谷寬度時,圖像灰度差不明顯,灰度范圍有較大重合,此方法的分割結果會受到很大影響,通常難以獲得準確的分割結果。
基于區(qū)域分割法的多尺度區(qū)域分割和圖論區(qū)域分割,因其具有很強的去噪聲能力和靈活性而受到廣泛關注。部分學者采用多尺度區(qū)域分割的方法對影像進行分割,該方法能定量確定不同地物的最佳分割尺度,以增強對目標物的分割效果[13-16]。上述多尺度的分割方法對尺度參數(shù)過于依賴,并且只考慮了像元的灰度,因此在實際應用中對影像的整體把握容易失準,更易被噪聲影響。因此,部分學者采用圖論區(qū)域分割的方法對影像分割,該方法在影像亮度小幅度變化的情況下,仍能穩(wěn)定地分割目標物體[17-22]。上述圖論的分割方法雖然降低了噪聲影響,提高了分割精度,但是降低了分割效果邊界與真實地物邊界吻合度。
為了有效提高不同地物邊界分割準確性,提出一種多尺度R-cut(Multi-scale ratio cut,MSR-cut)的遙感影像邊緣檢測分割方法。采用形態(tài)重建的分水嶺分割算法將影像分割成多個超像素區(qū)域;根據(jù)各個子區(qū)域的紋理特征信息熵和光譜特征與鄰域均值差分歸一化,建立評價函數(shù)RMNE,對影像進行粗分割;利用MSR-cut邊緣檢測分割方法對影像進行精細分割。
首先對高空間分辨率遙感影像進行形態(tài)學構建;采用分水嶺變換算法對高空間分辨率遙感影像進行過分割,生成超像素區(qū)域;提取區(qū)域內(nèi)地物表征各超像素的紋理特征信息熵、光譜特征與鄰域均值差分歸一化;計算各超像素的特征值構建評價函數(shù)RMNE,獲取最優(yōu)尺度,得到粗分割結果;采用MSR-cut邊緣檢測算法對超像素區(qū)域進行多尺度聚類合并,得到最終的分割結果,分割流程如圖1所示。
分水嶺變換算法是根據(jù)計算影像的局部極小值進行相鄰區(qū)域搜索,獲取不同地物分水嶺線,是一種快速分割算法[23]。由于算法會受到影像噪聲的影響,易形成過分割。為解決該問題,提出了一種形態(tài)梯度重建的分水嶺算法。該算法引入了MGR的方法抑制噪聲,去除影像中無用梯度細節(jié),可以有效地保留地物的邊界細節(jié),可以在較短時間內(nèi)獲得較好的分割效果。本文的分水嶺算法具體步驟如下:①對影像進行形態(tài)學梯度影像重建。②對重建后的影像進行分水嶺算法分割。設定遙感影像為f(x,y),影像梯度為g(x,y)。對輸入影像f(x,y)進行開運算和腐蝕操作,g(x,y)定義為
(1)
(2)
K=f?b(x,y)
(3)
式中b(x,y)——圓盤狀結構元素
?——灰度形態(tài)學腐蝕運算符號
K——腐蝕運算函數(shù)
1.1節(jié)對影像進行了分水嶺變換處理,通過利用梯度重建抑制過分割,一定程度上降低了噪聲干擾和后續(xù)計算復雜度。但沒能充分考慮地物邊界的同質(zhì)性和異質(zhì)性帶來的不穩(wěn)定,使得分割結果的輪廓貼合度較差,對于不規(guī)則的超像素區(qū)域分割較為破碎,分割精度較低。
融合最優(yōu)尺度下的多尺度分割能有效解決地物邊界的差異且輪廓的貼合度較高。最優(yōu)分割尺度是指分割后影像對象與地物目標輪廓相當,大小接近,對象多邊形既不能太破碎,也不能邊界模糊,且光譜變異情況較小,影像對象內(nèi)部同質(zhì)性盡量高,不同類別對象之間的異質(zhì)性盡量大[24]。傳統(tǒng)最優(yōu)尺度的分割方法主要根據(jù)影像的光譜標準差和莫蘭指數(shù)選取最優(yōu)尺度,但沒有利用高空間分辨率遙感影像的地物特征,忽略了地物與地物之間的異質(zhì)性,對地物空間分布性考慮不足?;诖?,本文采用毛寧等[25]提出的RMNE多尺度分割對過分割結果進行粗分割,該方法通過影像地物同質(zhì)性和異質(zhì)性分割,有效解決了影像中欠分割問題。對象信息熵歸一化值為
(4)
式中F(E)——對象信息熵歸一化值
E——不同分割尺度對象層的信息熵平均值
Emax——不同分割尺度對象層的信息熵平均值的最大值
Emin——不同分割尺度對象層的信息熵平均值的最小值
為了提取各地物之間的光譜差異,確定不同地物的邊界范圍。提取光譜特征與鄰域均值差分歸一值F(GL),計算式為
(5)
其中
(6)
式中GL——L波段單個尺度分割對象光譜均值與鄰域光譜均值差分的絕對值
GH——當前對象所有像素的光譜平均值
B——當前對象的邊界長度
m——與目標對象直接相鄰的對象個數(shù)
Bi——當前對象和第i個直接相鄰對象的公共邊界長度
GLi——當前對象的第i個直接相鄰對象的光譜平均值
GLmax——不同分割尺度對象層的對象與鄰域均值差分絕對值平均值的最大值
GLmin——不同分割尺度對象層的對象與鄰域均值差分絕對值平均值的最小值
分割評價函數(shù)為
(7)
在分割尺度確定實驗中,當分割尺度大于某種類別時,影像內(nèi)包含不同的地物類別,F(xiàn)(E)變大,與相鄰對象之間的離散程度變小,F(xiàn)(GL)減小,故RMNE較小;當分割尺度等于某種類別時,影像中包含相同的類別,F(xiàn)(E)較小,相鄰對象屬于不同的類別目標,F(xiàn)(GL)較大,則RMNE較大;當分割尺度小于某種類別時,影像內(nèi)包含相同的地物類別,F(xiàn)(E)較大,與相鄰對象之間的離散程度較小,F(xiàn)(GL)較小,故RMNE較小。
最優(yōu)尺度下的多尺度分割算法流程如圖2所示,具體步驟如下:輸入分水嶺過分割影像f(x,y);根據(jù)式(4)計算出紋理特征的信息熵F(E),根據(jù)式(5)、(6)計算出光譜特征與鄰域均值差分歸一值F(GL);根據(jù)式(7)計算RMNE,構建評價函數(shù),選取最優(yōu)分割尺度,獲取最優(yōu)尺度下分割的影像對象集Gi。
基于RMNE最優(yōu)尺度下的多尺度分割雖考慮到影像地物空間分布和光譜信息的特性,但分割結果仍存在過分割和邊緣模糊的問題。R-cut分割是一種基于圖論的邊緣檢測比率分割方法,該方法根據(jù)影像的地物鄰域信息和能量函數(shù)有效防止過分割和邊緣模糊[26]。因此,在RMNE最優(yōu)尺度下多尺度分割方法的基礎上,結合R-cut分割方法,通過集成兩者的優(yōu)勢,有效提高分割精度,保證地物邊緣保持清晰。不同地物相關聯(lián)的權重集表達式為
(8)
(9)
式中w1(u,v)——第1個邊界權重
w2(u,v)——第2個邊界權重
根據(jù)R-cut標準的能量函數(shù)表達式,計算各地物邊界,獲取最終分割影像。
(10)
其中
(11)
式中A、B——兩個不同的影像地物
d1(A,B)、d2(A,B)——使用兩種權重運算方法計算的切割集能量
u——A的頂點v——B的頂點
R-cut算法流程如圖3所示。
(1)輸入最優(yōu)尺度下分割的影像對象集和所有相鄰區(qū)域的邊界集,計算不同地物相關聯(lián)的權重集。由于影像對象集Gi的地物最小比率切割與雙影像對象集Gid的地物最小比率環(huán)路之間存在一對一的對應關系。因此,計算影像對象集Gi的不同地物相關聯(lián)的權重集的問題可以轉換為計算雙影像對象集Gid的不同地物相關聯(lián)的權重集的問題。由于雙影像對象集Gid的Gid(b)表示地物具有線性轉換cd11,其中cd11計算式為cd11=cd1-cd2,cd1和cd2是雙影像對象集Gid的權重轉換函數(shù)。權重轉換函數(shù)不會改變雙影像對象集Gid的地物最小比例環(huán)路,因此不會改變影像對象集Gi的地物最小比例切割。只有地物最小環(huán)路Gid(b*)為零值時,雙影像對象集Gid的地物環(huán)路的最小比率包含地物最小環(huán)路比率b*。因此,計算雙影像對象集Gid的不同地物相關聯(lián)的權重集的問題就可以轉換為計算雙影像對象集Gid的不同地物相關聯(lián)的權重集的問題。
(2)依據(jù)不同地物相關聯(lián)的權重集,將雙影像對象集Gid構造一個新影像Gdd(Gid,Ed),根據(jù)式(8)、(9)計算其最小代價匹配和地物邊界權重,最后根據(jù)能量函數(shù)式(10)、(11)計算不同地物邊界,獲取最終分割結果圖。當且僅當雙影像對象集Gid具有最小代價匹配時,影像對象集Gi包含負代價循環(huán)。從影像對象集Gi到影像雙影像對象集Gid,具體轉換原理如下:對于影像對象集Gi的每個地物頂點u1,雙影像對象集Gid包含該地物兩個頂點ud1、ud2和一個邊界(ud1,ud2),其權重等于零;對于影像對象集Gi的每個地物邊界(u1,u2),雙影像對象集Gid包含該地物2個相應的頂點uv和vu以及5個相應的地物邊界,地物邊界的權重分別為0、w(u1,v1)/2、w(v1,u1)/2、w(v1,u1)/2、w(u1,v1)/2。
為了驗證提出方法的有效性,共選取了5個高空間分辨率遙感影像,其中前4個為無人機遙感影像[27],該影像來自新西蘭市,均包含藍、綠和紅3個波段,空間分辨率均為0.3 m。前3個影像記做I1、I2和I3,尺寸均為512像素×512像素,第4個影像簡稱I4,尺寸為2 501像素×2 124像素。第5個影像為國產(chǎn)自主衛(wèi)星高分2號(GF-2),簡稱I5,經(jīng)過處理后包含藍、綠和紅3個波段,空間分辨率為4 m,尺寸為3 801像素×2 414像素。
如圖4所示,影像中主要包含建筑物、水體和道路等地物。該3種地物的尺寸和形狀各異。I1、I2和I3為建筑區(qū)密集區(qū)域,建筑物類型、形狀復雜,內(nèi)部紋理結構豐富。I4和I5比前3個影像面積大,地物豐富、分辨率較高,地物邊界清晰,且光譜信息更加豐富,如道路、建筑物和水體。
為了驗證實驗結果的準確性,結合定性和定量進行精度評定。定性分析是對比分割后影像的邊界附著度、形狀異質(zhì)度、過分割和欠分割的狀況。定量分析是利用區(qū)域灰度一致性Ru、峰值信噪比Ps、分割精度Pr[28]和召回率Re[29]對傳統(tǒng)R-cut、Spectral-Rcut、Textured-Rcut邊緣檢測算法和本文方法進行對比評價。
采用分水嶺(Watershed,WS)、簡單線性迭代(Simple linear iterative clustering,SLIC)、均值漂移(Mean shift,MS)算法對5個原始影像超像素分割,其中WS算法的分割結果與種子點選取有關,因此,WS算法是以梯度小于3的點作為種子點(圖5b、5f、5j、5n、5r);MS算法分割閾值為0.6得到的分割影像(圖5d、5h、5l、5p、5t);SLIC算法設定為600超像素作為實驗結果(圖5c、5g、5k、5o、5s)。圖5a、5e、5i、5m、5q為通過目視解譯的方法生成的參考影像。
由圖5可知,在地物光譜顏色相似時,如道路和建筑物, MS算法難以區(qū)分地物邊界,邊界附著率較低;WS算法和SLIC算法的分割結果解決了地物邊界附著率較低的問題,能夠較好地表達地物光譜形狀特征。由圖6可知,WS算法耗時小于SLIC算法和MS算法。根據(jù)分析結果,WS算法分割是一種高效率、地物邊界附著率較高的算法。綜上所述,采用WS算法對影像過分割。
將分割參數(shù)最小值設置為10,最大值設置為100,分割尺度步長為10依次遞增,計算每個尺度下的RMNE,結果如圖7所示。
由圖7可知,I1、I4和I5最優(yōu)分割尺度為30、60和90;I2最優(yōu)分割尺度為30、60和70;I3最優(yōu)分割尺度為40、60和90。通過結合目視判斷,I1、I2和I3在分割尺度為60最優(yōu);I4和I5在尺度90最優(yōu)。
2.5.1第1組實驗結果
為了更準確、客觀地評價算法的分割結果,對WS算法過分割影像進行傳統(tǒng)R-cut、Spectral-Rcut、Textured-Rcut邊緣檢測算法和本文方法進行區(qū)域合并,邊界權重分別為0.52、0.75和0.69。分割結果如圖8和表1所示。
表1 3個影像分割評估結果
由I1影像的分割結果可知,傳統(tǒng)R-cut邊緣檢測算法(圖8a)分割影像中產(chǎn)生了大量的噪聲和過分割現(xiàn)象,地物邊緣模糊,證明該方法難以區(qū)分出光譜和紋理相似的地物,因而出現(xiàn)過分割現(xiàn)象,如圖中圓圈所示;Spectral-Rcut(圖8b)、Textured-Rcut(圖8c)邊緣檢測算法使得過分割得到優(yōu)化,但是小尺度地物依然存在過分割現(xiàn)象。本文方法(圖8d)中道路和房屋被完整分割,植被也得到了更好的合并,說明了本文方法的優(yōu)越性。
由I2影像的分割結果可知,傳統(tǒng)R-cut算法(圖8e)分割產(chǎn)生了大量的噪聲,且存在過分割問題;Spectral-Rcut(圖8f)、Textured-Rcut(圖8g)邊緣檢測算法雖然通過結合光譜和紋理特征減少了過分割,但影像過分割的問題仍未得到較好解決,如植被還是不能被完整分割,如圖中圓圈所示,主要是因為植被與道路的邊界不明確造成的。本文方法(圖8h)有效地抑制了噪聲產(chǎn)生的過分割問題,使得分割結果較為理想。
由I3影像分割結果可知,傳統(tǒng)R-cut(圖8i)、Spectral-Rcut(圖8g)、Textured-Rcut(圖8k)邊緣檢測算法邊界產(chǎn)生了大量過分割現(xiàn)象,尤其是道路和房屋,如圖中圓圈所示,由于分割區(qū)域地物交界處存在邊界不明確的情況;本文方法(圖8l)能較好地考慮地物特性,增強了像素類屬的表達,從而優(yōu)化地物邊界分割效果,使得與參考影像一致。
由表1可知,本文方法分割精度優(yōu)于其他3種分割方法。相比于I2和I3的實驗結果,I1實驗中的分割效果最優(yōu),這主要是因為I1中地物內(nèi)部光譜細節(jié)簡單,邊界明顯,輪廓單一,便于判別。
2.5.2第2組實驗結果
與I1、I2和I3影像相比較,I4和I5影像地物豐富、紋理信息充足、輪廓更清晰,邊界信息更明顯,邊界權重分別為0.46和0.63。分割結果如圖9所示。其中,傳統(tǒng)R-cut(圖9a)、Spectral-Rcut(圖9b)、Textured-Rcut(圖9c)邊緣檢測算法和本文方法(圖9d)的分割結果中方框區(qū)域為房屋、草地、裸地和道路等地物,圖9e~9h對典型區(qū)域進行放大,更直觀地看出分割結果。由I4影像的分割結果可知,采用傳統(tǒng)R-cut邊緣檢測分割過分割現(xiàn)象嚴重,地物分布越密集,過分割現(xiàn)象越嚴重,地物尺度越小,地物分割越破碎;Spectral-Rcut和Textured-Rcut邊緣檢測分割效果比傳統(tǒng)R-cut邊緣檢測分割要好,但包含大量的噪聲點,且建筑和非建筑區(qū)域合并到一起,分割線出現(xiàn)了嚴重的偏移;本文方法對密集居民房屋、道路、大塊綠地等分割均得到了比較理想的分割結果,更加貼近地物的實際邊界。
由I5影像分割結果可知,傳統(tǒng)R-cut(圖9i)、Spectral-Rcut(圖9j)、Textured-Rcut(圖9k)邊緣檢測算法和本文方法(圖9l)的分割結果中黃色方框區(qū)域為包含水體、建筑物、植被和道路等地物的典型區(qū)域,圖9m~9p為典型區(qū)域放大圖。其中,傳統(tǒng)R-cut邊緣檢測分割難以區(qū)分出光譜和紋理相似的地物,因而出現(xiàn)大量過分割現(xiàn)象;Spectral-Rcut和Textured-Rcut邊緣檢測分割效果雖然減少了過分割現(xiàn)象,但過分割的問題還是未得到較好解決,主要是由于建筑物、道路之間的光譜差異性不明顯;本文方法較好地區(qū)分了建筑物和道路,并能在一定程度上反映地物的外形特征分割結果。
由表2可知,I4得到的分割效果較好。在I4分割的評價結果中,與其他3種分割結果相比,分割精度最高,分割效果最優(yōu)。從圖9d中可以看出,本文方法可以將建筑物、道路、綠地等很好地區(qū)分開。在I5分割的評價結果中,本文方法分割結果評價優(yōu)于其他3種算法。但I5的分割效果不優(yōu),主要因為第5組實驗圖幅面積大、地物復雜多樣、邊界不明確。但是本文的分割結果精度比其他3種方法明顯較優(yōu),說明本文方法能夠有效防止椒鹽噪聲、過分割和欠分割的問題,適用于分割區(qū)域范圍較大的影像。
表2 2個影像分割評估結果
相比于第2組的分割結果,第1組精度更高。主要是因為第2組實驗中地物種類多、紋理和輪廓復雜、邊界模糊,所以分割難度更高。I5影像的評價結果下降主要受到實驗圖幅面積增加的影響,并且要兼顧的地物更多,分割的尺度更加難把握。從3種分割方法的對比可知,影響影像分割精度的因素包括區(qū)域分辨率、分割區(qū)域范圍、地物分布情況以及邊界準確性等。
提出了一種MSR-cut邊緣檢測分割方法,對高空間分辨率遙感影像進行形態(tài)學梯度影像重建的分水嶺變換分割,在保證足夠的影像細節(jié)特征信息基礎上,使得到的超像素盡可能少。將超像素紋理信息和光譜信息構建評價方法,完成對影像進行增強和把光譜、紋理特征融合到分割算法中。采用R-cut方法完成對影像的精細分割,生成最終的分割結果。實驗結果表明:利用分水嶺變換的方法生成超像素,提高了算法效率,克服了噪聲對影像分割的影響;本文提出方法分割精度高于傳統(tǒng)R-cut邊緣檢測分割、Textured-Rcut邊緣檢測分割和Spectral-Rcut邊緣檢測分割3種方法,且更適用于高空間分辨率遙感影像。