李 淵, 毋 琳, 戚雯雯, 郭拯危, 李 寧
(1.河南大學(xué)計算機與信息工程學(xué)院,開封 475004; 2.河南大學(xué)河南省智能技術(shù)與應(yīng)用工程技術(shù)研究中心,開封 475004; 3.河南大學(xué)河南省大數(shù)據(jù)分析與處理重點實驗室,開封 475004; 4.商丘工學(xué)院信息與電子工程學(xué)院,商丘 476000; 5.河南大學(xué)環(huán)境與規(guī)劃學(xué)院,開封 475004)
合成孔徑雷達(synthetic aperture Radar, SAR)圖像分類是遙感應(yīng)用中的關(guān)鍵技術(shù)之一,其分類精度直接決定著SAR圖像應(yīng)用的質(zhì)量。常用的SAR圖像分類方法有K-均值(K-means)方法[1-2],模糊C均值(fuzzy C-means, FCM)方法[3],支持向量機(support vector machine, SVM)方法[4],以及馬爾可夫隨機場(Markov random field, MRF)模型等。其中,MRF模型充分考慮了空間上下文信息,具有較強的抗噪能力,在近些年的研究中得到了廣泛的應(yīng)用[5-9]。
MRF是一種概率圖模型,分別使用特征場和標(biāo)簽場表示圖像特征和類別。面向?qū)ο蟮腗RF(object-based Markov random field, OMRF)模型采用超像素分割處理,按像素特征將圖像劃分為同質(zhì)區(qū)域,作為分類的基本單元,以區(qū)域鄰接圖(region adjacency graph, RAG)[10]表示各區(qū)域概率關(guān)系,并以此進行OMRF建模,將圖像分類轉(zhuǎn)化為區(qū)域類別最優(yōu)標(biāo)記問題。與傳統(tǒng)MRF模型相比,OMRF方法用于SAR圖像分類可有效利用區(qū)域?qū)ο蟠笮?、形狀和邊緣等信息,降低相干斑噪聲對分類結(jié)果的干擾。
近年來,基于OMRF模型的圖像分類方法不斷涌現(xiàn)各種改進形式。Chen等[11]建立了統(tǒng)一的MRF(unified Markov random field, UMRF)模型,將像素和區(qū)域的似然函數(shù)相乘,同時獲取像素和區(qū)域信息,使得圖像分類精度得到提高; Zheng等[12]提出了一種具有區(qū)域系數(shù)的對象高斯-馬爾可夫隨機場模型(object-based Gaussian-Markov random field model with region coefficients, OGMRF-RC),以邊緣信息和區(qū)域大小為系數(shù),使用基于對象的線性回歸方程(object-based linear regression equation, OLRE)獲取相鄰區(qū)域的線性關(guān)系,用于特征場建模; Xu等[13]提出了一種極化輔助場OMRF(OMRF with polarimetric auxiliary fields, OMRF-PA)模型,采用極化指數(shù)評估OMRF模型迭代過程中的極化信息損失,結(jié)合改進的條件概率分布,有效提高了PolSAR圖像分類精度。
然而,上述改進模型中,迭代計算的區(qū)域?qū)ο髽?biāo)簽只有一個類別,這極有可能影響圖像中臨界區(qū)域的類型界定。本文針對該問題,提出了區(qū)域類別模糊概率(regional category fuzzy probability, RCFP)的方法,利用邊緣信息和后驗概率共同獲取區(qū)域?qū)ο髮λ锌赡茴悇e的RCFP,作為OGMRF-RC模型的標(biāo)簽場信息,同時在特征場參數(shù)計算中考慮RCFP的影響,并將該改進模型應(yīng)用于SAR圖像分類中。經(jīng)實驗驗證,與K-means,F(xiàn)CM和其他MRF模型等方法相比,本文方法在分類過程中以概率形式賦予各區(qū)域多類別標(biāo)簽,充分利用了區(qū)域?qū)ο蟮膱D像特征與空間關(guān)系信息,使得分類精度有了明顯的提升。
區(qū)域ri與其鄰域集合Nri的相關(guān)性參數(shù)可以表示為:
(1)
若區(qū)域ri的類別為h,1≤h≤k(k為總分類數(shù)目),區(qū)域ri與其鄰域集合Nri的特征關(guān)系可用OLRE獲取,表示為:
(2)
式中: 特征參數(shù)μh表示類別h的區(qū)域均值;gh為類別h均值為零的高斯白噪聲。
(3)
式中:P(Y=y|X=x)為特征場中給定類別標(biāo)簽x的條件概率分布;P(X=x)為標(biāo)簽場中給定類別標(biāo)簽x的先驗概率分布。
將圖像分類轉(zhuǎn)化為求解最小化能量的問題,則式(3)可轉(zhuǎn)化為:
看!好美呀。女友興奮地喊道,我順著她的驚叫聲看到在泛綠的樹叢中,一株桃花燦燦地開放,格外鮮艷,卻又有些孤傲的味道。
(4)
式中:x*為新的類別標(biāo)簽;Ef為特征場能量;El為標(biāo)簽場能量。
設(shè)待分類圖像滿足高斯分布,則OGMRF-RC模型的目標(biāo)函數(shù)為:
(5)
式中: 特征參數(shù)σh2為類別h的區(qū)域方差;V(xi,xj)為勢能函數(shù),其定義為:
(6)
式中β為勢能參數(shù)。
根據(jù)地理學(xué)第一定律[14],空間距離越近的地物,其相互影響越大。區(qū)域?qū)ο蟮倪吘壪袼靥卣髋c該區(qū)域類別一致,兩相鄰區(qū)域類別相同的概率可由二者邊緣的像素特征的差異性反映,差異越小,類別相同概率越高。例如,對如圖1(a)所示的SAR圖像進行超像素劃分,可得如圖1(b)所示的區(qū)域?qū)ο蠓指罱Y(jié)果。其中,區(qū)域2,3,4屬于區(qū)域1的鄰域集合,區(qū)域1,3,4為相同類別,其邊緣像素在特征上差異不大; 而區(qū)域1與區(qū)域2為不同類別,其邊緣像素則有明顯的特征差異。
(a) SAR圖像(b) 局部超像素分割圖1 超像素分割結(jié)果Fig.1 Result of super-pixel segmentation
因而,圖像分類時,除了區(qū)域?qū)ο蟊旧淼募y理特征外,將其與鄰域區(qū)域?qū)ο蟮倪吘壧卣髯鳛榉诸悈?shù)之一,對區(qū)域類別的正確劃分具有較高的參考價值。
OGMRF-RC模型中,標(biāo)簽場采用對象唯一類別標(biāo)簽的形式。對于不同類別交界的區(qū)域?qū)ο?,一旦出現(xiàn)錯誤的類別標(biāo)簽將會直接影響特征場參數(shù)的計算和最終分類結(jié)果的準(zhǔn)確性。針對此問題,本文提出依據(jù)區(qū)域?qū)ο笞陨淼暮篁灨怕屎袜徲蛳嚓P(guān)邊緣信息,獲得該區(qū)域?qū)λ锌赡茴悇e的RCFP,作為標(biāo)簽場,并參與特征場參數(shù)的迭代計算,使特征參數(shù)的更新考慮了圖像的全局信息,利用圖像空間特征不斷優(yōu)化并糾正每個區(qū)域?qū)ο蟮念悇e歸屬,獲得更好的分類效果。
基于邊緣信息獲取的區(qū)域ri的類別概率可以表示為:
(7)
式中P1(h-ri)為區(qū)域ri屬于類別h的概率。
后驗概率P2(h|yi)的計算公式為:
(8)
式中:P2(h|yi)為區(qū)域ri為類別h的后驗概率;G(yi;θh)為特征場參數(shù)θh=(μh,σh2)的高斯分布函數(shù);P(h|xNri)為先驗概率;P(yi)為常數(shù)。G(yi;θh)和P(h|xNri)可以定義為:
(9)
(10)
式中Z為歸一化常數(shù)。
區(qū)域ri屬于類別h的模糊概率RCFPh-ri可以表示為:
RCFPh-ri=(P1(h-ri)+P2(h|yi))/2 。
(11)
用RCFP作為區(qū)域的類別標(biāo)簽,會使區(qū)域ri屬于每個類別h都有一個RCFPh-ri,將其參與特征場參數(shù)計算時,則是考慮了圖像的全局信息。假設(shè)已知所有區(qū)域?qū)儆陬悇eh的RCFPh-ri,類別h的特征場參數(shù)(μh,σh2)的計算定義為:
(12)
(13)
改進的SAR圖像分類算法流程如圖2所示。首先采用像素級分類方法與圖像超像素分割方法對SAR圖像進行處理,用于獲取區(qū)域?qū)ο蠓指罱Y(jié)果及初始類別標(biāo)簽。然后應(yīng)用改進的OGMRF-RC模型對區(qū)域?qū)ο筇卣鬟M行迭代計算,不斷更新標(biāo)簽場信息,直至滿足結(jié)束條件完成對SAR圖像分類,獲得分類結(jié)果。算法執(zhí)行結(jié)束條件為: 達到最大迭代次數(shù)T,算法結(jié)束。
圖2 本文方法流程圖Fig.2 Flow chart of method in this paper
經(jīng)實地考察,選取河南省開封市東部約1 400 km2的區(qū)域為研究區(qū),其位置如圖3(a)所示。該區(qū)域為典型的鄉(xiāng)村地物分布,具有大片的農(nóng)田,其間分布著房屋建筑,北部有黃河主河道流經(jīng),即研究區(qū)內(nèi)具有3種地物類型,分別為農(nóng)田,建筑和水。實驗數(shù)據(jù)見圖3(b)和表1。
表1 實驗使用的Sentinel-1衛(wèi)星SAR圖像參數(shù)Tab.1 Parameters of Sentinel-1 Satellite SAR image used in experiment
(a) 研究區(qū)域位置 (b) 研究區(qū)域SAR圖像 (c) 研究區(qū)域地物樣本分布圖3 研究區(qū)域與樣本分布Fig.3 Study area and sample distribution
實驗數(shù)據(jù)為一景Sentinel-1衛(wèi)星SAR圖像,在圖像覆蓋區(qū)域內(nèi),選取若干農(nóng)田、建筑、水域等不同類別地物的樣本,進行真實地物標(biāo)記,樣本分布如圖3(c)所示。
為驗證本文方法的有效性,選擇基于像素的K-means,F(xiàn)CM和MRF模型,以及基于區(qū)域的OGMRF-RC模型等方法進行對比實驗。實驗中本文改進的OGMRF-RC方法選用MRF模型作為像素級分類方法,采用簡單線性迭代聚類(simple linear iterative clustering, SLIC)[15]方法對圖像進行超像素分割,依據(jù)經(jīng)驗設(shè)置勢能參數(shù)β值為0.06。
圖4為5種對比方法的分類結(jié)果,其中圖4(a)為谷歌地圖光學(xué)圖像。對照真實地物分布情況,中部區(qū)域不存在水域,但圖4(c)和圖4(d)在該區(qū)域中存在大量農(nóng)田錯分為水域的情況。左上矩形區(qū)域內(nèi)地物多為農(nóng)田,僅有少量的建筑和水域,但圖4(b)—(e)中該區(qū)域存在一些地物錯分的情況。直觀對比不同方法的分類結(jié)果,圖4(f)所示的本文方法分類結(jié)果與真實地物圖最為接近。為了更清晰地展示算法改進后的分類效果,選取了圖4左上矩形區(qū)域進行放大展示,結(jié)果如圖5所示。其中圖5(a)為所選區(qū)域的谷歌地圖光學(xué)圖像,圖5(b)—(f)為所選區(qū)域SAR圖像的分類結(jié)果。結(jié)果顯示圖5(b)—(e)的分類結(jié)果中,農(nóng)田和建筑存在一些錯誤分類,本文方法(圖5(f))對選定區(qū)域的分類結(jié)果最接近地物真實情況。
(a) 谷歌地圖光學(xué)圖像 (b) K-means (c) FCM
圖4-1 5種對比方法的SAR圖像分類結(jié)果Fig.4-1 SAR image classification results of five methods
(d) MRF(e) OGMRF-RC(f) 本文方法
圖4-2 5種對比方法的SAR圖像分類結(jié)果Fig.4-2 SAR image classification results of five methods
(a) 谷歌地圖光學(xué)圖像 (b) K-means (c) FCM
(d) MRF (e) OGMRF-RC (f) 本文方法
圖5 選定區(qū)域的SAR圖像分類結(jié)果Fig.5 SAR image classification results of selected area
總體精度(overall accuracy,OA)、Kappa系數(shù)和用戶精度(user accuracy,UA)常用作分類精度評價指標(biāo),其計算方法分別為:
(14)
(15)
(16)
(17)
5種方法的OA和Kappa定量分析結(jié)果如圖6所示,對不同類別地物的UA如表2所示。圖6中,3種MRF模型分類結(jié)果的OA和Kappa系數(shù)都高于FCM方法和K-means方法,這也進一步驗證了MRF模型對于SAR圖像分類的適用性。而本文方法由于考慮了對象多類別屬性概率,獲得了最高的分類精度,OA為94.16%,Kappa系數(shù)為0.895 7。由表2的UA結(jié)果可知,5種方法對農(nóng)田的分類結(jié)果差別不大; 對水域的分類結(jié)果,由于FCM和MRF方法中存在將農(nóng)田錯分為水域的情況,因此這兩種方法的UA精度較低,而其他方法都取得了較高的精度; 對于建筑的分類結(jié)果,其他方法UA處于80%左右,而本文方法UA為89.05%。綜合考慮本文方法的分類效果最好。綜上所述,與其他方法相比,本文方法的分類結(jié)果,對于水域、農(nóng)田和建筑物等都具有較好的效果,量化指標(biāo)OA和Kappa結(jié)果同樣優(yōu)于對比算法,證明了本文方法的有效性。
圖6 5種對比方法的OA和Kappa結(jié)果Fig.6 OA and Kappa Values of five methods
表2 5種對比方法的UA結(jié)果Tab.2 UA value of five methods
本文提出了一種基于改進OGMRF-RC模型的SAR圖像分類方法,該方法中充分考慮區(qū)域?qū)ο笞陨砼c其鄰域的特征信息,提出RCFP的方法。利用區(qū)域后驗概率與邊緣信息共同計算RCFP,作為區(qū)域?qū)ο髽?biāo)簽場,并納入特征場參數(shù)計算過程,讓參數(shù)的計算考慮了圖像的全局信息,使SAR圖像分類精度得到了有效的提高。
為驗證本文方法的有效性,采用K-means,F(xiàn)CM,MRF,OGMRF-RC等方法開展對比實驗。結(jié)果表明,本文方法對水域、農(nóng)田、建筑等地物的總體分類精度最高可達0.941 6,Kappa系數(shù)最高為0.895 7,優(yōu)于其他對比方法,驗證了本文方法的有效性。
本文在進行特征場參數(shù)計算時,只利用了圖像的灰度特征和紋理特征。在后期的研究中,可以在分類過程中增加極化等特征,從而進一步提高SAR圖像的分類精度。