劉亮亮,謝 菲,孟 鳴,2
(1.云南大學(xué) 資源環(huán)境與地球科學(xué)學(xué)院,云南 昆明 650000;2.云南省地理研究所,云南 昆明 650000)
遙感圖像分割是對(duì)遙感圖像內(nèi)容理解和地物識(shí)別的關(guān)鍵技術(shù),它可以將遙感圖像的同質(zhì)區(qū)域分離,使后續(xù)的分析和應(yīng)用研究針對(duì)同質(zhì)區(qū)域進(jìn)行,有效提高了地物識(shí)別的精度和效率[1]。遙感圖像分類識(shí)別的發(fā)展方向是使判別結(jié)果無限接近于實(shí)際地物,大量新技術(shù)新方法的不斷研究與應(yīng)用,將航空航天和衛(wèi)星遙感上采集的數(shù)據(jù)信息經(jīng)過加工處理,從宏觀角度更為廣闊地觀察、理解和把握自己所賴以生存的這個(gè)星球。目前研究的遙感圖像分類方法是對(duì)傳統(tǒng)分類方法的重大改進(jìn),由于待分類的遙感圖像都屬于數(shù)字圖像,而數(shù)字圖像的分類是通過計(jì)算機(jī)來實(shí)現(xiàn)的。這種分類方法能充分利用遙感數(shù)據(jù)提供的各種統(tǒng)計(jì)信息,從理論上其分類結(jié)果必定是高度定量化的,可以精確到圖像對(duì)應(yīng)地面上的像元,容易進(jìn)行面積統(tǒng)計(jì)[2-4]。做好圖像分類以及分類后的處理工作,進(jìn)行適當(dāng)?shù)娜藶獒屪g,可以在節(jié)省經(jīng)費(fèi)、時(shí)間的同時(shí),達(dá)到比經(jīng)過人工解譯、勾繪、轉(zhuǎn)繪、量算和傳統(tǒng)的統(tǒng)計(jì)方法結(jié)合處理后的分類精度更高的精度。隨著傳感器技術(shù)及計(jì)算機(jī)模式識(shí)別技術(shù)的不斷發(fā)展,遙感圖像由單波段發(fā)展到多光譜再到高光譜,遙感圖像分類方法也得到了越來越深入的研究與應(yīng)用[5-6]。
貝葉斯最小錯(cuò)誤率分類方法的設(shè)計(jì)初衷很簡(jiǎn)單,就是進(jìn)行“分類”這一操作。為方便說明,令{ω1,ω2,…,ωc}表示有限個(gè)類別集,{a1,a2,…,aa}表示有限的a中可能采取的動(dòng)作集,風(fēng)險(xiǎn)函數(shù)λ(ai|ωj)描述類別狀態(tài)為ωj時(shí)采取行動(dòng)ai所產(chǎn)生的風(fēng)險(xiǎn)[7-9]。
已知使用貝葉斯公式可以通過先驗(yàn)概率P(ωj)、概率密度函數(shù)(似然函數(shù))p(x|ωj)以及證據(jù)因子p(x)求出后驗(yàn)概率P(ωj|x):
(1)
假設(shè)樣本具有特征值x,并且將采取ai行動(dòng),而樣本的真實(shí)歸屬類別為ωj,那么將可能造成損失λ(ai|ωj),而后驗(yàn)概率P(ωj|x)表示特征值為x時(shí),樣本屬于類別ωj的概率,因此,與行為ai相關(guān)的損失為:
(2)
其中,R(ai|x)稱為與行為ai相關(guān)的損失函數(shù)。
計(jì)算損失函數(shù)的步驟如下:
Step1:通過將特征值、似然函數(shù)、先驗(yàn)概率帶入貝葉斯公式,求出具有特征值x的樣本分屬各個(gè)不同類別的可能性(后驗(yàn)概率);
Step2:將樣本屬于各個(gè)不同類別的可能性乘上將樣本誤判到這一類別所需付出的代價(jià);
Step3:將Step2的結(jié)果相加即可得出對(duì)具有特征值x的樣本進(jìn)行ai操作所可能產(chǎn)生的損失。顯然,要計(jì)算損失函數(shù),先驗(yàn)概率、似然函數(shù)、風(fēng)險(xiǎn)函數(shù)都必須已知。
為了最小化總風(fēng)險(xiǎn),對(duì)所有的i=1,2,…,a計(jì)算條件風(fēng)險(xiǎn)R(ai|x),并選擇行為ai使R(ai|x)最小化。最小化后的總風(fēng)險(xiǎn)值稱為貝葉斯風(fēng)險(xiǎn),記為R*,它是可獲得的最優(yōu)風(fēng)險(xiǎn)。
假設(shè)判決規(guī)則為函數(shù)a(x),它用來說明對(duì)于特征值x應(yīng)采取哪種行為(即a1,a2,…,aa中選擇哪種行為)。如果有一種規(guī)則,使得損失函數(shù)R(ai|x)對(duì)每個(gè)特征值x都盡可能小,那么對(duì)所有可能出現(xiàn)的特征值x,總風(fēng)險(xiǎn)將會(huì)降到最小[8-9]。而理想的規(guī)則就是貝葉斯決策:“對(duì)所有的i=1,2,…,a,計(jì)算條件風(fēng)險(xiǎn)R(ai|x),并選擇行為ai使R(ai|x)最小化”。而在實(shí)際操作過程中,通常沒有那么多已知條件,不過貝葉斯決策理論至少提供了一個(gè)與其他分類方法做對(duì)比的評(píng)價(jià)依據(jù),也就是說貝葉斯決策很多情況下是作為對(duì)比對(duì)象而存在的。
針對(duì)遙感影像進(jìn)行地物類型分類問題,首先定義一個(gè)風(fēng)險(xiǎn)評(píng)價(jià)函數(shù):過程表現(xiàn)是wi類,判別為wj類時(shí)造成的風(fēng)險(xiǎn)為L(zhǎng)ij;最小風(fēng)險(xiǎn)判別準(zhǔn)則:選取j,使rj(X)最小。利用貝葉斯公式重新定義風(fēng)險(xiǎn)函數(shù)[10-12]:
(3)
如果r1(X)
設(shè)i類判為除i之外的地物時(shí)所承擔(dān)的損失是0.11,判斷正確時(shí)的損失是0,從而得到如下的判別公式:
(4)
函數(shù)值達(dá)到最大時(shí)即得到所判定的地物類型,最后顯示重新還原的RGB遙感圖像。
圖1為貝葉斯最小錯(cuò)誤率算法的影像分割分類結(jié)果。
圖1 貝葉斯最小錯(cuò)誤率算法的影像分割分類結(jié)果
從整體來說,貝葉斯最小錯(cuò)誤率算法將水體和陸地進(jìn)行了很好的區(qū)分,對(duì)于大部分地物來說也進(jìn)行了很好的分類,從視覺角度來看分類結(jié)果比較理想;但是從(c)、(d)兩張分類結(jié)果的局部放大圖來看,從視覺上具有相同色彩的部分耕地也被誤分為水域,而且對(duì)于城市內(nèi)部來講,城市建筑物產(chǎn)生的陰影也對(duì)分類結(jié)果的準(zhǔn)確性造成了很大的影響,而且對(duì)于細(xì)小的地物類型也都被歸入了附近的地物大類之中。從統(tǒng)計(jì)學(xué)的角度來講(見圖2),水域約占影像整體分類的43%,耕地約占18%,居民點(diǎn)約占29%,耕地約占10%,而交通用地和未利用地約占不到總和的1%。
圖2 改進(jìn)的貝葉斯最小錯(cuò)誤率算法的影像分類結(jié)果統(tǒng)計(jì)圖
從上述例子可以看出,證據(jù)因子p(x)對(duì)函數(shù)做出哪種分類判斷的結(jié)果沒有實(shí)質(zhì)性的決定作用,它的存在僅僅是作為一個(gè)標(biāo)量,用來表示一種比例,即表示實(shí)際測(cè)量的具有特征值x的模式的出現(xiàn)頻率[3]。如果把它去掉,也可以將判決規(guī)則改為:“如果p(x|ω1)P(ω1)>p(x|ω2)P(ω2),則判決為ω1類,否則為ω2類”。然后用貝葉斯公式來幫助做決策的大概思路,就是計(jì)算出某個(gè)特征值為x的待測(cè)樣本屬于各個(gè)不同類別的可能性,然后根據(jù)判斷規(guī)則,選擇概率最大(即可能性最大)的一個(gè)作為決策結(jié)果。
K-means是一種廣泛使用的基于劃分的動(dòng)態(tài)聚類算法。該算法以K為參數(shù),把n個(gè)對(duì)象分為K個(gè)類別。根據(jù)一個(gè)類別中對(duì)象的平均值進(jìn)行相似度計(jì)算,以達(dá)到使相同類別之間具有較低的相似度、類別之內(nèi)具有較高的相似度的目的[10-13]。傳統(tǒng)的均值-方差K-mean聚類算法有著不可避免的缺點(diǎn):分類精度較低;由于初始聚類中心的選取具有隨機(jī)性,初始值的選取會(huì)導(dǎo)致分類結(jié)果具有較大的差異性。
針對(duì)傳統(tǒng)算法的缺點(diǎn),提出了基于小波變換的改進(jìn)K-mean算法。小波變換分析是一種基于應(yīng)用數(shù)學(xué)理論的知識(shí),其優(yōu)勢(shì)在于具有良好的時(shí)域頻域局部化、尺度變化和方向選擇性等特征,尤其近年來在紋理結(jié)構(gòu)特征信息提取方面也有一定的應(yīng)用研究[11]。文中采用Daubechies1小波,以云南省昆明市滇池流域??阪?zhèn)遙感圖像為分類目標(biāo),在非監(jiān)督類方法基礎(chǔ)上融合監(jiān)督類方法的思想,對(duì)遙感圖像進(jìn)行小波變換,提取樣本圖像的紋理特征向量,同時(shí)將各類地物的樣本圖像紋理特征向量作為初始聚類中心;讀取樣本數(shù)據(jù)的紋理特征向量進(jìn)行分類,并返回分類圖像的RGB圖,進(jìn)行遙感圖像分類,同時(shí)顯示各類地物的面積比例。
當(dāng)?shù)匚镱愋偷墓庾V信息比較接近時(shí),僅依靠光譜信息進(jìn)行分類結(jié)果誤差較大。在這種情況下,分類過程中可以引入紋理特征信息,因?yàn)椴煌匚锏墓庾V特性可能相同,但是其紋理特征肯定存在明顯的區(qū)別,所以就可以達(dá)到區(qū)分地物的目的。在計(jì)算機(jī)視覺研究領(lǐng)域,紋理是描述圖像的一個(gè)重要特征,基于小波變換的紋理分割方法是一種理想的圖像分割算法[13-14]。
設(shè)定小波包分解的層數(shù)為m,對(duì)Bi(i=1,2,…,p)分別進(jìn)行m層二維小波包分解,對(duì)于每個(gè)圖像子塊,均得到4m個(gè)分解子頻帶圖像。這里為了簡(jiǎn)便,決定進(jìn)行單尺度的小波變換,m取1,共得到4個(gè)分解子頻帶的圖像[5]。將每個(gè)圖像子塊的4個(gè)子頻帶的絕對(duì)值平均能量值作為一個(gè)特征分量,其表示為:
(5)
其中,M、N為子頻帶X的寬和高;X(i,j)為頻帶系數(shù)值。
因此第i個(gè)子塊的特征向量為:
wi=[ei,1,ei,2,ei,3,ei,4]
(6)
其中,ei,k表示第k個(gè)子頻帶的平均能量值。
通過下載的圖像資料中如土地利用類型圖和植被分布圖等,根據(jù)圖像各波段的光譜色調(diào)、紋理、形狀等特征(見表1)在屏幕上直接選取有代表性的地物類型的區(qū)域。
表1 昆明市滇池流域遙感圖像典型地物類型的目視解譯標(biāo)志
對(duì)待分類圖像進(jìn)行二維單尺度小波變換(DWT2),通過指定小波或者分解濾波器進(jìn)行二維單尺度小波分解,提取特征向量。
2.3使用改進(jìn)的K-mean算法進(jìn)行遙感圖像分類
實(shí)驗(yàn)分割對(duì)象為云南省昆明市滇池流域海口鎮(zhèn)的2015年谷歌地球遙感圖像(見圖3)。算法在MATLAB.R2010a平臺(tái)上實(shí)現(xiàn),經(jīng)過反復(fù)對(duì)實(shí)驗(yàn)區(qū)原始圖像進(jìn)行分割實(shí)驗(yàn),選取迭代次數(shù)為25~30,可以獲得較好的分割結(jié)果。
圖3 小波變換改進(jìn)的K-mean算法影像分割分類結(jié)果
按照各地物類型占總研究區(qū)的比例得到如圖4所示的餅狀圖。
圖4 K-mean算法分割影像分類結(jié)果統(tǒng)計(jì)圖
根據(jù)??阪?zhèn)土地利用總體規(guī)劃2010年土地利用現(xiàn)狀變更調(diào)查結(jié)果顯示,全鎮(zhèn)土地總面積為17 437.57公頃,已利用土地16 181.52公頃,占全鎮(zhèn)總面積的92.80%,未利用土地1 256.05公頃,占總面積的7.20%,土地利用較為充分。在已利用的土地面積中,耕地為2 880.33公頃,占16.52%,林地10 690.97公頃,占61.31%,園地224.33公頃,占1.29%,居民點(diǎn)及工礦用地1 570.66公頃,占9.01%,交通用地為455.45公頃,占2.61%,水域用地184.38公頃,占1.06%。根據(jù)海口鎮(zhèn)土地環(huán)境條件,規(guī)劃前有零星牧草地約占1%,后期規(guī)劃調(diào)整中不再配置增加牧草地。
分割性能評(píng)價(jià)誤分率是指錯(cuò)誤分割的像素占理想分割圖像總的像素的百分比,誤分率越低,說明對(duì)于被分割的圖像其被錯(cuò)誤歸類的像素越少,即分割效果越好,歸類越準(zhǔn)確。反之,誤分率越高,說明對(duì)于被分割的圖像其被錯(cuò)誤歸類的像素越多,即分割效果越差,歸類越模糊。將2015年的遙感影像分類結(jié)果和2010年海口鎮(zhèn)土地利用現(xiàn)狀變更調(diào)查結(jié)果進(jìn)行對(duì)比(見圖5),結(jié)果顯示林地、園地、牧草地、水域以及交通用地影像自動(dòng)分類結(jié)果和調(diào)查數(shù)據(jù)差距較大,誤分率均達(dá)到70%以上。但同時(shí)在對(duì)園地、林地、牧草地提取圖像特征時(shí),三種地物類型具有明顯的相似性,包括顏色和外表輪廓等,如將三者進(jìn)行合并進(jìn)行統(tǒng)計(jì)分析,則誤差率降低為35.5%,則分類結(jié)果較為可信。按照海口鎮(zhèn)經(jīng)濟(jì)發(fā)展趨勢(shì)進(jìn)行分析,2015年的全鎮(zhèn)經(jīng)濟(jì)水平明顯高于2010年,部分耕地、未利用土地轉(zhuǎn)化為居民及交通用地是經(jīng)濟(jì)發(fā)展中一個(gè)不可避免的趨勢(shì),因此對(duì)于耕地、未利用地以及交通用地的變化可以認(rèn)為分類結(jié)果準(zhǔn)確,誤差在合理的波動(dòng)范圍之中;對(duì)于水域分類結(jié)果的差異則是由于2010年進(jìn)行土地利用現(xiàn)狀變更調(diào)查中統(tǒng)計(jì)的水域面積擴(kuò)大以及由于遙感影像的圖像色階差異導(dǎo)致誤分,也是后續(xù)研究中需要解決的一個(gè)問題。
圖5 遙感影像分類結(jié)果和調(diào)查結(jié)果對(duì)比圖
總體來說,從統(tǒng)計(jì)以及人工識(shí)別的角度進(jìn)行綜合分析,利用該算法進(jìn)行的遙感影像自動(dòng)分類結(jié)果較為可信,如能獲取更加精確的土地利用類型數(shù)據(jù),則影像總體分類精度將會(huì)進(jìn)一步提高且更加可信。
上述兩種算法的實(shí)驗(yàn)仿真結(jié)果表明,經(jīng)過改良的小波紋理分割遙感影像計(jì)算方法能夠清晰地對(duì)高分辨率遙感圖像進(jìn)行分割,待分類圖像經(jīng)過單尺度二維離散小波變換后,削弱了相同地物類型內(nèi)部的噪聲,提高了不同地物類型的邊緣差異性[15];而貝葉斯最小錯(cuò)誤率分類方法在大范圍調(diào)查中且不追求高精度的統(tǒng)計(jì)數(shù)據(jù)時(shí)有很好的利用前景,而基于小波變換的K-means算法對(duì)于精確數(shù)據(jù)統(tǒng)計(jì)應(yīng)用效果較好。文中方法盡管能夠完成大部分圖像的分割以及分類研究,但是在實(shí)驗(yàn)過程中也發(fā)現(xiàn),對(duì)于圖像中的個(gè)別區(qū)域以及陰影區(qū)
域出現(xiàn)了較大的誤差,誤分概率較大,所以算法還存在很多不足之處,需要加強(qiáng)。對(duì)于實(shí)驗(yàn)結(jié)果中圖像分類效果好壞的評(píng)價(jià)是通過目視觀察和來自官方的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行對(duì)比分析,這種評(píng)價(jià)方法不僅費(fèi)時(shí)而且常帶有人的主觀因素,因此,該領(lǐng)域迫切地需要一種好的圖像分割方法評(píng)價(jià)標(biāo)準(zhǔn)。
[1] 侯立華.圖像分割方法綜述[J].科技創(chuàng)新導(dǎo)報(bào),2008(22):249.
[2] 黃 煌,肖鵬峰,王結(jié)臣.多尺度歸一化割用于遙感圖像分割[J].遙感信息,2015,30(5):20-25.
[3] 謝娟英,高紅超.基于統(tǒng)計(jì)相關(guān)性與K-means的區(qū)分基因子集選擇算法[J].軟件學(xué)報(bào),2014,25(9):2050-2075.
[4] 王曉年,馮遠(yuǎn)靜,馮祖仁.一種基于主動(dòng)輪廓模型的蟻群圖像分割算法[J].控制理論與應(yīng)用,2006,23(4):515-522.
[5] 胡建強(qiáng),李涓子,廖桂平.一種基于多維服務(wù)質(zhì)量的局部最優(yōu)服務(wù)選擇模型[J].計(jì)算機(jī)學(xué)報(bào),2010,33(3):526-534.
[6] CHAKRABORTY R S.Hardware security through design obfuscation[D].USA:Case Western Reserve University,2010.
[7] DORIGO M,BLUM C.Ant colony optimization theory:a survey[J].Theoretical Computer Science,2005,344:243-278.
[8] 曹永春,蔡正琦,邵亞斌.基于K-means的改進(jìn)人工蜂群聚類算法[J].計(jì)算機(jī)應(yīng)用,2014,34(1):204-207.
[9] 翟東海,魚 江,高 飛,等.最大距離法選取初始簇中心的K-means文本聚類算法的研究[J].計(jì)算機(jī)應(yīng)用研究,2014,31(3):713-715.
[10] WANG X,DU J,WU S,et al.Cluster ensemble-based image segmentation[J].International Journal of Advanced Robotic Systems,2013,10:297-308.
[11] 張亞利,睢 丹.改進(jìn)小波算法在圖像分割技術(shù)中的應(yīng)用[J].數(shù)字技術(shù)與應(yīng)用,2016(3):137-138.
[12] 趙 越,周 萍.改進(jìn)的K-means算法在遙感圖像分類中的應(yīng)用[J].國(guó)土資源遙感,2011,23(2):87-90.
[13] 季 虎,孫即祥,邵曉芳,等.圖像邊緣提取方法及展望[J].計(jì)算機(jī)工程與應(yīng)用,2004,40(14):70-73.
[14] 白 楊,孫 躍,王 君,等.基于動(dòng)態(tài)自適應(yīng)蟻群算法的MRI圖像分割[J].計(jì)算機(jī)科學(xué),2008,35(2):226-229.
[15] NEZAMABADI-POUR H,SARYAZDI S,RASHEDIE.Edge detection using ant algorithms[J].Soft Computing,2006,10(7):623-628.