馮文卿,眭海剛,涂繼輝,2,孫開(kāi)敏,黃偉明
1.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079;2.長(zhǎng)江大學(xué)電子信息學(xué)院,湖北 荊州 434023;3.隆德大學(xué)自然地理和生態(tài)系統(tǒng)科學(xué)系,瑞典 隆德 22362
高分辨率遙感影像的隨機(jī)森林變化檢測(cè)方法
馮文卿1,眭海剛1,涂繼輝1,2,孫開(kāi)敏1,黃偉明3
1.武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079;2.長(zhǎng)江大學(xué)電子信息學(xué)院,湖北 荊州 434023;3.隆德大學(xué)自然地理和生態(tài)系統(tǒng)科學(xué)系,瑞典 隆德 22362
基于面向?qū)ο蠓治?OBIA)的遙感影像變化檢測(cè)研究已取得顯著的進(jìn)展,代表了遙感影像變化檢測(cè)的發(fā)展范式,未來(lái)是發(fā)展更加智能的解譯分析方法。隨機(jī)森林作為一種新的機(jī)器學(xué)習(xí)算法,其預(yù)測(cè)效果和性能穩(wěn)定性要優(yōu)于許多單預(yù)測(cè)器和集成預(yù)測(cè)方法。本文充分利用OBIA及隨機(jī)森林機(jī)器學(xué)習(xí)算法的優(yōu)勢(shì),提出了利用隨機(jī)森林進(jìn)行面向?qū)ο蟮倪b感影像變化檢測(cè)。首先基于熵率對(duì)影像進(jìn)行超像素分割,通過(guò)最優(yōu)超像素個(gè)數(shù)評(píng)價(jià)指數(shù)來(lái)獲取最佳的影像分割結(jié)果,并提取每個(gè)超像素在前、后時(shí)相影像上的光譜特征和Gabor特征作為隨機(jī)森林的特征輸入數(shù)據(jù),用于模型的訓(xùn)練。在初始像素級(jí)檢測(cè)結(jié)果之上,自動(dòng)進(jìn)行分類樣本選擇并構(gòu)建分類器模型,用訓(xùn)練好的模型來(lái)提取最終的變化區(qū)域。利用Quickbird、IKONOS、SPOT-5等3組多光譜影像進(jìn)行試驗(yàn),結(jié)果表明,本文方法在變化檢測(cè)精度上要優(yōu)于對(duì)比方法。
分割;超像素;特征;隨機(jī)森林;變化檢測(cè)
變化檢測(cè)是通過(guò)定量分析不同時(shí)期遙感影像,確定地表覆蓋變化的過(guò)程,是遙感研究領(lǐng)域的熱點(diǎn),被廣泛應(yīng)用在災(zāi)害評(píng)估、城市發(fā)展、土地利用/覆蓋監(jiān)測(cè)等方面[1]。隨著遙感影像空間分辨率的提高,同類地物內(nèi)部光譜差異逐漸增大,基于像元光譜統(tǒng)計(jì)的自動(dòng)變化檢測(cè)技術(shù)已經(jīng)不能滿足當(dāng)前遙感圖像變化信息提取的要求,成為制約高分辨率遙感圖像廣泛應(yīng)用的主要瓶頸。面向?qū)ο蠓治?object-based image analysis,OBIA)方法為高分辨率遙感影像變化信息提取提供了新的思路,各國(guó)學(xué)者從不同的方面針對(duì)不同的應(yīng)用目的,研究了大量的變化檢測(cè)方法和理論模型[2-4]。
傳統(tǒng)的像素級(jí)變化檢測(cè)算法以單個(gè)像元為分析單位,無(wú)法顧及與鄰域像素之間的空間關(guān)系,使得變化檢測(cè)結(jié)果存在孤立性,并且容易產(chǎn)生椒鹽現(xiàn)象[2]。為了克服該問(wèn)題,有學(xué)者通過(guò)利用水平集(level set)及其改進(jìn)算法、馬爾科夫隨機(jī)場(chǎng)(Markov random field,MRF)、條件隨機(jī)場(chǎng)(conditional random field,CRF)等方法,將光譜和空間信息進(jìn)行有效結(jié)合,降低變化檢測(cè)的不確定性。其中,文獻(xiàn)[5—6]結(jié)合模糊C均值聚類(FCM)和MRF模型,提出了一種非監(jiān)督的變化檢測(cè)算法,相較于只利用單一方法,確實(shí)能夠提高檢測(cè)精度。文獻(xiàn)[7—9]通過(guò)考慮影像上區(qū)域之間的鄰接限制關(guān)系,利用改進(jìn)的水平集模型、條件隨機(jī)場(chǎng)模型來(lái)進(jìn)行變化、未變化區(qū)域的提取。文獻(xiàn)[10]將主成分變換(principal component analysis,PCA)和k均值聚類(PCA-k-means)進(jìn)行結(jié)合,有效減少了數(shù)據(jù)間的冗余信息,使得變化信息在變換后的影像上得到增強(qiáng),有利于變化信息的提取。但是,這些方法中控制參數(shù)的設(shè)置嚴(yán)重影響了最終檢測(cè)結(jié)果的精度;如果空間鄰域關(guān)系定義不夠準(zhǔn)確,很容易導(dǎo)致邊緣等細(xì)節(jié)過(guò)度平滑,造成細(xì)節(jié)變化的漏檢。對(duì)象級(jí)變化檢測(cè)以影像分割為基礎(chǔ),所處理的最小單元為一個(gè)對(duì)象。影像對(duì)象被定義為形狀與光譜性質(zhì)具有同質(zhì)性的單個(gè)區(qū)域,每個(gè)對(duì)象的屬性包括:光譜特征、形狀特征、紋理特征、上下文特征等[11-13]。這樣在變化檢測(cè)過(guò)程中,可以充分利用光譜信息并綜合應(yīng)用其他特征,以提高變化檢測(cè)精度。文獻(xiàn)[12—13]利用基于對(duì)象的變化向量分析法(object-based change vector analysis,OCVA)、相關(guān)系數(shù)法(object-based correlation coefficient,OCC)、卡方變換法(object-based Chi-square transformation,OCST),綜合利用對(duì)象的多種特征參與分析,相較于只利用單一特征,確實(shí)能夠提高變化檢測(cè)精度。但是,這些方法對(duì)特征選取的好壞、特征權(quán)重的分配以及變化閾值的確定等幾個(gè)方面都具有較大依賴性。此外,由于分割尺度的不確定性,容易在變化檢測(cè)過(guò)程中引入噪聲,降低變化檢測(cè)結(jié)果的可靠性。文獻(xiàn)[14]提出了一種多尺度分割與融合的對(duì)象級(jí)變化檢測(cè)方法,并對(duì)不同的融合策略對(duì)最終檢測(cè)結(jié)果的精度進(jìn)行了分析。文獻(xiàn)[15]則提出了一種尺度驅(qū)動(dòng)的面向?qū)ο笞兓瘷z測(cè)模型,對(duì)分割結(jié)果存在的尺度不確定性進(jìn)行分析,減弱了分割不確定性對(duì)變化檢測(cè)結(jié)果的影響??傮w來(lái)說(shuō),面向?qū)ο蠓治龇椒ㄊ且环N較為高級(jí)的影像分析方法,為了獲取更好的變化檢測(cè)結(jié)果,需要綜合考慮分割尺度,特征提取,變化閾值等多個(gè)方面的因素,其未來(lái)的發(fā)展趨勢(shì)是分析過(guò)程的自動(dòng)化與智能化。
隨機(jī)森林(random forest,RF)是由數(shù)據(jù)驅(qū)動(dòng)的非參數(shù)分類方法,通過(guò)給定樣本進(jìn)行學(xué)習(xí)訓(xùn)練,形成分類規(guī)則,無(wú)需先驗(yàn)知識(shí),對(duì)于噪聲數(shù)據(jù)具有很好的魯棒性,同時(shí)可以估計(jì)特征的重要性,具有較快的學(xué)習(xí)速度,相比當(dāng)前的同類算法具有較高的準(zhǔn)確度[18]。本文充分利用面向?qū)ο蠓治龇椒ǖ膬?yōu)勢(shì),并將其與隨機(jī)森林模型進(jìn)行結(jié)合,對(duì)分類樣本的自動(dòng)選取、樣本特征提取及決策樹(shù)個(gè)數(shù)對(duì)最終分類器性能的影響進(jìn)行了深入分析,提出了一種利用隨機(jī)森林進(jìn)行面向?qū)ο蟮倪b感影像變化檢測(cè)算法。
本文所提出的變化檢測(cè)算法,整體流程如圖1所示。主要包括以下3個(gè)步驟:①對(duì)兩時(shí)相影像進(jìn)行光譜特征和Gabor特征差異分析,并對(duì)兩種特征的變化檢測(cè)結(jié)果進(jìn)行邏輯運(yùn)算,將獲得的結(jié)果作為對(duì)象級(jí)變化檢測(cè)分析執(zhí)行的前提;②將兩時(shí)相影像進(jìn)行疊合,對(duì)疊加影像進(jìn)行主成分分析,并利用基于熵率的方法對(duì)第1主成分影像進(jìn)行分割,通過(guò)改變超像素?cái)?shù)目來(lái)獲取多層次不同尺寸大小的超像素區(qū)域;然后,利用超像素個(gè)數(shù)評(píng)價(jià)指數(shù)來(lái)獲取最佳的影像分割結(jié)果;③在像素級(jí)檢測(cè)結(jié)果基礎(chǔ)之上,自動(dòng)進(jìn)行分類樣本選擇并提取每個(gè)超像素在前、后時(shí)相影像上的光譜特征和Gabor特征作為隨機(jī)森林的特征輸入數(shù)據(jù),用于模型的訓(xùn)練;并利用訓(xùn)練好的分類器來(lái)獲取最終的對(duì)象級(jí)檢測(cè)結(jié)果。
圖1 變化檢測(cè)算法整體流程Fig.1 The flow chart of change detection algorithm
1.1 光譜特征與Gabor特征提取
1.1.1 光譜特征差異圖計(jì)算
(1)
1.1.2 Gabor特征差異圖計(jì)算
Gabor小波函數(shù)是由高斯函數(shù)經(jīng)過(guò)傅里葉變換得到的,它可以在不同尺度和方向上提取圖像相關(guān)特征[19]。Gabor濾波器與人們的認(rèn)知系統(tǒng)是一致的,能獲得頻率域和空間域的局部最優(yōu)化,實(shí)現(xiàn)對(duì)空間域和頻率域的最好表達(dá),對(duì)影像的紋理信息能夠進(jìn)行充分的表達(dá)[20]。本文利用Gabor小波提取遙感影像的紋理特征,用于變化檢測(cè)。二維Gabor函數(shù)Fφ(x,y)表示為
(2)
Gφ(x,y)=Re{I(x,y)*Fφ(x,y)}
(3)
式中,Gφ(x,y)為原始圖像I(x,y)經(jīng)過(guò)Gabor濾波后提取的特征圖像;*表示二維卷積運(yùn)算[20]。接著,本文對(duì)Gabor特征圖進(jìn)行差值運(yùn)算,形成差異影像N2。為了使光譜差異影像和Gabor差異影像具有相同的取值區(qū)間,需要對(duì)這兩種數(shù)據(jù)進(jìn)行歸一化處理,計(jì)算公式如下
(4)
1.2 最優(yōu)超像素個(gè)數(shù)評(píng)價(jià)指數(shù)
本文采用基于熵率的分割(entropy rate super-pixel segmentation)算法[21]將遙感影像劃分為一個(gè)個(gè)超像素區(qū)域,便于后續(xù)的變化信息提取試驗(yàn)。在分割過(guò)程中,超像素個(gè)數(shù)的選取,即平衡性的問(wèn)題,對(duì)影像的分割結(jié)果有著舉足輕重的作用,是提高影像分割質(zhì)量的關(guān)鍵。
圖2 邏輯運(yùn)算圖Fig.2 The logical operation graph
對(duì)于面向?qū)ο筮b感信息提取方法中的多尺度超像素分割來(lái)說(shuō),最優(yōu)超像素個(gè)數(shù)定義指:地類能用一個(gè)或幾個(gè)超像素來(lái)表達(dá),超像素大小與地物目標(biāo)大小接近,超像素多邊形不會(huì)太破碎,超像素邊界比較分明,內(nèi)部異質(zhì)性盡量小,不同類別之間的異質(zhì)性盡量大[22];而且超像素能夠表達(dá)某種地物的基本特征,其中內(nèi)部同質(zhì)性保證超像素的純度,而超像素之間的異質(zhì)性保證超像素的可分性[22]。本文采用超像素的加權(quán)方差表示其內(nèi)部同質(zhì)性,利用Moran’s I指數(shù)來(lái)表示超像素之間的異質(zhì)性,計(jì)算公式如下
(5)
(6)
本文采用文獻(xiàn)[23]提出的式(7)來(lái)表示最優(yōu)超像素個(gè)數(shù)評(píng)價(jià)指數(shù)。它是利用超像素的同質(zhì)性指數(shù)和異質(zhì)性指數(shù)來(lái)構(gòu)建衡量分割好壞的質(zhì)量函數(shù),其公式如下
F(H,MI)=(1-ρ)F(H)+ρF(MI)
(7)
式中,F(xiàn)(H)表示同質(zhì)性評(píng)價(jià)指數(shù);F(MI)表示異質(zhì)性評(píng)價(jià)指數(shù);ρ為異質(zhì)性權(quán)重,ρ∈[0,1],在本文的研究中,ρ=0.5。綜合同質(zhì)性指數(shù)和異質(zhì)性指數(shù)對(duì)最優(yōu)超像素個(gè)數(shù)進(jìn)行評(píng)價(jià)前,需要將它們進(jìn)行歸一化處理,如下
(8)
(9)
在此基礎(chǔ)上通過(guò)三次樣條函數(shù)插值的方法就可以得到一個(gè)最優(yōu)超像素個(gè)數(shù)選取的計(jì)算模型
(10)
當(dāng)函數(shù)s3(x)在超像素個(gè)數(shù)區(qū)間[xmin,xmax]取最大值時(shí),所對(duì)應(yīng)的超像素個(gè)數(shù)x,即為最優(yōu)的超像素個(gè)數(shù)。
1.3 隨機(jī)森林面向?qū)ο笞兓瘷z測(cè)方法
隨機(jī)森林是一種采用決策樹(shù)作為基預(yù)測(cè)器的集成學(xué)習(xí)方法,結(jié)合Bagging和隨機(jī)子空間理論,集成眾多決策樹(shù)進(jìn)行預(yù)測(cè),通過(guò)各個(gè)決策樹(shù)的預(yù)測(cè)值進(jìn)行平均或投票,得到最終的預(yù)測(cè)結(jié)果[18,24],其方法流程如圖3所示。首先采用基于Bootstrap方法重采樣,產(chǎn)生多個(gè)訓(xùn)練集;由每個(gè)自助數(shù)據(jù)集生成一棵決策樹(shù),由于采用了Bagging采樣的自助數(shù)據(jù)集僅包含部分原始訓(xùn)練數(shù)據(jù),將沒(méi)有被Bagging采用的數(shù)據(jù)稱為OOB(out-of-bag)數(shù)據(jù),把OOB數(shù)據(jù)用生成的決策樹(shù)進(jìn)行預(yù)測(cè),對(duì)每個(gè)OOB數(shù)據(jù)的預(yù)測(cè)結(jié)果錯(cuò)誤率進(jìn)行統(tǒng)計(jì),得到的平均錯(cuò)誤率即為隨機(jī)森林的錯(cuò)誤估計(jì)率[18,24]。本文基于隨機(jī)森林面向?qū)ο蟮淖兓瘷z測(cè)方法,其主要流程主要包括:影像分割、對(duì)象特征提取、樣本自動(dòng)選擇、隨機(jī)森林分類等幾個(gè)關(guān)鍵步驟。
(1) 影像分割。分割的目的是盡可能將同一種類型的地物分割在一起,最終形成一系列緊湊、區(qū)域一致性較強(qiáng)的同質(zhì)區(qū)域。
圖3 隨機(jī)森林分類器流程Fig.3 The flowchart of random forest classifier
(2) 特征提取。光譜特征是圖像分析的基本特征;在圖像上,如果同一地物或者地物的某一個(gè)部分具有相同的物質(zhì)組成,理想情況下可以認(rèn)為其在圖像上表現(xiàn)為灰度值相同,所以每一個(gè)分割對(duì)象中的像素值基本相同,它們組成的圖像分割對(duì)象能夠反映出現(xiàn)實(shí)中的地物。本文選取前、后時(shí)相影像在不同波段上的均值(mean)、灰度比(ratio)、方差(STD)作為對(duì)象的光譜特征。此外,利用Gabor小波變換對(duì)原始兩期影像進(jìn)行處理,其中高斯函數(shù)的復(fù)制頻率設(shè)置為ω=8,沿x軸和y軸方向的方差分別為σx=1、σy=2。對(duì)變換處理后的影像再做二維卷積運(yùn)算,并提取Gabor特征影像在不同波段上的均值和方差,作為分類特征。將每個(gè)對(duì)象在前、后時(shí)相影像上的光譜特征和Gabor特征進(jìn)行組合,并作為隨機(jī)森林分類器的特征輸入數(shù)據(jù),用于模型的訓(xùn)練。
(3) 樣本選擇。假設(shè)初始像素級(jí)變化檢測(cè)結(jié)果里面每個(gè)超像素Si內(nèi)包含的像素總個(gè)數(shù)為Numt,其中屬于變化像素的個(gè)數(shù)為Numc,未變化像素的個(gè)數(shù)為Numu,顯然Numc+Numu=Numt。本文根據(jù)每個(gè)超像素區(qū)域內(nèi)的變化像素比例w,計(jì)算公式如下
(11)
如果w=0,則該超像素作為未變化樣本;如果w≥T,T為閾值,T∈(0,1),則該超像素作為變化樣本;如果w∈(0,T),則該超像素為不確定變化類別,需要進(jìn)一步判斷。在自動(dòng)提取完變化/未變化樣本之后,隨機(jī)抽取其中80%的樣本作為訓(xùn)練樣本,用于模型訓(xùn)練;剩余樣本作為測(cè)試樣本用于評(píng)價(jià)分類的精度。針對(duì)閾值T的選取,本文在區(qū)間(0,1)范圍內(nèi),以步長(zhǎng)0.1進(jìn)行動(dòng)態(tài)變化,通過(guò)計(jì)算100次測(cè)試數(shù)據(jù)集的平均正確率,當(dāng)正確率最大時(shí),此時(shí)對(duì)應(yīng)的閾值T即為最佳閾值。
(4) 基于隨機(jī)森林的面向?qū)ο笞兓瘷z測(cè)。該過(guò)程主要包括訓(xùn)練和分類兩個(gè)基本過(guò)程,訓(xùn)練過(guò)程根據(jù)訓(xùn)練樣本和決策樹(shù)理論,得到分類的模型,同時(shí)自動(dòng)估計(jì)每個(gè)特征的重要性[18,24];分類過(guò)程即根據(jù)訓(xùn)練好的模型得到對(duì)象的變化類別。具體實(shí)現(xiàn)步驟如下:
step1——根據(jù)樣本選擇原則,創(chuàng)建參與的樣本序號(hào)、每個(gè)樣本的測(cè)試分類等參數(shù)。
① 從總數(shù)為N的特征變量中隨機(jī)選擇n個(gè)變量;
② 從n個(gè)變量中選擇出最佳變量及其最優(yōu)分裂點(diǎn);
③ 將此節(jié)點(diǎn)分裂成左右兩個(gè)子節(jié)點(diǎn)。
step4——利用隨機(jī)森林模型對(duì)新的特征向量X進(jìn)行預(yù)測(cè),取所有決策樹(shù)的投票結(jié)果作為最終的分類結(jié)果。
2.1 試驗(yàn)數(shù)據(jù)
為了綜合驗(yàn)證所提方法的可行性和有效性,本文采用Matlab R2010b軟件進(jìn)行試驗(yàn),試驗(yàn)環(huán)境為Inter(R) Core i5 CPU 2.5 GHz、4 GB內(nèi)存、Windows7操作系統(tǒng)。采用的3組試驗(yàn)數(shù)據(jù)集均已提前配準(zhǔn),并進(jìn)行相對(duì)輻射校正操作,影像灰度級(jí)均為256級(jí),分別如圖4所示,它們的相關(guān)信息詳情見(jiàn)表1所示。
2.2 最優(yōu)超像素個(gè)數(shù)的確定
遙感影像分割的理想結(jié)果是分割所得到的對(duì)象內(nèi)部具有良好的同質(zhì)性,相鄰對(duì)象間具有良好的異質(zhì)性[22]。為了獲取最佳的超像素分割結(jié)果,本文采用最優(yōu)超像素個(gè)數(shù)評(píng)價(jià)指數(shù)來(lái)確定最終的超像素?cái)?shù)目。在分割試驗(yàn)時(shí),通過(guò)改變超像素個(gè)數(shù)來(lái)獲取多層次不同尺寸大小的超像素區(qū)域。在試驗(yàn)數(shù)據(jù)集1中,選擇的超像素范圍從100增至1000,步長(zhǎng)為100,計(jì)算分割后每個(gè)尺度下的總體評(píng)價(jià)值F(H,I),并對(duì)其進(jìn)行三次樣條插值(圖5(a))。結(jié)果顯示,在分割個(gè)數(shù)為592時(shí),F(xiàn)(H,I)最高,即整體上來(lái)說(shuō),在超像素個(gè)數(shù)為592時(shí),超像素內(nèi)部多呈現(xiàn)均質(zhì),不同超像素間多呈現(xiàn)異質(zhì),因此本文選取超像素個(gè)數(shù)592作為試驗(yàn)數(shù)據(jù)集1的最優(yōu)超像素分割值。同理,在試驗(yàn)數(shù)據(jù)集2中,超像素范圍從300增至1200,步長(zhǎng)為100,從圖5(b)中可以看出,最優(yōu)超像素個(gè)數(shù)為783。在試驗(yàn)數(shù)據(jù)集3中,超像素范圍從900增至1800,步長(zhǎng)為100,從圖5(c)中可以看出,最優(yōu)超像素個(gè)數(shù)為1703。
圖4 3組試驗(yàn)數(shù)據(jù)集Fig.4 Three experimental datasets
表1 3組數(shù)據(jù)集詳情Tab.1 Details of three datasets
2.3 變化檢測(cè)試驗(yàn)分析
2.3.1 自動(dòng)樣本選擇閾值T對(duì)分類精度的影響
在分割完成之后,本文選取每個(gè)超像素在前、后時(shí)相影像上的光譜特征和Gabor特征作為隨機(jī)森林的特征輸入數(shù)據(jù),用于模型的訓(xùn)練。在自動(dòng)選擇分類樣本的時(shí)候,針對(duì)閾值T的選取,本文對(duì)3組試驗(yàn)影像,在區(qū)間(0,1)范圍內(nèi),以步長(zhǎng)0.1進(jìn)行動(dòng)態(tài)變化;通過(guò)計(jì)算100次測(cè)試數(shù)據(jù)集的平均正確率,從圖6所示的結(jié)果中可以看出:在試驗(yàn)數(shù)據(jù)集DS1中,當(dāng)閾值T=0.7時(shí),此時(shí)測(cè)試數(shù)據(jù)集的平均正確率最大,分類精度達(dá)到92.2%,即最佳選擇閾值為0.7。同理,在試驗(yàn)數(shù)據(jù)集DS2中,最佳選擇閾值為0.6,此時(shí)測(cè)試數(shù)據(jù)集的分類精度最大,達(dá)到94.6%;在試驗(yàn)數(shù)據(jù)集DS3中,最佳選擇閾值為0.5,此時(shí)測(cè)試數(shù)據(jù)集的分類精度最大,達(dá)到94.3%。
2.3.2 決策樹(shù)個(gè)數(shù)K對(duì)分類精度的影響
為了評(píng)估隨機(jī)森林中決策樹(shù)個(gè)數(shù)K對(duì)分類器性能的影響,本文對(duì)3組試驗(yàn)影像在區(qū)間[50,1000]范圍內(nèi),以步長(zhǎng)50進(jìn)行動(dòng)態(tài)變化;通過(guò)計(jì)算100次OOB誤差的平均值,從圖7所示的結(jié)果中可以看出:在試驗(yàn)數(shù)據(jù)集DS1中,當(dāng)決策樹(shù)個(gè)數(shù)K為250時(shí),此時(shí)OOB誤差達(dá)到最小值;隨著K的增加,OOB誤差值趨于穩(wěn)定,而此時(shí)分類器的訓(xùn)練時(shí)間隨著K的增加而增加,當(dāng)K=250時(shí),OOB誤差值為0.077,此時(shí)測(cè)試數(shù)據(jù)集分類精度達(dá)到92.3%。同理,在試驗(yàn)數(shù)據(jù)集DS2中,當(dāng)決策樹(shù)個(gè)數(shù)K為450時(shí),此時(shí)OOB誤差達(dá)到最小值,OOB誤差值為0.071,此時(shí)測(cè)試數(shù)據(jù)集分類精度達(dá)到92.9%。在試驗(yàn)數(shù)據(jù)集DS3中,當(dāng)決策樹(shù)個(gè)數(shù)K為700時(shí),此時(shí)OOB誤差達(dá)到最小值,OOB誤差值為0.072,此時(shí)測(cè)試數(shù)據(jù)集分類精度達(dá)到92.8%。
圖6 自動(dòng)樣本選擇閾值T對(duì)性能的影響Fig.6 The performance of threshold T in automatic sample selection
2.3.3 變化檢測(cè)結(jié)果與精度評(píng)定
為了對(duì)所提出的方法性能進(jìn)行定量評(píng)估,本文通過(guò)構(gòu)建混淆矩陣的方式來(lái)計(jì)算變化檢測(cè)結(jié)果的精度,并采用虛檢率、漏檢率、總體正確率以及Kappa指數(shù)4個(gè)指標(biāo)來(lái)衡量[25]。本文采用基于像素的變化向量分析法(change vector analysis,CVA)來(lái)構(gòu)造光譜差異圖。接著,利用Gabor小波變換對(duì)原始兩期影像進(jìn)行處理,提取Gabor特征差異圖,并對(duì)獲取的多時(shí)相差異影像進(jìn)行自適應(yīng)閾值分割(CVA-Gabor-OSTU),采用圖2所示的邏輯運(yùn)算規(guī)則來(lái)獲取初始的變化檢測(cè)結(jié)果。然后,在像素級(jí)檢測(cè)結(jié)果基礎(chǔ)之上,自動(dòng)進(jìn)行分類樣本選擇并利用基于隨機(jī)森林面向?qū)ο蟮淖兓瘷z測(cè)流程來(lái)獲取最終的對(duì)象級(jí)變化檢測(cè)結(jié)果。與此同時(shí),將本文方法與基于迭代條件模式的馬爾科夫模型(MRF-ICM)、基于對(duì)象的變化向量分析方法(OCVA),文獻(xiàn)[9]中所用的Chan-Vese (CV)水平集模型、距離規(guī)則水平集演化(distance regularized level set evolution,DRLSE)模型以及文獻(xiàn)[10]所提出的PCA-k-means方法進(jìn)行了對(duì)比分析。其中,MRF-ICM、CV、DRLSE 3種方法是對(duì)光譜差異圖進(jìn)行分割,以獲取最終的變化檢測(cè)結(jié)果;在MRF-ICM算法中,分類數(shù)class=2,固定勢(shì)函數(shù)β=0.5,迭代次數(shù)InterMax=30,并使用K均值算法計(jì)算初始分割結(jié)果;在PCA-k-means方法中,分塊大小H=5,特征向量維數(shù)S=5。利用3組試驗(yàn)數(shù)據(jù)集所得到的變化檢測(cè)結(jié)果分別如圖8—10所示,它們對(duì)應(yīng)的精度評(píng)定結(jié)果分別如表2—4所示,其中圖8(a)、圖9(a)、圖10(a)是根據(jù)目視解譯結(jié)果和實(shí)地調(diào)繪相結(jié)合而制作的標(biāo)準(zhǔn)變化檢測(cè)影像,黑色區(qū)域表示未變化的區(qū)域,白色區(qū)域表示變化的區(qū)域。
綜合3組試驗(yàn)結(jié)果可以得出以下結(jié)論:
(1) 傳統(tǒng)的像素級(jí)方法如CVA、MRF-ICM、PCA-k-means等在3組試驗(yàn)數(shù)據(jù)集中的變化檢測(cè)結(jié)果精度較低。這主要是由于3種方法在檢測(cè)過(guò)程中僅利用兩期影像的光譜信息,而原始影像受到噪聲的影響較大。從3組試驗(yàn)結(jié)果圖中也可以看出,3種方法的檢測(cè)結(jié)果都存在嚴(yán)重的椒鹽現(xiàn)象,并且存在較多孤立的像素點(diǎn),導(dǎo)致最終的試驗(yàn)效果不佳。在算法的時(shí)間消耗方面,MRF-ICM算法需要不停迭代優(yōu)化,時(shí)間上要明顯長(zhǎng)于CVA與PCA-k-means方法。
(2) 基于水平集演化分割的改進(jìn)算法,其在對(duì)差異影像進(jìn)行分割時(shí)能夠顧及像素之間的鄰域信息。從3組試驗(yàn)結(jié)果中可以看出,距離規(guī)則水平集演化(DRLSE)模型相較于傳統(tǒng)的CV模型,能夠進(jìn)一步提高變化檢測(cè)結(jié)果的精度。由于在分割演化的過(guò)程中,考慮了影像上區(qū)域之間的鄰接限制關(guān)系,所以在算法的時(shí)間消耗方面,DRLSE算法時(shí)間最長(zhǎng),其次是傳統(tǒng)的CV方法,且二者的時(shí)間消耗均長(zhǎng)于CVA和PCA-k-means方法。而基于面向?qū)ο蠓治龅淖兓蛄糠治?(OCVA) 法,其結(jié)果在3組試驗(yàn)中并沒(méi)有明顯優(yōu)于傳統(tǒng)的像素級(jí)變化檢測(cè)方法,在對(duì)差異影像進(jìn)行自動(dòng)閾值分割時(shí),分割結(jié)果的好壞對(duì)最終的變化檢測(cè)影響較大。這主要是由于其過(guò)分依賴閾值選取的好壞,以及對(duì)象的灰度均值信息,而未能有效利用其灰度分布信息,導(dǎo)致最終的檢測(cè)效果不佳。
(3) 本文將面向?qū)ο罄碚撆c隨機(jī)森林進(jìn)行結(jié)合,利用最優(yōu)超像素個(gè)數(shù)評(píng)價(jià)指數(shù)來(lái)獲取最佳的影像分割結(jié)果;同時(shí),針對(duì)分類樣本的自動(dòng)選取閾值參數(shù)以及隨機(jī)森林模型中的決策樹(shù)個(gè)數(shù)進(jìn)行了試驗(yàn)分析,所得的變化檢測(cè)結(jié)果其總體正確率最高,且虛檢率和漏檢率也低于其他算法,進(jìn)一步證明了該方法的有效性和可行性。在算法的時(shí)間消耗方面,也明顯優(yōu)于MRF-ICM、DRLSE等算法。
圖7 隨機(jī)森林中決策樹(shù)棵樹(shù)對(duì)性能的影響Fig.7 The performance of different numbers of decision trees in random forest
圖8 試驗(yàn)數(shù)據(jù)集1不同方法的變化檢測(cè)結(jié)果Fig.8 The change detection results by different methods of DS1
圖9 試驗(yàn)數(shù)據(jù)集2不同方法的變化檢測(cè)結(jié)果Fig.9 The change detection results by different methods of DS2
圖10 試驗(yàn)數(shù)據(jù)集3不同方法的變化檢測(cè)結(jié)果Fig.10 The change detection results by different methods of DS3
表2 試驗(yàn)數(shù)據(jù)集1不同方法之間的變化檢測(cè)精度評(píng)價(jià)Tab.2 Accuracy of change detection by different methods of DS1
表3 試驗(yàn)數(shù)據(jù)集2不同方法之間的變化檢測(cè)精度評(píng)價(jià)Tab.3 Accuracy of change detection by different methods of DS2
表4 試驗(yàn)數(shù)據(jù)集3不同方法之間的變化檢測(cè)精度評(píng)價(jià)Tab.4 Accuracy of change detection by different methods of DS3
綜上所述,在實(shí)際的變化檢測(cè)應(yīng)用中,可以將基于像素和基于對(duì)象的變化檢測(cè)過(guò)程有機(jī)結(jié)合起來(lái),并利用隨機(jī)森林分類器的優(yōu)勢(shì)來(lái)獲取最終的對(duì)象級(jí)檢測(cè)結(jié)果。該結(jié)果不僅較為規(guī)整,而且檢測(cè)對(duì)象都對(duì)應(yīng)著實(shí)際意義的地理實(shí)體。因此,可以有效集成多種方法的優(yōu)勢(shì),以獲取最佳的檢測(cè)精度。
本文提出了一種利用隨機(jī)森林分類器進(jìn)行面向?qū)ο蟮倪b感影像變化檢測(cè)算法,并詳細(xì)闡述了該算法的流程。該方法能夠在像素級(jí)變化檢測(cè)結(jié)果之上,自動(dòng)進(jìn)行分類樣本選擇及自動(dòng)構(gòu)建分類模型的優(yōu)勢(shì),相比較當(dāng)前其他的非監(jiān)督算法,能夠進(jìn)一步提高變化檢測(cè)結(jié)果的精度。但是也仍然存在一定的不足之處,在針對(duì)高分辨率遙感影像的變化檢測(cè)問(wèn)題時(shí),由于其“同物異譜”和“同譜異物”的現(xiàn)象較為嚴(yán)重,僅利用光譜特征信息和Gabor特征信息仍然存在不足。在今后的研究中,可進(jìn)一步引入邊緣等特征信息,從而進(jìn)一步有效地提高變化檢測(cè)精度。
[1] 李亮,舒寧,王凱,等.融合多特征的遙感影像變化檢測(cè)方法[J].測(cè)繪學(xué)報(bào),2014,43(9):945-953.DOI:10.13485/j.cnki.11-2089.2014.0138.
LI Liang,SHU Ning,WANG Kai,et al.Change Detection Method for Remote Sensing Images Based on Multi-features Fusion[J].Acta Geodaetica et Cartographica Sinica,2014,43(9):945-953.DOI:10.13485/j.cnki.11-2089.2014.0138.
[2] DURO D C,F(xiàn)RANKLIN S E,DUBé M G.A Comparison of Pixel-based and Object-based Image Analysis with Selected Machine Learning Algorithms for the Classification of Agricultural Landscapes Using SPOT-5 HRG Imagery[J].Remote Sensing of Environment,2012,118(2):259-272.
[3] HAZEL G G.Object-level Change Detection in Spectral Imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2001,39(3):553-561.
[4] WANG Chao,XU Mengxi,WANG Xin,et al.Object-Oriented Change Detection Approach for High-resolution Remote Sensing Images Based on Multiscale Fusion[J].Journal of Applied Remote Sensing,2013,7(1):73-82.
[5] HAO Ming,ZHANG Hua,SHI Wenzhong,et al.Unsupervised Change Detection Using Fuzzy c-means and MRF from Remotely Sensed Images[J].Remote Sensing Letters,2013,4(12):1185-1194.
[6] SHAO Pan,SHI Wenzhong,HE Pengfei,et al.Novel Approach to Unsupervised Change Detection Based on a Robust Semi-supervised FCM Clustering Algorithm[J].Remote Sensing,2016,8(3):264.
[7] CAO Guo,LIU Yazhou,SHANG Yanfeng.Automatic Change Detection in Remote Sensing Images Using Level Set Method with Neighborhood Constraints[J].Journal of Applied Remote Sensing,2014,8(1):83-89.
[8] ZHOU Licun,CAO Guo,LI Yupeng,et al.Change Detection Based on Conditional Random Field with Region Connection Constraints in High-resolution Remote Sensing Images[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016,9(8):3478-3488.
[9] HAO Ming,SHI Wenzhong,ZHANG Hua,et al.Unsupervised Change Detection with Expectation-maximization-based Level Set[J].IEEE Geoscience and Remote Sensing Letters,2014,11(1):210-214.
[10] CELIK T.Unsupervised Change Detection in Satellite Images Using Principal Component Analysis and k-means Clustering[J].IEEE Geoscience and Remote Sensing Letters,2009,6(4):772-776.
[11] WANG Wenjie,ZHAO Zhongming,ZHU Haiqing.Object-oriented Change Detection Method Based on Multi-scale and Multi-Feature Fusion[C]∥2009 Joint Urban Remote Sensing Event.Shanghai:IEEE,2009:1-5.
[12] SUN Kaimin,CHEN Yan.The Application of Objects Change Vector Analysis in Object-level Change Detection[C].Proceedings of the International Conference on Computational Intelligence and Industrial Application (PACIIA).[S.l.:s.n.],2010,15(4):383-389.
[13] 王琰,舒寧,龔龑.高分辨率遙感影像土地利用變化檢測(cè)方法研究[J].國(guó)土資源遙感,2012,24(1):43-47.
WANG Yan,SHU Ning,GONG Yan.A Study of Land Use Change Detection Based on High Resolution Remote Sensing Images[J].Remote Sensing for Land & Resources,2012,24(1):43-47.
[14] 馮文卿,張永軍.利用多尺度融合進(jìn)行面向?qū)ο蟮倪b感影像變化檢測(cè)[J].測(cè)繪學(xué)報(bào),2015,44(10):1142-1151.DOI:10.11947/j.AGCS.2015.20140260.
FENG Wenqing,ZHANG Yongjun.Object-oriented Change Detection for Remote Sensing Images Based on Multi-scale Fusion[J].Acta Geodaetica et Cartographica Sinica,2015,44(10):1142-1151.DOI:10.11947/j.AGCS.2015.20140260.
[15] HAO Ming,SHI Wenzhong,ZHANG Hua,et al.A Scale-driven Change Detection Method Incorporating Uncertainty Analysis for Remote Sensing Images[J].Remote Sensing,2016,8(9):745.
[16] ZHANG Junping,MU Chunfang,CHEN Hao,et al.Multi-scale Segmentation in Change Detection for Urban High Resolution Images[C]∥Proceedings of the 2011 IEEE International Geoscience and Remote Sensing Symposium.Vancouver,BC:IEEE,2011:209-212.
[17] TANG Yuqi,ZHANG Liangpei,HUANG Xin.Object-oriented Change Detection Based on the Kolmogorov-Smirnov Test Using High-resolution Multispectral Imagery[J].International Journal of Remote Sensing,2011,32(20):5719-5740.
[18] 顧海燕,閆利,李海濤,等.基于隨機(jī)森林的地理要素面向?qū)ο笞詣?dòng)解譯方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2016,41(2):228-234.
GU Haiyan,YAN Li,LI Haitao,et al.An Object-based Automatic Interpretation Method for Geographic Features Based on Random Forest Machine Learning[J].Geomatics and Information Science of Wuhan University,2016,41(2):228-234.
[19] DAUGMAN J G.Complete Discrete 2-D Gabor Transforms by Neural Networks for Image Analysis and Compression[J].IEEE Transactions on Acoustics,Speech,and Signal Processing,1988,36(7):1169-1179.
[20] 陳洪,陶超,鄒崢嶸,等.一種新的高分辨率遙感影像城區(qū)提取方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2013,38(9):1063-1067.
CHEN Hong,TAO Chao,ZOU Zhengrong,et al.Automatic Urban Area Extraction Using A Gabor Filter and High Resolution Remote Sensing Imagery[J].Geomatics and Information Science of Wuhan University,2013,38(9):1063-1067.
[21] LIU Mingyu,TUZEL O,RAMALINGAM S,et al.Entropy Rate Superpixel Segmentation[C]∥Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition.Providence,RI:IEEE,2011:2097-2104.
[22] 殷瑞娟,施潤(rùn)和,李鏡堯.一種高分辨率遙感影像的最優(yōu)分割尺度自動(dòng)選取方法[J].地球信息科學(xué)學(xué)報(bào),2013,15(6):902-910.
YIN Ruijuan,SHI Runhe,LI Jingyao.Automatic Selection of Optimal Segmentation Scale of High-resolution Remote Sensing Images[J].Journal of Geo-Information Science,2013,15(6):902-910.
[23] ESPINDOLA G M,CAMARA G,REIS I A,et al.Parameter Selection for Region-growing Image Segmentation Algorithms Using Spatial Autocorrelation[J].International Journal of Remote Sensing,2006,27(14):3035-3040.
[24] 郭天寶,池天河,彭玲,等.利用隨機(jī)森林的高分一號(hào)遙感數(shù)據(jù)進(jìn)行城市用地分類[J].測(cè)繪通報(bào),2016(5):73-76.DOI:10.13474/j.cnki.11-2246.2016.0159.
GUO Tianbao,CHI Tianhe,PENG Ling,et al.Classification of GF-1 Remote Sensing Image Based on Random Forests for Urban Land-use[J].Bulletin of Surveying and Mapping,2016(5):73-76.DOI:10.13474/j.cnki.11-2246.2016.0159.
[25] 杜培軍,柳思聰,鄭輝.基于支持向量機(jī)的礦區(qū)土地覆蓋變化檢測(cè)[J].中國(guó)礦業(yè)大學(xué)學(xué)報(bào),2012,41(2):262-267.
DU Peijun,LIU Sicong,ZHENG Hui.Land Cover Change Detection over Mining Areas Based on Support Vector Machine[J].Journal of China University of Mining & Technology,2012,41(2):262-267.
(責(zé)任編輯:張艷玲)
Change Detection Method for High Resolution Remote Sensing Images Using Random Forest
FENG Wenqing1,SUI Haigang1,TU Jihui1,2,SUN Kaimin1,HUANG Weiming3
1.State Key Laboratory of Information Engineering in Surveying Mapping and Remote Sensing,Wuhan University,Wuhan 430079,China; 2.Electronics & Information School of Yangtze University,Jingzhou 434023,China; 3.Department of Physical Geography and Ecosystem Science,Lund University,Lund 22362,Sweden
Studies based on object-based image analysis (OBIA) representing the paradigm shift in remote sensing image change detection (CD) have achieved remarkable progress in the last decade.Their aim has been developing more intelligent interpretation analysis methods in the future.The prediction effect and performance stability of random forest (RF),as a new kind of machine learning algorithm,are better than many single predictors and integrated forecasting method.This paper presents a novel RF OBIA method for high resolution remote sensing image CD that makes full use of the advantages of RF and OBIA.Firstly,the entropy rate segmentation algorithm is used to segment the image for the purpose of measuring the homogeneity of super-pixels.Then the optimal image segmentation result is obtained from the evaluation index of the optimal super-pixel number.Afterwards,the spectral features and Gabor features of each super-pixelareextracted and used as feature datasets for the training of RF model.On the basis of the initial pixel-level CD result,the changed and unchanged samples are automatically selected and used to build the classifier model in order to get the final object-level CD result.Experimental results on Quickbird,IKONOS and SPOT-5 multi-spectral images show that the proposed method out performs the compared methods in the accuracy of CD.
segmentation; super-pixel; feature; random forest; change detection
The National Key Research and Development Program of China (No.2016YFB0502603); Open Research Fund of State Key Laboratory of Information Engineering in Surveying,Mapping and Remote Sensing (No.16E01); The National Natural Foundation of China (NSFC) (No.41471354)
FENG Wenqing(1991—),male,PhD candidate,majors in the theories and methods of classification and change detection of high resolution remote sensing image.
SUI Haigang
馮文卿,眭海剛,涂繼輝,等.高分辨率遙感影像的隨機(jī)森林變化檢測(cè)方法[J].測(cè)繪學(xué)報(bào),2017,46(11):1880-1890.
10.11947/j.AGCS.2017.20170074.
FENG Wenqing,SUI Haigang,TU Jihui,et al.Change Detection Method for High Resolution Remote Sensing Images Using Random Forest[J].Acta Geodaetica et Cartographica Sinica,2017,46(11):1880-1890.DOI:10.11947/j.AGCS.2017.20170074.
P237
A
1001-1595(2017)11-1880-11
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB0502603);測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金(16E01);國(guó)家自然科學(xué)基金(41471354)
2017-03-01
修回日期:2017-09-09
馮文卿(1991—),男,博士生,研究方向?yàn)楦叻直媛蔬b感影像分類及變化檢測(cè)。
E-mail:wq_feng@whu.edu.cn
眭海剛
E-mail:haigang_sui@263.net