李軼鯤, 楊 洋, 楊樹文,3, 王子浩
(1.蘭州交通大學(xué)測繪與地理信息學(xué)院,蘭州 730070; 2.地理國情監(jiān)測技術(shù)應(yīng)用國家地方聯(lián)合工程研究中心,蘭州 730070; 3.甘肅省地理國情監(jiān)測工程實(shí)驗(yàn)室,蘭州 730070)
快速、有效和經(jīng)濟(jì)地監(jiān)測地表變化已成為學(xué)術(shù)界研究的熱點(diǎn)問題,遙感變化檢測是非常有效的解決技術(shù)手段之一[1-3]。目前,遙感變化檢測技術(shù)面臨的最大挑戰(zhàn)是來自自然環(huán)境和遙感波譜相互作用的復(fù)雜性所造成的不確定性。這種不確定性不但使得傳感器記錄的地表光譜信號易于出現(xiàn)混合像素現(xiàn)象[4],而且也對影像變化檢測過程中的各個環(huán)節(jié)產(chǎn)生了不利影響,從而降低了變化檢測最終結(jié)果的精度[5-7]。為此,Chen等[8]通過研究分類后比較法(post classification comparison,PCC)和變化向量分析(change vector analysis,CVA)的優(yōu)缺點(diǎn)[9],提出了后驗(yàn)概率空間變化向量分析(change vector analysis in posterior probability space,CVAPS)法。該方法能夠有效緩解PCC容易受累計(jì)分類誤差影響的問題[10],且與CVA不同,CVAPS不需要良好的輻射校正。然而,CVAPS算法使用支持向量機(jī)(support vector machine,SVM)估計(jì)后驗(yàn)概率向量,沒有專門針對遙感影像中易于出現(xiàn)的混合像素現(xiàn)象進(jìn)行建模,因而容易造成變化檢測精度的損失。
針對混合像元問題,模糊聚類算法[11]能夠以不同的隸屬度將遙感影像像元與不同信號類[12]聯(lián)系起來,有效解決混合像元的分解。其中,信號類指得是遙感影像中具有典型光譜或紋理特點(diǎn)的像素組成的聚類。由此,本文采用模糊C均值聚類(fuzzy C-means,F(xiàn)CM)對遙感影像進(jìn)行聚類,原因?yàn)椋?①FCM是一種無參數(shù)算法,其對遙感影像數(shù)據(jù)的統(tǒng)計(jì)分布沒有要求; ②由于FCM計(jì)算出的模糊隸屬度與信號類在影像中的比例強(qiáng)相關(guān), 因而將隸屬度作為混合像素中的相應(yīng)信號類的概率是比較合理的。然而,F(xiàn)CM從遙感影像中提取的信號類與影像中的地物并沒有直接的一一對應(yīng)關(guān)系[13]。例如,城市區(qū)作為一種地物,其本身由建筑物、綠地、道路等子地物構(gòu)成,而與這些子地物對應(yīng)的信號類與城市區(qū)形成了多對一的對應(yīng)關(guān)系。又比如,森林中的陰影與水體有著類似的光譜特點(diǎn),因而很可能被劃分成同一信號類,證明同一信號類在不同環(huán)境下可能與多種地物形成一對多的關(guān)系。因此,需要使用相應(yīng)的數(shù)學(xué)模型對信號類與地物間的多對多的關(guān)系進(jìn)行建模,而簡單貝葉斯網(wǎng)絡(luò)(simple Bayesian network, SBN)可以很好地解決這一問題[14-15]?;谝陨戏治?,本文使用FCM為SBN提供關(guān)鍵參數(shù),以計(jì)算遙感影像中像素屬于各個地物的后驗(yàn)概率向量,提出了一種新的后驗(yàn)概率空間變化向量法: FCM-SBN-CVAPS。該方法的優(yōu)點(diǎn)在于: ①使用FCM的模糊隸屬度,為SBN估計(jì)像素屬于各個信號類的條件概率; ②提出了新的SBN學(xué)習(xí)模型,利用模糊隸屬度為SBN估計(jì)所涉及地物中個信號類的條件頻率。
為解決遙感影像混合像元建模問題,本文設(shè)計(jì)了一種SBN模型,將FCM從遙感影像中發(fā)現(xiàn)的信號類與遙感影像中存在的地物建立隨機(jī)鏈接。SBN模型與FCM的結(jié)合體現(xiàn)在兩方面: ①使用FCM計(jì)算的模糊隸屬度建立遙感圖像中某像素pi,j與信號類ωk間的隨機(jī)鏈接,緩解了混合像元現(xiàn)象; ②基于模糊隸屬度和地物L(fēng)v的訓(xùn)練樣本,建立信號類ωk與地物L(fēng)v間的隨機(jī)鏈接,解決了信號類與地物間的多對多關(guān)系的建模問題。本文使用的SBN模型如圖1所示。
圖1 簡單貝葉斯網(wǎng)絡(luò)Fig.1 Simple Bayesian network
該模型共3層: 第一層為遙感影像的像素,其中pi,j為位于該影像i行j列的像素; 第二層為信號類,其中ωk為遙感影像中具有某種典型光譜或紋理特征的像素所構(gòu)成的信號類或聚類; 第三層為遙感影像中的地物,其中Lv為該影像中的某一類地物。通過該模型,能夠計(jì)算出像素pi,j屬于地物L(fēng)v的后驗(yàn)概率P(Lv|pi,j)。根據(jù)貝葉斯網(wǎng)絡(luò)的計(jì)算原則,P(Lv|pi,j)可以通過以下公式計(jì)算:
(1)
根據(jù)貝葉斯公式,P(Lv|ωk)可表示為:
(2)
進(jìn)一步,將式(2)代入式(1)可得:
(3)
式中:P(ωk|pi,j)為像素pi,j屬于信號類ωk的程度, 可由FCM計(jì)算得到(詳見2.2節(jié));P(ωk|Lv)為地物L(fēng)v中信號類ωk發(fā)生的概率(估計(jì)方法詳見2.3節(jié));P(Lv)為地物L(fēng)v的先驗(yàn)概率;P(ωk)為信號類ωk的概率。綜上所述,通過式(3),最終可以計(jì)算出像素pi,j屬于遙感影像中各個地物L(fēng)v(v=1,…,m)的后驗(yàn)概率向量ρ=(ρ1,…,ρv,…,ρm)(其中ρv=P(Lv|pi,j)),實(shí)現(xiàn)后驗(yàn)概率空間變化向量框架下的變化檢測。
在中低分辨率遙感影像中,混合像元普遍存在,單一像元可能隸屬于多個信號類。為此,本文使用FCM以不同的隸屬度將像元與不同信號類聯(lián)系起來,有效的實(shí)現(xiàn)了混合像元的分解,以提高后續(xù)處理過程的精度。
設(shè)影像I={pi,j|1≤i≤N, 1≤j≤M}是由N行M列像素構(gòu)成的遙感影像,現(xiàn)將其模糊劃分為n個信號類,uk(i,j) (1≤k≤n)表示圖像I中像素pi,j對于第k個信號類ωk的隸屬度。隸屬度集合U={uk(i,j)}滿足如下約束條件:
(4)
FCM聚類算法采用各個像素與所在信號類中心的差值平方和最小準(zhǔn)則,通過迭代更新隸屬度集合U和信號類中心Ψ,達(dá)到使目標(biāo)函數(shù)J最小的最優(yōu)聚類,目標(biāo)函數(shù)J的定義如下:
(5)
式中:Ψ={ψ1,…,ψk,…,ψn}為信號類中心點(diǎn)集,且ψk是信號類ωk的中心;q為控制聚類模糊程度的模糊參數(shù)。從式(4)可以看出,SBN中P(ωk|pi,j)與uk(i,j)滿足同樣的約束條件,因此可以用FCM計(jì)算所得的uk(i,j)估計(jì)P(ωk|pi,j),實(shí)現(xiàn)SBN與FCM的結(jié)合。
為了計(jì)算像素pi,j屬于地物L(fēng)v的后驗(yàn)概率P(Lv|pi,j),需要基于專家提供的地物L(fēng)v的訓(xùn)練像素集合Tv以計(jì)算條件概率P(ωk|Lv)。論文首先定義地物L(fēng)v中信號類ωk的頻率公式為:
SFv(k)=∑uk(x,y)?px,y∈Tv
(6)
由于不同于普通聚類算法如K均值聚類,訓(xùn)練像素px,y關(guān)于信號類ωk的隸屬度不是0或1,而是屬于0,1之間的一個模糊隸屬度uk(x,y),因此需要對訓(xùn)練集Tv里的所有像素對信號類ωk的隸屬度求和來計(jì)算地物L(fēng)v中信號類ωk的頻率。
在計(jì)算出訓(xùn)練集Tv中所有信號類ωl(l=1,…,n)的頻率SFv(l)后,條件概率P(ωk|Lv)被近似為:
(7)
另外,在式(3)中,先驗(yàn)概率P(ωk)是計(jì)算后驗(yàn)概率P(Lv|pi,j)的歸一化因子。本文使用全概率公式計(jì)算P(ωk),即
P(ωk)=∑vP(ωk|Lv)P(Lv)
(8)
式中P(ωk|Lv)可以通過式(6)和(7)進(jìn)行估計(jì)。
Δρ=ρ1-ρ2
(9)
式中Δρ為像素pi,j在t1和t2時相的后驗(yàn)概率的變化向量。相應(yīng)的,像素pi,j在后驗(yàn)概率向量空間的變化幅度為:
(10)
最后,使用自動閾值算法對基于式(10)生成的變化幅度圖進(jìn)行處理,得到變化二值圖。
綜上所述,構(gòu)建的FCM-SBN-CVAPS變化檢測算法的主要流程如圖 2所示。
圖2 耦合模糊C均值聚類和貝葉斯網(wǎng)絡(luò)的變化檢測模型Fig.2 Change detection model coupling fuzzy C- means clustering and Bayesian network
基于構(gòu)建的FCM-SBN-CVAPS模型,論文進(jìn)行了變化檢測、參數(shù)敏感性測試、訓(xùn)練樣本數(shù)量影響分析、算法耗時分析及綜合性能比較等方面的測試實(shí)驗(yàn)。
本文以甘肅省蘭州市蘭州新區(qū)為研究區(qū)。研究區(qū)位于蘭州市北部,東南與蘭州市皋蘭縣毗鄰,西北與蘭州市永登縣相鄰,中心位置為E103°290′~103°49′,N36°17′~36°43′。研究區(qū)主要包括建筑物,農(nóng)田,森林,荒地,山地等地物類型。本實(shí)驗(yàn)選擇了2016年和2017年的兩景Landsat8影像,影像大小為650像素×650像素。對實(shí)驗(yàn)數(shù)據(jù)做了輻射定標(biāo)、大氣校正及圖像拉伸等預(yù)處理。實(shí)驗(yàn)系統(tǒng)的運(yùn)行環(huán)境為英特爾 Core i7-10700 2.90GHz 8核處理器。為提高精度,實(shí)驗(yàn)中對生成的初始變化二值圖都進(jìn)行了去噪處理和形態(tài)學(xué)閉運(yùn)算(填充空洞)處理。
為驗(yàn)證所提出算法的有效性,本文實(shí)現(xiàn)了基于SVM的CVAPS算法(簡稱SVM-CVAPS[8]),并與FCM-SBN-CVAPS算法對比。其中FCM-SBN-CVAPS為50信號類,模糊參數(shù)q=3.5,5 000訓(xùn)練樣本/地物,閾值算法為Otsu; SVM-CVAPS為5 000訓(xùn)練樣本/地物, 閾值算法為Kapur[15]。結(jié)果如圖3所示。通過對比,從中可直觀地觀察到FCM-SBN-CVAPS算法和SVM-CVAPS算法變化檢測性能的差異。其中,圖3(c)中紅線劃分的區(qū)域?yàn)槿斯z測到的變化區(qū)域。圖3(d)和圖3(e)中紅線劃分的區(qū)域分別為FCM-SBN-CVAPS算法和SVM-CVAPS算法檢測到的變化區(qū)域。圖3(d)和圖3(e)中藍(lán)色框內(nèi)為算法錯檢的變化區(qū)域。從圖中可以發(fā)現(xiàn),相比FCM-SBN-CVAPS算法,SVM-CVAPS算法錯檢區(qū)域范圍明顯更大。圖3(c)中黃框內(nèi)為兩個算法都漏檢的區(qū)域,而綠框內(nèi)為SVM-CVAPS算法漏檢的區(qū)域。因此,與FCM-SBN-CVAPS算法相比SVM-CVAPS算法漏檢的區(qū)域更多一些。
(a) 2016年影像(b) 2017年影像(c) 人工檢測到的變化結(jié)果
論文使用FCM對影像的7個波段進(jìn)行聚類處理。首先,為FCM設(shè)定3種不同聚類數(shù)(10,30及50)和6種不同模糊參數(shù)q(1.0,1.5,2.0,2.5,3.0,3.5,4.0),以測試其對最終變化檢測結(jié)果的影響。其中,當(dāng)q=1.0時,F(xiàn)CM退化為普通C均值聚類。另外,本實(shí)驗(yàn)從原始圖像中選取了5類地物作為訓(xùn)練樣本: 建筑物(29 326像素),農(nóng)田(19 926像素),森林(80 120像素),荒地(32 224像素),山地(144 312)。總訓(xùn)練像素?cái)?shù)量為305 908(約占實(shí)驗(yàn)圖像總像素的36.20%),每種地物的平均訓(xùn)練像素?cái)?shù)量為61 182。
具體實(shí)驗(yàn)結(jié)果如圖4所示。從實(shí)驗(yàn)結(jié)果可發(fā)現(xiàn): 當(dāng)模糊度參數(shù)q=1.0及1.5時,F(xiàn)CM模糊度不夠,無法有效反映Landsat8影像的混合像元現(xiàn)象,因而導(dǎo)致在所有聚類數(shù)下,變化檢測Kappa系數(shù)值較低(均不超過0.50)。特別是當(dāng)q=1.0時FCM退化為普通C均值聚類,Kappa系數(shù)均不超過0.40。當(dāng)模糊參數(shù)q大于等于2.0時,對于所有聚類數(shù),變化檢測Kappa系數(shù)均大于0.75,并且隨著q的繼續(xù)增大,Kappa系數(shù)沒有顯著變化。以上結(jié)果表明混合像元問題極大地影響變化檢測精度。
圖4 基于不同聚類數(shù)和模糊參數(shù)q的FCM-SBN-CVAPS算法的Kappa系數(shù)Fig.4 The Kappa coefficient of FCM-SBN-CVAPS algorithm based on different clustering number and fuzzy parameter q
為了比較不同數(shù)量訓(xùn)練樣本對FCM-SBN-CVAPS算法的影響,針對每類地物隨機(jī)選取了1 000,2 000,3 000,4 000和5 000個訓(xùn)練像素。相應(yīng)的,總訓(xùn)練像素?cái)?shù)分別約占實(shí)驗(yàn)圖像總像素的0.59%,1.18%,1.76%,2.37%,2.96%。實(shí)驗(yàn)結(jié)果如圖5所示,圖上每種聚類數(shù)的模糊參數(shù)q選用圖4中具有最佳Kappa系數(shù)的模糊參數(shù)值。進(jìn)一步分析表明: 訓(xùn)練樣本數(shù)量對變化檢測的Kappa系數(shù)的影響很微弱,訓(xùn)練樣本為1 000時與訓(xùn)練樣本為5 000時的Kappa系數(shù)值的差異分別為0.02(聚類數(shù)10),0.00(聚類數(shù)30),0.00(聚類數(shù)50)。因此,本文所提出的方法只需要較少的訓(xùn)練樣本就可以取得相對較好的變化檢測效果。并且,隨著訓(xùn)練樣本的增加,Kappa系數(shù)沒有明顯下降,足見本文所提方法對過度訓(xùn)練問題有較好的魯棒性。
圖5 不同數(shù)量訓(xùn)練像素對FCM-SBN-CVAPS及SVM-CVAPS算法Kappa系數(shù)的影響Fig.5 Effects of different number of training pixels on the Kappa coefficients of FCM-SBN-CVAPS and SVM-CVAPS algorithms
為了進(jìn)一步通過比較驗(yàn)證所提出算法的有效性,實(shí)驗(yàn)測試了SVM-CVAPS算法在不同數(shù)量訓(xùn)練樣本條件下的變化檢測性能,結(jié)果如圖5所示。結(jié)果表明,隨著訓(xùn)練樣本的增加,SVM-CVAPS算法的Kappa系數(shù)沒有明顯改善,甚至有時增加訓(xùn)練樣本后Kappa系數(shù)出現(xiàn)下降現(xiàn)象。訓(xùn)練樣本為1 000時與訓(xùn)練樣本為5 000時的Kappa系數(shù)值的差異為0.04。與本文提出的FCM-SBN-CVAPS算法相比,SVM-CVAPS算法對訓(xùn)練樣本數(shù)量更為敏感,且這種影響并不總是正向的。造成這一結(jié)果的原因可能在于: ①訓(xùn)練樣本選擇對SVM的分類性能有較大的影響,而本實(shí)驗(yàn)的訓(xùn)練像素是從手動劃分的訓(xùn)練區(qū)域中隨機(jī)選取的; ②相比其他分類器,SVM在小樣本條件下具有更好的魯棒性[8],因此樣本的增加不一定會導(dǎo)致更好的分類性能。
FCM是FCM-SBN-CVAPS算法中最為耗時的步驟,并且隨著聚類數(shù)的增加,F(xiàn)CM所消耗的時間有極大的增長。其后繼SBN訓(xùn)練和變化檢測所消耗時間則少得多,并且與訓(xùn)練像素的數(shù)量沒有明顯的關(guān)系。相比之下,SVM-CVAPS算法中訓(xùn)練和分類步驟消耗了最多的時間,耗時與訓(xùn)練樣本數(shù)正相關(guān),而其變化檢測時間耗時則很少,且與訓(xùn)練樣本數(shù)量沒有明顯關(guān)聯(lián)??傮w上,F(xiàn)CM-SBN-CVAPS算法比SVM-CVAPS算法耗時少: FCM-SBN-CVAPS算法的最小耗時約為62 s,最大耗約時為314 s; 而SVM-CVAPS算法最小耗時約60 s,最大耗時約為535 s。值得注意的是,在消耗最少時間的情況下,F(xiàn)CM-SBN-CVAPS算法的Kappa系數(shù)為0.78,比SVM-CVAPS算法高0.17; 在消耗最多時間的情況下,F(xiàn)CM-SBN-CVAPS算法的Kappa系數(shù)為0.80,比SVM-CVAPS算法高0.13。
本文采用“變化/非變化”混淆矩陣對FCM-SBN-CVAPS算法、FCM-SBN-PCC算法、SVM-CVAPS算法和SVM-PCC算法的性能進(jìn)行了綜合比較。對比結(jié)果如表1所示。
表1 變化檢測算法性能比較Tab.1 The performance evaluation of change detection algorithms
1)本文算法無論從總體精度還是Kappa系數(shù)都取得了最好的結(jié)果,總體精度與Kappa系數(shù)比SVM-CVAPS的算法分別高2.33百分點(diǎn)和0.134 1。二者都存在過度估計(jì)變化像元的現(xiàn)象,但FCM-SBN-CVAPS算法的錯檢率低了18.59百分點(diǎn),表現(xiàn)相對更優(yōu)。
2)FCM-SBN-CVAPS算法的性能要明顯優(yōu)于FCM-SBN-PCC算法。其總體精度和Kappa系數(shù)比FCM-SBN-PCC算法分別高出5.38百分點(diǎn)和0.246 2。且過度估計(jì)變化像元的程度明顯比FCM-SBN-PCC算法低(錯檢率低33.68百分點(diǎn)),表明與PCC模型相比,CVAPS模型不易于受累計(jì)分類誤差的影響,進(jìn)一步證明了CVAPS變化檢測算法的優(yōu)越性。
本文所提出的FCM-SBN-CVAPS算法針對中低分辨率遙感影像的混合像元問題進(jìn)行建模,同時使用后驗(yàn)概率向量進(jìn)行變化檢測,有效提高了檢測精度和效率。與SVM-CVAPS算法相比,本文算法在總體精度和Kappa系數(shù)上都比較理想,此外,算法耗時少,參數(shù)設(shè)置要求低,不易受過度訓(xùn)練的影響。因此,本文算法具有更高的魯棒性和實(shí)用性。
但類似于許多變化檢測算法,F(xiàn)CM-SBN-CVAPS算法生成的初始變化二值圖有許多細(xì)小的斑塊和孔洞,需要進(jìn)一步的處理,計(jì)劃未來在模型中引入空間信息以解決這一問題。