黃冬梅 陳 珂 王振華 劉 爽
(上海海洋大學信息學院 上海 201306)
?
利用空間抽樣理論的遙感影像分類結果精度評價方法
黃冬梅陳珂王振華劉爽
(上海海洋大學信息學院上海 201306)
摘要遙感影像分類結果的準確性對于遙感信息的應用分析有著重要的影響。傳統(tǒng)抽樣方式下的遙感影像分類結果精度評價方法受樣本量及空間布局的影響,存在效率低和信息冗余等問題。利用空間數據的相關性,將空間抽樣理論應用于遙感影像分類結果的精度評價,通過與傳統(tǒng)抽樣方法比較,發(fā)現(xiàn)空間抽樣方法應用于遙感影像分類結果的精度評價不僅降低了數據冗余,同時提高了精度評價的檢驗效率和準確性。
關鍵詞遙感分類精度評價抽樣理論誤差矩陣
0引言
隨著遙感技術的發(fā)展,遙感影像分類作為遙感影像處理及信息處理的重要組成部分在土地利用制圖、變化監(jiān)測及專題制圖等[1]領域有著廣泛的應用,其結果的準確性和可靠性對信息的處理和分析有著重要的影響,因此,遙感影像分類結果的精度評價和分析是進行科學決策的前提和重要保障。抽樣理論作為遙感影像分類結果精度評價過程中的重要環(huán)節(jié)之一,已經被國內外學者廣泛應用在土地資源監(jiān)測[2]、種植面積估算、自然災害預測等[3]精度評價的多個領域。傳統(tǒng)抽樣的遙感影像分類結果精度評價方法,一般采用基于概率理論的抽樣方法選取樣本,通過對樣本區(qū)域進行實地調查和取樣,從而對遙感影像的分類結果進行精度評估和分析[4],典型的方法主要有:簡單隨機抽樣、分層隨機抽樣、系統(tǒng)抽樣和整群抽樣等。傳統(tǒng)抽樣的遙感影像分類結果精度評價方法受樣本量的大小、樣本點的空間分布的影響,同時,空間對象具有空間相關性,而基于概率論的傳統(tǒng)抽樣方法在樣本的確定及空間布樣方面具有隨機性,因此,傳統(tǒng)抽樣的精度評價方法不適用遙感數據的精度評價和分析。此外,傳統(tǒng)抽樣方式下的遙感影像分類結果精度評價方法依靠觀察者的主觀感覺[5,6],精度評價結果缺乏客觀性。隨著遙感技術的發(fā)展,數據的獲取快速增長,基于傳統(tǒng)抽樣理論的遙感影像分類精度評價方法不適應海量遙感數據處理與應用的需要,因此需要研究新的遙感影像分類精度評價方法。
空間抽樣理論顧及空間對象之間的相關性和變異性,因此在地學研究中得到了迅速發(fā)展,已經廣泛應用于地理研究、資源評估和農作物監(jiān)測等[7,8]各個領域。Matheron[9]最早提出了Kriging方法,將其應用與地質礦產的研究中;李連發(fā)[10]等人考慮了空間數據的相關性,并利用量化相關性的方法,提出了空間抽樣框架,提高了抽樣的效率;王勁峰[11]等人以分層抽樣為基礎,并且考慮了空間關聯(lián)性,提出“三明治”空間抽樣模型;王振華[12]等人將模糊集理論與抽樣檢驗理論相結合,提出了基于空間數據質量檢驗的二級抽樣模型。
為了分析傳統(tǒng)抽樣的遙感影像分類結果精度評價方法的局限性,本文首先針對遙感影像分類結果的特點,采用傳統(tǒng)抽樣的遙感影像精度評價方法對遙感影像的分類結果進行評價。然后考慮空間數據之間的空間相關性,采用Moran指數對傳統(tǒng)抽樣理論中樣本量的確定方法進行優(yōu)化。最后,對傳統(tǒng)抽樣理論和空間抽樣理論獲取的遙感影像分類結果的精度評價結果進行對比和分析。
1研究方法
傳統(tǒng)抽樣的遙感影像分類結果的精度評價方法[13],一般是基于概率論選取樣本,通過對樣本區(qū)域進行實地的調查和取樣,從而對遙感影像的分類結果進行精度評估和分析。但是,傳統(tǒng)抽樣理論是基于抽樣隨機性的統(tǒng)計推斷,忽略了空間對象之間的空間相關性,因此在樣本量的確定方面具有很大的局限性。Moran指數是一種度量空間對象之間相關程度的重要參數,在空間自相關分析中得到了廣泛的應用。因此,本文首先采用簡單隨機抽樣方法、系統(tǒng)抽樣方法、傳統(tǒng)分層抽樣方法進行樣本量的確定與空間布樣,隨后采用Moran指數對傳統(tǒng)的樣本量確定方法進行優(yōu)化,并結合高分辨率的遙感影像對遙感分類結果進行精度評價,最后,對傳統(tǒng)抽樣方法精度評價與空間抽樣方法精度評價結果進行對比分析,以期得到更合適的遙感影像分類結果的精度評價方法。本文的數據處理基本流程如圖1所示。
圖1 遙感影像分類結果評定流程圖
1.1傳統(tǒng)抽樣方法
樣本量的確定和樣本的空間布樣對遙感影像分類精度評價結果具有重要的影響,傳統(tǒng)抽樣理論主要基于概率論的方法確定樣本量,當樣本總體較大時,可以通過控制不合格品率樣本估值與真值之間的最大相對誤差方法確定抽樣所需的樣本量[12]:
(1)
傳統(tǒng)抽樣方法主要有簡單隨機抽樣方法、系統(tǒng)抽樣方法、分層抽樣方法。簡單隨機抽樣方法是指從一個單元總數為N中逐個抽取單元并且無放回,每次都在所有尚未進入樣本的單元中等概率地隨機抽取,直到n個單元被抽中。系統(tǒng)抽樣方法是指對研究總體按一定的順序排列,每隔一定的間隔抽取一個單元的抽樣方法。分層抽樣方法是按照等比分層抽樣在各層中隨機抽取樣本的抽樣方法。
由于空間對象之間存在空間相關性,因此空間事物在分布上呈現(xiàn)空間結構性。但傳統(tǒng)抽樣方法基于概率理論,在對空間對象進行調查時,忽略了樣本的空間分布,從而導致樣本的冗余和不足。空間抽樣方法考慮了調查對象的空間結構性,因此可以合理地選取具有代表性的樣本,減少樣本冗余,降低檢驗成本。
1.2空間抽樣方法
空間自相關是空間地理數據的重要性質,空間中鄰近的地理數據信息通常比相離較遠的地理數據信息具有較高的相似性。空間自相關性分析是空間抽樣的前提,Moran’s I是一種通用的空間自相關測量方法,在各個領域的空間自相關分析中廣泛使用。Moran’s I的公式[14]為:
(2)
其中,xi為單元i的屬性值,n為單元的總數,Wij為i和j之間位置的接近性,Sij為單元i和j之間屬性的相似性,它是根據各點的屬性值和所研究的單元的所有屬性值均值之間的差異來定義,σ2為總體的方差。
抽樣方法選擇的樣本只有在空間自相關顯著的前提下,才有空間自相關性。在計算出空間自相關的量化指標Moran’s I后,需要檢驗空間自相關顯著性,檢驗步驟為:
1) 在隨機假設條件下,計算Moran’s I的期望值和方差;
2) 計算出標準化Z值;
(3)
其中,E(I)表示Moran’s I的期望,V(I)表示Moran’s I的方差。
3) 比較Z值顯著性水平的臨界值,若Z值大于顯著性水平的臨界值時,樣本單元的空間自相關性顯著,反之,不顯著。
4) 在樣本單元的空間自相關性顯著的前提下,計算空間抽樣方法的樣本量。
在傳統(tǒng)抽樣中,樣本量通常由總體方差、均值方差、期望等數據計算而得,其中由總體方差σ2與均值方差v之比確定樣本量的方法比較常見,即:
(4)
在空間抽樣理論中,均值估計方法需要根據空間抽樣對象的相關程度而調整。因此,均值方差為:
(5)
(6)
1.3遙感影像分類結果精度評價模型
(1) 基于誤差矩陣的遙感影像分類結果精度評價模型
誤差矩陣用于遙感影像分類結果和真實土地類型信息的比較,參考指標有用戶精度、總體精度、Kappa系數等。用戶精度為每類像元被正確分類的精度,由該類土地類型中正確分類的像元數與該類土地類型總像元數之比獲得;總體精度為總體像元被正確分類的精度,由各類土地類型中被正確分類的像元總和與總像元數之比獲得。Kappa系數是在綜合了用戶精度和總體精度兩個參數上提出的一個最終指標,Kappa系數越高說明分類結果精度越高。
(7)
式中K是Kappa系數,r是誤差矩陣的行數,xii是行列(主對角線)上的像元的數量,xi+和x+i分別是第i行的和與第i列的和,n′是樣本點總數。
(2) 基于誤差矩陣的精度評價算法
基于誤差矩陣的精度評價算法如下:
INPUT:樣本點總數n′,誤差矩陣的行數r;
OUTPUT:誤差矩陣的Kappa系數K。
① 初始化:令誤差矩陣的行數i=1,對應x1+和x+1分別是第1行的和與第1列的和。
② for(i=1;i<=r;i++){利用式(7)計算出主對角線上值的和}。
③ for(i=1;i<=r;i++){利用式(7)計算出xi+x+i的和}。
④ 輸出誤差矩陣的Kappa系數K。
算法分析:
在該算法中,① 在樣本點為n′,誤差矩陣行數為r情況下,求遙感影像分類結果的Kappa系數的時間復雜度為O(r);② 由分析可知,基于誤差矩陣的精度評價算法的時間復雜度與誤差矩陣的行列數有關,與樣本點的總數無關,當樣本量n′足夠大時,基于誤差矩陣的遙感影像分類結果精度評價方法具有較明顯優(yōu)勢。
2結果分析與討論
2.1實驗區(qū)域與數據
為了研究傳統(tǒng)抽樣理論與空間抽樣理論對遙感影像分類結果精度評價的效果,本研究將Landsat-8中截取的上海某地區(qū)200×200像元的30m 分辨率遙感數據用于遙感影像的分類,投影類型為Transverse Mercator,坐標系統(tǒng)為WGS-84, 如圖2(a);同時,采用同一地區(qū)分辨率為3m的高分辨率遙感數據用于分類結果的精度評價,如圖2(b)。選取該區(qū)域主要有兩個原因:第一,該區(qū)域土地利用類型豐富,研究結果有較好的代表性;第二,區(qū)域位置方便實地考察,便于求得較為準確的土地信息。
圖2 Landsat-8低分辨率遙感影像及高分辨率遙感影像
在獲取遙感影像的過程中,由于受遙感平臺位置、運動狀態(tài)、地形起伏、地球表面曲率以及大氣折射等因素的影響,產生影像行列不均勻、像元大小與地面大小對應不準確、地物形狀不規(guī)則變化等畸變。因此,本研究在ENVI 4.7軟件的支持下,對30 m分辨率與3 m分辨率的遙感影像進行幾何糾正和配準等影像處理,采用極大似然遙感影像分類算法,對30 m分辨率的Landsat-8遙感影像進行遙感影像分類處理,將研究區(qū)域的土地利用類型分為土地、建筑、水域和道路4種土地利用類型,如圖3所示。
圖3 Landsat-8低分辨率遙感影像分類結果
極大似然遙感影像分類算法是經常使用的分類方法之一,它是通過求出每個像元對于各類別歸屬概率,把該像元分到歸屬概率最大的類別中去的方法。
極大似然遙感影像分類算法在多類別分類時,常采用統(tǒng)計學方法建立起一個判別函數集,然后根據這個判別函數集計算各待分像元的歸屬概率。這里,歸屬概率是指:對于待分像元x,它從屬于分類類別k的概率。
設從類別k中觀測到x的條件概率為P(x|k),則歸屬概率Lk可表示為如下形式的判別函數:
Lk=P(k|x)=P(k)×P(x|k)/∑P(i)×P(x|i)
(8)
式中,x為待分像元,P(k)為類別k的先驗概率。
2.2結果分析與討論
為了對遙感影像的分類結果進行精度評價,本文首先根據傳統(tǒng)樣本量的確定方法獲得實驗所需的樣本總數,然后分別采用簡單隨機抽樣、系統(tǒng)抽樣及傳統(tǒng)分層抽樣方法對樣本點進行空間布樣,最后以3 m高分辨率遙感影像作為參考影像,采用基于誤差矩陣的遙感影像精度評價方法對遙感影像的分類結果進行精度評價與分析討論。
(1) 樣本量的確定與空間布樣
本文對遙感影像分類結果進行精度評價的過程中,首先根據影像的像元總數,確定精度評估所需的樣本量,其中樣本總量為40 000像元,在置信水平為90%,質量水平為0.02,最大允許相對誤差為0.1時,可以獲取樣本量為2650像元,分別采用簡單隨機抽樣,系統(tǒng)抽樣及分層抽樣對樣本點進行空間布樣。在簡單隨機抽樣中樣本點按照簡單隨機抽樣模型,隨機分布在分類圖上,如圖4所示;在系統(tǒng)抽樣中,采用等間隔的系統(tǒng)抽樣方法獲取樣本,如圖5所示;在分層抽樣中,各層樣本量的采用比例分配,每層的樣本量與層的大小成比例,由此,獲取的土地層、建筑層、水域層、道路層的樣本量分別為1313、465、315、557,樣本點采用等比分層抽樣方法在各層中隨機抽取,如圖6所示。
圖4 隨機抽樣樣本點的空間分布
圖5 系統(tǒng)抽樣樣本點的空間分布
圖6 傳統(tǒng)分層抽樣中各層樣本點的空間分布
(2) 分類結果精度評價與分析
基于誤差矩陣對抽樣結果進行精度評價的方法是目前比較常見的遙感影像分類結果精度評價方法。實驗將簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣三種傳統(tǒng)的抽樣方法分別與基于誤差矩陣的精度評價方法相結合,采用高分辨率遙感影像的真實土地利用類型對遙感影像的分類結果進行精度評價和分析,結果如表1-表3所示。
表1 簡單隨機抽樣方法的遙感影像分類結果精度評價
由表1看出,簡單隨機抽樣獲取的遙感影像的分類結果的分類總體精度為85.21%,Kappa系數為78.14%,其中在土地、建筑、水域、道路四種土地類型的精度評價中,水域的分類精度較高,道路的分類精度較低,在道路的誤分中,劃分為土地的居多,占誤分總量的67.01%。
表2 系統(tǒng)抽樣方法的遙感影像分類結果精度評價
由表2看出,系統(tǒng)抽樣方法獲取的遙感影像的分類結果的總體精度為85.09%,Kappa系數為76.95%,在各類的分類精度評價中,水域的分類精度相對較高,而建筑的分類精度較低,其中,劃分為土地的居多,占誤分總量的75.28%。
表3 傳統(tǒng)分層抽樣方法的遙感影像分類結果精度評價
由表3看出,分層抽樣方法對遙感影像分類結果的精度評價的總體精度為86.26%,Kappa系數為79.25%。其中水域的分類精度較高,道路的分類精度較低,由于低分辨率的遙感影像的空間分辨率較低,容易產生混合像元,導致土地類型的邊緣不清晰,從而影響遙感影像的分類;同時,由于土地、道路、建筑的光譜特征相近,低分辨率遙感影像所選擇的波段不能很好地區(qū)別土地、道路、建筑三種土地類型,造成混分、誤分現(xiàn)象,從而導致在分類結果中,道路誤分為土地的居多,占誤分總量的55.38%。
由表1-表3看出,三種傳統(tǒng)抽樣精度評價中,系統(tǒng)抽樣的總體精度與Kappa系數值相對略低,而傳統(tǒng)分層抽樣方法得到的總體精度與Kappa系數值相對略高。這是由于在系統(tǒng)抽樣中,樣本點等間隔規(guī)律分布,對于總體有周期性變化的樣本點,評價結果易產生偏差,而土地類型的分布在空間上具有相關性,采用系統(tǒng)抽樣選擇的樣本點易產生周期性規(guī)律,從而導致精度評價結果較低。而在分層抽樣中,各層樣本量的確定是按比例分配,而簡單隨機抽樣與系統(tǒng)抽樣方法未考慮各層樣本量情況,樣本點的分布有可能集中在某一層上,從而導致總體精度略低。
2.3空間抽樣方法精度評價
空間自相關性是空間抽樣研究的前提和基礎,對采用傳統(tǒng)抽樣方法獲得的2650個樣本單元進行空間自相關顯著性分析。由式(4)求得Moran’s I指數為0.206309,標準化Z值為9.182086,Z值遠大于顯著水平99%時的臨界值2.58,因此,土地利用類型之間的自相關程度非常顯著??紤]空間要素之間的相關性,采用空間自相關系數0.21作為空間抽樣中確定其樣本量的條件,空間分層抽樣的總樣本量n′為:
n′=n(1-r′)=2103
(9)
在空間分層抽樣中,各層樣本量的確定采用比例分配,因此,土地層、建筑層、水域層、道路層的樣本量分別為1042、369、250、442,樣本點按照空間分層抽樣模型,等比隨機分布在分類圖上,如圖7所示。
圖7 空間分層抽樣中各層樣本點的空間分布
采用3 m高分辨率遙感影像對30 m低分辨率遙感影像分類結果進行精度評價和分析,結果如表4所示。
表4 空間抽樣方法的遙感影像分類結果精度評價
由表4看出,采用Moran’s I指數的空間抽樣方法獲取的遙感影像分類結果的總體精度為86.25%,Kappa系數為79.51%,與傳統(tǒng)的分層抽樣方法獲取的結果基本一致。但是由于空間抽樣方法針對空間事物特有的空間結構,通過空間相關性分析,解決了樣本量的冗余問題,樣本量比傳統(tǒng)的方法減少了20%。因此可以在保證精度的前提下,提高精度評價的檢驗效率。
3結語
本文針對遙感影像分類結果的特點,采用Moran指數對傳統(tǒng)抽樣理論中樣本量的確定方法進行優(yōu)化,并且利用空間抽樣模型和傳統(tǒng)抽樣模型(簡單抽樣、系統(tǒng)抽樣和分層抽樣)對遙感影像分類結果進行精度評價與對比分析,研究結果表明:
(1) 與傳統(tǒng)抽樣的遙感影像分類結果的精度評價方法相比,由于考慮了空間要素之間的相關性,空間分層抽樣方法的遙感分類結果精度評價方法不僅可以有效地降低樣本量,而且可以合理地選取樣本點,減少樣本冗余,因此,可以應用于遙感影像分類結果的精度評價。
(2) 由于低分辨率遙感影像的空間分辨率較低,造成土地類型的邊緣不清晰,容易產生混合像元,導致遙感影像的分類結果之間存在誤差;同時,由于土地、道路、建筑的光譜特征相近,低分辨率遙感影像所選擇的波段不能很好地區(qū)別土地、道路、建筑三種土地類型,從而導致了遙感影像分類結果的混分、誤分現(xiàn)象。
(3) 不同的抽樣方法對遙感影像分類結果的對比分析顯示不同的抽樣方法對遙感影像分類結果的精度評價具有不同的影響。但是,考慮到樣本量及精度檢驗效率問題時,空間分層抽樣的精度評價方法優(yōu)于傳統(tǒng)的精度評價方法,因此,可以在遙感影像分類結果精度評價中廣泛的應用。
參考文獻
[1] 張霞,莊智,張旭凱,等.秦皇島市海岸線遙感提取及變化監(jiān)測[J].遙感技術與應用,2014,29(4):625-630.
[2] 朱榴駿,肖鵬峰,馮學智,等.基于直方變差圖的土地覆蓋數據集多尺度精度評價[J].遙感學報,2013,17(6):1459-1474.
[3] 楊永可,肖鵬峰,馮學智,等.大尺度土地覆蓋數據集在中國及周邊區(qū)域的精度評價[J].遙感學報,2014,18(2):453-475.
[4] Dihkan M,Guneroglu N.Remote sensing of tea plantation using an SVM classifier and pattern-base accuracy assessment[J].International Journal of Remote Sensing,2013,34(23):8549-8565.
[5] 楊彬,李旭東,晏磊,等.航空遙感圖像拼接算法及其精度評價[J].計算機工程,2014,40(3):253-257.
[6] Chen L G,Li Y K,Yang X Y,et al.Accuracy assessment of land use/cover classification from different seasons based on remote sensing imagery:A case study of Lianyungang city,China[J].Journal of China University of Mining and Technology,2013,42(5):873-879.
[7] 姜成晟,王勁峰,曹志冬.地理空間抽樣理論研究綜述[J].地理學報,2009,64(3):368-380.
[8] 張煥雪,李強子,文寧,等.農作物種植面積遙感抽樣調查的誤差影響因素分析[J].農業(yè)工程學報,2014,30(13):176-184.
[9] Matheron G.The Theory of Regionalized Variables and Its Applications[D].Fontainbleau: Ecole de Mines,1971.
[10] Li L F,Wang J F,Liu J Y.Optimization of decision-making for spatial sampling in remote sensing survey of land[J].Science in China (Series D),2004(10):975-982.
[11] Wang J F,Zhuang D F,Li L F.Spatial sampling design for monitoring the area of cultivated land. International Journal of Remote Sensing[J].2002,13(2):263-284.
[12] 王振華.空間數據質量抽樣檢驗與控制的理論、方法和應用[D].上海:同濟大學,2011.
[13] 劉旭攏,何春陽,潘耀忠,等.遙感圖像分類精度的點、群樣本檢驗與評估[J].遙感學報,2006,10(3):366-372.
[14] 陶吉興,傅偉軍,姜培坤,等.基于Moran’s I和地統(tǒng)計學的浙江森林土壤有機碳空間分布研究[J].南京林業(yè)大學學報:自然科學版,2014,38(5):97-101.
[15] 孫皓晗.空間分層抽樣在森林覆蓋監(jiān)測中的應用研究[D].江蘇:南京林業(yè)大學,2013.
收稿日期:2014-12-15。國家自然科學基金項目(61272098);國家重點基礎研究發(fā)展計劃項目(2012CB316200);上海市自然科學基金項目(13ZR1455800);上海高校優(yōu)秀青年培養(yǎng)項目(B-5409-11-0012);海洋赤潮災害立體監(jiān)測技術與應用國家海洋局重點實驗室開放研究基金課題(MATHAB201307)。黃冬梅,教授,主研領域:WebGIS,智能信息處理,輔助決策系統(tǒng)。陳珂,碩士生。王振華,博士。劉爽,博士。
中圖分類號TP751.1
文獻標識碼A
DOI:10.3969/j.issn.1000-386x.2016.07.044
ACCURACY ASSESSMENT METHOD FOR REMOTE SENSING IMAGE CLASSIFICATION RESULTS BASED ON SPATIAL SAMPLING THEORY
Huang DongmeiChen KeWang ZhenhuaLiu Shuang
(SchoolofInformation,ShanghaiOceanUniversity,Shanghai201306,China)
AbstractThe accuracy of classification results of remote sensing images has an important effect on the application and analysis of remote sensing information. The accuracy assessment method of classification results of remote sensing image based on traditional sampling mode is affected by the sample size and spatial layout, and has the problems of low efficiency and information redundancy, etc. In this paper, by using the correlation of spatial data, we applied the spatial sampling theory to accuracy assessment of the classification results of remote sensing image, through comparison it with traditional sampling method, we found that the application of spatial sampling methods in accuracy assessment of the results not only reduces the data redundancy, it also improves the efficiency and accuracy of the test as well.
KeywordsRemote sensing classificationAccuracy assessmentSampling theoryError matrix