馬紅利 李祥武 白穆 劉玲玲 雷剛
(1.國家測繪地理信息局陜西基礎(chǔ)地理信息中心 陜西西安 710054;2.西安科技大學測繪科學與技術(shù)學院 陜西西安 710054)
近年來,由于人類長期無序生產(chǎn)和生活活動已經(jīng)影響到全球絕大多數(shù)地區(qū)地表覆蓋現(xiàn)象,使之原有自然環(huán)境受到破壞或者轉(zhuǎn)化為生產(chǎn)和生活用地,這種行為造成了生態(tài)環(huán)境急劇惡化。應(yīng)用先進的遙感和地理信息系統(tǒng)技術(shù)開展地表覆蓋變化研究對于環(huán)境保護和生態(tài)建設(shè)具有重要的指示意義[1-3]。
本文通過研究資源三號衛(wèi)星影像數(shù)據(jù)和環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)地表覆蓋分類結(jié)果的一致性,以高分辨率分類結(jié)果為參考數(shù)據(jù),重點分析中分辨率影像數(shù)據(jù)在不同地表覆蓋類型方面與參考數(shù)據(jù)之間的分類結(jié)果一致性,有助于今后在高分辨率衛(wèi)星數(shù)據(jù)無法覆蓋區(qū)域內(nèi),為使用中分辨率衛(wèi)星數(shù)據(jù)獲得的成果提供適用程度參考。
本文選取陜北榆林部分區(qū)域作為研究對象,東西和南北距離均為30km,主要覆蓋橫山縣和靖邊縣,地理位置東經(jīng) 108°58′~109°20′,北緯 37°38′~37°57′。榆林地區(qū)位于陜西省最北部,位于毛烏素沙漠和黃土高原的過渡區(qū),屬暖溫帶和溫帶半干旱大陸性季風氣候,是一個游牧與農(nóng)耕文化交融的區(qū)域,所以地表覆蓋類型也呈現(xiàn)出多樣性,生態(tài)環(huán)境系統(tǒng)脆弱,地表覆蓋變化監(jiān)測對于當?shù)丨h(huán)境保護和生態(tài)建設(shè)具有重要的指示意義。
研究區(qū)數(shù)據(jù)來源于國家測繪局陜西基礎(chǔ)地理信息中心,主要選用以下四種數(shù)據(jù):(1)資源三號衛(wèi)星影像數(shù)據(jù),時相為2012年11月14日;(2)環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù),時相為2012年11月8日;(3)野外調(diào)繪數(shù)據(jù);(4)1∶5萬基礎(chǔ)地理信息數(shù)據(jù)。后兩種數(shù)據(jù)作為目視解譯的參考數(shù)據(jù)。資源三號衛(wèi)星影像和環(huán)境減災(zāi)衛(wèi)星影像的光譜波段信息見表1。
表1:光譜波段信息
依據(jù)研究區(qū)地表覆蓋和土地利用類型,結(jié)合目視解譯和實地調(diào)查,確定研究區(qū)主要包含 9大類,即耕地、園地、林地、草地、房屋建筑群、構(gòu)筑物、人工堆掘地、荒漠與裸露地和水體。各類型及其定義詳見表2。
表2:研究區(qū)土地覆蓋類型及其含義
數(shù)據(jù)分類前處理在ENVI和ArcGIS軟件中完成,主要包括幾何校正、圖像配準、圖像融合、圖像裁剪和投影變換。
在幾何糾正中,本文主要采用控制點圖像對圖像的幾何校正方法。本文主要采用二次多項式法進行校正,資源三號全色影像數(shù)據(jù)幾何校正精度控制在 3個像元內(nèi),環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)幾何校正精度控制在1個像元內(nèi),坐標系統(tǒng)采用CGCS2000,投影采用高斯—克呂格投影。將資源三號多光譜數(shù)據(jù)與其全色數(shù)據(jù)進行圖像配準和圖像融合。按照研究區(qū)矢量邊界裁剪柵格數(shù)據(jù),結(jié)果如圖1。
圖1 影像數(shù)據(jù)(左:資源三號影像數(shù)據(jù),右:環(huán)境減災(zāi)衛(wèi)星數(shù)據(jù))
支持向量機(Support Vector Machines,SVM)是Vapnik等人在多年研究統(tǒng)計學習理論基礎(chǔ)上對線性分類器提出了另一種設(shè)計最佳準則[4-5],根據(jù)有限樣本信息在模型復(fù)雜性(即對特定訓練樣本的學習精度)和學習能力(即無錯誤地識別任意樣本的能力)之間尋求最佳折衷,以期獲得最好的推廣能力[6]。無論從總體精度還是從具體地類的分類精度來看,多源影像SVM分類精度較高,說明基于SVM的多源影像信息分類方法的實用性和優(yōu)越性[7]。SVM已廣泛應(yīng)用于土地覆蓋圖像分類中[8]。在此,本文提出基于SVM方法,根據(jù)研究區(qū)地物特征對環(huán)境減災(zāi)衛(wèi)星影像進行對比度增強處理,提高圖像對比度,這樣有利于目視樣方解譯。然后對處理好的環(huán)境減災(zāi)衛(wèi)星數(shù)據(jù)運用ENVI4.5遙感軟件進行監(jiān)督分類[9],具體分類流程如下兩方面。
5.1.1 訓練樣本的確定
本文在選取訓練樣本之前,先采用非監(jiān)督分類中的K-Mean方法將影像分為12類,作為后期訓練樣本選取的參考,進而提高樣本的分類精度。分類樣本選取的好壞直接影響分類結(jié)果的精度,選取樣本之前先對研究區(qū)范圍內(nèi)影像上的各種地物要有準確的判讀,對不確定地物借助Google Earth和野外調(diào)繪樣本進行判讀。樣本的選取要遵循如下原則:盡量選取純凈像元;像元盡量分布均勻并且覆蓋研究區(qū)范圍;像元個數(shù)盡可能多。
所選訓練樣本的可分離度在 1.8以上,說明樣本的可分離度比較高,影像的分類結(jié)果也較高。
5.1.2 環(huán)境減災(zāi)衛(wèi)星影像地表覆蓋數(shù)據(jù)分類
訓練樣本選定后,根據(jù)所選樣方對研究區(qū)進行分類,在ENVI中選擇支持向量機的分類器方法對環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)進行監(jiān)督分類,得到分類好的地表覆蓋分類數(shù)據(jù)[10]。
在分類完成后,需要對分類后數(shù)據(jù)進行后處理,主要包括聚類處理和目視修正。聚類處理將3×3的像元進行合并,即將小于3個像元的類別就近合并。目視修正主要修改混分誤分現(xiàn)象,如山區(qū)林地一般比較多,疊加 DEM在目視修正中幫助判讀;對于很明顯錯分類別,可以采用涂改方法;對于像元碎多,涂改方法效果不佳,本文利用結(jié)合NDVI特征對影像進行波段運算,糾正錯分類別,從而提高影像的分類精度。
由于影像分辨率30米,對于研究區(qū)出現(xiàn)的小面積地類(人工堆掘地,構(gòu)筑物)可以忽略,林地和園地在影像上區(qū)分難以區(qū)分,統(tǒng)一歸為林地,最后分成六類:房屋建筑群、林地、水體、耕地、草地和荒漠與裸露地。最終形成環(huán)境減災(zāi)衛(wèi)星影像分類成果圖如圖2。
圖2:環(huán)境減災(zāi)衛(wèi)星影像分類結(jié)果圖
本文對資源三號衛(wèi)星影像數(shù)據(jù)分類時,按照基礎(chǔ)測繪生產(chǎn)的工作流程,應(yīng)用1∶5萬基礎(chǔ)地理信息數(shù)據(jù)和實地調(diào)查數(shù)據(jù),按照相同的地表覆蓋分類體系,采用目視解譯的方式對數(shù)據(jù)進行地表覆蓋信息提取。目視解譯包括作業(yè)判讀和檢查判讀,需保證各類型邊界精確和分類準確。該分類數(shù)據(jù)作為分類結(jié)果的“準真值”,用于驗證環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)分類的精度,所以要對其提取結(jié)果進行后處理工作,包括去除小圖斑和拓撲檢查及處理,用以保證數(shù)據(jù)質(zhì)量的精確性。去除小圖斑考慮到環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)的分類類型最小圖斑為三個像元,將資源三號衛(wèi)星影像分類結(jié)果數(shù)據(jù)小于2700平方米的圖斑進行就近合理歸并,使得分類結(jié)果具有整體合理性;拓撲檢查和處理在于排查多邊形面重疊和多邊形面縫隙的問題。最后對資源三號信息提取結(jié)果進行了成果檢查,結(jié)果如圖3。
圖3 資源三號衛(wèi)星影像分類結(jié)果圖
本文選取資源三號高分影像數(shù)據(jù)分類結(jié)果作為研究區(qū)地表覆蓋分類結(jié)果的“準真值”,其分類結(jié)果的驗證樣本來驗證環(huán)境減災(zāi)衛(wèi)星數(shù)據(jù)分類結(jié)果的可靠性。驗證樣本的選取與訓練樣本選取標準一致,且各類型像元數(shù)目要達到訓練樣本的70%。
混淆矩陣計算結(jié)果顯示:環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)地表覆蓋分類結(jié)果的總體分類精度達到 90%,kappa系數(shù)為 0.86,說明分類結(jié)果精度較高?;煜仃囉嬎憬Y(jié)果見表3。
與參考數(shù)據(jù)相比,連續(xù)大片分布的林地和耕地的分類精度較高,而分布較分散且細碎的圖斑分類精度較低,比如房屋建筑群和草地,但從研究區(qū)總體分類來看,可以相對準確地反映該地區(qū)的真實地表覆蓋信息。
地表覆蓋分類結(jié)果的精度分析中,分類精度由制圖精度和用戶精度來衡量。結(jié)果顯示:林地的制圖精度和用戶精度相對其他地類最高,即漏分和錯分現(xiàn)象都較少;荒漠與裸露地的制圖精度較高,耕地和水體的制圖精度較一般,而房屋建筑群與草地的漏分現(xiàn)象較嚴重,制圖精度最差;荒漠與裸露地和房屋建筑群的用戶精度較一般,即錯分誤差較大,而其他地類的用戶精度都較高。如圖4和圖5。
表3:混淆矩陣
圖5:分類誤差情況
圖4:分類精度情況
上述分析表明,地表覆蓋各地類的錯分誤差較小,進而證明依據(jù)調(diào)繪樣本庫選取的樣本較準確,總體分類精度較高,當然也存在個別地類漏判較嚴重的現(xiàn)象。對照分類結(jié)果圖(圖2和圖3)分析,研究區(qū)大片都是林地,小面積的草地、房屋和耕地夾雜在其中難以準確區(qū)分,漏采較多,寬度在 30m內(nèi)的水體和房屋存在漏分,耕地與裸地也存在部分混分現(xiàn)象。分析漏判、錯判原因有兩方面:一是環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)的分辨率在30m,對于小于單個像元面積的圖斑存在混合像元現(xiàn)象,如對面積小的獨立房屋無法識別,并且由于地表粗糙度大,不能純粹反映地表覆蓋的某一類型,如耕地與裸地混分、耕地與林地混分、草地與林地混分。二是對于研究區(qū)零星分布的狹長細小的條帶難以準確確定邊界,混雜在其他地類中,且要避免此類現(xiàn)象建立普適的分類規(guī)則庫有難度。
(1)對資源三號影像數(shù)據(jù)和環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)參照最新樣本庫采用非監(jiān)督分類和監(jiān)督分類相結(jié)合方法進行分類和后處理,提高了分類精度。并靈活運用高分辨率影像分類結(jié)果作為分類的準真值,驗證中分辨率影像用于地表覆蓋大類分類精度的適度可靠性。
(2)基于分類結(jié)果統(tǒng)計出各地類的分類精度,對照分類結(jié)果圖分析錯分原因,總體來看環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)分類結(jié)果較好,證明利用多源遙感數(shù)據(jù)進行地表覆蓋分類的可行性。從分類結(jié)果來看,研究區(qū)林地覆蓋范圍最大,分類精度也較高,這與國家退耕還林和環(huán)境保護政策實施密切相關(guān);通過影像分析研究區(qū)的水域情況,該地水源較少。通過得到的一系列相關(guān)信息,可為后續(xù)監(jiān)測工作奠定基礎(chǔ)。
(3)環(huán)境減災(zāi)衛(wèi)星影像數(shù)據(jù)對地表覆蓋分類研究具有適宜性,但由于地表粗糙度大和空間分辨率低的限制,導致對小于一個像元大小的地類分類的局限性。因此,在后續(xù)工作中還有待做深層次研究,包括分類方法的研究、影像的判讀和評價積累更加豐富的經(jīng)驗并充實對評價方法的分析研究,提高分類精度。
[1]周兆葉,儲少林,王志偉,等.基于NDVI的植被覆蓋度的變化分析[J]草業(yè)科學,2008, 25(12):23-29.
[2]李琳.北京郊區(qū)植被覆蓋度變化動態(tài)遙感監(jiān)測[D]北京:北京林業(yè)大學,2008.
[3]周淑琴,吳發(fā)啟,荊耀棟.毛烏素沙地南緣植被覆蓋度動態(tài)監(jiān)測——以陜西省靖邊縣為例[J]安徽農(nóng)業(yè)科學,2007,35(27):8550-8551, 8573.
[4]VapnikV N.The Nature of Statistical Learning Theory, Springer Verlag[M]New York, 1995.
[5]Cortes C Vapnik V.Support Vector Networks[J]Machine Learning, 1995, 20(3):273-297.
[6]張錦水,何春陽,潘耀忠,等.基于SVM的多源信息復(fù)合的高空間分辨率遙感數(shù)據(jù)分析研究[J]遙感學報,2006, 10(1):49-57.
[7]賈萍,李海濤,林卉,等.基于SVM的多源遙感影像分類研究[J]測繪科學,2008, 33(4):21-22.
[8]Foody G M, Mathur A.A Relative Evaluation of Multiclass Image Classification by Support Vector Mathines[J]IEEE Trans.Geoscience and Remote Sensing, 2004, 42:1335-1343.
[9]趙文吉.ENVI遙感影像處理專題與實踐[M]北京:中國環(huán)境科學出版社,2008.
[10]趙春霞,錢樂祥.遙感影像監(jiān)督分類與非監(jiān)督分類的比較[J]河南大學學報,2004, 34(3):90-93.