熊 敏
(福建省地質(zhì)測繪院,福建 福州 350011)
隨著國家的快速發(fā)展,我國各個領(lǐng)域各個行業(yè)的發(fā)展也是日新月異,對于測繪工程來說,區(qū)別于傳統(tǒng)的大地測量,遙感技術(shù)、GPS 技術(shù)、地理信息系統(tǒng)以及攝影測量技術(shù)的發(fā)展與進步,改變了測繪界一直以來基于傳統(tǒng)測量的局面,有效地提高了測量的效率與精度。而其中遙感技術(shù)是必不可少的組成部分。本文首先對最初的遙感影像進行預(yù)處理操作,然后使用不同的分類方法進行分類,最后評價分析分類的結(jié)果,通過這種方法對土地覆蓋現(xiàn)狀進行調(diào)查,有利于我們更好地管理利用土地,減少國土資源的浪費和破壞。
本文研究所選地區(qū)為安徽省馬鞍山市,位于長江下游長三角區(qū),土地總面積約40.49 萬hm2,其中,耕地面積14.79 萬hm2,林地面積7.37 萬hm2,交通用地0.94 萬hm2,水域10.61 萬hm2,其他用地6.67 萬hm2,市區(qū)年平均降水量1060 mm,降水總量約2.9 億m3。
本文所采用的數(shù)據(jù)下載自官方網(wǎng)站地理空間數(shù)據(jù)云,行編號與列編號分別為120,38 的某地區(qū)Landsat 8 衛(wèi)星影像數(shù)據(jù)。Landsat 8 衛(wèi)星上攜帶有OLI 和TIRS 兩個主要的傳感器,本次研究所用數(shù)據(jù)即由地理空間數(shù)據(jù)云下載的云量遮擋少、能見度高的衛(wèi)星影像數(shù)據(jù)。我們將下載的Landsat 8 衛(wèi)星影像數(shù)據(jù)在所選用的軟件平臺ENVI 4.7 進行初步地裁剪、大氣校正輻射定標影像融合等處理后,通過監(jiān)督分類、非監(jiān)督分類以及構(gòu)建決策樹的方法對影像數(shù)據(jù)進行分類比較,分析其分類精度和效果。
本文實驗用的影像數(shù)據(jù)經(jīng)過篩選后下載,該影像畫面清晰,云量較少,圖像質(zhì)量總體較好,以下為預(yù)處理操作過程以及原理作簡單地介紹。
1.3.1 試驗區(qū)裁剪
所謂影像裁剪就是裁剪出本次研究所需區(qū)域,依據(jù)行政區(qū)邊界或者自身研究所需的區(qū)域大小的自然邊界進行裁剪,裁剪時可以根據(jù)行政區(qū)的邊界大小使用ArcGIS 軟件進行手動摳圖裁剪。
1.3.2 影像融合
本文研究所作的圖像融合是在基于ENVI 4.7軟件系統(tǒng)的支持下將低空間分辨率的多光譜影像和高光譜數(shù)據(jù)與高空間分辨率的單波段影像重采樣生成高分辨率的多光譜影像,使得處理過后的遙感影像在具有高空間分辨率的同時又比單波段影像具有多光譜的特征。
1.3.3 輻射定標
輻射定標,通俗來講就是把記錄的原始的數(shù)字量化值DN 轉(zhuǎn)化為大氣外層表面反射率或者輻射亮度值等,目的是消除傳感器本身產(chǎn)生的誤差,從而確保傳感器接收的輻射值準確,這也是進行大氣校正的前期準備[1]。
1.3.4 大氣校正
利用遙感技術(shù)獲取地物信息時,是用傳感器來接收觀測目標所發(fā)出的電磁能量。大氣校正有多種方法和模型,這里我們使用的ENVI 的FLAASH 模塊,直接使用atmospheric correction 工具進行大氣校正。
2.1.1 K-Means
K-Means 是非監(jiān)督的聚類算法,使用的是聚類分析的方法。聚類分析就是在給定的一些數(shù)據(jù)中查找發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,并以此為依據(jù)將數(shù)據(jù)進行分組,同組內(nèi)的對象之間相似度越高、不同組間的差別就越大,那么就代表著該聚類分析的聚類效果越好。
聚類算法時如果希望提高分類精度,可以嘗試適當提高迭代次數(shù),分類的操作步驟大致如下:首先打開需要分類的影像數(shù)據(jù),在K-Means 分類器的參數(shù)設(shè)置界面K-Means Paramenters 上我們可以設(shè)置分類數(shù)目Number of Classes 和最大迭代次數(shù)Maximum Iteration,迭代次數(shù)越多,分類效果和精度越好[2]。
圖1 K-Means 分類圖
2.1.2 IsoData
IsoData 中文名稱就是重復(fù)自組織數(shù)據(jù)分析技術(shù)。IsoData 和K-Means 算法是ENVI 非監(jiān)督分類的2 種分類器,從算法的角度比較,IsoData 算法是通過選擇初始值,包括聚類中心(也稱質(zhì)心)等指標,然后計算數(shù)據(jù)空間中均勻分布的類均值,按照距離中心的最短距離進行分類,然后用最小距離技術(shù)將剩余像元進行迭代聚合,計算出距離函數(shù)等指標,重新迭代計算后都計算出一個新的均值,按照給定的要求使用新計算出的各項指標,對之前獲得的聚類像元進行合并或分裂處理再分類,從而獲得新的聚類中心,聚類中心的個數(shù)也會隨之改變。
圖2 IsoData 分類圖
2.2.1 最大似然法
ENVI4.7 軟件中的監(jiān)督分類一共有兩類9 種分類器,其中,最大似然法是一種基于傳統(tǒng)統(tǒng)計分析學的統(tǒng)計方法,其特點是事先知道地物類別的特征信息,即類別的先驗知識。分類的步驟大致如下,首先本文對影像的土地利用分類定義了5 個類別,植被、水體、農(nóng)田、居民區(qū)和道路,在主頁窗口中點擊Region Of Interest 選擇Roi Tool 工具欄定義分類名稱和顏色繪制多邊形選擇訓練樣本。選擇最大似然分類器在參數(shù)設(shè)置界面根據(jù)需要更改參數(shù)。
一般默認參數(shù),選擇文件輸出保存路徑后,對影像進行分類顯示,經(jīng)過最大似然分類后的影像結(jié)果,如圖3 所示。
圖3 最大似然分類圖
圖4 最小距離分類圖
圖5 決策樹分類圖
2.2.2 最小距離法
最小距離法(Minimum Distance)屬于遙感影像監(jiān)督分類這個模塊,通俗來說,最小距離法就是經(jīng)過計算影像中所有像元到選取的樣本點的距離,統(tǒng)計后進行對比分析,然后根據(jù)距離的大小來將其規(guī)劃進某一類別中。最小距離法的原理大致如下:假設(shè)將數(shù)據(jù)庫n分成A、B、C 和D 等幾種類別,通過距離算法求出像元到各個類別中心X的距離S,通過比較選擇出最小的距離S,將該像元劃分到最小距離的類別中。
監(jiān)督分類和非監(jiān)督分類是比較傳統(tǒng)簡單的分類方法,隨著測繪學科范圍不斷擴大,遙感技術(shù)日新月異快速發(fā)展,許多新的分類方法不斷誕生,其中決策樹分類計數(shù)發(fā)展較為成熟應(yīng)用較多。決策樹顧名思義是一種樹的結(jié)構(gòu),并且是一個二叉樹或者多叉樹,樹的分叉處是結(jié)點包括葉結(jié)點和根節(jié)點,葉結(jié)點表示一個類,根結(jié)點是二叉樹上面那個結(jié)點。本次研究使用決策樹分類是基于CART 算法下的,通過CART 算法來獲取規(guī)則,并基于此規(guī)則對影像數(shù)據(jù)分類[3],以下是基于該算法決策樹分類的總體技術(shù)流程:
1)數(shù)據(jù)預(yù)處理;
2)構(gòu)建多源數(shù)據(jù)。這里需要構(gòu)建一個混合波段,這個合成波段包括紅、綠、藍和近紅4 個波段,NDVI 數(shù)據(jù),裁減過后的該試驗區(qū)DEM 矢量數(shù)據(jù)以及經(jīng)過IsoData 分的類數(shù)據(jù)共7 個波段;
3)獲取規(guī)則。與監(jiān)督分類方法相同使用Roi Tool 工具選擇選練樣本,樣本選取后,在Decision Tree 下選擇Classifier 計算,得到?jīng)Q策樹;
4)在打開的決策樹面板點擊菜單欄的Options選擇execute 執(zhí)行決策樹,得出分類結(jié)果。
本次研究使用的決策樹分類是基于CART 算法的,但是在ENVI 4.7 軟件中需要在網(wǎng)上自行下載CART 插件,安裝到ENVI 下。
對遙感數(shù)據(jù)分類后,需要評價分析分類的結(jié)果,判定分類的精度。這是非常重要的一個步驟,精度評價不僅可以判定分類結(jié)果的錯誤率是否對分類結(jié)果造成較大影響,而且還能夠鑒別每個分類方法的精確度。沒有精度說明的分類數(shù)據(jù)是沒有利用價值和使用意義的。對結(jié)果進行精度驗證最核心和關(guān)鍵的要素就是作為驗證樣本的數(shù)據(jù),該樣本數(shù)據(jù)的來源可以是親自進行野外調(diào)查后得到的數(shù)據(jù),也可以從高分辨率的數(shù)據(jù)源獲取。本次實驗所用的樣本來自Google Earth,主要步驟如下:
1)獲取高分辨率的數(shù)據(jù)樣本。
通過Google Earth 軟件,將該地區(qū)根據(jù)之前分類方法中的分類類別,對每種類別選擇幾處繪制多變形保存。由于Google Earth 上的文件保存類型是Kml 和Kmz 形式,在ENVI 中無法直接打開,因此需要在ArcGIS 中將圖層轉(zhuǎn)換為shp 文件。然后將獲取的樣本數(shù)據(jù),加載進ENVI 影像中,通過操作軟件將多變形數(shù)據(jù)轉(zhuǎn)成訓練樣本。
2)選擇分類器進行圖像分類。
3)精度驗證。在ENVI 主菜單欄Classifiation單擊Post Classifiation 選擇精度驗證方法對分類結(jié)果驗證,獲取精度評價結(jié)果。本次精度驗證方法選擇的是混淆矩陣驗證,混淆矩陣的另一個名稱是誤差矩陣[4]。
表1 IsoData 分類方法精度驗證結(jié)果
表2 K-Mean 分類精度驗證結(jié)果
表3 最小距離精度驗證結(jié)果
表4 最大似然法精度驗證結(jié)果
表5 決策樹精度驗證結(jié)果
總體分類精度與Kappa 系數(shù)的驗證結(jié)果:
通過對每一種的分類結(jié)果進行混淆矩陣精度評價后,將Kappa 系數(shù)與總分類精度值的數(shù)據(jù)列出,為了讓分類的結(jié)果有一個明顯對比,同時通過對比表6 中的Kappa 系數(shù)值的來確定精度的范圍級別。
表6 結(jié)果對比
通過對比分析可以得出非監(jiān)督分類方法IsoData 和K-Means 兩種分類方法的Kappa 系數(shù)分別為0.34 和0.48,通過對照表7 中的分類精度,IsoData 分類法的分類精度處于一般精度,K-Means分類法的分類精度為良好。對于監(jiān)督分類,最小距離與最大似然法的總分類精度高于監(jiān)督分類的兩種方法,且最小距離與最大分類方法的Kappa 系數(shù)值分別是0.64 和0.66,分類精度較好。相比于前4種分類方法決策樹分類法的分類結(jié)果顯示其總體分類精度和Kappa 系數(shù)值明顯高于其他4 種分類方法,分類精度較好且高于其他分類法。因此結(jié)合精度分類的結(jié)果數(shù)據(jù)對比分析,包括總分類精度和Kappa 系數(shù)等,得出對于該地區(qū)的土地利用分類方法的選擇,決策樹分類更加適合。
本文以某地區(qū)為研究區(qū)域,使用ENVI 軟件遙感分類方法對該地區(qū)的衛(wèi)星影像數(shù)據(jù)處理分類,分類方法使用了5 類,得到以下一些結(jié)論:
1)利用遙感影像進行實驗研究時,需要對原始的遙感影像進行處理,未經(jīng)處理的遙感影像清晰度和準確度不高,可能會對研究結(jié)果造成偏差,因此只有合理地對數(shù)據(jù)加以處理才能獲取較為滿意的結(jié)果。
2)對特定的地區(qū)地物進行分類時,需要大量數(shù)據(jù)支持,除了研究所需要的地區(qū)原始影像,精度驗證時使用的標準數(shù)據(jù)也是非常關(guān)鍵,若是檢驗數(shù)據(jù)的精度達不到要求,就無法對以上分類的結(jié)果作出準確和權(quán)威的精度評價。
3)就本次研究而言,該地區(qū)最優(yōu)的分類方法是基于CART 算法的決策樹分類,相較于其他分類方法而言,決策樹分類的優(yōu)勢在于根據(jù)分類樣本生成可被理解的決策樹,該算法簡單易行,運行的效率較高。