黃邵東,徐偉恒, *,熊 源,吳 超,代 飛, ,徐海峰,王雷光,寇衛(wèi)利
1. 西南林業(yè)大學大數(shù)據(jù)與智能工程學院,云南 昆明 650233 2. 西南林業(yè)大學大數(shù)據(jù)與智能工程研究院,云南 昆明 650233 3.西南林業(yè)大學林業(yè)生態(tài)大數(shù)據(jù)國家林業(yè)與草原局重點實驗室,云南 昆明 650233
茶葉起源于中國,中國是最早發(fā)現(xiàn)和種植茶葉的國家,中國茶文化源遠流長[1]。茶葉是包括中國、 斯里蘭卡,肯尼亞和印度在內(nèi)等諸多發(fā)展中國家重要的經(jīng)濟支柱[2]。21世紀初以來,全球茶產(chǎn)業(yè)發(fā)展迅速,茶葉種植面積與產(chǎn)量都有了顯著的增長。截止2018年,中國茶葉種植面積為2 985.80千公頃,產(chǎn)量達261.04萬噸。而云南省作為我國重要的產(chǎn)茶大省,茶葉成為當?shù)剞r(nóng)民的主要經(jīng)濟來源以及當?shù)刎斦愂盏闹匾獊碓础?018年云南省茶葉種植面積達46.66萬公頃,茶葉產(chǎn)量達42.33萬噸,同比2017年增長7.6%。茶園快速擴張,提高了茶葉產(chǎn)量,進而推動了當?shù)氐慕?jīng)濟發(fā)展,但同時產(chǎn)生了森林資源減少、 生物多樣性及生態(tài)系統(tǒng)服務(wù)降低等一系列負面影響[3]。因此準確識別茶園分布范圍,對有關(guān)部門制定相應(yīng)的土地政策,合理種植茶園、 茶園病害預(yù)防及茶葉估產(chǎn)、 保護生態(tài)環(huán)境等具有科學的指導(dǎo)意義。
傳統(tǒng)的應(yīng)用遙感影像對地物進行提取大多是基于像元的方法,無法充分利用高空間分辨率影像豐富的地物信息(紋理、 空間信息),且會造成信息冗余,容易導(dǎo)致地物錯分、 漏分,且出現(xiàn)“椒鹽現(xiàn)象”[4]。而面向?qū)ο蠓诸惙椒▌t是基于地物類內(nèi)一定同質(zhì)性進行對象分割獲得基元,因此可以充分利用高空間分辨率影像豐富的光譜信息、 紋理信息、 上下文語義信息、 鄰域信息和空間信息等相關(guān)信息,彌補了傳統(tǒng)基于像元分類容易造成的地物分類破碎化的弊端[5]。以云南省重點山地茶園區(qū)域的一景GF-1 PMS影像為數(shù)據(jù)源,采用多尺度分割(multiresolution segmentation, MRS)方法對影像進行分割,采用面向?qū)ο蟮谋O(jiān)督分類方法[貝葉斯(Bayes)、 決策樹(decision tree,DT)、 隨機森林(random forest,RF)]實現(xiàn)茶園的提取,探索適合山區(qū)茶園提取最優(yōu)的分割參數(shù)和分類特征組合的高精度、 精細化提取方法。
研究區(qū)位于云南省南部,是典型的山地茶園分布區(qū)域。世界紀錄認證機構(gòu)(World Record Certification Agency,WRCA)認證的“世界最大連片茶園”的大渡崗萬畝茶園位于本文研究區(qū)內(nèi)。地理范圍(100°43′34″E—101°29′39″E, 22°02′30″N—22°45′11″N),面積約為4 412 km2, 如圖1所示。研究區(qū)內(nèi)地物類型主要有森林、 茶園、 農(nóng)田、 不透水層以及水體等。
圖1 研究區(qū)示意圖Fig.1 Schematic diagram of study area
基于eCognition9.0軟件,采用MRS方法對影像進行不同尺度分割,并利用ED3Modified對分割結(jié)果進行評估,確定茶園提取的最優(yōu)分割尺度。在研究區(qū)分割對象上隨機選取了茶園、 農(nóng)田、 森林、 水體及不透水層5種地物類型共600個分割對象用作訓練樣本,并結(jié)合2018年12月份對普洱、 西雙版納地區(qū)茶園的實地調(diào)查及Google Earth影像數(shù)據(jù)對訓練樣本進行核對校正。通過優(yōu)化特征空間組合后,分別利用Bayes,DT及RF分類方法對茶園進行提取并對茶園提取結(jié)果進行精度比較。
以一景GF-1 PMS遙感影像(拍攝日期: 2019年2月21日)為數(shù)據(jù)源,包括2m分辨率的全色波段,4個8 m分辨率的多光譜波段[藍(Blue)、 綠(Green)、 紅(Red)、 近紅外(NIR)]。利用ENVI5.3進行影像預(yù)處理,采用NNDiffuse PAN Sharpening算法進行全色與多光譜數(shù)據(jù)融合,最終獲得2 m分辨率的融合影像。
GF-1影像分割效果主要受輸入影像波段,形狀,緊致度及尺度4個因素影響[6]。若分割尺度不當,則會導(dǎo)致一些地物存在“欠分割”或“過分割”現(xiàn)象,難以保證分類精度。為克服不當尺度造成的上述弊端,采用MRS方法對影像進行分割并進行最優(yōu)分割尺度評估,借助ED3Modified方法及樣地疊加進行目視解譯確定影像的最優(yōu)分割尺度[6]。該方法的原理是當與一個參考多邊形的重疊面積超過參考多邊形或被分割對象面積的50%時,被分割的對象才能被標記為相對應(yīng)的參考多邊形的分割對象。ED3Modified值為0~1的歸一化指數(shù),計算見式(1)。ED3Modified值越低則表示影像分割質(zhì)量越高。在分割對象中隨機選取茶園、 森林、 農(nóng)田、 不透水層、 水體樣地各30個參考多邊形,采用ArcGIS10.5計算ED3Modified值,最佳分割尺度由ED3Modified的最低值決定。
ED3Modified=
(1)
式(1)中,ri為參考多邊形;I為參考多邊形的數(shù)量;S為面積;sj為對應(yīng)的參考多邊形的分割對象;Ji為相對應(yīng)的分割數(shù)。
選擇分割尺度范圍為100~300(分割步長為25)對影像進行分割。如圖2所示,ED3Modified值呈現(xiàn)為“中間低兩頭高”的趨勢,說明ED3Modified表現(xiàn)為先減少后增加的變化,即在分割尺度為225時ED3Modified最小(0.44),則與之對應(yīng)的尺度225為最優(yōu)分割尺度。
圖2 ED3Modified值隨分割尺度的變化Fig.2 The ED3Modified values vs the segmentation scale
不同分割尺度的分割效果如圖3所示。分割尺度過小,會導(dǎo)致過分割,如圖3(a—e)所示,大面積連片區(qū)域的地物分割過于細碎化(森林、 茶園); 分割尺度過大,導(dǎo)致欠分割,一些夾雜在大面積地物內(nèi)的其他零散地物就會被合并為大面積地物,造成地物分割對象混淆,如圖3(g—i)所示。在最佳分割尺度下,地物分割不僅對離散的不透水層、 水體以及連片的茶園、 森林都達到了較為良好分割效果,合并了同類地物小區(qū)域,又與其他地物有明確的邊界,如圖3(f)所示。因此,針對本研究區(qū)域,當分割尺度為225時,不論是小面積的不透水層,水體,或者是大面積連片的森林、 茶園、 農(nóng)田都能較好的與參考圖斑重合,獲得良好的分割效果。
分類過程采用分割對象的紋理、 光譜及空間特征,見表1。選取了GF-1影像的4個波段(Blue,Green,Red和NIR)的光譜反射率均值及標準差、 調(diào)整土壤亮度的植被指數(shù)(soil adjust vegetation index,SAVI)、 歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、 燃燒面積指數(shù)(burned area index,BAI)及歸一化水體指數(shù)(normalized difference water index,NDWI),亮度指數(shù)(brightness)均值和對象內(nèi)部最大差值(Max.diff)等14個光譜特征; 基于灰度共生矩陣(gray level co-occurrence matrix, GLCM) 的角二矩陣(angular second moment)、 相異度(dissimilarity)、 相關(guān)性(correlation)、 熵(entropy)、 及同質(zhì)性(homogeneity)和對比度(contrast)等6個紋理特征; 緊致度(compactness)、 面積(area)及長寬比(length/width)等3個空間特征。最終構(gòu)建了23維分類特征。
圖3 不同尺度下的影像分割結(jié)果Fig.3 Image segmentation results at different scales
將表1中的23維特征組合為一個特征空間,基于eCognition9.0計算5類樣本在此特征空間中的分離度,通過比較不同特征空間產(chǎn)生的分離度,找出在兩兩不同地類樣本之間產(chǎn)生最大的平均最小距離的特征組合,各地物在此特征空間下具有最好的可分性,則此特征空間為最優(yōu)特征組合。如圖4所示,當特征維度達到16維時,地物可分離度已達到1.82,再增加特征對于地物樣本之間的可分離效果趨勢逐漸下降,也即增加特征已經(jīng)造成了分類特征冗余,因此將最優(yōu)特征空間定為16維,分別為BAI,Homogeneity,Area,NIR_Mean,NIR_Std,Length/Width, Dissimilarity,Compactness,Red_Mean,Max.diff,Entropy, Blue_Mean,NDVI,Correlation,Brightness以及SAVI。
表1 面向?qū)ο蠓诸惖膶ο筇卣鱐able 1 The features of object-oriented classification
圖4 最優(yōu)特征空間維度評價Fig.4 Evaluation of the optimal feature spaces dimensions
基于特征優(yōu)化得到16維分類特征,選用常用的三種監(jiān)督分類方法(Bayes,DT,RF)進行茶園提取并進行精度對比。對比了(1)三種面向?qū)ο蟮谋O(jiān)督分類[多分類(森林、 茶園、 農(nóng)田、 不透水層及水體)]精度; (2)面向?qū)ο蟮腞F二分類(茶園、 其他)與面向?qū)ο蟮腞F多分類茶園提取精度; (3)面向?qū)ο驲F二分類與基于像元的RF多分類的茶園提取精度。
面向?qū)ο蟮腞F的多分類[圖5(a)]以及RF二分類的茶園提取結(jié)果[圖5(b)]。多分類結(jié)果與茶園混淆的作物主要為農(nóng)田,而二分類由于將森林、 不透水層、 農(nóng)田及水體歸為一類,增加了與茶園的類間差異,因此,二分類較多分類對于農(nóng)田的過濾效果較明顯。
圖5 隨機森林(RF)茶園提取結(jié)果Fig.5 Extraction results of random forest tea plantations
選取研究區(qū)茶園分布較為典型的大渡崗茶園 (100°57′16.62″E, 22°21′3.12″N)進行局部地區(qū)茶園提取效果展示及面積比較。圖6(a)為大渡崗影像真彩色合成圖(藍、 綠、 紅波段合成); 圖6(b)為面向?qū)ο蟮腞F多分類結(jié)果; 圖6(c)為基于像元的RF多分類結(jié)果。大渡崗連片茶園的官方統(tǒng)計面積為65 246畝,面向?qū)ο蠖喾诸悓τ诓鑸@的提取面積為59 851畝,與統(tǒng)計面積相對誤差為-8.27%; 基于像元多分類對于茶園的提取面積為55 142畝,與統(tǒng)計面積相對誤差為-15.49%。
圖6 面向?qū)ο笈c基于像元的RF分類結(jié)果對比Fig.6 Comparison of the object-oriented and pixel-based classifications
本研究采用ArcGIS10.5在GF-1號影像上生成3 000個隨機點結(jié)合Google Earth進行地物類型標記,然后與野外實地調(diào)查的1 006個數(shù)據(jù)點相結(jié)合,利用ENVI5.3生成分類混淆矩陣進行精度驗證,其中驗證點個數(shù)分別為茶園(603)、 森林(2 728)、 農(nóng)田(372)、 不透水層(188)及水體(115)。
由表2可知,對于本研究區(qū)中5類地物分類中,面向?qū)ο蟮腂ayes,DT及RF分類的總體精度(overall accuracy, OA)與Kappa系數(shù)分別為87.73%,0.70; 88.52%,0.72; 91.23%,0.78。對于茶園提取效果而言,DT與RF分類效果優(yōu)于Bayes,以RF分類效果更為顯著,生產(chǎn)者精度(producer accuracy, PA)與使用者精度(user accuracy, UA)分別達到了70.54%及87.13%。
由表3可知,基于像元的RF分類的OA與Kappa系數(shù)分別為71.42%與0.58,而茶園的PA與UA只達到了55.43%和63.71%,由圖6大渡崗茶園提取結(jié)果可知,基于像元的RF的茶園提取結(jié)果[圖6(c)]相較于面向?qū)ο蠓诸惖牟鑸@提取結(jié)果[圖6(b)]“椒鹽”現(xiàn)象比較嚴重,且茶園、 農(nóng)田以及森林混淆度較高,分類結(jié)果較為破碎。而面向?qū)ο驲F二分類的OA與Kappa系數(shù)較基于像元RF分類的結(jié)果分別提高23.32%和0.27,較面向?qū)ο驲F多分類OA與Kappa系數(shù)分別提高3.24%和0.07; 就茶園提取精度而言,面向?qū)ο驲F二分類PA與UA比基于像元的RF多分類分別提高了21.10%和29.03%,比面向?qū)ο蟮腞F多分類分別提高了5.99%和5.61%。
表2 面向?qū)ο蟮谋O(jiān)督分類結(jié)果精度對比Table 2 Comparison of the accuracies of object-oriented supervision classification
表3 基于像元和面向?qū)ο蟮腞F茶園提取精度對比Table 3 Comparison of the accuracies of pixel-wise RF and object-oriented RF for tea plantations extraction
僅利用單一時相多光譜GF1-PMS影像,基于像元的RF分類方法,在山區(qū)茶園提取中精度(PA/UA: 55.43%/63.71%)不高。然而,結(jié)合紋理和空間特征,采用面向?qū)ο蠓椒梢蕴岣卟鑸@提取精度。在三種分類器(RF,Bayes和DT)中,面向?qū)ο蟮腞F分類精度(PA/UA: 70.54%/87.13%)較高。面向?qū)ο驲F二分類方法的茶園提取精度(PA/UA: 76.53%/92.74%)高于面向?qū)ο驲F多分類方法。本研究利用單一時相GF-1全色影像融合多光譜對于山區(qū)茶園提取獲得了較為滿意的精度,說明高分影像對山區(qū)破碎茶園的監(jiān)測及制圖具有較好的應(yīng)用價值及潛力。
隨著傳感器數(shù)量的增加,遙感影像的空間分辨率、 光譜分辨率以及時間分辨率的提高,在充分利用光譜信息的同時,空間信息及紋理信息對于地物分類越來越重要[7]。山區(qū)地物類型復(fù)雜多樣(橡膠、 香蕉、 甘蔗、 灌草等)與茶園具有相似的光譜特征,“異物同譜”現(xiàn)象增加了高精度提取茶園的難度,而采用面向?qū)ο蟮姆诸惙椒?,相比于基于像元的分類,在光譜特征基礎(chǔ)上增加了紋理特征與空間特征,提高了茶園的提取精度; 將森林、 水體、 農(nóng)田及不透水層四類地物合并為一類,平均了四種地物的類間差異,而增大了茶園同森林、 農(nóng)田的類間差異,因此面向?qū)ο蟮腄T二分類較多分類進一步提高了茶園的提取精度。但面向?qū)ο蠓诸惙椒ǜ呔忍崛〔鑸@依賴于影像的高空間分辨率,而諸如高分、 WorldView及SPOT等系列影像獲取成本高。本文僅討論了單一時相條件下,融合紋理和空間特征的茶園提取方法。如何將多源、 多時相遙感影像融合,應(yīng)用于山區(qū)復(fù)雜地形條件下茶園提取和精細化制圖,有待進一步研究。