馬戰(zhàn)林,薛華柱※,劉昌華,李長春,房 旭,周俊利
(1. 河南理工大學(xué)測繪與國土信息工程學(xué)院,焦作 454003;2. 河南省遙感測繪院,鄭州 450003)
大蒜作為一種重要的小宗經(jīng)濟作物,在河南省、山東省等地區(qū)廣泛種植??焖佟⒕珳实孬@取大蒜種植面積,對降低市場變動帶來的風(fēng)險和促進中國經(jīng)濟作物市場化發(fā)展具有重要意義。
在大規(guī)模農(nóng)作物種植監(jiān)測中,遙感技術(shù)相對人工統(tǒng)計法有更經(jīng)濟、及時、高效和客觀的優(yōu)勢。高光譜和高時空分辨率衛(wèi)星技術(shù)的蓬勃發(fā)展,推動了遙感技術(shù)在大范圍農(nóng)作物、農(nóng)情監(jiān)測中的應(yīng)用。在眾多高時空分辨率衛(wèi)星中,Sentinel主被動遙感衛(wèi)星成為露天農(nóng)作物種植監(jiān)測的主要數(shù)據(jù)源。已有學(xué)者利用最大似然、人工神經(jīng)網(wǎng)絡(luò)、支持向量機和監(jiān)督分類等分類方法,融合光學(xué)和合成孔徑雷達(Synthetic Aperture Radar,SAR)數(shù)據(jù)的分類精度高于單一數(shù)據(jù)源。多時相遙感數(shù)據(jù)可以獲取作物生長結(jié)構(gòu)時序變化,將多時相光學(xué)和SAR數(shù)據(jù)進行融合可獲取更多的作物信息,進一步提高作物識別精度。
當前,遙感數(shù)據(jù)作物提取方法主要為基于像元和降低光譜變異的面向?qū)ο蠓椒ā;谙裨挠跋穹诸惾菀桩a(chǎn)生椒鹽效應(yīng),面向?qū)ο蠓椒▽⑦b感影像的各個波段分割合并成若干互不重疊的分類單元,利用不同波段分割后的合成數(shù)據(jù)進行分類,有效降低基于像元分類產(chǎn)生的許多孤立噪聲點,避免椒鹽現(xiàn)象和提升分類精度。圖像分割方法和尺度直接影響作物識別精度。簡單線性迭代聚類(Simple Linear Iterative Clustering,SLIC)算法是一種非常高效的圖像分割算法,而改進的簡單非迭代聚類(Simple Non-iterative Clustering,SNIC)圖像分割算法,以對內(nèi)存要求更低、超像素生成速度快、精度高、更加適合云計算運算環(huán)境,而被廣泛應(yīng)用于遙感數(shù)據(jù)分類研究。分割尺度的選擇決定生成對象的大小,“分割不足”或“過度分割”都會對分類結(jié)果產(chǎn)生不利影響。有研究應(yīng)用對象同質(zhì)性局部方差、“面積對象數(shù)比”法獲取影像的整體最優(yōu)分割尺度,但并非針對某一特定作物進行最優(yōu)分割尺度選擇。最優(yōu)分割尺度的選擇,需根據(jù)遙感數(shù)據(jù)和提取對象的實際情況進行選擇。如程琳琳等對GF-1數(shù)據(jù)進行分割尺度選擇研究,當分割尺度為230時,分割結(jié)果對水產(chǎn)養(yǎng)殖濕地邊界吻合度高,分割效果好。張露洋等對Landsat數(shù)據(jù)進行土地利用研究時,選擇20為最優(yōu)分割尺度。
人工、自然覆被的紋理特征存在差異。地表紋理特征的加入可以有效提高地表分類精度。但大量紋理和形狀信息加入后,同樣會帶來噪聲或冗余信息,從而降低分類精度。有學(xué)者應(yīng)用特征優(yōu)選法、主成分分析法(Principal Components Analysis,PCA)等方法降低特征變量維度,達到較高的分類精度。
開封市面積達6 444 km,下載數(shù)據(jù)、配備遙感軟硬件工作站的傳統(tǒng)方式增加處理遙感數(shù)據(jù)的時間和計算成本。谷歌地球引擎(Google Earth Engine,GEE)僅需少量代碼則可輕易、快速獲取研究時間、地理范圍內(nèi)的遙感數(shù)據(jù)。GEE包含當前常用的支持向量機、隨機森林(Random Forest,RF)等機器學(xué)習(xí)算法。RF運算速度快、并行性和穩(wěn)健性強,以及固有的多種優(yōu)點被廣泛應(yīng)用于作物識別中。中國北方大蒜和冬小麥在各自不同生育期內(nèi),具有相似的物候和光譜特征,單純依靠光學(xué)影像難以區(qū)分。綜合上述多方面因素,本文基于GEE云平臺,利用大蒜生長周期內(nèi)包含地物結(jié)構(gòu)信息變化的Sentinel時序SAR極化數(shù)據(jù)和光學(xué)數(shù)據(jù),應(yīng)用面向?qū)ο蠓椒ê蚏F算法,探討融合不同分辨率主被動遙感數(shù)據(jù)的極化特征、光譜特征、光譜指數(shù)特征與紋理特征的不同組合對提升開封市大蒜識別精度的影響,為快速、及時、精準獲取中國大蒜種植面積及對大蒜市場化健康發(fā)展提供技術(shù)支持。
開封市位于河南省中東部,西鄰黃河,界于113°52′15″~115°15′42″E,34°11′45″~35°01′20″N,總面積達6 444 km。該市屬典型溫暖帶大陸性季風(fēng)氣候,四季分明,年平均氣溫14.1 ℃,年均降水量722 mm。開封市地勢平坦,農(nóng)業(yè)發(fā)達,耕地面積占總面積的69.20%,是河南省乃至全國重要的農(nóng)產(chǎn)品生產(chǎn)區(qū),主要作物有小麥、花生、玉米、大蒜、棉花等,是全國六大大蒜主產(chǎn)區(qū)之一。依據(jù)河南省2018—2020年統(tǒng)計年鑒,該區(qū)域內(nèi)大蒜種植面積達到499 km以上,占開封市總面積8%左右。大蒜一般在每年的10月份播種,5月至6月份收獲,與小麥生長周期基本重疊,且區(qū)域內(nèi)農(nóng)作物種植結(jié)構(gòu)復(fù)雜,地塊狹長,破碎化程度高。為驗證不同特征組合及分類器在不同碎部地區(qū)的分類性能,研究選取大蒜占比較少的a區(qū)域和大蒜與冬小麥錯綜復(fù)雜的b區(qū)域,并引入更高分辨率的高分數(shù)據(jù)進行對比分析,開封市、a和b區(qū)域的具體位置如圖1所示。因此,在該區(qū)進行遙感大蒜識別研究,具有很強的實用價值。
圖1 開封市地理位置及樣本采集點空間分布 Fig.1 Geographical location of Kaifeng and space distribution of collection samples
谷歌地球引擎(GEE)基于谷歌云計算平臺開發(fā),目前存儲超過5PB的海量遙感數(shù)據(jù)及產(chǎn)品數(shù)據(jù),包含Sentinel、Landsat、MODIS等多源遙感數(shù)據(jù)和葉面積指數(shù)、降水等遙感產(chǎn)品數(shù)據(jù),且逐日增加不同傳感器約5 000張最新遙感影像,能夠解決大范圍遙感數(shù)據(jù)的存儲下載問題。
Sentinel-1主動微波遙感衛(wèi)星和Sentinel-2光學(xué)衛(wèi)星的詳細介紹如文獻[7]中所述。本文采用分辨率為10 m和20 m、極化方式為“VV”和“VH”的Sentinel-1衛(wèi)星后向散射系數(shù)數(shù)據(jù)。Sentinel-2光學(xué)數(shù)據(jù)主要選取10 m分辨率的藍光(490 nm)、綠光(560 nm)、紅光(660 nm)、近紅外(840 nm)波段及20 m對植被監(jiān)測有效的3個紅邊波段(703.8 nm、739.1 nm、779.7 nm)。Sentinel系列衛(wèi)星數(shù)據(jù)均在GEE云平臺上調(diào)用、處理。GEE通過“ee.ImageCollection('COPERNICUS/S1_GRD')”等函數(shù),可直接獲取“VV”和“VH”后向散射系數(shù)數(shù)據(jù),降低SAR數(shù)據(jù)處理難度。Sentinel-2數(shù)據(jù)依據(jù)大氣校正狀態(tài)分為兩個級別:1C級和2A級。1C 是大氣頂層反射率數(shù)據(jù),2A是已經(jīng)過大氣校正后的地表反射率數(shù)據(jù),本文選用云量低于10%的2A級數(shù)據(jù)用于大蒜種植區(qū)域的識別研究。表1為應(yīng)用數(shù)據(jù)的傳感器參數(shù)。
表1 Sentinel衛(wèi)星傳感器參數(shù) Table 1 The Sentinel satellite sensor parameters
為驗證識別精度,本研究利用2021年3月2日GF-1和2021年3月30日GF-2融合后的2 m分辨率多光譜數(shù)據(jù),用于評價10 m、20 m分辨率Sentinel主被動數(shù)據(jù)在碎部地塊的分類性能。
根據(jù)研究區(qū)覆被類型、地形地貌和植被生長季物候特征等因素,選取Sentinel-1 影像的VV、VH后向散射系數(shù),Sentinel-2影像的光譜反射率及由反射率計算的光譜指數(shù)和紋理特征等特征變量提取大蒜種植面積。其中,光譜指數(shù)包含:歸一化差異植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、歸一化水體指數(shù)(Normalized Difference Water Index,NDWI)、增強型植被指數(shù)(Enhanced Vegetation Index,EVI)、綠色歸一化差異植被指數(shù)(Green Normalized Difference Vegetation Index,GNDVI)、綠葉指數(shù)(Green Leaf Index,GLI)和優(yōu)化土壤調(diào)節(jié)植被指數(shù)(Optimization Soil-adjust Vegetation Index,OSAVI),各光譜指數(shù)在分類中的優(yōu)勢及作用如文獻[7]所述。
為避免多紋理特征帶來的特征信息冗余,依據(jù)Hall-beyer和Ulaby等研究結(jié)論,本研究選擇熵值(Entropy,ENT)、逆差矩(Inverse Difference Moment,IDM)、角二矩陣(Angular Second Moment,ASM)、方差(Variance,VAR)、對比度(Contrast,CONTRAST)、均值(Mean,MEAN)、相關(guān)性(Correlation,CORR)7個紋理特征變量,以上紋理特征可確保在較高分類前提下保留最大量原始信息。其計算公式詳見文獻[28],所選特征變量與相關(guān)植被指數(shù)計算公示如表2表示。
表2 特征變量及其計算公式 Table 2 Characteristic variable and their calculation formula
為確定開封市主要地表覆被類型,利用Google Earth地圖,在2021年2月15日到2021年4月12日大蒜生長期內(nèi)進行了實地調(diào)查及樣本采集工作。開封市農(nóng)田、道路、房屋、水體占地表覆被總面積90%左右,林地、園地覆被面積較少,占總面積的5.46%。故將主要的覆被類型分成6個大類,為建設(shè)用地、大蒜、冬小麥、水體、其他植被與其他用地。建設(shè)用地包含房屋、道路、廠礦等建筑用地,其他植被包括蔬菜、林草地、瓜田、果園等,其他用地囊括石料廠、裸土等。應(yīng)用中海達V30型GPS儀器進行實地采樣,共獲得4 922個樣本點,包括大蒜914個樣本點,冬小麥1 266個樣本點,其他用地745個樣本點,水體750個樣本點,建設(shè)用地894個樣本點,其他植被353個樣本點,其中田地采樣點均在大面積(邊長100 m以上)田塊中心采集。在較小樣本總量(小于1 000)及應(yīng)用RF算法時,訓(xùn)練集與驗證集的比例通常大于1,目的是為了使訓(xùn)練模型的穩(wěn)健性更高,便于提高分類精度。有關(guān)研究表明,基于面向?qū)ο蠓椒ê蛻?yīng)用RF算法時,過多的訓(xùn)練樣本數(shù)量(大于625)對總體分類精度的影響程度小于0.5%。本文依據(jù)實際樣本采集數(shù)量,并參照汪小欽等采用更多樣本數(shù)據(jù)量驗證分類精度的方法,將隨機選取的訓(xùn)練樣本數(shù)據(jù)集(總數(shù)1 339)和驗證數(shù)據(jù)集(總數(shù)3 278)比例設(shè)為1∶2,如表3所示,以應(yīng)用更多樣本采集點來驗證算法的有效性。
表3 樣本數(shù)據(jù)集 Table 3 Sample data sets
本研究在進行分類時選擇隨機森林(RF)算法,RF由多棵CART決策樹組合而成,屬于監(jiān)督分類機器學(xué)習(xí)算法。文獻[7、32]詳細介紹RF算法的原理與思想。相關(guān)研究表明RF算法相比其他機器學(xué)習(xí)算法訓(xùn)練效率與分類精度均有很好的表現(xiàn),GEE中提供的RF算法還可以同時確定輸入特征的權(quán)重,并對樣本數(shù)量和質(zhì)量的敏感度低而廣泛用于遙感影像數(shù)據(jù)的監(jiān)督分類中。RF算法需輸入兩個變量:特征變量個數(shù)和決策樹數(shù)量。輸入的特征變量個數(shù)在研究中固定不變,需要確定最佳的決策樹數(shù)數(shù)量。根據(jù)郭群佐等研究結(jié)果及多次試驗,分類時選取的決策樹數(shù)量為50。
主成分分析(PCA)法是對多波段圖像的原始空間乘以一個線性變換矩陣,重新產(chǎn)生新空間的過程。公式為
式中表示圖像的原始空間;表示線性變換;為變換后的新圖像空間。
簡單非迭代聚類(SNIC)算法基于SLIC算法改進而來,有效地提高了聚類效率。GEE中的“ee.Algorithms. Image.Segmentation.SNIC()”函數(shù)進行圖像分割和參數(shù)設(shè)置,該函數(shù)的主要參數(shù)有“image”、“size”、“compactness”、“connectivity”、“neighborhoodSize”和“seeds”。其中“image”是參與分割的圖像?!皊ize”是指基于像素的超像素種子位置間距,即分割大小,如設(shè)置有“seeds”,此參數(shù)可不設(shè)置參數(shù)?!癱ompactness”為分割后集群的規(guī)整程度,數(shù)值越大,分割結(jié)果越接近正方形,此處設(shè)置參數(shù)為0。“connectivity”為像元的鄰接性,為4鄰接性或者8鄰接性,文中選取8鄰接性?!皀eighborhoodSize”代表領(lǐng)域的尺寸,一般選取256?!皊eeds”為種子,即聚類中心,種子點分布越分散,分成的塊越大。
灰度共生矩陣(Gray-level Co-occurrence Matrix,GLCM)以像元的灰度和位置為研究對象,反映像素灰度關(guān)于方向、相鄰間隔、變化幅度等多維信息。GEE中,“glcmTexture()”是計算圖像GLCM紋理特征的函數(shù),該函數(shù)的主要參數(shù)包括“image”,“size”,“kernel”和“average”。其中“image”是分割圖像。“size”為計算像素的鄰域值,在計算中試驗4、8、16鄰域值?!発ernel”為計算中心像素的偏移量,“average”是對每個度量方向波段取平均值,兩者在程序中都不進行參數(shù)設(shè)置。GLCM從8位灰度圖像中提取角二階矩、對比度、相關(guān)性、熵、方差、反差分矩陣、能量、均值、和平均、和熵、和方差等14個紋理特征和差異性、慣性、集群陰影及群集突出物4個Haralick紋理特征。
為充分利用光學(xué)數(shù)據(jù)的光譜信息及減少所應(yīng)用每個波段的紋理信息計算量,Tassi等應(yīng)用近紅外波段(Near infrared band,NIR)、紅波段(Red band,R)和綠波段(Green band,G)的線性組合生成灰度圖像(Gray level image,Gray)來計算紋理特征,公式如下
考慮到開封市作物間作、套作種植模式,分類精度受地塊破碎度高造成的混合像元及像元噪點等影響。制圖精度、用戶精度、總體精度和Kappa系數(shù)用于評價文中分類器的性能,其詳細計算公式見文獻[37]。
作物生長是一個隨時間變化的連續(xù)過程,遙感數(shù)據(jù)獲取的是離散時間點的作物生長信息。光學(xué)數(shù)據(jù)是衛(wèi)星獲取目標地物的瞬時物理光譜特征,時序、動態(tài)的NDVI波動則體現(xiàn)植被不同生長階段的物候特征變化。Savizky-Golay(S-G)濾波算法能夠去除像元突變導(dǎo)致的NDVI污染。圖2表示研究區(qū)不同覆被采集點在大蒜物候期內(nèi)的均值NDVI,經(jīng)S-G濾波后的三次樣條插值曲線。大蒜屬耐寒蔬菜,物候特征曲線變化與冬小麥相似,一樣經(jīng)歷越冬期,受種植密度影響,大蒜相較冬小麥的NDVI值較低。2—3月溫度上升,相比其他植被,大蒜和冬小麥此階段生長較快,致使NDVI特征值差異值開始擴大。3—4月份為大蒜的花芽鱗莖分化初期,冬小麥處于拔節(jié)孕穗期,迅速上升的葉綠素含量導(dǎo)致兩者植被指數(shù)較高,與其他植被及其兩作物之間的NDVI值在此時差異最大。依據(jù)特征值差異與RF算法的分類精度呈正比例關(guān)系和避免云霧對大面積光學(xué)數(shù)據(jù)造成較大影響,研究選取2021年3月1日到3月31日期間Sentinel-2月均值合成光學(xué)數(shù)據(jù)。影像疊加可消除異常值和改善色差影響。在GEE中,含云量小于10%的數(shù)據(jù)主要在3月3日(2幅)和3月28日(5幅),共 7幅影像。通過“get('CLOUDY_PIXEL_PERCENTAGE')”函數(shù),輸出每幅Sentinel-2光學(xué)影像的含云量,3月3日分別為1.06%和1.93%,3月28日全部為0.00%,月均值合成圖像的含云量為0.00%。
圖2 不同覆被Savizky-Golay濾波NDVI三次樣條插值曲線 Fig.2 Different land cover NDVI curves with cubic spline interpolation under Savizky-Golay filter
具有穿透性的SAR傳感器能夠獲取長時序的植被表面后向散射信息,且不受天氣因素影響。對于特定作物的識別研究,主要應(yīng)用該作物與其他覆被類型在不同物候期的生長結(jié)構(gòu)、光譜特征差異進行目標識別。時序的后向散射信息對植被的葉、莖、枝干等結(jié)構(gòu)信息變化有一定的反映。圖3表示開封市大蒜生長周期內(nèi),不同時期、不同覆被類型采樣點的VV、VH極化雷達后向散射系數(shù)均值經(jīng)S-G濾波后的三次樣條插值曲線。大蒜的VH后向散射系數(shù)在整個生長周期內(nèi)高于冬小麥,而VV后向散射系數(shù)在大蒜幼苗期前存在一定的交叉,后期兩者出現(xiàn)分離,但大蒜整體的VV極化后向散射系數(shù)高于冬小麥。將SAR后向散射系數(shù)在月尺度上進行均值合成后,能夠降低土壤水分含量對分類精度的影響,有利于提高作物的分類精度。綜上因素,研究選取大蒜生長期內(nèi)2020年11月到2021年5月的Sentinel-1 SAR數(shù)據(jù),在月尺度上進行均值合成,用于大蒜提取研究。
圖3 不同覆被Savizky-Golay濾波VH、VV極化雷達后向散射系數(shù)三次樣條插值曲線 Fig.3 Different land cover VH、VV backscattering coefficient curves with cubic spline interpolation under Savizky-Golay filter
影像的分割尺度直接決定了某一目標地物的尺度,即分割后對象的平均大小需和識別的地物尺度大小相一致。分割尺度相同時,影像分辨率越高,分割后地物細節(jié)、輪廓體現(xiàn)越明顯。研究選取較低的分辨率影像確定大致分割尺度范圍。圖4為20 m分辨率光學(xué)影像在1、5、10、15分割尺度下的分割特征。分割尺度為1時,分割結(jié)果整體呈現(xiàn)塊狀,無覆被細節(jié)、邊界等任何信息,不予使用。分割尺度大于1小于10內(nèi),分割特征與實際地類細節(jié)、邊緣較為吻合。
圖4 SNIC不同分割尺度結(jié)果 Fig.4 SNIC different segmentation scale results
空間分辨率越高,紋理特征細節(jié)體現(xiàn)越明顯。文中選取較高分辨率影像確定GLCM紋理特征鄰域值。圖5表示10 m分辨率合成波段GLCM紋理特征鄰域值為4、8、16時,紋理特征PC1、PC2(the second principal component)、PC3(the third principal component)主成分合成的真彩色影像。GLCM算法的鄰域值為4時,地物細節(jié)體現(xiàn)明顯,更加適合面向?qū)ο蠓椒ǖ姆诸愌芯?。其原因是開封市破碎地塊像素變化不規(guī)律,導(dǎo)致GLCM計算紋理特征的鄰域值選擇較大時,更多的周圍像素參與計算,導(dǎo)致紋理特征細節(jié)體現(xiàn)較差。
圖5 不同鄰域值的GLCM紋理特征 Fig.5 GLCM texture features of different neighborhood values
研究首先應(yīng)用10 m分辨率的極化特征、光譜特征(R、G、B、NIR)、植被指數(shù)特征與不同的紋理特征主成分組合,進行大蒜識別研究。在上節(jié)研究結(jié)果中,GLCM鄰域值選取4,SNIC分割尺度選擇2到9進行試驗。10 m分辨率Sentinel主被動遙感數(shù)據(jù)的不同分割尺度與特征組合的分類總體精度、Kappa系數(shù)、大蒜制圖精度、大蒜用戶精度如表4所示。
從表4中可以得出,10 m分辨率的Sentinel主被動遙感數(shù)據(jù)分割尺度為5時,添加紋理特征能夠提升分類的總體精度和Kappa系數(shù),且紋理特征選取PC1(信息量:95.56%)、PC2(The Second Principal Component)(信息量:4.19%)主成分時,總體分類精度和Kappa系數(shù)最高,達到94.54%和0.93。分割尺度低于5或大于5時,添加紋理特征未體現(xiàn)明顯規(guī)律。大蒜的制圖精度在分割尺度為7,紋理特征為PC1時最高,達到97.53%;大蒜用戶精度則在分割尺度為6,無紋理特征的情況下最高,達到99.49%。在有關(guān)影像分割的研究中,多尺度分割成為當前的研究熱點。開封市大蒜在杞縣、開封市西部以及蘭考縣南部大規(guī)模種植,而在其他地區(qū)則與冬小麥交叉或零星種植,且種植地塊細小、狹長。在進一步提取大范圍的大蒜識別中,將依據(jù)研究區(qū)提取對象的空間分布使用多尺度分割方法。本研究主要目的是在合適分割尺度下,探究融合數(shù)據(jù)的面向?qū)ο蠓椒ㄔ谧R別大蒜方面優(yōu)勢。
表4 不同分割尺度的分類結(jié)果 Table 4 Classification results of different segmentation scales
依據(jù)最高分類總體精度和Kappa系數(shù),研究中分割尺度選擇5,紋理特征選取PC1、PC2主成分,其詳細分類情況如表5和圖6、7、8所示。大蒜的制圖精度和用戶精度分別達到97.83%、96.38%;同樣,良好的分類算法及其分割尺度、紋理特征的優(yōu)化,冬小麥的制圖精度和用戶精度達到93.05%和99.88%。可見,應(yīng)用融合Sentinel主被動遙感數(shù)據(jù)可有效分離出具有相同或重疊生長周期的不同作物,但對其他植被的識別精度較低。其原因是開封市其他植被所占比例較小,應(yīng)用10 m分辨率時,可能占據(jù)不到一個像元,或者與農(nóng)村低矮建筑物構(gòu)成混合像元,造成識別精度較低。此時,應(yīng)結(jié)合植被的物候特征,使用可以體現(xiàn)作物生長-衰老交替的多時相光學(xué)遙感信息,提升混合像元、破碎地塊及其邊界的識別精度,削弱或避免“同物異譜”和“異物同譜”現(xiàn)象,但該方法易受光學(xué)數(shù)據(jù)缺乏影響。
圖6 10 m分辨率Sentinel主被動遙感數(shù)據(jù)及其分類結(jié)果 Fig.6 10 m resolution Sentinel active and passive remote sensing data and its classification results
表5 融合10 m分辨率Sentinel主被動遙感數(shù)據(jù)分類結(jié)果 Table 5 The classification result of integrating 10 m resolution Sentinel active and passive remote sensing data
RF算法能夠獲取每個特征變量的相對特征權(quán)重,在遙感分類中對各特征變量具有較好的可解釋性。其原理是將某特征變量數(shù)值作為隨機數(shù),計算它對模型準確率的影響,依據(jù)精度減少值來計算這一特征變量的權(quán)重,值越大說明該特征對分類結(jié)果貢獻的權(quán)重越大。特征變量權(quán)重值的總和大小由變量的數(shù)目決定,其權(quán)重值的大小在自身變量組中具有相對意義。在GEE平臺中可通過“explain()”函數(shù)輸出各輸入特征變量的權(quán)重值,如表6所示。
表6 10 m分辨率特征變量權(quán)重值 Table 6 Feature variable weight values of 10 m resolution
紋理特征PC1、PC2的特征權(quán)重小于其他所有特征權(quán)重,雖兩者包含紋理特征信息量不同,但兩者權(quán)重值相差僅為0.06,具體原因有待進一步挖掘。光學(xué)數(shù)據(jù)的權(quán)重和(286.29)小于時序SAR數(shù)據(jù)的權(quán)重和(330.02)。為進一步探究其原因,單獨使用光學(xué)或SAR數(shù)據(jù)進行各地物分類,結(jié)果如表7所示。從表中發(fā)現(xiàn),時序SAR數(shù)據(jù)對大蒜的制圖精度和用戶精度分別高于單期光學(xué)數(shù)據(jù)1.98百分點和1.50百分點。但對于冬小麥,光學(xué)數(shù)據(jù)的用戶精度較高,制圖精度較低。同樣,單獨或融合使用Sentinel主被動遙感數(shù)據(jù),對其他植被的識別精度仍然較低。在后期研究中,使用多期光學(xué)數(shù)據(jù)結(jié)合地物的物候特征、像元分割技術(shù)或更高分辨率的光學(xué)數(shù)據(jù)等多種方法進行其他植被的識別研究。對比表5和表7,融合Sentinel主被動遙感數(shù)據(jù)后,其總體分類精度分別高于單一光學(xué)數(shù)據(jù)或時序SAR數(shù)據(jù)1.77%和5.28%,Kappa系數(shù)分別高于兩者0.021 7和0.065 2,大蒜制圖精度分別高于兩者3.92%和1.94%,大蒜用戶精度分別高于兩者2.31%和0.81%。綜上,融合Sentinel主被動遙感數(shù)據(jù)對大蒜的識別精度高于單獨使用光學(xué)和時序SAR數(shù)據(jù)的識別精度,10 m分辨率時序SAR數(shù)據(jù)總體分類精度和Kappa系數(shù)低于光學(xué)的,但對大蒜的識別精度較高。
圖8 b區(qū)域遙感數(shù)據(jù)及分類結(jié)果 Fig.8 b region remote sensing data and classification results
表7 10 m分辨率光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù)單獨分類結(jié)果 Table 7 The classification results of optical and time series SAR data of 10 m resolution
為研究低空間分辨率、高光譜分辨率得Sentinel主被動遙感數(shù)據(jù)對大蒜的識別精度,選用20 m分辨率的極化特征、光譜特征(R、G、B、NIR、VRE5、VRE6、VRE7)、植被指數(shù)特征與不同的紋理特征組合,基于面向?qū)ο蠓椒ㄟM行大蒜識別研究。GLCM鄰域值同樣選取4,SNIC分割尺度選擇2到9進行試驗。20 m分辨率Sentinel主被動遙感數(shù)據(jù)的不同分割尺度和特征組合的分類總體精度、Kappa系數(shù)、大蒜制圖精度、大蒜用戶精度如表8所示。
從表8中發(fā)現(xiàn),20 m分辨率的Sentinel主被動遙感數(shù)據(jù)分類總體精度和Kappa系數(shù)在不同特征組合內(nèi),分割尺度的增加,兩者呈下降趨勢,且分割尺度(2到9)與兩者的最低相關(guān)系數(shù)分別為-0.81和-0.66。當融合主被動遙感數(shù)據(jù)的分割尺度為3,選取紋理特征PC1(信息量:67.15%)、PC2(信息量:28.81%)時,分類總體精度和Kappa系數(shù)最高,達到94.14%和0.92,詳細分類情況如表9和圖9所示。此時,大蒜的制圖精度和用戶精度分別為95.72%和98.81%,相對于融合10 m分辨率的數(shù)據(jù)分類結(jié)果,大蒜制圖精度精度降低2.11%,用戶精度則提升2.43%;但分類總體精度和Kappa系數(shù)分別降低0.40和0.004 9。相對單獨使用10 m分辨率的光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù),融合20 m分辨率數(shù)據(jù)的分類總體精度分別提升1.37%和4.88%,Kappa系數(shù)分別提升0.016 8和0.060 3;大蒜的制圖精度分別提升1.81%和降低0.17%,用戶精度則分別提升4.74%和3.24%;同樣對冬小麥的識別精度也達到91%以上。對比GF數(shù)據(jù)和圖7、圖9的碎部a區(qū)域分類結(jié)果,高光譜分辨率數(shù)據(jù)能夠識別圖9中a區(qū)域存在的大蒜。可見,高光譜分辨率數(shù)據(jù)在識別同生長周期作物具有較強優(yōu)勢。綜上結(jié)果,融合多光譜數(shù)據(jù)雖空間分辨率相對較低,但在大宗、經(jīng)濟作物提取中仍占優(yōu)勢,對于占地面積小、破碎程度高的其他植被,提取效果同樣較差。
圖7 a區(qū)域遙感數(shù)據(jù)及分類結(jié)果 Fig.7 a region remote sensing data and classification results
圖9 20 m分辨率Sentinel主被動遙感數(shù)據(jù)及其分類結(jié)果 Fig.9 Sentinel active and passive remote sensing data and its classification results of 20 m resolution
表8 不同分割尺度的分類結(jié)果 Table 8 Classification results of different segmentation scales
表9 融合20 m分辨率Sentinel主被動遙感數(shù)據(jù)分類結(jié)果 Table 9 The classification result of integrating 20 m resolution Sentinel active and passive remote sensing data
為探究20 m分辨率融合Sentinel主被動遙感數(shù)據(jù)紅邊波段在分類中的重要性,表10表示各變量的特征權(quán)重。從數(shù)值上得出B5、B6、B7的權(quán)重和(72.73)占整體權(quán)重(676.31)的10.75%,在分類中起重要作用。極化數(shù)據(jù)的權(quán)重和(314.88)低于光學(xué)數(shù)據(jù)的權(quán)重和(361.43)。表11表示20 m分辨率的光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù)的單獨分類結(jié)果。光學(xué)數(shù)據(jù)的分類總體精度和Kappa系數(shù)分別高于時序SAR數(shù)據(jù)6.22%和0.077 4。但20 m多光譜光學(xué)數(shù)據(jù)相對10 m的光學(xué)數(shù)據(jù),分類總體精度和Kappa系數(shù)分別提高1.34%和0.016 6,大蒜制圖精度和用戶精度分別提高0.49%和4.38%??梢?,應(yīng)用Sentinel-2光學(xué)數(shù)據(jù)在大蒜提取中,光譜分辨率占據(jù)優(yōu)勢。而時序SAR數(shù)據(jù)10 m分辨率的分類總體精度和Kappa系數(shù)高于20 m分辨率時序SAR數(shù)據(jù)的1.37%和0.017 3,大蒜制圖精度和用戶精度分別提高0.66%和2.03%。使用Sentinel-1時序SAR數(shù)據(jù)進行大蒜提取時,空間分辨率占據(jù)優(yōu)勢。
表10 20 m分辨率特征變量權(quán)重值 Table 10 Feature variable weight values of 20 m resolution
對比表9和表11,融合Sentinel主被動遙感數(shù)據(jù)總體分類精度分別高于光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù)0.03%和6.25%,Kappa系數(shù)分別高于兩者0.000 2和0.077 6,大蒜制圖精度分別高于兩者1.32%和0.49%,大蒜用戶精度分別高于兩者0.36%和5.27%。綜上,融合20 m分辨率Sentinel主被動遙感數(shù)據(jù)對大蒜的識別精度高于單獨使用光學(xué)或時序SAR數(shù)據(jù)的識別精度;20 m分辨率時序SAR數(shù)據(jù)總體分類精度和Kappa系數(shù)低于光學(xué)的,對大蒜的識別精度也相對較低。
表11 20 m分辨率光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù)分類結(jié)果 Table 11 The classification results of optical and time series SAR data of 20 m resolution
本文基于GEE云平臺、面向?qū)ο蠓椒ê蚏F算法,應(yīng)用10 m高空間分辨率和20 m高光譜分辨率的融合Sentinel主被動遙感數(shù)據(jù),通過最高分類總體精度和Kappa系數(shù),篩選不同融合數(shù)據(jù)的SNIC算法最佳分割尺度,對比分析各融合數(shù)據(jù)不同特征變量組合對開封市大蒜識別精度的影響程度,得到如下結(jié)論:
1)使用10 m高空間分辨率或20 m高光譜分辨率的融合Sentinel主被動遙感數(shù)據(jù),充分利用不同覆被的光譜信息和結(jié)構(gòu)信息,大蒜的制圖精度和用戶精度均高于單獨使用該分辨率的光學(xué)數(shù)據(jù)和時序SAR數(shù)據(jù);融合10 m高空間分辨率的主被動遙感數(shù)據(jù)分類總體精度和Kappa系數(shù)最高,達到94.54%和0.93。
2)在種植結(jié)構(gòu)復(fù)雜區(qū)域,無法獲取大蒜生長期周期內(nèi)光學(xué)影像時,10 m分辨率的多時相Sentinel-1 SAR數(shù)據(jù)可代替光學(xué)影像進行大蒜的提取工作。而單獨使用Sentinel-2光學(xué)數(shù)據(jù)進行大宗、經(jīng)濟作物識別時,建議選取20 m分辨率的高光譜光學(xué)數(shù)據(jù)。
3)文中采用的SNIC、GLCM、PCA方法及其參數(shù)的確定,對提取相同或重疊生長周期的作物有一定的指導(dǎo)意義。特別是河南焦作市的“四大懷藥”與秋季作物花生、玉米在作物生長周期上重疊,增加光學(xué)數(shù)據(jù)的提取難度。在進一步經(jīng)濟作物識別研究中,嘗試應(yīng)用該方法提取“四大懷藥”種植范圍。
本研究在Windows10系統(tǒng)、i7-9700K處理器、Nvidia GeForce-RTX-2060顯卡和64 G內(nèi)存下運行GEE,計算開封市6 444 km的每個結(jié)果總體耗時大約為6分鐘,相比于傳統(tǒng)的影像下載、大氣校正、幾何校正、拼接、裁剪等耗時幾天的人工處理流程,GEE顯著提高數(shù)據(jù)計算分析效率。高分三號SAR衛(wèi)星于2016年8月發(fā)射,結(jié)合更高分辨率的高分系列光學(xué)數(shù)據(jù),本研究可為高分數(shù)據(jù)提取破碎地塊大蒜研究提供理論依據(jù)。本文僅討論了使用單時相的Sentinel-2光學(xué)數(shù)據(jù),未處理“異物同譜”的像元對面向?qū)ο蠓诸惥鹊挠绊?。在后期的研究中,進一步探究應(yīng)用多時相光學(xué)數(shù)據(jù)或混合像元分解方法對分類精度的影響。