潘 競(jìng),艾尼玩·艾買(mǎi)爾,阿斯婭·曼力克,阿 仁,田 聰,馬海燕,孫宗玖,鄭逢令*
(1.新疆農(nóng)業(yè)大學(xué)草業(yè)學(xué)院,烏魯木齊 830052;2.新疆畜牧科學(xué)院草業(yè)研究所,烏魯木齊 830057;3.新疆畜牧科學(xué)院天山北坡草地生態(tài)環(huán)境野外定位觀測(cè)研究站,烏魯木齊 830057)
小麥?zhǔn)乾F(xiàn)今世界上最主要的經(jīng)濟(jì)作物,在全世界其重要性僅次于稻米,同時(shí)也是我國(guó)主要的作物之一,在中國(guó)糧食生產(chǎn)和保障糧食安全方面占有舉足輕重的地位[1]。因此開(kāi)展小麥耕地的識(shí)別有助于政府有關(guān)部門(mén)指導(dǎo)農(nóng)業(yè)生產(chǎn)活動(dòng),估計(jì)產(chǎn)量,優(yōu)化調(diào)整農(nóng)業(yè)結(jié)構(gòu),確保糧食安全[2]。對(duì)于農(nóng)作物識(shí)別及長(zhǎng)勢(shì)信息采集的傳統(tǒng)農(nóng)業(yè)調(diào)查法缺少精確的作物空間分布信息,調(diào)查數(shù)據(jù)的質(zhì)量往往易受到人為因素的影響[3],因而缺乏客觀性。遙感能夠在廣泛的地理區(qū)域獲取數(shù)據(jù),可以為監(jiān)測(cè)小麥的種植信息提供快速又準(zhǔn)確的數(shù)據(jù)源。田間秸稈廢棄物是指糧食作物收割后殘留在田里的殘余物料,它對(duì)耕地生態(tài)系統(tǒng)具有很大危害。新疆小麥、玉米、棉花等的秸稈廢棄物,都是草食家畜飼草料重要的來(lái)源。正確評(píng)價(jià)可利用秸稈資源量與分布是秸稈雜物資源化綜合利用的基礎(chǔ)。在農(nóng)業(yè)生產(chǎn)規(guī)劃或管理決策過(guò)程中,草谷比是估算不同種類、不同地域大田作物秸稈資源量的重要且較快捷可行的方式[4],遙感等空間技術(shù)有快速在大范圍實(shí)現(xiàn)作物分類并估算作物秸稈產(chǎn)量的潛力,但國(guó)內(nèi)相關(guān)研究報(bào)道較少,國(guó)外利用遙感和GIS 等技術(shù)調(diào)查秸稈資源主要是服務(wù)于生物質(zhì)能源的開(kāi)發(fā)利用[5,6]。
遙感應(yīng)用的各種衛(wèi)星圖像采集和數(shù)據(jù)挖掘方法相對(duì)比較成熟,能夠有效地服務(wù)于多種農(nóng)業(yè)應(yīng)用場(chǎng)景,如產(chǎn)量預(yù)測(cè)、作物類型識(shí)別、雜草分類等[7~9]。近年來(lái)高分辨率衛(wèi)星可以在較小的空間尺度上獲得更高的空間和時(shí)間分辨率數(shù)據(jù)。遙感數(shù)據(jù)可以通過(guò)光學(xué)、雷達(dá)、紅外等各種傳感器采集[10],使得遙感衛(wèi)星能夠采集的數(shù)據(jù)類型越來(lái)越豐富。遙感圖像處理技術(shù)不斷有新突破,分類方法朝著自動(dòng)化、智能化方向發(fā)展。Gulsen等[11]提出一種線性SVM和支持向量的混合模型可以有效地實(shí)現(xiàn)遙感圖像分類。Bruno 等[12]使用Landsat 8 傳感器的多時(shí)間光譜信息,提出了一種結(jié)合多分辨率分割和隨機(jī)森林(Random Forests)分類的方法,實(shí)現(xiàn)巴西東南部農(nóng)業(yè)地區(qū)的五種作物自動(dòng)分類。與常規(guī)的地面遙感研究方法比較,谷歌地球引擎(Google Earth Engine,GEE)優(yōu)點(diǎn)更明顯,可以迅速獲得大范圍的高分辨率圖像信號(hào)。目前Google Earth Engine云平臺(tái)己經(jīng)廣泛應(yīng)用于多個(gè)學(xué)科領(lǐng)域,如:植被制圖與監(jiān)測(cè)[13]、農(nóng)業(yè)應(yīng)用[14]、土地利用(覆蓋研究)。
本研究以Google earth engine 為平臺(tái),采用Sentinel-1 雷達(dá)影像、Sentinel-2 多光譜影像為主要數(shù)據(jù)源,使用三種機(jī)器學(xué)習(xí)算法進(jìn)行小麥作物的遙感分類,通過(guò)精度評(píng)價(jià)選擇出最優(yōu)的數(shù)據(jù)源以及機(jī)器學(xué)習(xí)算法。結(jié)合地面的實(shí)測(cè)產(chǎn)量來(lái)估算奇臺(tái)縣小麥秸稈資源的存量和分布。利用遙感技術(shù)可以更直觀有效地對(duì)農(nóng)作物種植面積和產(chǎn)量進(jìn)行識(shí)別和估算,為行業(yè)管理部門(mén)監(jiān)督指導(dǎo)農(nóng)業(yè)活動(dòng)提供基礎(chǔ)數(shù)據(jù)。
奇臺(tái)縣地處中國(guó)新疆東北部,東西橫間隔約150 km,南北縱線約250 km。由南向北地理環(huán)境特殊,地形地貌錯(cuò)綜復(fù)雜,地形北部高,中部較低,呈馬鞍狀,屬于中溫帶大陸性半荒漠干旱性氣候,主要栽培農(nóng)作物有小麥、玉米、西瓜、西葫蘆和甜菜。通常在4至5月播種,8至9月收獲[1],見(jiàn)表1。
表1 奇臺(tái)縣主要農(nóng)作物物候期
樣本數(shù)據(jù)采用戶外實(shí)地調(diào)查數(shù)據(jù),采集時(shí)間6月、7月與小麥關(guān)鍵物候期接近。野外實(shí)測(cè)數(shù)據(jù)中分別調(diào)查了小麥、玉米、西葫蘆、西瓜、甜菜等11 種農(nóng)作物田地、林地及裸地,樣地?cái)?shù)據(jù)共1 075 塊。其中小麥的樣本選取有302塊,玉米的樣本選取有356塊,西葫蘆的樣本選取有190塊。本次分類只選取在研究區(qū)中農(nóng)作物種植面積較大的前五種作物作為樣本點(diǎn)。同時(shí)在GEE 平臺(tái)上使用人工目視的方法在線選取水體、建筑物、道路、撂荒地(戈壁)和林(草)地塊[3],見(jiàn)表2。在樣地塊中隨機(jī)選擇70%的樣品數(shù)據(jù)作為訓(xùn)練樣本,另外30%為驗(yàn)證樣本,用以判斷分析及驗(yàn)證結(jié)論的可靠性。
表2 樣本地塊數(shù)據(jù)統(tǒng)計(jì)
1.2.1 Sentinel-1數(shù)據(jù)
本研究采用谷歌地球引擎(GEE)系統(tǒng)開(kāi)展信息收集與管理。通過(guò)Sentinel-1工具箱對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理。預(yù)處理過(guò)程涉及輻射校正、消除熱噪聲以及地形修正。針對(duì)本次研究,使用了Sentinel-1中的干涉寬幅模式(IW)的地距多視圖像方式作為數(shù)據(jù)源,該圖像方式包括了VV 極化和VH 偏振的雙極化模式。為了消除Sentinel-1 數(shù)據(jù)集中的斑點(diǎn)噪聲,使用了改進(jìn)的Lee 濾波器[15]來(lái)過(guò)濾反向散射時(shí)間序列。
1.2.2 Sentinel-2數(shù)據(jù)
使用GEE 平臺(tái)獲取已經(jīng)經(jīng)過(guò)大氣校正的大氣底層反射率的哨兵L2A 級(jí)數(shù)據(jù),其中包括了所有10 m 和20 m 分辨率波段,波段為藍(lán)、綠、紅、紅邊1、紅邊2、紅邊3、紅邊4、近紅外(NIR)、短波紅外1(SWIR1)和短波紅外2(SWIR2)。并在GEE 中構(gòu)建了一個(gè)函數(shù),使用QA60 波段檢測(cè)和云掩蔽來(lái)獲得云量較少的Sentinel-2 圖像,見(jiàn)表3。
表3 遙感影像參數(shù)
為了防止其它土地覆蓋類型對(duì)作物識(shí)別造成影響,本研究在進(jìn)行作物分類時(shí),先通過(guò)歐空局的ESRI十米年度全球農(nóng)田覆蓋產(chǎn)品數(shù)據(jù)及掩膜耕地信息,得到研究區(qū)的Sentinel-2農(nóng)田圖像。在時(shí)間序列范圍內(nèi),最終共得到2022 年奇臺(tái)縣作物生育期內(nèi)云量較低(云量小于20%)的研究區(qū)合成影像共6幅,其中四月到五月1幅、五月到六月1幅、六月到八月2幅、八月2幅。
1.2.3 數(shù)據(jù)特征選取
1.2.3.1光譜波段 選擇了Sentinel-2衛(wèi)星波段(共13個(gè))中的9個(gè),主要涉及用于進(jìn)行土地覆蓋變化觀測(cè)、植被調(diào)查、陸表調(diào)查和環(huán)境監(jiān)測(cè)的波段,即B2、B3、B4、B5、B6、B7、B8、B8A和B11波段。
1.2.3.2植被指數(shù) 根據(jù)研究區(qū)域植物的生態(tài)環(huán)境與物候特征,可以選擇利用Sentinel-2影像的光譜反射率與相關(guān)植物指標(biāo)來(lái)幫助劃分,包含歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、增強(qiáng)植被指數(shù)(Enhanced Vegetation Index,EVI)、比值植被指數(shù)(Enhanced Vegetation Index,RVI)、歸一化差異紅邊植被指數(shù)(Normalized difference red edge,NDRE)。其公式如下:
其中,G:增益系數(shù),2.5;C1:Red波段氣溶膠阻抗系數(shù),6;C2:Blue波段氣溶膠阻抗系數(shù),7.5;L:冠層背景調(diào)整因子,1。
1.2.3.3 Sentinel-1 雙極化特征 光學(xué)遙感方法在農(nóng)作物的關(guān)鍵生長(zhǎng)期內(nèi)的參數(shù)信息獲取方面依然存在明顯的局限性,如可能受云雨天氣影響,導(dǎo)致光學(xué)遙感產(chǎn)品數(shù)據(jù)源無(wú)法保障。與之相比,雷達(dá)遙感不受光照、云雨等天氣條件的影響,合成孔徑雷達(dá)成像的分辨率不受距離影響,通過(guò)對(duì)多次雷達(dá)回波信號(hào)進(jìn)行處理,可生成高分辨率的成像結(jié)果。由于成像分辨率不隨距離變化,因此可以實(shí)現(xiàn)在遠(yuǎn)距離下的高精度成像[16]。加入Sentinel-1 數(shù)據(jù)VV、VH 雙極化特征用于對(duì)Sentinel-2 影像分類的補(bǔ)充。
首先通過(guò)GEE 平臺(tái)對(duì)遙感影像進(jìn)行篩查,以篩選出不到百分之十云量的合成影像。選擇了歐空局的ESRI十米年度全球農(nóng)田覆蓋產(chǎn)品數(shù)據(jù),掩膜出只包含農(nóng)田的研究區(qū)域數(shù)據(jù),然后將五種作物的樣本點(diǎn)導(dǎo)入三種機(jī)器學(xué)習(xí)分類器,通過(guò)比較光譜、極化波段和植被特性對(duì)作物空間分布提取的影響,篩選出最佳的分類模型,用確定最優(yōu)特征波段組合和機(jī)器學(xué)習(xí)算法來(lái)獲取研究區(qū)小麥等作物的分類數(shù)據(jù)。
1.3.1 機(jī)器學(xué)習(xí)監(jiān)督分類方法
決策樹(shù)、隨機(jī)森林和支持向量機(jī)是近年來(lái)遙感監(jiān)督分類最普遍使用的機(jī)器學(xué)習(xí)方法。
1.3.1.1 決策樹(shù) 決策樹(shù)(Classification And Regression Tree,CART)的影像分類過(guò)程是通過(guò)使用專家知識(shí)庫(kù)、數(shù)學(xué)計(jì)算和機(jī)器學(xué)習(xí)算法等方式收集信息并設(shè)定分類規(guī)則,通過(guò)這些規(guī)則進(jìn)行的。這些規(guī)則有助于算法對(duì)影像進(jìn)行分類,并自動(dòng)識(shí)別出不同的影像類型[17]。每個(gè)節(jié)點(diǎn)都是基于樣本屬性的判斷條件,通過(guò)這些條件進(jìn)行分支和決策,最終形成葉子節(jié)點(diǎn)代表的類別劃分。
1.3.1.2隨機(jī)森林 隨機(jī)森林分級(jí)計(jì)算是很有效的一種CART 決策樹(shù)機(jī)器教學(xué)方式,其本質(zhì)是對(duì)決策樹(shù)分級(jí)算法的改進(jìn)。該計(jì)算可以防止由于單棵決策樹(shù)所造成的過(guò)模型擬合現(xiàn)象[18],旨在小樣本容量情況下保證較好的穩(wěn)定性[19]。通過(guò)分析發(fā)現(xiàn),本研究設(shè)置準(zhǔn)確率最高的顆數(shù)樹(shù)的數(shù)量為110,其他參數(shù)設(shè)置為默認(rèn)值。
1.3.1.3 支持向量機(jī) 支持向量機(jī)(Support Vector Machine,SVM)由Cortes 和Vapnik 在1995 年提出,基于統(tǒng)計(jì)學(xué)方法理論的一種算法模型[20]。SVM 中的軟間隔概念可以應(yīng)用于農(nóng)作物分類中,解決線性不可分的問(wèn)題,從而能夠有效降低計(jì)算量。
1.3.2 精度評(píng)價(jià)方法
混淆矩陣是一種常用的分類結(jié)果評(píng)價(jià)方法,其主要作用是將分類結(jié)果與真實(shí)信息進(jìn)行比較,并將分類精度展示在矩陣中。基于混淆矩陣,其中總體分類精度和Kappa 系數(shù)應(yīng)用最廣泛。計(jì)算公式如下:
其中,n 是待劃分的樣本類別數(shù)目;X是混淆矩陣中第i 行第j 列的元素;OA 表示總體精度,k代表Kappa 系數(shù)。
為評(píng)價(jià)不同機(jī)器學(xué)習(xí)算法在復(fù)雜土地結(jié)構(gòu)制圖中的特性,將通過(guò)GEE 對(duì)奇臺(tái)縣遙感圖像光譜波段、極化波段以及對(duì)植被特征的九種綜合方案分別作出精度評(píng)估。通過(guò)表4 可得知,在不同方案下的RF 分類器的總體精度和Kappa 系數(shù)都是最高,總體精度和Kappa 系數(shù)依次是0.98 和0.97。以CART 算法為例,僅采用極化波段的方法總體精度為0.73,明顯低于使用其他波段特征的分類方案,但增加了植被特征之后將分類準(zhǔn)確度提高至0.86。另外,在采用了光譜和植被特征分類方案后,CART 和SVM 分類器的方法總體精度也都有所提高,比僅采用極化波段的方案總體準(zhǔn)確度也提升了0.12。表明在奇臺(tái)縣的小麥作物識(shí)別中,光譜特征和植被特征都對(duì)識(shí)別的精度有至關(guān)重要影響。盡管基于極化波段或植被特征方案的識(shí)別精度并不高,但它們對(duì)于進(jìn)一步提高識(shí)別精度也有促進(jìn)作用。
表4 基于不同分類方案的識(shí)別精度
將實(shí)地采集的地塊數(shù)據(jù)與使用最優(yōu)特征的三種分類器識(shí)別出的小麥結(jié)果進(jìn)行直觀對(duì)比,如圖1所示,效果最好的是使用RF 分類器的圖1(a),與圖1(b)、圖1(c)相比RF 分類器識(shí)別出的小麥地塊較為完整、邊緣清晰,與實(shí)地采集數(shù)據(jù)重合度最高、錯(cuò)分最少。而使用SVM 分類器的圖1(c)效果最差,錯(cuò)分最多。使用RF分類器和極化波段、光譜波段以及植被特征組合對(duì)小麥識(shí)別的效果最好。
圖1 三種不同分類器在相同特征條件下(極化波段+光譜波段+植被指數(shù))的識(shí)別結(jié)果
混淆矩陣如圖2 所示,可以看出用于精度驗(yàn)證的樣本共1 664 個(gè)像元,其中被正確分類的有1 636個(gè)像元,總體效果較好。因此對(duì)于本研究區(qū)的小麥識(shí)別,使用RF分類器和極化波段、光譜波段以及植被特征組合的結(jié)果最好。
圖2 最優(yōu)方案分類后的混淆矩陣
依據(jù)小麥生長(zhǎng)特點(diǎn)與五種作物NDVI 曲線(4 月初-8 月末)對(duì)比結(jié)果,小麥的關(guān)鍵物候期為四月末、六月初和七月末,分別對(duì)應(yīng)小麥出苗、抽穗和灌漿乳熟期,也是對(duì)小麥進(jìn)行遙感識(shí)別的最佳時(shí)期。因此,使用分類精度最高的RF 分類器和分類特征分別對(duì)這三個(gè)時(shí)期的耕地影像進(jìn)行提取,識(shí)別小麥的空間分布,是判斷小麥種植面積最佳提取時(shí)期的較好方式,見(jiàn)圖3。
圖3 植被指數(shù)時(shí)間序列曲線
為了對(duì)小麥3個(gè)生長(zhǎng)期內(nèi)識(shí)別效果進(jìn)行更深入的對(duì)比分析,采用指標(biāo)總體精度和Kappa 系數(shù)對(duì)此3 種分類結(jié)果進(jìn)行評(píng)價(jià)。在小麥三個(gè)關(guān)鍵生長(zhǎng)期中,抽穗期的識(shí)別精度最高,總體精度和Kappa系數(shù)分別為0.98 和0.97,比出苗期分別高出0.2 和0.1。灌漿乳熟期分類效果最差,總體精度僅為0.69,Kappa系數(shù)為0.61,見(jiàn)表5。說(shuō)明在小麥關(guān)鍵物候期條件下,基于RF分類器和波段特征可以在小麥抽穗期有效提取土地覆蓋信息,具有很好的地物分類識(shí)別效果。
表5 使用RF分類器對(duì)三個(gè)生長(zhǎng)期小麥的識(shí)別精度
在2022年7月末對(duì)已收獲的小麥地塊的秸稈產(chǎn)量進(jìn)行數(shù)據(jù)采集,在全縣分布的4個(gè)地塊中進(jìn)行了實(shí)測(cè)后取平均值得到小麥秸稈每公頃產(chǎn)量(干重)2 700 kg。將研究區(qū)小麥種植地塊識(shí)別后的數(shù)據(jù)導(dǎo)入Arcgis,計(jì)算小麥作物的種植面積為37 265 hm2,折算出奇臺(tái)縣小麥秸稈總產(chǎn)量100 615.5 t。
隨著遙感影像分辨率的不斷提高,對(duì)遙感影像處理的需求也在不斷增加,特別是在進(jìn)行大區(qū)域作物分類時(shí),需要對(duì)大量的影像數(shù)據(jù)進(jìn)行分析處理,這對(duì)本地電腦的硬件和性能提出了更高的要求。因此,越來(lái)越多的人選擇在云平臺(tái)上進(jìn)行影像數(shù)據(jù)的處理。可以將GEE 平臺(tái)中的遙感數(shù)據(jù)上傳至Google 云平臺(tái),利用其數(shù)百萬(wàn)服務(wù)器進(jìn)行并行處理,從而大幅縮短遙感影像處理所需的時(shí)間和數(shù)據(jù)處理成本。這一方式可有效提高遙感數(shù)據(jù)處理的效率,為相關(guān)領(lǐng)域的研究和應(yīng)用提供了更為便捷的支持[21]。本研究基于GEE 云平臺(tái),利用Sentinel1、2 影像通過(guò)編程迅速地調(diào)用并管理這些數(shù)據(jù),從而使原本本地計(jì)算平臺(tái)需要幾天甚至幾周時(shí)間的數(shù)據(jù)處理分析工作能夠在數(shù)小時(shí)內(nèi)完成,大大地提高了效率、降低了成本。
在特征選擇方面,本研究主要選擇Sentinel-2光學(xué)影像的光譜波段和植被指數(shù)。而SAR 數(shù)據(jù)與光學(xué)數(shù)據(jù)相比能提供更豐富的農(nóng)作物紋理信息,可以有效解決光學(xué)數(shù)據(jù)中“異物同譜”、“同物異譜”的現(xiàn)象,提高農(nóng)作物識(shí)別精度[22]。本研究中可以明顯發(fā)現(xiàn)雷達(dá)數(shù)據(jù)的導(dǎo)入對(duì)小麥分類精度有明顯的提升作用。
此外,本研究在對(duì)農(nóng)作物進(jìn)行戶外調(diào)查時(shí),盡管獲取的樣本量較大且具備代表性,但實(shí)地?cái)?shù)據(jù)空間分布不夠均勻,對(duì)植被類型識(shí)別結(jié)果存在一定的影響。因此,通過(guò)適當(dāng)增加農(nóng)作物樣方數(shù)量和農(nóng)作物樣方分布范圍,會(huì)在一定程度上提升農(nóng)作物樣本的多樣性、可靠性和連續(xù)性,同時(shí)將多源遙感數(shù)據(jù)融合,可以進(jìn)一步提高農(nóng)作物遙感分類的精確性和有效性。
本研究以Google earth engine 為平臺(tái),以奇臺(tái)縣域內(nèi)主要農(nóng)作物種植區(qū)域?yàn)檠芯繉?duì)象。采用Sentinel-1 雷達(dá)影像、Sentinel-2 多光譜影像為主要數(shù)據(jù)源,評(píng)價(jià)三種機(jī)器學(xué)習(xí)分類器的作物分類精度,對(duì)比不同特征組合的效果,并使用地面實(shí)測(cè)數(shù)據(jù)來(lái)估算小麥秸稈產(chǎn)量。結(jié)論如下:對(duì)于小麥作物分類,使用隨機(jī)森林分類器結(jié)合光譜波段、極化波段和植被特征識(shí)別精度最高,總體精度達(dá)到98%。對(duì)比小麥出苗期、抽穗期和灌漿乳熟期識(shí)別精度,其中以抽穗期的識(shí)別效果最佳。通過(guò)實(shí)地測(cè)產(chǎn)方法估算奇臺(tái)縣小麥秸稈總產(chǎn)量為100 615.5 t。