喬樹亭,葉回春,劉榮豪,郭安廷,張冰瑞,錢彬祥,魏鵬,黃文江
1.可持續(xù)發(fā)展大數(shù)據(jù)國際研究中心,北京 100094
2.中國科學(xué)院空天信息創(chuàng)新研究院,數(shù)字地球重點(diǎn)實(shí)驗(yàn)室,北京 100094
3.海南空天信息研究院,海南省地球觀測(cè)重點(diǎn)實(shí)驗(yàn)室,海南三亞 572029
4.太原理工大學(xué),水利科學(xué)與工程學(xué)院,太原 030024
5.中國礦業(yè)大學(xué)(北京),地球科學(xué)與測(cè)繪工程學(xué)院,北京 100083
我國既是糧食生產(chǎn)大國又是消費(fèi)大國,糧食安全不僅影響社會(huì)穩(wěn)定和經(jīng)濟(jì)發(fā)展,更關(guān)系國家長治久安[1]。三江平原位于黑龍江省東北部,不僅是我國黑土地寶貴資源的重要組成部分,還是我國糧食安全關(guān)鍵地區(qū)和優(yōu)質(zhì)商品糧基地[2]。然而,伴隨以可持續(xù)農(nóng)業(yè)生產(chǎn)和緩解大豆國際貿(mào)易壓力為目標(biāo)的作物輪作實(shí)踐,該地區(qū)的種植制度逐年發(fā)生了顯著變化[3]。缺乏高精度的年度作物分布圖,導(dǎo)致我們對(duì)耕地動(dòng)態(tài)和耕作制度變化的潛在驅(qū)動(dòng)因素的理解有一定的欠缺[4]。
目前隨著新獲得的中等分辨率衛(wèi)星圖像、新算法的發(fā)展和云計(jì)算基礎(chǔ)設(shè)施的融合,作物制圖取得了相當(dāng)大的進(jìn)展[5]。金翠等[6]以250 m 空間分辨率MODIS/NDVI 時(shí)間序列數(shù)據(jù)集為數(shù)據(jù)源,采用“分層非監(jiān)督分類法”得到三江平原土地覆蓋類型,但MODIS 數(shù)據(jù)由于其分辨率過低,混合像元的問題很難解決。王楠[7]使用250 m 空間分辨率的MODIS 遙感影像以及30 米空間分辨率的美國陸地資源衛(wèi)星Landsat 5 TM 影像進(jìn)行黑龍江省作物種植結(jié)構(gòu)提?。欢艊鞯萚8]使用Landsat TM 以及Landsat OLI 影像為主要數(shù)據(jù)源,刻畫三江平原農(nóng)作物種植結(jié)構(gòu)時(shí)空演變特征及規(guī)律,盡管與之前使用低分辨率MODIS 數(shù)據(jù)[9]的工作相比,Landsat 圖像可以提供更多的空間細(xì)節(jié),但16 天的重訪周期無法輕易地分離不同的作物種類,從而限制了所得影像分類的準(zhǔn)確性[10-11]。Sentinel-2 衛(wèi)星攜帶多光譜成像儀共13 個(gè)波段,其中4 個(gè)波段的分辨率為10 m,6 個(gè)波段分辨率為20 m,3 個(gè)波段的分辨率為60 m,光譜覆蓋范圍從可見光到近紅外至短波紅外,并以5 天的間隔提供圖像[12],這為地塊級(jí)別的作物特定監(jiān)測(cè)開辟了一條全新的途徑。10 m 至20 m 的空間分辨率可以描述不同地區(qū)的各類田塊,相對(duì)較短的重訪周期可以提供與各個(gè)作物類型相關(guān)的更詳細(xì)的物候信息[13]。此外,Sentinel-2 衛(wèi)星包括幾個(gè)紅邊波段,已被證明是區(qū)分玉米和大豆的有效手段。因此,在東北地區(qū)的三江平原主要作物制圖上使用長時(shí)序的Sentinel-2 圖像是當(dāng)前分類研究的重點(diǎn)[14]。
本文以三江平原為研究區(qū),利用時(shí)間序列的Sentinel-2 衛(wèi)星遙感數(shù)據(jù),結(jié)合三江平原地面實(shí)地典型地物調(diào)查數(shù)據(jù),篩選主要農(nóng)作物及周邊典型地物的特征波段,采用隨機(jī)森林分類算法,提取了2020–2022 年三江平原主要農(nóng)作物(水稻、玉米和大豆)種植分布遙感監(jiān)測(cè)數(shù)據(jù)集。本數(shù)據(jù)集不但在分類像元精度上相較于其他數(shù)據(jù)集得到了大幅度提升,而且總體分類精度相較于使用MODIS[6,9]與Landsat 系列衛(wèi)星[7-8]也有明顯進(jìn)步,通過連續(xù)三年的實(shí)地樣本考察也保證了作物分類的準(zhǔn)確性。可以作為三江平原農(nóng)作物種植格局時(shí)空變化分析的基礎(chǔ)數(shù)據(jù),同時(shí)也為三江平原農(nóng)業(yè)生產(chǎn)管理決策提供信息支撐,服務(wù)區(qū)域農(nóng)業(yè)信息化建設(shè)以及黑土地保護(hù)與利用。
本文所用數(shù)據(jù)為2020–2022 年Sentinel-2(S2)多光譜衛(wèi)星(MSI)圖像(2A 級(jí)),來自Google Earth Engine(GEE)平臺(tái)(https://code.earthengine.google.com/)。根據(jù)GEE 平臺(tái)上官方發(fā)布的Sentinel-2 影像數(shù)據(jù)說明,Sentinel-2 遙感影像產(chǎn)品等級(jí)包括1C 級(jí)和2A 級(jí),其中2A 級(jí)數(shù)據(jù)是已經(jīng)經(jīng)過大氣校正的大氣底部反射數(shù)據(jù)可以直接運(yùn)用到本研究中。
三江平原主要農(nóng)作物的地面樣本點(diǎn)主要通過2020–2022 年野外現(xiàn)場調(diào)查,并結(jié)合多時(shí)相的Google Earth 高分辨率影像數(shù)據(jù)獲取。地物類型共分為四類:水稻、玉米、大豆及其他地物,由于除三種作物以外的其他地物(比如水體、山體和建筑)等地物類型一般不會(huì)隨著年份產(chǎn)生明顯變化,所以三年樣本點(diǎn)中的其他地物樣本點(diǎn)皆為相同樣本點(diǎn)。其中,2020 年包含水稻樣本點(diǎn)502 個(gè)、玉米樣本點(diǎn)300 個(gè)、大豆樣本點(diǎn)300 個(gè)、其他地物樣本點(diǎn)1308 個(gè);2021 年水稻樣本點(diǎn)470 個(gè)、玉米樣本點(diǎn)630 個(gè)、大豆樣本點(diǎn)361 個(gè),其他地物樣本點(diǎn)同上;2022 年水稻樣本點(diǎn)585 個(gè)、玉米樣本點(diǎn)302個(gè)、大豆樣本點(diǎn)311 個(gè),其他地物樣本點(diǎn)同上(圖1 為2020–2022 三年樣本點(diǎn)分布圖)。以上所有樣本點(diǎn)按3:1 的比例分為訓(xùn)練樣本以及驗(yàn)證樣本。
圖1 2020–2022 年三江平原典型地物實(shí)地調(diào)查樣點(diǎn)分布圖Figure 1 Distribution of typical ground objects in Sanjiang Plain from 2020 to 2022.
1.2.1 衛(wèi)星數(shù)據(jù)處理
本方法選用2020–2022 年Sentinel-2(S2)多光譜衛(wèi)星(MSI)圖像(2A 級(jí))。以往研究已經(jīng)證明了2A 級(jí)數(shù)據(jù)在圖像分類上的可靠性,最近多年的許多研究已經(jīng)證明Sentinel-2 對(duì)于水稻、玉米、大豆三種作物的可靠監(jiān)測(cè)[15-16]。以下為對(duì)于Sentinel-2 衛(wèi)星數(shù)據(jù)預(yù)處理過程:
(1)考慮到云在所有可見帶中都是潮濕的,使用四個(gè)波段(氣溶膠、藍(lán)色、綠色和紅色波段)和兩個(gè)光譜指數(shù)(歸一化差值水分指數(shù)NDMI 和歸一化差雪指數(shù)NDSI)計(jì)算云含量并檢測(cè)S2 數(shù)據(jù)的云[17]。兩種指數(shù)的計(jì)算公式如(1)(2)所示:
式中,NIR為近紅外波段,MIR為中紅外波段,GREEN為綠波段,SWIR1為短波紅外波段。
(2)用有效S2 觀測(cè)值的中值生成10 天復(fù)合數(shù)據(jù);
(3)通過線性插值來填補(bǔ)數(shù)據(jù)缺口,以實(shí)現(xiàn)整個(gè)時(shí)間域的完全覆蓋;
(4)使用Savitzky-Golay(SG)濾波器平滑10 天時(shí)間序列數(shù)據(jù)。在本數(shù)據(jù)集中,我們使用70天的窗口大小和三階多項(xiàng)式。
最終得到基于整個(gè)生長季規(guī)則的無云和間隙填充的10 天S2 時(shí)間序列影像共18 幅。
1.2.2 特征選取
主要通過前人的研究以及基于Google Earth Engine 對(duì)各類地物選取不同特征波段進(jìn)行分析,最終選取B8[16]、B11[16]、B12[16]、EVI(增強(qiáng)型植被指數(shù))[18]、NDVI(歸一化植被指數(shù))[19]、LSWI(地表水分指數(shù))[20]、NDSI(歸一化雪蓋指數(shù))[21]、NDSVI(歸一化耕種指數(shù))[22]、NDTI(歸一化溫差指數(shù))[23]、NDWI(歸一化差分水體指數(shù))[23]、RENDVI(改進(jìn)歸一化植被指數(shù))[24]、REP(紅邊位置指數(shù))[24]為每幅影像的特征波段(篩選過程如圖1 所示),計(jì)算公式如(3)–(10)所示:
式中,RED為紅波段,GREEN為綠波段,BLUE為藍(lán)波段,NIR為近紅波段,SWIR1 是中心波長為1613.7 的短波紅外波段,SWIR2 是中心波長為2202.4 的短波紅外波段,RE1 為中心波長為704.1的紅邊波段,RE2 為中心波長為740.5 的紅邊波段,RE3 為中心波長為782.8 的紅邊波段。
綜上計(jì)算共18 幅10 天時(shí)間序列合成影像,共計(jì)216 個(gè)特征,特征過多在分類過程中容易造成冗雜的現(xiàn)象,所以通過Google Earth Engine 中隨機(jī)森林分類器自帶的重要性排序功能篩選特征波段,將重要性排名前15 的特征波段保留。將以上篩選得出的特征波段放入隨機(jī)森林分類器中進(jìn)行分類。
1.2.3 分類器參數(shù)設(shè)置
隨機(jī)森林(RF)作為一種自然非線性分類器,可以通過平均每個(gè)決策樹的預(yù)測(cè)來獲得最終預(yù)測(cè)。先前的研究表明,RF 比許多傳統(tǒng)分類器(如最大似然法、決策樹和單層神經(jīng)網(wǎng)絡(luò))更準(zhǔn)確[25]。在訓(xùn)練作物分類器時(shí),我們調(diào)整了GEE 中RF 的兩個(gè)參數(shù):(1)Number Of Trees:決定了用于構(gòu)建RF模型的二進(jìn)制決策樹的數(shù)量,在本方法中設(shè)置為100。(2)Min Leaf Population:葉節(jié)點(diǎn)所需的最小樣本數(shù),設(shè)置為10,以限制每棵樹的深度以避免過擬合。其他4 個(gè)參數(shù)在GEE 中默認(rèn)設(shè)置[23]。
1.2.4 平滑影像處理
本研究使用八鄰域空間濾波處理,對(duì)于最終分類結(jié)果小于0.1 公頃的作物斑塊,通過半徑為100米的基于圓形核的多數(shù)過濾器將結(jié)果進(jìn)行更新。大多數(shù)斑點(diǎn)通過八領(lǐng)域空間連通性處理算法在生成的分類結(jié)果中消失。整體流程圖如圖2 所示。
圖2 分類流程圖Figure 2 Flow chart of classification
本數(shù)據(jù)集為基于Sentinel-2 衛(wèi)星遙感數(shù)據(jù)提取得到的2020–2022 年三江平原主要農(nóng)作物(水稻、玉米和大豆)種植分布數(shù)據(jù),其空間分辨率為10 米,坐標(biāo)系為WGS84,總數(shù)據(jù)量為5.64 GB。本數(shù)據(jù)集包含2020 年至2022 年三年的主要作物(水稻、玉米、大豆)的分類結(jié)果數(shù)據(jù),每個(gè)年份數(shù)據(jù)包含4 個(gè)文件:影像文件、金字塔文件、柵格的輔助文件、影像坐標(biāo)信息的文本文件。
通過利用Sentinel-2 衛(wèi)星的10 天時(shí)間序列影像數(shù)據(jù),提取了2020–2022 年三江平原主要農(nóng)作物種植分布數(shù)據(jù)。將數(shù)據(jù)在ArcGIS 軟件中打開,可以看到數(shù)據(jù)分成了3 類,分別是1、2 和3,其中1表示水稻,2 表示玉米,3 表示大豆。如圖3 所示為2020–2022 年的三江平原主要農(nóng)作物分類結(jié)果圖。對(duì)不同農(nóng)作物的種植分布面積進(jìn)行統(tǒng)計(jì)分析,可以探究不同時(shí)期三江平原農(nóng)作物種植格局的時(shí)空變化規(guī)律。也可將提取結(jié)果疊加到黑龍江省行政區(qū)劃圖上,得到各市縣的作物種植情況分布,為農(nóng)業(yè)生產(chǎn)管理決策提供信息支撐,服務(wù)區(qū)域農(nóng)業(yè)信息化建設(shè)以及黑土地保護(hù)與利用。
圖3 2020–2022 年三江平原主要農(nóng)作物種植空間分布圖Figure 3 Spatial distribution of major crops in Sanjiang Plain from 2020 to 2022
本研究分類結(jié)果評(píng)價(jià)均采用混淆矩陣作為分類精度的評(píng)價(jià)方法。對(duì)于精度評(píng)價(jià)的指標(biāo)主要利用了生產(chǎn)者精度、用戶精度、總體精度以及Kappa 系數(shù)4 個(gè)精度評(píng)價(jià)指標(biāo)。其中根據(jù)野外調(diào)查結(jié)果和遙感影像目視解譯結(jié)果,用于驗(yàn)證結(jié)果的樣本點(diǎn)分別為:2020 年水稻樣本點(diǎn)125 個(gè),玉米樣本點(diǎn)75個(gè),大豆樣本點(diǎn)75 個(gè),其他地物樣本點(diǎn)327 個(gè);2021 年水稻樣本點(diǎn)146 個(gè),玉米樣本點(diǎn)75 個(gè),大豆樣本點(diǎn)77 個(gè),其他地物樣本點(diǎn)327 個(gè);2022 年水稻樣本點(diǎn)118 個(gè),玉米樣本點(diǎn)158 個(gè),大豆樣本點(diǎn)90 個(gè),其他地物樣本點(diǎn)327 個(gè)。最后利用驗(yàn)證樣本點(diǎn)數(shù)據(jù)對(duì)提取結(jié)果進(jìn)行精度驗(yàn)證,結(jié)果如表1所示。2020 年、2021 年和2022 年三江平原三大農(nóng)作物提取的總體精度分別為95.18%,95.0%,94.5%,Kappa 系數(shù)為0.924、0.925 和0.919。
表1 基于Sentinel-2 衛(wèi)星數(shù)據(jù)的2020–2022 年三江平原主要農(nóng)作物種植分布提取精度評(píng)價(jià)Table 1 Accuracy evaluation of planting distribution extraction for major crops in Sanjiang Plain from 2020 to 2022 based on Sentinel-2 satellite data
本數(shù)據(jù)集是一套基于Sentinel-2 衛(wèi)星數(shù)據(jù)的2020–2022 年三江平原主要農(nóng)作物種植分布遙感監(jiān)測(cè)數(shù)據(jù)產(chǎn)品。數(shù)據(jù)可以在ArcGIS 等相關(guān)軟件中進(jìn)行讀取、編輯以及后續(xù)的一系列分析工作。如果對(duì)不同提取結(jié)果進(jìn)行統(tǒng)計(jì),可以得到2020–2022 年的主要農(nóng)作物種植分布面積變化信息。本數(shù)據(jù)集凸顯了三江平原農(nóng)業(yè)發(fā)展的經(jīng)濟(jì)、生態(tài)、社會(huì)和文化價(jià)值,為順應(yīng)全面推進(jìn)鄉(xiāng)村振興新要求,拓展農(nóng)業(yè)多種功能,推動(dòng)農(nóng)業(yè)高質(zhì)高效、農(nóng)民富裕富足,為全面推進(jìn)鄉(xiāng)村振興、加快農(nóng)業(yè)農(nóng)村現(xiàn)代化提供有力支撐。不但可以作為三江平原農(nóng)作物種植格局時(shí)空變化分析的基礎(chǔ)數(shù)據(jù),同時(shí)也為農(nóng)業(yè)生產(chǎn)管理決策提供信息支撐,加快推進(jìn)農(nóng)業(yè)農(nóng)村現(xiàn)代化進(jìn)程。
數(shù)據(jù)作者分工職責(zé)
喬樹亭(1998—),男,山西孝義人,碩士研究生,研究方向?yàn)檗r(nóng)業(yè)遙感研究。主要承擔(dān)工作:數(shù)據(jù)收集、處理與質(zhì)量控制,數(shù)據(jù)論文撰寫。
葉回春(1985—),男,浙江杭州人,博士,副研究員,研究方向?yàn)橹脖欢窟b感機(jī)理及應(yīng)用研究。主要承擔(dān)工作:數(shù)據(jù)集生產(chǎn)和實(shí)地驗(yàn)證,數(shù)據(jù)論文撰寫。
劉榮豪(1985—),男,山東臨沂人,博士,副教授,研究方向?yàn)檗r(nóng)業(yè)水利及利用。主要承擔(dān)工作:數(shù)據(jù)集生產(chǎn)和數(shù)據(jù)論文修改。
郭安廷(1991—),男,山東濱州,博士,博士后,研究方向?yàn)橹脖欢窟b感及應(yīng)用。主要承擔(dān)工作:實(shí)地考察與數(shù)據(jù)論文修改。
張冰瑞(1997—),女,河南商丘人,碩士研究生,研究方向?yàn)檗r(nóng)業(yè)遙感研究。主要承擔(dān)工作:實(shí)地考察、數(shù)據(jù)論文撰寫與修改。
錢彬祥(1995—),男,河南信陽人,博士研究生,研究方向?yàn)?D 作物建模及光譜模擬、參數(shù)反演。主要承擔(dān)工作:實(shí)地考察、模型建立與驗(yàn)證。
魏鵬(1997—),男,山西大同人,碩士研究生,研究方向位農(nóng)業(yè)遙感研究。主要承擔(dān)工作:數(shù)據(jù)集生產(chǎn)和數(shù)據(jù)處理。
黃文江(1972—),男,安徽懷寧人,博士,研究員,研究方向?yàn)橹脖欢窟b感及應(yīng)用研究。主要承擔(dān)工作:數(shù)據(jù)質(zhì)量控制,數(shù)據(jù)論文修改。
中國科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)2023年4期