常竹 李虎 陳冬花 劉玉鋒 鄒陳 陳健 韓偉杰
摘要:為減少農(nóng)作物提取過程中受光學(xué)數(shù)據(jù)成像質(zhì)量的影響,基于Google Earth Engine平臺,采用Sentinel-1和Sentinel-2數(shù)據(jù),分別對小麥越冬期、返青期、孕穗期、成熟期四個物候期進(jìn)行小麥和油菜的識別。使用隨機(jī)森林方法對構(gòu)建的光譜特征、植被指數(shù)特征、紅邊指數(shù)特征、紋理特征和極化特征共34個特征進(jìn)行優(yōu)選,構(gòu)建特征集;并對比最小距離、決策樹、支持向量機(jī)、隨機(jī)森林四種分類器在四個物候期的識別結(jié)果,確定最優(yōu)的分類器;同時還驗證了極化特征在四個物候期對識別結(jié)果的影響。研究結(jié)果表明,在四個物候期中最優(yōu)的分類器均為隨機(jī)森林,其中識別精度從高到低的物候期分別為小麥的孕穗期、成熟期、返青期、越冬期,總體精度(OA)分別為92.91%、91.93%、90.24%、87.69%,Kappa系數(shù)分別為91.00%、89.92%、87.61%、84.53%。在四個物候期中加入極化特征均能提高識別的精度,其中在小麥的返青期和成熟期更為明顯。
關(guān)鍵詞:物候期;農(nóng)作物識別;Sentinel-1;Sentinel-2;Google Earth Engine;隨機(jī)森林
中圖分類號:TP79 文獻(xiàn)標(biāo)志碼:A 文章編號: 1001-2443(2024)01-0033-11
農(nóng)作物類型識別是農(nóng)作物面積提取、長勢監(jiān)測、產(chǎn)量估計、災(zāi)害評估的關(guān)鍵。實時準(zhǔn)確地獲取作物分布信息對農(nóng)業(yè)生產(chǎn)有積極意義[1-2]。目前,基于衛(wèi)星數(shù)據(jù)的不同農(nóng)作物遙感識別多為利用其在不同物候期特定的光譜變化來實現(xiàn)[3-10]。利用單時相遙感影像識別不同農(nóng)作物時多選用特定物候期(如油菜花期),在此物候期內(nèi)因作物光譜差異大、易于區(qū)分而有望獲得較高精度[11-12]。而在實際監(jiān)測中,確保每個物候期都能獲取同一傳感器較高影像質(zhì)量的衛(wèi)星影像較為困難。即使是在油菜花期這一特定物候期,獲取高質(zhì)量的影像也具有不確定性。對不同物候期農(nóng)作物遙感識別開展研究,可以在無法獲取長時間序列高質(zhì)量影像的情況下,選擇識別效果相對較好的物候期影像進(jìn)行作物識別,同時針對農(nóng)業(yè)生產(chǎn)中的不同需求可以及時選取相近時間段影像進(jìn)行作物識別。
現(xiàn)有研究表明,在作物識別方面,使用光學(xué)和雷達(dá)數(shù)據(jù)結(jié)合得到的識別效果優(yōu)于僅用單一的光學(xué)或雷達(dá)數(shù)據(jù)[13-14]。但此類研究并未對多個物候期進(jìn)行分別探究,在不同物候期內(nèi)聯(lián)合光學(xué)和雷達(dá)數(shù)據(jù)的識別效果尚不明確。因此,開展不同物候期聯(lián)合光學(xué)和雷達(dá)數(shù)據(jù)的農(nóng)作物識別具有一定現(xiàn)實意義,可為后續(xù)相關(guān)研究提供借鑒參考。
本文以開源的Google Earth Engine(GEE)作為數(shù)據(jù)處理的平臺,基于Sentinel-1和Sentinel-2數(shù)據(jù)對小麥的越冬期、返青期、孕穗期、成熟期四個重要物候期的小麥、油菜識別的最優(yōu)特征組合和方法進(jìn)行研究,優(yōu)選出不同物候期內(nèi)的最優(yōu)特征組合和最優(yōu)方法。同時對比加入極化特征在各物候期對識別結(jié)果的影響,驗證極化特征在各物候期對識別結(jié)果的重要性。通過對比研究,定量評價不同特征組合和算法在不同物候期內(nèi)的識別精度,以確定適合不同物候期小麥、油菜識別的最優(yōu)特征組合和最優(yōu)方法。
1 研究區(qū)與數(shù)據(jù)處理
1.1 研究區(qū)概況
本研究以安徽省全椒縣(31°51′~32°15′N,117°49′~118°25′E)為研究區(qū)。全椒縣位于中國南北分界的江淮分水嶺區(qū)域,地貌類型有丘陵、波狀平原和平原三種,地勢呈東南—西北走向,最高點海拔393 m。全椒縣是安徽省農(nóng)業(yè)種植大縣,春季作物以小麥和油菜為主、秋季作物以水稻和大豆為主,農(nóng)業(yè)種植結(jié)構(gòu)復(fù)雜,既有平原區(qū)域的集體種植、又有山區(qū)的零散分布,受地形和氣候的影響,作物的遙感成像易形成“同物異譜”現(xiàn)象。圖1為研究區(qū)位置示意圖。
1.2 數(shù)據(jù)源及處理
基于云技術(shù)的GEE將各類數(shù)據(jù)存儲在云端,總量超過5Pt,并允許用戶通過 Web 客戶端調(diào)用、可視化檢索、處理、在線分析和下載各種數(shù)據(jù)。與基于本地計算機(jī)的傳統(tǒng)數(shù)據(jù)處理方法相比,GEE的出現(xiàn)極大地提高了大數(shù)據(jù)處理研究的效率,降低了大規(guī)模分析的門檻[15-18]。GEE提供兩種Sentinel-2的產(chǎn)品數(shù)據(jù),分別為L1C和L2A產(chǎn)品,L1C為經(jīng)過正射校正后產(chǎn)品數(shù)據(jù),L2A為經(jīng)過正射校正和大氣校正后的產(chǎn)品數(shù)據(jù)。本文Sentinel-1選擇干涉寬幅(IW)模式成像,包含VV和VH兩種極化方式的10m分辨率GRD產(chǎn)品,Sentinel-2選用經(jīng)過大氣校正后的L2A產(chǎn)品。覆蓋整個研究區(qū)Sentinel-1影像需要一景,Sentinel-2影像需要兩景,本文收集了小麥的越冬期、返青期、孕穗期、成熟期四個重要物候期的Sentinel-1和Sentinle-2影像。
針對Sentinel-1的GRD產(chǎn)品數(shù)據(jù),利用GEE在線進(jìn)行地形校正和濾波降噪處理,得到包含VV和VH兩種極化方式的10m分辨率影像。針對Sentinel-2首先按照小于20%云含量對數(shù)據(jù)進(jìn)行選擇(其中越冬期的云含量為小于40%),并按照最小云含量的方式合成每個物候期的影像,通過重采樣將影像所有波段的分辨率均采樣為10m。表1為影像的具體成像時間和對應(yīng)的小麥與油菜的物候期。
1.3 野外調(diào)查數(shù)據(jù)
2022年2月24日—2月26日,通過手機(jī)GPS定位和現(xiàn)場拍照的方式,對研究區(qū)內(nèi)10個鎮(zhèn)分別進(jìn)行采樣,共采集小麥樣本點124個、油菜樣本點189個。結(jié)合實地采集的樣本點和2022年3月初 GF-1 PMS經(jīng)過數(shù)據(jù)預(yù)處理后的2m分辨率研究區(qū)影像,使用目視解譯將所采集的點繪制成面,并增加建筑用地、林地、水體以及未利用土地的樣本,構(gòu)成樣本集。模型訓(xùn)練時均使用10折交叉驗證的方式分配訓(xùn)練集和測試集。圖2為外業(yè)采集的樣本點分布。
2 研究方法
2.1 特征提取
特征選擇在遙感分類的過程中尤為重要,科學(xué)地選取特征可以有效地提高遙感分類的精度[19]。本文選取光譜特征、植被指數(shù)、紅邊指數(shù)、極化特征和紋理特征構(gòu)建特征集。
實驗選取Sentinel-2的紅、綠、藍(lán)三個可見光波段,三個紅邊波段,兩個近紅外波段,兩個短波紅外波段共10個波段構(gòu)建光譜特征,通過波段運(yùn)算構(gòu)建8個植被指數(shù)特征,針對植被非常敏感的紅邊波段,構(gòu)建8個紅邊指數(shù)特征,表2為本文構(gòu)建的植被指數(shù)和紅邊指數(shù)。
僅使用光譜特征和指數(shù)特征難以解決“同物異譜,異物同譜”現(xiàn)象,有研究者認(rèn)為聯(lián)合光學(xué)和雷達(dá)數(shù)據(jù),加入極化特征[13-14]和紋理特征[20]??梢杂行Ц纳啤巴锂愖V,異物同譜”現(xiàn)象。使用Sentinel-1的VV極化和VH極化的后向散射系數(shù)構(gòu)建極化特征。選取精度驗證較高的灰度共生矩陣GLCM提取影像的紋理信息,并使用方差(Var)、對比度(Contrast)、差異性(Diss)、熵(Ent)、角二階矩(Asm)、相關(guān)性(Corr)等6個紋理計算量對影像進(jìn)行定量分析?;叶裙采仃嚨挠嬎愫头较蛴嘘P(guān),本文使用4個方向統(tǒng)計量疊加的均值消除角度影響。為避免紋理分析中統(tǒng)計分量較多且存在一定的信息交叉,考慮到本文研究對象為小麥和油菜兩種植被,因此僅提取常被用于計算植被覆蓋度的NDVI的紋理特征。表3為本文構(gòu)建的34個特征。
2.2 特征優(yōu)選方法
使用過多的特征參與分類,容易導(dǎo)致信息冗余以及“維數(shù)災(zāi)難”,從而導(dǎo)致分類性能下降,因此非常有必要對特征變量進(jìn)行特征選擇。本文使用隨機(jī)森林算法對特征進(jìn)行選擇,隨機(jī)森林算法不僅可以實現(xiàn)遙感影像的分類,而且在特征降維等方面也發(fā)揮著重要的作用[21]。本文使用GINI系數(shù)作為評價指標(biāo),GINI系數(shù)是衡量隨機(jī)樣本在樣本集中被錯誤分類的概率的指標(biāo)。GINI系數(shù)越小,集合中所選擇的樣本被錯誤分類的概率就越小,當(dāng)樣本集中的所有樣本都屬于一個類別時,GINI系數(shù)為0。 隨機(jī)森林算法中的每棵樹都是決策樹,當(dāng)樹選擇使用一個特征進(jìn)行拆分時,它需要計算GINI系數(shù)來衡量拆分前后的樣本集的純度,分割后左右分支的基尼指數(shù)越小,使用該特征進(jìn)行分離的準(zhǔn)確度就越高。GINI系數(shù)的計算公式為
式中,[GIm]是分枝前節(jié)點的 GINI 系數(shù),[K]表示類別個數(shù),[pmk]表示節(jié)點[m]中類別[k]所占的比例。特征[Xj]在節(jié)點[m]時的重要性為
式中,[GIl]和 [GIr]是分枝后兩個新節(jié)點的 GINI 系數(shù)。特征[Xj]在第[i]棵樹的重要性為
式中,[M]為特征[Xj]在決策樹中出現(xiàn)的節(jié)點集合。假設(shè)隨機(jī)森林中樹的數(shù)目為[n],則特征[Xj]的特征重要性評分為
2.3 分類方法
在遙感圖像分類的研究中,特征的選取和方法的選擇對結(jié)果都會產(chǎn)生重要影響,不同的機(jī)器學(xué)習(xí)分類器在不同的研究中往往會呈現(xiàn)不同的結(jié)果[22]。本文基于GEE提供的最小距離(Minimum Distance, MD)、決策樹(Classification Algorithms and Regression Trees, CART)、隨機(jī)森林(Random Forest, RF)、支持向量機(jī)(Support Vector Machine, SVM)四種分類器,分別討論不同物候期所適合的最優(yōu)分類器。
最小距離法依據(jù)未知類別像元到已知總體均值中心的距離進(jìn)行分類,距離越小,劃分至該類的概率越大[22]。GEE提供3種“距離”計算,分別是歐式距離,余弦距離和馬氏距離。本文使用馬氏距離進(jìn)行分類。
CART是由Breiman[23]提出的一種快速構(gòu)建分類樹的算法,決策樹是通過構(gòu)建二叉樹實現(xiàn)輸入值的歸類,通過算法確定二叉樹的節(jié)點,以能夠劃分樣本數(shù)據(jù)的最優(yōu)特征作為節(jié)點對樣本二分和細(xì)化,通過遞歸實現(xiàn)分類樹的構(gòu)建。
RF不僅可以用于特征選擇,而且具有良好的分類精度和穩(wěn)健性[21]。RF通過集成學(xué)習(xí)的思想將多棵決策樹集成在一起,每棵決策樹都是一個分類器,都會產(chǎn)生對應(yīng)的分類結(jié)果,RF將多棵決策樹的分類結(jié)果通過投票的方式?jīng)Q定最終的分類結(jié)果[24]。隨機(jī)森林方法通常不需要復(fù)雜的參數(shù)調(diào)制過程,樹的數(shù)量([nt])是關(guān)鍵的參數(shù),當(dāng)較大時表示使用的決策樹數(shù)量更多,算法更為復(fù)雜[18],通過格網(wǎng)搜索的方法確定設(shè)置在四個物候期的最優(yōu)值,分別為100、120、130、90。
SVM算法的關(guān)鍵參數(shù)包括核函數(shù)類型、懲罰系數(shù)[C]以及相關(guān)核參數(shù)[gamma]?,F(xiàn)有研究表明,徑向核函數(shù)(RBF)相比于線性核函數(shù)、多項式核函數(shù)等,對具有突出非線性特征的圖像具有更好的性能[18]。因此,本次實驗均使用RBF核作為核函數(shù)。通過格網(wǎng)搜索的方法確定[C]和[gamma]在不同物候期的最優(yōu)值(表4)。
2.4 評價指標(biāo)
混淆矩陣常被用于評價分類結(jié)果和實際值之間的混淆程度。本文主要使用目前普遍采用的總體精度(OA)、Kappa系數(shù)、生產(chǎn)者精度(PA)、用戶精度(UA)以及F1_Score作為評價指標(biāo)。
3 結(jié)果和分析
3.1 特征優(yōu)選結(jié)果
隨機(jī)森林算法可以計算出每次參與運(yùn)算特征的重要性,本文使用10折交叉驗證的方式計算34個特征在10次實驗重要性的均值。為確定最優(yōu)特征的數(shù)量,根據(jù)特征重要性的均值從大到小進(jìn)行排序,依次加入實驗,計算每次實驗的OA、Kappa的均值以及小麥和油菜F1-Score的均值,圖3為四個物候期各特征重要性以及不同特征參與運(yùn)算所得到的分類結(jié)果。
如圖3所示,當(dāng)加入特征達(dá)到一定數(shù)量時,特征數(shù)量的增加對模型精度并不能產(chǎn)生太大的波動。為了在保證實驗精度足夠高的同時減少特征的冗余,本文在小麥越冬期、返青期、孕穗期、成熟期按照相應(yīng)特征重要性排序分別選取前15個特征、前11個特征、前11個特征、前12個特征構(gòu)建對應(yīng)物候期的最優(yōu)特征集。表5為四個物候期的最優(yōu)特征集。
3.2 分類結(jié)果及精度評價
使用優(yōu)選后的特征集,對比隨機(jī)森林、支持向量機(jī)、決策樹、最小距離四種監(jiān)督分類方法在不同物候期的分類性能。使用十折交叉驗證的方式,對比不同方法在最優(yōu)參數(shù)條件下十次交叉驗證所得到分類結(jié)果的均值。實驗結(jié)果表明:小麥越冬期分類精度最高的為隨機(jī)森林,其次為支持向量機(jī)和決策樹法,最小距離分類所得到的小麥和油菜具有較高的用戶精度,但總體精度以及F1_Score、生產(chǎn)者精度都明顯低于RF、SVM、CART;小麥返青期隨機(jī)森林的分類精度最高,其次為支持向量機(jī),決策樹和最小距離的分類精度相近,均低于隨機(jī)森林和支持向量機(jī);小麥孕穗期分類精度最高的為隨機(jī)森林,其次為支持向量機(jī)和決策樹,最小距離所得到的精度最低;小麥成熟期分類精度從高到低分別為隨機(jī)森林、支持向量機(jī)、決策樹、最小距離。綜上所述,在四個物候期內(nèi)隨機(jī)森林的分類精度均為最高。表6為四種分類器在四個物候期所識別的精度,圖4為在最優(yōu)特征集和分類器條件下的小麥和油菜的識別結(jié)果。
3.3 極化特征對不同物候期分類結(jié)果的影響
為了評估極化特征在四個物候期對小麥和油菜識別精度的影響,分別提取小麥和油菜在四個物候期Sentinel-1的VV和VH后向散射系數(shù),同時對比四個物候期不加極化特征和加極化特征的實驗結(jié)果。
圖5為四個物候期小麥和油菜VV和VH后向散射系數(shù)的箱線圖,圖中每個矩形框表示后向散射系數(shù)15%~85%的取值范圍,矩形框中的橫線表示對應(yīng)物候期作物VV、VH后向散射系數(shù)的均值,兩端橫線為對應(yīng)的最大值和最小值。第一張圖(5a)顯示的為小麥和油菜四個物候期VV后向散射系數(shù)的箱線圖,第二張圖(5b)顯示的為小麥和油菜四個物候期VH后向散射系數(shù)的箱線圖。在四個物候期油菜VV和VH后向散射系數(shù)的均值都大于小麥VV和VH后向散射系數(shù)的均值,并且從后向散射系數(shù)值的分布區(qū)間可以得出,除小麥越冬期有大部分重疊外,剩余三個物候期重疊區(qū)域均較小,因此在小麥返青期、小麥孕穗期、小麥成熟期VV和VH極化特征均可作為區(qū)分小麥和油菜的特征。
圖6為四個物候期不加極化特征和加極化特征隨機(jī)森林分類器的OA、Kaapa系數(shù)、小麥和油菜的F1_Score、小麥和油菜的生產(chǎn)者精度和用戶精度的對比圖。第一張圖(6a)顯示,在小麥越冬期加入極化特征,OA、Kaapa系數(shù)以及小麥的F1_Score升高了1%,油菜的識別精度略微下降;第二張圖(6b)顯示,在小麥返青期加入極化特征識別的總體精度以及小麥和油菜的識別精度都升高了1%~2%左右;第三張圖(6c)顯示,在小麥孕穗期加入極化特征識別的總體精度以及小麥和油菜的識別精度都有所提升,但上升的幅度都較小,在0.5%左右;第四張圖(6d)顯示,在小麥成熟期加入極化特征識別的總體精度有所提升,但上升的幅度較小,約在0.5%,小麥的識別精度并未發(fā)生太大波動,而油菜的識別精度提升了3%左右。因此,在四個物候期加入極化特征均能提高識別的精度,并且在小麥返青期和小麥成熟期更為明顯。
3.4 最優(yōu)分類物候期
圖7為四個物候期在最優(yōu)特征集以及最優(yōu)分類器條件下的識別精度。四個物候期中小麥孕穗期的OA和Kappa最高,分別為92.91%、91.00%,其次為小麥成熟期,分別為91.93%、89.92%,小麥返青期分別為90.24%、87.61%,小麥越冬期最低,為87.69%、84.53%。四個物候期中小麥識別精度從高到底分別為小麥孕穗期、小麥成熟期、小麥返青期、小麥越冬期,其對應(yīng)的F1_Score分別為90.86%、85.99%、81.62%、71.84%。四個物候期中油菜識別精度從高到底分別為小麥成熟期、小麥孕穗期、小麥返青期、小麥越冬期,其對應(yīng)的F1_Score分別為96.81%、95.05%、84.93%、82.73%。綜上所述,在小麥孕穗期和小麥成熟期識別精度較高,其次為小麥返青期,在小麥越冬期識別的精度最低。
本文對最優(yōu)分類物候期、最優(yōu)特征組合和最優(yōu)分類方法所識別的結(jié)果進(jìn)行分析。圖8為兩塊典型區(qū)域的識別結(jié)果,場景一為地塊比較零散,種植結(jié)構(gòu)比較復(fù)雜的種植區(qū),場景二為種植較為集中的種植區(qū)。在兩種場景下,將識別結(jié)果與實際種植分布進(jìn)行比較,識別的結(jié)果在兩種場景中均沒有出現(xiàn)明顯的錯分和漏分,在地塊邊界信息的保留方面,識別的結(jié)果和實際種植分布仍然有一些差距。
4 結(jié)論
本文基于Sentinel-1和Sentinel-2遙感數(shù)據(jù)對小麥越冬期、返青期、孕穗期、成熟期四個物候期分別構(gòu)建光譜特征、植被指數(shù)特征、紅邊指數(shù)特征、紋理特征以及極化特征等5種基本特征,并通過隨機(jī)森林算法對每個物候期的特征進(jìn)行特征優(yōu)選,構(gòu)建各物候期的最優(yōu)特征集;同時對比GEE平臺提供的不同分類器,確定不同物候期識別的最優(yōu)分類器;并探究了Sentinel-1雷達(dá)數(shù)據(jù)在各物候期對識別結(jié)果的影響。研究結(jié)果表明:
(1)對構(gòu)建的34個特征進(jìn)行特征優(yōu)選,最終確定了在小麥越冬期、返青期、孕穗期、成熟期的最優(yōu)特征集,如表5所示。
(2)對GEE平臺提供的最小距離、決策樹、支持向量機(jī)、隨機(jī)森林4種分類器的分類結(jié)果進(jìn)行比較。結(jié)果表明,在四個物候期中隨機(jī)森林的分類精度均為最高。
(3)通過對比加入極化特征和不加入極化特征的識別結(jié)果得出,在四個物候期中加入極化特征均能提高識別的精度,其中在小麥的返青期和成熟期更為明顯。
(4)通過對比四個物候期在最優(yōu)特征集和最優(yōu)分類器條件下的識別結(jié)果得出,小麥的孕穗期識別精度>小麥的成熟期識別精度>小麥返青期識別精度>小麥越冬期識別精度,其OA分別為92.91%、91.93%、90.24%、87.69%,Kappa系數(shù)分別為91.00%、89.92%、87.61%、84.53%。
(5)在小麥的孕穗期和成熟期的識別精度較高,但在越冬期的識別精度較差,后續(xù)將對如何提高越冬期的識別精度開展進(jìn)一步的分析和探討。
參考文獻(xiàn)
[1] 唐華俊,吳文斌,楊鵬,等.農(nóng)作物空間格局遙感監(jiān)測研究進(jìn)展[J].中國農(nóng)業(yè)科學(xué),2010,43(14):2879-2888.
[2] 季富華,劉佳,王利民.農(nóng)作物類型遙感識別算法及國產(chǎn)高分衛(wèi)星應(yīng)用示例[J].中國農(nóng)業(yè)資源與區(qū)劃,2021,42(7):254-268.
[3] 許文波,張國平,范錦龍,等.利用MODIS遙感數(shù)據(jù)監(jiān)測冬小麥種植面積[J].農(nóng)業(yè)工程學(xué)報,2007(12):144-149+325.
[4] 游炯,裴志遠(yuǎn),王飛,等.基于改進(jìn)多元紋理信息模型和GF-1影像的縣域冬小麥面積提?。跩].農(nóng)業(yè)工程學(xué)報,2016,32(13):131-139.
[5] 張晶,占玉林,李如仁.高分一號歸一化植被指數(shù)時間序列用于冬小麥識別[J].遙感信息,2017,32(1):50-56.
[6] 王利民,劉佳,姚保民,等.基于GF-1影像NDVI年度間相關(guān)分析的冬小麥面積變化監(jiān)測[J].農(nóng)業(yè)工程學(xué)報,2018,34(8):184-191.
[7] 王林江,吳炳方,張淼,等.關(guān)鍵生育期冬小麥和油菜遙感分類方法[J].地球信息科學(xué)學(xué)報,2019,21(7):1121-1131.
[8] 姜楠,張雪紅,汶建龍,等.基于高分六號寬幅影像的油菜種植分布區(qū)域提取方法[J].地球信息科學(xué)學(xué)報,2021,23(12):2275-2291.
[9] 張紫荊,華麗,鄭萱,等.基于GEE平臺與Sentinel-NDVI時序數(shù)據(jù)江漢平原種植模式提?。跩].農(nóng)業(yè)工程學(xué)報,2022,38(1):196-202.
[10] SEYDI S T, AMANI M, GHORBANIAN A. A dual attention convolutional neural network for crop classification using time-series sentinel-2 imagery[J]. Remote Sens,2022, 14, 498-522.
[11] 楊澤宇,張洪艷,明金,等.深度學(xué)習(xí)在高分辨率遙感影像冬油菜提取中的應(yīng)用[J].測繪通報,2020(9):110-113.
[12] 趙晉陵,詹媛媛,王娟,等.基于SE-UNet的冬小麥種植區(qū)域提取方法[J].農(nóng)業(yè)機(jī)械學(xué)報,2022,53(9):189-196.
[13] 周濤,潘劍君,韓濤,等.基于多時相合成孔徑雷達(dá)與光學(xué)影像的冬小麥種植面積提?。跩].農(nóng)業(yè)工程學(xué)報,2017,33(10):215-221.
[14] 馬戰(zhàn)林,劉昌華,薛華柱,等.GEE環(huán)境下融合主被動遙感數(shù)據(jù)的冬小麥識別技術(shù)[J].農(nóng)業(yè)機(jī)械學(xué)報,2021,52(9):195-205.
[15] DENG Y, JIANG W, TANG Z, et al. Long-term changes of open-surface water bodies in the Yangtze River Basin based on the Google Earth Engine cloud platform[J]. Remote Sens, 2019, 11, 2213-2235.
[16] LI Y, NIU Z, XU Z, et al. Construction of high spatial-temporal water body dataset in China based on Sentinel-1 Archives and GEE[J]. Remote Sens, 2020, 12, 2413-2428.
[17] TANG H, LU S, ALI B, et al. Large-scale surface water mapping based on Landsat and Sentinel-1 Images[J]. Water, 2022, 14, 1454-1470.
[18] LI X, ZHANG D, JIANG C, et al. Comparison of lake area extraction algorithms in Qinghai Tibet Plateau leveraging Google Earth Engine and Landsat-9 Data[J]. Remote Sens, 2022, 14, 4612-4637.
[19] LUO H, LI M, DAI S, et al. Combinations of feature selection and machine learning algorithms for object-oriented betel palms and mango plantations classification based on Gaofen-2 Imagery[J]. Remote Sens, 2022, 14, 1757-1780.
[20] 熊皓麗,周小成,汪小欽,等.基于GEE云平臺的福建省10 m分辨率茶園專題空間分布制圖[J].地球信息科學(xué)學(xué)報,2021,23(7):1325-1337.
[21] 姚金璽,王浪,李建忠,等.青海諾木洪地區(qū)多源遙感及多特征組合地物分類[J].農(nóng)業(yè)工程學(xué)報,2022,38(3):247-256.
[22] 李斌,李崇貴,李煜.基于Sentinel-2數(shù)據(jù)的塞罕壩機(jī)械林場落葉松人工林提?。跩].林業(yè)資源管理,2021(2):117-123.
[23] BREIMAN L, FRIEDMAN J H, OLSHEN R A, et all. Classification and Regression Trees[M]. California: Wadsworth International Group, 1984:1-358.
[24] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
Crop Identification Study Based on Sentinel-1 and Sentinel-2 for Different Phenological Periods
CHANG Zhu1,2, LI Hu1,2, CHEN Dong-hua1,3, LIU Yu-feng3, ZOU Chen1, CHEN Jian1, HAN Wei-jie1
(1. School of Geography and Tourism, Anhui Normal University, Wuhu 241000, China; 2. Anhui Province Engineering Technolog Research Center of Resources Environment and GIS, Wuhu 241000, China;3. School of Computer and Information Engineering, Chuzhou University, Chuzhou 239000, China)
Abstract: In order to reduce the influence of optical data imaging quality in the process of crop extraction, Sentinel-1 and Sentinel-2 data were used based on Google Earth Engine platform to identify wheat and rape respectively in four phenological periods: overwintering period, regreening period, booting period and maturity period. A feature set is constructed by using a random forest method to preferentially select the optimal features from a set of 34 features consisting of spectral features, vegetation index features, red edge index features, texture features and polarisation features. It also compared the recognition results of four classifiers, namely, minimum distance, decision tree, support vector machine and random forest, in the four phenological periods to determine the optimal classifier; and also verified the influence of polarization features on the recognition results in the four phenological periods. The results showed that the optimal classifier was random forest in all four phenological periods; the phenological periods with the highest to lowest recognition accuracy were wheat booting, maturity, regreening and overwintering, with OA of 92.91%, 91.93%, 90.24% and 87.69%, and Kappa coefficients of 91.00%, 89.92%, 87.61% and 84.53%;The inclusion of polarisation features in each of the four phenological periods improved the accuracy of identification, more so in the two phenological periods of wheat, greening and maturity .
Key words: phenological periods; crop identification; Sentinel-1;Sentinel-2; Google Earth Engine; random forest
(責(zé)任編輯:鞏 劼)
收稿日期:2022-11-22
基金項目:高分辨率對地觀測系統(tǒng)科技重大專項(76-Y50G14-0038-22/23);安徽省科技重大專項(202003a06020002);安徽省重點研究與開發(fā)計劃項目(2021003,2022107020028);安徽省特支計劃項目(2019);安徽省高校協(xié)同創(chuàng)新項目(GXXT-2021-048);安徽省自然科學(xué)基金項目(2208085QD107);安徽省高等學(xué)校自然科學(xué)研究重點項目(KJ2021A1063);滁州市科技計劃項目(2021ZD013).
作者簡介:常竹(1998—),男,安徽安慶市人,碩士研究生,主要從事機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在農(nóng)業(yè)遙感方面的研究;通信作者:李虎(1962—),男,山東德州市人,教授,博士生導(dǎo)師,主要從事國產(chǎn)衛(wèi)星應(yīng)用和資源環(huán)境遙感方面的研究,E-mail: lihu2881@aliyun.com.
引用格式:常竹,李虎,陳冬花,等. 基于Sentinel-1和Sentinel-2的不同物候期農(nóng)作物識別研究[J].安徽師范大學(xué)學(xué)報(自然科學(xué)版),2024,33-43(1):33-43.