馮權(quán)瀧 任 燕 姚曉闖 牛博文 陳泊安 趙圓圓
(1.中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京 100193;2.自然資源部農(nóng)用地質(zhì)量與監(jiān)控重點(diǎn)實(shí)驗(yàn)室,北京 100193)
冬小麥?zhǔn)俏覈笾骷Z作物之一,與國家糧食安全息息相關(guān)。黃淮海平原作為我國重要的農(nóng)業(yè)生產(chǎn)區(qū),同時是全國最大冬小麥產(chǎn)區(qū),小麥產(chǎn)量占全國總產(chǎn)量的75%[1],及時精準(zhǔn)地獲取冬小麥種植面積和空間分布信息對我國農(nóng)業(yè)發(fā)展具有重要意義。當(dāng)前基于統(tǒng)計(jì)數(shù)據(jù)和遙感監(jiān)測的冬小麥提取研究仍為主流研究方法,效率低且耗費(fèi)大量人力成本,難以滿足當(dāng)前快速、準(zhǔn)確地獲取農(nóng)作物信息的實(shí)際需求[2-4]。而運(yùn)用遙感可快速獲取大范圍地表覆被信息,在不同時空尺度的冬小麥識別方面得到了廣泛應(yīng)用[5]。常用的提取冬小麥面積的方法是結(jié)合遙感影像,通過比較植被指數(shù)時序變化選擇合適閾值,進(jìn)而提取冬小麥的空間分布信息[6-8];另外,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等算法的發(fā)展也為農(nóng)作物分類、冬小麥面積提取提供了新的方法[2,9]。隨著對遙感圖像處理能力需求的提高,高效處理圖像數(shù)據(jù)的各類云平臺需求也逐漸增加。遙感云計(jì)算平臺(例如:Google Earth Engine,GEE)具有強(qiáng)大的計(jì)算能力,能夠快速分析遙感影像并及時獲取大范圍的農(nóng)作物信息[10-15]。由于遙感數(shù)據(jù)的工作限制和原理的不同,單一傳感器難以完整反映地表覆被特征?,F(xiàn)階段作物識別研究多基于光學(xué)影像作為數(shù)據(jù)源,運(yùn)用多時相數(shù)據(jù)增強(qiáng)不同地物之間的光譜可分性,能夠更好地分析冬小麥的生長發(fā)育規(guī)律在遙感影像上表現(xiàn)出的時相變化特征,有效提高冬小麥識別和分類精度。
目前融合多種傳感器的多時空分辨率的光學(xué)遙感影像被用來提取農(nóng)作物種植結(jié)構(gòu)并取得了大量成果[16]。基于高分辨率影像數(shù)據(jù)進(jìn)行農(nóng)作物提取也受到廣泛關(guān)注[17]。雷達(dá)遙感相對于光學(xué)遙感最大的優(yōu)點(diǎn)在于可穿透云雨,不受日照影響和限制,可全天時、全天候工作。諸多學(xué)者也將雷達(dá)數(shù)據(jù)與光學(xué)數(shù)據(jù)結(jié)合用于農(nóng)作物種植結(jié)構(gòu)信息提取。ARIAS等[18]探討了基于Sentinel-1時間序列數(shù)據(jù)進(jìn)行農(nóng)作物分類的可行性;GEE是一個免費(fèi)的遙感云計(jì)算平臺,基于GEE云平臺已進(jìn)行了諸多在遙感領(lǐng)域的研究。SHELESTOV等[19]基于GEE云平臺進(jìn)行農(nóng)作物分類研究,利用云平臺獲取大量多時相遙感數(shù)據(jù),并采用多種主流分類器進(jìn)行農(nóng)作物提取,對比了各分類器的提取效果;譚深等[10]運(yùn)用融合多源遙感數(shù)據(jù)進(jìn)行多云氣候區(qū)的水稻分類研究,并基于機(jī)器學(xué)習(xí)中的隨機(jī)森林分類方法獲取2016年的水稻分布圖,獲得較好結(jié)果。
綜上,本文基于2020年12月至2021年5月黃淮海平原的哨兵1號(Sentinel-1)SAR雷達(dá)影像和哨兵2號(Sentinel-2)光學(xué)遙感影像,分別構(gòu)建各地物類型的光譜特征、極化特征和紋理特征數(shù)據(jù),分析不同地物在以上特征中的時序曲線差異、冬小麥的生育周期以及對應(yīng)的植被指數(shù)特征差異。利用GEE云平臺,基于多種機(jī)器學(xué)習(xí)分類算法(樸素貝葉斯、支持向量機(jī)、決策樹和隨機(jī)森林)進(jìn)行分類及精度驗(yàn)證,從而得出最優(yōu)分類算法,并利用已選擇的冬小麥的樣本點(diǎn),提取樣本長時間序列的特征向量,基于深度學(xué)習(xí)中長短期記憶網(wǎng)絡(luò)(Long short term memory,LSTM)和Bi-LSTM進(jìn)行冬小麥的像元尺度的模型訓(xùn)練?;趯?shí)驗(yàn)結(jié)果,獲得2021年黃淮海平原區(qū)域冬小麥種植面積及其時空變化特征,以期為該區(qū)域輪作休耕政策制訂以及農(nóng)業(yè)生產(chǎn)提供數(shù)據(jù)支持。
黃淮海平原位于北緯32°~40°,東經(jīng)114°~121°,面積3×105km2??缭骄?、津、冀、魯、豫、皖、蘇7省市,地勢平坦,河湖眾多,交通便利,年均氣溫13℃,年均降水量710 mm,屬溫帶大陸性季風(fēng)氣候,雨熱同期,土質(zhì)肥沃,主要生長的農(nóng)作物為小麥、玉米、大豆等,其中冬小麥多于每年的10月上、中旬播種,次年6月收獲[20]。黃淮海平原研究區(qū)域范圍劃分參考文獻(xiàn)[21],包含北京、天津、河北、河南、山東、安徽、江蘇7個省級行政區(qū)(圖1)。
圖1 研究區(qū)范圍示意圖
選用Sentinel-1 SAR數(shù)據(jù)和Sentinel-2光學(xué)數(shù)據(jù)進(jìn)行冬小麥面積提取。Sentinel-2A衛(wèi)星覆蓋13個光譜波段,為獲得無云且包含冬小麥生長期的影像數(shù)據(jù),通過擴(kuò)大影像的時間跨度,設(shè)置時間范圍為2020年12月至2021年5月,得到黃淮海平原空間分辨率為10 m的Sentinel-2衛(wèi)星影像數(shù)據(jù),在月尺度上進(jìn)行均值合成,篩選云量低于20%的影像。Sentinel-2數(shù)據(jù)的裁剪、鑲嵌處理通過GEE平臺在線編寫代碼實(shí)現(xiàn)。Sentinel-1是主動微波遙感衛(wèi)星,能夠全天候、全天時地對地面進(jìn)行觀測,具有單極化、雙極化等多種極化方式[22-23]。本研究運(yùn)用VV、VH極化數(shù)據(jù)進(jìn)行極化特征計(jì)算,并在月尺度上進(jìn)行均值合成,影像空間分辨率為10 m。
1.3.1特征構(gòu)建
結(jié)合研究區(qū)的地理位置與農(nóng)作物的物候期,選取Sentinel-2光學(xué)影像的光譜反射率、光譜特征和紋理特征進(jìn)行計(jì)算?,F(xiàn)有研究表明農(nóng)作物遙感分類研究僅計(jì)算光譜特征會導(dǎo)致“同物異譜、異物同譜”的現(xiàn)象,影響最終分類效果,而不同地物類型在遙感影像上紋理表現(xiàn)差異較大。冬小麥在遙感影像上具有規(guī)則的紋理信息,易于與其他地物類型進(jìn)行區(qū)分?;诖耍疚倪\(yùn)用灰度共生矩陣(Gray-level co-occurrence matrix, GLCM)進(jìn)行紋理特征的構(gòu)建,根據(jù)植被光譜曲線可知,植被在近紅外B8波段具有最高的反射峰,植被反射率在可見光波段差異小,但近紅外波段的差異明顯。因此本文采用Sentinel-2光學(xué)影像的近紅外B8波段計(jì)算紋理特征能夠更好地區(qū)分植被等信息。為避免因選取過多紋理特征而導(dǎo)致信息冗余,故只選取灰度共生矩陣生成的角二矩陣(Angular second moment, ASM)、對比度(Contrast, CONTRAST)、相關(guān)性(Correlation, CORR)和熵值4個紋理特征變量。選擇Sentinel-1 SAR數(shù)據(jù)的極化特征變量,共2個特征變量。本研究共選取16個特征變量,如表1所示。
表1中,歸一化差異植被指數(shù)(Normalized difference vegetation index, NDVI)反映植被生長狀態(tài),通過計(jì)算近紅外和紅光波段之間的差異來識別植被。歸一化水體指數(shù)(Normalized difference water index, NDWI)用于水體識別,對波段進(jìn)行歸一化差值處理,其對植被冠層的液態(tài)水含量變化敏感。增強(qiáng)型植被指數(shù)(Enhanced vegetation index, EVI)的計(jì)算常用于植被茂密區(qū)域的計(jì)算,可減少大氣和土壤的影響,反映地表植被特征。綠色歸一化差異植被指數(shù)(Green normalized difference vegetation index, GNDVI)用于計(jì)算葉片葉綠素濃度。綠葉指數(shù)(Green leaf index, GLI)反映研究植被的顏色變化信息。優(yōu)化土壤調(diào)節(jié)植被指數(shù)(Optimization soil-adjust vegetation index, OSAVI)能夠反映冬小麥的生長狀況信息[24-28]。
表1 特征變量
1.3.2不同地物類型間的時序植被指數(shù)差異分析
綜合分析文獻(xiàn)[15]和研究區(qū)的地物類型分布特征,為便于進(jìn)行不同地物的植被指數(shù)差異比較,共選取冬小麥和非冬小麥兩大類樣本點(diǎn),非冬小麥地物類型由水體、不透水面、其他(植被+裸地)3類地物組成,結(jié)合遙感影像繪制各類地物在12月到次年5月的NDVI變化曲線(圖2)。研究區(qū)冬小麥從1月到3月的NDVI逐月增加,變化趨勢明顯有別于其他地物類型,說明該階段冬小麥綠色加深,根據(jù)研究區(qū)冬小麥物候信息可知該階段為返青期。3—4月冬小麥NDVI偏高,為冬小麥孕穗期。4—5月NDVI植被指數(shù)呈現(xiàn)明顯下降趨勢,但總體指數(shù)值仍較高,該時期冬小麥葉綠素含量下降,5月以后的冬小麥NDVI植被指數(shù)與其他地物類型較為相似,不易進(jìn)行農(nóng)作物提取研究。基于特征值差異越大,分類精度越高的原則,選取返青期影像作為選擇樣本的基礎(chǔ)影像,數(shù)據(jù)日期為2021年2月1日至3月1日。
圖2 2020年12月—2021年5月研究區(qū)各地物類型時序NDVI變化曲線
1.3.3樣本數(shù)據(jù)集
本文分類目標(biāo)作物為冬小麥,通過分析遙感影像的地表覆被信息和易混作物信息,選取20 000個樣本點(diǎn),綜合文獻(xiàn)[2]中的訓(xùn)練集測試集劃分比例和本研究樣本數(shù)據(jù)量以便于更準(zhǔn)確地反映模型效能,從中隨機(jī)抽取30%作為測試樣本,70%作為訓(xùn)練樣本,獲得研究區(qū)訓(xùn)練樣本集及測試樣本集(表2)。驗(yàn)證數(shù)據(jù)來自各省2020年統(tǒng)計(jì)年鑒發(fā)布的冬小麥播種面積數(shù)據(jù)。根據(jù)1.1節(jié)可知黃淮海平原非7省完整區(qū)域,故以黃淮海平原包括的各個市的小麥播種面積為統(tǒng)計(jì)數(shù)據(jù)驗(yàn)證提取結(jié)果。
表2 樣本數(shù)據(jù)集
基于2021年2月1日至3月1日的Sentinel-1影像和Sentienl-2影像,制作了各類地物的目視解譯標(biāo)志,如表3所示。
表3 目視解譯標(biāo)志
本研究技術(shù)路線圖如圖3所示。首先利用GEE云平臺獲取多時相的遙感影像,構(gòu)建地物類型的光譜特征、極化特征和紋理特征,基于多種機(jī)器學(xué)習(xí)分類算法和深度循環(huán)神經(jīng)網(wǎng)絡(luò)對冬小麥樣本點(diǎn)進(jìn)行訓(xùn)練和精度驗(yàn)證,得出2021年黃淮海平原區(qū)域的冬小麥種植信息。
圖3 技術(shù)路線圖
隨機(jī)森林(Random forest, RF)是利用若干個決策樹對樣本進(jìn)行訓(xùn)練預(yù)測的一種分類方法,由多個Bagging集成學(xué)習(xí)技術(shù)訓(xùn)練得到的決策樹組成,對輸入的數(shù)據(jù)集進(jìn)行判別與分類,同時給出各個變量的重要性評分,評估變量在分類中所起的作用。該方法能夠在大數(shù)據(jù)集上運(yùn)行,具有極好的準(zhǔn)確率,能夠較為準(zhǔn)確地評估各個特征在分類中的重要性,解決了決策樹的性能瓶頸的問題,具有良好的并行性和擴(kuò)展性。樸素貝葉斯(Naive Bayes, NB)分類算法是貝葉斯分類算法中最為簡單和常見的分類方法,該方法假設(shè)每一個輸入的樣本數(shù)據(jù)集變量均為相互獨(dú)立的,極大簡化了算法復(fù)雜性,因此針對實(shí)際的數(shù)據(jù)中存在屬性或類別之間存在關(guān)聯(lián)的情況,其分類準(zhǔn)確率會降低[30]。支持向量機(jī)(Support vector machine, SVM)是一種按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二分類模型,通過尋找最優(yōu)的邊距超平面對輸入的樣本數(shù)據(jù)進(jìn)行分割,是一個監(jiān)督式學(xué)習(xí)的方法[31]。該方法適用小樣本學(xué)習(xí),計(jì)算的復(fù)雜性不取決于樣本的空間維數(shù),具有較好的魯棒性,提高了模型的泛化能力,但解決多分類問題較為困難,模型效果好壞與參數(shù)和核函數(shù)的選擇關(guān)系密切。決策樹(Decision tree, DT)劃分方法簡單,運(yùn)用遞歸思想,以信息熵為度量構(gòu)造熵值下降最快的樹,到葉子節(jié)點(diǎn)處熵值為0,是用概率分析的方法[32]。
本研究基于GEE平臺運(yùn)用Sentinel-1 SAR雷達(dá)影像和Sentienl-2光學(xué)影像進(jìn)行月度均值合成,基于返青期的光學(xué)遙感影像選擇監(jiān)督分類的樣本點(diǎn)。隨機(jī)森林的參數(shù)設(shè)置上,進(jìn)行Grid Search調(diào)參,尋找分類的最佳參數(shù),通過調(diào)參結(jié)果與冬小麥提取的精度、與統(tǒng)計(jì)數(shù)據(jù)的誤差以及計(jì)算效率,將決策樹的數(shù)量設(shè)置為80,決策樹最大深度為7。隨機(jī)森林模型通過調(diào)用GEE平臺接口ee.Classifier.smileRandomForest實(shí)現(xiàn),樸素貝葉斯、支持向量機(jī)、決策樹模型均基于SKlearn框架構(gòu)建,編程語言為Python。支持向量機(jī)算法參數(shù)設(shè)置懲罰系數(shù)為1.0,核函數(shù)類型為‘rbf’,gamma值為1/13;決策樹模型采用CART決策樹分類,分裂評價(jià)指數(shù)為基尼系數(shù)(Gini);樸素貝葉斯算法選用高斯樸素貝葉斯,該方法不需要進(jìn)行參數(shù)設(shè)置。
冬小麥的識別精度結(jié)果通常采用兩種精度評價(jià)方法。常用的遙感分類結(jié)果的驗(yàn)證方法為混淆矩陣(Confusion matrix)。分類結(jié)果評價(jià)精度的指標(biāo)主要包括總體分類精度(Overall accuracy,OA),Kappa系數(shù)以及各個類別的制圖精度(Producer’s accuracy, PA)、用戶精度(User’s accuracy, UA)。Kappa系數(shù)是可以衡量總體分類精度的指標(biāo),綜合了用戶精度和生產(chǎn)者精度兩個精度的評價(jià)參數(shù)。取值范圍在-1和1之間,值越大圖像分類精度越高,說明分類效果越好。
2.4.1LSTM網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network, RNN)是一種用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。長短時記憶網(wǎng)絡(luò)(Long short term memory network, LSTM)是一種改進(jìn)之后的深度循環(huán)神經(jīng)網(wǎng)絡(luò),可以解決RNN無法處理長距離的依賴的問題,相比RNN結(jié)構(gòu),LSTM循環(huán)結(jié)構(gòu)能夠在長序列中展示更好的結(jié)果。該網(wǎng)絡(luò)的每個循環(huán)結(jié)構(gòu)有2個輸出,由輸入門、遺忘門、輸出門和單元狀態(tài)組成,不斷保持一個持久的單元狀態(tài)進(jìn)行傳遞,決定信息是否遺忘或繼續(xù)傳遞[33]。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。圖中xt是當(dāng)前時刻模塊的輸入值,ht是當(dāng)前模塊的輸出值,it、ot、ft分別對應(yīng)輸入門、輸出門和遺忘門,gt為當(dāng)前時刻的記憶。輸入門決定當(dāng)前網(wǎng)絡(luò)的輸入有多少內(nèi)容保存到單元狀態(tài)ct中,遺忘門主要用于計(jì)算上一時刻單元狀態(tài)ct-1保留多少內(nèi)容到當(dāng)前時刻狀態(tài)ct,而輸出則控制當(dāng)前狀態(tài)ct有多少內(nèi)容會輸出到下一階段LSTM模塊中(即ht)。
圖4 LSTM網(wǎng)絡(luò)結(jié)構(gòu)
2.4.2Bi-LSTM網(wǎng)絡(luò)
雙向長短記憶網(wǎng)絡(luò)(Bi-LSTM)是循環(huán)神經(jīng)網(wǎng)絡(luò)的一種擴(kuò)展形式,由前向LSTM與后向LSTM組合而成,實(shí)際的模型應(yīng)用中,預(yù)測需要考慮完整的上下文信息,需要使用完整的輸入序列信息,因此采用雙向的循環(huán)神經(jīng)網(wǎng)絡(luò)建模上下文信息,前向LSTM和后向LSTM層輸出向量可以使用相加、平均值或連接等方式進(jìn)行處理(圖5)[34]。
圖5 Bi-LSTM結(jié)構(gòu)圖
運(yùn)用4種機(jī)器學(xué)習(xí)方法對研究區(qū)進(jìn)行冬小麥識別,得到研究區(qū)冬小麥分類精度OA如表4所示。
表4 不同機(jī)器學(xué)習(xí)分類器冬小麥分類精度比較
由表4可知隨機(jī)森林在4種機(jī)器學(xué)習(xí)方法中提取精度最高。黃淮海平原冬小麥面積分層圖和冬小麥空間位置分布圖如圖6所示。
圖6 2021年黃淮海平原冬小麥面積分層、空間分布圖
在ArcMap上對分類結(jié)果圖進(jìn)行多維分析處理,對各省市的冬小麥面積進(jìn)行統(tǒng)計(jì)。圖7為黃淮海平原冬小麥種植面積的縣級分布分層統(tǒng)計(jì)圖,由淺到深的顏色表示冬小麥種植面積由少及多。對每個研究區(qū)內(nèi)的冬小麥種植面積求和,將其相加得到黃淮海平原冬小麥種植總面積,并計(jì)算每個研究區(qū)的種植面積在總面積中的比例,計(jì)算式為
圖7 冬小麥種植面積的縣級分布分層統(tǒng)計(jì)圖
(1)
(2)
式中W——黃淮海平原冬小麥種植面積
Wi——研究區(qū)i的冬小麥種植總面積
αi——研究區(qū)i冬小麥面積占總面積的比例
黃淮海平原冬小麥總面積為16 226 667 hm2,占研究區(qū)總面積的49.17%,研究區(qū)涵蓋的各市冬小麥播種面積統(tǒng)計(jì)數(shù)據(jù)總和約為15 690 949.13 hm2,為檢驗(yàn)提取準(zhǔn)確性,計(jì)算相對誤差為3.41%。5個研究區(qū)中,河南省的冬小麥種植面積最多,約為4 647 334 hm2,占黃淮海平原冬小麥總種植面積的28.64%;江蘇省次之,約為3 427 012 hm2,占黃淮海平原冬小麥總種植面積的21.12%;京津冀地區(qū)種植面積最少,約為1 886 401 hm2,僅占總面積的11.63%;山東省、安徽省的冬小麥種植面積分別占黃淮海平原冬小麥總種植面積的19.77%、18.84%。本研究黃淮海地區(qū)的各省冬小麥提取面積相對誤差均在5%以內(nèi),由文獻(xiàn)[15]可知,相對誤差在5%以內(nèi)即為提取誤差較小、提取效果較好。黃淮海平原的冬小麥種植分布呈現(xiàn)一種由東向西、由南向北遞減的趨勢。
基于隨機(jī)森林的消融實(shí)驗(yàn)是通過對比單一傳感器和多傳感器遙感數(shù)據(jù)的冬小麥分類識別精度,僅使用月度均值合成的Sentinel-1 SAR數(shù)據(jù),總體精度為87.38%,Kappa系數(shù)為0.763 8;僅使用月度均值合成的Sentinel-2光學(xué)數(shù)據(jù),其總體精度為93.95%,Kappa系數(shù)為0.972 0;而以Sentinel-1和Sentinel-2多源遙感數(shù)據(jù)為數(shù)據(jù)源,選擇多時相影像在月尺度上進(jìn)行均值合成,得到的冬小麥分類結(jié)果為總體精度為94.30%,Kappa系數(shù)為0.978 4。因此融合時序Sentinel主被動遙感數(shù)據(jù)能夠提高分類總體精度和冬小麥的識別精度。
本實(shí)驗(yàn)的深度學(xué)習(xí)框架為Tensorflow 2.3.0、Keras 2.4.3。操作系統(tǒng)為Ubuntu 18.04,CPU為Intel Core i7-9700K @ 3.60 GHz,GPU為NVIDIA RTX 2080ti。編程語言及版本為Python 3.7.0,學(xué)習(xí)率為10-5,迭代次數(shù)為2 000次,批處理大小為1 000,損失函數(shù)為交叉熵,優(yōu)化函數(shù)為Adam。
基于深度學(xué)習(xí)的LSTM和Bi-LSTM網(wǎng)絡(luò)架構(gòu)進(jìn)行冬小麥識別提取研究,隨機(jī)森林、LSTM和Bi-LSTM模型的冬小麥識別精度分別為94.30%、93.73%、93.87%,表明深度學(xué)習(xí)的冬小麥識別精度略低于機(jī)器學(xué)習(xí)隨機(jī)森林方法,所以進(jìn)行深度學(xué)習(xí)與機(jī)器學(xué)習(xí)的泛化性對比實(shí)驗(yàn)。本研究只嘗試了LSTM系列模型,并不能完全代表所有的深度學(xué)習(xí)模型的冬小麥分類精度均低于隨機(jī)森林方法。
為探究機(jī)器學(xué)習(xí)算法對新樣本的適應(yīng)能力,將具有同一規(guī)律的其他數(shù)據(jù)集輸入已經(jīng)訓(xùn)練好的網(wǎng)絡(luò),判斷輸出結(jié)果的優(yōu)劣即為模型的泛化能力。對在某一省份已訓(xùn)練好的網(wǎng)絡(luò)中輸入另一省份的冬小麥樣本數(shù)據(jù)集,并輸出精度,得到基于隨機(jī)森林方法泛化結(jié)果(表5),將5個區(qū)域矩陣對角線精度計(jì)算平均值,得到在原本區(qū)域的預(yù)測結(jié)果為99.11%;對角線以外的其余精度的平均值代表在其他區(qū)域的預(yù)測能力,二者對比即泛化能力,分別為90.98%、94.09%、92.63%、87.63%、92.44%。由此說明,隨機(jī)森林只在原本實(shí)驗(yàn)區(qū)域預(yù)測精度較高,在其他區(qū)域的識別精度較低,泛化性低。
表5 隨機(jī)森林方法泛化實(shí)驗(yàn)結(jié)果
基于深度循環(huán)神經(jīng)網(wǎng)絡(luò)方法Bi-LSTM的泛化實(shí)驗(yàn)結(jié)果如表6所示,得出深度學(xué)習(xí)在原本區(qū)域的預(yù)測精度為96.65%,對角線以外的其余精度的平均值代表其在其他區(qū)域的預(yù)測能力,分別為93.72%、96.00%、94.39%、90.84%、95.24%。由此說明,深度學(xué)習(xí)的泛化能力在5個區(qū)域均高于隨機(jī)森林方法,深度學(xué)習(xí)在其他地區(qū)的泛化性高于隨機(jī)森林的泛化性,隨機(jī)森林只在當(dāng)前實(shí)驗(yàn)區(qū)域識別精度較高,在其他區(qū)域的識別精度較低。
表6 深度學(xué)習(xí)的Bi-LSTM泛化實(shí)驗(yàn)結(jié)果
(1)黃淮海平原冬小麥總面積為16 226 667 hm2,其中河南省的冬小麥種植面積最多,約為4 647 334 hm2;黃淮海平原的冬小麥種植分布呈現(xiàn)一種由東向西、由南向北遞減的趨勢。
(2)河南省的冬小麥種植面積最多,占黃淮海平原冬小麥總種植面積的28.64%;京津冀地區(qū)種植面積最少,僅占總面積的11.63%。
(3)隨機(jī)森林在4種機(jī)器學(xué)習(xí)方法中識別精度最高,總體分類精度為94.30%,其他機(jī)器學(xué)習(xí)方法的總體分類精度分別為決策樹92.20%,樸素貝葉斯88.20%,支持向量機(jī)91.40%。
(4)融合時序Sentinel主被動遙感數(shù)據(jù)能夠提高分類總體精度和冬小麥的識別精度。
(5)在大范圍的冬小麥分類上,深度學(xué)習(xí)模型的泛化性高于機(jī)器學(xué)習(xí)方法。隨機(jī)森林泛化性較低,并只在當(dāng)前實(shí)驗(yàn)區(qū)域識別精度較高,在其他區(qū)域的識別精度較低。