摘要:為實(shí)現(xiàn)東北黑土區(qū)田塊尺度上玉米產(chǎn)量的精準(zhǔn)估算與生育時(shí)期優(yōu)選,本研究以我國東北黑土區(qū)的春玉米為研究對(duì)象,選取吉林省梨樹縣的長期定位玉米試驗(yàn)田,于2019、2020年利用無人機(jī)采集玉米3個(gè)關(guān)鍵生育時(shí)期(拔節(jié)期、吐絲期、成熟期)的冠層高光譜影像,選取10種與產(chǎn)量顯著相關(guān)的窄波段植被指數(shù),并結(jié)合作物農(nóng)學(xué)參數(shù)與施肥信息,分別采用逐步回歸、隨機(jī)森林(RF)和極度梯度提升樹(XGBoost)算法構(gòu)建玉米產(chǎn)量估算模型。最后通過決定系數(shù)(R2)、均方根誤差(RMSE)和歸一化均方根誤差(NRMSE)對(duì)產(chǎn)量模型進(jìn)行精度評(píng)價(jià),以篩選出最優(yōu)估產(chǎn)模型。結(jié)果表明:3種產(chǎn)量預(yù)測(cè)模型中XGBoost模型估算精度較優(yōu),其2019年吐絲期的R2、RMSE 和NRMSE 分別為0.93、1 054.17 kg·hm-2和11.68%。同時(shí),3種模型均表現(xiàn)為在吐絲期估算精度最優(yōu),最佳模型——2019年吐絲期的XGBoost模型中用于玉米產(chǎn)量估算的指示因子——植被指數(shù)R-M、作物農(nóng)學(xué)參數(shù)與施肥信息的特征重要性分別為19.72%、4.70%、62.41%。研究表明,結(jié)合無人機(jī)影像與機(jī)器學(xué)習(xí)算法并融合多源輔助信息可提高田塊尺度玉米產(chǎn)量的估算精度,為農(nóng)業(yè)生產(chǎn)中的作物產(chǎn)量精準(zhǔn)預(yù)估提供數(shù)據(jù)支撐與科學(xué)參考。
關(guān)鍵詞:無人機(jī);高光譜影像;田塊尺度;玉米;產(chǎn)量;機(jī)器學(xué)習(xí)
中圖分類號(hào):S513;S127 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-6819(2025)01-0079-11 doi: 10.13254/j.jare.2023.0634
我國作為世界農(nóng)業(yè)大國之一,擁有2億~3億的小型農(nóng)戶家庭[1],在數(shù)量和面積有限的耕地上確保糧食安全并實(shí)現(xiàn)農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。東北黑土區(qū)作為我國重要的糧食生產(chǎn)優(yōu)勢(shì)區(qū)及商品糧供給地,也是小型農(nóng)戶的集中分布區(qū),其土壤養(yǎng)分含量豐富,物理性狀優(yōu)良。春玉米是東北黑土區(qū)的主要糧食作物之一,每年玉米產(chǎn)量占全國總產(chǎn)量的1/4,黑土區(qū)的玉米產(chǎn)量直接影響到我國東北“糧倉”的安全問題[2]。因此,及時(shí)準(zhǔn)確地預(yù)估東北黑土區(qū)田塊尺度的玉米產(chǎn)量對(duì)于優(yōu)化農(nóng)田管理方式、保障國家糧食安全等具有重要指導(dǎo)意義。
玉米產(chǎn)量的傳統(tǒng)估算方法多采用實(shí)地采樣法,其費(fèi)時(shí)、費(fèi)力,且具有破壞性,難以由單點(diǎn)擴(kuò)大到區(qū)域尺度。遙感技術(shù)具有監(jiān)測(cè)面積大、動(dòng)態(tài)、快速等優(yōu)勢(shì),在農(nóng)作物精準(zhǔn)估產(chǎn)方面逐漸得到廣泛應(yīng)用。其中無人機(jī)因分辨率高、時(shí)效性強(qiáng),彌補(bǔ)了衛(wèi)星重訪周期長、易受天氣干擾等不足,近幾年在對(duì)田間作物長勢(shì)的監(jiān)測(cè)中效果較好,已被廣泛應(yīng)用于對(duì)多種作物如玉米[3]、水稻[4]等的長勢(shì)監(jiān)測(cè)與產(chǎn)量估算中。無人機(jī)遙感平臺(tái)搭載的傳感器目前多為RGB數(shù)碼相機(jī)、熱紅外、多光譜和高光譜相機(jī)等,其中高光譜遙感操作簡(jiǎn)單方便,可實(shí)時(shí)進(jìn)行大面積監(jiān)測(cè),使得目標(biāo)物的光譜信息可被有效獲取與精細(xì)表達(dá),有望進(jìn)一步提高作物產(chǎn)量的估算精度[5]。但是,由于高光譜影像的數(shù)據(jù)量巨大,目前采用何種模型方法可有效挖掘其中隱藏的光譜特征,以表征作物在不同生長階段的生理特征狀況,并選擇合適的生育期提前預(yù)估其產(chǎn)量信息,仍具有一定的挑戰(zhàn)。
近年來,植被指數(shù)已被廣泛用于對(duì)作物長勢(shì)監(jiān)測(cè)、產(chǎn)量預(yù)測(cè)等領(lǐng)域[6-7]。其中,基于可見光和近紅外波段的植被指數(shù)應(yīng)用最為廣泛[8],如歸一化差異植被指數(shù)(Normalized Difference Vegetation Index,NDVI)和增強(qiáng)型植被指數(shù)(Enhanced Vegetation Index,EVI)等[9]。隨著高光譜遙感技術(shù)的發(fā)展,窄波段植被指數(shù)逐漸被開發(fā)并應(yīng)用于對(duì)植被狀況的監(jiān)測(cè)中,且表現(xiàn)得比寬波段植被指數(shù)更為敏感。例如,Marshall等[10]比較了寬波段植被指數(shù)和窄波段植被指數(shù)在估算作物生物量中的表現(xiàn),結(jié)果表明窄波段植被指數(shù)可以解釋的作物變異情況比寬波段植被指數(shù)多3%~33%。然而,窄波段植被指數(shù)在對(duì)東北黑土區(qū)玉米產(chǎn)量估算中的表現(xiàn)尚不清楚。
國內(nèi)外很多學(xué)者嘗試?yán)枚喾N模型進(jìn)行作物產(chǎn)量的精確估算,常見的有多元線性回歸(Multiple LinearRegression,MLR)[11]、偏最小二乘回歸(Partial LeastSquares Regression,PLSR)[12]等經(jīng)典統(tǒng)計(jì)模型和支持向量機(jī)(Support Vector Machines,SVM)[13]、隨機(jī)森林(Random Forest,RF)[14]等機(jī)器學(xué)習(xí)模型。目前應(yīng)用線性模型的研究較為廣泛,如韓文霆等[15]采用牛頓-梯形積分和最小二乘法構(gòu)建了夏玉米產(chǎn)量的6種線性模型,最優(yōu)估算精度達(dá)到R2=0.80,RMSE=413.29 kg·hm-2。但是,由于作物產(chǎn)量與指示因子的關(guān)系未必均表現(xiàn)為線性,因此近年來非線性模型方法也開始受到研究者的關(guān)注。如申洋洋等[16]利用72種植被指數(shù)建立多種冬小麥產(chǎn)量的估算模型,發(fā)現(xiàn)RF模型的估算精度優(yōu)于逐步多元線性回歸(Stepwise Multiple LinearRegression,SMLR)和PLSR模型。
由于各地的作物品種、地形和氣候等條件不盡相同,田間輪作與間作方式復(fù)雜多樣,我國農(nóng)田土壤在一定范圍內(nèi)又表現(xiàn)出高度的空間異質(zhì)性,因此探討結(jié)合田間管理等信息的產(chǎn)量估算預(yù)期可提升對(duì)作物產(chǎn)量的估算精度。Zhang等[1]通過由衛(wèi)星遙感影像提取的植被指數(shù),結(jié)合地表溫度、累積降水和標(biāo)準(zhǔn)化降水指數(shù),構(gòu)建估產(chǎn)模型,并確定了輸入變量的最優(yōu)組合和玉米產(chǎn)量估算的最佳方法。張少華等[17]基于溫度參數(shù)、坡度信息和植被指數(shù)等多模態(tài)數(shù)據(jù)構(gòu)建小麥的估產(chǎn)模型,發(fā)現(xiàn)多種數(shù)據(jù)相融合的模型估算效果更優(yōu)。相關(guān)研究表明,在提取植被指數(shù)的同時(shí),加入一些作物輔助信息或可提高對(duì)作物產(chǎn)量的估算精度。然而,目前在田塊尺度將土壤屬性、植株特征及農(nóng)田管理措施等因素加入產(chǎn)量估算模型,以提高作物產(chǎn)量估算精度的研究還鮮有報(bào)道。
綜上,本研究以位于吉林省梨樹縣不同施氮處理的玉米試驗(yàn)田為研究區(qū),基于在玉米關(guān)鍵生育時(shí)期采集的無人機(jī)高光譜影像,利用提取的多種窄波段植被指數(shù),并融入植株長勢(shì)、施肥處理等輔助信息,采用線性模型(SMLR)與機(jī)器學(xué)習(xí)模型(RF,XGBoost)構(gòu)建產(chǎn)量估算模型,最終實(shí)現(xiàn)對(duì)東北黑土區(qū)田塊尺度上玉米產(chǎn)量的精準(zhǔn)估算與預(yù)估生育時(shí)期優(yōu)選。本研究結(jié)果可為精準(zhǔn)農(nóng)田養(yǎng)分管理與產(chǎn)量預(yù)測(cè)提供基礎(chǔ)數(shù)據(jù)與技術(shù)支持,為保護(hù)黑土地資源及保障國家糧食安全提供決策信息。
1 材料與方法
1.1 研究區(qū)概況與試驗(yàn)設(shè)計(jì)
梨樹縣(123°45′~124°53′E,43°02′~43°46′N)隸屬于吉林省四平市,地勢(shì)東南高、西北低。該縣域?qū)俦睖貛О霛駶櫞箨懠撅L(fēng)性氣候,四季分明,雨熱同季,作物生長期日照、降水較充足,年均日照時(shí)數(shù)2 644.2h,其中作物生長季節(jié)為4—9 月,平均日照8 h。試驗(yàn)于2019、2020 年在吉林省四平市梨樹縣(圖1)的付家街(b)、王家橋(c)和三棵樹(d)3個(gè)小區(qū)進(jìn)行,其土壤類型分別為砂土、沖積土和黏土。2019及2020年當(dāng)?shù)赜衩咨冢?月1日—10月1日)的平均氣溫和總降水量分別為20.62°、15.53 ℃和2 951、585.4 mm。如圖1所示,3個(gè)試驗(yàn)地分別包含有15個(gè)小區(qū),每個(gè)小區(qū)的面積為60 m2(10.0 m×6.0 m),每兩個(gè)小區(qū)間的溝距為0.6 m。3個(gè)試驗(yàn)地共設(shè)5個(gè)施氮水平(0 N:0 kg·hm-2,168 N:168 kg·hm-2,240 N:240 kg·hm-2,270 N:270 kg·hm-2,312 N:312 kg·hm-2)(圖1),其中氮肥一半基施,一半追施;磷肥[Ca(H2PO4)2 ]與鉀肥(K2SO4)作為基肥一次性施用,磷肥與鉀肥分別施用P2O5 100kg·hm-2和K2O 120 kg·hm-2;追肥在拔節(jié)期施于距壟約15 cm、深0~10 cm 的土層中。本試驗(yàn)中各小區(qū)玉米供試品種均為良玉99,遺傳性狀及指標(biāo)相同,種植密度為每公頃65 000株,且未采取灌溉措施,未噴灑農(nóng)藥。
1.2 植株樣品的采集與測(cè)定
為測(cè)定不同生育時(shí)期植株的全氮含量、株高、鮮質(zhì)量、干質(zhì)量,保證田間采集的數(shù)據(jù)均勻且具代表性,分別于3個(gè)關(guān)鍵生育時(shí)期在各小區(qū)中心1 m2 區(qū)域內(nèi)任意取3株玉米(圖2),取上述各指標(biāo)的平均值作為一組數(shù)據(jù),共獲得270個(gè)小區(qū)樣本。其中,葉片的全氮含量用KDY-9 820型凱氏定氮儀測(cè)量[4];株高為從地表到頂葉的距離,對(duì)整個(gè)植株樣本稱量,得到鮮質(zhì)量,在80 ℃烤箱中烘干至恒質(zhì)量,稱量得干質(zhì)量。于成熟期測(cè)產(chǎn),將玉米棒脫粒曬干至恒質(zhì)量,然后根據(jù)各小區(qū)的平均產(chǎn)量與作物種植密度計(jì)算各小區(qū)的產(chǎn)量,共獲取90組產(chǎn)量數(shù)據(jù)。
1.3 無人機(jī)影像的采集與預(yù)處理
無人機(jī)飛行試驗(yàn)在天氣晴朗、無風(fēng)無云的環(huán)境下進(jìn)行,分別于2019年6月23日、8月1日和9月28日,及2020年6月28日、8月14日和9月24日的10:00—15:00使用大疆S1 000六旋翼無人機(jī),并搭載CubertGmbH 公司的UHD 185 傳感器進(jìn)行影像的采集(圖3)。飛行高度為100 m,旁向重疊度與航向重疊度分別為60%、80%。采用畫幅式實(shí)時(shí)成像光譜儀生成影像,空間分辨率是5 cm,光譜范圍450~920 nm,帶寬4nm,光譜通道126個(gè)。光譜儀鏡頭為聚焦25 mm,對(duì)應(yīng)的視場(chǎng)角約為13°。
本研究采集并拼接1 809張高光譜圖像,獲得影像后采用Agisoft Photoscan Pro軟件進(jìn)行圖像排列、密集點(diǎn)云構(gòu)建、正射影像生成等操作。然后,利用ENVI5.1軟件中的FLAASH(Fast Line-of-sight-AtmosphericAnalysis of Spectral Hypercubes)模塊進(jìn)行大氣校正,從而消除部分誤差。在ArcGIS 10.6 軟件中均勻選取30個(gè)地面控制點(diǎn)對(duì)影像進(jìn)行幾何精準(zhǔn)校正,使均方根誤差(RMSE)均小于0.5個(gè)像元。
1.4 指示因子的選取
根據(jù)文獻(xiàn)查詢結(jié)果,初步選取43種可表征玉米產(chǎn)量的窄波段植被指數(shù),經(jīng)與各小區(qū)的產(chǎn)量實(shí)測(cè)值進(jìn)行相關(guān)分析,最終確定10種與產(chǎn)量顯著相關(guān)的窄波段植被指數(shù)(表1)。另外,同時(shí)選取相關(guān)植株特征(植株全氮、株高、鮮質(zhì)量、干質(zhì)量)及施肥信息作為產(chǎn)量的估算指標(biāo),加入后續(xù)產(chǎn)量估算模型,并對(duì)所有數(shù)據(jù)集進(jìn)行離差標(biāo)準(zhǔn)化處理。
1.5 玉米產(chǎn)量的估算模型
為了比較不同生育時(shí)期玉米產(chǎn)量的估算效果,本研究分別建立了2019年和2020年拔節(jié)期、吐絲期、成熟期及全生育期的玉米產(chǎn)量估算模型。按7∶3的比例將數(shù)據(jù)全集分為訓(xùn)練和測(cè)試數(shù)據(jù)集,分別采用逐步回歸、隨機(jī)森林和XGBoost模型對(duì)付家街、王家橋和三棵樹村的玉米產(chǎn)量進(jìn)行估算。上述所有模型均在R軟件中實(shí)現(xiàn)。
1.5.1 逐步回歸模型
逐步回歸模型是作物生理參數(shù)反演的常用方法,先從各變量中自動(dòng)選取相對(duì)最重要的變量,由大到小依次引入回歸方程,每引入一個(gè)解釋變量,同時(shí)對(duì)剩余變量進(jìn)行檢驗(yàn),去除不顯著的自變量,多次重復(fù)操作,直至建立最優(yōu)多元線性回歸方程[28]。
1.5.2 隨機(jī)森林模型
隨機(jī)森林(RF)是一套基于決策樹分類器的融合算法,利用Bootstrap 重抽樣方法從原始樣本數(shù)據(jù)集中重復(fù)隨機(jī)抽取多個(gè)樣本,對(duì)每個(gè)Bootstrap樣本數(shù)據(jù)采用完全分裂方式構(gòu)建決策樹,然后將決策樹中出現(xiàn)的最佳結(jié)果作為最終預(yù)測(cè)結(jié)果[29]。
1.5.3 XGBoost模型
XGBoost是一種梯度提升樹模型,與獨(dú)立訓(xùn)練每棵樹的RF 模型不同,XGBoost 通過優(yōu)化損失函數(shù)和復(fù)雜度來改進(jìn)目標(biāo)優(yōu)化函數(shù),可以防止過度擬合,在采樣點(diǎn)稀疏的情況下也能做出穩(wěn)定的預(yù)測(cè)[30]。
1.6 指示因子的重要性評(píng)價(jià)
特征重要性指變量對(duì)模型擬合精度貢獻(xiàn)率的大小,值越大表示越重要,比如在RF模型中,其特征重要性為相對(duì)重要性,總和為1[31]。RF模型可以根據(jù)驗(yàn)證集的預(yù)算誤差對(duì)各指示因子的相對(duì)重要性進(jìn)行排序,其計(jì)算公式如下:
2 結(jié)果與分析
2.1 指示因子與產(chǎn)量的相關(guān)性分析
在玉米關(guān)鍵生育時(shí)期將光譜指數(shù)、作物農(nóng)學(xué)參數(shù)、土壤屬性和施肥等指示因子與產(chǎn)量進(jìn)行相關(guān)性分析,并繪制相關(guān)性熱圖(圖4)。由此篩選得出12個(gè)與產(chǎn)量顯著相關(guān)的指示因子,分別包括10種植被指數(shù)、施肥量和株高,因有機(jī)質(zhì)等土壤屬性與產(chǎn)量均表現(xiàn)為不顯著相關(guān),故其不再參與后續(xù)的模型構(gòu)建。如圖4所示,本試驗(yàn)所選指示因子在各生育時(shí)期均與產(chǎn)量呈顯著相關(guān)(Plt;0.05)。在2019年拔節(jié)期,施肥、Maccioni與產(chǎn)量的相關(guān)系數(shù)最高,分別為0.76、0.54(Plt;0.001),2019年吐絲期、成熟期及2020年拔節(jié)期、吐絲期各因子均與產(chǎn)量表現(xiàn)為顯著相關(guān)(Plt;0.01),2020年成熟期,除NDI、R-M、VOG外,其他因子亦均與產(chǎn)量呈顯著相關(guān)關(guān)系(Plt;0.01)。總體上,施肥與玉米產(chǎn)量的相關(guān)性最強(qiáng);在吐絲期各指示因子與產(chǎn)量的相關(guān)性相對(duì)較強(qiáng)。
2.2 玉米產(chǎn)量估算模型的構(gòu)建與驗(yàn)證
本研究通過逐步回歸、RF、XGBoost 模型,基于2019年和2020年獲取的玉米冠層光譜指數(shù)、作物農(nóng)學(xué)參數(shù)、施肥,構(gòu)建了玉米3個(gè)關(guān)鍵生育時(shí)期及全生育期的產(chǎn)量估算模型,各預(yù)測(cè)模型在不同生育時(shí)期的精度評(píng)價(jià)結(jié)果如表2 所示。XGBoost 模型在2019年吐絲期估算結(jié)果最佳,R2 和RMSE 分別為0.93、1 054.17 kg·hm-2;RF模型對(duì)2019年成熟期的估算精度最高,R2是0.90,RMSE 是1 123.63 kg·hm-2;逐步回歸模型最佳估算結(jié)果在2020年吐絲期,其R2和RMSE分別為0.88、1 354.73 kg·hm-2。綜合兩年數(shù)據(jù)來看,XGBoost 模型表現(xiàn)最佳,逐步回歸與RF 模型的精度略低,但也可滿足對(duì)產(chǎn)量估算的精度要求。
為了驗(yàn)證玉米產(chǎn)量的估算精度,本研究利用最佳產(chǎn)量估算模型(XGBoost)數(shù)據(jù)驗(yàn)證集,得到不同生育時(shí)期玉米產(chǎn)量實(shí)測(cè)值與預(yù)測(cè)值的散點(diǎn)圖(圖5)。如圖5 所示,2019 年吐絲期的產(chǎn)量估算結(jié)果最佳(R2=0.93,RMSE=1 054.17 kg · hm-2,NRMSE=11.68%);2020年吐絲期和成熟期估產(chǎn)精度相似,均明顯高于拔節(jié)期。兩年均表現(xiàn)為在吐絲期玉米產(chǎn)量的估算精度達(dá)到最高。此外,2019、2020年全生育期三個(gè)模型的R2 處于0.71~0.81 之間,RMSE 處于1 603.34~4 948.33 kg·hm-2,NRMSE 處于18.14%~55.99%。兼顧時(shí)效性與經(jīng)濟(jì)性,推薦將吐絲期作為玉米產(chǎn)量預(yù)測(cè)的最佳時(shí)期。
2.3 各指示因子的重要性評(píng)分
本研究選取在各生育時(shí)期產(chǎn)量估算精度最佳的XGBoost模型進(jìn)行指示因子相對(duì)重要性評(píng)分的計(jì)算,并將模型中各指示因子的相對(duì)重要性進(jìn)行統(tǒng)計(jì),結(jié)果如圖6所示。由圖6可見,在3類指示因子中,不同生育時(shí)期的植被指數(shù)、株高、施肥與玉米產(chǎn)量的相關(guān)性略有不同。在2019 年各生育時(shí)期和2020 年全生育期,均表現(xiàn)為施肥對(duì)估產(chǎn)模型的貢獻(xiàn)率最高。總體上,施肥、株高、Maccioni 3個(gè)指示因子的特征重要性評(píng)分最高。施肥對(duì)產(chǎn)量估算模型的貢獻(xiàn)率在2019年拔節(jié)期最高,為68.16%;株高的貢獻(xiàn)率在2020年成熟期達(dá)到最高,為41.47%;植被指數(shù)Maccioni 在2020年吐絲期對(duì)產(chǎn)量估算模型的貢獻(xiàn)率最高,為60.14%。2019年吐絲期的XGBoost模型中用于玉米產(chǎn)量估算的指示因子——植被指數(shù)R-M、作物農(nóng)學(xué)參數(shù)與施肥信息的特征重要性分別為19.72%、4.70%、62.41%。
3 討論
遙感技術(shù)憑借高效、無損、監(jiān)測(cè)范圍大等特點(diǎn),在農(nóng)作物估產(chǎn)方面表現(xiàn)突出,已成為精準(zhǔn)農(nóng)業(yè)的研究熱點(diǎn)。本研究選取高光譜影像作為數(shù)據(jù)源,探討結(jié)合施肥、作物農(nóng)學(xué)參數(shù)等指標(biāo)對(duì)玉米產(chǎn)量估算精度的影響,并對(duì)比了線性模型與機(jī)器學(xué)習(xí)模型在產(chǎn)量估算中的適用性?,F(xiàn)階段大多研究利用衛(wèi)星遙感技術(shù)進(jìn)行產(chǎn)量預(yù)估,但因其空間分辨率較低,只適用于大范圍測(cè)產(chǎn),在小區(qū)域監(jiān)測(cè)應(yīng)用中效果并不理想。無人機(jī)兼具高效和高空間分辨率等特點(diǎn),為快速、精準(zhǔn)估測(cè)作物產(chǎn)量提供了新的手段和途徑。本研究利用無人機(jī)平臺(tái)搭載高光譜相機(jī)獲取玉米在不同生育時(shí)期的影像數(shù)據(jù),具有快速、精準(zhǔn)等優(yōu)點(diǎn),這表明通過無人機(jī)高光譜影像進(jìn)行估產(chǎn)具有優(yōu)勢(shì)和潛力。韓文霆等[15]基于多時(shí)相無人機(jī)遙感植被指數(shù)構(gòu)建夏玉米產(chǎn)量估算的6種線性模型,單一生育時(shí)期中,表現(xiàn)最優(yōu)的植被指數(shù)為EVI2(R2=0.72,RMSE 為485.46 kg·hm-2)。本試驗(yàn)采用逐步回歸模型進(jìn)行玉米產(chǎn)量估算,其中單生育時(shí)期的最佳估算精度為R2=0.88,RMSE=1 354.73kg·hm-2,NRMSE=15.96%。目前研究中現(xiàn)有的產(chǎn)量估算模型多采用光譜信息、結(jié)構(gòu)信息、紋理信息和氣象信息中的一種或多種組合估算作物產(chǎn)量[33]。張少華等[17]利用多光譜遙感數(shù)據(jù),通過多模態(tài)數(shù)據(jù)相互融合并建立小麥的估產(chǎn)模型,結(jié)果表明將開花期溫度參數(shù)、坡度信息和植被指數(shù)相融合的RF模型估算效果最好(R2=0.89,RMSE=420.06 kg·hm-2);Zhang 等[1]結(jié)合衛(wèi)星衍生氣候數(shù)據(jù)以及植被指數(shù),利用深度學(xué)習(xí)方法構(gòu)建玉米產(chǎn)量估算模型,解釋了70%的產(chǎn)量變化,這些研究表明在提取植被指數(shù)的同時(shí)融入某些相關(guān)輔助信息或可提高對(duì)作物產(chǎn)量的估算精度。因此,本研究嘗試結(jié)合植被指數(shù)與作物農(nóng)學(xué)參數(shù)、施肥等信息進(jìn)行田塊尺度玉米產(chǎn)量的估算,以期提高對(duì)作物產(chǎn)量的估算精度。
作物的光譜反射率隨生育時(shí)期的變更而有所變化,基于波段計(jì)算的植被指數(shù)能間接反映作物在不同生育時(shí)期內(nèi)的生長狀態(tài);在不同生育時(shí)期植株的全氮、鮮質(zhì)量、干質(zhì)量、株高都有明顯變化,作物各器官的發(fā)育均影響玉米的最終產(chǎn)量;在相似的地力條件下,不同的施肥管理措施對(duì)作物產(chǎn)量具有較強(qiáng)影響。由于各生育時(shí)期內(nèi)玉米的生長狀態(tài)不同,這些指標(biāo)也隨之變化,因此基于各生育時(shí)期生成產(chǎn)量估算模型的精度也各不相同。拔節(jié)期為玉米的主要營養(yǎng)生長階段,其特征暫時(shí)還不明顯,不能完全反映后期產(chǎn)量器官的發(fā)育狀況,模型估算精度一般較低;吐絲期是玉米由營養(yǎng)生長轉(zhuǎn)為生殖生長的關(guān)鍵時(shí)期,所需養(yǎng)分較多,干物質(zhì)積累最快,一般此時(shí)玉米單生育時(shí)期的估產(chǎn)預(yù)算模型精度較高;在成熟期,營養(yǎng)物質(zhì)向籽粒轉(zhuǎn)移,葉綠素含量下降,通過影像提取的植被指數(shù)與作物產(chǎn)量的相關(guān)性降低[15],而部分作物農(nóng)學(xué)參數(shù)與產(chǎn)量的相關(guān)性上升,所以在此生育時(shí)期的估產(chǎn)模型還需要綜合多因素來考量,以期達(dá)到較優(yōu)的預(yù)估效果。本研究結(jié)果表明,整體上吐絲期的估產(chǎn)效果表現(xiàn)最優(yōu),此外,與拔節(jié)期和成熟期相比,全生育期的模型精度相對(duì)較低。這是由于2019 年和2020年當(dāng)?shù)赜衩资艿綐颖緮?shù)量、人為因素及異常氣候條件如臺(tái)風(fēng)、強(qiáng)降雨、高溫等因素影響,嚴(yán)重影響玉米生長,導(dǎo)致產(chǎn)量估算精度未達(dá)到預(yù)期效果。
為了更好地探討不同模型對(duì)玉米產(chǎn)量的估算效果,本研究基于光譜指數(shù)、作物農(nóng)學(xué)參數(shù)和施肥信息建立逐步回歸、RF和XGBoost 3種模型,并比較其對(duì)估算玉米產(chǎn)量的性能表現(xiàn),結(jié)果表明機(jī)器學(xué)習(xí)算法要優(yōu)于線性回歸模型,這與Leroux等[34]的研究結(jié)果相一致。逐步回歸模型雖可以描述變量與產(chǎn)量的線性關(guān)系,但會(huì)受到較多限制因素的影響,比如自變量之間的多重共線性,以及大多數(shù)自變量與產(chǎn)量間并非單純的線性關(guān)系,易造成估產(chǎn)模型的精度不高等問題[35]。RF 模型善于處理具有復(fù)雜非線性關(guān)系的數(shù)據(jù),使產(chǎn)量模型的估算能力增強(qiáng),且RF 模型訓(xùn)練速度快,可以處理高維度數(shù)據(jù),具有較高的準(zhǔn)確性與穩(wěn)定性。本研究綜合模型評(píng)價(jià)結(jié)果表明,XGBoost模型更適用于對(duì)田塊尺度玉米產(chǎn)量的估算,其模型估算最優(yōu)結(jié)果為R2=0.93,RMSE=1 054.17 kg·hm-2,表明其在融合多種輔助信息進(jìn)行作物產(chǎn)量估算方面具有很大優(yōu)勢(shì),或可考慮作為田塊尺度玉米產(chǎn)量估算的有效方法?;跓o人機(jī)高光譜影像并結(jié)合田間輔助信息,且采用合適的機(jī)器學(xué)習(xí)方法,可以精準(zhǔn)、高效地對(duì)田塊尺度的作物產(chǎn)量進(jìn)行估算。
4 結(jié)論
本研究基于在玉米關(guān)鍵生育時(shí)期獲取的無人機(jī)高光譜影像,通過逐步回歸、RF和XGBoost模型將植被指數(shù)、作物農(nóng)學(xué)參數(shù)和施肥信息相結(jié)合以進(jìn)行田塊尺度上玉米產(chǎn)量的精準(zhǔn)估算及預(yù)估生育時(shí)期的優(yōu)選。結(jié)論如下:
(1)植被指數(shù)、作物農(nóng)學(xué)參數(shù)和施肥在不同生育時(shí)期與產(chǎn)量的相關(guān)性有所不同,但大部分都表現(xiàn)為與產(chǎn)量顯著相關(guān)(Plt;0.01)??傮w上,施肥對(duì)產(chǎn)量預(yù)測(cè)模型精度的貢獻(xiàn)率要相對(duì)高于作物農(nóng)學(xué)參數(shù)及植被指數(shù),且CIre等表現(xiàn)優(yōu)異。
(2)對(duì)比3種不同的建模方法,XGBoost模型表現(xiàn)出較高的作物產(chǎn)量估算精度與穩(wěn)定性??梢姡瑱C(jī)器學(xué)習(xí)等智能算法具有較強(qiáng)的大數(shù)據(jù)處理能力,且能對(duì)變量之間存在的非線性關(guān)系進(jìn)行深入挖掘。
(3)對(duì)比不同生育時(shí)期,產(chǎn)量模型的估算精度由高到低依次為吐絲期、成熟期、拔節(jié)期,同時(shí)在吐絲期各模型的NRMSE 均低于21%,因此可將其作為玉米產(chǎn)量預(yù)估的最佳生育時(shí)期,提高產(chǎn)量模型估算性能。
參考文獻(xiàn):
[1] ZHANG L L, ZHANG Z, LUO Y C, et al. Integrating satellite-derived
climatic and vegetation indices to predict smallholder maize yield
using deep learning[J]. Agricultural and Forest Meteorology, 2021, 311:
108666.
[2] SUN T, LI Z Z. Alfalfa-corn rotation and row placement affects yield,
water use, and economic returns in northeast China[J]. Field Crops
Research, 2019, 241:107558.
[3] 蘇偉, 侯寧, 李琪, 等. 基于Sentinel-2遙感影像的玉米冠層葉面積
指數(shù)反演[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2018, 49(1):151-156. SU W, HOU
N, LI Q, et al. Retrieving leaf area index of corn canopy based on
Sentinel-2 remote sensing image[J]. Transactions of the Chinese Society
for Agricultural Machinery, 2018, 49(1):151-156.
[4] DUAN B, FANG S H, GONG Y, et al. Remote estimation of grain yield
based on UAV data in different rice cultivars under contrasting
climatic zone[J]. Field Crops Research, 2021, 267:108148.
[5] 王飛龍, 王福民, 胡景輝, 等. 基于相對(duì)光譜變量的無人機(jī)遙感水稻
估產(chǎn)及產(chǎn)量制圖[J]. 遙感技術(shù)與應(yīng)用, 2020, 35(2):458-468.
WANG F L, WANG F M, HU J H, et al. Estimating and mapping rice
yield using UAV-hyperspectral imager based relative spectral variates
[J]. Remote Sensing Technology and Application, 2020, 35(2):458-
468.
[6] ZHANG Y, XIA C Z, ZHANG X Y, et al. Estimating the maize biomass
by crop height and narrowband vegetation indices derived from UAVbased
hyperspectral images[J]. Ecological Indicators, 2021, 129:
107985-.
[7] KAMIR E, WALDNER F, HOCHMAN Z. Estimating wheat yields in
Australia using climate records, satellite image time series and
machine learning methods[J]. ISPRS Journal of Photogrammetry and
Remote Sensing, 2020, 160:124-135.
[8] BENAMI E, JIN Z N, CARTER M R, et al. Uniting remote sensing,
crop modelling and economics for agricultural risk management[J].
Nature Reviews Earth amp; Environment, 2021, 2:140-159.
[9] 黃祥麟. 青藏高原生長季植被NDVI對(duì)氣候變化的響應(yīng)研究[D]. 成
都:成都理工大學(xué), 2020:11 -12. HUANG X L. Response of
vegetation NDVI to climate change in growing season of Qinghai Tibet
Plateau[D]. Chengdu:Chengdu University of Technology, 2020:11-12.
[10] MARSHALL M, THENKABAIL P. Advantage of hyperspectral EO-1
Hyperion over multispectral IKONOS, GeoEye-1, WorldView-2,
Landsat ETM + , and MODIS vegetation indices in crop biomass
estimation[J]. ISPRS Journal of Photogrammetry and Remote Sensing,
2015, 108:205-218.
[11] 李朋磊, 張驍, 王文輝, 等. 基于高光譜和激光雷達(dá)遙感的水稻產(chǎn)
量監(jiān)測(cè)研究[J]. 中國農(nóng)業(yè)科學(xué), 2021, 54(14):2965-2976. LI P L,
ZHANG X, WANG W H, et al. Assessment of terrestrial laser
scanning and hyperspectral remote sensing for the estimation of rice
grain yield[J]. Scientia Agricultura Sinica, 2021, 54(14):2965-2976.
[12] 朱婉雪, 李仕冀, 張旭博, 等. 基于無人機(jī)遙感植被指數(shù)優(yōu)選的田
塊尺度冬小麥估產(chǎn)[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2018, 34(11):78-86.
ZHU W X, LI S J, ZHANG X B, et al. Estimation of winter wheat
yield using optimal vegetation indices from unmanned aerial vehicle
remote sensing[J]. Transactions of the Chinese Society of Agricultural
Engineering, 2018, 34(11):78-86.
[13] TIAN H R, WANG P X, TANSEY K, et al. An LSTM neural network
for improving wheat yield estimates by integrating remote sensing data
and meteorological data in the Guanzhong Plain, PR China[J].
Agricultural and Forest Meteorology, 2021, 310:108629.
[14] 陶惠林, 馮海寬, 楊貴軍, 等. 基于無人機(jī)數(shù)碼影像和高光譜數(shù)據(jù)
的冬小麥產(chǎn)量估算對(duì)比[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2019, 35(23):111-
118. TAO H L, FENG H K, YANG G J, et al. Comparison of winter
wheat yields estimated with UAV digital image and hyperspectral data
[J]. Transactions of the Chinese Society of Agricultural Engineering,
2019, 35(23):111-118.
[15] 韓文霆, 彭星碩, 張立元, 等. 基于多時(shí)相無人機(jī)遙感植被指數(shù)的
夏玉米產(chǎn)量估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2020, 51(1):148-155. HAN
W T, PENG X S, ZHANG L Y, et al. Summer maize yield estimation
based on vegetation index derived from multi-temporal UAV remote
sensing[J]. Transactions of the Chinese Society for Agricultural
Machinery, 2020, 51(1):148-155.
[16] 申洋洋, 陳志超, 胡昊, 等. 基于無人機(jī)多時(shí)相遙感影像的冬小麥
產(chǎn)量估算[J]. 麥類作物學(xué)報(bào), 2021, 41(10):1298-1306. SHEN Y
Y, CHEN Z C, HU H, et al. Estimation of winter wheat yield based on
UAV multi - temporal remote sensing image[J]. Journal of Triticeae
Crops, 2021, 41(10):1298-1306.
[17] 張少華, 段劍釗, 賀利, 等. 基于無人機(jī)平臺(tái)多模態(tài)數(shù)據(jù)融合的小
麥產(chǎn)量估算研究[J]. 作物學(xué)報(bào), 2022, 48(7):1746-1760. ZHANG
S H, DUAN J Z, HE L, et al. Wheat yield estimation from UAV
platform based on multi-modal remote sensing data fusion[J]. Acta
Agronomica Sinica, 2022, 48(7):1746-1760.
[18] LI F, MISTELE B, HU Y C, et al. Remotely estimating aerial N status
of phenologically differing winter wheat cultivars grown in contrasting
climatic and geographic zones in China and Germany[J]. Field Crops
Research, 2012, 138:21-32.
[19] GITELSON A A, KEYDAN G P, MERZLYAK M N. Three-band
model for noninvasive estimation of chlorophyll, carotenoids, and
anthocyanin contents in higher plant leaves[J]. Geophysical Research
Letters, 2006, 33(11):431-433.
[20] GITELSON A A, KAUFMAN Y J, MERZLYAK M N. Use of a green
channel in remote sensing of global vegetation from EOS-MODIS[J].
Remote Sensing of Environment, 1996, 58(3):289-298.
[21] MACCIONI A, AGATI G, MAZZINGHI P, et al. New vegetation
indices for remote measurement of chlorophylls based on leaf
directional reflectance spectra[J]. Journal of Photochemistry and
Photobiology, B:Biology, 2001, 61(1/2):52-61.
[22] DATT B. A new reflectance index for remote sensing of chlorophyll
content in higher plants:tests using Eucalyptus leaves[J]. Journal of
Plant Physiology, 1999, 154(1):30–36.
[23] KEARNEY M S, ROGERS A S, TOWNSHEND J R G, et al.
Developing a model for determining coastal marsh“health”[C]. Third
Thematic Conference on Remote Sensing for Marine and Coastal
Environments, Seattle:Washington, 1995.
[24] MISTELE B, GUTSER R, SCHMIDHALTER U, et al. Validation of
field-scaled spectral measurements of the nitrogen status in winter
wheat[C]. International Conference on Precision Agriculture amp; Other
Precision Resources Management, 2004.
[25] GUPTA R K, VIJAYAN D, PRASAD T S, et al. Comparative analysis
of red-edge hyperspectral indices[J]. Advances in Space Research,
2003, 32(11):2217-2222.
[26] GITELSON A A, VINA A, CIGANDA V, et al. Remote estimation of
canopy chlorophyll content in crops[J]. Geophysical Research Letters,
2005, 32(8):403.
[27] VOGELMANN J E, ROCK B N, MOSS D M, et al. Red edge spectral
measurements from sugar maple leaves[J]. International Journal of
Remote Sensing, 1993, 14(8):1563–1575.
[28] 張智韜, 王海峰, KARNIELI Arnon, 等. 基于嶺回歸的土壤含水率
高光譜反演研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2018, 49(5):240-248.
ZHANG Z T, WANG H F, ARNON K, et al. Inversion of soil moisture
content from hyperspectra based on ridge regression[J]. Transactions
of the Chinese Society for Agricultural Machinery, 2018, 49(5):240-
248.
[29] 張?zhí)忑垼?吳珊, 湯宏勝, 等. 化學(xué)計(jì)量學(xué)在激光誘導(dǎo)擊穿光譜分析
中的研究進(jìn)展[J]. 分析化學(xué), 2015, 43(6):939-948. ZHANG T L,
WU S, TANG H S, et al. Progress of chemometrics in laser-induced
breakdown spectroscopic analysis[J]. Chinese Journal of Analytical
Chemistry, 2015, 43(6):939-948.
[30] 范詩語, 耿子悅, 田芮綺, 等. 基于集成學(xué)習(xí)的上市企業(yè)違約風(fēng)險(xiǎn)
評(píng)價(jià)[J]. 統(tǒng)計(jì)與管理, 2021, 36(2):62-68. FAN S Y, GENG Z Y,
TIAN R Q, et al. Default risk assessment of listed companies based on
in tegrated learning[J]. Statistics and Management, 201, 36(2):62-
68.
[31] 方馨蕊, 溫兆飛, 陳吉龍, 等. 隨機(jī)森林回歸模型的懸浮泥沙濃度
遙感估算[J]. 遙感學(xué)報(bào), 2019, 23(4):756-772. FANG X R, WEN
Z F, CHEN J L, et al. Remote sensing estimation of suspended
sediment concentration based on Random Forest regression model[J].
Journal of Remote Sensing, 2019, 23(4):756-772.
[32] ANGERMUELLER C, PARNAMAA T, PARTS L, et al. Deep
learning for computational biology[J]. Molecular Systems Biology,
2016, 12(7):878.
[33] 劉媛. 基于時(shí)序無人機(jī)遙感影像的玉米產(chǎn)量估算研究[D]. 淮南:
安徽理工大學(xué), 2023. LIU Y. Study on corn yield estimation based
on time series UAV remote sensing images[D]. Huainan:Anhui
University of Science and Technology, 2023.
[34] LEROUX L, CASTETS M, BARON C, et al. Maize yield estimation in
west Africa from crop process-induced combinations of multi-domain
remote sensing indices[J]. European Journal of Agronomy, 2019, 108:
11-26.
[35] XU J X, MA J, TANG Y N, et al. Estimation of sugarcane yield using
a machine learning approach based on UAV-LiDAR data[J]. Remote
Sensing, 2020, 12(17):2823.
農(nóng)業(yè)資源與環(huán)境學(xué)報(bào)2025年1期