陸軍勝,陳紹民,黃文敏,胡田田
采用SEPLS_ELM模型估算夏玉米地上部生物量和葉面積指數(shù)
陸軍勝1,2,陳紹民1,2,黃文敏3,胡田田1,2※
(1. 西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點(diǎn)實(shí)驗(yàn)室,楊凌 712100;2. 西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院,楊凌 712100;3. 陜西省耕地質(zhì)量與農(nóng)業(yè)環(huán)境保護(hù)工作站,西安 710000)
利用高光譜數(shù)據(jù)進(jìn)行作物生長(zhǎng)狀況監(jiān)測(cè)具有無(wú)損和高效的特點(diǎn),是現(xiàn)代精準(zhǔn)農(nóng)業(yè)發(fā)展的必要手段。該研究以連續(xù)3 a(2018—2020年)不同水氮供應(yīng)下夏玉米營(yíng)養(yǎng)生長(zhǎng)期采集的212份植物樣品(地上部生物量和葉面積指數(shù))和高光譜實(shí)測(cè)數(shù)據(jù)為數(shù)據(jù)源,分別采用偏最小二乘回歸(Partial Least Squares Regression,PLS)、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)、隨機(jī)森林(Random Forest,RF)和基于PLS疊加策略的疊加極限學(xué)習(xí)機(jī)算法(Stacked Ensemble Extreme Learning Machine based on the PLS,SEPLS_ELM)構(gòu)建了夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)估算模型。結(jié)果表明:基于PLS和ELM構(gòu)建的夏玉米地上部生物量和葉面積指數(shù)估算模型的精度均較低,前者驗(yàn)證集2低于0.85、均方根誤差高于550 kg/hm2,后者2低于0.90、均方根誤差高于0.40 cm2/cm2。相比之下,基于RF和SEPLS_ELM構(gòu)建的夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)估算模型均有著較高的估算精度,SEPLS_ELM模型表現(xiàn)尤為突出,其地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2分別為0.955和0.969,均方根誤差分別為307.3 kg/hm2和0.24 cm2/cm2,表明疊加集成模型能夠充分利用高光譜數(shù)據(jù)并提高作物地上部生物量和葉面積指數(shù)估算精度。
高光譜;遙感;生物量;隨機(jī)森林;葉面積指數(shù);偏最小二乘;極限學(xué)習(xí)機(jī);疊加集成模型
生物量是作物生長(zhǎng)發(fā)育過(guò)程中光合作用的產(chǎn)物,能夠反映作物長(zhǎng)勢(shì)和營(yíng)養(yǎng)狀況,是作物產(chǎn)量形成的重要基礎(chǔ)[1-2]。葉面積指數(shù)是表征葉片疏密程度和冠層結(jié)構(gòu)特征的重要植被參數(shù),與作物蒸騰、光能截獲、光合速率、凈初級(jí)生產(chǎn)力等密切相關(guān),在氣候變化、凈初級(jí)生產(chǎn)力模型、作物生長(zhǎng)模型、生態(tài)模型以及水、碳循環(huán)研究中有著重要作用[3-5]。依據(jù)地上部生物量和葉面積指數(shù)不但能夠進(jìn)行作物長(zhǎng)勢(shì)監(jiān)測(cè)和產(chǎn)量預(yù)報(bào),而且能夠進(jìn)行田間水肥管理[6-8]。因此,快速、準(zhǔn)確地獲取地上部生物量和葉面積指數(shù)具有重要意義。
傳統(tǒng)的作物地上部生物量和葉面積指數(shù)獲取主要通過(guò)破壞性的人工測(cè)量,其過(guò)程繁瑣,耗時(shí)費(fèi)力,難以大面積推廣應(yīng)用。近年來(lái),遙感技術(shù)逐漸應(yīng)用于作物生理生態(tài)參數(shù)的提取,這為作物生物量和葉面積指數(shù)等參數(shù)的快速獲取提供了極大可能。如高林等[9]通過(guò)植被指數(shù)估算了冬小麥葉面積指數(shù);Zhou等[10]通過(guò)構(gòu)建新植被指數(shù)估算了馬鈴薯地上部生物量和葉面積指數(shù);Feng等[11]通過(guò)優(yōu)化的非線性植被指數(shù)估算了冬小麥葉面積指數(shù)。然而利用單一植被指數(shù)進(jìn)行作物生理生態(tài)參數(shù)反演時(shí),常常存在不同程度的飽和現(xiàn)象[12],此外單一植被指數(shù)往往包含有限的信息,使得生物量和葉面積指數(shù)估算時(shí)存在精度不高的問(wèn)題。為了解決單一植被指數(shù)信息量少,估算不準(zhǔn)確等問(wèn)題,崔日鮮等[13]通過(guò)構(gòu)建多個(gè)植被指數(shù)并利用BP神經(jīng)網(wǎng)絡(luò)和多元線性回歸估算了冬小麥地上部生物量;夏天等[14]通過(guò)分析冬小麥冠層光譜反射率與葉面積指數(shù)之間的相關(guān)性,選擇了敏感光譜波段的反射率作為BP神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行冬小麥葉面積指數(shù)估算并獲得了較高的估算精度;梁棟等[15]通過(guò)將植被指數(shù)(歸一化植被指數(shù)和比值植被指數(shù))與不同波段反射率數(shù)據(jù)(藍(lán)、綠、紅、近紅外4個(gè)波段)作為支持向量機(jī)的輸入進(jìn)行了冬小麥葉面積指數(shù)的估算。然而上述將敏感波段的光譜信息或者多個(gè)植被指數(shù)作為傳統(tǒng)回歸或機(jī)器學(xué)習(xí)方法的輸入變量進(jìn)行生物量或葉面積指數(shù)估算往往會(huì)舍棄大量的光譜信息,同時(shí)敏感波段的選擇常常需要一定的先驗(yàn)知識(shí),且數(shù)據(jù)處理過(guò)程較為復(fù)雜。
已有研究報(bào)道極限學(xué)習(xí)機(jī)能夠以非??斓乃俣群洼^少的人工干預(yù)學(xué)習(xí)出泛化能力較好的學(xué)習(xí)器[16],解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)參數(shù)選取復(fù)雜,容易陷入局部最優(yōu)的缺點(diǎn),在非線性擬合方面有著明顯的優(yōu)勢(shì),近年來(lái)廣泛應(yīng)用于作物生理生態(tài)參數(shù)反演,然而該算法在處理高維小樣本數(shù)據(jù)時(shí)存在預(yù)測(cè)精度低、誤差大和預(yù)測(cè)結(jié)果不穩(wěn)定等問(wèn)題[16]?;诖艘延醒芯繉⒐庾V曲線劃分為若干個(gè)子區(qū)間,使得每個(gè)子區(qū)間包含相對(duì)較少的波段數(shù)降低了高光譜數(shù)據(jù)維度,然后分別對(duì)每個(gè)子區(qū)間進(jìn)行獨(dú)立建模(子模型),最后依據(jù)一定的疊加策略進(jìn)行子模型疊加集成,提高了模型的預(yù)測(cè)精度[16-19]。如Shan等[17]分別采用贏者通吃、非負(fù)約束最小二乘和偏最小二乘加權(quán)策略進(jìn)行了相關(guān)生化參數(shù)的估算,得出采用偏最小二乘加權(quán)策略進(jìn)行疊加集成能夠取得較好的預(yù)測(cè)效果。但是Shan等在光譜區(qū)間數(shù)和子模型神經(jīng)元數(shù)的選擇上存在一定的盲目性,這可能會(huì)使得子模型光譜區(qū)間對(duì)響應(yīng)變量的敏感性降低,最終影響疊加集成模型的估算精度。因此,本研究擬以此為切入點(diǎn),基于驗(yàn)證集均方根誤差最小的原則選擇適宜的光譜區(qū)間數(shù)和神經(jīng)元數(shù)量,對(duì)不同水氮處理下大田玉米的地上部生物量和葉面積指數(shù)進(jìn)行估算,同時(shí)對(duì)比具有集成思想的隨機(jī)森林算法與本研究構(gòu)建的基于偏最小二乘疊加策略的極限學(xué)習(xí)機(jī)疊加模型,以期為夏玉米地上部生物量和葉面積指數(shù)估算提供參考。
研究區(qū)位于陜西省楊凌示范區(qū)西北農(nóng)林科技大學(xué)節(jié)水灌溉試驗(yàn)站(108°24′E,34°20′N),海拔506 m,地處關(guān)中平原,屬于暖溫帶季風(fēng)半濕潤(rùn)氣候區(qū),年平均溫度為12.9 ℃,多年平均降水量560 mm(主要集中在7、8、9月),年平均蒸發(fā)量1 000 mm,是中國(guó)重要的夏玉米種植區(qū)[20]。
2018—2020年進(jìn)行了夏玉米不同水氮管理的田間試驗(yàn),試驗(yàn)采用裂區(qū)設(shè)計(jì),水分處理為主區(qū),施氮量為副區(qū),包括3個(gè)水分水平和4個(gè)氮肥供應(yīng)水平,共12個(gè)處理(表1),每個(gè)處理3次重復(fù)。具體的水肥管理細(xì)節(jié)和田間試驗(yàn)過(guò)程與參考文獻(xiàn)[20]一致。
表1 夏玉米田間試驗(yàn)水氮處理設(shè)計(jì)
注:ETc為夏玉米蒸散量。
Note: ETcis evapotranspiration of summer maize.
試驗(yàn)所用氮肥為尿素(N,46%),磷肥為過(guò)磷酸鈣(P2O5,16%),鉀肥為氯化鉀(K2O,62%)。氮肥采用滴灌水肥一體化(滴頭流量為2 L/h,滴頭間距為30 cm)分4次施入,具體施肥比例分別為播種(出苗)20%,苗期30%,拔節(jié)期30%,吐絲灌漿期20%。磷肥(P2O5)和鉀肥(K2O)在播種后隨降雨一次性撒施,施肥量分別為90和60 kg/hm2。
分別于2018年7月28日、2019年7月10日、7月26日和2020年7月6日、7月19日和7月27日采集光譜數(shù)據(jù)。夏玉米冠層光譜反射率采用ASD Field-Spec 3背掛式野外高光譜儀(Analytical Spectral Devices,Inc.,St,Boulder,美國(guó))測(cè)定。儀器波段范圍350~1 830 nm,其中,350~1 000 nm光譜分辨率為3 nm,采樣間隔為1.4 nm;1 000~1 830 nm分辨率為10 nm,采樣間隔為2 nm,儀器自動(dòng)將采樣數(shù)據(jù)插值為1 nm間隔輸出。光纖長(zhǎng)度1.5 m,視場(chǎng)角25°。在晴朗無(wú)風(fēng)的天氣,于11:00—14:00進(jìn)行測(cè)定,測(cè)定時(shí)保證光纖探頭垂直向下,距冠層頂部約1 m。
每個(gè)小區(qū)選取能代表該小區(qū)長(zhǎng)勢(shì)的3個(gè)樣方進(jìn)行測(cè)定,每個(gè)樣方每次采集10條光譜曲線,以平均值作為該樣方的光譜反射率,3 a共采集212組數(shù)據(jù)。每個(gè)樣本測(cè)定前進(jìn)行一次標(biāo)準(zhǔn)白板校正。在測(cè)定高光譜的樣方內(nèi)同步進(jìn)行破壞性取樣,分別測(cè)定夏玉米地上部生物量和葉面積指數(shù)。
由于光譜數(shù)據(jù)受到環(huán)境的干擾(1 350~1 450 nm處存在水分強(qiáng)吸收帶,1 801~1 830 nm處存在較強(qiáng)的邊緣噪聲),所以本研究保留351~1 350 nm和1 451~1 800 nm波段反射率進(jìn)行研究(共1 350個(gè)波段)。為了減少(消除)背景噪聲、基線漂移及雜散光等無(wú)用信息對(duì)高光譜反射率曲線的影響,本文選用Savitzky-Golay卷積平滑(9點(diǎn)4次)對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
基于3 a田間試驗(yàn)共獲取212份有效樣本,首先對(duì)地上部生物量和葉面積指數(shù)分別從小到大排序,然后選取1/4的樣本作為驗(yàn)證集,其余3/4的樣本作為建模集。建模集和驗(yàn)證集的樣本數(shù)量及地上部生物量和葉面積指數(shù)統(tǒng)計(jì)特征如表2所示。
表2 夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)統(tǒng)計(jì)
偏最小二乘回歸(Partial Least Squares Regression,PLS)是一種集多元線性回歸分析、典型相關(guān)分析和主成分分析于一體的多元統(tǒng)計(jì)數(shù)據(jù)分析方法[21]。自模型提出以來(lái),因其能夠較好地解決傳統(tǒng)多元回歸難以解決的問(wèn)題(如自變量之間的多重相關(guān)性)而得到廣泛的應(yīng)用。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)是基于單隱含層前饋神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的一種算法,在學(xué)習(xí)速率和泛化性能方面具有明顯優(yōu)勢(shì)[22]。ELM的特點(diǎn)是輸入層與隱含層之間的連接權(quán)值和隱含層神經(jīng)元的閾值隨機(jī)生成?;诖?,應(yīng)用ELM模型通常需要多次運(yùn)行,記錄建模和預(yù)測(cè)結(jié)果較好的模型或者計(jì)算多次預(yù)測(cè)的均值[23]。
隨機(jī)森林(Random Forest,RF)算法是基于自助法(bootstrap)取樣的一種機(jī)器學(xué)習(xí)算法,它的主要思想是從原始訓(xùn)練集中抽取個(gè)樣本,且每個(gè)樣本的樣本容量均與原始訓(xùn)練集的大小一致[24-25];然后對(duì)每個(gè)樣本分別進(jìn)行決策樹(shù)建模,得到個(gè)建模結(jié)果。最后,以所有決策樹(shù)預(yù)測(cè)結(jié)果的均值作為最終預(yù)測(cè)結(jié)果。RF預(yù)測(cè)準(zhǔn)確率高,不容易出現(xiàn)過(guò)擬合現(xiàn)象,對(duì)噪聲和異常值都具有很好的容忍度。對(duì)高光譜遙感等高維度數(shù)據(jù)訓(xùn)練和學(xué)習(xí)效果較佳。
為了驗(yàn)證模型預(yù)測(cè)精度和預(yù)測(cè)能力,本研究選取決定系數(shù)(determination coefficient,2)、均方根誤差(Root Mean Square Error,RMSE)和相對(duì)分析誤差(Residual Predictive Deviation,RPD)進(jìn)行模型評(píng)價(jià)[6]。
不同水氮處理對(duì)夏玉米地上部生物量和葉面積指數(shù)的影響如表3所示。由表可知,灌水對(duì)2018和2019年夏玉米地上部生物量和葉面積指數(shù)的影響均達(dá)到了極顯著水平,但對(duì)2020年夏玉米地上部生物量和葉面積指數(shù)的影響均未達(dá)到顯著水平。施氮對(duì)3 a夏玉米地上部生物量和葉面積指數(shù)的影響均達(dá)到了極顯著水平(<0.01)。夏玉米地上部生物量和葉面積指數(shù)均隨著施氮量的增加而增加。
表3 不同水氮處理對(duì)夏玉米地上部生物量和葉面積指數(shù)的影響
注:同列不同字母表示處理間差異顯著(<0.05);*和**分別表示在0.05和0.01水平下顯著,ns代表不顯著。
Note: Different letters in the same column indicate significant difference among treatments (<0.05); * and **indicate significance at 0.05 and 0.01 levels, and ns indicates no significance.
以夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)為響應(yīng)變量(),以光譜反射率作為自變量(),分別采用偏最小二乘回歸(PLS)、極限學(xué)習(xí)機(jī)(ELM)、隨機(jī)森林(RF)和疊加極限學(xué)習(xí)機(jī)(SEPLS_ELM)構(gòu)建了夏玉米營(yíng)養(yǎng)生長(zhǎng)期生物量和葉面積指數(shù)的估算模型。
2.2.1 基于PLS估算夏玉米生物量和葉面積指數(shù)
在PLS模型構(gòu)建中,采用10折交叉驗(yàn)證法確定生物量和葉面積指數(shù)估算模型的最優(yōu)潛在變量數(shù)(LVs)。圖 2a和圖2b分別展示了生物量估算模型和葉面積指數(shù)估算模型前10個(gè)潛在變量解釋的累積方差百分比。為了避免冗余LVs加入導(dǎo)致PLS回歸出現(xiàn)過(guò)度擬合,以對(duì)變量的解釋累積方差百分比提高5%為標(biāo)準(zhǔn)確定LVs,即增加某一LVs能夠使變量的解釋累積方差百分比提高5%,則加入該LVs[17]。本研究中前3個(gè)變量分別解釋了建模集生物量和葉面積指數(shù)的87.3%和88.5%,前4個(gè)LVs分別解釋了建模集生物量和葉面積指數(shù)的88.2%和89.6%,較前3個(gè)變量增加均不足5%。因此,本研究中夏玉米生物量和葉面積指數(shù)估算模型的LVs均確定為3個(gè)(圖2)。
圖3為基于PLS回歸的夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)估算模型。由圖可知,基于PLS回歸的夏玉米地上部生物量估算模型建模集和驗(yàn)證集的2分別為0.873和0.837,RMSE分別為504.9和570.5 kg/hm2,RPD為2.51;葉面積指數(shù)估算模型建模集和驗(yàn)證集的2分別為0.895和0.894,RMSE分別為0.40 和0.41 cm2/cm2,RPD為3.12?;赑LS回歸的夏玉米葉面積指數(shù)估算模型的精度高于地上部生物量估算模型。
2.2.2 基于ELM估算夏玉米生物量和葉面積指數(shù)
在ELM模型構(gòu)建中,本文選用默認(rèn)的“Sigmoid”為隱含層神經(jīng)元激活函數(shù),隱含層神經(jīng)元數(shù)量以15為初值,5為步長(zhǎng)逐步增加到120,每個(gè)模型進(jìn)行運(yùn)行100次選擇最優(yōu)訓(xùn)練結(jié)果。結(jié)果表明(圖4):當(dāng)神經(jīng)元數(shù)量為35時(shí),夏玉米地上部生物量和葉面積指數(shù)估算模型均獲得最高的估算精度?;贓LM構(gòu)建的夏玉米地上部生物量估算模型建模集和驗(yàn)證集的2分別為0.879和0.845,RMSE分別為490.4和565.0 kg/hm2,RPD為2.53;葉面積指數(shù)估算模型建模集和驗(yàn)證集的2分別為0.904和0.886,RMSE分別為0.39和0.42 cm2/cm2,RPD為3.00?;贓LM的夏玉米葉面積指數(shù)估算模型較地上部生物量估算模型獲得了更高的精度。
2.2.3 基于RF估算夏玉米生物量和葉面積指數(shù)
在RF模型構(gòu)建中,經(jīng)過(guò)參數(shù)優(yōu)選和多次訓(xùn)練最終確定的夏玉米生物量和葉面積指數(shù)估算模型中決策樹(shù)個(gè)數(shù)均為500。如圖5所示夏玉米地上部生物量估算模型建模集和驗(yàn)證集的2分別為0.958和0.851,RMSE分別為292.1和517.0 kg/hm2,RPD為2.61;葉面積指數(shù)估算模型建模集和驗(yàn)證集的2分別為0.963和0.903,RMSE分別為0.24和0.40 cm2/cm2,RPD為3.18?;赗F的夏玉米葉面積指數(shù)估算模型較地上部生物量估算模型獲得了更高的精度。
2.2.4 基于SEPLS_ELM估算夏玉米生物量和葉面積指數(shù)
光譜曲線分段數(shù)和神經(jīng)元數(shù)量是影響疊加集成模型估算精度的主要參數(shù)。為了選擇適宜的光譜曲線分段數(shù)和神經(jīng)元數(shù)量,本文依次將光譜曲線均勻劃分為3~50段,每段分別以實(shí)測(cè)地上部生物量和葉面積指數(shù)為響應(yīng)變量利用ELM進(jìn)行模型構(gòu)建,每個(gè)光譜分段數(shù)ELM神經(jīng)元個(gè)數(shù)均以15為初值,5為步長(zhǎng),直至120為止。然后依據(jù)偏最小二乘疊加策略進(jìn)行SEPLS_ELM模型構(gòu)建。最終依據(jù)驗(yàn)證集RMSE最小原則分別確定夏玉米地上部生物量和葉面積指數(shù)估算模型的最佳光譜分段數(shù)分別為20和33,最優(yōu)神經(jīng)元數(shù)分別為110和100(圖6)。
圖7展示了最佳光譜分段數(shù)下不同光譜區(qū)間子模型建模集RMSE和各子模型在疊加集成(SEPLS_ELM)模型中的權(quán)重,由圖7可知,夏玉米地上部生物量估算模型中子模型的RMSE介于136.3~308.5 kg/hm2之間,葉面積指數(shù)估算模型的RMSE介于0.15~0.32 cm2/cm2之間。在夏玉米地上部生物量估算模型中,子模型7(753~820 nm波段)的RMSE最小,相應(yīng)的在SEPLS_ELM模型中權(quán)重最大,為0.051 9,子模型6(686~752 nm波段)的權(quán)重次之,為0.051 5;在夏玉米葉面積指數(shù)估算模型中子模型11(751~791 nm波段)的RMSE最小,相應(yīng)的在SEPLS_ELM模型中權(quán)重最大,為0.031 8,子模型10(711~750 nm波段)的權(quán)重次之,為0.031 6,二者均位于紅邊和近紅外波段。此外,在可見(jiàn)光波段夏玉米地上部生物量估算模型子模型3(485~552 nm波段)的權(quán)重最高,葉面積指數(shù)估算模型中子模型7(591~631 nm波段)和子模型5(511~551 nm波段)的權(quán)重較高。圖8展示了最佳光譜分段數(shù)和最佳神經(jīng)元數(shù)量下基于SEPLS_ELM的夏玉米地上部生物量估算模型訓(xùn)練集的2為0.992,驗(yàn)證集的2為0.955;夏玉米葉面積指數(shù)估算模型的2為0.990,驗(yàn)證集的2為0.969。
圖8展示了最佳光譜分段數(shù)和最佳神經(jīng)元數(shù)量下基于SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型。夏玉米地上部生物量估算模型建模集和驗(yàn)證集的2分別為0.992和0.955,RMSE分別為123.1和307.3 kg/hm2;葉面積指數(shù)估算模型建模集和驗(yàn)證集的2分別為0.990和0.969,RMSE分別為0.13和0.24 cm2/cm2,RPD為5.30。
綜上,基于PLS和ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型的精度相近且較低?;赗F和SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型的精度顯著高于PLS和ELM模型,其建模集的2均在0.95以上,但基于RF的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2和RMSE較建模集顯著降低?;赟EPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2均高于0.95,RMSE分別為307.3和0.24 cm2/cm2,RPD分別為4.66和5.30。與PLS和ELM模型相比,基于SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2增加均超過(guò)8%,RMSE降低均超過(guò)40%,RPD增加均超過(guò)70%。與RF模型相比,基于SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2增加均超過(guò)7%,RMSE降低均超過(guò)40%,RPD增加均超過(guò)66%。
高光譜遙感數(shù)據(jù)已經(jīng)廣泛應(yīng)用于作物生理生態(tài)及生化參數(shù)的反演,然而前人研究主要通過(guò)選取敏感波段或者構(gòu)建敏感植被指數(shù)進(jìn)行目標(biāo)參數(shù)反演[6,14],這在一定程度會(huì)損失部分波段的光譜信息,進(jìn)而降低模型的預(yù)測(cè)能力。因此本研究以高光譜全波段反射率作為模型的輸入,分別基于PLS和3種機(jī)器學(xué)習(xí)方法進(jìn)行了夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)的估算。結(jié)果表明基于PLS和ELM方法的夏玉米地上部生物量和葉面積指數(shù)估算模型的精度遠(yuǎn)低于RF和疊加極限學(xué)習(xí)機(jī)SEPLS_ELM方法。這是因?yàn)镽F和SEPLS_ELM模型均是具有集成思想的機(jī)器學(xué)習(xí)方法,這種集成提高了模型的預(yù)測(cè)能力,增強(qiáng)了模型的抗噪能力[26-27]。此外,本研究中直接利用全波段高光譜反射率數(shù)據(jù)作為模型輸入,極大簡(jiǎn)化了高光譜數(shù)據(jù)的處理流程?;赟EPLS_ELM的夏玉米生物量和葉面積指數(shù)估算模型的精度高于RF建模方法,一方面原因可能是因?yàn)镾EPLS_ELM集PLS和ELM算法的優(yōu)勢(shì)于一體,既包含了所有波段的光譜信息并具有較強(qiáng)的抗噪和泛化能力;另一方面是RF的子模型為CART決策樹(shù),對(duì)于連續(xù)數(shù)據(jù)的分割較為粗糙,對(duì)本研究的數(shù)據(jù)集的適用性稍差,而SEPLS_ELM子模型ELM能夠更好地模擬出數(shù)據(jù)之間的非線性關(guān)系,因此SEPLS_ELM模型的表現(xiàn)好于RF模型。在SEPLS_ELM模型構(gòu)建中,隱含層神經(jīng)元數(shù)量和光譜曲線的分段數(shù)是決定算法性能的關(guān)鍵參數(shù),本研究中限于計(jì)算機(jī)硬件的性能在有限的范圍內(nèi)進(jìn)行了優(yōu)選,獲得的最佳分段數(shù)和神經(jīng)元數(shù)量可能為局部最優(yōu),也缺乏一定的理論基礎(chǔ)。因此在未來(lái)的研究中應(yīng)該加強(qiáng)光譜分段數(shù)與神經(jīng)元數(shù)量選擇的研究。此外,本研究結(jié)果還表明不論使用何種建模方法,夏玉米葉面積指數(shù)估算模型的精度均高于地上部生物量估算模型,這與侯學(xué)會(huì)等[28-29]研究結(jié)果一致。原因可能是因?yàn)槿~面積指數(shù)較生物量而言更為直觀,是作物重要的形態(tài)參數(shù)。
本研究還發(fā)現(xiàn)綠峰、紅谷及紅邊波段的子模型在SEPLS_ELM疊加模型中的權(quán)重較高(圖7),這說(shuō)明這些波段對(duì)地上部生物量和葉面積指數(shù)的響應(yīng)較為敏感。這與前人研究結(jié)果紅邊參數(shù)[30]及部分植被指數(shù)(MTVI1[31],Carte3[32]和NDCI[33])的敏感波段一致。但是本研究的估算精度(地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集2均高于0.95,RMSE分別低于307.3 kg/hm2和0.24 cm2/cm2)高于前人研究(玉米葉片生物量估算模型2為0.67[34];葉面積指數(shù)估算模型2為0.89,RMSE為0.46 cm2/cm2[31]),其原因是前人研究選擇了較為敏感的波段進(jìn)行建模,舍棄了一些次敏感波段,因此將光譜曲線劃分為多個(gè)波段區(qū)間的降維方式?jīng)]有損失光譜信息,提高了模型的估算精度。
本文基于實(shí)測(cè)高光譜數(shù)據(jù),分別采用偏最小二乘回歸(Partial Least Squares Regression,PLS),極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)、隨機(jī)森林(Random Forest,RF)和基于PLS疊加策略的極限學(xué)習(xí)機(jī)集成模型(Stacked Ensemble Extreme Learning Machine based on the PLS,SEPLS_ELM)估算了夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)。結(jié)果表明:
1)PLS和ELM模型估算夏玉米營(yíng)養(yǎng)生長(zhǎng)期地上部生物量和葉面積指數(shù)的精度相近且較低。
2)基于RF和SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型的精度顯著高于PLS和ELM模型,其建模集的2均在0.95以上,但基于RF的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2較建模集顯著降低,分別為0.851和0.903。
3)基于SEPLS_ELM的夏玉米地上部生物量和葉面積指數(shù)估算模型驗(yàn)證集的2均高于0.95,RMSE分別為307.3 kg/hm2和0.24 cm2/cm2,RPD分別為4.66和5.30。
[1] 吳芳,李映雪,張緣園,等. 基于機(jī)器學(xué)習(xí)算法的冬小麥不同生育時(shí)期生物量高光譜估算[J]. 麥類作物學(xué)報(bào),2019,39(2):217-224.
Wu Fang, Li Yingxue, Zhang Yuanyuan, et al. Hyperspectral estimation of biomass of winter wheat at different growth stages based on machine learning algorithms[J]. Journal of Triticeae Crops, 2019, 39(2): 217-224. (in Chinese with English abstract)
[2] 張領(lǐng)先,陳運(yùn)強(qiáng),李云霞,等. 可見(jiàn)光光譜的冬小麥苗期地上生物量估算[J]. 光譜學(xué)與光譜分析,2019,39(8):2501-2506.
Zhang Lingxian, Chen Yunqiang, Li Yunxia, et al. Estimating above ground biomass of winter wheat at early growth stages based on visual spectral[J]. Spectroscopy and Spectral Analysis, 2019, 39(8): 2501-2506. (in Chinese with English abstract)
[3] Chen J M, Cihlar J. Retrieving leaf area index of boreal conifer forests using Landsat TM images[J]. Remote sensing of environment, 1996, 55(2): 153-162.
[4] 江海英,賈坤,趙祥,等. 山地葉面積指數(shù)反演理論、方法與研究進(jìn)展[J]. 遙感學(xué)報(bào),2020,24(12):1433-1449.
Jiang Haiying, Jia Kun, Zhao Xiang, et al. Review on the theory, method, and research progress of leaf area index estimation in mountainous areas[J]. Journal of Remote Sensing, 2020, 24(12): 1433-1449. (in Chinese with English abstract)
[5] Sellers P J, Dickinson R E, Randall D A, et al. Modeling the exchanges of energy, water, and carbon between continents and the atmosphere[J]. Science, 1997, 275(5299): 502-509.
[6] 李嵐?jié)?,李靜,明金,等. 冬油菜葉面積指數(shù)高光譜監(jiān)測(cè)最佳波寬與有效波段研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2018,49(2):156-165.
Li Lantao, Li Jing, Ming Jin, et al. Selection optimization of hyperspectral bandwidth and effective wavelength for predicting leaf area index in winter oilseed rape[J]. Transactions of the Chinese Society for Agricultural Machinery, 2018, 49(2): 156-165. (in Chinese with English abstract)
[7] 謝巧云,黃文江,梁棟,等. 最小二乘支持向量機(jī)方法對(duì)冬小麥葉面積指數(shù)反演的普適性研究[J]. 光譜學(xué)與光譜分析,2014,34(2):489-493.
Xie Qiaoyun, Huang Wenjiang, Liang Dong, et al. Research on universality of least squares support vector machine method for estimation leaf area index of winter wheat[J]. Spectroscopy and Spectral Analysis, 2014, 34(2): 489-493. (in Chinese with English abstract)
[8] Zhang J J, Cheng T, Guo W, et al. Leaf area index estimation model for UAV image hyperspectral data based on wavelength variable selection and machine learning methods[J]. Plant Methods, 2021, 17(1): 14. DOI:10.1186/ s13007-021-00750-5
[9] 高林,楊貴軍,于海洋,等. 基于無(wú)人機(jī)高光譜遙感的冬小麥葉面積指數(shù)反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(22):113-120.
Gao Lin, Yang Guijun, Yu Haiyang, et al. Retrieving winter wheat leaf area index based on unmanned aerial vehicle hyperspectral remoter sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(22): 113-120. (in Chinese with English abstract)
[10] Zhou Z J, Jabloun M, Plauborg F, et al. Using ground-based spectral reflectance sensors and photography to estimate shoot N concentration and dry matter of potato[J]. Computers and Electronics in Agriculture, 2018, 144: 154-163.
[11] Feng W, Wu Y P, He L, et al. An optimized non-linear vegetation index for estimating leaf area index in winter wheat[J]. Precision Agriculture, 2019, 20(6): 1157-1176.
[12] 李鑫川,徐新剛,鮑艷松,等. 基于分段方式選擇敏感植被指數(shù)的冬小麥葉面積指數(shù)遙感反演[J]. 中國(guó)農(nóng)業(yè)科學(xué),2012,45(17):3486-3496.
Li Xinchuan, Xu Xingang, Bao Yansong, et al. Retrieving LAI of winter wheat based on sensitive vegetation index by the segmentation method[J]. Scientia Agricultura Sinica, 2012, 45(17): 3486-3496. (in Chinese with English abstract)
[13] 崔日鮮,劉亞?wèn)|,付金東. 基于可見(jiàn)光光譜和BP人工神經(jīng)網(wǎng)絡(luò)的冬小麥生物量估算研究[J]. 光譜學(xué)與光譜分析,2015,9(35):2596-2601.
Cui Rixian, Liu Yadong, Fu Jindong. Estimation of winter wheat biomass using visible spectral and BP based artificial neural networks[J]. Spectroscopy and Spectral Analysis, 2015, 9(35): 2596-2601. (in Chinese with English abstract)
[14] 夏天,吳文斌,周清波,等. 冬小麥葉面積指數(shù)高光譜遙感反演方法對(duì)比[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(3):139-147.
Xia Tian, Wu Wenbin, Zhou Qingbo, et al. Comparison of two inversion methods for winter wheat leaf area index based on hyperspectral remote sensing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(3): 139-147. (in Chinese with English abstract)
[15] 梁棟,管青松,黃文江,等. 基于支持向量機(jī)回歸的冬小麥葉面積指數(shù)遙感反演[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(7):117-123.
Liang Dong, Guan Qingsong, Huang Wenjiang, et al. Remote sensing inversion of leaf area index based on support vector machine regression in winter wheat[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(7): 117-123. (in Chinese with English abstract)
[16] 崔金鐸. 基于近紅外光譜的堆疊極限學(xué)習(xí)機(jī)算法及其應(yīng)用研究[D]. 沈陽(yáng):東北大學(xué),2015.
Cui Jinduo. A Stacked Extreme Learning Machine Algorithm Based on NIR Spectroscopy and Its Application[D]. Shenyang: Northeastern University, 2015. (in Chinese with English abstract)
[17] Shan P, Zhao Y H, Wang Q Y, et al. Stacked ensemble extreme learning machine coupled with Partial Least Squares-based weighting strategy for nonlinear multivariate calibration[J]. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 215: 97-111.
[18] Zhou H, Huang G B, Lin Z, et al. Stacked extreme learning machines[J]. IEEE Trans Cybern, 2015, 45(9): 2013-2025.
[19] Ni W D, Brown S D, Man R L. Stacked partial least squares regression analysis for spectral calibration and prediction[J]. Journal of Chemometrics, 2009, 23(10): 505-517.
[20] 陸軍勝,耿晨鳴,崔曉路,等. 基于葉面積指數(shù)的夏玉米葉片臨界氮濃度稀釋曲線研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2021,52(4):319-326.
Lu Junsheng, Geng Chenming, Cui Xiaolu, et al. Determination of summer maize leaf critical nitrogen dilution curve based on leaf area index[J]. Transactions of The Chinese Society for Agricultural Machinery, 2021, 52(4): 319-326. (in Chinese with English abstract)
[21] Kamruzzaman M, ElMasry G, Sun D W, et al. Prediction of some quality attributes of lamb meat using near-infrared hyperspectral imaging and multivariate analysis[J]. Analytica Chimica Acta, 2012, 714: 57-67.
[22] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1/2/3): 489-501.
[23] Guo L, Fu P, Shi T Z, et al. Mapping field-scale soil organic carbon with unmanned aircraft system-acquired time series multispectral images[J]. Soil and Tillage Research, 2020, 196: 104477.
[24] Wang Y W, Song Q Q, Du Y J, et al. A random forest model to predict heatstroke occurrence for heatwave in China[J]. Science of the Total Environment, 2019, 650: 3048-3053.
[25] 周志華. 《機(jī)器學(xué)習(xí)》[M]. 北京:清華大學(xué)出版社,2016.
[26] 岳繼博,楊貴軍,馮海寬. 基于隨機(jī)森林算法的冬小麥生物量遙感估算模型對(duì)比[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(18):175-182.
Yue Jibo, Yang Guijun, Feng Haikuan. Comparative of remote sensing estimation models of winter wheat biomass based on random forest algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(18): 175-182. (in Chinese with English abstract)
[27] 陳紹民. 水肥一體化水氮用量對(duì)蘋(píng)果園氮素利用的影響及其供應(yīng)決策[D]. 楊凌:西北農(nóng)林科技大學(xué),2021.
Chen Shaomin. Effects of the Water and Nitrogen Application Amount under Fertigation on Nitrogen Utilization and Its Supply Decision in Apple Orchard[D]. Yangling: Northwest A&F University, 2021. (in Chinese with English abstract)
[28] 侯學(xué)會(huì),牛錚,黃妮,等. 小麥生物量和真實(shí)葉面積指數(shù)的高光譜遙感估算模型[J]. 國(guó)土資源遙感,2012,199(4):30-35.
Hou Xuehui, Niu Zheng, Huang Ni, et al. The hyperspectral remote sensing estimation models of total biomass and true LAI of wheat[J]. Remote Sending for Land & Resources, 2012, 199(4): 30-35. (in Chinese with English abstract)
[29] 紀(jì)景純,劉建立,牛玉潔,等. 基于全波段高光譜的冬小麥生長(zhǎng)參數(shù)估算方法比較[J]. 作物雜志,2020(6):180-188.
Ji Jingchun, Liu Jianli, Niu Yujie, et al. Comparison of estimation methods for growth parameters of winter wheat based on full-band hyperspectral data[J]. Crops, 2020(6): 180-188. (in Chinese with English abstract)
[30] 郭彬彬. 小麥氮素營(yíng)養(yǎng)的高光譜監(jiān)測(cè)及施氮模型構(gòu)建[D]. 鄭州:河南農(nóng)業(yè)大學(xué),2019.
Guo Binbin. Remote Monitoring Nitrogen Status and Constraction of Nitrogen Application Model in Wheat[D]. Zhengzhou: Henan Agricultural University, 2019. (in Chinese with English abstract)
[31] Haboudane D, Miller J R, Pattey E, et al. Hyperspectral vegetation indices and novel algorithms for predicting green LAI of crop canopies: Modeling and validation in the context of precision agriculture[J]. Remote Sensing of Environment, 2004, 90(3): 337-352.
[32] Carter G A. Ratios of leaf reflectance in narrow wavebands as indicators of plant stress[J]. International Journal of Remote Sensing, 1994, 15(3): 697-703.
[33] Marshak A, Knyazikhin Y, Davis A B, et al. Cloud-vegetation interaction: Use of normalized difference cloud index for estimation of cloud optical thickness[J]. Geophysical Research Letters, 2000, 27(12): 1695-1698.
[34] 解飛. 基于高光譜數(shù)據(jù)的玉米生長(zhǎng)信息估算模型研究[D]. 楊凌:西北農(nóng)林科技大學(xué),2016.
Xie Fei. Study on Estimate Model of Corn Grow Information Based on Hyperspectral Data[D]. Yangling: Northwest A&F University, 2016. (in Chinese with English abstract)
Estimation of aboveground biomass and leaf area index of summer maize using SEPLS_ELM model
Lu Junsheng1,2, Chen Shaomin1,2, Huang Wenmin3, Hu Tiantian1,2※
(1.,,712100,; 2.,,712100,; 3.,710000,)
Hyperspectral remote sensing has widely been used to estimate crop physiological, ecological, and biochemical parameters in recent years. However, most previous studies focused mainly on the selection of sensitive bands or the construction of vegetation index (the combination of sensitive bands) for crop parameter inversion. Particularly, the spectral information of some bands can be lost, and then to reduce the prediction ability of the estimation model. The purpose of this study is to estimate the aboveground biomass and leaf area index of summer maize using all spectral information (spectral bands). Therefore, a three-year (2018-2020) field experiment was also conducted under different water and nitrogen management in the Guanzhong Plain of China. Accordingly, 212 plant samples (aboveground biomass and leaf area index) were collected during the vegetative growth period of summer maize. Prior to plant sample collection, the hyperspectral reflectance data of the summer maize canopy was measured using an ASD FieldSpec 3 portable spectroradiometer. Correspondingly, the estimation model was constructed using Partial Least Squares Regression (PLS), Extreme Learning Machine (ELM), Random Forest (RF), and Stacked Ensemble Extreme Learning Machine (SEPLS_ELM, using the PLS stacked ensemble strategy). The results showed that the estimation accuracy (four estimation models) of the leaf area index of summer maize was higher than that of aboveground biomass. The estimation models of PLS and ELM presented a relatively low accuracy for the aboveground biomass and leaf area index of summer maize, where the determination coefficient (2) for the validation set of the aboveground biomass estimation model was lower than 0.85, and the Root Mean Square Error (RMSE) was higher than 550 kg/hm-2, whereas, the2for the validation set of leaf area index estimation model was lower than 0.90, and the RMSE was higher than 0.40 cm2/cm2. The estimation model of aboveground biomass and leaf area index of summer maize using RF and SEPLS_ELM presented a higher estimation accuracy, particularly that the performance of the SEPLS_ELM model was outstanding. The2values for the validation set of aboveground biomass and leaf area index estimation model using the SEPLS_ELM model were 0.955 and 0.969, while the RMSE were 307.3 kg/hm2and 0.24 cm2/cm2, and the Residual Predictive Deviation (RPD) were 4.66 and 5.30, respectively. Compared with PLS and ELM, the estimation accuracy of the SEPLS_ELM model was significantly improved (the2increased by more than 8%, RMSE decreased by more than 40%, and RPD increased by more than 70%, respectively) in aboveground biomass and leaf area index estimation. Compared with the RF, the2of the SEPLS_ELM estimation model increased by more than 7%, RMSE decreased by more than 40%, and RPD increased by more than 66% in the aboveground biomass and leaf area index estimation of summer maize, respectively. Consequently, the present study demonstrated that the SEPLS_ELM model was highly reliable to predict the aboveground biomass and leaf area index of summer maize. The findings can provide a strong reference for the estimation of crop aboveground biomass and leaf area index using hyperspectral remote sensing.
hyperspectrum; remote sensing; biomass; random forest; leaf area index; partial least squares regression; extreme learning machine; stacked ensemble model
陸軍勝,陳紹民,黃文敏,等. 采用SEPLS_ELM模型估算夏玉米地上部生物量和葉面積指數(shù)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(18):128-135.doi:10.11975/j.issn.1002-6819.2021.18.015 http://www.tcsae.org
Lu Junsheng, Chen Shaomin, Huang Wenmin, et al. Estimation of aboveground biomass and leaf area index of summer maize using SEPLS_ELM model[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(18): 128-135. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2021.18.015 http://www.tcsae.org
2021-06-01
2021-08-29
公益性行業(yè)(農(nóng)業(yè))科研專項(xiàng)(201503124)
陸軍勝,博士,研究方向?yàn)檗r(nóng)業(yè)水土資源高效利用。Email:junshengup@163.com
胡田田,教授,研究方向?yàn)檗r(nóng)業(yè)水土資源高效利用。Email:hutiant@nwsuaf.edu.cn
10.11975/j.issn.1002-6819.2021.18.015
S365;S127
A
1002-6819(2021)-18-0128-08