樊意廣 馮海寬 劉 楊 邊明博 孟 煬 楊貴軍
(1.北京市農(nóng)林科學院信息技術(shù)研究中心農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)遙感機理與定量遙感重點實驗室,北京 100097;2.國家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京 100097;3.南京農(nóng)業(yè)大學國家信息農(nóng)業(yè)工程技術(shù)中心,南京 210095;4.中國農(nóng)業(yè)大學現(xiàn)代精細農(nóng)業(yè)系統(tǒng)集成研究教育部重點實驗室,北京 100083)
馬鈴薯是我國第4大糧食作物,其產(chǎn)量直接影響著我國的糧食安全和糧食貿(mào)易策略。氮素是決定馬鈴薯產(chǎn)量和品質(zhì)的重要因素,合理的氮肥供應(yīng)既能滿足作物的生長需求,又能避免因氮素流失而造成的環(huán)境污染和資源浪費[1]。因此,及時準確地掌握馬鈴薯植株氮含量(Plant nitrogen content,PNC)狀況,對田間管理決策的制定和實施具有重要的意義。傳統(tǒng)的PNC測量方法主要是田間取樣和實驗室測試相結(jié)合,但這種方法受人力和物力制約大,且具有滯后性,不利于大范圍的農(nóng)田監(jiān)測。近年來,無人機遙感技術(shù)的迅速發(fā)展,為監(jiān)測作物理化參數(shù)提供了一種新的技術(shù)手段。
目前,以無人機為遙感平臺監(jiān)測作物理化參數(shù)搭載的傳感器主要有高光譜、多光譜和數(shù)碼相機等[2]。高光譜傳感器雖然能獲取豐富的光譜信息,但其價格昂貴,數(shù)據(jù)處理復(fù)雜,限制了其在大范圍農(nóng)田監(jiān)測中的應(yīng)用[3-4]。數(shù)碼相機傳感器雖僅有3個波段,但空間分辨率高,數(shù)據(jù)處理簡單且成本低廉。如何利用低成本的無人機數(shù)碼影像監(jiān)測作物的生長狀況已引起了國內(nèi)外學者的關(guān)注[5]。文獻[6-8]研究表明,利用無人機數(shù)碼影像能有效地監(jiān)測作物的氮素狀態(tài),但也存在一定不足,僅利用影像的光譜信息構(gòu)建作物的氮素估算模型存在影像信息利用率低、模型精度易飽和等問題[9]。
株高在一定程度上能反映作物的生長情況和營養(yǎng)狀況[10],文獻[11-14]研究表明,株高可以用于作物地上生物量和葉面積指數(shù)的估算,且與作物的氮營養(yǎng)狀況存在一定的聯(lián)系,然而,尚沒有研究證明株高能用于作物的氮素狀況監(jiān)測。
綜上,本文以無人機為遙感平臺,獲取馬鈴薯5個關(guān)鍵生育期的冠層數(shù)碼影像,并提取各生育期的影像變量和株高Hdsm,結(jié)合地面實測的PNC數(shù)據(jù),采用3種方法構(gòu)建各生育期的PNC估算模型并驗證,探究株高對估算馬鈴薯PNC的影響,以期尋求最佳建模方法,為馬鈴薯氮素監(jiān)測提供新的技術(shù)手段。
于2019年在北京市昌平區(qū)小湯山鎮(zhèn)國家精準農(nóng)業(yè)研究示范基地(40°10′34″N,116°26′39″E)馬鈴薯試驗田開展試驗。該地平均海拔36 m,年均溫度10℃,年均無霜期180 d,氣候類型是典型的暖溫帶半濕潤大陸性季風氣候。試驗采取小區(qū)試驗設(shè)計,選用2種早熟的馬鈴薯品種(中薯5(Z1)和中薯3(Z2))作為試驗品種。試驗區(qū)域共劃分48個小區(qū),每個小區(qū)32.5 m2(5 m×6.5 m)。試驗共設(shè)密度試驗區(qū)(N區(qū))、氮素試驗區(qū)(S區(qū))和鉀肥試驗區(qū)(K區(qū)),每個試驗區(qū)3次重復(fù),分別進行不同密度、氮素(以尿素計)和鉀肥處理。其中N區(qū)共設(shè)3種水平(T0:60 000 株/hm2、T1:72 000 株/hm2、T2:84 000 株/hm2,S區(qū)共設(shè)4種水平(N0:0 kg/hm2,N1:244.65 kg/hm2,N2:489.15 kg/hm2,N3:733.5 kg/hm2),K區(qū)共設(shè)3種水平(K0:0 kg/hm2,K1:970.5 kg/hm2,K2:1 941 kg/hm2)。為精確獲得試驗田的位置,保證無人機影像的精度,在試驗小區(qū)周圍均勻地埋設(shè)了11個地面控制點(Ground control point,GCP),并利用高精度的GPS測定各GCP的三維坐標。具體的試驗設(shè)計如圖1(N區(qū)和S區(qū)均為K1處理,k1~k11為地面控制點)所示。
圖1 馬鈴薯田間位置及試驗設(shè)計Fig.1 Potato field location and experiment design
地面數(shù)據(jù)包括馬鈴薯現(xiàn)蕾期到成熟期的實測株高H和PNC,其中,H的測量方法為:每個小區(qū)選取具有代表性的植株4株,用直尺量取莖基至自然狀態(tài)下葉頂端的距離并記錄,最終以4株植株的平均高度作為該小區(qū)的實測株高。馬鈴薯PNC的測定方法為:在每個試驗小區(qū)選取3株具有代表性的植株作為樣本,將其莖葉分離,用清水洗凈,105℃殺青0.5 h,隨后80℃干燥至恒質(zhì)量,得到樣本的干質(zhì)量,然后利用凱氏定氮儀測定莖和葉部分的全氮含量,最后計算馬鈴薯各生育期PNC,計算式為
式中CPN——植株氮含量CLN——葉片氮含量
CSN——地上莖氮含量
MLD——葉片干質(zhì)量
MSD——地上莖干質(zhì)量
無人機數(shù)碼影像的獲取與地面數(shù)據(jù)采集工作同步進行,以大疆精靈4Pro型無人機為遙感平臺獲取各生育期的數(shù)碼影像,該系統(tǒng)攜帶的COMS傳感器有效像素為2 000萬,含紅、綠、藍3個波段通道。無人機作業(yè)時的飛行高度設(shè)置為20 m,橫向和旁向重疊度均為85%。為避免光照強度對試驗結(jié)果的影響,選擇晴朗無云的天氣開展飛行作業(yè),且飛行時間為12:00—14:00。無人機數(shù)碼影像的預(yù)處理在Agisoft PhotoScan Professional軟件中進行,主要包括影像的導(dǎo)入與對齊、幾何校正、生成點云、構(gòu)建格網(wǎng)和紋理,最后生成馬鈴薯試驗田的數(shù)字表面模型(Digital surface model,DSM)和數(shù)字正射影像(Digital orthophoto map,DOM)。
依據(jù)現(xiàn)有的文獻資料,本研究選取21個能較好反映作物氮素狀態(tài)的數(shù)碼影像變量(表1),進行馬鈴薯各生育期PNC的估算。
表1 與氮相關(guān)的數(shù)碼影像變量Tab.1 Digital image variables related to nitrogen
于2019年4月20日采集了馬鈴薯試驗田裸土狀態(tài)下的數(shù)碼影像,并結(jié)合實測的GCP,利用Agisoft PhotoScan Professional軟件生成該時期的DSM。將馬鈴薯不同生育期的DSM與裸土期的DSM做差值運算,得到對應(yīng)生育期的作物高度模型,最后基于各試驗小區(qū)的矢量數(shù)據(jù),在ArcGIS軟件中利用感興趣區(qū)工具,計算馬鈴薯各小區(qū)的株高,并將計算的株高的平均值作為該小區(qū)的提取株高(Hdsm),最后將Hdsm與實測H對比分析以驗證該方法的可靠性。
采用多元線性回歸(Multiple linear regression,MLR)、誤差反向傳播(Back propagation,BP)神經(jīng)網(wǎng)絡(luò)和Lasso回歸3種方法構(gòu)建馬鈴薯各生育期的PNC估算模型。MLR算法常用于描述因變量與2個或多個自變量之間的關(guān)系,相較于一元線性回歸模型,MLR能更有效地刻畫馬鈴薯PNC與多個影像變量及Hdsm之間的聯(lián)系。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄟM行網(wǎng)絡(luò)訓(xùn)練的前饋神經(jīng)網(wǎng)絡(luò),它能根據(jù)誤差反饋的信息對網(wǎng)絡(luò)權(quán)值進行不斷地修正,以達到無限逼近輸出目標的目的。Lasso回歸是一種改良的最小二乘估計,它通過引入L1正則化對損失函數(shù)進行改造,可以解決線性回歸中自變量間存在的嚴重共線性問題。
本研究以重復(fù)1和重復(fù)3的數(shù)據(jù)(32個)構(gòu)建馬鈴薯PNC的估算模型,以重復(fù)2的數(shù)據(jù)(16個)對模型進行驗證。采用決定系數(shù)(Coefficient of determination,R2)、均方根誤差(Root mean square error,RMSE)、標準均方根誤差(Normalized root mean square error,NRMSE)對模型進行評價,其中,R2越接近于1,RMSE和NRMSE越小,所建模型的預(yù)測性能越好。
為驗證基于DSM提取馬鈴薯株高的可靠性,將提取的5個生育期的Hdsm與田間實測的H對比分析,結(jié)果如圖2所示。由圖2可知,基于DSM提取的Hdsm與實測H擬合的R2為0.860,RMSE為2.663 cm,NRMSE為10.234%,這說明基于DSM提取的馬鈴薯Hdsm具有較高的精度,可以代替實測H估算馬鈴薯理化參數(shù)。
圖2 馬鈴薯提取株高與實測株高對比分析Fig.2 Comparative analysis of extracted and measured plant heights of potato
2.2.1相關(guān)性分析
將馬鈴薯5個生育期的影像變量分別與實測的PNC作相關(guān)性分析,結(jié)果如表2所示。由表2可知,現(xiàn)蕾期,除R、G和B與PNC表現(xiàn)顯著相關(guān)外,其他影像變量均與PNC表現(xiàn)不相關(guān),其中,R的相關(guān)系數(shù)絕對值最大,為0.506;塊莖形成期,除r/b和IKAW表現(xiàn)不相關(guān)外,其余影像變量均與PNC呈顯著相關(guān),其中R、B、r、g、r/g、g-r、(r-g-b)/(r+g)、g-b、EXR、GLA、NDI、GRVI、CIVE、EXGR、VARI和MGRVI 16個影像指數(shù)達到0.01相關(guān)水平,(r-g-b)/(r+g)的相關(guān)系數(shù)絕對值最大,為0.812;塊莖增長期,除G表現(xiàn)不相關(guān)外,其余20個影像變量均與PNC達到0.01相關(guān)水平,其中GLA的相關(guān)系數(shù)絕對值最大,為0.834;淀粉積累期,除r-b表現(xiàn)不相關(guān)外,其余影像變量均與PNC達到0.05相關(guān)水平,其中R、G、B、r、g、b、r/g、g-r、(r-g-b)/(r+g)、g-b、EXR、GLA、NDI、GRVI、CIVE、EXGR、VARI和MGRVI 18個影像變量達到0.01相關(guān)水平,R的相關(guān)系數(shù)絕對值最大,為0.765;成熟期影像變量與馬鈴薯PNC間的相關(guān)性較前一時期明顯減弱,僅G、r、b、r/b、r-b、g-r、g-b、(r-g-b)/(r+g)和IKAW 9個影像變量達到0.01相關(guān)水平,其中r/b的相關(guān)系數(shù)絕對值最大,為0.458。
表2 各生育期影像變量與PNC的相關(guān)性Tab.2 Correlation of image variables with PNC in different growth stages
5個生育期的Hdsm與馬鈴薯PNC均達到0.05相關(guān)水平,其中,塊莖形成期的相關(guān)性最好,相關(guān)系數(shù)絕對值為0.717,成熟期最差,相關(guān)系數(shù)絕對值為0.281,現(xiàn)蕾期、塊莖增長期、淀粉積累期分別為0.335、0.484、0.506。
2.2.2馬鈴薯PNC的估算與驗證
為探究加入株高是否能提高影像變量估算馬鈴薯PNC的能力,在馬鈴薯各生育期基于影像變量和影像變量結(jié)合Hdsm2種模型變量分別利用MLR、BP神經(jīng)網(wǎng)絡(luò)和Lasso回歸3種方法構(gòu)建PNC估算模型并驗證。其中,馬鈴薯現(xiàn)蕾期,影像變量與PNC的相關(guān)性普遍較差,僅選取R、G和B3個與PNC顯著相關(guān)的影像變量作為模型的輸入變量,其余4個生育期,分別選取與PNC相關(guān)系數(shù)絕對值較大的前10個影像變量作為模型的輸入變量。3種方法各生育期估算PNC的建模與驗證結(jié)果如表3和表4所示。由表3、4可知,以影像變量和影像變量結(jié)合Hdsm為模型變量,利用3種方法構(gòu)建的馬鈴薯PNC估算模型均表現(xiàn)為塊莖形成期到淀粉積累期的估算效果明顯優(yōu)于現(xiàn)蕾期和成熟期。不同生育期利用同種方法構(gòu)建的馬鈴薯PNC估算模型中,相較于單一影像變量,影像變量結(jié)合Hdsm的建模R2均有所提高,RMSE和NRMSE均有所下降,驗證結(jié)果與建模結(jié)果具有一致性。
表3 不同生育期3種方法PNC估算對比Tab.3 Comparison of PNC estimation results of three methods in different growth stages
表4 不同生育期3種方法PNC驗證結(jié)果對比Tab.4 Comparison of PNC validation results of three methods in different growth stages
圖3 影像變量結(jié)合Hdsm的MLR模型建模和驗證效果Fig.3 Modeling and validation effects of MLR method with image variables combined with Hdsm
綜合各生育期的建模和驗證結(jié)果可知,以同種模型變量利用MLR構(gòu)建的模型效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和Lasso回歸。其中,影像變量結(jié)合Hdsm的MLR方法精度最高,其在各生育期的建模和驗證效果如圖3所示。由圖3可知,馬鈴薯塊莖形成期、塊莖增長期和淀粉積累期的估算效果較好,各樣本點均分布在1∶1線附近。3個時期建模R2分別為0.770、0.809、0.651,RMSE分別為0.293%、0.263%、0.292%,NRMSE分別為9.304%、9.860%、9.734%。驗證R2分別為0.753、0.703、0.632,RMSE分別為0.298%、0.327%、0.212%,NRMSE分別為8.961%、11.958%、7.720%。成熟期的估算精度明顯降低,建模R2為0.557,RMSE為0.342%,NRMSE為13.072%,驗證R2為0.498,RMSE為0.332%,NRMSE為11.884%?,F(xiàn)蕾期的估算精度最差,樣本點偏離1∶1線嚴重。這一時期建模和驗證的R2分別為0.438和0.301,RMSE分別為0.606%和0.657%,NRME分別為16.633%和16.803%。
本研究基于馬鈴薯5個關(guān)鍵生育期的DSM提取株高Hdsm,并將Hdsm與實測H對比分析,結(jié)果表明,兩者的擬合R2為0.860,RMSE為2.663 cm,NRMSE為10.234%,說明基于無人機數(shù)碼影像提取的株高具有較高的精度,這與文獻[19-20]得出的結(jié)論一致。不同的是,文獻[19-20]是從DSM生成的作物表面模型(Crop surface model,CSM)中提取的株高Hcsm,而本研究的Hdsm是利用各生育期的DSM與裸土期的DSM的差值提取的,主要原因是本研究中馬鈴薯的種植方式為壟上種植,壟具有一定的高度,而Hcsm表示的是作物莖頂端到地面的距離,因此Hdsm較Hcsm更能表示馬鈴薯的實際高度。
本文以影像變量和影像變量結(jié)合株高為模型變量,分別利用3種方法構(gòu)建馬鈴薯各生育期的PNC估算模型,由結(jié)果可知,塊莖形成期到淀粉積累期的估算效果明顯優(yōu)于現(xiàn)蕾期和成熟期。主要原因是,現(xiàn)蕾期馬鈴薯以營養(yǎng)生長為主,葉片空間結(jié)構(gòu)小,提取的影像變量和Hdsm受土壤背景影響大,不能很好地反映PNC的變化規(guī)律,因而模型估算效果差。塊莖形成期到淀粉積累期,馬鈴薯以營養(yǎng)生長和生殖生長為主,莖葉生長旺盛,植被覆蓋度大,地上部氮持續(xù)向地下塊莖輸送,這一階段提取的影像變量和Hdsm能較好地反映PNC的變化規(guī)律,因而模型效果較好。成熟期受降雨較多影響,部分馬鈴薯植株葉片快速枯黃脫落,提取的影像變量和Hdsm不能反映真實的PNC變化情況,因而估算模型的精度較低。
為探究加入株高對影像變量估算馬鈴薯PNC的影響,本研究分別基于影像變量和影像變量結(jié)合Hdsm構(gòu)建馬鈴薯5個關(guān)鍵生育期的PNC估算模型并驗證。結(jié)果表明,相較于單一影像變量,各生育期加入株高,均能提高馬鈴薯PNC的估算精度,其原因是株高是植株主莖的自然高度,植株的地上生物量和葉面積與莖的生長狀況聯(lián)系密切[21],而地上生物量和葉面積的變化又會引起植株莖和葉中氮含量的變化,株高的加入,提供了這些變化在不同層次的信息[22],因此,影像變量結(jié)合株高作為模型變量的馬鈴薯PNC估算模型優(yōu)于單一影像變量。然而,相較于其它4個生育期,塊莖增長期加入Hdsm后馬鈴薯PNC估算模型精度提升不明顯,這是由于塊莖增長期,馬鈴薯以生殖生長為主,地上部氮持續(xù)向下輸送,但此時的株高已達最大值,不再發(fā)生明顯變化。因而塊莖增長期加入Hdsm對影像變量估算馬鈴薯PNC的影響較小。
本文采用MLR、BP神經(jīng)網(wǎng)絡(luò)和Lasso回歸3種方法構(gòu)建馬鈴薯PNC估算模型,由表3、4可知,MLR方法構(gòu)建的模型精度和穩(wěn)定性優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和Lasso回歸,主要原因是:MLR模型能有效地利用多個自變量的信息,提高了對因變量的解釋能力;BP神經(jīng)網(wǎng)絡(luò)雖然有較強的非線性映射能力,在處理大數(shù)據(jù)集方面具有優(yōu)越的性能,但本研究的數(shù)據(jù)集較小,導(dǎo)致模型的泛化能力較差,模型精度不高。Lasso回歸雖然能極大地降低模型的復(fù)雜度,但也因此丟失部分變量信息,導(dǎo)致估算精度不高。此外,本文僅用1年的馬鈴薯數(shù)據(jù),所得的結(jié)論是否適用于不同年限和地點的馬鈴薯數(shù)據(jù),還需要進一步研究分析。
(1)基于DSM提取的Hdsm與實測H高度擬合,R2為0.860,RMSE為2.663 cm,NRMSE為10.234%,說明利用DSM提取的馬鈴薯株高精度可靠。
(2)相較于單一影像變量,各生育期加入Hdsm,均能提高馬鈴薯植株氮含量的估算精度。
(3)MLR、BP神經(jīng)網(wǎng)絡(luò)和Lasso回歸構(gòu)建的馬鈴薯植株氮含量估算模型中,以影像變量結(jié)合Hdsm的MLR模型效果最好,5個生育期的建模R2分別為0.438、0.770、0.809、0.651、0.557,RMSE分別為0.606%、0.293%、0.263%、0.292%、0.342%,NRMSE分別為16.633%、9.304%、9.860%、9.734%、13.072%,表明模型精度較高。該研究為馬鈴薯的營養(yǎng)狀況監(jiān)測提供一種快捷、高效的技術(shù)方法。