李成舉, 劉寅篤, 秦天元, 王一好, 范又方,姚攀鋒, 孫 超, 畢真真*, 白江平*
1. 甘肅農(nóng)業(yè)大學農(nóng)學院, 甘肅 蘭州 730070
2. 省部共建干旱生境作物學國家重點實驗室, 甘肅 蘭州 730070
3. 甘肅省作物遺傳改良與種質(zhì)創(chuàng)新重點實驗室, 甘肅 蘭州 730070
葉綠素是植物光合作用中最重要的色素, 與產(chǎn)量形成密切相關(guān), 因此, 在農(nóng)業(yè)生產(chǎn)中常用葉綠素含量來監(jiān)測農(nóng)作物生長狀況[1]。 馬鈴薯是全球第四大糧食作物, 其葉片的葉綠素含量是衡量生長狀況的重要指標, 實現(xiàn)對馬鈴薯冠層葉綠素含量變化的監(jiān)測, 可以及時掌握其生長狀況, 有助于提高馬鈴薯產(chǎn)量。 傳統(tǒng)的馬鈴薯葉綠素含量測量主要以分光光度計法為主, 該方法測量的葉綠素含量更加精準, 但是對作物的破壞程度大, 且費時費力, 測量步驟繁瑣, 很難實現(xiàn)大批量的測量[2]。 而手持式葉綠素含量測定儀的出現(xiàn)在一定程度上解決了傳統(tǒng)方法的弊端, 通過測量馬鈴薯葉片對紅光波段和近紅外波段的吸收率, 計算得到葉綠素相對含量, 即SPAD值。 有學者研究表明, 使用手持式葉綠素含量測定儀獲取的相對葉綠素含量與傳統(tǒng)方法測定的葉綠素含量之間存在顯著相關(guān)性[3]。 盡管該方法能夠無損、 快速地測量馬鈴薯葉片葉綠素相對含量, 但由于需要對馬鈴薯葉片逐個測量, 很難運用在大空間尺度上。
近年來, 遙感技術(shù)以其快速、 高效、 無損的特點被廣泛應用于農(nóng)作物長勢監(jiān)測中, 而近低空無人機遙感平臺以其作業(yè)周期短、 靈活性高、 運行和維護成本低等優(yōu)勢代替了航天遙感和地面遙感, 應用于中小尺度的農(nóng)田中, 以獲取更準確的作物生長參數(shù)[4]。 多光譜傳感器相較于可見光相機增加了紅邊和近紅外波段, 與高光譜相機相比, 成本低、 質(zhì)量小、 數(shù)據(jù)處理簡單, 能夠更加經(jīng)濟且有效的大范圍監(jiān)測作物長勢[5]。 目前, 已有大量研究開展了基于無人機多光譜的植物葉綠素含量反演工作。 在之前的研究中, 研究學者通過使用單一植被指數(shù)構(gòu)建葉綠素含量反演模型。 于豐華[6]等對水稻葉綠素含量進行了反演, 發(fā)現(xiàn)使用紅邊優(yōu)化指數(shù)(ORVI)可以建立的葉綠素含量反演模型決定系數(shù)為0.726, 能夠用于水稻葉綠素含量預測。 蘇偉等[7]使用無人機獲取的遙感影像反演玉米冠層的葉綠素含量, 將不同分辨率下(0.1~1 m)的不同植被指數(shù)與地面實測數(shù)據(jù)進行回歸分析, 研究發(fā)現(xiàn), 分辨率為0.1 m時, 紅邊歸一化植被指數(shù)(NDVIre)與地面實測葉綠素含量之間的決定系數(shù)R2為0.7, 說明使用NDVIre預測玉米葉綠素含量是可行的。 也有學者[8]使用無人機搭載多光譜獲取甜菜的冠層遙感影像, 使用不同植被指數(shù)與葉綠素含量實測數(shù)據(jù)進行擬合, 得出土壤調(diào)整植被指數(shù)(OSAVI)擬合效果最好。 同時有研究發(fā)現(xiàn), 使用一階微分光譜指數(shù)作為輸入變量建立的大豆葉綠素含量預測模型決定系數(shù)達到0.836, 可以用來預測大豆葉綠素含量[9]。 雖然使用單一植被指數(shù)建立的模型可用來預測作物的葉綠素含量, 但是對于使用多種植被指數(shù)作為自變量是否會影響葉綠素含量反演模型的精度尚不明確。 因此, 有學者使用多種植被指數(shù)組合作為自變量, 研究了使用統(tǒng)計回歸方法是否能提高葉綠素含量反演模型的精度。 其中, 王丹等[10]使用無人機搭載多光譜相機對玉米主要生育期葉綠素含量進行監(jiān)測及反演模型構(gòu)建, 發(fā)現(xiàn)以三種植被指數(shù)為自變量構(gòu)建的多元線性回歸模型精度更高更穩(wěn)定。 田明璐等[11]研究發(fā)現(xiàn)使用多元逐步回歸建立的棉花冠層葉綠素含量反演模型精度更高。 陳鵬等[12]在馬鈴薯冠層葉綠素含量反演模型研究中, 不僅將多種植被指數(shù)作為自變量, 還引入了紋理特征的參數(shù), 結(jié)果表明, 使用植被指數(shù)與紋理特征組合可以提高葉綠素含量反演模型的精度。 前人的研究表明, 增加輸入變量可提高葉綠素含量反演模型的精度, 但是當變量增多時, 統(tǒng)計回歸算法的擬合效果并不理想。 而機器學習是有效開發(fā)預測模型的一種方法, 當輸入變量增多時, 機器學習的擬合效果優(yōu)于統(tǒng)計回歸算法, 近年來常用于表型反演模型的構(gòu)建, 其預測精度均高于統(tǒng)計回歸模型的預測精度[13]。 常用于植物葉綠素含量反演模型構(gòu)建的機器學習算法主要有支持向量機回歸(SVR)、 隨機森林回歸(RFR)、 決策樹回歸(DTR), 目前已應用于水稻[14][15]、 小麥[16-17]、 玉米[18]、 蘋果[19]、 柑橘[20]等植物中葉綠素含量的估算, 但是, 機器學習在馬鈴薯中的應用還鮮有報道。
因此, 為進一步提高馬鈴薯葉綠素含量估算精度, 本研究以西北地區(qū)馬鈴薯為研究對象, 使用無人機搭載多光譜相機獲取馬鈴薯全生育期的冠層遙感影像, 同期測量馬鈴薯葉片葉綠素含量, 分析13種植被指數(shù)與葉綠素含量之間的相關(guān)性, 選擇0.05水平下顯著相關(guān)的植被指數(shù)作為輸入變量, 使用機器學習算法構(gòu)建馬鈴薯關(guān)鍵生育期最佳的葉綠素含量反演模型, 以期實現(xiàn)監(jiān)測馬鈴薯冠層葉綠素含量的生長動態(tài)變化, 為田間精準管理提供理論依據(jù)。
試驗區(qū)位于甘肅省白銀市景泰縣條山農(nóng)場(103.59°E, 37.09°N), 土壤類型以砂壤土為主, 年平均降雨量為185.5 mm, 年平均氣溫8.2 ℃, 無霜期191 d, 年平均太陽輻射5.3×104MJ·m-2。
本研究供試材料為34份馬鈴薯栽培品種, 所有供試材料的脫毒種薯由甘肅省定西市馬鈴薯研究所提供, 試驗編號如表1所示。 試驗采用隨機區(qū)組試驗設計, 設對照(CK)和干旱(D)兩個處理, 其中每個處理設34個小區(qū)(每個品種種植一個小區(qū)), 每個小區(qū)4壟, 每壟25株, 株距20 cm, 壟寬為60 cm, 壟高為20 cm, 行距60 cm, 小區(qū)面積1.2 m×5 m=6 m2, 采用壟上滴灌的栽培方式, 壟面中央鋪設16 mm的滴灌帶, 滴孔間距為20 cm。 對照(CK)處理田間持水量約為60%, 3 d一次, 每次澆水2 h, 干旱(D)處理田間持水量約為30%, 3 d一次, 每次澆水1 h。 播前一周施用基肥, 復合肥(N∶P∶K=17∶17∶17)80 kg·hm-2, 播種后55 d開始, 每隔15 d追施尿素10 kg·hm-2。 圖1為本研究試驗小區(qū)設計。
圖1 本研究試驗小區(qū)設計
表1 34份馬鈴薯品種試驗編號
馬鈴薯葉綠素含量使用手持式SPAD-502 plus葉綠素計于2021年7月3日(塊莖形成期, 播種后70 d)、 7月18日(塊莖膨大期, 播種后85 d)、 8月2日(淀粉積累期, 播種后100 d)進行測量, 每個小區(qū)隨機選取3株, 每株選擇倒3葉的頂小葉, 每個葉片測量三次并記錄平均值[21]。
使用大疆悟inspire 2四旋翼無人機平臺, 無人機凈重3.44 kg, 最大起飛重量4.25 kg, 最大飛行時間23 min。 無人機搭載的多光譜相機為MicaSense Altum多光譜相機, 質(zhì)量354 g, 焦距8 mm, 拍照最小時間間隔1 s, 圖像大小2 064像素×1 544像素, 輸出位深12 bit, 中心波長和帶寬如表2所示。
表2 多光譜相機中心波長和帶寬
遙感數(shù)據(jù)采集與地面數(shù)據(jù)同期進行, 為減小大氣對遙感影像質(zhì)量的影響, 選擇無云低風的晴朗天氣, 于11:00—14:00之間采集。 使用DJI Pilot APP 選擇試驗區(qū)范圍并規(guī)劃航線自主飛行。 設置飛行高度40 m, 拍攝方式為等時間間隔拍照, 時間間隔1.5 s, 設置航向重疊率80%, 旁向重疊率85%, 圖像空間分辨率1.73 piexl。
1.5.1 遙感數(shù)據(jù)預處理
使用Pix4Dmapper軟件對采集的遙感影像數(shù)據(jù)進行拼接處理, 同時導入每次飛行前拍攝的校準板照片進行輻射校正, 最終可以生成該試驗區(qū)地物反射率的正射影像圖。 在Arcgis軟件中對正射影像圖進行掩膜裁剪處理, 提取指定點的單波段反射率, 每個小區(qū)隨機選取12點, 每4個點的反射率取平均值(圖2), 在Excel 2019中對單波段反射率進行統(tǒng)計并計算植被指數(shù), 植被指數(shù)計算公式如表3所示, 得到的各小區(qū)植被指數(shù)將作為葉綠素含量估測模型的輸入變量。
圖2 指定點反射率
表3 植被指數(shù)計算公式
1.5.2 模型構(gòu)建與精度評價
由于受到環(huán)境的影響, 第4、 第5、 第17小區(qū)的馬鈴薯品種與其他馬鈴薯品種出苗時間相差一個月以上, 將以上三個小區(qū)剔除(圖1), 因此, 建模中使用的樣本數(shù)據(jù)量為93組數(shù)據(jù), 根據(jù)相關(guān)文獻的報道[20], 隨機選取樣本數(shù)據(jù)的70%(65組數(shù)據(jù))進行模型反演, 30%(28組數(shù)據(jù))來作驗證集進行模型精度評價。 使用多元線性回歸(MLR)、 支持向量機回歸(SVR)、 隨機森林回歸(RFR)、 決策樹回歸(DTR)四種機器學習算法分別建立馬鈴薯葉綠素含量反演模型, 以上回歸算法均在Pytion中使用sklearn工具包實現(xiàn)。
(1)多元線性回歸(multiple linear regression, MLR): 多元線性回歸是使用多個自變量對因變量進行解釋的一種回歸方法, 多元線性回歸方法要求自變量與因變量之間要有顯著的相關(guān)性[31]。
(2)支持向量機回歸(support vector machine regression, SVR): 支持向量機是一種基于結(jié)構(gòu)風險最小化原理發(fā)展起來的有監(jiān)督機器學習算法, 可以用來解決模式識別和數(shù)據(jù)分析的回歸和分類問題。 SVM在解決回歸問題時, 采用的原理是先將數(shù)據(jù)通過非線性變換映射到高維特征空間, 然后在該空間建立線性模型來擬合回歸函數(shù)。 但是SVM算法難以實現(xiàn)大規(guī)模樣本的訓練, 且無法解決多分類問題。 可用來實現(xiàn)非線性轉(zhuǎn)換的核函數(shù)有: 線性核函數(shù)(Linear)、 多項式核函數(shù)(Polynomial)和徑向基核函數(shù)(RBF)[32]。
(3)隨機森林回歸: (random forest regression, RFR)隨機森林是一種有監(jiān)督的機器學習方法, 該算法實質(zhì)是一個包含多個決策樹的分類器, 它結(jié)合多個決策樹形成了一個“森林”, 這些決策樹隨機形成, 因此又叫作隨機決策樹, 可用來解決分類和回歸問題, 即可以同時處理分類和數(shù)值特征, 并且隨機森林可以通過平均決策樹降低過擬合的風險。 同時, 該方法也存在部分缺點, 如: 在分類或者回歸問題的訓練數(shù)據(jù)中存在噪音; 比決策樹算法更復雜, 計算成本更高。 隨機森林中有三個主要參數(shù), 分別是隨機森林中樹的個數(shù)(n_estimators)、 樹節(jié)點的最小樣本數(shù)(min_sample_leaf)和每個分支的特征個數(shù)(max_features)[33]。 本研究中通過調(diào)整樹的個數(shù)來調(diào)整模型的精度, 其他參數(shù)保持默認值。
自萊比錫大學分開后,蔡元培與但采爾十多年未見,想不到會因民族學會議而在異國相逢,雙方感到分外親切,談論最多的卻是民族學研究。但采爾告訴蔡元培,漢堡民族博物館有極豐富的民族學資料,并竭力邀請他去該校專研民族學。蔡元培對民族學研究本身就充滿熱情,德國漢堡有很好的研究條件,又有這么一位好友邀請,便愉快地答應了。
(4)決策樹回歸(decision tree regression, DTR): 決策樹起源于機器學習理論, 是解決分類和回歸問題的的非參數(shù)監(jiān)督學習方法。 決策樹采用的是從高層次特征到低層次特征解決問題的思想。 決策樹模型是一種樹狀結(jié)構(gòu), 建立模型時需要從決策樹的根節(jié)點開始, 逐步向下決策得到最終結(jié)果。 但是決策樹模型容易出現(xiàn)過擬合的現(xiàn)象, 使得模型的泛化能力很低[34]。
采用決定系數(shù)R2和均方根誤差RMSE評價葉綠素含量模型的精度。R2越大, RMSE越小, 模型的精度越高。
對不同處理下31個馬鈴薯品種中獲取的13種植被指數(shù)與葉綠素含量進行Pearson相關(guān)性分析, 結(jié)果如圖3—圖5所示。
圖3 塊莖形成期葉綠素含量與植被指數(shù)相關(guān)性分析
塊莖形成期葉綠素含量與植被指數(shù)相關(guān)性分析結(jié)果如圖3所示, 對照處理下, 葉綠素含量與植被指數(shù)的相關(guān)系數(shù)絕對值在0.2~0.7之間, GRVI與葉綠素含量的相關(guān)系數(shù)絕對值最高, DVI與葉綠素含量的相關(guān)系數(shù)絕對值最低, CIre和RTVI與葉綠素含量在0.05水平上顯著相關(guān), NDVI和WDRI與葉綠素含量在0.01水平上極顯著相關(guān), 其他植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān); 干旱處理下, 葉綠素含量與植被指數(shù)的相關(guān)系數(shù)絕對值在0.6~0.9之間, GRVI與葉綠素含量的相關(guān)系數(shù)絕對值最高, DVI、 MSR、 NDVI和WDRI與葉綠素含量的相關(guān)系數(shù)絕對值最低, 所有植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān)。 因此, 在對照處理中, 可作為馬鈴薯塊莖形成期葉綠素含量反演模型輸入變量的植被指數(shù)有: CIre、 GNDVI、 NDVIre、 NDWI、 GRVI、 LCI; 在干旱處理中, 13種植被指數(shù)均可作為馬鈴薯塊莖形成期葉綠素含量反演模型的輸入變量。
塊莖膨大期葉綠素含量與植被指數(shù)相關(guān)性分析結(jié)果如圖4所示, 對照處理下, 葉綠素含量與植被指數(shù)的相關(guān)系數(shù)絕對值在0.6~0.8之間, CIre、 GNDVI、 NDVIre、 NDWI、 GRVI與葉綠素含量的相關(guān)系數(shù)絕對值最高, DVI和RTVI與葉綠素含量的相關(guān)系數(shù)絕對值最低, 所有植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān); 干旱處理下, CIre、 GNDVI、 NDVIre、 NDWI、 RTVI、 GRVI、 LCI與葉綠素含量的相關(guān)系數(shù)絕對值為0.9, DVI、 MSR、 NDVI、 RVI、 TCARI、 WDRI與葉綠素含量的相關(guān)系數(shù)絕對值為0.8, 所有植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān)。 因此, 在對照處理和干旱處理中, 13種植被指數(shù)均可作為馬鈴薯塊莖膨大期葉綠素含量反演模型的輸入變量。
圖4 塊莖膨大期葉綠素含量與植被指數(shù)相關(guān)性分析
淀粉積累期葉綠素含量與植被指數(shù)相關(guān)性分析結(jié)果如圖5所示, 對照處理下, 葉綠素含量與植被指數(shù)的相關(guān)系數(shù)絕對值在0.8~0.9之間, 所有植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān); 干旱處理下, 葉綠素含量與植被指數(shù)的相關(guān)系數(shù)絕對值均為0.6, 所有植被指數(shù)與葉綠素含量均在0.001水平上極顯著相關(guān), 除NDWI與TCARI外, 其他植被指數(shù)均與葉綠素含量呈正相關(guān)。 因此, 在對照處理和干旱處理中, 13種植被指數(shù)均可作為馬鈴薯淀粉積累期葉綠素含量反演模型的輸入變量。
圖5 淀粉積累期葉綠素含量與植被指數(shù)相關(guān)性分析
綜上, 在對照處理塊莖形成期, 使用CIre、 GNDVI、 NDVIre、 NDWI、 GRVI、 LCI作為輸入變量, 在馬鈴薯其他生育時期, 13種植被指數(shù)均可作為馬鈴薯葉綠素含量反演模型的輸入變量。
將不同植被指數(shù)作為自變量, 實測葉綠素含量作為因變量, 使用MLR、 SVR、 RFR和DTR等算法分別建立馬鈴薯葉綠素含量反演模型。 根據(jù)經(jīng)驗及多次試驗, SVR算法使用徑向基核函數(shù), RFR算法的分類樹為100, DTR算法的決策樹深度為2, 其他參數(shù)為默認值。 不同算法得出的建模精度和驗證精度的結(jié)果如表4、 表5所示。
表4 對照處理下馬鈴薯不同生育期葉綠素含量估算模型比較
表5 干旱處理下馬鈴薯不同生育期葉綠素含量估算模型精度
在對照處理塊莖形成期, RFR模型建模精度相較于MLR、 SVR和DTR模型,R2分別提高了0.34、 0.43和0.37, RMSE分別降低了2.36、 2.90和2.50; SVR模型驗證精度相較于MLR、 RFR和DTR模型,R2分別提高了0.10、 0.19和0.14, RMSE分別降低了0.59、 0.84和1.61(表4)。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 但SVR模型穩(wěn)定性優(yōu)于MLR、 RFR和DTR模型, 因此, 在對照處理塊莖形成期可使用SVR模型預測馬鈴薯葉片葉綠素含量。
在對照處理塊莖膨大期, RFR模型建模精度相較于MLR、 SVR和DTR模型,R2分別提高了0.19、 0.24和0.21, RMSE分別降低了1.54、 1.93和1.72; SVR模型驗證精度相較于MLR、 RFR和DTR模型,R2分別提高了0.08、 0.02和0.12, RMSE分別降低了0.46、 0.16和0.59(表4)。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 但SVR模型穩(wěn)定性優(yōu)于MLR、 RFR和DTR模型, 因此, 在對照處理塊莖膨大期可使用SVR模型預測馬鈴薯葉片葉綠素含量。
在對照處理淀粉積累期, RFR模型建模精度相較于MLR、 SVR和DTR模型,R2分別提高了0.19、 0.29和0.20, RMSE分別降低1.88、 2.62和1.95; 在驗證模型中, SVR模型的R2與DTR模型相同, 相較于MLR和RFR模型分別提高了0.05和0.02, 相較于MLR、 RFR和DTR模型, SVR模型的RMSE分別降低了0.08、 0.29和0.12(表4)。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 但SVR模型穩(wěn)定性優(yōu)于MLR、 RFR和DTR模型, 因此, 在對照處理淀粉積累期可使用SVR模型預測馬鈴薯葉片葉綠素含量。
由表5可知, 在干旱處理塊莖形成期, RFR模型相較于MLR、 SVR和DTR模型, 建模精度的R2分別提高了0.10、 0.22和0.20, RMSE分別降低了0.69、 1.49和1.16; 驗證精度的R2分別提高0.06、 0.12和0.37, RMSE分別降低了0.10、 0.54和1.45。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 且RFR模型的穩(wěn)定性高于MLR、 SVR和DTR模型, 因此, 在干旱處理塊莖形成期可使用RFR模型預測馬鈴薯葉片葉綠素含量。
在干旱處理塊莖膨大期, RFR模型相較于MLR、 SVR和DTR模型, 建模精度的R2分別提高了0.09、 0.15和0.14, RMSE分別降低了1.15、 1.63和1.53; 驗證精度的R2分別提高了0.17、 0.03和0.01, RFR模型的RMSE與SVR模型相同, 相較于DTR模型提高了0.09, 與MLR模型相比降低了0.77(表5)。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 總體來看, RFR、 SVR、 DTR三種模型的驗證精度幾乎相同, 均高于MLR模型, 但是RFR模型的R2高于SVR和DTR模型, 因此RFR模型的穩(wěn)定性高于MLR、 SVR和DTR模型, 因此, 在干旱處理塊莖膨大期可使用RFR模型預測馬鈴薯葉片葉綠素含量。
在干旱處理淀粉積累期, RFR模型相較于MLR、 SVR和DTR模型, 建模精度的R2分別提高了0.40、 0.56和0.22, RMSE分別降低了1.91、 2.51和1.18; 在驗證精度中, RFR模型相較于MLR、 SVR和DTR模型,R2分別提高了0.62、 0.04和0.53, RMSE分別降低了3.31、 0.51和2.09(表5)。 說明RFR模型對馬鈴薯葉片葉綠素含量的估算精度高于MLR、 SVR和DTR模型, 且RFR模型的穩(wěn)定性高于MLR、 SVR和DTR模型。 因此, 在干旱處理淀粉積累期可使用RFR模型預測馬鈴薯葉片葉綠素含量。
綜上所述, 本文選擇SVR回歸算法構(gòu)建對照處理的馬鈴薯葉片葉綠素含量估算模型, 選擇RFR回歸算法構(gòu)建干旱處理的馬鈴薯葉片葉綠素含量估算模型, 不同生育期葉綠素含量最佳預測模型如圖6—圖8所示。
圖6 塊莖形成期葉綠素含量最佳預測模型
圖7 塊莖膨大期葉綠素含量最佳預測模型
圖8 淀粉積累期葉綠素含量最佳預測模型
目前, 作物表型監(jiān)測主要以衛(wèi)星遙感、 高光譜和多光譜為主, 衛(wèi)星遙感雖然可以實現(xiàn)大面積監(jiān)測, 但存在空間分辨率低的不足, 且難以實現(xiàn)小區(qū)域作物表型的監(jiān)測[35]。 高光譜和多光譜監(jiān)測可以解決小區(qū)域作物表型難以監(jiān)測的問題, 但是高光譜監(jiān)測也存在設備成本高, 數(shù)據(jù)量大, 處理難度高等問題。 本文基于輕小型無人機平臺搭載多光譜相機, 獲取了馬鈴薯關(guān)鍵生育期影像數(shù)據(jù), 根據(jù)前人的研究結(jié)果, 選擇與葉綠素含量相關(guān)性較高的植被指數(shù), 通過不同的機器學習算法, 篩選出對馬鈴薯葉綠素含量的估測效果更好的模型, 為馬鈴薯含量的快速估算提供了新方法。
結(jié)果表明, 在對照處理塊莖形成期, CIre、 GNDVI、 NDVIre、 NDWI、 GRVI、 LCI與葉綠素含量之間的相關(guān)系數(shù)絕對值在0.5以上, 且存在顯著(p<0.05)或極顯著(p<0.01)的相關(guān)性(圖3); 在馬鈴薯其他生育時期及干旱處理中, 13種植被指數(shù)與葉綠素含量之間的相關(guān)系數(shù)絕對值均在0.5以上, 且存在極顯著(p<0.01或p<0.001)的相關(guān)性(圖3—圖5)。 但從塊莖形成期到淀粉積累期, 植被指數(shù)與葉綠素含量相關(guān)性的變化無明顯的規(guī)律, 可能是不同生育期的植被指數(shù)對葉綠素含量的敏感程度不一樣, 陶惠林等[35]在對冬小麥產(chǎn)量估算的研究中也出現(xiàn)類似的結(jié)果。 在對照處理中, RFR模型的建模精度是最高的, 但是驗證精度出現(xiàn)了降低的現(xiàn)象, 其原因可能是RFR模型受到模型參數(shù)的影響, 在生成的樹中出現(xiàn)了差異較小的樹, 這些樹影響了部分正確的決策。 有研究報道[16], 小麥葉綠素含量估算中也出現(xiàn)了RFR模型驗證精度下降的問題, 在模型選擇時主要參考驗證模型的結(jié)果, 因此本研究在選擇最優(yōu)模型時以驗證精度為主, 建模精度為輔。 此外, 在干旱處理淀粉積累期, MLR和DTR模型的驗證精度均出現(xiàn)明顯的下降, 可能是因為干旱脅迫導致馬鈴薯生育后期地上部分枯萎, 使13種植被指數(shù)與葉綠素含量之間的相關(guān)系數(shù)絕對值與對照處理相比出現(xiàn)了降低; 而RFR模型的驗證精度未出現(xiàn)明顯下降, 說明在馬鈴薯受到干旱脅迫時, 使用RFR模型預測馬鈴薯葉片葉綠素含量是可行的。
Cavallo[36]等研究發(fā)現(xiàn), 蔬菜葉綠素含量估測最佳模型為RFR模型, 估測模型的R2為0.90。 Shah[17]等在小麥葉綠素含量反演中的研究結(jié)果表明, RFR模型對葉綠素含量的預測效果是最好, 估測模型的R2為0.90。 王麗愛[16]等對不同機器學習算法估測小麥各生育期葉綠素含量的模型進行了比較, 結(jié)果表明, RFR模型在小麥拔節(jié)、 孕穗、 開花期的估測效果均是最好,R2分別為0.89、 0.85、 0.80。 但是, 王念一[14]等和張卓然[37]等在小麥和棉花中的研究結(jié)果與之不同, 以SVR算法構(gòu)建的葉綠素含量估測模型是最優(yōu)的。 在本研究中, SVR模型在對照處理塊莖形成期、 塊莖膨大期和淀粉積累期的預測效果均是最佳; 同時, RFR模型在干旱處理塊莖形成期、 塊莖膨大期和淀粉積累期的預測效果均是最佳(表4、 表5)。 因此, 后期在監(jiān)測馬鈴薯不同生育期或不同試驗處理的葉綠素含量時可選擇相應的估測模型, 為實現(xiàn)馬鈴薯全生育期葉綠素含量動態(tài)監(jiān)測提供參考。
利用三種機器學習算法反演馬鈴薯葉片葉綠素含量, 相較于前人的研究結(jié)果, 模型精度均有所提高, 其中SVR模型在對照處理塊莖形成期、 塊莖膨大期和淀粉積累期的預測效果均是最佳,R2和RMSE在塊莖形成期為0.89和2.11, 塊莖膨大期為0.59和4.03, 淀粉積累期為0.80和3.18; RFR模型在干旱處理塊莖形成期、 塊莖膨大期和淀粉積累期的預測效果均是最佳,R2和RMSE在塊莖形成期為0.90和1.57, 在塊莖膨大期為0.87和2.16, 在淀粉積累期為0.63和3.01。 上述結(jié)論表明機器學習可提高馬鈴薯葉片葉綠素反演精度, 研究結(jié)果可為不同生育期或不同處理下馬鈴薯葉綠素含量反演提供參考, 以期為精準農(nóng)業(yè)管理提供技術(shù)支持。