• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    優(yōu)化光譜指數(shù)助力機器學(xué)習(xí)提高馬鈴薯葉綠素含量反演精度

    2023-09-26 01:03:44楊海波賈禹澤
    關(guān)鍵詞:波段葉綠素馬鈴薯

    劉 楠,李 斐*,楊海波,尹 航,高 飛,賈禹澤,2,孫 智

    (1 內(nèi)蒙古農(nóng)業(yè)大學(xué)草原與資源環(huán)境學(xué)院 / 內(nèi)蒙古自治區(qū)土壤質(zhì)量與養(yǎng)分資源重點實驗室 / 農(nóng)業(yè)生態(tài)安全與綠色發(fā)展自治區(qū)高等學(xué)校重點實驗室,內(nèi)蒙古呼和浩特 010011;2 內(nèi)蒙古包頭市園林綠化事業(yè)發(fā)展中心,內(nèi)蒙古包頭 014010)

    馬鈴薯主糧化對保障我國糧食安全以及農(nóng)民經(jīng)濟收入起到了極大的促進作用[1]。葉綠素是光合作用的重要色素,直接影響馬鈴薯的能量物質(zhì)轉(zhuǎn)換與傳輸過程,也實時反映了馬鈴薯的營養(yǎng)狀況[2]。大量研究表明葉綠素含量與氮素有較好的相關(guān)性,通過葉綠素含量可以對農(nóng)作物的氮含量進行間接的估測[3-4],所以葉綠素含量的實時監(jiān)測對于氮素精準(zhǔn)管理起到了重要的作用。傳統(tǒng)的葉綠素含量測定方法在測定過程中會造成葉綠素的損失,導(dǎo)致結(jié)果變異性高,并且實驗室測定過程用時較長而且復(fù)雜,采樣時破壞性強,不適用于現(xiàn)代農(nóng)業(yè)的需求[5]。由于作物的反射率主要受葉綠素含量的影響[6],所以遙感技術(shù)已經(jīng)成為葉綠素含量實時無損估測的主要途徑。通過SPAD 值來表征相對葉綠素含量已經(jīng)得到國內(nèi)外研究者的認可,前人使用手持葉綠素儀對葉綠素含量進行快速的測定,所得結(jié)果與葉綠素實際含量的相關(guān)性達到了顯著水平[7]。但是使用SPAD 儀進行田間葉綠素的采集是以點帶面來表征群體特征,這就需要在田間進行大量的測定,費時費力,而且對于馬鈴薯作物來說,封壟后很難進入田間開展多點大面積采集,某種程度上不便于使用這種方法對田塊氮素養(yǎng)分狀況進行更精準(zhǔn)的測定。

    光譜指數(shù)估測方法由于計算方法方便快捷而備受研究人員的歡迎。通過研究發(fā)現(xiàn),光譜的紅邊區(qū)域包含了農(nóng)作物的重要生長信息,所以利用此范圍光譜信息建立的光譜指數(shù)多用于預(yù)測植物的生理參數(shù),并且研究發(fā)現(xiàn)其與葉綠素的相關(guān)性較高[8]。然而,大多數(shù)的光譜指數(shù)在作物生育前期容易受到土壤背景和冠層結(jié)構(gòu)的影響[9],生育后期存在飽和問題,導(dǎo)致估測精度降低[10],為了解決這一問題,學(xué)者們優(yōu)化敏感波段,構(gòu)建優(yōu)化光譜指數(shù)[11]。通過基于面積估算葉綠素含量的光譜指數(shù)類型進行優(yōu)化,然而優(yōu)化后的光譜指數(shù)由于波段少、穩(wěn)定性差,對葉綠素含量、氮含量和葉面積指數(shù)的估測精度也不盡人意[12-14]。并且光譜指數(shù)的敏感波段受到生育時期、地點以及品種等外在因素和光譜指數(shù)計算公式內(nèi)在因素的影響,敏感波段的位置會發(fā)生變化,導(dǎo)致已經(jīng)發(fā)表的光譜指數(shù)在面對本地化的數(shù)據(jù)時往往不能達到滿意的效果。因此,為了得到高精度的光譜指數(shù)來指導(dǎo)當(dāng)?shù)氐谋O(jiān)測,對不同方程形式的光譜指數(shù)波段進行優(yōu)化設(shè)計仍然是國內(nèi)外研究熱點,在小麥[15-16]、玉米[17-18]、水稻[19]和馬鈴薯[20]作物參數(shù)反演中扮演著重要角色。

    隨著人工智能的發(fā)展,越來越多的學(xué)者利用機器學(xué)習(xí)算法對農(nóng)作物參數(shù)進行估算,如葉面積指數(shù),生物量等[21-22]。機器學(xué)習(xí)算法根據(jù)輸入變量和輸出變量的數(shù)學(xué)關(guān)系,將模型分為線性非參數(shù)模型和非線性非參數(shù)模型。研究表明,機器學(xué)習(xí)算法對大田作物的葉綠素含量能進行有效估測[23-24]。然而,機器學(xué)習(xí)算法眾多,建立的模型穩(wěn)定性受較多因素的影響,而且計算程度也較為復(fù)雜[25],找到一個合適且估測精度高的模型較難。最常用的機器學(xué)習(xí)算法有非參數(shù)線性的偏最小二乘法和非線性的隨機森林模型,但是輸入變量的選擇顯著影響了模型的穩(wěn)定性和估測能力[26]。偏最小二乘法主要運用主成分分析的統(tǒng)計學(xué)方法,可以提取出光譜數(shù)據(jù)中的冠層信息,可以削弱光譜中噪音的影響,但其解決非線性問題的能力較弱[27];隨機森林模型一般估測能力變化較大,導(dǎo)致建模集相關(guān)性較好,驗證集相關(guān)性較差[28]。不同輸入變量如原始全光譜波段、提取的敏感波段以及組合計算形成的不同形式的光譜指數(shù),分別作為偏最小二乘法和隨機森林模型的輸入變量,進行玉米、小麥等作物葉綠素含量建模得到有效發(fā)展[29-30]。然而,作為我國第四大主糧作物,馬鈴薯由羽狀復(fù)葉組成,冠層結(jié)構(gòu)與小麥、玉米和水稻等作物冠層結(jié)構(gòu)有較大的區(qū)別,葉綠素是一個重要的作物生長和氮素營養(yǎng)診斷指標(biāo),很有必要進行馬鈴薯葉綠素含量實時監(jiān)測方法及其應(yīng)用的研究。

    我國西北地區(qū)水資源匱乏,作為我國馬鈴薯種植一作區(qū),滴灌為主要灌溉方式,馬鈴薯葉綠素的實時監(jiān)測對滴灌農(nóng)田進行多次施肥具有重要的意義。本研究以內(nèi)蒙古馬鈴薯主產(chǎn)區(qū)田間試驗為基礎(chǔ),利用馬鈴薯冠層光譜數(shù)據(jù),選用光譜指數(shù)算法和最常用的偏最小二乘法、隨機森林算法進行馬鈴薯葉綠素含量建模,評價方法的優(yōu)劣,比較不同輸入變量對兩種機器學(xué)習(xí)算法馬鈴薯葉綠素含量估測精度的影響,最終得到具有普適性的估測模型,為大田尺度上馬鈴薯葉綠素含量的監(jiān)測提供理論支持。

    1 材料與方法

    1.1 試驗設(shè)計

    分別于2019、2020 年開展兩個田間試驗,試驗地灌溉方式為滴灌,田間管理按照當(dāng)?shù)卮筇镆?,統(tǒng)一管理。具體試驗設(shè)計如下:

    2019 年的試驗在集寧大十號村進行,供試品種為‘冀張薯12’,設(shè)有7 個氮水平分別為0、75、150、220、250、300、375 kg/hm2,小區(qū)面積76 m2,兩壟中心相距為0.9 m,株距為20 cm。試驗田每個處理設(shè)4 次重復(fù),各小區(qū)隨機排列。

    2020 年的試驗在四子王進行,供試品種為‘希森6 號’,設(shè)有5 個氮水平分別為198、202、229、287、317 kg/hm2,小區(qū)面積120 m2,兩壟中心相距為0.9 m,株距為30 cm。試驗田每個處理設(shè)4 次重復(fù),各小區(qū)隨機排列。

    1.2 光譜數(shù)據(jù)的采集

    馬鈴薯冠層光譜數(shù)據(jù)的測定需要選擇在天氣晴朗、無風(fēng)的狀況下進行,測定的時間段為10:00—14:00。每個小區(qū)掃描3 次,最終測定結(jié)果取3 次掃描的平均值。光譜儀(tec5, Oberursel)的波段范圍為300~1150 nm,探頭在測定時距馬鈴薯冠層高度為50~80 cm,隨機選擇具有代表性的兩行馬鈴薯植株進行光譜測定。400 nm 以下的波段噪聲較大,導(dǎo)致光譜的不連續(xù),為了去除影響,采用的波段為400~1150 nm。2019 和2020 年的馬鈴薯數(shù)據(jù)分別進行了4 次采樣:苗期、塊莖形成期、塊莖膨大期、淀粉積累期。苗期和塊莖形成期為花前,塊莖膨大期和淀粉積累期為花后。

    1.3 葉綠素的測定

    葉綠素含量的測定采用SPAD-502 型手持式葉綠素儀,在獲取光譜的當(dāng)天同步測定馬鈴薯的SPAD值,每處理選取代表其生長勢的馬鈴薯植株20 株,每株取功能葉片(倒4 葉)進行測量,取平均值作為該樣本的SPAD 值。通過SPAD 值與葉綠素含量的線性關(guān)系[31],將SPAD 值轉(zhuǎn)換為葉綠素含量進行估測。具體計算公式如下:

    式中:y是SPAD 值;x是葉綠素含量,單位mg/g;r=0.97。

    1.4 光譜指數(shù)的選擇與優(yōu)化

    為了消除光譜指數(shù)具有的散射問題,學(xué)者們提出了反射率差比(RRD)等式[32]。公式如下:

    式中:h、i、j和k代表全光譜范圍內(nèi)的隨機波長,本研究中h、k相等。

    使用波段優(yōu)化算法來確定RRD 型光譜指數(shù)的最佳波段組合,本研究選取了已發(fā)表與葉綠素相關(guān)性較高的光譜指數(shù)進行建模與波段優(yōu)化,波段組合與計算形式大不相同。三波段光譜指數(shù)進行優(yōu)化時,固定算法中最小的光譜波段,對其他波段進行優(yōu)化。在400~1150 nm 波段范圍內(nèi),按表1 中的公式,將所有波段兩兩組計算的光譜指數(shù)與葉綠素含量進行相關(guān)矩陣圖的繪制,橫、縱坐標(biāo)皆為光譜反射波段(圖1)。圖1 中顏色代表原光譜根據(jù)計算公式組合后的光譜指數(shù)與葉綠素含量的決定系數(shù),顏色越紅代表公式與葉綠素含量的相關(guān)性越好,決定系數(shù)最高的光譜指數(shù)波段組合確定為敏感波段[39]。

    圖1 馬鈴薯葉綠素含量與不同波段光譜指數(shù)之間線性擬合決定系數(shù)(R2)的等值線圖Fig.1 Contour maps of the coefficient of determination (R2) between potato chlorophyll content and spectral indices

    表1 供試光譜指數(shù)Table 1 Spectral indices used in this study

    1.5 機器學(xué)習(xí)

    本研究采用ANDCONDA NAVIGATOR 中Jupyter的python 編輯器,采用的機器學(xué)習(xí)方法為偏最小二乘和隨機森林,本研究機器學(xué)習(xí)模型的輸入變量有兩類,一類是376 個原光譜波段,第二類是根據(jù)表1 的公式結(jié)合圖1 計算出與葉綠素含量相關(guān)性最高的6 類優(yōu)化光譜指數(shù)(優(yōu)化比率光譜指數(shù)、優(yōu)化歸一化光譜指數(shù)、優(yōu)化紅邊氮指數(shù)、優(yōu)化紅外葉綠素光譜指數(shù)、優(yōu)化修正紅邊比指數(shù)、優(yōu)化修正歸一化指數(shù))。

    1.5.1 隨機森林算法 隨機森林算法是高維數(shù)據(jù)分類和回歸方法,屬于集成算法,主要是運用多棵樹的投票機制來解決預(yù)測問題。用N來表示訓(xùn)練用例(樣本)的個數(shù),M表示特征數(shù)目。輸入特征數(shù)目m,用于確定決策樹上一個節(jié)點的決策結(jié)果;其中m應(yīng)遠小于M。從N 個訓(xùn)練用例(樣本)中以有放回抽樣的方式,取樣N 次,形成一個訓(xùn)練集,并用未抽到的用例(樣本)作預(yù)測,評估其誤差。對于每一個節(jié)點,隨機選擇m個特征,決策樹上每個節(jié)點的決定都是基于這些特征確定的。根據(jù)這m個特征,計算其最佳的分裂方式。每棵樹都會完整成長而不會剪枝,這有可能在建完一棵正常樹狀分類器后會被采用。對于回歸預(yù)測的問題,隨機森林算法將多棵樹的回歸結(jié)果進行平均,作為預(yù)測樣本的結(jié)果。

    1.5.2 偏最小二乘法 偏最小二乘法是一種多元統(tǒng)計的數(shù)據(jù)分析方法,它主要研究多因變量或單因變量對自變量的回歸建模。高光譜數(shù)據(jù)建立回歸模型往往存在共線性,偏最小二乘法不僅可以克服共線性問題,它在選取特征向量時強調(diào)自變量對因變量的解釋和預(yù)測作用,去除了對回歸無益輸入變量的影響。在建立模型的過程中,偏最小二乘法可以識別光譜信息和噪聲,能夠有效的減少數(shù)據(jù)冗余。

    1.6 模型的評價

    本研究綜合已有的光譜指數(shù)算法并在EXCEL、Matlab、python 軟件實現(xiàn)優(yōu)化以及計算。建模集分別采用花前、花后和全部數(shù)據(jù)集的75%進行建模,驗證集分別采用花前、花后和全部數(shù)據(jù)集的25%進行驗證。在田間試驗資料的基礎(chǔ)上,篩選對葉綠素含量敏感的光譜指數(shù),并建立模型,利用決定系數(shù)(R2)、均方根誤差(RMSE,mg/g)和相對誤差(RE,%)綜合評價模型,并繪制建模模型或者建模集和驗證集的1∶1 關(guān)系圖。

    計算公式如下:

    式中:n為樣本個數(shù),yi為實測值,i為預(yù)測值,為平均值。

    2 結(jié)果與分析

    2.1 基于光譜指數(shù)的馬鈴薯葉綠素含量反演

    本研究選擇最常用6 類光譜指數(shù)(表1)對馬鈴薯各生育時期的葉綠素含量進行估測,表2 展示了各光譜指數(shù)與馬鈴薯各生育時期葉綠素含量的關(guān)系決定系數(shù)。從表2 看出,6 類光譜指數(shù)與馬鈴薯葉綠素含量沒有很好的相關(guān)關(guān)系。尤其是花前光譜指數(shù)與馬鈴薯葉綠素含量幾乎沒有相關(guān)性,不能對馬鈴薯葉綠素含量進行預(yù)測;花后光譜指數(shù)mNDblue與馬鈴薯葉綠素含量相關(guān)性較好,決定系數(shù)達0.44;從整體來看,光譜指數(shù)與馬鈴薯葉綠素含量的相關(guān)性較差,其中決定系數(shù)最高的是光譜指數(shù)mNDblue。

    表2 已發(fā)表光譜指數(shù)與馬鈴薯葉綠素含量的關(guān)系決定系數(shù)Table 2 Coefficient of determination of the relationship between published spectral indices and potato chlorophyll content

    光譜指數(shù)對馬鈴薯葉綠素含量進行估測的過程中,生育前期由于植株較小,葉片無法有效覆蓋掃描區(qū)域,在數(shù)據(jù)采集過程中容易受到土壤背景的影響;生育后期由于葉綠素含量過高,光譜指數(shù)會出現(xiàn)數(shù)據(jù)飽和現(xiàn)象。為了解決這些問題,提高光譜指數(shù)在馬鈴薯葉綠素含量上的估測能力,本研究以選擇的6 類指數(shù)算法為依據(jù),利用不同光譜指數(shù)與葉綠素含量的相關(guān)矩陣圖進行尋優(yōu),確定不同類型的優(yōu)化光譜指數(shù)(圖1)。光譜指數(shù)經(jīng)過優(yōu)化后的敏感波段主要集中在紫光和綠光范圍??梢钥闯? 類光譜指數(shù)與馬鈴薯葉綠素含量的相關(guān)性都在0.5 以上,其中相關(guān)性最好的為優(yōu)化的NDVI,決定系數(shù)(R2)為0.64,敏感波段組合為408 和552 nm。

    為了進一步驗證構(gòu)建優(yōu)化光譜指數(shù)的穩(wěn)定性和魯棒性,對大田實測數(shù)據(jù)與優(yōu)化后的指數(shù)進行不同生育時期相關(guān)性分析(表3)。結(jié)果表明,對光譜指數(shù)中心波段進行優(yōu)化,可以有效的提高光譜指數(shù)估測馬鈴薯葉綠素含量的能力。在馬鈴薯花前6 類優(yōu)化光譜指數(shù)與實測數(shù)據(jù)的相關(guān)性較差,決定系數(shù)的范圍為0.03~0.31;在馬鈴薯花后優(yōu)化光譜指數(shù)與葉綠素含量的相關(guān)性較好,其中光譜指數(shù)Opt-NDVI 最好,決定系數(shù)為0.81。這些結(jié)果表明,生育時期顯著影響了光譜指數(shù)對馬鈴薯葉綠素含量的估測能力。

    表3 優(yōu)化光譜指數(shù)與馬鈴薯葉綠素含量的關(guān)系決定系數(shù)Table 3 Coefficient of determination of the relationship between optimized spectral indices and potato chlorophyll content

    2.2 基于PLSR 和RF 算法的建模

    為了探索模型輸入變量的優(yōu)劣,從而選擇最優(yōu)馬鈴薯葉綠素含量估測模型,本研究以376 個光譜波段和6 個優(yōu)化光譜指數(shù)作為輸入變量進行建模。從基于機器學(xué)習(xí)模型的決定系數(shù)(表4) 可以看出,隨機森林的建模能力最好,其中以優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型更優(yōu),且受生育時期的影響較小;偏最小二乘法中建模能力較好的是以原光譜波段作為輸入變量的模型,受生育時期的影響較大,在花前模型的決定系數(shù)較低為0.55,在花后模型的決定系數(shù)較高為0.84。與優(yōu)化指數(shù)估測模型相比,機器學(xué)習(xí)明顯提高了馬鈴薯葉綠素含量的估測能力。

    表4 基于機器學(xué)習(xí)模型的決定系數(shù) (R2) 和均方根誤差(RMSE)Table 4 Coefficient of determination and root-mean-square-error (RMSE) based on machine learning models

    從以優(yōu)化光譜指數(shù)為輸入變量的隨機森林和以原光譜波段作為輸入變量的偏最小二乘法模型的散點圖(圖2)可以看出,隨機森林的數(shù)據(jù)分布較為集中,并且通過花前、花后和所有數(shù)據(jù)集來看,建模能力較為穩(wěn)定;而偏最小二乘法模型的數(shù)據(jù)集較為分散,且在花前模型的分散度較大。

    圖2 優(yōu)化光譜指數(shù)作為輸入變量的隨機森林建模和原始光譜波段作為輸入變量的偏最小二乘法建模Fig.2 Random forest modeling with optimized spectral indices as input variables and partial least square modeling with original spectrum band as input variables

    2.3 模型的評價

    模型的魯棒性和準(zhǔn)確性取決于建模時的決定系數(shù)和均方根誤差,本研究采用了驗證集均方根誤差(RMSE,mg/g)和相對誤差(RE,%)對模型進行了評價。從表5 可以看出,在馬鈴薯花前模型驗證能力最好的是以優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型,驗證集的決定系數(shù)(R2) 為0.60;在花后,以優(yōu)化光譜指數(shù)作為輸入變量的偏最小二乘法模型的驗證集最差,決定系數(shù)(R2)為0.50,其中最好的模型驗證集是以優(yōu)化光譜指數(shù)為輸入變量的隨機森林模型,決定系數(shù)(R2)為0.89;所有數(shù)據(jù)中,以優(yōu)化光譜指數(shù)作為輸入變量的偏最小二乘法的精度最高,均方根誤差(RMSE,mg/g)和相對誤差(RE,%)最小,分別為0.91 mg/g 和4.75%。

    表5 基于機器學(xué)習(xí)驗證集的決定系數(shù)(R2)、均方根誤差(RMSE)和相對誤差(RE)Table 5 Coefficient of determination (R2), root mean square error (RMSE), relative error (RE) of machine learning model based on validation dataset

    綜合比較以上驗證數(shù)據(jù)集,隨機森林模型中,以優(yōu)化光譜指數(shù)為輸入變量模型的驗證集相關(guān)性最好,各生育時期的決定系數(shù)最高,且均方根誤差(RMSE, mg/g)和相對誤差(RE, %)最低;偏最小二乘法模型中,花前,優(yōu)化光譜指數(shù)建立模型的驗證集較好,RMSE 和RE 較低,花后以原光譜波段作為輸入變量的模型驗證集最好,R2最高,為0.83。但是以優(yōu)化光譜指數(shù)為輸入變量的偏最小二乘法建立模型的花后驗證集較差,R2為0.50 (表5)。為更直觀的比較輸入變量和兩種機器學(xué)習(xí)模型的驗證能力,本研究同樣對二者進行作散點圖分析(圖3)。從圖3可以看出,兩種模型的驗證數(shù)據(jù)集均勻的分布在1∶1 線周圍,偏最小二乘法的驗證集數(shù)據(jù)分布較為分散,且受生育時期的影響,馬鈴薯花前驗證集相關(guān)性較差;隨機森林模型的驗證集,實測值和估測值離散程度較小,分布較為緊密,驗證精度明顯較高。經(jīng)過決定系數(shù)、均方根誤差以及相對誤差的綜合評價,以優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型的驗證效果最好,并且受生育時期的影響較小,所以可以用隨機森林模型對馬鈴薯葉綠素含量進行估測。

    圖3 優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型和原始光譜波段作為輸入變量的偏最小二乘法模型驗證Fig.3 Validation of random forest modeling with optimized spectral index as variables and partial least square modeling with original spectrum band as variables

    為了探究生育時期對模型精度的影響,本研究利用花前和花后的數(shù)據(jù)進行作圖(圖4),優(yōu)化后的光譜指數(shù)雖然可以提高與葉綠素含量的相關(guān)性,但其驗證集的數(shù)據(jù)較為分散(圖4a),尤其在生育前期,對模型的精度影響較大;而優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型,驗證集的數(shù)據(jù)較為集中且均勻,說明該模型不僅提高了魯棒性,同時也克服了馬鈴薯生育時期的影響(圖4b)。為了驗證模型的實用性,通過PROSAIL 物理模型的模擬也進一步證明了基于優(yōu)化光譜指數(shù)的隨機森林模型在某種程度上普適性也較高,模型建模與驗證比較穩(wěn)定(圖5)。

    圖4 基于優(yōu)化光譜指數(shù)模型(a)與優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型(b)驗證Fig.4 Validation of optimized spectral indices modeling (a) and random forest modeling with optimized spectral index as input variables (b)

    圖5 基于PROSAIL 模擬數(shù)據(jù)庫計算優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型建模(a)與驗證(b)Fig.5 Calibration (a) and validation (b) of random forest model based on PROSAIL simulation database with optimized spectral index as input variable

    3 討論

    馬鈴薯葉綠素含量的實時監(jiān)測是大田管理的前提,隨著人工智能的快速發(fā)展,將來基于光譜和機器學(xué)習(xí)算法相結(jié)合的監(jiān)測方法最可能成為葉綠素含量估測的主要途徑,然而由于輸入變量以及估測模型的復(fù)雜性使得機器學(xué)習(xí)算法估測精準(zhǔn)度和穩(wěn)定性變化較大。本研究利用波段優(yōu)化算法對光譜指數(shù)波段進行優(yōu)化,隨后將優(yōu)化后的光譜指數(shù)與原始光譜波段作為機器學(xué)習(xí)的輸入變量,對不同輸入變量的機器學(xué)習(xí)模型進行比較。通過分析模型的精確性和穩(wěn)定性證明了以優(yōu)化光譜指數(shù)作為輸入變量的隨機森林模型預(yù)測能力最好,可用于馬鈴薯葉綠素含量的估測,為機器學(xué)習(xí)估測馬鈴薯葉綠素含量提供了理論依據(jù)。

    光譜波段的組合對光譜指數(shù)的預(yù)測能力具有顯著的影響,而光譜指數(shù)的敏感波段實際上主要受到光譜指數(shù)方程形式、環(huán)境、作物品種和生育時期等因素的影響,從而造成敏感波段在選擇上的差異[10,20]。本研究發(fā)現(xiàn)優(yōu)化光譜指數(shù)敏感波段在紫光和綠光范圍與馬鈴薯葉綠素含量的相關(guān)性最佳,綠光波段在估測馬鈴薯葉綠素含量的過程中體現(xiàn)出較好的效果[40]。基于紫光408 nm 和綠光552 nm 構(gòu)建的優(yōu)化光譜指數(shù)Opt-NDVI 在本研究中具有較好的估測效果,這與前人提出來的NDVI (680、800 nm)光譜敏感波段有較大的差別,這可能是因為原NDVI (680、800 nm)是基于玉米葉綠素含量建立,而馬鈴薯與玉米在生育時期方面有顯著的差異[41],所以,作物種類和生育時期會影響光譜指數(shù)的估測能力。因此,針對指定作物進行波段優(yōu)化從而篩選出最佳的敏感波段對提高葉綠素含量估測具有重要意義。

    生育時期也是影響光譜指數(shù)對葉綠素含量估測能力的重要因素,所以很多研究指出基于光譜指數(shù)簡單線性回歸方法并不能很好地實現(xiàn)作物跨生育時期的葉綠素含量監(jiān)測[42]。一般而言,在馬鈴薯花前光譜信息中含有大量的非植被信息,尤其是土壤影響較為突出。隨后,花蕾的出現(xiàn)也會干擾到高光譜的預(yù)測,所以在花前準(zhǔn)確估測馬鈴薯葉綠素含量有一定的難度[31,43],這也是為什么在馬鈴薯生育前期優(yōu)化光譜指數(shù)與葉綠素含量線性關(guān)系較差的原因。隨著生育時期的推進,馬鈴薯花后時期的冠層相對穩(wěn)定,土壤背景對光譜波段影響較低,因此有關(guān)植被的特征信息增多,優(yōu)化光譜指數(shù)在花后估測葉綠素含量的效果最佳,可見分生育時期對光譜指數(shù)進行優(yōu)化十分重要。

    機器學(xué)習(xí)算法在植被參數(shù)估測中具有巨大的潛力。與前人研究結(jié)果[44]一致,本研究中優(yōu)化光譜指數(shù)作為機器學(xué)習(xí)模型輸入變量,顯著提高了馬鈴薯葉綠素含量的估測能力。此外,本研究發(fā)現(xiàn)輸入變量以及機器學(xué)習(xí)算法對估測模型的預(yù)測精度具有一定影響。傳統(tǒng)的機器學(xué)習(xí)算法大多直接使用光譜儀、傳感器測量的波段,或者選擇幾個簡單的已發(fā)表光譜指數(shù)作為機器學(xué)習(xí)算法的輸入變量來訓(xùn)練機器學(xué)習(xí)模型,而本研究探究了使用優(yōu)化光譜指數(shù)輸入到機器學(xué)習(xí)算法中構(gòu)建模型的預(yù)測性能。優(yōu)化光譜指數(shù)作為輸入變量優(yōu)于原光譜波段,因為光譜波段在采集的過程中,受到環(huán)境等因素影響,使光譜中包含的信息太過復(fù)雜冗余,這對機器學(xué)習(xí)建模有不利的影響[2,45]。而光譜指數(shù)優(yōu)化后放大了波段對指標(biāo)的敏感性,這種疊加效應(yīng)可以顯著提高輸入變量的質(zhì)量和穩(wěn)定性,也避免了冗余波段的干擾。實際上對光譜數(shù)據(jù)進行了降維處理,并且方程形式的組合可以挖掘到更多有價值的信息[46]。可以看出,光譜指數(shù)提取的敏感波段在前人研究中都有提及,所以通過波段優(yōu)化算法提取的馬鈴薯葉綠素含量并沒有添加其他與植被不相關(guān)的信息[47]。就模型類型來說,本研究中隨機森林較偏最小二乘法具有更好的估測水平?;跓o人機遙感影像的研究結(jié)果也證實了這一點[48]。偏最小二乘法以主成分分析為信息提取基礎(chǔ),當(dāng)使用光譜波段作為輸入變量時,可以較準(zhǔn)確的提取對葉綠素敏感的光譜成分[27]。不過很多研究指出,偏最小二乘法在處理線性問題時模型可以表現(xiàn)出較好的能力,但處理非線性問題時,體現(xiàn)不出自身優(yōu)勢。而隨機森林屬非線性回歸算法,不僅能夠高效的處理大規(guī)模數(shù)據(jù)集,而且能很好地控制數(shù)據(jù)的噪聲和魯棒性[48]。但是也應(yīng)注意機器學(xué)習(xí)算法在模型訓(xùn)練時的過擬合問題,本研究中模型的訓(xùn)練集和驗證集結(jié)果差異較大,很可能是因為模型在訓(xùn)練時對數(shù)據(jù)進行了過度的解讀,導(dǎo)致了過擬合現(xiàn)象,從而降低了模型的泛化能力,最終表現(xiàn)出模型在訓(xùn)練集上的精度高于驗證集的精度[49-50]。因此,在以后的研究中應(yīng)該重視對機器學(xué)習(xí)算法中超參數(shù)的控制以降低模型過擬合的問題。此外,驗證集數(shù)據(jù)效果明顯低于訓(xùn)練集也與驗證集數(shù)據(jù)本身比較接近有關(guān),較小的數(shù)據(jù)變化范圍使估測值與實測值的數(shù)據(jù)點比較集中,從而影響了相關(guān)性。而訓(xùn)練集數(shù)據(jù)集的數(shù)據(jù)樣本較多,由高到低的變異性更大,有利于估測模型的建立。為了避免這種現(xiàn)象,應(yīng)通過多年多點的試驗盡可能增加訓(xùn)練集和驗證集的數(shù)據(jù)量[51]。而PROSAIL模型是一個很好的工具,該模型可以通過指定的參數(shù)生成大量的模擬數(shù)據(jù),幫助隨機森林進行模型的訓(xùn)練與驗證[28],來提高模型的穩(wěn)定性與普適性,進一步驗證了以優(yōu)化光譜指數(shù)作為輸入變量的隨機森林估測馬鈴薯葉綠素含量的方法的可行性。

    本研究的結(jié)果證明,優(yōu)化光譜指數(shù)作為輸入變量建立的機器學(xué)習(xí)估測模型,估測能力優(yōu)于優(yōu)化光譜指數(shù)估測模型。優(yōu)化光譜指數(shù)作為輸入變量提高了機器學(xué)習(xí)算法的估測精度,克服了光譜指數(shù)估測葉綠素含量時容易“飽和”的缺點,還大大提高了機器學(xué)習(xí)算法的計算效率,提升了精準(zhǔn)農(nóng)業(yè)的高效性和實時性,為今后新型傳感器的研制提供了理論基礎(chǔ)。然而,本研究的地點所屬區(qū)域?qū)儆谖覈R鈴薯種植的一作區(qū),馬鈴薯品種眾多,不可避免會導(dǎo)致估測模型具有一定的局限性,模型的普適性有待完善。因此,在今后的研究中,應(yīng)擴大品種范圍,加大測定數(shù)據(jù)量,以提高模型的普適性。

    4 結(jié)論

    光譜指數(shù)的預(yù)測能力受生育時期的影響較大,優(yōu)化光譜指數(shù)作為輸入變量不僅有效減少了輸入變量數(shù)量從而提高了隨機森林算法和偏最小二乘法的計算效率,而且使預(yù)測精度有所提高。基于優(yōu)化光譜指數(shù)的隨機森林算法對馬鈴薯葉綠素含量的估測精度最高,在各生育時期都具有較好的估測能力,克服了生育時期的影響,利用該方法可對馬鈴薯葉綠素含量進行估測。

    猜你喜歡
    波段葉綠素馬鈴薯
    春日暖陽
    馬鈴薯有功勞
    提取葉綠素
    桃樹葉綠素含量與SPAD值呈極顯著正相關(guān)
    葉綠素家族概述
    定邊馬鈴薯
    陜西畫報(2016年1期)2016-12-01 05:35:30
    M87的多波段輻射過程及其能譜擬合
    胖胖的馬鈴薯
    日常維護對L 波段雷達的重要性
    西藏科技(2015年4期)2015-09-26 12:12:58
    秋馬鈴薯栽培技術(shù)
    宣武区| 湘阴县| 吉水县| 都江堰市| 芦溪县| 新竹县| SHOW| 阳西县| 库伦旗| 沈丘县| 宜君县| 平度市| 甘洛县| 双城市| 新丰县| 万山特区| 高阳县| 松溪县| 涟源市| 阳朔县| 嵩明县| 武清区| 东阳市| 株洲县| 遂溪县| 巫山县| 洛隆县| 忻州市| 涞源县| 彭山县| 龙陵县| 江孜县| 宁陕县| 洛扎县| 襄汾县| 镇宁| 舟曲县| 霍城县| 子洲县| 始兴县| 云阳县|