由明明,常慶瑞,田明璐,班松濤,余蛟洋,張卓然
(西北農(nóng)林科技大學(xué)資源環(huán)境學(xué)院,陜西 楊凌 712100)
葉綠素是植物與外界進(jìn)行能量交換的重要物質(zhì),由于葉綠素與葉片氮含量之間存在著較好的相關(guān)性,因此可以表征植物的營(yíng)養(yǎng)狀況[1-2]。高光譜技術(shù)具有光譜范圍廣、波段多和數(shù)據(jù)量大等優(yōu)點(diǎn),可以用來(lái)對(duì)農(nóng)作物葉片和冠層生化組分進(jìn)行監(jiān)測(cè)[3]。近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)利用高光譜數(shù)據(jù)監(jiān)測(cè)植物葉綠素含量方面做了大量研究,Dash.J等[4]利用MERID數(shù)據(jù)提取出的對(duì)高葉綠素含量敏感的MTCI指數(shù)來(lái)反演葉綠素含量;Gitelson[5]選擇玉米和大豆為研究對(duì)象,利用冠層反射率的倒數(shù)建立了冠層葉綠素含量的估測(cè)模型;Broge等[6]分析不同氮素水平下的小麥冠層光譜數(shù)據(jù),提出比值植被指數(shù)(RVI)能夠有效地預(yù)測(cè)冠層葉綠素的含量;姚付啟等[7]綜合分析了10種植被指數(shù)與法國(guó)梧桐葉綠素含量的相關(guān)性和預(yù)測(cè)性,利用主成分分析和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行了法國(guó)梧桐葉綠素含量的估算,認(rèn)為歸一化植被指數(shù)(NDVI)與葉綠素含量的關(guān)系最為密切;宮兆寧等[8]研究了植被葉綠素與“三邊”參數(shù)及由光譜反射率組成的比值(SR)和歸一化(ND)光譜指數(shù)之間的相關(guān)關(guān)系,建立了葉綠素含量的反演模型。
隨機(jī)森林(RandomForest,RF)是一種統(tǒng)計(jì)學(xué)習(xí)理論,具有非常強(qiáng)的擬合能力,不會(huì)出現(xiàn)過(guò)度擬合現(xiàn)象,建模速度快,處理大數(shù)據(jù)集(高光譜數(shù)據(jù))時(shí)非常高效,而且算法對(duì)于結(jié)果具有可解釋性,在解決反演問(wèn)題方面具有獨(dú)特的優(yōu)勢(shì)[9],被譽(yù)為當(dāng)前最好的算法之一。隨著高光譜技術(shù)的發(fā)展,已有學(xué)者將隨機(jī)森林算法應(yīng)用到植被高光譜遙感上,Onisimo Mutanga等利用隨機(jī)森林算法對(duì)高植被覆蓋度的濕地生物量進(jìn)行了遙感估測(cè),并與傳統(tǒng)的多元逐步回歸模型進(jìn)行了對(duì)比[10];Colin J .Gleason等利用偏最小二乘、隨機(jī)森林、支持向量機(jī)和Cubist決策樹(shù)算法對(duì)中等植被覆蓋度的森林生物量進(jìn)行了遙感估算[11];李粉玲等[12]提取了18種光譜指數(shù),構(gòu)建了基于隨機(jī)森林和多元逐步回歸的冬小麥葉片SPAD值高光譜估算模型;王麗愛(ài)等[13]使用隨機(jī)森林回歸算法構(gòu)建小麥葉片SPAD值遙感反演模型,并以支持向量回歸(SVR)和反向(BP)神經(jīng)網(wǎng)絡(luò)算法構(gòu)建的冬小麥葉片SPAD值估算模型為比較模型;韓兆迎等[14]利用支持向量機(jī)(SVM)與隨機(jī)森林回歸(RF)方法構(gòu)建了蘋果樹(shù)冠的LAI高光譜估算模型,結(jié)果表明RF回歸模型估測(cè)效果要優(yōu)于SVM。但以油菜為研究對(duì)象,利用隨機(jī)森林算法構(gòu)建葉片葉綠素高光譜反演模型的研究尚未見(jiàn)報(bào)道;同時(shí)由于地區(qū)不同,作物種類不同,葉片葉綠素的敏感波段會(huì)出現(xiàn)顯著差異,光譜指數(shù)的適用性也有所不同,為此本研究以西北干旱、半干旱地區(qū)經(jīng)濟(jì)作物油菜為試驗(yàn)對(duì)象,分析油菜不同生育期葉片光譜與葉綠素相對(duì)含量SPAD值之間的相關(guān)關(guān)系,利用10種光譜指數(shù)構(gòu)建基于隨機(jī)森林(RF)算法的不同生育期及全生育期油菜葉片SPAD估算模型,并與傳統(tǒng)的基于光譜指數(shù)的一元線性回歸模型和多元逐步回歸模型進(jìn)行精度比較,實(shí)現(xiàn)高光譜技術(shù)無(wú)損、快速、準(zhǔn)確地估算油菜各生育期葉片SPAD值,為西北干旱、半干旱地區(qū)油菜生長(zhǎng)狀況監(jiān)測(cè)提供理論和技術(shù)支持。
研究區(qū)位于陜西省咸陽(yáng)市乾縣梁山鎮(zhèn)齊南村(東經(jīng)108°7′6″,北緯34°38′33″),該地區(qū)處于陜北黃土高原南緣與關(guān)中平原的過(guò)渡地帶,溫帶半干旱大陸性季風(fēng)氣候,年降水量525 mm,年平均氣溫12.7℃,全年降雨分布不均,主要集中在6~9月,耕作制度基本為一年一熟,種植冬小麥、油菜、玉米等農(nóng)作物。
2015年9月-2016年5月在研究區(qū)種植冬油菜,供試品種為甘雜1號(hào)。共設(shè)置30個(gè)試驗(yàn)小區(qū),每個(gè)小區(qū)面積為48 m2,設(shè)置氮肥、磷肥和鉀肥處理各3個(gè)水平(N: 120、240、360 kg·hm-2;P: 60、120、180 kg·hm-2,K: 90、180、270 kg·hm-2),每個(gè)處理重復(fù)3次,設(shè)有空白對(duì)照,田間管理按當(dāng)?shù)卮筇锷a(chǎn)方式進(jìn)行。冬油菜種植時(shí)間為2015年9月13日,播種方式為機(jī)播,油菜生長(zhǎng)過(guò)程中無(wú)病蟲害發(fā)生。分別于2016年3月25日(苗期),4月12日(蕾薹期),5月3日(開(kāi)花期)和5月24日(成熟期)進(jìn)行田間觀測(cè)采樣。每個(gè)小區(qū)隨機(jī)采集6棵油菜植株冠層的共6片相同葉位(沿主莖自上而下第1葉)的葉片裝入密封袋,放置在藍(lán)冰保鮮盒中立即運(yùn)回實(shí)驗(yàn)室,及時(shí)進(jìn)行葉片光譜反射率及SPAD值同步測(cè)定。
1.3.1 光譜反射率測(cè)定 油菜葉片光譜反射率采用美國(guó)SVC HR-1024i型光譜儀進(jìn)行測(cè)定,該儀器光譜探測(cè)范圍為350~2 500 nm,在波段350~1 000 nm光譜分辨率3.5 nm,1 000~1 850 nm波段光譜分辨率9.5 nm,1 850~2 500 nm波段光譜分辨率6.5 nm。利用自帶光源型手持葉片光譜探測(cè)器直接測(cè)定葉片光譜,光源為內(nèi)置鹵鎢燈。每次測(cè)定前均利用漫反射參考版對(duì)儀器進(jìn)行優(yōu)化,之后將待測(cè)葉片直接置于探測(cè)器進(jìn)行光譜測(cè)量。為了獲得葉片具有代表性的光譜,每片葉子測(cè)量3個(gè)位置,每個(gè)位置測(cè)量?jī)蓷l光譜,取六條光譜的平均值作為該樣本的最終光譜反射率。
1.3.2 SPAD值測(cè)定 使用日本KONICA MINOLTA公司生產(chǎn)的SPAD 502葉綠素儀同步測(cè)定油菜葉片的SPAD值。為減小誤差,每片葉子測(cè)量10個(gè)點(diǎn),然后取其平均值作為該葉片的SPAD值,測(cè)量時(shí)避開(kāi)葉脈,同時(shí)根據(jù)所采油菜葉片面積的不同,適當(dāng)增加某些葉片的SPAD采集點(diǎn)。
光譜指數(shù)是利用植被光譜數(shù)據(jù)的線性或非線性組合構(gòu)建的參數(shù),能夠反映植被在可見(jiàn)光、近紅外波段反射與環(huán)境背景之間的差異[15]。本研究在多種可用于估測(cè)葉綠素含量的光譜指數(shù)中選取了10種認(rèn)可度較高、物理意義明確的光譜指數(shù)(表1)。
利用SVC HR-1024i PC、Excel 2013、Origin 2016及SPSS 22.0等軟件對(duì)數(shù)據(jù)進(jìn)行處理與計(jì)算,由于綠色植物光譜在可見(jiàn)光波段400~760 nm處主要受葉綠素影響,因此選擇400~1 000 nm的波段范圍進(jìn)行研究,并將光譜重采樣到1 nm。對(duì)每期采集的180個(gè)樣本按SPAD值進(jìn)行排序,采用分層抽樣的方法抽取135個(gè)作為建模樣本,剩余45個(gè)作為檢驗(yàn)樣本。
模型構(gòu)建分別采用一元線性回歸、多元逐步回歸和隨機(jī)森林回歸算法。其中隨機(jī)森林的基本原理是利用自助法重采樣技術(shù)從原始樣本中抽取多個(gè)自助樣本集,對(duì)每個(gè)自助樣本集進(jìn)行決策樹(shù)建模,樹(shù)的每個(gè)節(jié)點(diǎn)變量在隨機(jī)選出的多個(gè)預(yù)測(cè)變量中產(chǎn)生并進(jìn)行節(jié)點(diǎn)分割,將所有決策樹(shù)預(yù)測(cè)平均值作為最終預(yù)測(cè)結(jié)果[12]。一般情況下,隨機(jī)森林會(huì)隨機(jī)生成成百上千個(gè)分類樹(shù),再選擇重復(fù)度最高的樹(shù)作為最終結(jié)果[24]。RF通過(guò)構(gòu)造不同的訓(xùn)練集增加分類模型的差異,從而提高組合分類模型的外推預(yù)測(cè)能力。其最終分類決策的計(jì)算見(jiàn)公式(1)[25]。
表1 光譜指數(shù)及其計(jì)算公式
注:Ri表示波長(zhǎng)為inm處的光譜反射率。
Note:Rirepresents the spectral reflectance ofinm.
(1)
其中,H(x)表示組合分類模型,hi是單個(gè)決策樹(shù)分類模型,Y表示輸出變量,I為示性函數(shù)。
本文基于RandomForest軟件包在R環(huán)境中進(jìn)行RF回歸模擬,在模型構(gòu)建過(guò)程中,分類樹(shù)的數(shù)量(ntree)和分割節(jié)點(diǎn)的隨機(jī)變量數(shù)(mtry)是該模型中最為重要的兩個(gè)參數(shù),由圖1可知,模型誤差隨著分類樹(shù)的增加而趨于平穩(wěn),當(dāng)分類樹(shù)的數(shù)量達(dá)到2 600以后誤差趨于穩(wěn)定,經(jīng)反復(fù)試驗(yàn),在不影響計(jì)算效率的情況下,根據(jù)隨機(jī)森林模型的預(yù)測(cè)誤差及其決定系數(shù)(R2)確定本研究中分類樹(shù)的數(shù)量為3 000;通過(guò)編程實(shí)現(xiàn)mtry的參數(shù)尋優(yōu),最終確定分割節(jié)點(diǎn)的隨機(jī)變量數(shù)為3。
為驗(yàn)證模型的精度,利用檢驗(yàn)樣本將不同模型的預(yù)測(cè)SPAD值與實(shí)測(cè)SPAD值進(jìn)行回歸擬合,以決定系數(shù)(R2)、均方根誤差(RMSE)和相對(duì)誤差(RE)來(lái)評(píng)價(jià)模型的優(yōu)劣。式(2)、式(3)和式(4)為決定系數(shù)、均方根誤差和相對(duì)誤差的計(jì)算公式。
(2)
(3)
(4)
圖1 分類樹(shù)與誤差的關(guān)系Fig.1 Relationship diagram of trees and error
在油菜的不同生育期,葉片的SPAD值呈現(xiàn)出先上升后下降的拋物線趨勢(shì)(圖2)。從苗期到蕾薹期,油菜葉片SPAD值逐漸升高,蕾薹期達(dá)到整個(gè)生育期的最高點(diǎn),平均值由苗期的48.98上升到了蕾薹期的52.17,蕾薹期后隨著油菜的生長(zhǎng)發(fā)育,葉片SPAD值逐漸變小。開(kāi)花期后到成熟期,由于油菜角果開(kāi)始成熟,葉片逐漸枯萎衰老,營(yíng)養(yǎng)物質(zhì)向角果轉(zhuǎn)移,葉片變黃,油菜葉片的SPAD值急劇下降,成熟期SPAD值的平均值降至31.51。同時(shí),隨著油菜生育期的推進(jìn),各階段的SPAD值變化幅度逐漸變大,開(kāi)花期后標(biāo)準(zhǔn)差急劇增大,成熟期油菜葉片的SPAD值標(biāo)準(zhǔn)差達(dá)到整個(gè)生育期的最大值7.13。
油菜葉片各生育期反射光譜曲線如圖3所示。不同生育期的油菜葉片光譜特征基本一致,在400~500 nm的藍(lán)紫光波段和600~700 nm的紅光波段由于葉綠素的強(qiáng)烈吸收形成兩個(gè)吸收谷,同時(shí)使得在550 nm處形成一個(gè)相對(duì)較強(qiáng)的反射峰;在680~1 000 nm的近紅外區(qū)域,由于受到油菜葉片內(nèi)部結(jié)構(gòu)的支配作用,光譜反射率急劇上升,形成高反射平臺(tái)。從苗期到蕾薹期,油菜葉片光譜曲線的紅邊位置如圖4所示向長(zhǎng)波方向移動(dòng),從708 nm移動(dòng)到了710 nm;蕾薹期后紅邊位置向短波方向移動(dòng),至成熟期移動(dòng)到700 nm處,表現(xiàn)出“藍(lán)移”的現(xiàn)象。
圖2 不同生育期油菜葉片SPAD值變化Fig.2 Variation of SPAD values for rapeseed at different growth stages
圖3 不同生育期油菜葉片光譜曲線特征Fig.3 Spectral reflectance of rapeseed in different growth stages
圖4 不同生育期油菜葉片一階微分光譜特征Fig.4 First derivative value of rapeseed in different growth stages
2.2.1 油菜葉片原始光譜與SPAD值相關(guān)性分析 分別對(duì)油菜各生育期葉片的SPAD值與光譜反射率進(jìn)行相關(guān)分析,結(jié)果見(jiàn)圖5。從圖5可以看出,苗期、蕾薹期和開(kāi)花期油菜葉片SPAD值與原始光譜反射率的相關(guān)性趨勢(shì)基本一致,波長(zhǎng)500~730 nm之間呈極顯著負(fù)相關(guān),在藍(lán)光波段520 nm附近和紅光波段700 nm附近相關(guān)系數(shù)達(dá)到兩個(gè)峰值,其中以700 nm附近的相關(guān)性最為顯著;在700 nm之后,各生育期油菜葉片與原始光譜反射率的相關(guān)系數(shù)迅速降低,開(kāi)花期為-0.1左右,其他生育期基本趨于0;成熟期油菜葉片SPAD值與原始光譜反射率之間的相關(guān)系數(shù)變化與前三個(gè)時(shí)期稍有不同,在551 nm處相關(guān)性較低,峰值出現(xiàn)在630 nm和696 nm處,其中696 nm處相關(guān)系數(shù)最大。
圖5 不同生育期油菜葉片SPAD值與原始光譜相關(guān)性Fig.5 Correlation between SPAD and original spectrum at different growth stages of rapeseed leaves
2.2.2 油菜葉片SPAD值與光譜指數(shù)的相關(guān)性分析 分析各生育期實(shí)測(cè)SPAD值和光譜指數(shù)的相關(guān)性,結(jié)果如表3。由表3可以看出:油菜各生育期葉片SPAD值與光譜指數(shù)均達(dá)到顯著相關(guān),其中TCARI、GRVI和NPCI為負(fù)相關(guān),其它光譜指數(shù)為顯著正相關(guān)。苗期的10個(gè)光譜指數(shù)除NPCI外均與SPAD值呈極顯著相關(guān),其中相關(guān)性最好的為RVI,相關(guān)系數(shù)0.64;蕾薹期SPAD值與光譜指數(shù)的相關(guān)性都達(dá)到極顯著相關(guān),RVI、FDRVI和FDNDVI與SPAD值的相關(guān)系數(shù)達(dá)到了0.8以上;開(kāi)花期SPAD值與光譜指數(shù)的相關(guān)性為油菜整個(gè)生育期內(nèi)最好的,超過(guò)一半的光譜指數(shù)相關(guān)系數(shù)均在0.8以上,其中相關(guān)性最好的為FDNDVI,相關(guān)系數(shù)0.86,相關(guān)性相對(duì)較差的為NPCI,但也達(dá)到了0.70;成熟期油菜葉片的SPAD值與光譜指數(shù)的相關(guān)系數(shù)差異較大,其中RVI、NDVI、mNDVI、TCARI和MSR705的相關(guān)系數(shù)達(dá)到0.8以上,GRVI和NPCI的相關(guān)系數(shù)不到0.4。綜合油菜生長(zhǎng)過(guò)程中的4個(gè)生育期內(nèi)的原始光譜數(shù)據(jù)和SPAD值,進(jìn)行全生育期油菜葉片SPAD值與各光譜指數(shù)相關(guān)性分析,結(jié)果表明,全生育期內(nèi)油菜葉片SPAD值與各光譜指數(shù)均呈極顯著相關(guān),其中RVI、NDVI、mNDVI與油菜葉片SPAD值的相關(guān)系數(shù)在0.9以上,DCNI、MSR705、FDRVI和FDNDVI與油菜葉片的SPAD值的相關(guān)系數(shù)也都在0.8以上。
按照以下方式構(gòu)建油菜葉片SPAD值高光譜估算模型:①選取各生育期與油菜葉片SPAD值顯著相關(guān)且相關(guān)系數(shù)最大的光譜指數(shù)為自變量,構(gòu)建油菜各生育期的SPAD值一元線性回歸模型(VI-LR);②選取各生育期與油菜葉片SPAD值在0.001水平極顯著相關(guān)的光譜指數(shù)構(gòu)建SPAD值多元逐步回歸模型,記為VI-MSR;③選取各生育期所有光譜指數(shù)構(gòu)建隨機(jī)森林回歸模型,所建模型記為VI-RF。結(jié)果如表3所示。
由表3可見(jiàn),所有模型的擬合方程都達(dá)到了0.01的顯著水平(P<0.01),在油菜的各個(gè)生育期中,基于單一光譜指數(shù)構(gòu)建的一元線性回歸模型的精度都是最低的;基于極顯著相關(guān)的所有光譜指數(shù)構(gòu)建的多元逐步回歸模型和隨機(jī)森林模型能夠大幅度提高估算模型的精度,其中以隨機(jī)森林模型的決定系數(shù)最高,在整個(gè)生育期內(nèi)都能夠達(dá)到0.9以上,最大為0.971。在不同生育期中,苗期SPAD值估算模型的精度要明顯小于其他生育期;成熟期估算模型精度最高,各模型的決定系數(shù)R2都能夠達(dá)到0.72以上,最大為VI-RF模型,決定系數(shù)0.946。全生育期的油菜葉片SPAD值估算模型要明顯優(yōu)于分生育期構(gòu)建的估算模型,三種模型的決定系數(shù)R2都在0.83以上,VI-RF模型的估算精度仍為最高,決定系數(shù)R2達(dá)到了0.971。隨著隨機(jī)森林建模精度的提高,模型自變量(V)對(duì)于SPAD值的解釋率也逐漸升高,其中苗期、蕾薹期、開(kāi)花期和成熟期模型的解釋變異百分率分別為38.16%、74.56%、66.34%和57.96%,而全生育期模型的解釋變異百分率則達(dá)到了84.27%。綜合建模結(jié)果可以得出,基于隨機(jī)森林回歸算法構(gòu)建的油菜葉片SPAD值估算模型效果最好,能夠廣泛適用于油菜整個(gè)生育期的SPAD值估算。
利用檢驗(yàn)樣本對(duì)不同模型的估測(cè)精度進(jìn)行檢驗(yàn),結(jié)果如表4所示。 由表4可以看出,各生育期不同驗(yàn)證模型的R2都在0.46以上,達(dá)到了極顯著水平(P<0.001),能夠用于油菜SPAD值預(yù)測(cè)。其中苗期VI-RF模型的決定系數(shù)R2達(dá)到了0.81,RMSE和RE小于其他模型,分別為0.93和2.87%;蕾薹期VI-RF模型的R2,回歸方程斜率、RMSE和RE均為該生育期最優(yōu);開(kāi)花期VI-RF模型的決定系數(shù)及回歸方程斜率為三個(gè)模型中最優(yōu)的,但其RMSE和RE都要略大于VI-MSR模型;成熟期VI-RF模型同樣優(yōu)于其他模型,其決定系數(shù)R2達(dá)到了0.82,但各模型的RMSE和RE較其他生育期有大幅度上升,其均方根誤差達(dá)到了5以上,相對(duì)誤差達(dá)到了10%以上。在全生育期仍以VI-RF模型的預(yù)測(cè)精度最高,R2為0.89。綜合來(lái)看,VI-RF模型在分生育期及全生育期都表現(xiàn)出最強(qiáng)的學(xué)習(xí)和預(yù)測(cè)能力,決定系數(shù)R2均在0.81以上。但結(jié)合建模與預(yù)測(cè)結(jié)果,相對(duì)于建模精度,VI-RF模型的預(yù)測(cè)能力相對(duì)較弱,決定系數(shù)R2較建模有較大幅度的下降,與王麗愛(ài)[13]等的研究結(jié)果是一致的。這是由于隨機(jī)森林是適用于大樣本量數(shù)據(jù)計(jì)算的,樣本數(shù)偏小會(huì)導(dǎo)致模型決策樹(shù)之間的相關(guān)性增強(qiáng),預(yù)測(cè)誤差增大,同時(shí)隨機(jī)森林在生成決策樹(shù)的時(shí)候也可能會(huì)生成很多差異度非常小的樹(shù),也會(huì)對(duì)最終生成正確的決策產(chǎn)生影響,導(dǎo)致預(yù)測(cè)精度降低。
表2 不同生育期油菜葉片SPAD值與光譜指數(shù)之間的相關(guān)系數(shù)
注:** 表示在0.001水平上顯著相關(guān);* 表示在0.01水平上顯著相關(guān)。
Note:** indicates significant correlation at 0.001 level;* indicates significant correlation at 0.01 level.
表3 油菜不同生育期葉片SPAD值回歸擬合模型
表4 不同估算模型驗(yàn)證結(jié)果
通過(guò)高光譜遙感獲得的農(nóng)作物光譜信息可以較好地反映其理化參數(shù),監(jiān)測(cè)長(zhǎng)勢(shì)狀況[26],但是植被光譜的獲取易受到光譜儀本身的噪聲、環(huán)境噪聲和葉片內(nèi)部生理結(jié)構(gòu)等因素的影響。大量研究表明,葉片的SPAD值與其葉綠素總含量有著較強(qiáng)的相關(guān)性,能夠在一定程度上反映作物葉片的養(yǎng)分及長(zhǎng)勢(shì)[27-29]。
1)在成熟期和全生育期,NDVI與油菜葉片SPAD值的相關(guān)性最高,而在葉綠素含量相對(duì)較高的苗期和蕾薹期,NDVI與SPAD值的相關(guān)性則較差,這可能是因?yàn)樵谌~綠素含量較高時(shí),NDVI容易出現(xiàn)過(guò)飽和現(xiàn)象[30]。同時(shí)在各生育期及全生育期,SPAD值與GRVI和NPCI的相關(guān)性都相對(duì)較差,這主要是因?yàn)橛筒巳~片葉綠素最為敏感的波段主要集中在690~710 nm處,而這兩種光譜指數(shù)的構(gòu)建都沒(méi)有該波段的參與。
2)使用光譜指數(shù)估測(cè)農(nóng)作物SPAD值,雖然能夠很好地消除背景噪聲,提高估測(cè)精度,但是以往研究大都較少考慮光譜指數(shù)對(duì)于作物不同生育期的適用性,且多數(shù)研究?jī)H基于單一光譜指數(shù)構(gòu)建SPAD值估測(cè)模型[31-32]。而單一光譜指數(shù)往往只包含作物光譜的部分信息,易出現(xiàn)過(guò)飽和現(xiàn)象,且模型的精度和穩(wěn)定性都難以得到保證[33]。本研究借鑒多個(gè)光譜指數(shù)的同時(shí),針對(duì)油菜生長(zhǎng)的不同生育期及全生育期,分別結(jié)合最小二乘算法、多元逐步回歸算法和隨機(jī)森林算法構(gòu)建SPAD值估算模型,結(jié)果發(fā)現(xiàn)基于多個(gè)光譜指數(shù)構(gòu)建的模型精度較單光譜指數(shù)模型精度均有較大提高,在不同生育期的適用性也更強(qiáng),有效避免了因?yàn)槿~片葉綠素含量偏高導(dǎo)致的光譜指數(shù)飽和現(xiàn)象對(duì)于模型的影響。
3)在植被葉片SPAD值估算模型的構(gòu)建過(guò)程中,不同的建模方法對(duì)于模型的擬合精度影響也較大。隨機(jī)森林模型在各生育期表現(xiàn)良好,模型精度均有較大提高,R2在0.90以上,其中苗期較線性模型精度提高達(dá)39%,蕾薹期提高了32%,開(kāi)花期提高了14%,成熟期提高了27%,而全生育期則提高了13%,模型建模R2高達(dá)0.971 。隨機(jī)森林算法較最小二乘算法及多元逐步回歸算法具有很高的預(yù)測(cè)準(zhǔn)確性,原因在于隨機(jī)森林模型能夠很好地容忍建模過(guò)程中出現(xiàn)的異常值和噪聲,且不容易出現(xiàn)過(guò)度擬合[25],對(duì)多重共線性不敏感[34]。
本文以西北區(qū)經(jīng)濟(jì)作物油菜為研究對(duì)象,應(yīng)用光譜指數(shù)構(gòu)建葉片SPAD值的高光譜估算模型,并對(duì)各模型反演精度進(jìn)行檢驗(yàn),得到以下結(jié)論:
1)在油菜不同生育期其葉片SPAD值存在著顯著的差異,SPAD值呈現(xiàn)出先升高后下降的趨勢(shì),至蕾薹期達(dá)到最大值;葉綠素含量的差異導(dǎo)致葉片的光譜反射曲線有所不同,隨著SPAD值的升高在可見(jiàn)光波段光譜反射率降低。
2)各光譜指數(shù)在不同生育期均與油菜葉片SPAD值呈顯著相關(guān),其中TCARI、GRVI和NPCI與油菜葉片SPAD值呈顯著負(fù)相關(guān),其余光譜指數(shù)與油菜葉片SPAD值呈顯著正相關(guān)。
3)基于光譜指數(shù)構(gòu)建的分生育期和全生育期油菜葉片SPAD值估算模型均通過(guò)顯著性檢驗(yàn),其中隨機(jī)森林回歸模型在各生育期均表現(xiàn)出最好的建模及驗(yàn)證精度,其建模R2在0.90以上,驗(yàn)證R2達(dá)到0.81以上,是進(jìn)行油菜葉片SPAD值估測(cè)的最優(yōu)模型。