查晶晶,吳永波,周子堯,朱曉成,朱嘉馨,安玉亭
(1. 南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037;2. 南京林業(yè)大學(xué)生物與環(huán)境學(xué)院,江蘇 南京 210037;3. 鹽城市麋鹿研究所,江蘇 鹽城 224136)
牧草的質(zhì)量是影響鹿類保護(hù)區(qū)發(fā)展的重要因素之一,粗蛋白(crude protein,CP)是衡量牧草營(yíng)養(yǎng)狀況和飼用價(jià)值的一個(gè)重要指標(biāo)[1]。因此,精確估算牧草粗蛋白含量對(duì)評(píng)價(jià)鹿類保護(hù)區(qū)草地營(yíng)養(yǎng)價(jià)值具有重要意義。傳統(tǒng)的鹿類可食植物資源粗蛋白含量的測(cè)定主要通過(guò)實(shí)驗(yàn)室化學(xué)檢測(cè)等方法[2-3],不僅費(fèi)時(shí)費(fèi)力,具有破壞性,且難以實(shí)現(xiàn)大范圍的動(dòng)態(tài)監(jiān)測(cè)。
早在20 世紀(jì)六七十年代,美國(guó)農(nóng)業(yè)部(United States Department of Agriculture,USDA) 通過(guò)測(cè)量多種類型植物葉片光譜,發(fā)現(xiàn)在 0.24~0.40 nm 波段間的 42 個(gè)敏感波段對(duì)應(yīng)一定的生物化學(xué)成分的吸收特征,這為用遙感手段來(lái)估測(cè)葉片乃至植株的生化組分提供依據(jù)[4]。20 世紀(jì)80 年代,高光譜遙感開(kāi)始發(fā)展起來(lái),人們開(kāi)始從窄波段中篩選出對(duì)植被類型光譜差異較顯著的波段,采用成組整合的方式重新組合波段,充分利用植被光譜信息,改善植被識(shí)別與分類精度[5]。近年來(lái),高光譜遙感技術(shù)的發(fā)展,為定量分析地物的微弱光譜差異帶來(lái)很大便捷[6]。相比傳統(tǒng)的田間及實(shí)驗(yàn)室分析方法,高光譜遙感技術(shù)具有在不同區(qū)域尺度估測(cè)植物品質(zhì)參數(shù)的獨(dú)特優(yōu)勢(shì)[7]。國(guó)外關(guān)于牧草的粗蛋白含量高光譜遙感研究開(kāi)展較多[8-10]。國(guó)內(nèi)主要以小麥(Triticum aestivum)、玉米(Zea mays)和水稻(Oryza satiua)等農(nóng)作物為主[11-13],關(guān)于牧草的研究較少,尤其是鹿類動(dòng)物牧草[14]。Chaya 等[15]采用Cubist 模型建立了黑麥草(Lolium perenne)干物質(zhì)、酸性洗滌纖維等含量的預(yù)測(cè)模型,不同養(yǎng)分的預(yù)測(cè)模型R2值在0.49~0.82。Pullanagari 等[16]建立了不同牧草粗蛋白、木質(zhì)素等9 種指標(biāo)的PLS 預(yù)測(cè)模型,R2在0.55~0.83,預(yù)測(cè)效果較好。
狼尾草(Pennisetum alopecuroides)在大豐麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)占43%,是絕對(duì)優(yōu)勢(shì)種,也是麋鹿的主要采食植物以及麋鹿的喜食植物[17]。隨著麋鹿數(shù)量的大規(guī)模增加,食物匱乏加大了補(bǔ)飼壓力,狼尾草適應(yīng)力強(qiáng),受麋鹿踐踏影響較小,是麋鹿的重要食源[18]。本研究致力于解決大尺度下無(wú)損、實(shí)時(shí)分析狼尾草粗蛋白含量。通過(guò)利用野外實(shí)測(cè)狼尾草高光譜數(shù)據(jù),結(jié)合室內(nèi)粗蛋白含量實(shí)測(cè)數(shù)據(jù),分析狼尾草的高光譜反射率與粗蛋白含量的相關(guān)性,建立預(yù)測(cè)模型,實(shí)現(xiàn)無(wú)損、實(shí)時(shí)的粗蛋白含量分析,為評(píng)價(jià)保護(hù)區(qū)不同季節(jié)狼尾草品質(zhì)變化狀況,滿足作為麋鹿食物貢獻(xiàn)大小提供理論依據(jù)。
大豐國(guó)家級(jí)麋鹿自然保護(hù)區(qū)位于鹽城市(圖1)(32°56′ ? 33°36′ N,120°42′ ? 120°51′ E),處于北亞熱帶和南暖溫帶過(guò)渡地區(qū),具備明顯海洋性和季風(fēng)性氣候特點(diǎn),是典型黃海濕地生態(tài)系統(tǒng)。光、熱、水等條件良好。平均海拔2~4 m,地勢(shì)平坦,土質(zhì)為粉沙質(zhì),土壤pH 7.6~8.8,為濱海鹽土類。年平均氣溫13.7~14.5 ℃,1 月份平均氣溫0.8 ℃,7 月份平均氣溫26.8 ℃,年平均降水量980~1 100 mm,6 月?9 月為降水高峰期。
圖1 大豐麋鹿國(guó)家級(jí)自然保護(hù)區(qū)位置圖Figure 1 Map of Dafeng David’s Deer National Nature Reserve
分別于2018 年3 月、5 月、7 月和10 月,選擇晴朗天氣,在云層稀薄、風(fēng)速較小或無(wú)風(fēng)時(shí)測(cè)定狼尾草冠層反射率,測(cè)定時(shí)間為11:00 ? 13:00。為盡量匹配狼尾草生長(zhǎng)周期,不同月份盡量采集相同位置的樣本。樣方中為純狼尾草群落。狼尾草光譜參數(shù)采用美國(guó)ASD 公司生產(chǎn)的Field Spec Pro FR 2500 型背掛式野外光譜儀測(cè)定。光譜分辨率為10 nm,波段范圍為 350~2 500 nm。傳感器探頭垂直向下,距狼尾草冠層頂部垂直高度約1.3 m,光譜儀視場(chǎng)角25°,地面視場(chǎng)范圍直徑60 cm。葉片光譜測(cè)量選用5° 視場(chǎng)角,測(cè)量距離約為5 cm。每個(gè)觀測(cè)點(diǎn)記錄10 條采樣光譜線,每個(gè)處理重復(fù)3 次,以平均值作為該采樣點(diǎn)的光譜值。測(cè)量過(guò)程中,每15 min 進(jìn)行標(biāo)準(zhǔn)白板校正(標(biāo)準(zhǔn)白板的反射率接近1)。用ASD ViewSpec Programs 軟件讀取反射光譜原始數(shù)據(jù)。
光譜數(shù)據(jù)采集后,收割狼尾草地上部分(樣方大小0.5 m × 0.5 m),帶回實(shí)驗(yàn)室65 ℃烘干后,采用凱式法測(cè)定粗蛋白的相對(duì)含量。不同月份狼尾草粗蛋白含量及生物量如表1 所列。
表1 不同月份狼尾草粗蛋白含量及生物量Table 1 Crude protein and biomass content of Pennisetum alopecuroides in different months
植被冠層反射率光譜受很多噪音源影響,包括大氣混濁度、光照條件以及葉片大小、形狀等,反射率光譜數(shù)據(jù)使用前需進(jìn)行預(yù)處理以消除背景噪音[19]。光譜數(shù)據(jù)使用之前先剔除首尾波段及中間噪聲較強(qiáng)的波段(350~399、1 350~1 430、1 800~1 970和2 350~2 500 nm),再進(jìn)行Savitzky-Golay 七點(diǎn)三次平滑(Savitzky-Golay,SG) 進(jìn)一步來(lái)消除隨機(jī)噪聲[20]。為突出平滑效果,對(duì)部分光譜曲線進(jìn)行放大,SG 在去除噪聲的同時(shí)保存了光譜曲線的總體特征(圖2)。對(duì)平滑后的數(shù)據(jù)再進(jìn)行一階變換,以消除基線和背景噪聲,分解混合重疊峰,提高光譜分辨率。變換公式為 , 為兩倍原始波段寬度[21]。采用K-S (Kennard-Stone)方法[22]計(jì)算出每個(gè)預(yù)處理后樣品之間的歐氏距離,將2/3 樣品用于建模,1/3 用于模型驗(yàn)證(表2)。將狼尾草粗蛋白含量分別與預(yù)處理后的原始反射率及其構(gòu)建的植被指數(shù)進(jìn)行相關(guān)性分析[23],達(dá)到顯著相關(guān)的波段或植被指數(shù)作為模型的自變量進(jìn)行建模。
圖2 原始光譜曲線和SG 平滑曲線對(duì)比Figure 2 Difference between unprocessed and SG-smoothed spectral curves
表2 狼尾草粗蛋白含量變異特征Table 2 Variation in crude protein content of Pennisetum alopecuroides
采 用 偏 最 小 二 乘 回 歸(partial least squares regression, PLSR)和多元逐步回歸(stepwise multiple linear regression, SMLR)兩種光譜分析常用方法評(píng)價(jià)高光譜遙感模型對(duì)狼尾草粗蛋白含量的反演效果[1,24-25]。選取決定系數(shù)R2、均方根誤差RMSE和相對(duì)預(yù)測(cè)誤差RPD評(píng)價(jià)模型精度。R2越接近1,模型擬合度越高。RMSE越小模型估算能力越好。RPD≥2 時(shí),模型預(yù)測(cè)能力較好[1,26]。PLSR 和SMLR 建模在R 3.4.2 中 實(shí) 現(xiàn),采 用SPSS 22.0 和Excel 2010 處理與分析數(shù)據(jù)。
狼尾草生長(zhǎng)期內(nèi)不同月份的平均原始光譜曲線如圖3 所示。不同月份的狼尾草反射率光譜總體趨勢(shì)一致,具有綠色植被特有的光譜特征,即可見(jiàn)光區(qū)域的綠峰和紅谷,近紅外的高原區(qū)以及短波紅外1 400 和1 900 nm 附近的兩個(gè)反射低谷[27]。狼尾草冠層光譜在560 和670 nm 附近有反射峰和反射谷,由葉綠素吸收近、遠(yuǎn)紅光波段造成[28]。在530~570 nm 的綠光波峰區(qū)域,以及620~680 nm 的紅光區(qū)域,5 月和7 月的光譜曲線綠峰、紅谷特征與3、10 月差異較大,可能是3 月和10 月狼尾草地上部分綠色葉片較少,反射率受到土壤光譜干擾而偏高,綠峰相對(duì)較不明顯[29]。近紅外區(qū)域反射率光譜曲線差異較大,3 月反射率最低,7 月最高。該區(qū)域光譜反射率主要受葉片內(nèi)部結(jié)構(gòu)、生物量以及葉面積的影響,細(xì)胞層數(shù)越多,反射率越高[30-31]。3 月以后狼尾草葉片干物質(zhì)含量增多,反射率增高。7 月反射率較高可能是因?yàn)橹参锷锪扛?。短波紅外區(qū)域反射率較低,主要受葉片含水量影響[27]。
圖3 不同月份狼尾草葉片平均光譜曲線Figure 3 Average reflectance spectrum of crude protein of Pennisetum alopecuroides leaves in different months
相關(guān)性分析(圖4)顯示,狼尾草原始反射率與粗蛋白含量正相關(guān)和負(fù)相關(guān),相關(guān)性波動(dòng)較大。在可見(jiàn)光區(qū)域大部分相關(guān)系數(shù)為負(fù)值,其中在407~409 nm 以及416~420 nm 等波段達(dá)到顯著水平。在近紅外區(qū)的940、945 nm 及1 133~1 148 nm 等波段顯著正相關(guān)。1 980~2 350 nm 短波紅外波段相關(guān)系數(shù)變化起伏較大??傆?jì)篩選出296 個(gè)波段,其中相關(guān)系數(shù)絕對(duì)值最大出現(xiàn)在770 nm 波段,為?0.731。
圖4 狼尾草粗蛋白含量與原始光譜反射率的相關(guān)分析Figure 4 Correlation analysis between crude protein content and raw spectral reflectance of Pennisetum alopecuroides
常見(jiàn)的高光譜吸收特征參數(shù)有很多[21,32-33],本研究選取與狼尾草粗蛋白含量顯著相關(guān)的12 個(gè)植被指數(shù)進(jìn)行建模,包括黃邊位置[21](r= 0.752**)、改進(jìn)的土壤調(diào)節(jié)植被指數(shù)(improved soil adjusted vegetation index, MSAVI)[32](r= ?0.464**)、優(yōu) 化 土 壤 調(diào) 節(jié) 植 被指數(shù)(optimized soil adjusted vegetation index,OSAVI)[32](r= 0.464**)、 Zarco-Tejada & Miller (ZTM)[32](r=?0.713**)、Carter 指數(shù)2 (Carter indices 2,CTR2)[32](r=0.490**)、Lichtenthaler 指 數(shù)1 (Lichtenthaler indices1,Lic1)[32](r= ?0.585**)、Vogelmann 指 數(shù)1 (vogelmann indices1,Vog1)[32](r= 0.702**)、Vogelmann 指 數(shù)4(vogelmann indices 4,Vog4)[32](r= ?0.540**)、Gitelson和Merzlyak (G_M)[32](r= ?0.647**)、MERIS Terrestrial Chlorophyll Index (MTCI)[33](r= ?0.592**)、紅邊葉綠素指數(shù)(red-edge Chlorophyll Index,CI red-edge)[33]和歸 一 化 紅 邊 指 數(shù)(normalized difference red edge,NDRE)[33](r= ?0.569**)。
以顯著相關(guān)波段和植被指數(shù)為自變量,狼尾草粗蛋白含量為因變量,分別建立PLSR 和SMLR模型?;陲@著性波段的PLSR 和SMLR 模型分別選用了296 個(gè)和3 個(gè)變量,基于植被指數(shù)的PLSR和SMLR 模型分別選用了12 個(gè)和2 個(gè)變量。模型方程的反演效果如表3 所列??梢钥闯?,基于顯著波段的PLSR 模型建模集和驗(yàn)證集RPD分別達(dá)到2.364 和3.110,反演效果最好?;陲@著波段的SMLR 模型反演效果最差,建模集和驗(yàn)證集RPD約為1。由顯著性植被指數(shù)建立的PLSR 和SMLR 模型精度較為接近,兩者建模集和驗(yàn)證集RPD約為2。
表3 基于顯著性波段和植被指數(shù)的模型及其驗(yàn)證Table 3 Model establishment and validation of crude protein content of Pennisetum alopecuroides based on significant bands and spectral indices
狼尾草是麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)的優(yōu)勢(shì)植物。研究表明,麋鹿在補(bǔ)飼情況下仍需取食生境中的植被,以滿足不同的養(yǎng)分需求[34]。粗蛋白含量是反映牧草質(zhì)量的重要指標(biāo)。粗蛋白的缺乏導(dǎo)致礦質(zhì)營(yíng)養(yǎng)(特別是磷)的不足,往往是動(dòng)物生產(chǎn)的主要限制因子[35]。保護(hù)區(qū)狼尾草粗蛋白含量在生長(zhǎng)期內(nèi)逐漸下降,這影響麋鹿對(duì)食物的持續(xù)性需求。因此,利用高光譜儀建立狼尾草粗蛋白含量的估算模型,有利于提高麋鹿喜食植物的粗蛋白含量測(cè)定的效率和精度,也為改善麋鹿食物營(yíng)養(yǎng)結(jié)構(gòu)提供科學(xué)依據(jù)。本研究結(jié)果表明,麋鹿保護(hù)區(qū)狼尾草的反射率光譜與粗蛋白含量相關(guān)性較高。高光譜數(shù)據(jù)選擇顯著相關(guān)波段和植被指數(shù)進(jìn)行建模,去除無(wú)效信息,避免模型過(guò)度擬合,對(duì)構(gòu)建反演模型有重要意義。PLSR模型在處理樣品數(shù)量少,自變量數(shù)目多,變量間存在多重共線性時(shí)具有獨(dú)特優(yōu)勢(shì),比多元逐步回歸更能利用光譜中的重要信息[36]。PLSR 模型能綜合狼尾草反射率光譜對(duì)反演其粗蛋白含量貢獻(xiàn)較大的成分,簡(jiǎn)化了數(shù)據(jù)結(jié)構(gòu),獲得較高的精度。雖然一些學(xué)者采用非線性回歸方法得出的預(yù)測(cè)效果比線性模型好[37-38],本研究基于顯著性波段的PLSR 模型,具有較好的反演能力,建模集和預(yù)測(cè)集RPD分別達(dá)到2.364 和3.110,具有估算粗蛋白含量的潛力。但PLSR 方法只適用于有明顯線性關(guān)系的數(shù)據(jù),因此今后需研究一些非線性的建模方法,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等[39]。高光譜預(yù)處理方法也有很多,包括SG 卷積平滑、多元散射矯正、變量標(biāo)準(zhǔn)化等,以及不同方法進(jìn)行組合[40],今后將研究不同的預(yù)處理方法,獲得最佳預(yù)處理方法,以提高模型精度。
植物葉片中的有機(jī)物質(zhì),包括木質(zhì)素、蛋白質(zhì)、淀粉、纖維素和糖分等有共同的分子鍵(如O-H 鍵和C-H 鍵),與這些鍵相關(guān)的吸收峰位于短波紅外區(qū)域,吸收峰之間有重疊[4,16]。原始光譜進(jìn)行一階導(dǎo)數(shù)轉(zhuǎn)換能在一定程度上將不同生化成分的光譜吸收特征區(qū)分開(kāi),提高模型精度。本研究采用的是傳統(tǒng)經(jīng)驗(yàn)?zāi)P头?,具有一定的時(shí)空局限性,與粗蛋白含量相關(guān)的生化組分會(huì)影響粗蛋白的光譜特征吸收波段,進(jìn)而影響其反演精度,今后需進(jìn)一步研究這些生化組分的影響以提高預(yù)測(cè)精度。
本研究選定的大多數(shù)顯著性波段與蛋白質(zhì)和氮分子的鍵振動(dòng)密切相關(guān)。在可見(jiàn)光區(qū)域一些預(yù)測(cè)粗蛋白的重要波段與葉綠素有關(guān),可能是因?yàn)槿~綠素的蛋白質(zhì)含量較高[15]。研究表明,由于N-H 鍵的存在,植物葉綠素濃度與氮含量之間存在較強(qiáng)的相關(guān)性[4],而蛋白質(zhì)是植物體內(nèi)主要的含氮物質(zhì)[16]。近紅外區(qū)域粗蛋白預(yù)測(cè)光譜可能和蛋白質(zhì)中的N-H 鍵和N=H 鍵有關(guān)[15]。
綜上,基于全波段顯著性原始反射率光譜和顯著性植被指數(shù)建立的4 種狼尾草粗蛋白含量PLSR和SMLR 預(yù)測(cè)模型,以基于顯著性波段的PLSR 模型預(yù)測(cè)效果最好,可以較好估測(cè)麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)狼尾草粗蛋白含量。另外,本研究分析僅是基于某一年份的觀測(cè)數(shù)據(jù),樣本數(shù)量有限,增加更多年份的觀測(cè)數(shù)據(jù),可獲得更為可靠的結(jié)論。