查晶晶,吳永波,周子堯,朱曉成,朱嘉馨,安玉亭
(1. 南京林業(yè)大學(xué)南方現(xiàn)代林業(yè)協(xié)同創(chuàng)新中心,江蘇 南京 210037;2. 南京林業(yè)大學(xué)生物與環(huán)境學(xué)院,江蘇 南京 210037;3. 鹽城市麋鹿研究所,江蘇 鹽城 224136)
牧草的質(zhì)量是影響鹿類保護(hù)區(qū)發(fā)展的重要因素之一,粗蛋白(crude protein,CP)是衡量牧草營養(yǎng)狀況和飼用價值的一個重要指標(biāo)[1]。因此,精確估算牧草粗蛋白含量對評價鹿類保護(hù)區(qū)草地營養(yǎng)價值具有重要意義。傳統(tǒng)的鹿類可食植物資源粗蛋白含量的測定主要通過實驗室化學(xué)檢測等方法[2-3],不僅費時費力,具有破壞性,且難以實現(xiàn)大范圍的動態(tài)監(jiān)測。
早在20 世紀(jì)六七十年代,美國農(nóng)業(yè)部(United States Department of Agriculture,USDA) 通過測量多種類型植物葉片光譜,發(fā)現(xiàn)在 0.24~0.40 nm 波段間的 42 個敏感波段對應(yīng)一定的生物化學(xué)成分的吸收特征,這為用遙感手段來估測葉片乃至植株的生化組分提供依據(jù)[4]。20 世紀(jì)80 年代,高光譜遙感開始發(fā)展起來,人們開始從窄波段中篩選出對植被類型光譜差異較顯著的波段,采用成組整合的方式重新組合波段,充分利用植被光譜信息,改善植被識別與分類精度[5]。近年來,高光譜遙感技術(shù)的發(fā)展,為定量分析地物的微弱光譜差異帶來很大便捷[6]。相比傳統(tǒng)的田間及實驗室分析方法,高光譜遙感技術(shù)具有在不同區(qū)域尺度估測植物品質(zhì)參數(shù)的獨特優(yōu)勢[7]。國外關(guān)于牧草的粗蛋白含量高光譜遙感研究開展較多[8-10]。國內(nèi)主要以小麥(Triticum aestivum)、玉米(Zea mays)和水稻(Oryza satiua)等農(nóng)作物為主[11-13],關(guān)于牧草的研究較少,尤其是鹿類動物牧草[14]。Chaya 等[15]采用Cubist 模型建立了黑麥草(Lolium perenne)干物質(zhì)、酸性洗滌纖維等含量的預(yù)測模型,不同養(yǎng)分的預(yù)測模型R2值在0.49~0.82。Pullanagari 等[16]建立了不同牧草粗蛋白、木質(zhì)素等9 種指標(biāo)的PLS 預(yù)測模型,R2在0.55~0.83,預(yù)測效果較好。
狼尾草(Pennisetum alopecuroides)在大豐麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)占43%,是絕對優(yōu)勢種,也是麋鹿的主要采食植物以及麋鹿的喜食植物[17]。隨著麋鹿數(shù)量的大規(guī)模增加,食物匱乏加大了補(bǔ)飼壓力,狼尾草適應(yīng)力強(qiáng),受麋鹿踐踏影響較小,是麋鹿的重要食源[18]。本研究致力于解決大尺度下無損、實時分析狼尾草粗蛋白含量。通過利用野外實測狼尾草高光譜數(shù)據(jù),結(jié)合室內(nèi)粗蛋白含量實測數(shù)據(jù),分析狼尾草的高光譜反射率與粗蛋白含量的相關(guān)性,建立預(yù)測模型,實現(xiàn)無損、實時的粗蛋白含量分析,為評價保護(hù)區(qū)不同季節(jié)狼尾草品質(zhì)變化狀況,滿足作為麋鹿食物貢獻(xiàn)大小提供理論依據(jù)。
大豐國家級麋鹿自然保護(hù)區(qū)位于鹽城市(圖1)(32°56′ ? 33°36′ N,120°42′ ? 120°51′ E),處于北亞熱帶和南暖溫帶過渡地區(qū),具備明顯海洋性和季風(fēng)性氣候特點,是典型黃海濕地生態(tài)系統(tǒng)。光、熱、水等條件良好。平均海拔2~4 m,地勢平坦,土質(zhì)為粉沙質(zhì),土壤pH 7.6~8.8,為濱海鹽土類。年平均氣溫13.7~14.5 ℃,1 月份平均氣溫0.8 ℃,7 月份平均氣溫26.8 ℃,年平均降水量980~1 100 mm,6 月?9 月為降水高峰期。
圖1 大豐麋鹿國家級自然保護(hù)區(qū)位置圖Figure 1 Map of Dafeng David’s Deer National Nature Reserve
分別于2018 年3 月、5 月、7 月和10 月,選擇晴朗天氣,在云層稀薄、風(fēng)速較小或無風(fēng)時測定狼尾草冠層反射率,測定時間為11:00 ? 13:00。為盡量匹配狼尾草生長周期,不同月份盡量采集相同位置的樣本。樣方中為純狼尾草群落。狼尾草光譜參數(shù)采用美國ASD 公司生產(chǎn)的Field Spec Pro FR 2500 型背掛式野外光譜儀測定。光譜分辨率為10 nm,波段范圍為 350~2 500 nm。傳感器探頭垂直向下,距狼尾草冠層頂部垂直高度約1.3 m,光譜儀視場角25°,地面視場范圍直徑60 cm。葉片光譜測量選用5° 視場角,測量距離約為5 cm。每個觀測點記錄10 條采樣光譜線,每個處理重復(fù)3 次,以平均值作為該采樣點的光譜值。測量過程中,每15 min 進(jìn)行標(biāo)準(zhǔn)白板校正(標(biāo)準(zhǔn)白板的反射率接近1)。用ASD ViewSpec Programs 軟件讀取反射光譜原始數(shù)據(jù)。
光譜數(shù)據(jù)采集后,收割狼尾草地上部分(樣方大小0.5 m × 0.5 m),帶回實驗室65 ℃烘干后,采用凱式法測定粗蛋白的相對含量。不同月份狼尾草粗蛋白含量及生物量如表1 所列。
表1 不同月份狼尾草粗蛋白含量及生物量Table 1 Crude protein and biomass content of Pennisetum alopecuroides in different months
植被冠層反射率光譜受很多噪音源影響,包括大氣混濁度、光照條件以及葉片大小、形狀等,反射率光譜數(shù)據(jù)使用前需進(jìn)行預(yù)處理以消除背景噪音[19]。光譜數(shù)據(jù)使用之前先剔除首尾波段及中間噪聲較強(qiáng)的波段(350~399、1 350~1 430、1 800~1 970和2 350~2 500 nm),再進(jìn)行Savitzky-Golay 七點三次平滑(Savitzky-Golay,SG) 進(jìn)一步來消除隨機(jī)噪聲[20]。為突出平滑效果,對部分光譜曲線進(jìn)行放大,SG 在去除噪聲的同時保存了光譜曲線的總體特征(圖2)。對平滑后的數(shù)據(jù)再進(jìn)行一階變換,以消除基線和背景噪聲,分解混合重疊峰,提高光譜分辨率。變換公式為 , 為兩倍原始波段寬度[21]。采用K-S (Kennard-Stone)方法[22]計算出每個預(yù)處理后樣品之間的歐氏距離,將2/3 樣品用于建模,1/3 用于模型驗證(表2)。將狼尾草粗蛋白含量分別與預(yù)處理后的原始反射率及其構(gòu)建的植被指數(shù)進(jìn)行相關(guān)性分析[23],達(dá)到顯著相關(guān)的波段或植被指數(shù)作為模型的自變量進(jìn)行建模。
圖2 原始光譜曲線和SG 平滑曲線對比Figure 2 Difference between unprocessed and SG-smoothed spectral curves
表2 狼尾草粗蛋白含量變異特征Table 2 Variation in crude protein content of Pennisetum alopecuroides
采 用 偏 最 小 二 乘 回 歸(partial least squares regression, PLSR)和多元逐步回歸(stepwise multiple linear regression, SMLR)兩種光譜分析常用方法評價高光譜遙感模型對狼尾草粗蛋白含量的反演效果[1,24-25]。選取決定系數(shù)R2、均方根誤差RMSE和相對預(yù)測誤差RPD評價模型精度。R2越接近1,模型擬合度越高。RMSE越小模型估算能力越好。RPD≥2 時,模型預(yù)測能力較好[1,26]。PLSR 和SMLR 建模在R 3.4.2 中 實 現(xiàn),采 用SPSS 22.0 和Excel 2010 處理與分析數(shù)據(jù)。
狼尾草生長期內(nèi)不同月份的平均原始光譜曲線如圖3 所示。不同月份的狼尾草反射率光譜總體趨勢一致,具有綠色植被特有的光譜特征,即可見光區(qū)域的綠峰和紅谷,近紅外的高原區(qū)以及短波紅外1 400 和1 900 nm 附近的兩個反射低谷[27]。狼尾草冠層光譜在560 和670 nm 附近有反射峰和反射谷,由葉綠素吸收近、遠(yuǎn)紅光波段造成[28]。在530~570 nm 的綠光波峰區(qū)域,以及620~680 nm 的紅光區(qū)域,5 月和7 月的光譜曲線綠峰、紅谷特征與3、10 月差異較大,可能是3 月和10 月狼尾草地上部分綠色葉片較少,反射率受到土壤光譜干擾而偏高,綠峰相對較不明顯[29]。近紅外區(qū)域反射率光譜曲線差異較大,3 月反射率最低,7 月最高。該區(qū)域光譜反射率主要受葉片內(nèi)部結(jié)構(gòu)、生物量以及葉面積的影響,細(xì)胞層數(shù)越多,反射率越高[30-31]。3 月以后狼尾草葉片干物質(zhì)含量增多,反射率增高。7 月反射率較高可能是因為植物生物量高。短波紅外區(qū)域反射率較低,主要受葉片含水量影響[27]。
圖3 不同月份狼尾草葉片平均光譜曲線Figure 3 Average reflectance spectrum of crude protein of Pennisetum alopecuroides leaves in different months
相關(guān)性分析(圖4)顯示,狼尾草原始反射率與粗蛋白含量正相關(guān)和負(fù)相關(guān),相關(guān)性波動較大。在可見光區(qū)域大部分相關(guān)系數(shù)為負(fù)值,其中在407~409 nm 以及416~420 nm 等波段達(dá)到顯著水平。在近紅外區(qū)的940、945 nm 及1 133~1 148 nm 等波段顯著正相關(guān)。1 980~2 350 nm 短波紅外波段相關(guān)系數(shù)變化起伏較大。總計篩選出296 個波段,其中相關(guān)系數(shù)絕對值最大出現(xiàn)在770 nm 波段,為?0.731。
圖4 狼尾草粗蛋白含量與原始光譜反射率的相關(guān)分析Figure 4 Correlation analysis between crude protein content and raw spectral reflectance of Pennisetum alopecuroides
常見的高光譜吸收特征參數(shù)有很多[21,32-33],本研究選取與狼尾草粗蛋白含量顯著相關(guān)的12 個植被指數(shù)進(jìn)行建模,包括黃邊位置[21](r= 0.752**)、改進(jìn)的土壤調(diào)節(jié)植被指數(shù)(improved soil adjusted vegetation index, MSAVI)[32](r= ?0.464**)、優(yōu) 化 土 壤 調(diào) 節(jié) 植 被指數(shù)(optimized soil adjusted vegetation index,OSAVI)[32](r= 0.464**)、 Zarco-Tejada & Miller (ZTM)[32](r=?0.713**)、Carter 指數(shù)2 (Carter indices 2,CTR2)[32](r=0.490**)、Lichtenthaler 指 數(shù)1 (Lichtenthaler indices1,Lic1)[32](r= ?0.585**)、Vogelmann 指 數(shù)1 (vogelmann indices1,Vog1)[32](r= 0.702**)、Vogelmann 指 數(shù)4(vogelmann indices 4,Vog4)[32](r= ?0.540**)、Gitelson和Merzlyak (G_M)[32](r= ?0.647**)、MERIS Terrestrial Chlorophyll Index (MTCI)[33](r= ?0.592**)、紅邊葉綠素指數(shù)(red-edge Chlorophyll Index,CI red-edge)[33]和歸 一 化 紅 邊 指 數(shù)(normalized difference red edge,NDRE)[33](r= ?0.569**)。
以顯著相關(guān)波段和植被指數(shù)為自變量,狼尾草粗蛋白含量為因變量,分別建立PLSR 和SMLR模型?;陲@著性波段的PLSR 和SMLR 模型分別選用了296 個和3 個變量,基于植被指數(shù)的PLSR和SMLR 模型分別選用了12 個和2 個變量。模型方程的反演效果如表3 所列??梢钥闯觯陲@著波段的PLSR 模型建模集和驗證集RPD分別達(dá)到2.364 和3.110,反演效果最好?;陲@著波段的SMLR 模型反演效果最差,建模集和驗證集RPD約為1。由顯著性植被指數(shù)建立的PLSR 和SMLR 模型精度較為接近,兩者建模集和驗證集RPD約為2。
表3 基于顯著性波段和植被指數(shù)的模型及其驗證Table 3 Model establishment and validation of crude protein content of Pennisetum alopecuroides based on significant bands and spectral indices
狼尾草是麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)的優(yōu)勢植物。研究表明,麋鹿在補(bǔ)飼情況下仍需取食生境中的植被,以滿足不同的養(yǎng)分需求[34]。粗蛋白含量是反映牧草質(zhì)量的重要指標(biāo)。粗蛋白的缺乏導(dǎo)致礦質(zhì)營養(yǎng)(特別是磷)的不足,往往是動物生產(chǎn)的主要限制因子[35]。保護(hù)區(qū)狼尾草粗蛋白含量在生長期內(nèi)逐漸下降,這影響麋鹿對食物的持續(xù)性需求。因此,利用高光譜儀建立狼尾草粗蛋白含量的估算模型,有利于提高麋鹿喜食植物的粗蛋白含量測定的效率和精度,也為改善麋鹿食物營養(yǎng)結(jié)構(gòu)提供科學(xué)依據(jù)。本研究結(jié)果表明,麋鹿保護(hù)區(qū)狼尾草的反射率光譜與粗蛋白含量相關(guān)性較高。高光譜數(shù)據(jù)選擇顯著相關(guān)波段和植被指數(shù)進(jìn)行建模,去除無效信息,避免模型過度擬合,對構(gòu)建反演模型有重要意義。PLSR模型在處理樣品數(shù)量少,自變量數(shù)目多,變量間存在多重共線性時具有獨特優(yōu)勢,比多元逐步回歸更能利用光譜中的重要信息[36]。PLSR 模型能綜合狼尾草反射率光譜對反演其粗蛋白含量貢獻(xiàn)較大的成分,簡化了數(shù)據(jù)結(jié)構(gòu),獲得較高的精度。雖然一些學(xué)者采用非線性回歸方法得出的預(yù)測效果比線性模型好[37-38],本研究基于顯著性波段的PLSR 模型,具有較好的反演能力,建模集和預(yù)測集RPD分別達(dá)到2.364 和3.110,具有估算粗蛋白含量的潛力。但PLSR 方法只適用于有明顯線性關(guān)系的數(shù)據(jù),因此今后需研究一些非線性的建模方法,如支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等[39]。高光譜預(yù)處理方法也有很多,包括SG 卷積平滑、多元散射矯正、變量標(biāo)準(zhǔn)化等,以及不同方法進(jìn)行組合[40],今后將研究不同的預(yù)處理方法,獲得最佳預(yù)處理方法,以提高模型精度。
植物葉片中的有機(jī)物質(zhì),包括木質(zhì)素、蛋白質(zhì)、淀粉、纖維素和糖分等有共同的分子鍵(如O-H 鍵和C-H 鍵),與這些鍵相關(guān)的吸收峰位于短波紅外區(qū)域,吸收峰之間有重疊[4,16]。原始光譜進(jìn)行一階導(dǎo)數(shù)轉(zhuǎn)換能在一定程度上將不同生化成分的光譜吸收特征區(qū)分開,提高模型精度。本研究采用的是傳統(tǒng)經(jīng)驗?zāi)P头ǎ哂幸欢ǖ臅r空局限性,與粗蛋白含量相關(guān)的生化組分會影響粗蛋白的光譜特征吸收波段,進(jìn)而影響其反演精度,今后需進(jìn)一步研究這些生化組分的影響以提高預(yù)測精度。
本研究選定的大多數(shù)顯著性波段與蛋白質(zhì)和氮分子的鍵振動密切相關(guān)。在可見光區(qū)域一些預(yù)測粗蛋白的重要波段與葉綠素有關(guān),可能是因為葉綠素的蛋白質(zhì)含量較高[15]。研究表明,由于N-H 鍵的存在,植物葉綠素濃度與氮含量之間存在較強(qiáng)的相關(guān)性[4],而蛋白質(zhì)是植物體內(nèi)主要的含氮物質(zhì)[16]。近紅外區(qū)域粗蛋白預(yù)測光譜可能和蛋白質(zhì)中的N-H 鍵和N=H 鍵有關(guān)[15]。
綜上,基于全波段顯著性原始反射率光譜和顯著性植被指數(shù)建立的4 種狼尾草粗蛋白含量PLSR和SMLR 預(yù)測模型,以基于顯著性波段的PLSR 模型預(yù)測效果最好,可以較好估測麋鹿保護(hù)區(qū)半散養(yǎng)區(qū)狼尾草粗蛋白含量。另外,本研究分析僅是基于某一年份的觀測數(shù)據(jù),樣本數(shù)量有限,增加更多年份的觀測數(shù)據(jù),可獲得更為可靠的結(jié)論。