何桂芳,吳 見,彭 建,谷雙喜
(滁州學(xué)院 地理信息與旅游學(xué)院,安徽 滁州 239000)
葉綠素作為植物進(jìn)行光合作用的主要色素,其含量與光合作用能力、植物脅迫以及健康狀況關(guān)系密切[1]??焖佟?zhǔn)確地掌握植株葉綠素含量,對于植物生長狀態(tài)監(jiān)測、產(chǎn)量預(yù)測、生境的適宜性評價等都具有非常重要的意義[2]。檢測葉片葉綠素的常用方法有分光光度計法、原子吸收法、高效液相色譜法等,這些方法不僅具有破壞性,而且繁瑣,還只能測有限樣本[3]。高光譜分析技術(shù)具有快速、無損、成本低的優(yōu)點,能直接對植被進(jìn)行微弱光譜差異的定量分析[4]。因此,國內(nèi)外有很多學(xué)者借助高光譜對葉綠素含量進(jìn)行估算。目前,高光譜估算葉綠素含量的研究主要有2類:第1類使用原始光譜及各種變換光譜對葉片葉綠素含量進(jìn)行估算。馮海寬等[5]、黃慧等[6]、李媛媛等[7]、胥喆等[8]對原始光譜、倒數(shù)之對數(shù)、一階微分和連續(xù)統(tǒng)去除等變量,尼加提·卡斯木等[9]利用反射率、吸收深度等光譜參數(shù),鄧小蕾等[10]利用原始光譜及一階微分的小波包去噪光譜等構(gòu)建葉綠素反演模型。這類研究都是對單個敏感波段的光譜進(jìn)行建模,精度可能會在一定程度上受到制約。第2類使用任意2波段構(gòu)建的植被指數(shù)對葉綠素含量進(jìn)行估算。何彩蓮等[11]、姜海玲等[12]直接使用已經(jīng)發(fā)表的固定波段的植被指數(shù),Tumboetal[13]利用比值植被指數(shù),程志慶等[14]利用歸一化植被指數(shù),孫紅等[15]利用差值植被指數(shù),武旭梅等[16]、羅丹等[17]利用比值、差值、歸一化植被指數(shù)及土壤調(diào)節(jié)指數(shù),陳秀青等[18]、王鑫梅等[19]用原始光譜、一階導(dǎo)數(shù)的歸一化差分和比值植被指數(shù),馬文勇等[20]、劉文雅等[4]、李春等[21]利用紅邊位置植被指數(shù),構(gòu)建SPAD 估算模型。這類研究使用的反演方法主要有隨機森林、偏最小二乘、線性回歸、BP神經(jīng)網(wǎng)絡(luò)、主成分分析、支持向量機等,根據(jù)自變量和因變量的個數(shù)選用合適的反演方法,都能夠得到較高的精度模型。因此,利用高光譜分析技術(shù)對植被葉片葉綠素含量估算是可行可靠的,只是針對不同的植物和不同反演方法所選用的最佳波段和最佳估算變量不盡相同[22]。
以往研究大多集中在水稻、玉米、小麥等農(nóng)田經(jīng)濟作物和蘋果等果蔬上,對于園林綠化常用的綠色植物研究較少,本研究選取具有觀賞和藥用價值的常綠闊葉灌木石楠(Photiniaserrulata)為對象,通過實測光譜反射率和葉綠素含量,選擇葉片尺度的原始光譜及4種變換光譜和差值型、比值型、歸一化值型的6種常用植被指數(shù),采用逐步線性回歸和偏最小二乘方法建立葉綠素含量的高光譜反演模型,并對比單波段構(gòu)建的模型與植被指數(shù)回歸模型,尋求葉綠素最佳反演模型,為實現(xiàn)高光譜技術(shù)快速、大面積監(jiān)測綠色植物的長勢和營養(yǎng)監(jiān)測提供理論依據(jù)和技術(shù)支撐,為園林綠植的養(yǎng)護和管理提供參考。
研究區(qū)為滁州市瑯琊山景區(qū),采集健康成熟的單株石楠葉片,在每棵樹上采集3片葉片,并將葉片編號后同時進(jìn)行光譜與葉綠素含量的測量。葉片光譜值采用美國ASD Field Spec光譜儀實測獲取,波長350~2 500 nm,采樣間隔為1 nm,共有2 150個波段。每個樣點光譜數(shù)據(jù)記錄8次,取每個樣點的8條光譜數(shù)據(jù)平均值,作為該樣點的光譜數(shù)據(jù)。葉綠素測定采用SPAD-502葉綠素儀,該儀器采用光電無損檢測方法測得的SPAD(soil and plant analyzer development)值與葉綠素含量具有很高的相關(guān)性,常用于表征葉綠素含量[23]。選擇晴朗的無風(fēng)、無云天氣9:00-11:00,先按照說明對儀器校準(zhǔn)后,再對每片樹葉的葉尖、葉中和葉基3個部位測量葉片光譜,同時在該樣點上進(jìn)行SPAD值測量。
分別對每一片樹葉3個樣點的SPAD值與光譜數(shù)據(jù)取平均值,作為該葉片的SPAD值與對應(yīng)的光譜反射率。研究共測得59份葉片樣本,隨機選取40份作為建模樣本,剩余19份作為驗證樣本。各類型樣本的SPAD值統(tǒng)計特征見表1。其中,建模樣本的SPAD值為3.70~50.00,區(qū)間分布合理,變異程度較大,能保證所建模型的適應(yīng)范圍;驗證樣本和建模樣本的統(tǒng)計特征相差不大,能夠驗證模型的可靠性。
表1 SPAD值的統(tǒng)計特征
1.2.1 光譜變換 在原始光譜反射率(reflectance,R)的基礎(chǔ)上,計算其倒數(shù)1/R,倒數(shù)之對數(shù)(logarithm of reciprocal,LR,公式中用LR表示)、一階微分(first order differential of reflectance,FDR,公式中用FDR表示)、二階微分(second-order differential of reflectance,SDR,公式中用SDR表示)4種指標(biāo),計算公式見式(1)-式(3)。原始光譜經(jīng)過LR變換后能夠減少因為光照條件變化引起的乘性因素的影響,經(jīng)過FDR變換后可以消除背景噪聲的干擾,分解出混合的重疊峰,從而提高光譜的分辨率和靈敏度,找到相關(guān)性更高的波段。
LR=ln(1/R)
(1)
FDR=(Ri+1-Ri-1)/2Δλ
(2)
(3)
式中:Ri-1表示上一個波段的反射率,Ri+1表示下一個波段的反射率,R′表示一階微分,Δλ為采樣間隔。
1.2.2 植被指數(shù) 光譜的植被指數(shù)是2個或者多個波段光譜反射率的組合。通過對估算葉綠素模型的植被指數(shù)進(jìn)行分析,選取6個常用植被指數(shù)[16]:比值指數(shù)(ratio vegetation index,RI,公式中用RI表示)、差值指數(shù)(difference vegetation index,VI,公式中用VI表示)、歸一化指數(shù)(normalized difference vegetation Index,NDVI,公式中用NDVI表示)、光譜反射率一階微分比值指數(shù)(ratio index of derivative,DRI,公式中用DRI表示)、光譜反射率一階微分差值指數(shù)(difference vegetation index of derivative,DVI,公式中用DVI表示)、光譜反射率一階微分歸一化指數(shù)(normalized difference vegetation index of derivative,DNDVI,公式中用DNDVI表示),植被指數(shù)公式見表2[24]。
表2 植被指數(shù)運算公式
1.2.3 逐步線性回歸和偏最小二乘回歸 逐步線性回歸在構(gòu)建方程時,先考慮自變量對因變量的作用顯著程度大小,按照從大到小的原則逐個引入方程。每引入一個變量都將檢驗其顯著性F,對不符合的變量進(jìn)行篩選、剔除,確保每次引入新的變量之前方程中只含有顯著性的自變量。逐步線性回歸可以避免多元線性回歸模型中的個別自變量貢獻(xiàn)率較小的問題,篩選出顯著性因子強的自變量[25]。偏最小二乘回歸(partial least squares regression,PLSR)主要研究多因變量或單因變量對多自變量的回歸建模,但是單因變量的偏最小二乘回歸模型在日常分析中最為常見[12]。對于該方法的具體介紹可參考P.Geladietal[26]和S.Woldetal[27]。偏最小二乘回歸適合變量個數(shù)很多且存在多重共線性同時樣本數(shù)較少。在光譜建模過程中,PLSR能有效辨識光譜信息與噪聲,降低光譜維數(shù),減少數(shù)據(jù)冗余。PLSR的重點在于主成分個數(shù)的確定,主成分的個數(shù)會直接影響模型的穩(wěn)健性,主成分個數(shù)過少會出現(xiàn)欠擬合情況,主成分個數(shù)過大會出現(xiàn)過擬合情況[28]。PLSR模型在SPSS中的實現(xiàn)過程參考王國華等[29]。
1.2.4 精度驗證 模型構(gòu)建與驗證分析在SPSS23.0中完成,選用的模型精度驗證的2個指標(biāo)決定系數(shù)(coefficient of determination,R2),均方根誤差(root mean square error,RMSE,公式中用RMSE表示),其計算公式:
(4)
(5)
對59個樣本按照葉綠素含量進(jìn)行升序排列,采用等間隔方法選取6個樣本,其SPAD值分別為3.7、14.17、23.4、37.4、46.6、58.9,得到對應(yīng)的6條原始光譜曲線(圖1)。該曲線存在以下特征:1)波長350~500 nm,光譜反射率區(qū)別較??;2)可見光波段500~760 nm,光譜反射率波動趨勢變化較大,不同葉綠素含量的曲線峰值波段有所差別;3)在760~1 360 nm,光譜反射率達(dá)到最大值,曲線比較平穩(wěn),6條曲線趨于平行;4)650~700 nm存在明顯的葉綠素吸收谷,1 360~1 470 nm存在明顯的水分吸收谷,但是部分曲線的吸收深度和吸收面積存在差異。
2.2.1 葉綠素含量和變換光譜的相關(guān)性分析 分別計算葉綠素含量與R、1/R、LR、FDR、SDR之間的相關(guān)系數(shù),其相關(guān)性分析見圖2。
在0.01顯著性水平上,原始光譜R在560~720顯著負(fù)相關(guān),最大相關(guān)系數(shù)波長699 nm(r=-0.800 9),峰值帶寬較??;光譜倒數(shù)1/R在580~720顯著正相關(guān),最大相關(guān)系數(shù)波長700nm(r=0.766 2);光譜倒數(shù)之對數(shù)LR與1/R曲線幾乎重合,但相關(guān)性比1/R稍高,最大相關(guān)系數(shù)波長698 nm(r=0.804 4);光譜一階微分FDR消除了相鄰波段的影響,相關(guān)性比R有所增強,相關(guān)性變化劇烈,最大相關(guān)系數(shù)波長747 nm(r=0.928 3),其峰值帶寬較大;SDR最大相關(guān)系數(shù)波長701 nm(r=0.894 1),其峰值帶寬較小。各種光譜反射率與葉綠素含量之間相關(guān)系數(shù)最大波長均在可見光波段。
在可見光波段350~760 nm,葉綠素含量與各種光譜反射率之間相關(guān)性有正有負(fù),變化明顯。其中,LR與1/R 2條曲線差異最小,部分重合。FDR、SDR的相關(guān)系數(shù)變化較大,在正負(fù)之間波動,與R的相關(guān)系數(shù)相比有所增加,說明FDR、SDR可以將R在可見光波段的葉綠素光譜吸收特征反映出來。在760~1 700 nm,R、LR與1/R 3條曲線趨于平緩,在1 400 nm左右的水分吸收帶有少量增強,F(xiàn)DR、SDR 2條曲線變化仍然較大,相關(guān)性時正時負(fù),在水分吸收帶時變化較為明顯。
對葉綠素含量與R、1/R、LR、FDR、SDR的相關(guān)系數(shù)進(jìn)行顯著性檢驗。在0.01顯著性水平上的波段有:R的519~569、741~1 718 nm;1/R的583~719 nm;LR的518~719、740~1 518 nm;FDR的503~546、634~677、702~769、1 221~1 236 nm;SDR的527~567、575、604~760 nm。
2.2.2 葉綠素含量與植被指數(shù)相關(guān)性分析 研究了350~2 000 nm范圍內(nèi)任意2波段組合的6種植被指數(shù)與石楠(PS)葉片的葉綠素含量值的相關(guān)性。為突出顯示最佳波段組合,利用MATLAB軟件分析并制作相關(guān)性矩陣二維圖(圖3),紅色到藍(lán)色表示高正相關(guān)到高負(fù)相關(guān)。
波長之間的相關(guān)分析表明,可見光波段(350~760 nm)的2個波段之間相關(guān)性相對較強,特別是紅光波段相關(guān)系數(shù)最高。近紅外短波階段(780~1 100 nm)光譜數(shù)據(jù)冗余較多,近紅外長波階段相關(guān)性有所增強。對比不同植被指數(shù),RI、VI、NDVI的敏感波段組合相似,DRI、DVI、DNDVI的敏感波段組合相似。對相關(guān)系數(shù)進(jìn)行統(tǒng)計分析,挑選相關(guān)系數(shù)的最大絕對值所在波段作為特征波段。結(jié)果表明,RI的最佳波段組合為RI(R733,R944),相關(guān)系數(shù)0.952 6,VI的最佳波段組合為VI(R732,R980),相關(guān)系數(shù)0.956 2,NDVI的最佳波段組合為NDVI(R732,R931),相關(guān)系數(shù)0.952 4,DRI的最佳波段組合為DRI(R747,R1 464),相關(guān)系數(shù)0.950 2,DVI的最佳波段組合為DVI(R747,R1 464),相關(guān)系數(shù)0.944 8,
DNDVI的最佳波段組合為DNDVI(R645,R1 370),相關(guān)系數(shù)0.936 9。
2.3.1 基于逐步線性回歸和PLSR的葉片葉綠素估算模型 在通過顯著性檢驗的光譜曲線中,挑選相關(guān)系數(shù)為波峰或波谷的波段作為特征波段。在R曲線中,特征波段為615、630、664、699 nm;1/R曲線中,特征波段為546、560、593、631、659、700 nm;LR曲線中,特征波段為546、558、621、631、664、698 nm;FDR曲線中,特征波段為532、536、541、553、560、611、636、647、655、660、680、691、705、735 nm;SDR曲線中,特征波段為567、639、658、685、693、701、708、736 nm。
分別以各種形式光譜特征波段的反射率作為自變量,以葉綠素含量為因變量,在SPSS中構(gòu)建逐步線性回歸模型和偏最小二乘模型。構(gòu)建逐步回歸方程時,先進(jìn)行共線性診斷,確保入選的自變量之間不存在共線性。設(shè)置入選條件為顯著性F檢驗的概率值小于0.05。構(gòu)建偏最小二乘模型時,根據(jù)潛在因子的方差解釋比例,確定最佳的潛在因子數(shù)。為檢驗?zāi)P偷目煽啃院蛯嵱眯?,采用決定系數(shù)R2和均方根誤差RMSE對模型進(jìn)行評定,結(jié)果見表3。
表3 基于原始光譜和變換光譜的葉綠素估算模型及精度
在葉綠素的逐步線性回歸模型中,對R進(jìn)行LR、FDR、SDR變換后,建模集和驗證集的R2都變大了, RMSE都減小了,其中FDR變換的光譜對葉綠素含量預(yù)測效果最好。
在葉綠素的最小偏二乘模型中,基于變換光譜建立的模型較于原始光譜有效提高了反演精度,驗證集的R2變大了, RMSE均減小,但是建模集的1/R、SDR變換后,2個精度指標(biāo)變化不太一致,模型精度最高的仍然是FDR。從建模集的精度來看,R、SDR的逐步線性回歸模型優(yōu)于偏最小二乘模型。從驗證集的精度來看,LR的偏最小二乘模型優(yōu)于逐步線性回歸模型。綜合來看,最優(yōu)模型為FDR的逐步線性回歸模型。
因此,對R進(jìn)行LR、FDR、SDR變換,能夠提高葉綠素含量預(yù)測模型的精度和穩(wěn)定性。
2.3.2 基于植被指數(shù)的單變量葉綠素估算模型 選擇線性函數(shù)、二次函數(shù)、對數(shù)函數(shù)、逆函數(shù)、指數(shù)函數(shù)分別與6種植被指數(shù)擬合,構(gòu)建葉綠素含量的單變量估算模型。通過比較決定系數(shù)R2和均方根誤差RMSE,探索葉綠素含量的最佳單變量估算模型,結(jié)果見表4。
表4 SPAD的單變量擬合模型及精度
以上各種模型中,基于同一植被指數(shù)所建立的5種模型中,線性函數(shù)模型普遍具有較高的決定系數(shù)和較低的均方根誤差,模型精度較高。二次函數(shù)模型的R2和RMSE都很接近。除了RI的逆函數(shù)R2>0.6外,其他幾個逆函數(shù)的R2均小于0.6,表明逆函數(shù)不能進(jìn)行葉綠素估算。對數(shù)函數(shù)與指數(shù)函數(shù)的R2和RMSE有的最好,有的較差。從建模集來看,精度最優(yōu)的模型是DRI的線性模型,從驗證集來看,最優(yōu)的是DNDVI的指數(shù)模型。
3.3.3 基于植被指數(shù)的多變量葉綠素估算模型 以葉綠素含量為因變量,6種植被指數(shù)為自變量,在SPSS中構(gòu)建逐步線性回歸模型,并利用驗證樣本對建立的模型進(jìn)行精度評價(表5)。
表5 基于植被指數(shù)的葉綠素估算模型及精度
逐步線性回歸模型最終僅入選了DRI和RI 2個變量,其建模集的R2達(dá)到了0.93,說明模型預(yù)測效果非常高,RMSE為3.145,說明預(yù)測精度也很理想,同時檢驗精度也達(dá)到了0.955。
依據(jù)上述分析,5種光譜指標(biāo)的逐步線性回歸模型和偏最小二乘模型的R2取值在0.700~0.958,預(yù)測精度最高為FDR的逐步線性回歸模型。6種植被指數(shù)的5類函數(shù)模型中,除逆函數(shù)外,其余4類函數(shù)R2取值在0.8~0.96,預(yù)測精度最高為DNDVI的指數(shù)模型。6種植被指數(shù)構(gòu)建的逐步線性回歸模型最佳為DRI+RI,R2取值0.955。
為了直觀展示葉綠素估算模型的擬合度和可靠性,繪制了預(yù)測值與實測值之間的1∶1關(guān)系圖(圖4),可以看出基于植被指數(shù)DRI+RI的線性回歸模型的樣本點集中在1∶1直線的兩側(cè),比單光譜指標(biāo)和單植被指數(shù)模型的精度都要高。
通過對入選波段的統(tǒng)計表明,石楠葉綠素含量相關(guān)性最高的波段在紅波段(622~770 nm);利用逐步線性回歸和PLSR構(gòu)建的各種變換光譜與葉綠素含量的預(yù)測模型結(jié)果具有一致性,光譜的一階微分變換后能有效增強有價值波段信息,提高模型的精度;使用5種函數(shù)擬合的6種植被指數(shù)的預(yù)測模型中,僅RI的5種函數(shù)精度都較高,其他5種植被指數(shù)的對數(shù)函數(shù)和逆函數(shù)不能預(yù)測葉綠素含量;石楠葉片葉綠素估算最佳模型是RI和DRI的線性模型,說明比值植被指數(shù)比差值、歸一化值植被指數(shù)有更好的預(yù)測能力。因此,本研究成果能為高光譜遙感技術(shù)在園林綠化中的應(yīng)用提供依據(jù)。
對原始光譜與4種變換光譜構(gòu)建葉綠素含量的逐步線性回歸和偏最小二乘模型,發(fā)現(xiàn)基于FDR的逐步線性回歸和偏最小二乘模型均最優(yōu)。這可能與FDR消除了相鄰波段的干擾有關(guān),使得光譜的吸收特征信息被釋放,相關(guān)系數(shù)最大值提高了0.13,從而改善了模型精度。由于R、1/R、LR、SDR入選的特征波段有限,使得其偏最小二乘模型精度低于逐步線性回歸,而FDR構(gòu)建的偏最小二乘模型精度與逐步線性模型較為接近,這可能與其入選特征波段較多有關(guān)。從試驗結(jié)果分析可知,偏最小二乘模型更適合變量多且變量間存在較大共線性的情況,今后可嘗試用所有顯著性波段構(gòu)建該模型。
6種植被指數(shù)與葉綠素含量間具有極顯著相關(guān)性,最大相關(guān)系數(shù)都大于0.93,均高于原始光譜及變換光譜。研究表明,逆函數(shù)和對數(shù)函數(shù)只適用于RI,線性、二次、指數(shù)函數(shù)適用于6種植被指數(shù),且6種植被指數(shù)構(gòu)建的逐步線性回歸模型中,RI(R733,R944)和DRI(R747,R1 464)2個變量建立的模型精度優(yōu)于單植被指數(shù)變量模型。說明多個植被指數(shù)結(jié)合也可以提高葉綠素含量的估算精度。