黎小清,陳桂良,許木果,丁華平,劉忠妹,楊春霞
(云南省熱帶作物科學(xué)研究所,云南 景洪 666100)
【研究意義】鉀是橡膠樹生長和膠乳生產(chǎn)所必需的養(yǎng)分,具有提高光合作用強度、促進淀粉和糖的形成、增強橡膠樹的抗逆性和抗病能力以及產(chǎn)膠和排膠能力的作用[1]。葉片營養(yǎng)診斷是當(dāng)前較成熟的簡單可行的橡膠樹營養(yǎng)診斷方法[2-3]。傳統(tǒng)的葉片化學(xué)分析,雖然具有較高的檢測精度,但從樣品采集、制備到分析測試需要消耗大量的時間、人力和物力,測試結(jié)果時效性差。通過建立橡膠樹營養(yǎng)高光譜估算模型,能夠快速獲得橡膠樹營養(yǎng)狀況,并節(jié)約大量實驗室資源?!厩叭搜芯窟M展】國內(nèi)外有關(guān)植物生化組分的高光譜估算研究大多集中在氮素[4-17],氮素含量估算做了大量的研究工作并取得了較好的效果。部分學(xué)者也開始嘗試建立植物葉片其他元素含量估算模型。郭澎濤等利用高光譜技術(shù)結(jié)合BPANN模型對橡膠苗葉片磷含量進行了預(yù)測[18]。劉延等采用多元逐步回歸分析的方法建立了基于光譜特征單變量估測云煙97號葉片鉀含量模型[19]。李園等通過光譜參數(shù)組合有效地估測了香梨葉片鐵元素含量[20]。偏最小二乘法(PLS)和支持向量機(SVM)是常用的回歸建模方法,大量用于構(gòu)建植物生化組分的估算。筆者采用PLS建立了橡膠樹葉片氮素高光譜估算模型,取得了良好的效果[21-22]。黃雙萍等基于敏感特征波段建立柑橘葉片鉀素含量預(yù)測模型,結(jié)果顯示,PLS和SVM模型效果差異不大,但明顯優(yōu)于多元線性回歸(MLR)[23]。Zhai等通過比較PLS和SVM,認為SVM結(jié)合可見光/近紅外光譜數(shù)據(jù)在估算植物生化組分含量方面具有較大的潛力[24]?!颈狙芯康那腥朦c】目前,有關(guān)橡膠樹葉片鉀素含量高光譜估算的研究未見報道,基于可見光/近紅外光譜數(shù)據(jù)能否準確估算橡膠樹葉片鉀素含量還有待研究?!緮M解決的關(guān)鍵問題】PLS能夠很好地消除光譜數(shù)據(jù)的共線性,但它是一種線性模型,而SVM能用于非線性建模。文章嘗試將PLS與SVM結(jié)合用于估算葉片鉀素含量。以云南西雙版納為研究區(qū),采集了2個不同品種、涵蓋6個割齡的橡膠樹葉片樣品,并測定其反射率和鉀素含量。通過比較偏最小二乘法(PLS)和偏最小二乘-支持向量機法(PLS-SVM),確定最優(yōu)的建模方法,構(gòu)建橡膠樹葉片鉀素含量高光譜估算模型,以實現(xiàn)橡膠樹鉀素營養(yǎng)的快速檢測。
圖1 采樣點分布Fig.1 Distribution of sampling sites
1.1.1 葉片樣品采集 2018年8-9月,綜合考慮不同的品種、割齡、營養(yǎng)狀況和地理位置,確定了6個采樣點(圖1)。在每個采樣點隨機選擇橡膠樹采樣,采集主側(cè)枝頂蓬葉中無病蟲害成熟復(fù)葉的中間葉作為1個樣品,共采集到298個葉片樣品。采集的樣品涵蓋了2個品種、6個割齡(表1)。
表1 橡膠樹葉片樣品信息
1.1.2 葉片反射率測定 葉片反射率測定在實驗室進行。測定儀器為ASD FieldSpec4(Hi-Res),波長范圍350~2500 nm,其中350~1000 nm采樣間隔1.4 nm,光譜分辨率3 nm;1001~2500 nm采樣間隔2 nm,光譜分辨率8 nm,輸出光譜數(shù)據(jù)間隔為1 nm,因此,每個葉片樣品的光譜數(shù)據(jù)輸出的總波段為2151個。測定光源由植物探頭提供,測量前先進行參考白板校正,測量時利用葉片夾持器將葉片固定,以葉片的主葉脈為界,選取葉片上中下部共6個無病斑區(qū)域,測定葉片正面的光譜反射率。每個區(qū)域連續(xù)掃描3次,每個葉片樣品的反射率由18條光譜曲線取平均而得。
1.1.3 葉片鉀含量測定 采用H2SO4-H2O2消煮、火焰光度計法測定葉片鉀含量。將已測定反射率的葉片樣品去除葉柄和主葉脈,在105 ℃烘箱中進行殺青,然后在60 ℃下烘干,最后碾缽搗碎。稱取葉片樣品0.08~0.10 g于100 mL消化試管中,沿消化管內(nèi)壁加濃H2SO43 mL,在380 ℃下消化1 h,取下消化管稍冷卻,加H2O2至清亮,繼續(xù)加熱5 min,取下冷卻后轉(zhuǎn)移至50 mL容量瓶,蒸餾水定容,同時做空白對照。將待測液于原子吸收分光光度計(AA-6300C)測定鉀含量,每組葉片樣品重復(fù)分析2次,取平均值作為葉片鉀含量。
1.2.1 光譜反射率預(yù)處理 由于400 nm以下的光譜反射率噪聲較大,將其剔除,剩余的400~2500 nm光譜反射率數(shù)據(jù)用于文章的建模研究。根據(jù)杠桿值和學(xué)生殘差判定異常樣品[25],共剔除4個異常樣品。將剔除異常樣品后的294個葉片樣本用于建模分析,按鉀含量從小到大排序,每5個樣本中選取第3個為驗證樣本,其余為校正樣本,最后得到校正樣本235個,驗證樣本59個。
模型校正前,首先將全部光譜反射率重采樣為10 nm間隔(405、415、425…2485、2495 nm)。為了消除光譜數(shù)據(jù)無關(guān)信息和噪聲,提高建模精度,采用以下方法或方法組合對重采樣后的原始光譜反射率R進行預(yù)處理[26]:多元散射校正(MSC)、標準正態(tài)變換(SNV)、Savitzky-Golay平滑 (SG)、一階導(dǎo)數(shù)(FD)和二階導(dǎo)數(shù)(SD)。
1.2.2 偏最小二乘法 偏最小二乘法(PLS)目前在可見光/近紅外光譜定量分析中應(yīng)用相當(dāng)廣泛。應(yīng)用Unscrambler 9.7軟件的偏最小二乘法(PLS1)和留一交叉驗證的方式進行PLS建模[27]。
1.2.3 偏最小二乘-支持向量機 支持向量機(SVM)通過核函數(shù)將低維非線性問題轉(zhuǎn)換成高維的線性問題,將復(fù)雜的非線性問題進行線性化,廣泛應(yīng)用于分類與回歸模型的構(gòu)建[28-29]。
偏最小二乘-支持向量機(PLS-SVM)方法是將PLS與SVM相結(jié)合的一種建模方法。PLS-SVM的基本思想是用PLS提取主成分,用主成分得分變量代替初始輸入變量,然后利用SVM進行模型校正和驗證。其中PLS主成分得分矩陣T可以由式(1)計算而得[30-31]:
T=X0W(PTW)-1
(1)
式中,成分得分矩陣T=[t1,…,tr],X0是原始自變量矩陣X經(jīng)中心化處理后得到的矩陣,P=[p1,…,pr]為負載矩陣,W=[w1,…,wr]為系數(shù)矩陣。
模型驗證時,驗證集的PLS主成分得分矩陣由式(1)計算而得,其中X0是驗證集原始自變量矩陣X經(jīng)中心化變換得到的矩陣,負載矩陣P和系數(shù)矩陣W從PLS校正模型中提取得到。
1.2.4 模型驗證 采用決定系數(shù)(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)進行模型驗證。R2和RPD越大,同時RMSE越小,說明模型具有較高精度。RPD≥2.25,說明模型估算效果良好;1.75 從表2可見,由于采集了不同區(qū)域、不同品種和不同割齡的葉片樣品,樣品鉀含量變異程度較大,有利于建模研究。將所有樣本按鉀素含量高低劃分為高(>13 g/kg)、中(10~13 g/kg )、低(<10 g/kg)3種營養(yǎng)水平,并計算每種營養(yǎng)水平葉片樣品的平均反射率光譜,發(fā)現(xiàn)絕大部分波段的反射率與鉀素含量成正相關(guān),且不同鉀素營養(yǎng)水平橡膠樹葉片的反射率光譜曲線有相似的反射特征(圖2)。在400~700 nm波段,葉片的反射率總體較低,是因為色素對該波段能量的強烈吸收。在550 nm附近,由于葉綠素吸收作用較小,形成1個反射峰。在700~750 nm波段,反射率急劇上升。在750~1300 nm波段,受葉片細胞結(jié)構(gòu)的影響,出現(xiàn)1個高反射平臺。在1450和1950 nm附近受水分強烈吸收的影響,形成2個吸收峰。 表2 用于模型校正和驗證的橡膠樹葉片樣品鉀含量描述性統(tǒng)計 圖2 3種鉀素營養(yǎng)水平葉片的平均原始反射率光譜Fig.2 The average raw reflectance spectra of leaves from three levels of potassium nutrition 應(yīng)用不同預(yù)處理方法或方法組合(MSC、SNV、SG、FD、SD)對重采樣后的原始光譜反射率進行預(yù)處理,基于預(yù)處理后的光譜數(shù)據(jù)與鉀素含量數(shù)據(jù),采用PLS及留一交叉驗證方法建模,其中,SG平滑模式的平滑點數(shù)在3~101的奇數(shù)中篩選,多項式次數(shù)1~9中篩選,按照預(yù)測均方根誤差選擇最優(yōu)的光譜預(yù)處理模式。MSC和SNV變換在unscrambler 9.7中實現(xiàn),SG平滑和PLS模型的建立通過MATLAB 2015編程實現(xiàn)。 通過篩選,SNV、SG和FD組合方法是最佳的預(yù)測處理方法,其中,SG平滑點數(shù)為7,多項式次數(shù)為1或2。圖3為葉片原始光譜反射率及預(yù)處理后的光譜數(shù)據(jù)與葉片鉀含量的相關(guān)系數(shù)。原始光譜反射率最高相關(guān)系數(shù)為0.486出現(xiàn)在725 nm處,預(yù)處理后最高相關(guān)系數(shù)達到-0.679,出現(xiàn)在2305 nm處。相比原始光譜反射率,預(yù)處理后的光譜數(shù)據(jù)與葉片鉀含量的相關(guān)系數(shù)有了顯著地提高。 圖3 葉片原始光譜反射率及預(yù)處理后的光譜數(shù)據(jù)與葉片鉀含量的相關(guān)系數(shù)(n=235)Fig.3 The correlation coefficients between leaf potassium content and raw reflectance and preprocessed spectral data(n=235) 基于校正集的葉片鉀含量與原始光譜反射率及預(yù)處理后光譜數(shù)據(jù),應(yīng)用Unscrambler 9.7軟件,采用PLS1及留一交叉驗證方法建立PLS模型,模型校正效果如表3所示。利用驗證集對所建模型進行精度驗證,模型的預(yù)測效果如圖4所示。 從表3的PLS模型中,按照最佳PLS因子數(shù)確定主成分個數(shù),分別提取原始光譜反射率與預(yù)處理后光譜數(shù)據(jù)的主成分得分向量,作為SVM的條件屬性,葉片鉀素含量作為決策屬性。利用LIBSVM軟件[33]進行SVM的參數(shù)優(yōu)選、建立模型及模型驗證。建模前,利用LIBSVM軟件的svm-scale對光譜數(shù)據(jù)進行歸一化縮放。 文章選取SVM類型為epsilon-SVR,核函數(shù)類型為radial basis function,通過網(wǎng)格搜索和10折交叉驗證,得到的最優(yōu)參數(shù)如表4所示。利用驗證集對所建模型進行精度驗證,模型的預(yù)測效果如圖5所示。 通過剔除異常波段和光譜反射率重采樣,獲得了采樣間隔為10 nm(405、415、425…2485、2495 nm)的原始光譜反射率。采用多元散射校正(MSC)、標準正態(tài)變換(SNV)、SG平滑(SG)、一階導(dǎo)數(shù)(FD)和二階導(dǎo)數(shù)(SD)等預(yù)處理方法或方法組合對葉片原始光譜反射率進行預(yù)處理,通過篩選得到最佳預(yù)處理模式為SNV+SG+FD的組合方法,其中,SG平滑點數(shù)為7,多項式次數(shù)為1或2。相比原始光譜反射率,預(yù)處理后的光譜數(shù)據(jù)與葉片鉀含量的相關(guān)系數(shù)有了顯著地提高,最高相關(guān)系數(shù)從0.486增加到-0.679。 表3 PLS模型的校正效果 圖4 PLS模型預(yù)測結(jié)果Fig.4 The partial least squares regression model prediction 圖5 PLS-SVM模型預(yù)測結(jié)果Fig.5 The partial least squares-support vector machine model prediction 分別采用偏最小二乘法(PLS)和偏最小二乘-支持向量機法(PLS-SVM)建立了橡膠樹葉片鉀素含量的高光譜估算模型。采用驗證集對PLS模型和PLS-SVM模型進行驗證,結(jié)果顯示,決定系數(shù)R2分別為0.843和0.868,均方根誤差RMSE分別為1.331和1.162 g/kg,相對分析誤差RPD分別為2.414和2.764,2種模型均具有良好的估算效果,但PLS-SVM模型具有更高的估算精度。 表4 最優(yōu)PLS-SVM模型的參數(shù) 為了得到更具有代表性和鉀含量變異程度較大的橡膠樹葉片樣品,本次樣品的采集綜合考慮不同的品種、割齡、營養(yǎng)狀況和地理位置,但由于各類型樣品較少,并未按品種和割齡分別建模。一般而言,在作物養(yǎng)分高光譜估算模型研究中,應(yīng)考慮品種間差異[11,22]。同時橡膠樹又是多年生的經(jīng)濟作物,割齡可能也會對高光譜估算養(yǎng)分產(chǎn)生影響。今后可開展分品種和割齡建模研究,看是否能夠提高模型的估算精度。 從文章研究來看,將不同品種和割齡的葉片樣品混合用于構(gòu)建橡膠樹葉片鉀素含量高光譜估算模型也能夠取得理想的估算效果。2 結(jié)果與分析
2.1 鉀素含量與光譜反射率
2.2 鉀素含量與光譜反射率及其變換光譜的相關(guān)分析
2.3 PLS 模型
2.4 PLS-SVM模型
3 討 論
4 結(jié) 論