于 雷,章 濤,朱亞星,周 勇,夏 天,聶 艷
(1. 華中師范大學(xué)地理過(guò)程分析與模擬湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430079;2. 華中師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,武漢 430079;3. 華中師范大學(xué)可持續(xù)發(fā)展研究中心,武漢 430079)
葉綠素是植物營(yíng)養(yǎng)脅迫、光合能力和衰老進(jìn)程各階段的良好指示劑[1]。監(jiān)測(cè)大豆葉片的葉綠素狀況,對(duì)大豆生長(zhǎng)診斷與施肥調(diào)控等具有重要意義[2]。SPAD(soil and plant analyzer development)值是葉綠素的相對(duì)含量,與葉綠素含量具有良好的相關(guān)性,可準(zhǔn)確表征葉綠素含量[3]。目前,普遍采用便攜式葉綠素儀單點(diǎn)測(cè)定植物葉片SPAD值,不僅需要反復(fù)接觸葉片,而且不適于大范圍葉綠素信息獲取[4]。高光譜遙感技術(shù)具有高效率、非接觸、不破壞、無(wú)污染等特點(diǎn),為獲取植物葉片 SPAD值提供了一種新方法。然而,葉片近紅外光譜的吸收峰嚴(yán)重重疊,導(dǎo)致光譜中存在冗余信息,影響了高光譜估測(cè)葉綠素含量模型的精度[5]。因此,分析葉綠素的光譜特征,揭示葉綠素的高光譜響應(yīng)規(guī)律,確定葉綠素的敏感波長(zhǎng)變量,對(duì)提升葉綠素高光譜估測(cè)模型的運(yùn)行效率、簡(jiǎn)化模型結(jié)構(gòu)和增強(qiáng)模型穩(wěn)定性具有重要意義。
變量篩選方法是從高光譜波段信息中挖掘隱藏信息,提取與估測(cè)目標(biāo)相關(guān)的特征波長(zhǎng)變量方法的總稱(chēng)[6],主要具有3個(gè)優(yōu)點(diǎn):1)消除無(wú)信息和干擾信息變量提高模型預(yù)測(cè)能力;2)挑選信息變量增強(qiáng)模型可解釋性;3)降低數(shù)據(jù)維度提升模型運(yùn)行速度[7]。常見(jiàn)的變量篩選方法可分為 2類(lèi),一類(lèi)是以變量數(shù)理統(tǒng)計(jì)特征為基礎(chǔ),主要包括無(wú)信息變量消除法(uninformative variables elimination,UVE)、競(jìng)爭(zhēng)適應(yīng)重加權(quán)采樣法(competitive adaptive reweighted sampling,CARS)、連續(xù)投影算法(successive projections algorithm,SPA)等。UVE方法可以濾除高光譜中的無(wú)效信息變量,但保留變量數(shù)依然較多[8];CARS和SPA方法分別可以剔除冗余信息變量及消除共線性信息變量,然而篩選結(jié)果中可能存在較低信噪比的變量[9-10]。另一類(lèi)是基于優(yōu)化算法搜索最優(yōu)變量,主要有逐步選擇、前向選擇、反向消除、遺傳算法(genetic algorithm,GA)等,此類(lèi)方法可全局搜索有效信息變量,但運(yùn)算過(guò)程耗時(shí)長(zhǎng),模型參數(shù)復(fù)雜且難以徹底搜索所有可能的變量組合[11]。上述方法均較好地實(shí)現(xiàn)了高光譜特征波長(zhǎng)變量的篩選,然而未對(duì)篩選結(jié)果進(jìn)行細(xì)化分析和歸類(lèi),未考慮變量之間的聯(lián)合效應(yīng),易忽視與葉綠素關(guān)系較弱的信息[12]。迭代保留信息變量算法(iteratively retains informative variables,IRIV)[12],假設(shè)所有變量被采樣的幾率相同,不將變量當(dāng)作獨(dú)立的個(gè)體,充分考慮波長(zhǎng)變量間的聯(lián)合效應(yīng),根據(jù)變量重要性將其劃分為強(qiáng)信息波長(zhǎng)變量(strongly informative variable)、弱信息波長(zhǎng)變量(weakly informative variable)、無(wú)信息波長(zhǎng)變量(uninformative variable)和干擾信息波長(zhǎng)變量(interfering variable)等4類(lèi)[13],經(jīng)過(guò)迭代分析運(yùn)算,排除無(wú)效及干擾信息變量,從強(qiáng)信息波長(zhǎng)變量和弱信息波長(zhǎng)變量中提取特征波長(zhǎng)變量。IRIV算法可嘗試用于研究葉片光譜弱信息變量在揭示葉綠素高光譜響應(yīng)規(guī)律及構(gòu)建葉綠素估測(cè)模型中的作用。
因此,本研究以江漢平原大豆葉片為研究對(duì)象,分析葉片光譜特征,采用IRIV算法篩選光譜特征波長(zhǎng)變量,建立大豆葉片 SPAD值估測(cè)模型。研究方法可為葉綠素動(dòng)態(tài)監(jiān)測(cè)提供技術(shù)支撐,研究結(jié)果可為研發(fā)葉綠素高光譜傳感器提供理論依據(jù)。
本研究選取湖北省潛江市竹根灘鎮(zhèn)(112°52¢~112°59¢E,30°25¢~30°34¢N)作為試驗(yàn)區(qū),其位于江漢平原腹地,地勢(shì)平坦;屬于亞熱帶季風(fēng)性濕潤(rùn)氣候,四季分明,雨量充沛;耕地地力優(yōu)越,主要種植大豆、棉花和花生等旱生作物;該試驗(yàn)區(qū)為優(yōu)質(zhì)高蛋白大豆標(biāo)準(zhǔn)化生產(chǎn)示范基地,大豆種植類(lèi)型主要為鄂豆系列,采用配方施肥,栽培技術(shù)相對(duì)統(tǒng)一。在試驗(yàn)區(qū)范圍內(nèi),選取 80塊種植大豆的田塊作為樣點(diǎn),相鄰樣點(diǎn)的東西間距不小于200 m,南北間距不小于1 000 m,每個(gè)樣點(diǎn)均為面積不低于1 hm2的連片耕地。由于試驗(yàn)區(qū)范圍大,樣點(diǎn)距離較長(zhǎng),試驗(yàn)環(huán)境變化及光譜儀頻繁校正會(huì)影響光譜數(shù)據(jù)的穩(wěn)定性和精確性[14],因此本研究在試驗(yàn)環(huán)境穩(wěn)定的室內(nèi)進(jìn)行光譜采集。試驗(yàn)時(shí)間處于大豆鼓粒期,每個(gè)樣點(diǎn)采集 6片具有代表性且生長(zhǎng)健康的葉片,立即裝入自封袋排除空氣放入冰盒暫存,在2 h內(nèi)轉(zhuǎn)移至4 ℃冰箱中冷藏保存,充分保證室內(nèi)測(cè)定光譜時(shí)葉片的新鮮度。
采用日本KONICA MINOLTA公司生產(chǎn)的SPAD 502葉綠素儀測(cè)定SPAD值,其原理是夾緊葉片測(cè)量葉片在2個(gè)波長(zhǎng)(650、940 nm)的吸收率反演葉綠素的相對(duì)含量,直接顯示SPAD值。每個(gè)樣點(diǎn)測(cè)定6片葉片,6片葉片SPAD值的平均值作為該樣點(diǎn)的SPAD值;最終獲得80個(gè)樣點(diǎn)的SPAD值。
采用濃度梯度法劃分樣本集[15],將80個(gè)樣點(diǎn)作為總體樣本集(whole set);根據(jù)各樣點(diǎn)的SPAD值由小到大排序,依次每隔 2個(gè)樣本取一個(gè)作為驗(yàn)證集(validation set),共計(jì)26個(gè)樣本;其余54個(gè)樣本作為建模集(calibration set)。每個(gè)數(shù)據(jù)集SPAD值的描述性統(tǒng)計(jì)見(jiàn)表1。
本研究采用美國(guó)Analytical Spectral Devices公司生產(chǎn)的ASD HandHeld 2型地物光譜儀測(cè)定葉片高光譜數(shù)據(jù),波譜范圍為350~1 075 nm,采樣間隔為1.5 nm,重采樣輸出間隔為1 nm。光譜測(cè)量在暗室內(nèi)進(jìn)行,光源為能夠提供平行光線的 50 W 鹵素?zé)?,其到葉片表面距離為30 cm,光源入射角度為30°;光釬探頭視場(chǎng)角為25°,探頭到葉片表面距離為10 cm;將每個(gè)樣點(diǎn)6片葉片平鋪在黑色吸光布上,葉片平鋪面積約為 80 cm2,使其完全覆蓋光譜視場(chǎng)范圍。每次采集光譜前,用白板(反射率近似 100%)對(duì)光譜儀進(jìn)行優(yōu)化和標(biāo)定。每個(gè)樣本保存 10條光譜曲線,對(duì)其進(jìn)行算術(shù)平均后得到該樣本的葉片原始光譜。每條光譜去除噪聲較大的邊緣波段(350~399 nm,1 001~1 075 nm),保留400~1 000 nm。采用Savitzky-Golay平滑對(duì)全部光譜數(shù)據(jù)進(jìn)行預(yù)處理,降低因試驗(yàn)環(huán)境和儀器本身而產(chǎn)生的噪音。
表1 各數(shù)據(jù)集SPAD值的描述性統(tǒng)計(jì)Table 1 Statistical characteristics of SPAD value
IRIV算法利用變量的隨機(jī)組合并充分考慮變量間的相互作用,在二進(jìn)制矩陣重排過(guò)濾器的基礎(chǔ)上,將所有變量生成隨機(jī)組合的二進(jìn)制矩陣(行為變量的隨機(jī)組合,列為變量數(shù)),基于矩陣每一行(即變量的隨機(jī)組合)分別建立偏最小二乘模型,利用交叉驗(yàn)證均方根誤差(RMSECV)評(píng)估不同隨機(jī)變量組合模型效果?;谀P图悍治龇椒?,逐個(gè)波長(zhǎng)變量計(jì)算包含和不包含該變量時(shí)的 RMSECV平均值,得到兩者之差 DMEAN(difference of mean values)和非參數(shù)檢驗(yàn)方法曼-惠特尼U檢驗(yàn)的P值,確定該變量的重要性(表2)[12],每一次迭代后都會(huì)產(chǎn)生不同的DMEAN和P值,均保留強(qiáng)信息波長(zhǎng)變量和弱信息波長(zhǎng)變量,經(jīng)多次迭代循環(huán)直至消除無(wú)信息波長(zhǎng)變量和干擾信息波長(zhǎng)變量,最后進(jìn)行反向消除獲得最優(yōu)特征波長(zhǎng)變量[16]。本文定義分布于可見(jiàn)光波段的波長(zhǎng)變量為“可見(jiàn)光變量”,分布于近紅外波段的波長(zhǎng)變量為“近紅外變量”。
表2 變量分類(lèi)規(guī)則[12]Table 2 Variable classification rules
本文分別采用線性和非線性建模方法,定量描述葉片SPAD值與特征波長(zhǎng)變量之間關(guān)系,建立SPAD估測(cè)模型。其中,線性建模方法為偏最小二乘法(partial least squares regression,PLSR),其借鑒了多元線性回歸分析、典型相關(guān)分析和主成分分析的思想,在提取主成分減少光譜維數(shù)的同時(shí)考慮了目標(biāo)變量的作用,可以較好地解決樣本數(shù)量小于波長(zhǎng)數(shù)量的問(wèn)題,以及自變量之間存在多重相關(guān)性的問(wèn)題[17];非線性建模方法為支持向量機(jī)(support vector machine,SVM),其能較好地解決自變量與因變量之間的非線性復(fù)雜關(guān)系,將非線性不可分的問(wèn)題在高維空間(超平面)中轉(zhuǎn)化為線性可分,具體處理過(guò)程可概括為升維和線性化[18]。本文采用 RBF核函數(shù)[19],利用網(wǎng)格參數(shù)尋優(yōu)確定SVM建模的最佳懲罰參數(shù)C和核參數(shù)g。
利用3個(gè)參數(shù)即決定系數(shù)(R2)、均方根誤差(RMSE)、相對(duì)分析誤差(RPD)檢驗(yàn)SPAD估測(cè)模型性能。其中,R2值越接近于1,表明模型的穩(wěn)定性及擬合度越高;RMSE值越接近于 0,表明模型預(yù)測(cè)能力越強(qiáng);RPD值是計(jì)算樣本標(biāo)準(zhǔn)差與均方根誤差比值得到,若 RPD<1.4,模型對(duì)樣本無(wú)法實(shí)施預(yù)測(cè),1.4≤RPD<1.8,模型可對(duì)樣本進(jìn)行粗略評(píng)估,1.8≤RPD<2.0,模型可對(duì)樣本進(jìn)行較好的評(píng)估,RPD≥2,模型可對(duì)樣本進(jìn)行極好的預(yù)測(cè)[20]。
將建模集樣本的 SPAD值由高至低排序,選取四分位樣本,分析其原始光譜反射率曲線(圖1)。結(jié)果表明,4個(gè)樣本的反射率曲線整體形態(tài)具有較高的相似性,可見(jiàn)光波段范圍內(nèi),500~600 nm為高反射區(qū),在550 nm附近出現(xiàn)一個(gè)波峰,400~500與600~700 nm為2個(gè)低反射區(qū),從700到760 nm反射率呈陡增趨勢(shì);近紅外波段范圍內(nèi),760~1 000 nm為強(qiáng)反射區(qū),曲線接近水平。另外,4個(gè)樣本的反射率曲線在局部存在反射率相差低于0.1的微弱差異,在高反射區(qū)(500~600 nm),隨SPAD值升高,反射率呈現(xiàn)逐漸降低單調(diào)變化的規(guī)律;在強(qiáng)反射區(qū)(760~1 000 nm),隨SPAD值升高,反射率未出現(xiàn)單調(diào)變化的規(guī)律。
圖1 大豆葉片原始光譜反射率Fig. 1 Spectral reflectance curve of soybean leaves
逐個(gè)計(jì)算葉片 SPAD值與各波長(zhǎng)變量的相關(guān)系數(shù),得到全波段的相關(guān)系數(shù)曲線(圖 2)。結(jié)果表明,可見(jiàn)光波段 SPAD與光譜變量為負(fù)相關(guān),相關(guān)系數(shù)曲線在 550和710 nm附近出現(xiàn)2個(gè)明顯的低谷,谷底對(duì)應(yīng)的相關(guān)系數(shù)分別為-0.70和-0.53;近紅外波段SPAD與光譜變量為正相關(guān),從760到1 000 nm相關(guān)系數(shù)平穩(wěn)上升,相關(guān)系數(shù)最大值約為0.2。通過(guò)P=0.01顯著性檢驗(yàn),得到500~650 nm、690~730 nm波段為極顯著負(fù)相關(guān)。
圖2 SPAD值與波長(zhǎng)相關(guān)系數(shù)Fig.2 SPAD value and wavelength correlation coefficients
全波段的波長(zhǎng)變量?jī)蓛芍g的相關(guān)性分析表明(圖3),可見(jiàn)光波段與近紅外波段相對(duì)獨(dú)立,2個(gè)波段之間的變量相關(guān)性較弱,2波段內(nèi)部的變量相關(guān)性較強(qiáng);可見(jiàn)光波段內(nèi)部,在500 nm附近的波長(zhǎng)變量與其他波長(zhǎng)變量具有較高的相關(guān)性;近紅外波段內(nèi)部,800 nm之后的變量之間的相關(guān)系數(shù)絕對(duì)值(R)均高于 0.8,說(shuō)明波長(zhǎng)變量之間相關(guān)程度高,存在較嚴(yán)重的相互干擾,近紅外部分的光譜數(shù)據(jù)存在較大冗余。
圖3 波長(zhǎng)變量二維相關(guān)系數(shù)Fig. 3 Two-dimensional correlation coefficient of wavelength variable
本文確定IRIV算法的交叉驗(yàn)證次數(shù)為5,最大主成分?jǐn)?shù)為10[12]。隨著迭代次數(shù)的增加,保留變量數(shù)隨之降低,下降趨勢(shì)逐漸平緩(圖4a)。在本研究中迭代次數(shù)為5次,之后為反向消除。限于篇幅,僅展示第5次迭代所保留的16個(gè)波長(zhǎng)變量的DMEAN和P值(圖4b),結(jié)合表2的規(guī)則,可劃分變量類(lèi)型。
IRIV算法經(jīng)過(guò)數(shù)輪迭代分析后,從全部601個(gè)光譜波長(zhǎng)變量中篩選出強(qiáng)信息波長(zhǎng)變量 6個(gè)和弱信息波長(zhǎng)變量10個(gè)。其中,強(qiáng)信息波長(zhǎng)變量全部為可見(jiàn)光變量,分別是540、541、544、545、568、569 nm;弱信息波長(zhǎng)變量包括7個(gè)可見(jiàn)光變量(542、549、550、556、557、558、559 nm),3個(gè)近紅外變量(813、814、815 nm)。通過(guò)反向消除從強(qiáng)信息波長(zhǎng)變量和弱信息波長(zhǎng)變量中篩選了 9個(gè)(包含5個(gè)強(qiáng)信息波長(zhǎng)變量和4個(gè)弱信息波長(zhǎng)變量)與 SPAD值相關(guān)的最優(yōu)特征波長(zhǎng)變量,其中,可見(jiàn)光變量 8 個(gè):540、541、544、545、549、550、556、568 nm;近紅外變量1個(gè):814 nm。
經(jīng)IRIV篩選出的波長(zhǎng)中(540,541 nm)、(544,545 nm)、(549,550 nm)兩兩之間鄰近,通過(guò)P=0.01顯著性檢驗(yàn),存在極顯著相關(guān)性(相關(guān)系數(shù)均大于 0.9)。因此,嘗試去除相鄰的與SPAD相關(guān)系數(shù)低的波長(zhǎng)(541、544、549 nm),保留6個(gè)波長(zhǎng)(記為IRIV-C):540、545、550、556、568、814 nm。
圖4 IRIV迭代過(guò)程及波長(zhǎng)類(lèi)型判定參數(shù)值Fig.4 IRIV iterative process and wavelength type decision parameter values
對(duì)比SPAD線性和非線性估測(cè)模型結(jié)果(表3),基于非線性SVM模型的擬合效果整體上要優(yōu)于線性PLSR模型,IRIV-SVM 模型效果最好,其建模集和驗(yàn)證集R2分別達(dá)到0.80、0.73,RPD達(dá)到1.82,表明IRIV-SVM模型可以較好地估測(cè)SPAD值,SPAD值與反射率之間的關(guān)系更趨于非線性關(guān)系。
基于不同自變量的模型效果存在差異,全波段變量(full spectral variables,F(xiàn)ULL)模型估測(cè)效果整體要優(yōu)于強(qiáng)信息波長(zhǎng)變量(strongly informative variables,SV)模型,表明僅利用SV會(huì)損失模型精度,模型估測(cè)效果不佳。經(jīng)IRIV方法篩選后的特征波長(zhǎng)變量建立的模型估測(cè)效果優(yōu)于未篩選的FULL模型和SV模型,表明IRIV具有較強(qiáng)篩選能力,加入弱信息波長(zhǎng)變量對(duì)于提升模型精度有明顯效果;易被忽視的弱信息波長(zhǎng)變量中存在葉綠素相關(guān)信息,對(duì)于估測(cè)模型精度提升有重要的作用。IRIV-C模型估測(cè)效果整體優(yōu)于FULL與SV模型,與IRIV模型效果相當(dāng),表明在IRIV基礎(chǔ)上去除自相關(guān)性較高的波段,在保持模型精度的同時(shí)有利于進(jìn)一步減少冗余。
表3 SPAD值估測(cè)模型的建模集和驗(yàn)證集結(jié)果Table 3 Calibration and validation results of estimation models for SPAD value
由全波段變量和特征波長(zhǎng)變量模型驗(yàn)證集1∶1線圖(圖5)可以看出,相比全波段模型,基于IRIV的特征波長(zhǎng)模型的實(shí)測(cè)值和估測(cè)值均勻分布在1∶1線附近,模型精度更高,可以更精確地估測(cè)SPAD值。由此表明,IRIV變量篩選方法可以準(zhǔn)確提取被掩蓋的葉綠素特征波段,有效降低建模的波長(zhǎng)變量數(shù),簡(jiǎn)化模型結(jié)構(gòu);與常規(guī)建模方法相比,估測(cè)能力有較大提升。
圖5 SPAD實(shí)測(cè)值與估測(cè)值比較Fig.5 Comparation of measured and predictive value SPAD
本研究表明葉片光譜在可見(jiàn)光處吸光強(qiáng)烈,反射率整體較低且波動(dòng)劇烈,與葉綠素呈顯著負(fù)相關(guān)關(guān)系;而在近紅外區(qū)域反射率較高且平穩(wěn),與葉綠素相關(guān)性較弱,這與王曉星等[21]研究結(jié)果一致。在可見(jiàn)光波段,反射率主要受葉片色素影響,綠光波段是強(qiáng)反射區(qū),而藍(lán)、紅光波段的光輻射被葉片中的葉綠素全部吸收而形成 2個(gè)低反射區(qū)域。受細(xì)胞結(jié)構(gòu)及葉片含水率的影響,在近紅外波段葉綠素與光譜反射率相關(guān)性程度較低[22],其光譜反射率高則由于葉肉內(nèi)的海綿組織結(jié)構(gòu)內(nèi)有很大反射表面的空腔,且細(xì)胞內(nèi)的葉綠素呈水溶膠狀態(tài),具有強(qiáng)烈的紅外反射[21]?;谏鲜鋈~片光譜機(jī)理,SPAD 502葉綠素儀利用650 nm(強(qiáng)吸收區(qū))、940 nm(強(qiáng)反射區(qū))2個(gè)波長(zhǎng)測(cè)定SPAD值,可準(zhǔn)確表征葉綠素含量[3]。為實(shí)現(xiàn)大范圍葉綠素監(jiān)測(cè),挖掘葉綠素特征波長(zhǎng)信息,學(xué)者們利用高光譜技術(shù)估測(cè)植物葉片 SPAD值,劉京等[22]建立了蘋(píng)果葉片SPAD值高光譜估測(cè)模型,建模集和預(yù)測(cè)集R2分別為0.74、0.89;殷紫等[23]基于高光譜技術(shù)對(duì)不同生育期油菜葉片建立SPAD值反演模型,預(yù)測(cè)模型R2最高為0.70;楊榮超等[4]基于高光譜對(duì)甜菜SPAD值進(jìn)行估測(cè),其模型R2為0.57。前人研究表明高光譜可以較好地估測(cè)SPAD,有利于將來(lái)大范圍監(jiān)測(cè),但估測(cè)精度存在明顯差異,需要解決測(cè)試環(huán)境、儀器、波長(zhǎng)變量自相關(guān)等因素影響,以進(jìn)一步提高估測(cè)精度。
近紅外光譜波段間存在嚴(yán)重自相關(guān)性(圖 3),導(dǎo)致近紅外波長(zhǎng)變量與 SPAD值的相關(guān)性較弱,而傳統(tǒng)的基于光譜特征參數(shù)估測(cè)葉綠素未充分考慮這一特性,忽略了近紅外波段信息[24-26]。王福民等[27]基于水稻光譜研究發(fā)現(xiàn),可見(jiàn)光波段與近紅外波段存在大量冗余信息,經(jīng)信息提取,特征波長(zhǎng)在可見(jiàn)光與近紅外波段均有分布。王強(qiáng)等[28]基于全波段組合指數(shù)構(gòu)建葉綠素密度估測(cè)模型,結(jié)果表明近紅外波長(zhǎng)1 055 nm與可見(jiàn)光波長(zhǎng)684 nm的比值歸一化指數(shù)效果最佳。由此說(shuō)明,在近紅外波段存在與葉綠素相關(guān)的有用波長(zhǎng)變量。采用變量篩選方法可以最大限度地提取因受外部因素影響而相關(guān)性較弱的葉綠素特征波段,有效地壓縮波長(zhǎng)變量數(shù)并簡(jiǎn)化模型結(jié)構(gòu)[29],本研究表明,通過(guò)加入弱信息波長(zhǎng)變量可提升模型預(yù)測(cè)精度。然而,UVE、CARS等變量篩選方法易忽視弱信息波長(zhǎng)變量的作用,IRIV方法注重波長(zhǎng)變量間的聯(lián)合效應(yīng),考慮弱信息波長(zhǎng)變量作用[13],經(jīng)過(guò)數(shù)輪迭代分析,篩選出包含葉綠素信息的特征波長(zhǎng)變量。Yun等[12,16]先后比較了IRIV、CARS、UVE、GA等多種變量篩選方法,結(jié)果表明IRIV算法表現(xiàn)最優(yōu),可有效濾除大部分冗余及共線性信息變量。
在本研究中,經(jīng)IRIV方法篩選出的特征波長(zhǎng)變量集中在540~560 nm,由圖2可知,該波段波長(zhǎng)與SPAD值具有極強(qiáng)的相關(guān)性。劉燕德等[11]基于高光譜的GA和SPA算法對(duì)贛南臍橙葉片SPAD值定量反演,GA和SPA挑選的敏感波長(zhǎng)分別集中在 550~720 nm、520~800 nm,2種算法挑選范圍基本吻合,都是葉綠素信息區(qū)域波段,含有葉綠素吸收峰。然而,所篩選的波長(zhǎng)兩兩鄰近存在較高的相關(guān)性,IRIV方法無(wú)法完全消除數(shù)據(jù)間的自相關(guān)性,嘗試基于波長(zhǎng)與 SPAD值相關(guān)系數(shù),去除相鄰的較低相關(guān)系數(shù)波長(zhǎng)。結(jié)果表明該方法在保持模型精度的基礎(chǔ)上有利于進(jìn)一步減少冗余,簡(jiǎn)化模型結(jié)構(gòu)。
本研究通過(guò)篩選特征波長(zhǎng)變量結(jié)合線性和非線性模型估測(cè)大豆葉綠素含量,取得了較好的估測(cè)結(jié)果。但如何改進(jìn)篩選方法以降低特征波長(zhǎng)變量的自相關(guān)性,如何將本研究應(yīng)用于大豆全生育期及其他種類(lèi)作物以進(jìn)一步提升模型魯棒性,今后需要著重探討研究。
本研究利用室內(nèi)大豆葉片光譜數(shù)據(jù),基于IRIV算法篩選大豆葉片的光譜特征波長(zhǎng)變量,建立估測(cè)能力較高的 SPAD值估測(cè)模型,為利用高光譜估測(cè)植物生理參數(shù)提供了一種新的方法和途徑。主要結(jié)論如下:
1)大豆葉片SPAD值在可見(jiàn)光波段與光譜波長(zhǎng)變量相關(guān)性較強(qiáng),尤其在500~650 nm、690~730 nm波段與光譜波長(zhǎng)變量為極顯著負(fù)相關(guān),在近紅外波段與光譜波長(zhǎng)變量為不顯著正相關(guān)(P>0.01);
2)大豆葉片可見(jiàn)光波長(zhǎng)變量與近紅外波長(zhǎng)變量之間相關(guān)性較弱,而 2波段內(nèi)部變量相關(guān)性較高,尤其近紅外波段變量共線問(wèn)題突出;
3)基于IRIV算法確定了9個(gè)大豆葉綠素的特征波長(zhǎng)變量,其中,在可見(jiàn)光波段篩選 5個(gè)強(qiáng)信息變量和 3個(gè)弱信息變量,在近紅外波段篩選弱信息變量1個(gè);
4)SVM模型估測(cè)效果要優(yōu)于PLSR模型,PLSR模型驗(yàn)證集R2最高為0.52,SVM模型驗(yàn)證集R2均高于0.59,SPAD值與反射率之間趨于非線性關(guān)系;
5)IRIV算法可以有效地確定大豆葉片SPAD值的特征波長(zhǎng)變量,基于IRIV特征波長(zhǎng)變量模型估測(cè)能力優(yōu)于基于全波段模型和強(qiáng)信息波長(zhǎng)變量模型,其中IRIV-SVM表現(xiàn)最優(yōu),驗(yàn)證集R2為0.73,RPD為1.82,說(shuō)明IRIV變量篩選方法的有效性及弱信息變量的重要性。
[1]Merzlyak M, Gitelson A, Chivkunova O, et al. Nondestructive optical detection of pigment changes during leaf senescence and fruit ripening[J]. Physiologia Plantarum,1999, 106(1): 135-141.
[2]楊杰,田永超,姚霞,等. 水稻上部葉片葉綠素含量的高光譜估算模型[J]. 生態(tài)學(xué)報(bào),2009,29(12):6561-6571.Yang Jie, Tian Yongchao, Yao Xia, et al. Hyperspectral estimation model for chlorophyll concentrations in top leaves of rice[J]. Acta Ecologica Sinica, 2009, 29(12): 6561-6571.(in Chinese with English abstract)
[3]程志慶,張勁松,孟平,等. 楊樹(shù)葉片葉綠素含量高光譜估算模型研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(8):264-271.Cheng Zhiqing, Zhang Jingsong, Meng Ping, et al.Hyperspectral estimation model of chlorophyll content in poplar leaves[J]. Transactions of the Chinese Society for Agricultural Machinery, 2015, 46(8): 264-271. (in Chinese with English abstract)
[4]楊榮超,田海清,李斐,等. 基于冠層高光譜的甜菜不同生育時(shí)期SPAD值估測(cè)研究[J]. 干旱區(qū)資源與環(huán)境,2017,31(7):50-54.Yang Rongchao, Tian Haiqing, Li Fei, et al. Research on the SPAD values at different growth stages of sugar beet based on canopy hyperspectrum[J]. Journal of Arid Land Resources and Environment, 2017, 31(7): 50-54. (in Chinese with English abstract)
[5]Vohland M, Ludwig M, Thiele-Bruhn S, et al. Determination of soil properties with visible to near- and mid-infrared spectroscopy: Effects of spectral variable selection[J].Geoderma, 2014, s 223–225(1): 88-96.
[6]Zou Xiaobo, Zhao Jiewen, Povey M. J, et al. Variables selection methods in near-infrared spectroscopy[J]. Analytica Chimica Acta, 2010, 667(1/2): 14.
[7]Guyon, Isabelle, Elisseeff, et al. An introduction to variable and feature selection[J]. Journal of Machine Learning Research, 2003, 3(6): 1157-1182.
[8]朱亞星,于雷,洪永勝,等. 土壤有機(jī)質(zhì)高光譜特征與波長(zhǎng)變量?jī)?yōu)選方法[J]. 中國(guó)農(nóng)業(yè)科學(xué),2017,50(22):4325-4337.Zhu Yaxing, Yu Lei, Hong Yongsheng, et al. Hyperspectral features and wavelength variables selection methods of soil organic matter[J]. Scientia Agricultura Sinica, 2017, 50(22):4325-4337. (in Chinese with English abstract)
[9]Sun Ye, Wang Yihang, Xiao Hui, et al. Hyperspectral imaging detection of decayed honey peaches based on their chlorophyll content [J]. Food Chemistry, 2017, 235: 194.
[10]Xu Shengxiang, Zhao Yongcun, Wang Meiyan, et al.Determination of rice root density from Vis–NIR spectroscopy by support vector machine regression and spectral variable selection techniques[J]. Catena, 2017, 157:12-23.
[11]劉燕德,張光偉,蔡麗君. 基于高光譜的GA和SPA算法對(duì)贛南臍橙葉綠素定量分析[J]. 光譜學(xué)與光譜分析,2012,32(12):3377-3380.Liu Yande, Zhang Guangwei, Cai Lijun. Analysis of chlorophyll in gannan navel orange with algorithm of ga and spa based on hyperspectral[J]. Spectroscopy and Spectral Analysis, 2012, 32(12): 3377-3380. (in Chinese with English abstract)
[12]Yun Yonghuan, Wang Weiting, Tan Minli, et al. A strategy that iteratively retains informative variables for selecting optimal variable subset in multivariate calibration[J].Analytica Chimica Acta, 2014, 807(1): 36.
[13]Díaz-Uriarte R, Andrés S A D. Gene selection and classification of microarray data using random forest. [J].Bmc Bioinformatics, 2006, 7(1): 3.
[14]Terra F S, Demattê J A M, Rossel R A V. Spectral libraries for quantitative analyses of tropical Brazilian soils:Comparing vis–NIR and mid-IR reflectance data[J].Geoderma, 2015, s 255–256: 81-93.
[15]劉偉,趙眾,袁洪福,等. 光譜多元分析校正集和驗(yàn)證集樣本分布優(yōu)選方法研究[J]. 光譜學(xué)與光譜分析,2014(4):947-951.Liu Wei, Zhao Zhong, Yuan Hongfu, et al. An optimal selection method of samples of calibration set and validation set for spectral multivariate analysis[J]. 2014(4): 947-951.(in Chinese with English abstract)
[16]張航,劉國(guó)海,江輝,等. 基于近紅外光譜技術(shù)的乙醇固態(tài)發(fā)酵過(guò)程參數(shù)定量檢測(cè)[J]. 激光與光電子學(xué)進(jìn)展,2017(2):314-320.Zhang Hang, Liu Guohai, Jiang Hui, et al. Quantitative detection of ethanol solid-state fermentation process parameters based on nearinfrared spectroscopy [J]. Laser &Optoelectronics Progress, 2017(2): 314-320. (in Chinese with English abstract)
[17]彭小婷,高文秀,王俊杰. 基于包絡(luò)線去除和偏最小二乘的土壤參數(shù)光譜反演[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2014,39(7):862-866.Peng Xiaoting, Gao Wenxiu, Wang Junjie. Inversion of soil parameters from hyperspectra based on continuum removal and partial least squares regression[J]. Geomatics and Information Science of Wuhan University, 2014, 39(7):862-866. (in Chinese with English abstract)
[18]史舟. 土壤地面高光譜遙感原理與方法[M]. 北京:科學(xué)出版社,2014.
[19]奉國(guó)和. SVM分類(lèi)核函數(shù)及參數(shù)選擇比較[J]. 計(jì)算機(jī)工程與應(yīng)用,2011,47(3):123-124.Feng Guohe. Parameter optimizing for support vector machines classification[J]. Computer Engineering and Applications, 2011, 47(3): 123-124. (in Chinese with English abstract)
[20]Rossel R A V, Mcglynn R N, Mcbratney A B. Determining the composition of mineral-organic mixes using UV–vis–NIR diffuse reflectance spectroscopy[J]. Geoderma, 2006,137(1/2): 70-82.
[21]王曉星,常慶瑞,劉夢(mèng)云,等. 冬小麥冠層水平葉綠素含量的高光譜估測(cè)[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,44(2):48-54.Wang Xiaoxing, Chang Qingrui, Liu Mengyun, et al.Hyper-spectral estimation of chlorophyll content in canopy of winter wheat[J]. Journal of Northwest A & F University(Natural Science Edition), 2016, 44(2): 48-54. (in Chinese with English abstract)
[22]劉京,常慶瑞,劉淼,等. 基于SVR算法的蘋(píng)果葉片葉綠素含量高光譜反演[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2016,47(8):260-265.Liu Jing, Chang Qingrui, Liu Miao, et al. Chlorophyll content inversion with hyperspectral technology for apple leaves based on support vector regression algorithm[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016,47(8): 260-265. (in Chinese with English abstract)
[23]殷紫,常慶瑞,劉淼,等. 基于光譜指數(shù)的不同生育期油菜葉片 SPAD估測(cè)[J]. 西北農(nóng)林科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2017(5):66-72.Yin Zi, Chang Qingrui, Liu Miao, et al. Estimation of rape leaf SPAD in different periods based on spectral indices[J].2017(5): 66-72. (in Chinese with English abstract)
[24]徐道青,劉小玲,王維,等. 淹水脅迫下棉花葉片高光譜特征及葉綠素含量估算模型[J]. 應(yīng)用生態(tài)學(xué)報(bào),2017,28(10):3289-3296.Xu Daoqing, Liu Xiaoling, Wang Wei, et al. Hyper-spectral characteristics and estimation model of leaf chlorophyll content in cotton under waterlogging stress[J]. Chinese Journal of Applied Ecology, 2017, 28(10): 3289-3296. (in Chinese with English abstract)
[25]劉文雅,潘潔. 基于神經(jīng)網(wǎng)絡(luò)的馬尾松葉綠素含量高光譜估算模型[J]. 應(yīng)用生態(tài)學(xué)報(bào),2017,28(4):1128-1136.Liu Wenya, Pan Jie. A hyperspectral assessment model for leaf chlorophyll content of Pinus massoniana based on neural network[J]. Chinese Journal of Applied Ecology, 2017, 28(4):1128-1136. (in Chinese with English abstract)
[26]馮偉,王曉宇,宋曉,等. 白粉病脅迫下小麥冠層葉綠素密度的高光譜估測(cè)[J]. 農(nóng)業(yè)工程學(xué)報(bào),2013,29(13):114-123.Feng Wei, Wang Xiaoyu, Song Xiao, et al. Hyperspectral estimation of canopy chlorophyll density in winter wheat under stress of powdery mildew[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2013, 29(13): 114-123. (in Chinese with English abstract)
[27]王福民,黃敬峰,徐俊鋒,等. 基于光譜波段自相關(guān)的水稻信息提取波段選擇[J]. 光譜學(xué)與光譜分析,2008,28(5):1098-1101.Wang Fumin, Huang Jingfeng, Xu Junfeng, et al. Wavebands selection for rice information extraction based on spectral bands inter-correlation [J]. Spectroscopy and Spectral Analysis, 2008, 28(5): 1098-1101. (in Chinese with English abstract)
[28]王強(qiáng),易秋香,包安明,等. 基于高光譜反射率的棉花冠層葉綠素密度估算[J]. 農(nóng)業(yè)工程學(xué)報(bào), 2012,28(15):125-132.Wang Qiang, Yi Qiuxiang, Bao Anming, et al. Estimating chlorophyll density of cotton canopy by hyperspectral reflectance [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012,28(15): 125-132. (in Chinese with English abstract)
[29]于雷,洪永勝,周勇,等. 高光譜估算土壤有機(jī)質(zhì)含量的波長(zhǎng)變量篩選方法[J]. 農(nóng)業(yè)工程學(xué)報(bào),2016,32(13):95-102.Yu Lei, Hong Yongsheng, Zhou Yong, et al. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique[J]. Transactions of the Chinese Society of Agricultural Engineering(Transactions of the CSAE), 2016, 32(13): 95-102. (in Chinese with English abstract)