李勝男,曹萌萌,李盛楠,董姝含,劉煥軍
(東北農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,黑龍江哈爾濱150030)
黑土典型區(qū)有機(jī)質(zhì)高光譜預(yù)測模型
李勝男,曹萌萌,李盛楠,董姝含,劉煥軍*
(東北農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,黑龍江哈爾濱150030)
土壤有機(jī)質(zhì)(SOM)是鑒別土壤肥力的重要指標(biāo),是土壤肥力的物質(zhì)基礎(chǔ),其含量預(yù)測模型研究對于土壤肥力評價(jià)、土壤碳庫估算、土壤資源利用與保護(hù)具有重要意義。該文以黑龍江省黑土帶典型區(qū)為例,采集區(qū)域土壤樣本,基于有機(jī)質(zhì)含量與土壤反射率的定量關(guān)系,對光譜反射率進(jìn)行一階微分和倒對數(shù)的處理,建立偏最小二乘法模型(PLSR)、一元線性回歸模型和多元線性逐步回歸模型。結(jié)果表明:(1)土壤有機(jī)質(zhì)敏感波段位于650-750nm。(2)通過比較建模樣本與檢驗(yàn)樣本的決定系數(shù)(R2)和均方根誤差(RMSE)的大小,得到反射率和倒對數(shù)處理后的數(shù)據(jù)最優(yōu)模型都為PLSR模型,一階微分處理后的最優(yōu)模型為多元線性逐步回歸模型。(3)PLSR模型的建模效果優(yōu)于回歸模型,但其預(yù)測效果卻并不理想。該研究將為改進(jìn)土壤理化參數(shù)、遙感反演、土地質(zhì)量評價(jià)等工作方法提供理論與技術(shù)支持。
黑土;有機(jī)質(zhì);遙感;高光譜;預(yù)測模型
土壤有機(jī)質(zhì)(soil organicmatter,SOM)是反映土壤肥力的重要物質(zhì),高光譜技術(shù)為土壤評價(jià)與理化性狀的監(jiān)測提供了強(qiáng)有力的工具,為定量化監(jiān)測土壤有機(jī)質(zhì)含量提供了可能。目前,高光譜技術(shù)不僅廣泛應(yīng)用在土壤有機(jī)質(zhì)理化指標(biāo)的定量反演中,而且也為土壤分類提供了重要依據(jù)。
傳統(tǒng)的土壤養(yǎng)分化學(xué)測定方法是基于點(diǎn)測量的,且測點(diǎn)稀少、速度慢、范圍有限,已不能滿足現(xiàn)代農(nóng)業(yè)發(fā)展的需要,而高光譜遙感憑借其極高的光譜分辨率,具備獲取土壤化學(xué)組分的潛力,為土壤有機(jī)質(zhì)含量的精細(xì)診斷提供技術(shù)支持。土壤有機(jī)質(zhì)與土壤有機(jī)碳存在定量關(guān)系,土壤有機(jī)質(zhì)的遙感監(jiān)測將有助于提高土壤有機(jī)碳庫儲量的估算。土壤有機(jī)質(zhì)在可見光和近紅外波段有獨(dú)特的光譜特性。土壤光譜反射率與SOM含量呈顯著負(fù)相關(guān),SOM含量可以從土壤反射光譜中得到一定程度的反映[1,2]。利用土壤高光譜反射率及其數(shù)學(xué)變化可以進(jìn)行有機(jī)質(zhì)含量的速測。
近年來,國內(nèi)外學(xué)者在利用土壤的反射光譜估算其有機(jī)質(zhì)含量方面已經(jīng)進(jìn)行了卓有成效的研究。Galvao等分析了AVIRIS數(shù)據(jù)和巴西3個(gè)主要土壤類型樣品的成分(有機(jī)質(zhì)、Fe、TiO2、Al2O3和SiO2)之間的關(guān)系,發(fā)現(xiàn)不同土壤類型的光譜變化和土壤組成之間具有很好的一致性[3]。
東北黑土區(qū)作物生長一年一季,裸土?xí)r間長,且保護(hù)性耕作少,秸稈覆蓋影響小,容易獲取土壤野外高光譜反射率與遙感影像,適于土壤遙感研究。因此,本研究獲取黑龍江典型黑土,利用統(tǒng)計(jì)分析方法建立土壤有機(jī)質(zhì)遙感反演模型,聯(lián)系土壤有機(jī)質(zhì)和光譜反射率的關(guān)系,得出最優(yōu)模型。揭示黑土典型區(qū)土壤有機(jī)質(zhì)空間分布規(guī)律。
1.1土樣采集與處理
采集土壤樣品均為0-20cm的表層土壤。2015.5.22-2015.05.27,在作物播種后、出苗前,沿縣級以上公路,在黑龍江省典型黑土區(qū)(北安市南部、海倫市中部、綏化市東部、綏棱縣西南部、望奎縣中部)采集了133個(gè)土樣;同時(shí)利用GPS記錄樣點(diǎn)的經(jīng)緯度,并獲取樣點(diǎn)的數(shù)碼相片、前茬作物類型、田塊的大小、天氣狀況、采樣點(diǎn)周邊環(huán)境等。土壤樣本經(jīng)風(fēng)干、研磨并通過2mm孔篩,采用四分法分成兩份,分別供化學(xué)分析和光譜測試用[4]。采用重鉻酸鉀容量法—外加熱法分析有機(jī)質(zhì)含量。在加熱條件下,用過量的重鉻酸鉀—硫酸溶液氧化土壤有機(jī)碳,多余的重鉻酸鉀用硫酸亞鐵銨標(biāo)準(zhǔn)溶液滴定,以樣品和空白消耗重鉻酸鉀的差值計(jì)算出有機(jī)碳量,室內(nèi)測定土樣有機(jī)質(zhì)含量如表1。
1.2反射光譜測量
采用ASD Field Spec Pro地物光譜儀測量土壤樣品的反射光譜數(shù)據(jù)。該光譜儀波長范圍為350-2500 nm,采樣間隔為5nm(360-2500nm),重采樣間隔也為5nm,輸出波段數(shù)為428。光源為儀器配套的功率為1000W的鹵素?zé)?,探頭視場角為5°。操作過程在四周黑暗的實(shí)驗(yàn)室進(jìn)行,光源照射方向與垂直方向夾角30°。探頭到土樣表面距離15cm,把適量經(jīng)處理的1mm土壤樣品倒入盛樣皿中。用玻璃稍稍壓實(shí),使其表面盡量平整。每個(gè)樣品旋轉(zhuǎn)3次,每個(gè)角度掃描12次,共36次,求其平均值。
1.3光譜數(shù)據(jù)的平滑處理
光譜曲線的平滑處理是為了去除包含在信號內(nèi)的少量噪聲,得到平穩(wěn)的光譜波形。
本文采用9點(diǎn)加權(quán)移動平均方法對光譜數(shù)據(jù)進(jìn)行平滑處理[5]。由于光譜儀波段間在能量響應(yīng)上的差異,使光譜曲線存在一些噪聲,為得到平穩(wěn)的變化模式,需平滑波形,以去除包含在信號內(nèi)的少量噪聲。如果噪聲的頻率較高,且量值也不大,用平滑方法可在一定程度上降低噪聲。本研究采用Savitzky-Golay多項(xiàng)式平滑去噪處理,光譜曲線給出了N個(gè)測定點(diǎn)的序列{Ri,i=1,2,3,…,N}(本研究中,N=2151)。平滑中,對窗口7個(gè)數(shù)據(jù)點(diǎn)擬合三次多項(xiàng)式,并由所得數(shù)學(xué)模型對平滑的點(diǎn)進(jìn)行計(jì)算。
1.4模型建立與檢驗(yàn)
1.4.1模型的建立
本文共采用93個(gè)建模樣本,40個(gè)檢驗(yàn)樣本,對有機(jī)質(zhì)的含量以及光譜數(shù)據(jù)的一階微分,倒對數(shù)等數(shù)學(xué)變換形式進(jìn)行相關(guān)性分析,建立光譜數(shù)據(jù)不同數(shù)學(xué)變換下與有機(jī)質(zhì)含量的一元線性回歸模型,多元線性逐步回歸模型。同時(shí)采用133個(gè)樣本數(shù)據(jù)交叉驗(yàn)證建立PLSR(最小二乘回歸)模型。
1.4.2模型的檢驗(yàn)
模型的穩(wěn)定性用決定系數(shù)R2檢驗(yàn),R2越大,模型越穩(wěn)定;其計(jì)算公式為:
模型的預(yù)報(bào)能力用建模和驗(yàn)證樣本的總均方根誤差(RMSE)來檢驗(yàn),RMSE越小,模型精度越高、預(yù)測能力越強(qiáng)。其計(jì)算公式如下:
式中yi和i分別為檢驗(yàn)樣本的觀測值和預(yù)測值,n為預(yù)測樣本數(shù)。
表1 樣本有機(jī)質(zhì)統(tǒng)計(jì)量
2.1對黑土光譜特征分析
選取25個(gè)樣本,建立不同有機(jī)質(zhì)含量土壤反射光譜曲線圖,如圖1。以不同波長下的土壤反射率的倒對數(shù)和一階微分處理后的數(shù)據(jù)為因變量,以波長為自變量,建立關(guān)系圖如下圖2。
由圖知,有機(jī)質(zhì)含量不同的土壤反射光譜曲線趨勢相同,大致除1400nm和1900nm兩個(gè)水分吸收峰外,土壤光譜曲線整體表現(xiàn)平緩,在350-1350nm的范圍內(nèi)土壤有機(jī)質(zhì)的反射率隨波長的增大而增大,其中在350-850nm范圍內(nèi)曲線斜率逐漸增大,在850-1350nm范圍內(nèi)曲線斜率逐漸減小。
圖2為其一階微分和倒對數(shù)處理光譜反射率與波長圖,表明經(jīng)一階微分變換后,在580nm、1350nm、1900nm附近分別出現(xiàn)了不同的正負(fù)峰值,可見一階導(dǎo)數(shù)較有利于顯現(xiàn)原始譜圖中的肩峰。同時(shí),經(jīng)倒對數(shù)處理后,在400nm-650nm波段附近出現(xiàn)了波峰波谷交替出現(xiàn)的現(xiàn)象,在1350nm,1850nm附近也出現(xiàn)了正負(fù)峰值,綜上所述,對土壤反射率進(jìn)行一階微分處理和倒對數(shù)處理,都有利于顯現(xiàn)原始譜圖中的肩峰,對后續(xù)的一元建模波段選取具有指導(dǎo)意義。
2.2一元線性回歸模型
以土壤有機(jī)質(zhì)含量為因變量,以光譜數(shù)據(jù)的數(shù)學(xué)變換為自變量,通過兩者相關(guān)性分析,分別確定出不同變換形式下的光譜響應(yīng)程度大的范圍,在此基礎(chǔ)上建立各自的一元回歸模型和對光譜數(shù)據(jù)進(jìn)行數(shù)學(xué)變換后建立的一元模型,相關(guān)特征如下表2。
由表知,反射率及其各種形式變換后與有機(jī)質(zhì)含量的相關(guān)系數(shù)的絕對值的差別并不大,從建模樣本看,一介微分形式的決定系數(shù)最大,均方根誤差最小,可見三種變換形式中一介微分形式變換后其建模效果最好,且由表中可以發(fā)現(xiàn),與有機(jī)質(zhì)相關(guān)系數(shù)絕對值大的,其建模效果也好。
圖1 不同有機(jī)質(zhì)含量土壤反射光譜曲線圖
圖2 倒對數(shù)與一階微分處理后的土壤反射率與波長的關(guān)系圖(系列1為倒對數(shù)、系列2為一階微分)
表2 反射率不同變換形式有機(jī)質(zhì)特征波段位置及模型相關(guān)數(shù)據(jù)
從檢驗(yàn)樣本來看,一階微分的預(yù)測效果并不好,三者相比其預(yù)測效果最差,可見建模樣本效果較好的模型并不一定具有較好的預(yù)測的能力,且由表知反射率、倒對數(shù)形式的預(yù)測效果決定系數(shù)的值均大于0.77,均方根誤差的值也都小于0.385,而一階微分的決定系數(shù)小于0.7,均方根誤差卻大于0.55。
2.3多元線性逐步回歸模型
對光譜數(shù)據(jù)進(jìn)行不同變換處理后的三組數(shù)據(jù),以有機(jī)質(zhì)含量為因變量,不同波長對應(yīng)的處理后的數(shù)據(jù)為自變量,將全部變量的方差貢獻(xiàn)值按大小進(jìn)行排列,進(jìn)行多元線性逐步回歸分析,在分析中,選入以及剔除自變量的概率參數(shù)為0.05和0.1,如表3。
由表3可知,建模樣本和預(yù)測樣本R2(log1/R)>R2(R)>R2(R'),而RMSE值則為RMSE(R)>RMSE(R')>RMSE(log1/R),故而,在多元線性逐步回歸模型中,建模效果最好的模型是倒對數(shù)模型,預(yù)測效果最好的也為倒對數(shù)模型。
2.4偏最小二乘回歸模型
建立3種光譜數(shù)據(jù)處理后的土壤樣本建立了全波段的PLSR模型,如圖3。
當(dāng)提取包含更多自變量信息的因子時(shí),它能保證提取因子與因變量之間的最大相關(guān)性,它可以將大量光譜變量壓縮為幾個(gè)主要部分,消除自變量之間的共線性問題。有效提取到對有機(jī)質(zhì)解釋強(qiáng)的綜合變量,排除解釋力弱或無解釋力的信息,從而使它對模型的因變量由最強(qiáng)的解釋能力。本文采用交叉驗(yàn)證的方法進(jìn)行建模,利用R2與RMSE對模型進(jìn)行選擇。下表4即為建模結(jié)果。
由表4知,反射率和倒對數(shù)處理后其建模樣本R2都在0.9以上,RMSE值均小于0.3,其檢驗(yàn)樣本R2都在0.7以上,RMSE值均小于0.5,故而反射率和倒對數(shù)處理后建模效果好,而一階微分處理后建模樣本R2為0.614,RMSE值最大為0.597,且其檢驗(yàn)樣本的R2小于0.5,RMSE值也大于另外兩種處理方式。綜上所述,R和log1/R的模型優(yōu)于R'模型,同時(shí)反射率模型預(yù)測效果優(yōu)于倒對數(shù)處理后的模型,但是建模效果略差于后者。
圖3 PLSR建模圖(A為倒數(shù)對數(shù)微分、B為反射率、C為反射率)
本文建立一元線性回歸、多元線性逐步回歸、偏最小二乘法(PLSR)模型。實(shí)驗(yàn)結(jié)果表明如下。
3.1土壤反射率進(jìn)行一階微分處理和倒對數(shù)處理后,在580nm、1350nm、1900nm附近分別出現(xiàn)了不同峰值,倒對數(shù)處理后出現(xiàn)了波峰波谷交替的現(xiàn)象,說明對土壤反射率進(jìn)行數(shù)學(xué)變換后有利于顯現(xiàn)原始譜圖中的肩峰,對后續(xù)的一元建模波段選取具有指導(dǎo)意義。3.2反射率和倒對數(shù)處理后的數(shù)據(jù)最優(yōu)模型都為PLSR模型,兩者的建模樣本R2均大于0.9,RMSE值均小于0.3,檢驗(yàn)樣本R2均大于0.7,RMSE值均小于0.5。一階微分處理后的最優(yōu)模型為多元線性逐步回歸模型,其建模樣本和檢驗(yàn)樣的R2和RMSE值均優(yōu)于其余兩個(gè)模型。不同的建模方法影響土壤有機(jī)質(zhì)含量高光譜反演的精度。因此,在重視土壤有機(jī)質(zhì)光譜反演機(jī)理研究的同時(shí),加強(qiáng)光譜反演建模方法的研究是必要的。
3.3由研究可得,PLSR模型的建模效果優(yōu)于回歸模型,但其預(yù)測效果卻并不理想,可見PLSR模型具有不穩(wěn)定性。
本研究的結(jié)果是在黑土區(qū)干旱較嚴(yán)重、土壤含水量相對較低的前提下得到的,是否適用于雨后不久、土壤含水量較高的情況,還有待下一步研究解決。另外應(yīng)引入土壤類型、地形、地質(zhì)等因子的空間信息,提高土壤有機(jī)質(zhì)時(shí)空變異規(guī)律研究水平。
表3 有機(jī)質(zhì)含量預(yù)測多元線性逐步回歸模型列表
表4 PLSR模型結(jié)果
[1]Ben-dor E,Banin A.Near-infrared analysis as a rapid method to simultaneous ly evaluate several soil properties[J].Soil Sci.Soc.Am. J.,1995(59):364-372.
[2]Mccarty G W,Reeves J B,Reeves V B,et al.Mid-infrared diffuse reflectance spectroscopy for soil carbonmeasurement[J].Soil Sci.Soc.Am.J.,2002,66(2):640-646.
[3]Galvao LS,Pizarro M A,Epiphanio JC N.Variations in reflectance of tropical soils:spectral-chemical composition relationships from AVIRIS data[J].Remote Sensing of Environment,2001,75(2):245-255.
[4]劉煥軍,趙春江,等.“黑土典型區(qū)土壤有機(jī)質(zhì)遙感反演”農(nóng)業(yè)工程學(xué)報(bào)[J].2011,27(8):211-214.
[5]呂秀琴,艾自興.“地理信息系統(tǒng)課程設(shè)計(jì)”教學(xué)內(nèi)容和模式探討[J].實(shí)驗(yàn)技術(shù)與管理,2012,29(1):165-167.
(2016-07-26收稿劉曉佳編輯)
Hyper spectral prediction model of organic matter in black soil region
LI Sheng-nan et al
(The northeast agricultural college of resources and environment,Harbin 150030,China)
The study on spatial heterogeneity of soil organic matter(SOM)is significantly important to soil fertility evaluation,soil carbon pool estimation,soil resources utilization and protection.Based on Chernomyrdin typical area in Heilongjiang province as an examp le,the soil samples in the area of acquisition,based on the quantitative relationship between organic matter content and soil reflectance,for first order differential spectral reflectance,logarithmic and remove abnormal numerical processing,establish a model of partial least squares(PLSR),a yuan linear regression model and multiple linear regression model. Results show that:(1)the sensitive wavelengths of organic matter in 650-750 nm.(2)by comparing the determination coefficient(R2)and the size of the root mean square error(RMSE),after processing the data of the optimal models for the PLSR model. The results can provide theoretical and technical support for improving RS retrieving of soil physic-chemical parameters,evaluating soil quality and carbon pool.
Black soil;Organic matter;Remote sensing;Comprehensive practice course;Predicting model
S153
A
1003-7853(2016)04-0073-04
李勝男(1995-),女,在讀本科生,研究方向:生態(tài)環(huán)境科學(xué)。
劉煥軍。