陽洋,黃偉濠,盧瑛,李博,歐錦瓊,唐賢,王超,陳勇
(華南農(nóng)業(yè)大學資源環(huán)境學院/農(nóng)業(yè)農(nóng)村部華南耕地保育重點實驗室/廣東省土地利用與整治重點實驗室,廣東廣州510642)
土壤可見?近紅外反射光譜是土壤理化特性光譜行為的綜合,土壤中許多組分在可見?近紅外光譜范圍內(nèi)具有反射與吸收特征,可以用來識別土壤成分[1]。土壤反射光譜法是一種無破壞性、快速、經(jīng)濟的方法,已廣泛應用于土壤礦物、物理、化學和生物學特性的預測[2-3]。土壤游離鐵是成土母質風化、遷移轉化的產(chǎn)物,能夠反映成土過程和成土環(huán)境,是表征土壤發(fā)育程度的指標之一[4]。在中國土壤系統(tǒng)分類中,土壤游離鐵含量是判斷低活性富鐵層、鐵質特性和水耕人為土中鐵聚、鐵滲特征的指標[5]。
近年來,國內(nèi)外學者在利用土壤反射光譜預測鐵氧化含量和礦物類型方面開展了研究。Coleman等[6]認為紅光波段(630~690 nm)和近紅外波段(1 150~1 300 nm)是解釋美國阿拉巴馬州變性土和淋溶土鐵氧化物變異的最重要波段。彭杰等[7]對湖南土壤研究表明,氧化鐵含量對土壤光譜反射率有明顯的影響,利用土壤線性參數(shù)預測氧化鐵含量具有可行性。夏學齊等[8]研究江蘇土壤發(fā)現(xiàn)鐵氧化物含量和類型均可以在土壤反射率光譜或其一階導數(shù)值中找到相關波段,反射光譜方法能夠定量鐵氧化物總量、鑒別針鐵礦和赤鐵礦及相對含量。Summers等[9]報道預測澳大利亞南部土壤鐵氧化物的波段是400~1 100 nm,不同類型和礦物組成的土壤氧化鐵偏最小二乘回歸(Partial least squares regression,PLSR)預測模型需要進行校準。謝碧裕[10]研究江西丘陵地區(qū)水稻土時認為PLSR 模型為土壤氧化鐵含量最優(yōu)估測模型。熊俊峰等[11]利用PLSR 對全反射波段與江蘇東臺市土壤中不同形態(tài)鐵含量進行建模預測,結果表明多元散射矯正光譜處理建立的模型最優(yōu)。郭穎等[12]研究表明珠江三角洲地區(qū)水稻土無定型鐵的敏感波段為404、574、784、854和1 204 nm 等,BP人工神經(jīng)網(wǎng)絡(Back propagation neuralnetwork,BPNN)模型預測土壤無定型鐵含量的效果最佳。Xu 等[13]報道浙江土壤游離鐵的特征波段是400~480、1 900和2 200 nm,PLSR 模型預測土壤游離鐵準確性高。Camargo等[14]報道預測巴西氧化土游離鐵和赤鐵礦最準確的光譜波段為380~800 nm,預測模型為PLSR 模型。Sellitto等[15]認為土壤針鐵礦和赤鐵礦含量分別與420和535 nm 波段二階導數(shù)處理的譜帶振幅呈顯著相關性,反射光譜可用來快速測定巴西氧化土中氧化鐵礦物。Rossel 等[16]報道可見?近紅外反射光譜可以用于估算澳大利亞表層土壤中赤鐵礦和針鐵礦的相對豐度,特征波段分別是880和920 nm。Bahia 等[17-18]報道利用PLSR 模型預測巴西土壤游離鐵準確度高,原始反射光譜經(jīng)過二階微分和去包絡線處理后對赤鐵礦和針鐵礦預測效果好。而魏昌龍等[19]研究表明PLSR 和BPNN 模型均不能準確預測安徽宣城土壤游離鐵含量。以上研究為利用可見?近紅外反射光譜預測土壤鐵氧化物含量提供了依據(jù),但對于不同區(qū)域和類型的土壤,精確預測鐵氧化物的光譜轉換、敏感或特征波段和預測模型均不一致,因此有必要建立不同區(qū)域土壤鐵氧化物的光譜預測模型。廣西位于我國華南地區(qū),風化和淋溶作用強,脫硅富鐵鋁化明顯,鐵鋁等元素以二三氧化物形態(tài)殘留富集,使得該地區(qū)土壤中氧化鐵礦物主導了土壤的顏色,從而明顯區(qū)別于其他區(qū)域。利用土壤光譜特征定量反演廣西土壤游離鐵含量的研究鮮見報道,本文通過分析廣西旱地土壤反射光譜與游離鐵含量的關系,試圖建立基于可見?近紅外光譜的土壤游離鐵含量預測模型,為該區(qū)域土壤游離鐵含量預測提供一種簡單、快速、經(jīng)濟的方法。
2015年12月至2017年12月采集廣西壯族自治區(qū)82個旱地土壤剖面的B層土壤(圖1),土壤類型包括雛形土、淋溶土、富鐵土和鐵鋁土等。土壤樣品經(jīng)室內(nèi)風干后,制備過60和100目篩的樣品,結合參考文獻[20]的方法進行土壤化學特性分析。土壤游離鐵含量的測定用連二亞硫酸鈉?檸檬酸鈉?碳酸氫鈉(DCB)浸提?鄰菲羅啉比色法;土壤全鐵含量測定用HNO3-HCl-HClO4消解?鄰啡羅啉比色法;土壤有機質含量測定用重鉻酸鉀?濃硫酸?外加熱法。土壤化學性質分析于2016年3月至2018年2月完成。選取過60目篩的土壤于2017年12月至2018年8月進行光譜的采集與處理。
圖1 廣西采樣點分布圖Fig.1 Distribution of sampling sites in Guangxi
土壤光譜用AvaField-3便攜式地物波譜儀(荷蘭Avantes公司)測定,其波長范圍是350~2 500 nm,采樣間隔為0.6(區(qū)間為300~1 000 nm)和6 nm(區(qū)間為1 000~2 500 nm),光譜分辨率為1.4(300~1 100 nm)和15 nm(1 100~2 500 nm),波長重復性為±0.3 nm,輸出波段為1 569 nm。光譜測定在可控制光照條件的暗室內(nèi)進行,光源為一盞50 W 的鹵素燈,光源通過光纖連接探頭,視場角為10°。土壤樣品放置于直徑2.5 cm、高1.5 cm 黑色瓶蓋中,將土樣表面刮平。探頭距土樣表面2~3mm 垂直進行光譜數(shù)據(jù)采集,測試之前先進行白板校正,每個土樣采集25條光譜曲線,算術平均后得到該土樣的實際反射光譜數(shù)據(jù)。每個土樣的光譜曲線去除噪聲較大的邊緣波段(350~399和2 401~2 500 nm),保留400~2 400 nm 波段的反射光譜數(shù)據(jù)用于后續(xù)研究。
在土壤原始光譜反射率基礎上進行數(shù)學形式變換可以有效減少光照、背景噪聲的干擾,提高光譜靈敏度,更加容易分解混合特征信息[21]。為篩選對土壤游離鐵含量敏感的特征波段,本研究對土壤原始光譜進行10種變換處理,分別是一階微分、二階微分、倒數(shù)、倒數(shù)的對數(shù)、倒數(shù)的一階微分、倒數(shù)的二階微分、去包絡線、平方根、平方根的一階微分和平方根的二階微分。用Pearson 相關系數(shù)(rλ)來衡量光譜變換后光譜反射率與土壤游離鐵含量間相關程度,其計算公式如下:
式中,xi為第i個波段反射率,yi為第i個土壤游離鐵含量, x 為波段反射率的平均值, y為土壤游離鐵含量的平均值。
將供試土壤按游離鐵含量高低排序后隨機選取建模和驗證樣本。建模和驗證樣本數(shù)分別為62和20,占總樣本的75%和25%。通過SPSS 21.0對2組數(shù)據(jù)進行K-S檢驗[12],得到D=0.58、P=0.74>0.05,故可確認這兩組樣本來自同一分布。各樣本集土壤游離鐵含量的箱型散點圖見圖2,供試土壤基本理化性質統(tǒng)計如下:全鐵(Fe2O3)為9.37~124.44 g/kg,均值為(57.58±27.26)g/kg,變異系數(shù)為47.35%,游離鐵(Fe2O3)為1.58~108.13 g/kg,均值為(41.88±24.03) g/kg,變異系數(shù)為57.35%,有機質為2.20~48.90 g/kg,均值為(12.13±8.86)g/kg,變異系數(shù)為73.04%。
圖2 土壤游離鐵含量箱型散點圖Fig.2 Boxplot and scatter p lot of free iron content in soil
偏最小二乘回歸(PLSR)可以很好地解決各變量內(nèi)部高度線性相關、樣本個數(shù)少于變量個數(shù)等問題,很大程度上提高了模型的應用能力、精度及可靠性[22]。逐步多元線性回歸(SMLR)則將變量逐個選入回歸方程,并考慮全部變量的方差貢獻值,期間利用F統(tǒng)計量選擇或剔除自變量,不斷重復,直到無法引入新變量,最終建立自變量與因變量之間的回歸關系[23]。本研究采用PLSR 和SMLR 方法建立土壤游離鐵含量預測模型,分別在M ATLAB 2016a 和SPSS 21.0軟件中實現(xiàn)。
模型的預測精度通過預測值與實測值的決定系數(shù)(R2)、均方根誤差(RMSE)以及相對預測偏差(RPD)來評價;R2及RPD越大、RMSE 越小,說明預測效果越好[24]。當R2>0.90,RPD>3.00時,模型具有極好的預測能力;當0.82<R2<0.90,2.50<RPD<3.00時,模型具有很好的預測能力;當0.66<R2<0.81,2.00<RPD<2.50時,模型具有近似定量預測能力;當0.50<R2<0.66,1.50<RPD<2.00時,模型具有對樣品高含量與低含量進行區(qū)分的可能性;當R2<0.50時,RPD≤1.50時,模型不能成功預測[25]。R2、RMSE 和RPD計算公式如下:
式中, yi為第i個樣本的土壤游離鐵實測值為第i個樣本的土壤游離鐵預測值;y為82個樣本土壤游離鐵實測平均值;SD為土壤游離鐵實測值的標準差;n為樣本數(shù)。
供試土壤游離鐵含量分為<20、20~40、40~60及>60 g·kg?14組,對應的樣本數(shù)分別為13、33、18和18,對每一組別樣本計算原始光譜反射率和去包絡線處理平均值,形成不同土壤游離鐵含量的光譜曲線(圖3)。由圖3a 可知,在400~2 400 nm土壤游離鐵含量與光譜反射率呈負相關關系,即隨著土壤游離鐵含量的增加,土壤光譜反射率降低;在可見光波段(400~780 nm)范圍內(nèi)光譜曲線呈明顯的上升趨勢,氧化鐵含量越高,光譜反射率越低,在400 nm 波段附近有一個小吸收谷;在近紅外波段(780~1 300 nm)范圍內(nèi)光譜反射率上升比較平緩,在1 300~1 600 nm 波段光譜曲線趨于重合,說明光譜曲線的差異較小;在1 400、1 900 及2 200 nm 附近存在明顯的曲線吸收特征,主要是與鐵的氧化物及高嶺類黏土礦物所含OH?有關[26]。由圖3b可知,在400 nm 附近的吸收谷與氧化鐵含量有關,氧化鐵含量高的比較清晰;不同游離鐵含量的土壤在800 nm 附近有明顯的吸收峰,900 nm 附近有吸收谷。
圖3 不同游離鐵含量的土壤光譜曲線Fig.3 Reflectivity curves of soils with different free iron contents
將土壤游離鐵含量與原始光譜、去包絡線、一階微分、二階微分、倒數(shù)、倒數(shù)一階微分、倒數(shù)二階微分、倒數(shù)的對數(shù)、平方根、平方根一階微分和平方根二階微分變換后的光譜反射率進行Pearson 相關性分析,由分析結果(圖4)可知,原始光譜反射率與游離鐵含量呈負相關,并且整條曲線比較平滑,很難篩選出與游離鐵含量具有良好相關性的敏感波段,而經(jīng)過光譜變換后的土壤光譜反射率與游離鐵含量之間的相關性明顯提高。為篩選預測土壤游離鐵的不同光譜變換形式下的特征波段,對每種光譜變換后土壤光譜反射率與游離鐵含量的相關系數(shù)進行P=0.01水平的顯著性檢驗(|r0.01|=0.29)。去包絡線光譜變換主要是突出了一些反射峰和吸收谷的信息,在可見光波段范圍內(nèi)相關系數(shù)絕對值最大達到0.60,其他波段相關系數(shù)絕對值最大值約為0.20。倒數(shù)、倒數(shù)的對數(shù)與平方根光譜變換光譜曲線基本是原始光譜曲線以x軸為對稱軸的相似圖,整體表現(xiàn)比較平緩。微分變換處理效果顯著,多處波段相關系數(shù)絕對值≥0.50,一階微分變換比二階微分變換整體效果要好。從全波段來看,效果最好的光譜變換形式是倒數(shù)一階微分?;谝陨戏治鼋Y果,選取通過顯著性檢驗波段數(shù)量多的一階微分、去包絡線、倒數(shù)、倒數(shù)一階微分和平方根一階微分的光譜變換形式建立土壤游離鐵預測模型,評估不同光譜變換后土壤游離鐵含量預測精度。
不同學者利用不同光譜波段建立同一土壤屬性預測模型的結果不盡相同[10,12]。然而,很少有學者對基于不同反射光譜波段建立的預測模型效果進行評估,針對某種土壤屬性選擇較優(yōu)的建模波段。
圖4 不同光譜變換形式反射率與土壤游離鐵含量的相關性分析Fig.4 Correlation analysis between reflectance with different spectral transformation and soil free iron content
根據(jù)供試土壤在可見?近紅外波段的光譜反射率與土壤游離鐵含量的相關關系,獲取與土壤游離鐵含量相關性較強的反射光譜建模波段。本研究中在全波段400~2 400 nm 范圍內(nèi)隨著土壤游離鐵含量增加,土壤光譜反射率降低,因此選擇400~2 400 nm波段作為全波段數(shù)據(jù)。通過不同光譜變換后的光譜反射率與土壤游離鐵含量相關性分析得知,經(jīng)過一階微分、去包絡線、倒數(shù)、倒數(shù)一階微分和平方根一階微分的光譜變換,在400~580和760~1 300 nm 波段范圍內(nèi)有明顯的反射和吸收特征,因此確定為土壤游離鐵的特征波段。將光譜反射率與土壤游離鐵含量的相關系數(shù)經(jīng)過P=0.01水平的顯著性檢驗,再通過逐步多元線性的方法剔除共線性波段,得到400、457、510、735、848 nm 等12個敏感波段。敏感波段光譜反射率與土壤游離鐵含量間的相關系數(shù)以及方差膨脹因子見表1。
表1 敏感波段共線性檢驗1)Table 1 Collinearity test of sensitive band
利用全波段、特征波段和敏感波段建立土壤游離鐵含量預測模型(表2)。結果表明,基于全波段進行倒數(shù)和倒數(shù)的一階微分光譜變換的SM LR 模型,驗證樣本的R2分別為0.80和0.82,RPD分別為2.20和2.21,模型具有近似定量預測能力;PLSR模型的驗證樣本R2<0.80,RPD<2.0,模型不能進行定量預測?;谔卣鞑ǘ我浑A微分光譜變換的SMLR 模型,驗證樣本的R2為0.85,RPD為2.62,模型具有很好的預測能力;PLSR 模型的驗證樣本R2<0.80,RPD<2.0,模型不能進行定量預測?;诿舾胁ǘ谓PЧ焕硐耄琒MLR 和PLSR 模型驗證集R2<0.80,除倒數(shù)一階微分外,RPD<2.0,模型不能進行定量預測。
圖5為通過3種反射光譜建模波段建立的土壤游離鐵含量最佳反演模型的實測值與預測值散點圖。綜合比較R2、RMSE 和RPD評價指標可知,基于特征波段一階微分光譜變換的SMLR 模型預測土壤游離鐵含量的效果最佳。土壤游離鐵含量的最佳預測模型表示為:
式中,Y表示土壤游離鐵含量預測值;X表示提取的
該波段處的土壤光譜反射率。
表2 土壤游離鐵含量預測模型1)Table2 Calibration and validation of the model for predicting soil free iron content
圖5 不同建模波段最佳模型的土壤游離鐵含量Fig.5 Soil free iron content of the optimal model in different modeling band
廣西旱地土壤隨著游離鐵含量的增加,可見?近紅外波段范圍內(nèi)土壤光譜反射率降低,在可見光波段的降低程度比近紅外波段高,可見光波段能夠提供更多的游離鐵信息。土壤原始光譜經(jīng)過微分光譜變換后光譜反射率與土壤游離鐵含量的相關性顯著提高。采用一階微分光譜變換、特征波段(400~580、760~1 300 nm)和逐步多元線性回歸建立的模型能夠很好地預測廣西旱地土壤游離鐵含量,驗證樣本的R2和RPD分別為0.85和2.62。
本研究的相關性分析結果表明,土壤游離鐵含量在全波段范圍內(nèi)與原始光譜呈負相關關系,且特征波段位于可見近紅外光(400~1 300 nm)區(qū)域,在457和900 nm 波段附近具有明顯的氧化鐵吸收谷特征,在800 nm 波段附近有氧化鐵反射峰特征。該結論同前人的研究結論一致[27],同時也符合土壤特征光譜的產(chǎn)生機制[7,13]。其中,400~580、760~1 300、400、457、510 nm 等波段是本研究區(qū)域土壤游離鐵的特征波段和敏感波段,其主要原因是不同土壤鐵氧化物含量有差異,且不同的氧化物中羥基的數(shù)量也會對其敏感波段造成影響[14-16]。其次,光譜變換形式及波段提取方法的不同,使得同一土壤屬性提取的特征波段不一致。本文提取特征波段是在相關分析的前提下,相關系數(shù)通過P=0.01顯著性檢驗;敏感波段是進一步采用多元逐步線性手段剔除共線性波段獲取的。本研究中土壤游離鐵含量的反射光譜在可見光波段,反射率曲線從長波向短波波段明顯下降,可見光波段反射率的降低程度高于近紅外波段,這主要是由土壤鐵氧化物的電子躍遷造成的,也就是說在可見光范圍內(nèi)能夠提供更多的氧化鐵信息[7]。進入紅外波段后,不同游離氧化鐵含量梯度的光譜曲線在1 400、1 900、2 200 nm 附近有強烈的吸收谷,這幾個吸收谷是受到N—H、C—H、C—O、C=O等功能基團的影響[3]。這與趙小敏等[1]、郭穎等[12]、黃應豐等[26]對我國南方其他區(qū)域土壤光譜特征的研究結果一致。
本研究中原始光譜反射率與土壤游離鐵含量的相關性整體偏低,經(jīng)過一階微分、二階微分、倒數(shù)、倒數(shù)的對數(shù)等10種形式變換后,微分光譜變換的光譜反射率與游離鐵含量之間相關性顯著提高,其中倒數(shù)一階微分變換的相關系數(shù)提高最多,相關系數(shù)絕對值最大為0.64。熊俊峰等[11]利用全波段數(shù)據(jù)對不同鐵元素含量進行反演時認為多元散射校正(MSC)光譜處理效果最好。何挺等[27]計算不同變換形式反射率與氧化鐵含量的相關系數(shù)表明,變換后相關性并沒有得到顯著增強,只有反射率平方根的一階微分相關系數(shù)提高最多;Xu 等[13]將氧化鐵進行對數(shù)光譜變換后得到較好的預測模型。光譜變換能夠降低外界噪聲干擾,突出光譜特征,增強光譜反射率與土壤屬性的相關性,提高基于土壤光譜預測土壤屬性的精確性,然而不同光譜變換方法的建模精度存在差異[11-13]。根據(jù)不同光譜波段建模結果可知,利用特征波段(400~580、760~1 300 nm)的建模效果要優(yōu)于全波段(400~2 400 nm)。研究表明不同區(qū)域和不同類型土壤,基于可見?近紅外反射光譜預測土壤鐵氧化物的光譜變換、特征波段及預測模型均不一致。與其他區(qū)域土壤[7,9,10,12-13]不同的是,廣西旱地B層土壤中有機質含量較少,均值僅為12.13 g/kg,而土壤游離鐵和全鐵含量較高。全波段由于波段較多相應地增加了受其他因素或成分影響的程度,使得不僅沒有凸顯全面而豐富的氧化鐵光譜特征信息,反而使得一些重要波段信息被掩蓋[7]。
一元線性回歸、偏最小二乘回歸、逐步多元線性回歸、反向神經(jīng)網(wǎng)絡(BPNN)等是利用光譜特征預測土壤屬性最普遍的建模方法。本研究選用PLSR和SM LR 這2種模型來預測土壤游離鐵含量,通過R2、RMSE和RPD評價,SMLR 建模效果要優(yōu)于PLSR,與何挺等[27]用逐步回歸分析得到氧化鐵的預測模型結論一致;但眾多研究結果[10,11,13-14,17]表明PLSR 模型能較好地預測土壤鐵氧化物含量。造成這種結果的原因可能是:1)研究區(qū)土壤類型多樣,不同的土壤類型的反射光譜不同[24],而光譜反射率建立在反演模型的基礎上,因此對反演結果造成影響;2)由于土壤成分復雜,當土壤氧化鐵含量不高時,其他成分易對其光譜特征造成交叉干擾[13]。不同研究區(qū)域土壤中水分含量、有機質以及鹽分等差異較大,模型結果自然也有較大不同。本文雖然已經(jīng)盡可能排除了這些影響,但成土母質及眾多含量較少成分的影響仍難以排除,還需要繼續(xù)深入研究。本研究中SM LR 預測模型應用于驗證樣本的R2和RPD分別為0.85和2.62,與浙江[13]、巴西[14,18]土壤游離鐵預測模型相近,高于江蘇省東臺[11]、安徽宣城[19]土壤游離鐵預測模型,結果表明本研究中建立的廣西旱地土壤游離鐵預測模型準確度較高。從不同游離鐵含量的光譜特征曲線圖[24]可以看出,本研究區(qū)供試土壤光譜曲線類型屬于鐵影響型光譜曲線,相對來說這類光譜曲線土壤中有機質含量低,鐵氧化物含量高于有機質控制型光譜曲線。根據(jù)謝碧裕[10]、郭穎等[12]研究不同區(qū)域水稻土的氧化鐵含量預測模型可知,對來自不同地區(qū)不同發(fā)育母質的同一類型土壤進行預測時,其預測精度同樣不能保證。因此,本研究預測模型綜合考慮了土壤光譜反射率的影響因素,選擇室內(nèi)光譜測試環(huán)境,以避免外界環(huán)境的影響;統(tǒng)一土壤化學分析測定與光譜預測時的土壤粒徑,并且選用自然風干的B層土壤,最大程度降低了土壤其他組分對氧化鐵光譜反演結果的影響。已有研究表明土壤有機質影響土壤鐵含量與光譜反射率關系,尤其是在可見光區(qū)域[28],有機質含量對游離鐵估算精度的影響小于全鐵、無定型鐵[11]。為了降低有機質對游離鐵含量預測精度可能的影響,本研究只選取有機質含量低的B層土壤,有關土壤有機質含量對廣西旱地土壤游離鐵預測精度產(chǎn)生怎樣的影響以及本研究得到的游離鐵預測模型是否適用于更廣泛的土壤亟待進一步深入研究。