羅德芳,柳維揚(yáng)*,彭 杰,馮春暉,紀(jì)文君,白子金
1.塔里木大學(xué)植物科學(xué)學(xué)院,新疆 阿拉爾 843300 2.中國(guó)農(nóng)業(yè)大學(xué)土地資源管理學(xué)院,北京 100083
土壤是由多種成分組成的,如有機(jī)、無機(jī)礦物質(zhì)、微生物和水。土壤有機(jī)質(zhì)(soil organic matter,SOM)約為土壤有機(jī)碳的1.72倍,由不同分解階段的動(dòng)植物殘余物組成,與土壤肥力和穩(wěn)定性有關(guān)[1]。根據(jù)土壤有機(jī)質(zhì)含量分布,繪制土壤肥力分布圖,對(duì)精準(zhǔn)施肥具有重要意義,因此快速準(zhǔn)確的監(jiān)測(cè)土壤有機(jī)質(zhì)含量在智慧農(nóng)業(yè)中尤為重要。但SOM測(cè)定仍以傳統(tǒng)的室內(nèi)分析法(重鉻酸鉀-外加熱法)為主,該方法在測(cè)定土壤有機(jī)質(zhì)時(shí)存在化學(xué)試劑消耗大、有毒廢料量大、分析費(fèi)時(shí)等問題,不能滿足智慧農(nóng)業(yè)需求且會(huì)造成環(huán)境污染[2]。大量研究已經(jīng)充分證明了利用可見光和近紅外(VIS-NIR)反射光譜能夠高效、低成本和高精度的預(yù)測(cè)土壤有機(jī)質(zhì)、黏土礦物等土壤性質(zhì)。史舟等[3]利用可見-近紅外光譜分類方法結(jié)合偏最小二乘(PLSR),建立的光譜分類-局部模型有效的預(yù)測(cè)了不同地區(qū)土壤有機(jī)質(zhì)含量,分類之后的土壤有機(jī)質(zhì)模型精度顯著提升,預(yù)測(cè)模型R2和RPD分別從0.70和1.82提高到0.90和3.16。
但室內(nèi)光譜測(cè)定中存在采樣及工序繁瑣等缺點(diǎn),用野外原位光譜替代室內(nèi)光譜進(jìn)行土壤屬性測(cè)定可顯著提高工作效率。Allory等[4]在原位和實(shí)驗(yàn)室條件下利用可見-近紅外光譜分別預(yù)測(cè)了城市土壤的有機(jī)碳含量,結(jié)果表明實(shí)驗(yàn)室條件下土壤有機(jī)碳的預(yù)測(cè)精度更高。土壤光譜反射率對(duì)外部環(huán)境條件相當(dāng)敏感,顆粒大小、溫度和土壤濕度,都影響土壤有機(jī)質(zhì)預(yù)測(cè)精度。
為了克服土壤水分對(duì)可見-近紅外光譜預(yù)測(cè)土壤有機(jī)質(zhì)的影響,國(guó)內(nèi)外學(xué)者們提出了多種方法來提高田間原位光譜條件下土壤有機(jī)質(zhì)的預(yù)測(cè)精度。洪永勝等[5]在室內(nèi)進(jìn)行了水分梯度實(shí)驗(yàn),對(duì)比干濕土壤光譜反射率并進(jìn)行外部參數(shù)正交化法(EPO)校正,在EPO算法校正后,PLSR的模型預(yù)測(cè)偏差比由1.16提升到1.76,實(shí)現(xiàn)了不同含水量梯度條件下土壤有機(jī)質(zhì)含量的有效估算。Ji等[6]對(duì)浙江省水稻田土壤分別進(jìn)行了野外原位光譜及室內(nèi)光譜測(cè)定,經(jīng)光譜直接轉(zhuǎn)換法(DS)校正后的野外原位PLSR模型精度R2由0.25提高到0.69、RPD由0.35提高到1.61,結(jié)果表明DS能有效地去除水和環(huán)境因素對(duì)土壤光譜的影響,提高土壤有機(jī)質(zhì)的預(yù)測(cè)精度。雖已有眾多關(guān)于去除土壤水分影響的有機(jī)質(zhì)光譜預(yù)測(cè)的相關(guān)報(bào)道,但目前針對(duì)南疆干旱區(qū)膜下滴灌棉田土壤有機(jī)質(zhì)的原位光譜反演研究甚少,南疆土壤普遍存在一定程度的鹽漬化,且以旱作為主,土壤質(zhì)地以沙土和沙壤土為主,水分含量相對(duì)較低,而目前的報(bào)道多集中于土壤質(zhì)地較粘、土壤水分含量較高且無鹽漬化危害的區(qū)域。因此,現(xiàn)有去除水分的算法是否能對(duì)南疆這種特殊環(huán)境土壤的有機(jī)質(zhì)原位光譜測(cè)定產(chǎn)生理想的效果,尚未有明確結(jié)論。同時(shí),南疆棉花是機(jī)械化作業(yè)程度最高的一種作物,解決水分影響土壤有機(jī)質(zhì)原位光譜反演精度的問題,有助于光譜儀與農(nóng)業(yè)機(jī)械的協(xié)同作業(yè),實(shí)現(xiàn)智慧農(nóng)機(jī)在線檢測(cè)土壤有機(jī)質(zhì)含量。
鑒于以上分析,選擇面積在南疆占主導(dǎo)地位的棉田為實(shí)驗(yàn)區(qū),旨在研究以隨機(jī)森林(random forest,RF)建立的機(jī)器學(xué)習(xí)模型來預(yù)測(cè)通過外部參數(shù)正交化法(EPO)、光譜直接轉(zhuǎn)換法(DS)及光譜間接轉(zhuǎn)換法(PDS)三種去除水分算法后的棉田土壤有機(jī)質(zhì)含量,以期提高新疆南部地區(qū)大尺度范圍內(nèi)棉田土壤有機(jī)質(zhì)的光譜預(yù)測(cè)精度,為精準(zhǔn)施肥提供數(shù)據(jù)支撐。
試驗(yàn)區(qū)位于新疆維吾爾自治區(qū)阿拉爾墾區(qū)的一師十二團(tuán)內(nèi)。墾區(qū)屬暖溫帶極端大陸性干旱荒漠氣候,墾區(qū)內(nèi)太陽輻射年均133.7~146.3 kJ·cm-2,年均日照2 556.3~2 991.8 h,日照率為5869%,雨量稀少,冬季少雪,地表蒸發(fā)強(qiáng)烈,年均降水量為40.1~82.5 mm,年均蒸發(fā)量1 876.6~2 558.9 mm[7]。
試驗(yàn)區(qū)面積為400 m×200 m,種植作物為棉花,連作時(shí)間大于20年,灌溉方式為膜下滴灌。采用等間距網(wǎng)格采樣法進(jìn)行土壤樣品及田間原位光譜數(shù)據(jù)采集,點(diǎn)間距為20 m,樣點(diǎn)分布為21行×11列,各樣點(diǎn)均采集光譜數(shù)據(jù),共采集231個(gè)田間原位光譜數(shù)據(jù),每行樣點(diǎn)間隔采集土壤樣品,共采集116個(gè)土壤樣品。試驗(yàn)區(qū)中心地理坐標(biāo)為北緯40°29′22.194″,東經(jīng)81°19′12.688″,土壤類型為沙壤土,試驗(yàn)區(qū)示意圖如圖1所示。
圖1 試驗(yàn)區(qū)示意圖Fig.1 Schematic diagram of the study area
土壤樣品采集時(shí)間為2018年11月初,均勻布局采樣點(diǎn)位置,同時(shí)記錄樣點(diǎn)坐標(biāo)位置及地理環(huán)境。用土鉆鉆取0~20 cm表層土壤,迅速裝入自封袋中帶回實(shí)驗(yàn)室,剔除植物根系及砂礫等雜質(zhì),取約40 g新鮮土樣測(cè)定土壤質(zhì)量含水量,將剩余的土樣風(fēng)干研磨過1 mm篩后分別進(jìn)行土壤有機(jī)質(zhì)含量及室內(nèi)光譜的測(cè)定,共得到116個(gè)土壤有機(jī)質(zhì)及室內(nèi)光譜反射率數(shù)據(jù),數(shù)據(jù)分析后剔除1個(gè)異常值,共得到115個(gè)有效土壤有機(jī)質(zhì)及室內(nèi)光譜數(shù)據(jù)。對(duì)土壤樣本進(jìn)行統(tǒng)計(jì)分析,如表1所示。土壤有機(jī)質(zhì)含量最大值為20.26 g·kg-1,最小值為4.23 g·kg-1,土壤水分含量最小值為7.36%,最大含水量55.25%。根據(jù)變異系數(shù)等級(jí)劃分原則,變異系數(shù)小于10%為弱變異性;變異系數(shù)在10%~100%為中等變異性;變異系數(shù)大于100%為強(qiáng)變異性,從表中可以看出,土壤水分與有機(jī)質(zhì)含量都屬于中等變異。
表1 土樣統(tǒng)計(jì)分析Table 1 Statistics of soil samples
光譜測(cè)量?jī)x器為美國(guó)Spectral Evolution制造的SR-3500型便攜式地物光譜儀,其光譜測(cè)量范圍在350~2 500 nm波段;光譜分辨率在350~1 000 nm為3.5 nm,在1 000~1 900 nm為10 nm,1 900~2 500 nm為7 nm;采樣間隔為1 nm。采集光譜樣本使用設(shè)備配套的手槍式光纖手柄,光源為手柄內(nèi)置光源;將農(nóng)田土壤表面的植物組織、殘膜及各類雜物清理后,探頭緊貼平整地面測(cè)量,共采集231個(gè)樣點(diǎn)的田間原位光譜,每個(gè)樣點(diǎn)取10次測(cè)量結(jié)果的算術(shù)平均值為該樣點(diǎn)原位反射光譜數(shù)據(jù)(Situ-spectra)。在進(jìn)行室內(nèi)風(fēng)干土樣的光譜測(cè)定時(shí),將過1 mm篩的土樣裝入直徑為10 cm,深度為2 cm的器皿中,并用直尺刮平,用SR-3500便攜式光譜儀測(cè)量土壤光譜,與田間測(cè)定方法一致,每10次測(cè)量取平均值為該土樣的室內(nèi)光譜數(shù)據(jù)(Dry-spectra),共得到了116個(gè)風(fēng)干土樣的室內(nèi)光譜,剔除了1個(gè)異常值光譜,得到115條可用室內(nèi)光譜。測(cè)量光譜數(shù)據(jù)時(shí),每測(cè)量1個(gè)樣點(diǎn)清理手柄鏡面1次,每測(cè)量10個(gè)樣點(diǎn)白板標(biāo)定校準(zhǔn)1次。本研究?jī)H用與室內(nèi)光譜數(shù)據(jù)相對(duì)應(yīng)的115條田間原位光譜數(shù)據(jù),剩余的115條土樣的田間原位光譜數(shù)據(jù)用于后續(xù)的數(shù)字土壤制圖研究,有關(guān)數(shù)字土壤制圖研究,因此不做相應(yīng)的處理和利用。
室內(nèi)外光譜數(shù)據(jù)測(cè)定結(jié)束后,利用DARWin SP軟件進(jìn)行土壤光譜曲線校正,由于儀器受自身精度誤差及大氣影響會(huì)使光譜反射率有輕微偏移。在分析時(shí)需去除邊緣(350~399和2 401~2 500 nm)噪聲較大土壤樣品的光譜反射率,保留400~2 400 nm波段的土壤原始光譜反射率進(jìn)行分析處理。對(duì)田間原位及室內(nèi)光譜分別做Savitzky-Golay (SG)平滑處理,并進(jìn)行反射率一階微分(R′)、反射率對(duì)數(shù)(LOG(R))以及反射率倒數(shù)(1/R)數(shù)學(xué)形式變換。
1.4.1 外部參數(shù)正交化(EPO)
外部參數(shù)正交化(external parameter orthogonalization,EPO)是將光譜投影到空間的正交面上進(jìn)行預(yù)處理來降低光譜(X)的維度[8]。一般X的列空間由兩個(gè)子空間的和組成,其中只有一個(gè)包含對(duì)模型有用的信息,通過投影保留有用的子空間,EPO算法主要用于改善現(xiàn)有模型校正的穩(wěn)健性。通常n個(gè)樣本m個(gè)波段的田間光譜X(n×m)可以用矩陣的形式表示為
X=XP+XQ+R
(1)
式(1)中,Pm×m為有用光譜信息(土壤屬性)的投影矩陣;Qm×m為無用光譜信息(額外的環(huán)境因素)的投影矩陣;Rn×m為殘差矩陣。n為土壤樣本數(shù),m為光譜波段數(shù)。
1.4.2 光譜直接轉(zhuǎn)換法(DS)
光譜直接轉(zhuǎn)換法(direct standardization,DS)可通過測(cè)量田間光譜和室內(nèi)光譜之間的變化規(guī)律,從田間光譜中去除水分,來表征土壤濕度或溫度等環(huán)境影響[9]。室內(nèi)光譜X是田間原位光譜Xw的線性組合,DS轉(zhuǎn)換存在著如式(2)的關(guān)系
(2)
式(2)中,X(m×p)為轉(zhuǎn)換樣本的室內(nèi)光譜數(shù)據(jù);Xw(m×p)為轉(zhuǎn)換樣本的田間光譜數(shù)據(jù);m是轉(zhuǎn)換樣本的個(gè)數(shù),P為光譜波段數(shù)。Bp×p是轉(zhuǎn)換矩陣,用以衡量室內(nèi)土壤光譜與田間土壤光譜之間的差異;Dm×p是殘差矩陣,用以校正田間不同于室內(nèi)測(cè)量環(huán)境下所產(chǎn)生的基線偏移。
1.4.3 光譜間接轉(zhuǎn)換法(PDS)
光譜間接轉(zhuǎn)換法(piecewise direct standardization,PDS)是為了改進(jìn)DS方法所引入的算法[10]。DS和PDS的主要區(qū)別在于轉(zhuǎn)移矩陣的計(jì)算方式,PDS是將相鄰幾個(gè)波長(zhǎng)的原位光譜區(qū)域?qū)?yīng)到室內(nèi)光譜中的每個(gè)波長(zhǎng)中,即在預(yù)測(cè)時(shí),由相鄰波長(zhǎng)的光譜窗口O=2n+1大小的光譜段的數(shù)據(jù)重建室內(nèi)光譜的第i個(gè)波長(zhǎng),PDS算法存在如式(3)關(guān)系
Xi=XwiBi
(3)
式(3)中,Xi(m×1)是室內(nèi)光譜中波長(zhǎng)i所組成的列向量,Xwi(m×O)是i相鄰的2n+1大小的田間原位光譜組成的矩陣,m是轉(zhuǎn)換樣本的數(shù)目,O是窗口的寬度,O=2n+1;Bi(O×1)是對(duì)應(yīng)i的轉(zhuǎn)換系數(shù),由PLS方法求出。以上三種去除水分算法中轉(zhuǎn)換子集的選取均由Kennard-Stone算法得出。
隨機(jī)森林(RF)是一種用于分類、回歸和其他任務(wù)的集成學(xué)習(xí)方法,通過在訓(xùn)練時(shí)間內(nèi)構(gòu)建多個(gè)決策樹并輸出結(jié)果,RF能夠修正決策樹的歸納偏好而產(chǎn)生的過擬合[11]。RF對(duì)于很多數(shù)據(jù)集表現(xiàn)良好,精確度比較高,不易發(fā)生過擬合,在數(shù)據(jù)建模中具有一定的優(yōu)勢(shì)。故選用RF方法進(jìn)行構(gòu)建模型。
模型的穩(wěn)定性與預(yù)測(cè)的精度評(píng)價(jià)指標(biāo)主要包括決定系數(shù)(R2)、相對(duì)分析誤差(RPD)、均方根誤差(RMSE)以及平均絕對(duì)百分誤差(MAPE)[12]。R2是表征回歸方程在多大程度上解釋了因變量的變化以及方程對(duì)觀測(cè)值的擬合程度,根據(jù)RPD的分類標(biāo)準(zhǔn),RPD<1.5時(shí),表明模型的預(yù)測(cè)能力很差;1.5≤RPD<2時(shí),表明模型預(yù)測(cè)能力良好,尚可用來進(jìn)行大致估算;RPD≥2.0,代表模型質(zhì)量很好,可以用于土壤性質(zhì)的定量預(yù)測(cè)。RMSE可以度量預(yù)測(cè)值和實(shí)測(cè)值之間的差異,并通過比較不同模型的預(yù)測(cè)誤差來量化預(yù)測(cè)的準(zhǔn)確性。因此,RMSE越小,模型精度越好。MAPE的范圍在[0,+∞),MAPE為0%表示完美模型,MAPE大于100%則表示劣質(zhì)模型。相比RMSE,MAPE相當(dāng)于把每個(gè)點(diǎn)的誤差進(jìn)行了歸一化,降低了個(gè)別離群點(diǎn)帶來的絕對(duì)誤差的影響。
將土壤樣本按有機(jī)質(zhì)含量分為<5,5~10,10~15和>15 g·kg-1四個(gè)等級(jí),計(jì)算每個(gè)等級(jí)的所有土樣光譜曲線的各波段反射率平均值并做圖2。不同土壤有機(jī)質(zhì)含量的室內(nèi)和田間原位的土壤光譜曲線形狀整體趨勢(shì)一致,土壤有機(jī)質(zhì)含量越大,光譜反射率越小,且反射率光譜曲線的波谷向短波方向偏移。室內(nèi)光譜反射率與田間原位光譜反射率的土壤類型及測(cè)定方式一致,唯一不同的是水分因素的影響。由圖2可知,田間原位光譜反射率整體小于室內(nèi)光譜反射率,但在1 400和1 900 nm波段處,田間原位光譜反射率下降的趨勢(shì)更為明顯,波谷更深。隨著土壤含水率的增加,土壤光譜反射率下降,說明水分因素主要在近紅外波段影響土壤光譜反射率。
圖2 不同有機(jī)質(zhì)平均含量的土壤室內(nèi)光譜曲線(a)及田間原位光譜曲線(b)Fig.2 Dry-spectral (a)and Situ-spectral (b)of soil with different average organic matter contents
采用Kennard-Stone算法,經(jīng)過多次不同樣本轉(zhuǎn)換數(shù)的試驗(yàn)分析,在115個(gè)土樣中選取出具有代表性且均勻分布的69個(gè)樣本作為轉(zhuǎn)換集樣本,剩余的46個(gè)樣本作為驗(yàn)證集樣本。對(duì)原位及室內(nèi)光譜反射率分別做一階微分、對(duì)數(shù)及倒數(shù)形式的處理,并利用RF模型進(jìn)行建模,不同數(shù)學(xué)形式的土壤有機(jī)質(zhì)模型如表2所示。其次,篩選模型精度較好的田間原位光譜數(shù)據(jù),進(jìn)行EPO,DS和PDS三種去除水分算法處理并建立RF模型,表3為不同數(shù)學(xué)變換形式結(jié)合去除水分算法的土壤有機(jī)質(zhì)預(yù)測(cè)精度表。
表2 不同數(shù)學(xué)形式的土壤有機(jī)質(zhì)模型精度Table 2 Accuracy of soil organic matter models in different mathematical forms
表3 不同去除水分算法的土壤有機(jī)質(zhì)預(yù)測(cè)模型精度Table 3 Accuracy of soil organic matter prediction model under different treatment forms
由表2可得,經(jīng)光譜反射率一階微分和對(duì)數(shù)形式變換之后,室內(nèi)光譜和田間原位光譜模型精度均有所增加,室內(nèi)光譜模型以反射率一階微分變換后的土壤有機(jī)質(zhì)模型預(yù)測(cè)精度最優(yōu),R2和RPD最大為0.90和2.46,RMSE和MAPE最小為1.54 g·kg-1和0.14,田間原位光譜模型以反射率對(duì)數(shù)變換后的土壤有機(jī)質(zhì)模型精度最優(yōu),R2和RPD最大為0.73和1.90,RMSE和MAPE最小為1.99 g·kg-1和0.17。經(jīng)反射率倒數(shù)變換之后,室內(nèi)光譜和田間原位光譜模型精度均降低,在室內(nèi)光譜有機(jī)質(zhì)模型中,模型精度R2和RPD分別降低了0.06和0.34,RMSE和MAPE分別增加了0.26 g·kg-1和0.01,田間原位光譜模型精度R2和RPD分別降低了0.01和0.05,RMSE增加了0.05 g·kg-1,MAPE沒有變化。室內(nèi)光譜與田間原位光譜模型精度相比較來說,室內(nèi)光譜的模型精度高于原位光譜模型精度,原始室內(nèi)光譜反射率有機(jī)質(zhì)模型精度R2可達(dá)到0.87,RPD為2.38大于2.0,能夠精準(zhǔn)的預(yù)測(cè)出土壤有機(jī)質(zhì)含量。田間原位光譜模型精度R2為0.71,RPD僅為1.78,只能大致估測(cè)出土壤有機(jī)質(zhì)含量。
表3為光譜反射率、反射率一階微分、反射率對(duì)數(shù)與EPO,DS和PDS三種去除水分算法相結(jié)合建立的有機(jī)質(zhì)模型精度評(píng)價(jià)表。經(jīng)過去除水分影響后,土壤有機(jī)質(zhì)光譜模型精度均有所提高,PDS以反射率對(duì)數(shù)變換后的去除水分效果最好,模型精度R2為0.80,RPD為2.06,RMSE為1.84 g·kg-1,MAPE為0.17,但模型精度僅能大致估測(cè)出土壤有機(jī)質(zhì)含量。EPO和DS以反射率一階微分變換后的模型去除水分效果最好,模型精度較原位光譜模型精度R2均提高了0.12,RPD均提高了0.57,RMSE分別降低了0.52和0.50 g·kg-1,MAPE分別降低了0.05和0.04,均能精確地預(yù)測(cè)出土壤有機(jī)質(zhì)含量。EPO和DS一階微分模型的R2和RPD相同,但DS模型的RMSE和MAPE均大于EPO模型。因此,EPO模型能夠更有效的去除水分因素的影響,以EPO一階微分去除水分模型進(jìn)行土壤有機(jī)質(zhì)預(yù)測(cè),精度最高,預(yù)測(cè)效果最好。
通過對(duì)三種反射率變換形式、三種去除水分算法結(jié)合并進(jìn)行RF建模,共得到11個(gè)土壤有機(jī)質(zhì)預(yù)測(cè)模型,分別對(duì)46個(gè)驗(yàn)證集樣本進(jìn)行模型精度驗(yàn)證。其中,以土壤室內(nèi)光譜預(yù)測(cè)的結(jié)果最好,田間原位光譜預(yù)測(cè)的結(jié)果最差,在去除水分算法中,以反射率一階微分進(jìn)行的EPO和DS算法模型預(yù)測(cè)精度相對(duì)較好。利用室內(nèi)光譜、田間原位光譜、反射率一階微分進(jìn)行的EPO和DS算法模型對(duì)土壤有機(jī)質(zhì)進(jìn)行預(yù)測(cè)的散點(diǎn)圖如圖3所示。
由圖3可得,田間原位光譜預(yù)測(cè)土壤有機(jī)質(zhì)含量模型精度最差,R2為0.71,RPD為1.49,RMSE為2.17 g·kg-1,MAPE為0.20,不能預(yù)測(cè)出土壤有機(jī)質(zhì)的含量。土壤室內(nèi)光譜預(yù)測(cè)模型精度最高,R2為0.86,RPD為2.08,RMSE為1.55 g·kg-1,MAPE為0.14,能夠精準(zhǔn)的預(yù)測(cè)出土壤有機(jī)質(zhì)的含量。經(jīng)EPO一階微分和DS一階微分去除水分影響后的模型預(yù)測(cè)精度較田間原位光譜模型精度均有所提高,R2和RPD分別提高了0.12,0.55和0.11,0.54,RMSE和MAPE分別降低了0.59 g·kg-1,0.06和0.58 g·kg-1,0.06,EPO一階微分和DS一階微分去除水分模型均能夠精確的預(yù)測(cè)出土壤有機(jī)質(zhì)含量,以EPO一階微分去除水分影響后建立的模型能夠更精確地預(yù)測(cè)反演出土壤有機(jī)質(zhì)含量,本研究為南疆棉田土壤大尺度預(yù)測(cè)土壤肥力狀況提供了新的思路。
圖3 不同模型對(duì)土壤有機(jī)質(zhì)含量預(yù)測(cè)散點(diǎn)圖Fig.3 Scatter plots of soil organic matter content predicted by different models
在進(jìn)行田間測(cè)量土壤光譜時(shí),由于雜散光等自然條件的影響,會(huì)使測(cè)量的土壤光譜曲線有一定的誤差。本研究使用的是內(nèi)置光源的手持式土壤光譜儀,能夠避免雜散光等影響,保證在田間進(jìn)行土壤光譜測(cè)定時(shí)的環(huán)境因素不受干擾,但土壤自身的水分含量對(duì)土壤光譜有很大的影響。吳龍國(guó)等[13]在研究土壤水分高光譜的無損檢測(cè)時(shí)發(fā)現(xiàn)土壤光譜反射率隨著土壤含水率的增加而減小,當(dāng)超過田間持水率時(shí),光譜曲線的反射率會(huì)隨著土壤含水率的增加而增大。因此田間原位土壤中水分含量較大時(shí),在進(jìn)行田間光譜直接預(yù)測(cè)土壤有機(jī)質(zhì)時(shí)會(huì)嚴(yán)重影響預(yù)測(cè)精度。前人研究提高土壤有機(jī)質(zhì)預(yù)測(cè)精度的方法主要是進(jìn)行光譜反射率預(yù)處理算法或者模型方法的提高,雖然能夠提高模型的預(yù)測(cè)精度,但卻不能完全去除水分因素的影響,在與室內(nèi)光譜預(yù)測(cè)土壤有機(jī)質(zhì)相比,田間原位光譜的預(yù)測(cè)結(jié)果還是較低,不能直接用來預(yù)測(cè)土壤有機(jī)質(zhì)含量[14]。
對(duì)田間原位光譜及室內(nèi)光譜原始光譜反射率作反射率一階微分與反射率對(duì)數(shù)數(shù)學(xué)形式變換,并與土壤有機(jī)質(zhì)含量作相關(guān)性分析,結(jié)果表明室內(nèi)光譜反射率與土壤有機(jī)質(zhì)的相關(guān)性大于田間原位光譜反射率。與原始光譜反射率相比,經(jīng)一階微分及對(duì)數(shù)變換后,光譜反射率的相關(guān)性有了很大的提高,尤其是在特征性波段1 400和1 900 nm處,光譜反射率的相關(guān)性明顯增加。因此,經(jīng)一階微分及對(duì)數(shù)變換后可在一定程度上消除土壤水分的影響。本研究在選用EPO,DS和PDS三種去除水分的算法來校正土壤田間原位光譜中的水分影響因素的基礎(chǔ)上,還結(jié)合了一階微分及對(duì)數(shù)數(shù)學(xué)形式預(yù)處理后的光譜反射率來進(jìn)一步提高土壤有機(jī)質(zhì)含量的預(yù)測(cè)精度。在模型選擇中,本研究選擇建模精度較好的RF模型。結(jié)果表明,基于EPO一階微分去除水分影響后的RF模型能夠更精確地預(yù)測(cè)反演出土壤有機(jī)質(zhì)含量,在土壤肥力鑒定中能有一定的借鑒意義。
田間原位光譜預(yù)測(cè)土壤有機(jī)質(zhì)時(shí)水分因素會(huì)對(duì)有機(jī)質(zhì)預(yù)測(cè)精度有一定的影響。本研究采用EPO,DS和PDS三種去除水分算法結(jié)合反射率一階微分、倒數(shù)及對(duì)數(shù)三種數(shù)學(xué)變換方式,利用RF模型進(jìn)行模型預(yù)測(cè),提高了原位土壤有機(jī)質(zhì)含量的預(yù)測(cè)精度,得出以下結(jié)論:
(1)土壤有機(jī)質(zhì)含量越高,土壤光譜反射率越低。土壤原位光譜反射率低于土壤室內(nèi)光譜反射率,且在1 400以及1 900 nm附近,土壤原位光譜反射率出現(xiàn)更深的波谷。
(2)田間原位光譜預(yù)測(cè)土壤有機(jī)質(zhì)含量模型精度R2為0.71,RPD為1.49,RMSE為2.17 g·kg-1,MAPE為0.20,不能預(yù)測(cè)出土壤有機(jī)質(zhì)的含量。土壤室內(nèi)光譜預(yù)測(cè)模型精度R2為0.86,RPD為2.08,RMSE為1.55 g·kg-1,MAPE為0.14,能夠精確地預(yù)測(cè)出土壤有機(jī)質(zhì)的含量。
(3)經(jīng)EPO一階微分去除水分RF模型精度最高,決定系數(shù)R2為0.83,RPD為2.04,RMSE為1.58 g·kg-1,MAPE為0.14,能夠有效的去除土壤中水分因素的影響,精確的預(yù)測(cè)出土壤有機(jī)質(zhì)含量。本研究為南疆地區(qū)大尺度范圍內(nèi)進(jìn)行田間原位光譜預(yù)測(cè)土壤有機(jī)質(zhì)含量提供了參考,也為快速監(jiān)測(cè)土壤肥力,精準(zhǔn)灌溉及合理施肥提供了一定的研究意義。