摘要:土壤是陸地生態(tài)系統(tǒng)中的核心,具有多種屬性,主要包括土壤質(zhì)地、土壤鹽度、土壤養(yǎng)分、土壤有機碳(Soil organic carbon,SOC)、土壤酸堿度、土壤含水率等,在動植物生長、調(diào)節(jié)氣候變化以及保護生物多樣性等方面發(fā)揮著關(guān)鍵作用。近些年來土壤問題變得日益嚴峻,量化土壤的各種屬性變得至關(guān)重要。通過分析總結(jié)土壤屬性空間預(yù)測的多元/逐步線性回歸、偏最小二乘回歸等線性回歸方法,支持向量機、隨機森林和人工神經(jīng)網(wǎng)絡(luò)等機器學習方法,以及多層感知器和卷積神經(jīng)網(wǎng)絡(luò)等深度學習方法,可以為提升土壤屬性的空間預(yù)測精度,緩解土壤問題,促進生態(tài)環(huán)境的可持續(xù)發(fā)展提供理論支撐。因此,在對區(qū)域土壤屬性進行空間預(yù)測時,應(yīng)充分考慮各種條件的影響,將多種空間預(yù)測方法相結(jié)合,以此提升土壤屬性的預(yù)測精度,促進土壤生態(tài)系統(tǒng)的健康發(fā)展。
關(guān)鍵詞:土壤;空間預(yù)測;土壤有機質(zhì);土壤養(yǎng)分;機器學習
中圖分類號:S159 文獻標志碼:A
A Review of Spatial Prediction Methods of Soil Properties in Modern Agriculture
LIANG Ruilin
(College of Architectural Engineering and Spatial Information, Shandong University of Technology,
Zibo, Shandong 255000, China)
Abstract: Soil is the core of terrestrial ecosystems, and it has a variety of properties, including soil texture, soil salinity, soil nutrients, soil organic carbon (SOC), soil pH, soil moisture content and so on. It plays a key role in animal and plant growth, regulating climate change and protecting biodiversity. In recent years, due to the worsening problem in soil, quantifying soil properties has become crucial. By analyzing and summarizing linear regression methods such as multivariate/stepwise linear regression and partial least squares regression for spatial prediction of soil properties, machine learning methods such as support vector machine, random forest and artificial neural network and deep learning methods such as multilayer perceptron and convolutional neural network, thus providing theoretical support for improving the spatial prediction accuracy of soil properties, alleviating soil problems and promoting the sustainable development of ecological environment. Therefore, when conducting spatial prediction of regional soil properties, the influence of various conditions should be considered and a variety of spatial prediction methods should be combined, so as to improve the prediction accuracy of soil properties and promote the healthy development of soil ecosystems.
Keywords: Soil; spatial prediction; soil organic matter; soil nutrient; machine learning
土壤是陸地生態(tài)系統(tǒng)中的核心,在動植物生長、調(diào)節(jié)氣候變化以及保護生物多樣性等方面發(fā)揮著重要的作用。土壤具有多種物理化學性質(zhì),主要包括土壤質(zhì)地、土壤鹽度、土壤養(yǎng)分、土壤有機碳、土壤酸堿度、土壤含水率等。土壤有機碳(Soil organic carbon,SOC)是反映土壤的結(jié)構(gòu)和功能、土壤肥力以及支持動植物健康生活的關(guān)鍵指標[1],在穩(wěn)定生態(tài)系統(tǒng)和促進陸地碳循環(huán)中起著關(guān)鍵作用,土壤碳(C)、氮(N)等養(yǎng)分,通過影響凋零物的分解、營養(yǎng)物質(zhì)的循環(huán)積累和土壤微生物運動[2],來影響土壤肥力和生產(chǎn)力,是決定植物營養(yǎng)水平的關(guān)鍵因素之一[3],土壤微生物可以促進植物養(yǎng)分的轉(zhuǎn)化和循環(huán),土壤鹽度對土壤養(yǎng)分循環(huán)、有機質(zhì)分解、植物生產(chǎn)力和生物多樣性有顯著影響[4]。近年來,由于城市化和工業(yè)化的高速發(fā)展,導致可耕種土地大量減少[5],由于施肥不足或不平衡,導致土壤肥力逐漸下降[6],土壤問題變得日益嚴峻,因此對土壤的各種屬性進行測定變得至關(guān)重要。傳統(tǒng)的土壤屬性測定主要通過室外土壤樣品采集和室內(nèi)實驗室分析來實現(xiàn)[7],這種測量方法需要耗費大量時間,成本較昂貴,效率低下[2],難以快速得到土壤屬性的預(yù)測結(jié)果,并且使用實驗室分析試劑還可能會釋放環(huán)境污染物分子[8],不利于生態(tài)環(huán)境的可持續(xù)發(fā)展。根據(jù)現(xiàn)有理論和實證研究[9],有學者發(fā)現(xiàn)土壤屬性空間預(yù)測可以快速高效的對土壤的各種屬性進行評估,并且具有經(jīng)濟、無損和成本效益高的優(yōu)點[2],及時診斷土壤養(yǎng)分、土壤有機碳等土壤屬性的含量也是提高農(nóng)業(yè)集約化和彌合產(chǎn)量差距的關(guān)鍵,在維持土壤功能和提供相關(guān)生態(tài)系統(tǒng)服務(wù)方面有著至關(guān)重要的作用[10]。因此,綜述土壤屬性空間預(yù)測研究,不僅可以為人類農(nóng)業(yè)活動提供有價值的數(shù)據(jù)和理論指導[9],還在現(xiàn)代農(nóng)業(yè)工程中具有重要的研究意義與應(yīng)用價值[7]。
1 方法總述
目前土壤屬性空間預(yù)測用到的方法有很多,主要包括線性回歸(Linear regression,LR)、機器學習(Machine learning,ML)和深度學習(Deep learning,DL)三種類型。在土壤屬性的空間預(yù)測過程中,各種模型的應(yīng)用過程多種多樣。部分研究采用單一預(yù)測模型對土壤屬性進行空間預(yù)測,如BANGROO等利用回歸克里格法(Regression-kriging,RK)分析預(yù)測變量在北克什米爾森林喜馬拉雅地區(qū)土壤有機碳和總氮空間定量中的應(yīng)用[11];也有部分研究將預(yù)測模型與環(huán)境協(xié)變量等其他因素相結(jié)合對土壤屬性進行空間預(yù)測,如LELAGO等將中紅外光譜(Mid-infrared spectroscopy,MIR)與偏最小二乘回歸方法(Partial least squares regression,PLSR)相結(jié)合對埃塞俄比亞選定地區(qū)的農(nóng)業(yè)土壤養(yǎng)分進行預(yù)測[8];還有部分研究將多種預(yù)測模型相結(jié)合,采用綜合方法對土壤屬性進行空間預(yù)測,PACINI等[12]在估算歐洲農(nóng)田表層土壤有機碳含量的研究中,將土壤氣候的自然參照(Natural references per pedoclimate)、數(shù)據(jù)驅(qū)動互惠建模(Data-driven reciprocal modeling)與碳景觀區(qū)概念(The concept of carbon landscape zones)三種方法采用集成建??蚣芟嘟Y(jié)合,提出一種新的集成建模方法(Ensemble modeling),對歐洲農(nóng)田表層的土壤有機碳進行空間預(yù)測。可以看出,土壤屬性的空間預(yù)測方法多種多樣,因此,本文對這幾種預(yù)測模型在土壤屬性空間預(yù)測中的具體應(yīng)用展開了相應(yīng)的介紹。
2 線性回歸模型在農(nóng)業(yè)土壤屬性空間預(yù)測中的應(yīng)用
回歸模型是對連續(xù)型變量進行預(yù)測的一種機器學習模型,主要包括線性回歸(Linear regression,LR)、多項式回歸(Polynomial regression)、集成學習(Ensemble learning)、嶺回歸(Ridge regression)、Lasso回歸(Lasso regression)等模型。在土壤屬性的空間預(yù)測研究中,LR是最常用的回歸方法,其基本原理是利用數(shù)理統(tǒng)計中的回歸分析確定兩種或兩種以上的變量間相互依賴的定量關(guān)系。LR主要包括偏最小二乘(Partial least squares regression,PLSR)、多元線性回歸(Multiple linear regression,MLR)、逐步線性回歸(Stepwise linear regression,SWLR)、分位數(shù)回歸(Quantile regression,QR)和廣義加性模型(Generalized additive model,GAM)等,均廣泛應(yīng)用于土壤屬性的評估與空間預(yù)測[5]。例如在之前的研究中,GUO等[13]采用LR模型檢驗自然土壤背景值校正的城市表層土壤微量元素濃度與總體沉積之間的相關(guān)性,用于評估大氣微量元素沉積對城市土壤污染的潛在影響。LOMBARDO等[14]采用QR模型對SOC進行空間預(yù)測,并探究了在半干旱農(nóng)業(yè)區(qū)不同SOC儲量下預(yù)測因子的作用。SIRSAT等[5]利用廣泛的回歸方法對土壤養(yǎng)分進行空間預(yù)測,自動預(yù)測了印度幾種具有不同養(yǎng)分的鄉(xiāng)村土壤的肥力,決定在農(nóng)業(yè)生產(chǎn)中施用適量的肥料來改善土壤肥力,并制定了相應(yīng)的肥料分配和消費政策。
2.1 多元/逐步線性回歸
MLR是含有多個變量的線性回歸模型,SWLR是可以自動從大量可供選擇的變量中逐個選取所需變量的線性回歸模型,二者均在土壤屬性的評估與空間預(yù)測中發(fā)揮著重要作用。例如在之前的研究中,VA??T等[15]基于可見光-近紅外漫反射光譜(Visible to near infrared-diffuse reflectance spectrum,VNIR-DRS),利用MLR模型,通過連續(xù)去除光譜技術(shù)預(yù)測土壤中可提取的營養(yǎng)物質(zhì)。WANG等[16]采用MLR模型,建立了預(yù)測土壤有機碳歸一化吸附系數(shù)(Soil organic carbon normalized absorption coefficients,KOC)的定量構(gòu)效關(guān)系(Quantitative structure-activity relationship,QSAR)模型,對SOC進行空間預(yù)測。有時還將MLR與SWLR相結(jié)合,形成逐步多元線性回歸模型(Stepwise multiple linear regression,SMLR),對土壤的各種屬性進行評估與空間預(yù)測。例如WANG等應(yīng)用SMLR和主成分回歸(Principal component regression,PCR)算法建立了不同變換方法預(yù)處理后的反射光譜數(shù)據(jù)與重金屬之間的關(guān)系,采用反射光譜技術(shù)對山東省典型污灌區(qū)土壤中的重金屬含量進行估算[17]。
2.2 偏最小二乘回歸
PLSR是一種多對多的線性回歸方法,適用于變量個數(shù)很多且都存在多重相關(guān)性,而樣本量又較少的情形。它可以通過從因變量和自變量的協(xié)方差矩陣中生成潛變量來去除數(shù)據(jù)集中的共線性[18],因此該模型可以使用共線且不獨立的預(yù)測變量[14]。并且它還可以同時實現(xiàn)多元線性回歸、主成分分析以及兩組變量之間的相關(guān)分析,因此廣泛應(yīng)用于土壤屬性的評估與空間預(yù)測。例如在之前的研究中,LI等[19]采用PLSR模型,研究土壤性質(zhì)、集料穩(wěn)定性和集料尺寸組成、可視化植被格局和植被恢復(fù)時間對C-N-P含量和化學計量學的影響。CAMBOU等[20]利用原位獲取的可見光-近紅外反射光譜(Visible to near infrared spectrum,Vis-NIRS)和篩干樣品,比較了局部PLSR與全局PLSR模型在預(yù)測區(qū)域土壤有機碳儲量方面的性能,得出基于光譜近鄰的局部PLSR優(yōu)于全局PLSR,并證明了使用建立在存檔土壤樣本上的Vis-NIRS庫可以準確地量化SOC儲量。DAS等[21]采用PLSR模型,基于Vis-NIRS對SOC進行空間預(yù)測,并得出將Vis-NIRS與PLSR相結(jié)合可以準確預(yù)測SOC含量。LELAGO等[8]將MIR光譜與PLSR模型相結(jié)合,對埃塞俄比亞選定地區(qū)的農(nóng)業(yè)土壤養(yǎng)分進行空間預(yù)測;然而,光譜波長和客觀變量之間不僅存在線性關(guān)系,還存在非線性關(guān)系[22],因此PLSR在預(yù)測非線性變量的SOC時存在一定局限性。
2.3 多種線性回歸方法組合應(yīng)用
在土壤屬性的空間預(yù)測中,除了以上兩種線性回歸模型,還有部分研究采用多種回歸模型進行空間預(yù)測。例如NOWKANDEH等[23]在估算伊朗半干旱地區(qū)的土壤有機質(zhì)(Soil organic matter,SOM)含量研究中,利用Hyperion影像,采用逐步回歸(Stepwise regression,SWR)、最小回歸(Minimum regression,MinR)、PLSR和PCR模型預(yù)測伊朗半干旱地區(qū)SOM的空間分布,得出SWR和PLSR在預(yù)測整個半干旱地區(qū)土壤有機質(zhì)中的精度較高。通過以上案例可以得出,LR模型具有建模速度快、可釋性好以及預(yù)測精度較高的優(yōu)點。然而,該模型無法較好的擬合非線性數(shù)據(jù),容易出現(xiàn)過擬合問題,因此在對土壤屬性進行空間預(yù)測時應(yīng)綜合考慮多種預(yù)測方法。
3 機器學習模型在農(nóng)業(yè)土壤屬性空間預(yù)測中的應(yīng)用
ML指通過輸入大量訓練數(shù)據(jù)對模型進行訓練,使模型掌握數(shù)據(jù)所蘊含的潛在規(guī)律,進而對新輸入的數(shù)據(jù)進行準確分類或預(yù)測的一種方法。ML模型有很多,主要包括支持向量機(Support vector machine,SVM)、隨機森林(Random forest,RF)、人工神經(jīng)網(wǎng)絡(luò)(Artificial neutral network,ANN)等,均廣泛用于土壤屬性的評估與空間預(yù)測,且應(yīng)用形式多樣。例如CHEN等[24]在繪制農(nóng)田土壤有機質(zhì)的動態(tài)圖譜研究中,比較了決策樹(Decision tree,DT)、裝袋決策樹(Bagging decision tree,BDT)、RF和梯度提升回歸樹(Gradient boosting regression trees,GBRT)四種機器學習算法對中國湖北省2000年至2017年18年間農(nóng)田SOM的空間預(yù)測性能,并繪制了每年500 m×500 m像素的農(nóng)田土壤有機質(zhì)圖,得出GBRT對SOM含量的預(yù)測效果最好。下面將分別介紹幾種常用的機器學習模型在具體土壤屬性空間預(yù)測案例中的應(yīng)用。
3.1 支持向量機
SVM是一類按監(jiān)督學習(Supervised learning)方式對數(shù)據(jù)進行二元分類的廣義線性分類器(Generalized linear classifier)。該模型的基本原理是求解學習樣本幾何間隔最大的分離超平面,以正確劃分訓練數(shù)據(jù)集。SVM是一種小樣本學習法,不僅算法簡單,還具有較好的“魯棒”性,因此在土壤屬性的空間預(yù)測中得到了廣泛的應(yīng)用。例如GAO等[25]采用SVM校正土壤團聚體結(jié)合態(tài)有機碳(Soil aggregate-associated organic carbon,SAOC)的預(yù)測模型,對SAOC進行多元預(yù)測,為大尺度預(yù)測SOC提供了可能。ABDOLI等[26]在利用遙感數(shù)據(jù)預(yù)測伊朗部分農(nóng)業(yè)土壤中SOC研究中,采用ANN、支持向量機回歸(Support vector regression,SVR)和基因表達式編程(Gene expression programming,GEP)等機器學習模型對SOC含量進行估算,得出SVR模型的預(yù)測精度更高,并得出將不同衛(wèi)星的遙感數(shù)據(jù)相結(jié)合可以提高SOC的預(yù)測精度。DEVIANTI等利用Vis-NIR光譜,結(jié)合SVR、偏最小二乘-人工神經(jīng)網(wǎng)絡(luò)(Partial least squares-artificial neural network,PLS-ANN)和梯度增強樹回歸(Gradient boosting regression trees,GBRT)三種機器學習方法預(yù)測印度尼西亞亞齊省的農(nóng)田土壤養(yǎng)分,并比較了三種機器學習算法的性能[3]。QI等[2]利用高光譜可見-近紅外光譜(Hyperspectral visible and near-infrared)數(shù)據(jù),并結(jié)合PLSR、LS-SVM和反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural network,BPNN) 3種回歸方法,建立土壤NPK預(yù)測模型,對土壤中的NPK進行建模和預(yù)測,為利用高光譜可見-近紅外光譜數(shù)據(jù)選擇校準方法和提高對土壤NPK的預(yù)測能力提供了一個框架。盡管SVM有眾多優(yōu)點,但是該模型對缺失的數(shù)據(jù)較為敏感,并且在解決非線性問題時沒有通用的解決方法,因此在對SOC進行評估與空間預(yù)測時還應(yīng)綜合考慮多種預(yù)測方法。
3.2 隨機森林
RF是一種由多個決策樹相結(jié)合而成的集成機器學習模型。集成學習(Ensemble-learning)通過訓練多個學習器并將它們結(jié)合起來共同解決一個問題,因此該方法的準確率高,在土壤屬性空間預(yù)測中具有較高的預(yù)測精度。例如在之前的研究中,LIU等[27]基于可見-近紅外高光譜成像(Visible to near infrared hyperspectral imaging,Vis-NIR-HSI),利用RF模型對土壤中的有機碳進行預(yù)測,得出成像光譜技術(shù)在預(yù)測未擾動土壤輪廓中的SOC中發(fā)揮著重要作用。多數(shù)研究通常將RF模型與其他模型進行對比,以探究模型在土壤屬性空間預(yù)測中的預(yù)測精度。例如WANG等[28]利用收集的澳大利亞東部半干旱地區(qū)的數(shù)據(jù),對比評估了增強回歸樹(Boosted regression trees,BRT)和RF模型在預(yù)測SOC儲量中的效果,并得出RF模型具有較高的預(yù)測精度。OPPONG SARKODIE等[29]分別采用Cubist模型和RF模型預(yù)測捷克共和國41個天然林區(qū)地表有機層、礦質(zhì)表土層和底土層碳儲量的空間分布,并結(jié)合網(wǎng)格搜索超調(diào)提高預(yù)測精度,得出RF模型在地表有機層、礦質(zhì)表土層和底土層森林土壤SOC儲量預(yù)測中的精度均高于Cubist模型,并且與RF模型相比,Cubist模型在預(yù)測時需要使用更多的協(xié)變量。PAUL S等在利用遙感數(shù)據(jù)對SOC和黏粒(Clay,CL)進行制圖的研究中,將來自多個陸地衛(wèi)星圖像、地形指數(shù)和土壤調(diào)查信息的野外數(shù)據(jù)、土壤和土壤指數(shù)相結(jié)合,利用RF和廣義增強回歸模型(Generalized enhanced regression model,GBM)對三角洲農(nóng)田SOC和CL進行數(shù)字制圖,預(yù)測土壤的工作性能,得出RF在各方面的預(yù)測精度均高于GBM[30]。還有部分研究將RF模型與其他模型相結(jié)合來提升土壤屬性的空間預(yù)測精度。例如CHINILIN等[31]在結(jié)合機器學習和環(huán)境協(xié)變量繪制俄羅斯土壤中有機碳圖的研究中,使用RF和空間交叉驗證技術(shù)(Spatial cross-validation techniques)相結(jié)合的三維建模方法,預(yù)測俄羅斯土壤中SOC含量的橫向和縱向分布,證明了將遙感數(shù)據(jù)與地形和氣候變量相結(jié)合有利于對土壤有機碳空間變異的估算,并得出土壤剖面深度和季節(jié)性溫度是最關(guān)鍵的預(yù)測因子。從以上案例中可以看出,RF模型具有較高的預(yù)測精度,且不易出現(xiàn)過擬合問題,因此被許多研究者所采用。然而,該方法也存在一定的局限性,即在處理取值劃分較多的特征時擬合效果較差。
3.3 人工神經(jīng)網(wǎng)絡(luò)
ANN也是一種常用的機器學習模型,它基于多層感知器(Multilayer perceptron,MLP),采用反向傳播算法(Back-propagation algorithm,BP)計算網(wǎng)絡(luò)中權(quán)值所需的梯度。該模型由輸入層、隱藏層和輸出層三層組成,采用并行分布處理(Parallel distributed processing)方法,具有較高的精度,有利于對土壤屬性進行評估與空間預(yù)測。例如KIM等[6]利用ANN模型估算土壤侵蝕和養(yǎng)分濃度,得出在提高作物產(chǎn)量的同時應(yīng)盡量減少環(huán)境污染問題的結(jié)論。PELLEGRINI等[32]采用ANN模型對葡萄園土壤中的微生物生物量進行預(yù)測,得出ANN模型比LR模型具有更好的擬合度,即ANN模型具有較高的預(yù)測性能。WERE等[33]將ANN與模糊邏輯相結(jié)合,設(shè)計了一種新的基于進化遺傳優(yōu)化的自適應(yīng)神經(jīng)模糊推理系統(tǒng)ANFIS-EC,對毛烏素森林保護區(qū)東部土壤的SOC儲量進行空間預(yù)測,并繪制了SOC分布圖。PUDE?KO等[34]在比較傅里葉紅外光譜(Fourier transform-near infrared,F(xiàn)T-NIR)和近紅外高光譜成像(Near-infrared hyperspectral imaging,NIR-HSI)對礦山土壤中有機碳濃度(Concentrations of organic carbon,Corg )和總氮(Total nitrogen,Nt)含量的預(yù)測性能的研究中,采用ANN方法建立了126個樣本的預(yù)測模型,得出基于NIR-HSI的模型對Corg含量預(yù)測的準確性明顯高于基于FT-NIR數(shù)據(jù)的模型。通過以上案例可以看出,ANN模型具有較高的預(yù)測精度,但該模型也存在所有神經(jīng)網(wǎng)絡(luò)模型所共有的缺點,即在使用過程中需要大量數(shù)據(jù),進行大量訓練,導致訓練時間長,并且模型的計算過程較為復(fù)雜,運算量大。
4 深度學習模型在農(nóng)業(yè)土壤屬性空間預(yù)測中的應(yīng)用
DL是一種能學習極其復(fù)雜模式的多層神經(jīng)網(wǎng)絡(luò),主要用于對大規(guī)模的數(shù)據(jù)進行處理和預(yù)測,具有學習能力極強、適應(yīng)性強以及可移植性好的優(yōu)點,在土壤屬性的空間預(yù)測中發(fā)揮著重要的作用。常用的DL模型主要有MLP、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)、深度信念網(wǎng)絡(luò)(Deep belief networks,DBN)、長短期記憶網(wǎng)絡(luò)(Long short-term memory neural networks,LSTM)、門控循環(huán)單元(Gate recurrent unit,GRU)等,均廣泛應(yīng)用于土壤屬性的評估與空間預(yù)測。例如WANG等采用一維卷積神經(jīng)網(wǎng)絡(luò)(One dimensional-convolutional neural network,1D-CNN)、二維卷積神經(jīng)網(wǎng)絡(luò)(Two dimensional-convolutional neural network,2D-CNN)、DBN、RNN、LSTM、GRU 6種DL方法,對中國南疆的SOC進行空間預(yù)測,并得出LSTM模型表現(xiàn)最好,DBN模型表現(xiàn)最差,1D-CNN、2D-CNN、RNN和DBN算法對不同的樣本量比較敏感[35]。下面將具體對土壤屬性空間預(yù)測中常用的幾種DL模型進行介紹。
4.1 多層感知器
MLP是最簡單、最經(jīng)典的神經(jīng)網(wǎng)絡(luò)。它由輸入層、隱含層和輸出層三層結(jié)構(gòu)組成,并且不同層之間全連接,具有較高的準確性和較強的表達能力,因此可以用其對土壤屬性進行評估與空間預(yù)測。例如JANG等[36]在評估人類活動對澳大利亞納莫伊山谷下游土壤有機碳變化的影響研究中,采用MLP模型,以10 cm為間隔,預(yù)測土壤表層至1 m深度的SOC含量,并得出,灌溉種植區(qū)SOC損失量最大,其次為非灌溉種植區(qū)和牧草地,并且所有種植區(qū)的SOC儲量均表現(xiàn)出至少5 tC·ha-1的下降,表層SOC損失量最大,且隨深度增加呈指數(shù)性遞減。然而,MLP在預(yù)測時需要較多參數(shù),并且訓練難度較大,因此在土壤屬性的空間預(yù)測的過程中,可以綜合考慮MLP與其他深度學習模型。
4.2 卷積神經(jīng)網(wǎng)絡(luò)
CNN是目前公認的主流深度學習模型之一,成功應(yīng)用于圖像處理、土壤空間預(yù)測和其他地理要素預(yù)測中[37]。CNN模型一般由輸入層、卷積層、激活層、池化層、光柵化層、全連接層和輸出層組成。其中,光柵化層有時可以省略,卷積層、激活層和池化層是CNN的核心結(jié)構(gòu),三者可以疊加重復(fù)使用。CNN模型在土壤屬性的空間預(yù)測中應(yīng)用非常廣泛。例如NG等[38]采用CNN模型,使用可見/近紅外、中紅外以及它們的組合光譜同時對土壤屬性進行空間預(yù)測,得出CNN模型具有較高的預(yù)測精度。CHEN等[39]基于實驗室Vis-NIR光譜數(shù)據(jù),采用CNN模型,對土壤濕度進行空間預(yù)測,得出CNN模型的預(yù)測精度較高,并得出基于知識的遷移學習方法是一種高效的土壤屬性空間預(yù)測方法。HOSSEINPOUR-ZARNAQ等[40]在利用Vis-NIR光譜數(shù)據(jù)預(yù)測土壤屬性的研究中,使用吸光度光譜數(shù)據(jù)開發(fā)了1D-CNN模型,對土壤屬性進行空間預(yù)測,并證明使用CNN模型和Vis-NIR光譜數(shù)據(jù)可以快速準確的評估土壤屬性。YANG等[41]在利用衛(wèi)星物候變量預(yù)測區(qū)域尺度上的土壤有機碳含量研究中,利用CNN模型,將植被物候變量與自然地理變量相結(jié)合,研究空間鄰域大小對土壤預(yù)測的影響,并得出CNN模型在預(yù)測SOC含量中具有較高的精度,陸面物候指標是有效的SOC預(yù)測因子。通過以上案例可以看出,CNN模型具有較高的預(yù)測精度和效率,但同時也存在一些不足,比如由于需要處理大量數(shù)據(jù)導致該模型的訓練速度較慢,并且有時易出現(xiàn)過擬合問題,導致其在訓練數(shù)據(jù)上表現(xiàn)良好而在測試數(shù)據(jù)中的表現(xiàn)較差。
5 結(jié)論與討論
通過以上綜述,我們可以得出土壤屬性的空間預(yù)測方法多種多樣,且各有優(yōu)缺點。通過對土壤屬性進行空間預(yù)測,可以探究土壤各種屬性對土壤肥力以及植物生長的影響,治理土壤污染,解決當下日益嚴峻的土壤問題,并且可以提升土壤肥力,增加作物的產(chǎn)量,對實行精準農(nóng)業(yè),土地退化監(jiān)測,土地利用管理,保護生態(tài)環(huán)境以及實現(xiàn)我國雙碳目標具有重要意義。因此,在對區(qū)域土壤屬性進行空間預(yù)測時,應(yīng)充分考慮當?shù)刈匀画h(huán)境條件以及社會經(jīng)濟條件的影響,選取最合適的預(yù)測方法,將多種空間預(yù)測方法相結(jié)合,以此來提升土壤屬性的預(yù)測精度,促進土壤生態(tài)系統(tǒng)的健康發(fā)展。
參考文獻
[1] ORTON T G, THORNTON C M, PAGE K L, et al. Evaluation of remotely sensed imagery to monitor temporal changes in soil organic carbon at a long-term grazed pasture trial[J]. Ecological Indicators, 2023, 154: 110614.
[2] QI H J, PAZ-KAGAN T, KARNIELI A, et al. Evaluating calibration methods for predicting soil available nutrients using hyperspectral VNIR data[J]. Soil and Tillage Research, 2018, 175: 267-275.
[3] DEVIANTI, SUFARDI, RAMAYANTY B, et al. Vis-NIR Spectra Combined with Machine Learning for Predicting Soil Nutrients in Cropland From Aceh Province, Indonesia[J]. Case Studies in Chemical and Environmental Engineering.
[4] ZHANG G L, BAI J H, ZHAI Y J, et al. Microbial diversity and functions in saline soils: A review from a biogeochemical perspective[J]. Journal of Advanced Research, 2023: S2090-S1232(23)00178-9.
[5] SIRSAT M S, CERNADAS E, FERN?NDEZ-DELGADO M, et al. Automatic prediction of village-wise soil fertility for several nutrients in India using a wide range of regression methods[J]. Computers and Electronics in Agriculture, 2018, 154: 120-133.
[6] KIM M, GILLEY J E. Artificial Neural Network estimation of soil erosion and nutrient concentrations in runoff from land application areas[J]. Computers and Electronics in Agriculture, 2008, 64(2): 268-275.
[7] LIU K, WANG Y F, WANG X D, et al. Characteristic bands extraction method and prediction of soil nutrient contents based on an analytic hierarchy process[J]. Measurement, 2023, 220: 113408.
[8] LELAGO A, BIBISO M. Performance of mid infrared spectroscopy to predict nutrients for agricultural soils in selected areas of Ethiopia[J]. Heliyon, 2022, 8(3): e09050.
[9] SHAO W Y, WANG Q Z, GUAN Q Y, et al. Distribution of soil available nutrients and their response to environmental factors based on path analysis model in arid and semi-arid area of Northwest China[J]. The Science of the Total Environment, 2022, 827: 154254.
[10] TIAGO R T, BUDIMAN M, ALEX M, et al. Estimating plant-available nutrients with XRF sensors: Towards a versatile analysis tool for soil condition assessment[J]. Geoderma, 2023, 439: 116701.
[11] BANGROO S A, NAJAR G R, ACHIN E, et al. Application of predictor variables in spatial quantification of soil organic carbon and total nitrogen using regression Kriging in the North Kashmir forest Himalayas[J]. CATENA, 2020, 193: 104632.
[12] PACINI L, ARBELET P, CHEN S C, et al. A new approach to estimate soil organic carbon content targets in European croplands topsoils[J]. The Science of the Total Environment, 2023, 900: 165811.
[13] GUO Y Y, DU E Z, LI B H, et al. Significant urban hotspots of atmospheric trace element deposition and potential effects on urban soil pollution in China[J]. Journal of Cleaner Production, 2023, 415: 137872.
[14] LOMBARDO L, SAIA S, SCHILLACI C, et al. Modeling soil organic carbon with Quantile Regression: Dissecting predictors' effects on carbon stocks[J]. Geoderma, 2018, 318: 148-159.
[15] VA??T R, KODE?OV? R, BOR?VKA L, et al. Consideration of peak parameters derived from continuum-removed spectra to predict extractable nutrients in soils with visible and near-infrared diffuse reflectance spectroscopy (VNIR-DRS)[J]. Geoderma, 2014, 232-234: 208-218.
[16] WANG Y, CHEN J W, YANG X H, et al. In silico model for predicting soil organic carbon normalized sorption coefficient (K(OC)) of organic chemicals[J]. Chemosphere, 2015, 119: 438-444.
[17] WANG F, LI C F, WANG J N, et al. Concentration estimation of heavy metal in soils from typical sewage irrigation area of Shandong Province, China using reflectance spectroscopy[J]. Environmental Science and Pollution Research International, 2017, 24(20): 16883-16892.
[18] MUNNAF M A, GUERRERO A, NAWAR S, et al. A combined data mining approach for on-line prediction of key soil quality indicators by Vis-NIR spectroscopy[J]. Soil and Tillage Research, 2021, 205: 104808.
[19] LI W Q, LIU Y J, ZHENG H, et al. Complex vegetation patterns improve soil nutrients and maintain stoichiometric balance of terrace wall aggregates over long periods of vegetation recovery[J]. CATENA, 2023, 227: 107141.
[20] CAMBOU A, ALLORY V, CARDINAEL R, et al. Comparison of soil organic carbon stocks predicted using visible and near infrared reflectance (VNIR) spectra acquired in situ vs. on sieved dried samples: Synthesis of different studies[J]. Soil Security, 2021, 5: 100024.
[21] DAS B, CHAKRABORTY D, SINGH V K, et al. Partial least square regression based machine learning models for soil organic carbon prediction using visible–near infrared spectroscopy[J]. Geoderma Regional, 2023, 33: e00628.
[22] NAWAR S, MUNNAF M A, MOUAZEN A M. Machine learning based on-line prediction of soil organic carbon after removal of soil moisture effect[J]. Remote Sensing, 2020, 12(8): 1308.
[23] MALLAH NOWKANDEH S, NOROOZI A A, HOMAEE M. Estimating soil organic matter content from Hyperion reflectance images using PLSR, PCR, MinR and SWR models in semi-arid regions of Iran[J]. Environmental Development, 2018, 25: 23-32.
[24] CHEN D, CHANG N J, XIAO J F, et al. Mapping dynamics of soil organic matter in croplands with MODIS data and machine learning algorithms[J]. The Science of the Total Environment, 2019, 669: 844-855.
[25] GAO C R, YAN X B, QIAO X X, et al. Multivariate prediction of soil aggregate-associated organic carbon by simulating satellite sensor bands[J]. Computers and Electronics in Agriculture, 2023, 209: 107859.
[26] ABDOLI P, KHANMIRZAEI A, HAMZEH S, et al. Use of remote sensing data to predict soil organic carbon in some agricultural soils of Iran[J]. Remote Sensing Applications: Society and Environment, 2023, 30: 100969.
[27] LIU S Y, CHEN J Y, GUO L, et al. Prediction of soil organic carbon in soil profiles based on visible–near-infrared hyperspectral imaging spectroscopy[J]. Soil and Tillage Research, 2023, 232: 105736.
[28] WANG B, WATERS C, ORGILL S, et al. Estimating soil organic carbon stocks using different modelling techniques in the semi-arid rangelands of eastern Australia[J]. Ecological Indicators, 2018, 88: 425-438.
[29] OPPONG SARKODIE V Y, VA??T R, POULADI N, et al. Predicting soil organic carbon stocks in different layers of forest soils in the Czech Republic[J]. Geoderma Regional, 2023, 34: e00658.
[30] PAUL S S, COOPS N C, JOHNSON M S, et al. Mapping soil organic carbon and clay using remote sensing to predict soil workability for enhanced climate change adaptation[J]. Geoderma, 2020, 363: 114177.
[31] CHINILIN A, SAVIN I Y. Combining machine learning and environmental covariates for mapping of organic carbon in soils of Russia[J]. The Egyptian Journal of Remote Sensing and Space Sciences, 2023, 26(3): 666-675.
[32] PELLEGRINI E, ROVERE N, ZANINOTTI S, et al. Artificial neural network (ANN) modelling for the estimation of soil microbial biomass in vineyard soils[J]. Biology and Fertility of Soils, 2021, 57(1): 145-151.
[33] WERE K O, TIEN BUI D, DICK ? B, et al. A novel evolutionary genetic optimization-based adaptive neuro-fuzzy inference system and geographical information systems predict and map soil organic carbon stocks across an afromontane landscape[J]. Pedosphere, 2017, 27(5): 877-889.
[34] PUDE?KO A, CHODAK M, ROEMER J, et al. Application of FT-NIR spectroscopy and NIR hyperspectral imaging to predict nitrogen and organic carbon contents in mine soils[J]. Measurement, 2020, 164: 108117.
[35] WANG Y, CHEN S C, HONG Y S, et al. A comparison of multiple deep learning methods for predicting soil organic carbon in Southern Xinjiang, China[J]. Computers and Electronics in Agriculture, 2023, 212: 108067.
[36] JANG H J, DOBARCO M R, MINASNY B, et al. Assessing human impacts on soil organic carbon change in the Lower Namoi Valley, Australia[J]. Anthropocene, 2023, 43: 100393.
[37] TIEN BUI D, HOANG N D, MART?NEZ-?LVAREZ F, et al. A novel deep learning neural network approach for predicting flash flood susceptibility: A case study at a high frequency tropical storm area[J]. The Science of the Total Environment, 2020, 701: 134413.
[38] NG W, MINASNY B, MONTAZEROLGHAEM M, et al. Convolutional neural network for simultaneous prediction of several soil properties using visible/near-infrared, mid-infrared, and their combined spectra[J]. Geoderma, 2019, 352: 251-267.
[39] CHEN Y, LI L, WHITING M, et al. Convolutional neural network model for soil moisture prediction and its transferability analysis based on laboratory Vis-NIR spectral data[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 104: 102550.
[40] HOSSEINPOUR-ZARNAQ M, OMID M, SARMADIAN F, et al. A CNN model for predicting soil properties using VIS–NIR spectral data[J]. Environmental Earth Sciences, 2023, 82(16): 382.
[41] YANG L, CAI Y Y, ZHANG L, et al. A deep learning method to predict soil organic carbon content at a regional scale using satellite-based phenology variables[J]. International Journal of Applied Earth Observation and Geoinformation, 2021, 102: 102428.
責任編輯:李菊馨
第一作者:梁瑞琳,在讀本科生,研究方向為農(nóng)業(yè)遙感,E-mail:749968515@qq.com。
收稿日期:2023-09-16