摘" 要:為提高土壤屬性數(shù)字制圖預(yù)測(cè)精度,以及隨著遙感環(huán)境變量數(shù)據(jù)量的增加、算力的增強(qiáng)和開源深度學(xué)習(xí)框架的普及,數(shù)字土壤制圖正在從傳統(tǒng)的知識(shí)驅(qū)動(dòng)模型向數(shù)據(jù)驅(qū)動(dòng)的人工智能深度學(xué)習(xí)模型轉(zhuǎn)變。該文以土壤關(guān)鍵屬性有機(jī)碳為例,分析歸納土壤有機(jī)碳數(shù)字制圖深度學(xué)習(xí)模型的理論基礎(chǔ)、模型結(jié)構(gòu)、亟待解決的有關(guān)環(huán)境變量空間上下文信息和多模態(tài)數(shù)據(jù)整合及模型可解釋性等問題,旨在促進(jìn)人工智能深度學(xué)習(xí)模型在第三次全國土壤普查土壤屬性制圖中的應(yīng)用。
關(guān)鍵詞:數(shù)字土壤制圖;深度學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);土壤屬性;土壤有機(jī)碳
中圖分類號(hào):S127" " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號(hào):2096-9902(2024)12-0011-05
Abstract: In order to increase the prediction accuracy of digital mapping model of soil properties, accompanied by the increase in data quantity especially remote sensing environmental variables, the improvement of computing power, and the popularization of deep learning frameworks, the digital mapping model of soil propertiesis transitioning from traditional knowledge-driven models to data-driven artificial intelligent deep learning models. This article takes the key property of soil organic carbon as an example to analyze and summarize the theoretical basis, model structure, integration of relevant environmental variable spatial context information and multimodality data that urgently needs to be solved, and interpretability of deep learning models. The aim is to promote the application of artificial intelligent deep learning models in soil properties digital mapping of the Third National Soil Survey.
Keywords: digital soil mapping; deep learning; neural network; soil properties; soil organic carbon
土壤屬性圖是基于像元或柵格表達(dá)土壤物理、化學(xué)、生物等性質(zhì)的地理空間分布信息的模型,它是通過一組圖例和規(guī)則(如地圖投影、符號(hào)、文本)建立的真實(shí)土壤實(shí)體的比例尺模型。通過土壤屬性圖來發(fā)現(xiàn)和共享關(guān)于土壤屬性的質(zhì)量/數(shù)量的位置、關(guān)系、分布模式及趨勢(shì)等信息,能更好地服務(wù)于土壤資源的管理與開發(fā)利用?,F(xiàn)代土壤屬性圖是通過數(shù)字土壤制圖(DSM)方法/模型來實(shí)現(xiàn)的。模型的預(yù)測(cè)制圖精度越高,即驗(yàn)證指標(biāo)決定系數(shù)(R2)越高,均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)等越低,則產(chǎn)生的土壤屬性圖越有實(shí)用價(jià)值。為此,土壤學(xué)家和數(shù)字制圖工作者想方設(shè)法開發(fā)出幾十種數(shù)字土壤制圖模型,以求提高土壤屬性預(yù)測(cè)制圖精度。
當(dāng)前,數(shù)字土壤制圖模型的環(huán)境變量,如遙感大數(shù)據(jù)越來越容易獲取、云計(jì)算等平臺(tái)提供了越來越強(qiáng)大的算力、R和Python語言等的開源人工智能(AI)深度學(xué)習(xí)(DL)框架逐漸普及,這些因素為應(yīng)用深度學(xué)習(xí)模型對(duì)土壤屬性進(jìn)行預(yù)測(cè)制圖提供了條件,從而促進(jìn)DSM模型從傳統(tǒng)的知識(shí)驅(qū)動(dòng)模型(如地統(tǒng)計(jì)學(xué)模型等)向數(shù)據(jù)驅(qū)動(dòng)的AI模型(如隨機(jī)森林(RF)和深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)等)轉(zhuǎn)變,與此同時(shí),人工智能深度學(xué)習(xí)模型(AI-DL)的預(yù)測(cè)精度也在不斷提高。
國務(wù)院第三次全國土壤普查領(lǐng)導(dǎo)小組辦公室推薦了5種數(shù)字土壤制圖方法/模型[1]:地統(tǒng)計(jì)學(xué)模型(如普通克里格、回歸克里格)、確定性插值(如逆距離加權(quán)法)、數(shù)理統(tǒng)計(jì)(如多元線性回歸)、機(jī)器學(xué)習(xí)(如RF、CNN)和模糊推理方法。《第三次全國土壤普查土壤屬性圖與專題圖編制技術(shù)規(guī)范(修訂版)》中指出,“對(duì)一般面積大小的農(nóng)業(yè)區(qū)縣,表層樣點(diǎn)數(shù)平均達(dá)1 000個(gè)以上,一般決定系數(shù)R2應(yīng)大于0.5,RMSE數(shù)值越小越好”。當(dāng)一個(gè)農(nóng)業(yè)區(qū)縣土壤調(diào)查采樣方案一定時(shí),樣點(diǎn)數(shù)相同的條件下,采用更為先進(jìn)的深度學(xué)習(xí)模型,將有望能進(jìn)一步提升模型預(yù)測(cè)精度。本文在介紹數(shù)字土壤制圖深度學(xué)習(xí)模型理論的基礎(chǔ)之上,以土壤關(guān)鍵屬性有機(jī)碳為例,分析3種常用的AI-DL模型:多層感知機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、兩分支神經(jīng)網(wǎng)絡(luò),并指出深度學(xué)習(xí)模型亟待改進(jìn)的地方,旨在推動(dòng)AI-DL模型在土壤屬性制圖中的應(yīng)用,并為第三次全國土壤普查土壤屬性圖編制提供參考。
1" 土壤屬性數(shù)字制圖深度學(xué)習(xí)模型的理論基礎(chǔ)
數(shù)字土壤制圖方法/模型是以土壤發(fā)生學(xué)理論為基礎(chǔ),以定量的土壤-景觀關(guān)系模型(從俄國土壤學(xué)家道庫恰耶夫和美國土壤學(xué)家Jenny的概念公式,發(fā)展到“scorpan”概念模型[2])為依據(jù)的現(xiàn)代預(yù)測(cè)制圖技術(shù)?!皊corpan”概念模型表達(dá)式如下
S=f(C,O,R,P,a,n)。
“scorpan”模型將成土因素中的氣候(C)、生物(O)、地形(R)、母質(zhì)(P)、時(shí)間(a)和空間位置(n)作為預(yù)測(cè)因子,來建模土壤屬性(S)在空間分布中的大尺度趨勢(shì)性,用空間自相關(guān)模型來建模除去趨勢(shì)后的殘差的隨機(jī)性特征,通常要求殘差滿足地統(tǒng)計(jì)學(xué)的內(nèi)稟平穩(wěn)假定。
人工智能包括機(jī)器學(xué)習(xí)(ML),深度學(xué)習(xí)是ML的一個(gè)重要的分支領(lǐng)域。深度學(xué)習(xí)是從數(shù)據(jù)中學(xué)習(xí)表示的一種新方法,它利用經(jīng)過大數(shù)據(jù)集訓(xùn)練過的多層神經(jīng)網(wǎng)絡(luò)去解決復(fù)雜的信息處理任務(wù)(如回歸、分類等問題)。深度學(xué)習(xí)正在對(duì)科學(xué)技術(shù)和生產(chǎn)力產(chǎn)生革命性的促進(jìn)作用[3-4]。
自20世紀(jì)90年代以來,AI機(jī)器學(xué)習(xí)模型(用AI-ML表示),如RF、支持向量機(jī)(SVM)、Cubist、XGBoost和地理加權(quán)回歸等在DSM中流行起來,其中RF在土壤有機(jī)碳制圖中應(yīng)用最為廣泛[5-8]。但是AI-ML模型的輸入變量是土壤采樣點(diǎn)對(duì)應(yīng)的遙感環(huán)境變量數(shù)值組成的向量(圖1(a))。它是由土壤采樣點(diǎn)與遙感環(huán)境變量圖像進(jìn)行空間疊置分析后得到采樣點(diǎn)對(duì)應(yīng)的單個(gè)像元值組成的。由于該類向量數(shù)據(jù)沒有空間上下文信息,以RF為代表的AI-ML模型不具備整合土壤采樣點(diǎn)周圍遙感環(huán)境變量圖像空間上下文信息的能力,限制了景觀環(huán)境信息對(duì)土壤有機(jī)碳預(yù)測(cè)性能的提升[9]。相反,AI-DL模型,如CNN輸入的是遙感環(huán)境變量圖像的3D張量(圖1(b)),使得AI-DL模型具有整合遙感環(huán)境變量空間上下文信息的能力。人工智能機(jī)器學(xué)習(xí)模型通常被稱為淺層學(xué)習(xí)模型,而深度學(xué)習(xí)被認(rèn)為是深層學(xué)習(xí)模型,AI-DL比AI-ML具有更強(qiáng)的學(xué)習(xí)能力[9]。
2" 土壤有機(jī)碳數(shù)字制圖深度學(xué)習(xí)模型結(jié)構(gòu)
土壤碳(SC)包括有機(jī)碳(SOC)和無機(jī)碳(SIC),其中,SOC是土壤的關(guān)鍵屬性之一,它與土壤肥力、功能、生態(tài)以及氣候變化等密切相關(guān)。對(duì)土壤有機(jī)碳的高精度空間建模、預(yù)測(cè)與制圖是土壤時(shí)空變化研究中的重要科學(xué)問題[10]。從2019年開始,有3種人工智能深度學(xué)習(xí)模型被應(yīng)用到土壤有機(jī)碳制圖:①深度全連接網(wǎng)絡(luò)(DNN),該神經(jīng)網(wǎng)絡(luò)采用的是多層感知機(jī)(MLP)架構(gòu);②CNN;③循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[11-14],下面進(jìn)行分述。
2.1" 多層感知機(jī)
多層感知機(jī)MLP架構(gòu)的AI-DL模型(圖2)輸入變量是土壤采樣點(diǎn)位置的遙感環(huán)境變量像元所組成的向量,該模型本質(zhì)上是一個(gè)多元非線性回歸,它已成功應(yīng)用于南非(10個(gè)隱藏層)和全球(3個(gè)隱藏層)土壤有機(jī)碳制圖,且預(yù)測(cè)性能優(yōu)于RF和SVM等AI-ML數(shù)字土壤制圖模型[14-15]。
2.2" 單分支卷積神經(jīng)網(wǎng)絡(luò)
單分支卷積神經(jīng)網(wǎng)絡(luò)是目前土壤有機(jī)碳數(shù)字制圖常采用的AI-DL模型(圖3[8]),并被列為第三次全國土壤普查土壤屬性制圖的備選模型[1]。表1列出了不同研究者采用的CNN模型預(yù)測(cè)土壤有機(jī)碳的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)[7,9,16,16-20]。卷積神經(jīng)網(wǎng)絡(luò)模型已經(jīng)列入到第三次全國土壤普查土壤屬性制圖與專題技術(shù)規(guī)范中的數(shù)字土壤制圖的備選模型[1]。目前,CNN模型預(yù)測(cè)不同研究區(qū)土壤有機(jī)碳空間分布時(shí),其網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)(卷積層數(shù)、最大池化層數(shù)、Dropout層數(shù)、全連接層數(shù)和拉平層數(shù))的設(shè)置還不完全相同。
單分支CNN結(jié)構(gòu)的缺陷是:遙感、GIS等環(huán)境變量圖像中的空間上下文窗口大小必須一致,才能以給定維度(窗口的高、寬和通道數(shù))的3D張量形式輸入到神經(jīng)網(wǎng)絡(luò)中。遙感、GIS數(shù)據(jù)的空間分辨率通常是不一致的,如Landsat 9 OLI-2的多光譜波段空間分辨率為30 m,Sentinel -2A MSI多光譜波段空間分辨率為10 m或20 m。處理不同空間分辨率的遙感、GIS等環(huán)境變量圖像時(shí)要將其重采樣到相同的空間分辨率。單分支CNN網(wǎng)絡(luò)結(jié)構(gòu)輸入的遙感、GIS等環(huán)境變量圖像空間分辨率是經(jīng)過了重采樣處理,相應(yīng)地遙感環(huán)境變量空間上下文信息也經(jīng)過了重采樣處理,這可能會(huì)導(dǎo)致一些信息的丟失。
2.3" 兩分支卷積神經(jīng)網(wǎng)絡(luò)
如果將土壤有機(jī)碳制圖的神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì)為2個(gè)分支(圖4[20]),就可以將具有時(shí)間序列特征的氣候、物候等變量數(shù)據(jù)在采樣點(diǎn)對(duì)應(yīng)的單個(gè)像元值組成數(shù)值向量,輸入到一個(gè)單獨(dú)的非卷積神經(jīng)網(wǎng)絡(luò)分支(如MLP)中;較高空間分辨率的遙感環(huán)境變量數(shù)據(jù)仍然以3D張量的形式輸入到CNN分支。2個(gè)分支的輸出經(jīng)過連接(Concatenate)后輸入到全連接層中。Zhang等[19]采用兩分支CNN網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行土壤SOC數(shù)字制圖,其中一個(gè)分支是卷積模塊,用于捕獲遙感環(huán)境變量(地形、植被)空間上下文信息。另一個(gè)分支是長短期記憶(LSTM)模塊,用于捕獲與土壤有機(jī)碳相關(guān)的物候變量,因?yàn)槲锖蜃兞渴菚r(shí)間序列變量,因此采用了RNN中的LSTM結(jié)構(gòu)。
3" 土壤有機(jī)碳數(shù)字制圖的深度學(xué)習(xí)模型存在的問題
3.1" 遙感環(huán)境變量空間上下文信息和多模態(tài)數(shù)據(jù)整合的問題
遙感環(huán)境變量空間分辨率固定的情況下,輸入CNN的窗口大小就決定了輸入到CNN中的遙感環(huán)境變量空間上下文信息的多少。極端情況下,當(dāng)窗口設(shè)定為1×1,則遙感環(huán)境變量圖像只有一個(gè)像元(即土壤采樣點(diǎn)所在的像元)值輸入CNN,1個(gè)像元值是不具有空間上下文信息的。由表1可知,數(shù)字土壤制圖工作者設(shè)置的遙感環(huán)境變量空間上下文窗口的大小是多種的,如3×3……31×31等[9,16,21]。隨著窗口增大,輸入CNN的遙感環(huán)境變量空間上下文信息增多,數(shù)據(jù)量增大,與此同時(shí),神經(jīng)網(wǎng)絡(luò)模型參數(shù)也將增多,模型過擬合風(fēng)險(xiǎn)也隨之增大[9]。Yang等[16]認(rèn)為,窗口大小與輸入CNN模型的遙感環(huán)境變量空間上下文信息密切相關(guān),最優(yōu)的窗口應(yīng)與環(huán)境變量對(duì)土壤發(fā)育的影響尺度相關(guān)聯(lián)。但是,遙感環(huán)境變量空間分辨率對(duì)最優(yōu)窗口大小的影響規(guī)律仍不清楚,遙感環(huán)境變量空間上下文窗口對(duì)AI-DL模型的預(yù)測(cè)性能的影響以及最優(yōu)窗口的選擇(即遙感環(huán)境變量空間上下文窗口效應(yīng))有待深入研究。
土壤普查以及各種專題調(diào)查所產(chǎn)生的數(shù)據(jù)(包括歷史數(shù)據(jù),如第二次全國土壤普查數(shù)據(jù)、現(xiàn)有數(shù)據(jù))具有不同的模態(tài),如文本(土壤普查報(bào)告、科技論文等)、圖像(空、天、地遙感影像等)、圖形(土壤圖、土壤屬性圖、土壤專題評(píng)價(jià)圖等),以及第三次全國土壤普查時(shí)的調(diào)查視頻等,如何對(duì)這些多模態(tài)數(shù)據(jù)進(jìn)行整合,以實(shí)現(xiàn)土壤屬性的高精度預(yù)測(cè),這是AI-DL模型所面臨的一個(gè)重要挑戰(zhàn)。
3.2" 深度學(xué)習(xí)模型的可解釋性問題
人工智能學(xué)習(xí)過程中的基礎(chǔ)問題是泛化和可解釋性問題[22]。AI-DL和AI-ML模型是數(shù)據(jù)驅(qū)動(dòng)的空間預(yù)測(cè)模型,被認(rèn)為是“黑箱”和“灰箱”模型,而傳統(tǒng)地統(tǒng)計(jì)學(xué)模型是知識(shí)驅(qū)動(dòng)模型,被認(rèn)為是“白箱”模型[7-8,18]?!鞍紫洹蹦P驮谕该鞫群涂山忉屝苑矫嬉哂凇盎蚁洹焙汀昂谙洹蹦P汀1M管以CNN為代表的AI-DL模型在土壤有機(jī)碳預(yù)測(cè)精度方面比AI-ML和地統(tǒng)計(jì)學(xué)模型有了很大提高,但是,其可解釋性仍不如AI-ML和地統(tǒng)計(jì)學(xué)模型。因此,在提升數(shù)字土壤制圖預(yù)測(cè)精度的同時(shí),增強(qiáng)可解釋性已經(jīng)成了當(dāng)前AI-DL模型亟待解決的重要問題[23]。
參考文獻(xiàn):
[1] 國務(wù)院第三次全國土壤普查領(lǐng)導(dǎo)小組辦公室.第三次全國土壤普查土壤屬性制圖與專題技術(shù)規(guī)范(修訂版)[Z].第三次全國土壤普查技術(shù)規(guī)程,2023:378.
[2] ARROUAYS D, MCBRATNEY A, BOUMAS J, et al. Impressions of digital soil map: The good, the not so good, and making them even better[J].Geoderma Regional,2020(20):e00255.
[3] CHOLLET F. Deep learning with Python[M].Manning Publications,2021.
[4] BISHOP C M, BISHOP H. Deep learning: Foundations and Concepts[M]. Springer,2024.
[5] WADOUX A M J C, HEUVELINK G B M, LARK R M, et al. Ten challenges for the future of Pedometrics[J].Geoderma,2021(401):115155.
[6] WADOUX A M J C, ODEH I O A, MCBRATNEY A B. Overview of Pedometrics[J]. Encyclopedia of Soils in the Environment (Second Edition), 2023(4): 471-485.
[7] GRUNWALD S. Grand challenges in Pedometrics-AI research[J]. Frontiers in Soil Science,2021(1):714323.
[8] GRUNWALD S. Artificial intelligence and soil carbon modeling demystified: power,potentials, and perils[J].Carbon Footprints,2022(1):5.
[9] PADARIAN J, MINASNYB, MCBRATNEY A B. Using deep learning for digital soil mapping[J].Soil,2019(5):79-89.
[10] 張甘霖,史舟,朱阿興,等.土壤時(shí)空變化研究的進(jìn)展與未來[J].土壤學(xué)報(bào),2020,57(5):1060-1070.
[11] TAO F, ZHOU Z, HUANG Y, et al. Deep learning optimizes data-driven representation of soil organic carbon in earth system model over the conterminous United States[J].Frontiers in Big Data,2020,3(17):1-15.
[12] ODEBIRI O, MUTANGA O, ODINDI J, et al. Deep learning approaches in remote sensing of soil organic carbon: A review of utility, challenges, and prospects[J]. Environmental Monitoring amp; Assessment,2021(193):802.
[13] ODEBIRI O, ODINDI J, MUTANGA O. Basic and deep learning models in remote sensing of soil organic carbon estimation: A brief review[J]. International Journal of Applied Earth Observations and Geoinformation,2021(102):102389.
[14] ODEBIRI O, MUTANGA O, ODINDI J. Deep learning-based national scale organic carbon mapping with Sentinel-3 data[J]. Geoderma,2022(411):115695.
[15] PADARIAN J, MINASNY B, McBRATNEY A B, et al. Additional soil organic carbon storage potential in global croplands[J]. Soil,2021.
[16] YANG L, CAI Y Y, ZHANG L, et al. A deep learning method to predict soil organic carbon content at a regional scale using satellite-based phenology variables[J].International Journal of Applied Earth Observations and Geoinformation,2021(102):102428.
[17] WADOUX A M J C, PADARIAN J, MINASNY B. Multi-source data integration for soil mapping using deep learning[J].Soil,2019(5):107-109.
[18] PADARIAN J, McBRATNEY A B, MINASNYB. Game theory interpretation of digital soil mapping convolutional neural networks[J]. Soil,2020(6):389-397.
[19] ZHANG L, CAI Y Y,HUANG H, et al. A CNN-LSTM model for soil organic carbon content prediction with long term series of MODIS-based phenological variables[J]. Remote Sensing,2022(14):4441.
[20] ZENG P, SONG X,YANG H, et al. Digital soil mapping of soil organic matter with deep learning algorithms[J]. ISPRS International Journal of Geo-Information,2022(11):299.
[21] WADOUX A M J C. Using deep learning for multivariate mapping of soil with quantified uncertainty[J].Geoderma,2019(351):59-70.
[22] 劉瑜,郭浩,李海峰,等.從地理規(guī)律到地理空間人工智能[J].測(cè)繪學(xué)報(bào),2022,51(6):1062-1068.
[23] REICHSTEIN M, GAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data-driven earth system science[J]. Nature,2019(566):195-204.
基金項(xiàng)目:塔里木大學(xué)高教研究項(xiàng)目(TDGJYB2226)
作者簡介:伍維模(1971-),男,博士,教授。研究方向?yàn)檗r(nóng)業(yè)遙感與信息技術(shù)。