李夢(mèng)佳,王 磊,劉洪斌*,武 偉
(1.西南大學(xué)資源環(huán)境學(xué)院,重慶 400716;2.西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院,重慶 400715;3.重慶市數(shù)字農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室,重慶 400716)
【研究意義】土壤有機(jī)質(zhì)(Soil Organic Matter,SOM)是土壤的重要組成部分,與土壤肥力存在正相關(guān)關(guān)系,是反映土壤肥力的重要特征,與環(huán)境、大氣圈、生物圈等的可持續(xù)發(fā)展存在聯(lián)系[1-2],受到不同因素的綜合影響,具有高度的空間差異性。利用不同模型預(yù)測(cè)有機(jī)質(zhì)的空間分布,分析不同預(yù)測(cè)模型的差異,對(duì)土壤肥力研究、農(nóng)業(yè)可持續(xù)發(fā)展有重要的意義[3]?!厩叭搜芯窟M(jìn)展】近幾十年來(lái),地統(tǒng)計(jì)學(xué)方法被普遍用來(lái)描述和預(yù)測(cè)土壤數(shù)據(jù)的空間分布,已有的研究表明地統(tǒng)計(jì)學(xué)是研究土壤特征及其不一致性空間分配、減少評(píng)估誤差的有效方法[4-6]。普通克里格因其操作簡(jiǎn)便而成為最廣泛使用的地統(tǒng)計(jì)學(xué)方法之一,國(guó)內(nèi)外研究者運(yùn)用普通克里格預(yù)測(cè)了土壤有機(jī)碳、pH、有機(jī)質(zhì)、堿解氮、有效磷、速效鉀及微量元素的空間分布,并分析了與其他預(yù)測(cè)模型預(yù)測(cè)結(jié)果的差異,認(rèn)為普通克里格可以用于預(yù)測(cè)不同土壤數(shù)據(jù)的空間分布[7-11]。隨著信息技術(shù)的發(fā)展,分類與回歸樹、隨機(jī)森林等機(jī)器學(xué)習(xí)算法被應(yīng)用到土壤數(shù)據(jù)空間分布預(yù)測(cè)中,國(guó)內(nèi)外研究者運(yùn)用機(jī)器學(xué)習(xí)模型預(yù)測(cè)了土壤水分、有機(jī)碳、pH、有機(jī)質(zhì)及全氮的空間分布[12-16],研究表明隨機(jī)森林等能較好地模擬環(huán)境變量與土壤數(shù)據(jù)變量的關(guān)系,能夠有效地解決土壤數(shù)據(jù)變量與環(huán)境變量之間的非線性問(wèn)題,是現(xiàn)在被廣泛應(yīng)用的方法?!颈狙芯壳腥朦c(diǎn)】普通克里格之所以具有較好的預(yù)測(cè)效果,是因?yàn)樗心芰κ构烙?jì)誤差變化最小化[17]。普通克里格方法基于變量的空間自相關(guān)性,依賴于所有樣點(diǎn)的空間關(guān)系確定,一般情況下,獲得有較好代表性的空間關(guān)系需要數(shù)量足夠大和空間覆蓋比較好的樣本集,因此普通克里格要求樣本數(shù)量較多、分布均勻及代表性好[12]。克里金法的主要缺點(diǎn)是當(dāng)樣本量少時(shí)預(yù)測(cè)將變得不確定,并且無(wú)法模擬因海拔高度、氣候和植被等差異引起的土壤特性局部變化,這個(gè)缺點(diǎn)可以通過(guò)大量采樣和使用與土壤特性高度相關(guān)的環(huán)境變量來(lái)解決[17]。隨著信息技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)預(yù)測(cè)模型被廣泛應(yīng)用,但隨機(jī)森林等屬于黑箱技術(shù),依據(jù)它們所獲得的結(jié)果難以直觀地了解土壤與環(huán)境變量之間的定量關(guān)系[18],而且尋找與研究變量相關(guān)性強(qiáng)的、容易獲取且廉價(jià)的環(huán)境變量具有一定挑戰(zhàn)性[19],此外研究變量可能受到人為活動(dòng)的影響,但是人為因子影響不穩(wěn)定且不易獲得定量數(shù)據(jù)。由此可知,不同的預(yù)測(cè)模型各有優(yōu)缺點(diǎn),本研究是要利用充分的采樣點(diǎn)比較不同模型的預(yù)測(cè)能力。【擬解決的關(guān)鍵問(wèn)題】本文結(jié)合地形、氣候、植被和成土母質(zhì)等9個(gè)環(huán)境變量,利用分類與回歸樹、隨機(jī)森林、隨機(jī)森林殘差克里格和普通克里格4種預(yù)測(cè)模型對(duì)研究區(qū)土壤有機(jī)質(zhì)含量進(jìn)行空間分布預(yù)測(cè)制圖,得到研究區(qū)有機(jī)質(zhì)含量空間分布特征,為土壤屬性空間變異研究提供依據(jù),并比較不同預(yù)測(cè)模型的預(yù)測(cè)精度,分析不同預(yù)測(cè)模型繪制空間分布圖的差異,為高密度采樣區(qū)制圖方法的選取提供參考。
長(zhǎng)壽區(qū)位于重慶市中部、長(zhǎng)江三峽庫(kù)區(qū)上游,地理位置為106°49′~107°27′E,29°43′~30°12′N,總面積為1423.62 km2,研究區(qū)DEM及樣點(diǎn)分布見圖1。該地區(qū)屬四川盆地東部平行嶺谷褶皺低山丘陵區(qū),為典型低山丘陵地帶,低山丘陵區(qū)的坡度較緩、起伏不大。亞熱帶濕潤(rùn)季風(fēng)氣候,常年平均氣溫17.68 ℃,常年降水量1162.7 mm,常年平均無(wú)霜期360 d。研究區(qū)土類包括水稻土、紫色土、潮土、黃壤和石灰土,其中水稻土占總耕地面積61.69 %,紫色土占總耕地面積35.05 %,潮土占總耕地面積0.25 %,黃壤和石灰土占總耕地面積3.02 %[20]。研究區(qū)成土母質(zhì)包括二疊系和三疊系灰?guī)r,三疊系須家河組砂巖,下侏羅統(tǒng)自流井組粉砂巖,中侏羅統(tǒng)沙溪廟組粉砂巖和上侏羅統(tǒng)遂寧組砂泥巖(圖2)。
1.2.1 土壤有機(jī)質(zhì)數(shù)據(jù)獲取 土壤有機(jī)質(zhì)樣點(diǎn)數(shù)據(jù)從長(zhǎng)壽區(qū)測(cè)土配方施肥項(xiàng)目中獲取,共有5162個(gè)樣本點(diǎn),采樣時(shí)間集中在2009年,采樣深度為20 cm,采樣點(diǎn)空間分布情況如圖1所示。采集土壤樣本的同時(shí),記錄采樣點(diǎn)經(jīng)緯度、高程、土壤類型、地形部位等信息。采樣點(diǎn)土壤類型包括:紫色土(50.4 %)、水稻土(45.4 %)、黃壤(2.6 %)、潮土(1.3 %)、石灰土(0.3 %)。土壤樣品帶回實(shí)驗(yàn)室后在室內(nèi)自然風(fēng)干,過(guò)篩后采用重鉻酸鉀測(cè)法測(cè)定土壤有機(jī)質(zhì)含量。
1.2.2 環(huán)境變量數(shù)據(jù)獲取 土壤有機(jī)質(zhì)的空間分布受到地形、氣候、植被和成土母質(zhì)等因素的影響,本文選取9個(gè)環(huán)境變量:高程(Elevation,ELE)、相對(duì)坡度位置(Relative Slope Position,RSP)、溝谷深度(Valley Depth,VD)、地形濕度指數(shù)(Topographic Wetness Index,TWI)、垂直到溝谷距離(Vertical Distance to Channel Network,VDCN))、歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、年均溫(Annual Average Temperature,ANTP)、年降水量(Annual Precipitation,ANPR)和成土母質(zhì)(Strata,ST)。
(1)數(shù)字高程模型(DEM)數(shù)據(jù)來(lái)源于中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心地理空間數(shù)據(jù)云平臺(tái)(http://www.gscloud.cn),空間分辨率為30 m。DEM數(shù)據(jù)通過(guò)SAGA GIS v.6.4提取4個(gè)地形因子:相對(duì)坡度位置(RSP),溝谷深度(VD),地形濕度指數(shù)(TWI)和垂直到溝谷距離(VDCN)。
(2)歸一化植被指數(shù)(NDVI)數(shù)據(jù)從http://ladsweb.nascom.nasa.gov下載獲得,空間分辨率為250 m。下載的遙感影像經(jīng)過(guò)大氣校正、輻射校正和幾何校正,通過(guò)Savitzky-Golay濾波去除時(shí)間序列中的噪聲,并通過(guò)最鄰近法重采樣獲得分辨率30 m的NDVI數(shù)據(jù)。
(3)年均溫(ANTP)和年降水量(ANPR)數(shù)據(jù)來(lái)源于世界氣象數(shù)據(jù)庫(kù)(http://www.worldclim),空間分辨率為1000 m。
(4)成土母質(zhì)(ST)數(shù)據(jù)來(lái)源于全國(guó)第二次土壤普查,比例尺為1∶50 000。
1.3.1 分類與回歸樹 分類與回歸樹(Classification and Regression Tree,CART)是一種監(jiān)督分類方法,它假設(shè)決策樹為二叉樹,利用訓(xùn)練樣本來(lái)構(gòu)造二叉樹并進(jìn)行決策分類。CART可以用于分類或連續(xù)變量預(yù)測(cè),可以處理非線性、非正態(tài)分布的數(shù)據(jù),包容數(shù)據(jù)的缺失和錯(cuò)誤,具有結(jié)構(gòu)清楚、計(jì)算簡(jiǎn)單和適用性廣等優(yōu)點(diǎn)[21]。構(gòu)造CART樹分為樹生長(zhǎng)和樹剪枝兩個(gè)步驟:首先基于總樣本生成一個(gè)多層次、多葉節(jié)點(diǎn)的決策樹,當(dāng)所有葉節(jié)點(diǎn)中的樣本數(shù)為1或決策樹高度到達(dá)用戶設(shè)置的閾值時(shí)停止建樹,生成的決策樹足夠大,能充分反映數(shù)據(jù)之間的聯(lián)系;然后對(duì)決策樹進(jìn)行剪枝,從產(chǎn)生的一系列子樹中選擇適當(dāng)大小的樹,對(duì)未知數(shù)據(jù)進(jìn)行準(zhǔn)確預(yù)測(cè)[22-23]。
1.3.2 隨機(jī)森林 隨機(jī)森林(Random Forest,RF)是由多個(gè)決策樹形成的組合預(yù)測(cè)模型,是CART模型的擴(kuò)展。RF克服了CART模型過(guò)度擬合的問(wèn)題,能夠估計(jì)影響變量的重要性[24],但對(duì)樣本數(shù)據(jù)集的大小較為敏感。RF的計(jì)算步驟為:從總樣本中有放回的隨機(jī)選出N個(gè)樣本構(gòu)建回歸樹,不進(jìn)行剪枝操作,余下的樣本作為袋外數(shù)據(jù),袋外數(shù)據(jù)用來(lái)評(píng)價(jià)模型性能和自變量的重要性,通過(guò)投票或取平均值的方法,得到回歸樹最終預(yù)測(cè)結(jié)果。RF方法中的兩個(gè)重要參數(shù)是樹的數(shù)量和每個(gè)非葉子節(jié)點(diǎn)上可供選擇的變量數(shù)。
1.3.3 隨機(jī)森林殘差克里格 隨機(jī)森林殘差克里格(Random Forest with Residual Kriging,RFRK)是一種結(jié)合了RF與OK的混合地統(tǒng)計(jì)方法,它考慮了變量間的非線性關(guān)系及目標(biāo)變量的空間自相關(guān)性,提高了預(yù)測(cè)精度。通過(guò)RF算法得到的預(yù)測(cè)值與觀測(cè)值之間存在殘差,如果這些殘差存在空間自相關(guān)性,可以將殘差當(dāng)作隨機(jī)變量,通過(guò)克里格提高對(duì)未知點(diǎn)的預(yù)測(cè)精度。RFRK的計(jì)算步驟為:首先使用RF得到研究區(qū)有機(jī)質(zhì)的預(yù)測(cè)值,計(jì)算RF預(yù)測(cè)殘差,然后對(duì)預(yù)測(cè)殘差進(jìn)行OK插值,最后將RF預(yù)測(cè)值和OK插值誤差相加得到預(yù)測(cè)結(jié)果。
1.3.4 普通克里格 普通克里格(Ordinary Kriging,OK)是一種隨機(jī)性局部插值法,用已知點(diǎn)的樣本估計(jì)未知點(diǎn)的值,考慮變量的隨機(jī)性。OK著重于空間自相關(guān)因素,用擬合的半變異直接進(jìn)行插值,通用方程式為:
(1)
式中,z為未知點(diǎn)的估計(jì)值,zx為x點(diǎn)的已知值,wx為x點(diǎn)的權(quán)重,n為用于估算的已知點(diǎn)數(shù)。權(quán)重不僅與估算點(diǎn)和已知點(diǎn)之間的半變異有關(guān),還與已知點(diǎn)之間的半變異有關(guān)。
根據(jù)模型構(gòu)建的原則和相關(guān)研究,隨機(jī)選取總樣點(diǎn)的80 %作為訓(xùn)練集,余下20 %作為驗(yàn)證集,訓(xùn)練集用于構(gòu)建預(yù)測(cè)模型,驗(yàn)證集用于評(píng)估模型的預(yù)測(cè)精度。統(tǒng)計(jì)指標(biāo)包括平均絕對(duì)誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error,RMSE)和決定系數(shù)(Coefficient of Determination,R2),當(dāng)MAE和RMSE值越小、R2值越接近1時(shí),模型精度越高。使用多個(gè)統(tǒng)計(jì)指標(biāo)很難對(duì)預(yù)測(cè)模型精度進(jìn)行排序,因此,本文使用能夠代表所有選定統(tǒng)計(jì)指標(biāo)(MAE,RMSE,R2)的整體評(píng)價(jià)指標(biāo)(Global Performance Indicator,GPI)對(duì)模型精度進(jìn)行排序,結(jié)果顯示GPI值越大,預(yù)測(cè)模型總體效果越好[25-26]。計(jì)算公式分別為:
(2)
(3)
(4)
(5)
土壤有機(jī)質(zhì)含量的描述性統(tǒng)計(jì)列于表1,可見總樣本均值為17.46 g·kg-1,取值范圍為5.10~78.80 g·kg-1,土壤有機(jī)質(zhì)含量整體上屬于中等水平。土壤有機(jī)質(zhì)含量的變異系數(shù)為33.73 %,屬于中等變異程度,表明研究區(qū)內(nèi)土壤有機(jī)質(zhì)具有一定的變異性,適合空間局部估計(jì)[27]。
表1 研究區(qū)采樣點(diǎn)土壤有機(jī)質(zhì)含量描述性統(tǒng)計(jì)Table 1 Descriptive statistics of soil organic matter content in the study area
從5162個(gè)總樣本點(diǎn)中隨機(jī)選取4100個(gè)樣本點(diǎn)構(gòu)建預(yù)測(cè)模型,剩余1062個(gè)樣本點(diǎn)用于評(píng)價(jià)不同預(yù)測(cè)模型的精度。普通克里格法要求輸入數(shù)據(jù)呈正態(tài)分布,但研究區(qū)土壤有機(jī)質(zhì)含量的偏度大于1,不符合正態(tài)分布,因此對(duì)研究區(qū)SOM數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,數(shù)據(jù)經(jīng)轉(zhuǎn)換后符合要求。
2.2.1 土壤有機(jī)質(zhì)含量與氣候、地形和植被的相關(guān)性分析 土壤有機(jī)質(zhì)含量與年均溫(ANTP)、歸一化植被指數(shù)(NDVI)、相對(duì)坡度位置(RSP)、年降水量(ANPR)和垂直到溝谷距離(VDCN)呈極顯著負(fù)相關(guān),相關(guān)系數(shù)分別為-0.25、-0.13、-0.10、-0.06、-0.06。土壤有機(jī)質(zhì)含量與高程(ELE)、溝谷深度(VD)、地形濕度指數(shù)(TWI)呈極顯著正相關(guān),相關(guān)系數(shù)分別為0.18、0.18、0.11。
通過(guò)SOM與ELE、VD、TWI、RSP、NDVI、ANTP、ANPR和VDCN的相關(guān)性分析,證實(shí)所選的環(huán)境變量對(duì)研究區(qū)SOM有顯著影響,應(yīng)參與CART、RF和RFRK的模型構(gòu)建(表2)。
表2 土壤有機(jī)質(zhì)含量與環(huán)境變量的相關(guān)性Table 2 Pearson’s correlations between soil organic matter content and environmental variable
2.2.2 成土母質(zhì)對(duì)土壤有機(jī)質(zhì)含量的影響 土壤有機(jī)質(zhì)含量在不同成土母質(zhì)中存在顯著差異(P<0.05),二疊系和三疊系灰?guī)r發(fā)育的土壤有機(jī)質(zhì)含量最高,為27.34 g·kg-1,而下侏羅統(tǒng)自流井組粉砂巖發(fā)育的土壤有機(jī)質(zhì)含量最低,為15.17 g·kg-1。說(shuō)明成土母質(zhì)對(duì)土壤有機(jī)質(zhì)含量的空間分布有顯著影響,應(yīng)參與CART、RF和RFRK的模型構(gòu)建,這與Guo等學(xué)者的研究結(jié)果一致[28](表3)。
表3 成土母質(zhì)對(duì)土壤有機(jī)質(zhì)含量的影響Table 3 The influence of strata on soil organic matter content
通過(guò)半方差分析可以得到變量的空間自相關(guān)性和最優(yōu)擬合模型,用于OK預(yù)測(cè)模型構(gòu)建。研究中除了土壤有機(jī)質(zhì)直接使用OK預(yù)測(cè)模型進(jìn)行插值外,在RFRK預(yù)測(cè)模型插值過(guò)程中也用到OK預(yù)測(cè)模型,因此SOM(對(duì)數(shù)轉(zhuǎn)換)和RF預(yù)測(cè)殘差都需要進(jìn)行半方差分析。
采用GS+軟件計(jì)算半方差,結(jié)果(表4)表明,SOM(對(duì)數(shù)轉(zhuǎn)換)和RF預(yù)測(cè)殘差的最優(yōu)擬合模型為指數(shù)模型,塊金效應(yīng)分別為12 %和9 %。塊金效應(yīng)表示空間相關(guān)性強(qiáng)弱,如果塊金效應(yīng)小于25 %,表示強(qiáng)空間自相關(guān)性,說(shuō)明變量具有很好的空間結(jié)構(gòu)性[29-30],研究中的塊金效應(yīng)均小于25 %,屬于強(qiáng)空間自相關(guān)性,空間變異主要受結(jié)構(gòu)性因素(例如成土母質(zhì)、地形和氣候)的影響。
OK預(yù)測(cè)模型著重考慮空間自相關(guān)因素,用擬合的半變異模型直接進(jìn)行插值,研究中的SOM(對(duì)數(shù)轉(zhuǎn)換)和RF預(yù)測(cè)殘差屬于強(qiáng)空間自相關(guān)性,滿足OK預(yù)測(cè)模型的使用要求,有條件取到較好的插值結(jié)果。
構(gòu)建CART、RF預(yù)測(cè)模型時(shí),通過(guò)網(wǎng)格搜索與交叉驗(yàn)證確定預(yù)測(cè)模型的最優(yōu)參數(shù)組,最后確定CART預(yù)測(cè)模型中最小子節(jié)點(diǎn)、最小父節(jié)點(diǎn)和最大樹深度分別為10、20、20,RF預(yù)測(cè)模型中樹的數(shù)量和每個(gè)非葉子節(jié)點(diǎn)上可供選擇的變量數(shù)量分別為500個(gè)和3個(gè),CART、RF預(yù)測(cè)模型在MatLab軟件中構(gòu)建。OK預(yù)測(cè)模型在ArcGIS軟件中構(gòu)建,需要的擬合模型及參數(shù)通過(guò)半方差分析得到(表4)?;赗F預(yù)測(cè)模型得到變量的預(yù)測(cè)值,計(jì)算預(yù)測(cè)殘差,然后對(duì)預(yù)測(cè)殘差進(jìn)行OK插值,最后將RF預(yù)測(cè)值和OK插值誤差相加構(gòu)建RFRK預(yù)測(cè)模型。
表4 土壤有機(jī)質(zhì)含量的最優(yōu)半方差函數(shù)模型及參數(shù)Table 4 The semi-variance model and parameters for soil organic matter content
不同預(yù)測(cè)模型的精度見表5和圖3。CART、RF、RFRK、OK的GPI值分別為-2.25、-0.80、0、0.71,預(yù)測(cè)模型整體精度由低到高排序?yàn)镃ART 表5 不同土壤有機(jī)質(zhì)含量預(yù)測(cè)模型精度Table 5 The accuracy of different prediction models on soil organic matter content 在使用不同預(yù)測(cè)模型繪制的空間分布圖(圖4)中,土壤有機(jī)質(zhì)分布的總體趨勢(shì)一致,土壤有機(jī)質(zhì)含量整體上屬于中等水平,高值主要集中在西部的明月山地區(qū),而東部地區(qū)的有機(jī)質(zhì)含量偏低,中部地區(qū)的有機(jī)質(zhì)含量分布不均、高低錯(cuò)落。模型精度最低的CART預(yù)測(cè)模型繪制的空間分布圖,出現(xiàn)邊界明顯的塊狀區(qū)域。OK預(yù)測(cè)模型與RF、RFRK預(yù)測(cè)模型相比,OK預(yù)測(cè)模型繪制的空間分布圖更平滑,RF和RFRK預(yù)測(cè)模型繪制的空間分布圖對(duì)局部細(xì)節(jié)刻畫更精細(xì)。 本研究中的地統(tǒng)計(jì)學(xué)預(yù)測(cè)模型OK整體精度高于機(jī)器學(xué)習(xí)預(yù)測(cè)模型CART、RF 和RFRK。研究區(qū)樣點(diǎn)密度較高、分布較均勻,半方差模型的隨機(jī)性會(huì)隨著采樣間隔的減小而減小,變量的空間相關(guān)性增強(qiáng),在半方差分析中研究區(qū)土壤有機(jī)質(zhì)含量呈現(xiàn)強(qiáng)烈的空間自相關(guān)性,空間自相關(guān)性極大地提高了模型的性能[31],因此依賴于空間自相關(guān)性的OK預(yù)測(cè)模型精度高。Pouladi等[12]的研究結(jié)果同樣表明對(duì)于采樣密度較大的區(qū)域,克立格法可以不需要輔助變量而直接預(yù)測(cè)土壤有機(jī)質(zhì)含量;而在觀測(cè)點(diǎn)數(shù)量有限的地區(qū),結(jié)合輔助因子的方法表現(xiàn)更好[32]。機(jī)器學(xué)習(xí)模型通過(guò)模擬環(huán)境變量與土壤有機(jī)質(zhì)含量的非線性關(guān)系,預(yù)測(cè)未知位置的土壤有機(jī)質(zhì)含量,在土壤屬性受多種環(huán)境因素共同作用時(shí),參與構(gòu)建模型的指標(biāo)越多,機(jī)器學(xué)習(xí)的預(yù)測(cè)能力可以得到越好的挖掘,而對(duì)于成土環(huán)境相對(duì)單一的區(qū)域,使用易于操作的地統(tǒng)計(jì)方法可以獲得理想的制圖效果[33]。謝恩澤等[19]在研究中提出:尋找與土壤有機(jī)質(zhì)含量相關(guān)性強(qiáng)的、容易獲取且廉價(jià)的輔助因子具有一定挑戰(zhàn)性,這增加了機(jī)器學(xué)習(xí)預(yù)測(cè)模型的復(fù)雜性。分析表明采樣密度、空間自相關(guān)性和環(huán)境變量對(duì)研究結(jié)果有影響,所以當(dāng)研究區(qū)已有土壤數(shù)據(jù)庫(kù),且數(shù)據(jù)庫(kù)中土壤采樣點(diǎn)密度較高、分布較均勻,同時(shí)研究區(qū)位于坡度較緩、起伏不大的低山丘陵區(qū),可以考慮采用操作簡(jiǎn)單的OK預(yù)測(cè)模型繪制土壤有機(jī)質(zhì)含量空間分布圖,有效降低工作量和工作難度。 機(jī)器學(xué)習(xí)預(yù)測(cè)模型整體精度由低到高排序?yàn)镃ART 通過(guò)對(duì)比分析4種不同預(yù)測(cè)模型繪制的空間分布圖,發(fā)現(xiàn)不同預(yù)測(cè)模型的土壤有機(jī)質(zhì)空間分布總體趨勢(shì)一致,但局部細(xì)節(jié)存在差異,這與姜賽平等[35]研究結(jié)果一致。RF和RFRK預(yù)測(cè)模型繪制的空間分布圖不是光滑的連續(xù)曲面,而且CART預(yù)測(cè)模型繪制的空間分布圖出現(xiàn)邊界明顯的塊狀區(qū)域,這是因?yàn)樵诓捎没貧w樹方法繪制的土壤有機(jī)質(zhì)空間分布圖過(guò)程中,每一個(gè)節(jié)點(diǎn)處土壤有機(jī)質(zhì)含量值都是不連續(xù)的,因此導(dǎo)致生成的土壤有機(jī)質(zhì)空間分布圖不是一個(gè)平滑的連續(xù)面,并且在節(jié)點(diǎn)較少的情況下,會(huì)導(dǎo)致與現(xiàn)實(shí)不符的土壤突變現(xiàn)象[36]??死锔癫逯凳腔谝阎目臻g數(shù)據(jù)對(duì)未知空間數(shù)據(jù)進(jìn)行估算,利用擬合模型將離散數(shù)據(jù)插值為連續(xù)的曲面數(shù)據(jù),因此OK預(yù)測(cè)模型比機(jī)器學(xué)習(xí)模型繪制的空間分布圖更平滑。 在不同預(yù)測(cè)模型繪制的空間分布圖中,土壤有機(jī)質(zhì)分布的總體趨勢(shì)一致,高值主要集中在西部的明月山地區(qū),而東部地區(qū)的有機(jī)質(zhì)含量偏低,中部地區(qū)的有機(jī)質(zhì)含量分布不均、高低錯(cuò)落。不同空間分布圖在局部細(xì)節(jié)中存在差異,RF和RFRK預(yù)測(cè)模型繪制的分布圖對(duì)局部細(xì)節(jié)刻畫更精細(xì),OK預(yù)測(cè)模型繪制的空間分布圖更平滑。 預(yù)測(cè)模型整體精度由低到高排序?yàn)镃ART2.5 使用不同預(yù)測(cè)模型繪制空間分布圖
3 討 論
4 結(jié) 論