趙彥鋒 李豪杰 陳 杰 孫志英 梁思源
(1 鄭州大學水利與環(huán)境學院地理信息科學系,鄭州 450001)
(2 河南省國土資源調查規(guī)劃院,鄭州 450016)
(3 鄭州大學公共管理學院,鄭州 450001)
由于土壤—成土因子之間的多尺度、非線性關系,基于詹尼方程和傳統數學預測土壤屬性具有較大局限性;1950—2000年,假設土壤類型與其屬性的對應關系,土壤類型連接法是進行土壤有機碳密度(Soil organic carbon density,SOCD)和碳儲量估算的常用方法[1-7]。隨著現代數學發(fā)展,以及數字高程、遙感等制圖輔助變量的類型日益廣泛和易得,以數字土壤制圖(Digital soil mapping,DSM)方式進行土壤有機碳密度制圖和儲量估算成為主流。當前,土壤有機碳的DSM方法總體分為三類[8]:第一,純粹的空間方法,即地統計學方法。第二,確定性關系建模方法。最初這類方法主要指線性回歸,現在則廣泛地包括空間地理回歸、人工神經網絡、回歸樹等現代數學方法[9-16]。第三,混合模型方法?;旌夏P椭饕腔貧w克里格概念的延伸:回歸可以是線性回歸,也可以是以土壤或土地類型單元提取的趨勢(均值或中值),也可以是各種機器學習算法的結果。也即在各種算法基礎上,對預測殘差進一步應用克里格插值的方法均被稱為回歸克里格[17-20]。
盡管土壤有機碳的DSM技術發(fā)展較快,但由于大空間尺度土壤碳密度的影響因素復雜,同時由于剖面深層土壤碳密度與地形、遙感等環(huán)境協變量的關系減弱[21-22],使得1m土體碳密度制圖的DSM模型并不總能取得理想精度。因此,土壤類型連接法在大、中尺度土體的碳密度制圖方面仍具有較強的實踐價值[23]。同時,土壤類型連接法在土壤碳密度制圖和碳儲量估算方面已取得不少成果,應將其與DSM法系統對比,以便更加客觀看待之。對于現有的DSM方法而言,一些比較研究中強調模型法較克里格法有效[24],或者回歸克里格方法能有效結合模型方法和空間方法的優(yōu)勢等[16-19]。Brungard等[25]比較11種機器學習算法,發(fā)現隨機森林、人工神經網絡、支持向量機等復雜的建模方法一般優(yōu)于k臨近距離、多元邏輯回歸等簡單建模方法。顯然,上述研究者傾向于認為更復雜和精密的方法對提高土壤制圖效果具有重要意義,但該觀點并不全面。如Heung等[26]比較了10種機器學習算法在數字土壤制圖中的效果,發(fā)現k鄰近距離法和支持向量機法優(yōu)于人工神經網絡和隨機森林等其他方法;而Taghizadeh-Mehrjardi等[27]在類似的研究中表明人工神經網絡和決策樹法優(yōu)于支持向量機、K鄰近距離和隨機森林;上述結論存在矛盾之處。一些研究認識到研究條件對結果的制約,如對于不同類型區(qū)或者參數組合不同,隨機森林方法效果差異較大;而Martin等[15]發(fā)現當更有效的土壤有機碳驅動因子被代入BRT(Boosted regression trees,BRT)模型,再進行殘差克里格的實際意義不大。
可見,土壤預測制圖效果并不完全取決于方法的精密性和復雜性。更本質的原因,應從土壤變異性被制圖方法揭示的程度探究。這可能涉及本底數據的詳細性(如土壤類型)、關鍵協變量的應用、方法對關鍵變量的利用效率等多種因素。本文以南陽市1m土體土壤有機碳密度制圖為例,擬通過對土壤類型連接法、普通線性回歸、空間地理回歸、隨機森林、普通克里格、回歸克里格等的系統對比,分析土壤變異解釋機制對制圖效果的影響。
研究區(qū)位于河南省西南部(圖1),面積2.66萬 km2,北亞熱帶氣候,年降雨量800 mm;西北部為中山、低山,東部為低山丘陵,中南部為河流沖積平原,東南續(xù)接桐柏山地。按發(fā)生分類體系,土壤可分為10個土類(圖2a)、19個亞類、37個土屬。
收集第二次土壤普查時期土壤剖面數據488個,隨機抽取其中90%,即439個樣點為訓練練據進行1m土體SOCD制圖,其余49個剖面作為驗證數據(圖1)。土壤剖面樣點記錄了特征土層深度區(qū)間、每層的土壤有機質、容重、礫石含量和砂姜含量等數據,按下式計算SOCD[3-7],
圖1 研究區(qū)及土壤樣點分布圖Fig. 1 Distribution of the study area and soil samples
式中,SOCD為土壤剖面有機碳密度(kg m-2);θi為第i層>2 mm礫石(砂姜作為礫石對待)含量(%);ρi為第i層土壤容重(g cm-3);Ci為第i層土壤有機碳含量(g kg-1),由有機質含量×0.58換算得到;Ti為第i層土層的厚度(cm);n為參與計算的土壤層次總數;100為用于單位換算的常數。訓練數據在土壤表層的有機質(organic matter,OM)含量和1m土體的SOCD統計見表1。
表1 1m土體土壤有機碳密度和表層土壤有機質的統計特征Table 1 Statistical features of SOCD(soil organic carbon density )of 1 m thickness soil body and OM content of topsoil
圖2 南陽市土壤類型(a)和土壤表層有機質含量(b)示意圖Fig. 2 Soil map(a)and topsoil OM content map(b)of Nanyang City
地形變量:收集該區(qū)30 m分辨率數字高程,取高程、坡度、坡向、平面曲率、剖面曲率、復合地形指數作為預測土壤有機碳的地形變量。
土壤表層有機質數據:土壤剖面最上部土層的有機質含量數據結構性變異比例為67.5%,將其Kriging插值圖(圖2b)作為預測土壤1m 土體SOCD的變量之一。
遙感數據:南陽市第二次土壤普查工作主要在1980—1983年間開展,各縣并不一致,遙感影像年份無法做到與土壤樣本采集時間的完全對應。因此,遙感影像數據的應用定位為對土壤母質、土壤相對濕度、山區(qū)自然植被差異等信息的補充,上述信息受人為土地利用干擾相對較少,可放寬對遙感時效的要求。特在可得數據源中選擇了1990年5月2日云量為0%的TM影像(通過地理空間數據云平臺下載),當地主要農作物——小麥此時已成熟,影像數據更利于反映自然植被類型差異和土壤差異。提取TM1-7波段、歸一化植被指數、穗帽變換(Tasseled cap transformation,TC)的3個成分亮度、綠度、濕度(Wetness of TC,TCW)等作為土壤有機碳密度制圖的環(huán)境協變量。
基于南陽市1∶5萬數字化土壤圖,按土屬、亞類、土類3個分類級別進行概括,依次得到土屬圖、亞類圖和土類圖;分別采用均值連接法(Mean法)、中值連接法(Median法)將土壤剖面計算得到的碳密度值連接到土壤圖圖斑。
WLS回歸:即加權最小二乘法線性回歸。在普通最小二乘法回歸(OLS)公式Y=XB+μ基礎上(其中Y為因變量,X為自變量,B為回歸系數,μ為隨機誤差),構建權重矩陣W=DDT,使D-1Y=D-1XB+D-1μ,按 ?B=(XTW-1X)-1XTW-1Y計算回歸系數,即為WLS回歸。WLS回歸改變了OLS回歸中所有變量貢獻相同的假設,而使變異較大的觀察值對分析的影響小、變異小的觀察值對分析的影響大,可取得更理想的回歸模型。本研究采用變量乘冪的導數為權重值,冪值在SPSS中根據最大似然法估計λ的最優(yōu)值。得到WLS方程后,在ArcGIS10.3中進行計算,實現SOCD的預測。
GWR回歸:即地理權重最小二乘法回歸[10,28]。其公式為其中(μi,νi)表示第i個采樣點坐標,βj(μi,νi)為第i個采樣點的第j個自變量xij的回歸系數,εi為該點的回歸誤差。GWR回歸中,周圍采樣點根據其距離預測點i的距離計算其進入回歸方程時的權重,每個采樣點相對于其他采樣點均有一個權重系數,n個采樣點就構成n×n空間權重對角矩陣,本文采用二次距離衰減函數擬合權重系數,公式為wij=[1-(dij/h)2]2∣dij<h,wij=0∣dij>h,其中dij為兩點間的歐氏距離,h為衰減函數的帶寬,超出h認為樣點的作用權重為0。帶寬的確定一般有固定內核和自適應內核兩種方法,前者給出確定性帶寬,后者則根據樣點密度分布進行自動調整,本文采用自適應內核。通過計算wij構造權重矩陣W(μi,νi),進而估算回歸系數 ?B=(XTW(μi,νi)X)-1XTW(μi,νi)Y。應用ArcGIS 10.3地理回歸工具模塊進行計算。
隨機森林(Random Forest,簡寫為RF):由Breiman[29]改進分類樹算法而來,是一種機器學習算法。其優(yōu)點是:可以避免過擬合、能同時利用名義變量(如土壤類型)和數值變量;每次運行隨機森林,均隨機抽取1/3的數據不參與建模,被稱為范圍外數據(Out of Bag,簡稱OOB),模型自動對OOB數據實測值和模型運算值交叉檢驗,計算OOB數據變異的解釋比例,是對整個訓練數據變異解釋比的無偏估計。
根據驗證數據集驗證和訓練數據集交叉驗證的相關系數(r)、平均預測誤差(ME)、均方根預測誤差(RMSE)、變異解釋比(Varex)對SOCD預測結果進行評判[11-12]。其中
式中,ε為預測誤差,為預測誤差均值,z為實測有機碳儲量,為實測有機碳儲量均值。
隨機森林的范圍外數據分析可提供SOCD關鍵協變量解釋力無偏估算途徑,當訓練樹足夠多時,結果具有高度的重復性(表2)。由表2可知:第1,土屬對SOCD變異的解釋能力最強,其次是亞類、土類、有機質,3次隨機計算的平均解釋力分別達到40.8%、37.9%、37.0%和21.9%。第2,土屬與土壤OM組合達到了57.5%的變異解釋比,附加其他變量過多又導致變異解釋比降低,所有變量全部應用僅達到52.7%的變異解釋比。第3,排除土壤OM和土壤類型信息,其他變量對SOCD變異的綜合解釋能力不超過2%。第4,高程、坡度和濕度指數(TCW)等單獨使用對SOCD變異的解釋力為負,即完全沒有規(guī)律性,但與一些重要變量結合,則提高原有變量的解釋力,如OM+TCW解釋力上升為28.9%。上述結果定量說明:(1)在預測SOCD方面土壤類別是最重要的變量,其次是土壤表層OM。(2)所有變量共同參與建模并不能達到最高的解釋力,可見非重要變量進入模型增加了噪聲。(3)高程、坡度、TCW等的作用效果是依附主要變量的,即主要參與對主要變量預測結果進一步細分,可以認為它們只解釋局部的數據變異性。
純空間方法不需借助協變量,而是從空間相關性的角度對土壤SOCD變異性進行解釋。盡管SOCD空間相關性與其關鍵協變量在空間上的變化規(guī)律可能有關,但就數學原理而言,它們提供了完全不同的解釋機制。變異函數分析表明,SOCD在14 400 m變程范圍內具有40.5%的空間變異結構性(圖3a),即可由空間相關性解釋的總方差為40.5%,這一數值低于關鍵參數組合所能達到的最大變異解釋力,而與土壤類型對SOCD變異的解釋力接近。
回歸Kriging模型對土壤SOCD變異的解釋可分為趨勢模型和殘差變異函數特征兩個部分。很顯然,趨勢和殘差不是互相獨立的,不同方法提取趨勢值后殘差的空間變異結構性顯著不同。以土壤類型均值、中值提取趨勢值后的的SOCD殘差呈現較強的隨機變異特征,理論上不能再借助空間相關性途徑獲得補充性的變異解釋;采用土壤類型和土壤表層OM等關鍵變量組合進行隨機森林建模計算的結果殘差亦如此;而WLS、GWL和RF(OM+TCW)方法提取趨勢后的殘差空間變異結構性達到33.1%、25.0%和25.9%,殘差可提供額外的變異解釋。
表2 基于隨機森林的預測變量對SOCD變異的解釋力Table 2 Variance explanation of covariates for predicting SOCD of 1m thickness soil body based on RF model
土類、亞類、土屬的Mean連接法結果見圖3。土類圖、亞類圖、土屬圖斑數分別為2 213、2 866、4 057,從亞類~土屬的圖斑詳細度增加較大,制圖細節(jié)的變化也主要發(fā)生在亞類~土屬的變化。驗證數據集參數的改善也主要體現這一特征(表3):其數據集驗證的r分別為0.51、0.51和0.58,Varex為0.29、0.30和0.35。ME為-0.41、-0.43、-0.31;Median連接法具有類似規(guī)律,但驗證集中Median法的r值和Varex普遍略低于同分類級別的Mean法的r值和Varex,說明對土壤類型估值而言,本例中均值較中值可能更有代表性。土壤類型連接法的突出特征還表現在圖斑邊界線兩側的突變明顯,空間變異的漸變性表現不佳。
圖3 基于土壤類型連接法的SOCD制圖Fig. 3 SOCD maps based on soil category linkage method
表3 有機碳密度制圖的結果驗證Table 3 Verification of the SOCD maps
用逐步回歸篩選出土壤表層OM和TCW構成對SOCD的最佳解釋變量組合,其他變量則由于多重共線性而被排除。WLS回歸系數r為0.45,關系式為
WLS回歸預測的SOCD表現明顯的平滑效應,且出現最小值為負的極端推論(圖4a)。其驗證數據集r系數為0.20(表3),Varex為0.04,實際預測效果明顯不如土壤類型連接法。
同樣采用OM和TCW變量進行SOCD的GWR回歸,制圖效果較WLS回歸平滑效應小、局部細節(jié)變異獲得較好擬合(圖4b),驗證數據的r為0.42,Varex為0.16,較WLS回歸明顯改善(表3)。從制圖形式上GWR結果更接近土壤類型連接法,但對驗證數據集的預測效果仍不如后者。
圖4 基于WLS(a)和GWR(b)的SOCD制圖Fig. 4 SOCD maps based on WLS regression(a)and GWR regression(b)
基于O M和T C W的隨機森林制圖,即R F(OM+TCW)結果見圖5a,其驗證數據的r為0.41,Varex為0.15,精度與GWR法相當。
OM+Genus(土屬)、 OM+Genus+TCW(圖5b)、“所有變量”等3種組合方式下的RF預測結果相似,文中只列出一種。比較可知,較之土壤類型法和其他模型法,結合了土壤類型和土壤OM的RF結果既避免了土壤圖斑邊界兩側的突變,也較大程度避免了平滑效應、突出了空間變異的細節(jié),并防止了WLS和GWR的過度外推。其驗證數據集的r分別達到0.62、0.65、0.65,Varex為0.32、0.37、0.35,檢驗指標優(yōu)于土壤類型連接法、GWR回歸和WLS回歸。
對土壤有機碳密度進行普通Krging插值的結果(圖6a)在宏觀趨勢方面與土壤類型法、RF(OM+Genus+TCW)均較接近,但在細節(jié)表達方面稍欠佳。表現為驗證數據檢驗的r為0.53,與土壤類型連接法相當,而Varex為0.23,略低于后者。然而,在趨勢和細節(jié)表達方面,普通Kriging結果均較WLS和GWR結果好。
土壤類型連接法、隨機森林法、GWR法的交叉驗證結果均顯示(表3),它們的制圖結果與訓練數據的擬合程度較好,因此它們的殘差呈隨機性變異的可能性更大。此外,不同的趨勢提取方法也影響到殘差的計算,最終的變異函數計算表明:僅對WLS、GWR和RF(OM+TCW)的計算結果執(zhí)行殘差Kriging具有實際意義。數據集檢驗的結果顯示:盡管WLS原始結果表現最差,但通過殘差Kriging其預測效果得到的補償最為顯著,最終WLS+RK的效果優(yōu)于GWR+RK,而RF(OM+TCW)+RK的效果最差(表3)。
圖5 基于隨機森林的SOCD制圖Fig. 5 SOCD maps based on RF models
圖6 基于普通Kriging(a)和回歸Kriging的SOCD制圖(b:WLS回歸+殘差Kriging)Fig. 6 SOCD maps based on ordinary kriging(a)and regression kriging(b:WLS regression+residual kriging )
與普通Kriging類似,WLS+RK在趨勢方面與土壤類型Mean連接法和RF(OM+Genus+TCW)的結果很相似(圖6b),但在細節(jié)方面略遜,表現為驗證數據集的r和Varex略低。盡管以殘差Kriging進行了補償,GWR+RK、RF(OM+TCW)+RK的效果未達到普通Kriging和土壤類型連接法的同等效果。必須指出,較之土壤類型連接法和其他模型法,回歸Kriging使訓練數據交叉檢驗的參數r、RMSE和Varex均顯著改善,這顯然是由于在訓練點位置殘差得到補償的結果,制圖效果和驗證數據集的檢驗均表明這種改善的“預測意義”不大。
制圖效果取決于制圖模型是否充分利用了訓練數據中關鍵預測變量、空間變異函數或者它們的組合所蘊含的解釋力,方法復雜性的影響則在其次。在南陽地區(qū),土壤表層有機質含量對1m土體SOCD變異的解釋力為21.9%;土類、亞類、土屬所能解釋的1m土體SOCD變異為37.0%~40.8%;土屬與土壤表層OM對SOCD變異的聯合解釋能力為57.5%;變異函數提供的空間相關性對SOCD變異的解釋力為40.5%。各類SOCD制圖方法的效果與其所用參數的解釋力關系密切:同時利用土壤類型和土壤表層OM的隨機森林RF(OM+Genus)或RF(OM+Genus+TCW)等效果較好;土壤類型連接法、普通Kriging插值的效果次之;GWR和RF(OM+TCW)采用非線性回歸方式進行建模的效果明顯優(yōu)于WLS,但由于僅利用到關鍵參數OM,它們的總體效果顯著低于前述方法。空間相關性與關鍵協變量建模是兩種不同的解釋機制,它們所能解釋的土壤變異可能包含或交叉重疊,并不能保證回歸Kriging是最優(yōu)方法,本例中WLS、GWR和RF(OM+TCW)得到殘差補償后并沒有使其制圖效果達到RF(OM+Genus)或RF(OM+Genus+TCW)的精度水平。并且趨勢性建模方式也不可避免影響到殘差變異結構的計算:WLS、GWR和RF(OM+TCW)在原始模型中對訓練數據的擬合效果依次升高,但其RK結果的優(yōu)劣排序則相反。
[1] Bohn H L. Estimate of organic carbon in world soils.Soil Science Society of America Journal,1982,46:1118—1119
[2] Batjes N H. Total carbon and nitrogen in the soils of the world. European Journal of Soil Science,1996,47(2):151—163
[3] 解憲麗,孫波,周慧珍,等. 中國土壤有機碳密度和儲量的估算與空間分布分析. 土壤學報,2004,41(1):35—43 Xie X L,Sun B,Zhou H Z,et al. Organic carbon density and storage in soils of China and spatial analysis(In Chinese). Acta Pedologica Sinica,2004,41(1):35—43
[4] Shi X Z,Yu D S,Warner E D,et al. Soil database of 1∶1 000 000 digital soil survey and reference system of the Chinese genetic soil classification system. Soil Survey Horizon,2004,45(4):129—136
[5] 于東升,史學正,孫維俠,等. 基于1∶100 萬土壤數據庫的中國SOCD及儲量研究. 應用生態(tài)學報,2005,16(12):2279—2283 Yu D S,Shi X Z,Sun W X,et al. Estimation of China soil organic carbon and density based on 1∶1000 000 soil database(In Chinese). Chinese Journal of Applied Ecology,2005,16(12):2279—2283
[6] 張勇,史學正,于東升,等. 屬性數據與空間數據連接對土壤有機碳儲量估算的影響. 地球科學進展,2008,23(8):840—847 Zhang Y,Shi X Z,Yu D S,et al. Effects of the linkage between spatial data and attribute data on estimates of soil organic carbon(In Chinese). Advances in Earth Science,2008,23(8):840—847
[7] 支俊俊,荊長偉,張操,等. 利用1∶5 萬土壤數據庫估算浙江省土壤有機碳密度及儲量. 應用生態(tài)學報,2013,24(3):683—689 Zhi J J,Jing C W,Zhang C,et al. Estimation of soil organic carbon density and storage in Zhejiang Province by using 1∶50 000 soil database(In Chinese).Chinese Journal of Applied Ecology,2013,24(3):683—689
[8] Minasy B,Mcbratney A B,Malone B,et al. Digital mapping of soil carbon. Advances in Agronomy,2013,118(118):1—47
[9] Ratnayake R R,Karunaratne S B,Lessels J S,et al.Digital soil mapping of organic carbon concentration in paddy growing soils of Northern Sri Lanka. Geoderma Regional,2016,7(2):167—176
[10] 王庫. 基于地理權重回歸模型的土壤有機質空間預測.土壤通報,2013,44(1):21—28 Wang K. Spatial estimation of soil organic matter by using geographically weighted regression model(In Chinese). Journal of Chinese Journal of Soil Sciecne,2013,44(1):21—28
[11] Wiesmeier M,Barthold F,Blank B,et al. Digital mapping of soil organic matter stocks using Random Forest modeling in a semi-arid steppe ecosystem. Plant Soil,2011,340(1):7—24
[12] 王茵茵,齊雁冰,陳洋,等. 基于多分辨率遙感數據與隨機森林算法的土壤有機質預測研究. 土壤學報,2016,53(2):342—354 Wang Y Y,Qi Y B,Chen Y,et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm(In Chinese). Acta Pedologica Sinica,2016,53(2):342—354
[13] Mansuy N,Thiffault E,Paré D,et al. Digital mapping of soil properties in Canadian managed forests at 250 m of resolution using the k-nearest neighbor method. Geoderma,2014,235/236(4):59—73
[14] Tiwari S K,Saha S K,Kumar S. Prediction modeling and mapping of soil carbon content using artificial neural network,hyperspectral satellite data and field spectroscopy. Advances in Remote Sensing,2015,4(1):63—72
[15] Martin M P,Orton T G,Lacarce E. Evaluation of modelling approaches for predicting the spatial distribution of soil organic carbon stocks at the national scale. Geoderma,2014,223/225:97—107
[16] Sandeep K. Estimating spatial distribution of soil organic carbon for the Midwestern United States using historical database. Chemosphere,2015,127:49—57
[17] Doetterl S,Stevens A,van Oost K,et al. Spatiallyexplicit regional-scale prediction of soil organic carbon stocks in cropland using environmental variables and mixed model approaches. Geoderma,2013,204/205(4):31—42
[18] Somarathna P D S N,Malone B P,Minasny B. Mapping soil organic carbon content over New South Wales,Australia using local regression kriging. Geoderma Regional,2016,7(1):38—48
[19] Guo P T,Li M F,Luo W,et al. Digital mapping of soil organic matter for rubber plantation at regional scale:An application of random forest plus residuals kriging approach. Geoderma,2015,237/238:49—59
[20] Ungaro F,Staffilanii F,Tarocco P. Assessing and mapping topsoil organic carbon stock at regional scale:A scorpan kriging approach conditional on soil map delineations and land use. Land Degradation &Development,2010,21(6):565—581
[21] Taghizadeh-Mehrjardi R,Nabiollahi K,Kerry R.Digital mapping of soil organic carbon at multiple depths using different data mining techniques in Baneh region,Iran. Geoderma,2016,266:98—110
[22] Miller B A,Koszinski S,Hierold W,et al. Towards mapping soil carbon landscapes:Issues of sampling scale and transferability. Soil & Tillage Research,2015,156:194—208
[23] 顧成軍,史學正,于東升,等. 省域土壤有機碳空間分布的主控因子-土壤類型與土地利用比較. 土壤學報,2013,50(3):425—432 Gu C J,Shi X Z,Yu D S,et al. Main contributing SOC spatial distribution at the province scale as affected by soil type and land use(In Chinese). Acta Pedologica Sinica,2013,50(3):425—432
[24] 郭治興,袁宇志,郭穎,等. 基于地形因子的土壤有機碳最優(yōu)模型. 土壤學報,2017,54(2):331—343 Guo Z X,Yuan Y Z,Guo Y,et al. Optimal estimation model of soil organic carbon based on the terrain factor(In Chinese). Acta Pedologica Sinica,2017,54(2):331—343
[25] Brungard C W,Boettinger J L,Duniway M. Machine learning for predicting soil classes in three semi-arid landscapes. Geoderma,2015,239/240:68—83
[26] Heung B,Chak Ho H,Zhang J,et al. An overview and comparison of machine-learning techniques for classification purposes in digital soil mapping.Geoderma,2016,265:62—77
[27] Taghizadeh-Mehrjardi R,Nabiollahi K,Minasny B,et al. Comparing data mining classifiers to predict spatial distribution of USDA-family soil groups in Baneh region,Iran. Geoderma,2015,253/254:67—77
[28] Fotheringham A S,Brunsdon C,Charlton M E.Geographically weighted regression. England:John Wiley and Sons,LTD. Sussex. 2002:27—64
[29] Breiman L. Random forest. Machine Learning,2001,45:5—32