• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    融合半變異函數(shù)的空間隨機(jī)森林插值方法*

    2022-03-11 03:38:30王銘鑫高秉博任周鵬李發(fā)東
    關(guān)鍵詞:土壤環(huán)境插值變異

    王銘鑫,范 超,高秉博**,任周鵬,李發(fā)東

    (1.中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院 北京 100193;2.武漢大學(xué)遙感信息工程學(xué)院 武漢 430079;3.中國科學(xué)院地理科學(xué)與資源研究所 北京 100011)

    土壤是農(nóng)業(yè)生產(chǎn)的基礎(chǔ),土壤環(huán)境屬性影響耕地的生產(chǎn)能力與糧食安全。土壤受到重金屬污染后不僅會(huì)影響作物的產(chǎn)量和農(nóng)產(chǎn)品的安全,危害人類健康,還會(huì)進(jìn)入水體和空氣,造成次生生態(tài)環(huán)境問題。我國由于近些年工業(yè)迅猛發(fā)展、農(nóng)業(yè)化學(xué)水平提高、城鎮(zhèn)快速擴(kuò)張以及對(duì)環(huán)境保護(hù)的忽視,使得大量的有毒有害物質(zhì)進(jìn)入土壤,造成了嚴(yán)峻的污染形勢。精確的環(huán)境污染空間分布圖是開展各項(xiàng)污染風(fēng)險(xiǎn)管控和防治工作的基礎(chǔ)。由于目前土壤環(huán)境污染以實(shí)地采樣調(diào)查為主要手段,成本較高,樣點(diǎn)分布相對(duì)稀疏。因此,需要采用空間插值方法基于樣本數(shù)據(jù)完成區(qū)域土壤環(huán)境屬性分布圖。然而,由于土壤污染具有較強(qiáng)的空間異質(zhì)性,為空間插值精度的提升帶來較大的挑戰(zhàn)。

    目前,土壤環(huán)境屬性空間插值方法主要分為基于空間位置關(guān)系信息的插值、基于屬性相似信息的插值以及融合空間位置關(guān)系信息和屬性相似信息的插值方法。基于空間位置關(guān)系信息的插值以描述空間自相關(guān)性的地理學(xué)第一定律和描述空間異質(zhì)性的第二定律為基礎(chǔ)?;诘乩韺W(xué)第一定律包括最鄰近點(diǎn)插值、反距離加權(quán)、徑向基函數(shù)和局部多項(xiàng)式等確定性插值方法,以及普通克里金、簡單克里金和指示克里金等地統(tǒng)計(jì)方法。與確定性插值方法相比,地統(tǒng)計(jì)方法能在給出無偏最優(yōu)插值結(jié)果的同時(shí),得到對(duì)插值結(jié)果的不確定性估計(jì),因此應(yīng)用較為廣泛,但是難以解決土壤環(huán)境屬性的空間異質(zhì)性問題。各向異性半變異函數(shù)方法、三明治方法、空間分層異質(zhì)性方法等空間插值方法在考慮空間自相關(guān)性的基礎(chǔ)上,考慮到對(duì)空間異質(zhì)性的處理,能一定程度上解決土壤環(huán)境屬性空間異質(zhì)性插值問題。

    基于屬性相似信息的插值方法以地理學(xué)第三定律為基礎(chǔ)。地理學(xué)第三定律認(rèn)為:具有相似地理環(huán)境的兩個(gè)點(diǎn)(區(qū)域),其目標(biāo)變量具有相似(近)的取值。包括相似度度量法、Soil-Land Inference Model(SoLIM,土壤-環(huán)境推理模型)、回歸方法和可以處理多變量的嶺回歸、lasso 回歸、隨機(jī)森林、提升樹和支持向量機(jī)等監(jiān)督學(xué)習(xí)方法。基于屬性相似信息的方法可以充分利用土壤污染來源及其影響因素等輔助變量數(shù)據(jù),改善土壤環(huán)境屬性的插值精度。但是由于土壤環(huán)境污染源及其影響因素?cái)?shù)據(jù)難以全部精確獲得,同時(shí)為了防止模型過擬合,因此模型會(huì)產(chǎn)生殘差。由于污染物的擴(kuò)散遷移特性,殘差往往具有空間自相關(guān)性。因此在考慮屬性相似性的基礎(chǔ)上,綜合應(yīng)用空間位置關(guān)系信息能夠提高空間插值精度。

    融合空間位置關(guān)系信息和屬性相似信息的插值方法包括空間滯后模型、空間誤差模型、空間變系數(shù)回歸和地理加權(quán)回歸等空間回歸方法,以及協(xié)克里金、回歸克里金和因子克里金等地統(tǒng)計(jì)方法。其中回歸克里金是數(shù)字土壤制圖領(lǐng)域應(yīng)用最為廣泛的一種插值方法。但是當(dāng)輔助變量較多且包含較多類型變量時(shí),回歸克里金處理多變量的能力不足,難以有效利用土壤環(huán)境屬性空間插值所涉及的多維輔助變量信息。

    機(jī)器學(xué)習(xí)方法在處理高維輔助變量方面具有獨(dú)特的優(yōu)勢,但是主流的機(jī)器學(xué)習(xí)方法僅能利用多維輔助變量信息,并沒有融合空間位置關(guān)系信息進(jìn)一步改進(jìn)插值精度。如何將空間位置關(guān)系信息融入機(jī)器學(xué)習(xí)方法改進(jìn)土壤環(huán)境空間插值精度成為目前數(shù)字土壤制圖領(lǐng)域最前沿的研究方向之一。Sekuli?等提出了隨機(jī)森林空間插值法(random forest spatial interpolation,RFSI)。該方法將鄰近若干樣點(diǎn)的空間橫、縱坐標(biāo)和目標(biāo)變量作為單獨(dú)的屬性加入隨機(jī)森林,以改進(jìn)空間插值結(jié)果。但是該方法分離了樣點(diǎn)位置與目標(biāo)變量之間的關(guān)系,未能融合空間位置關(guān)系信息和屬性相似信息。Hengl 等提出的隨機(jī)森林空間預(yù)測框架(random forest for spatial predictions framework,RFsp),將到樣點(diǎn)的距離作為預(yù)測屬性加入隨機(jī)森林方法,將位置關(guān)系信息有效反映在預(yù)測屬性中,完成了空間位置信息和屬性相似信息的融合,可用于改善土壤環(huán)境屬性插值精度。但是土壤環(huán)境變量的空間變異并不一定與距離呈現(xiàn)線性關(guān)系。因此,為了進(jìn)一步改進(jìn)土壤環(huán)境屬性插值精度,本文在隨機(jī)森林空間預(yù)測框架的基礎(chǔ)上,將空間距離替換為空間半變異值,融合隨機(jī)森林與地統(tǒng)計(jì)中的空間半變異函數(shù),提出了融合半變異函數(shù)的空間隨機(jī)森林插值方法(spatial random forest with semi-variogram interpolation,SRFsei),以充分融合空間位置信息和屬性相似信息,提高土壤環(huán)境屬性的空間插值精度。并以湖南省湘潭縣北部部分鄉(xiāng)鎮(zhèn)的土壤重金屬數(shù)據(jù)作為案例,對(duì)比分析了該方法的空間插值效果。

    1 面向土壤環(huán)境插值的空間隨機(jī)森林方法

    1.1 隨機(jī)森林

    隨機(jī)森林是一種基于分類回歸樹的集成學(xué)習(xí)方法,由多個(gè)具有高預(yù)測精度和低相關(guān)性的分類回歸樹組成。該方法通過隨機(jī)選取樣點(diǎn)和特征的重采樣訓(xùn)練多個(gè)分類回歸樹,在預(yù)測時(shí)綜合多個(gè)分類回歸樹的結(jié)果,提高預(yù)測精度并解決過擬合問題。其基本流程如下:

    1)從原始訓(xùn)練集中采用bootstrap 抽樣抽取個(gè)樣本和個(gè)屬性;

    2)將個(gè)樣本分別建立個(gè)分類回歸樹,完成模型訓(xùn)練;

    3)對(duì)于待預(yù)測點(diǎn),將其帶入個(gè)分類回歸樹,得到每個(gè)分類回歸樹的預(yù)測結(jié)果;

    4)綜合個(gè)分類回歸樹的預(yù)測結(jié)果,給出對(duì)待預(yù)測點(diǎn)的最終預(yù)測結(jié)果。

    隨機(jī)森林(RF)是一種集成學(xué)習(xí)方法,最終預(yù)測結(jié)果一般是個(gè)分類回歸樹結(jié)果的平均值,如公式(1):

    1.2 隨機(jī)森林空間預(yù)測框架

    RF 在建模的過程中忽略待估計(jì)點(diǎn)與樣本點(diǎn)之間的空間自相關(guān)性,可能會(huì)導(dǎo)致預(yù)測結(jié)果不準(zhǔn)確,出現(xiàn)過高估計(jì)和過低估計(jì),尤其是在目標(biāo)變量的具有較強(qiáng)的空間自相關(guān)性時(shí)。為了彌補(bǔ)這項(xiàng)不足,Hengl 等提出了隨機(jī)森林空間預(yù)測框架(RFsp):

    式中:()為空間點(diǎn)上的目標(biāo)變量取值;為輔助變量;為遙感圖像的光譜信息;為空間距離屬性,即距離空間樣點(diǎn)的距離。RFsp 將與樣點(diǎn)的距離作為輔助變量加入預(yù)測變量,并利用隨機(jī)森林方法處理多維預(yù)測變量,實(shí)現(xiàn)了輔助變量信息與位置關(guān)系信息的融合。Hengl 等已經(jīng)證明,隨機(jī)森林與線性地統(tǒng)計(jì)建模和克里金等技術(shù)相比,其優(yōu)點(diǎn)在于不需要遵循平穩(wěn)性假設(shè),且當(dāng)樣點(diǎn)具有代表性,而目標(biāo)變量、協(xié)變量和空間依賴結(jié)構(gòu)之間的關(guān)系是復(fù)雜的、非線性的情況下,可以改進(jìn)空間插值結(jié)果。

    1.3 融合半變異函數(shù)的空間隨機(jī)森林方法

    隨機(jī)森林空間預(yù)測框架(RFsp)采用空間距離關(guān)系反映樣點(diǎn)之間的空間位置信息。但是由于模型構(gòu)建的最終目標(biāo)是實(shí)現(xiàn)土壤環(huán)境屬性的精確插值,而空間位置信息并未直接與土壤環(huán)境屬性的空間變異關(guān)聯(lián),同時(shí)土壤環(huán)境變量的空間變異并不一定和距離呈線性關(guān)系,因此本文提出結(jié)合地統(tǒng)計(jì)空間半變異函數(shù)的改進(jìn)方法,即融合半變異函數(shù)插值的空間隨機(jī)森林方法(spatial random forest with semi-variogram interpolation,SRFsei)。該方法的定義如公式(3):

    式中:是基于空間位置關(guān)系和空間半變異函數(shù)所得的變量組,其中每一個(gè)變量的取值為待估計(jì)點(diǎn)到單個(gè)樣本點(diǎn)之間半方差的平方根,定義如公式(4):

    式中:h為待估計(jì)點(diǎn)到樣點(diǎn)的距離,γ()為空間半變異函數(shù),定義如公式(5):

    式中:()為一區(qū)域化隨機(jī)變量,為兩空間點(diǎn)之間的距離,(s)和(s+)分別是區(qū)域化變量()在空間位置ss+處的值,()表示在空間上所有距離為的離散點(diǎn)對(duì)的數(shù)量。通過樣本點(diǎn)計(jì)算半方差后,可以采用球狀模型、高斯模型和指數(shù)模型等擬合,獲得空間半變異模型的函數(shù)形式??臻g半變異函數(shù)由模型類型、基臺(tái)值(Sill)、變程(Range)和塊金值(Nugget)唯一確定?!盎_(tái)值”是半變異函數(shù)隨著距離增加達(dá)到一個(gè)相對(duì)穩(wěn)定的常數(shù)的值;“塊金值”指的是間隔距離=0 時(shí)的半變異函數(shù)值,塊金值是由于混合樣的存在和測量誤差造成的;“變程”指的是變異函數(shù)達(dá)到基臺(tái)值時(shí)的間隔距離,當(dāng)兩點(diǎn)間的間距大于等于變程(range)時(shí),區(qū)域化變量(s)的空間相關(guān)性消失。

    2 案例研究

    2.1 研究區(qū)描述

    研究區(qū)為湖南省湘潭縣北部5 個(gè)鄉(xiāng)鎮(zhèn)(112°57′E,27°46′N),如圖1所示,總面積為522.46 km。研究區(qū)位于湘江東岸,主要地貌類型為低山、丘陵和平原,屬亞熱帶季風(fēng)濕潤氣候。2011年共采集688 個(gè)農(nóng)田土壤樣本點(diǎn),并使用火焰原子吸收光譜法分析了土壤的Cr 含量。本研究以土壤Cr 含量為目標(biāo)變量。

    圖1 研究區(qū)域及樣點(diǎn)分布Fig.1 Study area and sampling point

    目前已有多項(xiàng)研究證實(shí)地形(例如海拔高度、坡度等)、土壤類型、土地利用類型是Cr 分布的重要影響因子。海拔高度通過土壤侵蝕來影響重金屬的遷移,土壤類型和土地利用類型影響重金屬的累積狀況。因此,本文選取土壤類型、土地利用類型、海拔高度、坡度等因素作為土壤重金屬含量插值研究的輔助變量。各因子的空間分布情況如圖2所示。

    圖2 研究區(qū)輔助變量土壤類型(a)、土地利用類型(b)、海拔(c)和坡度(d)的映射Fig.2 Mapping of auxiliary variables in the study area.a:soil type;b:land use type;c:altitude;d:slope.

    2.2 試驗(yàn)方法

    對(duì)于研究區(qū)采樣數(shù)據(jù),分別采用本文提出的SRFsei 方法、RF、RFsp、普通克里金(Ordinary Kriging,OK)和泛克里金(Universal Kriging,UK)方法進(jìn)行插值,通過交叉檢驗(yàn)對(duì)比不同方法的插值精度。所有對(duì)比試驗(yàn)均采用R 語言實(shí)現(xiàn),空間半變異函數(shù)、OK和UK 使用gstat 實(shí)現(xiàn),隨機(jī)森林訓(xùn)練和預(yù)測基于ranger 包實(shí)現(xiàn)。為了比較不同插值方法的結(jié)果,采用平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)表征插值精度,兩個(gè)指標(biāo)可以避免正負(fù)偏差互相抵消的情況,用來量化預(yù)測結(jié)果的平均誤差。MAE 和RMSE的計(jì)算方法如下:

    為了對(duì)比SRFsei 方法相比其他插值方差的插值精度改進(jìn)程度,本文定義了改進(jìn)程度指數(shù),如公式(8):

    式中:imp為SRFsei 方法相比第種方法的插值精度改進(jìn)程度指數(shù);為SRFsei 方法的插值誤差,可以是MAE或RMSE;E為作為對(duì)比的第種方法的插值誤差,可以采用MAE或RMSE,但需要與 E對(duì)應(yīng)一致。

    處理覆蓋整個(gè)研究區(qū)域的輔助變量數(shù)據(jù),在此基礎(chǔ)上,使用全部采樣點(diǎn),采用SRFsei 方法、RF、RFsp、普通克里金(Ordinary Kriging,OK)和泛克里金(Universal Kriging,UK)方法對(duì)整個(gè)研究區(qū)域的Cr 含量進(jìn)行插值制圖,獲得插值制圖結(jié)果和不確定性估計(jì)結(jié)果。

    2.3 結(jié)果與分析

    原始樣本的Cr 含量的變異函數(shù)圖如圖3所示,利用研究區(qū)域數(shù)據(jù)和R 語言工具繪制出圖。使用如公式(9)所示的球狀模型擬合:

    圖3 研究區(qū)Cr 含量半變異函數(shù)Fig.3 Variation function of Cr content in the study area

    式中:為塊金效應(yīng)常數(shù),為拱高,+為基臺(tái)值,為空間依賴范圍,即變程值。

    其中,研究區(qū)域內(nèi)土壤中Cr 含量的變差函數(shù)的變程值為6421.279,塊金值為77.3,基臺(tái)值為369.7。塊金值與基臺(tái)值之比(基底比)是表示空間自相關(guān)性程度的指標(biāo),一般認(rèn)為該值為25%和75%是區(qū)分相關(guān)性程度等級(jí)的兩個(gè)分界值,如果該比值小于25%,則空間相關(guān)性程度很高;如果比值在25%~75%,則空間相關(guān)性程度為中等;如果比值大于75%,則由隨機(jī)變化引起的空間變異性程度較大。本文土壤中Cr含量的變差函數(shù)的塊金值與基臺(tái)值比率為20.9%,說明研究區(qū)域內(nèi)土壤中Cr 含量存在著較強(qiáng)的空間自相關(guān)性。

    本文提出的SRFsei 與RF、RFsp、OK 和UK 的插值交叉檢驗(yàn)結(jié)果如圖4所示。由圖4 中MAE 結(jié)果可知,SRFsei 具有最小的空間插值誤差,OK 具有最大的空間插值誤差,UK 由于采用了輔助變量,插值精度較OK 有所改善。RF 和RFsp 比OK 和UK有更好的插值精度,在RF 和RFsp 中,RFsp 由于考慮了空間位置關(guān)系,插值精度更高。圖4 中RMSE結(jié)果與MAE 基本一致,SRFsei 具有最優(yōu)的插值精度,OK 具有最大的RMSE。與MAE 不同之處是RFsp方法的RMSE 大于RF 方法。

    圖4 不同插值方法交叉驗(yàn)證結(jié)果的平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)Fig.4 Mean absolute error(MAE)and root mean square error(RMSE)of cross-validation results of different interpolation methods

    SRFsei 相對(duì)傳統(tǒng)的OK 和UK 方法在MAE 和RMSE 上的改進(jìn)均大于10%。相比RF,SRFsei 在MAE上的改進(jìn)為6.52%,在RMSE 上的改進(jìn)為5.34%。而相比RFsp,在MAE 上的改進(jìn)為5.97%,在RMSE 上的改進(jìn)為6.49%。從交叉檢驗(yàn)結(jié)果可知,SRFsei 相比傳統(tǒng)的地統(tǒng)計(jì)方法有較大的插值精度提升,而相對(duì)于新型的機(jī)器學(xué)習(xí)方法精度提升有限。

    采用全部688 個(gè)樣點(diǎn)的數(shù)據(jù)基于SRFsei 方法對(duì)研究區(qū)空間插值制圖如圖5所示。其中圖5a 為插值制圖結(jié)果,圖5b 為插值不確定性結(jié)果。由圖5a 可知,研究區(qū)域中東部污染較為嚴(yán)重,西北部污染較輕。由圖5b 可知,研究區(qū)域絕大部分的插值誤差標(biāo)準(zhǔn)差小于5,誤差較大的區(qū)域主要集中在污染較嚴(yán)重的中部區(qū)域。圖中黑色方框所示部分與白色方框所示部分具有相同的污染濃度,但是從誤差圖中可以得出,黑色方框所示部分具有較小的插值誤差,因此可以確定該部分污染較為嚴(yán)重,而白色方框部分誤差較高,因此該部分的插值結(jié)果具有較大的不確定性。如需更精確地掌握污染情況,還需要進(jìn)一步展開加密采樣調(diào)查。

    圖5 融合半變異函數(shù)的空間隨機(jī)森林插值法的插值結(jié)果圖(a)與誤差標(biāo)準(zhǔn)差圖(b)Fig.5 Interpolation results(a)and standard deviation variance of error(b)of spatial random forest with semivariogram interpolation

    RF、RFsp、UK 和OK 對(duì)研究區(qū)域的插值制圖結(jié)果及其不確定性估計(jì)圖如圖6所示。土壤Cr 含量插值結(jié)果總體相似,但在局部上差異明顯:其中OK和UK 的插值結(jié)果,東南部區(qū)域由于協(xié)方差矩陣是奇異矩陣,沒有計(jì)算出插值結(jié)果。相比較OK 方法,其他方法由于使用了輔助數(shù)據(jù),因此具有更豐富的細(xì)節(jié)信息。而RF 方法,由于沒有利用空間自相關(guān)性,插值結(jié)果存在不自然的非平滑變化。RFsp 插值結(jié)果中,存在條帶化現(xiàn)象。相比其他方法,SRFsei 插值結(jié)果包含了更豐富的細(xì)節(jié)信息,空間變化也更加合理。

    圖6 不同插值方法的插值結(jié)果圖(a)及誤差標(biāo)準(zhǔn)差圖(b)Fig.6 Interpolation results(a)and standard deviation variance of error(b)of different interpolation methods

    3 結(jié)論

    本文基于隨機(jī)森林空間預(yù)測框架,通過結(jié)合隨機(jī)森林方法與空間變異函數(shù),提出了融合半變異函數(shù)的空間隨機(jī)森林方法(SRFsei)。該方法在空間插值建模和預(yù)測中能夠?qū)⒎从惩寥拉h(huán)境污染源及影響因素的多維輔助變量信息與空間變異信息有效結(jié)合,同時(shí)考慮屬性相似性信息和空間位置關(guān)系信息,因而可以有效提高插值進(jìn)度,得到更為可靠的插值結(jié)果。湖南省湘潭縣北部鄉(xiāng)鎮(zhèn)土壤重金屬數(shù)據(jù)插值案例結(jié)果表明,本文所提出的方法相較于其他傳統(tǒng)地統(tǒng)計(jì)的OK 和UK 方法插值精度提升10%以上,相較于新型的機(jī)器學(xué)習(xí)空間插值方法的插值精度提升5%以上。同時(shí),其插值制圖結(jié)果具有更豐富的細(xì)節(jié)信息和合理空間變化。因此,本文所提出方法較適用于具有復(fù)雜空間異質(zhì)性的土壤環(huán)境變量下的空間插值。但是其插值效率還有待進(jìn)一步在其他區(qū)域應(yīng)用中檢驗(yàn)。

    猜你喜歡
    土壤環(huán)境插值變異
    變異危機(jī)
    變異
    基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
    有機(jī)氯農(nóng)藥對(duì)土壤環(huán)境的影響
    土壤環(huán)境安全及其污染防治對(duì)策
    土壤環(huán)境質(zhì)量監(jiān)測的現(xiàn)狀及發(fā)展趨勢
    一種改進(jìn)FFT多譜線插值諧波分析方法
    基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
    變異的蚊子
    環(huán)保部對(duì)《土壤環(huán)境質(zhì)量標(biāo)準(zhǔn)》修訂草案公開征求意見
    邻水| 台湾省| 康保县| 杨浦区| 南木林县| 修武县| 成都市| 定边县| 六盘水市| 万州区| 卓资县| 秦安县| 沙洋县| 玉屏| 尚义县| 安吉县| 平江县| 枣阳市| 巫溪县| 丹东市| 贵州省| 和田市| 江城| 太康县| 禄丰县| 屏南县| 鄱阳县| 山东省| 广宗县| 屏东县| 柘城县| 都兰县| 济南市| 玉环县| 澄城县| 长泰县| 穆棱市| 关岭| 高州市| 西畴县| 资中县|