王瑾杰,丁建麗?,張子鵬,張 喆
(1. 新疆大學(xué)地理與遙感科學(xué)學(xué)院,新疆烏魯木齊 830017;2. 新疆綠洲生態(tài)重點(diǎn)實(shí)驗(yàn)室,新疆烏魯木齊 830017;3. 智慧城市與環(huán)境建模普通高校重點(diǎn)實(shí)驗(yàn)室,新疆烏魯木齊 830017)
土壤鹽漬化是過量的可溶性鹽在土壤中富集的過程,通常在土壤表層最為明顯.隨著全球變化不斷加劇,土壤鹽漬化已成為全球關(guān)注的問題,目前全球超過7%的土地受到土壤鹽漬化的威脅[1].此外,土壤屬性的空間分布是影響農(nóng)業(yè)生產(chǎn)力、土地管理和生態(tài)安全的重要因素[2].原生土壤鹽漬化和農(nóng)業(yè)灌溉引起的次生鹽漬化問題是影響綠洲農(nóng)業(yè)發(fā)展的主要因素,也是影響西北地區(qū)生態(tài)環(huán)境穩(wěn)定的因素之一[3].因此,土壤鹽漬化的動(dòng)態(tài)監(jiān)測(cè)是精準(zhǔn)農(nóng)業(yè)和土地復(fù)墾精準(zhǔn)決策的重要定量參考信息.
大量的野外采樣和實(shí)驗(yàn)室分析使研究成本較高,為了有效降低成本、提高效率、解決數(shù)據(jù)匱乏等難題,數(shù)字土壤制圖已經(jīng)被廣泛應(yīng)用[4].?dāng)?shù)字土壤制圖是基于Scorpan-框架,利用土壤變量與一種或多個(gè)土壤形成因子[5](氣候、生物、地形、母質(zhì)、時(shí)間)的協(xié)方差,在已有數(shù)據(jù)的位置構(gòu)建預(yù)測(cè)模型,并將其擴(kuò)展到整個(gè)區(qū)域的制圖方法.
大量研究結(jié)果表明,土壤鹽分與土壤電導(dǎo)率(Electrical Conductivity, EC)具有明確的數(shù)理統(tǒng)計(jì)關(guān)系,而土壤EC又與不同的光譜波段和指數(shù)密切相關(guān).利用光譜波段參數(shù)可以從衛(wèi)星影像中提取的特點(diǎn),協(xié)同衛(wèi)星遙感可以在短時(shí)間內(nèi)重復(fù)提供大尺度和高空間分辨的光譜信息優(yōu)勢(shì),共同為區(qū)域土壤鹽漬化的動(dòng)態(tài)監(jiān)測(cè)提供豐富的數(shù)據(jù)源.目前較新的衛(wèi)星傳感器Sentinel-2是歐洲哥白尼計(jì)劃的一部分,于2015年6月23日成功發(fā)射,并正式投入使用[6].研究選取Sentinel-2衛(wèi)星數(shù)據(jù),因?yàn)樵撔l(wèi)星攜帶了一種創(chuàng)新的寬幅(寬度290 km)和高空間分辨率(部分波段的空間分辨率達(dá)到10 m)的多光譜成像儀,是具有五天重訪周期的雙軌衛(wèi)星,可為光譜數(shù)據(jù)的時(shí)空分辨率提供保障.
近年來,國內(nèi)外學(xué)者對(duì)土壤EC的估測(cè)與反演開展了大量研究.Peng等[7]在新疆南部的區(qū)域研究發(fā)現(xiàn),與偏最小二乘算法相比,Cubist模型結(jié)合Landsat-8數(shù)據(jù)被證明是最適合土壤鹽度制圖的估算策略.Yu等[8]在吉林半干旱地區(qū)的研究結(jié)果表明,利用Landsat-8數(shù)據(jù)進(jìn)行土壤鹽分建??梢越忉?3.5%的空間變異.然而,基于多種回歸算法結(jié)合Sentinel-2光譜數(shù)據(jù)的土壤EC反演研究還相對(duì)較少.此外,鮮有研究探索土壤EC在數(shù)字土壤制圖中的不確定性.因此,本研究利用四種回歸算法結(jié)合Sentinel-2光譜數(shù)據(jù)、氣候和地形變量,模擬干旱區(qū)尾閭湖周邊地區(qū)土壤EC的空間分布,揭示算法模擬過程中的不確定性,分析該地區(qū)影響土壤EC空間分布的主要環(huán)境因子.
艾比湖濕地保護(hù)區(qū)位于新疆維吾爾自治區(qū)西北部,研究區(qū)總面積約為4 393 km2.該地區(qū)屬于典型的中溫帶干旱大陸性氣候,受西風(fēng)環(huán)流以及蒙古高壓和西伯利亞冷空氣的影響,艾比湖流域具有冬冷夏熱(年均溫8 ℃)、降水量少(年均降水量小于150 mm)、蒸發(fā)量大(年均蒸發(fā)量大于1 200 mm)等特點(diǎn).該地區(qū)以鹽生植被為主,覆蓋度小于10%;主要的土壤類型為灰漠土、灰棕漠土和風(fēng)沙土[9];土壤母質(zhì)屬于第四紀(jì)松散沖積物,含有石膏、石灰、氯化鈉等鹽類.由于水分收支不平衡,土壤中鹽分受淋洗作用的影響較小,在土壤毛細(xì)管的作用下,干涸河床和湖體周邊土壤中的鹽分不斷向地表聚集,造成嚴(yán)重的鹽漬化現(xiàn)象(圖1)[10].近年來,由于人口數(shù)量的增加和土地資源的不合理利用,導(dǎo)致人地矛盾不斷加劇,土地質(zhì)量不斷下降[11].同時(shí),不合理的耕作灌排方式進(jìn)一步加劇了次生鹽漬化現(xiàn)象和土壤鹽分空間變異的復(fù)雜性,制約了該地農(nóng)業(yè)和生態(tài)環(huán)境的可持續(xù)發(fā)展.
圖 1 研究區(qū)采樣點(diǎn)分布圖
1.2.1 土壤樣本
田間土壤調(diào)查于2018年8月5日到8月15日,根據(jù)研究區(qū)的典型景觀特征(圖2),建立了110個(gè)20 m×20 m的樣方,依據(jù)五點(diǎn)采樣法采集土壤樣本,將樣品放入密封的防水袋中并貼上標(biāo)簽運(yùn)回實(shí)驗(yàn)室,使用手持GPS記錄每個(gè)樣點(diǎn)的經(jīng)緯度.在實(shí)驗(yàn)前,對(duì)土壤樣本進(jìn)行室內(nèi)風(fēng)干兩周,粗略去除植被等其它殘余物后,進(jìn)行研磨和過篩(<1.5 mm).為了便于同行交流和國際通用研究比較,以及土壤EC的測(cè)定成本相對(duì)于土壤鹽分含量測(cè)定成本更低等原因,本研究選擇土壤電導(dǎo)率(EC)來表征該地區(qū)的土壤鹽分含量.以1︰5土水比例提取土壤溶液的上清液,用MP515-01 precision conductivity meter儀器在室內(nèi)進(jìn)行EC測(cè)定,協(xié)調(diào)使用儀器配套的2401-1M電導(dǎo)電極測(cè)定,每次測(cè)定前需用校準(zhǔn)溶液進(jìn)行校準(zhǔn),確保測(cè)定結(jié)果接近真實(shí)值.
圖 2 研究區(qū)采樣點(diǎn)景觀圖
1.2.2 地表參數(shù)變量
考慮地形要素對(duì)土壤鹽漬化的影響,利用SAGA GIS v8.2.0軟件平臺(tái)從30 m地形數(shù)據(jù)中提取了14種地形屬性(表1).地形數(shù)據(jù)來源于中國科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心(https://www.resdc.cn/).將得到的地形屬性重采樣到20 m,便于匹配Sentinel-2的空間分辨率并提供更詳細(xì)的信息.
表 1 地表參數(shù)變量及其縮寫
氣象因素是數(shù)字土壤制圖Scorpan-框架中的主要環(huán)境因子,其中溫度和降水的變化會(huì)直接影響土壤水分供給和大氣水分需求,從而間接影響土壤鹽分的運(yùn)移.因此,選擇2000―2018年的多年平均氣溫(Mean Annual Temperature, MAT)和平均降水量(Mean Annual Precipitation, MAP)作為影響土壤鹽分變化的主要?dú)夂蛞蜃樱甅AT和MAP的空間分辨率是1 000 m,利用最鄰近采樣法將其重采樣到20 m.這兩種數(shù)據(jù)均從中國科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心下載.
從Sentinels Scientific Data Hub(http://scihub.copernicus.eu)下載三景無云的Sentinel-2影像(Level-1C產(chǎn)品),使用Sentinel應(yīng)用平臺(tái)(SNAP)Sen2Cor模塊(V.4.0.2)對(duì)圖像進(jìn)行大氣校正,并選取11個(gè)鹽度指標(biāo)組合模擬預(yù)測(cè)(表1).在Sentinel-2的光譜波段中,B1(443 nm)應(yīng)用于成像淺水并跟蹤灰塵和煙霧等細(xì)微顆粒,不能與其它多波段一起使用.Sentinel-2具有兩個(gè)NIR波段,B8具有比B8a寬的光譜帶寬,應(yīng)用于10 m分辨率的輸出.然而,在20 m的空間分辨率中,建議使用B8a作為替代.B9(945 nm)和B10(1 375 nm)分別用于大氣校正和高空云的探測(cè),因此我們從中省略這兩個(gè)波段.最終選擇了9個(gè)Sentinel-2的光譜波段:B2(490 nm)、B3(560 nm)、B4(665 nm)、B5(705 nm)、B6(740 nm)、B7(783 nm)、B8a(865 nm)、B11(1 610 nm)和B12(2 190 nm).將大氣校正后的圖像重采樣到20 m.此外,使用ENVI軟件中集成的最大似然法,結(jié)合監(jiān)督分類法對(duì)湖水進(jìn)行掩膜.
1.3.1 隨機(jī)森林模型
隨機(jī)森林(RF)算法[12]以決策樹學(xué)習(xí)為基礎(chǔ),該模型無需剪枝即可生成多個(gè)樹,使用ut-of-bag(OOB)數(shù)據(jù)計(jì)算均方誤差,利用未被選擇的樣本對(duì)每棵樹進(jìn)行預(yù)測(cè).最后將所有樹的輸出結(jié)果平均得到最終的預(yù)測(cè)結(jié)果.
基于Matlab 2018b軟件,利用Windowsprecomplied-RF mexstandalone-v0.0實(shí)現(xiàn)RF模型.RF建模時(shí)有三個(gè)參數(shù)需要用戶自定義,即決策樹數(shù)目(ntree),每棵樹的變量數(shù)目(mtry)和終端節(jié)點(diǎn)的最小數(shù)目(nodesize).其中:mtry使用默認(rèn)值(即變量數(shù)目開根號(hào)再取整);nodesize的默認(rèn)值為5;由于ntree(500)的默認(rèn)值已被證明不足以產(chǎn)生穩(wěn)定的預(yù)測(cè)結(jié)果[13],因此,將ntree設(shè)置為1 000.變量的相對(duì)重要性(RI)是根據(jù)變量置換時(shí)預(yù)測(cè)準(zhǔn)確度的平均降低程度來估計(jì)的[14].
1.3.2 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(ANN)能夠模擬一組輸入和輸出變量之間的任何線性或非線性關(guān)系[15?16].研究結(jié)合實(shí)際情況,利用ANN中的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬預(yù)測(cè),并對(duì)其參數(shù)進(jìn)行多次調(diào)整,最終確定網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為29-5-1.其中ANN的訓(xùn)練函數(shù)選用Levenberg-Marquardt方法,將訓(xùn)練精度和學(xué)習(xí)率設(shè)置為10?3,其余參數(shù)選用默認(rèn)值.使用網(wǎng)格搜索確定隱含層神經(jīng)元的數(shù)量以及使用早期停止程序確定訓(xùn)練迭代次數(shù),可有效避免過擬合.
1.3.3 極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(ELM)與傳統(tǒng)需要迭代調(diào)整網(wǎng)絡(luò)參數(shù)的方法相比,ELM隨機(jī)生成隱含層節(jié)點(diǎn)參數(shù)的速率高[17],因此,該方法具有高效和快速學(xué)習(xí)的優(yōu)點(diǎn),并且受到廣泛關(guān)注.本研究選用Sigmod函數(shù)作為連接層的激活函數(shù),按區(qū)域特點(diǎn),將隱含層的節(jié)點(diǎn)個(gè)數(shù)設(shè)置為10.
1.3.4 多元自適應(yīng)樣條回歸
多元自適應(yīng)樣條回歸(MARS)是由Friedman提出的數(shù)據(jù)挖掘技術(shù)[18],該算法通過樣條函數(shù)來模擬復(fù)雜的非線性關(guān)系,綜合了樣條回歸、累加回歸、遞歸自分回歸等諸多優(yōu)點(diǎn),建模過程分為前向逐步和后向剪枝選擇基函數(shù)和篩選因子,具有很強(qiáng)的自適應(yīng)性.本研究采用Adaptive regression spline toolbox(version 1.13.0)在Matlab 2018b中完成多元自適應(yīng)樣條回歸模型的建模.模型中基函數(shù)的最大數(shù)量(Max Funcs)設(shè)置為30,節(jié)點(diǎn)的交叉驗(yàn)證次數(shù)(Cross Number)設(shè)置為3,輸入變量之間相互作用的最大程度(Max Interactions)設(shè)置為10,人工老化因子(Fast Beta)設(shè)置為1.
1.3.5 模型驗(yàn)證
對(duì)RF模型進(jìn)行10折交叉驗(yàn)證,該算法利用Crossvalind.m腳本實(shí)現(xiàn).為了應(yīng)對(duì)模型可能出現(xiàn)的性能變化和確保模型預(yù)測(cè)結(jié)果的穩(wěn)定性,對(duì)每個(gè)模型迭代運(yùn)算100次.利用均方根誤差(Root Mean Square Error,RMSE)、Lin的一致性相關(guān)系數(shù)(Lin’s Concordance Correlation Coefficient, LCCC)和決定系數(shù)(R2, Coefficient of Determination)評(píng)估模型的預(yù)測(cè)性能.利用每個(gè)模型迭代100次得到的標(biāo)準(zhǔn)差來評(píng)估各模型預(yù)測(cè)EC時(shí)的不確定性,并在Matlab 2018b(The MathWorks, Natick, MA, USA)中生成土壤EC預(yù)測(cè)的不確定圖.近些年,許多研究均采用預(yù)測(cè)不確定圖來衡量模型預(yù)測(cè)時(shí)的誤差.
艾比湖地區(qū)夏季的土壤鹽度范圍在0.174~65.992 dS·m?1,平均鹽度為15.456 dS·m?1,屬于重度鹽漬土(表2).考慮到Sentinel-2數(shù)據(jù)具有三個(gè)額外的紅邊波段,本研究使用三個(gè)紅邊波段(B5、B6、B7)代替B4來計(jì)算新紅邊波段的各種可能組合,以產(chǎn)生用于估計(jì)EC的潛在土壤鹽度指數(shù)和提高植被指數(shù)在該地區(qū)的適用性.分別比較土壤EC與植被指數(shù)和鹽分指數(shù)的關(guān)系(圖3).研究發(fā)現(xiàn)除CRSI和NLI外,其它的植被指數(shù)均與土壤EC呈顯著的負(fù)相關(guān)關(guān)系,P <0.01;在鹽分指數(shù)中除S5以外,其它的鹽分指數(shù)與土壤EC均呈正相關(guān)關(guān)系,P <0.01.當(dāng)使用紅邊波段替代B4時(shí),發(fā)現(xiàn)相關(guān)性有所增加.研究發(fā)現(xiàn),引入紅邊波段增強(qiáng)了指數(shù)對(duì)土壤鹽分的敏感程度,這可能與紅邊區(qū)域潛在的光譜信息和更高的信噪比有關(guān).在所有指數(shù)中,基于B5構(gòu)建的S3指數(shù)效果最佳,相關(guān)性達(dá)到了0.55.而對(duì)于CRSI、NLI和S5,引入紅邊波段的改進(jìn)效果并不明顯,因此對(duì)上述三個(gè)指數(shù)進(jìn)行剔除.利用其余15個(gè)指數(shù)的最優(yōu)波段組合進(jìn)行后續(xù)的EC建模和數(shù)字土壤制圖.
表 2 艾比湖地區(qū)土壤鹽度的統(tǒng)計(jì)分析/dS·m?1
圖 3 EC與不同土壤鹽分指數(shù)(紅邊指數(shù)和衍生紅邊指數(shù))之間的關(guān)系
在46個(gè)參數(shù)中,28個(gè)參數(shù)與EC具有顯著相關(guān)性,P <0.01(表3).MAP與EC之間的相關(guān)性在0.05顯著性水平上是顯著的,而其余17個(gè)參數(shù)與EC沒有顯著相關(guān)性.有26個(gè)參數(shù)與EC呈正相關(guān)關(guān)系,其中B11的相關(guān)性最強(qiáng),為0.68.有17個(gè)參數(shù)與EC呈負(fù)相關(guān)關(guān)系,GDVI最強(qiáng),為-0.38.有3個(gè)參數(shù)與EC沒有相關(guān)性,分別為TCA、LSF和RSP,可能與計(jì)算中該像元處存在空值有關(guān).在17個(gè)環(huán)境協(xié)變量中,只有MAT、SR、AS和CNBL與EC具有顯著相關(guān)關(guān)系(P <0.01),MAP與EC之間的相關(guān)性在0.05顯著性水平上顯著.該結(jié)果在一定程度上說明,氣候因素(MAP、MAT和SR)是鹽堿荒地土壤鹽分運(yùn)移變化的重要驅(qū)動(dòng)力因素.而地形因素普遍與土壤EC之間沒有任何明顯的關(guān)系,這是因?yàn)檠芯繀^(qū)地勢(shì)相對(duì)較為平坦,地形因素?zé)o法有效顯示該地區(qū)土壤鹽分的空間分布.在Sentinel-2因子中,所有波段均與土壤EC顯著相關(guān)(P <0.01).其中:B11的相關(guān)性最強(qiáng),達(dá)到0.68;B12次之,r=0.56.紅邊波段的效果要優(yōu)于可見光波段,其中B6的效果最好,r=0.53.鹽分指數(shù)均與土壤EC呈正相關(guān)關(guān)系,而在植被指數(shù)中除SAVI外,其它均與土壤EC呈負(fù)相關(guān)關(guān)系.
表 3 研究區(qū)環(huán)境因子與EC(dS·m?1)數(shù)據(jù)的關(guān)系
表4為10折交叉驗(yàn)證的RF、ANN、ELM和MARS模型的預(yù)測(cè)性能.精度驗(yàn)證的結(jié)果表明:MARS模型的R2均值為0.549,LCCC均值為0.698,RMSE均值為11.406,其R2均值在四個(gè)模型中最低.ELM的預(yù)測(cè)準(zhǔn)確度略優(yōu)于ANN模型,其中ELM模型100次運(yùn)算的R2和LCCC均值都高于ANN,同時(shí)RMSE降低了0.313.RF模型具有最優(yōu)的預(yù)測(cè)精度,R2均值為0.662,LCCC均值為0.771,且R2和LCCC的標(biāo)準(zhǔn)差也相對(duì)較低.因此,在本研究區(qū)的EC模擬結(jié)果對(duì)比中,RF模型模擬的整體結(jié)果表現(xiàn)最優(yōu).
表 4 基于不同建模策略的土壤EC(dS·m?1)反演模型的統(tǒng)計(jì)分析
Nawar等[19]在Egypt El-Tina平原對(duì)EC與土壤反射光譜進(jìn)行建模,發(fā)現(xiàn)MARS是一種比PLSR更適合估算和繪制土壤鹽分的技術(shù),特別是在高鹽度地區(qū).但在本研究中,MARS的建模效果與其它三種機(jī)器學(xué)習(xí)算法(RF、ANN、ELM)相比,已經(jīng)表現(xiàn)出明顯的不足,這從另一方面證明了機(jī)器學(xué)習(xí)方法在本研究區(qū)對(duì)EC預(yù)測(cè)的潛力.Khosravi等[20]在對(duì)土壤鋅和鉛含量的預(yù)測(cè)中,發(fā)現(xiàn)相比ANN模型,ELM不僅提供了更好的預(yù)測(cè)性能,還具有更短的運(yùn)算時(shí)間和更低的模型復(fù)雜度.在中國東部的一項(xiàng)研究中,Deng等[21]對(duì)29 927個(gè)土壤有機(jī)碳數(shù)據(jù)進(jìn)行RF建模,結(jié)果表明RF模型解釋了76%的農(nóng)田表層土壤有機(jī)碳的變化.Chen等[22]利用中國最全面的土壤數(shù)據(jù)集和17個(gè)環(huán)境協(xié)變量開發(fā)的RF模型解釋了中國土壤71%的pH變化.上述研究均表明RF模型在EC模擬中具有顯著的優(yōu)勢(shì).
模型的預(yù)測(cè)效果也可以從預(yù)測(cè)值與實(shí)測(cè)值的密度圖分布中觀察到.圖4為四種模型100次預(yù)測(cè)得到的土壤EC模擬結(jié)果.研究發(fā)現(xiàn),四種模型均會(huì)對(duì)0~15 dS·m?1的EC產(chǎn)生一定程度的低估,其中:ELM的效果最差,MARS次之,而RF和ANN的效果相對(duì)較好.在15~40 dS·m?1的EC區(qū)間,所有模型均存在高估EC的現(xiàn)象,相比之下,ANN的高估現(xiàn)象最弱,ELM的最嚴(yán)重.MARS模型的特征空間分布呈現(xiàn)近似對(duì)稱的弧度,RF則更為陡峭,并在22 dS·m?1附近存在一個(gè)峰谷.在40~60 dS·m?1的EC區(qū)間,RF僅在40~43 dS·m?1的EC區(qū)間存在一些高估,在高EC區(qū)域沒有明顯的低估.ANN和ELM分別存在嚴(yán)重的低估和高估現(xiàn)象.MARS的低估程度在RF和ANN之間,基本不存在高估現(xiàn)象.
圖 4 實(shí)測(cè)土壤EC與模型模擬結(jié)果密度圖
由于每次所得到結(jié)果不同,本研究基于前人研究成果,均使用100次迭代的土壤EC均值來反映研究區(qū)的鹽漬化情況.圖5顯示基于20 m空間分辨率的各模型的土壤EC均值圖,經(jīng)過統(tǒng)計(jì)分析得出,各模型的土壤EC均值分別為12.248 dS·m?1(RF)、12.216 dS·m?1(ANN)、11.806 dS·m?1(ELM)和11.898 dS·m?1(MARS).此外,本研究得到的土壤EC圖顯示出許多鹽分變化的細(xì)節(jié)特征,這主要?dú)w因于Sentinel-2光譜數(shù)據(jù)的高時(shí)空分辨率.從預(yù)測(cè)的鹽度空間分布來看,四種模型沒有明顯的差異.受地形因素的影響,土壤鹽漬化程度最低的區(qū)域主要位于研究區(qū)的北部;干湖床周圍的鹽漬化程度次之;嚴(yán)重的鹽漬化區(qū)域主要位于艾比湖西南部、奎屯河?xùn)|北部和阿克蘇河?xùn)|南部.
圖6為各模型100次迭代得到的標(biāo)準(zhǔn)差結(jié)果,以此衡量各模型預(yù)測(cè)土壤EC含量的差異.經(jīng)過統(tǒng)計(jì)各模型的SD均值分別為1.139 dS·m?1(RF)、6.546 dS·m?1(ANN)、3.108 5 dS·m?1(ELM)和4.478 dS·m?1(MARS).其中:RF模型顯示出的不確定性水平最低,表明RF模型在預(yù)測(cè)土壤EC方面表現(xiàn)穩(wěn)定;其余三個(gè)模型均在高鹽漬化區(qū)域顯示出較大的不確定性,SD的最大值分別達(dá)到了76.466 dS·m?1(ANN)、42.239 dS·m?1(ELM)和55.289 dS·m?1(MARS).參考前人研究成果[23?24],圖6中的預(yù)測(cè)不確定性可能來自于室外采樣誤差、實(shí)驗(yàn)分析誤差、機(jī)器建模誤差和統(tǒng)計(jì)學(xué)誤差,而且ANN、ELM和MARS三種模型對(duì)于研究區(qū)不確定性的研究和分析已經(jīng)超出了本研究的范圍.
圖 5 四種模型模擬的土壤EC空間分布圖
圖 6 四種模型對(duì)土壤EC空間分布預(yù)測(cè)的不確定性
通過100次迭代來評(píng)估RF模型中每個(gè)環(huán)境協(xié)變量的相對(duì)重要性(RI),再經(jīng)過平均和標(biāo)準(zhǔn)化來展示變量重要性的結(jié)果(圖7).我們發(fā)現(xiàn)預(yù)測(cè)土壤EC含量最重要的影響因素是Sentinel-2光譜數(shù)據(jù),其變量重要性達(dá)到44%,并且每個(gè)預(yù)測(cè)因子均與EC具有良好的相關(guān)性.其中:Band 11(SWIR1)的貢獻(xiàn)率最高,達(dá)到15%;其次分別是Band 6(Red Edge2)為6.73%、Band 5(Veg Red1)為6.50%.Taghadosi等[25]利用基于RBF核函數(shù)的SVM模型揭示了Sentinel-2光譜數(shù)據(jù)以高精度生成土壤EC圖的潛力,而我們的研究也證明了Sentinel-2光譜數(shù)據(jù)是區(qū)域尺度內(nèi)監(jiān)測(cè)土壤鹽分的關(guān)鍵因子,對(duì)干旱區(qū)地表鹽分檢測(cè)工作具有重要的經(jīng)濟(jì)價(jià)值.
圖 7 隨機(jī)森林模型中各類環(huán)境因子的變量重要性
除了Sentinel-2光譜數(shù)據(jù)十分重要以外,鹽分光譜指數(shù)、氣候和地形協(xié)變量以及植被光譜指數(shù)均能有效解釋土壤EC預(yù)測(cè)時(shí)各類變化的來源,其重要值分別為31%、20%和5%.地形要素決定了EC的空間格局,但由于該區(qū)域地勢(shì)較為平坦,大多地形因子的貢獻(xiàn)度相對(duì)較低,只有坡向的重要性相對(duì)較好(4.68%).這是因?yàn)槠孪驎?huì)影響太陽輻射、溫度、雨量、風(fēng)速和土壤質(zhì)地等因素,間接地影響土壤鹽分的分布.雖然植被光譜指數(shù)作為一種間接的鹽分指標(biāo),可以通過衡量作物生長和植物脅迫的不利影響來評(píng)估土壤中鹽的存在.作為國家后備土地資源的西部,綠洲內(nèi)外植被分布有空間差異,但植被覆蓋度的差異會(huì)掩蓋土壤信息,導(dǎo)致土壤EC的誤差,因此,植被指數(shù)(生物因子)等變量被作為挖掘空間土壤鹽度信息的環(huán)境協(xié)同因子[26?27].同時(shí),在干旱區(qū)植被相對(duì)較少,如本研究中除在西南地區(qū)存在一部分農(nóng)田以外,其余區(qū)域的植被覆蓋極其稀少.因此,建議對(duì)低植被覆蓋區(qū)域考慮植被光譜指數(shù),但優(yōu)先考慮鹽分光譜指數(shù).此外,融雪水是中高緯度地帶和山區(qū)的一項(xiàng)重要徑流補(bǔ)給源,新疆“三山夾兩盆”的特殊地理?xiàng)l件,形成了水資源時(shí)空分布的特殊規(guī)律[28?29].艾比湖地區(qū)地處荒漠區(qū),降雨稀少,水資源主要以冰川融雪徑流為主,與氣溫要素相比,降水對(duì)于土壤鹽分空間預(yù)測(cè)的貢獻(xiàn)度相對(duì)較低.
本研究利用四種機(jī)器學(xué)習(xí)算法模擬了土壤EC的空間分布.研究結(jié)果表明:RF模型最為準(zhǔn)確和穩(wěn)定,解釋了土壤EC 66%的空間變化,并且平均標(biāo)準(zhǔn)差僅為1.139 dS·m?1.在RF模型中,Sentinel-2光譜數(shù)據(jù)為模型貢獻(xiàn)了44%的相對(duì)重要性,顯示出土壤鹽漬化遙感反演中的優(yōu)勢(shì).同時(shí),氣候和地形因素的加入也在一定程度上提升了模型預(yù)測(cè)的穩(wěn)定性和科學(xué)性.此外,在繪制區(qū)域土壤EC圖時(shí),建議在低植被覆蓋區(qū)優(yōu)先考慮鹽分光譜指數(shù)的影響.