劉瑞亮, 賈科利, 李小雨, 陳睿華, 王怡婧, 張俊華
(1.寧夏大學(xué)地理科學(xué)與規(guī)劃學(xué)院,寧夏 銀川 750021;2.寧夏大學(xué)生態(tài)學(xué)院,寧夏 銀川 750021)
自然或人為引起的土壤鹽漬化是一種重大的環(huán)境災(zāi)害,廣泛發(fā)生在內(nèi)陸干旱、半干旱地區(qū),嚴(yán)重影響農(nóng)業(yè)生產(chǎn)和區(qū)域可持續(xù)發(fā)展。據(jù)估計,到2050年全球約50%的耕地會面臨鹽堿化[1],將成為世界性的生態(tài)問題[2]。因此,運(yùn)用科學(xué)手段精準(zhǔn)反演和監(jiān)測耕地土壤鹽漬化動態(tài),及時治理和緩解耕地土壤鹽漬化,對區(qū)域糧食生產(chǎn)和農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。
衛(wèi)星遙感手段能快速、宏觀地獲取土壤光譜特征,通過構(gòu)建遙感監(jiān)測模型,可以實現(xiàn)大范圍土壤鹽漬化監(jiān)測和評估[3]。光學(xué)遙感可以提供多波段的光譜信息,對土壤鹽分具有較強(qiáng)敏感性,研究者通過構(gòu)建光譜指數(shù)實現(xiàn)土壤鹽分的反演。陳紅艷等[4]基于Landsat 8 OLI,引入第7 波段(2100~2300 nm)對植被指數(shù)進(jìn)行改進(jìn),模型反演精度大幅提升。Wang等[5]等用Sentinel-2紅邊波段代替原來紅光波段構(gòu)建光譜指數(shù),提高了光譜信息對土壤鹽分的敏感性。然而單一光學(xué)數(shù)據(jù)易受成像時間、云雨等天氣影響,依賴光譜特征提取鹽漬化信息具有局限性[6]。微波遙感具有全天候工作能力,不易受氣象條件和日照水平影響。同時,由于試驗區(qū)有植被覆蓋,光譜反射率受影響,而微波遙感能穿透植被,具有探測地表下目標(biāo)的能力[7]。馬馳等[8]基于Sentinel-1 雷達(dá)影像,分析垂直極化模式(VV)和交叉極化模式(VH)組合的后向散射系數(shù)與土壤鹽分之間的關(guān)系,確定(VV2+VH2)/(VV2-VH2)極化組合的后向散射系數(shù)可以較好分離不同含鹽量的土壤。張智韜等[9]利用Sentinel-1 雷達(dá)數(shù)據(jù)探究了內(nèi)蒙古河套灌區(qū)不同深度土壤含鹽量。盡管上述研究已經(jīng)取得較好的結(jié)果,但多基于單一遙感數(shù)據(jù),而組合光學(xué)和微波遙感反演土壤含鹽量相關(guān)研究較少。肖森天等[10]組合光學(xué)影像和雷達(dá)后向散射特征,驗證了光學(xué)與雷達(dá)數(shù)據(jù)組合在土壤鹽漬化監(jiān)測方面的可行性。然而該研究僅利用隨機(jī)森林分類算法對土壤鹽漬化進(jìn)行了等級分類,并沒有反演出土壤不同區(qū)域具體的鹽分值。而本文利用隨機(jī)森林的回歸算法,能夠反演得到研究區(qū)耕地像元尺度土壤含鹽量,在一定程度上可以保留更多的鹽分信息。
土壤鹽漬化產(chǎn)生原因和土壤鹽分組成復(fù)雜,在特征變量的選擇上,不同區(qū)域的研究結(jié)果存在差異[11]。因此,需要采用不同方法來篩選特征變量。常用的方法有相關(guān)系數(shù)法(PCC)、逐步回歸(SR)、灰度關(guān)聯(lián)法(GC)和變量投影重要性法(VIP)等。王海峰[12]采用GC、SR 和VIP 3 種方法篩選變量構(gòu)建模型,發(fā)現(xiàn)不同篩選方法下模型精度不同。Wang等[5]基于PCC、VIP、GC、隨機(jī)森林(RF)篩選變量,并利用偏最小二乘回歸(PLSR)建立模型,結(jié)果顯示GCPLSR模型決定系數(shù)(R2)高于VIP-PLSR模型。不同建模方法反演效果不同,劉恩等[13]等采用多元線性回歸和反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)反演小開河引黃灌區(qū)土壤鹽漬化,發(fā)現(xiàn)BPNN 的精度優(yōu)于傳統(tǒng)的多元線性回歸。而陳紅艷等[4]以Landsat 8 OLI建立的土壤含鹽量反演模型中,支持向量機(jī)(SVM)精度優(yōu)于BPNN。此外,RF 具有可處理非線性數(shù)據(jù)、抗擬合能力強(qiáng)的特點(diǎn),在土壤鹽分及主要離子定量估測方面已顯示出較好效果[14]。變量篩選方法結(jié)合機(jī)器學(xué)習(xí)算法進(jìn)行土壤鹽分反演是近幾年的研究熱點(diǎn),而比較不同變量篩選方法,并結(jié)合不同機(jī)器學(xué)習(xí)算法反演土壤含鹽量相關(guān)研究較少。
本文以寧夏平羅縣為研究區(qū),基于光學(xué)和微波遙感影像,提取光譜指數(shù)和雷達(dá)極化組合指數(shù),使用VIP 和GC 篩選特征變量,然后利用BPNN、SVM和RF 機(jī)器學(xué)習(xí)算法構(gòu)建耕地土壤含鹽量反演模型,評定不同變量輸入和不同建模方法下土壤含鹽量反演精度,并反演研究區(qū)耕地土壤鹽分分布,為銀川平原耕地土壤鹽漬化的潛在識別和防治提供理論依據(jù)和技術(shù)支持。
研究區(qū)位于寧夏石嘴山市平羅縣(38°26′60″~39°14′09″N,105°57′40″~106°52′52″E),地處賀蘭山東麓洪積扇和黃河沖積之間、寧夏平原北部,是重要的灌溉農(nóng)業(yè)區(qū)。年平均降水量150~203 mm,年蒸發(fā)量超過1825 mm,蒸降比達(dá)到10:1。主要土地利用類型為耕地、林地、草地和鹽堿荒地,耕地總面積約9.5×104hm2,主要分為水田和旱地。試驗區(qū)(圖1)選擇平羅縣耕地區(qū)域進(jìn)行布設(shè),分別位于平羅縣山前洪積扇區(qū)、西大灘碟形洼地、沖積平原區(qū)、靈鹽臺地和河灘區(qū)五大地貌單元。同時,采樣時間處于春耕農(nóng)忙之前,人為擾動較少。
圖1 研究區(qū)土地利用類型及試驗區(qū)分布Fig.1 Land use types of the study area and distribution of the test areas
1.2.1 土壤樣本采集與鹽分測定樣本采集于2022年3 月20 日—4 月8 日,采樣時利用五點(diǎn)法采集0~20 cm 土壤,編號裝入采樣袋帶回實驗室。土樣經(jīng)過自然風(fēng)干、研磨,并用2 mm孔徑篩過濾后,以水土5:1配置提取液[15],運(yùn)用電導(dǎo)率法[16]計算樣本的含鹽量,每個樣本重復(fù)3 次,取平均值作為該點(diǎn)的鹽分值。
按含鹽量大小劃分樣本鹽漬化程度[17]。樣本總體變異系數(shù)為79.154%(表1),呈中等強(qiáng)度變異,表明樣本分布離散,具有普適性。將樣本按含鹽量大小進(jìn)行排序,每隔2 個樣本取出1 個用于模型驗證,剩余樣本用于建模,共選取70 個樣本作為建模數(shù)據(jù),34個樣本作為驗證數(shù)據(jù)。建模集與驗證集樣本分布趨勢與總樣本分布趨勢一致(圖2),說明樣本劃分合理,可用于模型構(gòu)建和驗證。
表1 土壤樣本描述性統(tǒng)計Tab.1 Descriptive statistics of soil samples
圖2 不同數(shù)據(jù)集土壤樣本分布Fig.2 Distributions of soil samples in different datasets
1.2.2 遙感影像數(shù)據(jù)獲取與處理Landsat 9 OLI 遙感影像來源于美國地質(zhì)勘探局(https://earthexplorer.usgs.gov),行列號為129/33,成像時間為2022年4月5 日,云量為4.7%。在ENVI 5.3 中對影像進(jìn)行輻射校正、裁剪等預(yù)處理,計算鹽分指數(shù)和植被指數(shù),如表2所示。
表2 光譜指數(shù)計算公式Tab.2 Calculation formulas of spectral indices
Sentinel-1 數(shù)據(jù)來源于歐洲航空航天局?jǐn)?shù)據(jù)網(wǎng)站(https://scihub.copernicus.eu),成像時間為2022年4 月1 日,數(shù)據(jù)級別為Level 1,包括垂直極化模式和交叉極化模式。利用SNAP軟件對數(shù)據(jù)進(jìn)行熱噪聲去除、軌道文件校正、輻射定標(biāo)等處理。已有研究指出[25],對于單極化雷達(dá)數(shù)據(jù),如提取的土壤信息量相對較少,研究結(jié)果會受到一定影響。因此,將雷達(dá)影像的極化方式進(jìn)行組合,以提高土壤含鹽量反演精度[26-27]。本文所用指數(shù)如表3所示。
表3 雷達(dá)極化組合指數(shù)計算公式Tab.3 Calculation formulas of radar polarization combination indices
1.2.3 土地利用數(shù)據(jù)獲取及處理土地利用數(shù)據(jù)從中國科學(xué)院資源環(huán)境科學(xué)與數(shù)據(jù)中心(http://www.resdc.cn)獲取,根據(jù)分類標(biāo)準(zhǔn)將研究區(qū)土地利用分為6類(圖1):耕地、林地、草地、水域、未利用地以及城鄉(xiāng)、工礦、居民用地,提取耕地作為研究對象。
首先進(jìn)行數(shù)據(jù)獲取和處理,包括光譜指數(shù)、雷達(dá)極化組合指數(shù)的計算,土壤含鹽量的測定;然后采用變量投影重要性法和灰度關(guān)聯(lián)法進(jìn)行土壤含鹽量特征變量篩選;最后利用篩選的變量,采用3種不同機(jī)器學(xué)習(xí)算法分別構(gòu)建光譜指數(shù)模型、雷達(dá)極化組合指數(shù)模型、光譜指數(shù)和雷達(dá)極化組合指數(shù)協(xié)同模型,并進(jìn)行精度驗證,選擇最優(yōu)模型進(jìn)行研究區(qū)耕地土壤含鹽量反演。具體研究思路如圖3所示。
圖3 研究路線Fig.3 Research route
1.3.1 土壤含鹽量特征變量篩選采用變量投影重要性法和灰度關(guān)聯(lián)法進(jìn)行特征變量篩選。變量投影重要性法是一種基于偏最小二乘回歸的變量篩選方法[28]。對于給定的自變量,變量投影重要性不僅表示自變量對因變量的影響,還考慮了其他自變量對因變量的間接影響。計算公式為:
式中:VIPj為j變量的重要性;p為自變量個數(shù);F為主成分總數(shù);f為主成分;SSYf為f主成分解釋的方差平方和;SSYtotal為因變量平方和;Wjf2 為j變量在f主成分中的重要性。VIPj越大,自變量對因變量的解釋力越強(qiáng)。當(dāng)自變量的VIPj大于1時,獨(dú)立變量被判斷為重要的自變量[29]。
灰色關(guān)聯(lián)度分析是一種多因素統(tǒng)計方法,其目的是通過一定的方法原理確定系統(tǒng)中各因素的主要關(guān)系,用灰色關(guān)聯(lián)度刻畫因素間關(guān)系的強(qiáng)弱和次序,找出影響最大的因素[30]。計算公式為:
式中:GCD為灰色關(guān)聯(lián)度;t為變量;n為變量個數(shù);γ為關(guān)聯(lián)系數(shù);x0(t)為參考序列;xi(t)為比較序列,其中:
1.3.2 機(jī)器學(xué)習(xí)模型
(1)反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)
BPNN基于反向傳播誤差方式對數(shù)據(jù)集進(jìn)行訓(xùn)練,達(dá)到誤差最小化的目的[31]。該模型是對非線性映射的全局逼近,擁有較強(qiáng)的自適應(yīng)和自學(xué)習(xí)能力[32]。本文模型訓(xùn)練目標(biāo)最小誤差設(shè)置為0.00001,迭代次數(shù)設(shè)置為1000次,學(xué)習(xí)率設(shè)置為0.01。
(2)支持向量機(jī)(SVM)
SVM 基于結(jié)構(gòu)風(fēng)險最小原理,依靠有限的樣本來檢索全局最優(yōu)解,對未知點(diǎn)有較好的泛化效果[33]。本文選用RBF(Radial basis function)為SVM核函數(shù)類型,懲罰因子(c)與核函數(shù)(g)由樣本訓(xùn)練得到,分別為13和5。
(3)隨機(jī)森林(RF)
RF是基于多棵回歸樹的集成學(xué)習(xí)方法,通過結(jié)合多個決策樹,并平均其結(jié)果使得決策樹泛化誤差收斂從而產(chǎn)生更好的預(yù)測結(jié)果[34]。RF 善于處理變量間的非線性關(guān)系,預(yù)測性能受回歸樹棵數(shù)、最大深度、最小葉子數(shù)等參數(shù)影響[35]。本文回歸樹棵樹為200,最小葉子數(shù)為4。
1.3.3 模型評價為定量比較不同算法反演土壤含鹽量的精度,本文選擇2 個常用指標(biāo)決定系數(shù)(R2)和均方根誤差(RMSE)來進(jìn)行量化。R2越大,RMSE越小,說明模型擬合效果越好。
利用式(1)、式(2)計算指數(shù)的變量投影重要性(圖4)和灰色關(guān)聯(lián)度(圖5),篩選出特征變量參與建模。結(jié)果表明,光譜指數(shù)S1、S2、ARVI、CRSI、EEVI(圖4a)和雷達(dá)極化組合指數(shù)VV、VH、VV+VH、VV2+VH2、VH2-VV(圖4b)重要性大于1,說明這些變量是指示土壤鹽分的重要變量,可作為特征變量參與建模。
圖4 特征變量與土壤含鹽量的投影重要性Fig.4 Projection importance between soil salt content and characteristic variables
圖5 特征變量與土壤含鹽量的灰色關(guān)聯(lián)度Fig.5 Grey relativity between soil salt content and characteristic variables
由圖5a可知,光譜指數(shù)與土壤含鹽量灰色關(guān)聯(lián)度均大于0.73,其中ARVI 灰色關(guān)聯(lián)度最高,達(dá)到了0.784;S2灰色關(guān)聯(lián)度最低,為0.738。雷達(dá)極化組合指數(shù)與土壤含鹽量灰色關(guān)聯(lián)度(圖5b)介于0.71~0.75,最高為VV+VH的0.739。為實現(xiàn)特征變量篩選,本文設(shè)光譜指數(shù)和雷達(dá)極化組合指數(shù)灰色關(guān)聯(lián)度閾值為0.720,統(tǒng)計基于灰度關(guān)聯(lián)分析的土壤含鹽量敏感指數(shù)情況。結(jié)果發(fā)現(xiàn),利用灰度關(guān)聯(lián)法篩選的光譜特征變量較雷達(dá)特征變量多,其中,10 個光譜指數(shù)都為特征變量,雷達(dá)極化組合指數(shù)中篩選出VV、VH、VV-VH、VV+VH和VV2-VH共計5 個特征變量參與建模。
光譜指數(shù)模型中,以土壤含鹽量作為因變量,選取VIP篩選的S1、S2、ARVI、CRSI、EEVI作為自變量構(gòu)建VIP-BPNN、VIP-SVM、VIP-RF 模型;選取GC篩選的S1、S2、S5、SI、SI1、ARVI、EDVI、ERVI、CRSI、EEVI 作為自變量構(gòu)建GC-BPNN、GC-SVM、GC-RF模型。
雷達(dá)極化組合指數(shù)模型中,選取VIP篩選的VV、VH、VV+VH、VV2+VH2、VH2-VV作為自變量構(gòu)建VIP-BPNN、VIP-SVM、VIP-RF 模型;選取GC 篩選的VV、VH、VV-VH、VV+VH、VV2-VH作為自變量構(gòu)建GC-BPNN、GCSVM、GC-RF模型。
結(jié)果發(fā)現(xiàn)(表4),光譜指數(shù)模型中,利用VIP 篩選變量構(gòu)建的3個模型驗證集R2均大于0.46,RMSE均小于1.93,其中VIP-RF 模型精度最高,建模集和驗證集R2分別為0.726 和0.689,RMSE 分別為1.163和1.307,模型具有較強(qiáng)的穩(wěn)定性。利用GC 篩選變量構(gòu)建的3 個模型驗證集R2整體較低,其中GCSVM 模型驗證效果較好,GC-BPNN 模型次之,GCRF 模型驗證集誤差最大。雷達(dá)極化組合指數(shù)模型中(表4),VIP篩選變量建立的模型建模集和驗證集R2呈現(xiàn)VIP-RF>VIP-SVM>VIP-BPNN 的規(guī)律;GC 篩選變量建立的模型建模集和驗證集R2呈現(xiàn)同樣的規(guī)律,表明隨機(jī)森林機(jī)器學(xué)習(xí)算法在雷達(dá)極化組合指數(shù)模型中具有較好的反演能力。比較光譜指數(shù)模型和雷達(dá)極化組合指數(shù)模型發(fā)現(xiàn),光譜指數(shù)模型精度普遍高于雷達(dá)極化組合指數(shù)模型,這可能與本文鹽分采樣為0~20 cm 表層土壤有關(guān),雷達(dá)數(shù)據(jù)更適合于探測地表下目標(biāo),而光學(xué)數(shù)據(jù)具有豐富的地表反射率信息。
表4 基于單一遙感數(shù)據(jù)的機(jī)器學(xué)習(xí)模型Tab.4 Machine learning models based on single remote sensing data
對比2 種變量篩選方法建立的模型精度(表4)發(fā)現(xiàn),光譜指數(shù)模型中,驗證集精度VIP-RF>GCRF,VIP-BPNN>GC-BPNN,VIP-SVM>GC-SVM。雷達(dá)極化組合指數(shù)模型中,除VIP-BPNN 表5 基于多源遙感數(shù)據(jù)的機(jī)器學(xué)習(xí)模型Tab.5 Machine learning models based on multi-source remote sensing data 組合光譜指數(shù)和雷達(dá)極化組合指數(shù)模型反演精度較單一光譜指數(shù)和雷達(dá)極化組合指數(shù)模型大幅提高。其中,VIP-BPNN 模型驗證集R2分別提高0.124和0.297,RMSE 分別降低0.237和0.525。VIPSVM 和VIP-RF 模型建模集和驗證集R2均大于0.6,RMSE均小于1.6,模型準(zhǔn)確度和學(xué)習(xí)性能更強(qiáng)。其中,VIP-RF建模集R2較單一光譜指數(shù)和雷達(dá)極化組合指數(shù)模型分別提高0.065和0.085,R2達(dá)到了0.791,RMSE 分別降低0.147 和0.189;驗證集R2分別提高0.091和0.237,R2達(dá)到了0.780,RMSE分別降低0.175和0.377,表明光譜指數(shù)和雷達(dá)極化組合指數(shù)協(xié)同反演模型效果優(yōu)于單一數(shù)據(jù)源模型,說明多源遙感數(shù)據(jù)參與建模能夠有效提高土壤含鹽量預(yù)測精度。 圖6為基于VIP-RF構(gòu)建的光譜指數(shù)模型,雷達(dá)極化組合指數(shù)模型以及協(xié)同模型驗證集的實測值與預(yù)測值的散點(diǎn)圖。結(jié)果表明,組合光譜指數(shù)和雷達(dá)極化組合指數(shù)共同建立的VIP-RF 模型擬合效果最好,故選擇此模型對研究區(qū)耕地土壤含鹽量進(jìn)行反演。 圖6 不同數(shù)據(jù)源變量的VIP-RF模型Fig.6 VIP-RF models of different data source variables 選擇精度最佳的光譜指數(shù)和雷達(dá)極化組合指數(shù)VIP-RF 協(xié)同反演模型對平羅縣耕地進(jìn)行土壤鹽分反演,得到平羅縣耕地土壤鹽分反演等級圖(圖7),利用ArcGIS 統(tǒng)計不同鹽漬化等級土壤面積(表6)。由結(jié)果可知,平羅縣耕地鹽漬化情況較為嚴(yán)重,鹽漬化土壤占比達(dá)到了耕地總面積的86.81%,中度鹽漬化高達(dá)33.54%,重度鹽漬化和鹽土主要分布在中西部和東部引黃灌溉區(qū)。鹽漬化反演結(jié)果與實地采樣情況較為一致,表明組合多源遙感數(shù)據(jù)構(gòu)建反演模型在研究區(qū)耕地土壤鹽分反演中具有可行性。 表6 耕地土壤含鹽量反演等級統(tǒng)計Tab.6 Grade statistics of soil salinity inversion in cultivated land 圖7 耕地土壤含鹽量反演等級分布Fig.7 Grade distribution of soil salinity inversion in cultivated land 組合多源遙感數(shù)據(jù)反演土壤含鹽量已成為近年來研究熱點(diǎn),但如何高效組合不同數(shù)據(jù)源,減少影像數(shù)據(jù)處理過程中存在的部分光譜特征、雷達(dá)信息丟失和失真等問題,還有待繼續(xù)研究。余祥偉等[36]利用乘積變換、G-S變換、PC 變換、小波變換等算法將星載SAR 和Landsat 8 OLI 進(jìn)行融合,發(fā)現(xiàn)G-S 變換和PC變換能夠較好實現(xiàn)星載SAR 和光學(xué)影像的融合,但仍然存在信息量、空間分辨率增加的同時,光譜特征丟失的問題。姜紅等[37]研究發(fā)現(xiàn),以雷達(dá)后向散射系數(shù)和改進(jìn)型溫度植被干旱指數(shù)共同作為SVM模型輸入?yún)?shù)時,土壤水分監(jiān)測精度顯著提高。因此,本文組合VIP 篩選得到的光譜指數(shù)和雷達(dá)極化組合指數(shù)共同參與建模,充分結(jié)合光學(xué)遙感和微波遙感優(yōu)勢,較好地保留了土壤的光譜特征和雷達(dá)信息。 最優(yōu)變量篩選方法結(jié)合最優(yōu)機(jī)器學(xué)習(xí)算法可以有效提高反演精度。本文比較VIP 和GC 篩選變量優(yōu)劣,發(fā)現(xiàn)VIP的結(jié)果更為可靠,與王海峰等[12]的研究結(jié)果相同。這是因為VIP通過判斷特征對模型準(zhǔn)確率的影響和加入噪聲干擾前后模型準(zhǔn)確率的變換來實現(xiàn)對模型精度的優(yōu)化構(gòu)建,但李明亮[38]指出GC篩選變量建模同樣能夠有效提高模型擬合精度。有研究[39]指出,土壤成分對反演模型的性能有很大的影響,因此本文所選變量篩選方法是否適用于其他研究區(qū)有待商榷。本文選擇BPNN、SVM 和RF 3 種傳統(tǒng)機(jī)器學(xué)習(xí)算法反演土壤鹽分,發(fā)現(xiàn)BPNN 和SVM 精度較低,RF 精度最高,能夠滿足研究區(qū)土壤含鹽量的反演,這與張智韜等[40]所得結(jié)論基本一致??梢姡瑢F應(yīng)用于土壤含鹽量反演,能夠在一定程度上提升模型反演精度。而近年來,諸多學(xué)者嘗試引入網(wǎng)格搜索、隨機(jī)搜索和貝葉斯等算法對機(jī)器學(xué)習(xí)進(jìn)行超參數(shù)優(yōu)化,Chen等[41]提出了一種基于樹結(jié)構(gòu)Parzen估計器(TPE)優(yōu)化算法的極端梯度提升(XGBoost)模型,結(jié)果表明TPE 聯(lián)合優(yōu)化算法顯著提高了XGBoost 模型的性能,具有較強(qiáng)的泛化能力。Wang等[42]同樣在貝葉斯優(yōu)化框架下,將超參數(shù)和特征選擇相結(jié)合,對光梯度增強(qiáng)機(jī)(Light-GBM)模型進(jìn)行自適應(yīng)聯(lián)合優(yōu)化。Xu等[43]提出了一種自適應(yīng)遺傳算法(AGA)的支持向量機(jī)輸入特征和超參數(shù)同時識別的新方法,并使用網(wǎng)格搜索優(yōu)化超參數(shù)。這些優(yōu)化算法的引入表明學(xué)者們開始關(guān)注特征選擇和超參數(shù)調(diào)整對機(jī)器學(xué)習(xí)模型性能的影響,以及輸入特征和超參數(shù)之間的復(fù)雜依賴性和相互作用,進(jìn)而從模型層面提高預(yù)測精度。因此,之后的研究可以考慮引入不同優(yōu)化算法,并結(jié)合特征變量篩選方法,以期進(jìn)一步提高模型的反演精度和普適性。 本文選擇光譜指數(shù)和雷達(dá)極化組合指數(shù)協(xié)同VIP-RF 模型反演研究區(qū)耕地土壤含鹽量,結(jié)果表明,研究區(qū)耕地鹽漬化已較為嚴(yán)重,鹽漬化土壤占耕地總面積的86.81%,中度鹽漬化土壤分布范圍最廣,達(dá)到了耕地總面積的33.54%,這與前人研究[44]所得結(jié)論相符。平羅縣地處內(nèi)陸干旱區(qū),氣候干燥,土壤透氣、透水性差,易產(chǎn)生鹽漬化。中西部為山前洪積扇區(qū)和西大灘碟形洼地,排水條件差。東部引黃灌溉區(qū)灌溉方式不合理,常出現(xiàn)過量引水和引黃河大水漫灌現(xiàn)象,灌溉水的滲漏引起地下水位升高和強(qiáng)烈蒸發(fā),造成鹽漬化愈演愈烈,進(jìn)而嚴(yán)重影響農(nóng)業(yè)生產(chǎn)。因此,利用遙感監(jiān)測,結(jié)合鹽漬土改良與治理的主要機(jī)制,如物理調(diào)控、化學(xué)調(diào)理、灌排管理和生物改良[45],因地制宜,提出可行性的治理措施,以減少鹽漬化給當(dāng)?shù)剞r(nóng)業(yè)發(fā)展和自然環(huán)境造成的危害。 本文土壤樣本采樣與影像獲取時間不一致,而土壤含鹽量存在短期變化情況,影像數(shù)據(jù)難以真實反應(yīng)地表情況,數(shù)據(jù)存在不確定性。后續(xù)研究可以考慮利用無人機(jī)技術(shù),在同一時間段采集土壤樣本和遙感數(shù)據(jù),且無人機(jī)數(shù)據(jù)分辨率高達(dá)厘米級,模型反演精度會更高。 本文采用VIP和GC篩選特征變量,利用光譜指數(shù)、雷達(dá)極化組合指數(shù)、光譜和雷達(dá)指數(shù)組合的3種不同數(shù)據(jù)源構(gòu)建基于不同機(jī)器學(xué)習(xí)算法的土壤鹽分反演模型,得到以下結(jié)論: (1)基于GC 方法確定的光譜指數(shù)和雷達(dá)極化組合指數(shù)數(shù)量差異較大,篩選變量所構(gòu)建的模型反演效果較差;基于VIP 方法確定的光譜指數(shù)和雷達(dá)極化組合指數(shù)數(shù)量相同,篩選變量所構(gòu)建的模型精度相對較高。 (2)RF模型反演效果最優(yōu),SVM次之,BPNN效果最差,說明RF較其他2種機(jī)器學(xué)習(xí)算法更適于該研究區(qū)耕地土壤含鹽量反演。 (3)組合多源遙感數(shù)據(jù)構(gòu)建的VIP-RF 模型驗證集R2=0.780,較單一光譜指數(shù)模型和雷達(dá)極化組合指數(shù)模型分別提高0.091 和0.237,說明組合多源遙感數(shù)據(jù)能夠有效提高土壤含鹽量反演精度,有助于更加精確地研究區(qū)域土壤鹽分分布情況,提升土壤鹽漬化監(jiān)測水平。 (4)根據(jù)反演結(jié)果可知,平羅縣耕地鹽漬化較為嚴(yán)重,非鹽漬化土壤僅占耕地總面積的13.19%,輕度鹽漬化和中度鹽漬化土壤較多,占比分別為23.77%和33.54%,29.5%的耕地惡化為重度鹽漬化和鹽土。2.3 模型應(yīng)用
3 討論
4 結(jié)論