DOI:10.3969/j.issn.2095-1191.2025.01.011
摘要:【目的】基于GF-5高光譜影像構(gòu)建針對滇中高原灌區(qū)土壤有機碳(SOC)含量反演模型,為后續(xù)開展滇中高原灌區(qū)SOC含量反演研究提供參考依據(jù)?!痉椒ā窟x取云南省楚雄州姚安縣為研究區(qū),以GF-5高光譜影像為基礎(chǔ)數(shù)據(jù)源,篩選出與SOC含量相關(guān)性較高的預(yù)處理方法并構(gòu)建光譜指數(shù),基于連續(xù)投影算法(SPA)和競爭性自適應(yīng)重加權(quán)算法(CARS)篩選特征波段組合,以篩選的特征波段、光譜指數(shù)、地形因子及Sentinel-1后向散射系數(shù)為輔助變量進(jìn)行組合,結(jié)合實地采樣的SOC含量數(shù)據(jù),運用XGBoost模型進(jìn)行SOC含量反演?!窘Y(jié)果】在21種數(shù)據(jù)預(yù)處理方法中以AM-Normalize的預(yù)處理效果最優(yōu),與實測SOC含量的相關(guān)系數(shù)為0.7544;其次是SG-FD、SD和FD的預(yù)處理效果,與實測SOC含量的相關(guān)系數(shù)分別為0.6791、0.6671和0.6202。SPA篩選的波段反演效果最優(yōu),其決定系數(shù)(R2)較CARS和全波段數(shù)據(jù)分別提升了0.0739和0.1524,均方根誤差(RMSE)分別降低了0.9279和1.2793。引入地形因子的變量模型G2,其R2較變量模型G1(特征波段+光譜指數(shù))提升了0.0398,RMSE降低了0.1685;進(jìn)一步加入Sentinel-1后向散射系數(shù),變量模型G3的R2較變量模型G2提升了0.0255,RMSE降低了0.1385?;贕F-5高光譜影像的SOC含量反演結(jié)果顯示,滇中高原姚安灌區(qū)的SOC含量范圍為9.8443~29.2514 g/kg,平均為19.4447 g/kg,與土壤樣本SOC含量實測值的范圍(10.47~30.11 g/kg)及平均值(20.6307 g/kg)較接近?!窘Y(jié)論】基于GF-5高光譜影像構(gòu)建的XGBoost模型,經(jīng)AM-Normalize預(yù)處理降低噪聲干擾、SPA篩選特征波段及引入光譜指數(shù)、地形因子和Sentinel-1后向散射系數(shù)后,能有效提升SOC含量反演的精度和適用性,為滇中高原地區(qū)SOC含量預(yù)測提供技術(shù)支撐。
關(guān)鍵詞:土壤有機碳(SOC);GF-5高光譜影像;光譜指數(shù);XGBoost模型;滇中高原
中圖分類號:S127文獻(xiàn)標(biāo)志碼:A文章編號:2095-1191(2025)01-0124-11
Inversion of soil organic carbon content in irrigation area of Central Yunnan Plateau based on GF-5 hyperspectral images
YAN Zheng-fei1,YANG Ming-long1*,TANG Xiu-juan2,XIA Yong-hua1,YANG Zhen1,LI Wang-tao1
(1Faculty of Land Resources Engineering,Kunming University of Science and Technology/Yunnan University SpatialInformation Mapping Technology Application Engineering Research Center,Kunming,Yunnan 650093,China;2Kunming Institute of Surveying and Mapping,Kunming,Yunnan 650091,China)
Abstract:【Objective】Based on GF-5 hyperspectral images,a model for inverting soil organic carbon(SOC)content in the irrigation area of Central Yunnan Plateau was constructed,which could provide reference basis for subsequent re-search on SOC content inversion in the irrigation area of Central Yunnan Plateau.【Method】Yao’an County,Chuxiong Prefecture,Yunnan Province was selected as the research area,and GF-5 hyperspectral image was used as the basic data source to screen out preprocessing methods with high correlation with SOC content and spectral index.The feature band combination was screened based on continuous projection algorithm(SPA)and competitive adaptive reweighting algo-rithm(CARS).The selected feature band,spectral index,topographic factor and Sentinel-1 backscattering coefficientwere combined as auxiliary variables,combined with the SOC content data collected in the field,XGBoost model was used to invert SOC content.【Result】Among the 21 data preprocessing methods,AM-Normalize had the best preproce-ssing effect,with a correlation coefficient of 0.7544 with the measured SOC content;followed by SG-FD,SD and FD,with correlation coefficients with the measured SOC content of 0.6791,0.6671 and 0.6202 respectively.The band inver-sion effect of SPA screening was the best,with coefficient of determination(R2)increasing by 0.0739 and 0.1524 com-pared to CARS and full-band data respectively,while root mean square error(RMSE)decreased by 0.9279 and 1.2793 re-spectively.The variable model G2,which introduced topographic factors,had an R2 increase of 0.0398 compared to the variable model G1(characteristic bands+spectral indexes),and RMSE decreased by 0.1685;further adding the Sentinel-1 backscatter coefficient,the R2 of the variable model G3 increased by 0.0255 compared to the variable model G2,and RMSE decreased by 0.1385.The SOC content inversion results based on GF-5 hyperspectral images showed that the SOC content range in the Yao’an irrigation district of the Central Yunnan Plateau was 9.8443-29.2514 g/kg,with an average of 19.4447 g/kg,which was relatively close to the SOC content measured value range of soil samples(10.47-30.11 g/kg)and the average value(20.6307 g/kg).【Conclusion】The XGBoost model has been built on the basis of GF-5 hyperspec-tral images,after AM-Normalize preprocessing effectively reduces noise interference,SPA screens feature bands,and in-troduces spectral index,terrain factor and Sentinel-1 backscatter coefficient,the accuracy and applicability of SOC con-tent inversion can be effectively improved,which can provide technical support for SOC content prediction in the Central Yunnan Plateau.
Key words:soil organic carbon(SOC);GF-5 hyperspectral image;spectral index;XGBoost model;Central Yun-nan Plateau
Foundation items:National Natural Science Foundation of China(62266026)
0引言
【研究意義】土壤有機碳(Soil organic carbon,SOC)在維持土壤肥力、促進(jìn)植物生長及實現(xiàn)農(nóng)業(yè)可持續(xù)發(fā)展等方面發(fā)揮著重要作用(馮雪琦等,2024)。滇中高原地處我國云南省中部,是云南省人口、城市和耕地最集中的地區(qū)及傳統(tǒng)的糧煙基地,其地勢高低起伏,呈片狀零散分布,每片灌區(qū)的種植類型和土壤性質(zhì)存在一定差異。因此,采用遙感技術(shù)結(jié)合機器學(xué)習(xí)等方法進(jìn)行滇中高原灌區(qū)耕地SOC含量反演研究,對指導(dǎo)滇中高原地區(qū)科學(xué)耕作、優(yōu)化種植結(jié)構(gòu)及確保云貴高原農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。【前人研究進(jìn)展】在SOC含量高光譜反演方面,由于有機碳分子含有特定的化學(xué)鍵和官能團(tuán),且這些化學(xué)鍵和官能團(tuán)在特定波長下會吸收或反射光線,對光譜響應(yīng)區(qū)域為580~730 nm,尤其在623nm處的光譜反射率相關(guān)性最大,而形成特定的光譜特征(岳繼博等,2024)。當(dāng)SOC含量發(fā)生變化時,這些光譜特征也隨之改變,因此可通過分析光譜數(shù)據(jù)估算SOC含量(Nocita et al.,2015)。至今,已有諸多學(xué)者從光譜數(shù)據(jù)源、傳感器數(shù)據(jù)融合及優(yōu)化估算模型等方面展開了SOC含量高光譜反演研究(宋奇等,2024)。光譜數(shù)據(jù)源主要包括地物光譜儀獲取的高光譜數(shù)據(jù)和高光譜衛(wèi)星遙感影像數(shù)據(jù),已有學(xué)者使用高光譜技術(shù)對SOC含量進(jìn)行反演,且在光譜數(shù)據(jù)預(yù)處理、特征波段篩選及深度學(xué)習(xí)等方面取得了長足進(jìn)展(丁金梅等,2023;亓子龍,2023),但主要是基于國外的Hyperion星載高光譜影像及PRISMA衛(wèi)星影像和HyspHI衛(wèi)星影像(邱壑等,2017;楊長保等,2017),通過國產(chǎn)高光譜衛(wèi)星遙感影像監(jiān)測SOC含量的研究鮮見報道(Viscarra Rossel and Webster,2012)。相比之下,國內(nèi)GF-5高光譜影像具有更高的光譜分辨率,是國際上首次實現(xiàn)對陸地和大氣進(jìn)行綜合觀測的全譜段高光譜衛(wèi)星,且輔以較優(yōu)的數(shù)據(jù)處理方法,SOC含量預(yù)測精度提升了10%左右(Meng et al.,2020)。此外,非數(shù)據(jù)源自身的自然因素對SOC含量反演精度也有較大影響,尤其是地形因子,其變化趨勢直接影響SOC的形成與空間分布(王永平等,2021;Xie et al.,2022;孔晨晨等,2024)。宋發(fā)軍(2021)研究表明,通過SRTM提取的11個地形因子解釋了土壤養(yǎng)分54.7%的變異信息,其中高程(Elevation)、坡向(Aspect)、坡度(Slope)對土壤養(yǎng)分的綜合解釋能力分別為15.2%、14.1%和7.1%,是影響縣域尺度土壤養(yǎng)分空間變異的主要因素?!颈狙芯壳腥朦c】目前,國內(nèi)有關(guān)SOC含量反演的研究區(qū)域主要集中在東北平原種植區(qū)或果園等,且大部分研究是通過提取高光譜特征波段結(jié)合部分光譜指數(shù)反演SOC含量(賈子玉等,2024),針對高原地區(qū)SOC含量反演的研究較少,而綜合考慮地形因素等外部環(huán)境因素以提高SOC含量反演可靠性和準(zhǔn)確性的研究更少。【擬解決的關(guān)鍵問題】選取云南省楚雄州姚安縣為研究區(qū),以GF-5高光譜影像為基礎(chǔ)數(shù)據(jù)源,基于連續(xù)投影算法(Successive projection algo-rithm,SPA)和競爭性自適應(yīng)重加權(quán)算法(Competi-tive adaptive reweighted sampling,CARS)篩選特征波段組合,并通過XGBoost模型探明特征波段、光譜指數(shù)、地形因子及Sentinel-1后向散射系數(shù)等輔助變量對SOC含量反演精度及準(zhǔn)確性的影響,為后續(xù)開展滇中高原灌區(qū)SOC含量反演研究提供參考依據(jù)。
1材料與方法
1.1試驗材料
1.1.1研究區(qū)樣本采集與測定研究區(qū)位于云南省楚雄州姚安縣(23°13′N~25°45′N,100°56′E~101°34′E),平均海拔2141 m(最低海拔1518 m,最高海拔2846m),地形以山地為主,種植區(qū)呈零散分布,屬于典型的滇中高原灌區(qū)。2023年11月1日,通過五點采樣法在滇中高原姚安灌區(qū)進(jìn)行土壤樣本采集,采集10 m×10 m區(qū)域內(nèi)0~15 cm的表層土樣,每個采樣點采集2~3 kg土壤樣本,充分混勻后,保留2 kg土壤作為樣本數(shù)據(jù),共采集土壤樣本80份,送至云南大學(xué)土壤生態(tài)學(xué)實驗室采用硫酸—重鉻酸鉀法測定SOC含量。采樣點分布情況見圖1。
1.1.2 GF-5高光譜影像獲取與處理GF-5高光譜影像選用2023年11月3日的可見短波紅外高光譜相機(Advanced hyperspectral imager,AHSI)數(shù)據(jù),與土壤樣本采集時間相差2 d,期間無降雨,且正值秋收后土壤裸露、無植被殘留和人工灌溉。AHSI數(shù)據(jù)的空間分辨率為30 m,涵蓋了400~2500 nm的330個波段。在原始數(shù)據(jù)中,因信噪比低及水蒸氣影響,導(dǎo)致光譜數(shù)據(jù)不連續(xù),故剔除400~430 nm及2462~2500 nm波段,以確保數(shù)據(jù)的有效性。影像處理包括采用ENVI 5.6對影像進(jìn)行輻射定標(biāo)、FLAASH大氣校正及幾何校正。
1.1.3輔助變量獲取與處理地形因子數(shù)據(jù)來自谷歌地球引擎(Google earth engine,GEE)平臺開源數(shù)據(jù)庫,選取指標(biāo)包括高程、坡度和坡向,分別反映地面高度、傾斜程度和傾斜方向。Sentinel-1后向散射系數(shù)數(shù)據(jù)處理基于GEE平臺,處理后得到IW成像方式下的2種極化模式影像(VV和VH)。地形因子和Sentinel-1后向散射系數(shù)的影像數(shù)據(jù)均以雙線性插值法重采樣至30m空間分辨率。
1.2試驗設(shè)計
基于GF-5高光譜影像數(shù)據(jù),經(jīng)一階微分(FD)、二階微分(SD)、S-D卷積平滑+一階微積分(SG-FD)及移動平均窗口平滑(Average moving)等21種數(shù)據(jù)預(yù)處理方法預(yù)處理后構(gòu)建光譜指數(shù);通過SPA和CARS對原始波段進(jìn)行特征篩選,然后以篩選后的特征波段、光譜指數(shù)、地形因子及Sentinel-1后向散射系數(shù)作為多元輸入變量,結(jié)合地面實測SOC含量數(shù)據(jù),采用XGBoost模型進(jìn)行SOC含量反演。對比不同變量組合的模型精度,確定最優(yōu)組合,并繪制SOC含量空間分布圖,以直觀展示研究區(qū)的SOC分布特征。
1.3數(shù)據(jù)處理
1.3.1 GF-5高光譜影像數(shù)據(jù)預(yù)處理GF-5高光譜影像數(shù)據(jù)包含土壤樣本光譜特征及多種非目標(biāo)信息,如電噪音和背景干擾等。為減少噪聲、提高信號純度及模型穩(wěn)定性,參照王亞新(2022)的研究方法對原始數(shù)據(jù)進(jìn)行預(yù)處理。鑒于可見光—近紅外邊緣波段噪聲明顯,易影響光譜分析及模型建立,故選取移動平均窗口平滑+Normalize規(guī)范化(AM-Normalize)、SG-FD、SD和FD等21種數(shù)據(jù)預(yù)處理方法進(jìn)行對比,選出最優(yōu)預(yù)處理方法以降低非目標(biāo)信息的干擾。
1.3.2光譜指數(shù)構(gòu)建光譜指數(shù)是一種基于不同波段反射率的線性或非線性組合數(shù)學(xué)工具,其特定組合形式能反映波段間的相互作用關(guān)系,同時增強特定地物或環(huán)境特征的信息表達(dá)。光譜指數(shù)的構(gòu)建對提升SOC含量反演精度具有重要意義(Xu etal.,2018),分別通過差值指數(shù)(Difference index,DI)、比值指數(shù)(Ratio index,RI)及歸一化指數(shù)(Normaliza-tion index,NDI)探究光譜指數(shù)與SOC含量間的關(guān)系,計算公式如下:
式中,Rx表示波段x獲得的光譜反射率,Ry表示波段y獲得的光譜反射率。
1.3.3特征波段篩選方法采用SPA和CARS進(jìn)行光譜特征波段篩選。SPA通過迭代投影選擇信息量最大且相關(guān)性最低的波段,適用于近紅外光譜和高光譜成像,能有效降低數(shù)據(jù)維度并提升模型計算效率(楊林婧等,2024)。CARS結(jié)合自適應(yīng)重加權(quán)和競爭性篩選機制,通過動態(tài)調(diào)整波段權(quán)重和蒙特卡洛采樣,逐步優(yōu)化波段選擇,具有高效降維和強魯棒性的優(yōu)勢(Yang et al.,2021)。
1.3.4 XGBoost模型XGBoost模型是一種高效的梯度提升算法,通過迭代優(yōu)化損失函數(shù),結(jié)合正則化以防過擬合,且支持并行計算加速訓(xùn)練,適用于分類、回歸和排序任務(wù)(孫怡,2024;葉淼等,2024)。
2結(jié)果與分析
2.1土壤樣本分析結(jié)果
采用隨機劃分法,將PCA馬氏距離法剔除異常樣本后的78個土壤樣本按1.3∶1.0劃分為訓(xùn)練集和測試集。滇中高原姚安灌區(qū),SOC含量范圍在10.47~30.11 g/kg,平均值為20.6307 g/kg,變異系數(shù)為28.46%(表1),屬中等變異,但訓(xùn)練集、測試集及總體的統(tǒng)計特征相似,表明土壤樣本具有代表性,可用于后續(xù)特征波段選擇及模型構(gòu)建與驗證。
2.2 SOC含量高光譜特征分析結(jié)果
圖2為滇中高原姚安灌區(qū)SOC含量反射光譜曲線。在430~2462 nm波長范圍內(nèi),各土壤樣本SOC含量反射光譜曲線趨勢一致,但由于不同土壤樣本的理化性質(zhì)差異,對反射光譜曲線也會造成一定影響。在430~1030 nm波長范圍內(nèi),光譜反射率因有機物和鐵離子而上升;在1030~2504 nm波長范圍內(nèi)則呈波動下降趨勢,特別是在2033 nm波長后逐漸遞減;在1982~2462 nm波長范圍內(nèi),由于噪聲較大,對反射光譜曲線有明顯影響,因此需進(jìn)一步降噪處理。
2.3不同預(yù)處理方法的效果比較
由圖3可知,在21種數(shù)據(jù)預(yù)處理方法中以AM-Normalize的預(yù)處理效果最優(yōu),與實測SOC含量的相關(guān)系數(shù)為0.7544;其次是SG-FD、SD和FD的預(yù)處理效果,與實測SOC含量的相關(guān)系數(shù)分別為0.6791、0.6671和0.6202。經(jīng)AM-Normalize預(yù)處理后,SOC含量反射光譜曲線趨于平滑,與原始反射光譜曲線的整體變化趨勢基本一致,尤其在1700~2462 nm波長范圍內(nèi),AM-Normalize預(yù)處理能有效抑制原始反射光譜曲線的波動不穩(wěn)定性。相比之下,經(jīng)FD、SD和SG-FD預(yù)處理后的反射光譜曲線被壓縮,且波動幅度變大、頻率變快(圖4),增強了光譜細(xì)微變化及削弱了基線漂移。因此,選用AM-Normalize、FD、SD和SG-FD等4種相關(guān)系數(shù)較高的預(yù)處理方法處理波長數(shù)據(jù)以構(gòu)建光譜指數(shù),并采用AM-Normalize預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征波段篩選。
2.4光譜指數(shù)與SOC含量的相關(guān)分析結(jié)果
以AM-Normalize、FD、SD和SG-FD預(yù)處理后的光譜數(shù)據(jù)構(gòu)建DI、RI和NDI等3個光譜指數(shù),并與SOC含量進(jìn)行相關(guān)分析,結(jié)果(表2和圖5)顯示,RI和NDI與SOC含量的最高相關(guān)系數(shù)分別為0.8034和0.8106;DI與SOC含量的相關(guān)系數(shù)相對較低,其最高相關(guān)系數(shù)僅為0.6748。因此,最終確定以波長1653.80和794.42 nm計算DI,以波長592.96和2167.20 nm計算RI,以波長1704.30和1569.70 nm計算NDI,再將計算得到的DI、RI和NDI加入到最終的SOC含量反演模型中。
2.5 SPA和CARS特征波段篩選結(jié)果
2.5.1基于SPA的特征波段篩選結(jié)果由圖6可看出,將AM-Normalize預(yù)處理后的光譜數(shù)據(jù)加入到SPA中,共篩選出30個特征波段,僅占原始光譜波段總數(shù)的12.2449%,而此時的交叉驗證均方根誤差(RMSECV)最小,為2.6480。
2.5.2基于CARS的特征波段篩選結(jié)果將AM-Normalize預(yù)處理后的光譜數(shù)據(jù)加入到CARS中,同時將蒙特卡洛采樣次數(shù)設(shè)為100次,結(jié)果(圖7)顯示,在第50次采樣處,RMSECV最?。?.0100),對應(yīng)最優(yōu)波長選擇子集和采樣波長數(shù)目;共篩選出23個特征波段,僅占原始光譜波段總數(shù)目的9.3878%。
2.5.3不同特征波段篩選結(jié)果對比分析由圖8可看出,基于SPA和CARS篩選的特征波段及全波段數(shù)據(jù)構(gòu)建的XGBoost模型反演精度存在明顯差異。其中,SPA篩選的波段反演效果最優(yōu),其決定系數(shù)(R2)較CARS和全波段數(shù)據(jù)分別提升了0.0739和0.1524,而均方根誤差(RMSE)分別降低了0.9279和1.2793。此外,SPA篩選出30個特征波段,對原始光譜數(shù)目實現(xiàn)有效降維,提高模型反演效率。因此,最終選用SPA篩選的波段數(shù)據(jù)作為滇中高原姚安灌區(qū)SOC含量反演的輸入變量。
2.6輔助變量模型構(gòu)建及其反演精度評價結(jié)果
為探究光譜指數(shù)、地形因子和Sentinel-1后向散射系數(shù)數(shù)據(jù)3個變量間遞增組合對SOC含量反演精度的影響,基于GF-5高光譜影像分別構(gòu)建變量模型G1、G2和G3,并以R2和RMSE進(jìn)行XGBoost模型反演精度評價。變量模型的具體變量組合搭配見表3。
圖9展示了XGBoost模型對變量模型G1、G2和G3的預(yù)測效果與精度評估。相對于僅使用特征波段,變量模型G1的R2提升了0.0255,RMSE降低了0.2230;引入地形因子的變量模型G2,其R2較變量模型G1提升了0.0398,RMSE降低了0.1685;進(jìn)一步加入Sentinel-1后向散射系數(shù),變量模型G3的R2較變量模型G2提升了0.0255,RMSE降低了0.1385??梢?,在滇中高原地區(qū),光譜指數(shù)、地形因子和Senti-nel-1后向散射系數(shù)數(shù)據(jù)能有效提升SOC含量的反演精度。
2.7基于GF-5高光譜影像的SOC含量反演結(jié)果
滇中高原姚安灌區(qū)土壤以紅壤為主,其肥力較黑土等土壤低。由圖10可看出,在剔除建筑、水體、道路和植被的影響后,反演圖呈現(xiàn)出明顯的SOC含量區(qū)域差異,說明運用XGBoost模型進(jìn)行SOC含量反演主要受滇中高原地形和種植結(jié)構(gòu)等特殊環(huán)境因素的影響?;贕F-5高光譜影像的SOC含量反演結(jié)果顯示,滇中高原姚安灌區(qū)SOC含量范圍為9.8443~29.2514 g/kg,平均為19.4447 g/kg,與土壤樣本SOC含量實測值的范圍(10.47~30.11 g/kg)及平均值(20.6307 g/kg)較接近,即SOC含量在紅壤地區(qū)處于較高水平,適宜種植水稻、小麥、玉米、豆類、薯類等糧食作物,以及花卉和煙葉等高原特色經(jīng)濟(jì)作物。
3討論
本研究發(fā)現(xiàn),進(jìn)行高光譜數(shù)據(jù)預(yù)處理時以AM-Normalize預(yù)處理方法與SOC含量的相關(guān)性最高(相關(guān)系數(shù)為0.7544),究其原因:(1)AM-Normalize預(yù)處理方法是移動平均窗口平滑和Normalize規(guī)范化的結(jié)合,移動平均窗口平滑能有效消除因測試環(huán)境等因素引入的噪聲(呂明磊,2017),尤其在反射光譜曲線前后端表現(xiàn)出顯著的平滑效果,與SOC含量原始反射光譜曲線前后端噪聲較大的特征相符;Nor-malize規(guī)范化處理則增強了數(shù)據(jù)的一致性和可比性(范若渝,2023),二者結(jié)合促使預(yù)處理后的高光譜數(shù)據(jù)能更準(zhǔn)確反映SOC含量的真實信息,從而提升反演的精度和穩(wěn)定性。(2)滇中高原姚安灌區(qū)地勢及種植分布的差異性與特殊性導(dǎo)致光譜數(shù)據(jù)變異較大,而AM-Normalize預(yù)處理方法能更好地適應(yīng)這種復(fù)雜環(huán)境,減少噪聲干擾,突出與SOC相關(guān)的光譜特征。(3)其他預(yù)處理方法雖各具優(yōu)勢,但也存在明顯的局限性。如FD和SD雖能增強光譜的細(xì)微變化,但對噪聲敏感,可能會放大噪聲影響,降低與SOC含量的相關(guān)性(鄧永鵬等,2022);多元散射校正(MSC)雖能消除基線漂移,但會改變光譜的絕對強度信息,進(jìn)而影響與SOC含量的相關(guān)性(熊志立等,2024)。
通過光譜特征篩選能有效降低數(shù)據(jù)的冗余,提高模型反演效率(樊泳灼等,2023)。本研究通過SPA和CARS篩選SOC含量的特征波段,并以XGBoost模型反演,結(jié)果顯示,SPA篩選的波段反演效果最優(yōu),其R2較CARS和全波段數(shù)據(jù)分別提升了0.0739和0.1524,RMSE分別降低了0.9279和1.2793。此外,SPA篩選出的特征波段能對原始光譜數(shù)目實現(xiàn)有效降維,提高模型反演效率,故選用SPA篩選的波段數(shù)據(jù)作為滇中高原姚安灌區(qū)SOC含量反演的輸入變量。本研究還發(fā)現(xiàn),在SOC含量反演模型中引入地形因子和Sentinel-1后向散射系數(shù),顯著提升了XGBoost模型的預(yù)測精度和可靠性,其中,變量模型G3的R2較變量模型G1、G2分別提升了0.0653和0.0255,RMSE分別降低了0.3070和0.1385。在滇中高原的復(fù)雜地理環(huán)境中,地形因子(高程、坡度和坡向)對SOC的含量和空間分布有重要影響。這些地形因子通過調(diào)控植被類型和生產(chǎn)力,間接影響SOC的輸入質(zhì)量與數(shù)量,同時通過改變土壤溫濕度等水熱條件,進(jìn)一步影響有機質(zhì)的分解與腐殖化過程。Sentinel-1后向散射系數(shù)則通過提供土壤含水量和粗糙度等關(guān)鍵參數(shù),豐富XGBoost模型的輸入特征,增強SOC含量反演的精度和區(qū)域適應(yīng)性(羅福正等,2024),為SOC含量反演研究提供了重要的輔助變量。
本研究僅針對滇中高原地區(qū),土壤類型以紅壤為主,基于GF-5高光譜影像構(gòu)建的SOC含量反演模型在其他地區(qū)或土壤類型中的泛化能力仍需進(jìn)一步驗證。此外,SOC含量的空間分布受多種因素影響,本研究使用的輔助變量有限,僅包括光譜指數(shù)、地形因子和Sentine-1后向散射系數(shù)。因此,今后應(yīng)構(gòu)建更全面、更有效的特征變量數(shù)據(jù)集,并結(jié)合多種算法模型,以提高SOC含量反演的精度和適用性。
4結(jié)論
基于GF-5高光譜影像構(gòu)建的XGBoost模型,經(jīng)AM-Normalize預(yù)處理降低噪聲干擾、SPA篩選特征波段及引入光譜指數(shù)、地形因子和Sentinel-1后向散射系數(shù)后,能有效提升SOC含量反演的精度和適用性,為滇中高原地區(qū)SOC含量預(yù)測提供技術(shù)支撐。
參考文獻(xiàn)(References):
鄧永鵬,朱洪芬,丁皓希,孫瑞鵬,畢如田.2022.黃河中游退耕還林地土壤有機碳含量的高光譜估測——以大寧縣為例[J].山西農(nóng)業(yè)科學(xué),50(6):869-877.[Deng Y P,ZhuH F,Ding H X,Sun R P,Bi R T.2022.Estimation of soil organic carbon in returning cropland to forest in the middle reaches of the Yellow River based on hyperspectral data——TakeDaning County as an example[J].Journal of Shanxi Agricultural Sciences,50(6):869-877.]doi:10.3969/j.issn.1002-2481.2022.06.14.
丁金梅,王維珍,米文寶,侯凱元,張喜旺,趙亞楠,文琦.2023.寧夏草地土壤有機碳空間特征及其影響因素[J].生態(tài)學(xué)報,43(5):1913-1922.[Ding J M,Wang W Z,Mi W B,Hou K Y,Zhang X W,Zhao Y N,Wen Q.2023.Spatial characteristics of soil organic carbon in grassland of Ning-xia and its influencing factors[J].Acta Ecologica Sinica,43(5):1913-1922.]doi:10.5846/stxb202201040022.
樊泳灼,李新國.2023.湖濱綠洲棕漠土有機碳含量高光譜估算[J].江蘇農(nóng)業(yè)學(xué)報,39(6):1341-1348.[Fan Y Z,Li X G.2023.Hyperspectral prediction of organic carbon con‐tent of brown desert soil in the lakeside oasis[J].Jiangsu Journal of Agricultural Sciences,39(6):1341-1348.]doi:10.3969/j.issn.1000-4440.2023.06.009.
范若渝.2023.基于中紅外光譜技術(shù)估測內(nèi)蒙古農(nóng)田土壤全氮含量[D].呼和浩特:內(nèi)蒙古農(nóng)業(yè)大學(xué).[Fan RY.2023.Estimation of soil total nitrogen content of farmland soil in Inner Mongolia based on mid-infrared spectroscopy[D].Hohhot:Inner Mongolia Agricultural University.]doi:10.27229/d.cnki.gnmnu.2023.000858.
馮雪琦,趙星輝,劉占欣,張巖,谷啟,張杰,郭二輝.2024.黃河孟津段河岸帶土壤有機碳分布特征及影響因素分析[J].河南農(nóng)業(yè)大學(xué)學(xué)報,58(4):635-643.[Feng X Q,Zhao X H,Liu Z X,Zhang Y,Gu Q,Zhang J,Guo E H.2024.Distribution characteristics and influencing factors of soil organic carbon in the riparian zone of Mengjin Sec‐tion of the Yellow River[J].Journal of Henan Agricultural University,58(4):635-643.]doi:10.16445/j.cnki.1000-2340.20240023.004.
賈子玉,張振豪,莊前友,紅梅,程云湘.2024.利用隨機森林與遙感數(shù)據(jù)估算內(nèi)蒙古東部草地土壤有機碳含量[J/OL].草業(yè)科學(xué).https://link.cnki.net/urlid/62.1069.s.2024 1224.0853.002.[Jia Z Y,Zhang Z H,Zhuang Q Y,Hong M,Cheng Y X.2024.Estimation of soil organic carbon content in grassland in eastern Inner Mongolia using random forest and remote sensing data[J/OL].Pratacultu-ral Science.https://link.cnki.net/urlid/62.1069.s.20241224.0853.002.]doi:10.11829/j.issn.1001-0629.2024-0422.
孔晨晨,顏芳,王維瑞,張世文,郭丹丹,王姍.2024.不同景觀綜合體土壤有機碳空間分異特征及驅(qū)動因素分析[J/OL].環(huán)境科學(xué).https://doi.org/10.13227/j.hjkx.2024032 53.[Kong C C,Yan F,Wang W R,Zhang S W,Guo D D,Wang S.2024.Spatial differentiation characteristics and driving factors of soil organic carbon in various landscape complexes[J].Environmental Science.https://doi.org/10.13227/j.hjkx.202403253.]doi:10.13227/j.hjkx.202403253.
羅福正,楊柳,盧彬,黃永生.2024.基于多時相Sentinel-1影像的江南地區(qū)水稻信息提?。跩].地理空間信息,22(11):73-77.[Luo F Z,Yang L,Lu B,Huang Y S.2024.Rice information extraction in the Southern Yangtze River Re-gion based on multi-temporal Sentinel-1 images[J].Geos-patial Information,22(11):73-77.]doi:10.3969/j.issn.1672-4623.2024.11.014.
呂明磊.2017.拉曼光譜基線校正與噪聲抑制技術(shù)研究[D].成都:電子科技大學(xué).[LüM L.2017.Baseline correction and noise suppression of raman spectroscopy[D].Cheng-du:University of Electronic Science and Technology of China.]
亓子龍.2023.果園土壤有機碳含量的高光譜反演方法研究[D].泰安:山東農(nóng)業(yè)大學(xué).[Qi Z L.2023.Hyperspectralinversion method for organic carbon content of orchardsoil[D].Tai?an:Shandong Agricultural University.]doi:10.27277/d.cnki.gsdnu.2023.000504.
邱壑,陳瀚閱,邢世和,張黎明,董新宇.2017.基于Hyperion數(shù)據(jù)的耕地土壤有機質(zhì)含量遙感反演[J].福建農(nóng)林大學(xué)學(xué)報(自然科學(xué)版),46(4):460-467.[Qiu H,Chen H Y,Xing S H,Zhang L M,Dong X Y.2017.Soil organic mat‐ter estimation models based on Hyperion data[J].Journal of Fujian Agriculture and Forestry University(Natural Science Edition),46(4):460-467.]doi:10.13323/j.cnki.j.fafu(nat.sci.).2017.04.017.
宋發(fā)軍.2021.基于GIS和RDA的丘陵區(qū)土壤養(yǎng)分空間變異及其與地形因子的關(guān)系[J].湖北農(nóng)業(yè)科學(xué),60(17):31-35.[Song F J.2021.Spatial variability and topography factors affecting soil nutrients in hilly area based on GIS and RDA[J].Hubei Agricultural Sciences,60(17):31-35.]doi:10.14088/j.cnki.issn0439-8114.2021.17.007.
宋奇,高小紅,宋玉婷,黎巧麗,陳真,李潤祥,張昊,才桑潔.2024.基于無人機高光譜影像的農(nóng)田土壤有機碳含量估算——以湟水流域農(nóng)田為例[J].自然資源遙感,36(2):160-172.[Song Q,Gao X H,Song Y T,Li Q L,Chen Z,Li R X,Zhang H,Cai S J.2024.Estimation of soil organic carbon content in farmland based on UAV hyperspectral images:A case study of farmland in the Huangshui River basin[J].Remote Sensing for Natural Resources,36(2):160-172.]doi:10.6046/zrzyyg.2023005.
孫怡.2024.基于可解釋機器學(xué)習(xí)的中國表層土壤有機碳時空異質(zhì)性研究[D].北京:中國環(huán)境科學(xué)研究院.[Sun Y.2024.Spatiotemporal heterogeneity of surface soil organic carbon in China based on interpretable machine learning[D].Beijing:Chinese Research Academy of Environmen‐tal Sciences.]doi:10.27510/d.cnki.gzhky.2024.000080.
王亞新.2022.基于高光譜多元統(tǒng)計分析的土壤碳氮的估測研究[D].太谷:山西農(nóng)業(yè)大學(xué).[Wang Y X.2022.Esti‐mation of soil carbon and nitrogen based on hyperspectral multivariate statistical analysis[D].Taigu:Shanxi Agricul‐tural University.]doi:10.27285/d.cnki.gsxnu.2022.000680.
王永平,周子柯,滕昊蔚,牛曉音,李曉輝.2021.滇南小流域3種土地利用方式下土壤侵蝕及養(yǎng)分流失特征[J].水土保持研究,28(1):11-18.[Wang Y P,Zhou Z K,Teng H W,Niu X Y,Li X H.2021.Characteristics of soil erosionand nutrient losses in three land use patterns in the small watershed of Southern Dianchi[J].Research of Soil and Water Conservation,28(1):11-18.]doi:10.13869/j.cnki.rswc.2021.01.001.
熊志立,高會議,萬莉.2024.基于頻譜圖的土壤有機碳含量高光譜反演[J].農(nóng)業(yè)與技術(shù),44(9):28-32.[Xiong Z L,Gao H Y,Wan L.2024.Spectrum map-based hyperspec-tral inversion of soil organic carbon content[J].Agricul-ture and Technology,44(9):28-32.]doi:10.19754/j.nyyjs.20240515007.
楊林婧,楊莎,張圣楊,張文顏,左圓瑔,閆碧瑤,楊武德.2024.農(nóng)田土壤有機碳高光譜特征及定量監(jiān)測研究[J].激光生物學(xué)報,33(4):316-325.[Yang L J,Yang S,Zhang S Y,Zhang W Y,Zuo Y Q,Yan B Y,Yang W D.2024.Hyperspectral characteristics and quantitative monitoring of soil organic carbon in farmland[J].Acta Laser Biology Sinica,33(4):316-325.]doi:10.3969/j.issn.1007-7146.2024.04.004.
楊長保,李東輝,劉津懌,吳夢紅.2017.小波包分析在Hype-rion數(shù)據(jù)提取農(nóng)田土壤有機質(zhì)含量中的應(yīng)用研究[J].應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報,25(5):869-879.[Yang C B,Li D H,Liu JY,Wu M H.2017.The study of extracting farm-land soil organic matter content from Hyperion data by the wavelet packet analysis[J].Journal of Basic Science and Engineering,25(5):869-879.]doi:10.16058/j.issn.1005-0930.2017.05.001.
葉淼,朱琳,劉旭東,黃勇,陳蓓蓓,李歡.2024.基于連續(xù)小波變換、SHAP和XGBoost的土壤有機質(zhì)含量高光譜反演[J].環(huán)境科學(xué),45(4):2280-2291.[Ye M,Zhu L,Liu X D,Huang Y,Chen B B,Li H.2024.Hyperspectral inver-sion of soil organic matter content based on continuous wavelet transform,SHAP,and XGBoost[J].Environmen-tal Science,45(4):2280-2291.]doi:10.13227/j.hjkx.2023 04100.
岳繼博,李婷,宋潔,田慶久,劉楊,馮海寬.2024.基于高光譜和深度學(xué)習(xí)的水稻秸稈覆蓋度遙感估算[J].河南農(nóng)業(yè)大學(xué)學(xué)報,58(5):838-851.[Yue J B,Li T,Song J,Tian Q J,Liu Y,F(xiàn)eng H K.2024.Estimation of rice residue cover by remote sensing based on hyperspectral and deep lear-ning[J].Journal of Henan Agricultural University,58(5):838-851.]doi:10.16445/j.cnki.1000-2340.20240822.002.Meng X T,Bao Y L,Liu J G,Liu H J,Zhang X L,Zhang Y,
Wang P,Tang H T,Kong F C.2020.Regional soil organic carbon prediction model based on a discrete wavelet analy-sis of hyperspectral satellite data[J].International Journal of Applied Earth Observation and Geoinformation,89:102111.doi:10.1016/j.jag.2020.102111.
Nocita M,Stevens A,van Wesemael B,Aitkenhead M,Bach-mann M,Barthès B,Ben Dor E,Brown D J,Clairotte M,Csorba A,Dardenne P,DemattêJ A M,Genot V,Guerrero C,Knadel M,Montanarella L,Noon C,Ramirez-Lopez L,Robertson J,Sakai H,Soriano-Disla J M,Shepherd K D,Stenberg B,Towett E K,Vargas R,Wetterlind J.2015.Chapter four-soil spectroscopy:An alternative to wet chemistry for soil monitoring[J].Advances in Agronomy,132:139-159.doi:10.1016/bs.agron.2015.02.002.
Viscarra Rossel R A,Webster R.2012.Predicting soil proper-ties from the Australian soil visible-near infrared spectro-scopic database[J].European Journal of Soil Science,63(6):848-860.doi:10.1111/j.1365-2389.2012.01495.x.
Xie B Q,Ding J L,Ge X Y,Li X H,Han L J,Wang Z.2022.Estimation of soil organic carbon content in the Ebinur Lake wetland,Xinjiang,China,based on multisource remote sensing data and ensemble learning algorithms[J].Sensors,22(7):2685.doi:10.3390/s22072685.
Xu X B,Luo M Z,Tang Z Y,Pei R H.2018.Echo signal extraction method of laser radar based on improved singu-lar value decomposition and wavelet threshold denoising[J].Infrared Physicsamp;Technology,92:327-335.doi:10.1016/j.infrared.2018.06.028.
Yang C B,F(xiàn)eng M C,Song L F,Wang C,Yang W D,Xie Y K,Jing B H,Xiao L J,Zhang M J,Song X Y,Saleem M.2021.Study on hyperspectral estimation model of soil organic carbon content in the wheat field under different water treatments[J].Scientific Reports,11(1):18582.doi:10.21203/rs.3.rs-530273/v 1.
(責(zé)任編輯:蘭宗寶)