孜尼哈爾?祖努尼江 尼加提?卡斯木 拓跋凱薇
摘要:為探究基于分?jǐn)?shù)階微分(fractional order derivative, FOD)預(yù)處理的光譜反射率與土壤表層有機(jī)質(zhì)含量之間的響應(yīng)機(jī)制,以新疆烏魯木齊縣安寧渠鎮(zhèn)土壤冠層光譜為數(shù)據(jù)源,采用G-L分?jǐn)?shù)階微分方法對高光譜數(shù)據(jù)進(jìn)行0~2.0階次(間隔0.2)預(yù)處理,并利用任意波段組合算法,計算基于分?jǐn)?shù)階微分預(yù)處理光譜的比值光譜指數(shù)、歸一化光譜指數(shù)和差值光譜指數(shù),通過競爭性自適應(yīng)重加權(quán)(CARS)算法篩選土壤有機(jī)質(zhì)含量的敏感波段及光譜指數(shù)等,與3種機(jī)器學(xué)習(xí)(machine learning, ML)算法(ANN、KNN和SVM)相結(jié)合,構(gòu)建基于分?jǐn)?shù)階微分和機(jī)器學(xué)習(xí)方法的土壤有機(jī)質(zhì)含量估算模型,并進(jìn)行模型驗證。結(jié)果表明:基于0~2.0階次的兩波段光譜指數(shù)與土壤有機(jī)質(zhì)含量之間均呈現(xiàn)極顯著相關(guān),基于原數(shù)據(jù)和0.2階預(yù)處理的NDVI和RVI相關(guān)性系數(shù)r超過0.80。該研究基于0.2階NDVI指數(shù)的K近鄰算法模擬土壤有機(jī)質(zhì)含量能力表現(xiàn)最佳,估算模型精度分別為決定系數(shù)(R2)為0.73,均方根誤差(RMSE)為2.11g/kg,相對分析誤差(RPD)為2.23。為遙感技術(shù)提供理論支持,實現(xiàn)對土壤肥沃程度的精準(zhǔn)監(jiān)測和評估,推動智慧農(nóng)業(yè)的發(fā)展。
關(guān)鍵詞:干旱區(qū);土壤有機(jī)質(zhì);分?jǐn)?shù)階微分;機(jī)器學(xué)習(xí)
中圖分類號:S27: O433.4
文獻(xiàn)標(biāo)識碼:A
文章編號:20955553 (2023) 11020109
Estimation of soil organic matter content in arid region based on FOD-ML
Zinhar Zunun Nijat Kasim Tuoba Kaiwei
(1. Institute of Resources and Ecology, Yili Normal University, Yining, 835000, China;
2. College of Biology and Geography, Yili Normal University, Yining, 835000, China)
Abstract:In order to investigate the response mechanism between spectral reflectance and soil surface organic matter content based on fractional differential pre-processing, this study used soil canopy spectra of Anningqu Town, Urumqi County, Xinjiang as the data source. The G-L fractional differential method was used to pre-process the hyperspectral data with orders ranging from 0 to 2.0 (with an interval of 0.2). The ratio spectral index, normalized spectral index, and difference spectral index based on fractional differential pre-processing were calculated using arbitrary band combination algorithms. The competitive adaptive reweighted sampling (CARS) algorithm was used to screen sensitive bands and spectral indices for soil organic matter content, combined with three machine learning algorithms (ANN, KNN, and SVM), a soil organic matter content estimation model based on fractional differential and machine learning methods was constructed, and model validation was performed. The results showed that there was a significant correlation between the spectral indices based on 0-2.0 orders and soil organic matter content. The correlation coefficients (r) of NDVI and RVI based on the original data and 0.2 order preprocessing exceeded 0.80. The K-nearest neighbor algorithm based on the 0.2 order NDVI index exhibited the best ability to simulate soil organic matter content, with a coefficient of determination (R2) of 0.73, a root mean square error (RMSE) of 2.11 g/kg, and a relative analysis error (RPD) of 2.23, respectively. The study can provide theoretical support for remote sensing technology, achieve accurate monitoring and evaluation of soil fertility, and promote the development of smart agriculture.
Keywords:arid area; soil organic matter; fractional differentiation; machine learning
0引言
土壤有機(jī)質(zhì)(Soil Organic Matter, SOM)是土壤固相部分的重要成分,是植物生長過程中所需營養(yǎng)物質(zhì)的供源,也是評價土壤保肥性能的重要指標(biāo)[14]。因此,土壤SOM含量的快速準(zhǔn)確監(jiān)測可為土壤狀況的改良、完善和優(yōu)化土壤施肥措施,以及對精準(zhǔn)農(nóng)業(yè)可持續(xù)發(fā)展提供理論基礎(chǔ)。目前,隨著高光譜遙感技術(shù)的發(fā)展,在國內(nèi)外以其規(guī)模大、實時觀測、客觀性強(qiáng)、成本低、無損和高效等優(yōu)勢被廣泛采納于土壤重要參數(shù)的定量估算[57]。
對土壤有機(jī)質(zhì)遙感定量監(jiān)測中,前者利用土壤表層光譜數(shù)據(jù)與其有機(jī)質(zhì)含量進(jìn)行了一系列的相關(guān)分析以及土壤有機(jī)質(zhì)含量估算研究,并取得了較好的研究者成果。Krishnan等[8]采用4種不同土壤光譜反射率與其SOM含量進(jìn)行相關(guān)性分析,研究表明土壤有機(jī)質(zhì)含量最佳波段為0.62μm和0.56μm,敏感波段范圍集中于可見光波段區(qū)域,而NIR部分沒有出現(xiàn)明顯光譜特征;Hummel等[9]對土壤樣品光譜反射率進(jìn)行了倒數(shù)對數(shù)等數(shù)學(xué)變換,分析了光譜反射率預(yù)處理前后的變化以及與土壤有機(jī)質(zhì)含量的響應(yīng),并構(gòu)建了相應(yīng)的多元逐步回歸估算模型;Conforti等[10]收集了不同地區(qū)土壤樣品(共215個),通過偏小二乘回歸算法構(gòu)建了土壤有機(jī)質(zhì)含量PLSR模型,并在估算模型的評價精度上取得了一定的研究成果;尚天浩等[11]利用標(biāo)準(zhǔn)正態(tài)變量、峰值歸一化、一階微分、對數(shù)的倒數(shù)和倒數(shù)等5種方法對高光譜進(jìn)行數(shù)學(xué)變換,對敏感波段進(jìn)行最優(yōu)建模變量提取;何少芳等[12]通過生成式對抗網(wǎng)絡(luò)方法生成了等量的新數(shù)據(jù),利用交叉驗證嶺回歸、PLSR和BP神經(jīng)網(wǎng)絡(luò)等算法,建立估算模型并進(jìn)行了精度驗證;尼加提·卡斯木等[13]通過400~2400 nm范圍的光譜數(shù)據(jù)進(jìn)行兩波段組合優(yōu)化計算,構(gòu)建最佳波段組合的植被指數(shù),并構(gòu)建了基于波段組合優(yōu)化植被指數(shù)的土壤SOM估算模型;欒福明等[14]分別建立了基于敏感光譜波段信息的多元線性逐步回歸模型和人工神經(jīng)網(wǎng)絡(luò)模型,分析了不同建模方法再土壤有機(jī)質(zhì)含量估算中的應(yīng)用。盡管諸多研究學(xué)者對土壤SOM含量的估算中,進(jìn)行了大量的高光譜數(shù)據(jù)的數(shù)學(xué)變換以及計算相應(yīng)的植被指數(shù),進(jìn)一步對兩波段植被指數(shù)完成了波段組合優(yōu)化等;研究表明土壤光譜反射率特征隨著土壤組成成分的多樣性而具備一定的差異性,因此不同區(qū)域土壤參數(shù)估算研究成果相互應(yīng)用可能呈現(xiàn)一定誤差[15]。在此問題上,試著利用波段組合優(yōu)化的植被指數(shù),尋找研究區(qū)最佳敏感光譜指數(shù),也是該研究的核心部分。對解決模型參數(shù)多重共線性和建模復(fù)雜性等問題,孫倩等利用PLSR方法,發(fā)現(xiàn)了多元線性回歸、主成分分析、典型相關(guān)分析等方法的優(yōu)點集成于PLSR算法當(dāng)中,對模型參數(shù)的篩選,PLSR算法具有一定優(yōu)勢,在土壤參數(shù)篩選與估算具有一定的意義[16]。
因此,本文以新疆烏魯木齊縣安寧渠鎮(zhèn)土壤有機(jī)質(zhì)為研究對象,對采樣點土壤樣品進(jìn)行室內(nèi)測定獲取土壤有機(jī)質(zhì)含量和光譜數(shù)據(jù)采集,試著對土壤光譜數(shù)據(jù)進(jìn)行G-L分?jǐn)?shù)階微分(間隔0.2)預(yù)處理,比較光譜預(yù)處理前后對任意兩波段組合的植被指數(shù)影響,并分析不同階次所對應(yīng)的植被指數(shù)與土壤有機(jī)質(zhì)含量的關(guān)聯(lián)程度,利用競爭性自適應(yīng)重加權(quán)算法篩選非多重共線性的敏感植被指數(shù),結(jié)合不同的機(jī)器學(xué)習(xí)算法,建立研究區(qū)最優(yōu)的土壤有機(jī)質(zhì)含量估算模型,并在一定程度上提高模型的精度,對研究區(qū)田間尺度快速、準(zhǔn)確地評估土壤肥力提供方法依據(jù)。
1材料與方法
1.1研究區(qū)概況
研究區(qū)位于烏魯木齊市北郊的沖積平原上,地勢平緩,地理坐標(biāo)為87°25′~87°30′E,43°57′~44°06′N,圖1為研究區(qū)采樣點分布區(qū)域;地處中溫帶干旱氣候區(qū),光熱充足,土壤肥沃,適合一般的農(nóng)作物、蔬菜和果樹生長[1718]。該區(qū)域水資源豐富,既有水質(zhì)良好的地下水資源,又有縱貫?zāi)媳钡暮推角峁┑牡乇韽搅?,形成井渠雙灌的地方特色,為農(nóng)牧業(yè)的豐收奠定了良好的基礎(chǔ)[1920]。
1.2數(shù)據(jù)采集與處理
土壤樣品的采集時間為2017年10月15日,針對烏魯木齊市安寧渠蔬菜基地研究區(qū)典型景觀特征,設(shè)置5m×5m樣方。利用GPS記錄每個樣方位置,采用5點混合法進(jìn)行樣品采集,土壤樣品采樣深度為0~10cm,共計57個土壤樣品。土壤樣品帶回實驗室并進(jìn)行自然風(fēng)干、研磨后,過2mm孔篩分為兩部分,分別用于室內(nèi)高光譜數(shù)據(jù)的測定及土壤有機(jī)質(zhì)的化學(xué)分析。其中,土壤有機(jī)質(zhì)質(zhì)量比采取重鉻酸鉀容量—硫酸氧化法進(jìn)行測定[21]。
因環(huán)境影響因素的存在,易在邊緣波段350~399nm和2401~2500nm出現(xiàn)較大噪聲,對室內(nèi)測定的高光譜數(shù)據(jù)需要進(jìn)行噪聲去除處理。利用常用的Savitzky-Golay濾波方法進(jìn)行剩余光譜數(shù)據(jù)(400~2400nm)的平滑處理;此后通過Matlab2014采用分?jǐn)?shù)階微分一元函數(shù)差分(Grünwald-Letnikov, G-L)[2223]實現(xiàn)光譜反射率的0~2階之間運算,G-L分?jǐn)?shù)階微分表達(dá)式如式(1)所示。
dvf(x)/dxv≈f(x)+(-v)f(x-1)+(-v)(-v+1)/2f(x-2)+…+Γ(-v+1)/m!Γ(-v+m+1)f(x-m)(1)
式中:
x——對應(yīng)點的值;
v——階數(shù);
Γ(·)——Gamma函數(shù);
m——微分上下限之差。
1.3敏感植被指數(shù)的篩選
光譜指數(shù)是通過目標(biāo)物的光譜特征,對波段反射率進(jìn)行組合計算,不僅能充分考慮波段之間的相互關(guān)系,還可以有效地提高與目標(biāo)物之間的度量關(guān)系[24]。在前人研究基礎(chǔ)上,通過對光譜全波段信息多種方式組合計算,利用RVI(Ratio Vegetation Index)、NDVI(Normalized Difference Vegetation Index)和DVI(Difference Vegetation Index)構(gòu)建任意兩波段組合二維光譜指數(shù),達(dá)到波段組合優(yōu)化的植被指數(shù)[25]。最佳敏感植被指數(shù)的選擇中,先利用基于分?jǐn)?shù)階微分處理的光譜數(shù)據(jù)構(gòu)建任意兩波段組合的二維光譜指數(shù),并與土壤有機(jī)質(zhì)含量進(jìn)行Pearson相關(guān)性分析,分別篩選相關(guān)系數(shù)通過0.01水平顯著性檢驗的RVI、NDVI、DVI,計算公式如式(2)~式(4)所示。
比值植被指數(shù)
RVI=Rλ1/Rλ2(2)
歸一化植被指數(shù)
NDVI=(Rλ1-Rλ2)/(Rλ1+Rλ2)(3)
差值植被指數(shù)
DVI=Rλ1-Rλ2(4)
式中:
λ——400~2 400 nm范圍內(nèi)任意波長;
R——波長對應(yīng)的反射率。
為消除共線性光譜指數(shù)的存在問題,本文采用競爭性自適應(yīng)重加權(quán)算法(Competitive Adaptive Reweighted Sampling, CARS)進(jìn)行精細(xì)的篩選。CARS算法是通過自適應(yīng)重加權(quán)采樣(Adaptive Reweighted Sampling, ARS)技術(shù)選擇出偏最小二乘回歸模型中回歸系數(shù)絕對值大的波長點,去掉權(quán)重小的波長點,利用交互驗證選出均方根誤差(Root Mean Square Error, RMSE)值最低的子集,可有效尋出最優(yōu)變量組合[26]。
1.4估算模型的建立與驗證
ANN(Artificial Neural Network, ANN)是指由大量的處理單元(神經(jīng)元)互相連接而形成的復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu),是對人腦組織結(jié)構(gòu)和運行機(jī)制的某種抽象、簡化和模擬[27]。以數(shù)學(xué)模型模擬神經(jīng)元活動,是基于模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立的一種信息處理系統(tǒng)。KNN(K-Nearest Neighbors, KNN)是一個理論上比較成熟的方法,也是最簡單的機(jī)器學(xué)習(xí)算法之一。如果一個樣本在特征空間中的K個最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別[28]。SVR(Support Vector Regression, SVR)是支持向量機(jī)(Support Vector Machine, SVM)算法來計算出來的回歸方法,是輸入標(biāo)簽連續(xù)值時選取的模式[29]。
對建立的模型進(jìn)行穩(wěn)定性和預(yù)測能力的驗證,主要是以最高的決定系數(shù)(Coefficient of Determination, R2)和最低的均方根誤差(Root Mean Square Error, RMSE)來決定,表明數(shù)據(jù)擬合效果;相對分析誤差(Relative Percent Deviation, RPD),指示模型的預(yù)測能力,計算過程是標(biāo)準(zhǔn)偏差(Standard Deviation, SD)與估計標(biāo)準(zhǔn)誤差(Standard Error of Prediction, SEP)之比。根據(jù)模型的預(yù)測能力,RPD值有三種情況:(1)RPD的值超過2.0,說明該模型具有較好的預(yù)測能力;(2)RPD值在1.4~2.0之間,代表具有一般預(yù)測能力;(3)RPD值小于1.4,說明其預(yù)測能力較差。
2結(jié)果與分析
2.1數(shù)據(jù)統(tǒng)計及光譜特征分析
對土壤有機(jī)質(zhì)含量估算模型的建立與精度驗證,將采樣數(shù)據(jù)分成建模集和驗證集(表2)。分析可知,研究區(qū)土壤樣品有機(jī)質(zhì)含量最大值為31.78g/kg,最小值為2.70g/kg,標(biāo)準(zhǔn)差為5.79g/kg,數(shù)據(jù)的離散程度達(dá)到53.17%;隨機(jī)選擇構(gòu)建的建模集土壤有機(jī)質(zhì)含量最大值為31.78g/kg,最小值為4.39g/kg,標(biāo)準(zhǔn)差為6.37g/kg,數(shù)據(jù)的離散程度達(dá)到53.82%;驗證集土壤有機(jī)質(zhì)含量最大值為15.79g/kg,最小值為2.70g/kg,標(biāo)準(zhǔn)差為3.19g/kg,數(shù)據(jù)的離散程度達(dá)到36.54%;總數(shù)據(jù)集的變異系數(shù)恰好介于建模集與驗證集之間,數(shù)據(jù)離散程大于36%,屬于高度變異[23]。
據(jù)土壤養(yǎng)分含量分級標(biāo)準(zhǔn)[28],將采樣區(qū)土壤有機(jī)質(zhì)含量分為極高、高、中、低、極低等5個等級,對不同等級對應(yīng)的光譜反射率進(jìn)行加權(quán)平均,并作為該等級的光譜反射率值。圖2是基于不同等級的土壤有機(jī)質(zhì)含量對高光譜反射率的影響關(guān)系,分析可知,在紅邊波段范圍對土壤有機(jī)質(zhì)響應(yīng)比較明顯,尤其是在1 500~2 200nm波段范圍內(nèi),光譜反射率值差異比較顯著;而在可見光部分,對不同土壤有機(jī)質(zhì)含量的區(qū)分比較難,差異性較弱。
2.2光譜指數(shù)與土壤有機(jī)質(zhì)含量的相關(guān)性
為尋求基于分?jǐn)?shù)階微分構(gòu)建的兩波段光譜指數(shù)與土壤有機(jī)質(zhì)含量之間的最佳階數(shù)和波段信息,該研究分別分析了0~2階次下(間隔0.2)構(gòu)建的兩波段光譜指數(shù)與土壤有機(jī)質(zhì)含量之間的相關(guān)性,結(jié)果如圖3所示。
分析發(fā)現(xiàn),基于分?jǐn)?shù)階微分構(gòu)建的NDVI、RVI和DVI均呈現(xiàn)極顯著相關(guān);其中NDVI和RVI指數(shù)相關(guān)系數(shù)均達(dá)到±0.8;而DVI指數(shù)相關(guān)性略低于前兩種植被和指數(shù)。說明基于分?jǐn)?shù)階微分處理的光譜反射率構(gòu)建NDVI和RVI對土壤有機(jī)質(zhì)含量的敏感性明顯增強(qiáng)。
為構(gòu)建估算模型的參數(shù)篩選,該研究對相關(guān)系數(shù)閾值劃分,劃分標(biāo)準(zhǔn)為相關(guān)系數(shù)滿足|r|≥0.80且通過0.01顯著性水平檢驗的所有波段數(shù)量,見表3所示。通過相關(guān)性系數(shù)的統(tǒng)計分析發(fā)現(xiàn),構(gòu)建的DVI指數(shù)與土壤有機(jī)質(zhì)含量之間的最高相關(guān)系數(shù)絕對值為0.79,主要是在0.0到1.0階次范圍內(nèi)出現(xiàn);而構(gòu)建的NDVI和RVI指數(shù)在0.0到1.0階次范圍內(nèi)出現(xiàn)了最高相關(guān)性,相關(guān)系數(shù)絕對值均為0.82,在原數(shù)據(jù)(0.0階次)構(gòu)建的NDVI指數(shù)滿足|r|≥0.80的系數(shù)數(shù)量為82,RVI指數(shù)滿足|r|≥0.80的系數(shù)數(shù)量為85;基于0.2階次構(gòu)建的NDVI和RVI指數(shù)滿足|r|≥0.80的系數(shù)數(shù)量分別為32和33;在0.4到2.0階次范圍中,三種光譜指數(shù)均未出現(xiàn)滿足|r|≥0.80的系數(shù)。
因此,該研究試著建立基于滿足|r|≥0.80的系數(shù)對應(yīng)波段反射率的土壤有機(jī)質(zhì)含量估算模型并進(jìn)行精度驗證。
2.3基于CARS的敏感參數(shù)選擇
為了驗證模型變量共線性光譜指數(shù)的存在,該研究首先利用Pearson相關(guān)性方法篩選滿足|r|≥0.80且通過0.01顯著性水平檢驗的所有光譜指數(shù)的數(shù)量,再通過CARS(Competitive Adaptive Reweighted)算法對篩選的結(jié)果進(jìn)一步驗證。
由CARS算法進(jìn)行驗證并有效尋出最優(yōu)變量組合中,設(shè)置采樣次數(shù)為100次,誤差值最小對應(yīng)變量作為最佳參數(shù)集,結(jié)果如圖4所示。
NDVI和RVI的對比各次采樣RMSECV值均呈現(xiàn)隨著迭代次數(shù)的增加而上升趨勢,最小值分別是1.47g/kg、1.48g/kg、1.21g/kg和1.18g/kg;說明基于0.0和0.2階次篩選出來的敏感光譜指數(shù)(NDVI和RVI)中,不存在共線性變量,符合建立土壤有機(jī)質(zhì)含量估算模型參數(shù)。
2.4模型建立與驗證
在土壤有機(jī)質(zhì)含量與兩波段植被指數(shù)之間的關(guān)聯(lián)程度分析發(fā)現(xiàn),基于分?jǐn)?shù)階微分的光譜指數(shù)對其相關(guān)程度具有一定的差異。其中,基于分?jǐn)?shù)階微分(0.0和0.2階次)的NDVI和RVI兩波段光譜指數(shù)優(yōu)化后的關(guān)聯(lián)程度呈現(xiàn)最高。在數(shù)據(jù)建模中,因0.4~2.0階次中未出現(xiàn)滿足|r|≥0.80且通過0.01顯著性水平的光譜指數(shù),因此不參與模型構(gòu)建;而對0.0和0.2階次構(gòu)建的光譜指數(shù)選用3種機(jī)器學(xué)習(xí)算法(KNN、SVR、ANN)進(jìn)行訓(xùn)練,并根據(jù)模型評價指標(biāo)進(jìn)行對比分析,訓(xùn)練數(shù)據(jù)集與驗證數(shù)據(jù)集的模型評價結(jié)果見表4所示。
從0.0和0.2階次構(gòu)建的12種估算模型結(jié)果分析發(fā)現(xiàn),基于原始光譜數(shù)據(jù)篩選的敏感參數(shù)比基于分?jǐn)?shù)階微分處理篩選結(jié)果2倍多,該研究利用分?jǐn)?shù)階微分方法對模型有效參數(shù)的篩選具有一定的貢獻(xiàn)。其中,基于0.2階微分光譜指數(shù)的建模精度R2從0.61提升到0.75,對模型的估算精度有所提高。從數(shù)據(jù)模擬與估算能力分析發(fā)現(xiàn),KNN和SVR算法在不同數(shù)據(jù)建模效果與估算能力中均處于較好的運算和模擬過程,僅有該兩種算法的相對分析誤差RPD值分別達(dá)到了2.23、2.02、2.15,其余算法的相對分析誤差RPD值均低于2.0。
通過該研究估算模型的驗證值與估算值之間散點分布分析發(fā)現(xiàn)(圖5),結(jié)合高光譜數(shù)據(jù)的分?jǐn)?shù)階微分預(yù)處理和3種機(jī)器學(xué)習(xí)算法的建模與模擬,對土壤有機(jī)質(zhì)含量估算能力較好的階數(shù)和機(jī)器學(xué)習(xí)方法分別為0.2階、KNN算法;該研究基于0.2階NDVI指數(shù)的K近鄰算法模擬土壤有機(jī)質(zhì)含量能力表現(xiàn)最佳,R2=0.73,RMSE=2.11g/kg,RPD=2.23。
基于0.2階的高光譜數(shù)據(jù)處理,并計算了0.2階數(shù)據(jù)下的NDVI指數(shù),通過對指數(shù)的篩選,確定了參與模型的有效指數(shù),在0.2階處理數(shù)據(jù)中,參與光譜指數(shù)計算的有效組合波段如表5所示。
3討論
分析基于分?jǐn)?shù)階微分預(yù)處理的光譜反射率與土壤有機(jī)質(zhì)含量之間的關(guān)系,該研究以新疆烏魯木齊縣安寧渠鎮(zhèn)土壤為數(shù)據(jù)源,采用分?jǐn)?shù)階微分處理方法對高光譜數(shù)據(jù)進(jìn)行0.0~2.0階次預(yù)處理,并運算兩波段光譜指數(shù)(DVI、NDVI、RVI),篩選光譜指數(shù)與土壤有機(jī)質(zhì)含量之間滿足|r|≥0.80系數(shù)的敏感光譜指數(shù),利用人工神經(jīng)網(wǎng)絡(luò)、K近鄰和支持向量回歸等3種建模方法,構(gòu)建了基于分?jǐn)?shù)階微分和機(jī)器學(xué)習(xí)方法的土壤有機(jī)質(zhì)含量估算模型,取得了較好的預(yù)測效果。該研究最后參與建模的敏感參數(shù)為原數(shù)據(jù)(0.0階)和0.2階的光譜數(shù)據(jù),分析發(fā)現(xiàn)基于0.2階的光譜指數(shù)(NDVI和RVI)模型精度較高。
已研究中,對光譜指數(shù)的計算多數(shù)基于特定波長反射率或顯著性波段,對400~2400nm光譜數(shù)據(jù)來說,無法呈現(xiàn)光譜的隱含信息。徐繼剛等研究學(xué)者表明光譜數(shù)據(jù)通過分?jǐn)?shù)階微分預(yù)處理不僅可以有效地減少背景噪聲,而且突出隱含細(xì)節(jié)的光譜信息[23]。土壤光譜反射特性是因土壤各種理化性狀相互作用產(chǎn)生,并具有一定的區(qū)域獨特性和地域性。因此,在土壤光譜反射率數(shù)據(jù)的進(jìn)一步研究上具有很大的意義[3032]。不同參數(shù)的高光譜建模研究中,高光譜原始數(shù)據(jù)或基于原始數(shù)據(jù)計算的傳統(tǒng)植被指數(shù)、以及基于不同數(shù)學(xué)方法預(yù)處理等都是高光譜建模過程的重要組成部分,植被指數(shù)的構(gòu)建要比單波段反射率的特性穩(wěn)定且敏感性較強(qiáng),整數(shù)階預(yù)處理對光譜隱藏信息的突出具有很好的幫助,分?jǐn)?shù)階微分更能夠細(xì)化和呈現(xiàn)隱藏光譜信息,對土壤不同參數(shù)的敏感性更顯著。本研究采用全波段光譜數(shù)據(jù)的分?jǐn)?shù)階微分方法的歸一化處理,分別運算基于原數(shù)據(jù)和處理后的光譜指數(shù),尋求全波段有效信息的組合,降低了基線漂移和背景噪聲的影響,增強(qiáng)了土壤有機(jī)質(zhì)光譜吸收特征。
該研究綜合不同預(yù)處理方法的優(yōu)點,基于分?jǐn)?shù)階微分全波段預(yù)處理,進(jìn)行所有可能兩波段組合計算植被指數(shù),結(jié)合機(jī)器學(xué)習(xí)的方法構(gòu)建土壤有機(jī)質(zhì)含量高光譜估算模型,對干旱區(qū)土壤參數(shù)高精度遙感監(jiān)測方面提供了理論基礎(chǔ)和科學(xué)依據(jù)。
4結(jié)論
以新疆烏魯木齊縣安寧渠鎮(zhèn)土壤為數(shù)據(jù)源,采用分?jǐn)?shù)階微分處理方法對高光譜數(shù)據(jù)進(jìn)行預(yù)處理,利用人工神經(jīng)網(wǎng)絡(luò)、K近鄰和支持向量回歸等3種建模方法和兩波段光譜指數(shù),構(gòu)建了基于分?jǐn)?shù)階微分和機(jī)器學(xué)習(xí)方法的土壤有機(jī)質(zhì)含量估算模型,得出了以下結(jié)論。
1)? 在0~2階次下(間隔0.2)構(gòu)建的兩波段光譜指數(shù)與土壤有機(jī)質(zhì)含量之間的相關(guān)性中,得出基于分?jǐn)?shù)階微分構(gòu)建的NDVI、RVI和DVI均呈現(xiàn)極顯著相關(guān);其中NDVI和RVI指數(shù)相關(guān)系數(shù)均達(dá)到了0.8以上;對DVI指數(shù)而言,NDVI和RVI對土壤有機(jī)質(zhì)含量的敏感性明顯較強(qiáng)。
2)? 在相關(guān)系數(shù)滿足|r|≥0.80且通過0.01顯著性水平檢驗的所有波段數(shù)量分析中,原數(shù)據(jù)(0.0階次)構(gòu)建的NDVI、RVI指數(shù)滿足|r|≥0.80的系數(shù)數(shù)量分別為82、85;而基于0.2階次構(gòu)建的NDVI和RVI指數(shù)滿足|r|≥0.80的系數(shù)數(shù)量分別為32和33;有效的降低了參與模型的參數(shù)數(shù)量。
3)? 對于土壤有機(jī)質(zhì)含量估測模型的建立,3種機(jī)器學(xué)習(xí)算法的建模與模擬,對土壤有機(jī)質(zhì)含量估算能力較好的階數(shù)和機(jī)器學(xué)習(xí)方法分別為0.2階、KNN算法;該研究基于0.2階NDVI指數(shù)的K近鄰算法模擬土壤有機(jī)質(zhì)含量能力表現(xiàn)最佳,估算模型精度分別為R2=0.73,RMSE=2.11g/kg,RPD=2.23。
參考文獻(xiàn)
[1]鄭建樂, 張家禎, 劉微, 等. 土壤有機(jī)質(zhì)含量高光譜定量反演研究[J]. 北方園藝, 2022(16): 83-91.Zheng Jianle, Zhang Jiazhen, Liu Wei, et al. Study on quantitative inversion of soil organic matter content by hyperspectral [J]. Northern Horticulture, 2022(16): 83-91.
[2]成永生, 周瑤. 土壤重金屬高光譜遙感定量監(jiān)測研究進(jìn)展與趨勢[J]. 中國有色金屬學(xué)報, 2021, 31(11): 3450-3467.Cheng Yongsheng, Zhou Yao. Research progress and trend of quantitative monitoring of hyperspectral remote sensing for heavy metals in soil [J]. The Chinese Journal of Nonferrous Metals. 2021, 31(11): 3450-3467.
[3]焦彩霞, 鄭光輝, 解憲麗, 等. 可見—短近紅外成像光譜數(shù)據(jù)的土壤有機(jī)質(zhì)含量估算[J]. 光譜學(xué)與光譜分析, 2020, 40(10): 3277-3281.Jiao Caixia, Zheng Guanghui, Jie Xianli, et al. Prediction of soil organic matter using visible-short near-infrared imaging spectroscopy [J]. Spectroscopy and Spectral Analysis, 2020, 40(10): 3277-3281.
[4]趙瑞, 崔希民, 劉超. GF-5高光譜遙感影像的土壤有機(jī)質(zhì)含量反演估算研究[J]. 中國環(huán)境科學(xué), 2020, 40(8): 3539-3545.Zhao Rui, Cui Ximin, Liu Chao. Inversion estimation of soil organic matter content based on GF-5 hyperspectral remote sensing image [J]. China Environmental Science, 2020, 40(8): 3539-3545.
[5]馮泉霖, 李洪濤, 徐夕博, 等. 基于聚類深度網(wǎng)絡(luò)模型的萊州灣近岸平原表層土壤有機(jī)質(zhì)含量遙感估算[J]. 安全與環(huán)境學(xué)報, 2022, 22(4): 2248-2258.Feng Quanlin, Li Hongtao, Xu Xibo, et al. Remote sensed estimation of soil organic matter using cluster-based deep neural network in the nearshore plains of Laizhou Bay, eastern China [J]. Journal of Safety and Environment, 2022, 22(4): 2248-2258.
[6]葉勤, 姜雪芹, 李西燦, 等. 基于高光譜數(shù)據(jù)的土壤有機(jī)質(zhì)含量反演模型比較[J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2017, 48(3): 164-172.Ye Qin, Jiang Xueqin, Li Xishan, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data [J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3): 164-172.
[7]王延倉, 楊貴軍, 朱金山, 等. 基于小波變換與偏最小二乘耦合模型估測北方潮土有機(jī)質(zhì)含量[J]. 光譜學(xué)與光譜分析, 2014, 34(7): 1922-1926.Wang Yancang, Ynag Guijun, Zhu Jinshan, et al. Estimation of organic matter content of north Fluvo-aquic soil based on the coupling model of wavelet transform and partial least squares [J]. Spectroscopy and Spectral Analysis, 2014, 34(7): 1922-1926.
[7]于雷, 洪永勝, 耿雷, 等. 基于偏最小二乘回歸的土壤有機(jī)質(zhì)含量高光譜估算[J]. 農(nóng)業(yè)工程學(xué)報, 2015, 31(14): 103-109.Yu Lei, Hong Yongsheng, Geng Lei, et al. Hyperspectral estimation of soil organic matter content based on partial least squares regression [J]. Transactions of the Chinese Society of Agricultural Engineering, 2015, 31(14): 103-109.
[8]Krishnan P, Alexander J D, Butler B J, et al. Reflectance technique for predicting soil organic matter [J]. Soil Science Society of America Journal, 1980, 44(6): 1282-1285.
[9]Hummel J W, Sudduth K A, Hollinger S E. Soil moisture and organic matter prediction of surface and subsurface soils using an NIR soil sensor [J]. Computers and Electronics in Agriculture, 2001, 32(2): 149-165.
[10]Conforti M, Buttafuoco G, Leone A P, et al. Studying the relationship between water-induced soil erosion and soil organic matter using Vis-NIR spectroscopy and geomorphological analysis: A case study in southern Italy [J]. Catena, 2013, 110: 44-58.
[11]尚天浩, 毛鴻欣, 張俊華, 等. 基于PCA敏感波段篩選與SVM建模的銀川平原土壤有機(jī)質(zhì)高光譜估算[J]. 生態(tài)學(xué)雜志, 2021, 40(12): 4128-4136.Shang Tianhao, Mao Hongxin, Zhang Junhua, et al. Hyperspctral estimation of soil organic matter content in Yinchuan plain, China based on PCA sensitive band screening and SVM modeling [J]. Chinese Journal of Ecology, 2021, 40(12): 4128-4136.
[12]何少芳, 沈陸明, 謝紅霞. 生成式對抗網(wǎng)絡(luò)的土壤有機(jī)質(zhì)高光譜估測模型[J]. 光譜學(xué)與光譜分析, 2021, 41(6): 1905-1911.He Shaofang, Shen Luming, Xie Hongxia. Hyperspectral estimation model of soil organic matter content using generative adversarial networks [J]. Spectroscopy and Spectral Analysis, 2021, 41(6): 1905-1911.
[13]尼加提·卡斯木, 茹克亞·薩吾提, 師慶東, 等. 基于優(yōu)化光譜指數(shù)的土壤有機(jī)質(zhì)含量估算[J]. 農(nóng)業(yè)機(jī)械學(xué)報, 2018, 49(11): 155-163.Nejat Kasim, Rukeya Sawut, Shi Qingdong, et al. Estimation of soil organic matter content based on optimized spectral index [J]. Transactions of the Chinese Society for Agricultural Machinery,? 2018, 49(11): 155-163.
[14]欒福明, 張小雷, 熊黑鋼, 等. 基于不同模型的土壤有機(jī)質(zhì)含量高光譜反演比較分析[J]. 光譜學(xué)與光譜分析, 2013, 33(1): 196-200.Luan Fuming, Zhang Xiaolei, Xiong Heigang, et al. Comparative analysis of soil organic matter content based on different hyperspectral inversion models [J]. Spectroscopy and Spectral Analysis, 2013, 33(1): 196-200.
[15]劉磊, 沈潤平, 丁國香. 基于高光譜的土壤有機(jī)質(zhì)含量估算研究[J]. 光譜學(xué)與光譜分析, 2011, 31(3): 762-766.Liu Lei, Shen Runping, Ding Guoxiang. Studies on the estimation of soil organic matter content based on hyper-spectrum [J]. Spectroscopy and Spectral Analysis, 2011, 31(3): 762-766.
[16]李曉明, 韓霽昌, 李娟. 典型半干旱區(qū)土壤鹽分高光譜特征反演[J]. 光譜學(xué)與光譜分析, 2014, 34(4): 1081-1084.Li Xiaoming, Han Jichang, Li Juan. Research on hyperspectral inversion of soil salinity in typical semiarid area [J]. Spectroscopy and Spectral Analysis, 2014, 34(4): 1081-1084.
[17]胡慧玲, 玉素甫·艾力, 阿布力米提·阿布都卡德爾. 烏魯木齊市安寧渠區(qū)蔬菜中重金屬的分布特征研究[J]. 新疆大學(xué)學(xué)報(自然科學(xué)版), 2003, 20(3): 260-263.Hu Huiling, Yusup Ali, Abdumijit Abdukadir. Study on distribution characterastics of heavy metals in vegetables of Anningqu district in Urumqi [J]. Journal of Xinjiang University (Natural Science Edition), 2003, 20(3): 260-263.
[18]米熱阿地力·庫爾班, 買合木提·巴拉提, 斯馬伊力江·艾尼瓦爾, 等. 烏魯木齊市安寧渠蔬菜基地土壤重金屬污染現(xiàn)狀及潛在生態(tài)風(fēng)險評價[J]. 地球與環(huán)境, 2019, 47(4): 485-494.Miradil Kurban, Maihemut Balati, Simayil Ainiwar, et al. Characteristics and ecological risk assessment of heavy metals in soil of the Anningqu vegetable base in Urumqi [J]. Earth and Environment, 2019, 47(4): 485-494.
[19]許月英, 李剛, 賈那別克. 烏魯木齊“市菜籃子”基地土壤環(huán)境質(zhì)量現(xiàn)狀調(diào)查[J]. 干旱環(huán)境監(jiān)測, 2006(3): 137-141.Xu Yueying, Li Gang, Jianabieke. Investigation on the soil environmental quality of “Shopping Basket” base in Urumqi [J]. Arid Environmental Monitoring, 2006(3): 137-141.
[20]杜萍萍, 何麗, 王亞宇. 烏魯木齊市蔬菜基地土壤有效態(tài)鎘的空間變異特征[J]. 干旱環(huán)境監(jiān)測, 2011, 25(2): 85-89.Du Pingping, He Li, Wang Yayu. Spatial variation of soil available Cd in Urumqi vegetable base [J]. Arid Environmental Monitoring, 2011, 25(2): 85-89.
[21]李孝蘭. 用重鉻酸鉀氧化容量法測定土壤有機(jī)質(zhì)關(guān)鍵技術(shù)[J]. 現(xiàn)代農(nóng)村科技, 2013(23): 36.
[22]林世敏, 許傳炬. 分?jǐn)?shù)階微分方程的理論和數(shù)值方法研究[J]. 計算數(shù)學(xué), 2016, 38(1): 1-24.Li Shimin, Xu Chuanju. Theoretical and numerical investigation of fractional differential equations [J]. Mathematica Numerica Sinica, 2016, 38(1):? 1-24.
[23]徐繼剛, 馮新瀘, 管亮, 等. 分?jǐn)?shù)階微分在紅外光譜數(shù)據(jù)預(yù)處理中的應(yīng)用[J]. 化工自動化及儀表, 2012(3): 347-351.Xu Jigang, Feng Xinlu, Guang Liang, et al. Fractional differential application in reprocessing infrared spectral data [J]. Control and Instruments in Chemical Industry, 2012(3): 347-351.
[24]高琪, 王玉珍, 馮春暉, 等. 基于改進(jìn)型光譜指數(shù)的荒漠土壤水分遙感反演[J]. 國土資源遙感, 2022(1): 142-150.Gao Qi, Wand Yuzhen, Feng Chunhui, et al. Remote sensing inversion of desert soil moisture based on improved spectral indices [J]. Remote Sensing for Natural Resources, 2022(1): 142-150.
[25]姚付啟, 張振華, 楊潤亞, 等. 基于紅邊參數(shù)的植被葉綠素含量高光譜估算模型[J]. 農(nóng)業(yè)工程學(xué)報, 2009, 25(13): 123-129.Yao Fuqi, Zhang Zhenhua, Yang Runya, et al. Hyperspectral models for estimating vegetation chlorophyll content based on red edge parameter [J]. Transactions of the Chinese Society of Agricultural Engineering, 2009, 25(13): 123-129.
[26]唐海濤, 孟祥添, 蘇循新, 等. 基于CARS算法的不同類型土壤有機(jī)質(zhì)高光譜預(yù)測[J]. 農(nóng)業(yè)工程學(xué)報, 2021, 37(2): 105-113.Tang Haitao, Meng Xiangtian, Su Xunxin, et al. Hyperspectral prediction on soil organic matter of different types using CARS algorithm [J]. Transactions of the Chinese Society of Agricultural Engineering, 2021, 37(2): 105-113.
[27]王喆, 連炎清, 李曉娜, 等. 基于機(jī)器學(xué)習(xí)的浐灞河水質(zhì)參數(shù)遙感反演研究[J]. 人民長江, 2022, 53(9): 13-18.Wang Zhe, Lian Yanqing, Li Xiaona, et al. Research on remote sensing inversion of water quality parameters in Chanhe River and Bahe River based on machine learning [J]. Yangtze River, 2022, 53(9): 13-18.
[28]王新穎, 雋志才, 吳慶妍, 等. KNN算法的數(shù)據(jù)優(yōu)化策略[J]. 吉林大學(xué)學(xué)報(信息科學(xué)版), 2010, 28(3): 309-313.Wang Xinying, Jun Zhicai, Wu Qingyan, et al. Data optimization strategy of KNN algorithm [J]. Journal of Jilin University (Information Science Edition), 2010, 28(3): 309-313.
[29]鄭立華, 李民贊, 安曉飛, 等. 基于近紅外光譜和支持向量機(jī)的土壤參數(shù)預(yù)測[J]. 農(nóng)業(yè)工程學(xué)報, 2010, 26(S2): 81-87.Zheng Lihua, Li Minzan, An Xiaofei, et al. Forecasting soil parameters based on NIR and SVM [J]. Transactions of the Chinese Society of Agricultural Engineering, 2010, 26(S2): 81-87.
[30]鄭淼, 王翔, 李思佳, 等. 黑土區(qū)土壤有機(jī)質(zhì)和全氮含量遙感反演研究[J]. 地理科學(xué), 2022, 42(8): 1336-1347.Zheng Miao, Wnag Xiang, Li Sijia, et al. Remote sensing inversion of soil organic matter and total nitrogen in black soil region [J]. Scientia Geographica Sinica, 2022, 42(8): 1336-1347.
[32]馬媛. 干旱區(qū)土壤肥力變異規(guī)律研究——以阜康地區(qū)為例[D]. 烏魯木齊: 新疆大學(xué), 2004.Ma Yuan. Study on variation patterns of soil fertility in arid regions: A case study of Fukang region [D]. Urumqi: Xinjiang University, 2004.