田安紅,楊麗華,崔麗梅,付承彪,趙俊三,熊黑鋼,于 龍
(1. 曲靖師范學(xué)院 信息工程學(xué)院,云南 曲靖 655011;2. 昆明理工大學(xué) 國(guó)土資源工程學(xué)院,云南 昆明 650093;3. 北京聯(lián)合大學(xué) 應(yīng)用文理學(xué)院,北京 100083;4. 曲靖師范學(xué)院 城市學(xué)院,云南 曲靖 655011)
土壤中硝態(tài)氮含量的準(zhǔn)確估測(cè)是合理施用氮肥、確保農(nóng)作物生長(zhǎng)的關(guān)鍵[1]。高光譜遙感技術(shù)因具有快速、無(wú)損、實(shí)時(shí)、精度高等優(yōu)點(diǎn)[2-3],被廣泛用來(lái)估測(cè)土壤中的養(yǎng)分信息。例如,單海斌等[4]以新疆農(nóng)田灰漠土為研究對(duì)象,在暗室內(nèi)測(cè)量土壤的高光譜,并對(duì)其進(jìn)行倒數(shù)、對(duì)數(shù)和一階微分變換,采用多元逐步方法預(yù)測(cè)有機(jī)質(zhì)含量,結(jié)果顯示,對(duì)數(shù)一階微分后的反演模型精度最高,決定系數(shù)為 0.82。劉凡等[5]研究新疆干旱區(qū)灰漠土中全氮的高光譜特性,一階微分后的土壤高光譜與全氮的相關(guān)性明顯優(yōu)越原始高光譜與全氮的相關(guān)性,一階微分后建立的估測(cè)模型在驗(yàn)證集的決定系數(shù)達(dá)0.8,總體上預(yù)測(cè)模型的精度較高。張佳佳等[6]研究江西省贛州市稻田土壤的高光譜特性,并建立反演全磷和有效磷的預(yù)測(cè)模型,表明全磷的特征波段位于534 nm和1 090 nm,而有效磷的特征波段位于365 nm、1 631 nm和2 223 nm,通過(guò)SPSS軟件建立的全磷和有效磷的多項(xiàng)式回歸模型的相關(guān)分析誤差分別為1.43和1.54。尤承增等[7]采集橫山縣的84個(gè)土壤樣本,測(cè)量其在 350~2 500 nm波段的高光譜反射率曲線,并對(duì)原始高光譜進(jìn)行一階微分變換,根據(jù)極大相關(guān)性原則來(lái)篩選敏感波段,通過(guò)模糊識(shí)別理論來(lái)建立全鉀的預(yù)測(cè)模型。以上的研究表明,利用高光譜遙感技術(shù)檢測(cè)土壤中的養(yǎng)分是可行的,但主要涉及的養(yǎng)分為有機(jī)質(zhì)、全氮、全磷、全鉀等。而硝態(tài)氮的含量普遍在土壤中較低[1],準(zhǔn)確檢測(cè)硝態(tài)氮的含量存在一定的困難。目前,針對(duì)土壤中硝態(tài)氮含量的高光譜反演研究報(bào)道非常少。
另外,現(xiàn)有文獻(xiàn)針對(duì)土壤養(yǎng)分的反演主要是以被人類干擾過(guò)的土壤為研究區(qū)域,很少對(duì)比分析沒(méi)有受到人類干擾的土壤和受到人類干擾的土壤。因此,本研究以新疆不同人類干擾區(qū)域的土壤為研究對(duì)象,采用非線性的 BP神經(jīng)網(wǎng)絡(luò)建立精確反演硝態(tài)氮含量的模型,為研究不同區(qū)域的土壤硝態(tài)氮反演提供了可靠的依據(jù)。
研究區(qū)域?yàn)樾陆房档耐寥?,地理坐?biāo)如圖1所示。2個(gè)不同研究區(qū)域主要是以不同人類干擾情況來(lái)劃分。圖1的右邊定義為沒(méi)有人類干擾的區(qū)域(A區(qū)),圖1的左邊定義為有人類干擾的區(qū)域(B區(qū))。因?yàn)樵贏區(qū)和B區(qū)中間有一條長(zhǎng)約15 km左右的大水渠,水渠基本隔斷了人類在A區(qū)的日常活動(dòng),A區(qū)的土壤表層生長(zhǎng)著如紅柳、梭梭等耐鹽性的植物。B區(qū)的土壤被當(dāng)?shù)鼐用窭绲亻_(kāi)發(fā)為人工林地等。
圖1 研究區(qū)域
土壤樣品的采集時(shí)間為2017年5月中旬,利用五點(diǎn)取樣方法來(lái)采集表層土壤0~20 cm,A區(qū)和B區(qū)分別為25個(gè)和30個(gè)土壤樣本。野外采集的樣本密封保存后帶回實(shí)驗(yàn)室,通過(guò)自然風(fēng)干、去除殘?jiān)?、研磨等處理后[8],由中科院新疆生態(tài)與地理研究所的專業(yè)人員測(cè)量土壤中硝態(tài)氮含量。
土壤的高光譜反射率采用 ASD FieldSpec3來(lái)測(cè)量[9],該光譜儀的全波段范圍從350 nm到2 500 nm。野外高光譜的測(cè)量要選擇晴朗無(wú)云無(wú)風(fēng)的天氣進(jìn)行,時(shí)間選擇在當(dāng)?shù)?4:00左右進(jìn)行。每次進(jìn)行高光譜測(cè)量之前都需要白板校正操作,每個(gè)土壤樣本點(diǎn)重復(fù)測(cè)量 10次,取其平均值代表該樣本點(diǎn)的最終高光譜反射率。
為了減少測(cè)量過(guò)程中的噪聲干擾,需要利用Savitzky-Golay平滑方法對(duì)測(cè)量的高光譜進(jìn)行濾波處理。同時(shí)刪除信噪比低的邊緣波段范圍的高光譜,即350~390 nm和2 401~2 500 nm。又因野外高光譜的測(cè)量還受到大氣中水分的影響,因此還需要?jiǎng)h除1 400 nm和1 900 nm附近的波段,即1 355~1 410 nm和1 820~1 942 nm。高光譜預(yù)處理后的曲線如圖2所示。
本研究的建模方法采用線性的逐步多元回歸模型(stepwise multiple linear regression,SMLR)和非線性的BP(back propagation)神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)。SMLR的主要思路是:考慮所有變量的方差貢獻(xiàn)值[10-11],按照其值大小的重要性進(jìn)行篩選,逐步依次地選則進(jìn)入回歸方程中?;谡`差反向傳播算法的BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的非線性映射能力[12-13],其主要由輸入層、隱藏層和輸出層組成。本研究在Matlab2019a中編程實(shí)現(xiàn),設(shè)置的最大迭代次數(shù)設(shè)為 1 000,期望誤差設(shè)為le-6,學(xué)習(xí)速率設(shè)為0.001,訓(xùn)練函數(shù)選擇設(shè)為trainscg,隱藏層節(jié)點(diǎn)個(gè)數(shù)設(shè)置為 300。同時(shí),SMLR和BP模型的訓(xùn)練土壤樣本選擇60%,測(cè)試土壤樣本選擇40%。
圖2 土壤的高光譜反射率曲線
本研究采用3個(gè)參數(shù)來(lái)評(píng)價(jià)預(yù)測(cè)模型的精度,即決定系數(shù)(R2),均方根誤差(RMSE)和相對(duì)分析誤差(RPD)[14-15]。當(dāng)R2的值越接近1,RMSE的值越接近于0時(shí),說(shuō)明所建立的模型的預(yù)測(cè)精度越高[16]。并且當(dāng)RPD值大于2.5時(shí),說(shuō)明所建立的模型的預(yù)測(cè)能力極強(qiáng);當(dāng)RPD值在2.0~2.5之間時(shí),說(shuō)明所建立的模型的預(yù)測(cè)能力很好;當(dāng)RPD值在1.8~2.0之間時(shí),說(shuō)明所建立的模型的預(yù)測(cè)能力好;當(dāng) RPD值在 1.4~1.8之間時(shí),說(shuō)明所建立的模型的預(yù)測(cè)能力一般;當(dāng)RPD值在 1.0~1.4之間時(shí),說(shuō)明所建立的模型的預(yù)測(cè)能力很差;當(dāng)RPD值小于1.0時(shí),說(shuō)明所建立的模型不具有預(yù)測(cè)能力。
因土壤的原始高光譜與硝態(tài)氮含量的最大相關(guān)系數(shù),在A區(qū)為0.322 361,在B區(qū)為0.439 667,總體來(lái)說(shuō),A區(qū)和B區(qū)的最大相關(guān)系數(shù)值較低,難以選擇出敏感波段。因此,進(jìn)一步將土壤的原始高光譜進(jìn)行一階導(dǎo)數(shù)和二階導(dǎo)數(shù)變換(見(jiàn)圖3),發(fā)現(xiàn)變換后的高光譜與硝態(tài)氮的相關(guān)系數(shù)被明顯地增大,A區(qū)一階導(dǎo)數(shù)與硝態(tài)氮的最大相關(guān)系數(shù)絕對(duì)值為0.695 314,對(duì)應(yīng)波段為142 8 nm,A區(qū)二階導(dǎo)數(shù)與硝態(tài)氮的最大相關(guān)系數(shù)絕對(duì)值為0.718 687,對(duì)應(yīng)波段為681 nm;B區(qū)一階導(dǎo)數(shù)與硝態(tài)氮的最大相關(guān)系數(shù)絕對(duì)值為0.696 547,對(duì)應(yīng)波段為1 526 nm,B區(qū)二階導(dǎo)數(shù)與硝態(tài)氮的最大相關(guān)系數(shù)絕對(duì)值為0.638 911,對(duì)應(yīng)波段為2 252 nm。在圖3中,僅有部分波段通過(guò)了0.01檢驗(yàn)(見(jiàn)表1),可選取通過(guò)0.01檢驗(yàn)的波段作為后續(xù)反演模型的敏感波段。由表2可知,A區(qū)一階導(dǎo)數(shù)和二階導(dǎo)數(shù)通過(guò)0.01檢驗(yàn)的波段分別為61和33個(gè);B區(qū)一階導(dǎo)數(shù)和二階導(dǎo)數(shù)通過(guò)0.01檢驗(yàn)的波段分別為95和33個(gè)。
將表1中通過(guò)0.01檢驗(yàn)的波段對(duì)應(yīng)的高光譜反射率作為自變量,將土壤的硝態(tài)氮含量作為因變量,建立 BP神經(jīng)網(wǎng)絡(luò)模型和逐步多元線性回歸模型估算硝態(tài)氮含量(見(jiàn)表2)。SMLR一階導(dǎo)數(shù)模型的相對(duì)分析誤差RPD很低,在A區(qū)的RPD值為1.132,在B區(qū)的RPD值為1.146;SMLR二階導(dǎo)數(shù)模型的相對(duì)分析誤差RPD也很低,在A區(qū)的RPD值為1.183,在B區(qū)的RPD值為1.014,說(shuō)明SMLR一階導(dǎo)數(shù)和二階導(dǎo)數(shù)模型都無(wú)法預(yù)測(cè)土壤硝態(tài)氮含量。
一階導(dǎo)數(shù)后的BP神經(jīng)網(wǎng)絡(luò)模型在A區(qū)的RPD值為2.884,R2為0.874,RMSE為18.980,因RPD值大于2.5,說(shuō)明該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力很強(qiáng)。二階導(dǎo)數(shù)后的 BP神經(jīng)網(wǎng)絡(luò)模型在 A區(qū)的 RPD值為2.317,R2為 0.807,RMSE為 24.142,因 RPD 值在2.0~2.5之間,說(shuō)明該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力好。一階導(dǎo)數(shù)后的BP神經(jīng)網(wǎng)絡(luò)模型在B區(qū)的RPD值為2.226,R2為0.929,RMSE為26.959,因RPD值在2.0~2.5之間,說(shuō)明該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力好。二階導(dǎo)數(shù)后的 BP神經(jīng)網(wǎng)絡(luò)模型在 B區(qū)的RPD值為1.956,R2為0.887,RMSE為29.922,因RPD值在1.8與2.0之間,說(shuō)明該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力較好。
圖3 土壤高光譜與硝態(tài)氮的相關(guān)系數(shù)
表1 通過(guò)0.01檢驗(yàn)的波段
表2 BP和SMLR的建模精度比較
利用驗(yàn)證集的檢驗(yàn)樣本對(duì)SMLR和BP模型進(jìn)行檢驗(yàn),SMLR和BP對(duì)硝態(tài)氮含量的真實(shí)值與預(yù)測(cè)值的比較如圖4所示。SMLR一階導(dǎo)數(shù)和二階導(dǎo)數(shù)的樣本值比較分散,擬合線偏離 1∶1線的程度較大。BP一階導(dǎo)數(shù)和二階導(dǎo)數(shù)的樣本值基本集中分布在 1∶1線附近。BP一階導(dǎo)數(shù)在A區(qū)的擬合方程為y=0.931 62x+0.672 57,在B區(qū)的擬合方程為y=0.781 97x+5.646 8。BP二階導(dǎo)數(shù)在 A區(qū)的擬合方程為 y=0.888 86x+6.699 8,在B區(qū)的擬合方程為y=0.699 68x+26.735 4。圖5為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果。BP模型的隱藏層節(jié)點(diǎn)數(shù)都設(shè)置為300個(gè),輸出層1個(gè)變量。輸入變量在A區(qū)一階導(dǎo)數(shù)、B區(qū)一階導(dǎo)數(shù)、A區(qū)二階導(dǎo)數(shù)、B區(qū)二階導(dǎo)數(shù)中,分別對(duì)應(yīng)61個(gè)、95個(gè)、33個(gè)、33個(gè)波段的高光譜反射率。并且A區(qū)一階導(dǎo)數(shù)、B區(qū)一階導(dǎo)數(shù)、A區(qū)二階導(dǎo)數(shù)、B區(qū)二階導(dǎo)數(shù)分別進(jìn)行迭代13次、12次、40次、8次滿足精度要求。
圖4 SMLR和BP對(duì)硝態(tài)氮含量的真實(shí)值與預(yù)測(cè)值的比較
圖5 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練
原始高光譜的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)通過(guò)0.01檢驗(yàn)的波段數(shù)量,在A區(qū)分別61個(gè)和95個(gè),在B區(qū)均為33個(gè)。一階導(dǎo)數(shù)變換后的BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度最高,在A區(qū)的RPD為2.884,R2為0.874,RMSE為18.980,該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力很強(qiáng);在B區(qū)的RPD為2.226,R2為0.929,RMSE為26.959,該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力好。二階導(dǎo)數(shù)變換后的BP神經(jīng)網(wǎng)絡(luò)模型在A區(qū)的RPD值為2.317,R2為0.807,RMSE為24.142,該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力好。二階導(dǎo)數(shù)變換后的BP神經(jīng)網(wǎng)絡(luò)模型在B區(qū)的RPD值為1.956,R2為0.887,RMSE為29.922,該模型對(duì)硝態(tài)氮含量的預(yù)測(cè)能力較好。一階導(dǎo)數(shù)和二階導(dǎo)數(shù)變換后的SMLR模型的RPD值很低,基本在1.1左右,說(shuō)明其對(duì)2種土壤中的硝態(tài)氮含量的預(yù)測(cè)能力非常差。