李鑫星,梁步穩(wěn),白雪冰,李 娜
1. 中國農(nóng)業(yè)大學信息與電氣工程學院食品質(zhì)量與安全北京實驗室,北京 100083 2. 承德石油高等??茖W校工業(yè)技術(shù)中心,河北 承德 067000
土壤是影響農(nóng)業(yè)生產(chǎn)的重要因素之一,是保障農(nóng)作物品質(zhì)、產(chǎn)量和區(qū)域生態(tài)環(huán)境穩(wěn)定的基礎(chǔ)。 目前我國面臨土壤資源緊張、農(nóng)業(yè)用水資源相對緊缺等重大挑戰(zhàn),截至2018年,我國人均水資源量2 007.57 m3·人-1,不足世界的三分之一,年總用水總量6 110.00億m3,農(nóng)業(yè)用水3 807.00億m3,農(nóng)業(yè)用水占據(jù)全國總用水量的2/3。 然而,農(nóng)業(yè)用水利用率較低,高效利用水資源已成為農(nóng)業(yè)生產(chǎn)亟待解決的問題[1-3]。 如何節(jié)約土壤水資源,精確地檢測土壤水分含量,保證作物的生產(chǎn)已經(jīng)成為目前研究的熱點問題。
傳統(tǒng)獲取土壤水分含量的方法包括取樣測定法(烘干法、核磁共振法等)和定點測定法(中子儀法、時域反射儀法等),雖然可以精確地獲取地面部分區(qū)域的含水量數(shù)據(jù),但成本高、時效性差,少量的單點數(shù)據(jù)無法反映全部土壤的含水情況,不適用于農(nóng)業(yè)生產(chǎn)[4-5]。 因此土壤水分含量檢測亟需從靜態(tài)向動態(tài)、實時持續(xù)高效的監(jiān)測,而光譜土壤水分檢測技術(shù)正適應這種發(fā)展的需求。
光譜技術(shù)具有快速性、精確性和無損性等特點[6-7],近五年來國內(nèi)外光譜技術(shù)在土壤水分含量檢測領(lǐng)域應用有很多報道,本文對光譜技術(shù)在土壤水分含量檢測中的優(yōu)勢和局限性進行了總結(jié),闡述了光譜土壤水分含量檢測的關(guān)鍵技術(shù)并展望其發(fā)展趨勢,為土壤水分研究提供系統(tǒng)的綜合參考。
土壤是一個多因素的綜合系統(tǒng),在保持其他因素一致的情況下,土壤水分含量對土壤光譜有著重要的影響,因此,建立特定的波譜組合能夠有效地反映土壤水分含量的變化[8-9]。 基于光譜的土壤水分含量檢測技術(shù),可以精確、快速、無損地對土壤水分含量進行實時動態(tài)的檢測,其在土壤水分檢測的研究中表現(xiàn)出非凡的潛力。
光譜土壤水分分析技術(shù)是利用土壤介質(zhì)的物理結(jié)構(gòu)和化學性質(zhì)的不同,有效地檢測土壤水分含量,與傳統(tǒng)土壤水分含量檢測方法相比有比較明顯的優(yōu)勢,是目前獲取土壤水分數(shù)據(jù)的最重要手段[10],具體的優(yōu)勢表現(xiàn)為以下三個方面:
(1)實時性。 傳統(tǒng)的土壤水分含量檢測方法需對特定的坐標點進行檢測,效率低、時效性差,難以對大面積區(qū)域進行檢測,而光譜技術(shù)可以利用遙感平臺搭載光譜傳感器快速獲取檢測區(qū)域的全部土壤光譜信息,并對含水量進行預測,達到實時檢測的效果[11]。
(2)無損性。 光譜土壤水分檢測技術(shù)僅需要通過傳感器來獲取土壤的光譜信息,無需損害土壤的內(nèi)部物理構(gòu)造和化學性質(zhì),保證了土壤水分含量不因檢測而發(fā)生改變,因此保證了土壤水分含量的準確性[12]。
(3)精確性。 不同的土壤含水量和土壤中不同物質(zhì)對應光譜反射率曲線中不同的特征吸收峰谷,光譜傳感器可同時獲取土壤的圖像數(shù)據(jù)和光譜數(shù)據(jù),并提取土壤光譜數(shù)據(jù)的敏感波段。 由該數(shù)據(jù)建立的土壤檢測模型較為精確,因此目前已成功應用于便攜式土壤含水量傳感器。
(1)土壤的構(gòu)造復雜。 土壤是由母質(zhì)在氣候、地形、生物等因素經(jīng)過長時間形成的復雜系統(tǒng),并隨氣候環(huán)境變化而不斷改變,任一影響因子的改變都可能導致土壤光譜的改變,因此土壤光譜具有時空變異性。 采集的光譜數(shù)據(jù)中包含了較多的干擾物質(zhì),而研究中僅需利用對水分敏感性較強的波段。 目前解決辦法均是對數(shù)據(jù)進行預處理,消除其他信息的影響,增強水分敏感波段的光譜特征[13]。
(2)泛化能力不足。 土壤由多種物質(zhì)組成,有機質(zhì)含量、鹽分含量等和粒徑大小對光譜有很大影響,不同物質(zhì)的含量會導致土壤光譜的水分敏感波段的不同,進而影響光譜模型的適用性和泛化能力,因此多數(shù)光譜土壤水分檢測模型僅針對某一地區(qū)或某種土壤類型進行研究[14-15]。
(3)氣候條件制約。 光譜數(shù)據(jù)采集條件要求要高,需要考慮光照、風力等天氣的影響,惡劣的氣候條件下采集的數(shù)據(jù)誤差較大,為保證測量的精確性,采集需要在環(huán)境理想的條件下進行。
(1)基于光譜分辨率。 針對光譜分辨能力的不同,光譜可分為多光譜、高光譜和超光譜。 隨著光譜分辨率的不斷提高,可獲得更多的土壤信息,根據(jù)光譜特性的差異更容易判斷土壤水分的豐缺情況[16]。
(2)基于信息獲取方式。 一是通過衛(wèi)星、無人機等航天航空平臺攜帶的傳感器采集數(shù)據(jù),該方法具有獲取數(shù)據(jù)量大,效率高等優(yōu)點,但是易受到氣候環(huán)境的嚴重影響; 二是使用地物光譜儀或成像高光譜儀直接進行光譜數(shù)據(jù)的獲取,該方法獲取的數(shù)據(jù)較為精確,但是采集數(shù)據(jù)速度較慢[17]。
(3)基于波段。 綜述目前國內(nèi)外光譜土壤水分檢測技術(shù)的研究現(xiàn)狀,多數(shù)研究者基于可見光—近紅外之間土壤水分含量與光譜的關(guān)系進行檢測,少數(shù)研究者使用熱紅外波段通過輻射平衡估算土壤水分,或通過微波和紫外波段進行檢測[18-20]。
了解光譜土壤水分檢測中的關(guān)鍵技術(shù)并深入探討基于光譜技術(shù)在土壤水分含量檢測中的可行性十分必要。 第一,對原始的光譜數(shù)據(jù)預處理; 第二,提取對土壤水分敏感的光譜特征; 第三,建立土壤水分含量檢測模型并進行驗證。
光譜數(shù)據(jù)的采集和建模過程中存在由不同因素引起的實驗誤差,為建立一個更加穩(wěn)定、準確的光譜土壤水分檢測模型,需對數(shù)據(jù)進行預處理,消除干擾信息,突出土壤水分光譜的吸收和反射峰谷,提取有效信息[18-22]。 不同的預處理方法如表1所示。
(1)Savitzky-Golay平滑算法(S-G)。 S-G算法通過多項式最小二乘擬合,計算出窗口內(nèi)中心點關(guān)于其周圍點的加權(quán)平均和。 該算法相比于其他算法更穩(wěn)定、誤差更小,適用于去除土壤光譜中出現(xiàn)下高頻光譜信號[23],采用S-G算法有效地減弱了其他因素對土壤水分的影響,但該算法也會削弱水分的敏感波段,因此需要在土壤水分光譜中尋求去噪不足和過度去燥之間的平衡點,但目前對光譜的去燥平衡點很難確定[27]。
(2)多元散射校正(MSC)。 該算法將采集的數(shù)據(jù)與標準光譜進行一元線性回歸運算,增強了與主成分含量相關(guān)的光譜信息[24],可以增強土壤光譜中水分的信息,消除分布不均勻產(chǎn)生的散射影響。 MSC算法在去除大氣散射和消除土壤粒徑大小影響的效果較好,因此最適用于氣候條件不佳和土壤粒徑問題的光譜信息的預處理。
(3)微分處理。 微分適用于消除背景的影響,根據(jù)微分的不同階數(shù),可以顯示光譜的變化規(guī)律,突出光譜曲線的波峰波谷。 Morellos等[25-26]采用一階微分的方法,對比了多種土壤光譜的變化規(guī)律,突出了土壤水分的特征波段,為建模提供了精確的數(shù)據(jù)支持。
采集的光譜數(shù)據(jù)能顯示豐富的空間、光譜、輻射信息,不僅包含光譜土壤水分檢測所需的特定光譜數(shù)據(jù),而且還包含大量的冗余數(shù)據(jù)和無關(guān)信息,與全波長范圍相比,特定變量選擇重要的波長范圍會得到性能更好的模型[28],因此選取適當?shù)奶卣鞴庾V提取算法來降低數(shù)據(jù)的冗余程度和無關(guān)信息,可以提高光譜土壤水分檢測模型的精度,優(yōu)化預測模型的性能。 常見的光譜特征波段選擇方法如表2所示。
表1 光譜預處理技術(shù)特點分析Table 1 Characteristic analysis of spectral pretreatment technology
表2 特征提取算法的對比分析Table 2 Comparative analysis of feature extraction algorithms
(1)包絡(luò)線消除法(C-R)。 以包絡(luò)線作為背景,去掉包絡(luò)線,即可有效突出單個感興趣的光譜吸收特征。 有研究發(fā)現(xiàn)土壤光譜曲線一般情況下差異不大,利用C-R算法可以突出土壤光譜中某一具體光譜特征,例如土壤水分,并確定土壤水分最為敏感的波段為1 481和1 616 nm,為精確建模奠定了基礎(chǔ)。
(2)主成分分析法(PCA)。 通過正交變換將存在相關(guān)性的光譜信息轉(zhuǎn)換為線性不相關(guān)的特征信息。 該算法不破壞原始的光譜信息,適用于對大規(guī)模數(shù)據(jù)的處理,提取所需光譜信息,例如Morellos等[25]基于PCA算法可以準確提取大樣本土壤光譜中水分敏感信息,減少其他因素對水分敏感波段的影響。
(3)遺傳算法(GA)。 GA算法通過模仿自然界的遺傳機理來尋找最優(yōu)信息的全局優(yōu)化算法。 雖然通過犧牲效率來保證精度,但其具有可拓展性、易與其他算法結(jié)合等優(yōu)點。 有研究利用GA算法提取歸一化水體指數(shù),效果較好; 將優(yōu)化遺傳算法與連續(xù)投影算法結(jié)合,達到了較好的效果。
光譜技術(shù)改進了特定的農(nóng)業(yè)特征的模型,極大地提升了土壤水分含量檢測的精度和效率,使有效評估農(nóng)業(yè)特性方面得到了顯著增強。 目前利用土壤光譜特性建立土壤水分檢測模型的方法主要分為一元線性模型、多元線性模型和其他非線性模型。 線性模型高效簡便且精度較高,非線性模型較為復雜但是具有更好的泛化性能[29,32]。 常見的光譜建模算法如表3所示。
(1)一元線性模型。 自20世紀70年代,Bowers等[33]研究發(fā)現(xiàn)土壤水分和光譜特征有顯著相關(guān)性并建立土壤水分檢測模型,光譜土壤水分檢測技術(shù)正式進入到應用階段。 有研究基于特定單一波段已建立指數(shù)、倒數(shù)、對數(shù)等大量一元模型。 一元模型面向單一波長,建模流程簡單且精確性較高,但不具有普遍性[34-35],僅適用于特定的區(qū)域和時間,不適合進行大區(qū)域統(tǒng)一的土壤水分檢測。
(2)多元線性模型。 多元線性模型在一元模型的基礎(chǔ)上考慮數(shù)個光譜水分敏感波段或加入其他外界因素對土壤水分的影響,有研究采用1 481和1 616 nm等多個波段與土壤水分含量的關(guān)系建立多元線性回歸模型; 有報道在多光譜的基礎(chǔ)上增添了氣候地形植被等外界影響因子,大大提高模型的精度和適用范圍。 用少量的關(guān)鍵參數(shù)可以有效地建立土壤水分模型,高效簡便,適用性相比于一元線性模型有很大的提高。
(3)非線性模型。 土壤水分含量與光譜特征曲線有著極大的相關(guān)性,然而二者并不是理想的線性關(guān)系,使用線性模型進行預測無法達到預期的效果,非線性模型可以更好地反映土壤水分含量與特征曲線的關(guān)系。 目前土壤水分含量檢測的非線性建模主要有機器學習和人工神經(jīng)網(wǎng)絡(luò)兩種建模方法。
表3 光譜建模方法的特點分析Table 3 Characteristic analysis of spectral modeling methods
向量機目前被廣泛應用于光譜建模的領(lǐng)域。 Morellos等[25,33]通過對比在不同核函數(shù)支持向量機(SVM)的效果,選擇高斯核函數(shù),得到了精度較高的檢測模型,然而傳統(tǒng)的SVM無法適用于大樣本數(shù)據(jù)的訓練。 隨著光譜數(shù)據(jù)的海量化,為得到更好的檢測速率和模型性能,國內(nèi)外研究者開始使用相關(guān)向量機(RVM)對光譜數(shù)據(jù)進行建模。 RVM具有接近于SVM的精度,但其速度更快,更加適合處理大量數(shù)據(jù),因此Alfonso等[31]基于美國猶他州大區(qū)域的海量光譜數(shù)據(jù)建立了RVM非線性土壤水分檢測模型。
人工神經(jīng)網(wǎng)絡(luò)通過模仿人類的中樞神經(jīng)系統(tǒng),可以通過外界的數(shù)據(jù)改變內(nèi)部結(jié)構(gòu),具有很強的自學習和自適應能力,在非線性模型上取得較好的效果,是目前土壤水分檢測模型研究的最前沿問題。 該方法簡化了土壤光譜數(shù)據(jù)的預處理要求,考慮所有的外界影響因子及時空信息,有效地提取所需波段,且泛化能力強,模型精度高。 例如Hassan-Esfahani等[32,36]利用不同的人工神經(jīng)網(wǎng)絡(luò)(BP,RBF和CNN等),將氣候、環(huán)境和時間等影響因子和土壤光譜數(shù)據(jù)作為輸入量,建立多層網(wǎng)絡(luò)模型,因此這些模型在不同天氣情況、尺度、時間及地區(qū)的土壤水分檢測中有較優(yōu)良的性能。
光譜技術(shù)在土壤水分檢測中的應用前景十分廣泛,目前取得了一定的成果,光譜檢測的實時性、無損性和準確性,大大提高了土壤水資源的利用率,促進了精準農(nóng)業(yè)、智慧農(nóng)業(yè)的發(fā)展。
(1)光譜數(shù)據(jù)的處理的精度、效率將不斷提高。 傳統(tǒng)的光譜數(shù)據(jù)存在不一致和冗余度高等問題。 未來預處理和特征提取算法的不斷創(chuàng)新與發(fā)展,應更加注重提高算法對實際數(shù)據(jù)采集環(huán)境和尺度的適應能力,消除其他因素對光譜的影響,保證數(shù)據(jù)的準確性。
(2)光譜建模技術(shù)逐漸由線性模型向非線性模型發(fā)展,非線性模型考慮區(qū)域大小、采集數(shù)據(jù)的環(huán)境和土壤的內(nèi)部構(gòu)造等因素的影響,因此非線性模型建模難度較大,但是其魯棒性和實際泛化性優(yōu)于傳統(tǒng)線性建模方法。 研究多種土壤的光譜特征,考慮地理、氣候環(huán)境的影響,建立通用于多種土壤類型的光譜水分檢測模型是未來研究的重點。
(3)基于SVM和人工神經(jīng)網(wǎng)絡(luò)的土壤水分檢測方法能夠有效解決泛化能力不足和精確度較低等問題,但目前僅是比較經(jīng)典的模型與土壤光譜相結(jié)合,如BP神經(jīng)網(wǎng)絡(luò)、SVM等,很少將最新的機器學習或深度學習算法如Xgboost、CNN等與土壤光譜相結(jié)合。 未來的重要研究方向是結(jié)合光譜數(shù)據(jù)的特點和土壤系統(tǒng)的復雜性,提出或改進最新的神經(jīng)網(wǎng)絡(luò)模型或支持向量機,將更為先進、優(yōu)良的模型應用于土壤水分含量檢測上,提高土壤水分檢測模型的精確性和泛化能力。
(4)目前土壤水分檢測技術(shù)的重要發(fā)展趨勢是加強土壤光譜數(shù)據(jù)庫的建設(shè),實現(xiàn)全國乃至全球范圍內(nèi)的土壤光譜數(shù)據(jù)共享,為模型提供數(shù)據(jù)支持[37],如機器學習的精度和泛化能力依賴于訓練樣本的數(shù)量與精確性。