許景輝 王 雷 王一琛 趙鐘聲 韓文霆
(1.西北農(nóng)林科技大學(xué)旱區(qū)農(nóng)業(yè)水土工程教育部重點實驗室, 陜西楊凌 712100;2.西北農(nóng)林科技大學(xué)水利與建筑工程學(xué)院, 陜西楊凌 712100;3.西北農(nóng)林科技大學(xué)中國旱區(qū)節(jié)水農(nóng)業(yè)研究院, 陜西楊凌 712100)
基于無人機遙感反演的土壤含水率(Soil moisture content,SMC)監(jiān)測能進行較大范圍的土壤含水率測量,但目前其準(zhǔn)確性和精度都還較低[1]。土壤表層含水率是土壤侵蝕、蒸發(fā)蒸騰及作物耗水的重要影響因素,由于距地面較淺,無法應(yīng)用各類介電傳感器,其自動監(jiān)測一直是相關(guān)領(lǐng)域的難題[2]。近年來,無人機遙感技術(shù)發(fā)展迅速,基于無人機遙感的土壤含水率測量已成為國內(nèi)外研究熱點[1,3-9]。李小昱等[10]采用近紅外光譜傅里葉變換特征提取方法檢測土壤含水率,并取得了一定成果。但由于近紅外光譜設(shè)備成本較高,土壤含水率相關(guān)研究的應(yīng)用具有很大局限性。羅蔚然等[11]通過可見光遙感進行了土壤含水率監(jiān)測,但光線的干擾使得可見光遙感精度較差。張榮標(biāo)等[12]提出了中值濾波方法,但可見光影響因素眾多,不能簡單通過一種數(shù)學(xué)模型實現(xiàn)干擾信息過濾。數(shù)據(jù)挖掘技術(shù)能夠很好地描述非線性模型,因此研究基于數(shù)據(jù)挖掘技術(shù)的可見光遙感技術(shù),可有效降低成本,為無人機廣域土壤含水率監(jiān)測提供技術(shù)支持。
光譜的定量反演大多以線性回歸模型進行,但模型訓(xùn)練及篩選均基于偏最小二乘回歸法[5]、光譜變換[13]等簡單方法。如何定量表達光譜特性和SMC的相關(guān)性、提高模型魯棒性、降低模型過程冗雜度,仍有待優(yōu)化。數(shù)據(jù)挖掘能綜合考慮SMC光譜響應(yīng),降低干擾項影響,提高測量精度。數(shù)據(jù)挖掘技術(shù)中,LM神經(jīng)網(wǎng)絡(luò)是基于LM(Levenberg-Marquardt)算法的一種神經(jīng)網(wǎng)絡(luò),其在解析非線性問題時表現(xiàn)能力較好,所構(gòu)建模型具有很好的自適應(yīng)性和魯棒性,在建模反演中被廣泛應(yīng)用[14-15]。但在基于RGB顏色矩的土壤含水率監(jiān)測研究應(yīng)用還在探索。
本文以3種土壤(黃綿土、粘黃土、紅土)為研究對象,通過野外土壤采樣、室內(nèi)理化分析、RGB真彩色圖像采集與處理等工作,嘗試采用LM神經(jīng)網(wǎng)絡(luò)構(gòu)建3種土壤的可見光SMC計算模型,并對模型進行精度評定。采用BP算法[16-20]和CART算法[21-22]與之對比,比較分析3種算法在SMC監(jiān)測中的效果,以實現(xiàn)精度高、穩(wěn)定性好的無人機機載SMC測量與監(jiān)測。
選用不同類型的3 種土壤作為試驗用土,分別為我國延安地區(qū)的黃綿土、陜西楊凌地區(qū)的粘黃土和江西地區(qū)紅土。測得3種土壤干容重ρd為1.25、1.3、1.5 g/cm3。將3種土樣曬干、粉碎并過2 mm篩網(wǎng)制成試驗土樣。分別取330 g土樣裝入塑料密封袋中,配成土壤含水率θ分別為0、6%、10%、14%、18%、22%的土樣,密封放置24 h,使水分在土壤均勻擴散。隨后將配置好的土樣裝入預(yù)先準(zhǔn)備好的樣品盒中(高度1.3 cm),每種土樣樣品共60個。配制好后用精度為0.01 g的LT3002T型電子天平稱取每一個樣本的質(zhì)量,供后續(xù)測量土壤樣本真實含水率。
為了調(diào)控干擾因素,便于檢驗?zāi)P偷目垢蓴_性,試驗在實驗室內(nèi)進行,采用相機(Canon EOS 500D)拍照采樣,每幅圖像分辨率為2 304像素×3 456像素。用三腳架固定數(shù)碼相機,并調(diào)至合適高度,并保證土樣置于圖像中央。09:00—10:00對每種土樣進行自然光線拍攝,完畢后將土壤用密封袋保存,待15:00—16:00再次拍攝完畢后,立即將樣本放入干燥箱,在105℃恒溫條件下干燥10 h,以獲取其實際含水率。為減少偶然因素影響,每個樣品取樣3幅圖像。為了模擬不同工作時段自然光線的影響,利用Photoshop將采集的圖像進行處理,將上午樣本圖像亮度分別降低10%、增高15%、增高30%;下午樣本圖像亮度分別增高10%、降低15%、降低30%。由此,上午、下午樣本各720個,土樣圖像樣本總數(shù)為1 440個。
1.3.1圖像切割
圖1 土樣圖像Fig.1 Images of soil sample
1.3.2RGB顏色矩提取
顏色矩包含各個顏色通道的一階矩、二階矩和三階矩,對于一幅具有RGB顏色空間的圖像,具有R、G和B 3個顏色通道,則共有9個分量。各階顏色矩的計算公式如下[23]:
(1)一階顏色矩
一階顏色矩采用一階原點矩,反映了圖像的整體明暗程度,計算公式為
(1)
式中Ei——第i個顏色通道的一階顏色矩,對應(yīng)于RGB顏色空間的圖像
pij——第j個像素的第i個顏色通道顏色值
(2)二階顏色矩
二階顏色矩采用二階中心矩的平方根,反映了圖像顏色的分布范圍,計算公式為
(2)
式中si——第i個顏色通道的二階顏色矩
(3)三階顏色矩
三階顏色矩采用三階中心矩的立方根,反映了圖像顏色分布的對稱性,計算公式為
(3)
式中ri——第i個顏色通道的三階顏色矩
對切割后的圖像提取顏色矩,以作為圖像的顏色特征。提取部分結(jié)果(紅土)如表1所示。
對提取特征值后的樣本進行抽樣,從各自總樣本中抽取80%作為訓(xùn)練樣本,20%作為測試樣本,以檢驗?zāi)P偷臏y量精度。
表1 土樣顏色特征與相應(yīng)土樣實測含水率部分數(shù)據(jù)Tab.1 Partial data of soil color characteristics and measured soil moisture content of corresponding soil samples
LM算法屬于二階算法,當(dāng)誤差曲面的梯度較小時,LM算法類似于最速梯度法;當(dāng)誤差曲面的梯度較大時,LM算法類似于高斯-牛頓法[24-26]。由于LM算法能夠根據(jù)Hessian矩陣估計誤差曲面各個梯度方向上的學(xué)習(xí)率,與一階算法相比,LM算法是目前訓(xùn)練神經(jīng)網(wǎng)絡(luò)最有效的算法[27]。LM 算法理論如下[15,28-29]:
神經(jīng)網(wǎng)絡(luò)的誤差指標(biāo)函數(shù)為
(4)
式中Yi——預(yù)期的網(wǎng)絡(luò)輸出向量
ei——當(dāng)前誤差
設(shè)xk為第k次迭代的網(wǎng)絡(luò)權(quán)值向量,維數(shù)為M,牛頓算法新的權(quán)值向量xk+1為
(5)
(6)
xk+1=xk-[JT(xk)J(xk)]-1JT(xk)e(xk)=xk-H-1(xi)JT(xk)e(xk)
H=JTJ
式中J——雅可比矩陣
H——Hessian矩陣
Hk——Hessian矩陣
gk——當(dāng)前梯度
然而矩陣H不一定可逆,為了解決這個問題,考慮引入系數(shù)λk,更新權(quán)值的LM算法為
xk+1=xk-[JT(xk)J(xk)+λkI]-1JT(xk)e(xk)
(7)
當(dāng)λk很大時,LM算法近似于梯度下降法;當(dāng)λk很小時,則是高斯-牛頓算法。
其算法流程為:①給出訓(xùn)練的允許誤差ε,初始化權(quán)值向量x,k=0。②計算網(wǎng)絡(luò)的輸出及誤差向量E(x)。③計算誤差向量對網(wǎng)絡(luò)權(quán)值的梯度值并形成雅可比矩陣。④訓(xùn)練完成后,更新選擇。⑤如果網(wǎng)絡(luò)收斂則停止,否則返回步驟②。
為了量化基于LM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和CART決策樹的實測土壤含水率和回歸值的建模效果和性能,選用決定系數(shù)(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)來進行模型的評價。R2越大,表明建模精度越高;RMSE越小,表明模型的預(yù)測精度越高。RPD已廣泛應(yīng)用于度量評估土壤屬性回歸模型的準(zhǔn)確性。當(dāng)RPD≥2.5時,表明模型具有極好的回歸能力,當(dāng)2.0≤RPD<2.5 時,表明模型具有很好的定量回歸能力; 當(dāng)1.8≤RPD<2.0 時,表明模型具有較好的定量回歸能力;當(dāng)1.4≤RPD<1.8時,表明模型具有定量回歸能力;當(dāng)1.0≤RPD<1.4 時,表明模型具有區(qū)別高值和低值的能力;當(dāng)RPD<1.0 時,表明模型不具備回歸能力[1]。
表2為上午樣本和下午樣本各土壤類型SMC的統(tǒng)計特征。其中黃綿土的建模集與驗證集所對應(yīng)的均值分別是13.21%和13.12%,變異系數(shù)分別為56.18%和60.49%。而黃綿土全樣本的SMC的均值為13.19%,變異系數(shù)為57.02%??梢?,全樣本的均值和變異系數(shù)均介于建模集和驗證集之間。其他兩種土樣具有相同試驗結(jié)果,全樣本的均值和變異系數(shù)均介于建模集和驗證集之間。為了驗證模型對自然環(huán)境影響的適應(yīng)性,除了進行上午樣本和下午樣本訓(xùn)練外,還將上午、下午樣本進行混合,通過混合樣本來驗證模型的適應(yīng)性。表3為混合樣本的SMC統(tǒng)計特征。
根據(jù)各土壤實測含水率以及其相應(yīng)的RGB顏色矩數(shù)據(jù),構(gòu)建基于LM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和CART決策樹的3種回歸SMC模型,分別簡稱為LM模型、BP模型和DT模型。各模型對于不同土壤的SMC回歸結(jié)果如表4所示。表4為上午樣本不同模型下土壤含水率的模型評價及回歸評價結(jié)果;表5為下午樣本不同模型下各土壤含水率的模型評價及回歸評價結(jié)果;表6為混合樣本不同模型下各土壤含水率的模型評價及回歸評價結(jié)果。
由表4可以看出,LM模型的RPD值均大于2.5,而BP模型和DT模型的RPD值相對較低,但都大于1.4,因此均適合3種土壤的SMC建模。在3種算法所構(gòu)建的SMC模型中,LM神經(jīng)網(wǎng)絡(luò)模型在3種土壤中均表現(xiàn)最佳,最佳表現(xiàn)土壤種類為黃綿土,模型評價參數(shù)R2為0.980、RMSE為1.0%、RPD為7.133,回歸評價參數(shù)R2為0.972、RMSE為1.3%、RPD為5.964。由此可見,3種算法構(gòu)建的模型回歸能力由大到小為LM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、CART決策樹,各模型對于3種土壤的適應(yīng)表現(xiàn)能力黃綿土最強,粘黃土和紅土相對較差。圖2為上午樣本各土壤LM模型SMC回歸值與實測值。
表2 被測土壤樣品SMC統(tǒng)計特征Tab.2 SMC statistical characteristics of sample soil samples
表3 混合樣本土壤樣品SMC統(tǒng)計特征Tab.3 SMC statistical characteristics of mixed sample soil samples
表4 上午樣本不同模型下各土壤含水率的模型 評價及回歸評價結(jié)果Tab.4 Model evaluation and prediction evaluation results of soil moisture content under different models for AM sample
表5 下午樣本不同模型下各土壤含水率的 模型評價及回歸評價結(jié)果Tab.5 Model evaluation and prediction evaluation results of soil moisture content under different models for PM sample
表6 混合樣本不同模型下各土壤含水率的 模型評價及回歸評價結(jié)果Tab.6 Model evaluation and prediction evaluation results of soil moisture content under different models of mixed samples
由表5可以看出,LM神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)模型RPD均大于2.5,適合3種土壤的SMC建模。而DT模型對于3種土壤其RPD小于2.5,尤其對于粘黃土和紅土其RPD小于1.8,因此DT模型對于紅土的SMC建模能力較低。同樣,在3種算法所構(gòu)建的SMC模型中,LM神經(jīng)網(wǎng)絡(luò)模型在3種土壤中的3個參數(shù)均表現(xiàn)最佳,最佳表現(xiàn)土壤種類為黃綿土,模型評價參數(shù)R2為0.982、RMSE為1.0%、RPD為7.402,回歸評價參數(shù)R2為0.977、RMSE為1.2%、RPD為6.576。由此可見,3種算法構(gòu)建的模型回歸能力由大到小為LM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、CART決策樹,各模型對于3種土壤的適應(yīng)表現(xiàn)能力黃綿土最強,粘黃土和紅土相對較差。圖3為下午樣本各土壤LM模型SMC回歸值與實測值。
由表6可以看出,LM神經(jīng)網(wǎng)絡(luò)模型RPD大于2.5,適合3種土壤的SMC建模。而BP模型RPD值僅在黃綿土中略小于2.5,另兩種土中均大于2.5,表明BP模型適用于3種土壤的SMC建模。其DT模型RPD均小于1.8,因此DT模型在混合樣本中對于3種土壤的SMC建模能力較低。同樣,在3種算法所構(gòu)建的SMC模型中,LM神經(jīng)網(wǎng)絡(luò)模型在3種土壤中的3個參數(shù)均表現(xiàn)最佳,最佳表現(xiàn)土壤種類為黃綿土,模型評價參數(shù)R2為0.966、RMSE為1.4%、RPD為5.426,回歸評價參數(shù)R2為0.958、RMSE為1.6%、RPD為4.873。由此可見,3種算法構(gòu)建的模型回歸能力由大到小為LM神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、CART決策樹,各模型對于3種土壤的適應(yīng)表現(xiàn)能力黃綿土最強,粘黃土和紅土相對較差。圖4為混合樣本各土壤LM模型SMC回歸值與實測值。
圖2 上午樣本LM模型SMC回歸值與實測值Fig.2 SMC predicted and measured values of LM model for AM sample
圖3 下午樣本LM模型SMC回歸值與實測值Fig.3 SMC predicted and measured values of LM model for PM sample
圖4 混合樣本LM模型SMC回歸值與實測值Fig.4 SMC predicted and measured values of LM model for mixed sample
綜上所述,在SMC回歸模型的建模效果和回歸效果中LM模型表現(xiàn)最佳,BP模型回歸能力相對較差,DT模型回歸能力最差,因此,3種模型中LM模型回歸能力和模型精度都高于其他兩者,即LM模型最優(yōu),適用于土壤表層(約1 cm)的土壤水分回歸。對比3種模型在各土壤的適應(yīng)情況,可以看出,各模型均在黃綿土表現(xiàn)最佳,粘黃土和紅土相對較差,可見土壤自身的顏色對于模型的回歸有一定的影響。
研究結(jié)果表明,LM神經(jīng)網(wǎng)絡(luò)能通過大量數(shù)據(jù)訓(xùn)練,消除自然條件下的綜合影響因素,提高基于土壤RGB顏色矩的土壤含水率識別精度。土壤可見光-RGB顏色矩與土壤含水率之間存在較好的相關(guān)性,其建模集和回歸集的建模回歸決定系數(shù)R2最高分別可達0.982和0.977。為通過遙感技術(shù)實現(xiàn)農(nóng)田土壤墑情的快速檢測技術(shù)提供了一定的理論基礎(chǔ)。同時,通過對比3種算法在不同土壤類型的SMC建?;貧w的結(jié)果分析,得出LM神經(jīng)網(wǎng)絡(luò)建立的SMC回歸模型最優(yōu),其模型決定系數(shù)R2均大于0.9。BP神經(jīng)網(wǎng)絡(luò)回歸模型相對LM模型較差,DT模型相對前兩種模型表現(xiàn)最差,在下午樣本紅土中其決定系數(shù)R2為0.551,基本沒有回歸能力。由于紅土自身顏色較重,土壤含水率增加后其顏色變化敏感度較低,因此對于模型回歸有一定影響,而LM算法模型能夠較好地克服這一影響因素,表現(xiàn)了其算法的優(yōu)越性。通過統(tǒng)計學(xué)理論分析可知,3種SMC模型在回歸不同土壤含水率時,LM模型的回歸效果具有較強的相關(guān)性。相較于傳統(tǒng)線性回歸模型,LM算法構(gòu)建的神經(jīng)網(wǎng)絡(luò)回歸模型具有顯著的優(yōu)越性,它不僅訓(xùn)練誤差較小,回歸能力更為精準(zhǔn),而且模型魯棒性強,具有很好的非線性解譯建模能力。
(1)基于LM算法的SMC回歸模型表現(xiàn)最優(yōu),其建模精度和回歸能力最好,在下午黃綿土樣本中,建模集R2為0.982、RMSE為1.0%、RPD為7.402,回歸集R2為0.977、RMSE為1.2%、RPD為6.576?;旌蠘颖静煌翗?黃綿土、粘黃土、紅土)回歸模型決定系數(shù)(R2)分別為0.958、0.943、0.949,均方根誤差(RMSE)分別為1.6%、2.0%、1.9%,相對分析誤差(RPD)分別為4.873、4.183、4.440。
(2)LM算法模型在黃綿土中均表現(xiàn)最佳,在粘黃土和紅土中相對較差。由此可見,土壤自身顏色對于本研究SMC回歸模型具有一定的影響。通過比較上午樣本、下午樣本和混合樣本可知,外界光線對于LM算法的建模影響很小,說明基于LM算法的SMC回歸模型具體較好的適應(yīng)能力。
(3)通過分析LM模型算法建模集和回歸集評價參數(shù)可知,LM算法建立的回歸模型更為穩(wěn)定,其回歸集和建模集的決定系數(shù)(R2)均穩(wěn)定在0.9以上,說明基于LM算法的SMC回歸模型具有較好的穩(wěn)定性。