孫 波,張 弛,尹世超,許 浩,張偉杰
(1.山東農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山東 泰安 2710182.中華人民共和國(guó)科學(xué)技術(shù)部 國(guó)家遙感中心,北京 100036)
土壤濕度是農(nóng)田環(huán)境的一個(gè)重要指標(biāo),是影響農(nóng)作物正常生長(zhǎng)的重要因素[1]。因此,農(nóng)田土壤濕度的大范圍、實(shí)時(shí)、精確地獲取對(duì)于指導(dǎo)農(nóng)田精準(zhǔn)灌溉、提高現(xiàn)代農(nóng)業(yè)的智能化水平具有重要的研究意義。
基于全球?qū)Ш叫l(wèi)星系統(tǒng)干涉測(cè)量(Global Navigation Satellite System Interferometry and Reflectometry,GNSS-IR)技術(shù)的土壤濕度探測(cè)方法是一種新興的被動(dòng)微波遙感方式。與目前已有的探測(cè)方式相比,彌補(bǔ)了傳統(tǒng)烘干稱重法在實(shí)時(shí)性及對(duì)農(nóng)田的破壞性方面的弊端,同時(shí)解決了傳統(tǒng)微波遙感方式造價(jià)高、時(shí)空分辨率低的問(wèn)題,近年來(lái)已成為微波遙感技術(shù)研究的熱點(diǎn)[2]。
GNSS-IR技術(shù)從探測(cè)模式上又稱為GNSS單天線技術(shù),起源于歐美。2008年,美國(guó)科羅拉多大學(xué)Larson團(tuán)隊(duì)[3-6]首先提出利用已有的GNSS普通信號(hào)接收機(jī)在接收導(dǎo)航衛(wèi)星直射信號(hào)的同時(shí),也能夠接收地面的散射及反射信號(hào),實(shí)測(cè)結(jié)果驗(yàn)證了土壤濕度與接收的直反射信號(hào)產(chǎn)生的干涉信噪比(Signal to Noise Ratio,SNR)的振幅和相位有關(guān)。在此基礎(chǔ)上,法國(guó)圖盧茲三大的Roussel團(tuán)隊(duì)[7-8]分析了全球定位系統(tǒng)(Global Positioning System,GPS)和格洛納斯系統(tǒng)(Global Navigation Satellite System,GLONASS)在不同衛(wèi)星高度角條件下的SNR數(shù)據(jù),證明了從低高度角2°~30°的SNR數(shù)據(jù)中提取的特征參量與土壤濕度相關(guān)性較高。國(guó)內(nèi)學(xué)者也在相關(guān)領(lǐng)域展開(kāi)了研究,桂林理工大學(xué)任超團(tuán)隊(duì)[9]將小波變換應(yīng)用到直反射信號(hào)分離的過(guò)程中,提高了SNR特征參量的提取精度,進(jìn)而改善了土壤濕度的反演精度。
綜上所述,從國(guó)內(nèi)外研究進(jìn)展看,GNSS-IR技術(shù)已被證明可以有效地進(jìn)行土壤濕度的反演,但大部分研究只是驗(yàn)證了土壤濕度與SNR特征參量的相關(guān)性,缺乏理論模型及經(jīng)驗(yàn)?zāi)P?,且反演精度較低;此外,前期的研究大多圍繞GPS的應(yīng)用展開(kāi),而隨著我國(guó)北斗系統(tǒng)的組網(wǎng)完成,基于北斗系統(tǒng)的相關(guān)研究將是今后研究的熱點(diǎn)。因此,本文將隨機(jī)森林(Random Forest,RF)的機(jī)器學(xué)習(xí)方法引入到GNSS-IR土壤濕度的反演過(guò)程中,利用機(jī)器學(xué)習(xí)的黑箱特點(diǎn)來(lái)克服土壤粗糙度及系統(tǒng)噪聲對(duì)反演精度的影響,進(jìn)一步引入粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法解決隨機(jī)森林模型的參數(shù)優(yōu)選問(wèn)題,并展開(kāi)北斗系統(tǒng)的相關(guān)實(shí)驗(yàn),驗(yàn)證了所提方法可以有效地提高反演精度。
在地基單天線模式下,信號(hào)接收機(jī)可以同時(shí)接收導(dǎo)航衛(wèi)星的直反射信號(hào),由于地基接收天線高度較低,直反射信號(hào)可以看成衰減不同的同頻電磁波[10],接收時(shí)產(chǎn)生的干涉信號(hào)會(huì)被接收機(jī)以SNR的形式記錄下來(lái),具體表現(xiàn)為隨高度角變化的一定趨勢(shì)上的振蕩現(xiàn)象,如圖1所示。
圖1 上升段SNR波形 Fig.1 Waveform of the ascending SNR
SNR的數(shù)學(xué)模型可表示為[11]:
(1)
式中,Ad為收機(jī)接收的衛(wèi)星直射信號(hào)幅度;Am為地表的反射信號(hào)幅度;ψ為Ad,Am由路徑差引起的相位差。由于土壤濕度等地表信息僅影響SNR的反射分量,通過(guò)多項(xiàng)式擬合可以把與反演無(wú)關(guān)的直射分量去除,僅保留多徑反射振蕩分量,如圖2所示。
圖2 SNRm的波形Fig.2 Waveform of the SNRm
進(jìn)一步利用譜分析法可以得到振蕩頻率f,用正弦信號(hào)對(duì)該分量進(jìn)行逼近擬合,則多徑反射信號(hào)SNRm可以表示為:
SNRm=Amcos(4πHλ-1sinθ+φ),
(2)
式中,λ為GNSS衛(wèi)星信號(hào)的波長(zhǎng);θ為衛(wèi)星的高度角;H為接收機(jī)天線的等效高度。通過(guò)最小二乘擬合可以得到SNRm的干涉特征參量:振蕩幅度Am和振蕩相位φ。文獻(xiàn)[3-8]已證明上述干涉特征參量與土壤濕度存在相關(guān)性,本文選取相關(guān)性較好的SNRm的振蕩頻率作為反演的特征觀測(cè)量。
土壤濕度反演從方法上屬于回歸的范疇,文獻(xiàn)[3-9]采用特征觀測(cè)量的一元回歸方法反演得到的土壤濕度在精度方面并不理想,僅利用單一頻點(diǎn)GNSS干涉信號(hào)反演土壤濕度,忽視了不同頻點(diǎn)信號(hào)間的差異性及潛在的更豐富的觀測(cè)信息。隨著人工智能的興起,越來(lái)越多的學(xué)者開(kāi)始嘗試將機(jī)器學(xué)習(xí)方法引入到反演過(guò)程中,取得了不錯(cuò)的效果[12-13]。本文采用非線性RF回歸方法,融合北斗B1,B2雙頻段的振蕩頻率觀測(cè)量進(jìn)行土壤濕度的反演研究。
RF算法是一種新興的、高度靈活的基于決策樹(shù)的機(jī)器學(xué)習(xí)算法。本質(zhì)上屬于集成學(xué)習(xí)的一個(gè)重要分支,采用非參數(shù)計(jì)算,以隨機(jī)的方式生成若干弱決策樹(shù),并通過(guò)集成所有決策樹(shù)的預(yù)測(cè)結(jié)果進(jìn)行預(yù)測(cè),既可以解決分類問(wèn)題也可以用于回歸分析,應(yīng)用領(lǐng)域廣泛[14]。該算法的隨機(jī)主要體現(xiàn)在決策樹(shù)生成的2方面:① 隨機(jī)選取子樣本;② 隨機(jī)選取輸入?yún)?shù),該方式有效降低了決策樹(shù)之間的相關(guān)性,使RF算法具有良好的魯棒性和預(yù)測(cè)精度。土壤濕度反演本質(zhì)上為回歸問(wèn)題,適用于RF算法進(jìn)行處理,輸出結(jié)果為每棵決策樹(shù)得到的土壤濕度均值。
實(shí)驗(yàn)證明,超參數(shù)中的決策樹(shù)個(gè)數(shù)n_estimators、決策樹(shù)最大深度max_depth以及最大葉子節(jié)點(diǎn)數(shù)max_leaf_nodes對(duì)RF的性能影響較大,在參數(shù)的選取上,既要提高反演的準(zhǔn)確性還需要考慮算法的運(yùn)行效率。本文引入了PSO算法對(duì)RF回歸模型的上述3個(gè)超參數(shù)進(jìn)行自動(dòng)尋找最優(yōu)解,避免了人為調(diào)參的隨意性。
PSO算法是一種全局的隨機(jī)搜索算法,其基本思想來(lái)源于鳥(niǎo)群在遷徙過(guò)程中的群聚捕食行為[15]。該算法采用種群中個(gè)體的適應(yīng)度評(píng)估個(gè)體優(yōu)劣,在 RF算法中首先對(duì)超參數(shù)n_estimators、max_depth以及max_leaf_nodes隨機(jī)初始化一群粒子,計(jì)算相應(yīng)的適應(yīng)度值,并通過(guò)不斷更新粒子的速度和位置來(lái)達(dá)到最佳的適應(yīng)度值,從而得到最佳RF模型的超參數(shù)n_estimators、max_depth以及max_leaf_nodes,進(jìn)而提高RF模型的收斂速度及預(yù)測(cè)性能。
基于PSO-RF的土壤濕度反演模型如圖3所示。
圖3 PSO-RF模型Fig.3 PSO-RF model
為了對(duì)所提方法進(jìn)行驗(yàn)證,2018年9月10—11月9日在通州區(qū)北京市農(nóng)林科學(xué)院蔬菜研究中心( 116°41′23.19″E,39°41′50.33″N)開(kāi)展了61 天的探測(cè)實(shí)驗(yàn)。場(chǎng)地四周空曠無(wú)遮蔽,實(shí)驗(yàn)期間為秋冬季,地表可視為裸土,現(xiàn)場(chǎng)如圖4所示。接收機(jī)天線架設(shè)高度為 3 m,采樣頻率為 1 Hz,同時(shí)采集北斗系統(tǒng)B1,B2頻段以及GPS系統(tǒng)L1,L2,L5頻段的直、反射信號(hào)。根據(jù)文獻(xiàn)[7],GNSS-R可以探測(cè)0~50 mm的地表土壤濕度,為了進(jìn)行同比驗(yàn)證,在第一菲涅爾反射區(qū)內(nèi)安裝3個(gè)深度分別為20,40,50 mm的高精度傳感器采集土壤濕度,取其平均值作為日土壤濕度真值。架設(shè)自動(dòng)氣象站采集同期氣象數(shù)據(jù),采樣間隔60 s。
圖4 實(shí)驗(yàn)場(chǎng)地信息Fig.4 Experimental site information
3.2.1 樣本數(shù)據(jù)的選取
按照?qǐng)D3的流程對(duì)北斗系統(tǒng)接收數(shù)據(jù)進(jìn)行處理,得到61組北斗B1,B2的振蕩頻率觀測(cè)量,然后與土壤濕度真值按照2∶1的間隔比例劃分成訓(xùn)練集與測(cè)試集,分別進(jìn)行PSO-RF的回歸反演及傳統(tǒng)回歸方法的反演。綜合考慮實(shí)驗(yàn)場(chǎng)地的經(jīng)緯度及天線架設(shè)位置,以及方位角和高度角的限制,滿足以上條件的僅有PRN9,PRN10和PRN13三顆衛(wèi)星。
3.2.2 PSO-RF模型訓(xùn)練
將訓(xùn)練集的北斗B1,B2的振蕩頻率觀測(cè)量及土壤濕度真值分別作為PSO-RF模型的輸入輸出進(jìn)行訓(xùn)練。為了提高反演模型的精度及泛化能力,對(duì)RF模型的超參數(shù)n_estimators,max_depth以及max_leaf_nodes 進(jìn)行優(yōu)選是關(guān)鍵。根據(jù)文獻(xiàn)[16],PSO 的相關(guān)設(shè)置如下:最大進(jìn)化代數(shù)為200,種群數(shù)量為20,學(xué)習(xí)因子C1,C2均為2,交叉驗(yàn)證次數(shù)V= 5。通過(guò)PSO搜索算法進(jìn)行尋優(yōu),當(dāng)粒子的適應(yīng)度趨于穩(wěn)定或迭代次數(shù)達(dá)到最大時(shí),終止迭代循環(huán),確定最終尋優(yōu)結(jié)果。
3.2.3 結(jié)果分析
將最優(yōu)參數(shù)n_estimators,max_depth,max_leaf_nodes代入RF 模型,分別將北斗PRN9,PRN10和PRN13 衛(wèi)星的測(cè)試集數(shù)據(jù)輸入PSO-RF模型進(jìn)行預(yù)測(cè)反演,所得結(jié)果如圖5 所示。
(a) PRN9反演結(jié)果
(b) PRN10反演結(jié)果
(c) PRN13反演結(jié)果圖5 不同衛(wèi)星PSO-RF模型反演結(jié)果Fig.5 PSO-RF model inversion results of different satellites
由圖5可以看出,PRN9,PRN10,PRN13三顆星的土壤濕度反演值與實(shí)測(cè)值的線性相關(guān)系數(shù)R分別達(dá)到了0.876 9,0.881 5,0.831 4,反演結(jié)果接近實(shí)測(cè)值,證明了PSO-RF方法也可以有效地應(yīng)用到土壤濕度的探測(cè)領(lǐng)域。
3顆星的PSO-RF方法與利用B1,B2頻段SNR振蕩頻率的傳統(tǒng)回歸方法的反演結(jié)果如圖6所示。
(a) PRN9反演結(jié)果對(duì)比
(b) PRN10反演結(jié)果對(duì)比
(c) PRN13反演結(jié)果對(duì)比圖6 不同反演模型結(jié)果對(duì)比Fig.6 Comparison of results of different inversion models
由圖6可以看出,PSO-RF方法反演值與實(shí)測(cè)值具有更明顯的相關(guān)性,反演結(jié)果反映出了土壤濕度變化的趨勢(shì)和降雨過(guò)程。相比于傳統(tǒng)回歸方法的反演結(jié)果,相關(guān)系數(shù)R分別提高了32.88%,48.1%,說(shuō)明PSO-RF優(yōu)化模型較傳統(tǒng)回歸模型性能有明顯提升。
為了進(jìn)一步驗(yàn)證各反演模型的有效性,本文還通過(guò)均方根誤差(Root Mean Square Error,RMSE)對(duì)上述3顆星的反演結(jié)果進(jìn)行了誤差分析,如表1所示。
表1 反演誤差對(duì)比Tab.1 Inversion error comparison
由表1可以看出,PSO-RF方法反演結(jié)果的RMSE最小,與北斗B1,B2的傳統(tǒng)回歸方法相比,RMSE分別降低了18.93%,62.98%,反演精度得到了明顯的提升。
根據(jù)GNSS-IR的探測(cè)原理及數(shù)據(jù)分析結(jié)果,構(gòu)建了基于PSO-RF的土壤濕度反演的半經(jīng)驗(yàn)?zāi)P?,并開(kāi)展了實(shí)驗(yàn)對(duì)該模型進(jìn)行了驗(yàn)證測(cè)試。得到如下結(jié)論:① 在北斗系統(tǒng)低高度角條件下(2°~30°),利用PSO-RF方法得到的測(cè)試集反演值與土壤濕度真值相關(guān)性較好,相關(guān)系數(shù)均達(dá)到了0.8以上,均方根誤差在2%以下,說(shuō)明該方法可以較好地實(shí)現(xiàn)對(duì)固定區(qū)域土壤濕度的連續(xù)監(jiān)測(cè)。② 與利用振蕩頻率的傳統(tǒng)回歸模型相比,PSO-RF模型的反演結(jié)果在相關(guān)系數(shù)及誤差方面均有較明顯的改善,說(shuō)明利用PSO-RF方法融合了北斗B1,B2的雙頻觀測(cè)量,綜合利用了不同頻段信息間的差異性,從而在反演的精度方面得到有效的提升。③ 北斗組網(wǎng)目前已經(jīng)完成,圍繞北斗系統(tǒng)的反演模型及實(shí)驗(yàn)驗(yàn)證的相關(guān)工作將是未來(lái)的趨勢(shì)和研究重點(diǎn)。
由于本次實(shí)驗(yàn)處于秋冬季,農(nóng)田地表近似為裸土,且地形平坦,沒(méi)有考慮土壤粗糙度的影響。因此,深入研究具體農(nóng)作物覆蓋及地表粗糙度對(duì)GNSS接收機(jī)信噪比的影響是下一步的主要工作。