蘇 偉 姚 嬋 李 穎 張明政 趙國強 劉峻明
(1.中國農(nóng)業(yè)大學土地科學與技術(shù)學院, 北京 100083; 2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)災(zāi)害遙感重點實驗室, 北京 100083;3.河南省氣象科學研究所, 鄭州 450003; 4.河南省氣象局, 鄭州 450003)
葉面積指數(shù)LAI是指單位土地面積上植物葉片單面面積的總和[1],直接反映植被的生長狀況,對農(nóng)作物長勢監(jiān)測、水肥管理、農(nóng)業(yè)災(zāi)害脅迫監(jiān)測和產(chǎn)量預測具有重要意義[2-3]。傳統(tǒng)獲取LAI的方法是通過野外測量獲得,需要耗費大量的人力、物力,成本高,且不能進行實時和大面積的獲取。遙感是快速獲取大范圍內(nèi)地物信息的有效方法,可以反映農(nóng)作物不同生長狀況的光譜差異[4],因此被廣泛用于農(nóng)作物長勢監(jiān)測[5],并為肥料虧缺診斷、田間管理和產(chǎn)量預測等提供科學依據(jù)[6]。
隨著衛(wèi)星技術(shù)的發(fā)展,出現(xiàn)了越來越多的高時空分辨率影像[7]。Sentinel-2衛(wèi)星是歐洲航天局發(fā)射的新一代衛(wèi)星,一共包含13個光譜波段,其中3個紅邊波段對植被的生長狀況敏感[8],是植被生長監(jiān)測的理想數(shù)據(jù)源。但Sentinel-2衛(wèi)星影像的3個紅邊帶具有20 m的空間分辨率,與可見光和近紅外波段10 m的分辨率不一致,這限制了紅邊波段最大優(yōu)勢的發(fā)揮,但是10 m分辨率波段的可用性為提高20 m的空間分辨率提供了可能,從而形成了一種有效方法,可以在不增加輸入成本的情況下使輸出最大化[7]。目前,已有許多學者對更高分辨率的影像增強進行了研究,提出了多種可行算法[9-12]。
可用的高空間分辨率影像數(shù)據(jù)為植被生長參數(shù)的精確反演提供了可靠的數(shù)據(jù)支持[13],但僅有少數(shù)研究者關(guān)注超分辨率影像重建對植被生長定量評估的能力。植被生長參數(shù)的反演主要有3種模型:經(jīng)驗統(tǒng)計模型、物理模型和機器學習模型。其中,機器學習模型通過對樣本數(shù)據(jù)的不斷訓練達到最優(yōu)化目標,具有很強的非線性擬合能力[14]。目前已有學者對使用機器學習模型反演植被LAI進行了研究。文獻[15]利用無人機多光譜影像,采用梯度提升樹和支持向量機算法建立葉面積指數(shù)的反演模型,結(jié)果表明,梯度提升樹算法的預測精度高于支持向量機算法;文獻[16]對利用經(jīng)驗回歸模型、機器學習模型和輻射傳輸模型反演葉綠素含量進行評估,結(jié)果表明,偏最小二乘回歸和隨機森林回歸的效果優(yōu)于線性回歸模型和輻射傳輸模型;文獻[7]采用線性回歸和輻射傳輸模型,將超分辨率影像重建用于玉米的生長狀況監(jiān)測,并與原始重采樣數(shù)據(jù)進行對比,取得了較好的反演精度。
本文以SupReMe算法重建的高分辨率多光譜影像為數(shù)據(jù)源,基于PROSAIL模型構(gòu)建查找表,并以此作為隨機森林回歸模型的訓練數(shù)據(jù)反演玉米生育期的LAI,通過野外實測數(shù)據(jù)驗證反演精度,并與基于原始重采樣的Sentinel-2影像數(shù)據(jù)的反演結(jié)果進行對比,以期證明影像超分辨率重建對LAI反演的作用與意義。
研究區(qū)位于廊坊市轄區(qū)和永清縣,河北省中部偏東,經(jīng)緯度范圍為116°38′7″~116°44′6″E,39°28′42″~39°32′54″N,地理位置如圖1所示,屬溫帶大陸性季風氣候,年平均氣溫10~12℃,年平均降水量554.9 mm,地勢平坦,海拔約13 m。該區(qū)域的主要耕作方式為玉米-小麥輪作,夏玉米的生長季節(jié)一般是從6月底到10月初。
Sentinel-2是由歐洲委員會和歐洲航天局聯(lián)合倡議研發(fā)的全球環(huán)境與安全監(jiān)測計劃的第2顆衛(wèi)星,A/B雙星的時間分辨率為5 d,共有13個光譜波段,空間分辨率為10、20、60 m,包括可見光、紅邊、近紅外、水汽、卷云以及短波紅外波段。本研究選用2019年8月18日的無云Sentinel-2B衛(wèi)星影像,利用Sen2cor模型完成對Sentinel-2衛(wèi)星影像的大氣校正,為了使每個波段的影像獲得相同數(shù)量的像素,采用最近鄰域法將分辨率20 m的影像重采樣到分辨率10 m。本文光譜波段信息如表1所示。
表1 Sentinel-2衛(wèi)星影像部分波段信息Tab.1 Band information of Sentinel-2 image
2019年8月16—22日,課題組在研究區(qū)內(nèi)開展夏玉米關(guān)鍵生育期的實驗數(shù)據(jù)采集,由于不同玉米品種的播種時間不同,研究區(qū)域中玉米的物候期大部分處在灌漿期前后,樣方尺寸為10 m×10 m,與Sentinel-2影像分辨率相對應(yīng),在研究區(qū)內(nèi)選擇100個生長均勻的樣方進行實地測量,實測數(shù)據(jù)包括LAI、葉綠素含量及精準定位信息等。LAI測量采用美國LI-COR公司生產(chǎn)的LAI-2200C型植物冠層分析儀,每個樣方測量3~5次,取平均值作為樣方LAI。同時采用華測i80型智能RTK GPS測量系統(tǒng),并結(jié)合千尋位置提供的Find-CM厘米級差分定位服務(wù),對樣方點進行精準定位。葉綠素含量測量選用日本柯尼卡美能達生產(chǎn)的便攜式SPAD-502 Plus型葉綠素含量測定儀,每個樣方選擇3~5株,每株上選擇4片葉,每個葉片從葉基到葉尖測量3次葉綠素含量,取平均值作為樣方葉綠素含量。
超分辨率算法采用SupReME (Super-resolution for multispectral multiresolution estimation)模型[12]。該模型充分利用了來自高分辨率波段的紋理信息制定規(guī)則器,可以在單個步驟中對所有較低分辨率的波段執(zhí)行超分辨率算法生成高分辨率(10 m)的波段。
y=MBx
(1)
式中B——塊-循環(huán)-循環(huán)-塊(BCCB)矩陣,每個塊代表一個2D循環(huán)卷積,與最高空間分辨率相應(yīng)頻帶的點擴展函數(shù)(PSF)相關(guān)聯(lián)
M——分塊對角矩陣,每個塊代表y得到x的采樣
對于Sentinel-2衛(wèi)星影像的13個波段,發(fā)現(xiàn)大于99%的信號能量保留在基于相關(guān)的本征分解的p=6個最大分量中[12]。形式上,X的列(波段向量)存在于由U∈RL×p的列所跨越的子空間中,即X=UZ,其中,Z∈Rp×n為相對于U的表示系數(shù)。z=vec(ZT),向量形式為x=(U?I)z,其中,I為適當維數(shù)的單位矩陣。隨著維度的降低,式(1)轉(zhuǎn)換為
y=MB(U?I)z
(2)
為了計算子空間U,執(zhí)行以下3個步驟:①用雙3次插值將y的每個光譜波段上采樣到相同的高分辨率。②模糊每個光譜波段,使得每個光譜波段都達到最強模糊。③在模糊處理之后的數(shù)據(jù)上進行奇異值分解,保留最大的p個奇異值對應(yīng)的奇異向量作為U的列。影像重建可以表示為凸優(yōu)化問題,即
(Dh,Dv∈RLn×Ln)
(3)
式中 φw,q——基于權(quán)重w、q的2次正則化項
α——正則化強度
Dh、Dv——2個對角區(qū)塊的線性算子(每個算子具有相同的塊),z中影像的水平和垂直方向近似導數(shù)
為了簡化,將這些帶周期性邊界條件的矩陣看作循環(huán)卷積。因此,式(3)等價于
(4)
其中v1=(U?I)zv2=Dhzv3=Dvz
式(4)的增廣拉格朗日函數(shù)為
(5)
式中d1、d2、d3——縮放的拉格朗日乘數(shù)
μ——正權(quán)值
迭代優(yōu)化3個參數(shù)塊直到收斂:z、(v1,v2,v3)和(d1,d2,d3),可以得到最優(yōu)的z,再由x=(U?I)z得到x,關(guān)于這個算法更多的信息,可以參照文獻[12]。
為了量化SupReMe算法的影像重建效果,對重建影像和重采樣影像逐波段計算信息熵和平均梯度[17],同時計算3個相似性統(tǒng)計值:決定系數(shù)(R2)、均方根誤差(RMSE)和估算精度(EA)。
基于單波段光譜特征監(jiān)測植被時容易受到非植被目標(背景土壤、水體等)的影響,因此需要對植被冠層敏感的波段進行組合,達到在一定程度上消除非植被目標的影響[18]。紅邊波段的光譜反射率在680~750 nm范圍內(nèi)快速上升,能夠用于研究植物生理生化參數(shù)反演、冠層養(yǎng)分提取、健康狀態(tài)監(jiān)測等[19]。本研究使用的Sentinel-2遙感影像包含3個紅邊波段,并且重建后的影像波段空間分辨率均為10 m,因此在植被指數(shù)選取方面,選取RI[7]、NDI[7]、MCARI[20]、MTCI[21]、AIVI[22]、TCARI/OSAVI[705,750][23]、NDRE2[24]、CIred-edge[25]、NDVI[26]和RVI[27]共10個能較好估算LAI的植被指數(shù)作為玉米冠層LAI反演時隨機森林機器學習法的輸入特征[7,19,28]。
PROSAIL輻射傳輸模型是植被冠層LAI反演的常用方法,綜合考慮了冠層結(jié)構(gòu)、生長狀況和影像的獲取環(huán)境,因此,本文利用PROSAIL模型模擬不同理化參數(shù)下的玉米冠層反射率。模型的輸入?yún)?shù)取值范圍如表2所示,其中sza、oza、raa太陽-衛(wèi)星觀測角度來自影像的頭文件,LAI、Cab、ρS以及LIDF由實測數(shù)據(jù)確定取值范圍,其他參數(shù)通過先驗知識、LOPEX93數(shù)據(jù)庫及文獻[29]確定。依據(jù)表2的參數(shù)設(shè)置,共模擬10 800條數(shù)據(jù)。
由于PROSAIL模型正向模擬得到的光譜反射率范圍是400~2 500 nm,光譜分辨率是1 nm,而Sentinel-2衛(wèi)星影像各波段的反射率是在一定光譜范圍內(nèi),存在光譜不一致的問題,所以利用Sentinel-2衛(wèi)星影像的光譜響應(yīng)函數(shù)對模擬數(shù)據(jù)進行光譜積分,積分公式為
表2 PROSAIL模型參數(shù)Tab.2 Range and unit of PROSAIL model inputs
(6)
式中ρs(λ)——模擬Sentinel-2衛(wèi)星影像的波段反射率
λmax、λmin——不同波段最大、最小波長范圍
ρ(λi)——PROSAIL模型模擬的光譜i處的反射率
φ(λi)——Sentinel-2衛(wèi)星影像對應(yīng)波段的光譜響應(yīng)函數(shù)
依據(jù)模擬的光譜數(shù)據(jù)通過光譜積分得到的多個波段反射率計算2.2節(jié)中提到的10個植被指數(shù),為隨機森林模型提供訓練數(shù)據(jù)集。
隨機森林(Random forest, RF)是一種基于分類回歸樹的機器學習方法,它由多棵相互獨立的決策樹組成,多棵樹進行平行訓練,取多棵樹的平均值或者較多的那一類作為結(jié)果。隨機森林是一種能夠基于離散或連續(xù)數(shù)據(jù)集合成回歸或分類函數(shù)的非參數(shù)統(tǒng)計技術(shù),能處理具有噪聲和大量數(shù)據(jù)的預測因子之間的復雜關(guān)系[30],隨機森林的優(yōu)點在于對多元線性公式不敏感,對缺失數(shù)據(jù)和非平衡數(shù)據(jù)的預測結(jié)果也具有魯棒性[31]。隨機森林總共有3個重要的參數(shù)變量:決策樹數(shù)目、葉子節(jié)點最小數(shù)目、每個節(jié)點的特征數(shù)目。本研究是利用Python中的sklearn包實現(xiàn)隨機森林模型,PROSAIL生成的查找表和野外實測數(shù)據(jù)分別作為模型的訓練數(shù)據(jù)集和測試數(shù)據(jù)集,利用決定系數(shù)R2和均方根誤差RMSE評估玉米冠層LAI反演結(jié)果。
為了評估使用SupReMe算法重建影像反射率的一致性,從空間細節(jié)和光譜一致性2方面進行評估,從圖2a、2b、2d可看出,在使用SupReMe算法重建的影像上,居民區(qū)、道路和耕地在提高空間細節(jié)的同時并很好地保持了地物邊界的一致性,相對于原始分辨率20 m的影像,重建后的影像有更為清晰的地物邊界和更詳細的紋理特征。為了客觀、定量地評價重建后影像質(zhì)量的提高情況,利用信息熵與平均梯度對重建后的影像進行質(zhì)量評價,評價結(jié)果如表3所示,通過評價結(jié)果可以看出,重建后影像的客觀評價指標都有提升,就信息熵而言,重建后影像的平均信息熵比重采樣影像的平均信息熵提升了0.083,就平均梯度而言,重建后影像波段的平均梯度均值比重采樣的影像波段平均梯度均值提升了0.007。因此,重建后的影像比重采樣的影像有更豐富的信息量和更高的清晰度。
表3 超分辨率重建定量評價結(jié)果Tab.3 Quantitative assessment results of reconstructed images using super resolution method
此外,評估影像重建前后的光譜一致性,表4為重建影像和重采樣影像的光譜相關(guān)性,可以看出,重建影像和重采樣影像有高度的相關(guān)性,各波段的R2都不小于0.91;具有最高相關(guān)性值的波段是B12,R2為0.93;整幅影像的估算精度都不小于88.76%,這說明重建影像在保持光譜不變性的同時提高了影像的空間細節(jié)。
表4 重建前后影像反射率相關(guān)性分析結(jié)果Tab.4 Correlation analysis results of image reflectance before and after reconstruction
利用PROSAIL生成的查找表作為訓練集,以所構(gòu)建的10個植被指數(shù)作為輸入特征,LAI作為輸出變量,基于隨機森林學習方法構(gòu)建LAI反演模型,隨機森林學習方法的核心是確定決策樹數(shù)目、葉子節(jié)點最小數(shù)目和每個節(jié)點的特征數(shù)目,由于本文中輸入特征只有10個,所以每個節(jié)點的特征數(shù)目為默認值,即劃分時考慮所有的特征數(shù),根據(jù)sklearn包中的GridSearchCV確定決策樹數(shù)目為100,葉子節(jié)點最小數(shù)目為1,其他的參數(shù)默認。
依據(jù)實測點的位置分別提取重建影像和重采樣影像的波段反射率,進而計算10個植被指數(shù),形成2份測試數(shù)據(jù)集;基于模擬數(shù)據(jù)訓練隨機森林模型,再用2份測試數(shù)據(jù)集來進行預測,每一份測試數(shù)據(jù)集分別運行3次,取其均值作為最終的LAI預測結(jié)果;并通過對LAI的實測數(shù)據(jù)和預測數(shù)據(jù)進行回歸分析并反演研究區(qū)的LAI。以重建影像為數(shù)據(jù)源,利用隨機森林方法反演得到的研究區(qū)內(nèi)玉米冠層LAI空間分布結(jié)果如圖3所示,從圖中可以看出,整個研究區(qū)內(nèi)的LAI分布在1.0~5.0之間,絕大多數(shù)區(qū)域的LAI反演結(jié)果在3.0~5.0之間,從空間分布規(guī)律來看,研究區(qū)西部的LAI偏低,主要原因是研究區(qū)西部為永清縣,該縣的玉米種植時間晚于市轄區(qū),平均玉米長勢與其相比略差,研究區(qū)東部是廊坊市市轄區(qū),玉米種植區(qū)域較大且相對集中,所以玉米長勢較好。
為了定量評價利用重建影像的LAI反演精度,以野外實測的LAI為依據(jù)進行反演精度評價,圖4a、4b分別為利用重建影像和重采樣影像的LAI反演精度評價結(jié)果,從2個反演結(jié)果可以看出,基于2種影像的LAI反演精度的決定系數(shù)R2都超過了 0.6,說明這2個反演結(jié)果與實測值的擬合效果較好,其中重建影像的R2高于重采樣影像的R2,由0.68提高到了0.70。從均方根誤差RMSE來看,重建影像的RMSE比重采樣影像低0.022,說明與重采樣影像相比,重建影像對應(yīng)實驗點的反演結(jié)果與實測值離散程度較小,更接近1∶1線,LAI的反演精度得到提高。
(1)使用SupReMe算法增強的影像在保持光譜特性不變的同時提高了影像的空間細節(jié)。采用SupReMe算法重建后,影像的空間細節(jié)與原始分辨率10 m的影像具有很好的一致性,與原始分辨率20 m的影像相比,重建后影像有更為清晰的地物邊界和更詳細的紋理特征,重建后影像的信息熵和平均梯度都有明顯提高;采用SupReMe算法重建前后,影像的反射率具有高度相關(guān)性,重采樣波段和重建后的波段之間的決定系數(shù)(R2)均不小于0.91,影像重建的估算精度均不小于88.76%。
(2)采用SupReMe算法對影像進行重建可以提高玉米冠層LAI的反演精度。采用SupReMe算法進行影像重建后,LAI反演結(jié)果比原始影像數(shù)據(jù)擁有更高的R2和更低的RMSE,R2由0.68提高到0.70,RMSE由0.262降低到0.240,通過LAI和實測值的擬合趨勢可以反映大范圍內(nèi)不同生育期的玉米長勢。