李長春 陳偉男 王 宇 馬春艷 王藝琳 李亞聰
(河南理工大學(xué)測繪與國土信息工程學(xué)院, 焦作 454000)
農(nóng)業(yè)生產(chǎn)是國家社會經(jīng)濟發(fā)展的基礎(chǔ),是國土資源管理和糧食安全的關(guān)鍵[1-3]。冬小麥?zhǔn)俏覈闹饕Z食作物之一,其種植面積和產(chǎn)量對于國家制定經(jīng)濟發(fā)展規(guī)劃、調(diào)控種植結(jié)構(gòu)、確保社會穩(wěn)定具有重要意義[4-7]。及時準(zhǔn)確地獲取冬小麥種植面積對農(nóng)業(yè)政策的制定具有重要意義。傳統(tǒng)的作物種植面積和分布信息的獲取和更新,一般需要管理人員進行實地考察或查詢當(dāng)?shù)剞r(nóng)業(yè)統(tǒng)計報表。該過程異常繁瑣,會消耗大量的人力和物力,并且會產(chǎn)生一些不可預(yù)料的錯誤[8-10]。遙感技術(shù)的發(fā)展,使得快速、準(zhǔn)確地獲取農(nóng)作物種植面積和分布狀況成為可能,因此使用遙感數(shù)據(jù)進行冬小麥種植面積提取具有重要意義。
目前,光學(xué)遙感影像是國內(nèi)外眾多學(xué)者在作物提取研究中使用的最主要數(shù)據(jù)。由于光學(xué)遙感影像受到云雨天氣的影響,質(zhì)量無法得到保證,一定程度上限制了作物信息的提取[11-12]。雷達衛(wèi)星具有全天候獲取影像的優(yōu)勢,可以為使用光學(xué)遙感數(shù)據(jù)進行作物信息提取提供數(shù)據(jù)保障[13-14]。國內(nèi)外一些學(xué)者基于融合影像進行農(nóng)作物類型空間分布圖繪制,結(jié)果表明使用融合影像提取作物種植信息較單一傳感器的識別精度均有不同程度的提升[8,15-17]。因此,進行作物種植信息的提取時,光學(xué)遙感數(shù)據(jù)和雷達數(shù)據(jù)的有效結(jié)合可以彌補某一類數(shù)據(jù)的局限性,充分發(fā)揮兩者的優(yōu)勢。
使用多生育期的遙感數(shù)據(jù)進行作物種植信息提取效果優(yōu)于單生育期數(shù)據(jù)。使用多生育期遙感影像進行作物種植信息提取,可以降低“同物異譜”和“同譜異物”的影響[18-20]。與單生育期影像相比,多生育期影像包含更多的物候信息,文獻[21-25]研究發(fā)現(xiàn),使用多生育期影像可以獲取較好的識別精度,提高了作物識別的準(zhǔn)確性。因此,將作物的物候生育期有效結(jié)合起來,可以為冬小麥的識別與提取提供新的思路。
本文以河南省扶溝縣為研究區(qū)域,以冬小麥拔節(jié)期、抽穗期、開花期、乳熟期、成熟期的Sentinel影像為數(shù)據(jù)源,結(jié)合實地調(diào)查數(shù)據(jù),基于隨機森林算法,綜合5個關(guān)鍵生育期的植被特征、光譜特征和極化特征,分別研究單生育期單傳感器、單生育期多傳感器、多生育期單傳感器、多生育期多傳感器的冬小麥識別方案,完成冬小麥種植面積的提取和空間分布圖的制作,對比分析上述4種方案的提取精度,優(yōu)選縣域冬小麥提取的最佳生育期,探討生育期融合數(shù)據(jù)在冬小麥識別中的可行性。
扶溝縣位于河南省中部(北緯33.84°~34.34°、東經(jīng)114.26°~114.65°),總面積1 173 km2(圖1,圖中DEM為數(shù)字高程模型)。該區(qū)域地處溫暖帶,氣候為半濕潤季風(fēng)氣候,冬季寒冷白天時間短,夏季燥熱白天時間長,四季分明,呈現(xiàn)非常典型的冬冷夏熱特征。全年最多的風(fēng)向為東風(fēng),歷年平均氣溫在14~15.8℃之間,年均光照時長為1 489~1 848 h,年均降水量在630 mm左右,全年無霜期為215 d左右,非常適合冬小麥種植。根據(jù)農(nóng)業(yè)農(nóng)村部公布的信息,扶溝縣冬小麥的物候期為:10月播種,11月出苗分蘗,12月至翌年1月分蘗越冬,2月至3月越冬返青,4月拔節(jié)抽穗,5月開花乳熟,6月成熟收獲[1]。
1.2.1Sentinel-1數(shù)據(jù)及預(yù)處理
Sentinel-1由兩顆極軌衛(wèi)星組成,均搭載C波段傳感器,重訪周期為6 d[17,26-27],包括4種成像模式:條帶模式(Stripmap,SM)、超寬幅模式(Extra wide swath,EW)、波譜模式(Wave,WM)和干涉寬幅模式(Interferometric wide swath,IW),其中IW模式是陸地觀測的主要成像模式。選取IW模式下的地距多視產(chǎn)品(Ground range detected,GRD)為數(shù)據(jù)源,該數(shù)據(jù)擁有交叉極化VH和同極化VV兩種極化方式。使用SAR工具條對各生育期的雷達影像進行預(yù)處理,首先完成軌道校正和輻射校正,然后選擇Refined Lee濾波器進行相干斑濾波,并進行地理編碼,最后使用矢量文件裁剪出研究區(qū)。為方便數(shù)據(jù)可視化以及提取研究,將標(biāo)準(zhǔn)后向散射系數(shù)進行分貝化處理。
1.2.2Sentinel-2數(shù)據(jù)及預(yù)處理
Sentinel-2影像的時間分辨率在Sentinel-2B成功發(fā)射后升至5 d,兩顆衛(wèi)星均攜帶多光譜成像儀(Multi-spectral instrument,MSI),軌道寬度為290 km。該衛(wèi)星擁有13個多光譜波段,其中4個波段分辨率為10 m,6個波段分辨率為20 m,3個波段分辨率為60 m[17,26-27]。根據(jù)質(zhì)量優(yōu)良、清晰無云、無條帶噪聲影響的原則,對目標(biāo)影像進行篩選。使用經(jīng)過幾何校正和輻射校正的L1C級影像,并使用Sen2Cor插件將其處理為L2A級產(chǎn)品。單景Sentinel-2影像無法覆蓋整個研究區(qū),因此將同期影像鑲嵌成一景能覆蓋整個研究區(qū)的影像,并裁剪出研究區(qū)。波段運算前需要統(tǒng)一波段,使用雙線性插值法完成空間分辨率的統(tǒng)一,對空間分辨率為20 m的波段進行重采樣。以Sentinel-2影像為基礎(chǔ),將預(yù)處理后的Sentinel-1和Sentinel-2數(shù)據(jù)進行影像配準(zhǔn),生成包含光學(xué)波段和雷達波段的融合影像。
在進行分類模型構(gòu)建與驗證過程中,需獲取可靠的地面樣本數(shù)據(jù)。在地面樣本數(shù)據(jù)選取時,將野外調(diào)查和記錄數(shù)據(jù)與谷歌高分辨率影像目視解譯結(jié)合,篩選出精準(zhǔn)的樣本數(shù)據(jù)。根據(jù)研究區(qū)概況以及研究目的,將樣本數(shù)據(jù)劃分為5個類別:冬小麥、水體(人造湖、河流等)、建筑(建筑物、裸地、道路等)、地膜(地膜及塑料大棚)、其他植被(林地、草地等)。利用上述方法共獲取187個樣本數(shù)據(jù),其中冬小麥36個、水體30個、建筑及裸地50個、地膜及塑料大棚20個、其他植被51個。隨機將樣本數(shù)據(jù)分為訓(xùn)練集和驗證集,其中70%的樣本數(shù)據(jù)用于模型構(gòu)建;30%的樣本數(shù)據(jù)用于分類精度驗證。
研究的基本流程如圖2(圖中R、G、B分別表示紅波段、綠波段和藍波段,SWIRⅠ、SWIRⅡ表示短波紅外波段)所示。首先對Sentinel-1和Sentinel-2數(shù)據(jù)進行預(yù)處理和配準(zhǔn);然后根據(jù)樣本數(shù)據(jù)構(gòu)建不同分類特征的多生育期變化曲線,分析不同類型地物在分類特征上的差異;最后使用隨機森林算法分別對4種方案的影像進行分類,得到提取結(jié)果,完成精度分析。
本文使用的分類方法是隨機森林算法,該算法由BREIMAN提出,是一種集成分類器[27-28]。由于該算法具有魯棒性好、分類速度快、分類精度高、不易產(chǎn)生過擬合等優(yōu)勢,已經(jīng)被廣泛應(yīng)用在農(nóng)業(yè)領(lǐng)域[5-6,24-25]。
考慮衛(wèi)星重訪周期和云層覆蓋度對Sentinel-2數(shù)據(jù)質(zhì)量的影響,選擇云量小于10%的光學(xué)遙感影像作為數(shù)據(jù)源。為降低數(shù)據(jù)源時間差異造成的影響,以Sentinel-2影像為參考,對過境時間跨度在3 d以內(nèi)的Sentinel-1影像進行篩選。表1列舉了Sentinel影像的獲取時間和數(shù)量,并且采用英文字母對冬小麥的不同生育期進行注記。
考慮到研究區(qū)的生態(tài)環(huán)境、各類地物的結(jié)構(gòu)、冬小麥的物候特征、土壤背景信息的影響以及各種分類特征的意義[5,15,25],選取5種光譜特征、3種極化特征和4種植被指數(shù)特征進行冬小麥提取。除了農(nóng)情監(jiān)測常用的3個可見光R、G、B波段以外,還選取了Sentinel-1影像的VV、VH以及VH/VV比值,Sentinel-2影像的SWIRⅠ、SWIRⅡ以及歸一化植被指數(shù)、土壤調(diào)節(jié)植被指數(shù)、紅邊歸一化植被指數(shù)、紅邊位置指數(shù)作為分類特征。由于各類地物在不同分類特征上包含的信息不同,因此對不同地物的時間特征進行分析,觀察圖3可以發(fā)現(xiàn)冬小麥在各種分類特征上均容易與其他地物區(qū)分開來。其中,VH/VV比值可以降低輻射不穩(wěn)定與環(huán)境因素等造成的影響,是評估植被生長狀態(tài)的良好指標(biāo)[13-14];SWIRⅠ、SWIRⅡ、VV、VH可以反映植物冠層含水率的狀況;土壤調(diào)節(jié)植被指數(shù)反映了土壤背景的情況,可以降低土壤背景對植被的影響[5,24];歸一化植被指數(shù)是目前檢測植被生長狀態(tài)的最佳指標(biāo)[21,27],紅邊歸一化植被指數(shù)和紅邊位置指數(shù)充分利用Sentinel-2影像紅邊波段的優(yōu)勢,更加有效地區(qū)分各類農(nóng)作物[6]。歸一化植被指數(shù)、土壤調(diào)節(jié)植被指數(shù)、紅邊歸一化植被指數(shù)、紅邊位置指數(shù)公式分別為
(1)
(2)
(3)
(4)
式中B4——紅波段反射率
B8——近紅外波段反射率
B8A——窄近紅外波段反射率
B5、B6、B7——紅邊波段反射率
i——土壤調(diào)節(jié)因子,取0.5
使用混淆矩陣對分類精度進行評估?;诨煜仃嚕梢垣@取總體精度、Kappa系數(shù),它們是定量描述分類精度的評價指標(biāo)[29-30]。
地物的極化特征、光譜特征、植被指數(shù)特征均會隨農(nóng)作物生育期的推移而變化,因此農(nóng)作物生長發(fā)育的變化情況可以為農(nóng)作物識別提供有效、可靠的信息[24]。通過計算各類地物樣本的各項特征平均值,繪制各類地物時間特征曲線,結(jié)果如圖3所示。
從圖3中可以得到,不同類型地物的特征變化差異非常明顯:分析光譜特征可知,曲線呈現(xiàn)先減少后增加的趨勢,在抽穗期達到最小值后,開始增長,并且在成熟期達到最大;地膜、建筑、水體地物在光譜特征波段保持平穩(wěn),沒有大幅度增減;其他植被在光譜特征波段均呈現(xiàn)逐漸降低并趨于平穩(wěn)的趨勢。分析植被指數(shù)特征可知,曲線呈現(xiàn)先增加后降低的趨勢,并且在抽穗期達到峰值,然后開始降低,成熟期降到最低;其他植被的植被指數(shù)曲線均在開花期后趨于平穩(wěn);其他類型地物的曲線均在一定范圍內(nèi)上下波動。分析極化特征可知,3種極化特征均呈現(xiàn)先降低后增加的趨勢,在抽穗期降到最低,在成熟期達到最高;其他植被的曲線呈現(xiàn)先增加后降低的趨勢,在開花期達到最高;其他類型地物則呈現(xiàn)比較平穩(wěn)的趨勢,沒有較大波動。
分析上述變化特點,可以得到如下結(jié)論:①冬小麥在各特征波段的變化曲線與其他地物類型的曲線較易區(qū)分,這與冬小麥獨特的物候特征密不可分。②對光譜特征進行分析,在抽穗期,冬小麥的冠層對可見光(R、G、B)和SWIR波段的反射率達到最高,此時冬小麥的光譜特征值降到最低,抽穗期后,冬小麥開始衰老,光譜特征值開始逐漸增大。③對植被指數(shù)特征進行分析,從拔節(jié)期到抽穗期,冬小麥生長迅速,各項植被指數(shù)在抽穗期達到峰值,與植被冠層的葉綠素含量密不可分。抽穗期后,冬小麥光合作用衰減,葉片逐漸泛黃,葉面積指數(shù)降低,直至冬小麥葉片完全變黃,植被指數(shù)降到最小。④對極化特征進行分析,從拔節(jié)期到抽穗期,葉密度和稈密度逐漸增加,土壤對后向散射的影響開始降低,冠層散射占據(jù)主導(dǎo)地位,冬小麥的極化特征值開始降低。從抽穗期到成熟期,冬小麥進入衰老狀態(tài),開始出現(xiàn)麥穗,冬小麥植株的含水率逐漸降低,冠層密度也降低,土壤的散射作用逐漸增強,使3種極化特征值增加。⑤綜合分析上述分類特征可知,冬小麥的變化曲線均有著明顯區(qū)別于其他地物類型的特征,為冬小麥識別和種植面積提取提供了理論基礎(chǔ)。
3.2.1單生育期
分別對單生育期的3種影像組合分類結(jié)果進行分析,繪制冬小麥空間分布圖,并評估分類的準(zhǔn)確性。在單生育期影像中,光學(xué)影像包含9個分類特征,雷達影像包含3個分類特征。表2為各生育期分類總體精度與Kappa系數(shù),由表2可知,融合影像較僅使用光學(xué)影像和雷達影像,分類精度均有不同程度的提升。以Sentinel-2影像分類結(jié)果為基準(zhǔn),分析融合影像的分類精度,5個生育期的總體精度依次提升了0.1、0.9、5.9、3.8、1.7個百分點,Kappa系數(shù)依次提升了0.1、1.2、7.8、5.0、2.4個百分點。
表2 各生育期總體精度與Kappa系數(shù)Tab.2 Overall accuracy and Kappa coefficient of mono-temporal images %
進一步對比分析冬小麥在不同生育期遙感影像的分類結(jié)果。拔節(jié)期的雷達影像分類精度最高,其他植被在該生育期還未完全進入生長期,冬小麥的冠層密度相對較高,此時易與其他植被區(qū)分,但是該生育期的分類精度仍舊無法滿足冬小麥遙感識別精度要求。成熟期的光學(xué)影像分類精度最高,在該生育期,冬小麥植株體內(nèi)的葉綠素含量降到最低,其他植被進入旺期生長期,具有很明顯的植被指數(shù)特征,此時冬小麥在光學(xué)影像分類特征中很容易與其他地物類型進行區(qū)分。在成熟期,融合影像分類精度最高,這是由于該生育期冬小麥植株含水率降低到最小,冠層密度達到最低,土壤背景的散射影響較大,結(jié)合冬小麥在成熟期光學(xué)影像上的良好表現(xiàn),很容易將冬小麥與其他地物類型區(qū)分開來。研究結(jié)果表明將光學(xué)影像和雷達影像進行融合,可以提高分類精度,這與文獻[8,15-17]的研究結(jié)論一致。
3.2.2多生育期
分別對多生育期3種影像組合分類結(jié)果進行分析,繪制冬小麥空間分布圖,對分類的準(zhǔn)確性進行評估。在多生育期影像中,光學(xué)影像包含45個用于分類的特征,雷達影像包含15個分類特征。圖4為多生育期遙感影像的總體分類精度與Kappa系數(shù),多生育期融合影像的分類精度最高;多生育期雷達影像分類精度最低,總體精度僅為81.9%,Kappa系數(shù)為76.4%;與多生育期雷達影像分類結(jié)果相比,多生育期光學(xué)影像的分類精度相對較高,總體精度為95.6%,Kappa系數(shù)為94.5%,但此精度仍低于多生育期融合影像。此外,由于融合后的多生育期影像,光譜特征和植被指數(shù)特征所占比例較大,多生育期融合影像分類結(jié)果比多生育期雷達影像提高較為顯著,而對于分類精度較高的多生育期光學(xué)影像的改善較小。這與文獻[13]使用多時相Sentinel-1和Sentinel-2數(shù)據(jù)在基于像元層面對農(nóng)作物進行分類的研究結(jié)果一致。
由此可以得出,融合影像可以彌補雷達影像和光學(xué)影像的不足,對于提高冬小麥遙感識別精度非常有效。受重訪周期和光學(xué)影像質(zhì)量的影響,光學(xué)影像在某個生育期缺失時,可以使用雷達影像作為補充數(shù)據(jù)完成冬小麥的識別[8]。
3.3.1典型地塊提取結(jié)果分析
對拔節(jié)期雷達VV影像和成熟期光學(xué)真彩色影像目視解譯,將冬小麥空間分布情況與4種實驗方案制圖結(jié)果進行對比分析。選擇包含5種地物類型的典型區(qū)域,對提取結(jié)果進行比較分析,如圖5所示。
結(jié)果表明不同數(shù)據(jù)類型的制圖結(jié)果存在較大差異。對單生育期影像分類結(jié)果進行分析,此3種分類結(jié)果“椒鹽”噪聲比較嚴重,圖5c中,錯分、漏分最嚴重,該分類方案將水體誤分為冬小麥,這是由水體與冬小麥的極化特征相近造成的,分類結(jié)果準(zhǔn)確性較低,無法滿足制圖要求;圖5d中,無法將地膜與收割后的小麥區(qū)分開,圖5e中,無法將收割后的冬小麥與裸地區(qū)分開,這是由收割后的冬小麥與裸地、地膜的分類特征相似造成的,這兩種情況均對冬小麥種植面積的正確估算產(chǎn)生干擾。單生育期的影像在一定程度上可以將冬小麥與其他地物進行有效區(qū)分,但物候特征在不同生育期的差異較大,蘊含的信息量也不同,所以單生育期影像在冬小麥提取上具有一定的局限性。
對多生育期影像分類結(jié)果進行分析,此3種分類結(jié)果較單生育期影像分類結(jié)果,“椒鹽”噪聲均得到改善。圖5f中,地塊內(nèi)部比較粗糙,且冬小麥地塊與其他地物之間的邊界比較模糊,錯分、漏分現(xiàn)象依舊存在,受樹木冠層散射的影響,分類結(jié)果中的道路比實際的寬;圖5g中,地塊內(nèi)部相對均勻,道路與冬小麥地塊的邊界效果較優(yōu),受冬小麥與其他植被之間存在“異物同譜”的影響,冬小麥地塊的輪廓邊緣依舊不是很清晰;圖5h將兩種數(shù)據(jù)融合后,分類結(jié)果中各類地物的分布范圍目視解譯結(jié)果基本保持一致,分類邊界最清晰,消除了將小塊水體誤分為冬小麥的現(xiàn)象,面積較大的植被與冬小麥地塊完全分離,可以將較窄的道路提取出來,有利于縣域冬小麥的遙感提取與制圖。
3.3.2冬小麥空間分布圖
針對研究的4種方案,選擇總體精度最高的多生育期融合影像繪制冬小麥空間分布圖。多生育期融合影像的總體精度和Kappa系數(shù)分別為96.8%和95.7%,分類結(jié)果可靠,具有良好的實用價值。圖6為基于多生育期融合影像繪制的2019年扶溝縣冬小麥空間分布圖,可以看出,冬小麥?zhǔn)欠鰷峡h境內(nèi)的主要夏收作物。以扶溝縣城區(qū)為中心,扶溝縣城區(qū)附近的冬小麥種植比較零散,其他地區(qū)的冬小麥種植分布均勻,地塊連續(xù),與實地情況相符。
(1)時間特征曲線表明,冬小麥生長過程中,各種分類特征變化明顯,各類地物差異較大,可以進行有效區(qū)分,為冬小麥種植面積提取提供理論依據(jù)。
(2)單生育期的雷達影像很難滿足制圖要求,使用多生育期的雷達影像可以解決該問題。單生育期中,拔節(jié)期識別精度最高,但總體精度僅為62.9%。使用多生育期的雷達影像可以提高分類精度,總體精度達到81.9%,基本滿足制圖要求。
(3)使用單生育期的融合影像進行分類,較同期的光學(xué)影像和雷達影像,分類精度均有不同程度提高。成熟期的融合影像分類精度最高,總體精度達到95.1%,Kappa系數(shù)達到94.8%,對于同一生育期,融合影像可以提高分類精度。
(4)多生育期的融合影像分類效果最優(yōu),融合影像可以提高冬小麥識別精度。使用多生育期融合影像進行冬小麥種植面積提取,可以繪制更為精準(zhǔn)的扶溝縣冬小麥空間分布圖。