劉惠楠,王井利,周 斌,馬運濤
(1.沈陽建筑大學(xué) 交通與測繪工程學(xué)院,遼寧 沈陽 110168;2.遼寧省生態(tài)氣象和衛(wèi)星遙感中心,遼寧 沈陽 110166)
玉米作為我國主要的糧食作物之一,準(zhǔn)確掌握玉米的分布情況有助于推動我國精準(zhǔn)農(nóng)業(yè)的發(fā)展。目前,關(guān)于玉米種植結(jié)構(gòu)的識別及提取的研究主要基于中高分辨率遙感影像的地塊尺度方面[1-5]。中高分辨率的遙感影像雖然有較高的分類精度,但由于受到重訪周期、圖幅寬窄、云污染等影響,監(jiān)測較大尺度農(nóng)業(yè)種植面積的中高空間分辨率遙感數(shù)據(jù)難以滿足精確研究農(nóng)作物關(guān)鍵生育期識別的要求。
在實際應(yīng)用中,玉米屬于季節(jié)性作物,準(zhǔn)確區(qū)分其物候期,可為實現(xiàn)玉米種植結(jié)構(gòu)的準(zhǔn)確提取提供重要依據(jù)[6]。其中,利用MODIS制作的時序數(shù)據(jù)最為廣泛,它具有觀測周期短、范圍廣等優(yōu)點[7-8]。但在市(縣)尺度的研究中,MODIS數(shù)據(jù)的空間分辨率較低,從而影響了對作物識別的精度,因此,引入較高空間分辨率的遙感影像聯(lián)合應(yīng)用可互相彌補不足之處,進而提高對作物識別的精度與效率[9-13]。
大量研究表明,多源數(shù)據(jù)聯(lián)合應(yīng)用的分類方法已成為遙感農(nóng)作物識別的主要發(fā)展趨勢。其中,MODIS數(shù)據(jù)的空間尺度較大,與其他高分辨率影像數(shù)據(jù)融合后極易造成混合像元,導(dǎo)致融合后影像數(shù)據(jù)的應(yīng)用受限,對作物提取結(jié)果的精度并不理想。本文提出了不基于影像融合的多源數(shù)據(jù)聯(lián)合應(yīng)用提取作物種植結(jié)構(gòu)的方法,為提高農(nóng)作物遙感種植結(jié)構(gòu)提取的準(zhǔn)確度提供了一種新的思路。
沈陽市位于遼寧省中部,位于41°10′30″ N~43°0′42″N、122°23′22″E~123°46′38″E 之間,處于遼東山地與下遼河平原的過渡地帶,屬溫帶季風(fēng)氣候區(qū)濕潤和半濕潤大陸性氣候,四季分明,降水集中,日照充足,雨熱同季,年均降水量628 mm,適于農(nóng)作物的生長發(fā)育。研究區(qū)地理位置和Landsat-8真彩色影像如圖1所示。
圖1 研究區(qū)位置示意圖和Landsat-8真彩色影像
1.2.1 多源遙感數(shù)據(jù)的獲取與預(yù)處理 本文應(yīng)用Landsat-8、Sentinel-2、GF-1、MODIS等4類遙感影像,選取了沈陽區(qū)域2020年無云或云量較少的中高分辨率衛(wèi)星遙感影像共28幅,2020年5月1日—10月1日低分辨率衛(wèi)星遙感影像共154幅,多源遙感影像具體數(shù)據(jù)見表1。
表1 2020年5月1日—10月1日的多源遙感影像參數(shù)
本文所用Landsat-8 OLI多光譜影像數(shù)據(jù)來源于美國地質(zhì)勘查局網(wǎng)站(https://glovis.usgs.gov/),Sentinel-2A/B MSL多光譜影像數(shù)據(jù)來源于歐空局哥白尼數(shù)據(jù)中心(https://scihub.copernicus.eu/),GF-1 WFV數(shù)據(jù)來源于遼寧省高分?jǐn)?shù)據(jù)中心,MODIS數(shù)據(jù)來源于NASA網(wǎng)站(http://modis.gsfc.nasa.gov/)提供的MODIS1B陸地帶MOD09(MODIS表面反射率)的MOD09GA數(shù)據(jù)產(chǎn)品。
遙感數(shù)據(jù)均經(jīng)過輻射定標(biāo)、大氣校正、投影轉(zhuǎn)換、波段合成、正射校正、圖像配準(zhǔn)、鑲嵌、裁剪及光譜指數(shù)計算而來。各光譜指數(shù)計算公式為:
增強型植被指數(shù):
歸一化水體指數(shù):
歸一化建筑指數(shù):
1.2.2 樣本的建立與數(shù)據(jù)的驗證 基于現(xiàn)有的東北地區(qū)10 m作物類型分布產(chǎn)品數(shù)據(jù)集,制作玉米(157處)、水稻(100處)、大豆(37處)的樣本區(qū)域數(shù)據(jù)。計算Landsat-8、Sentinel-2、GF-1、MODIS遙感影像中玉米157處樣本區(qū)域的EVI平均值,并以此作為轉(zhuǎn)化模型的樣本數(shù)據(jù)。結(jié)合實地調(diào)查(圖1)與研究區(qū)Google Earth影像制作玉米(86處)、水稻(50處)、大豆(60處)、林地(50處)、水體(37處)、其他植被(40處)、非植被與水體區(qū)域(100處)為結(jié)果驗證數(shù)據(jù)。
1.3.1 Savitzky-Golay濾波 S-G濾波是一種在域內(nèi)基于多項式,通過移動窗口利用最小二乘法最佳擬合的方法[14]。具體計算公式為:
式(4)中,Yj+i為原始EVI的時序數(shù)據(jù),′為EVI的擬合數(shù)據(jù),Ci為第i個EVI值的濾波系數(shù),N為卷積數(shù)目,等于組數(shù)的寬度(2m+1),j為原始EVI數(shù)據(jù)的系數(shù),m是平滑窗口大小的一半。
該研究利用2020年5月1日—10月1日共計154 d的每日MOD09GA數(shù)據(jù)中玉米、水稻、大豆各處樣本區(qū)域合計的日平均EVI值,制作作物完整物候期的時間序列。由于EVI數(shù)據(jù)受云的影響明顯,導(dǎo)致部分日期數(shù)據(jù)存在明顯偏差。利用S-G濾波,滑動窗口設(shè)置為5,使得保留細節(jié)特征的同時更接近EVI時序的上包絡(luò)線,對EVI數(shù)據(jù)的噪聲進行有效剔除。
1.3.2 各傳感器間EVI指數(shù)轉(zhuǎn)化模型的構(gòu)建 利用中高分辨率EVI數(shù)據(jù)來彌補MODIS-EVI時間序列分辨率較低的問題。選取與中高分辨率影像對應(yīng)同一天的MODIS數(shù)據(jù),可以較大程度地避免衛(wèi)星數(shù)據(jù)獲取過程中由地物變化導(dǎo)致影像輻射值變化的問題,影像預(yù)處理可消除或盡量減小數(shù)據(jù)獲取時太陽高度角、氣溶膠等因素的影響。在盡可能地減小由數(shù)據(jù)來源差異引起的誤差后,分別計算MODIS與Landsat-8、Sentinel-2、GF-1各個影像157處樣本區(qū)域的EVI平均值,使之一一對應(yīng)構(gòu)建數(shù)據(jù)對,利用線性回歸方法,以中高分辨率EVI數(shù)據(jù)作為自變量、對應(yīng)的MODISEVI作為因變量構(gòu)建EVI指數(shù)轉(zhuǎn)化模型,并利用決定系數(shù)R2評價模型的擬合效果。
1.3.3 分類方法 CART決策樹、隨機森林、最大似然法為傳統(tǒng)監(jiān)督分類方法,利用已知分類樣本像元對未知像元進行判別。該研究利用ENVI軟件,輸入待分類數(shù)與樣本數(shù)據(jù)后計算機自動輸出分類結(jié)果。
決策樹分類技術(shù)在遙感分類方面具有很大的優(yōu)勢,可逐步建立決策樹,手動設(shè)置閾值,將目標(biāo)地物逐步從原始數(shù)據(jù)中分層掩膜出來,能有效地避免在提取過程中相似地物的相互干擾,通過共同運用大量不同類別的輸入數(shù)據(jù),從而達到多種類數(shù)據(jù)復(fù)合應(yīng)用分類的目的,且分類結(jié)構(gòu)清晰并容易理解[15-16]。
1.3.4 混合像元分解模型 玉米常與其他作物間作,在遙感解譯中極易產(chǎn)生混合像元,導(dǎo)致地物分類精度下降。該研究選擇Heinz等[17-18]提出的全約束最小二乘法混合像元分解模型(Fully Constrained Least Squares,FCLS),在決策樹分類結(jié)果的基礎(chǔ)上進行混合像元分解,進而提高對數(shù)據(jù)的解譯精度。
1.3.5 精度評價方法 該研究利用R2評價模型的擬合優(yōu)度,以及標(biāo)準(zhǔn)差、均方根誤差評價經(jīng)模型轉(zhuǎn)換前、后各個樣本點的離散程度。利用驗證數(shù)據(jù)的混淆矩陣,計算各地類的分類精度,使用Kappa系數(shù)和總體精度評價整體分類結(jié)果的精度,利用各地類的制圖精度與用戶的精度評價各地類的漏分與錯分情況。
S-G濾波重構(gòu)后的各類農(nóng)作物時序曲線如圖2所示,圖2中2020年5月1日對應(yīng)時間為0 d,2020年10月1日對應(yīng)時間為153 d。
圖2 作物全生長周期EVI時序曲線
玉米EVI在5月中下旬開始增加,此時玉米開始出苗生長;7月上旬的EVI增長最快,此時玉米處于拔節(jié)期,其生長態(tài)勢最旺盛;7月14日(第75天)達到峰值,為0.660,此時由于玉米頂端雄穗與玉米植株顏色的反差導(dǎo)致各通道反射率發(fā)生變化,使得EVI開始下降;8月8日(第100天)到達波谷,為0.512,此時玉米處于吐絲期;隨后植株繼續(xù)生長,EVI經(jīng)過小幅度增長后,玉米進入乳熟期;9月EVI迅速下降,玉米則逐漸成熟。
水稻于5月初出苗;EVI在5月中下旬緩慢減小,稻苗葉片收縮,此時水稻處于返青期;6月中下旬EVI迅速增長,此時水稻處于分蘗期;7月17日(第78天)EVI達到峰值,為0.683,此時水稻處于拔節(jié)期;隨后EVI開始逐漸下降,水稻進入抽穗期,雖然此時稻穗顏色發(fā)生了變化,并由此導(dǎo)致各通道的反射率也隨之發(fā)生了變化,但稻穗顏色的變化比玉米雄穗與植株的少,因此,此時的時序曲線未產(chǎn)生波谷;9月EVI迅速下降,水稻進入逐漸成熟。
大豆EVI在5月中旬開始增加,此時大豆開始出苗生長;6月中下旬EVI增長速率最快,生長態(tài)勢最旺盛,此時大豆處于分枝期;7月20日(第81天)EVI為0.571時開始緩慢增長,大豆進入開花期;8月20日(第112天)達到峰值0.583,此時大豆處于結(jié)莢期;9月EVI迅速下降,大豆進入鼓粒期后逐漸成熟。由上述分析獲取的作物物候期如表2所示。
表2 沈陽市主要作物物候期
各傳感器間EVI指數(shù)的轉(zhuǎn)化模型及相關(guān)系數(shù)(R2)如圖3所示。各轉(zhuǎn)化模型的R2>0.85,各轉(zhuǎn)化模型的擬合優(yōu)度較高。
圖3 EVI指數(shù)轉(zhuǎn)換模型
模型轉(zhuǎn)換前,MODISEVI的數(shù)據(jù)相較于其他類型的標(biāo)準(zhǔn)差更小,離散程度較小,數(shù)據(jù)較穩(wěn)定。經(jīng)模型轉(zhuǎn)換后,GF-1EVI、Landsat-8EVI與Sentinel-2EVI的標(biāo)準(zhǔn)差與均方根誤差均有一定程度的減小,EVI離散范圍明顯縮小,具體標(biāo)準(zhǔn)差與均方根誤差如表3所示。
表3 模型轉(zhuǎn)換前、后各類EVI樣本的標(biāo)準(zhǔn)差與均方根誤差比較
轉(zhuǎn)換后的數(shù)據(jù)能夠與同日期的MODISEVI數(shù)據(jù)相匹配,具體如圖4所示。將研究區(qū)域的Landsat-8、Sentinel-2、GF-1的EVI影像數(shù)據(jù)進行對應(yīng)模型轉(zhuǎn)換后,得到了各個日期的MODISLandsat-8EVI、MODISSentinel-2EVI、MODISGF-1EVI。
圖4 模型轉(zhuǎn)換前、后數(shù)據(jù)的對比圖
2.3.1 傳統(tǒng)分類方法的玉米種植結(jié)構(gòu)提取 采用CART決策樹、隨機森林、最大似然法分別對中高分辨率影像進行地物提取,各類方法的總體精度、Kappa系數(shù)如表4所示??傮w分類精度均小于86.5%,Kappa 系數(shù)均小于0.8,由此可知,這3種分類方法結(jié)果的精度并不理想。
表4 傳統(tǒng)遙感分類方法的結(jié)果精度比較
2.3.2 基于決策樹的多源遙感數(shù)據(jù)種植結(jié)構(gòu)提取 經(jīng)反復(fù)實驗發(fā)現(xiàn),EVI在水體和建筑用地的分類中會將部分水體與建筑用地混淆,故利用9月30日的Sentinel-2 NDWI數(shù)據(jù),將NDWI值>0.5的區(qū)域判定為水體。利用7月22日的Landsat-8 NDBI數(shù)據(jù),將NDBI值>-0.1236且NDWI值<0.5的區(qū)域判定為非植被與水體區(qū)域。利用7月22日的Landsat-8 EVI數(shù)據(jù),將EVI值<0.5755、NDWI值<0.5、NDBI值<-0.1236的區(qū)域判定為其他植被。
利用7月15日的GF-1影像、8月7日的Landsat-8 EVI數(shù)據(jù)、9月20日的Sentinel-2 EVI數(shù)據(jù),根據(jù)作物的物候期將植被細分為林地、玉米、水稻、大豆。圖2是由MODIS-EVI制作,故其只能作為各地類間植被指數(shù)大小比較的參考,其具體數(shù)值不能作為未經(jīng)模型轉(zhuǎn)換的數(shù)據(jù)分類閾值使用。基于此,經(jīng)反復(fù)實驗確定,由于8月7日的水稻處于抽穗期,此時的EVI值大于玉米和大豆的,故將8月7日的Landsat-8 EVI值在1.6213~1.8525范圍內(nèi)的區(qū)域判定為水稻;9月20日的大豆處于鼓粒期,此時的EVI值大于玉米的,故將不滿足上述條件且9月20日的Sentinel-2 EVI值在-0.1021~0.0662范圍內(nèi)的區(qū)域判定為大豆。7月15日的玉米與水稻的EVI值遠大于大豆的,玉米處于吐絲期,故將水稻與大豆提取后剩余區(qū)域內(nèi)7月15日的EVI值>0.5112的區(qū)域判定為玉米,余下區(qū)域被劃分為林地。分辨率為30 m的分類結(jié)果如圖5所示。
圖5 基于決策樹的多源遙感數(shù)據(jù)種植結(jié)構(gòu)提取圖
基于多源遙感數(shù)據(jù)的分類總體精度為87.68%,Kappa系數(shù)為0.8162,相較于傳統(tǒng)監(jiān)督分類方法,其總體精度與Kappa系數(shù)均有明顯提高,各地類具體的用戶精度與制圖精度如表5所示。
表5 基于決策樹的多源遙感數(shù)據(jù)種植結(jié)構(gòu)分類結(jié)果的混淆矩陣
2.3.3 基于決策樹的多源轉(zhuǎn)化遙感數(shù)據(jù)種植結(jié)構(gòu)提取 經(jīng)模型轉(zhuǎn)換后的各類傳感器EVI數(shù)據(jù)可根據(jù)MODIS-EVI時序曲線特征閾值,因此對植被細化分類的閾值進行更改。經(jīng)反復(fù)實驗確定將8月7日MODISLandsat-8EVI值>0.5788的區(qū)域判定為水稻;將不滿足上述條件且9月20日MODISSentinel-2EVI值在0.3006~0.3435范圍內(nèi)的區(qū)域判定為大豆;將水稻與大豆提取后,剩余區(qū)域內(nèi)7月15日MODISGF-1EVI值>0.634的區(qū)域判定為玉米,剩余區(qū)域被劃分為林地。各時相EVI樣本平均值變化見表6。
表6 模型轉(zhuǎn)換后各時相EVI樣本平均值
對比可知,利用時序曲線提取物候特征對決策樹準(zhǔn)確閾值能夠有效區(qū)分玉米、水稻和大豆,并糾正研究區(qū)南部水稻與玉米混淆錯分的問題,分類結(jié)果分辨率為30 m,具體如圖6所示。
圖6 基于決策樹的多源轉(zhuǎn)化遙感數(shù)據(jù)種植結(jié)構(gòu)提取圖
基于多源轉(zhuǎn)化遙感數(shù)據(jù)的分類總體精度為92.27%,Kappa系數(shù)為0.8825,相較于數(shù)據(jù)未經(jīng)模型轉(zhuǎn)換的決策樹分類方法,玉米制圖精度、用戶精度、總體精度分別提高了6.25、0.80、4.59個百分點,Kappa系數(shù)提高了0.0663,各地類具體的用戶精度與制圖精度如表7所示。
表7 基于決策樹的多源轉(zhuǎn)化遙感數(shù)據(jù)種植結(jié)構(gòu)分類結(jié)果的混淆矩陣
2.3.4 基于決策樹的混合像元分解模型 將MODISGF-1EVI、MODISLandsat-8EVI、MODISSentinel-2EVI與2.3.2節(jié)的分類結(jié)果疊加,在玉米分類結(jié)果范圍內(nèi)選取玉米的端元,利用FCLS進行線性混合像元分解以實現(xiàn)玉米反演。決策樹與混合像元分解結(jié)合提取玉米種植結(jié)構(gòu)的總體精度為95.98%,玉米地類提取結(jié)果的邊界清晰,能夠有效地解決決策樹分類結(jié)果出現(xiàn)的地塊邊緣錯分、細碎圖斑的問題(圖7)。
圖7 決策樹與混合像元分解結(jié)合提取玉米種植結(jié)構(gòu)的對比圖
本文以提高玉米種植結(jié)構(gòu)提取精度為目的,嘗試聯(lián)合應(yīng)用Landsat-8、Sentinel-2、GF-1與MODIS數(shù)據(jù)進行玉米提取。采用CART決策樹、隨機森林、最大似然法、決策樹分類方法對研究區(qū)域內(nèi)的作物進行分類,得出如下結(jié)論:
(1)為充分利用MODIS數(shù)據(jù)的高時間分辨率優(yōu)勢,通過作物生育期每日的MODIS-EVI數(shù)據(jù)經(jīng)S-G濾波制作時序曲線,能夠準(zhǔn)確地反映作物的生長變化趨勢,為其物候特征的提取提供可靠依據(jù)。
(2)不同作物的物候特征是區(qū)分易混淆作物的重要依據(jù),利用MODIS-EVI的時序曲線確定作物的物候特征準(zhǔn)確的閾值,再通過決策樹方法逐步掩膜剔除水稻、大豆等易混淆的地類,能夠得到較高精度的玉米分類結(jié)果。
(3)EVI轉(zhuǎn)換模型能夠有效控制EVI數(shù)據(jù)跳躍幅度,并且實現(xiàn)調(diào)整Landsat-8、Sentinel-2、GF-1與MODIS數(shù)據(jù)之間的匹配度,經(jīng)轉(zhuǎn)換后的影像數(shù)據(jù)既具備了MODIS的數(shù)據(jù)特征,又保留了中高分辨率影像的數(shù)據(jù)細節(jié),通過EVI轉(zhuǎn)換模型可以達到多源數(shù)據(jù)聯(lián)合應(yīng)用的目的。
(4)在相同樣本與驗證的條件下,基于MODISEVI物候特征對轉(zhuǎn)換后的多源時序數(shù)據(jù)進行決策樹分類,其結(jié)果的總體精度顯著高于CART決策樹、隨機森林、最大似然法分類結(jié)果的總體精度。
(5)通過決策樹分類與混合像元分解相結(jié)合,可以進一步提高玉米種植結(jié)構(gòu)的提取精度,使地塊劃分細節(jié)更加精準(zhǔn),能夠解決決策樹分類結(jié)果出現(xiàn)的細小斑塊等問題。