汪荃,陳軍軍
(1.中南勘察基礎(chǔ)工程有限公司,武漢 430081;2.湖北正紐地理信息有限公司,湖北 黃石 435006)
近年來,中國水稻種植面積逐年減少,因此需要利用遙感技術(shù)實時精確獲取水稻空間分布及種植面積信息為各級政府指導(dǎo)水稻生產(chǎn)、平衡區(qū)域供需提供參考。目前,多數(shù)遙感傳感器具有高光譜、高分辨率、長時間觀測等特點,能夠在遙感監(jiān)測農(nóng)作物生長信息方面發(fā)揮很大的作用,從而大大提升農(nóng)業(yè)生產(chǎn)效率[1-5]。農(nóng)作物生長信息大多均由中分辨率遙感衛(wèi)星SPOT、Landsat等遙感監(jiān)測,苗翠翠等[6]利用MODIS遙感影像對江蘇省水稻種植面積進行監(jiān)測分析,Chen等[7]利用MODIS時間序列影像對湄公河三角洲上游的水稻種植強度進行監(jiān)測。而Sentinel-2衛(wèi)星影像數(shù)據(jù)雖然較少使用在農(nóng)作物遙感監(jiān)測上,但是其分辨率高、覆蓋范圍廣,適用于對農(nóng)作物進行監(jiān)測。
因此,本研究采用Sentinel-2衛(wèi)星影像數(shù)據(jù)作為數(shù)據(jù)源,采用基于像素分類的最大似然法、支持向量機法對研究區(qū)水稻信息進行提取,3種植被指數(shù)NDVI、NDGI、RVI及其組合并結(jié)合多時間序列影像數(shù)據(jù)提取研究區(qū)水稻種植信息,并采用混淆矩陣對分類結(jié)果進行精度評價和結(jié)果分析,旨在得到適合于此研究區(qū)的最優(yōu)提取方案。
研究區(qū)域為蕪湖市蕪湖縣南部面積為118.8 km2的水稻種植區(qū),其位于長江下游,東經(jīng)117°40′—118°44′、北緯30°19′—31°34′,屬亞熱帶濕潤季風(fēng)氣候,雨量充沛,光照充足。年平均氣溫在15~16℃,年均日照時長約2 000 h,年降雨量約為1 200 mm,該區(qū)域主要種植水稻、玉米、高粱、小麥、豆類等糧食作物[8]。
歐州航天局發(fā)射的Sentinel-2衛(wèi)星,是一枚具有多光譜成像儀的遙感衛(wèi)星。Sentinel-2衛(wèi)星在光學(xué)數(shù)據(jù)方面的性能十分優(yōu)異,Sentinel-2遙感數(shù)據(jù)在紅邊范圍擁有3個波段和10、20、60 m 3種分辨率。研究表明,Sentinel-2衛(wèi)星遙感數(shù)據(jù)可以在農(nóng)作物信息提取和農(nóng)作物分類研究等方面發(fā)揮較大的作用,而在農(nóng)作物產(chǎn)量監(jiān)測中,其經(jīng)濟實用性和性能優(yōu)異性會有更優(yōu)的體現(xiàn)[9-13]。
本研究按蕪湖縣水稻種植收獲周期的時間序列(表1)(早稻一般3月上中旬播種,7月下旬收獲;晚稻6月上中旬播種,10月下旬收獲)[14]獲取3月至10月共8個月的覆蓋蕪湖縣地區(qū)的16景坐標(biāo)系統(tǒng)為WGS84,投影方式為UTM的Sentinel-2 Level-1C產(chǎn)品圖像。對獲取的研究區(qū)影像進行目視解譯,將目視解譯的結(jié)果中3/4作為解譯標(biāo)志,1/4用作精度驗證,在目視解譯結(jié)果中,按照樣本在研究區(qū)域均勻分布的原則選取20個樣方,并用轉(zhuǎn)換分離度與Jeffries-Matusita距離對樣方進行可分離性判斷,當(dāng)結(jié)果處于0到2之間時,值越大代表可分離性越好。如表2所示,兩種指數(shù)的檢驗結(jié)果均大于1.85,選取樣本可分離性很好,可用于水稻分離提取研究。
表1 蕪湖縣水稻物候期
表2 訓(xùn)練樣本的可分離性檢驗結(jié)果
采用最大似然法和支持向量機法分別對2019年單一時相研究區(qū)Sentinel-2遙感圖像進行水稻分布信息提取。在分類完成后用聚類方法對2種分類方法所得到的結(jié)果進行處理,以提高分類精度。最后對分類結(jié)果的Kappa系數(shù)、總體度等分類結(jié)果進行比較,得出較適合于水稻信息提取的監(jiān)督分類方法。
支持向量機分類法作為一種基于像素的分類方法,其理論基礎(chǔ)是統(tǒng)計學(xué)。使用非線性函數(shù)將輸入的空間特征數(shù)據(jù)由低維變換至高維,然后在高維的特征空間上再次利用數(shù)學(xué)統(tǒng)計方法得到數(shù)據(jù)的最佳線性分類面,從而實現(xiàn)分類結(jié)果的精度最大化,解決了低維空間數(shù)據(jù)不易被分類的難點。該分類方法是以一定數(shù)量的樣本作為依據(jù)建立模型,使建立的模型既有很高的分類精度又有可以識別的樣本類別廣度,以獲得最佳的分類效果。如圖2所示,分類超平面wTx+b=0不僅可以把所有樣本分開,而且還和最近的樣本點(支持向量)保持一定的函數(shù)距離,該分類超平面比感知機的分類超平面表現(xiàn)更優(yōu),該超平面只有1個[15]。采用支持向量機法結(jié)合單時相影像對樣方進行水稻信息提取,結(jié)果見圖3。
圖2 支持向量機模型
圖3 基于單時相的支持向量機法水稻信息提取
最大似然分類法是一種基于像素的分類方法。它的分類器是一種魯棒性、穩(wěn)定性表現(xiàn)突出的分類器。如圖4所示,它是使遙感影像各個波段數(shù)據(jù)形成正態(tài)分布從而來構(gòu)造出判別分類函數(shù),其基本思想是根據(jù)所選取的訓(xùn)練樣本將樣本中的所有像元以點集的方式在二維或者三維空間中表現(xiàn)出來,然后再將點集當(dāng)中的所有像元數(shù)據(jù)在每個維度空間上以數(shù)軸正態(tài)分布的形式進行表達,最終每一個點集上的每一個維度的像元數(shù)據(jù)都以為正態(tài)分布的形式存在;但是每個以多維正態(tài)分布形式存在的點集都存在各種差異,例如空間大小、空間位置、集約程度等。而最大似然法根據(jù)這種差異通過貝葉斯公式計算得出每一個像元數(shù)據(jù)歸依到各個類別中的概率大小,構(gòu)造一個概率分布模型,再將像元數(shù)據(jù)分類到概率最大的類別中,以此完成分類[16]。采用最大似然法結(jié)合單時相影像對樣方進行水稻信息提取,結(jié)果見圖5。
圖4 最大似然法模型
圖5 基于單時相的最大似然法水稻信息提取
采用最大似然法結(jié)合目視解譯并利用多時相影像(6月11日和9月9日的Sentine-2遙感影像)將訓(xùn)練樣本分為水域、綠地、耕地及建筑用地,如圖6所示,再根據(jù)相關(guān)農(nóng)作知識提取研究區(qū)水稻面積。由于6月11日時晚稻還未插秧,部分水稻用地在遙感圖像上顯示為水域,結(jié)合6月11日和9月19日時序影像分析,6月11日遙感影像分類為水域,同時9月19日分類為綠地的樣本最終分類為水稻用地;6月11日遙感影像分類為水域,同時9月19日分類為水域的樣本最終分類為非水稻用地(魚塘、水渠等);6月11日遙感影像分類為綠地,同時9月19日分類為水域的樣本最終分類為水稻用地。為增加非水稻用地水域與水稻用地水域的對比效果,特選取研究區(qū)2的水域(經(jīng)實地觀察多為魚塘)與研究區(qū)1的水域(多為水稻用地)作對比分類試驗。
圖6 2019年6月11日(上)至9月19日(下)研究區(qū)土地類型變化
NDVI值又稱歸一化植被指數(shù),該植被指數(shù)的特征是具有周期變化性,本研究選取研究區(qū)的歸一化植被指數(shù)變化序列,利用該研究區(qū)的多時相遙感影像數(shù)據(jù)處理,然后利用水稻的周期演變同其他作物的周期演變之間差異作為區(qū)分指標(biāo)將水稻信息進行提取,公式如下所示:
式中,IR是紅外波段像素值,R是紅光波段像素值。
利用NDVI對選取好的樣方進行提取處理,提取出水稻、玉米、小麥在其發(fā)育過程中NDVI值,然后繪制3種農(nóng)作物的月平均值隨月份變化而變化的折線圖。如圖7所示,3月至6月小麥的NDVI值遞增曲線斜率最大,而水稻次之,玉米的斜率最??;同時小麥的斜率轉(zhuǎn)折點出現(xiàn)在6月,水稻的斜率轉(zhuǎn)折點出現(xiàn)在7月,玉米的斜率轉(zhuǎn)折點出現(xiàn)在8月,通過轉(zhuǎn)折點出現(xiàn)的時間將3者區(qū)分。
NDVI對于照明與觀測非常敏感,在水稻生長過程的前期,會過高估算水稻所占百分比;在水稻生長過程的后期,會過低估算水稻所占百分比。
為了提高提取水稻分布信息的精度,本研究使用RVI和NDGI輔助NDVI進行組合對水稻分布信息進行提取。
RVI又稱比值植被指數(shù),對于含葉綠素較多的農(nóng)作物的變化十分靈敏,可用作綠色植被提取分類的參考指數(shù),其公式如下所示:
式中,R是紅色帶反射率數(shù)據(jù),NIR是近紅外帶反射率數(shù)據(jù)。
NDGI又稱歸一化差異綠度指數(shù),可以用于檢驗各種農(nóng)作物的不同時期的生長狀態(tài),其公式如下所示:
式中,G是綠色帶反射率數(shù)據(jù)。
通過對選取好的樣方遙感數(shù)據(jù)進行處理,得到在水稻的隨時間序列變化過程中RVI與NDVI3月到10月的每半個月份的平均值,將該值用來代表水稻在各個月份的植被指數(shù)值,獲得植被指數(shù)在3月到10月間變化指數(shù)大小。該指數(shù)變化折線圖如圖8所示。
圖8 水稻的3種植被指數(shù)時序變化
由圖8可以看出,在3月到10月水稻生長周期內(nèi),6月時水稻NDVI和NDGI的斜率轉(zhuǎn)折點都由正轉(zhuǎn)負,數(shù)值變化特征結(jié)合決策樹分類可以提升水稻的分布信息提取精度。水稻RVI值的曲線斜率出現(xiàn)在6月,6月之前為負,之后為正。如果NDVI和NDGI曲線斜率轉(zhuǎn)折點出現(xiàn)在6月,6月之前曲線斜率為正,6月之后曲線斜率為負,且NDVI的曲線斜率絕對值大于NDGI的曲線斜率;并且RVI的曲線斜率轉(zhuǎn)折點也出現(xiàn)在6月,且6月之前為負,之后為正。將3種指數(shù)特征的作物作為水稻進行提取,具體分類流程如圖9所示。通過對水稻的植被指數(shù)曲線斜率變化分析,得出符合要求的作物大多分布在研究區(qū)的西部,符合實地調(diào)研結(jié)果。
圖9 基于3種植被指數(shù)時序影像的分類流程
在運用不同的分類方法進行分類后,需要對基于分類方法建立分類模型的分類結(jié)果進行比較,評價出分類結(jié)果較好的方法,從而研究出高精度提取水稻種植信息的分類模型。本研究采用基于像素的混淆矩陣進行分類精度評價,該方法是目前普遍使用的分類精度檢驗方法?;煜仃囋趫D像精度評價中,主要用于對分類結(jié)果和實際值進行比較分析,在一個混淆矩陣里面把分類結(jié)果的精度顯示出來[17,18]。在混淆矩陣中,Kappa系數(shù)與總體分類精度可以對分類結(jié)果的整體分類效果進行評價,而生產(chǎn)者精度與用戶精度可以對單個類別的分類結(jié)果進行評價??傮w分類精度表示的是在所選的所有樣本最終分類結(jié)果中分類無誤的類別總數(shù)與所選的全部樣點總數(shù)的比值,反映最終分類結(jié)果的總體精確度。Kappa系數(shù)表示的是最終提取地物的類別與實際類別的相互匹配準確度,最后結(jié)果值在0到1之間,當(dāng)最終數(shù)值大于0.8時表明結(jié)果與實際一致性較高[19]。
基于單時相遙感影像的情況下支持向量機法和最大似然法對水稻種植區(qū)域提取的精度如表3所示。由表3可知,最大似然法分類結(jié)果的總體分類精度達到89.73%,其Kappa系數(shù)達到0.797。分類總精度比支持向量機法的分類總精度83.67%,增加6.06個百分點,Kappa系數(shù)比支持向量機法的Kappa系數(shù)0.640增加0.157,采用最大似然法提取水稻精度更高。
表3 基于像素方法的水稻面積提取精度
對研究區(qū)進行基于像素的2種不同分類方法的水稻面積提取,得出以下結(jié)論:①最大似然法和支持向量機法結(jié)合單時相影像提取水稻的結(jié)果總體精度都低于90.00%,其主要原因是蕪湖市屬亞熱帶濕潤季風(fēng)氣候,7—9月研究區(qū)降雨量較大,影響遙感影像質(zhì)量進而影響了提取精度;②通過實地考察得知,6月上旬和9月上旬,研究區(qū)域早稻和晚稻都分布陸續(xù)開始被收割,研究區(qū)南部的水稻種植區(qū)域中有大面積的旱地摻雜其中,所以導(dǎo)致最終的分類提取結(jié)果多為分離度較高的水稻種植地塊,使得水稻提取的精度有所降低;③對中低緯度雙季稻地區(qū)進行水稻面積提取時,由于該研究區(qū)域旱地與水稻交錯在一起,水稻種植區(qū)域分散度較高[20]。而最大似然法比起支持向量機法可以識別單獨像元,更適合提取破碎地塊信息[21],在該研究區(qū),最大似然法分類效果優(yōu)于支持向量機法。
利用最大似然法分別結(jié)合單時相影像數(shù)據(jù)和多時相影像數(shù)據(jù)對研究區(qū)的水稻面積信息進行提取,2種分類方法下各自分類的相關(guān)精度如表4所示。由表4可知,多時相分類結(jié)果的總體分類精度達到91.23%,Kappa系數(shù)達到0.817。分類總精度比單時相分類的總體分類精度89.73%,增加1.50個百分點,Kappa系數(shù)比單時相分類的Kappa系數(shù)0.796,增加0.021,基于多時相影像的分類方法提取水稻精度更佳。
表4 基于多時相影像的水稻面積提取精度
基于多時相影像數(shù)據(jù)的分類提取方法總體分類精度為91.23%,Kappa系數(shù)為0.817,均高于基于單時相影像數(shù)據(jù)的分類提取方法,是因為基于多時相影像數(shù)據(jù)的分類方法所處理的影像數(shù)量更多且具有時間序列特性、地物情況具有復(fù)雜性(變化和未變化的地物相互混雜)、數(shù)據(jù)異質(zhì)性更強(成像條件不同所帶來的數(shù)據(jù)差異)。對地物和相關(guān)現(xiàn)象進行長期跟蹤觀測從而更加精確地識別研究區(qū)土地利用類型的狀態(tài)變化,進而降低單一時相影像數(shù)據(jù)導(dǎo)致分類提取時的錯分誤差和漏分誤差,提高分類提取水稻的精度。
將根據(jù)影像計算出6類植被指數(shù)及其組合作為分類指標(biāo),結(jié)合多時相影像分別采用2類分類方法對研究區(qū)水稻信息進行提取,得出每種植被指數(shù)在2類分類方法下各自的分類精度,如圖10、圖11所示。
圖1 研究區(qū)區(qū)位
圖10 6種植被指數(shù)及其組合在2種分類方法下的總精度
圖11 6種植被指數(shù)及其組合在2種分類方法下的Kappa系數(shù)
NDVI、RVI2個植被指數(shù)在2個分類方法中總精度和Kappa系數(shù)最高的都是采用最大似然法,分類的總體精度都超過90.0%,其中分類精度最高的為NDVI,分類總精度達到94.0%,Kappa系數(shù)為0.870。NDGI分類的總精度和Kappa系數(shù)在采用支持向量機分類方法時最高,分類的總精度為91.9%,Kappa系數(shù)是0.852。在采用單一植被指數(shù)作為分類特征時,最大似然法在以NDVI、RVI2個植被指數(shù)為分類指標(biāo)時比使用支持向量機法有較好的分類效果,而支持向量機法在以NDGI為分類指標(biāo)時比使用最大似然法的分類精度更高。NDVI分類的總精度為最高,分類效果較好的是采用RVI進行分類。而NDGI整體分類精度較差,無法較有效地分類出水稻。
另外對NDVI、RVI、NDGI3種植被指數(shù)的不同組合形式進行精度評價得到以下結(jié)果:3種植被指數(shù)組合都是采用最大似然法時總體分類精度和Kappa系數(shù)更高;當(dāng)NDVI和RVI或NDGI任意一種植被指數(shù)進行組合時,總體分類精度都會隨之提升,其中NDVI和RVI的組合要優(yōu)于NDVI和NDGI的組合;當(dāng)3種植被指數(shù)組合使用時,總體分類精度和Kappa系數(shù)都達到最高。
該組合方式結(jié)合NDVI明顯的時間規(guī)律性,RVI對綠色植被的敏感度和NDGI對不同植被活力的檢驗等植被指數(shù)特性,利用植被指數(shù)值隨時間變化的曲線斜率和值域提高水稻信息提取的精度[22,23]。如圖12所示為利用NDVI、RVI、NDGI并結(jié)合最大似然法對水稻進行提取的結(jié)果。蕪湖縣農(nóng)作物種植區(qū)的水稻分布分散度較高,在農(nóng)作物種植區(qū)的西部有大量水稻種植,而種植區(qū)東北部主要為魚塘,南部為旱田,為蕪湖縣谷業(yè)和漁業(yè)分布區(qū)。
圖12 研究區(qū)水稻種植區(qū)域分布
本研究對蕪湖市蕪湖縣南部面積約為118.8 km2的水稻種植區(qū)水稻信息進行提取。使用Sentinel-2衛(wèi)星為數(shù)據(jù)源,利用基于像素分類的最大似然法、支持向量機法和3種植被指數(shù)NDVI、NDGI、RVI及其組合并結(jié)合多時間序列影像數(shù)據(jù)提取研究區(qū)水稻種植信息,然后采用混淆矩陣對分類結(jié)果進行精度評價,得到適合于此研究區(qū)的最優(yōu)提取方案。①在對中低緯度雙季稻地區(qū)進行水稻面積提取時,基于像素的分類方法當(dāng)中,最大似然法優(yōu)于支持向量機法。②在對水稻信息進行提取時,利用多時相影像數(shù)據(jù)通過對地物和相關(guān)現(xiàn)象進行長期跟蹤觀測從而更加精確識別研究區(qū)土地利用類型的狀態(tài)變化,進而降低單一時相影像數(shù)據(jù)導(dǎo)致的分類提取時的錯分誤差和漏分誤差,提高分類提取水稻的精度。③在相同情況下,NDVI較RVI,DGI更適合于進行水稻信息提取。同時,不同植被指數(shù)相結(jié)合使用時,精度更優(yōu)。