王利軍 郭 燕 賀 佳 王利民 張喜旺 劉 婷
(1.河南省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)經(jīng)濟(jì)與信息研究所, 鄭州 450002; 2.中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所, 北京 100081;3.河南大學(xué)環(huán)境與規(guī)劃學(xué)院, 開(kāi)封 475004)
空間遙感技術(shù)的不斷發(fā)展,為快速、準(zhǔn)確獲取農(nóng)作物空間分布信息提供了新的技術(shù)手段。目前,多傳感器、多時(shí)相和多空間分辨率的遙感數(shù)據(jù)已廣泛應(yīng)用于農(nóng)作物空間信息提取,在理論、技術(shù)和實(shí)踐方面都取得了長(zhǎng)足的進(jìn)展[1-3]。然而,由于秋季作物種植結(jié)構(gòu)復(fù)雜、生育期較短,中高空間分辨率遙感數(shù)據(jù)受到回訪周期和云雨天氣的影響,往往難以獲得“最佳物候期”的時(shí)序遙感影像數(shù)據(jù)。這使得秋季復(fù)雜的種植空間分布信息提取成為農(nóng)業(yè)遙感專(zhuān)題信息提取的難題。研究表明,植被指數(shù)和紅邊光譜數(shù)據(jù)與表征作物生長(zhǎng)狀況的農(nóng)學(xué)參數(shù)之間存在較好的相關(guān)關(guān)系[4]。針對(duì)秋季玉米、花生、大豆、水稻等農(nóng)作物生育期接近、光譜特征相似且較難區(qū)分等問(wèn)題,畢愷藝等[5]基于Sentinel-2A時(shí)序數(shù)據(jù)的歸一化植被指數(shù)(Normalized difference vegetation index,NDVI)時(shí)序曲線特征和光譜特征,利用面向?qū)ο鬀Q策樹(shù)的方法識(shí)別了林地和農(nóng)作物,總體精度和Kappa系數(shù)分別為89.7%和0.87。劉佳等[6]利用長(zhǎng)時(shí)序中空間分辨率遙感影像及其波譜特征,有效識(shí)別了春玉米、夏玉米、棉花和小宗作物(主要包括紅薯、大豆和花生等),分類(lèi)總體精度達(dá)90.9%。賈樹(shù)海等[7]通過(guò)分析3個(gè)不同時(shí)期農(nóng)作物物候特征差異和影像NDVI特征值,提取了縣域尺度下花生空間分布信息。黃健熙等[8]基于多時(shí)相GF-1 WFV影像,利用4個(gè)不同植被指數(shù)特征參數(shù)和實(shí)地樣本點(diǎn),采用隨機(jī)森林分類(lèi)算法提取縣域尺度下玉米和大豆的空間分布,總體精度和Kappa系數(shù)分別為84.8%和0.774。以上研究都不同程度提高了作物識(shí)別精度,但基于構(gòu)建作物特定發(fā)育期生長(zhǎng)特征光譜曲線、利用單時(shí)相遙感影像進(jìn)行秋季多種作物空間分布信息提取方面的研究相對(duì)較少。
Sentinel-2A、RapidEye和Worldview-2等衛(wèi)星通過(guò)增加多光譜譜段提高遙感數(shù)據(jù)應(yīng)用能力,尤其是其紅邊波段數(shù)據(jù)為農(nóng)作物遙感監(jiān)測(cè)提供了數(shù)據(jù)支持[4]。Sentinel-2A衛(wèi)星覆蓋13個(gè)光譜波段,能夠提供10 d重訪周期和最高10 m空間分辨率的多光譜數(shù)據(jù)。本文以河南省濮陽(yáng)縣為研究區(qū),針對(duì)秋季農(nóng)作物,主要包括玉米、花生、大豆、水稻和蔬菜等小宗作物,通過(guò)構(gòu)建、分析NDVI和紅邊歸一化植被指數(shù)(Red edge normalized difference vegetation index,RENDVI),在確定植被指數(shù)分割閾值的基礎(chǔ)上,采用決策樹(shù)和SVM相結(jié)合的方法,對(duì)秋季主要作物空間分布信息進(jìn)行提取,并結(jié)合地面樣方和樣本點(diǎn)數(shù)據(jù),與ML和SVM分類(lèi)結(jié)果進(jìn)行對(duì)比分析,以期提高農(nóng)作物分類(lèi)提取精度。
濮陽(yáng)縣位于河南省東北部(114°31′~115°15′E,35°12′~35°30′N(xiāo)),地勢(shì)平坦,屬溫帶大陸性季風(fēng)氣候,年平均氣溫13.4℃,年均降水量626 mm,年平均無(wú)霜期205 d??h域面積1 382 km2,2016年濮陽(yáng)市統(tǒng)計(jì)年鑒顯示該縣耕地面積為97 791.90 hm2。以小麥、玉米一年兩熟的作物輪作模式為主[6],其中玉米、花生、大豆和水稻4種作物生育期見(jiàn)表1。一般秋季作物于6月上中旬播種,8月進(jìn)入生長(zhǎng)旺期,9月中下旬收獲,總生長(zhǎng)期約4個(gè)月。玉米、花生、大豆和水稻分別在抽雄期、下針期、結(jié)莢期和孕穗期開(kāi)始有較高的植被覆蓋度。
Sentinel-2A衛(wèi)星數(shù)據(jù)主要用于農(nóng)業(yè)、森林監(jiān)測(cè)、土地使用變遷、土地覆蓋變化監(jiān)測(cè)等方面[5],波段信息如表2所示。其中Band 5和Band 6用于獲取紅邊位置,Band 7用于反演葉面積指數(shù)(Leaf area index,LAI),Band 8A是LAI、葉綠素和生物量敏感的波段[4]。
表1 主要農(nóng)作物生育期Tab.1 Major crop development periods
表2 Sentinel-2A波段信息Tab.2 Band information of Sentinel-2A
圖2 研究區(qū)樣方分布Fig.2 Distributions of ground samples in study area
結(jié)合秋季作物主要生育期及其地表覆蓋度,為降低地表土壤反射光譜對(duì)農(nóng)作物面積提取的影響,選取2017年8月6日質(zhì)量好且完全覆蓋研究區(qū)的1景影像(20170806_n0205_r075_t50sle_albers)。并通過(guò)網(wǎng)站(http:∥step.esa.int/main/download/)下載Sentinel-2 Toolbox軟件,對(duì)影像進(jìn)行重采樣和格式轉(zhuǎn)存,生成有10個(gè)波段(不包括Band 1、Band 9和Band 10)且空間分辨率為10 m的ENVI格式(*.img)的影像數(shù)據(jù),并基于研究區(qū)基礎(chǔ)影像進(jìn)行幾何校正和大氣校正等預(yù)處理,經(jīng)矢量邊界裁切后影像如圖1所示,ArcMap圖層屬性中標(biāo)準(zhǔn)差設(shè)為1.5。
圖1 研究區(qū)遙感影像(R/G/B:7/9/3)Fig.1 S-2A imagery of study area(R/G/B: 7/9/3)
首先將研究區(qū)制作成為2 km×2 km的規(guī)則格網(wǎng),刪除無(wú)覆蓋研究區(qū)格網(wǎng)后獲得411個(gè)格網(wǎng),然后基于格網(wǎng)總體均勻分布的原則選取23個(gè)約1 km×1 km的地面調(diào)查樣方,針對(duì)黃河沿岸復(fù)雜作物種植結(jié)構(gòu)需增設(shè)樣方,其分布如圖2a所示。樣方數(shù)據(jù)均采用Trimble GeoXT差分GPS實(shí)地測(cè)量標(biāo)注,調(diào)繪結(jié)果基于Sentinel-2A影像進(jìn)行幾何校正,誤差控制在0.5個(gè)像元內(nèi)。經(jīng)實(shí)測(cè)23個(gè)樣方總面積為2 330 hm2,其中玉米、花生、大豆、水稻、小宗作物面積分別為987.6、193.5、460.1、157.8、17.3 hm2,分別占樣方總面積的42.4%、8.3%、19.7%、6.8%和0.74%,其余為水體、園地、建設(shè)用地等類(lèi)型。圖2b和圖2c為樣方影像和作物分布類(lèi)型。在樣方調(diào)繪過(guò)程中利用Geatc F110平板計(jì)算機(jī)采集各作物類(lèi)型樣本點(diǎn),作為選擇訓(xùn)練樣本參考、植被指數(shù)變化分析及分類(lèi)結(jié)果驗(yàn)證數(shù)據(jù),共獲取實(shí)地樣本點(diǎn)274個(gè),其中玉米、大豆、花生、水稻、小宗作物(蔬菜、藥材、紅薯等)各81、67、59、15、52個(gè)。
在影像數(shù)據(jù)預(yù)處理后,首先構(gòu)建NDVI,根據(jù)地面樣方和實(shí)地樣本點(diǎn)數(shù)據(jù)確定試驗(yàn)區(qū)主要作物和小宗作物的分割閾值,通過(guò)構(gòu)建決策樹(shù)和波段計(jì)算工具進(jìn)行區(qū)域分類(lèi)。然后,對(duì)主要作物區(qū)域數(shù)據(jù)進(jìn)行RENDVI計(jì)算,根據(jù)地面樣方和樣本點(diǎn)進(jìn)行植被指數(shù)分析,采用決策樹(shù)和波段計(jì)算工具將影像分為玉米/水稻、花生/大豆種植區(qū),并根據(jù)作物訓(xùn)練樣本對(duì)玉米/水稻、花生/大豆采用SVM進(jìn)一步分類(lèi),得到研究區(qū)秋季主要作物分類(lèi)結(jié)果,并與傳統(tǒng)分類(lèi)方法的分類(lèi)結(jié)果進(jìn)行分析和精度評(píng)價(jià),如圖3所示。
圖3 研究流程圖Fig.3 Flow chart of study
植被指數(shù)是利用遙感影像不同波段組合而成的光譜特性,能夠反映不同植被類(lèi)型的物候差異和光譜特征,將分類(lèi)精度提高到作物層次,NDVI和RENDVI是農(nóng)作物監(jiān)測(cè)中應(yīng)用較為廣泛的光譜參數(shù)[8-9]。NDVI和RENDVI計(jì)算公式分別為
(1)
(2)
式中ρNIR、ρRED——對(duì)應(yīng)表2中的近紅外Band 8和紅光Band 4的反射率
ρ665、ρ705——對(duì)應(yīng)表2中的紅光Band 4和植被紅邊Band 5的反射率
在執(zhí)行傳統(tǒng)監(jiān)督分類(lèi)時(shí),一般每種地物類(lèi)別所選取的訓(xùn)練樣本數(shù)量大致為30n(其中n為影像波段數(shù))[10],經(jīng)實(shí)地調(diào)查,將試驗(yàn)區(qū)的分類(lèi)系統(tǒng)確定為玉米、花生、大豆、水稻、小宗作物、林地、建筑(房屋、道路、休閑耕地)和水體8類(lèi),因此,訓(xùn)練樣本人工目視選擇工作量較大,而支持向量機(jī)因其本身具有良好的泛化能力,可減少訓(xùn)練樣本點(diǎn)數(shù)量的選擇。利用RENDVI將作物分為玉米/水稻、花生/大豆種植區(qū)影像數(shù)據(jù)后,根據(jù)作物光譜特征和紋理特征等信息,單獨(dú)選取了用于訓(xùn)練的389個(gè)樣本點(diǎn),其中玉米、大豆、花生、水稻各113、109、92、75個(gè)。
ML和SVM作為傳統(tǒng)監(jiān)督分類(lèi)方法,在作物種植結(jié)構(gòu)提取、森林面積監(jiān)測(cè)、土地利用變化監(jiān)測(cè)等領(lǐng)域得到廣泛應(yīng)用和評(píng)價(jià)[11-16],支持向量機(jī)典型方法是模糊支持向量機(jī),通過(guò)對(duì)每個(gè)樣本引入模糊隸屬度參數(shù)來(lái)實(shí)現(xiàn)分類(lèi);決策樹(shù)分類(lèi)基于遙感影像等空間數(shù)據(jù),采用自頂而下的遞歸方式,通過(guò)尋找分類(lèi)能力最優(yōu)的屬性變量,把數(shù)據(jù)依次分為多個(gè)子集,迭代直至所有子集僅包含同一類(lèi)型或子集包含的樣本數(shù)小于某閾值[17-18]。多年來(lái),國(guó)內(nèi)外專(zhuān)家學(xué)者經(jīng)過(guò)與傳統(tǒng)分類(lèi)方法對(duì)比研究認(rèn)為,決策樹(shù)分類(lèi)方法具有分類(lèi)運(yùn)算速度快、分類(lèi)精度高的優(yōu)勢(shì),結(jié)合植被指數(shù)、紋理特征等其他多種特征變量能獲得較好的分類(lèi)結(jié)果[19-20]。本研究中采用決策樹(shù)與支持向量機(jī)相結(jié)合的方法進(jìn)行秋季主要作物空間分布信息的提取。在分析作物物候特征和光譜特征基礎(chǔ)上,通過(guò)構(gòu)建不同植被指數(shù)分割閾值的分類(lèi)決策樹(shù),逐層分類(lèi)提取不同地物信息;同時(shí),利用模糊支持向量機(jī)原理在ENVI中將主要作物進(jìn)一步分類(lèi)提取,獲得研究區(qū)主要種植作物空間分布數(shù)據(jù)。
基于地面實(shí)測(cè)數(shù)據(jù)驗(yàn)證是精度驗(yàn)證的主要手段之一,也是說(shuō)明遙感分類(lèi)器和分類(lèi)結(jié)果準(zhǔn)確程度的指標(biāo)之一[6,11]。本文基于地面樣方和實(shí)地樣本點(diǎn)數(shù)據(jù),以混淆矩陣、Kappa系數(shù)、總體分類(lèi)精度、制圖精度和用戶精度5種方式表達(dá)。其中混淆矩陣是一個(gè)k×k的矩陣,是計(jì)算總體分類(lèi)精度和Kappa系數(shù)的基礎(chǔ),總體分類(lèi)精度是指所有被正確分類(lèi)的像元總和與總像元數(shù)的比例,其算式為
(3)
Kappa系數(shù)計(jì)算公式為[19]
(4)
式中k——類(lèi)別數(shù)
xii——分類(lèi)結(jié)果中第i類(lèi)與參考類(lèi)型數(shù)據(jù)第i類(lèi)所占的組成成分
N——像元總數(shù)
xi+、x+i——混淆矩陣第i行和第i列的元素之和
NDVI和RENDVI數(shù)據(jù)結(jié)果如圖4所示。NDVI二值化后局部數(shù)據(jù)如圖5a所示,基于實(shí)測(cè)274個(gè)樣本點(diǎn)數(shù)據(jù),結(jié)合選取23個(gè)樣方中各作物類(lèi)型分布中心位置作為作物類(lèi)型樣本點(diǎn),形成主要作物植被指數(shù)變化范圍(表3)。
圖4 NDVI與RENDVI計(jì)算結(jié)果Fig.4 Results of NDVI and RENDVI calculation
圖5 植被指數(shù)與局部影像計(jì)算結(jié)果Fig.5 Local image and results of NDVI and RENDVI
表3 主要作物植被指數(shù)變化特征Tab.3 Characteristics of NDVI and RENDVI for major crop types
玉米、水稻、花生和大豆的NDVI在該時(shí)期較為接近,因此,將研究區(qū)初步分為主要作物、非作物和小宗作物種植區(qū)域;將主要作物種植區(qū)域與研究區(qū)遙感影像進(jìn)行波段計(jì)算,獲得主要作物種植區(qū)域影像數(shù)據(jù),其局部放大結(jié)果如圖5b所示,以此為數(shù)據(jù)源計(jì)算RENDVI,并結(jié)合作物樣點(diǎn)調(diào)查數(shù)據(jù)發(fā)現(xiàn),該植被指數(shù)能有效地將玉米/水稻、花生/大豆區(qū)分為兩類(lèi),其局部結(jié)果如圖5c所以,顏色較深的為玉米和水稻,顏色較淺區(qū)域?yàn)榛ㄉ痛蠖埂?/p>
圖6 構(gòu)建基于植被指數(shù)閾值分割的分類(lèi)決策樹(shù)Fig.6 Building of decision tree based on threshold segmentation of vegetation index features
根據(jù)以上數(shù)據(jù)結(jié)果,當(dāng)NDVI分布范圍在0.480~0.724之間時(shí)為作物種植區(qū),其余為非作物種植區(qū),當(dāng)NDVI分布范圍在0.480~0.628之間時(shí),為小宗作物種植區(qū)域;當(dāng)采用紅邊植被指數(shù)對(duì)主要作物區(qū)進(jìn)行玉米/水稻、大豆/花生提取時(shí),由于閾值范圍之間有差值,因此需要將閾值進(jìn)行調(diào)整,保障二者閾值之間無(wú)差值且能達(dá)到全作物種植區(qū)完全覆蓋,分類(lèi)結(jié)果采用樣方數(shù)據(jù)和實(shí)地樣本點(diǎn)對(duì)分類(lèi)結(jié)果進(jìn)行驗(yàn)證,當(dāng)精度驗(yàn)證結(jié)果較低時(shí),重新調(diào)整RENDVI的閾值進(jìn)行分類(lèi),當(dāng)已基本滿足分類(lèi)要求或精度改善不大時(shí)停止調(diào)整,接受當(dāng)前分類(lèi)結(jié)果,其分類(lèi)過(guò)程決策樹(shù)構(gòu)建如圖6所示。在主要作物種植區(qū)域,利用RENDVI通過(guò)閾值調(diào)整達(dá)到最優(yōu)分類(lèi)效果,經(jīng)試驗(yàn)獲得分割閾值為0.137。
采用最大似然法、支持向量機(jī)法和決策樹(shù)+支持向量機(jī)法分別提取了研究區(qū)2017年8月玉米、水稻、大豆、花生和小宗作物,其分類(lèi)總面積分別為96 770.18、95 936.88、95 240.58 hm2。采用23個(gè)地面樣方和獲取的274個(gè)地面樣本點(diǎn)進(jìn)行作物分類(lèi)精度驗(yàn)證,各分類(lèi)方法提取秋季作物面積比例及精度驗(yàn)證對(duì)比數(shù)據(jù)見(jiàn)表4,其中用戶精度和制圖精度各行依次對(duì)應(yīng)最大似然法、支持向量機(jī)法和決策樹(shù)+支持向量機(jī)法。
由表4可以看出,玉米識(shí)別精度較高,小宗作物由于種植類(lèi)型復(fù)雜且面積較小,識(shí)別精度較低。因此,采用決策樹(shù)和支持向量機(jī)的方法可以獲得較高的分類(lèi)精度,其總體精度為92.3%,Kappa系數(shù)達(dá)0.886,用戶精度和制圖精度均達(dá)81.2%和84.7%。采用同一組訓(xùn)練樣本進(jìn)行分類(lèi),由圖7紅色框選區(qū)域可以看出,最大似然分類(lèi)法在作物分類(lèi)時(shí)能較好地提取線性地物,但“椒鹽”現(xiàn)象問(wèn)題較為明顯,尤其面積較大分類(lèi)圖斑周邊會(huì)出現(xiàn)大量細(xì)碎圖斑,且細(xì)碎圖斑屬性需要進(jìn)一步人工處理,后期處理工作量較大,支持向量機(jī)分類(lèi)法可以有效地解決分類(lèi)中細(xì)碎圖斑的問(wèn)題,但存在線性地物和小地塊不同作物分類(lèi)提取不完全等問(wèn)題,而引入植被指數(shù),采用決策樹(shù)與支持向量機(jī)相結(jié)合的分類(lèi)方法則能較好地解決以上問(wèn)題,作物提取結(jié)果和分類(lèi)精度較好,能滿足區(qū)域作物分類(lèi)提取研究的需要。
表4 秋季主要作物分類(lèi)結(jié)果比例和精度對(duì)比Tab.4 Classification result and precision comparison of major crop types
圖7 不同方法分類(lèi)結(jié)果局部數(shù)據(jù)Fig.7 Comparisons of local results of different classification methods
采用決策樹(shù)和支持向量機(jī)相結(jié)合的方法提取研究區(qū)秋季主要作物空間分布如圖8所示,該區(qū)域玉米種植面積分布最為廣泛,占秋季作物總種植面積的67.1%,沿黃河一帶種植分布較少;大豆種植面積占16.0%,主要分布于東部和東南部沿黃河區(qū)域,西部與內(nèi)黃縣、滑縣接壤處則有少量分布;水稻種植面積占3.7%,種植較為集中,主要分布于徐鎮(zhèn)鎮(zhèn)和渠村鄉(xiāng),梨園鄉(xiāng)、習(xí)城鄉(xiāng)和海通鄉(xiāng)則有少量分布;花生則主要分布于習(xí)城鄉(xiāng)和中原路街道辦事處,與大豆混種情況較多,中部和北部也有少量分布,占12.5%;小宗作物主要有蔬菜、紅薯、藥材等,在全區(qū)種植分布較少,文留鎮(zhèn)分布較多,占0.7%??傮w來(lái)看,植被紅邊Band 5在植被分類(lèi)中效果最優(yōu),各類(lèi)型農(nóng)作物的空間分布格局宏觀上與當(dāng)?shù)刈魑锓植家恢?,分?lèi)結(jié)果與實(shí)地調(diào)查結(jié)果較為符合,說(shuō)明采用決策樹(shù)和支持向量機(jī)相結(jié)合的方法對(duì)Sentinel-2A影像進(jìn)行農(nóng)作物提取具有一定的區(qū)域應(yīng)用價(jià)值。
圖8 研究區(qū)主要秋季作物分類(lèi)結(jié)果Fig.8 Classification results of major crop types in study area
(1)決策樹(shù)和支持向量機(jī)相結(jié)合的分類(lèi)方法能有效解決線性地物和小地塊不同作物分類(lèi)提取不完全以及“椒鹽”現(xiàn)象等問(wèn)題,在準(zhǔn)確提取大宗作物的同時(shí),對(duì)小宗作物也有一定的區(qū)分能力,作物面積提取總體精度較高,驗(yàn)證了基于Sentinel-2A單時(shí)相遙感影像進(jìn)行復(fù)雜秋季作物面積提取的可行性。
(2)NDVI和RENDVI的引入可以提高單時(shí)相遙感影像對(duì)復(fù)雜作物分類(lèi)識(shí)別能力,在提高遙感影像分類(lèi)精度的同時(shí),減少了訓(xùn)練樣本選取數(shù)量及其對(duì)作物分類(lèi)精度的影響。作物分類(lèi)提取總體精度和Kappa系數(shù)分別達(dá)92.3%和0.886,優(yōu)于最大似然法和支持向量機(jī)法。