• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于R語言的作物分類研究

    2022-07-28 12:59:54刁雨晴冉谷林查元源
    節(jié)水灌溉 2022年7期
    關(guān)鍵詞:植被指數(shù)決策樹作物

    刁雨晴,冉谷林,查元源

    (武漢大學(xué)水資源與水電工程科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,武漢 430072)

    0 引 言

    灌區(qū)的農(nóng)業(yè)生產(chǎn)規(guī)劃情況影響著全國的糧食生產(chǎn),對糧食生產(chǎn)具有關(guān)鍵的意義。作物的空間分布影響著農(nóng)業(yè)生產(chǎn)管理方法以及農(nóng)業(yè)政策的制定,快速、精準(zhǔn)地提取灌區(qū)的作物種植信息對推進(jìn)灌區(qū)生產(chǎn)的合理規(guī)劃及農(nóng)業(yè)現(xiàn)代化具有重要意義。

    遙感是一門高效、便捷的監(jiān)測技術(shù),其檢測范圍廣,信息多元。精準(zhǔn)農(nóng)業(yè)是農(nóng)業(yè)發(fā)展的趨勢,信息采集是發(fā)展精準(zhǔn)農(nóng)業(yè)的基礎(chǔ),將農(nóng)業(yè)信息監(jiān)測與遙感技術(shù)相結(jié)合,可以快速、準(zhǔn)確的提取到所需的農(nóng)業(yè)信息,目前,遙感技術(shù)已廣泛地應(yīng)用于農(nóng)業(yè)信息的監(jiān)測[1,2]。

    作物分類方法根據(jù)數(shù)據(jù)源的差異又可分為基于單一遙感數(shù)據(jù)的分類和基于多源數(shù)據(jù)融合的分類。單一的遙感數(shù)據(jù)源往往受時(shí)間分辨率或空間分辨率的限制,導(dǎo)致其不能準(zhǔn)確表達(dá)作物的光譜特征,從而導(dǎo)致分類結(jié)果較差?;诙嘣磾?shù)據(jù)融合的分類就是把各種遙感及非遙感數(shù)據(jù)融合為一個(gè)整體的數(shù)據(jù)集,這種方法可以有效地減少由于單一遙感數(shù)據(jù)分辨率引起的“同物異譜”及“同譜異物”的現(xiàn)象,從而提高分類的精度。根據(jù)宋茜[3]等統(tǒng)計(jì),目前農(nóng)作物遙感識別的研究中基于單一數(shù)據(jù)源的分類仍占主導(dǎo),但基于多源遙感數(shù)據(jù)的分類越來越多地得到應(yīng)用,單一數(shù)據(jù)源在單一農(nóng)作物的識別和提取方面應(yīng)用較為普遍,而多源數(shù)據(jù)在農(nóng)作物分類方面的應(yīng)用更多。

    目前,國內(nèi)外已有大量基于遙感的作物分類研究。使用遙感數(shù)據(jù)進(jìn)行作物分類的方法主要分為統(tǒng)計(jì)分析的圖像分類、人工神經(jīng)網(wǎng)絡(luò)分類?;诮y(tǒng)計(jì)分析的遙感圖像分類方法又分為監(jiān)督分類和非監(jiān)督分類。張健康[4]等使用TM/ETM+影像數(shù)據(jù)和MODIS EVI 影像數(shù)據(jù),采用監(jiān)督分類與決策樹分類相結(jié)合的人機(jī)交互解譯方法,建立決策樹識別模型,對黑龍港地區(qū)的主要作物進(jìn)行了遙感解譯;王冬利[5]等使用GF-1 多光譜數(shù)據(jù),以歸一化植被指數(shù)作為冬小麥信息提取的判別指標(biāo),運(yùn)用非監(jiān)督分類結(jié)合多尺度技術(shù)提取了辛集市冬小麥種植信息。張東彥[6]等基于Sentinel-2 數(shù)據(jù),分析內(nèi)蒙古自治區(qū)興安盟扎賚特旗現(xiàn)代農(nóng)業(yè)示范園區(qū)作物的典型植被指數(shù)時(shí)序變化特征,采用隨機(jī)森林等機(jī)器學(xué)習(xí)算法對研究區(qū)主要作物進(jìn)行識別。

    在應(yīng)用遙感數(shù)據(jù)進(jìn)行作物分類的過程中,分析處理遙感數(shù)據(jù)的工具至關(guān)重要。目前的研究多使用arcGIS、ENVI 等軟件,這些軟件具有成熟的數(shù)據(jù)分析功能,但對于遙感數(shù)據(jù)的下載以及批量處理等方面有所欠缺。R語言是近些年來較為流行的一款開源性編程語言,其操作界面簡單,可視化功能完善,語法靈活[7-9]。此外,R 語言中的包具有眾多功能,用戶可根據(jù)需要在R 語言中直接下載安裝包,這些包涵蓋了遙感數(shù)據(jù)的下載、預(yù)處理及計(jì)算分析等各個(gè)方面。由于遙感數(shù)據(jù)的下載、格式等差異,使用集成化軟件處理遙感數(shù)據(jù)需要跨越多個(gè)平臺(tái)操作,步驟繁瑣,效率低下,而R 語言中只需安裝對應(yīng)功能的包并輸入相應(yīng)函數(shù),即可批量完成遙感數(shù)據(jù)的處理過程,這種流程化的處理方式避免了跨平臺(tái)操作,極大地提高了遙感數(shù)據(jù)的處理效率。

    因此,本研究基于R 語言,采用多源遙感數(shù)據(jù)融合技術(shù),提出了基于機(jī)器學(xué)習(xí)的作物分類方法,為實(shí)現(xiàn)多源遙感數(shù)據(jù)融合,提高遙感數(shù)據(jù)處理效率,提升作物分類精度提供了新思路。

    1 研究區(qū)及數(shù)據(jù)

    1.1 研究區(qū)概況

    研究區(qū)漳河灌區(qū)位于湖北省中部,江漢平原西部,地理坐標(biāo)為111°54′~112°42′E,30°23′~31°34′N,總灌區(qū)面積約5 543 km2,地勢西北部高,東南部低,地形主要為平原與丘陵。灌區(qū)屬長江中游亞熱帶季風(fēng)氣候區(qū),日照充足,降水充沛,年平均氣溫15.6~16.3 ℃,年平均降水量804~1 067 mm。農(nóng)作物以水稻、棉花、冬小麥、油菜為主,部分地區(qū)有早稻-晚稻連作、水稻-油菜輪作及小麥-棉花輪作的種植模式。漳河灌區(qū)是湖北省最重要的商品糧食基地之一,具有南方灌區(qū)的特點(diǎn),以該區(qū)域作為研究區(qū)進(jìn)行作物分類具有一定的代表性,見圖1。

    圖1 漳河灌區(qū)區(qū)位圖Fig.1 Zhanghe irrigation area location map

    1.2 數(shù)據(jù)及預(yù)處理

    本研究采用2017年12月至2018年12月的GF-1、Landsat 8 OLI 和Sentinel-2 數(shù)據(jù)。GF-1 衛(wèi)星是我國于2013年4月26日發(fā)射的一顆高分辨率對地觀測衛(wèi)星,其波段1-4分別對應(yīng)可見光波段及近紅外波段,空間分辨率16 m;Landsat 8 衛(wèi)星于2013年2月11日由美國航天航空局成功發(fā)射,衛(wèi)星共有11 個(gè)波段,其中波段2-5為可見光波段及近紅外波段,其空間分辨率均為30 m[10];Sentinel-2 衛(wèi)星于2016年6月23日成功發(fā)射,其共包含12個(gè)波段,波段2-4對應(yīng)可見光波段,波段8對應(yīng)近紅外波段,可見光及近紅外波段的空間分辨率均為10 m。在研究區(qū)內(nèi)根據(jù)云量小于10%篩選,GF-1全年可用數(shù)據(jù)共3期,Landsat 8 覆蓋研究區(qū)需2 景影像,全年可用數(shù)據(jù)共計(jì)5 期,Sentinel-2 數(shù)據(jù)覆蓋研究區(qū)需4-6 景影像,全年可用數(shù)據(jù)共4期。影像數(shù)據(jù)見表1。

    表1 影像列表Tab.1 Image list

    對于研究所選取的遙感數(shù)據(jù)的下載及預(yù)處理,R語言中有大量的處理遙感數(shù)據(jù)的包,這些包涵蓋了遙感數(shù)據(jù)的下載、預(yù)處理及使用、輸出等各個(gè)方面。getSpatialData包是一個(gè)用于下載遙感數(shù)據(jù)的包,研究所選的Landsat 8 數(shù)據(jù)及Sentinel-2 數(shù)據(jù)均可以通過該包進(jìn)行下載,除此之外,getlandsat 包[11]和sen2r 包[12]也可以分別用于下載Landsat 數(shù)據(jù)和Sentinel 數(shù)據(jù)。除了下載,sen2r包還集成了針對Sentinel數(shù)據(jù)的校正、裁剪等各種構(gòu)建完整的Sentinel-2 處理鏈所需的所有步驟,無須任何外部工具。GF-1 數(shù)據(jù)需要在中國資源衛(wèi)星應(yīng)用中心進(jìn)行下載,但其處理可以在R 語言中完成。對于除Sentinel-2 數(shù)據(jù)外的遙感數(shù)據(jù)處理,RSToolbox 包[13]是一個(gè)專門處理遙感數(shù)據(jù)的包,可以對遙感數(shù)據(jù)進(jìn)行導(dǎo)入、預(yù)處理、數(shù)據(jù)分析等多種處理;raster 包[14]是針對柵格對象處理的包,可以用于遙感圖像的拼接、裁剪、分析計(jì)算及保存等多個(gè)功能。使用上述R 包,對研究所選取的數(shù)據(jù)進(jìn)行校正、拼接,將影像數(shù)據(jù)根據(jù)研究區(qū)范圍進(jìn)行裁剪,導(dǎo)出藍(lán)、綠、紅、近紅外波段,并分別按日期保存得到研究所需的遙感數(shù)據(jù)。本研究使用的R 包及其功能匯總見表2。

    表2 研究中使用的R包及其主要功能介紹Tab.2 The R package used in the study and its main functions

    通過查閱相關(guān)文獻(xiàn),訪問農(nóng)業(yè)信息網(wǎng),并結(jié)合Google Earth 高清歷史影像,可以基本掌握各種作物的種植區(qū)域、紋理和色相等特點(diǎn)。油菜廣泛分布于漳河灌區(qū)各個(gè)區(qū)域,其花期在10月下旬,影像上呈亮黃綠色;棉花主要產(chǎn)于馬良鎮(zhèn)附近區(qū)域,其花期在7月下旬,花期時(shí)棉花在影像中呈黃白色;除了油菜與棉花,各種作物都有比較獨(dú)特的特征,可以在影像中較好的分辨各種作物。在Google Earth 上根據(jù)目視解譯選取作物樣本點(diǎn)共3 092 個(gè),按70%作為訓(xùn)練樣本,30%作為測試樣本,見表3。

    表3 地物樣本數(shù)量Tab.3 Number of sample points

    2 研究方法

    以遙感數(shù)據(jù)為基礎(chǔ),分別計(jì)算各日期的歸一化差值植被指數(shù)(Normalized Difference Vegetation Index,NDVI)、增強(qiáng)型植被指數(shù)(Enhanced Vegetation Index,EVI)及比值植被指數(shù)(Ratio Vegetation Index,RVI),并分別構(gòu)造3種植被指數(shù)的時(shí)間序列數(shù)據(jù)。根據(jù)作物樣本點(diǎn)分別提取各作物的時(shí)間序列曲線,以此作為分類依據(jù),分別使用CART 決策樹、隨機(jī)森林(Random Forest,RF)、樸素貝葉斯(Naive Bayes,NB)、支持向量機(jī)(Support Vector Machines,SVM)及K 近鄰(K Nearest Neighbor,KNN)算法進(jìn)行作物分類,并對比分類效果。

    2.1 特征選擇

    在遙感技術(shù)發(fā)展初期,研究人員為了探索植被與遙感光譜波段之間的關(guān)系,將各波段以不同方式組合,分別探究各種組合與植被之間的相關(guān)關(guān)系,在此過程中發(fā)現(xiàn)了植被在紅光波段具有強(qiáng)吸收、在近紅外波段具有高反射的特點(diǎn),提出了植被指數(shù)這一概念。隨著遙感技術(shù)的進(jìn)一步發(fā)展,各種形式的植被指數(shù)被提出,植被指數(shù)逐步被應(yīng)用在環(huán)境、生態(tài)、農(nóng)業(yè)等領(lǐng)域[15]。在作物分類方面,因?yàn)楦髯魑锏纳诓煌?,光譜特征隨作物生育期發(fā)生變化,植被指數(shù)也會(huì)隨之變化,不同作物的植被指數(shù)變化趨勢不同,因此,可以以植被指數(shù)的時(shí)間序列為分類依據(jù)來對作物進(jìn)行分類。

    NDVI是在作物分類中應(yīng)用最廣泛的植被指數(shù),它是近紅外波段與紅光波段反射率之差與二者之和的比值。根據(jù)NDVI值,可以將植被從水體和土地中分類出來,NDVI值越大代表植被覆蓋度越高。但以NDVI時(shí)間序列作為作物分類依據(jù)有兩個(gè)缺陷:一是NDVI缺乏對大氣及土壤背景干擾的處理;二是NDVI在覆蓋度較好的地區(qū)飽和問題比較嚴(yán)重[16]。EVI和RVI可以改進(jìn)NDVI的這兩個(gè)缺陷。針對大氣及土壤背景的干擾問題,EVI引入了藍(lán)光波段,減少了氣溶膠及土壤背景對植被指數(shù)的影響;在高植被覆蓋區(qū),RVI具有比NDVI更高的靈敏度,且RVI可以趨于無窮大,不存在飽和問題。

    基于以上分析,研究選用NDVI、EVI、RVI3 種植被指數(shù)為分類指標(biāo),各指標(biāo)介紹如表4所示。

    表4 植被指數(shù)介紹Tab.4 Calculation formula of vegetation index

    2.2 分類方法

    作物分類就是將各種作物的特征信息作為樣本集,通過分類器從樣本集中尋找到各類作物的共性,從而形成一種統(tǒng)一的分類規(guī)則。將測試樣本代入該分類規(guī)則中即可獲得分類的精度,將新數(shù)據(jù)代入該規(guī)則中即可得到預(yù)測分類結(jié)果。研究使用決策樹、隨機(jī)森林、樸素貝葉斯、支持向量機(jī)及K 近鄰算法5種分類方法進(jìn)行分類。

    決策樹是一種樹形的分類模型,它在樹枝節(jié)點(diǎn)處依據(jù)特征值對數(shù)據(jù)類別進(jìn)行判斷,把數(shù)據(jù)集劃分為兩個(gè)分支,在分支的節(jié)點(diǎn)處再進(jìn)行類別判斷,如此重復(fù)下去,將訓(xùn)練的數(shù)據(jù)集按級依次分割,最終將具有類似特征條件的數(shù)據(jù)劃分在同一個(gè)集合內(nèi),完成對數(shù)據(jù)集的分類。本文選用決策樹中最基礎(chǔ)的CART決策樹進(jìn)行分類。

    隨機(jī)森林算法是一種基于決策樹算法而改進(jìn)的集成學(xué)習(xí)方法,它組合了多棵決策樹,隨機(jī)選擇樣本并對樣本數(shù)據(jù)集進(jìn)行重復(fù)預(yù)測,每棵決策樹都會(huì)有不同的分類結(jié)果,使用多數(shù)投票法對不同分類結(jié)果進(jìn)行投票整合,最終得到對數(shù)據(jù)集分類的結(jié)果。

    樸素貝葉斯分類方法是以貝葉斯定理為基礎(chǔ)理論的分類方法,是貝葉斯分類器中應(yīng)用最為廣泛的模型之一。它計(jì)算給定樣本在各類別上的后驗(yàn)概率,通過概率推理的方法,將樣本判定為最大后驗(yàn)概率所對應(yīng)的類別,從而完成分類[17,18]。

    支持向量機(jī)算法是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的學(xué)習(xí)方法[19,20],該算法采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則,求解一個(gè)能夠劃分訓(xùn)練數(shù)據(jù)類別且能使各類別之間的幾何間隔最大的分類面,通過該分類面實(shí)現(xiàn)數(shù)據(jù)的分類。

    K近鄰算法是一種非參數(shù)的分類技術(shù),它通過在分類樣本集中選取與待分類樣本點(diǎn)最相近的K 個(gè)已知類別的樣本,從而將該待分類樣本點(diǎn)劃分為該類別,達(dá)到分類的效果。該算法簡單且易于實(shí)現(xiàn),但計(jì)算量龐大,分類速度比較慢[21]。

    2.3 精度評價(jià)

    研究使用總體分類精度和Kappa系數(shù)評價(jià)研究區(qū)地物分類效果??傮w分類精度為正確分類的像元數(shù)占分類總像元數(shù)的比例,即混淆矩陣的對角線之和與混淆矩陣之和的比值;Kappa系數(shù)是通過把所有地表真實(shí)分類中的像元總數(shù)乘以混淆矩陣對角線的和,再減去某一類地表真實(shí)像元總數(shù)與該類中被分類像元總數(shù)之積對所有類別求和的結(jié)果,再除以總像元數(shù)的平方減去某一類地表真實(shí)像元總數(shù)與該類中被分類像元總數(shù)之積對所有類別求和的結(jié)果所得到的[22]。

    使用用戶精度(User’s Accuracy,UA)、生產(chǎn)者精度(Producer’s Accuracy,PA)評價(jià)各類地物分類效果。用戶精度表示某一類地物正確分類的像元數(shù)與該類別地物實(shí)際總像元數(shù)的比值;生產(chǎn)者精度表示某一類地物正確分類的像元數(shù)與整個(gè)分類過程中分類到該類別的像元數(shù)的比值[23]。

    3 結(jié)果與分析

    3.1 光譜時(shí)序特征分析

    分別計(jì)算漳河灌區(qū)的NDVI、EVI、RVI,提取各作物樣本點(diǎn)的植被指數(shù)特征值,剔除異常值點(diǎn),并按類別求取均值,得到漳河灌區(qū)主要地物的NDVI、EVI、RVI時(shí)間序列曲線見圖2~圖4。

    圖2 各作物NDVI時(shí)序變化曲線Fig.2 Temporal changes of NDVI of all crops

    圖3 各作物RVI時(shí)序變化曲線Fig.3 Temporal changes of RVI of all crops

    圖4 各作物EVI時(shí)序變化Fig.4 Temporal changes of EVI of all crops

    由圖2~圖4可以看出,建筑用地的NDVI、EVI、RVI值在全年都處于很低的水平,波動(dòng)不大。森林的年內(nèi)變化不大,其NDVI值全年都處于較高水平,均大于0.5,而RVI在高覆蓋區(qū)具有比NDVI更高的靈敏度,因此在夏季茂密的森林地區(qū),RVI值呈上升趨勢,并在8月達(dá)到峰值。

    棉花-小麥輪作區(qū)、早稻-晚稻間作區(qū)、水稻-油菜輪作區(qū)的植被指數(shù)時(shí)序曲線均具有明顯的雙峰特征,符合輪作區(qū)的植被指數(shù)變化規(guī)律。其中,棉花-小麥輪作區(qū)的NDVI曲線的第一個(gè)峰值在3月,對應(yīng)的是小麥的返青及拔節(jié),第一個(gè)谷值在6月,對應(yīng)的是小麥的收獲,第二個(gè)峰值在6月,對應(yīng)的是棉花開花;早稻-晚稻間作區(qū)的NDVI曲線自3月下旬早稻播種后緩慢降低,5月中旬早稻分蘗期NDVI值達(dá)到第一個(gè)谷值,然后NDVI值開始增加,在6月下旬早稻抽穗期達(dá)到第一個(gè)峰值,7月下旬早稻收獲,在8月中旬晚稻分蘗期時(shí)NDVI曲線達(dá)到第二個(gè)谷值,在9月中旬晚稻抽穗期達(dá)到第二個(gè)峰值。水稻-油菜輪作區(qū)的NDVI曲線第一個(gè)峰值是在3月油菜開花期,第二個(gè)峰值在7月中稻抽穗期。各輪作區(qū)的EVI、RVI時(shí)序曲線的趨勢均與NDVI時(shí)序曲線的趨勢基本相同,但RVI的變化幅度更劇烈。

    3.2 分類方案及分類過程

    將地物分類過程根據(jù)分類數(shù)據(jù)分成4 個(gè)方案,方案1、2、3分別以NDVI、RVI、EVI時(shí)間序列為分類數(shù)據(jù),方案4采用按順序合成的3種植被指數(shù)時(shí)間序列為分類數(shù)據(jù)。每種方案均使用CART 決策樹、樸素貝葉斯、支持向量機(jī)、K 近鄰、隨機(jī)森林五種不同的算法為分類方法,對漳河灌區(qū)地物進(jìn)行分類預(yù)測。

    R 語言中有可以完成作物分類及驗(yàn)證的包。例如,caret包[24]可以訓(xùn)練決策樹、樸素貝葉斯分類模型,randomForest 包可以訓(xùn)練隨機(jī)森林算法分類模型,e1071 包可以訓(xùn)練支持向量機(jī)算法分類模型,class包[25]可以訓(xùn)練K近鄰算法分類模型。對于訓(xùn)練好的模型,將測試集數(shù)據(jù)去除類別信息,使用predict函數(shù)進(jìn)行預(yù)測,并調(diào)用confusionMatrix 函數(shù)計(jì)算分類的混淆矩陣、總體精度值、Kappa值、用戶精度值及生產(chǎn)者精度值等指標(biāo)。將整理好的植被指數(shù)時(shí)序圖像作為預(yù)測數(shù)據(jù),使用predict函數(shù),即可得到研究區(qū)域的作物分類圖見圖5。

    圖5 漳河灌區(qū)地物分類預(yù)測圖Fig.5 Classification forecast map of Zhanghe Irrigation area

    3.3 分類結(jié)果與精度評價(jià)

    圖5為使用隨機(jī)森林算法對NDVI、RVI、EVI3 種植被指數(shù)混合數(shù)據(jù)進(jìn)行分類得到的漳河灌區(qū)地物分類預(yù)測圖。從圖5可以看出,漳河灌區(qū)主要種植作物有水稻、油菜、棉花、小麥。其中水稻-油菜輪作的種植方式在漳河灌區(qū)最為普遍,分布較廣;而棉花-小麥輪作的種植方式主要集中在灌區(qū)東部臨近漢江的地帶;早稻-晚稻間作的種植模式在灌區(qū)分布較少,主要集中在灌區(qū)東南部靠近長湖的地帶。

    使用訓(xùn)練好的模型對測試數(shù)據(jù)進(jìn)行分類預(yù)測,并調(diào)用confusionMatrix 函數(shù),整理運(yùn)行后的結(jié)果,得到分類總體精度值、Kappa 系數(shù)值見表5,各地物的用戶精度及生產(chǎn)者精度見圖6~圖7。

    表5 分類精度統(tǒng)計(jì)Tab.5 Classification accuracy statistics

    根據(jù)表5,對方案4 采用隨機(jī)森林算法對灌區(qū)進(jìn)行地物分類的分類效果最好,總精度達(dá)96.96%,Kappa 系數(shù)為0.948;對方案3 采用CART 決策樹對灌區(qū)進(jìn)行分類的分類效果最差,總精度僅為81.52%,Kappa 系數(shù)僅為0.662。對比同一方案中不同分類器的分類效果,隨機(jī)森林算法的分類效果最好,K近鄰算法、支持向量機(jī)算法及樸素貝葉斯算法次之,CART 決策樹分類器的效果最差,其中,隨機(jī)森林算法的分類平均總精度達(dá)95.6%,K 近鄰、支持向量機(jī)及樸素貝葉斯算法的分類平均總精度值在93.2%~94.5%之間,CART 決策樹分類的平均總精度僅有83.2%。對比同一分類器下不同方案的分類效果,方案4 效果最好,方案1 及方案2 的平均總精度值及Kappa 系數(shù)略低于方案4,但差別不大,方案3 的分類效果最差,平均總精度值比其他方案低2%左右。

    根據(jù)圖6~圖7對比各方案中地物的用戶精度值及生產(chǎn)者精度值,水體在各種分類方案下的用戶精度值均為100.0%,生產(chǎn)者精度均大于97.0%,其分類結(jié)果最可靠,分類效果最好;油菜-水稻輪作區(qū)、棉花-小麥輪作區(qū)、其他植被區(qū)及建筑用地的分類可靠性及效果比水體略差;早稻-晚稻間作區(qū)的分類結(jié)果最不可靠,分類效果最差。結(jié)合圖2~圖4,水體、建筑及其他植被區(qū)的植被指數(shù)曲線具有明顯特征,易于從其他地物中區(qū)分出來;油稻輪作區(qū)及棉麥輪作區(qū)的植被指數(shù)時(shí)序曲線雖有相同的雙峰趨勢,但達(dá)到峰值的時(shí)間不同,因此也利于區(qū)分;而早晚稻間作區(qū)由于面積較小,樣本點(diǎn)數(shù)目少,且植被指數(shù)曲線在夏季達(dá)到峰值的時(shí)間與油稻輪作區(qū)基本相同,容易錯(cuò)分進(jìn)油稻輪作區(qū),因此分類效果不好。

    圖6 各地物分類用戶精度Fig.6 User accuracy of local object classification

    圖7 各地物分類生產(chǎn)者精度Fig.7 Producer accuracy of local object classification

    綜上所述,對于分類器,使用隨機(jī)森林分類器的分類效果最好,使用CART 決策樹的分類效果最差;對于分類數(shù)據(jù),方案4 的數(shù)據(jù)分類效果最好,方案3 的數(shù)據(jù)分類效果最差,但綜合考慮工作量與精度提升之間的關(guān)系,使用方案1的數(shù)據(jù)進(jìn)行分類與方案4差別不大;對于地物分類結(jié)果,水體的分類結(jié)果最可靠,雙季稻區(qū)域的分類結(jié)果最差。

    4 結(jié) 論

    本研究以R 語言為工具,分別基于GF-1數(shù)據(jù)、Sentinel-2數(shù)據(jù)及Landsat 8 數(shù)據(jù)構(gòu)建的湖北省漳河灌區(qū)NDVI、EVI、RVI時(shí)間序列,采用決策樹、支持向量機(jī)、K近鄰算法、樸素貝葉斯算法及隨機(jī)森林5種分類器對研究區(qū)地物進(jìn)行分類,主要得到以下結(jié)論:

    (1)以R 語言為工具,實(shí)現(xiàn)了遙感數(shù)據(jù)的下載、預(yù)處理、分析及可視化過程,避免了跨平臺(tái)數(shù)據(jù)處理,簡化了遙感數(shù)據(jù)的處理過程,驗(yàn)證了R 語言在遙感數(shù)據(jù)處理過程中的適用性與優(yōu)越性。

    (2)采用CART 決策樹、樸素貝葉斯、支持向量機(jī)、K 近鄰算法及隨機(jī)森林模型對研究區(qū)地物分類。結(jié)果表明,隨機(jī)森林算法分類效果最好,平均總精度達(dá)到95.60%;CART決策樹算法分類效果最差,平均總精度僅83.15%。

    (3)分別使用NDVI、RVI、EVI及三者組合的時(shí)間序列作為分類數(shù)據(jù),對比4種方案的分類效果,結(jié)果表明,使用組合數(shù)據(jù)分類的效果最好,單獨(dú)使用EVI時(shí)間序列的分類效果最差,單獨(dú)使用NDVI作為分類數(shù)據(jù)進(jìn)行分類與使用組合數(shù)據(jù)分類的精度差別不大。綜合考慮工作量與精度提升之間的關(guān)系,使用NDVI時(shí)間序列為分類數(shù)據(jù)進(jìn)行分類最佳。

    (4)使用用戶精度、生產(chǎn)者精度對各地物分類效果進(jìn)行評價(jià),結(jié)果表明,水體分類效果最好,雙季稻分類效果最差。

    本研究的主要優(yōu)勢在于使用R 語言簡化了遙感數(shù)據(jù)的處理及分析過程,為提高遙感數(shù)據(jù)處理效率提供了新思路。同時(shí),對湖北省漳河灌區(qū)的作物進(jìn)行分類,為當(dāng)?shù)剞r(nóng)業(yè)布局提供了數(shù)據(jù)支撐。但研究還存在一些不足之處需要改進(jìn),目前研究表明,同時(shí)考慮地物的光譜特征和紋理特征可以極大提高分類的精度,后續(xù)研究應(yīng)在本研究的基礎(chǔ)上考慮使用面向?qū)ο蟮姆诸惙椒▽Ρ狙芯窟M(jìn)行改進(jìn)。

    猜你喜歡
    植被指數(shù)決策樹作物
    作物遭受霜凍該如何補(bǔ)救
    四種作物 北方種植有前景
    內(nèi)生微生物和其在作物管理中的潛在應(yīng)用
    一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
    AMSR_2微波植被指數(shù)在黃河流域的適用性對比與分析
    決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
    電子制作(2018年16期)2018-09-26 03:27:06
    河南省冬小麥產(chǎn)量遙感監(jiān)測精度比較研究
    無人機(jī)遙感在作物監(jiān)測中的應(yīng)用與展望
    基于決策樹的出租車乘客出行目的識別
    主要植被指數(shù)在生態(tài)環(huán)評中的作用
    西藏科技(2015年1期)2015-09-26 12:09:29
    常熟市| 新巴尔虎左旗| 达州市| 南充市| 新源县| 铅山县| 阿合奇县| 海阳市| 怀远县| 封丘县| 黄陵县| 宜兰市| 云浮市| 安泽县| 通榆县| 永福县| 边坝县| 祁连县| 双峰县| 惠州市| 天柱县| 襄城县| 平果县| 阿克苏市| 综艺| 凭祥市| 孟州市| 内黄县| 漳平市| 长兴县| 汽车| 麟游县| 习水县| 河源市| 明水县| 河津市| 汉寿县| 柞水县| 凭祥市| 天津市| 浪卡子县|