收稿日期:2023-11-10
基金項目:國家重點研發(fā)計劃項目(2023YFB3905801)
作者簡介:羅鳳宇(1998-),男,貴州黔南人,碩士研究生,主要研究方向為茶樹遙感識別。(E-mail)20211210039@nuist.edu.cn
通訊作者:謝 勇,(E-mail) xieyong@nuist.edu.cn
摘要: 茶樹是中國重要的木本經(jīng)濟(jì)作物,及時準(zhǔn)確地獲取茶樹種植區(qū)面積及空間分布對區(qū)域農(nóng)業(yè)經(jīng)濟(jì)發(fā)展具有重要意義。本研究以安徽省郎溪縣為研究區(qū),首先分析茶樹、小麥和紅葉石楠時序光譜特征,其次基于3個時相的Sentinel-2影像數(shù)據(jù)提取光譜特征、水體指數(shù)及植被指數(shù)特征、紅邊指數(shù)特征、紋理特征組成多時相特征變量數(shù)據(jù)集,并設(shè)置6種特征變量組合方案,利用隨機(jī)森林算法進(jìn)行茶樹種植區(qū)信息提取精度的比較,篩選得到適宜的特征變量組合方案,最后基于適宜的特征變量組合方案進(jìn)行郎溪茶樹種植區(qū)信息的提取。結(jié)果表明,在光譜特征變量的基礎(chǔ)上,分別融合水體指數(shù)及植被指數(shù)特征、紅邊指數(shù)特征和紋理特征變量均能有效提高茶樹種植區(qū)信息的提取精度,其中,紅邊指數(shù)特征對茶樹種植區(qū)信息提取精度的提高效果最好,其次是水體指數(shù)及植被指數(shù)特征。基于隨機(jī)森林-平均精確度下降算法(RF-MDA)優(yōu)選后的特征變量組合的分類效果最佳,總體分類精度達(dá)94.95%,Kappa系數(shù)為0.934 8,說明特征變量優(yōu)選能有效地保留重要的地物識別特征變量,避免冗余信息對分類結(jié)果的影響。綜上,基于隨機(jī)森林算法和茶樹多時相Sentinel-2影像數(shù)據(jù)能實現(xiàn)郎溪縣茶樹種植區(qū)信息的高精度提取。
關(guān)鍵詞: 茶樹種植區(qū);隨機(jī)森林;多時相特征;面積監(jiān)測
中圖分類號: S127"" 文獻(xiàn)標(biāo)識碼: A"" 文章編號: 000-4440(2024)09-1671-10
Extraction of tea plantation area information based on random forest algorithm and multi-temporal Sentinel-2 image data
LUO Fengyu GAO Yifei XIE Yong ZOU Xuhui SHAO Wen ZHANG Shiyu
(1.School of Geographical Sciences, Nanjing University of Information Science amp; Technology, Nanjing 210044, China;2.School of Geography, Geomatics and Planning, Jiangsu Normal University, Xuzhou 221116, China)
Abstract: Tea plant is an important woody cash crop in China, and timely and accurate acquisition of the planting area and spatial distribution of tea plants is of great significance to regional agricultural economic development. In this study, Langxi County in Anhui province was taken as the study area. Firstly, the temporal spectral characteristics of tea trees, wheat and Photinia fraseri were analyzed. Secondly, based on the Sentinel-2 image data of three phases, spectral features, water index and vegetation index features, red edge index features and texture features were extracted to form a multi-temporal feature variable data set, and six feature variable combination schemes were set up. The random forest algorithm was used to compare the extraction accuracy of tea tree planting areas, and the suitable combination scheme of characteristic variables was selected. Finally, the tea tree planting area in Langxi County was extracted based on the suitable combination scheme of characteristic variables. The results showed that on the basis of spectral feature variables, the fusion of water index and vegetation index features, red edge index features and texture feature variables could effectively improve the extraction accuracy of tea planting area information. Among them, red edge index features had the best effect on improving the extraction accuracy of tea planting areas, followed by water index and vegetation index features. The classification effect of the feature variable combination based on the random forest-average accuracy reduction algorithm (RF-MDA) was the best, the overall classification accuracy was 94.95%, and the Kappa coefficient was 0.934 8, indicating that the feature variable optimization could effectively retain the important feature recognition feature variables and avoid the influence of redundant information on the classification results. In summary, based on the random forest algorithm and the multi-temporal Sentinel-2 image data of tea trees, the high-precision extraction of tea planting area information in Langxi County can be realized.
Key words: tea plantation area;random forest;multi-temporal features;area monitoring
茶樹(Camellia sinensis)發(fā)源于中國,山茶科山茶屬,是中國重要的木本經(jīng)濟(jì)作物,廣泛分布于中國的18個省市[1]。安徽省郎溪縣是中國著名的產(chǎn)茶區(qū),1996年被原農(nóng)業(yè)部授予“中國綠茶之鄉(xiāng)”稱號。及時準(zhǔn)確地獲取茶樹種植面積及其空間分布對于茶園規(guī)劃、茶產(chǎn)業(yè)的可持續(xù)健康發(fā)展及鄉(xiāng)村振興和區(qū)域農(nóng)業(yè)經(jīng)濟(jì)發(fā)展均具有重要意義。
傳統(tǒng)的依靠基層人員對作物種植面積進(jìn)行實地調(diào)查的方法不僅難以獲取準(zhǔn)確的數(shù)據(jù)及空間分布,而且人工成本高、時效性差。20世紀(jì)80年代以來,衛(wèi)星遙感技術(shù)憑借覆蓋范圍廣、時效性高、獲取信息豐富等特點,在農(nóng)作物種植面積和空間分布的監(jiān)測方面取得了許多成果[2-3]。近年來,隨著遙感影像資源的日益豐富及人工智能算法的應(yīng)用,農(nóng)業(yè)遙感監(jiān)測的范圍逐步由大宗作物向小宗作物、種植面積和分布狀況向長勢、營養(yǎng)狀況、病蟲害等方向深入[4-6]?;诙鄷r相遙感數(shù)據(jù)的作物監(jiān)測能充分利用地物不同物候期信息,有效減少光譜混淆導(dǎo)致的分類誤差。張猛等[7]基于時間序列MODIS EVI(增強(qiáng)型植被指數(shù))數(shù)據(jù)提取洞庭湖流域濕地信息,能有效解決“異物同譜”、“同物異譜”的現(xiàn)象。柳文杰等[8]融合多時相環(huán)境衛(wèi)星(HJ-1A/1B)數(shù)據(jù)和MODIS13Q1數(shù)據(jù),獲取時間序列NDVI(歸一化植被指數(shù))數(shù)據(jù),并結(jié)合水稻關(guān)鍵物候特征參數(shù),對洞庭湖流域水稻種植面積進(jìn)行提取,取得了較好的效果,總體分類精度達(dá)91.71%,Kappa系數(shù)達(dá)0.902 4。
由于茶樹常與其他灌木、林木、農(nóng)作物混種,基于遙感影像的茶樹種植區(qū)信息提取具有一定的難度。但茶樹與其他農(nóng)作物、常綠天然林和灌木林在管理方面存在一定的差異,如定期的修剪以保持茶樹活力[9-11],這為精細(xì)化的茶樹種植區(qū)信息提取提供了可能。王斌等[12]基于春季、秋季和冬季Landsat-8 OLI影像數(shù)據(jù),構(gòu)建單時相和多時相特征變量數(shù)據(jù)集,并利用隨機(jī)森林算法對安吉縣茶樹種植區(qū)信息進(jìn)行了提取,取得了較好的結(jié)果。Xu等[9]基于多時相Landsat ETM和OLI遙感影像數(shù)據(jù)構(gòu)建植被指數(shù)分析茶樹的物候期,并提出一種基于像元和物候的茶樹種植區(qū)信息的提取方法。
紅邊指數(shù)等光譜衍生因子的應(yīng)用有利于提高地物分類精度[13]。Sentinel-2系列衛(wèi)星擁有3個紅邊波段,能夠?qū)χ脖簧L信息及其健康狀況進(jìn)行監(jiān)測[14],此外,雙星運行模式使得重訪周期縮短至5 d,極大增強(qiáng)了對地面物體的觀測能力[15]。然而,利用Sentinel-2影像對茶樹種植區(qū)信息的精細(xì)化提取方面還未有報道。因此,本研究利用實地采集的典型植被(茶樹、紅葉石楠、小麥)時序反射率數(shù)據(jù),分析其同時期的光譜差異,并以無人機(jī)獲取郎溪縣不同植被類型的樣本,結(jié)合3個時相的Sentinel-2影像數(shù)據(jù),構(gòu)建不同的特征變量數(shù)據(jù)集,利用隨機(jī)森林算法進(jìn)行地表植被類型的分類,以期為皖南地區(qū)茶樹種植面積動態(tài)監(jiān)測提供方法和依據(jù),促進(jìn)當(dāng)?shù)夭璁a(chǎn)業(yè)可持續(xù)健康發(fā)展。
1 材料與方法
1.1 研究區(qū)概況
郎溪縣(30°48′~31°18′N,118°58′~119°22′E)隸屬于安徽省宣城市,地勢東高西低、南高中低,低山和丘陵崗地約占57.2%,土壤類型以紅壤、黃壤等酸性土壤為主,氣候溫和、日照充足,降水豐富,具有發(fā)展茶樹種植的優(yōu)良條件(圖1)。郎溪茶樹主要種植在具有一定坡度的山坡上,株高低于1.5 m,以灌木型中小葉綠茶[16-18]為主,且不同品種的茶樹物候期相近。當(dāng)?shù)剡€種植以紅葉石楠為主的灌木,耕地則以小麥、水稻輪作為主。郎溪是皖南地區(qū)重要的茶樹種植區(qū),具有較好的代表性,因此本研究以郎溪的茶樹為研究對象,進(jìn)行茶樹種植區(qū)面積和分布的提取。
1.2 數(shù)據(jù)獲取及處理
1.2.1 遙感數(shù)據(jù)獲取與處理 本研究所使用遙感數(shù)據(jù)均為歐洲航天局(ESA,European Space Agency)提供的Sentinel-2A的L2C級數(shù)據(jù)。Sentinel-2衛(wèi)星搭載多光譜影像儀,具有13個波段,涵蓋可見光到近紅外,具體參數(shù)如表 所示。本研究中使用的遙感數(shù)據(jù)為2023年2月、5月、6月共3個時相的Sentinel-2A影像B2、B3、B4、B5、B6、B7、B8、B8A、B11、B12共10個波段數(shù)據(jù)。所有影像數(shù)據(jù)均基于ESA官方提供的軟件SNAP進(jìn)行大氣校正和重采樣至10 m空間分辨率等預(yù)處理。
1.2.2 典型植被高光譜數(shù)據(jù)采集與處理 為更準(zhǔn)確進(jìn)行茶樹的遙感識別,本研究中針對易與茶樹光譜產(chǎn)生混淆的紅葉石楠和小麥進(jìn)行高光譜監(jiān)測,以明確易混淆植被的光譜差異。分別選取茶樹、紅葉石楠和小麥60 m×60 m樣地,利用RS-8800高性能便攜式地物光譜儀(美國Spectral Evolution公司產(chǎn)品)進(jìn)行樣方的光譜監(jiān)測,具體采集時間如表 2 所示。RS-8800地物光譜儀的光譜范圍為350~2 500 nm,采樣間隔1 nm,視場角為25°。數(shù)據(jù)采集時,先選取植被覆蓋度均勻的樣方6個,樣方大小為1 m×1 m,樣方之間距離大于10 m,并使采樣樣方均勻分布于樣地。選擇晴朗、無云、風(fēng)小的天氣條件,于10:00-14:00進(jìn)行數(shù)據(jù)采集,測量時將探頭置于樣方垂直上方0.3~0.5 m處。為減少試驗誤差,每測完1個樣方均重新利用白板進(jìn)行校正,每個樣方采集5~8條反射率數(shù)據(jù),最后對所有數(shù)據(jù)進(jìn)行質(zhì)量篩選,計算平均值得到不同時相的茶樹、紅葉石楠和小麥冠層反射率數(shù)據(jù)。
1.2.3 不同植被類型樣本數(shù)據(jù)的采集 在參考《土地利用現(xiàn)狀分類》[19]以及文獻(xiàn)[20]、[21]的基礎(chǔ)上,結(jié)合研究區(qū)實際植被情況,將郎溪縣土地覆蓋類型劃分為耕地、林地(灌木、果園、森林等)、茶樹種植區(qū)、水域(坑塘、河流等)、人造地表、裸土6類。于2023年2月至6月在郎溪縣域內(nèi)利用無人機(jī)采集樣本數(shù)據(jù),每個樣本大小控制在50 m×50 m以上,然后依據(jù)實地考察及Google Earth高分辨率影像的目視解譯,共獲取耕地樣本65個、林地樣本72個、茶樹種植區(qū)樣本80個、水域樣本77個、人造地表樣本62個、裸土樣本67個。最后基于分層抽樣法將70%的樣本用于模型訓(xùn)練,30%的樣本用于結(jié)果驗證。
1.3 研究方法
首先對茶樹、小麥和紅葉石楠的實測光譜特征進(jìn)行分析,基于光譜差異選擇茶樹種植區(qū)識別的Sentinel-2影像構(gòu)建特征變量數(shù)據(jù)集,并設(shè)置6種特征變量組合方案,利用隨機(jī)森林算法篩選適宜茶樹種植區(qū)信息提取的特征變量組合方案,最后基于適宜的特征變量組合方案進(jìn)行郎溪茶樹種植區(qū)信息的提取。
1.3.1 特征變量提取 首先基于Sentinel-2影像的光譜特征,計算水體及植被指數(shù)特征、紅邊特征、紋理特征,構(gòu)建特征變量數(shù)據(jù)集,各類特征的變量名稱及算法等描述見表3。
鑒于光譜的一階導(dǎo)數(shù)能部分消除大氣效應(yīng)以及植被光譜中土壤成分的影響[22],研究中在紅邊指數(shù)特征中引入紅邊波段1一階微分反射比(B5_FDR)、紅邊波段2一階微分反射比(B6_FDR)及歸一化差異紅邊一階微分反射比(NDred_FDR)3個變量。B5_FDR和B6_FDR利用ENVI軟件的Image Derivative插件進(jìn)行提取。NDred_FDR 由B5_FDR和B6_FDR計算得到(表3)。
紋理特征具有魯棒性強(qiáng)、計算簡單等特點,可基于影像的灰度共生矩陣[23]提取。研究中對每個時相的Sentinel-2A影像B2、B3、B4、B5、B6、B7、B8、B8A、B11和B12共10個波段數(shù)據(jù)進(jìn)行主成分分析后,選擇方差貢獻(xiàn)率最大的第一主成分,并取4個方向的平均值來表示灰度共生矩陣,進(jìn)而得到紋理特征參數(shù)。
1.3.2 分類及特征優(yōu)選算法 隨機(jī)森林(Random Forest, RF)分類算法[40]能夠高效處理高維特征數(shù)據(jù),具有較高的泛化能力,在遙感研究中得到了廣泛的應(yīng)用。隨機(jī)森林-平均精確度減少算法(Random Forest -Mean Decreased Accuracy, RF-MDA)[41]通過打亂每個特征值的順序,然后度量這種順序變化對模型精確度的影響,以此來計算特征值的重要性得分。本研究利用RF-MDA算法進(jìn)行特征選擇,并結(jié)合隨機(jī)森林分類算法進(jìn)行地物分類。
1.3.3 特征值選取方案設(shè)計 本研究設(shè)計6組特征值組合進(jìn)行茶樹種植區(qū)信息提取結(jié)果的比較,其中方案1~方案5是直接利用表3中的特征值進(jìn)行組合,方案6是在方案5的基礎(chǔ)上,采用RF-MDA算法對3個時相114個特征變量進(jìn)行重要性計算,選擇重要性排序前20%[12]的特征構(gòu)成(表4)。
1.3.4 分類結(jié)果精度評價方法 本研究基于混淆矩陣[42]進(jìn)行分類精度評價,評價指標(biāo)包括生產(chǎn)者精度(PA)、用戶精度(UA)、總體精度(OA)和Kappa系數(shù)。各指標(biāo)計算公式如下:
PA=xiix+i×100%(3)
UA=xiixi+×100%(4)
OA=∑Ni=1xiiN×100%(5)
Kappa=N∑ki=1xii-∑ki=1(xi+×x+i)N 2-∑ki=1(xi+×x+i)(6)
式中:N為樣本數(shù),xi+為分類類別為i的樣本總數(shù),x+i為驗證類別為i的樣本總數(shù),k為分類結(jié)果類別總數(shù),xii為混淆矩陣中第i行第i列的值,即分類類別和實際類別一致的第i類樣本數(shù)。
2 結(jié)果與分析
2.1 不同植被的光譜特征
2023年1-6月小麥、茶樹、紅葉石楠的反射率特征如圖2所示。從圖中可以看出,1月份茶樹350~2 500 nm波段光譜反射率與2月份差異不大,而1-2月小麥和紅葉石楠短波近紅外波段(780~1 00 nm)的光譜反射率明顯高于茶樹,說明此階段茶樹生長發(fā)育較為緩慢。3月,茶樹反射率變化仍不明顯,紅葉石楠780~1 00 nm波段的光譜反射率明顯低于小麥,其他波段兩者基本一致,這可能是紅葉石楠生長過程中受到了外界脅迫。5月,茶樹進(jìn)入新梢生長期,長出新葉,此時茶樹近紅外波段的光譜反射率高于紅葉石楠和小麥。6月,由于研究區(qū)小麥已經(jīng)收割,且田中蓄水,沒有采集到反射率數(shù)據(jù);茶樹的800~1 300 nm波段的光譜反射率較5月份出現(xiàn)較大幅度的下降,且低于紅葉石楠,可能是茶葉采摘后,茶樹修剪導(dǎo)致的。
2023年5-6月茶樹修剪前后反射率的變化主要表現(xiàn)在670~1 300 nm波段,修剪后的茶樹反射率明顯低于未修剪茶樹;2 000~2 400 nm波段,修剪后的茶樹反射率明顯高于未修剪茶樹(圖2a)。
從3種植被1-6月反射率變化來看,茶樹由于經(jīng)歷人工修剪,修剪前后反射率發(fā)生顯著變化,與小麥和紅葉石楠存在一定的可分辨性。因此,為更好地提取茶樹種植區(qū)信息,以5月新梢期影像為基礎(chǔ),在5月前后各選1景的影像,構(gòu)成多時相數(shù)據(jù)。實際應(yīng)用中,應(yīng)選取鄰近實際修剪時間的影像進(jìn)行茶樹種植面積與分布的提取。本研究中,選取的3景Sentinel-2A影像的成像時間分別為2023年2月27日、2023年5月1日、2023年6月10日。
2.2 特征選擇
基于RF-MDA算法,方案6篩選出的23個特征變量的重要性分布情況如圖3所示。從圖中可以看出,水分脅迫指數(shù)_6月的重要性得分最高,達(dá)4.37,這可能由于茶樹修剪導(dǎo)致6月份茶樹冠層水分變化劇烈,而水分脅迫指數(shù)對于植被冠層水分異常敏感。歸一化差異紅邊一階微分反射比_6月的特征重要性得分排在第6位,此外紅邊波段1一階微分反射比_6月、紅邊波段2一階微分反射比_6月特征變量亦被選出,說明本研究構(gòu)建的紅邊波段衍生因子有利于正確分類。優(yōu)選出的特征變量大部分與6月份影像數(shù)據(jù)相關(guān),因此,6月份是比較適宜提取茶樹種植區(qū)信息的主要時相,一方面6月份研究區(qū)的冬小麥已經(jīng)收割,秋收作物如玉米等剛栽種,植被覆蓋度較小,另一方面茶樹經(jīng)過人工修剪雖然冠層覆蓋度降低,但仍明顯高于新播種的玉米等秋收作物,而林地的植被覆蓋度在5-6月份則不會存在人工修剪導(dǎo)致的冠層覆蓋度降低。
根據(jù)優(yōu)選的23個特征變量的重要性得分,統(tǒng)計得到各個分段不同類型特征變量的累計重要性得分比重如圖4a所示。前6個特征變量中,光譜特征、水體指數(shù)及植被指數(shù)特征、紅邊指數(shù)特征各占2個,累計重要性得分所占比重差距不大。前12個特征變量中,水體指數(shù)及植被指數(shù)特征累計重要性得分占比明顯高于光譜特征、紅邊指數(shù)特征。前18個特征中,水體指數(shù)及植被指數(shù)特征與紅邊指數(shù)特征的累計重要性得分占比相當(dāng),均高于光譜特征。23個特征變量中,紅邊指數(shù)特征的變量累計重要性積分最高,水體指數(shù)及植被指數(shù)特征的變量次之,光譜特征的變量最低。23個特征變量有9個變量屬于紅邊指數(shù)特征,7個變量為光譜特征, 7個變量為水體指數(shù)及植被指數(shù)特征(圖4b)。從上述分析可知紅邊指數(shù)特征相關(guān)的變量不僅數(shù)量多,累計重要性得分亦高,這說明紅邊指數(shù)特征對植被的分類和茶樹信息的提取有重要貢獻(xiàn)。優(yōu)選的特征變量中沒有與紋理特征相關(guān)的變量,這一方面可能是因為Sentinel-2衛(wèi)星10 m空間分辨率的影像數(shù)據(jù)所呈現(xiàn)的紋理特征不明顯,另一方面可能是紋理特征對于地表植被的分類貢獻(xiàn)較小。
2.3 提取精度對比
基于不同特征變量組合方案、隨機(jī)森林分類算法及訓(xùn)練集和驗證集數(shù)據(jù)得到各分類方案下的植被分類精度如表5所示。從表5可以看出,由多時相光譜特征構(gòu)成的分類方案1的總體分類精度(OA)為91.97%,Kappa系數(shù)為0.896 ,茶樹種植區(qū)的生產(chǎn)者精度(PA)和用戶精度(UA)均超過90%。在光譜特征變量的基礎(chǔ)上加入水體指數(shù)及植被指數(shù)特征變量后,方案2的茶樹種植區(qū)PA和UA分別比方案1提高1.23個百分點和0.52個百分點。而在光譜特征變量的基礎(chǔ)上加入紅邊指數(shù)特征變量后,方案3的茶樹種植區(qū)PA和UA分別比方案1提高0.3個百分點和2.46個百分點,提升較明顯。在光譜特征變量的基礎(chǔ)上加入紋理特征變量后,方案4的茶樹種植區(qū)PA和UA分別比方案1提高0.17個百分點和0.64個百分點,提升效果相對較差,這也說明10 m中分辨率影像的紋理特征對地表植被分類精度的提升作用有限。融合多時相光譜特征、水體指數(shù)及植被指數(shù)特征、紅邊指數(shù)特征及紋理特征114個變量的方案5茶樹種植區(qū)PA比方案1增加0.81個百分點,但UA下降0.97個百分點,這可能是由于特征變量冗余導(dǎo)致分類精度的下降,這與張磊等[35]研究結(jié)果一致。而經(jīng)RF-MDA算法優(yōu)選后的方案6可以獲得最佳的分類效果,OA為94.95%,Kappa為0.934 8,茶樹種植區(qū)PA和UA分別為93.07%、95.95%。
2.4 茶樹種植區(qū)空間分布
由方案6提取的郎溪縣茶樹種植區(qū)分布如圖5所示。郎溪縣茶樹種植區(qū)主要分布在海拔200 m以下具有一定地勢的中部、南部和東北部地區(qū)。茶樹根系不耐水,茶樹種植對地形具有一定的要求,而坡度太大不便于茶樹種植和人工養(yǎng)護(hù),因此茶樹往往種植在不易蓄水且坡度較小的山坡上。郎溪縣茶樹種植區(qū)空間分布按鄉(xiāng)鎮(zhèn)可劃分為3個等級:十字鎮(zhèn)、飛鯉鎮(zhèn)、凌笪鎮(zhèn)茶樹種植較多,累計茶樹種植面積達(dá)1 929.39 hm 2;畢橋鎮(zhèn)、姚村鎮(zhèn)、濤城鎮(zhèn)次之,累計茶樹種植面積為811.21 hm 2;新發(fā)鎮(zhèn)、梅渚鎮(zhèn)、建平鎮(zhèn)和郎溪經(jīng)濟(jì)開發(fā)區(qū)茶樹種植面積相對較少。
3 討論
本研究通過實地采集1-6月茶樹、小麥及紅葉石楠高光譜數(shù)據(jù),明確茶樹與其他植被不同的光譜特征,為茶樹信息的提取提供依據(jù)。但本研究仍存在一些局限,如10 m分辨率Sentinel-2影像難以準(zhǔn)確反映和有效利用茶樹獨特的紋理特征。因此,后續(xù)的研究中應(yīng)充分利用茶樹為行植作物這一特性,應(yīng)用更高空間分辨率的遙感數(shù)據(jù)(如高分系列遙感影像等)提取紋理特征,以進(jìn)一步提高茶樹種植區(qū)信息提取的精度;另一方面由于Sentinel-2單星的重訪周期約10 d,未來研究中可考慮將Sentinel-2與MODIS數(shù)據(jù)進(jìn)行時空融合得到時間分辨率更高的時序數(shù)據(jù),以實現(xiàn)更為準(zhǔn)確的茶樹種植面積和分布等信息提取。
4 結(jié)論
本研究基于2023年1-6月多時相Sentinel-2影像提取光譜特征、水體指數(shù)及植被指數(shù)特征、紅邊指數(shù)特征、紋理特征,設(shè)計6組不同的特征變量組合方案并使用隨機(jī)森林算法對郎溪縣地表植被進(jìn)行分類,主要結(jié)論如下:(1)不同類型特征變量對于地物分類精度的貢獻(xiàn)具有明顯差異,相比較而言,紅邊指數(shù)特征對提升茶樹種植區(qū)信息提取精度貢獻(xiàn)最大,其次是水體指數(shù)及植被指數(shù)特征,紋理特征貢獻(xiàn)最小,表明本研究構(gòu)建的紅邊指數(shù)特征對茶樹修剪前后的冠層變化更為敏感。(2)基于隨機(jī)森林-平均精確度減少算法(RF-MDA)特征優(yōu)選后的特征變量進(jìn)行分類能得到最高的分類精度,總體精度達(dá)94.95%,Kappa系數(shù)為0.934 8,表明RF-MDA能有效地保留識別地物重要的特征變量,避免冗余信息對分類結(jié)果的影響。
致謝: 感謝國家民用空間基礎(chǔ)設(shè)施項目對本研究數(shù)據(jù)采集與分析等方面的資助和支持!
參考文獻(xiàn):
[1] 肖 智,黃賢金,孟 浩,等. 2009-2014年中國茶葉生產(chǎn)空間演變格局及變化特征[J]. 地理研究,2017,36(1):109-120.
[2] 梁 繼,鄭鎮(zhèn)煒,夏詩婷,等. 高分六號紅邊特征的農(nóng)作物識別與評估[J]. 遙感學(xué)報,2020,24(10):1168-1179.
[3] 巫明焱,董 光,稅 麗,等. 基于Landsat 8影像的濟(jì)寧市春季主要作物種植面積變化監(jiān)測[J]. 江蘇農(nóng)業(yè)學(xué)報,2018,34(3):559-569.
[4] KHATAMI R, MOUNTRAKIS G, STEHMAN S V. A meta-analysis of remote sensing research on supervised pixel-based land-cover image classification processes:general guidelines for practitioners and future research[J]. Remote Sensing of Environment,2016,177:89-100.
[5] 徐 喬,張 霄,余紹淮,等. 綜合多特征的極化SAR圖像隨機(jī)森林分類算法[J]. 遙感學(xué)報,2019,23(4):685-694.
[6] 王 娜,李強(qiáng)子,杜 鑫,等. 單變量特征選擇的蘇北地區(qū)主要農(nóng)作物遙感識別[J]. 遙感學(xué)報,2017,21(4):519-530.
[7] 張 猛,曾永年,朱永森. 面向?qū)ο蠓椒ǖ臅r間序列MODIS數(shù)據(jù)濕地信息提取——以洞庭湖流域為例[J]. 遙感學(xué)報,2017,21(3):479-492.
[8] 柳文杰,曾永年,張 猛. 融合時間序列環(huán)境衛(wèi)星數(shù)據(jù)與物候特征的水稻種植區(qū)提取[J]. 遙感學(xué)報,2018,22(3):381-391.
[9] XU W, HUANG S, WU C, et al. The pruning phenological phase-based method for extracting tea plantations by field hyperspectral data and Landsat time series imagery[J]. Geocarto International,2020,37(7):2116-2136.
[10]DAVRANCHE A,POULIN B,LEFEBVRE G. Mapping flooding regimes in Camargue wetlands using seasonal multispectral data[J]. Remote Sensing of Environment,2013,138:165-171.
[11]平躍鵬,臧淑英. 基于MODIS時間序列及物候特征的農(nóng)作物分類[J]. 自然資源學(xué)報,2016,31(3):503-513.
[12]王 斌,何丙輝,林 娜,等. 基于隨機(jī)森林特征選擇的茶園遙感提取[J]. 吉林大學(xué)學(xué)報(工學(xué)版),2022,52(7):1719-1722.
[13]SHOKO C, MUTANGA O. Examining the strength of the newly-launched Sentinel 2 MSI sensor in detecting and discriminating subtle differences between C2 and C4 grass species[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2017,129:22-40.
[14]KORHONEN L, HADI, PACKALEN P, et al. Comparison of Sentinel-2 and Landsat 8 in the estimation of boreal forest canopy cover and leaf area index[J]. Remote Sensing of Environment,2017,195:259-274.
[15]鄭 陽,吳炳方,張 淼. Sentinel-2數(shù)據(jù)的冬小麥地上干生物量估算及評價[J]. 遙感學(xué)報,2017,21(2):218-228.
[16]陳炳環(huán). 茶樹品種分類的探討[J]. 中國茶葉,1988(2):16-18.
[17]金志鳳,黃敬蜂,李 波,等. 基于GIS及氣候-土壤-地形因子的浙江省茶樹栽培適宜性評價[J]. 農(nóng)業(yè)工程學(xué)報,2017,27(3):231-236.
[18]李時睿,王治海,楊再強(qiáng),等. 江南茶區(qū)茶葉生產(chǎn)現(xiàn)狀和氣候資源特征分析[J]. 干旱氣象,2014,32(6):1007-1014.
[19]國家質(zhì)量監(jiān)督檢驗檢疫總局,國家標(biāo)準(zhǔn)化管理委員會. 土地利用現(xiàn)狀分類:GB/T 21010-2017[S]. 北京:中國標(biāo)準(zhǔn)出版社,2017.
[20]劉紀(jì)遠(yuǎn). 中國資源環(huán)境遙感宏觀調(diào)查與動態(tài)[M]. 北京:中國科學(xué)技術(shù)出版社,1996.
[21]張景華,封志明,姜魯光. 土地利用/土地覆被分類系統(tǒng)研究進(jìn)展[J].資源科學(xué),2011,33(6):1195-1203.
[22]童慶禧,張 兵,鄭蘭芬. 高光譜遙感-原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006.
[23]HARALICK R M, SHANMUGAM K. Textural features for image classification[J]. IEEE Transactions on Systems,Man,and Cybernetics,1973,3(6):610-621.
[24]XIAO X M, BOLES S, LIU J Y, et al. Mapping paddy rice agriculture in Southern China using multi-temporal MODIS images[J]. Remote Sensing of Environment,2005,95(4):480-492.
[25]GAO B C. NDWI:a normalized difference water index for remote sensing of vegetation liquid water from space[J]. Remote Sensing of Environment,1996,58(2):257-266.
[26]ERJR H, ROCK B N. Detection of changes in leaf water content using near-and middle-infrared reflectances[J]. Remote Sensing of Environ,1989,20(1):42-54.
[27]RONDEAUX G, STEVEN M, BARET F. Optimization of soil-adjusted vegetation indices[J]. Remote Sensing of Environment,1996,55(2):95-107.
[28]BIRTH C S, MCVEY G. Measuring the color of growing turf with a reflectance spectrophotometer[J]. Agronomy Journal,1968,60:640-643.
[29]TUCKER C J. Red and photographic infrared linear combinations for monitoring vegetation[J]. Remote Sensing of Environment,1979,8(2):127-150.
[30]MIURA T, HUETE A R, YOSHIOKA H. Evaluation of sensor calibration uncertainties on vegetation indices for MODIS[J]. IEEE Transactions on Geoscience & Remote Sensing,2000,38(3):1399-1409.
[31]GAMON J A, PEUELAS J, FIELD C B. A narrow-waveband spectral index that tracks diurnal changes in photosynthetic efficiency[J]. Remote Sensing of Environment,1992,41(1):25-44.
[32]GITELSON A A, VIA A, ARKEBAUER T J, et al. Remote estimation of leaf area index and green leaf biomass in maize canopies[J]. Geophysical Research Letters,2003,30(5):1248.
[33]DEVENTER V, WARD A D, GOWDA P H, et al. Using thematic mapper data to identify contrasting soil plains and tillage practices[J]. Photogrammetric Engineering amp; Remote Sensing,1997,62(1):87-92.
[34]GITELSON A A, MERZLYAK M N. Remote estimation of chlorophyll content in higher plant leaves[J]. International Journal of Remote Sensing,1997,18(12):2691-2697.
[35]張 磊,宮兆寧,王啟為,等. Sentinel-2影像多特征優(yōu)選的黃河三角洲濕地信息提取[J]. 遙感學(xué)報,2019,22(2):212-226.
[36]GITELSON A A, GRITZ Y, MERZLYAK M N. Relationships between leaf chlorophyll content and spectral reflectance and algorithms for non-destructive chlorophyll assessment in higher plant leaves[J]. Journal of Plant Physiology,2002,160(2):271-282.
[37]MERZLYAK M N, GITELSON A A, CHIVKUNOVA O B, et al. Non-destructive optical detection of pigment changes during leaf senescence and fruit ripening[J]. Physiologia Plantarum,1999,106(1):125-141.
[38]FRAMPTON W J, DASH J, WATMOUGH G, et al. Evaluating the capabilities of Sentinel-2 for quantitative estimation of biophysical variables in vegetation[J]. ISPRS Journal of Photogrammetry and Remote Sensing,2012,82:82-92.
[39]WU C Y, NIU Z, TANG Q, et al. Estimating chlorophyll content from hyperspectral vegetation indices:modeling and validation[J]. Agricultural and Forest Meteorology,2008,148(8/9):1220-1241.
[40]BREIMAN L. Random forests[J]. Machine Learning,2001,45(1):5-22.
[41]GENUER R, POGGI J M, TULEAU-MALOT C. Variable selection using random forests[J]. Pattern Recognition Letters,2010,31(14):2225-2236.
[42]CONGALTON R G. A review of assessing the accuracy of classifications of remotely sensed data[J]. Remote Sensing of Environment,1991,37(1):35-46.
(責(zé)任編輯:石春林)