陳盼盼, 任艷敏, 趙春江, 李存軍, 劉 玉
北京市農(nóng)林科學(xué)院信息技術(shù)研究中心, 北京 100097
茶樹(shù)為多年生常綠灌木, 是一種高附加值的經(jīng)濟(jì)作物, 是我國(guó)南方山區(qū)實(shí)現(xiàn)鄉(xiāng)村振興和脫貧攻堅(jiān)的重要抓手[1]。 至2020年, 我國(guó)的茶園面積為4748萬(wàn)畝, 其中廣東省茶園種植面積為117.2萬(wàn)畝, 近年來(lái)茶樹(shù)種植面積不斷擴(kuò)大[2]。 隨著部分森林、 農(nóng)田和山地轉(zhuǎn)化為茶園用地, 導(dǎo)致眾多生態(tài)問(wèn)題頻發(fā), 如毀林種茶、 水土流失、 土地退化等[3-4]。 因此, 實(shí)現(xiàn)對(duì)茶園面積的快速、 動(dòng)態(tài)監(jiān)測(cè)對(duì)茶葉產(chǎn)業(yè)的可持續(xù)發(fā)展至關(guān)重要; 也可為政府部門的規(guī)劃、 管理及茶葉生長(zhǎng)監(jiān)測(cè)及估產(chǎn)提供數(shù)據(jù)支持[5]。
通常, 傳統(tǒng)茶園種植面積及其空間分布主要通過(guò)人工調(diào)查來(lái)獲取, 該方法精度雖高但耗時(shí)耗力, 且無(wú)法快速動(dòng)態(tài)的獲取茶園的空間分布[6]。 遙感技術(shù)具有快速及高效獲取數(shù)據(jù)的優(yōu)勢(shì)且成本較低, 已廣泛應(yīng)用于作物提取分類中, 尤其是在茶園提取中, 可為準(zhǔn)確及時(shí)掌握茶園的空間分布提供強(qiáng)有力的技術(shù)手段[7]。 在茶園分類提取中, 遙感技術(shù)逐步由中低分辨遙感影像(Landsat、 MODIS)發(fā)展到高時(shí)空分辨率的遙感影像(ZY-3、 GF及Sentinel-2等)[8-10]。 有研究基于Landsat-8數(shù)據(jù)提取了云南省臨滄市復(fù)雜地形中的茶園面積。 馬超等采用MODIS數(shù)據(jù)對(duì)茶園進(jìn)行分類研究, 利用時(shí)序的增強(qiáng)植被指數(shù)(enhanced vegetation index, EVI) 和歸一化植被指數(shù)(normalized difference vegetation index, NDVI)構(gòu)建分類特征[9]。 徐偉燕等采用資源三號(hào)衛(wèi)星數(shù)據(jù), 利用不同季節(jié)的NDVI差異實(shí)現(xiàn)了對(duì)平原區(qū)和山區(qū)的茶樹(shù)種植進(jìn)行提取[8]。 楊艷魁等利用高分二號(hào)影像數(shù)據(jù)利用植被指數(shù)和紋理特征對(duì)茶園進(jìn)行了分類研究[11]。 上述研究以Landsat、 MODIS衛(wèi)星影像數(shù)據(jù)為主的茶園分類提取, 雖然數(shù)據(jù)的時(shí)序性較好, 但影像的空間分辨率較低導(dǎo)致茶園錯(cuò)分漏分情況較多[10]。 以ZY-3和GF-2衛(wèi)星數(shù)據(jù)為主的茶園分類研究, 雖然影像數(shù)據(jù)的空間分辨率較高, 但所獲取的波段信息較少, 且在大尺度茶園分類提取研究中應(yīng)用性較差。
Sentinel-2A/2B衛(wèi)星具有13個(gè)較窄波段及高重訪周期, 可以更好地區(qū)分不同地物的光譜響應(yīng)特性差異, 靈敏捕捉各類物質(zhì)特征波長(zhǎng)間的細(xì)微差異[12]。 作物對(duì)電磁波譜中可見(jiàn)光中的紅光波段、 近紅外波段極為敏感[13], 尤其是近年來(lái)發(fā)現(xiàn)植被在紅邊波段的波動(dòng)較為明顯[14]。 目前, 含有紅邊波段的衛(wèi)星有GF-6、 WorldView、 RapidEye、 Sentinel-2等, 尤其是Sentinel-2影像的發(fā)布, 包含3個(gè)紅邊波段, 可精準(zhǔn)反映其生長(zhǎng)發(fā)育過(guò)程, 為植被的分類提供了更多波段選擇[15]。 眾多學(xué)者基于Sentinel-2影像數(shù)據(jù)針對(duì)作物分類提取已進(jìn)行較多研究, 如水稻、 玉米、 大豆和甘蔗等作物[16-18], 但目前針對(duì)茶園分類的提取研究較少。 李龍偉等利用Sentinel-2影像結(jié)合物候和光譜特征, 采用決策樹(shù)分類方法對(duì)浙江西北部地區(qū)的茶園進(jìn)行了提取研究[19]。 Zhu等采用Sentinel-2影像數(shù)據(jù), 結(jié)合NDVI、 紋理特征、 地形特征, 利用SVM和RF方法對(duì)河南信陽(yáng)地區(qū)的茶園進(jìn)行了提取[5]。 趙曉晴等采用Sentinel-2影像數(shù)據(jù), 通過(guò)對(duì)時(shí)序影像的光譜特征和NDVI變化分析, 構(gòu)建14個(gè)植被指數(shù)特征, 采用決策樹(shù)分類對(duì)杭州西湖地區(qū)的茶園進(jìn)行了分類研究[20]。 目前采用Sentinel-2影像的茶園提取主要是結(jié)合物候和光譜特征進(jìn)行的, 但由于我國(guó)不同地區(qū)間物候、 地貌差異性較大, 不同地區(qū)的茶園提取特征也具有差異性, 且綜合考慮茶園物候特征、 植被特征和紋理特征的茶園提取研究較少。 本文以廣東省英德市為研究區(qū), 采用時(shí)序Sentinel-2影像數(shù)據(jù), 結(jié)合研究區(qū)的光譜、 植被指數(shù)及物候等特征進(jìn)行茶園的提取, 采用RF和SVM分類方法進(jìn)行對(duì)比研究, 探究時(shí)序哨兵數(shù)據(jù)在縣域尺度的應(yīng)用潛力及其精度。
英德市位于廣東省中北部, 粵北山區(qū)南部, 三江交匯處, 主要以山地和丘陵地貌為主(圖1); 境內(nèi)氣候溫和、 雨量豐沛, 為亞熱帶濕潤(rùn)性季風(fēng)氣候(subtropical monsoon climate), 年均降雨量為1 835.8 mm, 年平均氣溫約為21 ℃, 年均日照為1 739.4 h, 年均無(wú)霜期為319 d, 極適宜茶樹(shù)生長(zhǎng)[21]。 英德市是重要的紅茶產(chǎn)區(qū), 被譽(yù)為為“中國(guó)紅茶之鄉(xiāng)”, 廣泛種植英紅九號(hào), 全市茶葉企業(yè)有346家, 省級(jí)茶葉農(nóng)業(yè)龍頭企業(yè)11家, 到2019年英德市茶園總面積14.7萬(wàn)畝, 全年干毛茶總產(chǎn)量1.1萬(wàn)噸, 總產(chǎn)值高達(dá)41億元, 是當(dāng)?shù)刂匾慕?jīng)濟(jì)支柱[22]。
圖1 研究區(qū)示意圖
為了更好地對(duì)研究區(qū)茶園進(jìn)行分類, 采用全年12個(gè)月的影像數(shù)據(jù)進(jìn)行分析。 而實(shí)際的數(shù)據(jù)獲取中, 由于研究區(qū)5月、 6月降雨較多, 數(shù)據(jù)的云量高達(dá)50%以上, 加之8月數(shù)據(jù)質(zhì)量較差, 導(dǎo)致上述月份數(shù)據(jù)缺失。 因此獲取了9個(gè)月的影像數(shù)據(jù), 其數(shù)據(jù)信息如表1所示。 所有數(shù)據(jù)均來(lái)源于歐洲航空局哥白尼科學(xué)數(shù)據(jù)中心(European Space Agency’s Copernicus Scientific Data Hub, ESA CSDB)網(wǎng)站(https://scihub.copernicus.eu/)。 Sentinel-2A/B L1C影像數(shù)據(jù)未經(jīng)輻射定標(biāo)和大氣校正, 首先利用Sen2cor插件完成對(duì)影像數(shù)據(jù)進(jìn)行大氣校正, 得到Sentinel-2 Level-2A數(shù)據(jù); 然后利用SNAP 8.0處理軟件對(duì)數(shù)據(jù)進(jìn)行去云、 重采樣、 鑲嵌、 裁剪等預(yù)處理, 最終獲取研究區(qū)10 m分辨率的影像數(shù)據(jù), 轉(zhuǎn)換數(shù)據(jù)格式導(dǎo)出至ENVI 5.3進(jìn)行后續(xù)處理。
表1 Sentinel-2影像數(shù)據(jù)的信息
在2020年9月和2021年5月分別對(duì)英德市的茶園分布情況開(kāi)展野外調(diào)查, 走訪了英德市15個(gè)主要的茶葉分布鄉(xiāng)鎮(zhèn), 采集了68個(gè)茶園的經(jīng)緯度信息, 如圖1中所示; 結(jié)合Google遙感影像, 按照茶園、 森林、 農(nóng)田、 水體、 居民地等5大類型, 共計(jì)選取了627個(gè)訓(xùn)練樣本與驗(yàn)證樣本。 使用分層隨機(jī)抽樣方式, 選擇5種地物全部樣本區(qū)的80%作為訓(xùn)練樣本集, 20%的樣本作為驗(yàn)證集。
主要采用研究區(qū)9期Sentinel-2影像數(shù)據(jù)和DEM數(shù)據(jù), 通過(guò)對(duì)所選取的植被指數(shù)和紋理特征進(jìn)行時(shí)序變化分析, 并采用Relief算法對(duì)植被和紋理特征進(jìn)行降維, 并結(jié)合時(shí)序特征構(gòu)建不同分類場(chǎng)景, 分別利用SVM、 RF等淺層機(jī)器學(xué)習(xí)算法, 獲取茶園的空間分布, 最后結(jié)合驗(yàn)證數(shù)據(jù)集評(píng)價(jià)茶園的分類精度, 對(duì)比不同分類方法在不同的分類場(chǎng)景下的精度,選取適合茶園分類提取的最優(yōu)分類場(chǎng)景和分類方法, 為茶園分類提取提供技術(shù)支撐。 技術(shù)路線如圖2所示。
圖2 技術(shù)流程圖
分析并構(gòu)建茶樹(shù)作物的物候特征, 可為作物最佳時(shí)相的選擇提供依據(jù)[23]。 為了解茶樹(shù)的物候特征, 通過(guò)詢問(wèn)及文獻(xiàn)資料查閱, 獲取了英德市茶樹(shù)生長(zhǎng)物候圖(圖3)。 茶樹(shù)的生長(zhǎng)階段從每年的3月中下旬開(kāi)始, 直至當(dāng)年的10月中下旬, 當(dāng)年10月中下旬至次年的3月中上旬為茶樹(shù)生長(zhǎng)的休止期, 該時(shí)段可更好的積蓄營(yíng)養(yǎng)[5]。 茶樹(shù)在當(dāng)年內(nèi)大體可分為3個(gè)生長(zhǎng)階段: 第一生長(zhǎng)階段為3月下旬至5月上旬、 第二生長(zhǎng)階段為整個(gè)6月和第三個(gè)生長(zhǎng)階段為8月到10月上旬, 根據(jù)采摘的時(shí)間將其分別對(duì)應(yīng)為春茶采摘期、 夏茶采摘期、 秋茶采摘期。 為了采摘高品質(zhì)的茶鮮葉, 在茶樹(shù)生長(zhǎng)的周期內(nèi)進(jìn)行修剪, 通常在5月份進(jìn)行1次深修剪, 分別在8月和9月進(jìn)行2次輕修剪。
圖3 英德市茶樹(shù)生長(zhǎng)物候圖
植被指數(shù)特征主要是利用植被呈現(xiàn)的不同光譜反映拓性, 遵循經(jīng)驗(yàn)或半經(jīng)驗(yàn)?zāi)P瞳@取不同的波段組合且具有一定指示意義的數(shù)值, 衡量植被的生長(zhǎng)及覆蓋情況, 并有助于提高遙感影像的解譯能力[24]。 結(jié)合茶樹(shù)提取過(guò)程中常用的植被指數(shù), 選取了歸一化差值植被指數(shù)(normalized difference vegetation index, NDVI)、 土壤調(diào)節(jié)植被指數(shù)(soil adjusted vegetation index, SAVI)、 土壤亮度指數(shù)(the second brightness index, BI2)、 差值植被指數(shù)(difference vegetation index, DVI)、 垂直植被指數(shù)(perpendicular vegetation index, PVI)、 修正型葉綠素吸收比值指數(shù)(modified chlorophyll absorption ratio index, MCARI)、 特定色素簡(jiǎn)單比值植被指數(shù)(pigment specific simple ratio chlorophyll index, PSSRa)等7個(gè)植被指數(shù)特征來(lái)進(jìn)行時(shí)序分析, 更好地了解茶樹(shù)在不同季節(jié)的植被指數(shù)變化, 為茶園的分類提供參考。
依次對(duì)不同地類的時(shí)序植被特征進(jìn)行了統(tǒng)計(jì), 如圖4所示。 以PSSRa植被特征為例, 農(nóng)田、 建設(shè)用地、 水體的PSSRa值與森林和茶園的PSSRa值差異性較大, 易于區(qū)分。 森林和茶園的PSSRa時(shí)序特征在春季和夏季時(shí)逐漸增大, 冬季逐漸下降。 茶園和森林的PSSRa最低值出現(xiàn)在2月和1月, 分別為4.45和6.99; 茶園和森林的PSSRa值保持增長(zhǎng)到10月份達(dá)到最大, 分別為12.97和13.42。 但在2月份時(shí), 兩者的差異達(dá)到最大, 因此在利用PSSRa進(jìn)行分類提取時(shí), 優(yōu)先選擇春季2月的PSSRa特征來(lái)參與后續(xù)分類。 其他特征進(jìn)行同樣分析可知, NDVI植被特征差異比較明顯的月份在2月, SAVI、 BI2、 DVI、 PVI和MCARI等植被特征差異比較明顯的月份均在10月。
圖4 七項(xiàng)植被指數(shù)特征時(shí)序變化圖
利用多特征, 尤其是紋理特征進(jìn)行組合、 優(yōu)化和遴選最佳分類特征也是目前常用的分類方法[25]。 紋理特征作為遙感影像在空間上分布和變化的結(jié)構(gòu)特征, 不同的地物類型其紋理特征不同, 可有效提高遙感影像在茶園分類中的精度。 灰度共生矩陣(gray level co-occurrence matrix, GLCM)是一種常用的紋理特征分析方法, 可較好地反映圖像中任意兩點(diǎn)之間灰度的空間相關(guān)性[26]。 本紋理特征主要是基于灰度共生控陣方法, 選取了6個(gè)GLCM紋理指標(biāo), 即同質(zhì)性(Homogeneity)、 對(duì)比度(Contrast)、 差異性(Dissmilarity)、 熵(Entropy)、 均值(Mean)、 方差(Variance)進(jìn)行實(shí)驗(yàn), 其窗口大小設(shè)置為99像素, 默認(rèn)設(shè)置為等概率量化器來(lái)進(jìn)行紋理提取。 同時(shí)考慮到灰度共生矩陣具有方向性, 因此在其角度設(shè)置為全方向, 即紋理值為0°、 45°、 90°、 135°四個(gè)方向的平均值。
依次對(duì)不同地類的時(shí)序紋理特征進(jìn)行了統(tǒng)計(jì)(圖5)。 以Contrast(對(duì)比度)紋理特征為例, 主要側(cè)重易混淆地類茶園和森林來(lái)重點(diǎn)分析可知: 茶園的Contrast紋理特征時(shí)序變化較大, 在3月時(shí)Contrast紋理特征變化最小(26.18); 隨后逐漸增大, 在10月份時(shí), 達(dá)到最大(144.05)。 森林的Contrast紋理特征在4月份時(shí) Contrast紋理特征值為最小(7.74); 在10月份時(shí), 達(dá)到最大(38.23)。 在所有地物中, 茶園的Contrast紋理特征變化最為明顯, 且在10月份時(shí)茶園和森林的Contrast紋理特征差異達(dá)到最大。 因此在利用Contrast進(jìn)行分類提取時(shí), 優(yōu)先選擇10月的Contrast特征來(lái)參與后續(xù)分類。 其他特征進(jìn)行同樣的分析可知, Homogeneity、 Dissmilarity、 Entropy、 Mean、 Variance等紋理特征差異比較明顯的月份分別在4月、 10月、 4月、 1月和2月。
圖5 紋理特征時(shí)序變化圖
Relief是一種多變量過(guò)濾式特征權(quán)重算法, 采用樣本距離來(lái)衡量特征的重要性, 即通過(guò)設(shè)定權(quán)值的閾值, 移除小于閾值的參數(shù)可以實(shí)現(xiàn)特征降維; 該算法能處理多種類型的數(shù)據(jù), 簡(jiǎn)單、 快捷且高效, 可以很好地去除無(wú)關(guān)特征[27-28]。 其Relief算法的主要步驟如下:
(1)定義所有樣本數(shù)據(jù)為m×n維數(shù)矩陣, 把n個(gè)樣本的特征數(shù)據(jù)存放于數(shù)據(jù)庫(kù)中, 并把待訓(xùn)練的第i個(gè)樣本的N個(gè)特征對(duì)應(yīng)在第i列中。
(2)尋找n的同類樣本中最近鄰樣本H和不同類樣本中的最近鄰樣本M;
(3)如果樣本n中的特征與同類H的距離小于與不同類M的距離, 則表明該特征可以實(shí)現(xiàn)不同地類的分類, 也進(jìn)一步說(shuō)明該特征的權(quán)重值較高。 則訓(xùn)練第p個(gè)特征樣本過(guò)程為:
定義不同維數(shù)特征初始權(quán)值為0, 且p=1, 2, …,N。
①定義訓(xùn)練的樣本總數(shù)為n, 在1到n中重復(fù)選取i值;
②定義所有不同樣本特征總數(shù)為N, 在1到N中重復(fù)選取p值;
③更新特征p的權(quán)值如式(1)所示。
(1)
其中, diff()函數(shù)形式如式(2)所示。
(2)
(4)重復(fù)迭代步驟3次, 獲取不同特征的平均權(quán)重值。 特征權(quán)重值越大, 則該特征對(duì)茶園分類的貢獻(xiàn)度越高。 本特征排序主要是基于python編程語(yǔ)言, 采用Relief算法實(shí)現(xiàn), 結(jié)果如圖6所示。
圖6 特征因子權(quán)重示意圖
根據(jù)特征排序結(jié)果, 選取特征權(quán)重值加權(quán)大于90%所有特征, 即NDVI_2、 PSSRA_2、 BI2_10、 Variance_2、 MCARI_10、 MEAN_1、 SAVI_10、 PVI_10、 DVI_10等9個(gè)特征, 依次遞增, 構(gòu)建了9類分類場(chǎng)景, 如表2所示。
表2 九種不同分類場(chǎng)景組合
為了評(píng)估上述分類場(chǎng)景對(duì)茶園提取的影響, 根據(jù)特征排序的權(quán)重值依次遞增特征, 組合成上述9類分類場(chǎng)景。 采用隨機(jī)森林分類方法對(duì)9種分類場(chǎng)景進(jìn)行處理, 主要由于隨機(jī)森林(random forest, RF)在處理高維數(shù)據(jù)時(shí)具有較強(qiáng)的靈活性且速度較快, 可解決過(guò)度擬合的問(wèn)題[29]。 同時(shí)為了探究不同分類方法對(duì)茶園提取的影響, 在利用隨機(jī)森林分類方法確定最佳分類場(chǎng)景后, 進(jìn)一步采用支持向量機(jī)(support vector machines, SVM)分類方法來(lái)驗(yàn)證不同分類方法對(duì)茶園提取精度的影響。 其中, 支持向量機(jī)分類方法核心思想是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集并且?guī)缀伍g隔最大的分離超平面, 該方法可以自動(dòng)尋找對(duì)分類有較大的區(qū)分度的支持向量并構(gòu)造分類器, 使得各類之間的間隔最大[30]。 為了更好地評(píng)價(jià)分類結(jié)果, 選取總體精度(overall accuracy)、 Kappa系數(shù)(Kappa coefficient)、 生產(chǎn)者精度(producer accuracy)和用戶精度(user accuracy)4個(gè)指標(biāo)來(lái)對(duì)茶園分類結(jié)果進(jìn)行評(píng)價(jià)。
根據(jù)上述9種分類場(chǎng)景, 采用隨機(jī)森林分類方法對(duì)英德市的茶園進(jìn)行了提取實(shí)驗(yàn), 并采用上述4個(gè)指標(biāo)對(duì)分類結(jié)果進(jìn)行驗(yàn)證(表3)。 由表3可知, 僅利用NDVI(Scenes_1)進(jìn)行分類時(shí), 其分類提取結(jié)果精度較低, 總體精度為72.02%, Kappa系數(shù)為0.64; 當(dāng)分類特征逐漸增多時(shí), 在Scenes_6場(chǎng)景時(shí), 分類精度達(dá)到最大, 總體精度為91.48%, Kappa系數(shù)為0.89, 生產(chǎn)者精度和用戶精度分別為89.86%和73.31%。 隨后增加分類特征, 但總體精度基本保持約91%, 且用戶精度降低。 由此可知其最佳分類場(chǎng)景為Scenes_6。
表3 不同分類場(chǎng)景精度評(píng)價(jià)結(jié)果
為了進(jìn)一步探討不同分類方法在茶園提取精度上的優(yōu)劣, 基于上述9種分類場(chǎng)景中的最優(yōu)分類場(chǎng)景(Scenes_6), 采用相同的訓(xùn)練和驗(yàn)證樣本數(shù)據(jù)集, 采用支持向量機(jī)(support vector machine, SVM)分類方法進(jìn)行茶園的提取實(shí)驗(yàn), 其統(tǒng)計(jì)結(jié)果如表4所示。 RF分類算法的總體精度為91.48%, Kappa系數(shù)為0.89, 生產(chǎn)者精度和用戶精度分別為89.86%和73.31%; SVM分類算法的總體精度為91.56%, Kappa系數(shù)為0.89, 生產(chǎn)者精度和用戶精度分別為80.22%和84.56%。 由上述分析可知, 在進(jìn)行茶園分類時(shí)SVM算法分類精度較高, 分類結(jié)果如圖7所示。 實(shí)驗(yàn)可知, SVM算法的總體精度及用戶精度相對(duì)于RF算法都較高, 對(duì)所分類的地類較細(xì)致, 這樣間接提高了分類的用戶精度, 而在一定程度上犧牲了生產(chǎn)者精度, SVM算法總體精度優(yōu)于RF。 但在數(shù)據(jù)處理過(guò)程中, SVM方法相比于RF方法耗時(shí)較長(zhǎng), 這在一定程度上也削弱了SVM的優(yōu)勢(shì)。
表4 不同分類方法精度評(píng)價(jià)結(jié)果
圖7 英德市茶園分布示意圖
主要探討了基于Sentinel-2影像并結(jié)合多時(shí)序多特征信息在茶園提取中應(yīng)用。 王斌[31]等采用Landsat-8 OLI影像, 選擇多季節(jié)的光譜、 紋理和物候特征進(jìn)行組合, 研究表明多季節(jié)特征融合提取精度高于單季節(jié), 其總體精度為92.4%, Kappa系數(shù)為0.897, 生產(chǎn)者精度為87.5%。 本工作同樣通過(guò)構(gòu)建多季節(jié)時(shí)序的植被、 紋理特征進(jìn)行不同場(chǎng)景組合, 可知分類場(chǎng)景為Scenes_6時(shí)精度較高, 其總體精度達(dá)到91.48%, Kappa系數(shù)為0.89, 生產(chǎn)者精度和用戶精度分別為89.86%和73.31%, 本研究結(jié)果與其結(jié)果相一致, 也證明了多季節(jié)特征構(gòu)建對(duì)于茶園提取精度具有重要作用。 本工作2月和10月為最佳提取時(shí)間, 可能是由于2月茶樹(shù)長(zhǎng)出嫩綠的新葉與周圍森林植被較易區(qū)分, 而在10月上旬茶樹(shù)進(jìn)行修剪階段, 茶樹(shù)的植被指數(shù)和紋理特征比較明顯, 進(jìn)而2月和10月的特征組合茶園提取的精度較高。 李龍偉[19]采利用多時(shí)相的Sentinel-2影像, 通過(guò)構(gòu)建歸一化茶園指數(shù)(normalized difference tea garden index, NDTI), 僅選取2月的NDVI和5月的NDTI, 利用決策樹(shù)分類方法對(duì)浙西北的茶園進(jìn)行了提取, 總精度達(dá)93.83%, Kappa系數(shù)為0.917, 茶園生產(chǎn)者精度為95.50%, 用戶精度為92.00%。 趙曉晴[20]等采用多時(shí)相的Sentinel-2影像, 結(jié)合紅邊波段和NDVI構(gòu)造了18個(gè)茶園的提取特征進(jìn)行實(shí)驗(yàn), 并采用決策樹(shù)分類算法對(duì)浙江杭州西湖區(qū)的茶園進(jìn)行了提取, 分類精度較高的前3個(gè)特征總體精度依次為96.71%、 94.24%和93.43%。 柏佳[34]等利用GF-1和Sentinel-2時(shí)序數(shù)據(jù), 對(duì)浙江省武義縣王宅鎮(zhèn)的茶園進(jìn)行了提取, 結(jié)合光譜和紋理特征, 采用隨機(jī)森林分類方法進(jìn)行研究, 結(jié)果表明總體精度為96.91%, 茶園提取的精確率為 89.00%。 同時(shí), 將SVM和RF分類結(jié)果與Chen等[33]采用決策樹(shù)方法進(jìn)行茶園分類結(jié)果對(duì)比可知: 基于決策樹(shù)的茶園分類結(jié)果, 用戶精度較高, 生產(chǎn)者精度較低; 而采用機(jī)器學(xué)習(xí)(RF和SVM)等算法進(jìn)行的茶園分類結(jié)果可知生產(chǎn)者精度較高, 用戶精度較低, 這主要是由于在利用決策樹(shù)分類時(shí), 相關(guān)參數(shù)的閾值設(shè)置直接影響了用戶精度, 在進(jìn)行閾值設(shè)置時(shí)閾值設(shè)定的范圍越小, 不同地類錯(cuò)分的可能性就較小, 但同時(shí)由于閾值設(shè)定的范圍較小, 導(dǎo)致不同地類漏分的可能性增大, 因此在分類結(jié)果中導(dǎo)致用戶精度較高, 生產(chǎn)者精度較低。 圍繞Sentinel-2數(shù)據(jù)的茶園種植提取的精度略高于本文, 這主要是由于李龍偉和趙曉晴等在進(jìn)行分類方法選擇時(shí)采用了決策樹(shù)分類方法, 該方法可以更加直觀地確定所選分類特征的閾值范圍。 與其他研究區(qū)相比, 本研究區(qū)的總面積相對(duì)較大, 而茶園總面積相對(duì)較少, 也對(duì)本提取精度造成了一定的影響。
以9期時(shí)序Sentinel-2影像數(shù)據(jù), 分析了茶樹(shù)生長(zhǎng)的物候特征, 并詳細(xì)研究了5種典型地物的植被指數(shù)和紋理特征時(shí)序變化, 采用Relief算法對(duì)所有特征進(jìn)行重要性排序, 旨在發(fā)掘可用于茶園提取的植被指數(shù)和紋理特征與最佳時(shí)間窗口, 探索多時(shí)相多特征融合在茶園遙感識(shí)別中的應(yīng)用潛力。 構(gòu)建了9種分類場(chǎng)景, 并采用RF算法對(duì)所有分類場(chǎng)景進(jìn)行精度評(píng)價(jià), 選取最佳分類場(chǎng)景, 并進(jìn)一步探討了RF分類算法和SVM分類算法對(duì)茶園提取的可行性。 通過(guò)對(duì)研究結(jié)果進(jìn)行分析, 得出結(jié)論:
(1)在進(jìn)行英德市茶園提取時(shí), 2月和10月是采用多時(shí)相構(gòu)造茶園多特征最佳組合的時(shí)間。
(2)通過(guò)Relief算法對(duì)所選取的特征進(jìn)行篩選排序, 其重要性排序?yàn)镹DVI_2>PSSRA_2>BI2_10>Variance_2>MCARI_10>MEAN_1>SAVI_10>PVI_10>DVI_10>Dissimilarit_10>CONTRAST_10>Homogeneity_4>Entropy_4。
(3)RF分類方法與SVM分類方法相比, 后者的精度略高, 其總體精度達(dá)到91.56%, Kappa系數(shù)為0.89, 生產(chǎn)者精度和用戶精度分別為80.22%和84.56%。