張紅華 趙威成 劉強凱
摘要 獲取水稻種植信息對于指導水稻生產,監(jiān)測作物生長及合理分配水資源具有重要意義。針對基于單時相影像提取水稻信息精度有限,以Sentinel-2A/B多時相影像為數據源,構建NDVI、EVI、NDWI和光譜特征4種時序特征數據集并設計6種試驗方案,結合隨機森林算法對水稻種植信息進行提取。結果表明,NDVI、EVI時序曲線可以較好反映出水稻生育期的物候特征,不同地類的光譜時序曲線和NDWI時序曲線可分離度較高,有利于提高分類精度;基于NDVI時序數據集的分類精度最低,基于光譜時序數據集的分類精度最高,總體精度達95.559 0%,Kappa系數為0.943 3,與基于NDVI的分類結果相比,總體精度、Kappa系數、水稻生產者精度和用戶精度分別提高了3.530 4%、0.044 9、8.64%和3.36%,水稻與旱地的混分現象得到有效抑制。該研究為區(qū)域水稻種植信息精確提取在數據源選擇、時序特征構建方面提供了一種新的思路和技術手段。
關鍵詞 Sentinel-2A/B;多時相;時序特征;水稻
中圖分類號 S127? 文獻標識碼 A? 文章編號 0517-6611(2022)07-0234-05
doi:10.3969/j.issn.0517-6611.2022.07.056
開放科學(資源服務)標識碼(OSID):
Rice Planting Information Extraction Based on Multi-temporal Remote Sensing Images
ZHANG Hong-hua, ZHAO Wei-cheng, LIU Qiang-kai
(Heilongjiang University of Science and Technology, Harbin, Heilongjiang 150022)
Abstract Obtaining rice planting information is of great significance for guiding rice production, monitoring crop growth and rational allocation of water resources. In view of the limited accuracy of extracting rice information based on single temporal image, four time-series feature data sets of NDVI, EVI, NDWI and spectral features were created based on sentinel-2A/B multi-temporal images. Six experimental schemes were designed to extract rice planting information combined with random forest algorithm. The results showed that NDVI and EVI time series could better reflect the phenological characteristics of rice growth period, and the spectral time series and NDWI time series of different land types had a high degree of separation, which was conducive to improve the classification accuracy;the classification accuracy based on NDVI time series dataset was the lowest, and the classification accuracy based on spectral time series dataset was the highest, the overall accuracy was 95.559 0%, and the Kappa coefficient was 0.943 3. Compared with the classification results based on NDVI, the overall accuracy, Kappa coefficient, rice producer accuracy and user accuracy were improved by 3.530 4%, 0.044 9, 8.64% and 3.36%, respectively. And? the mixing of rice and dry land was effectively controlled. This research provided a new idea and technical means for accurate extraction of regional rice planting information in data sources selection and time series feature construction.
Key words Sentinel-2A/B;Multi-temporal;Timing characteristics;Rice
準確獲取區(qū)域水稻種植結構信息,對于作物產量估計、種植結構調整具有重要意義[1]。與傳統(tǒng)的田間調查與統(tǒng)計匯總方法相比,利用遙感技術提取作物種植結構,更加直觀和準確[2]。水稻常與背景信息在空間上相互交錯,由水稻植株、水體和土壤的混合地物組成,這種組合的季相變換帶來的光譜信息差異可作為區(qū)分水稻田和其他地物的重要依據。作物生育期內,僅基于單時相影像難以將水稻與其他作物區(qū)分,可利用多時相影像獲取作物的時間序列特征來提取水稻信息。以往研究多是通過構建歸一化植被指數(Normalized Difference Vegetation Index,NDVI)時序數據集來進行作物的提取,如利用MODIS NDVI時間序列實現作物的識別[3-5],基于Sentinel-2[6-8]或GF-1[9-11]數據構建NDVI時間序列,基于多源影像構建NDVI時間序列等[12]。然而,目前利用多時相數據進行水稻提取多局限于構建NDVI時序數據,對其他時序特征很少關注和研究。鑒于此,筆者以黑龍江省五常市龍鳳山鎮(zhèn)為研究區(qū),利用作物整個生育期內的多時相Sentinel-2A/B遙感影像構建4種不同的時間序列特征,包括光譜特征、歸一化植被指數、增強植被指數(Enhanced vegetation index,EVI)、歸一化水體指數(Normalized difference water index,NDWI);同時設計6種時序特征組合方案,結合隨機森林分類方法提取水稻空間分布信息,以期提高區(qū)域尺度的水稻種植信息的提取精度,為精準農情監(jiān)測提供參考。
1 研究區(qū)及數據來源
該研究以黑龍江省五常市龍鳳山鎮(zhèn)為研究區(qū)(圖1),五常市位于黑龍江省南部(44°04′~45°26′N,126°33′~128°14′E),是五常大米主產地。五常市屬中溫帶大陸性季風氣候,夏短冬長,寒暑懸殊,年均氣溫3~4 ℃,年均降水量500~800 mm。由于氣候特征的影響,水稻主要分布于五常市西南的C型盆地中,因其獨特的地形條件,有利于在4—9月份達到優(yōu)質水稻所需要的活動積溫。
根據五常水稻生育周期,選取了涵蓋2021年整個生長季(5—10月)的10景Sentinel-2影像(表1),其中4景為Sentinel-2A數據,6景為Sentinel-2B數據。數據均來源于歐空局(ESA)數據中心(https://scihub.copernicus.eu/),產品等級為Level-2A級,其中紅綠藍和近紅外4個波段空間分辨率為10 m,坐標系WGS-84,投影UTM,Zone 52 N。該研究樣本數據主要通過實地調查和依據天地圖進行目視解譯2種方式獲取。于2021年8月對研究區(qū)進行樣本采集,包括地物類型、經緯度信息和生長狀況。
2 研究方法
以10景不同時期的Sentinel-2A/B影像為數據源,構建時間序列數據集,包括光譜特征、NDVI、EVI、NDWI,分析其時序曲線特征,利用隨機森林算法對水稻種植信息進行提取并評定其精度。
2.1 時序特征數據集的構建
2.1.1 時序光譜數據集。
該研究利用紅綠藍和近紅外4個10 m波段構建時序光譜數據集,10景影像共計40個波段,分析不同地類光譜曲線特征,進而完成分類。
2.1.2 NDVI時序數據集。
由于植被的紅邊效應,將紅光波段與近紅外波段進行組合形成的植被指數可以較好反應地表植被的生長狀況,其中歸一化植被指數(NDVI)是遙感影像分類中應用最廣泛的植被指數,是植被生長狀態(tài)和植被分布密度的最佳指數因子。NDVI時間序列可以反映出作物從播種、生長、成熟到收割的作物生長過程,以及植被覆蓋度的變化,并且消除一些輻射錯誤。NDVI的計算方法如式(1)所示:
NDVI=(ρ nir-ρ red)/(ρ nir+ρ red)(1)
式中,ρ nir為近紅外波段的反射率;ρ red為紅波段的反射率。
2.1.3 EVI時序數據集。
增強植被指數(EVI)通過加入藍色波段以增強植被信號,矯正土壤背景和氣溶膠散射的影響,該指數常用于植被茂密區(qū),計算方法見式(2)。
EVI=2.5ρ nir-ρ redρ nir+6ρ red-7.5ρ blue+1(2)
式中,ρ nir為近紅外波段的反射率;ρ red為紅波段的反射率。ρ blue為藍波段的反射率。
2.1.4 NDWI時序數據集。
歸一化水體指數(NDWI)是基于綠波段與近紅外波段的歸一化比值指數。該NDWI一般用來提取影像中的水體信息,效果較好。因水稻特有的水生特點,使得其生長環(huán)境離不開水體,所以引入NDWI,以便對水稻和其他植被或作物進行區(qū)分,NDWI的計算方法見式(3)。
NDWI=(ρ green-ρ nir)/(ρ green+ρ nir)(3)
式中,ρ green為綠波段的反射率;ρ nir為近紅外波段的反射率。
2.2 隨機森林算法
隨機森林是以CART決策樹為基本分類器的集成學習模型[13],采用自助抽樣技術隨機抽取大約2/3的樣本作為訓練樣本子集,未被抽中的1/3稱為袋外樣本(Out-Of-Bag,OOB),OOB數據可以通過內部交叉驗證的方法估算每一棵決策樹的泛化誤差,將隨機森林中所有決策樹的OOB誤差估計取平均值即可獲得整個隨機森林的泛化誤差估計。當輸入待分類的樣本時,最終的分類結果由單個決策樹的輸出結果投票決定。隨機森林克服了決策樹過擬合問題,對噪聲和異常值有較好的容忍性,在遙感影像信息提取方面取得了較好的分類效果[14-16]。
2.3 試驗方案
該研究設計6種試驗方案進行對比研究(表2),通過不同方案之間的對比,探索提高水稻信息提取精度的方法。
3 結果與分析
3.1 時序特征曲線
利用10期5—10月的遙感影像,分地類計算每期訓練樣本光譜特征、DNVI、EVI、NDWI的平均值,繪制時序曲線,如圖2~5所示。
從圖2可以看出,水體和建設用地的時序光譜曲線平穩(wěn),不同時期光譜反射率變化幅度較小,與綠色植被(林地、水稻、旱地)可分離度較高。水稻、旱地和林地在7—8月反射率值較高,整個生長季波譜變化幅度較大,但從時序曲線上來看,綠色植被間也表現了明顯的差異性,有利于提高其分類精度。從圖3的NDVI時序曲線來看,5種地類均有獨特的時序特征,林地、建設用地和水體可分離性較高,水稻和旱地在7—8月間NDVI值極為接近,可分離性稍差,該時期為水稻拔節(jié)期和抽穗期,生長旺盛,ENVI值較高,最大值達0.848 0。由圖4可知,各地類EVI時序曲線差異較明顯,但在7—8月間,水稻、旱地和林地的EVI值差異非常小,在7月24日、8月8日和8月18日的遙感影像上,綠色植被可分離性較差。由圖5中NDWI時序曲線可知,各地類間特征差異顯著,在生長季易混分的水稻和旱地也具有較好的可分離性??傮w來看,4類時序曲線僅在少數時相上存在水稻和旱地的分離度較低的情況,但各地類均有獨特的時序特征,有利于分類精度的提高。
3.2 隨機森林分類結果及精度評價
依據6種特征組合方案進行隨機森林分類,提取結果如圖6所示。該研究將研究區(qū)分為水稻、旱地、林地、建設用地和水體5種類型。通過與原始圖像對比可以看出,不同方案中旱地的提取結果存在差異,主要原因是水稻和旱地的混分;水體中大面積水域(即龍鳳山水庫)提取精度高,而河流和溝渠提取精度較低,存在建設用地和水體混分的現象;林地提取結果較理想。
利用驗證樣本計算混淆矩陣,通過總體精度、Kappa系數、各類別的生產者精度(Producer’s Accuracy,PA)、用戶精度(User’s Accuracy,UA)來評價不同試驗方案的分類精度(表3)。從總體精度和Kappa系數來看,方案1和2的分類精度相近,方案3、4和5的分類精度接近并高于方案1、2,方案6總體精度最高,與總體精度最低的方案1相比,總體精度和Kappa系數分別提高了3.530 4%和0.044 9,說明利用時序光譜特征進行分類的總體精度最高。由各地類的生產者精度和用戶精度可知,方案1即基于時序NDVI分類,旱地與水稻混分比例較高,旱地與水稻的生產者精度均低于90.00%,旱地的用戶精度低于70.00%,在方案2中混分現象沒有明顯改善,方案3中水稻和旱地的分類精度有較大提升,水稻的PA和UA分別提升了4.29%和2.68%,旱地分別提升了4.26%和8.95%;方案4和5的結果與方案3相比,分類精度提高有限,甚至方案4整體分類精度略低于方案3,說明在NDWI的基礎上加入NDVI或EVI,分類精度并沒有明顯提高;方案6總體精度最高,水稻和旱地的混分現象得到有效抑制,與方案1相比,水稻的PA和UA分別提升了8.64%和3.36%。綜上,方案6即利用時序光譜特征進行分類,各地類的分類精度及總體精度均較高,方案3即基于時序NDWI的分類結果也較為理想。
4 結論
利用覆蓋水稻完整生育期的多時相Sentinel-2A/B數據,構建NDVI、EVI、NDWI和光譜特征時間序列數據集并設計6種試驗方案,結合隨機森林算法進行五常市龍鳳山鎮(zhèn)水稻信息提取,同時計算混淆矩陣來評價不同實驗方案的水稻種植信息提取精度,主要結論如下:
(1)NDVI、EVI時序曲線可以明顯反映出水稻生長季的物候特征;各類地物的光譜時序曲線和NDWI時序曲線均具有的特征,有利于提高分類精度。
(2)基于NDVI、EVI時序數據集的分類結果,水稻與旱地混分比例較高,分類精度較低;基于光譜特征時序數據集的分類結果,總體精度、Kappa系數、水稻生產者精度和用戶精度均較高,同時水稻與旱地的混分現象得到有效控制。
由于該研究采用的是基于像素的分類方法,分類結果存在一定的“椒鹽現象”,未來應將時序數據集與基于對象的分類方法結合,減少“同物異譜”和“同譜異物”的產生。
參考文獻
[1] 陳安旭,李月臣.基于Sentinel-2影像的西南山區(qū)不同生長期水稻識別[J].農業(yè)工程學報,2020,36(7):192-199.
[2] 麥麗素,烏蘭吐雅.基于Sentinel-2數據的水稻面積提取方法比較分析[J].北方農業(yè)學報,2019,47(5):119-126.
[3] 周思,何祺勝,劉寶柱.基于MODIS的黑龍江省農作物種植結構提取研究[J].地理空間信息,2018,16(1):79-82.
[4] 郭昱杉,劉慶生,劉高煥,等.基于MODIS時序NDVI主要農作物種植信息提取研究[J].自然資源學報,2017,32(10):1808-1818.
[5] 朱彤,張學霞,王士遠,等.基于物候特征和混合光譜信息的春玉米種植面積提取[J].沈陽農業(yè)大學學報,2017,48(3):328-337.
[6] 王利軍,郭燕,賀佳,等.基于決策樹和SVM的Sentinel-2A影像作物提取方法[J].農業(yè)機械學報,2018,49(9):146-153.
[7] 畢愷藝,牛錚,黃妮,等.基于Sentinel-2A時序數據和面向對象決策樹方法的植被識別[J].地理與地理信息科學,2017,33(5):16-20.
[8] 杜保佳,張晶,王宗明,等.應用Sentinel-2A NDVI時間序列和面向對象決策樹方法的農作物分類[J].地球信息科學學報,2019,21(5):740-751.
[9] 張海東,田婷,張青,等.基于GF-1影像的耕地地塊破碎區(qū)水稻遙感提取[J].遙感技術與應用,2019,34(4):785-792.
[10] 楊閆君,占玉林,田慶久,等.基于 GF-1/WFV NDVI時間序列數據的作物分類[J].農業(yè)工程學報,2015,31(24):155-161.
[11] 萬叢,梁治華,張錦水.基于高分一號寬幅時序影像的冬小麥分布識別研究[J].安徽農業(yè)科學,2020,48(23):256-259.
[12] 王碧晴,韓文泉,許馳.基于圖像分割和NDVI時間序列曲線分類模型的冬小麥種植區(qū)域識別與提取[J].國土資源遙感,2020,32(2):219-225.
[13] 張磊,宮兆寧,王啟為,等.Sentinel-2 影像多特征優(yōu)選的黃河三角洲濕地信息提取[J].遙感學報,2019,23(2):313-326.
[14] 何云,黃翀,李賀,等.基于Sentinel-2A影像特征優(yōu)選的隨機森林土地覆蓋分類[J].資源科學,2019,41(5):992-1001.
[15] 馮文卿,眭海剛,涂繼輝,等.高分辨率遙感影像的隨機森林變化檢測方法[J].測繪學報,2017,46(11):1880-1890.
[16] 詹國旗,楊國東,王鳳艷,等.基于特征空間優(yōu)化的隨機森林算法在GF-2影像濕地分類中的研究[J].地球信息科學學報,2018,20(10):1520-1528.