沈宇,李強(qiáng)子,杜鑫,王紅巖,張?jiān)?/p>
1.中國科學(xué)院空天信息創(chuàng)新研究院 遙感衛(wèi)星應(yīng)用國家工程實(shí)驗(yàn)室,北京 100101;2.中國科學(xué)院大學(xué) 資源與環(huán)境學(xué)院,北京 100049
遙感技術(shù)在農(nóng)業(yè)領(lǐng)域方面最先投入應(yīng)用并獲得顯著收益,它具有信息量大、快速、覆蓋面積廣的優(yōu)勢,是當(dāng)前條件下及時準(zhǔn)確監(jiān)測糧食種植面積的最佳手段(賈坤等,2011;朱秀芳等,2007)。作物遙感分類與識別是監(jiān)測農(nóng)作物遙感面積、長勢、產(chǎn)量及其他參數(shù)的基礎(chǔ)。充分利用當(dāng)前條件下的數(shù)據(jù)條件和特征信息是提高遙感農(nóng)作物識別精度的主要策略,但是農(nóng)作物遙感識別與面積估算的精度仍然有很大的提升空間(Jia 等,2012;任建強(qiáng)等,2015)。
玉米和大豆是兩種主要的糧食作物,及時、有效地大面積監(jiān)測兩者的種植面積是進(jìn)行產(chǎn)量精確預(yù)測和穩(wěn)定市場價格的基礎(chǔ)。目前,在遙感領(lǐng)域玉米和大豆的區(qū)分研究主要包含兩個方面。(1)利用多時相影像構(gòu)建時間序列光譜特征,通過特征的差異選擇最優(yōu)的區(qū)分時段或關(guān)鍵生育期對兩者進(jìn)行區(qū)分(封志明等,2014;李鑫川等,2013;劉佳 等,2015;潘耀忠 等,2011),(2)研究單波段光譜特征(如短波紅外特征)對玉米和大豆區(qū)分的潛力或者多種植被指數(shù)特征綜合提高玉米和大豆的識別精度(Dong 等,2016;李鑫川等,2013)。但是,這兩個方面均有一些不足之處。首先,基于時間序列特征的方法至少需要獲取一景生長后期的影像,推遲了玉米和大豆種植面積和分布信息獲取的時間,無法滿足當(dāng)前實(shí)時和連續(xù)監(jiān)測的需求。其次,玉米和大豆區(qū)分的潛在識別特征的研究常常只考慮了植被指數(shù)特征以及單波段光譜特征等方面(黃健熙等,2017;劉佳等,2016;王利民等,2018),很少涉及紋理特征以及其他特征參數(shù),這不利于充分利用多源特征綜合提高作物識別精度。最后,玉米和大豆的區(qū)分研究得到有效的遙感識別特征往往局限于單個實(shí)驗(yàn)區(qū)或者局部區(qū)域,在其他區(qū)域的適用性不得而知且不同實(shí)驗(yàn)區(qū)的最佳識別特征集也有不同,這不利于進(jìn)行遙感作物面積監(jiān)測的產(chǎn)業(yè)化進(jìn)程。因此,對玉米和大豆生長中期的種植面積和分布的監(jiān)測是有必要和有需求的,且綜合不同實(shí)驗(yàn)區(qū)的多源特征信息得到玉米大豆區(qū)分的穩(wěn)定的、固定的遙感識別特征集是有意義的。
有研究表明,利用特征優(yōu)選的方法綜合農(nóng)作物植被指數(shù)特征和紋理特征,可以大幅提升作物識別與分類的精度(孫寧等,2010;王娜等,2017;王文靜等,2017)。分類方法對玉米和大豆的識別也有重要的影響。遙感領(lǐng)域內(nèi)常用的分類方法如最大似然法(MLC)(徐新剛 等,2008)、支持向量機(jī)(SVM)(劉慶生等,2014)、決策樹(崔璐等,2019)等在進(jìn)行玉米和大豆的分類問題中取得的分類精度并不理想。這主要是由于選擇的分類器難以獲取有效的分類特征,或者分類器對分類特征不敏感。隨機(jī)森林分類算法是一種可以減少樣本異常和分類誤差的機(jī)器學(xué)習(xí)算法,它具有抗噪性能強(qiáng),預(yù)測準(zhǔn)確率高等優(yōu)勢,且不容易出現(xiàn)過擬合等優(yōu)勢(Wang 等,2017a)。劉毅等(2012)也充分比較了多種分類方法,發(fā)現(xiàn)隨機(jī)森林是在作物識別與面積提取方面能取得比其他方法更優(yōu)的結(jié)果,充分證明了該方法的有效性和對分類特征的敏感性。
本文選擇玉米和大豆的生長發(fā)育中后期為主要的識別時相,以GF-1 影像為數(shù)據(jù)源,計(jì)算多種類型植被指數(shù)特征和紋理特征,利用特征優(yōu)選方法分析多種遙感識別特征對玉米和大豆區(qū)分的敏感性,并結(jié)合隨機(jī)森林分類方法在兩個典型的種植區(qū)進(jìn)行分類實(shí)驗(yàn),本文研究目標(biāo)是找到大豆和玉米生長發(fā)育中后期遙感區(qū)分的有效特征集,提高兩者在該時期的分類識別精度。具體包括3個子目標(biāo):(1)篩選對玉米和大豆遙感區(qū)分具有積極意義的重要特征;(2)優(yōu)選具有最大可能實(shí)現(xiàn)玉米和大豆遙感區(qū)分的特征子集;(3)優(yōu)選具有不同區(qū)域適應(yīng)性的玉米和大豆的指示性遙感識別特征,為大范圍遙感應(yīng)用推廣提供參考。
本文選取安徽省泗縣和黑龍江省克東縣兩個典型的玉米和大豆種植區(qū)為研究區(qū)(圖1)。泗縣地處淮北平原東部(33°16′N—33°46′N,117°40′E—118°10′E),屬暖溫帶半溫潤季風(fēng)氣候,四季分明,光照充足,雨量適中,雨熱同期,主要種植夏糧作物玉米和大豆等??藮|縣位于黑龍江省北部(47°43′N—48°18′N,126°01′E—126°41′E),為中溫帶典型大陸性季風(fēng)氣候,冬季漫長、干燥、嚴(yán)寒;夏季溫和多雨。夏糧作物主要有大豆、玉米和水稻(水稻有小部分)。兩個研究區(qū)作物的生育期大致相同,黑龍江克東縣的玉米為單季夏玉米,播種時間為6月初,收獲時間為9月底,安徽省泗縣地區(qū)的玉米為春玉米,5月中下旬播種,9月中下旬收獲,兩地的大豆種植時間和收割時間相差不大。并且兩者的光譜信息在8月份之后變化不大且較接近(大豆處于結(jié)痂期、玉米處于開花期),利用遙感數(shù)據(jù)的原始波段光譜信息難以進(jìn)行區(qū)分,且兩地都有混種現(xiàn)象,增大了區(qū)分的難度。
圖1 研究區(qū)以及采樣地塊信息Fig.1 Study area and plot information of samples
黑龍江地區(qū)的實(shí)際野外采樣時間為是2017年8月17日,安徽省泗縣地區(qū)的野外調(diào)查時間是2017年8月1日。實(shí)際地面調(diào)查主要采用在研究區(qū)內(nèi)均勻布置樣方的方式進(jìn)行,泗縣地區(qū)共布設(shè)了25 個采樣區(qū),克東縣布置了20 個采樣區(qū),每個采樣區(qū)大小平均為500 m×500 m,在采樣區(qū)內(nèi)主要記錄各種地表類型的采樣點(diǎn),并結(jié)合遙感影像和Google Earth 參考影像勾繪對應(yīng)的地塊,調(diào)查記錄的數(shù)據(jù)主要有作物類型、作物種植面積、地塊經(jīng)緯度以及實(shí)地拍攝的照片。通過匯總發(fā)現(xiàn),泗縣地表類型主要有玉米、大豆、林地、草地、城區(qū)、裸地以及未種植地等;克東地區(qū)主要地表類型為玉米、大豆、林地、草地、蔬菜種植地、城區(qū)以及少量水稻和其他地類。
2.2.1 遙感數(shù)據(jù)及預(yù)處理
玉米和大豆生長中后期的區(qū)分是該研究的目標(biāo),所以該文選取了覆蓋玉米和大豆主要種植區(qū)的兩景GF-1 16 m 寬幅影像,影像時相的選取依據(jù)是兩地作物的物候信息表(表1),其中7月底至8月中下旬為大豆和玉米生長發(fā)育的中后期。黑龍江克東縣地區(qū)的影像時相為2017年8月27日,安徽省泗縣的影像為2017年8月17日,兩幅影像均全覆蓋研究區(qū),且云量較少。
表1 實(shí)驗(yàn)區(qū)玉米和大豆的物候信息以及數(shù)據(jù)時相Table 1 Phenology information and data phase of corn and soybean in the experimental area
在分類實(shí)驗(yàn)過程中需要計(jì)算遙感影像的植被指數(shù)以及紋理特征等信息,因此需要進(jìn)行遙感數(shù)據(jù)的預(yù)處理,其中關(guān)鍵步驟有:正射糾正、輻射定標(biāo)、基于FLAASH 模型的大氣糾正、影像裁剪等。其中正射糾正是基于ENVI 5.3 自帶的DEM 數(shù)據(jù)進(jìn)行,輻射定標(biāo)的絕對定標(biāo)系數(shù)來自于中國資源衛(wèi)星網(wǎng)站2017年發(fā)布的數(shù)據(jù)。
2.2.2 輔助數(shù)據(jù)
該研究用到的輔助數(shù)據(jù)主要有黑龍江克東縣和安徽泗縣的矢量數(shù)據(jù),黑龍江地區(qū)Google Earth 2017年8月18日的0.8 m 參考影像一幅,安徽泗縣2017年9月3日0.8 m 參考影像一幅(兩幅參考影像主要是為監(jiān)督分類時樣本選擇的時候結(jié)合野外調(diào)查數(shù)據(jù)作參考,對選擇的地塊邊界作進(jìn)一步修正),同時還有兩地區(qū)主要作物玉米、大豆的物候信息等。
該研究旨在建立玉米和大豆生長季中期或后期的遙感識別方法,以更早準(zhǔn)確獲取其種植面積信息。研究設(shè)計(jì)了兩種影像紋理特征算法,一為常用的基于灰度共生矩陣GLCM(Gray-Level Cooccurrence Matrix)的算法,另一種為改進(jìn)型局部二值圖模式ILBP (Improved LBP) 算法,其中ILBP 紋理和其他的局部二值圖模式均對條帶型紋理特征(如玉米制種田)(張超等,2017)具有較好的表征。在此基礎(chǔ)上,結(jié)合隨機(jī)森林分類方法,優(yōu)選玉米和大豆遙感識別的最佳影像特征集合,優(yōu)選方法采用基于卡方檢驗(yàn)的特征優(yōu)選。最后通過分析比較兩個實(shí)驗(yàn)區(qū)最佳影像特征集合的差異和共同點(diǎn),找到對玉米和大豆中后期遙感識別的指示性特征集,并分類實(shí)驗(yàn)與兩個地區(qū)的最優(yōu)分類結(jié)果做驗(yàn)證,驗(yàn)證指示性特征集的有效性和穩(wěn)定性。圖2為該研究的總體技術(shù)流程。
圖2 總體技術(shù)流程Fig.2 Overall technical process
該研究以GF-1 的4 個波段的反射率作為基本的影像分類特征,同時計(jì)算了10 種植被指數(shù)和2種不同的影像紋理特征。
3.1.1 植被指數(shù)計(jì)算
該研究共選取了10 種常見且廣泛應(yīng)用的植被指數(shù)(表2),它們對作物識別有很大的潛力和貢獻(xiàn)(田慶久和閔祥軍,1998)。其中有些植被指數(shù)的參數(shù)是根據(jù)地面地物的覆蓋度情況而定(吳朝陽和牛錚,2008)(表2)。表中“NIR”,“R”,“G”,“B”分別指代的是GF-1 在近紅外、紅、藍(lán)和綠波段的反射率,“SR”和“VR”分別指代的是土壤和植被在紅波段的反射率,“VNIR”指植被在近紅外波段植被的反射率。
表2 植被指數(shù)計(jì)算方法信息Table 2 Vegetation index calculation method information
3.1.2 紋理特征計(jì)算
本文計(jì)算得到GF-1 影像的兩種紋理特征灰度共生矩陣(GLCM) 紋理特征(Haralick,1982)和改進(jìn)型局部二值圖模式(ILBP)(Ojala 等,2001),它們在作物遙感分類與制圖領(lǐng)域得到了較好的應(yīng)用,并能夠在一定程度上提升作物識別的精度(宋翠玉等,2011;鄭淑丹等,2014)。
該研究首先進(jìn)行玉米和大豆遙感識別特征重要性的評估,在此基礎(chǔ)上通過分類實(shí)驗(yàn)確定最佳特征子集。最后通過分析不同實(shí)驗(yàn)區(qū)最佳特征子集的共性和差異以及分類精度,確定玉米和大豆遙感識別的指示性特征子集。
特征變量重要性和特征選擇在農(nóng)作物遙感分類與識別中有著重要的地位(宋冬梅等,2015)。特征選擇不僅僅是大幅減少數(shù)據(jù)維度的一種方法(劉笑笑等,2017),而且還能夠幫助我們明確各種遙感識別特征與分類模型之間的敏感性并去除對分類體系貢獻(xiàn)較小的特征集,進(jìn)而提高分類效率和精度。特征選擇是利用一系列的原理和規(guī)則,得到特征重要程度的相對關(guān)系,自動選擇出對分類過程最重要的特征子集的過程。過濾式、封裝式和嵌入式是特征選擇的3 種典型模型(Dash 和Liu,1997)。過濾式特征選擇模型相對于其他兩種模型而言對遙感分類與識別有更廣泛的應(yīng)用,因?yàn)樗苯用鞔_了每個遙感識別特征與標(biāo)簽的相關(guān)性并以相對分值的形式進(jìn)行表征,計(jì)算量小且效果明顯(Hall和Smith,1999)。
該研究采用一種基于過濾式模型的特征選擇方法,基于卡方檢驗(yàn)的特征選擇方法??ǚ綑z驗(yàn)是一種用途很廣的計(jì)數(shù)資料的假設(shè)檢驗(yàn)方法,它屬于非參數(shù)檢驗(yàn)的范疇,可以基于數(shù)據(jù)出現(xiàn)頻率計(jì)算自變量對因變量的相關(guān)性。在遙感分類特征選擇過程中,可以用于計(jì)算某個影像特征對目標(biāo)類別的重要性得分,得分越高表明該影像特征對分類的貢獻(xiàn)越大。
式中,A是實(shí)際值,T為理論值,“?2”用于衡量實(shí)際值與理論值的差異程度(核心思想)。
該研究首先利用基于卡方檢驗(yàn)的SelectKBest方法從構(gòu)建的光譜特征、植被指數(shù)以及紋理特征的特征空間中優(yōu)選出K個特征(K值可以人為設(shè)定),并用于隨機(jī)森林分類,通過分析特征個數(shù)(K)與分類精度的關(guān)系可以得到不同實(shí)驗(yàn)區(qū)的最佳遙感特征子集。然后,基于不同實(shí)驗(yàn)區(qū)區(qū)分玉米和大豆的最佳特征子集,分析對玉米和大豆區(qū)分貢獻(xiàn)較大的特征類型及其差異,并結(jié)合該兩種作物中后期的生理生化參數(shù)的差異,指出對玉米和大豆生育中后期的遙感指示性特征集。
該研究選取隨機(jī)森林分類算法(RF)進(jìn)行玉米和大豆的區(qū)分。隨機(jī)森林分類算法是一種以結(jié)合弱分類器形成強(qiáng)分類器為主要思想的分類方法,具有抗噪能力強(qiáng)、受人為因素影響小以及較高的分類能力等優(yōu)勢,相對于其他分類器,如SVM 而言,設(shè)置的參數(shù)更少并且更容易。隨機(jī)森林分類算法的基本思想是通過隨機(jī)地有放回地抽取訓(xùn)練樣本的技術(shù),即bootstrap sample 重采樣技術(shù),不斷地生成訓(xùn)練樣本和測試樣本,將訓(xùn)練樣本輸入到每棵分類樹(弱分類器)中進(jìn)行分類形成隨機(jī)森林,最終對若干個弱分類器的分類結(jié)果進(jìn)行投票選擇,從而組成一個強(qiáng)分類器對影像進(jìn)行分類和預(yù)測。
該研究利用基于實(shí)際地面樣本數(shù)據(jù)的混淆矩陣來計(jì)算玉米和大豆分類的精度。一方面使用kappa 系數(shù)和總體分類精度用來評價分類的整體精度,另一方面使用條件kappa 系數(shù)(Song 等,2012)來評價單類地物的分類精度??傮w精度能夠?qū)τ衩缀痛蠖箙^(qū)分的整體效果進(jìn)行評價,單類分類精度能夠?qū)饬糠诸惼鲗Σ煌卣鞯拿舾行砸约伴g接的從錯分和漏分角度評價分類效果。
在兩個實(shí)驗(yàn)區(qū),該研究通過遙感識別特征集優(yōu)選和隨機(jī)森林算法,可以分別得到一組優(yōu)選的分類特征集(A5 和B5)以及分類結(jié)果,然后設(shè)置了對照實(shí)驗(yàn)(A1、A2、A3 和A4),分析比較各種玉米大豆生長中期的特征集的遙感識別能力,當(dāng)優(yōu)選的特征子集的分類結(jié)果優(yōu)于常規(guī)特征組合分類結(jié)果且分類精度達(dá)到一定水平,才能確認(rèn)其有效可用(此時的優(yōu)選特征子集即該實(shí)驗(yàn)區(qū)區(qū)分兩者的最佳特征集),這是進(jìn)行指示性特征集驗(yàn)證的基礎(chǔ)。然后,設(shè)置指示性特征集驗(yàn)證實(shí)驗(yàn)(A6 和B6),通過與最佳特征集(A5 和B5)的分類精度與效果作對比,驗(yàn)證指示性特征集的有效性和穩(wěn)定性。各個組別的特征組合信息如表3(A1—A6表示泗縣各個實(shí)驗(yàn)組,B1—B6 表示克東縣各個實(shí)驗(yàn)組)。
表3 實(shí)驗(yàn)方案特征組合信息Table 3 The information of feature combinations in different experimental groups
該研究首先利用基于卡方檢驗(yàn)的特征優(yōu)選方法分別計(jì)算兩個實(shí)驗(yàn)區(qū)內(nèi)的50 個特征的重要性得分(圖3、圖4 中展示了前20 個特征的重要性得分)??梢园l(fā)現(xiàn)不同的影像特征對于玉米和大豆的區(qū)分能力差異較大,如植被指數(shù)中RVI、DVI、TVI 等特征重要性得分相對較高,而紅波段反射率(R)及其相關(guān)紋理特征(B3_mean,B3_Homogeneity,B3_Dissimiliarity)除B3_Entropy外均不太理想。
圖3 泗縣各個特征的重要性得分Fig.3 The importance score of each feature of Si County
圖4 克東縣各個特征的重要性得分Fig.4 The importance score of each feature of Kedong County
該研究通過逐漸增加重要性較高的影像特征,分析影像特征數(shù)量K與分類精度的關(guān)系(圖5、圖6),可以發(fā)現(xiàn):(1)隨著優(yōu)選特征的個數(shù)增加,玉米和大豆的整體辨識精度首先快速增加,并穩(wěn)定在較高的水平(0.97),隨著影像特征數(shù)量的繼續(xù)增加,精度開始出現(xiàn)下降,并呈現(xiàn)波動的狀態(tài)(0.93 左右),Kappa 系數(shù)的情形與此類似;(2)兩個實(shí)驗(yàn)區(qū)的總體分類精度的最高水平分別出現(xiàn)在特征個數(shù)為17個(泗縣)和15個(克東縣);(3)分析能夠產(chǎn)出最高精度的特征組合(表5),發(fā)現(xiàn)主要由植被指數(shù)(6 個)和GLCM 紋理特征(熵和二階矩)為主,植被指數(shù)的特征重要性要高于紋理特征,ILBP紋理特征表現(xiàn)一般。
圖5 泗縣特征個數(shù)與分類精度的關(guān)系Fig.5 Relationship between the number of features and classification accuracy of Si County
圖6 克東特征個數(shù)與分類精度的關(guān)系Fig.6 Relationship between the number of features and classification accuracy of Kedong County
比較兩個研究區(qū)優(yōu)選特征子集中植被指數(shù)發(fā)現(xiàn)具有一致性(表4),植被指數(shù)中的RVI,DVI,TVI,MCARI等均對分類精度有較大貢獻(xiàn)。表明這些指數(shù)能夠表征玉米和大豆兩種作物的光譜差異。研究表明,生長季中后期玉米和大豆的葉面積指數(shù)有明顯差異(大豆高于玉米)(宋開山等,2005),并且由于玉米對陽光的競爭力大于大豆,導(dǎo)致大豆在該時期葉綠素含量迅速降低,兩者的生物量也會產(chǎn)生明顯差別(韋柳佳等,2013)。兩個實(shí)驗(yàn)區(qū)的玉米大豆種植情況不同,這是各個特征之間重要性得分高低的根本原因??藮|地區(qū)的玉米和大豆多為大田種植,田塊內(nèi)大多為純像元,植被指數(shù)與其他參數(shù)(如葉面積指數(shù)等)的相關(guān)性幾乎不會受到混合像元的影響。而TVI與葉面積指數(shù)的相關(guān)性較RVI 和NDVI 更好(湯旭光 等,2010),所以對于克東縣地區(qū)的玉米和大豆的區(qū)分而言,TVI的特征得分更高。泗縣地區(qū)由于存在較多的混種和間種現(xiàn)象,且種植密度較大,植被指數(shù)與葉面積指數(shù)的相關(guān)性受到混合像元和高覆蓋度植被指數(shù)敏感性飽和的影響,僅僅使用表征葉面積指數(shù)的植被指數(shù)進(jìn)行兩者的區(qū)分是不充分和不準(zhǔn)確的。所以對于泗縣地區(qū)而言,表征作物生物量和葉綠素含量的植被指數(shù)在該時期對兩者的區(qū)分有更大的能力。植被指數(shù)RVI和DVI與作物的生物量和葉綠素含量的相關(guān)性比其他類型的植被指數(shù)更高(李衛(wèi)國等,2017),所以泗縣地區(qū)該兩者特征的重要性得分更高。其次,植被指數(shù)中MCARI 與葉綠素的濃度相關(guān)性較好且克服了高覆蓋度植被敏感性飽和的問題(吳朝陽和牛錚,2008),作為兩者生長中期區(qū)分的補(bǔ)充數(shù)據(jù),一定程度上能夠增強(qiáng)兩者辨識的精度。
表4 兩個實(shí)驗(yàn)區(qū)的優(yōu)選特征子集信息Table 4 The selected features of two different experimental areas
比較兩個研究區(qū)優(yōu)選特征子集中紋理特征發(fā)現(xiàn)具有相似性(表4),4個波段的二階矩和熵在兩個實(shí)驗(yàn)區(qū)的分類中表現(xiàn)突出,但略有差異。相異性和同質(zhì)性也有貢獻(xiàn)。有研究指出灰度共生矩陣中的信息熵和二階矩對城鎮(zhèn)用地和局部光譜反射率較一致的地物如水體等區(qū)分較好(彭光雄等,2007),而大豆玉米生育中期都處于生長茂盛期,大部分大塊田中的作物長勢較均勻,所以這兩種紋理特征能夠有效提高兩者在中期的整體區(qū)分效果,特征得分相對于其他紋理而言較高。
利用優(yōu)選的玉米和大豆生長季中期遙感區(qū)分的最佳特征集,分別在兩個實(shí)驗(yàn)區(qū)進(jìn)行分類實(shí)驗(yàn),并使用同樣的遙感識別特征,即:TVI+RVI+DVI+MCARI+4 波段的熵特征+4 波段的二階矩特征。通過分析各個實(shí)驗(yàn)組(見2.4 節(jié))的玉米和大豆整體識別精度以及單類分類精度(圖8、圖9)。得到以下結(jié)果。
圖8 泗縣各實(shí)驗(yàn)組方案分類精度Fig.8 Classification accuracy of each experimental group
圖9 泗縣各實(shí)驗(yàn)組分類效果Fig.9 Mapping performance of each experimental group in Si County
(1)通過特征優(yōu)選出的最佳特征子集(A5、B5)與隨機(jī)森林分類器結(jié)合,能夠得到比常規(guī)特征組合更高的分類精度。這主要是因?yàn)锳5和B5綜合了多種不同的遙感識別特征,且對多源特征進(jìn)行了優(yōu)選和剔除。
圖7 泗縣各實(shí)驗(yàn)組方案分類精度Fig.7 Classification accuracy of each experimental group
(2)簡單的將紋理、光譜和植被指數(shù)特征融合(A4、B4)用于分類,精度提升不明顯;多種特征之間的簡單疊加如果不經(jīng)過特征的有效選取,只會增加特征維數(shù)和導(dǎo)致數(shù)據(jù)冗余,最終對分類精度的提高貢獻(xiàn)較小。
(3)植被指數(shù)的參與(A3、B3)相對于紋理特征(A2、B2)對分類精度的提升更大;因?yàn)榧y理特征是基于光譜反射率計(jì)算的二級特征(Hasituya 等,2016),它對分類精度的提升作用較小。
(4)利用玉米和大豆中后期的指示特征集進(jìn)行分類(A6、B6),發(fā)現(xiàn)在兩個實(shí)驗(yàn)區(qū)的分類精度均接近最優(yōu)分類精度,說明了該特征集具有效性,且能夠適應(yīng)不同實(shí)驗(yàn)區(qū)的種植制度差異,表現(xiàn)出較強(qiáng)的穩(wěn)定性。
圖9、圖10 為依據(jù)表3 分組信息進(jìn)行隨機(jī)森林分類的玉米大豆制圖結(jié)果。通過局部分析發(fā)現(xiàn)以下結(jié)果。
圖10 克東縣各實(shí)驗(yàn)組分類效果Fig.10 Mapping performance of each experimental group in Kedong County
(1)植被指數(shù)的參與,在一定程度上能夠提高玉米和大豆種植地塊的完整性,并能改善制圖精度和效果(圖8 A3 和A1;圖9 B3 和B1)。A3 和B3 中玉米和大豆的斑塊更加完整和清晰,類別間的邊界更加清晰明確。
(2)紋理特征的參與,可以有效地改善錯分和“椒鹽”現(xiàn)象。A2和B2中的孤立點(diǎn)現(xiàn)象明顯得到了改善,說明紋理特征能使錯分誤差降低,并改善“椒鹽”現(xiàn)象。
(3)基于最佳特征子集的隨機(jī)森林分類制圖效果最好(A5 和B5)。錯分和漏分現(xiàn)象得到了極大改善,同類地物的田塊準(zhǔn)確完整地分成了一類,不同地類之間的邊界清晰且?guī)缀鯖]有“椒鹽”現(xiàn)象,說明分類器對優(yōu)選出的特征子集有較好敏感性。
(4)基于該研究優(yōu)選的玉米和大豆生長中后期指示性特征子集,可以獲得幾乎最佳的制圖效果(A6 和B6),與最佳特征集(A5 和B5)得到的玉米和大豆制圖結(jié)果幾乎一致。
該研究選取了玉米和大豆典型的種植區(qū)域安徽泗縣以及黑龍江克東縣為研究區(qū),首先結(jié)合不同的分類特征設(shè)置4個實(shí)驗(yàn)對照組,同時使用特征優(yōu)選對多源遙感特征進(jìn)行選擇并結(jié)合隨機(jī)森林算法進(jìn)行分類,通過分析比較優(yōu)選特征子集和各個實(shí)驗(yàn)對照組的分類精度驗(yàn)證優(yōu)選子集對玉米大豆區(qū)分的有效性,以及對比不同實(shí)驗(yàn)區(qū)的優(yōu)選特征子集的異同點(diǎn),提出對玉米和大豆生長季中后期有指示性的特征集,并設(shè)計(jì)了分類實(shí)驗(yàn),驗(yàn)證該特征集的有效性和穩(wěn)定性。該研究旨在找到對玉米大豆作物生育中后期穩(wěn)定的指示性識別特征集,為玉米和大豆中后期面積監(jiān)測提供技術(shù)支撐。通過實(shí)驗(yàn)得出了以下3方面的結(jié)論。
(1)在玉米和大豆生長季中后期,可以找到具有高效辨識兩種作物的遙感特征。植被指數(shù)RVI、DVI、TVI 和MCARI 能一定程度上表征玉米大豆在該階段的冠層生理參數(shù)或光譜的差異(生物量、LAI 和葉綠素含量等等),從而提高兩種作物的區(qū)分能力;紋理特征二階矩和熵能夠增加大塊田中作物的辨識能力,提升兩者的整體識別精度,實(shí)現(xiàn)玉米和大豆的中期面積監(jiān)測估算。
(2)從多種類別的遙感影像特征中可以優(yōu)選出最佳分類特征子集,得到玉米和大豆的最優(yōu)識別效果,比僅僅使用原始波段特征分類的精度提升了近10 個百分點(diǎn),總體分類精度能夠平均達(dá)到97%,Kappa 系數(shù)能達(dá)到0.96,玉米和大豆的單類分類精度平均超過95%。
(3)該研究通過實(shí)驗(yàn)分析,考慮不同特征的物理意義和貢獻(xiàn),提煉出的玉米和大豆遙感區(qū)分的指示性特征集,可以得到幾乎與優(yōu)選出的最佳特征子集同樣的分類精度和制圖效果,且具有穩(wěn)定性和有效性,較最佳特征集更具推廣使用意義。指示性特征集包括了植被指數(shù)中的RVI,DVI,TVI,MCARI和紋理特征中的二階矩和熵。
該研究存在的局限性在于,它是基于16 m 分辨率的GF-1 影像得出的,對于空間分辨率更高、光譜波段更豐富的遙感影像,如哨兵2 號10 m 數(shù)據(jù)或GF-2 4 m 等,需要進(jìn)一步探究是否具有獲得更好識別效果的指示性特征集。其次,本研究同時選擇春玉米和夏玉米作為研究對象,在選擇影像時間上應(yīng)盡量選擇兩種玉米同一生育期內(nèi)的影像,減少對結(jié)果的影響。同時應(yīng)當(dāng)指出,野外調(diào)查的時間應(yīng)與遙感數(shù)據(jù)采集時相一致,減少在樣本選擇過程中由于時間差異較大光譜變化較快導(dǎo)致的樣本類型不確定問題,并影響最終結(jié)果。
今后的工作著重建議聚焦在:(1)其他類型的作物遙感特征的加入,如微波后向散射特征,作物的生化特征等;(2)針對遙感數(shù)據(jù)不同空間分辨率問題,進(jìn)一步探討不同尺度對作物組合最佳分類特征的影響;(3)進(jìn)行作物中前期的實(shí)驗(yàn),進(jìn)一步指出不同生育期的指示性特征集。