孟啟鳳,盧小平,張向軍,于海坤,李國清,朱夢豪
(1.河南理工大學(xué) 自然資源部礦山時空信息與生態(tài)修復(fù)實驗室,河南 焦作454150;2.河南省遙感測繪院,河南 鄭州 454003)
遙感技術(shù)由于具備觀測范圍大、時效性高等優(yōu)勢,可作為研究農(nóng)作物分類和提取農(nóng)業(yè)種植結(jié)構(gòu)的重要手段[1]。
目前,使用遙感技術(shù)進行地物分類的研究較多,常用的影像分類方法按照處理單元分為2類:基于像素分類(Pixel-based Image Classification,PBIC)與面向?qū)ο蠓诸?Object-based Image Classification,OBIC)[2]。其中PBIC方法應(yīng)用廣泛,Toll[3]和Martin等[4]于20世紀80年代使用多光譜掃描儀(Multi-spectral Scanner,MSS)、專題制圖儀(Thematic Mapper,TM)和Spot衛(wèi)星獲取同一研究區(qū)的影像并使用PBIC進行信息提取,結(jié)果表明隨著影像空間分辨率的提高,PBIC方法并不能得到更高的分類精度。除此之外,該方法只能利用像素信息,無法獲取鄰近像元信息,在分類后會導(dǎo)致“椒鹽現(xiàn)象”。OBIC方法則可以克服以上缺點,通過彌補PBIC導(dǎo)致的語義信息損耗,實現(xiàn)較高層次的遙感影像分類和地物提取。類似研究也表明,OBIC方法在中、高空間分辨率影像分析上有更好的效果[5]。隨著高分辨率影像的普及,OBIC方法的相關(guān)研究增加,自20世紀70年代以來,國內(nèi)外利用OBIC方法進行了大量的研究,已將其應(yīng)用于土地利用分類、道路提取和樹種識別等[6-9],但在農(nóng)作物精細分類方面的研究較少。
影像分割是OBIC的基礎(chǔ),主要包括3種模式:單時相影像分割、多時相影像組合分割和多時相影像分別分割[10]。分別分割會造成影像子對象邊界不對應(yīng)的現(xiàn)象,從而無法建立空間聯(lián)系,應(yīng)用范圍受限,這里不再介紹。單時相影像分割是使用最多的分割模式,在該分割模式基礎(chǔ)上已進行甘蔗識別、水稻提取和作物分類等研究[11-12],但應(yīng)用場景有限,僅適用于地物變化緩慢、地物類型單一的場景。多時相組合分割則可以彌補單時相影像分割的不足,該分割模式的問題主要集中在參與分割波段的選取上,一般多時相組合分割是機械地將多時相影像的光譜波段疊合后分割,沒有考慮到多個波段之間的相關(guān)性與互補性。為充分利用遙感影像中的隱藏信息,可以通過多個波段的運算和組合,挖掘新的特征波段參與分割,同時也可對參與分割的波段進行選擇,避免高度相關(guān)的波段同時參與分割導(dǎo)致算力消耗。自1999年以來,國內(nèi)關(guān)于多特征參與影像分析的研究逐漸增多,駱劍承等[13]和陳秋曉等[14]通過研究表明基于多特征的遙感影像能夠引入除光譜特征之外的時相特征與空間特征,特征選擇和特征組合意味著更多領(lǐng)域知識和規(guī)則融入分類過程,可以提高影像分析的智能化程度。但PBIC方法的作用對象是像素,無法通過空間特征進行影像分析,與之相比,OBIC方法可憑借影像對象充分利用各類特征,在影像分析上更具優(yōu)勢。
本研究以開封市通許縣為研究區(qū),以哨兵2號影像作為數(shù)據(jù)源,基于隨機森林算法對多個時相的影像特征進行優(yōu)選,利用多尺度分割算法將優(yōu)選特征在對象層面進行融合,進行多時相影像組合分割優(yōu)化,并統(tǒng)一不同時相影像的分割尺度,在此基礎(chǔ)上使用OBIC方法進行農(nóng)作物識別,探究多時相影像組合分割優(yōu)化后的表現(xiàn),以及OBIC方法在農(nóng)作物種植結(jié)構(gòu)監(jiān)測方面的可行性。
本文選擇開封市通許縣作為研究區(qū),以 2020年2月22日的哨兵2號真彩色影像描述概況,如圖1所示。該地年平均氣溫14.6 ℃,年平均降水量658.4 mm,年平均風(fēng)速1.8 m/s,主導(dǎo)風(fēng)向為東北風(fēng)。地勢平坦,種植結(jié)構(gòu)復(fù)雜,除了連片種植冬小麥、花生、棉花、玉米和紅薯等農(nóng)作物,大蒜、西瓜、辣椒和胡蘿卜等經(jīng)濟作物,還存在大量間作套種,其中通許縣中南部為優(yōu)質(zhì)專用小麥優(yōu)勢區(qū),西北部以種植胡蘿卜和反季蔬菜為主,東北部以種植大蒜為主。
圖1 研究區(qū)位及其哨兵2號影像
1.2.1 衛(wèi)星遙感數(shù)據(jù)
從歐洲航天局官網(wǎng)獲取哨兵2號影像的L2A級產(chǎn)品作為數(shù)據(jù)源,并剔除云量高于5%遙感影像,成像時間分別為2019年12月4日,2020年2月22日,2020年3月23日,2020年4月22日以及2020年5月22日。
1.2.2 野外調(diào)查數(shù)據(jù)
2019年12月21日到研究區(qū)展開實地調(diào)查,使用手持GPS采集樣本。采集時遵循空間上均勻分布的原則,后期根據(jù)實際采樣成果,利用高分影像進行目視解譯,補充樣本數(shù)量,最終的樣本狀況如表1所示。
表1 研究區(qū)樣本詳情
以哨兵2號影像為數(shù)據(jù)源,從多時相影像中提取光譜、紋理和植被指數(shù)等特征波段;使用隨機森林算法進行特征選擇,將優(yōu)選波段合成多特征影像后分割,并應(yīng)用OBIC;最后與最佳單時相影像分割、多時相影像組合分割后的OBIC結(jié)果進行比較,驗證本文提出方法的有效性。技術(shù)路線如圖2所示。
圖2 技術(shù)路線
本文通過對研究區(qū)不同時相哨兵2號影像的原始光譜波段進行組合運算獲取特征波段。其中歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)是描述生物量主要參量,但其對植被茂密區(qū)敏感度較低,而增強植被指數(shù)(Enhanced Vegetation Index,EVI)可彌補其不足,于是從各時相影像中分別提取NDVI,EVI,裸土指數(shù)(Bare Soil Index,BSI)共15個指數(shù)。紋理信息是對影像局部信息的描述,對地物識別起重要作用。本文使用灰度共生矩陣對各時相影像經(jīng)主成分變換后的第一主成分進行運算,提取各時相影像包括均值、方差、同質(zhì)性、對比度、非相似性、相似熵、角二階矩和相關(guān)性等共40個紋理特征作為初始波段,再引入各時相影像的原始光譜波段,共獲取115個波段。初始波段之間的相關(guān)性如圖3(a)所示。
(a)初始波段相關(guān)性
由圖3(a)可以看出,波段之間存在相關(guān)性和互補性,如果影像某些波段之間存在高度相關(guān),分析所有波段是不必要的。這就需要對參與組合分割的所有波段進行優(yōu)選,使優(yōu)選出的波段既能保留多時相遙感影像的主要信息,又能使參與分割的波段數(shù)量得到有效精簡,提高分割效率[15]。這里使用隨機森林算法對所有波段進行選擇[16],詳細步驟如下:
假設(shè)有N個訓(xùn)練樣本:
① 當n=1,創(chuàng)建決策樹Tn,記袋外數(shù)據(jù)(Out of Bag,OOB)為LOOBn。
④ 對于n=2,3,…,N,重復(fù)步驟①~③,計算所有波段。
(1)
由上可知,波段Xf變化引起的袋外誤差越大,表明波段Xf具有越高的重要性,最后將特征波段重要性與分類精度結(jié)合確定優(yōu)選波段的數(shù)量。
圖像分割效果是OBIC關(guān)鍵,利用單一尺度分割影像可能會造成分割過?;蚯贩指畹那闆r,很難完整反映對象特征。佃袁勇等[17]的研究表明多尺度分割效果更好,可以更全面、更完整地描述地理對象。這里采用分形網(wǎng)絡(luò)演化算法(Fractal Net Evolution Approach,FNEA)進行多尺度分割,在分類之前,需要根據(jù)研究區(qū)域地物塊狀特征調(diào)整圖像分割尺度,本文借助ESP尺度評價工具選取最佳分割尺度。除了分割尺度之外,多尺度分割時,形狀因子與緊致度因子對分割效果的影響是不可忽略的[18]。但緊致度因子與形狀因子無法通過具體公式選定,只可通過多次實驗比較分割結(jié)果發(fā)現(xiàn)二者之間的規(guī)律性。
JM(Jeffries-Matusita)距離是一種基于條件概率之差的光譜可分性度量標準。本文使用JM距離通過判斷樣本點在各時相影像中的分離性選取最佳單時相影像。當樣本之間的JM值大于1.9,小于等于2.0時,認為樣本之間可分離性高,該影像為最佳單時相影像。JM距離求解方法為:
JM=[2(1-e-B)]1/2,
(2)
式中,B表示巴氏距離,計算公式為:
(3)
式中,m1和m2為2個類別的某特征均值;σ1和σ2為2個類別的某特征標準差。
隨機森林算法不僅用于對高維數(shù)據(jù)進行特征重要性排序,還可用于影像分類。該算法通過在數(shù)據(jù)樣本上集成多個決策樹,然后從少量樣本中學(xué)習(xí)投票規(guī)則,最后通過投票決定地物的最終歸屬類型,并且集成決策樹思想使隨機森林分類算法具有很高的穩(wěn)定性,不易出現(xiàn)過擬合現(xiàn)象。
通過隨機森林法求得各特征波段重要性并進行排序,結(jié)果如圖4所示。
圖4 特征波段重要性
后續(xù)將特征波段重要性與分類精度結(jié)合確定優(yōu)選波段數(shù)量。經(jīng)多次實驗表明,當特征波段數(shù)量達到一定程度之后,分類精度隨波段數(shù)量少量增加變化不明顯,以10個特征波段為單位遞增,不僅可以明顯觀察到總體分類精度隨波段數(shù)量增加時的變化趨勢,決定優(yōu)選波段數(shù)量,還可以避免不必要的算力消耗。
本研究從特征波段重要性排序結(jié)果中選取重要性靠前的10個波段為基礎(chǔ),按重要性依次增加10個波段進行合成,并分別對具有不同波段數(shù)量所合成的多特征影像進行分類,把總體分類精度與Kappa系數(shù)作為選取多特征影像的重要參考,進而以該多特征影像所包含的波段作為優(yōu)選波段。分類精度詳情如圖5所示。
圖5 多特征影像分類精度隨特征波段數(shù)量變化情況
就分類精度來看,前10個波段合成的多特征影像分類精度較由更多波段合成的多特征影像低,前30,40,50個波段合成的多特征影像,分類總體精度與Kappa系數(shù)較高且相近,綜合考慮運算效率與后續(xù)分類精度,最終從115個波段中選取重要性靠前的30個波段作為優(yōu)選波段參與多時相影像組合分割,優(yōu)選波段詳情如表2所示。優(yōu)選后波段相關(guān)性如圖3(b)所示,可以看出,與初始波段相關(guān)性相比優(yōu)選波段相關(guān)性明顯降低。
由表2可以看出,從波段類型來看,光譜波段在優(yōu)選波段組合所占比重最大,貢獻個數(shù)為22個,植被指數(shù)次之,貢獻個數(shù)為7個,紋理特征最少,該結(jié)果與文獻[19]的研究成果相符,即研究所使用的影像空間分辨率相對于亞米級遙感影像來說,紋理信息不夠豐富,其擾動對分類精度影響較小,對優(yōu)選出來的波段組合貢獻薄弱。從時間維度來看,4月份獲取的影像貢獻的波段數(shù)量最多,3月份次之,其他月份最少且貢獻度相似。
表2 優(yōu)選波段詳情
借助ESP插件所得受試者工作特征(Receiver Operating Characteristic,ROC)曲線去分析最佳分割尺度。采用控制變量法,以步長為0.1進行多次實驗,確定緊致度因子與形狀因子。最終得到的多尺度分割參數(shù)如表3所示。
表3 影像分割參數(shù)詳情
由JM距離計算出各地物之間的可分離性狀況如表4所示。由表4分析可以看出,冬小麥與大蒜的光譜信息在多數(shù)時期都相互干擾,可分離性較弱,與菜地及其他地物的可分離性在2—4月則較好,綜合考慮各時相影像中地物樣本的可分離性以及對特征優(yōu)選子集的貢獻程度,選取4月份影像為最佳時相影像。
表4 樣本光譜可分性狀況
實驗將樣本按照3∶7的比例隨機分為訓(xùn)練樣本和驗證樣本,將訓(xùn)練樣本輸入隨機森林分類器中學(xué)習(xí),再將學(xué)習(xí)過的隨機森林分類器分別應(yīng)用于經(jīng)統(tǒng)一分割尺度分割后的最佳單時相影像、多時相影像和優(yōu)選波段合成的多特征影像,并基于樣本分類結(jié)果的混淆矩陣進行精度評價,評價結(jié)果如表5所示。經(jīng)混淆矩陣驗證得,本文提出的方法分類總體精度為86.02%,Kappa系數(shù)為0.792,較單時相影像分割后的OBIC分別提高6.36%和8.37%,整體精度得到了提升,較多時相影像組合分割模式下的OBIC分別提高了0.25%,0.47%??傮w而言,本方法優(yōu)于單時相影像分割模式下的OBIC和多時相影像組合分割模式下的OBIC。
表5 基于樣本分類結(jié)果的混淆矩陣
3種分割模式下的分類結(jié)果如圖6所示。由圖6對比結(jié)果可以看出,單時相影像分割模式下的OBIC結(jié)果存在大蒜與菜地混分現(xiàn)象,種植結(jié)構(gòu)邊界模糊,按照本文方法得到分類結(jié)果不僅精度高,而且與通許縣的農(nóng)業(yè)種植結(jié)構(gòu)更相符。
(a)最佳時相影像分類結(jié)果
與單時相影像相比,多特征影像更豐富的地物信息使得最終的分類精度高于單時相影像。雖然多時相影像分類效果與多特征影像差距甚小,但是多特征影像僅用30個特征波段參與分類就可以達到多時相影像60個波段參與分類的效果,證明該優(yōu)化方法兼具效率與精度。本文所用波段是根據(jù)研究區(qū)地物特點選取,受地域及地物覆蓋類型限制,后續(xù)研究將增加其他種植結(jié)構(gòu)或其他地區(qū)的分類實驗以進一步驗證該方法的適用性。