韓衍欣, 蒙繼華
(1.中國(guó)科學(xué)院遙感與數(shù)字地球研究所數(shù)字地球重點(diǎn)實(shí)驗(yàn)室, 北京 100101; 2.中國(guó)科學(xué)院大學(xué),北京 100049)
我國(guó)是一個(gè)農(nóng)業(yè)大國(guó),農(nóng)業(yè)問(wèn)題一直是人們關(guān)注的焦點(diǎn)。人口的不斷增長(zhǎng)和耕地資源的減少,促使我國(guó)現(xiàn)代化農(nóng)業(yè)生產(chǎn)向集約化、精準(zhǔn)化方向發(fā)展[1]。隨著這種轉(zhuǎn)變,農(nóng)業(yè)生產(chǎn)過(guò)程中對(duì)空間信息,特別是動(dòng)態(tài)、大范圍、及時(shí)快速的農(nóng)作物信息需求越來(lái)越迫切[2]。及時(shí)了解農(nóng)作物空間分布、長(zhǎng)勢(shì)、產(chǎn)量以及農(nóng)業(yè)災(zāi)害等信息,對(duì)于實(shí)現(xiàn)科學(xué)管理和農(nóng)作物增產(chǎn)、輔助政府決策者宏觀掌握糧食生產(chǎn)和調(diào)控農(nóng)產(chǎn)品貿(mào)易具有重要意義[3-4]。
遙感具有覆蓋面積大、高效及時(shí)、省時(shí)省力的優(yōu)點(diǎn),能夠?yàn)檗r(nóng)業(yè)部門(mén)提供及時(shí)準(zhǔn)確的農(nóng)田信息,越來(lái)越多地應(yīng)用于農(nóng)業(yè)生產(chǎn)與管理[5]。目前,遙感已經(jīng)成為精準(zhǔn)農(nóng)業(yè)中獲取農(nóng)作物信息的重要手段,在農(nóng)作物分類(lèi)[6]、長(zhǎng)勢(shì)評(píng)價(jià)[7-8]、物候監(jiān)測(cè)[9]、產(chǎn)量估測(cè)[10]和農(nóng)業(yè)災(zāi)害評(píng)估[11]等領(lǐng)域取得了越來(lái)越多的成果。農(nóng)作物種植面積是影響糧食產(chǎn)量的重要因素之一[12],它反映了農(nóng)業(yè)生產(chǎn)資源的情況,是重要的農(nóng)情信息[13]。了解農(nóng)作物空間分布信息是開(kāi)展農(nóng)作物長(zhǎng)勢(shì)、產(chǎn)量和成熟期等專(zhuān)題監(jiān)測(cè)的前提,而提取這一信息的關(guān)鍵是農(nóng)作物類(lèi)型的精確識(shí)別,遙感為其提供了豐富的數(shù)據(jù)和方法[14]。通過(guò)遙感快速、準(zhǔn)確識(shí)別各種農(nóng)作物類(lèi)型,對(duì)于完善農(nóng)作物面積監(jiān)測(cè)方法、開(kāi)展農(nóng)作物生產(chǎn)水平遙感評(píng)估等具有重要意義。
通常,根據(jù)分類(lèi)的基本單元,可以將農(nóng)作物遙感分類(lèi)方法分為面向亞像元、像元、對(duì)象和地塊4種類(lèi)型[15],這些分類(lèi)方法在理論、技術(shù)方法和實(shí)踐方面都取得了長(zhǎng)足的進(jìn)展[16-18]。傳統(tǒng)基于像元的分類(lèi)僅著眼于局部而忽視地物之間的關(guān)聯(lián)關(guān)系,始終存在光譜變異和光譜混合問(wèn)題,嚴(yán)重影響農(nóng)作物分類(lèi)精度[19-21],因此許多學(xué)者根據(jù)農(nóng)作物種植結(jié)構(gòu)特點(diǎn),采取以地塊為基本單元的分類(lèi)方式來(lái)提高分類(lèi)精度[2]。面向地塊的農(nóng)作物遙感分類(lèi)利用真實(shí)的地塊邊界矢量數(shù)據(jù),可以解決面向像元分類(lèi)存在的問(wèn)題,相對(duì)于面向?qū)ο蠓诸?lèi)也更加符合實(shí)際。另外,面向地塊的農(nóng)作物遙感分類(lèi)以地塊為核心,有助于針對(duì)地塊形態(tài)特點(diǎn)選擇適宜空間分辨率的數(shù)據(jù)進(jìn)行分類(lèi),降低分類(lèi)精度對(duì)影像空間分辨率的依賴(lài)。一系列國(guó)情調(diào)查的有序推進(jìn),全面查清了我國(guó)土地利用狀況,陸續(xù)發(fā)布了很多重要的數(shù)據(jù)成果,其中包括農(nóng)村土地的范圍、類(lèi)型、面積和權(quán)屬等數(shù)據(jù)。隨著這些成果的推廣應(yīng)用,地塊數(shù)據(jù)越來(lái)越容易獲取,給面向地塊的農(nóng)作物遙感分類(lèi)提供了新的機(jī)遇。
本文對(duì)面向地塊農(nóng)作物遙感分類(lèi)的研究進(jìn)展進(jìn)行總結(jié),首先,介紹了地塊數(shù)據(jù)獲取的現(xiàn)狀; 其次,對(duì)面向地塊分類(lèi)的分類(lèi)策略、分類(lèi)特征和分類(lèi)方法進(jìn)行綜述和分析,同時(shí)指出該方法存在的問(wèn)題和面臨的挑戰(zhàn); 最后,對(duì)未來(lái)發(fā)展趨勢(shì)進(jìn)行了展望。
地塊是指具有同一權(quán)屬主的完整封閉的農(nóng)田,是農(nóng)戶(hù)生產(chǎn)經(jīng)營(yíng)的最小單位,是實(shí)現(xiàn)農(nóng)作物生產(chǎn)規(guī)劃、管理和效益評(píng)價(jià)的基本單元[22-23]。一般來(lái)說(shuō),一個(gè)地塊只種植一種農(nóng)作物,其邊界具有長(zhǎng)期穩(wěn)定性,可以重復(fù)多次使用,有利于開(kāi)展基于地塊的農(nóng)作物遙感分類(lèi)。地塊是一種特殊的對(duì)象,面向地塊分類(lèi)正是將遙感影像分為一個(gè)個(gè)地表真實(shí)的“地塊”對(duì)象并將其作為基本單元進(jìn)行分類(lèi),根據(jù)地塊內(nèi)像元的特性統(tǒng)計(jì)賦予地塊農(nóng)作物類(lèi)型,而不只是確定每個(gè)像元的類(lèi)型。地塊與普通對(duì)象又有所區(qū)別,對(duì)象是通過(guò)對(duì)高空間分辨率遙感影像進(jìn)行分割得到的,它的實(shí)質(zhì)是相對(duì)同質(zhì)像元的集合; 而地塊作為一種典型的地理對(duì)象,內(nèi)部除了農(nóng)作物純像元外,還可能存在一些混合像元和內(nèi)部變異。地塊與普通對(duì)象的另一個(gè)區(qū)別是邊界,對(duì)象邊界為了與像元邊緣保持一致往往呈鋸齒狀,而現(xiàn)實(shí)中的地塊邊界更加平滑。最后,對(duì)象僅針對(duì)像元間的同質(zhì)性進(jìn)行聚類(lèi),是自然的; 而地塊經(jīng)過(guò)人工勾繪,與農(nóng)作物種植實(shí)際情況相符,同時(shí)也被賦予了更多的社會(huì)屬性??偟膩?lái)說(shuō),地塊在參考像元間關(guān)系的基礎(chǔ)上,更多地考慮了農(nóng)作物種植的真實(shí)情況,提供了更為準(zhǔn)確的邊界、地理位置以及面積信息。因此,以地塊為基本單元的農(nóng)作物遙感分類(lèi)與面積監(jiān)測(cè)在精度和效率上都有很大優(yōu)勢(shì),可以服務(wù)于農(nóng)業(yè)普查和農(nóng)業(yè)保險(xiǎn)等領(lǐng)域。
目前面向地塊的農(nóng)作物遙感分類(lèi)研究中,地塊邊界矢量多來(lái)自于對(duì)衛(wèi)星影像、地籍?dāng)?shù)據(jù)或拓?fù)鋱D的數(shù)字化[24]。通過(guò)專(zhuān)業(yè)人員對(duì)高空間分辨率影像的目視解譯,在考慮像元相近性的基礎(chǔ)上引入先驗(yàn)知識(shí),可以更加準(zhǔn)確地進(jìn)行地塊邊界提取。但是在獲取大范圍地塊邊界數(shù)據(jù)時(shí),人工數(shù)字化的方式會(huì)耗費(fèi)大量時(shí)間,效率較低。
影像分割技術(shù)是獲取地塊邊界的另一種方式,它基于相鄰像元之間的光譜異質(zhì)度及設(shè)定的光譜異質(zhì)閾值對(duì)像元進(jìn)行合并和分割,形成由多個(gè)同質(zhì)像元組成的目標(biāo)對(duì)象[25]。對(duì)于同一景影像,通過(guò)選擇最優(yōu)分割尺度可以較為準(zhǔn)確地提取地塊邊界,但最優(yōu)分割尺度的選取比較復(fù)雜,它主要受地物類(lèi)型、周?chē)h(huán)境對(duì)比度和內(nèi)部異質(zhì)性影響[26]。在眾多分割算法中,多尺度分割(multiresolution segmentation,MRS)算法應(yīng)用最為廣泛[27-30],其中由eCognition軟件提供的分型網(wǎng)絡(luò)演化方法(fractal net evolution approach,F(xiàn)NEA)在視覺(jué)和數(shù)量方面都優(yōu)于其他MRS算法[31-32]。但是MRS算法中,每一類(lèi)只能選擇一個(gè)尺度,它忽略了周?chē)h(huán)境和內(nèi)部異質(zhì)性的影響,因此還不足以生產(chǎn)出精確的分割結(jié)果。另外,用戶(hù)還需手動(dòng)選擇最優(yōu)分割參數(shù)(包括定義斑塊大小的“分割尺度”、多光譜波段“顏色/形狀”的權(quán)重和斑塊緊密程度的“平滑/緊密”)來(lái)提升分割效果,而這一過(guò)程需要一定的經(jīng)驗(yàn),且是相當(dāng)費(fèi)時(shí)費(fèi)力的[33]。盡管影像分割技術(shù)已有了較大發(fā)展,但仍不能像目視解譯般準(zhǔn)確獲取所有地物邊界[34],因此自動(dòng)分割得到的地塊邊界往往仍需要手動(dòng)修正才能與實(shí)際邊界吻合。
隨著一系列國(guó)情普查成果的推廣應(yīng)用,地塊邊界數(shù)據(jù)更容易獲取[19]。目前的國(guó)情普查主要有第二次全國(guó)土地調(diào)查、第一次全國(guó)地理國(guó)情普查、第三次全國(guó)農(nóng)業(yè)普查和農(nóng)村土地確權(quán),雖然這些普查工作內(nèi)容和重點(diǎn)不同,但都針對(duì)我國(guó)土地情況展開(kāi)了調(diào)查,形成了多種全國(guó)范圍的地塊數(shù)據(jù)集。
第二次全國(guó)土地調(diào)查于2009年完成,利用現(xiàn)有土地調(diào)查成果和3S技術(shù),以1∶ 10 000比例尺和5 m圖斑采集精度對(duì)農(nóng)村土地進(jìn)行調(diào)查,確定了每塊土地的地類(lèi)、面積、權(quán)屬和分布信息,形成了最小圖斑面積為600 m2的全國(guó)各級(jí)基本農(nóng)田的分布數(shù)據(jù)[35]。2013—2015年第一次全國(guó)地理國(guó)情普查基于覆蓋全國(guó)的空間分辨率優(yōu)于1 m的多源遙感影像數(shù)據(jù),開(kāi)展了地表覆蓋調(diào)查(包括植被、水體、建筑物及地理單元等的普查),查清了我國(guó)農(nóng)田植被分布情況,地塊圖斑采集精度和最小圖斑面積分別為2.5 m和400 m2[36-37]。第三次全國(guó)農(nóng)業(yè)普查的重要內(nèi)容之一是農(nóng)作物種植面積遙感測(cè)量,查清了我國(guó)農(nóng)村土地利用和流轉(zhuǎn)情況[38]。農(nóng)村土地確權(quán)是指土地所有權(quán)、土地使用權(quán)和其他項(xiàng)權(quán)利的確認(rèn)、確定,全面開(kāi)展農(nóng)村土地確權(quán)登記頒證工作,有利于掌握農(nóng)用地的空間信息和權(quán)屬信息[39]。在開(kāi)展普查工作的同時(shí),國(guó)家也在建立健全數(shù)據(jù)共享機(jī)制,加強(qiáng)對(duì)普查成果的及時(shí)轉(zhuǎn)化和廣泛利用。隨著普查成果的不斷發(fā)布,越來(lái)越多的地塊數(shù)據(jù)實(shí)現(xiàn)了共享,將為面向地塊的農(nóng)作物遙感分類(lèi)提供重要數(shù)據(jù)支撐。
面向地塊的農(nóng)作物分類(lèi)思想最早由Derenyi[40]提出,它為解決像元分類(lèi)面臨的光譜變異和光譜混合問(wèn)題提供了一個(gè)簡(jiǎn)單有效的解決方案,之后國(guó)內(nèi)外學(xué)者開(kāi)展了大量研究,在面向地塊農(nóng)作物分類(lèi)領(lǐng)域取得了較大進(jìn)展。Wit等[34]研究了面向地塊思想在運(yùn)行化農(nóng)作物遙感監(jiān)測(cè)的精度和效率,結(jié)果表明地塊邊界有效降低了分類(lèi)誤差,總體精度可達(dá)85%以上,但是地塊邊界數(shù)字化效率較低; Conrad等[41]利用影像自動(dòng)分割技術(shù)勾繪地塊數(shù)據(jù),在中亞干旱區(qū)開(kāi)展了面向地塊的灌溉作物分類(lèi),實(shí)現(xiàn)了80%的分類(lèi)精度; 顧曉鶴等[19]使用不同特征和不同分類(lèi)器進(jìn)行面向地塊的冬小麥種植面積估算,結(jié)果表明基于地塊分類(lèi)的冬小麥總量精度和位置精度均高于像元分類(lèi); L?w等[42]根據(jù)前人研究選取了多種農(nóng)作物分類(lèi)特征,研究了特征選擇對(duì)面向地塊農(nóng)作物分類(lèi)精度和空間不確定性的影響。以上研究表明,面向地塊的農(nóng)作物遙感分類(lèi)切合實(shí)際,能夠?qū)崿F(xiàn)較高的分類(lèi)精度。
目前,面向地塊農(nóng)作物遙感分類(lèi)采用的策略主要有2種[34]。一種是將地塊看成一個(gè)整體,通過(guò)像元平均等方式統(tǒng)計(jì)地塊對(duì)象的特征(如平均反射率、平均植被指數(shù)、標(biāo)準(zhǔn)差和面積等),根據(jù)特征賦予地塊不同的農(nóng)作物類(lèi)型[43]。顧曉鶴等[19]在開(kāi)展面向地塊的農(nóng)作物分類(lèi)時(shí)便采用了以上策略,取得了較好的效果。但是從像元尺度轉(zhuǎn)換到地塊尺度,訓(xùn)練樣本數(shù)量會(huì)大幅減少,可能導(dǎo)致分類(lèi)精度下降。另外一種以像元分類(lèi)為基礎(chǔ),根據(jù)像元分類(lèi)的結(jié)果賦予地塊農(nóng)作物類(lèi)型屬性(如將地塊內(nèi)像元占比最高的類(lèi)別作為該地塊農(nóng)作物類(lèi)型)。為了分析不同策略面向地塊分類(lèi)的優(yōu)劣,Kussul等[44]改進(jìn)了分類(lèi)策略并對(duì)不同分類(lèi)策略進(jìn)行了研究。需要注意的是,不管采用哪種策略開(kāi)展農(nóng)作物遙感分類(lèi),均對(duì)地塊邊界數(shù)據(jù)的準(zhǔn)確性有較高要求。因?yàn)樵诘貕K邊界劃分不準(zhǔn)確的情況下,一個(gè)地塊可能包含多種農(nóng)作物,產(chǎn)生地塊尺度的“混合地塊”現(xiàn)象,最終會(huì)影響農(nóng)作物的分類(lèi)精度。
2.2.1 分類(lèi)特征
面向地塊與傳統(tǒng)面向像元、面向?qū)ο蟮霓r(nóng)作物遙感分類(lèi)相比,可使用的分類(lèi)特征差別不大,主要包括光譜特征、時(shí)相特征和空間特征。不管基于哪種分類(lèi)單元進(jìn)行遙感分類(lèi),分類(lèi)特征的選擇都是必不可少的,研究學(xué)者針對(duì)分類(lèi)特征進(jìn)行了相關(guān)研究。
光譜特征作為農(nóng)作物遙感分類(lèi)的物理基礎(chǔ),是農(nóng)作物生理生化參數(shù)和環(huán)境因子共同作用的結(jié)果,但是農(nóng)作物遙感識(shí)別中普遍存在“同物異譜”和“異物同譜”問(wèn)題[45]。如圖1所示,農(nóng)作物光譜受葉片內(nèi)部各種色素(葉綠素為主)和水分含量等因素的影響,呈現(xiàn)出區(qū)別于水體、土壤和建筑物等其他地物的獨(dú)特反射特征。劉亮等[46]充分利用高光譜數(shù)據(jù)豐富的光譜特征,采用分層分類(lèi)的方法對(duì)北京市順義區(qū)農(nóng)作物進(jìn)行了精細(xì)識(shí)別,各種農(nóng)作物分類(lèi)精度達(dá)到了95%以上; L?w等[42]通過(guò)分析不同特征對(duì)面向地塊農(nóng)作物分類(lèi)精度的影響發(fā)現(xiàn),包含RapidEye紅邊信息的特征能夠有效提高農(nóng)作物的識(shí)別精度; 劉佳等[47]在研究中引入RapidEye紅邊波段后提高了不同農(nóng)作物的可分性,總體識(shí)別精度提高了6.7%。另外,通過(guò)對(duì)多波段運(yùn)算獲得的多種指數(shù),如歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、歸一化水體指數(shù)(normalized difference water index,NDWI)和三角植被指數(shù)(triangular vegetation index,TVI)等特征在面向地塊的農(nóng)作物遙感分類(lèi)中的應(yīng)用也很廣泛[28]。微波數(shù)據(jù)可以提供農(nóng)作物幾何特征和土壤水分信息,在農(nóng)作物生長(zhǎng)發(fā)育不同時(shí)期呈現(xiàn)不同的散射特性,被較多地應(yīng)用于識(shí)別水稻等農(nóng)作物[48]。Kussul等[44]在開(kāi)展面向地塊分類(lèi)時(shí),綜合使用了Landsat8多光譜數(shù)據(jù)和Sentinel-1A合成孔徑雷達(dá)數(shù)據(jù),取得了較高的分類(lèi)精度。
圖1 農(nóng)作物反射光譜特征
時(shí)相特征是指農(nóng)作物在不同時(shí)相遙感影像上的變化規(guī)律,主要反映了農(nóng)作物在不同物候階段的生理生化差異。通過(guò)捕獲關(guān)鍵物候期的遙感數(shù)據(jù),分析農(nóng)作物不同時(shí)期的特征,可以提高目標(biāo)識(shí)別能力和精度。參考時(shí)相特征的農(nóng)作物遙感分類(lèi),根據(jù)遙感影像數(shù)量的多少,主要分為基于單一時(shí)相、多時(shí)相和時(shí)間序列遙感影像3種。Arikan[49]選取多時(shí)相Landsat7 ETM+影像,采用先面向像元再面向地塊的分類(lèi)策略進(jìn)行農(nóng)作物識(shí)別,識(shí)別精度比使用單景8月份影像提高了10%以上; Kussul等[50]使用6景Landsat8 OLI影像進(jìn)行面向地塊的分類(lèi),在分類(lèi)時(shí)去除云像元的影響,有效提高了分類(lèi)精度。
此外,遙感影像還可以提供空間特征,最常用的方法是提取影像的紋理特征,例如通過(guò)灰度共生矩陣計(jì)算的同質(zhì)性和差異性等。研究表明,地形(高程、坡度、坡向等)和氣象(日照、積溫、風(fēng)速、降水量等)等各類(lèi)專(zhuān)題信息也可以作為輔助數(shù)據(jù)特征應(yīng)用到農(nóng)作物遙感識(shí)別中[51]。Bolstad等[52]發(fā)現(xiàn)綜合利用Landsat TM影像、土壤和地形信息可以獲得較基于光譜數(shù)據(jù)分類(lèi)更高的精度; 吳炳方等[53]通過(guò)將Landsat TM數(shù)據(jù)劃分為各個(gè)小區(qū)進(jìn)行局部光譜訓(xùn)練和監(jiān)督分類(lèi),將早稻面積提取精度提高到85%以上,將中稻面積提取精度提高到80%以上。
2.2.2 特征選擇
隨著遙感技術(shù)的不斷發(fā)展,高時(shí)間、高空間分辨率衛(wèi)星不斷涌現(xiàn),提供了更豐富的地物分類(lèi)特征,使農(nóng)作物精細(xì)識(shí)別成為可能。但在實(shí)際應(yīng)用中,訓(xùn)練樣本有限,特征維數(shù)并不是越高越好,特征數(shù)量增加到某一臨界點(diǎn)后,繼續(xù)增加反而會(huì)導(dǎo)致分類(lèi)精度變低,這種現(xiàn)象被稱(chēng)為“休斯”現(xiàn)象或“休斯”效應(yīng)[54]。因此,評(píng)價(jià)各種特征對(duì)分類(lèi)的影響,從大量特征中優(yōu)選出對(duì)分類(lèi)貢獻(xiàn)最大的特征,從而使用最優(yōu)特征或特征組合識(shí)別農(nóng)作物,可以降低特征提取和分類(lèi)器的計(jì)算復(fù)雜度,降低分類(lèi)結(jié)果的不確定性,顯著提高農(nóng)作物分類(lèi)的效率。根據(jù)特征集合與學(xué)習(xí)算法結(jié)合方式的不同,特征選擇策略可以分為3類(lèi): 過(guò)濾式、封裝式和嵌入式[55]。
過(guò)濾式特征選擇獨(dú)立于分類(lèi)學(xué)習(xí)算法,由數(shù)據(jù)集直接求得優(yōu)化的目標(biāo)函數(shù),如特征的相關(guān)性和可分度等,用搜索算法得到最終的特征子集,最后應(yīng)用于分類(lèi)學(xué)習(xí)算法。過(guò)濾式特征選擇算法主要有主成分分析法和單變量特征選擇法等。王娜等[56]基于單變量特征選擇法對(duì)光譜特征、波段差值、植被指數(shù)和紋理特征等76個(gè)特征變量進(jìn)行優(yōu)選,分類(lèi)總體精度達(dá)到97.07%,Kappa系數(shù)達(dá)到0.96,降低特征維度的同時(shí)保證了較高的分類(lèi)精度。過(guò)濾式的優(yōu)點(diǎn)是簡(jiǎn)單、高效,但容易和后續(xù)的分類(lèi)算法產(chǎn)生偏差,于是出現(xiàn)了封裝式的特征選擇算法。
封裝式策略利用分類(lèi)器的分類(lèi)性能來(lái)評(píng)價(jià)特征子集的優(yōu)劣,在特征空間中篩選出具有較高性能的子集,直接構(gòu)造分類(lèi)模型。在封裝式的特征選擇算法中,有很多用來(lái)評(píng)價(jià)特征子集的學(xué)習(xí)算法,如遺傳算法等,這些算法都是將分類(lèi)算法性能作為子集的評(píng)價(jià)標(biāo)準(zhǔn)。該策略中特征選擇算法直接成為分類(lèi)學(xué)習(xí)算法的一個(gè)組成部分,有利于關(guān)鍵特征的辨識(shí),同時(shí)準(zhǔn)確率比較高。但是該算法在速度上比過(guò)濾式慢,時(shí)間復(fù)雜度較高。
嵌入式特征選擇是一種基本的歸納算法,從根本上說(shuō)是封裝式的發(fā)展和延伸。嵌入式特征選擇是在機(jī)器學(xué)習(xí)的過(guò)程中進(jìn)行的,實(shí)現(xiàn)特征分類(lèi)的方法是增加特征或者減少特征,也可以將不同特征組合。典型的嵌入式特征選擇算法主要有支持向量機(jī)(support vector machine,SVM)遞歸特征消除算法以及隨機(jī)森林算法等。L?w等[42]將隨機(jī)森林算法作為特征選擇策略,通過(guò)計(jì)算特征重要性得分對(duì)71個(gè)光譜特征和地學(xué)統(tǒng)計(jì)特征進(jìn)行優(yōu)選,并研究了不同特征對(duì)面向地塊農(nóng)作物分類(lèi)的貢獻(xiàn)大小。
農(nóng)作物遙感分類(lèi)是一個(gè)復(fù)雜的過(guò)程,分類(lèi)方法的選擇是分類(lèi)成功的關(guān)鍵。面向地塊的農(nóng)作物分類(lèi)實(shí)質(zhì)上只是改變了分類(lèi)的基本單元,而且一些面向地塊的分類(lèi)是以像元分類(lèi)為基礎(chǔ)的,因此在分類(lèi)方法的使用上與面向像元、面向?qū)ο蠓诸?lèi)是一致的。目前,國(guó)內(nèi)外發(fā)展了各種分類(lèi)技術(shù),針對(duì)農(nóng)作物面積的遙感提取方法除了常規(guī)的目視解譯,最大似然、最小距離和ISODATA等一些傳統(tǒng)的監(jiān)督、非監(jiān)督分類(lèi)方法外,還發(fā)展了決策樹(shù)、隨機(jī)森林和SVM等很多先進(jìn)的分類(lèi)算法。
2.3.1 傳統(tǒng)分類(lèi)器
監(jiān)督分類(lèi)是計(jì)算機(jī)自動(dòng)進(jìn)行農(nóng)作物遙感分類(lèi)經(jīng)常使用的一種手段,如美國(guó)LACIE計(jì)劃使用Landsat MSS數(shù)據(jù),其中部分結(jié)合航空影像,在已知地面樣方小麥種植情況和位置的前提下,采用分層監(jiān)督分類(lèi)的方法提取小麥的種植面積,達(dá)到90%以上的提取精度[57]; Yang等[58]使用SPOT5數(shù)據(jù),比較了最小距離、馬氏距離、最大似然和光譜角制圖等傳統(tǒng)監(jiān)督分類(lèi)法在農(nóng)作物分類(lèi)和面積提取效果上的差異,結(jié)果表明最大似然的精度高于其他3種分類(lèi)方法,最高可達(dá)91%。非監(jiān)督分類(lèi)方法不需要人工選擇訓(xùn)練樣本,僅需極少的人工初始輸入,計(jì)算機(jī)自動(dòng)根據(jù)像元光譜或空間等特征組成集群組,然后分類(lèi)者將每個(gè)組與參考數(shù)據(jù)比較,將其劃分到某一類(lèi)中[59]。長(zhǎng)期以來(lái),已經(jīng)發(fā)展了很多非監(jiān)督分類(lèi)方法,常用的有ISODATA和K-means分類(lèi)。Turker等[18]使用非監(jiān)督分類(lèi)方法開(kāi)展面向地塊的農(nóng)作物遙感識(shí)別,對(duì)比了不同傳感器數(shù)據(jù)下的分類(lèi)效果,對(duì)不同傳感器數(shù)據(jù)的適用場(chǎng)景進(jìn)行了總結(jié)。
2.3.2 決策樹(shù)與隨機(jī)森林
決策樹(shù)是由一系列的二叉樹(shù)構(gòu)成的樹(shù)形分類(lèi)器,根據(jù)規(guī)定的判斷規(guī)則,不斷地將影像的像元分割成相對(duì)同質(zhì)的數(shù)據(jù)子集來(lái)確定影像中每個(gè)像元所屬的正確類(lèi)型。決策樹(shù)分類(lèi)方法具有直觀簡(jiǎn)潔、可行性強(qiáng)、計(jì)算量小的特點(diǎn)。并且決策樹(shù)分類(lèi)還可以較好地對(duì)分類(lèi)過(guò)程和結(jié)果進(jìn)行解釋?zhuān)軌蚝芎玫乇硎静煌?lèi)型之間的相互關(guān)系。Li等[60]基于NDVI時(shí)間序列數(shù)據(jù),使用決策樹(shù)進(jìn)行面向?qū)ο蟮霓r(nóng)作物分類(lèi),總體精度達(dá)到90.87%。
通過(guò)改進(jìn)決策樹(shù)分類(lèi)器,獲得了很多新的數(shù)據(jù)挖掘算法,例如分類(lèi)回歸樹(shù)、C5.0和隨機(jī)森林。隨機(jī)森林是由多個(gè)決策樹(shù)組成的組合型分類(lèi)器,實(shí)質(zhì)是對(duì)決策樹(shù)算法的一種改進(jìn),它通過(guò)隨機(jī)等方式建立多個(gè)決策樹(shù),分類(lèi)時(shí)根據(jù)決策樹(shù)對(duì)樣本的投票決定樣本所屬的類(lèi)型[61]。隨機(jī)森林能夠在有效處理大量數(shù)據(jù)的同時(shí)避免過(guò)度擬合,具備訓(xùn)練樣本快、分類(lèi)精度高、抗噪性強(qiáng)等優(yōu)點(diǎn),因而被廣泛應(yīng)用于遙感分類(lèi)領(lǐng)域[62-63]。
Bagging是組合型分類(lèi)器中較為常用的算法,它的基本思想是從原始數(shù)據(jù)集中隨機(jī)、獨(dú)立地產(chǎn)生多個(gè)訓(xùn)練子集,然后將每個(gè)子集獨(dú)立地運(yùn)用于每個(gè)分類(lèi)器,每個(gè)分類(lèi)器對(duì)測(cè)試樣本進(jìn)行分類(lèi),最后將各個(gè)分類(lèi)器的分類(lèi)結(jié)果進(jìn)行組合[64]。隨機(jī)森林采用Bagging算法思想,從原始數(shù)據(jù)集中選取N個(gè)訓(xùn)練子集,每個(gè)訓(xùn)練子集大小約為原始數(shù)據(jù)的2/3,剩余的1/3數(shù)據(jù)作為測(cè)試樣本,通常被稱(chēng)為袋外數(shù)據(jù)(out-of-bag,OOB),OOB可以用來(lái)估計(jì)內(nèi)部誤差,進(jìn)而預(yù)測(cè)分類(lèi)的正確率[61]。根據(jù)自助樣本集生成的多個(gè)決策樹(shù)組成隨機(jī)森林,新數(shù)據(jù)的分類(lèi)結(jié)果根據(jù)決策樹(shù)的投票結(jié)果而定。
2.3.3 SVM
SVM是一種非參數(shù)分類(lèi)器,能夠解決復(fù)雜的分類(lèi)問(wèn)題。由于它具有適用于高維特征空間、小樣本統(tǒng)計(jì)學(xué)習(xí)、抗噪聲影響能力強(qiáng)等特點(diǎn),因而在遙感分類(lèi)中得到了廣泛應(yīng)用[65]。如果采取考慮地塊整體特征的策略進(jìn)行面向地塊的分類(lèi),訓(xùn)練樣本會(huì)大大減少,這時(shí)SVM就可以發(fā)揮很大優(yōu)勢(shì)。L?w等[42]綜合利用隨機(jī)森林和SVM進(jìn)行分類(lèi),首先根據(jù)隨機(jī)森林重要性得分評(píng)價(jià)特征,然后選取不同特征進(jìn)行SVM分類(lèi),研究了不同特征對(duì)面向地塊農(nóng)作物分類(lèi)的影響; Gu等[66]對(duì)比了SVM和最大似然法的面向地塊冬小麥面積監(jiān)測(cè)情況,結(jié)果顯示SVM分類(lèi)精度為97%,高于最大似然法的90%,而且面向地塊比面向像元能夠獲得更高、更穩(wěn)定的分類(lèi)精度。
雖然很多地區(qū)的地塊數(shù)據(jù)作為普查成果已經(jīng)實(shí)現(xiàn)了共享,但在不能通過(guò)該方式獲取地塊數(shù)據(jù)的情況下,矢量化和影像分割是2種常見(jiàn)的獲取方式,而這2種方式又各有優(yōu)缺點(diǎn)。通過(guò)對(duì)高空間分辨率影像等數(shù)據(jù)的矢量化可以獲得地塊邊界,這種人工目視解譯的方式獲得的邊界數(shù)據(jù)往往精度較高,與真實(shí)地理實(shí)體的重合度較高,但是該方式效率較低,難以在獲取大范圍地塊邊界時(shí)應(yīng)用。影像分割技術(shù)通過(guò)對(duì)同質(zhì)像元的自動(dòng)聚類(lèi),很大程度上提高了獲取地塊邊界的效率。但是,很多分割算法的結(jié)果是不可預(yù)測(cè)的,而且分割時(shí)無(wú)法將一些環(huán)境信息(如地塊形狀、種植結(jié)構(gòu)等)考慮進(jìn)去,在大多數(shù)情況下無(wú)法達(dá)到人工識(shí)別的準(zhǔn)確率。因此,為快速獲取準(zhǔn)確的地塊邊界數(shù)據(jù),應(yīng)改進(jìn)傳統(tǒng)技術(shù)或發(fā)展新的地塊邊界獲取方法。
地塊內(nèi)部不均一性會(huì)對(duì)面向地塊的農(nóng)作物遙感分類(lèi)產(chǎn)生干擾,主要包括2點(diǎn)問(wèn)題: ①地塊與對(duì)象的主要區(qū)別是地塊內(nèi)部不僅包含同質(zhì)像元,還存在一些其他像元(地塊邊界處的混合像元、由長(zhǎng)勢(shì)差異等原因引起的內(nèi)部變異像元以及受云覆蓋影響的像元等),無(wú)論采取何種面向地塊分類(lèi)的策略,這些干擾像元都將增加分類(lèi)的不確定性; ②雖然大多數(shù)地塊數(shù)據(jù)常年不變,但由于農(nóng)作物輪作與生產(chǎn)計(jì)劃改變,仍有部分地塊邊界會(huì)發(fā)生變化。如果這部分地塊數(shù)據(jù)更新不及時(shí),可能出現(xiàn)一個(gè)地塊種植多種農(nóng)作物的情況。如何解決干擾像元與地塊混合的問(wèn)題,最大程度發(fā)揮地塊數(shù)據(jù)在分類(lèi)中的優(yōu)勢(shì),亟需進(jìn)一步研究。
一般來(lái)說(shuō),遙感數(shù)據(jù)的空間分辨率越高,其識(shí)別地物的能力越強(qiáng),面向?qū)ο蠓诸?lèi)也大多針對(duì)高空間分辨率數(shù)據(jù)。但是,在實(shí)際開(kāi)展農(nóng)作物遙感識(shí)別工作中,農(nóng)作物可分辨程度不完全決定于空間分辨率,而是和目標(biāo)地塊的形狀、大小,以及它與周?chē)匚锪炼?、結(jié)構(gòu)的相對(duì)差異有關(guān)[59]。因此,不應(yīng)一味追求高空間分辨率,而是在獲得精確的地塊邊界后,分析空間分辨率對(duì)面向地塊農(nóng)作物遙感分類(lèi)的影響,研究不同地塊形態(tài)(大小、形狀等)下分類(lèi)精度與空間分辨率的關(guān)系,進(jìn)而選擇最優(yōu)空間分辨率的遙感數(shù)據(jù)。
目前農(nóng)作物遙感分類(lèi)特征選擇較多地考慮了遙感數(shù)據(jù)的光譜特征、時(shí)相特征和空間特征等,沒(méi)有充分研究從農(nóng)作物自身具有的特征進(jìn)行具有機(jī)理性的特征變量的構(gòu)建和選擇[51]。不同農(nóng)作物種植特點(diǎn)、生理生化參數(shù)和冠層特征等差異特別明顯,如果能將這些更具理論基礎(chǔ)的特征(如地塊形狀、葉綠素含量、葉面積指數(shù)和株高等)應(yīng)用于農(nóng)作物遙感分類(lèi),將會(huì)大幅提高農(nóng)作物遙感分類(lèi)精度。因此,應(yīng)該深入開(kāi)展農(nóng)作物遙感分類(lèi)新型特征的挖掘與綜合應(yīng)用。
在進(jìn)行監(jiān)督分類(lèi)時(shí),訓(xùn)練樣本的數(shù)量對(duì)分類(lèi)精度有較大影響,但是樣本采集是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作,通常情況下難以獲得理想數(shù)量的分類(lèi)樣本。如何用較少的樣本獲得較高的精度是農(nóng)作物遙感分類(lèi)中值得思考的問(wèn)題。在面向地塊的農(nóng)作物分類(lèi)中,若采用先面向像元再面向地塊分類(lèi)的策略,則可以將點(diǎn)類(lèi)型訓(xùn)練樣本擴(kuò)展至面,這樣就大大增加了訓(xùn)練樣本數(shù)量。另外,可以考慮不同分類(lèi)器對(duì)訓(xùn)練樣本的依賴(lài)度,在保證分類(lèi)精度的同時(shí)選擇對(duì)樣本依賴(lài)度較低的分類(lèi)器進(jìn)行分類(lèi)。
隨著遙感技術(shù)的快速發(fā)展,新型傳感器不斷涌現(xiàn),尤其是高空間分辨率影像的出現(xiàn),為農(nóng)作物精細(xì)識(shí)別提供了更加豐富的信息。但是基于像元的高空間分辨率遙感分類(lèi)往往面臨光譜變異和光譜混合問(wèn)題,面向地塊的農(nóng)作物遙感分類(lèi)能夠很好地解決以上問(wèn)題。近年來(lái),面向地塊的農(nóng)作物遙感分類(lèi)取得了很大進(jìn)展,但是仍存在很多難點(diǎn)和挑戰(zhàn),制約著分類(lèi)精度和效率。未來(lái)應(yīng)進(jìn)一步開(kāi)展面向地塊的農(nóng)作物遙感分類(lèi)研究,提高農(nóng)作物分類(lèi)精度和效率,滿(mǎn)足實(shí)際農(nóng)業(yè)應(yīng)用的需要。
1)應(yīng)用于面向地塊農(nóng)作物遙感分類(lèi)的數(shù)據(jù)應(yīng)多元化。高空間分辨率數(shù)據(jù)有助于獲取準(zhǔn)確的地塊邊界信息,因而被廣泛應(yīng)用于面向地塊的農(nóng)作物遙感分類(lèi)。但是高空間分辨率影像意味著有更多的信息需要處理,因此需要發(fā)展新的遙感信息處理技術(shù)。在發(fā)展新技術(shù)的同時(shí),不妨考慮在獲得準(zhǔn)確的地塊邊界后,針對(duì)研究區(qū)地塊特點(diǎn)利用中低空間分辨率遙感影像進(jìn)行農(nóng)作物識(shí)別,充分發(fā)揮中低空間分辨率數(shù)據(jù)幅寬大、重訪周期短、處理簡(jiǎn)單等優(yōu)勢(shì)。在進(jìn)行農(nóng)作物精細(xì)識(shí)別時(shí),應(yīng)充分考慮遙感數(shù)據(jù)光譜分辨率、空間分辨率和時(shí)間分辨率的關(guān)系,必要時(shí)充分利用多源遙感數(shù)據(jù)實(shí)現(xiàn)農(nóng)作物的精確提取。另外,地形、氣象和各類(lèi)專(zhuān)題信息等也可以作為輔助數(shù)據(jù)引入農(nóng)作物分類(lèi)中來(lái),以提高農(nóng)作物分類(lèi)精度。
2)地塊邊界獲取技術(shù)有待進(jìn)一步發(fā)展。盡管未來(lái)越來(lái)越多的地塊數(shù)據(jù)將實(shí)現(xiàn)共享,但部分地區(qū)在初次繪制地塊邊界時(shí)仍存在一些問(wèn)題。在獲取大范圍地塊邊界數(shù)據(jù)時(shí),矢量化方式精度較高,但耗費(fèi)大量人力、時(shí)間; 影像分割雖然大大提高了效率,但其分割對(duì)象往往與實(shí)際地塊不符。這些問(wèn)題很大程度上影響了面向地塊分類(lèi)的實(shí)際應(yīng)用。因此,應(yīng)進(jìn)一步研究影像分割技術(shù),盡可能保證分割對(duì)象與地理實(shí)體的一致性,或者發(fā)展新的地塊邊界檢測(cè)技術(shù)。
3)分類(lèi)特征應(yīng)進(jìn)一步挖掘與綜合應(yīng)用。目前在面向地塊的農(nóng)作物遙感分類(lèi)中,多使用傳統(tǒng)的光譜特征、時(shí)相特征和空間特征,分類(lèi)特征的挖掘與綜合應(yīng)用將成為以后遙感分類(lèi)的重要內(nèi)容。地塊面積和形態(tài)等一定程度上反映了不同農(nóng)作物的種植特點(diǎn)及差異,因此可以嘗試使用地塊的周長(zhǎng)、面積和形狀等特征進(jìn)行分類(lèi)。另外,結(jié)合農(nóng)作物自身特點(diǎn),構(gòu)建新的具有農(nóng)學(xué)、生物學(xué)和物理學(xué)意義的分類(lèi)特征,例如反映農(nóng)作物冠層特征的葉面積指數(shù)、反映農(nóng)作物生理生化狀況的葉綠素、激光雷達(dá)數(shù)據(jù)的高度信息以及無(wú)人機(jī)可獲得的株距行距等。這些新的特征與傳統(tǒng)特征變量可以同時(shí)應(yīng)用于農(nóng)作物遙感分類(lèi),提高分類(lèi)精度的同時(shí)使其更具可解釋性。
4)農(nóng)作物遙感分類(lèi)的運(yùn)行化能力應(yīng)進(jìn)一步提升。目前國(guó)內(nèi)利用遙感能夠識(shí)別的農(nóng)作物類(lèi)型偏少,主要集中在小麥、玉米、水稻和大豆等主要農(nóng)作物,而棉花、甘蔗、油菜和花生等其他農(nóng)作物較少涉及,因此應(yīng)該進(jìn)一步挖掘遙感數(shù)據(jù)識(shí)別這些農(nóng)作物的潛力,更好地滿(mǎn)足不同用戶(hù)對(duì)農(nóng)作物識(shí)別的需求。農(nóng)作物遙感分類(lèi)的時(shí)效性也應(yīng)進(jìn)一步提高,農(nóng)作物識(shí)別是其他一切工作的基礎(chǔ),只有及時(shí)準(zhǔn)確地提取農(nóng)作物空間分布,才能為農(nóng)田管理打好基礎(chǔ)。在實(shí)際農(nóng)業(yè)應(yīng)用中,應(yīng)盡量簡(jiǎn)化遙感信息提取過(guò)程,以滿(mǎn)足不同人群的需求,進(jìn)一步擴(kuò)大遙感在農(nóng)業(yè)領(lǐng)域的應(yīng)用。