李 卓,韓文超,胡起源,高 翔,王林林,肖 飛,劉文超,郭文華,孫丹峰※
(1. 中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京 100193;2. 自然資源部城市國土資源監(jiān)測與仿真重點實驗室,深圳 518034;3. 自然資源部信息中心,北京 100036)
土地利用/覆被分類是自然資源監(jiān)管督察的重要內(nèi)容之一。充分挖掘遙感技術(shù)在土地利用/覆被信息提取的優(yōu)勢,可快速、持續(xù)且成本低廉地為決策部門提供基礎(chǔ)資料[1-2]。當今,日益復(fù)雜的土地利用模式和破碎的地物斑塊對基于遙感技術(shù)的土地利用/覆被分類提出了新挑戰(zhàn)[3]。一方面,以像元為基本單元的傳統(tǒng)遙感影像解譯法存在著混合像元對精度影響的弊端[4]。另一方面,如何綜合利用地物光譜、紋理、形狀信息及各對象間的關(guān)系結(jié)構(gòu)特征一直是土地利用/覆被分類研究的重點和熱點[5-6]。因此,進一步探索多種方法融合的土地利用/覆被分類技術(shù),實現(xiàn)基于遙感影像的自動化、高精度的土地要素識別和特征信息提取,對構(gòu)建土地資源調(diào)查監(jiān)測技術(shù)體系和國土空間優(yōu)化布局具有現(xiàn)實意義。
面向?qū)ο蟮耐恋乩?覆被分類技術(shù)是以相鄰像元為對象,綜合考慮光譜、形狀和紋理等多種屬性[7],在一定程度上削弱了混合像元對地物特征信息提取的干擾,因此具有精度高、時效性強等優(yōu)勢,已得到了廣泛的應(yīng)用[8-10]?;诠庾V、形狀和紋理特征構(gòu)建的地物信息提取規(guī)則是面向?qū)ο蠓诸惙ǖ膬?yōu)勢,但也存在一定缺陷。相較于傳統(tǒng)基于像元的土地利用/覆被分類法,面向?qū)ο蠓诸惙ǖ膬?yōu)勢在于地物形狀特征和紋理特征的應(yīng)用,但對地物光譜特征的利用還存在一定的改進空間[11-12]。面向?qū)ο蠓诸惙▽庾V信息的使用主要是通過多種光譜指數(shù)構(gòu)建目標地物的光譜特征集。利用眾多的光譜指數(shù)如植被指數(shù)、土壤指數(shù)、水體指數(shù)和建筑指數(shù)等,雖然能在一定程度上增強了不同地物在不同波段上光譜信息的差異性[13-14],但對地物的物理意義解釋仍然不足[15]。另外,受遙感影像空間分辨率的限制,由多種地物組成的混合像元模糊了地物的典型光譜特征,影響了真實地物信息的提取。因此,有必要基于典型地物的光譜特征信息,改進光譜特征的提取規(guī)則,提高地物信息的提取效率。
光譜混合分解模型將混合像元的光譜信息分解為多種光譜端元和端元豐度值[16]。地表標準光譜端元是一種具有物理意義的單位空間[17],其豐度值表征了各地物在混合像元中所占的比例,可以連續(xù)地描述地表物質(zhì)的異質(zhì)性梯度,能更準確地反映地表信息[18]。光譜混合分解模型依靠具有典型物理意義的端元及其簡潔性,已被廣泛應(yīng)用于土地利用/覆被信息提取、分類制圖、生物量估算等研究領(lǐng)域[19-20]?;谏鲜龇治觯玫湫凸庾V端元優(yōu)化地物信息的提取規(guī)則,對提升土地利用/覆被分類的準確率具有較大潛力。一方面,光譜混合分解的過程,本質(zhì)上是對混合像元進行亞像元尺度的分解,是理解光譜變異的有效方法。另外,多端元的融合增強了地表的組分信息,相較于傳統(tǒng)光譜指數(shù),在反演植被等景觀要素的信息時具有顯著優(yōu)勢。因此,本文以江蘇省南京市六合區(qū)為例,基于Sentinel-2A遙感影像,開展融合光譜混合分解與面向?qū)ο蠓ǖ耐恋乩?覆被分類研究,旨在優(yōu)化地物光譜特征的提取規(guī)則,提高分類精度,為土地資源調(diào)查監(jiān)測技術(shù)體系的構(gòu)建提供技術(shù)支持。
六合區(qū)位于江蘇省南京市北部,是長三角地區(qū)重要的現(xiàn)代化服務(wù)中心。如圖1所示,研究區(qū)選擇為六合區(qū)北部竹鎮(zhèn)、馬鞍街道、程橋街道3個鄉(xiāng)鎮(zhèn),區(qū)域面積共計590 km2。研究區(qū)地貌大部分為丘陵山崗,屬寧鎮(zhèn)揚山區(qū)。該區(qū)域土地覆被類型豐富,其中耕地分布最為廣泛,是主要的土地利用類型。另外,低山、高丘分布有大量的林草地,城鄉(xiāng)居民用地分布相對集中,主要處于平原圩區(qū)。另外,在研究區(qū)選擇了120個樣本點,進行地物提取規(guī)則改進前后的精度評價。
本研究使用的Sentinel-2A 遙感影像來源于歐洲航天局(European Space Agency, ESA),獲取時間為2018年9月4日。該影像數(shù)據(jù)級別為L2A級,已通過輻射定標、正射校正、大氣校正等預(yù)處理,數(shù)據(jù)質(zhì)量良好。該數(shù)據(jù)具有13個波段,覆蓋范圍從可見光、近紅外到短波紅外,空間分辨率最高可達10 m。Sentinel-2A遙感影像具有豐富的光譜波段和較高的空間分辨率。因此,該數(shù)據(jù)集契合了基于面向?qū)ο蠓ㄍ恋乩眯畔⑻崛〉幕疽?,可充分發(fā)揮地物多尺度分割的優(yōu)勢[21-22]。另外,該影像的3個植被紅邊波段(B5、B6、B7)已被證實在植被信息的提取中具有較好的應(yīng)用前景[23]。得益于該數(shù)據(jù)集豐富的光譜信息,為本研究基于光譜混合分解模型優(yōu)化光譜特征的地物信息提取規(guī)則提供了巨大潛力[24-25]。
參考《土地利用現(xiàn)狀分類》(GB/T21010-2017)、中國科學(xué)院土地利用遙感監(jiān)測分類系統(tǒng)和研究區(qū)土地利用特征,本研究主要對水體、耕地、城鄉(xiāng)用地、交通用地和林草地共5類土地利用類型進行提取試驗。在本研究中,水體包含了河流、湖泊、坑塘等,耕地主要為水田和旱地,城鄉(xiāng)居民用地為城鎮(zhèn)、村莊等,林草地主要為林地、灌木林地、園地及草地。另外,由于研究區(qū)內(nèi)的交通用地在影像展示出顯著的形狀、紋理特征,因此本研究將其單獨列為提取對象之一,用于檢測形狀特征和紋理特征的地物提取規(guī)則的可行性。研究區(qū)不同土地利用/覆被類型的典型影像如圖2所示。
影像的多尺度分割是面向?qū)ο蠓诸惙ǔ晒Φ年P(guān)鍵,但分割效果受波段數(shù)量、形狀參數(shù)、尺度參數(shù)等多種因素影響,易造成分割尺度的過度或不足導(dǎo)致土地利用信息的提取精度的降低[26]。通常確定最佳分割尺度要綜合考慮研究區(qū)地物和影像特征,進行反復(fù)測試、模擬。ESP(Estimation of Scale Parameter)工具是一種自下而上的區(qū)域合并技術(shù),能通過迭代分割產(chǎn)生最優(yōu)分割參數(shù)[27]。本研究使用ESP工具評估了研究區(qū)影像的最優(yōu)分割參數(shù)。最佳分割尺度的判定通常以分割對象同質(zhì)性局部方差(Local Variance,LV)及其變化率ROC(Rates of Change)表示[28]。ROC的計算公式為最佳分割尺度時應(yīng)具有代表性,突出所選不同分割尺度的特點。本研究充分考量了所選分割尺度周邊區(qū)域多個極值點的差異性,盡可能突出不同峰值間的特征,目的是最大化地區(qū)分不同地物的最佳分割尺度?;赗OC曲線的趨勢可以看出,變化率在0.4以上時曲線變化較大,且在分割尺度為70時,出現(xiàn)了顯著的極小值,因此在其前后分別選擇65和80作為兩個最佳分割尺度;當變化率低于0.4時,ROC曲線的變化程度不大,因此在分割尺度較大處選擇125為另一個最佳分割尺度。最終,本研究選擇65、80、125為最佳分割尺度,幾種典型地物的分割效果如圖4所示。
式中ROC為LV的變化率,%,Ii為目標層第i對象層的平均標準差,Ii-1為目標層i-1對象層的平均標準差。本研究設(shè)置的分割層數(shù)為200,步長為5,光譜因子為0.7,形狀因子為0.3,緊致度為0.5,光滑度為0.5。ESP分割尺度評價結(jié)果如圖3所示,ROC在不同分割尺度出現(xiàn)了多個極值點。ROC的多個極值點是不同地物最佳分割尺度的體現(xiàn),即各極值點均可能是最佳分割尺度。由于不同的分割尺度決定了影像分割的破碎程度,因此在選取
從不同分割尺度的對象中提取地物特征信息是面向?qū)ο蠓ǖ年P(guān)鍵[29]。因此,選擇地物信息提取的具體方法尤其重要。本研究中采用模糊分類法,依據(jù)地物信息提取的難易程度,由易到難逐層提取土地利用/覆被信息,從而避免了誤差的積累,提高了分類精度[30]。模糊分類在描述地物信息概念差異時,通過隸屬度函數(shù)進行相對判斷,削弱了主觀設(shè)定的閾值的差異性,更符合真實規(guī)律[12]。在eCognition軟件中,基于3個最優(yōu)分割尺度,構(gòu)建了具有3個層次的土地利用/覆被信息提取結(jié)構(gòu)(圖5)。在不同層次結(jié)構(gòu)中共設(shè)置了NDWI(Normalized Difference Water Index)、NDVI(Normalized Difference Vegetation Index)、SBL(Soil Background Level)、Density等8個特征參數(shù)(表1)用于表達不同地物的光譜、形狀和紋理特征,并使用模糊函數(shù)基于地物斑塊進行地物信息的逐層次提取。具體步驟如下:
表1 地物特征提取變量集Table 1 Feature variable set in extraction rules
1)層次1中使用的分割尺度為125,用于水體和非水體的劃分。基于歸一化水體指數(shù)(NDWI)和纓帽變換的濕度指數(shù)(WET),設(shè)置模糊函數(shù)-0.3<NDWI<0.52、-630<WET<900提取水體。
2)層次2中使用的分割尺度為80,用于植被與非植被的劃分。歸一化植被指數(shù)(NDVI)對植被覆蓋度具有較好的表征[14],本文設(shè)置識別植被的閾值為:NDVI>0.58。
3)層次3中設(shè)置的分割尺度為65,進行耕地、林草地、城鄉(xiāng)居民點及交通用地的信息提取。在植被中設(shè)置閾值:SBL(土壤背景值)<2400、SBIMSS(土壤亮度指數(shù))<3050,區(qū)分林草地與耕地。通過測試多種特征,在非植被中選擇設(shè)置閾值為:Density(密度)<0.9、Length/Width(長寬比)>1.5和Entropy(熵)<5.8區(qū)分道路與城鄉(xiāng)居民用地。
線性光譜混合分解模型的理論假設(shè)為傳感器接收到的地面目標像元的輻射亮度只與各組分所占的面積比例有關(guān)[31]。因此,目標像元各個波段的反射率為像元內(nèi)各端元在相應(yīng)波段的反射率以及其所占像元面積比例為權(quán)重的線性組合。根據(jù)像元光譜計算亞像元級的各標準端元在像元內(nèi)的面積百分比,即端元豐度值。具有明確物理意義的端元豐度值能更好地反映植被等景觀要素的信息,這相較于其他傳統(tǒng)信息提取理論來說,其精度相對更高[32]。
光譜混合分解的主要過程為端元選取和豐度值估計。本文采用主成分分析法對光譜空間進行主要特征的提取。表2為遙感影像經(jīng)主成分變換后,前6個主成分的累計方差貢獻率。前3個主成分的累計貢獻率超過93.79%,說明前3個主成分幾乎包含了所有的光譜特征信息,因此確定影像光譜信息的典型端元為3種。全球非冰層陸地表面均可由光譜空間中基質(zhì)(SL;巖石和土壤)、植被(GV;光合作用葉片)和暗色物質(zhì)(DA;陰影和水)3種通用端元進行表達[32]。然后在二維散點圖的端點處分別選取3種端元光譜,最后進行豐度值估計。在本研究區(qū)中,暗色物質(zhì)中的陰影主要為由山體遮擋、光譜反射率特征被削弱的植被。本研究區(qū)的3端元光譜特征曲線如圖6所示,相應(yīng)的豐度值見圖7。
表2 前6個主成分的累計方差貢獻率Table 2 Cumulative variance of the top six principle components
基于上述面向?qū)ο蟮姆诸愐?guī)則(圖5),嘗試融合3端元增強地表組分信息,優(yōu)化地物光譜特征的提取規(guī)則,提高土地利用/覆被的分類精度。首先通過均值法將斑塊內(nèi)的每個像元的端元豐度值聚合到該斑塊,然后通過模糊函數(shù)進行地物信息的逐層次提取。具體步驟如下:
1)層次1中使用的分割尺度為125,用于水體和非水體的劃分。基于DA,設(shè)置模糊函數(shù)DA>0.4提取水體。
2)層次2中使用的分割尺度為80,用于植被與非植被的劃分。設(shè)置識別植被的閾值為:GV>0.44。
3)層次3中設(shè)置的分割尺度為65,進行耕地、林草地、城鄉(xiāng)居民點及交通用地的信息提取。在植被中設(shè)置閾值:SL>0.25區(qū)分林草地與耕地。在非植被中選擇設(shè)置閾值為:Density<0.9、Length/Width>1.5和Entropy<5.8區(qū)分道路與城鄉(xiāng)居民用地。
為了評估3端元的光譜特征對地物信息提取規(guī)則的優(yōu)化效果,分別計算融合光譜混合分解前后的土地利用/覆被分類結(jié)果的混淆矩陣。通過制圖精度(Producer’s Accuracy, PA)、總體精度(Overall Accuracy, OA)和Kappa系數(shù)3項精度指標定量評估??傮w精度和Kappa系數(shù)用于比較兩種方法的整體提升效果,制圖精度評估每種土地利用類型信息提取的優(yōu)化程度。3項精度指標的計算公式(公式(2)~(4))分別為:
式中N為驗證樣本量,k為土地利用類型個數(shù),Nii為正確提取的樣本量,Ni+為第i類土地利用類型的監(jiān)測樣本量,N+i為第i類土地利用類型的真實樣本量。
圖8 為未使用3端元的面向?qū)ο笸恋乩?覆被分類結(jié)果(圖8a)和融合3端元的分類結(jié)果(圖8b)。對比結(jié)果,基于光譜混合分解模型改進后的地物提取規(guī)則,并未有大面積差異。本研究通過實地調(diào)查和其他高分辨率影像選取了120個樣本點(圖1b),分別對地物提取規(guī)則改進前后的進行分類精度評價。表3和表4為方法改進前后的混淆矩陣。土地利用/覆被信息提取規(guī)則改進后,總體精度由80.83%提升至90.00%,Kappa系數(shù)由0.76提升至0.88。對比各項地物類型的制圖精度可以看出,耕地和水體的提升最大。圖9為研究區(qū)土地利用/覆被分類規(guī)則改進后的主要糾錯對象,即耕地錯分為林草地和水體錯分為城鄉(xiāng)居民用地。
表3 未使用3端元的土地利用/覆被分類結(jié)果的混淆矩陣Table 3 Confusion matrix of land use/cover classification without three end members
表4 融合3端元的土地利用/覆被分類結(jié)果的混淆矩陣Table 4 Confusion matrix of land use/cover classification with three end members
光譜混合分解模型對地物提取規(guī)則的改動主要有:在第1層次中,以DA替代NDWI和WET指數(shù);在第2層次中,以GV替代NDVI;在第3層次中,以SL替代SBL和SBIMSS。改進后的規(guī)則在降低特征維數(shù)的同時提高信息提取精度,證明了基于線性光譜混合分解模型的SL、GV、DA3端元替代傳統(tǒng)光譜指數(shù)的可行性。端元對混合像元的精細化解譯,提高了局部復(fù)雜景觀要素的信息分類精度。例如,土地利用信息提取中,耕地被錯分為林草地的概率較大,尤其是當耕地作物植被覆蓋度較大時,兩者土壤亮度相似,傳統(tǒng)土壤-植被光譜指數(shù)不具有在亞像元尺度增強土壤與植被的差異化信息的優(yōu)勢。另外,水體被錯分為城鄉(xiāng)居民用地,主要發(fā)生在河岸泥沙、懸浮物較多的細碎區(qū)域,如圖9所示。這是由于僅通過可見光和近紅外波段的構(gòu)建的水體指數(shù)難以準確抑制植被、土壤信息導(dǎo)致。而DA端元是多波段光譜混合分解后的水體信息,更能突出水體與其他地物的差異性。
基于面向?qū)ο蟮耐恋乩?覆被分類能充分利用高空間分辨率遙感影像的形狀、紋理信息,具有較好的應(yīng)用前景。但由于高空間分辨率影像的光譜波段有限以及傳統(tǒng)光譜指數(shù)對混合像元解釋力不足等原因,有必要融合光譜混合分解模型改進光譜特征的提取規(guī)則,提高分類精度和效率。本研究以Sentinel-2A遙感影像為數(shù)據(jù)源,嘗試融合光譜混合分解與面向?qū)ο蠓ǖ耐恋乩?覆被分類研究,得出以下結(jié)論:
1)通過面向?qū)ο蟮亩喑叨确指钏惴?,?gòu)建的光譜、形狀和紋理的地物提取規(guī)則,在3個層次使用模糊函數(shù)和閾值法進行土地利用/覆被分類,取得了較高的精度。研究區(qū)5種地物的分類總體精度為80.83%,Kappa系數(shù)為0.76。
2)由線性光譜混合分解所得的基質(zhì)(SL;巖石和土壤)、植被(GV;光合作用葉片)和暗色物質(zhì)(DA;陰影和水)3端元能夠很好地表達研究區(qū)地表組分信息。融合3端元的地物提取規(guī)則提高了分類精度,總體精度提升至90.00%,Kappa系數(shù)提升至0.88。
3)對比融合光譜混合分解前后的分類結(jié)果,主要的糾錯對象為耕地與林草地以及水體與城鄉(xiāng)居民用地。錯分的主要原因是常用的光譜指數(shù)是對植被與土壤間的亮度信息解析度不充分,而具有明確物理意義的3端元的融入增強了像元內(nèi)各組分信息的差異性,為高效、正確的土地利用/覆被分類提供了幫助。
融合光譜混合分解與面向?qū)ο蠓椒ǖ耐恋乩?覆被分類簡化了地物提取規(guī)則,提高了分類精度。本研究使用的3端元為通用的基礎(chǔ)端元,后續(xù)針對不同研究區(qū)可進一步增添其他典型端元用于更精細的土地利用/覆被分類,如在干旱地區(qū)增設(shè)沙、鹽等端元進行沙地和鹽堿地的提取。