盛 輝, 韋靖靖, 胡耀東, 許明明, 崔建勇, 鄭紅霞
基于多時(shí)相Sentinel-2影像多特征優(yōu)選的濕地信息提取
盛 輝1, 韋靖靖1, 胡耀東2, 許明明1, 崔建勇1, 鄭紅霞1
(1. 中國石油大學(xué)(華東)海洋與空間信息學(xué)院, 山東 青島 266580; 2. 青島市勘察測繪研究院, 山東 青島 266033)
本文提出了一種隨機(jī)森林(random forest, RF)模型和Pearson相關(guān)系數(shù)相結(jié)合的RF-Pearson模型特征優(yōu)選方法。以多時(shí)相Sentinel-2影像為數(shù)據(jù)源, 提取多時(shí)相多特征; 利用RF-Pearson模型進(jìn)行特征選擇, 篩選出特征重要性得分較高且相關(guān)性較小的特征作為優(yōu)選特征, 參與黃河三角洲濕地信息提取; 最后將分類結(jié)果與多時(shí)相全特征和隨機(jī)森林模型優(yōu)選特征進(jìn)行比較。實(shí)驗(yàn)表明: 特征優(yōu)選能夠提高濕地信息的提取效果, 基于RF-Pearson模型特征優(yōu)選方法的分類精度最高, 表明了特征優(yōu)選方法的有效性以及特征優(yōu)選在濕地分類方面的優(yōu)勢。
黃河三角洲; 多時(shí)相; 特征優(yōu)選; Pearson
黃河流域在中國生態(tài)安全、經(jīng)濟(jì)發(fā)展和文化繁榮等方面具有十分重要的地位, 黃河三角洲自然資源豐富, 是帶動(dòng)?xùn)|部沿海地區(qū)產(chǎn)業(yè)結(jié)構(gòu)調(diào)整和發(fā)展方式的重大引擎, 因此統(tǒng)籌各項(xiàng)任務(wù)、科學(xué)謀劃、明確用力方向, 對推進(jìn)區(qū)域經(jīng)濟(jì)跨越發(fā)展具有重要意義。濕地是地球上生產(chǎn)力最高的生態(tài)系統(tǒng), 然而, 由于經(jīng)濟(jì)快速度發(fā)展、人口不斷增加, 工農(nóng)業(yè)較為發(fā)達(dá), 人類活動(dòng)越來越劇烈, 黃河三角洲地區(qū)在過去幾十年經(jīng)歷了快速的土地覆蓋變化[1-2]。為了保護(hù)黃河三角洲區(qū)域的生態(tài)環(huán)境, 協(xié)調(diào)區(qū)域生態(tài)多樣性, 制定了各項(xiàng)生態(tài)環(huán)境保護(hù)條例, 統(tǒng)籌規(guī)劃了該區(qū)域今后的發(fā)展方向, 堅(jiān)持以生態(tài)的方式治理生態(tài)。因此, 需要采用快速科學(xué)的方法, 對黃河三角洲濕地信息進(jìn)行準(zhǔn)確提取, 濕地信息的準(zhǔn)確提取為黃河三角洲區(qū)域生態(tài)環(huán)境保護(hù)條例的科學(xué)制定奠定了基礎(chǔ)。
隨著遙感技術(shù)和圖像處理技能的快速發(fā)展, 利用遙感影像進(jìn)行土地覆蓋研究成為主流。目前, 有眾多學(xué)者利用遙感數(shù)據(jù)的單一時(shí)相, 對濕地信息提取進(jìn)行了研究[3-5]。但是, 濕地信息具有季相特點(diǎn)且濕地地物分布錯(cuò)綜復(fù)雜, 僅靠單一時(shí)期數(shù)據(jù)對濕地信息進(jìn)行分類, 缺乏季節(jié)性相關(guān)的濕地特征, 容易造成地物的混淆, 所以, 近幾年利用多時(shí)相遙感數(shù)據(jù)進(jìn)行濕地信息提取的研究得到了發(fā)展[6-7]。還有一部分學(xué)者, 利用提取濕地地物的特征信息(如, 相植被、水體和紋理特征等)來改善濕地分類效果, 通過特征提取增加了地物間的差異特征, 對濕地信息提取精度有一定的提高[8-10]。充分利用特征信息, 可以提取多種類型的特征, 但多種特征會帶來“維數(shù)”災(zāi)難, 造成數(shù)據(jù)冗余, 不僅分類的執(zhí)行效率大打折扣, 而且影響濕地信息提取的效果, 勢必要對特征進(jìn)行優(yōu)選, 基于傳統(tǒng)的特征優(yōu)選方法[11-13], 只考慮了特征之間的單一關(guān)系, 隨機(jī)森林模型特征優(yōu)選只考慮特征在分類中的貢獻(xiàn)值, 缺乏特征之間的相關(guān)性分析, 使得篩選出的特征重要性得分高, 但特征之間的相關(guān)性較大, 導(dǎo)致數(shù)據(jù)冗余, 影響分類效果, 所以, 特征優(yōu)選既要充分利用重要性高的濕地特征, 又要減小特征之間的數(shù)據(jù)冗余, 保證濕地信息的提取效果。
本文以黃河三角洲濕地作為研究區(qū)域, 以多時(shí)相Sentinel-2影像為數(shù)據(jù)源, 挖掘多種時(shí)相特征, 提出一種隨機(jī)森林模型和Pearson系數(shù)相結(jié)合的特征優(yōu)選方法, 獲得最優(yōu)特征組合; 分析多時(shí)相優(yōu)選特征對黃河三角洲濕地信息提取的優(yōu)劣, 為濕地信息的準(zhǔn)確提取提供依據(jù)。
隨機(jī)森林分類器在每次建立隨機(jī)森林決策樹抽樣的過程中, 約有1/3的樣本數(shù)據(jù)未被抽取, 未被抽取的數(shù)據(jù)被稱為袋外數(shù)據(jù)(out of bag, OOB)。通過袋外數(shù)據(jù)產(chǎn)生的袋外誤差, 能夠計(jì)算參與分類特征的重要性得分, 選擇重要性得分高的特征, 從而達(dá)到特征優(yōu)選的目的[14]。假設(shè)隨機(jī)森林中有棵樹, 對每一顆決策樹, 選擇相應(yīng)的袋外數(shù)據(jù)計(jì)算袋外誤差E, 隨機(jī)對袋外數(shù)據(jù)OOB所有樣本的特征加入噪聲干擾, 再次計(jì)算袋外數(shù)據(jù)誤差2, 特征x的重要性記為, 則的計(jì)算公式為:
傳統(tǒng)的RF模型選擇的特征, 只考慮了特征對分類的相對重要性, 通過獲取重要性得分高的特征達(dá)到特征優(yōu)選的目的, 但重要性得分高的特征之間也存在數(shù)據(jù)冗余, 所以, 傳統(tǒng)的RF模型缺乏特征之間的相關(guān)性運(yùn)算。
本文采用隨機(jī)森林模型和皮爾遜相關(guān)系數(shù)相結(jié)合的RF-Pearson模型進(jìn)行特征優(yōu)選, 既能獲得貢獻(xiàn)值高的特征, 又能減少特征之間的相關(guān)性。
皮爾遜(Pearson)相關(guān)系數(shù)描述一種線性關(guān)系, 包括是否相關(guān)、正相關(guān)、負(fù)相關(guān)和相關(guān)的緊密程度。可以通過相關(guān)系數(shù)值來判斷兩個(gè)變量和之間的相關(guān)關(guān)系, 數(shù)值介于?1和1之間, 數(shù)值的絕對值大小與相關(guān)強(qiáng)度成正比。變量和的相關(guān)系數(shù)的計(jì)算公式為:
首先, 通過傳統(tǒng)的隨機(jī)森林模型評估每個(gè)特征在分類中的重要性, 再利用Pearson相關(guān)系數(shù)計(jì)算特征之間的相關(guān)性, 篩選出特征重要性得分較高且相關(guān)性較小的特征作為優(yōu)選特征, 既能獲得貢獻(xiàn)值高的特征, 又能減數(shù)據(jù)冗余, 進(jìn)而提高濕地信息提取效果。
黃河三角洲位于山東省東北部, 地處渤海之濱, 主要分布于東營市和濱州市境內(nèi), 面積廣闊。黃河三角洲是典型的河口濕地生態(tài)系統(tǒng), 是保護(hù)物種多樣性的天然基因庫, 因此選擇該區(qū)域進(jìn)行地物覆蓋類型研究, 研究區(qū)域如圖1所示。
圖1 研究區(qū)
Sentinel-2擁有多光譜成像設(shè)備, 能夠檢測到土地覆蓋信息, 包括植被覆蓋、生長狀況、土地環(huán)境和河流環(huán)境等信息, 這對監(jiān)測土地環(huán)境具有重要意義, 特別是Sentinel-2紅邊指數(shù)更適于作物生物量的監(jiān)測[15], 對植被監(jiān)測十分有效。Sentinel-2進(jìn)入運(yùn)行狀態(tài)后, 地球赤道區(qū)域的完整測繪需要5 d, 而緯度較高的區(qū)域, 完整測繪一次僅需要3 d。
本文選用2018年黃河三角洲的Sentinel-2影像。首先, 對影像質(zhì)量和云量條件初步篩選, 再選出具有季節(jié)代表的2幅影像, 使得選取的遙感影像能夠獲得更多的時(shí)相信息。選取對信息提取有用的10個(gè)波段, 去除無用波段, 減少數(shù)據(jù)冗余, 影像具體信息和選取的波段信息如表1、表2所示。
從歐洲航空航天局可以直接獲得L1C級的Sentinel-2數(shù)據(jù), L1C級的數(shù)據(jù)已經(jīng)經(jīng)過歐洲航空航天局初步處理, 再對獲得的數(shù)據(jù)進(jìn)行輻射定標(biāo)和大氣校正, 該數(shù)據(jù)的大氣校正需要在ESA提供的SNAP軟件中完成, 對L1C級數(shù)據(jù)處理后獲得的是L2A級產(chǎn)品。
表1 Sentinel-2數(shù)據(jù)信息
表2 Sentinel-2波段參數(shù)
考慮到Sentinel-2數(shù)據(jù)波段較多且空間分辨率相差較大, 選用波段的空間分辨率大部分是20 m, 小部分是10 m, 如表2所示, 所以要對空間分辨率進(jìn)行灰度值重采樣, 使波段空間分辨率統(tǒng)一到10 m。在重采樣方法中, 雙線性插值法雖然計(jì)算過程復(fù)雜且消耗大量的計(jì)算時(shí)間, 但能解決灰度值不連續(xù)的缺點(diǎn), 效果較好, 并且圖像質(zhì)量高。
為了科學(xué)、準(zhǔn)確地對實(shí)驗(yàn)區(qū)域進(jìn)行分類研究, 本文根據(jù)實(shí)地勘測解譯資料和中國濱海濕地分類系統(tǒng)以及相關(guān)文獻(xiàn)資料[16], 制定的類別體系見表3。本研究區(qū)域中有10種土地覆蓋類型: 河流、潮灘、鹽地堿蓬、互花米草、蘆葦、天然柳林、檉柳林、互花米草、耕地和坑塘。
表3 研究區(qū)分類體系
本文的樣本數(shù)據(jù)從收集的資料、現(xiàn)場實(shí)地踏勘數(shù)據(jù)和影像目視解譯三個(gè)方面獲得。收集的資料主要是2019年的地面實(shí)測數(shù)據(jù); 2020年, 實(shí)驗(yàn)組對黃河三角洲自然保護(hù)區(qū)進(jìn)行了詳細(xì)的調(diào)研, 對不同濕地分布及其植被類型進(jìn)行定位、記錄并拍照; 依據(jù)2020年Google Earth影像進(jìn)行目視解譯, 本文研究區(qū)域位于黃河口自然保護(hù)區(qū)內(nèi), 人為活動(dòng)稀少且土地受國家法律法規(guī)保護(hù), 土地利用情況人為干預(yù)程度低, 地物類型在一定周期內(nèi)變化較小。根據(jù)確定的土地覆蓋類型, 在實(shí)驗(yàn)區(qū)域中均勻選取了10類地物樣本, 分別是河流、潮灘、鹽地堿蓬、互花米草、蘆葦、天然柳林、檉柳林、互花米草、耕地和坑塘, 訓(xùn)練樣本與驗(yàn)證樣本之比約為7∶3, 樣本如圖2所示。
圖2 研究區(qū)樣本點(diǎn)的空間位置
為了充分利用濕地地物的特征信息, 以多時(shí)相光譜數(shù)據(jù)為基礎(chǔ), 提取多種類型的特征, 主要包括植被、水體、土壤、紅邊和紋理特征[17-18], 相關(guān)特征集的描述見表4, 每幅影像共提取21個(gè)特征。
實(shí)驗(yàn)選擇Sentinel-2影像的原始波段作為光譜特征; 提取的植被特征有歸一化植被指數(shù)(normalized difference vegetation Index, NDVI)、比值植被指數(shù)(ratio vegetation index, RVI)和差值植被指數(shù)(differe-nce ve-ge-tation index, DVI)、增強(qiáng)型植被指數(shù)(enha-nced vegetation index, EVI); 水體特征包括歸一化水體指數(shù)(normalized difference water index, NDWI)、修改型歸一化水體指數(shù)(modified normalized difference water index, MNDWI)和地表水體指數(shù)(land surface water index, LSWI); 土壤特征為土壤調(diào)節(jié)植被指數(shù)(soil adjusted vegetation index, SAVI); 紅邊波段是特別針對Sentinel-2而設(shè)計(jì)的, 利于植被信息提取, 通過紅邊波段生成的紅邊光譜特征指數(shù)包括4.5 μm波段歸一化差異指數(shù)(normalized difference index for the 4.5 μm band, NDI45)、反射率修正型葉綠素吸收指數(shù)(modified chlorophyll absorption in reflectance index, MCARI)、植物衰老反射率指數(shù)(plant senescence reflectance index, PSSRI)、歸一化紅邊差異指數(shù)1 (normalized difference red edge index 1, NDre1)和歸一化紅邊差異指數(shù)2 (normalized difference red edge index 2, NDre2), 它們的計(jì)算見表4。
圖像紋理特性的獲取方法有很多種, 灰度共生矩陣(gray-level co-occurrence matrix, GLCM)是目前最常用的方法?;叶裙采仃囉枚轿幌袼氐墓餐怕拭芏认禂?shù)來描述, 它不但反應(yīng)了對比度的分配特性, 而且反應(yīng)有同樣明亮或相似明亮的像素間的分配特征, 是有關(guān)圖形對比度變化的二階統(tǒng)計(jì)特征?;谕恋馗采w類型在圖像空間上的紋理屬性, 提取紋理特征, 反映感興趣地物在圖像空間上的相互作用關(guān)系。
主成分分析(PCA)是一種常用的波譜降維方法[19], 用主成分分析法實(shí)現(xiàn)遙感紋理特征的降維, 取主成分分后的第一主成分, 利用灰度共生矩陣法提取影像的8個(gè)特征: 角二階矩(GLCM_A)、對比度(GLCM_Con)、相關(guān)性(GLCM_Cor)、差異性(GLCM_D)、熵(GLCM_E)、同質(zhì)性(GLCM_H)、均值(GLCM_M)和方差(GLCM_V)。
本文采用2種分類器, 隨機(jī)森林(random forest, RF)和支持向量機(jī)(support vector machin, SVM)。比較不同分類器的實(shí)驗(yàn)結(jié)果, 可以消除分類器本身的局限性產(chǎn)生的影響, 保證信息提取結(jié)果更具有科學(xué)性。
隨機(jī)森林算法[20]是由Breiman等人于2001年提出的一種非參數(shù)的集成算法, 將分類回歸樹(CART)作為基礎(chǔ)分類器構(gòu)建而成的集成分類器。在原始訓(xùn)練集中隨機(jī)有放回的選擇訓(xùn)練子集, 每個(gè)大小等于原始數(shù)據(jù), 由多棵決策樹對數(shù)據(jù)集進(jìn)行預(yù)測, 形成隨機(jī)森林預(yù)測, 對得到的預(yù)測分類結(jié)果進(jìn)行投票決策確定類。實(shí)驗(yàn)結(jié)果證明, 如果假設(shè)決策樹的數(shù)量是100, 則其信息提取結(jié)果最穩(wěn)定, 因此將決策樹的數(shù)目設(shè)置為100。
表4 光譜指數(shù)描述
支持向量機(jī)算法是一種二分類模型, 將實(shí)例的特征向量(以二維為例)映射為空間中的一些點(diǎn), SVM本質(zhì)是利用“一條線”將空間中的點(diǎn)劃分為兩類, 兩類點(diǎn)有各自的特征屬性, “線”可以有很多條, 關(guān)鍵在于區(qū)分類的效果, 多條“線”可以將空間中的點(diǎn)劃分為多類, 這些“線”還可用于回歸或其他任務(wù)。
為了證明所用方法的有效性, 本文采用視覺評估和分類性能進(jìn)行評價(jià)。視覺評估用于檢查明顯的分類錯(cuò)誤, 而從測試樣本導(dǎo)出的混淆矩陣用于通過以下指標(biāo)定量評估分類性能: 生產(chǎn)者精度(PA)、用戶精度(UA)、總體精度(OA)和Kappa系數(shù)。
本文的多時(shí)相原始光譜信息中包含較多的濕地季相差異特征, 保留差異特征更能充分利用時(shí)相信息, 因此, 只對提取的42個(gè)多時(shí)相特征進(jìn)行優(yōu)選。采用隨機(jī)森林模型原始光譜信息和提取的特征進(jìn)行重要性評估, 獲得每個(gè)特征在分類中的重要性得分, 為了更直觀地展示每個(gè)特征的重要性, 繪制了特征的重要性排序圖, 如圖3所示。
圖3 特征重要性排序
注:2_12表示為12月份波段2, 以此類推
在特征重要性得分的基礎(chǔ)上, 利用Pearson相關(guān)系數(shù)計(jì)算提取特征之間相關(guān)系數(shù)值, 找到Pearson相關(guān)系數(shù)值大于0.9的特征, 通過比較特征的重要性得分, 移除重要性得分較低的特征, 實(shí)現(xiàn)對提取的植被、水體、土壤、紅邊和紋理特征的降維, 42個(gè)特征經(jīng)過RF-Pearson優(yōu)選方法運(yùn)算后, 獲得23個(gè)特征作為優(yōu)選特征, 獲得的優(yōu)選特征及其相關(guān)性如圖4所示。同時(shí), 獲取僅用傳統(tǒng)RF模型獲取重要性得分高的前23個(gè)特征, 作為對比實(shí)驗(yàn)。
圖4 優(yōu)選特征及Pearson相關(guān)系數(shù)圖
注: DVI_9表示為9月份提取DVI植被指數(shù), 以此類推
本研究區(qū)域中有10種地物類型, 它們在不同特征上有不同的反射值, 為了更直觀地描述地物在多時(shí)相優(yōu)選特征上的可分性, 繪制地物在不同特征上的響應(yīng)值。由于不同地物在同一特征上的反射值差異較大, 需要對地物反射值進(jìn)行線性歸一化處理, 然后繪制地物的特征曲線, 如圖5和圖6所示。
從圖5可以看出, 養(yǎng)殖池塘、坑塘、耕地和河流的可分性較高, 植被的可分性較低; 9月份, 蘆葦、互花米草、天然柳林的特征曲線接近, 12月份, 潮灘和鹽地堿蓬的特征曲線幾乎重合, 蘆葦、檉柳林和天然柳林的特征曲線變化一致且接近。從圖6可以看出, 利用紋理特征可以將互花米草分離; 鹽地堿蓬在優(yōu)選特征上的整體曲線差異大, 可分性較好; 蘆葦、檉柳林和天然柳林的總體特征曲線接近, 在部分特征上表現(xiàn)出可分性??傮w來看, 多時(shí)相原始光譜和優(yōu)選特征能夠形成優(yōu)勢互補(bǔ), 在濕地的識別上有很大的優(yōu)勢。
為了準(zhǔn)確科學(xué)地評價(jià)分類結(jié)果, 圖7展示了分類結(jié)果圖, 表5統(tǒng)計(jì)了各地物類型的分類精度, 可以得出:
圖5 多時(shí)相特征曲線
注:2_9表示為9月份波段2, 以此類推
圖6 優(yōu)選特征曲線
注: DVI_9表示為9月份提取的DVI植被指數(shù), 以此類推
注: RF表示隨機(jī)森林方法, RF-Pearson表示隨機(jī)森林和皮爾遜相關(guān)系數(shù)相結(jié)合的方法, SVM表示支持向量機(jī)方法。
表5 地物分類精度統(tǒng)計(jì)
注: RF表示隨機(jī)森林方法, RF-Pearson表示隨機(jī)森林和皮爾遜相關(guān)系數(shù)相結(jié)合的方法, SVM表示支持向量機(jī)方法。
1)通過對圖7目視解譯發(fā)現(xiàn), 所有分類結(jié)果都存在一定的“椒鹽”現(xiàn)象, 并且, 在所有的分類方案中都存在錯(cuò)分與漏分現(xiàn)象, 如散落在潮灘的鹽地堿蓬和檉柳林被分為潮灘, 部分潮灘被分為檉柳林, 天然柳林與蘆葦之間混分嚴(yán)重, 互花米草與蘆葦之間的混分, 在水陸交界處, 部分河流被分為坑塘, 部分河流被分為養(yǎng)殖池塘。
2)從生產(chǎn)者精度(PA)和用戶精度(UA)來看, 檉柳林和天然柳林的分類精度較低, 這主要是受到它們空間分布的影響, 容易受到周圍地物拓?fù)潢P(guān)聯(lián)的影響, 但是天然柳林和檉柳林在整個(gè)區(qū)域中所占比重較小,所以對總體信息提取精度的影響不大。其他地物的提取效果相對較好, 其中, 河流和耕地的提取精度較高, 在所有分類方案下的精度普遍達(dá)到90%以上, 主要是耕地和河流的特征明顯, 易與周圍地物分離。
3)在基于不同數(shù)據(jù)的分類方案中, RF分類器的分類精度都高于SVM分類器, RF分類器的平均總體精度為90.61%, 比SVM分類器的平均總體精度高出2.83%; 在多時(shí)相原始光譜數(shù)據(jù)中, 加入各類特征后, RF分類器受到特征的影響較大, 分類精度曲線變化明顯, SVM分類器受到特征的影響較小; 但僅憑精度難以區(qū)分2種分類算法的優(yōu)劣, 因?yàn)榉诸愃惴ㄊ艿剿惴▍?shù)的影響, 改變參數(shù), 分類精度也會發(fā)生變化。
4)基于RF-Pearson模型的特征優(yōu)選方法, 在兩種分類器的分類結(jié)果中, 分類精度都高于傳統(tǒng)的RF模型的特征優(yōu)選方法, 驗(yàn)證了RF-Pearson模型在特征優(yōu)選方面的有效性。與不進(jìn)行特征優(yōu)選的多時(shí)相全特征相比, RF-Pearson特征優(yōu)選對鹽地堿蓬和天然柳林的生產(chǎn)者精度影響較大, 在RF分類器下, 鹽地堿蓬的生產(chǎn)者精度提高7.62%, 天然柳林的生產(chǎn)者精度提高11.06%。
5)從表5的分類精度來看, 在多時(shí)相的基礎(chǔ)上增加提取的特征, 能夠提高濕地信息的分類效果, 但多特征容易產(chǎn)生“維度”災(zāi)難, 進(jìn)行特征優(yōu)選后精度提高。本文基于RF-Pearson模型特征優(yōu)選的分類精度在兩種分類器中都達(dá)到了最高, 其中, 采用RF分類器的信息提取精度較高, 總體精度為91.55%, Kappa系數(shù)為0.895, 表明了特征優(yōu)選在濕地分類方面的優(yōu)勢。
本文利用多時(shí)相Sentinel-2影像, 提取多時(shí)相特征并進(jìn)行特征優(yōu)選, 提出一種基于RF-Pearson模型的特征優(yōu)選方法, 采用了隨機(jī)森林和支持向量機(jī)2種分類器, 實(shí)現(xiàn)了黃河三角洲區(qū)域的濕地信息提取。優(yōu)選特征利用較小的特征維數(shù)保留了較多的地物重要信息, 分類精度得到改善, 驗(yàn)證了RF-Pearson模型的特征優(yōu)選方法的有效性, 也表明了特征優(yōu)選在濕地分類方面的優(yōu)勢。
本文后續(xù)研究將考慮利用不同種類的衛(wèi)星遙感數(shù)據(jù)源進(jìn)行濕地協(xié)同分類, 并結(jié)合長時(shí)間序列遙感數(shù)據(jù), 進(jìn)行更細(xì)致的濕地信息提取研究。
[1] 宮寧, 牛振國, 齊偉, 等. 中國濕地變化的驅(qū)動(dòng)力分析[J]. 遙感學(xué)報(bào), 2016, 20(2): 172-183.
GONG Ning, NIU Zhenguo, QI Wei, et al. Analysis on the driving forces of wetland change in China[J]. Journal of Remote Sensing, 2016, 20(2): 172-183.
[2] 宋百媛, 侯西勇, 劉玉斌. 黃河三角洲—萊州灣海岸帶土地利用變化特征及多情景分析[J]. 海洋科學(xué), 2019, 43(10): 24-34.
SONG Baiyuan, HOU Xiyong, LIU Yubin. Land use change characteristics and multi scenario analysis in the coastal zone of the Yellow River Delta Laizhou Bay[J]. Marine Sciences, 2019, 43(10): 24-34.
[3] HU Y B, ZHANG J, MA Y, et al. Hyperspectral coastal wetland classification based on a multiobject convolutional neural network model and decision fusion[J]. IEEE Geoscience and Remote Sensing Letters, 2019, 16(7): 1110-1114.
[4] DU B J, MAO D H, WANG Z M, et al. Mapping wetland plant communities using unmanned aerial vehicle hyperspectral Imagery by comparing object/pixel-based classifications combining multiple machine-learning algorithms[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14(10): 8249-8258.
[5] REZAEE M, MASOUD M, ZHANG Y, et al. Deep convolutional neural network for complex wetland classification using optical remote sensing imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2018, 11(9): 3030-3039.
[6] 高瑞, 王志勇, 周曉東, 等. 利用多時(shí)相遙感監(jiān)測與分析黃河三角洲濕地變化動(dòng)態(tài)[J]. 測繪通報(bào), 2021, 19(4): 22-27.
GAO Rui, WANG Zhiyong, ZHOU Xiaodong, et al. Monitoring and analysis of wetland change in the Yellow River Delta by multi temporal remote sensing[J]. Bulletin of Surveying and Mapping, 2021, 19(4): 22-27.
[7] 魏鵬飛, 徐新剛, 楊貴軍, 等. 基于多時(shí)相影像植被指數(shù)變化特征的作物遙感分類[J]. 中國農(nóng)業(yè)科技導(dǎo)報(bào), 2019, 21(2): 54-61.
WEI Pengfei, XU Xingang, YANG Guijun, et al. Crop remote sensing classification based on vegetation index change characteristics of multi temporal images[J]. China Agricultural Science and Technology Guide, 2019, 21(2): 54-61.
[8] GUO H J, CAI Y P, YANG ZF, et al. Dynamic simulation of coastal wetlands for Guangdong-Hong Kong- Macao Greater Bay area based on multi-temporal Landsat images and FLUS model[J]. Ecological Indicators, 2021, 4(125): 107559-107559.
[9] 張磊, 宮兆寧, 王啟為, 等. Sentinel-2影像多特征優(yōu)選的黃河三角洲濕地信息提取[J]. 遙感學(xué)報(bào), 2019, 23(2): 313-326.
ZHANG Lei, GONG Zhaoning, WANG Qiwei, et al. Wetland information extraction in the Yellow River Delta Based on multi feature optimization of Sentinel-2 image[J]. Journal of Remote Sensing, 2019, 23(2): 313-326.
[10] 梁爽, 宮兆寧, 趙文吉, 等. 基于多季相Sentinel-2影像的白洋淀濕地信息提取[J]. 遙感技術(shù)與應(yīng)用, 2021, 36(4): 777-790.
LIANG Shuang, GONG Zhaoning, ZHAO Wenji, et al. Baiyangdian wetland information extraction based on multi seasonal Sentinel-2 image[J]. Remote Sensing Technology and Applicatio, 2021, 36(4): 777-790.
[11] 郝玉峰, 滿衛(wèi)東, 汪金花, 等. Relief-F算法及決策樹方法下的濕地信息提取[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 40(3): 225-233.
HAO Yufeng, MAN Weidong, WANG Jinhua, et al. Wetland information extraction based on Relief-F algorithm and decision tree method[J]. Journal of Liaoning University of engineering and Technology (Natural Science Edition), 2021, 40(3): 225-233.
[12] 劉家福, 李林峰, 任春穎, 等. 基于特征優(yōu)選的隨機(jī)森林模型的黃河口濱海濕地信息提取研究[J]. 濕地科學(xué), 2018, 16(2): 97-105.
LiU Jiafu, LI Linfeng, REN Chunying, et al. Study on information extraction of coastal wetland in the Yellow River Estuary based on random forest model with feature optimization[J]. Wetland Science, 2018, 16(2): 97-105.
[13] 夏盈, 厲恩華, 王學(xué)雷, 等. 基于特征優(yōu)選的隨機(jī)森林算法在濕地信息提取中的應(yīng)用——以湖北洪湖濕地自然保護(hù)區(qū)為例[J]. 華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 55(4): 639-648.
XIA Ying, LI Enhua, WANG Xuelei, et al. Application of random forest algorithm based on teature optimization in wetland information extraction -- a case study of Honghu wetland nature reserve in Hubei Province[J]. Journal of Central China Normal University (Natural Science Edition), 2021, 55(4): 639-648.
[14] GENUER R, POGGI J M, CHRISTINE T M. Variable selection using random forests[J]. Pattern Recognition Letters, 2010, 31(14): 2225-2236.
[15] 鄭陽, 吳炳方, 張淼. Sentinel-2數(shù)據(jù)的冬小麥地上干生物量估算及評價(jià)[J]. 遙感學(xué)報(bào), 2017, 21(2): 318-328.
ZHENG Yang, WU Bingfang, ZHANG Miao. Estimation and evaluation of aboveground dry biomass of winter wheat based on Sentinel-2 data[J]. Journal of Remote Sensing, 2017, 21(2): 318-328.
[16] 牟曉杰, 劉興土, 閻百興, 等. 中國濱海濕地分類系統(tǒng)[J]. 濕地科學(xué), 2015, 13(1): 19-26.
MOU Xiaojie, LIU Xingtu, YAN Baixing, et al. Classification system of coastal wetlands in China[J]. Wetland Science, 2015, 13(1): 19-26.
[17] ALFONSO F M, OSCAR F M, CARMEN Q. Sentinel-2A red-edge spectral indices suitability for discriminating burn severity[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 50(2): 170-175.
[18] FORKUOR G, DIMOBE K, IDRISS S, et al. Landsat 8 vs Sentinel 2 examining the added value of sentinel 2 s red edge bands to land use and land cover mapping in Burkina Faso[J]. GIScience & Remote Sensing, 2018, 3(55): 331-354.
[19] 李曉敏, 張杰, 馬毅, 等. 基于主成分分析和決策級融合的高光譜圖像分類方法研究[J]. 海洋科學(xué), 2015, 39(2): 25-34.
LI Xiaomin, ZHANG Jie, MA Yi, et al. Hyperspectral image classification based on principal component analysis and decision level fusion[J]. Marine Sciences, 2015, 39(2): 25-34.
[20] 詹國旗, 楊國東, 王鳳艷, 等. 基于特征空間優(yōu)化的隨機(jī)森林算法在GF-2影像濕地分類中的研究[J]. 地球信息科學(xué)學(xué)報(bào), 2018, 20(10): 1520-1528.
ZHAN Guoqi, YANG Guodong, WANG Fengyan, et al. Research on the random forest algorithm based on feature space optimization in wetland classification of GF-2 image[J]. Journal of Geo Information Science, 2018, 20(10): 1520-1528.
Wetland information extraction based on multifeature optimization of multitemporal Sentinel-2 images
SHENG Hui1, WEI Jing-jing1, HU Yao-dong2, XU Ming-ming1, CUI Jian-yong1, ZHENG Hong-xia1
(1. College of Oceanography and Space Information, China University of Petroleum (East China), Qingdao 266580, China; 2. Qingdao Municipal Institute of Surveying and Mapping, Qingdao 266033, China)
This paper presents a method for feature optimization of the RF-Pearson model based on the combination of the random forest model and Pearson correlation coefficient. The multitemporal Sentinel-2 image was used as the data source for extracting multitemporal features. Furthermore, the RF-Pearson model for feature selection was employed to select the features with a high importance score and low correlation of feature variables as the preferred features, participating in the wetland information extraction in the Yellow River Delta. Finally, the classification results were compared with multitemporal full and random forest model optimization features. Experiments revealed that feature optimization can enhance the extraction effect of wetland information, and the feature optimization method based on the RF-Pearson model had the highest classification accuracy, indicating the efficacy of the feature optimization method and the benefits of feature optimization in wetland classification.
Yellow River Delta; multitemporal; feature optimization; Pearson
Jun. 26, 2022
TP79
A
1000-3096(2023)5-0102-11
10.11759/hykx20220626001
2022-06-26;
2022-08-03
中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助(22CX01004A-8); 國家自然科學(xué)基金面上項(xiàng)目(62071492)
[Special Fund for Basic Scientific Research Business Expenses of Central Universities, No. 22CX01004A-8; General program of National Natural Science Foundation of China, No. 62071492]
盛輝(1972—), 男, 漢族, 山東定陶人, 副教授, 主要從事海洋遙感、傾斜攝影測量、土地利用和土地覆蓋變化監(jiān)測, E-mail: sheng@upc.edu.cn; 崔建勇,通信作者(1976—), 男, 漢族, 講師, 主要從事遙感圖像處理與分析、時(shí)間序列遙感數(shù)據(jù)重建和海洋水色要素定量反演, E-mail: cui_jianyong@upc.edu.cn
(本文編輯: 楊 悅)