吳宗洋,蔡卓雅,郭 英,王彥芳**
(1.河北省農(nóng)業(yè)干旱遙感監(jiān)測(cè)國(guó)際聯(lián)合研究中心/河北地質(zhì)大學(xué)土地科學(xué)與空間規(guī)劃學(xué)院 石家莊 050031;2.河北省高校生態(tài)環(huán)境地質(zhì)應(yīng)用技術(shù)研發(fā)中心 石家莊 050031;3.中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所農(nóng)業(yè)資源研究中心/中國(guó)科學(xué)院農(nóng)業(yè)水資源重點(diǎn)實(shí)驗(yàn)室/河北省節(jié)水農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室 石家莊 050022)
土地覆被是地球表層自然狀態(tài)的客觀反映,其空間分布格局及動(dòng)態(tài)變化對(duì)于解決全球和區(qū)域環(huán)境演變、可持續(xù)發(fā)展等問題具有重大意義[1-3]。近年來,隨著衛(wèi)星遙感技術(shù)和GIS 技術(shù)的高速發(fā)展,極大程度促進(jìn)了土地覆被產(chǎn)品的時(shí)空分辨率和精度的提高,涌現(xiàn)出大量?jī)?yōu)質(zhì)的土地覆被數(shù)據(jù)集。然而,這些數(shù)據(jù)集在區(qū)域尺度的具體應(yīng)用中往往存在以下幾個(gè)方面的不確定性[4-5],使得數(shù)據(jù)集的應(yīng)用受到限制: 1)所使用的遙感數(shù)據(jù)獲取時(shí)間、土地覆被分類技術(shù)、分類體系等的差異;2)目前發(fā)布的土地覆被數(shù)據(jù)集大多數(shù)是全球和國(guó)家尺度的,在區(qū)域尺度的精度和適用性存在不確定性;3)測(cè)量或表達(dá)尺度即數(shù)據(jù)源和產(chǎn)品的空間分辨率也存在差異,使得多套的數(shù)據(jù)集在區(qū)域尺度存在不確定性,使用受到限制,難以選擇合適的數(shù)據(jù)集[6]。因此,在使用數(shù)據(jù)之前對(duì)現(xiàn)有土地覆被數(shù)據(jù)的精度分析與評(píng)價(jià)至關(guān)重要。
目前,國(guó)內(nèi)外學(xué)者基于各類土地覆被遙感產(chǎn)品在不同尺度上進(jìn)行了相關(guān)研究,主要以洲際和國(guó)家尺度居多,包括中國(guó)、西班牙、南美洲、歐洲、北極地區(qū)等相關(guān)區(qū)域的研究[7-13]。例如宋宏利等[8]以中國(guó)科學(xué)院的CHINA2000 數(shù)據(jù)為參考,從國(guó)家尺度上對(duì)全球4 種土地覆被遙感產(chǎn)品的分類精度進(jìn)行了評(píng)價(jià);戴昭鑫等[12]評(píng)價(jià)了5 種全球衛(wèi)星土地覆被產(chǎn)品在南美洲地區(qū)的一致性。區(qū)域尺度上,我國(guó)學(xué)者對(duì)長(zhǎng)江流域、新疆、京津冀等地的多套數(shù)據(jù)產(chǎn)品進(jìn)行了基本精度驗(yàn)證及一致性分析[14-16],評(píng)價(jià)方法上多采用相對(duì)評(píng)價(jià)方法、類型面積對(duì)比、誤差矩陣分析和類型空間混淆等方法[17];研究形式上部分學(xué)者以某套數(shù)據(jù)產(chǎn)品為對(duì)象,評(píng)價(jià)在研究區(qū)域內(nèi)的總體精度[18-21],或者評(píng)價(jià)多套全球土地覆被數(shù)據(jù)精度和一致性。雖然眾多學(xué)者對(duì)各土地覆被產(chǎn)品的研究取得了一些成果,但是存在對(duì)同一地區(qū)不同年份的對(duì)比、參考數(shù)據(jù)的選擇具有隨意性等問題,也鮮見對(duì)黃河流域多空間分辨率土地覆被產(chǎn)品的定性和定量對(duì)比評(píng)價(jià),數(shù)套不同分辨率的遙感產(chǎn)品該如何選擇的問題,仍有待進(jìn)一步研究。
本文以黃河流域?yàn)檠芯繀^(qū),基于2020 年的30 m 分辨率土地覆被產(chǎn)品CLCD_v01_2020、GLOBELAND30和GLC_FCS30_2020 和低分辨率土地覆被產(chǎn)品LANDCOVER (300 m)、MCD12Q1 (500 m)和CNLUCC-1000 (1000 m),采用直接和間接評(píng)價(jià)相結(jié)合的方法,進(jìn)行區(qū)域尺度精度評(píng)價(jià)。本研究旨在通過對(duì)比同期不同來源不同空間分辨率的土地覆被產(chǎn)品在黃河流域的精度表現(xiàn),為用戶在區(qū)域尺度合理利用土地覆被遙感產(chǎn)品提供科學(xué)參考。
黃河流域地勢(shì)東低西高,西部河源地區(qū)平均海拔在4000 m 以上(圖1),分布著眾多高山,有冰川地貌發(fā)育;中部地區(qū)的平均海拔1000~2000 m,為黃土地貌;東部地區(qū)主要由黃河沖積平原組成。該流域橫跨東、中、西三大地形階梯,是我國(guó)重要的生態(tài)安全屏障,也是人口活動(dòng)和經(jīng)濟(jì)發(fā)展的重要區(qū)域。因此,黃河流域的生態(tài)環(huán)境問題是關(guān)乎流域生態(tài)安全及社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展的關(guān)鍵問題之一。而根據(jù)《2019 年中國(guó)水資源公報(bào)》和《2020 年中國(guó)統(tǒng)計(jì)年鑒》[22],黃河流域水資源總量為797.5×108m3,僅占全國(guó)水資源總量的2.75%;黃河流域降水量為496.9 mm,相當(dāng)于長(zhǎng)江流域的46.87%;黃河流域人均國(guó)內(nèi)生產(chǎn)總值(GDP)為55 470.29 元,低于全國(guó)水平的27.80%。同時(shí),根據(jù)《2019 黃河泥沙公報(bào)》,近10 年來,隨著干流河底的不斷淤積,小浪底庫區(qū)最大支流畛水的斷面淤積抬高62.90 m,主要支流大峪河的斷面淤積抬高53.83 m。當(dāng)前黃河流域存在的水資源匱乏、水沙關(guān)系失衡等生態(tài)環(huán)境問題嚴(yán)重制約了黃河流域的發(fā)展質(zhì)量,是關(guān)乎流域生態(tài)安全及社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展的關(guān)鍵問題之一。目前,黃河流域生態(tài)保護(hù)和高質(zhì)量發(fā)展已上升為重大國(guó)家戰(zhàn)略,系統(tǒng)科學(xué)地認(rèn)識(shí)黃河流域的環(huán)境格局變化是實(shí)現(xiàn)黃河流域高質(zhì)量發(fā)展的重要前提[23-24]。
圖1 研究區(qū)概況圖Fig.1 Overview of the study area
1.2.1 土地覆被數(shù)據(jù)
本研究采用不同來源30~1000 m 不同分辨率的6 種土地覆被產(chǎn)品進(jìn)行精度評(píng)價(jià)和一致性分析,各種數(shù)據(jù)詳細(xì)參數(shù)如表1 所示。中國(guó)逐年土地覆蓋數(shù)據(jù)集(Annual China Land Cover Dataset,CLCD),是基于GEE 上所有可獲得的Landsat 數(shù)據(jù),結(jié)合從中國(guó)土地利用/覆蓋數(shù)據(jù)集(CLUD)中提取的穩(wěn)定樣本,以及從Google Earth 等通過目視解譯收集的訓(xùn)練樣本,結(jié)合隨機(jī)森林分類器得到1985-2021 年中國(guó)土地利用分類結(jié)果[25],本文采用的為Version 1.0.0 中2020年的數(shù)據(jù),即命名為CLCD_v01_2020。GLOBELAND30數(shù)據(jù)集是國(guó)家基礎(chǔ)地理信息中心等多單位開發(fā)的全球首個(gè)30 m 地表覆蓋數(shù)據(jù)產(chǎn)品,包含2000 年、2010 年和2020 年3 期,采用“像素分類-對(duì)象提取-知識(shí)檢核”方案制作而成[26]。GLC_FCS30_2020 是中國(guó)科學(xué)院空天信息創(chuàng)新研究院2020 年最新研發(fā)的全球30 m 地表覆蓋精細(xì)分類產(chǎn)品,并以該數(shù)據(jù)為基準(zhǔn),采用耦合變化檢測(cè)和動(dòng)態(tài)更新相結(jié)合的長(zhǎng)時(shí)序地表覆蓋動(dòng)態(tài)監(jiān)測(cè)方案,生產(chǎn)了1985-2020 年全球30 m 精細(xì)地表覆蓋動(dòng)態(tài)監(jiān)測(cè)產(chǎn)品,該產(chǎn)品包含29 個(gè)地表覆蓋類型,更新周期為5 年[27]。LANDCOVER 數(shù)據(jù)集是利用2003-2012 年的中分辨率成像光譜儀(MERIS)數(shù)據(jù)生成10 年基線土地覆被圖,然后再結(jié)合AVHRR、SPOT、PROBA-V、Sentinel-3 等不同數(shù)據(jù)進(jìn)行回溯和更新而生成,時(shí)間序列為1992-2020 年。MCD12Q1 數(shù)據(jù)產(chǎn)品是使用MODIS Terra 和Aqua 反射率數(shù)據(jù)經(jīng)過監(jiān)督分類后,再結(jié)合先驗(yàn)知識(shí)和輔助信息等做分類后處理進(jìn)一步細(xì)化到特定類別[28]。中國(guó)多時(shí)期土地利用/土地覆被遙感監(jiān)測(cè)數(shù)據(jù)集(CNLUCC1000)是中國(guó)科學(xué)院地理科學(xué)與資源研究所牽頭生產(chǎn)的系列數(shù)據(jù)集,2020 年的數(shù)據(jù)是在2015年土地利用遙感監(jiān)測(cè)數(shù)據(jù)的基礎(chǔ)上,基于Landsat 8遙感影像,通過人工目視解譯生成[29],該原始數(shù)據(jù)空間分辨率為30 m,本文所采用的是公開發(fā)布的空間分辨率為1000 m 的重采樣產(chǎn)品。
表1 研究所用多源遙感土地覆被產(chǎn)品的參數(shù)表Table 1 Parameters of multi-source remote-sensing land cover products used in the study
所采用的6 種土地覆被產(chǎn)品年份均為2020 年,其 中 CLCD_v01_2020、GLOBELAND30 和 GLC_FCS30_2020 產(chǎn)品分辨率均為30 m;LANDCOVER、MCD12Q1 和CNLUCC1000 為更低分辨率,分別為300 m、500 m 和1000 m。
1.2.2 驗(yàn)證樣本
本研究所采用的驗(yàn)證樣本點(diǎn)均是在Google Earth 上通過對(duì)2020 年黃河流域的歷史影像進(jìn)行目視解譯篩選出來的,共采取了1540 個(gè)樣本點(diǎn)(圖2),其中耕地540 個(gè)、林地293 個(gè)、草地204 個(gè)、水域182 個(gè)、冰川58 個(gè)、裸地105 個(gè)和建設(shè)用地158 個(gè)樣本點(diǎn)。為減少樣本由于定位誤差和解譯誤差所帶來的影響,在進(jìn)行樣本選擇及解譯時(shí)需遵循以下原則: 1)樣本點(diǎn)選擇區(qū)域至少為2 km×2 km 均質(zhì)區(qū)域的中心點(diǎn)。2)使用與待評(píng)價(jià)數(shù)據(jù)時(shí)相一致的2020年的遙感影像,并參考2019-2021 年間的多時(shí)相數(shù)據(jù)。3)對(duì)于少數(shù)解譯較為困難的樣本,結(jié)合參考其他輔助信息解譯。4)采用多人獨(dú)立解譯方式,并在解譯結(jié)果經(jīng)商議無法統(tǒng)一時(shí),舍棄該樣本。在遵循以上原則的基礎(chǔ)上,按類別面積大小、隨機(jī)采樣確定樣本位置。
圖2 基于Google Earth 的黃河流域樣本點(diǎn)分布Fig.2 Sample points distribution of the Yellow River Basin based on Google Earth
首先,將LANDCOVER 和MCD12Q1 的格式進(jìn)行統(tǒng)一化處理,而后,為保證土地覆被數(shù)據(jù)投影一致和無面積變形,選擇Albers 等積投影作為基準(zhǔn)投影,最后將數(shù)據(jù)進(jìn)行裁剪得到黃河流域的土地覆被數(shù)據(jù)。
統(tǒng)一的分類體系是土地覆被數(shù)據(jù)精度評(píng)價(jià)的前提。由于6 種數(shù)據(jù)采用了不同的分類體系,為了統(tǒng)一標(biāo)準(zhǔn),在精度評(píng)價(jià)前需將6 種數(shù)據(jù)聚類為表2 所示的7 種地物類型,分別是耕地、林地、草地、水域、冰川、裸地和建設(shè)用地。
表2 研究所用土地覆被產(chǎn)品類別聚合表Table 2 Aggregation table of land cover types of multi-source remote-sensing products used by the study
由于Google Earth 影像具有定位準(zhǔn)確、時(shí)相豐富、分辨率高、獲取方便、覆被廣泛等優(yōu)勢(shì),是精度評(píng)價(jià)的主要數(shù)據(jù)源之一[30-33],所以本研究采用Google Earth 影像作為樣本,生成了6 種土地覆被分類數(shù)據(jù)的混淆矩陣。計(jì)算總體精度(overall accuracy,OA)、Kappa 系數(shù)(K)、使用者精度(user accuracy,UA),以評(píng)價(jià)6 種土地覆被產(chǎn)品在黃河流域的分類精度情況,將精度最高的產(chǎn)品作為參考數(shù)據(jù)進(jìn)行后續(xù)的分析與評(píng)價(jià)。具體計(jì)算方法如下:
式中:N是參與評(píng)價(jià)的樣本總數(shù),n是 混淆矩陣中的行列數(shù),xii是混淆矩陣中第i行第i列的樣本數(shù),xi+和x+i分別為第i行和第i列的樣本總數(shù)。
為滿足土地覆被產(chǎn)品的不同應(yīng)用需求,在對(duì)多套土地覆被分類產(chǎn)品進(jìn)行比較時(shí),通常將多套驗(yàn)證數(shù)據(jù)與參考數(shù)據(jù)進(jìn)行構(gòu)成相似性分析得到面積一致性評(píng)價(jià)。相關(guān)系數(shù)(R2)表示的是兩向量之間的線性關(guān)系,本研究通過計(jì)算聚合重分類后的5 種土地覆被驗(yàn)證數(shù)據(jù)與參考數(shù)據(jù)土地利用數(shù)據(jù)類型面積的相關(guān)性來評(píng)價(jià)5 種數(shù)據(jù)類型面積相對(duì)參考數(shù)據(jù)的偏離程度。
相關(guān)系數(shù)的定義式如下:
式中:i是第i種待驗(yàn)證的土地覆被類型產(chǎn)品;k取1,2,3···,7,代表7 種不同的土地覆被類別;xk為各類別的總面積(km2);yk為參考數(shù)據(jù)各類別的總面積(km2);為所要評(píng)價(jià)的土地覆被數(shù)據(jù)7 種面積的均值(km2);為參考數(shù)據(jù)的7 種面積的均值(km2)。
面積一致性評(píng)價(jià)能夠表明不同土地覆被產(chǎn)品間土地類型面積構(gòu)成上的相似性,但無法刻畫不同產(chǎn)品之間同一土地覆被類型在空間上的混淆程度[34-35]。因此,采用空間疊置方法,獲取不同產(chǎn)品之間逐像元的空間對(duì)應(yīng)關(guān)系;而后匯總計(jì)算全部類型像元的個(gè)數(shù)(面積),并與總像元數(shù)(總面積)比較,即可得到關(guān)于不同產(chǎn)品之間、同一土地覆被類別在空間上的純凈程度(兩種產(chǎn)品指示為同一種類型)或混淆程度(兩種產(chǎn)品指示為不同的類型)的判斷。
通過Google Earth 在2020 年黃河流域的歷史影像上選取驗(yàn)證樣本點(diǎn),然后運(yùn)用公式(1)-(4)計(jì)算得到多源產(chǎn)品精度評(píng)價(jià)結(jié)果(表3)。從總體精度(OA)看,CLCD_v01_2020 最高(OA=88.12%),CNLUCC-1000 最低(OA=71.82%)。其他數(shù)據(jù)總體精度從高到低依次是GLOBELAND30 (OA=85.32%)、GLC_FCS30_2020 (OA=84.09%)、LANDCOVER300 (OA=77.79%)、MCD12Q1 (OA=73.38%)。30 m 土地覆被產(chǎn)品的KAPPA 系數(shù)均在0.8 以上,分類精度較高,隨著產(chǎn)品分辨率的下降,分類精度總體也呈現(xiàn)下降趨勢(shì)。
表3 不同遙感產(chǎn)品的土地覆被精度Table 3 Accuracy results of land cover types of different remote-sensing products %
各數(shù)據(jù)集在不同覆被類型上存在較大的精度差異。GLC_FCS30_2020 在耕地上具有最高的使用者精度(UA,93.28%),CNLUCC1000 的UA (79.40%)最低。對(duì)于林地,MCD12Q1 具有最高的UA (99.48%),CNLUCC1000 最低(93.45%)。草地方面,CLCD_v01_2020 具有最高的UA,但也僅有64.97%,MCD12Q1的UA 僅為40.09%。對(duì)于水域CLCD_v01_2020 和LANDCOVER300 具有最高的UA (100%),CNLUCC-1000 具有最低的UA (70.45%)。6 種產(chǎn)品在冰川類型上都具有最高的UA(100%)。對(duì)于裸地和建設(shè)用地,GLC_FCS30_2020 均具有最高的UA,CNLUCC1000具有最低的UA。
綜上可知,CLCD_v01_2020 具有最高的精度結(jié)果,主要是由于該數(shù)據(jù)是以國(guó)家為尺度制作的,相比于其他數(shù)據(jù)在中國(guó)擁有更多的樣本,并且分類體系屬于一級(jí)分類,從而增加了聚類的準(zhǔn)確性。CNLUCC-1000 具有最低的精度結(jié)果是由于分辨率是所有數(shù)據(jù)中最粗的,較粗的柵格增加了混合像元的概率,同時(shí)在定位上可能會(huì)存在偏差。6 種產(chǎn)品對(duì)于冰川都具有最高UA,草地的分類精度最低,存在耕-草和林-草混淆。
統(tǒng)計(jì)6 種遙感產(chǎn)品中各地表覆被類型的面積占比發(fā)現(xiàn),不同數(shù)據(jù)源各類別面積構(gòu)成比例總體一致,但具體數(shù)值上仍存在一定差異。6 種數(shù)據(jù)均表明,流域內(nèi)草地是最主要的土地覆被類型(~50%),其次是耕地和林地,裸地和建設(shè)用地等其他土地覆被類型占比較小,均在10%以下(圖3a)。將具有最高樣本精度的CLCD_v01_2020 產(chǎn)品作為參考數(shù)據(jù),分析其他數(shù)據(jù)的面積偏差,結(jié)果表明(圖3b),不同數(shù)據(jù)產(chǎn)品對(duì)不同土地覆被的面積判定存在差異。耕地上,GLC_FCS30_2020 與參考數(shù)據(jù)最為接近(-1.28%),GLOBELAND30 產(chǎn)品差異最大(7.35%)。草地的面積偏差最大,最大和最小值相差20%以上,其中,GOLELAND30 草地面積較CLCD_v01_2020 偏小12.04%,MCD12Q1 草地的面積占比均高于其他數(shù)據(jù),比參考數(shù)據(jù)高11.19%。林地方面,除MCD12Q1(-6.8%)外,其他各驗(yàn)證數(shù)據(jù)與參考數(shù)據(jù)一致性較高。CNLUCC1000 的裸地與參考數(shù)據(jù)面積差異最大(3.42%)。建設(shè)用地、冰川和水域等類型與參考數(shù)據(jù)均表現(xiàn)出較好的一致性,這是由于這3 種土地覆被類型在黃河流域的面積占比本身較小。綜上可得,GLOBELAND30 高估了耕地面積,低估了草地面積,存在耕地與草地混淆,將部分草地分進(jìn)了耕地,LANDCOVER 也存在同樣的情形。MCD12Q1 對(duì)草地面積的高估則是由于林草的混淆,導(dǎo)致部分林地被錯(cuò)分為草地。CNLUCC1000 數(shù)據(jù)低估了草地面積是由于草地與裸地混淆較為嚴(yán)重,部分草地被分進(jìn)了裸地。
圖3 不同遙感產(chǎn)品的黃河流域土地覆被類別面積組成(a)與面積偏差(b)Fig.3 Area composition (a) and area deviation (b) of different land cover types in the Yellow River basin of different remote-sensing products
由3.1 可知,CLCD_v01_2020 數(shù)據(jù)具有最高的樣本驗(yàn)證精度,因此,確定以CLCD_v01_2020 為參考數(shù)據(jù),分別計(jì)算其余5 種驗(yàn)證數(shù)據(jù)集與該數(shù)據(jù)的面積相關(guān)性。結(jié)果表明,5 種驗(yàn)證產(chǎn)品與參考數(shù)據(jù)的相關(guān)性均較高,其中最高的為GLC_FCS30_2020 產(chǎn)品,相關(guān)性為0.9976,這是由于兩種數(shù)據(jù)采用同樣的LCCS分類體系且都為一級(jí)分類,從而增加了聚類的準(zhǔn)確性。相關(guān)性最低的為GLOBELAND30 產(chǎn)品,相關(guān)性為0.9687,這是由于GLOBELAND30 產(chǎn)品的草地和耕地的面積與參考數(shù)據(jù)相差較大,從而降低了總體的相關(guān)性。其余數(shù)據(jù)相關(guān)性從高到低依次為CNLUCC1000 (0.9917)、MCD12Q1 (0.9896)、LANDCOVER (0.9780)。
圖4 展示了6 種土地覆被產(chǎn)品不同地物類型間的混淆情況,縱坐標(biāo)表示不同土地覆被類型的樣本點(diǎn)被劃分為橫坐標(biāo)所對(duì)應(yīng)地物的數(shù)量占比,當(dāng)樣本類型與橫坐標(biāo)對(duì)應(yīng)地物類型相同時(shí),則代表一致,否則代表混淆。
圖4 多源遙感數(shù)據(jù)的土地覆被類型混淆程度Fig.4 Degrees of confusion between land cover types of different remote-sensing products
不同土地覆被產(chǎn)品中耕地、林地、水域、冰川和建設(shè)用地的分類精度較高,被混淆的比例較低,這是因?yàn)檫@些地類的光譜特征普遍明顯,地物成片分布、邊界較為清晰,因此和其他類別混淆相對(duì)較少。裸地和冰川光譜特征相似,因此易被識(shí)別為冰川。草地是不確定性最大的類型,且普遍存在于各分辨率產(chǎn)品中,CLCD_v01_2020 和GLOBELAND30 將林地、裸地與草地混淆,而GLC_FCS30_2020 存在明顯的耕地和草地混淆。百米以上的粗分辨率產(chǎn)品對(duì)草地的分類不確定性更大,普遍存在裸地、耕地、林地與草地的混淆,這可能是由于草地存在不同覆蓋特征易與其他地類混淆。粗分辨率的水域存在與林地、草地等的錯(cuò)分,主要是由于柵格尺寸大,但水域一般較為狹長(zhǎng),因此,存在混合像元導(dǎo)致混淆。另外,CNLUCC1000 由于較粗的分辨率,在城鎮(zhèn)邊緣存在城鎮(zhèn)用地與耕地的混合像元,導(dǎo)致樣本點(diǎn)類型有偏差。由此可見,分辨率越高,分類精度越高,所以提高遙感土地覆被產(chǎn)品的分辨率可以增加對(duì)不同地物的分類精度,也是目前的發(fā)展方向。
為分析多源土地覆被產(chǎn)品在空間上的一致性,將參考數(shù)據(jù)CLCD_v01_2020 產(chǎn)品作為基準(zhǔn),對(duì)其他數(shù)據(jù)進(jìn)行疊加分析(圖5)。結(jié)果表明,5 種土地覆被產(chǎn)品與CLCD_v0_2020 總體空間一致性較高,但仍存在部分混淆情況。一致性表現(xiàn)在黃河上游青海東部的草地,黃河中下游部分耕地和建設(shè)用地等土地利用較為單一和明顯的區(qū)域,而在黃河中游陜西北部、山西西部和寧夏區(qū)域一致性較低,主要表現(xiàn)為草地和林地的混淆。其中GLC_FCS30_2020 與參考數(shù)據(jù)一致性較好,但仍在黃河上中游內(nèi)蒙古西南部的草地和山西西部的耕地一致性較低。GLOBELAND-30 與參考數(shù)據(jù)在黃河上中游寧夏區(qū)域和山西西部的草地一致性較差。LANDCOVER 與CLCD_v01_2020在黃河上游一致性較好,但在黃河中游山西西部和陜西北部的一致性較差,混淆在草地、耕地和裸地之間。MCD12Q1 與CLCD_v01_2020 在黃河上游草地一致性較好,而在黃河中游陜西北部、山西西部和河南北部的林地一致性較差。CNLUCC1000 與參考數(shù)據(jù)的混淆表現(xiàn)出破碎特征,在黃河上中游主要表現(xiàn)為草地的混淆,在黃河下游主要表現(xiàn)為林地和耕地的混淆。對(duì)于5 種數(shù)據(jù)與CLCD_v0_2020 差異較大的區(qū)域,如山西西部與陜西北部,通過與Google earth 歷史影像對(duì)比,發(fā)現(xiàn)在山西西部差異較大的地物實(shí)際為耕地,在陜西北部差異較大的地物實(shí)際為草地,結(jié)果均與參考數(shù)據(jù)一致,這表明對(duì)于植物的精確分類算法仍需要改善。
圖5 多源遙感產(chǎn)品與參考數(shù)據(jù)的類別混淆空間圖譜Fig.5 Confuse spatial atlases of multi-source remote-sensing land cover products with the categories of reference data
本研究評(píng)估了黃河流域6 套土地覆被數(shù)據(jù)的分類精度,結(jié)果表明,6 種數(shù)據(jù)精度從高到低依次為CLCD_v01_2020、GLOBELAND30、GLC_FCS30_2020、LANDCOVER300、MCD12Q1、CNLUCC-1000。該結(jié)果與劉瓊歡等[34]在羌塘高原利用直接法得到的不同數(shù)據(jù)集精度從高到低的順序一致(GLOBELAND30>GLC2000>MCD12Q1),但與陳逸聰?shù)萚14]在長(zhǎng)三角地區(qū)的評(píng)價(jià)結(jié)果(GLC_FCS30>GlobeLand-30>CCI_LC>FROM-GLC)和仝冉等[32]在蒙古高原的研究結(jié)果(GLC_FCS30>GLOBELAND30>FROM-GLC)存在一定差異。較已有的研究,本研究增加了CLCD數(shù)據(jù)集,發(fā)現(xiàn)在黃河流域該數(shù)據(jù)集較GLOBELAND30、GLC_FCS30 精度更高。在不同的研究區(qū),可以看出多源數(shù)據(jù)精度總體較高,但由于樣本的選擇、目標(biāo)分類系統(tǒng)、評(píng)價(jià)方法等的差異會(huì)對(duì)結(jié)果造成一定影響,導(dǎo)致各數(shù)據(jù)的評(píng)價(jià)結(jié)果也存在差異。
對(duì)于黃河流域不同土地覆被精度產(chǎn)生差異的原因與黃亞博等[19]在河南區(qū)域產(chǎn)生差異的原因類似,主要有以下幾方面: 1)制圖范圍的不同會(huì)造成數(shù)據(jù)的精度差異。全球范圍的數(shù)據(jù)在中國(guó)區(qū)域的訓(xùn)練樣本較少,從而導(dǎo)致在相同分辨率下,分類精度較低。2)不同的空間分辨率也是造成差異的原因之一。高分辨率數(shù)據(jù)的像元純凈度較粗分辨率的數(shù)據(jù)高,因此,分類精度也較高。3)分類體系的轉(zhuǎn)換也可能造成精度的差異。統(tǒng)一的分類體系是土地覆被數(shù)據(jù)精度評(píng)價(jià)的基礎(chǔ),但不同的分類體系在向目標(biāo)分類體系轉(zhuǎn)換時(shí)可能存在誤差,從而會(huì)影響后續(xù)精度評(píng)價(jià)的準(zhǔn)確性。
從混淆類型來看,黃河流域主要表現(xiàn)為耕地、林地和草地的混淆,這與已有的研究結(jié)果類似[13,19,21]。例如全國(guó)尺度耕地和草地面積變化趨勢(shì)以及空間分布與我國(guó)實(shí)際情況存在較大差距[13],河南省山地與平原、山地與盆地過渡帶的耕地、林地和草地混淆嚴(yán)重[19,21]??梢?目前對(duì)于植被類型的精確分類仍是土地覆被數(shù)據(jù)生產(chǎn)的主要難題之一,在未來針對(duì)耕地、林地和草地的混淆現(xiàn)象,建議在結(jié)合地形特征的基礎(chǔ)上,引入?yún)^(qū)域植被物候信息以降低“異物同譜”所帶來的影響。
綜上,本研究通過在Google Earth 上選擇驗(yàn)證點(diǎn)對(duì)黃河流域6 種土地覆被數(shù)據(jù)進(jìn)行精度評(píng)價(jià),并選擇精度較高的數(shù)據(jù)作為參考數(shù)據(jù)與其他數(shù)據(jù)進(jìn)行面積一致性分析和類別圖譜分析。主要結(jié)論如下: 利用驗(yàn)證點(diǎn)對(duì)6 種土地覆被數(shù)據(jù)進(jìn)行精度評(píng)價(jià)可得,6種數(shù)據(jù)的精度為71.82%~88.12%,其中30 m 的土地覆被數(shù)據(jù)中,CLCD_v01_2020 產(chǎn)品精度最高,低分辨率的數(shù)據(jù)中,LANDCOVER300 產(chǎn)品精度最高,為77.79%。6 種數(shù)據(jù)對(duì)黃河流域土地覆被構(gòu)成的描述基本一致,即黃河流域主要以草地、耕地和林地為主體,繼而為水域、冰川雪地、裸地和建設(shè)用地等其他土地類型。不同土地覆被產(chǎn)品與CLCD_v01_2020的面積相關(guān)性很強(qiáng),相關(guān)系數(shù)為96.87%~99.76%。不同產(chǎn)品與CLCD_v01_2020 在黃河上游青海東部的草地,黃河中下游部分耕地和建設(shè)用地等類型較為單一的區(qū)域一致性較高,而在陜西北部、山西西部的一致性較差,主要表現(xiàn)為草地和林地的混淆。針對(duì)黃河流域土地覆被數(shù)據(jù),30 m 分辨率的數(shù)據(jù)中可以綜合選擇總體精度最高的CLCD_v01_2020 數(shù)據(jù),百米級(jí)分辨率數(shù)據(jù)中選擇LANDCOVER300,或者生成粗分辨率像元內(nèi)各地類的面積百分比,以提高計(jì)算和模擬精度。
中國(guó)生態(tài)農(nóng)業(yè)學(xué)報(bào)(中英文)2023年6期