陳 迪,吳文斌, 2,陸 苗,胡 瓊,周清波※
(1.中國農(nóng)業(yè)科學院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)部農(nóng)業(yè)信息技術重點實驗室,北京 100081;2.華中師范大學城市和環(huán)境科學學院,湖北武漢 430079)
?
·研究綜述·
基于多源數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建研究進展綜述*
陳 迪1,吳文斌1, 2,陸 苗1,胡 瓊1,周清波1※
(1.中國農(nóng)業(yè)科學院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)部農(nóng)業(yè)信息技術重點實驗室,北京 100081;2.華中師范大學城市和環(huán)境科學學院,湖北武漢 430079)
地表覆蓋數(shù)據(jù)對于全球環(huán)境變化、生物多樣性和發(fā)展政策制定有著重要意義。遙感已成為獲取地表覆蓋數(shù)據(jù)的重要手段。而目前的地表覆蓋數(shù)據(jù)產(chǎn)品,如GlobeLand30、FROM-GLC、MODIS Collection5、MODIS Cropland、GlobCover、GLC2000等,存在數(shù)據(jù)精度不高、數(shù)據(jù)間一致性較差、與統(tǒng)計數(shù)據(jù)差異較大等問題。因此,基于多源數(shù)據(jù)融合的數(shù)據(jù)重建方法成為目前研究中的熱點問題。文章檢索了近10年關于多源數(shù)據(jù)融合在地表覆蓋數(shù)據(jù)重建中的應用的相關文獻,概括了多源數(shù)據(jù)在數(shù)據(jù)重建中的應用現(xiàn)狀,并對基于多源數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建方法進行了歸納總結,重點評述了不同方法的特點及應用情況,闡明了各種方法的優(yōu)勢與不足,同時對存在的問題進行探討并展望了未來基于多源數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建研究的發(fā)展方向。基于多源數(shù)據(jù)融合的數(shù)據(jù)重建方法包括基于多源遙感數(shù)據(jù)融合法以及基于多源遙感和非遙感數(shù)據(jù)融合法。該文在對基于多源遙感數(shù)據(jù)融合的數(shù)據(jù)重建方法進行論述時,主要討論了其中應用最廣泛的兩種融合方法:基于數(shù)據(jù)一致性的融合法和基于回歸分析的融合法。對于其他基于多源遙感數(shù)據(jù)融合的數(shù)據(jù)重建方法,如基于D-S證據(jù)理論融合法、基于數(shù)據(jù)集成融合法、基于統(tǒng)計模型融合法,也列舉了最具代表性的相關文獻進行論述。在對基于遙感數(shù)據(jù)和非遙感數(shù)據(jù)融合的數(shù)據(jù)重建方法進行論述時,主要討論了其3種空間分配方法:完全依賴法、部分依賴法、動態(tài)依賴法。在對目前研究進行探討的過程中,該文對其研究區(qū)域、數(shù)據(jù)源、地表覆蓋類型、空間分辨率、融合方法和文獻來源進行總結分析,并重點就融合方法展開討論。圍繞各種融合方法在數(shù)據(jù)重建中的運用,該文歸納出目前研究中存在的主要問題:研究對象和區(qū)域上的不足,研究區(qū)多為全球及歐美,其他區(qū)域的研究過少,研究對象多為所有地表覆蓋類型和森林,對耕地和草地的研究過少; 融合算法上的不足、重建結果精度上的不足。最后,指出基于多源數(shù)據(jù)融合的數(shù)據(jù)重建方法未來的發(fā)展方向,即綜合運用兩類方法,得到具有詳細完整空間信息的長時間序列的地表覆蓋數(shù)據(jù)集。
多源數(shù)據(jù) 遙感 地表覆蓋 融合方法 重建
地表覆蓋是地球表面各種物質類型及其自然屬性特征的綜合體,對地球物理和化學循環(huán)、物質能量平衡具有重要作用[1],同時也是全球變化的重要內容和原因[2]。地表覆蓋及其時空動態(tài)變化研究因此一直都是國際學術界廣泛關注的研究方向[3-4]。獲取高精度、大范圍、長時間序列的地表覆蓋數(shù)據(jù)成為地表覆蓋科學研究的首要前提。
地表覆蓋數(shù)據(jù)獲取常用的方法包括統(tǒng)計調查法、實地測量法、空間制圖法等。近年來,隨著遙感技術的興起和發(fā)展,遙感制圖法成為地表覆蓋數(shù)據(jù)獲取的主流方法。國際對地觀測組織(GEO)將地表覆蓋數(shù)據(jù)遙感獲取作為其未來10年發(fā)展執(zhí)行方案中最重要的任務之一。利用該方法獲取的地表覆蓋數(shù)據(jù)已經(jīng)成為生物地球化學、水土流失、大氣環(huán)流模型、碳循環(huán)等方面研究的基礎數(shù)據(jù)[5-7]。然而,由于地表覆蓋的復雜多樣性、時空異質性和尺度敏感性[8],基于單一數(shù)據(jù)源的地表覆蓋識別分類和制圖效果往往不理想。如遙感僅能獲取距今30~40年的地表覆蓋數(shù)據(jù); 受天氣因素影響,部分區(qū)域無法獲得適宜的遙感數(shù)據(jù); 不同來源的遙感數(shù)據(jù)獲得同一區(qū)域的地表覆蓋數(shù)據(jù)具有差異性[9-10]。多源數(shù)據(jù)具有大范圍和長時間的優(yōu)勢,為地表覆蓋數(shù)據(jù)重建提供了新途徑,在很大程度上可以彌補了單一數(shù)據(jù)和分類方法的缺陷。近年來,很多國內外研究人員開展了基于多源數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建研究,在理論、技術方法方面取得了顯著進展。但是,目前沒有文獻對這些研究進行系統(tǒng)性梳理和總結,使得地表數(shù)據(jù)重建中的多源數(shù)據(jù)融合總體研究進展仍不清晰?;诖?,文章檢索國內外發(fā)表的期刊論文,對近年來基于多源數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建方法進行評述。
多源數(shù)據(jù)融合的地表覆蓋重建就是將多種不同來源的數(shù)據(jù),通過一定的數(shù)學算法進行融合,憑借多源數(shù)據(jù)在時空分辨率、完整性、精度等方面的互補性,綜合了各個輸入數(shù)據(jù)集,彌補了單個數(shù)據(jù)集的不足。目前,多源數(shù)據(jù)總體上可以分為遙感數(shù)據(jù)源和非遙感數(shù)據(jù)源。
遙感數(shù)據(jù)源即多種全球及區(qū)域尺度的地表覆蓋遙感數(shù)據(jù)產(chǎn)品,如GlobeLand30數(shù)據(jù)[11]、FROM-GLC數(shù)據(jù)[12]、MODIS Collection5數(shù)據(jù)[13]、MODIS Cropland數(shù)據(jù)[14]、GlobCover數(shù)據(jù)[15]、GLC2000數(shù)據(jù)[16]等。這些數(shù)據(jù)為全球和區(qū)域生態(tài)系統(tǒng)反演、數(shù)值天氣預報、陸面過程模擬等提供了豐富數(shù)據(jù)源。但是,不同數(shù)據(jù)集來自不同的傳感器、分類體系存在差異、分辨率不盡相同,使得不同數(shù)據(jù)集的精度和一致性差異較大?;诙嘣催b感數(shù)據(jù)的融合可以在很大程度上避免分辨率不同、數(shù)據(jù)一致性差、分類算法不同的問題,使得融合得到的地表覆蓋數(shù)據(jù)精度高于單一數(shù)據(jù)產(chǎn)品,削弱單一數(shù)據(jù)的缺陷。
非遙感數(shù)據(jù)源包括歷史統(tǒng)計數(shù)據(jù)、歷史土地利用信息[17-22]、土地利用現(xiàn)狀調查數(shù)據(jù)及植被景觀數(shù)據(jù)[23]、歷史時期專題圖件[24]等。利用非遙感數(shù)據(jù)源與遙感數(shù)據(jù)源結合進行空間分配,建立算法模型進行地表覆蓋數(shù)據(jù)重建,可以得到長時間序列的地表覆蓋數(shù)據(jù)集。目前,利用非遙感數(shù)據(jù)源的地表覆蓋數(shù)據(jù)重建的結果多是行政單元上的面積數(shù)量,缺乏足夠分辨率的空間屬性[19]。為此,不少學者就重建具有空間屬性信息的地表覆蓋數(shù)據(jù)進行了努力,最著名的兩個數(shù)據(jù)集為Ramankutty 等[25]重建的“過去300年全球地表覆蓋數(shù)據(jù)集”(SAGE 數(shù)據(jù)集)和Goldewijk[26-27]等重建的“全球歷史環(huán)境數(shù)據(jù)集”(Historical Database of the Global Environment,HYDE 數(shù)據(jù)集)。SAGE數(shù)據(jù)集重建了近300年的全球耕地數(shù)據(jù)。HYDE 3.1數(shù)據(jù)集將重建時間尺度延伸到過去1.2萬年,所用的數(shù)據(jù)資料和分配算法也較SAGE數(shù)據(jù)集好。雖如此,具有明確空間屬性信息的歷史地表覆蓋數(shù)據(jù)集重建研究還是相對薄弱[28]。表1列舉了部分具代表性的地表覆蓋數(shù)據(jù)集。
從已有文獻看,基于多源遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建方法根據(jù)融合方法可分為6類:基于回歸分析的融合、基于數(shù)據(jù)一致性的融合、基于D-S證據(jù)理論的融合、基于數(shù)據(jù)集成方法的融合、基于模糊集合理論的融合及基于統(tǒng)計模型的融合。目前,應用最廣泛的是基于數(shù)據(jù)一致性分析的融合方法和基于回歸分析的融合方法。
2.1 基于數(shù)據(jù)一致性的融合方法
基于數(shù)據(jù)一致性的融合是在多源遙感數(shù)據(jù)權重設置的基礎上,分析多源遙感數(shù)據(jù)間的一致性,建立融合決策規(guī)則,從而對多源遙感數(shù)據(jù)源進行融合。該方法的關鍵是如何建立融合的決策規(guī)則。表2列出基于數(shù)據(jù)一致性分析的融合方法代表性論文。早在2006年,Jung[29]提出了一種基于親和力指數(shù)的多源數(shù)據(jù)融合方法,實現(xiàn)了MODIS、GLC2000、DISCover 等多源數(shù)據(jù)融合,結果表明融合結果能更好地表達異質性區(qū)域的地表覆蓋類型,具有較好的空間一致性。但該方法認為所有參與融合的數(shù)據(jù)具有相同的權重,主觀因素決定性強,屬于一種定性的數(shù)據(jù)融合方法。Ramankutty[30]對兩套全球土地覆蓋數(shù)據(jù)GLC2000和MOIDS進行空間一致性分析,找出兩類數(shù)據(jù)的一致性及異質性區(qū)域; 然后以農(nóng)業(yè)統(tǒng)計資料為訓練樣本,對一致性較差的區(qū)域進行重新分類,獲得了2000年全球耕地和草地數(shù)據(jù)集。Schepaschenko等[31]以俄羅斯為研究區(qū)域,提出了一種基于適宜性指數(shù)的融合方法,該方法可融合遙感、統(tǒng)計和野外調查數(shù)據(jù),生成地表覆蓋數(shù)據(jù)。融合生成的數(shù)據(jù)具有詳細的分類體系,并且能夠應用于生物化學模型的參數(shù)設置。Fritz等[15,32]根據(jù)不同耕地數(shù)據(jù)間的一致性情況設置權重,在產(chǎn)品疊置分析的基礎上計算不同一致量下耕地的面積,確定和統(tǒng)計數(shù)據(jù)較接近的一致量。在最佳一致量的基礎上,細化耕地產(chǎn)品排列組合,按照產(chǎn)品權重,對不同的產(chǎn)品組合進行打分。按照分值計算融合后的耕地面積,并比較和統(tǒng)計數(shù)據(jù)的接近程度,直到找出和統(tǒng)計數(shù)據(jù)最吻合的耕地組合為止。利用該方法研制了空間一致性較高、精度較高的地表覆蓋數(shù)據(jù)。Waldner等[33]提出基于多指標分析的融合方法,將多源數(shù)據(jù)的一致性、精度、置信水平等作為指標分別進行打分,利用得分來決定數(shù)據(jù)的權重,進而對重疊區(qū)域中得分高的數(shù)據(jù)集進行融合。此法需要足夠的專家知識,預先知道各個指標之間一致性高低的區(qū)域,而且對于地理位置的誤差敏感性很高。
表1 代表性地表覆蓋數(shù)據(jù)集
2.2 基于回歸分析的融合方法
基于回歸分析的融合是建立訓練樣本和數(shù)據(jù)集之間的回歸關系[34-35],預測無樣本區(qū)域耕地/地表覆蓋類型出現(xiàn)的概率,從而得到融合結果。該方法的關鍵在于需要地表大量的訓練數(shù)據(jù)建立回歸模型。表3列出基于回歸分析的融合方法代表性論文。Dendoncker[36]選擇了土壤含水量、土壤厚度、土壤質地、溫度、坡度、預測位置的地表覆蓋類型數(shù)量和距離水源的距離作為解釋變量,構建了一種Logistic回歸模型,預測了比利時土地覆蓋類型的空間分布特征。Kinoshita等[37]利用Logistic回歸模型實現(xiàn)了MOD12C4、MOD12C5、GLC2000、UMD、GLCNMO和GlobCover六種數(shù)據(jù)的融合,發(fā)現(xiàn)融合數(shù)據(jù)集的個數(shù)對融合結果的精度有著重要影響,訓練樣本點個數(shù)對精度影響不大。Song等[38]利用全球和區(qū)域地表覆蓋產(chǎn)品GLCC、GLC2000、GlobCover、MODIS VCF、UMD LC、MODIS LC建立回歸樹模型進行融合,得到一幅北美洲百分比森林覆蓋產(chǎn)品。See等[39]用MODIS、GLC2000和GlobCover 3種數(shù)據(jù),利用地理加權回歸Logistic函數(shù)建立訓練樣本和數(shù)據(jù)集之間的回歸關系,預測無樣本區(qū)的地表覆蓋類型,分別得到空間分辨率為1km的兩種全球所有地表覆蓋數(shù)據(jù)。第一種數(shù)據(jù)中,地理加權回歸用于決定每個位置上的最佳地表覆蓋產(chǎn)品; 第二種數(shù)據(jù)中,地理加權回歸只用于在3種產(chǎn)品出現(xiàn)分歧的地方,決定最佳地表覆蓋類型,而其他地方則用那些地表覆蓋地圖的一致來決定最佳地表覆蓋類型。結果表明,融合精度在森林類別上最高,而且第一種數(shù)據(jù)精度要高。Schepaschenko等[40]利用了和See相同的融合方法,但輸入的數(shù)據(jù)源為GLC2000、GLCNMO、GlobeCover、MODIS LC和Regional mosaics等地表覆蓋數(shù)據(jù),以及MODIS VCF、Landsat VCF和Hansen’s TC等森林覆蓋數(shù)據(jù),得到森林概率分布圖和森林覆蓋百分比圖,再以森林概率圖為掩膜,與森林覆蓋百分比圖相乘,得到“最佳估測”森林覆蓋圖。
表3 基于回歸分析的融合方法代表論文
2.3 其它多源遙感數(shù)據(jù)融合方法
表4列出其它多源遙感數(shù)據(jù)融合方法。冉有華等[41-42]采用D-S證據(jù)理論的方法將MOD12Q1、中國1: 10萬冰川圖、中國植被圖集的植被類型和中國沼澤濕地圖進行融合,結果不僅補充了植被圖中的植被類型及植被季相信息,而且更新了中國冰川圖和濕地圖,同時還提高了2000年中國土地覆蓋數(shù)據(jù)的精度。俞樂等[43]首先將兩套粗分辨率的不透水層產(chǎn)品降維成30m,然后構建決策樹規(guī)則將FROM-GLC-seg與FROM-GLC進行合成,最后將上述產(chǎn)品進行集成,生成新的30m地表覆蓋產(chǎn)品。同時,還結合了更多的數(shù)據(jù)對生成的產(chǎn)品進行空間升尺度處理,生成了包括30m, 250m, 500m, 1 km, 5km, 10km, 25km, 50km和100km的9 個不同分辨率的數(shù)據(jù)。這一全球地表覆蓋層級產(chǎn)品的構建框架,同樣適用于其他全球和區(qū)域地表覆蓋產(chǎn)品,如中國土地利用數(shù)據(jù)集、歐洲Corine 土地覆蓋數(shù)據(jù)、美國土地覆蓋數(shù)據(jù)集、全球陸表濕地潛在分布區(qū)圖、單類型土地覆蓋等[43]。A.Pérez-Hoyos等[44]采用模糊集合理論,實現(xiàn)了歐洲區(qū)域內MODIS、GLOBCOVER、GLC2000和CORINE四種數(shù)據(jù)的融合,這種方法可以融合不同時間分辨率和空間分辨率的遙感數(shù)據(jù),不僅保留了原有數(shù)據(jù)的優(yōu)點,而且在空間一致性和精度上都得到了提高,但該方法的不足之處在于未考慮到數(shù)據(jù)在融合過程中的權重問題。Hurtt等[45]采用統(tǒng)計模型實現(xiàn)了美國農(nóng)業(yè)部土地利用數(shù)據(jù)庫和美國IGBP 1km土地覆蓋遙感數(shù)據(jù)的融合,生成的美國2000年高精度土地覆蓋數(shù)據(jù)集,結合了農(nóng)業(yè)土地利用數(shù)據(jù)庫精確的屬性特征以及 IGBP 數(shù)據(jù)空間上詳細的地表覆蓋類型。Wadsworth等[46]提出了一種語義統(tǒng)計模型對西伯利亞地區(qū)3種不同的土地覆蓋數(shù)據(jù)進行融合實驗,此模型中數(shù)據(jù)間的一致性由重疊度的高低來表達,指出了未來需要重點調查的一些區(qū)域。
基于多源遙感與非遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建就是將行政單元上的地表覆蓋面積統(tǒng)計數(shù)量轉化為具有地理屬性、更精細的空間數(shù)據(jù)。該方法的重建流程主要包括地表覆蓋類型面積數(shù)量的重建和空間地理位置的重建。數(shù)量重建是空間分布重建的前提,空間分布重建是將無空間屬性的統(tǒng)計數(shù)據(jù)按照一定規(guī)則或算法分配到空間單元,實現(xiàn)數(shù)量信息的空間化表達。該方法的輸入數(shù)據(jù)往往包括3類:一是地表覆蓋類型面積統(tǒng)計數(shù)據(jù); 二是參與數(shù)量重建的輔助資料數(shù)據(jù),多為人口數(shù)據(jù); 三是空間重建中的自然和社會經(jīng)濟因子數(shù)據(jù),如人口密度、坡度、海拔、土壤等。表5列出了多源遙感數(shù)據(jù)與非遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建代表性論文。
表4 基于多源遙感數(shù)據(jù)融合制圖其它方法代表論文
表5 基于多源遙感數(shù)據(jù)與非遙感數(shù)據(jù)融合的制圖方法代表性論文
3.1 完全依賴法
完全依賴法是以現(xiàn)代地表覆蓋空間格局來推算歷史地表覆蓋空間格局。該方法將研究區(qū)域劃分為空間網(wǎng)格單元,假設每個網(wǎng)格單元分配到的地表覆蓋面積占總面積的比例不變,變化的是地表覆蓋類型的總面積。因此,該方法多適用于具有悠久歷史、地表利用強度高地區(qū)的長時間地表覆蓋數(shù)據(jù)重建。如SAGE數(shù)據(jù)集重建了1700~1992年的耕地數(shù)據(jù),時間分辨率在19世紀50年代之前為50年, 19世紀50年代至20世紀80年代為10年, 1986年以后為1年; 空間分辨率為0.5°[20]。其使用的數(shù)據(jù)源是Houghton和Richards[50]估算的大陸尺度1850~1980年耕地轉換速率、1700~1980年耕地面積以及FAO不同國家1961~1992年耕地數(shù)據(jù)[50]等。重建流程是先利用收集到的歷史耕地統(tǒng)計數(shù)據(jù),繪制國家單元歷史耕地覆蓋比例圖; 再利用1992年全球耕地統(tǒng)計數(shù)據(jù)來校正同期DISCover耕地數(shù)據(jù),獲得1992年耕地空間分布圖; 然后將歷史耕地覆蓋比例圖與耕地空間分布圖疊加,得到具有地理空間位置的歷史耕地數(shù)據(jù)[50]。完全依賴法假定自然條件和人類農(nóng)業(yè)活動相對穩(wěn)定,該方法在變化較大的區(qū)域(如中國東北地區(qū))的重建結果與歷史真實結果有較大差異。
3.2 部分依賴法
部分依賴法是以現(xiàn)代地表覆蓋空間分布區(qū)域作為空間分配的邊界條件或飽和狀態(tài),在這一限制條件上再輔以地形坡度、人口密度等指示因子進行空間分配。林珊珊等[47]認為耕地已達到飽和,將中國傳統(tǒng)農(nóng)區(qū)歷史數(shù)據(jù)網(wǎng)格化,選擇坡度、地勢、海拔、坡向4個地形因子與墾殖率進行擬合。李柯等[48]以2000年MODIS影像中耕地空間分布范圍為基礎,以高程、坡度等為限制因子,將歷史考訂的縣域耕地面積數(shù)據(jù)分配到空間上,重建了云南省1671和1827年兩個時間斷面上的耕地空間分布信息,分辨率為90m。部分依賴法注重地表覆蓋空間格局的驅動機制分析,可以獲得較高分辨率的空間分布信息,使得重建結果更加合理,但其往往需要更多輔助數(shù)據(jù),未能充分考慮到地表覆蓋的時間動態(tài)擴展變化,也具有一定的局限性。
3.3 動態(tài)依賴法
動態(tài)依賴法不考慮現(xiàn)代地表覆蓋空間格局的時間效應,利用空間權重來指示地表覆蓋類型的空間分配。龍瀛等[49]以江蘇省為研究區(qū)考慮了耕地連片開發(fā)的原則,基于約束性CA建模進行空間格局重建,模擬出更為真實的空間動態(tài)過程。HYDE3.1數(shù)據(jù)集重建了自10000BC至AD2000年[26]的耕地和牧草地數(shù)據(jù)。1700年以后的時間分辨率為10年,空間分辨率為5[50]。該方法以國家為單元,以1994年人口密度圖為依據(jù),利用各國普查數(shù)據(jù)和聯(lián)合國人口統(tǒng)計數(shù)據(jù)等相關資料,編制歷史人口密度圖; 以歷史人口密度為權重,進行歷史耕地面積的空間分配[26]。在HYDE3.1數(shù)據(jù)集中,Klein Goldewijk等[26]提出了時間依賴的空間分配算法,該算法以空間權重圖來分配地表覆蓋,權重圖包括通過遙感得到的當代地表覆蓋權重和由社會、自然環(huán)境因子權重得到的歷史權重。當代和歷史地表覆蓋權重會隨著時間變化而變化,該方法在空間分配上包含了歷史地表覆蓋空間格局驅動因子分析,同時考慮了驅動因子對歷史空間格局影響的時間效應,但是并未對這一影響程度進行量化分析。
地表覆蓋空間分布數(shù)據(jù)獲取對于糧食安全、氣候變化及政策制定[51-52]具有重要意義。多源數(shù)據(jù)具有大范圍和長時間的優(yōu)勢,為地表覆蓋數(shù)據(jù)重建提供了新途徑,在很大程度上可以彌補了單一數(shù)據(jù)和分類方法的缺陷。受制于遙感技術產(chǎn)生及發(fā)展的時間限制,多源遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建方法不適用于長時間序列,但卻具有高精度的空間屬性?;诙嘣催b感與非遙感數(shù)據(jù)融合方法適合于長時間序列的研究,對地表覆蓋時空變化及其氣候和生態(tài)效應研究至關重要[28],但其空間分辨率往往要低。雖然近年來多源數(shù)據(jù)融合在地表覆蓋重建中取得了長足進展,但是還存在一些明顯不足,成為將來重點的發(fā)展方向。
一是研究對象與區(qū)域上的不足。目前,多源遙感數(shù)據(jù)融合的方法多是針對常用的地表覆蓋類型或森林類型,有關耕地或草地等其他類型的重建研究較少; 研究區(qū)域大多為全球區(qū)域或是歐美地區(qū),其他區(qū)域的研究較少。多源遙感數(shù)據(jù)與非遙感數(shù)據(jù)融合的地表覆蓋重建多針對小研究區(qū)域開展,有關該方法的大區(qū)域應用缺少。
二是融合算法上的不足。多源遙感數(shù)據(jù)融合的重建方法近10年取得了迅速發(fā)展,但不同的算法存在一些不足。如基于回歸分析的融合方法,由于不同遙感數(shù)據(jù)集在不同區(qū)域的精度不同,不同區(qū)域的數(shù)據(jù)融合時所選擇的數(shù)據(jù)集會不同。因此,在進行融合重建時需要先根據(jù)不同遙感數(shù)據(jù)在不同地區(qū)的精度情況,進行分區(qū)做逐步回歸分析,用貢獻大的數(shù)據(jù)集在一個區(qū)域做融合?;跀?shù)據(jù)一致性的融合方法需要根據(jù)精度對數(shù)據(jù)集劃分權重,進行排名打分,n種數(shù)據(jù)產(chǎn)品進行打分設置時,需要設置2n-1種情況,容易出現(xiàn)“打分災難”。因此,需要采用分層最優(yōu)融合的方法,按照地表覆蓋數(shù)據(jù)間的一致性,以統(tǒng)計數(shù)據(jù)為標準,從一致量和產(chǎn)品組合兩個層次進行分層最優(yōu)融合?;跀?shù)據(jù)集成方法融合和基于統(tǒng)計模型融合的方法需要改進之處是增加更多的數(shù)據(jù)集進行融合。基于D-S理論的融合方法在其基本概率確定時不能完全依靠經(jīng)驗,對其融合后的不確定性特征應做進一步處理。基于模糊集合理論的融合方法應注意考慮每種數(shù)據(jù)在融合過程中的類別權重問題。隨著各種算法的改進,多源遙感數(shù)據(jù)融合的方法會越來越成熟、精度會越來越高,未來也會成為地表覆蓋數(shù)據(jù)重建的主流方法。
三是重建結果精度上的不足。多源數(shù)據(jù)融合不僅要獲取地表覆蓋數(shù)據(jù),更要獲得精度可靠的數(shù)據(jù)。多源遙感數(shù)據(jù)生產(chǎn)時間不一致、分類方法各異,導致最后的融合結果存在誤差[53]。將基于Google Earth平臺的Geo-Wiki[54]實地觀測樣本引入可以減少誤差,提高重建結果的精度。目前,全球尺度應用最為廣泛的SAGE數(shù)據(jù)集和HYDE3.0數(shù)據(jù)集仍不夠精細,在中國傳統(tǒng)農(nóng)區(qū)[55]和東北區(qū)域[56]都存在較大誤差。區(qū)域尺度上,Liu等[57]雖然建立了高精度的中國地表覆蓋數(shù)據(jù)集,但基于地表覆蓋格局不變的假設。多數(shù)基于多源遙感與非遙感數(shù)據(jù)融合研究的數(shù)據(jù)空間分辨率低,缺少高精度的具有空間屬性的地表覆蓋信息。同時,歷史統(tǒng)計資料和估算方法也具有很大不確定性,社會經(jīng)濟、政策等因素對歷史地表覆蓋變化的影響考慮不夠,這些都影響了重建數(shù)據(jù)的精度。因此,提高重建結果的可信度和準確性,必須要在獲得準確可靠的統(tǒng)計資料、保證當代底圖精度的前提下,了解區(qū)域內發(fā)生的影響地表覆蓋空間格局的重大歷史事件及歷史過程,同時采用合理的分配算法,并加強對影響空間格局的驅動因子的量化分析[28]。對于社會經(jīng)濟、人口密度、政策影響等因素的考慮也是將來需要重點加強的地方。在有重大歷史事件(戰(zhàn)爭、重要政策頒布)的年份要重點進行重建,而不是能是簡單地順序推演。最后,考慮到不同區(qū)域間歷史過程、自然條件的差異和特征,分區(qū)域進行數(shù)據(jù)重建也是未來發(fā)展的重要方向,可以保證重建結果的精度,同時加強不同區(qū)域間重建結果的集成,以便重建結果在更大尺度上得到應用。
綜上所述,基于多源遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建的優(yōu)勢在于地表覆蓋空間分布信息明確,基于多源遙感和非遙感數(shù)據(jù)融合的地表覆蓋數(shù)據(jù)重建優(yōu)勢在于可獲得長時間序列的地表覆蓋分布信息。這兩類方法各有其優(yōu)勢與劣勢,如何取其精華去其糟粕,將兩類方法綜合應用,得到具有詳細完整空間信息、長時間序列的地表覆蓋數(shù)據(jù),將是多源數(shù)據(jù)融合地表覆蓋數(shù)據(jù)重建未來的發(fā)展方向。
[1] Foley J A,DeFries R,Asner G P,et al.Global consequences of land use. Science, 2005, 309(5734): 570~574
[2] Li X F,Ju W M,Chen S,et al.Influence of land cover data on regional forest leaf area index inversion.Journal of Remote Sensing,2010, 14(5): 974~989
[3] 唐華俊, 吳文斌,楊鵬,等.土地利用/土地覆被變化(LUCC)模型研究進展.地理學報, 2009, 64(4): 456~468
[4] 張宇碩, 陳軍,陳利軍,等.2000~2010年西伯利亞地表覆蓋變化特征——基于GlobeLand30的分析.地理科學進展, 2015, 34(10): 1324~1333
[5] Bonan G B,Oleson K W,Vertenstein M,et al.The land surface climatology of the community land model coupled to the NCAR community climate model.Journal of Climate, 2002, 15(22): 3123~3149
[6] Running S W,Nemani R R,Heinsch F A,et al.A continuous satellite-derived measure of global terrestrial primary production.Bioscience, 2004, 54(6): 547~560
[7] Zhang K,Kimball J S,Mu Q,et al.Satellite based analysis of northern ET trends and associated changes in the regional water balance from 1983 to 2005.Journal of Hydrology, 2009, 397(1-2): 92~110
[8] 宋茜, 周清波,吳文斌,等.農(nóng)作物遙感識別中的多源數(shù)據(jù)融合研究進展.中國農(nóng)業(yè)科學, 2015, 48(6): 1122~1135
[9] 吳文斌, 楊鵬,張莉,等.四類全球土地覆蓋數(shù)據(jù)在中國區(qū)域的精度評價.農(nóng)業(yè)工程學報, 2009, 25(12): 167~173
[10]陸苗, 吳文斌,張莉,等.五套全球耕地制圖產(chǎn)品在中國區(qū)域的比對研究(出版中).中國科學, 2016
[11]陳軍, 陳晉,廖安平,等.全球30m地表覆蓋遙感制圖的總體技術.測繪學報, 2014, 43(6): 551~557
[12]Gong P,Wang J,Yu L,et al.Finer resolution observation and monitoring of global land cover:first mapping results with Landsat Tm and ETM+data.International Journal of Remote Sensing, 2013, 34(7): 2607~2654
[13]Friedl M A,Sulla-Menashe D,Tan B,et al.MODIS Collection 5 global land cover:Algorithm refinements and characterization of new datasets.Remote Sensing of Environment, 2010, 114(1): 168~182
[14]Pittman K,Hansen M C,Becker-Reshef I,et al.Estimating global cropland extent with multi-year MODIS data.Remote Sensing, 2010, 2(7): 1844~1863
[15]Fritz S,You L,Bun A,et al.Cropland for sub-Saharan Africa:A synergistic approach using five land cover data sets.Geophysical Research Letters, 2011, 38:L04404,doi: 10.1029/2010GL046213
[16]Bartholome E,Belward A S.GLC2000:a new approach to global land cover mapping from Earth observation data.International Journal of Remote Sensing, 2005, 26(9): 1959~1977
[17]何凡能, 葛全勝,戴君虎,等.近300年來中國森林的變遷.地理學報, 2007, 62(1): 30~40
[18]何凡能, 葛全勝,鄭景云.中國清代城鎮(zhèn)用地面積估算及其比較.地理學報, 2002, 57(6): 709~716
[19]葉瑜, 方修琦,任玉玉,等.東北地區(qū)過去300年耕地覆蓋變化.中國科學(D輯:地球科學), 2009, 39(3): 340~350
[20]葉瑜, 方修琦,張學珍,等.過去300年東北地區(qū)林地和草地覆蓋變化.北京林業(yè)大學學報, 2009, 31(5): 137~144
[21]Petit C C,Lambin E F.Long-term land-cover changes in the Belgian Ardennes(1775-1929)model-based reconstruction vs.historical maps.Global Change Biology, 2002, 8(7): 616~630
[22]白淑英, 張樹文,張養(yǎng)貞.土地利用/土地覆被時空分布100年數(shù)字重建——以大慶市杜爾伯特蒙古族自治縣為例.地理學報, 2007, 62(4): 427~436
[23]丁偉, 龐瑞洺,許清海.中國東部暖溫帶低山丘陵區(qū)表土花粉對人類活動的指示意義.科學通報, 2011, 56(11): 839~847
[24]匡文慧, 張樹文,張養(yǎng)貞,等.1900年以來長春市土地利用空間擴張機理分析.地理學報, 2005, 60(5): 841~850
[25]Ramankutty N,F(xiàn)oley J.Estimating historical changes in global land cover:croplands from 1700 to 1992.Global Biogeochemical Cycles, 1999, 13(4): 997~1027
[26]Goldewijk K K,Beusen A,Van Drecht G,et al.The HYDE3.1 spatially explicit database of human-induced global land-use change over the past 12, 000 years.Global Ecology and Biogeography, 2011, 20(1): 73~86
[27]Goldewijk K K.Estimating global land use change over the past 300 Years:The HYDE database. Global Biogeochemical Cycles, 2001, 15(2): 417~433
[28]朱楓, 崔雪鋒,繆麗娟.中國歷史時期土地利用數(shù)據(jù)集的重建方法述評.地理科學進展, 2012, 31(12): 1563~1573
[29]Jung M,Henkel K,Herold M,et al.Exploiting synergies of global land cover products for carbon cycle modeling.Remote Sensing of Environment, 2006, 101(4): 534~553
[30]Ramankutty N,Evan A T,Monfreda C,et al.Farming the planet: 1.Geographic distribution of global agricultural lands in the year 2000.Global Biogeochemical Cycles, 2008, 22:GB1003,doi: 10.1029/2007GB002952
[31]Schepaschenko D,McCallum I,Shvidenko A,et al.A new hybrid land cover dataset for Russia:a methodology for integrating statistics,remote sensing and in situ information.Journal of land Use Science, 2011, 6(4): 245~259
[32]Fritz S,See L,McCallum I,et al.Mapping global cropland and field size.Global Change Biology, 2015, 21(5): 1980~1992
[33]Waldner F,F(xiàn)ritz S,Di Gregorio A,et al.Mapping priorities to focus cropland mapping activities:fitness assessment of existing global,Regional and National Cropland Maps.Remote Sensing, 2015, 7(6): 7959~7986
[34]夏天, 吳文斌,周清波,等.基于地理回歸的農(nóng)作物播種面積統(tǒng)計數(shù)據(jù)空間化方法(出版中).自然資源學報, 2016
[35]夏天, 吳文斌,余強毅,等.農(nóng)作物空間格局動態(tài)變化模擬模型(CROPS)構建.中國農(nóng)業(yè)資源與區(qū)劃, 2014, 35(1): 44~51
[36]Dendoncker N,Rounsevell M,Bogaert P.Spatial analysis and modelling of land use distributions in Belgium.Computers,Environment and Urban Systems, 2007, 31: 188~205
[37]Kinoshita T,Iwao K,Yamagata Y.Creation of a global land cover and a probability map through a new map integration method.International Journal of Applied Earth Observation and Geoinformation, 2014, 28: 70~77
[38]Song X,Huang C,F(xiàn)eng M,et al.Integrating global land cover products for improved forest cover characterization:an application in North America.International Journal of Digital Earth, 2014, 7(9): 709~724
[39]See L,Schepaschenko D,Lesiv M.Building a hybrid land cover map with crowdsourcing and geographically weighted regression.ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103: 48~56
[40]Schepaschenko D,See L,Lesiv M,et al.Development of a global hybrid forest mask through the synergy of remote sensing,crowdsourcing and FAO statistics.Remote Sensing of Environment, 2015, 162: 208~220
[41]冉有華, 李新,盧玲.基于多源數(shù)據(jù)融合方法的中國1km土地覆蓋分類制圖.地球科學進展, 2009, 24(2): 192~203
[42]Ran Y H,Li X,Lu L,et al.Large-scale land cover mapping with the integration of multi-source information based on the Dempster-Shafer theory.International Journal of Geographical Information Science, 2012, 26(1): 169~191
[43]俞樂, 王杰,李雪草,等.基于多源數(shù)據(jù)集成的多分辨率全球地表覆蓋制圖.中國科學:地球科學, 2014, 9(8): 1646~1660
[44]Perez-Hoyos A,Garcia-Haro F J,San-Miguel-Ayanz J.A methodology to generate a synergetic land-cover map by fusion of different land-cover products.International Journal of Applied Earth Observation and Geoinformation, 2012, 19: 72~87
[45]Hurtt G C,Rosentrater L,F(xiàn)rolking S,et al.Linking remote-sensing estimates of land cover and census statistics on land use to produce maps of land use of the conterminous United States.Global Biogeochemical Cycles, 2001, 15(3): 673~685
[46]Wadsworth R,Balzter H,Gerard F,et al.An environmental assessment of land cover and land use change in Central Siberia using quantified conceptual overlaps to reconcile inconsistent data sets.Journal of land Use Science, 2008, 3(4): 251~264
[47]林珊珊, 鄭景云,何凡能.中國傳統(tǒng)農(nóng)區(qū)歷史耕地數(shù)據(jù)網(wǎng)格化方法.地理學報, 2008, 63(1): 83~92
[48]李柯, 何凡能,張學珍.基于MODIS數(shù)據(jù)網(wǎng)格化重建歷史耕地空間分布的方法——以清代云南省為例.地理研究, 2011, 30(12): 2281~2288
[49]龍瀛, 金曉斌,李苗裔,等.利用約束性CA重建歷史時期耕地空間格局——以江蘇省為例.地理研究, 2014, 33(12): 2239~2250
[50]何凡能, 李士成,張學珍,等.中國傳統(tǒng)農(nóng)區(qū)過去300年耕地重建結果的對比分析.地理學報, 2012, 67(9): 1190~1200
[51]吳文斌, 楊鵬,李正國,等.農(nóng)作物空間格局變化研究進展評述.中國農(nóng)業(yè)資源與區(qū)劃, 2014, 35(1): 12~20
[52]唐鵬欽, 姚艷敏,吳文斌,等.基于遙感技術的耕地復種指數(shù)研究進展.中國農(nóng)業(yè)資源與區(qū)劃, 2010, 31(2): 21~27
[53]See L,F(xiàn)ritz S,You L,et al.Improved global cropland data as an essential ingredient for food security.Global Food Security, 2014, 4: 37~45
[54]Fritz S,McCallum I,Schill C,et al.Geo-Wiki:An online platform for improving global land cover.Environmental Modelling & Software, 2012, 31: 110~123
[55]Zhang X Z,He F N,Li S C.Reconstructed cropland in the mid-eleventh century in the traditional agricultural area of China:implications of comparisons among datasets.Regional Environmental Change, 2013, 13(5): 969~977
[56]李蓓蓓, 方修琦,葉瑜,等.全球土地利用數(shù)據(jù)集精度的區(qū)域評估:以中國東北地區(qū)為例.中國科學:地球科學, 2010, 40(8): 1048~1059
[57]Liu M L,Tian H Q.China′s land cover and land use change from 1700 to 2005:estimations from high-resolution satellite data and historical archives.Global Biogeochemical Cycles, 2010, 24:GB3003,doi: 10.1029/2009GB003687
PROGRESSES IN LAND COVER DATA RECONSTRUCTION METHOD BASED ON MULTI-SOURCE DATA FUSION*
Chen Di1,Wu Wenbin1, 2,Lu Miao1,Hu Qiong1,Zhou Qingbo1※
(1.Key Laboratory of Agri-informatics,Ministry of Agriculture/Institute of Agricultural Resources and Regional Planning,Chinese Academy of Agricultural Sciences,Beijing 100081,China;2.College of Urban & Environmental Sciences,Central China Normal University,Wuhan,Hubei 430079,China)
Land cover data is of great significance for global environmental change, biodiversity and policy-making. Remote sensing has been demonstrated an important method to obtain land cover data. Nowadays, there are varieties of remote sensing products, such as GlobeLand30, FROM-GLC, MODIS Collection5, MODIS Cropland, GlobCover, GLC2000. However, these previous remote sensing products exist some limitations, such as poor products accuracies, low consistency between different products and big discrepancy compared with statistic data. In this paper, the related literatures on the land cover data reconstruction methods based on the multi-source data fusion in the latest decade were sorted out, application of the multi-source data reconstruction methods were summarized, characteristics and development of different fusion methods in the latest researches were discussed intensively, and the advantages and disadvantages of various methods were concluded. This paper also discussed the limitations of current data reconstruction researches and proposed some important directions for future studies of the multi-source data fusion. In terms of the land cover reconstruction method based on multi-source remote sensing data fusion, this paper mainly discussed two widely-used methods: data consistency and regression analysis. In addition to the two common methods, other methods on multi-source remote sensing data fusion were also summarized, such as Dempster-Shafer evidential reasoning, data integration, statistical models, and the synergistic combination theory. In terms of the reconstruction method of fusing multi-source remote sensing and non-remote sensing data, three allocation methods were respectively discussed: the complete dependence method, partial dependence method and dynamic dependence method. The study region, used data source, targeted land cover types, spatial resolution, fusion methods and literature resources were respectively summarized and analyzed, among which the fusion methods were intensively discussed. At the end of this paper, the limitations and problems of the latest research were concluded: the study objectives were limited to the forest and all land cover types while the studies on the grassland and cultivated land were scarce. Most studies focused on European and American regions. Besides, the fusion methods were limited, and the accuracies of the reconstruction methods were not satisfactory. The future study directions and priorities of the reconstruction method were also proposed, such as integrating two methods to product a hybrid land cover map with a long time series and detailed spatial information.
multi-source data; remote sensing; land cover; hybrid methods; reconstruction
10.7621/cjarrp.1005-9121.20160912
2016-01-15
陳迪(1991—),女,貴州安順人,碩士研究生。研究方向:農(nóng)業(yè)遙感。
※通訊作者:周清波(1965—),男,湖南沅江人,研究員。研究方向:農(nóng)情遙感領域的基礎研究和應用基礎研究。Email:zhouqb@mail.caas.net.cn
*資助項目:測繪地理信息公益性行業(yè)科研專項項目“全球地表覆蓋數(shù)據(jù)分析”(201512028)
TP75
A
1005-9121[2016]09-0062-09
中國農(nóng)業(yè)資源與區(qū)劃2016年9期