韓 剛,何超英,陳 軍,廖安平
(1. 北京師范大學(xué) 資源學(xué)院,北京 100875; 2. 國(guó)家基礎(chǔ)地理信息中心,北京 100830)
全球地表覆蓋分布及變化是全球變化研究與地球系統(tǒng)模式發(fā)展的重要基礎(chǔ)數(shù)據(jù),國(guó)內(nèi)部分是地理國(guó)情監(jiān)測(cè)與國(guó)家宏觀調(diào)控分析的重要內(nèi)容[1-3]。近年來(lái),國(guó)際社會(huì)一直致力于利用空間遙感技術(shù)研究全球和區(qū)域的地表覆蓋及變化情況,積累了大量地表覆蓋空間數(shù)據(jù)資源[4]。中國(guó)于2009年啟動(dòng)了全球地表覆蓋遙感制圖項(xiàng)目,計(jì)劃三年完成2000和2010兩個(gè)基準(zhǔn)年度全球30 m地表覆蓋數(shù)據(jù)的遙感提取工作。受全球30 m影像獲取能力的限制與影像分類自身局限的影響,需要充分參考已有地表覆蓋數(shù)據(jù)和其他相關(guān)數(shù)據(jù)資料,在自動(dòng)提取基礎(chǔ)上加入大量人機(jī)交互檢查環(huán)節(jié)[5],盡可能減少有限時(shí)相覆蓋下復(fù)雜現(xiàn)實(shí)世界中不同地物的光譜混淆現(xiàn)象[6-7],最大限度提高影像分類的精度。
全球30 m影像及其他各種來(lái)源的參考資料數(shù)據(jù)量巨大、類型多樣、格式復(fù)雜,而且隨著影像的不斷獲取與研究工作的不斷推進(jìn),數(shù)據(jù)還將持續(xù)增加。在全球地表覆蓋遙感數(shù)據(jù)檢查環(huán)節(jié),這些體量巨大并持續(xù)膨脹的各類地理信息數(shù)據(jù),不被淹沒(méi)并得以充分利用的關(guān)鍵是有效的集成手段和高效的應(yīng)用工具[8]。常見(jiàn)的方法是利用通用GIS軟件平臺(tái)進(jìn)行讀取和分析,數(shù)據(jù)檢查人員首先需要拷貝任務(wù)區(qū)的影像與各類參考數(shù)據(jù),非交換格式的空間數(shù)據(jù)還需進(jìn)行格式轉(zhuǎn)換后才能被讀取,特別是同時(shí)使用不同GIS平臺(tái)時(shí)需要轉(zhuǎn)換多次,存在大量重復(fù)的數(shù)據(jù)傳遞、格式轉(zhuǎn)換、數(shù)據(jù)裁切等工作[9],影像及各類參考數(shù)據(jù)的使用異常復(fù)雜,在一定程度上造成了數(shù)據(jù)檢查人員的使用倦怠,大量參考數(shù)據(jù)未得到充分有效應(yīng)用,嚴(yán)重影響了工作效率與分類精度的提高。本文針對(duì)該問(wèn)題,基于Web服務(wù)技術(shù)研究并提出了一種全球地表覆蓋大數(shù)據(jù)集成應(yīng)用的方法,提出了異構(gòu)數(shù)據(jù)和服務(wù)的集成處理流程,在此基礎(chǔ)上研發(fā)了服務(wù)系統(tǒng),提高了數(shù)據(jù)使用的效率與效果,以及全球范圍內(nèi)專家的參與力度,可為全球地表覆蓋遙感制圖生產(chǎn)提供服務(wù)支持。
Web服務(wù)技術(shù)采用開(kāi)放式的協(xié)議和接口實(shí)現(xiàn)跨平臺(tái)數(shù)據(jù)的交換,近年來(lái)廣泛地應(yīng)用于地理信息的集成與共享[10]?;赪eb服務(wù)技術(shù)集成全球地表覆蓋遙感制圖大數(shù)據(jù),可以對(duì)數(shù)據(jù)使用者屏蔽各類數(shù)據(jù)的格式、坐標(biāo)和投影系統(tǒng),免去大量數(shù)據(jù)傳遞和重復(fù)數(shù)據(jù)處理工作,遠(yuǎn)程數(shù)據(jù)使用也非常方便。利用該技術(shù)研究數(shù)據(jù)集成模型,關(guān)鍵是分析影像與各類參考數(shù)據(jù)的特點(diǎn),根據(jù)數(shù)據(jù)檢查的應(yīng)用需求確定數(shù)據(jù)用途,進(jìn)而設(shè)計(jì)數(shù)據(jù)的集成處理與服務(wù)發(fā)布方法,以及異構(gòu)服務(wù)的集成處理方法,最終為生產(chǎn)應(yīng)用提供服務(wù)支持。圖1給出了基于服務(wù)的全球地表覆蓋遙感制圖大數(shù)據(jù)集成模型。
全球30 m地表覆蓋遙感精細(xì)制圖涉及5類數(shù)據(jù)資料,數(shù)據(jù)總量達(dá)6 TB以上:① 多分辨率遙感影像及其元數(shù)據(jù),其中直接用于分類的兩期30 m Landsat影像近20 000景;② 已有地表覆蓋數(shù)據(jù),其中全球范圍地表覆蓋數(shù)據(jù)有6套(4套1 km、2套300 m),區(qū)域性30 m地表覆蓋數(shù)據(jù)包含中國(guó)、美國(guó)、加拿大、歐洲等范圍,此外還有全球或區(qū)域范圍內(nèi)單類型數(shù)據(jù)(如全球紅樹(shù)林?jǐn)?shù)據(jù)、中國(guó)濕地?cái)?shù)據(jù))等;③ 輔助數(shù)據(jù),包括全球生態(tài)地理分區(qū)數(shù)據(jù)、全球DEM、近5000篇地表覆蓋參考文獻(xiàn)等;④ 實(shí)地?cái)?shù)據(jù),指實(shí)地采集的樣本、拍攝的照片,由項(xiàng)目組成員、專家或志愿者提供;⑤ 中間成果,中國(guó)區(qū)域全球30 m地表覆蓋遙感精細(xì)制圖項(xiàng)目的初步分類結(jié)果,由影像分類算法自動(dòng)提取。在數(shù)據(jù)檢查環(huán)節(jié),這些數(shù)據(jù)主要用作參考數(shù)據(jù),以判斷中間成果是否正確,并發(fā)現(xiàn)存在的問(wèn)題。在全球范圍30 m尺度下,該過(guò)程需要大量人員參與,這些人負(fù)責(zé)不同任務(wù)區(qū),可能分布在全國(guó),甚至世界各地,傳統(tǒng)單機(jī)環(huán)境難以支撐完成,需要借助有效的方法與工具以提高工作效率。
圖1 基于服務(wù)的全球地表覆蓋遙感制圖大數(shù)據(jù)集成模型
Web服務(wù)是實(shí)現(xiàn)網(wǎng)絡(luò)環(huán)境下地理信息共享與集成的有效手段。地理信息Web服務(wù)主要遵循開(kāi)放地理信息聯(lián)盟(OGC)的網(wǎng)絡(luò)地圖服務(wù)(WMS)、網(wǎng)絡(luò)要素服務(wù)(WFS)、網(wǎng)絡(luò)覆蓋服務(wù)(WCS)和網(wǎng)絡(luò)處理服務(wù)(WPS)規(guī)范,其中前三者是數(shù)據(jù)資料對(duì)外共享的主要渠道,而網(wǎng)絡(luò)處理服務(wù)則是實(shí)現(xiàn)用戶功能需求的有效手段。在基于Web服務(wù)的地表覆蓋遙感制圖大數(shù)據(jù)集成模型中,涉及的5類影像和參考數(shù)據(jù)資料分別被發(fā)布為5類數(shù)據(jù)服務(wù)。其中,影像服務(wù)、已有地表覆蓋數(shù)據(jù)服務(wù)、輔助數(shù)據(jù)服務(wù)、中間成果服務(wù)主要用于數(shù)據(jù)瀏覽比較,這4類服務(wù)發(fā)布為WMS及在此基礎(chǔ)上發(fā)展起來(lái)的網(wǎng)絡(luò)地圖切片服務(wù)(WMTS);實(shí)地?cái)?shù)據(jù)服務(wù)涉及在線的編輯修改等操作,發(fā)布為WFS。在網(wǎng)絡(luò)處理服務(wù)方面,從需要滿足的功能需求出發(fā),涉及的處理服務(wù)包括集成顯示服務(wù)、數(shù)據(jù)分發(fā)服務(wù)、在線標(biāo)注服務(wù)、信息挖掘服務(wù)、協(xié)同管理服務(wù)5類。集成顯示服務(wù)包括同步、疊置、查詢、定位、地理瀏覽等,數(shù)據(jù)分發(fā)服務(wù)包括數(shù)據(jù)的上傳、下載、發(fā)布等,在線標(biāo)注服務(wù)包括樣本標(biāo)注、錯(cuò)誤標(biāo)記等,信息挖掘服務(wù)包括比較、計(jì)算等,協(xié)同管理服務(wù)包括任務(wù)分配、通知/確認(rèn)等。除了項(xiàng)目發(fā)布的服務(wù)外,其他研究團(tuán)隊(duì)或公司企業(yè)通過(guò)Internet還發(fā)布了大量的數(shù)據(jù)和處理服務(wù),如天地圖的影像和數(shù)據(jù)服務(wù),Google Earth、Bing Map的高分辨率影像服務(wù),Geo-Wiki發(fā)布的全球耕地覆蓋圖服務(wù)[11]等,這些服務(wù)作為外部服務(wù)為數(shù)據(jù)質(zhì)量檢查提供了豐富資源。
按照不同職責(zé)分工,參與人機(jī)交互質(zhì)量檢查的人員分為數(shù)據(jù)操作員、質(zhì)量檢查員、專家3類角色。數(shù)據(jù)操作員負(fù)責(zé)數(shù)據(jù)的修改完善;質(zhì)量檢查員負(fù)責(zé)檢查中間成果中存在的錯(cuò)誤,標(biāo)注錯(cuò)誤位置并提出修改建議;專家負(fù)責(zé)確認(rèn)質(zhì)量檢查員難以確定的錯(cuò)誤,或就本地地表覆蓋情況提出建議等。3類角色可分布在不同地方,基于集成的數(shù)據(jù)與服務(wù),借助在此之上開(kāi)發(fā)的服務(wù)系統(tǒng)工作。
全球地表覆蓋遙感制圖數(shù)據(jù)來(lái)源多樣,數(shù)據(jù)格式、坐標(biāo)系統(tǒng)、數(shù)據(jù)量和數(shù)據(jù)存儲(chǔ)方式等各不相同,基于服務(wù)的異構(gòu)數(shù)據(jù)集成即以服務(wù)的形式發(fā)布這些不同來(lái)源的數(shù)據(jù),在服務(wù)層次上統(tǒng)一數(shù)據(jù)的投影、坐標(biāo)系統(tǒng),對(duì)用戶屏蔽數(shù)據(jù)的格式、存儲(chǔ)方式等。此外,項(xiàng)目組發(fā)布的服務(wù)與從項(xiàng)目外部引入的服務(wù)在接口定義、服務(wù)粒度等方面也存在較大差異,在全球應(yīng)用上還存在不同客戶端瀏覽器的適應(yīng)性問(wèn)題,需要對(duì)異構(gòu)服務(wù)進(jìn)行集成處理。圖2給出了異構(gòu)數(shù)據(jù)和服務(wù)的集成處理流程。
圖2 異構(gòu)數(shù)據(jù)和服務(wù)集成處理過(guò)程
為了達(dá)到最好的數(shù)據(jù)訪問(wèn)速度和數(shù)據(jù)可視效果,在發(fā)布為數(shù)據(jù)服務(wù)之前,需要根據(jù)不同數(shù)據(jù)的特征進(jìn)行一種或多種處理,即數(shù)據(jù)預(yù)處理、數(shù)據(jù)粒度處理、重投影與格式轉(zhuǎn)換、地圖樣式配置等。全球30 m Landsat影像約有20 000景、4 TB,數(shù)據(jù)量和數(shù)據(jù)文件的數(shù)量太大,影響訪問(wèn)速度。采用分區(qū)域拼接的方式得到合適的數(shù)據(jù)粒度,平衡數(shù)據(jù)文件數(shù)量與每個(gè)文件的數(shù)據(jù)量,同時(shí)考慮到可視效果,采用432和743兩種方式對(duì)影像進(jìn)行波段組合、色彩增強(qiáng)等預(yù)處理,最后經(jīng)服務(wù)發(fā)布,形成若干網(wǎng)絡(luò)地圖服務(wù)。已有全球或區(qū)域地表覆蓋數(shù)據(jù)的數(shù)據(jù)文件數(shù)較少,數(shù)據(jù)量在幾百M(fèi)B到幾GB之間,無(wú)需進(jìn)行數(shù)據(jù)粒度處理即可達(dá)到較好的訪問(wèn)速度,此類數(shù)據(jù)最大的問(wèn)題是數(shù)據(jù)格式各不相同,坐標(biāo)和投影系統(tǒng)差別較大,需進(jìn)行格式轉(zhuǎn)換、坐標(biāo)投影系統(tǒng)轉(zhuǎn)換,并進(jìn)行地圖樣式配置,發(fā)布為網(wǎng)絡(luò)地圖服務(wù)。大部分輔助數(shù)據(jù)的處理方式與已有地表覆蓋數(shù)據(jù)類似,地表覆蓋參考文獻(xiàn)例外,由于其需提高在線發(fā)布、編輯功能,因此發(fā)布為網(wǎng)絡(luò)要素服務(wù)。中間成果數(shù)據(jù)采用與影像數(shù)據(jù)類似的處理方式,每一個(gè)類型、每一個(gè)區(qū)域發(fā)布為一個(gè)網(wǎng)絡(luò)地圖服務(wù)。實(shí)地?cái)?shù)據(jù)采用在線方式添加和修改,發(fā)布為支持?jǐn)?shù)據(jù)修改的網(wǎng)絡(luò)要素服務(wù)。
由于底層空間數(shù)據(jù)模型與服務(wù)接口定義的差異,不同來(lái)源的地理信息Web服務(wù)通常存在顯著的異構(gòu)特征,在進(jìn)行服務(wù)集成時(shí)需要進(jìn)行適配處理[12]。在全球地表覆蓋遙感制圖應(yīng)用中,用戶的各種需求通過(guò)各種功能按鈕映射到不同處理服務(wù)上實(shí)現(xiàn),處理服務(wù)根據(jù)用戶請(qǐng)求的數(shù)據(jù)范圍、數(shù)據(jù)類型與處理要求將多種服務(wù)集成在一起,涉及的異構(gòu)服務(wù)集成處理可分為接口定義適配、多服務(wù)集成處理、響應(yīng)結(jié)果渲染等。接口定義適配主要是指不同來(lái)源的地理信息服務(wù)由于遵循不同的接口標(biāo)準(zhǔn),如OGC標(biāo)準(zhǔn)、表征狀態(tài)轉(zhuǎn)移(REST)標(biāo)準(zhǔn),或雖然遵循相同的接口標(biāo)準(zhǔn)但在接口實(shí)現(xiàn)上存在差異,或地表覆蓋數(shù)據(jù)類型語(yǔ)義存在差異,需要建立各個(gè)服務(wù)接口之間的對(duì)應(yīng)關(guān)系。不同的地理信息服務(wù)提供商在組織、發(fā)布服務(wù)時(shí),對(duì)外提供的服務(wù)粒度大小,數(shù)據(jù)訪問(wèn)層級(jí)數(shù)也各不相同,如Google把全球影像作為一個(gè)服務(wù)提供,而項(xiàng)目組則把全球劃分為6個(gè)區(qū)域。在響應(yīng)全球地表覆蓋遙感制圖應(yīng)用需求時(shí),需要準(zhǔn)確定位所需(原子)服務(wù),在接口定義適配的基礎(chǔ)上進(jìn)行多服務(wù)集成處理,消除在服務(wù)粒度、數(shù)據(jù)層級(jí)數(shù)等方面的異構(gòu)差異,對(duì)用戶提供統(tǒng)一集成的服務(wù)。無(wú)論用戶提出何種需求,服務(wù)器處理完成后其服務(wù)響應(yīng)結(jié)果最終均要通過(guò)客戶端(瀏覽器)渲染展示在用戶面前。由于不同的瀏覽器使用的渲染方式不同,需要根據(jù)服務(wù)內(nèi)容、功能需求與客戶端瀏覽器等進(jìn)行綜合選取,最終達(dá)到滿足用戶需求的高效且有效的響應(yīng)結(jié)果。
在全球30 m地表覆蓋遙感精細(xì)制圖中,遙感自動(dòng)分類算法生成的中間成果存在大量的錯(cuò)分或漏分現(xiàn)象。為了提高遙感制圖的精度,必須利用各類數(shù)據(jù)資料,對(duì)中間成果進(jìn)行人機(jī)交互質(zhì)量檢查,修改完善錯(cuò)分漏分類型。質(zhì)量檢查人員可以借助服務(wù)系統(tǒng)方便地使用各種數(shù)據(jù)資料,如比較項(xiàng)目完成的中間成果與已有地表覆蓋數(shù)據(jù)是否一致,比較中間成果與分類影像、高分辨率影像是否一致,比較兩期分類成果是否合理等。在這一過(guò)程中,針對(duì)不同類型的地表覆蓋數(shù)據(jù)和使用的參考數(shù)據(jù),可制定相應(yīng)的數(shù)據(jù)檢查規(guī)則。
圖3所示為系統(tǒng)的主界面,左側(cè)窗口為全球2010年432波段組合Landsat影像,右側(cè)窗口為全球生態(tài)地理分區(qū)、中間成果數(shù)據(jù)的接圖表與各類數(shù)據(jù)服務(wù)列表。數(shù)據(jù)服務(wù)采用靈活的圖層管理形式,可在單窗口或平行窗口中組合疊加顯示,用戶無(wú)需考慮后臺(tái)數(shù)據(jù)的格式與服務(wù)的粒度大小,系統(tǒng)根據(jù)用戶請(qǐng)求自動(dòng)進(jìn)行服務(wù)組合與服務(wù)調(diào)用。功能服務(wù)按鈕位于在界面左上側(cè),用戶可以方便地進(jìn)行數(shù)據(jù)質(zhì)量檢查、標(biāo)注錯(cuò)誤分類、修改完善地表覆蓋分類數(shù)據(jù)等。
圖3 應(yīng)用服務(wù)系統(tǒng)主界面
圖4所示為利用坡度數(shù)據(jù)檢查水體合理性的例子。左側(cè)窗口是2000基準(zhǔn)年度Landsat 432波段組合影像,深色多邊形區(qū)域是該年度水體中間成果;右側(cè)窗口是利用90 m SRTM生成的坡度數(shù)據(jù),淺色和深色區(qū)域分別表示坡度小于和大于5°。鑒于水體不可能存在于坡度大于5°的地區(qū),雖然A、B區(qū)域在Landsat 432波段組合影像中呈現(xiàn)黑色,與水體影像特征類似,但其坡度大于5°,不應(yīng)該存在水體,而已被提為水體的C、D區(qū)域坡度小于5°,它們均與規(guī)則相符。E區(qū)域在中間成果中被提為水體,但該區(qū)域坡度大于5°,不應(yīng)該存在水體,為中間成果中錯(cuò)提的數(shù)據(jù),應(yīng)該被刪除。
圖4 利用坡度數(shù)據(jù)區(qū)分水體和山體陰影
檢查人員發(fā)現(xiàn)中間成果的錯(cuò)誤以后,利用系統(tǒng)提供的工具可以在線標(biāo)注發(fā)現(xiàn)的錯(cuò)誤。圖5所示為系統(tǒng)標(biāo)注的界面,E即為圖4中判定的錯(cuò)提區(qū)域。在線標(biāo)注的點(diǎn)發(fā)布為WFS服務(wù),部分難以判斷的數(shù)據(jù)可以單獨(dú)注明,并將標(biāo)注點(diǎn)數(shù)據(jù)推送給相應(yīng)專家,請(qǐng)專家確認(rèn)后,再將結(jié)果反饋給作業(yè)人員。作業(yè)人員可將發(fā)布的影像服務(wù)、標(biāo)注的錯(cuò)誤點(diǎn)導(dǎo)入本地的編輯軟件,對(duì)標(biāo)注錯(cuò)誤的點(diǎn)進(jìn)行修改和完善。
本文根據(jù)全球30 m地表覆蓋遙感精細(xì)制圖中面臨的大數(shù)據(jù)使用問(wèn)題,提出了基于Web服務(wù)的數(shù)據(jù)集成模型與數(shù)據(jù)集成處理方法,研發(fā)了應(yīng)用系統(tǒng)并在項(xiàng)目中廣泛應(yīng)用。針對(duì)質(zhì)量檢查過(guò)程中頻繁使用各類數(shù)據(jù)資料的特點(diǎn), 利用本文提出的數(shù)據(jù)集成處理流程對(duì)數(shù)據(jù)進(jìn)行處理并發(fā)布為服務(wù),采用提出的數(shù)據(jù)集成服務(wù)模型開(kāi)發(fā)了應(yīng)用服務(wù)系統(tǒng),為用戶屏蔽了復(fù)雜的數(shù)據(jù)格式,避免了頻繁使用帶來(lái)的大量重復(fù)的數(shù)據(jù)傳遞、格式轉(zhuǎn)換、數(shù)據(jù)裁切等問(wèn)題,促進(jìn)了參考資料的使用,提高了最終數(shù)據(jù)產(chǎn)品的精度。同時(shí),基于互聯(lián)網(wǎng)的應(yīng)用系統(tǒng)使全球范圍內(nèi)專家參與的協(xié)同質(zhì)量檢查成為可能,提高了工作效率。
參考文獻(xiàn):
[1] VERBURG P H, NEUMANN K, NOL L. Challenges in Using Land Use and Land Cover Data for Global Change Studies[J]. Global Change Biology, 2011, 17(2): 974-989.
[2] HANSEN M C, LOVELAND T R. A Review of Large Area Monitoring of Land Cover Change Using Landsat Data[J]. Remote Sensing of Environment, 2012(122): 66-74.
[3] 陳軍,陳晉,宮鵬,等. 全球地表覆蓋高分辨率遙感制圖[J].地理信息世界,2011(2): 12-14.
[4] GONG P, WANG J, YU L, et al. Finer Resolution Observation and Monitoring of Global Land Cover: First Mapping Results with Landsat TM and ETM+Data[J]. International Journal of Remote Sensing, 2013, 34(7): 2607-2654.
[5] 陳利軍,陳軍,廖安平,等. 30 m全球地表覆蓋遙感分類方法初探[J]. 測(cè)繪通報(bào),2012(S1):357-360, 398.
[6] LU D, WENG Q. A Survey of Image Classification Methods and Techniques for Improving Classification Performance[J]. International Journal of Remote Sensing, 2007, 28(5): 823-870.
[7] 何超英,廖安平,陳志剛,等. NDVI時(shí)間序列在全球耕地提取中的應(yīng)用[J]. 地理信息世界,2013(2):66-69.
[8] 王樹(shù)良,丁剛毅,鐘鳴. 大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考[J]. 中國(guó)電子科學(xué)研究院學(xué)報(bào),2013,8(1): 8-17.
[9] 周順平,魏利萍,萬(wàn)波,等. 多源異構(gòu)空間數(shù)據(jù)集成的研究[J]. 測(cè)繪通報(bào),2008(5): 25-27, 39.
[10] 申利民,李志偉. 面向服務(wù)的柔性異構(gòu)數(shù)據(jù)集成模型研究[J]. 燕山大學(xué)學(xué)報(bào),2013,37(2): 117-123.
[11] FRITZ S, MCCALLUM I, SCHILL C, et al. Geo-Wiki: An Online Platform for Improving Global Land Cover[J]. Environmental Modelling & Software, 2012(31): 110-123.
[12] 武昊,廖安平,彭舒. 面向服務(wù)契約的地理信息Web服務(wù)自適應(yīng)集成方法研究[J]. 測(cè)繪通報(bào),2012(1): 74-77.