詹遠增,馮存均,左石磊,黃 博,章欽瑜,周 宇,施臨錦
(1. 浙江省地理信息中心,浙江 杭州 310012;2. 浙江省地理國情監(jiān)測中心,浙江 杭州 310012;3. 地理國情監(jiān)測國家測繪地理信息局重點實驗室,浙江 杭州 310012)
地理國情普查(以下簡稱“國普”)是常態(tài)化地理國情監(jiān)測的前提和基礎(chǔ),普查獲取的監(jiān)測本底是各項戰(zhàn)略與規(guī)劃、國土空間開發(fā)和資源配置的重要依據(jù),對生態(tài)環(huán)境保護、防災(zāi)減災(zāi)和應(yīng)急保障等具有重要作用,也是相關(guān)行業(yè)開展調(diào)查統(tǒng)計工作的數(shù)據(jù)基礎(chǔ)[1]。在浙江省第一次地理國情普查(以下簡稱“浙江省國普”)中,采用優(yōu)于1 m的遙感影像提取地表覆蓋信息,涵蓋了耕地、園地、林地、草地、房屋建筑(區(qū))、道路、構(gòu)筑物、人工堆掘地、荒漠與裸露地表、水域等10個一級類,46個二級類和77個三級類[2]。若采用傳統(tǒng)人工勾繪方式解譯,耗時長且成本高。面向?qū)ο蠓指罘诸惣夹g(shù)在高空間分辨率遙感影像(以下簡稱“高分影像)自動解譯方面已逐漸成熟并得到了廣泛應(yīng)用。若采用先自動分割分類,后人工修正部分圖斑邊界及屬性的方式,可降低工作量,縮減成本,提高工作效率[3]。
目前,國內(nèi)外對高分影像自動解譯研究[4-7]主要側(cè)重解譯算法,研究區(qū)往往局限于一個或多個局部區(qū)域。國內(nèi)外也推出了多款采用面向?qū)ο蠓指罘诸惖母叻钟跋褡詣咏庾g商業(yè)軟件,如eCognition Developer、FeatureStation、ENVI FX等,但主要針對單文件(單景或單塊)影像進行解譯。
在浙江省國普中,需自動解譯全省約10萬多平方千米的海量高分影像,需要一套可多人協(xié)同作業(yè)、高效率、便捷操作的自動解譯平臺,對解譯數(shù)據(jù)、人力資源、工作進度等進行整合,以便利用有限的人力資源和軟硬件資源提高自動解譯工作效率。
部分自動解譯商業(yè)軟件,如eCognition Server,支持多用戶、多任務(wù)批量運行,但以提供通用自動解譯批處理方案為主,缺乏海量數(shù)據(jù)、作業(yè)人員、作業(yè)區(qū)域、作業(yè)進度的統(tǒng)一管理和優(yōu)化配置。部分學(xué)者[8-9]對協(xié)同遙感圖像解譯系統(tǒng)進行了深入研究,力求系統(tǒng)能實現(xiàn)人員共享、數(shù)據(jù)共享、同步并行作業(yè)、疑難會判等,但研究重點是多人協(xié)同對疑難區(qū)進行判繪,對計算資源動態(tài)優(yōu)化、作業(yè)進度管理等方面涉及較少,較難滿足國普工作需要。
因此,本文以浙江省國普工作為例,采用常用的eCognition Developer分割分類軟件,通過研究工程化自動解譯工作特點,借鑒已有的研究成果和相關(guān)產(chǎn)品,提出針對性的作業(yè)模式,設(shè)計和開發(fā)相應(yīng)的自動解譯平臺,并實際應(yīng)用于浙江全省地表覆蓋自動解譯工作,該平臺現(xiàn)已納入浙江省地理國情監(jiān)測一體化生產(chǎn)作業(yè)平臺體系,作為其中的一項重要組成部分。
以浙江省國普工作為例,與局部區(qū)域自動解譯工作相比,國普中的地表覆蓋工程化自動解譯特點主要表現(xiàn)在:區(qū)域地類破碎復(fù)雜、影像質(zhì)量參差不齊、效率效益統(tǒng)籌兼顧等三方面。
1)區(qū)域地類破碎復(fù)雜
浙江省地處東南沿海,經(jīng)濟發(fā)展迅速,地表覆蓋人為痕跡明顯。地類形態(tài)復(fù)雜多樣,圖斑相對破碎,各地類間往往呈現(xiàn)漸變特征。
全省范圍內(nèi)存在大量影像特征不同的水體,如高泥沙含量水體、局部浮萍覆蓋水體、山澗淺水河流、泥灘上的淺層水體、不同污染形式水體等。部分同一片水體也混合著不同的影像特征,且邊界不清晰。在沿海一帶,退潮期間泥水分界也極其模糊。
受人為因素影響,不同耕地的影像特征差異較明顯,如不同作物類型、不同耕作模式、是否短期荒蕪等因素都將顯著影響耕地在影像上的光譜、紋理和結(jié)構(gòu)特征。靠近山區(qū)的耕地和林草地普遍存在漸變過渡特征,較難區(qū)分地類邊界。
在城市地區(qū)及城郊結(jié)合部,不同類型房屋、建筑工地、廢棄廠房等,不但各自沒有統(tǒng)一的光譜、紋理、結(jié)構(gòu)特征,且部分過渡邊界也不清晰。
2)影像質(zhì)量參差不齊
浙江省國普工作中,涉及1 000多景高分影像,時相跨度超過1年。受數(shù)據(jù)獲取能力局限以及沿海地區(qū)局地氣候的復(fù)雜多變,很難使覆蓋全省的所有影像質(zhì)量統(tǒng)一保持在較好的水平,較多區(qū)域被薄云覆蓋,增加了解譯難度。
同時,高分影像成像角度相對較大,和平原區(qū)相比,丘陵地區(qū)普遍受到山體陰影及拉花變形等因素影響。這些因素進一步增加了工程化自動解譯工作難度。
3)效率效益統(tǒng)籌兼顧
作為一項工程化應(yīng)用,自動解譯旨在降低后期人工修正和調(diào)整的工作量,而自動解譯規(guī)則及參數(shù)的編制與調(diào)整需要消耗一定的工作量,尤其是在地類復(fù)雜度較高的區(qū)域,消耗的工作量更大。因此,自動解譯應(yīng)重點解決人工解譯中工作量消耗較大的環(huán)節(jié)(如地類邊界的分割),效果在滿足實際生產(chǎn)需要的情況下,還應(yīng)兼顧自動解譯效率。
在浙江省國普中,自動解譯涉及數(shù)據(jù)量大,人員多,應(yīng)統(tǒng)籌管理數(shù)據(jù)資源、計算資源、人力資源等,實時掌控工作進度,以便進一步提高工程化自動解譯效率。
基于上述工程化自動解譯工作特點,本文提出以下針對性作業(yè)模式,如圖1所示。
圖1 工程化自動解譯作業(yè)模式框架圖Fig.1 Workf l ow diagram of the engineering automatic interpretation
浙江省地類圖斑相對破碎且復(fù)雜,解譯工作以1:10 000分幅作為作業(yè)單元,并采用統(tǒng)一的空間參考。為充分利用已有地理信息資源,提高解譯效率和精度,解譯所需數(shù)據(jù)源除高分影像外,還包括最新的1:10 000數(shù)字線劃圖(DLG)、5 m格網(wǎng)數(shù)字高程模型(DEM)及相應(yīng)的坡度數(shù)據(jù)等。
工程化解譯中,涉及的數(shù)據(jù)量大,為保持數(shù)據(jù)的一致性,所有數(shù)據(jù)源、解譯中間數(shù)據(jù)及最終成果采用統(tǒng)一存儲。高分影像解譯核心工作以eCogntion Developer軟件為基礎(chǔ),采用規(guī)則模式進行分割分類。由于分割分類計算量大,作業(yè)過程中自動分割分類計算將由批處理服務(wù)器集群統(tǒng)一處理。
為進一步厘清工程化自動解譯各項流程,使作業(yè)人員分工明確。作業(yè)過程將分為數(shù)據(jù)預(yù)處理、通用規(guī)則編制、規(guī)則細調(diào)及效果確認、分割分類計算、結(jié)果分發(fā)等工作環(huán)節(jié)。其中,數(shù)據(jù)預(yù)處理主要采用1:10 000分幅框?qū)尉案叻钟跋?、各項輔助數(shù)據(jù)進行裁切,生成各個子塊,并以圖幅為單元進行數(shù)據(jù)組織。通用規(guī)則編制主要是根據(jù)區(qū)域特征,選取幾類典型特征區(qū)域編寫通用規(guī)則集。規(guī)則細調(diào)及效果確認主要是指在通用規(guī)則基礎(chǔ)上,不斷調(diào)整部分細節(jié)及參數(shù),使規(guī)則應(yīng)用于當(dāng)前子塊能達到最佳分類效果。分割分類環(huán)節(jié)主要是采用eCognition Developer軟件,利用調(diào)整好的規(guī)則進行分割分類計算。
為了與上述作業(yè)模式相適應(yīng),工程化自動解譯平臺架構(gòu)應(yīng)滿足以下要求:
1)低耦合模塊化設(shè)計:工程化自動解譯涉及多道工序,針對每道工序提供單一的模塊化軟件,各個模塊之間低耦合,以便于不同作業(yè)人員操作。
2)多用戶并發(fā)訪問和操作:工程化自動解譯工作中,一般需要多名作業(yè)人員同時進行作業(yè),平臺應(yīng)支持多用戶并發(fā)訪問和操作。
3)分布式、可擴展的計算節(jié)點:面向?qū)ο蠓指罘诸愑嬎懔看螅こ袒詣咏庾g需要處理海量數(shù)據(jù),因此需要提供分布式、可擴展的后臺計算節(jié)點,最大化利用已有計算資源。
4)可視化的工程管理:工程化自動解譯涉及區(qū)域大,作業(yè)人員多,為了合理控制工程進度、優(yōu)化人員調(diào)配,應(yīng)提供可視化的工程進度展示及多用戶工作量管理等功能。
從上述要求出發(fā),本次平臺架構(gòu)設(shè)計框架如圖2所示,主要包括:數(shù)據(jù)預(yù)處理及上傳端、規(guī)則管理端、批處理請求提交端、主控端、批處理服務(wù)端、結(jié)果分發(fā)端、項目管理端等7個模塊。不同模塊分別部署在客戶端、數(shù)據(jù)服務(wù)器、批處理服務(wù)器上。除批處理服務(wù)端外,每個模塊均采用圖形化界面。各模塊間采用千兆以太網(wǎng)聯(lián)通。
圖2 工程化自動解譯平臺架構(gòu)圖Fig.2 Framework diagram of the engineering automatic interpretation platform
數(shù)據(jù)預(yù)處理及上傳端主要對分景高分影像及輔助數(shù)據(jù)進行分幅裁剪,生成相應(yīng)的各個子塊,并將處于同一圖幅的子塊按圖幅號組織到同一個文件目錄中。然后將處理好的數(shù)據(jù)上傳到數(shù)據(jù)庫服務(wù)器。這一模塊主要由影像預(yù)處理人員操作,部署在客戶端。
規(guī)則管理端提供通用規(guī)則的增加、修改和刪除等管理功能,同時也提供局部區(qū)域測試數(shù)據(jù)集下載、子塊規(guī)則指定等功能。是規(guī)則編制人員主要操作的平臺之一,部署在客戶端。
從規(guī)則管理端下載的局部測試數(shù)據(jù)集包括了影像塊、輔助數(shù)據(jù)及相應(yīng)的通用規(guī)則,規(guī)則編制人員可在eCognition Developer中直接打開該數(shù)據(jù)集進行規(guī)則細節(jié)調(diào)整,完成后采用規(guī)則管理端將修改后的規(guī)則指定到相應(yīng)的子塊。由于同景高分影像成像光譜較一致,因此在子塊規(guī)則指定時,系統(tǒng)提供同景子塊自動復(fù)制規(guī)則的功能。
通過批處理請求端,可向主控端提交自動解譯請求。是分類效果確認人員的主要操作平臺,部署在客戶端。在對子塊指定規(guī)則集后,需通過此模塊提交自動分割分類請求,提交后,可實時查看各個子塊的處理狀態(tài)。當(dāng)子塊分割分類完畢后,作業(yè)人員可在批處理請求段加載分類結(jié)果進行效果確認。若效果不佳,可重新調(diào)整規(guī)則并提交任務(wù),直到效果達標(biāo)。
當(dāng)同一圖幅各子塊都完成分割分類后,作業(yè)人員可通過批處理請求端提交子塊拼接請求,以便形成最終的1:10 000分幅矢量解譯成果。
主控端提供平臺管理功能,主要包括:用戶管理、權(quán)限管理、日志管理、批處理計算資源管理、實時增量備份等功能。主要由平臺管理人員負責(zé)操作,部署在數(shù)據(jù)服務(wù)器上。
其中,批處理計算資源管理模塊可動態(tài)監(jiān)聽批處理請求端發(fā)出的請求,根據(jù)請求類型對相應(yīng)的數(shù)據(jù)資源進行打包,分配到指定批處理服務(wù)端進行處理。同時,還支持動態(tài)增加批處理節(jié)點、批處理服務(wù)器負載均衡等功能。
批處理服務(wù)端用于響應(yīng)和執(zhí)行主控端分配的計算任務(wù),部署在批處理服務(wù)器上。由內(nèi)存常駐進程負責(zé)監(jiān)聽,有新請求進入時將調(diào)用eCognition Developer或ArcEngine等軟件進行處理,系統(tǒng)采用多進程模式支持并發(fā)計算,充分利用多核心多CPU計算資源。
結(jié)果分發(fā)端主要用于最終解譯成果的分發(fā)。部署在客戶端,提供主動分發(fā)和被動請求兩種方式。主動分發(fā)是指管理員向指定IP主機派發(fā)自動解譯成果。被動請求是指人工解譯作業(yè)人員請求下載指定圖幅分類結(jié)果。
項目管理端主要提供工程進度管理、作業(yè)人員工作量管理等功能。采用地圖、表格、直方圖等多種形式,為項目管理人員實時提供最新的工程進度報表、人員工作量報表等。主要部署在客戶端。
以上7個模塊,將自動解譯工作有機串聯(lián),形成了從原始影像數(shù)據(jù)到最終自動解譯成果分發(fā)的一站式作業(yè)平臺。
在浙江省第一次地理國情普查工作中,已實現(xiàn)上述平臺架構(gòu),形成了可實際應(yīng)用的遙感影像自動解譯平臺,該平臺已應(yīng)用于全省高分影像的自動解譯工作。和前期普查試點中采用eCognition Developer、eCognition Server作業(yè)模式相比,在相似區(qū)域、規(guī)則復(fù)雜度相當(dāng)?shù)那闆r下,總體作業(yè)效率提高約35%。針對地類相對復(fù)雜的區(qū)域,采用該平臺設(shè)計,可對解譯數(shù)據(jù)、人力資源、計算資源、工作進度等進行有效調(diào)度和優(yōu)化管理,從而提高地表覆蓋工程化自動解譯工作效率。常態(tài)化的地理國情監(jiān)測工作中,此平臺已納入到地理國情監(jiān)測一體化生產(chǎn)作業(yè)平臺體系,作為其中的一項重要組成部分,為地表覆蓋動態(tài)更新提供服務(wù)。