文|漳平市自然資源局 劉星紅
隨著智慧城市、數(shù)字地球的提出,測繪行業(yè)對測繪成果提出新的要求,基礎測繪地形圖數(shù)據(jù)的使用更加廣泛,作為基礎測繪成果的數(shù)字化地形圖,在建設中數(shù)字城市發(fā)揮了重要作用,是地理信息數(shù)據(jù)庫構(gòu)建的基礎?,F(xiàn)階段要求數(shù)字化地形圖,不光需要滿足基礎建設規(guī)劃、施工等,數(shù)字化地形圖還需具有管理、統(tǒng)計、分析等作用,這就要求數(shù)字化地形圖需要采用多種形式展現(xiàn)給大家,包括滿足CAD 軟件的DWG、滿足GIS 軟件的格式例如SHP 格式。目前,測繪部門用圖習慣還是依賴DWG 格式的DLG 數(shù)據(jù),在對基礎測繪數(shù)據(jù)進行整合時,對于歷史遺留的大量DLG 數(shù)據(jù)也需要對應的GIS 軟件數(shù)據(jù)一并入庫審批。然而由于線劃圖數(shù)據(jù)復雜,數(shù)據(jù)轉(zhuǎn)換困難,數(shù)字化地形圖快速精確入庫是現(xiàn)階段智慧城市建設面臨的一大難題。
地理信息系統(tǒng)(Geographic Information system,GIS)作為數(shù)字城市建設的核心,在“數(shù)字地球”“數(shù)字中國”建設中發(fā)揮了重要作用。目前,GIS 已經(jīng)廣泛用于地理國情監(jiān)測、國土資源管理、環(huán)境評估、城市建設與規(guī)劃、災害預警、運輸、水利水電等方面。ArcGIS 軟件是Esri 公司研發(fā)的一套完整GIS 平臺產(chǎn)品。它具有制作地圖、數(shù)據(jù)管理、空間信息整合、數(shù)據(jù)發(fā)布、數(shù)據(jù)共享的功能。ArcGIS 作為測繪地理信息數(shù)據(jù)生產(chǎn)中廣泛應用的地理信息系統(tǒng)數(shù)據(jù)處理軟件,其系統(tǒng)下的Spatial EXL 工具,擁有強大的數(shù)據(jù)庫數(shù)據(jù)操作能力,包括從龐大的數(shù)據(jù)源中提取目標數(shù)據(jù),進行數(shù)據(jù)標準化處理,經(jīng)合理拆分合并后完成正確性檢測,實現(xiàn)批量化的數(shù)據(jù)轉(zhuǎn)換。其優(yōu)勢在于數(shù)據(jù)轉(zhuǎn)換的規(guī)則可根據(jù)用戶需求進行定義、自動化程度高、效率快、數(shù)據(jù)可批量生產(chǎn)。
基于以上情況的考慮,為能夠完成數(shù)字城市地理信息基礎數(shù)據(jù)庫的建設,本文從漳平市地形圖入庫工作出發(fā),將原始數(shù)據(jù)為CASS 軟件繪制的DWG 格式地形圖,選擇合理、高效的轉(zhuǎn)換方法,完成數(shù)據(jù)轉(zhuǎn)換入庫工作。
直接轉(zhuǎn)換法是修改CASS 配置文件實現(xiàn)數(shù)據(jù)從DWG 格式到ArcGIS 軟件下SHP 格式的轉(zhuǎn)換,CASS 安裝系統(tǒng)目錄下存在配置文件,即圖元索引文件和屬性表文件。圖元索引文件內(nèi)包含編碼、圖層、圖元等參數(shù)信息,屬性表文件定義每個圖層屬性表結(jié)構(gòu),通常按照入庫數(shù)據(jù)標準和規(guī)范修改配置文件參數(shù),使用CASS 軟件中的輸出SHP 格式命令便可實現(xiàn)入庫數(shù)據(jù)格式的轉(zhuǎn)換。
FME(Feature Manipulate Engine) 是Safe Software 公司開發(fā)的空間數(shù)據(jù)轉(zhuǎn)換處理系統(tǒng),它是完整的空間ETL 解決方案。該方案提出了基于Open GIS 組織的“語義轉(zhuǎn)換”全新的數(shù)據(jù)轉(zhuǎn)換概念,具體方式是數(shù)據(jù)的重構(gòu),該系統(tǒng)包含了250 種以上的不同數(shù)據(jù)格式間的轉(zhuǎn)換模型,為多源數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換提供了方案,是實現(xiàn)數(shù)據(jù)快速、精確轉(zhuǎn)換的可靠方法。FME 映射法,首先分析DWG 格式和SHP 格式并通過FME 語義映射規(guī)則,構(gòu)建原始數(shù)據(jù)集與目標數(shù)據(jù)集間關系,實現(xiàn)數(shù)據(jù)轉(zhuǎn)換。具體操作中因FME 不能直接讀取CASS 數(shù)據(jù)擴展屬性字段,需要安裝My FME插件來完成擴展屬性、圖形樣式、注記等參數(shù)的讀取。
Spatial ETL(Extract-Transform-Load) 工具可實現(xiàn)數(shù)據(jù)抽取、轉(zhuǎn)換、加載,其優(yōu)勢在于數(shù)據(jù)轉(zhuǎn)換模型可根據(jù)用戶需求自行設定規(guī)則,面對數(shù)據(jù)量比較龐大的任務采用該方法可輕松實現(xiàn)數(shù)據(jù)批量轉(zhuǎn)換,效率高。Spatial EXL 可按用戶定義的規(guī)則將原始數(shù)據(jù)從DWG 格式轉(zhuǎn)換到滿足入庫標準的SHP格式數(shù)據(jù),實現(xiàn)目標數(shù)據(jù)的獲取,完成數(shù)據(jù)快速入庫。
綜合以上三種數(shù)據(jù)轉(zhuǎn)換方法各有利弊。方法一具有操作簡單容易實現(xiàn),但需要大量人工干預,易出錯,影響工作效率和產(chǎn)品質(zhì)量,不適合工作量較龐大的項目;方法二,在采用FME 映射法進行數(shù)據(jù)轉(zhuǎn)換時需針對專一項目自主研發(fā)系統(tǒng),操作較復雜工程成本大;方法三,定義規(guī)則比方法二簡單,可實現(xiàn)批量自動化數(shù)據(jù)處理,轉(zhuǎn)換效率高、產(chǎn)品質(zhì)量高。本次項目擬采用第三中方法開展漳平市某地區(qū)1:500 數(shù)字地形圖數(shù)據(jù)入庫工作。
(1)源數(shù)據(jù)處理
入庫數(shù)據(jù)源為1:500DLG 數(shù)據(jù),數(shù)據(jù)包含詳細的測區(qū)控制點、交通、水系設施等。DLG 數(shù)據(jù)表示方式為點、線,對于為進、進行拓撲分析的數(shù)字線劃圖會存在要素間未連接、線懸掛問題。圖層不規(guī)范問題,CASS 軟件成圖時因種種原因會出現(xiàn)圖層多余或空圖層問題,可采用“圖層正確性檢查”命令進行圖層檢查,對空圖層進行刪除時因圖層參照原因不能進行有效的刪除時,可使用“purge”命令進行數(shù)據(jù)清理然后進行刪除。
(2)要素編碼
數(shù)據(jù)入庫的實現(xiàn)實質(zhì)上是將CASS 軟件下DWG 格式數(shù)據(jù)轉(zhuǎn)換到能進行GIS 軟件進行讀取、存儲的SHP 格式數(shù)據(jù)。在DLG 數(shù)據(jù)中不同的地物有著不同的要素代碼進行表示,在GIS 軟件中數(shù)據(jù)要素編碼目的是將每個地物實體進行唯一編碼,在保證原始數(shù)據(jù)要素信息不丟失的情況下進行數(shù)據(jù)轉(zhuǎn)換,同時獨一無二的數(shù)據(jù)要素編碼有利于在GIS 軟件中進行數(shù)據(jù)的查詢、采集、分析等。具體要素編碼結(jié)構(gòu)可根據(jù)地區(qū)規(guī)范進行分類編碼?;A信息要素分類與代碼詳(如表1所示)。
(3)數(shù)據(jù)分層
分層的依據(jù)主要是根據(jù)地物類型來進行,數(shù)字地形圖入庫時,每個圖層單獨存在一個SHP 文件中,具體分層主要依據(jù)要素大類和類型。
(4)數(shù)據(jù)標準
符合國家標準并結(jié)合實際情況進行一定補充的數(shù)據(jù)標準是數(shù)據(jù)入庫重要保障。數(shù)據(jù)生產(chǎn)過程中需嚴格標準進行作業(yè),生產(chǎn)DLG 數(shù)據(jù)實際的幾何劃分可分為點(point)、線(point)、面(polygon)、注記(annotation),其中點(point)的物理劃分為簡單點實體(SP),線(point)的物理劃分分別為簡單無向線實體(SL)、簡單有向線實體(DL)、復合線實體(CL),面(polygon) 的物理劃分為面實體(PG),注記(annotation) 物理劃分為圖面注記實體(TX),且每個物理劃分都有簡單說明和編碼(可根據(jù)當?shù)匾?guī)范制定)。如表2所示。
表1 基礎信息要素分類與代碼
表2 DLG 數(shù)據(jù)實體劃分
由于數(shù)據(jù)生產(chǎn)平臺種類繁多,所以生產(chǎn)的數(shù)據(jù)屬性、結(jié)構(gòu)存在很多區(qū)別,本文所介紹的內(nèi)容主要是CASS 軟件所生成的DLG 數(shù)據(jù)其格式為DWG 作為原始數(shù)據(jù)轉(zhuǎn)換目標數(shù)據(jù)為可進行ARCGIS 入庫的SHP 格式文件,轉(zhuǎn)換方法選擇本文介紹的ArcGIS 下自定義Spatial ETL Tool 工具,Spatial ETL Tool 工具有FME 語義映射功能,可建立原始數(shù)據(jù)集和目標數(shù)據(jù)集映射關系,可實線多對一映射。建立映射關系后可以將DLG 數(shù)據(jù)以不同的圖層進行數(shù)據(jù)輸出,同時對于DLG 數(shù)據(jù)中不同圖層的點、線、面數(shù)據(jù)按照不同的類別轉(zhuǎn)換輸出到SHP 格式數(shù)據(jù)中,對于DLG 數(shù)據(jù)中的屬性值同樣也可以進行數(shù)據(jù)轉(zhuǎn)換。
數(shù)據(jù)轉(zhuǎn)換階段主要完成數(shù)據(jù)組織重構(gòu)和分類代碼轉(zhuǎn)換,同時數(shù)據(jù)轉(zhuǎn)換過程不僅僅是數(shù)據(jù)格式的轉(zhuǎn)換同時還包括數(shù)據(jù)質(zhì)量檢查、圖像符號化處理、數(shù)據(jù)處理等多個操作步驟。本文以漳平市1∶500DLG 數(shù)據(jù)為例,使用ArcMAP 嵌入的Spatial ETL Tool 工具建立原始數(shù)據(jù)與目標數(shù)據(jù)的映射關系,進行數(shù)據(jù)的轉(zhuǎn)換與重構(gòu)。DLG 數(shù)據(jù)和目標SHP格式數(shù)據(jù)映射關系。如表3所示。
DLG 數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換后,新生產(chǎn)的SHP 格式數(shù)據(jù)需要進行數(shù)據(jù)處理和質(zhì)量檢查以確保入庫數(shù)據(jù)是無誤可用的。數(shù)據(jù)質(zhì)量控制主要包括目標數(shù)據(jù)要素編碼檢查、目標數(shù)據(jù)屬性確認和添加、拓撲分析、數(shù)據(jù)融合、質(zhì)量檢查等。
根據(jù)數(shù)據(jù)標準進行要素編碼的檢查,屬性可分為點要素實體屬性檢查、線要素實體屬性檢查、面要素實體屬性檢查。由于數(shù)據(jù)轉(zhuǎn)換前DLG 數(shù)據(jù)的點實體是由符號構(gòu)成,存在線、面形式,需要進行點的地物寫塊,轉(zhuǎn)換過程中在ArcGIS 中由點的地物寫塊轉(zhuǎn)換成點才能得到點的矢量數(shù)據(jù),需進行屬性的添加。線實體需進行數(shù)據(jù)骨架的提取在進行屬性添加。由于面實體是由點線構(gòu)成,通常借助線實體進行處理,然后按不同種類進行數(shù)據(jù)分類處理以及屬性的添加。
目標數(shù)據(jù)圖層需按照數(shù)據(jù)標準進行修改、整合。由于DLG 數(shù)據(jù)存在數(shù)據(jù)分幅的問題造成轉(zhuǎn)換后的數(shù)據(jù)存在被分割或同一地物被多次定義的問題,同時也會出現(xiàn)數(shù)據(jù)的丟失和錯誤構(gòu)面等現(xiàn)象。以上存在的問題需進行物理接邊、屬性合并、補充或者刪除等處理,實現(xiàn)圖形無縫拼接。
數(shù)據(jù)質(zhì)量控制是轉(zhuǎn)換是否完成的最終步驟,嚴格的數(shù)據(jù)檢查時構(gòu)建數(shù)據(jù)庫的基礎,成果檢查主要包括以下內(nèi)容,如表4所示。
現(xiàn)階段城市的智能化發(fā)展是以建立數(shù)據(jù)完整、精度高、實用性強的地理空間信息數(shù)據(jù)庫為基礎的,本文講述了傳統(tǒng)的DLG數(shù)據(jù)入庫方法,著重講述了采用Spatial ETL Tool 工具進行數(shù)據(jù)轉(zhuǎn)換入庫過程以及方法和技巧,大幅度提高了工作效率,并運用該方法順利完成了福州市DLG 數(shù)據(jù)入庫項目。同時在實際操作過程中也發(fā)現(xiàn)了一些問題,例如地物數(shù)據(jù)編碼、數(shù)據(jù)拓撲等問題影響了工作進展,解決這些問題將是下一步工作的重點內(nèi)容。
表3 映射關系
表4 質(zhì)量檢查項目表