歐立業(yè) 劉文軍
(江西省測(cè)繪應(yīng)急保障服務(wù)中心江西南昌 330046)
基于語(yǔ)義映射的CAD數(shù)據(jù)到GIS數(shù)據(jù)轉(zhuǎn)換方法的探討
歐立業(yè) 劉文軍
(江西省測(cè)繪應(yīng)急保障服務(wù)中心江西南昌 330046)
大比例尺基礎(chǔ)地理信息數(shù)據(jù)庫(kù)建設(shè)是“數(shù)字城市”地理空間框架項(xiàng)目中重要的建設(shè)內(nèi)容,本文以數(shù)字撫州為例,分析1∶500CAD數(shù)據(jù)與GIS數(shù)據(jù)之間存在的差異和內(nèi)在聯(lián)系,嘗試將語(yǔ)義映射和空間操作結(jié)合在一起,設(shè)計(jì)出CAD數(shù)據(jù)到GIS數(shù)據(jù)的映射關(guān)系,實(shí)現(xiàn)了CAD數(shù)據(jù)到GIS數(shù)據(jù)之間的快速轉(zhuǎn)換,并取得了良好的效果。
數(shù)字城市;語(yǔ)義;映射;數(shù)據(jù)轉(zhuǎn)換
隨著地理信息產(chǎn)業(yè)的快速發(fā)展,各個(gè)部門對(duì)數(shù)據(jù)的需求越來(lái)越多。在實(shí)際生產(chǎn)當(dāng)中,常常會(huì)因?yàn)榻?jīng)費(fèi)、技術(shù)或外部環(huán)境等因素的影響,而采用不同的軟件進(jìn)行數(shù)據(jù)的采集和處理,來(lái)滿足本部門內(nèi)部的需要。隨著時(shí)間的推移,越來(lái)越多的異構(gòu)格式的數(shù)據(jù)也隨之產(chǎn)生。當(dāng)不同的業(yè)務(wù)部門需要應(yīng)用這些數(shù)據(jù)的時(shí),由于數(shù)據(jù)的格式差異和宿主軟件的不同,造成利用這些數(shù)據(jù)的困難。為此,不同格式數(shù)據(jù)之間的相互轉(zhuǎn)換,已成為國(guó)內(nèi)眾多學(xué)者研究的重點(diǎn)[1-4]。筆者通過(guò)分析和總結(jié)已有的研究成果,得出以下幾點(diǎn)的不足:一是數(shù)據(jù)由一種格式轉(zhuǎn)換為另一種格式的過(guò)程中,會(huì)造成數(shù)據(jù)屬性信息和拓?fù)潢P(guān)系的丟失。由于CAD格式數(shù)據(jù)主要是側(cè)重圖形的表現(xiàn)形式,用顏色、線型、線寬、符號(hào)等來(lái)表達(dá)空間對(duì)象,但是在空間對(duì)象和屬性數(shù)據(jù)之間的拓?fù)潢P(guān)系方面則沒有詳述;與此相反,GIS格式數(shù)據(jù)對(duì)空間對(duì)象的拓?fù)潢P(guān)系有嚴(yán)格的要求,但是在空間對(duì)象實(shí)體的圖形表達(dá)方面較欠缺。因此,CAD格式數(shù)據(jù)轉(zhuǎn)換為GIS數(shù)據(jù)時(shí)會(huì)丟失顏色、線型等信息;GIS數(shù)據(jù)轉(zhuǎn)換為CAD格式數(shù)據(jù)時(shí),會(huì)出現(xiàn)拓?fù)潢P(guān)系和屬性數(shù)據(jù)的損失的現(xiàn)象。二是數(shù)據(jù)轉(zhuǎn)換的過(guò)程比較復(fù)雜,一般情況下需要把數(shù)據(jù)文件輸出公開的交換格式數(shù)據(jù),然后再將公開交換數(shù)據(jù)轉(zhuǎn)換為目的格式數(shù)據(jù)。這種方式在數(shù)據(jù)量較大,數(shù)據(jù)更新較快的時(shí)候,就很難保證不同系統(tǒng)之間數(shù)據(jù)的一致性。本文從CAD數(shù)據(jù)向GIS數(shù)據(jù)轉(zhuǎn)換存在的問題出發(fā),利用語(yǔ)義映射的思想,將其與空間操作相結(jié)合,設(shè)計(jì)了CAD數(shù)據(jù)到GIS數(shù)據(jù)的映射關(guān)系,實(shí)現(xiàn)了CAD數(shù)據(jù)到GIS數(shù)據(jù)之間的快速轉(zhuǎn)換。
按數(shù)學(xué)的概念,映射可以這樣定義,即為集合間的一種對(duì)應(yīng)關(guān)系,一個(gè)集合中的各元素與自己本身或另一個(gè)集合中的元素存在的一種對(duì)應(yīng)規(guī)則。語(yǔ)義是信息的內(nèi)在涵義,其意義與相關(guān)上下文環(huán)境有很大的關(guān)系。然而映射問題是以源數(shù)據(jù)為出發(fā)點(diǎn),通過(guò)對(duì)其觀察,目的是尋找到滿足目標(biāo)類定義要求的某固定的屬性值,因此語(yǔ)義映射被定義為:在目標(biāo)域內(nèi)對(duì)一組源類的重新分類[5]。用M表示目標(biāo)類集,M= {M1,M2,…,Mn};N1表示源類可直接觀察的屬性;N2表示由源類的語(yǔ)義上下文推出的源類屬性;R表示分類規(guī)則;W表示類之間的映射關(guān)系,那么映射問題就可以表示為:為源類Ms在目標(biāo)域內(nèi)找到m∈M,使得N1∧N2∧R=>W(wǎng)(Ms,Mi)。以及解釋為給定了源類結(jié)構(gòu),在目標(biāo)類結(jié)構(gòu)的前提下對(duì)其進(jìn)行分類映射,該映射過(guò)程是由源類結(jié)構(gòu)和目標(biāo)類結(jié)構(gòu)雙方的語(yǔ)義特征決定的,源類提供了對(duì)類的觀察,目標(biāo)類提供了類和分類規(guī)則,就可以基于源語(yǔ)義環(huán)境條件來(lái)尋找滿足要求的目標(biāo),最終映射到目標(biāo)語(yǔ)義環(huán)境,如圖1所示。
圖1 語(yǔ)義映射概念圖
傳統(tǒng)的數(shù)據(jù)轉(zhuǎn)換模型主要有三個(gè)特點(diǎn)[6]:一是支持簡(jiǎn)單地圖圖元;二是屬性數(shù)據(jù)單獨(dú)處理;三是輸入數(shù)據(jù)決定輸出數(shù)據(jù)。與之相對(duì),基于語(yǔ)義映射的空間數(shù)據(jù)轉(zhuǎn)換在數(shù)據(jù)轉(zhuǎn)換的基礎(chǔ)上,更加注重語(yǔ)義層次上的數(shù)據(jù)共享,該轉(zhuǎn)換過(guò)程實(shí)現(xiàn)了對(duì)數(shù)據(jù)的重新構(gòu)造,這樣用戶就能能夠根據(jù)自己內(nèi)部特定的需要,尋找并獲得不同層面上的相同數(shù)據(jù)源數(shù)據(jù),最終提供給用戶使用。與傳統(tǒng)的數(shù)據(jù)模型相對(duì)比,基于語(yǔ)義映射的空間數(shù)據(jù)轉(zhuǎn)換的優(yōu)點(diǎn)在于:定義了源類數(shù)據(jù)集到目標(biāo)類數(shù)據(jù)集之間的相互映射關(guān)系;允許對(duì)數(shù)據(jù)的重新構(gòu)造定義;使用了要素操作語(yǔ)言以及提供了查找復(fù)雜計(jì)算的函數(shù)。
語(yǔ)義映射就好比一個(gè)發(fā)動(dòng)機(jī)的引擎,要借助要素操作語(yǔ)言,重新定義輸入數(shù)據(jù)和輸出數(shù)據(jù)。在實(shí)際的映射過(guò)程中,有很多不同的輸入數(shù)據(jù)和輸出數(shù)據(jù),為此,該數(shù)據(jù)轉(zhuǎn)換模型提供了一系列的數(shù)據(jù)模型之間定義和轉(zhuǎn)換的方法,其優(yōu)點(diǎn)在于使得數(shù)據(jù)輸入端和數(shù)據(jù)輸出端能夠自由的轉(zhuǎn)換,同時(shí)可以使用各自的獨(dú)立系統(tǒng)和數(shù)據(jù)格式[7]。因此,用戶或開發(fā)人員只需要知道輸入數(shù)據(jù)的描述和輸出數(shù)據(jù)的要求,就能夠順利完成轉(zhuǎn)換,這種操作既方便快速,又能最大程度保證轉(zhuǎn)換過(guò)程中數(shù)據(jù)質(zhì)量的完整性。
在構(gòu)建CAD數(shù)據(jù)和GIS數(shù)據(jù)映射關(guān)系之前,必須制定統(tǒng)一的空間信息分類與編碼方案、CAD數(shù)據(jù)標(biāo)準(zhǔn)以及GIS數(shù)據(jù)標(biāo)準(zhǔn)。本文以江西省撫州市1: 500CAD基礎(chǔ)地形圖到GIS數(shù)據(jù)的格式轉(zhuǎn)換為例,介紹基于語(yǔ)義映射的CAD數(shù)據(jù)到GIS數(shù)據(jù)的轉(zhuǎn)換過(guò)程和方法。
3.1 CAD數(shù)據(jù)標(biāo)準(zhǔn)
CAD地形圖數(shù)據(jù)的數(shù)字化標(biāo)準(zhǔn),一般包括分層設(shè)色標(biāo)準(zhǔn)、要素符號(hào)標(biāo)準(zhǔn)、要素編碼標(biāo)準(zhǔn)、要素?cái)U(kuò)展屬性項(xiàng)標(biāo)準(zhǔn)等。分層設(shè)色標(biāo)準(zhǔn)參照《1:500、1:1000、1: 2000地形圖圖式》[8]執(zhí)行,將地形圖中的地物要素按照?qǐng)D式的規(guī)定分為9大類,例如測(cè)量控制點(diǎn)(層名為KZD,顏色為red);居民地(層名為JMD,顏色為magenta)。要素符號(hào)標(biāo)準(zhǔn)參照《1:500、1:1000、1:2000地形圖圖式》執(zhí)行,分為點(diǎn)、線和文字注記三類符號(hào),例如三角點(diǎn)(代碼為131100,塊名為gc113);時(shí)令河(線型為X0);控制點(diǎn)點(diǎn)名注記(文字高度為2.4mm,字體為HZ)。要素編碼標(biāo)準(zhǔn)參照《1:500、1:1000、1: 2000地形圖要素分類與代碼》[9]執(zhí)行,采用6位數(shù)字編碼表示,前四位表示要素代碼,第五位表示擴(kuò)展碼,最后一位表示類型碼。根據(jù)CAD的數(shù)據(jù)組織結(jié)構(gòu),擴(kuò)展屬性(XDATA)主要存儲(chǔ)要素代碼和屬性信息。例如交通及附屬設(shè)施要素集中的公路要素類的擴(kuò)展屬性為要素代碼、名稱、材料和等級(jí);地貌土質(zhì)要素集中的等高線要素類的擴(kuò)展屬性為要素代碼和高程。
3.2 GIS數(shù)據(jù)標(biāo)準(zhǔn)
在數(shù)據(jù)轉(zhuǎn)換過(guò)程中面臨的關(guān)鍵問題是GIS數(shù)據(jù)標(biāo)準(zhǔn)的制定,因?yàn)闃?biāo)準(zhǔn)制定的完善與否,直接關(guān)系到了目標(biāo)數(shù)據(jù)存儲(chǔ)格式的不同,從而影響到轉(zhuǎn)換后數(shù)據(jù)質(zhì)量的好壞。GIS數(shù)據(jù)標(biāo)準(zhǔn)參照《l:500、l:1000、l: 2000地形圖圖式》執(zhí)行,設(shè)定了測(cè)量控制點(diǎn)、居民地及其附屬設(shè)施等9個(gè)要素集,每個(gè)要素集又根據(jù)其中要素的幾何分類的不同,細(xì)分為若干個(gè)要素類,同時(shí)確保每個(gè)要素類的名稱和CAD圖層都能夠一一對(duì)應(yīng)。例如植被要素集(ZB_500)分為三個(gè)要素類:植被點(diǎn)(ZB_500_P)、植被線(ZB_500_L)、植被面(ZB_500_A)、植被注記(ZB_500_T)。
3.3 CAD數(shù)據(jù)與GIS數(shù)據(jù)映射關(guān)系
(1)點(diǎn)要素實(shí)體映射關(guān)系。在CAD格式的基礎(chǔ)地形圖中,點(diǎn)狀地物分為單點(diǎn)對(duì)象(POINT)和塊對(duì)象(BLOCK),可以將這類點(diǎn)要素直接映射為GIS數(shù)據(jù)集中的點(diǎn)層要素。當(dāng)為有向點(diǎn)的時(shí)候,例如河流流向、高壓線符號(hào)線等,其符號(hào)的旋轉(zhuǎn)角度表示該點(diǎn)的方向,轉(zhuǎn)換時(shí)應(yīng)將旋轉(zhuǎn)角度映射到相對(duì)應(yīng)的屬性表中。同時(shí)將擴(kuò)展屬性(XDATA)存儲(chǔ)的點(diǎn)屬性數(shù)據(jù)映射到GIS屬性表中的相應(yīng)字段。
(2)線要素實(shí)體映射關(guān)系。線狀地物分為直線(LINE)和多段線(POLYLINE)。直線(如陡坎、籬笆和圍墻等)直接映射為GIS數(shù)據(jù)集中的線層要素;多段線(如房屋、河流、池塘等)則映射為GIS數(shù)據(jù)集中的面層要素。同時(shí)將擴(kuò)展屬性(XDATA)存儲(chǔ)的線屬性數(shù)據(jù)映射到GIS屬性表中的相應(yīng)字段。
(3)文本注記映射關(guān)系。注記分為單文本(TEXT)和多行文本(MTEXT),可以直接將注記映射為GIS數(shù)據(jù)集中的注記層要素。
(4)地圖符號(hào)映射關(guān)系。由于CAD數(shù)據(jù)和GIS數(shù)據(jù)所使用的地圖符號(hào)不同,即應(yīng)用的線型和符號(hào)類型不同,可以利用之前設(shè)計(jì)好的要素編碼標(biāo)準(zhǔn),實(shí)現(xiàn)CAD數(shù)據(jù)和GIS數(shù)據(jù)之間地圖要素符號(hào)的的映射,保證了數(shù)據(jù)轉(zhuǎn)換前后的一致性。
(5)其他映射關(guān)系。在CAD格式的基礎(chǔ)地形圖中,對(duì)地物的拓?fù)潢P(guān)系方面沒有嚴(yán)格的要求,為此,本文對(duì)拓?fù)潢P(guān)系的映射關(guān)系不予考慮,至于拓?fù)潢P(guān)系的確定,要在數(shù)據(jù)轉(zhuǎn)換完成之后,在GIS軟件平臺(tái)下進(jìn)行。另外,CAD數(shù)據(jù)采用的是笛卡爾直角坐標(biāo)系統(tǒng),并不是地理坐標(biāo)系統(tǒng),因此也無(wú)法確定映射關(guān)系,這個(gè)問題也可以在數(shù)據(jù)轉(zhuǎn)換完成之后,對(duì)數(shù)據(jù)進(jìn)行重新投影來(lái)解決。
根據(jù)以上的CAD數(shù)據(jù)與GIS數(shù)據(jù)的語(yǔ)義映射關(guān)系,借助FME軟件平臺(tái)制定好映射文件之后,就可以進(jìn)行CAD格式基礎(chǔ)地形圖數(shù)據(jù)到GIS數(shù)據(jù)庫(kù)格式的轉(zhuǎn)換,轉(zhuǎn)換前后結(jié)果如圖2和圖3所示。經(jīng)過(guò)對(duì)比分析,發(fā)現(xiàn)點(diǎn)、線、面幾何要素以及文本注記都能正確的轉(zhuǎn)換到相應(yīng)圖層,而且保證了圖形信息和屬性信息的對(duì)應(yīng)關(guān)系正確,得到了較好的效果。
圖2 CAD原始基礎(chǔ)地形圖
圖3 轉(zhuǎn)換后的GeoDatabase格式地形圖
為了滿足“數(shù)字城市”工程中大比例尺數(shù)據(jù)建庫(kù)的需要,本文深入分析了CAD數(shù)據(jù)模型和GIS數(shù)據(jù)模型各自的特點(diǎn),引入語(yǔ)義映射的思想,結(jié)合具體的CAD實(shí)例數(shù)據(jù),制定了CAD數(shù)據(jù)到GIS數(shù)據(jù)的映射關(guān)系。根據(jù)以上思路,完成了撫州市1:500CAD格式的80平方公里基礎(chǔ)地形圖數(shù)據(jù)向GIS格式數(shù)據(jù)的轉(zhuǎn)換。實(shí)踐證明,該方法具有速度快,擴(kuò)充性能好等特點(diǎn)。
[1]崔洪波,李井杰,賀智.城市大比例尺CAD數(shù)據(jù)到GIS數(shù)據(jù)的轉(zhuǎn)換[J].測(cè)繪與地理空間信息,2011,34(2):34-36.
[2]葉海波,吳遇文,李會(huì)梅.基于ARCGIS由道路規(guī)劃圖CAD數(shù)據(jù)到GIS格式轉(zhuǎn)換的探討[J].西部探礦工程,2010,(8):112-115.
[3]計(jì)長(zhǎng)飛,孫尚宇,楊歡.基于EPS的CAD數(shù)據(jù)到GIS數(shù)據(jù)轉(zhuǎn)換方法研究[J].礦山測(cè)量,2010,10(5):16-18.
[4]陳南南,李篷,周美霞,等.CAD數(shù)據(jù)到GIS數(shù)據(jù)轉(zhuǎn)換的探討[J].北京測(cè)繪,2012,(1):15-17.
[5]李宗華.基于語(yǔ)義映射的空間數(shù)據(jù)轉(zhuǎn)換及其應(yīng)用研究[J].地理空間信息,2007,5(2):1-2.
[6]吳昊昕.基于語(yǔ)義的GIS數(shù)據(jù)轉(zhuǎn)換模型的研究及實(shí)現(xiàn)[J].軟件導(dǎo)報(bào),2008,4(7):77-78.
[7]曾巧玲,張書亮,姜永發(fā),等.利用FME實(shí)現(xiàn)GIS與CAD的語(yǔ)義轉(zhuǎn)換[J].計(jì)算機(jī)工程與應(yīng)用,2005,(13):214-217.
[8]GB/T20257.1-2007.國(guó)家基本比例尺地圖圖式第一部分:1:500、1:1000、1:2000地形圖圖式[S].
[9]GB/T14804-93.國(guó)家基本比例尺地形圖要素分類與代碼1:500、1:1000、1:2000地形圖要素分類與代碼[S].