易茹蘭 李宣銳 王 川
(江西省地理國情監(jiān)測遙感院 江西南昌 330046)
多源數(shù)據(jù)集的地名地址庫建設(shè)研究
易茹蘭 李宣銳 王 川
(江西省地理國情監(jiān)測遙感院 江西南昌 330046)
以數(shù)字城市建設(shè)中地名地址庫的建設(shè)為研究對象,通過對地名地址多來源數(shù)據(jù)的分析,闡述了地名地址建庫的概念模型及地理實體的幾何表達規(guī)則,在此基礎(chǔ)上探討了地名地址庫的建庫思路流程,為地名地址數(shù)據(jù)的管理、標(biāo)準(zhǔn)化及信息共享提供了參考。
地理信息平臺;地名地址;多源數(shù)據(jù);標(biāo)準(zhǔn)化表達;標(biāo)準(zhǔn)化建庫
目前數(shù)字城市的概念已深入人心,而地理信息公共服務(wù)平臺正是實現(xiàn)了對這一概念的地理空間信息可視化表達。地名地址數(shù)據(jù)作為對地名信息的標(biāo)識與結(jié)構(gòu)化表達,以坐標(biāo)點位的方式描述了某一地理實體的空間和非空間屬性,是地理信息公共平臺實現(xiàn)在線數(shù)據(jù)服務(wù)的重要組成部分,是其它行業(yè)信息與之關(guān)聯(lián)的媒介和橋梁。但地名地址信息數(shù)據(jù)具有來源廣泛(包括國土、民政、規(guī)劃等行業(yè))、標(biāo)準(zhǔn)不統(tǒng)一、格式多樣化等特點,導(dǎo)致數(shù)據(jù)不能得到有效的整合利用。基于此,本文對多數(shù)據(jù)源的地名地址數(shù)據(jù)建庫方法進行闡述。
地名地址數(shù)據(jù)庫的建設(shè),最終是要滿足于用戶對于地理空間實體信息的查閱、檢索、使用以及與其它信息進行關(guān)聯(lián)。地名地址數(shù)據(jù)涉及的職能部門眾多,包括國土、民政、規(guī)劃、房產(chǎn)、工商、統(tǒng)計等部門,各職能部門在其業(yè)務(wù)管理過程中,大部分已建立了各自的地名地址庫,但這些數(shù)據(jù)都存在一定的缺陷,相互之間不能按照統(tǒng)一的標(biāo)準(zhǔn)進行共享,具體體現(xiàn)在:
2.1 缺乏統(tǒng)一的標(biāo)準(zhǔn)
各職能部門基于各自的工作重點,其地名地址數(shù)據(jù)格式程序多樣化,建庫過程中缺乏統(tǒng)一的規(guī)范指導(dǎo),造成對數(shù)據(jù)信息的表達混亂,不具備規(guī)范性,只針對其職能范圍內(nèi)數(shù)據(jù)建庫,造成地名地址數(shù)據(jù)不具備完整性。具體表現(xiàn)在地址描述不規(guī)范、文件命名多樣性、字段設(shè)置任意性。
2.2 缺乏空間位置信息
各數(shù)據(jù)源的地名地址數(shù)據(jù)中,大部分缺乏空間位置信息,只有國土測繪部門的地名地址數(shù)據(jù)具備地理空間位置信息。其它,如:工商部門的數(shù)據(jù)只有在冊登記的地理實體名稱這類單純描述地址的文字信息,需要對其空間位置信息進行補充。
地名地址庫建設(shè)中的多數(shù)據(jù)源,需要有一個統(tǒng)一的標(biāo)準(zhǔn)規(guī)則和概念模型來進行各類數(shù)據(jù)的整合。
3.1 地名地址數(shù)據(jù)幾何表達規(guī)則
地名地址數(shù)據(jù)以地理位置標(biāo)識點來表達,其主要為區(qū)域?qū)嶓w地名、線狀實體地名、局部點地理位置標(biāo)識點[1],其定義規(guī)則如表1所示:
表1 地名地址數(shù)據(jù)幾何表達規(guī)則
3.2 地名地址數(shù)據(jù)庫概念模型
針對多源地名地址數(shù)據(jù)缺乏統(tǒng)一的規(guī)范和標(biāo)準(zhǔn),地理信息公共服務(wù)平臺下的地名地址庫建設(shè)采用如圖1所示的概念模型:
圖1 地名地址庫數(shù)據(jù)模型
數(shù)據(jù)模型中,結(jié)構(gòu)化地名地址描述使用巴科斯范式(BNF)語法,并采用分段組合的方式描述,由行政區(qū)域、基本區(qū)域限定物、局部點位置三大類要素構(gòu)成。具體為:
<結(jié)構(gòu)化地名地址描述>::=<行政區(qū)域名稱>[基本區(qū)域限定物名稱][局部點位置描述]。其中:尖括號(<>)內(nèi)包含的是必選項;方括號([])內(nèi)包含的為可選項;豎線(|)表示在其左右兩邊任選一項;::=表示“被定義為”。
地名地址代碼根據(jù)地名地址所處地理位置,即與結(jié)構(gòu)化地名地址描述一致的位置信息進行編號,每個地理實體具有唯一的地名地址代碼[2]。
地名地址分類有多種方式,本人經(jīng)實踐對比得出,按照地名所指代地理實體的地理屬性進行分類的方法較詳盡,其分為門類、大類、中類、小類4層[3],其具體分類層次如圖2所示,每層類別分別對應(yīng)特定的分類代碼。
圖2 地名地址分類層次圖
地名地址數(shù)據(jù)庫的建立具有和一般GIS數(shù)據(jù)庫的建立類似的階段,即:已有數(shù)據(jù)資料整理分析階段、數(shù)據(jù)庫分層結(jié)構(gòu)設(shè)計階段、數(shù)據(jù)庫建立階段、數(shù)據(jù)庫維護階段[4]。具體建庫流程如圖3所示:
圖3 地名地址建庫流程圖
建庫過程中獲取的地名地址數(shù)據(jù),若各類數(shù)據(jù)格式不一致需先將其統(tǒng)一到同一格式,若數(shù)據(jù)非地理信息數(shù)據(jù)格式,可在分析其數(shù)據(jù)現(xiàn)勢性情況下根據(jù)項目需求進行取舍。獲取的各類數(shù)據(jù)需根據(jù)其數(shù)據(jù)完整性和現(xiàn)勢性確定其優(yōu)先等級,在數(shù)據(jù)優(yōu)先使用原則下對數(shù)據(jù)進行核實、更新。對現(xiàn)今不存在的地理實體則刪除該地名點,新增的地理實體則更新該地名點,充分利用現(xiàn)有的參考資料進行地名地址數(shù)據(jù)的修改、完善、標(biāo)準(zhǔn)地址建設(shè)和建庫工作。依據(jù)地名地址庫概念模型進行數(shù)據(jù)庫的設(shè)計,并給各屬性項賦值。
地名地址庫是地理信息公共服務(wù)平臺的重要組成部分,建立一個完備的地名地址庫能實現(xiàn)地理信息的有效共享。本文在分析多來源地名地址數(shù)據(jù)特點的基礎(chǔ)上,闡析了數(shù)據(jù)庫建庫模型,包括數(shù)據(jù)庫概念模型與數(shù)據(jù)幾何表達規(guī)則,并設(shè)計了地名地址建庫流程。由于地理信息數(shù)據(jù)存在不斷更新,地名地址數(shù)據(jù)也需隨之不斷更新,目前很多地名地址庫在建設(shè)過程中就實現(xiàn)了數(shù)據(jù)的更新,但建立完善高效的數(shù)據(jù)更新體制仍是地名地址庫在后期維護中需重點突破的地方。
[1]CH/Z9010-2011:地理信息公共服務(wù)平臺地理實體與地名地址數(shù)據(jù)規(guī)范[S].
[2]高小萍,兀偉.地理編碼技術(shù)探討[J].測繪標(biāo)準(zhǔn)化,2012,28(4):1-3.
[3]GB/T18521-2001:地名分類與類別代碼編制規(guī)則[S].
[4]王琪,凌翠明.?dāng)?shù)字城市中城市數(shù)據(jù)庫設(shè)計內(nèi)容研究[J].科技創(chuàng)新導(dǎo)報,2012(7):58-60.