引文格式: 張保鋼,楊伯鋼,張偉松. 矢量地理信息更新增量的傳播[J].測繪通報,2015(4):53-56.DOI:10.13474/j.cnki.11-2246.2015.0110
矢量地理信息更新增量的傳播
張保鋼,楊伯鋼,張偉松
(北京市測繪設計研究院,北京 100038)
IncrementalPropagationofVectorGeographicInformationUpdating
ZHANGBaogang,YANGBogang,ZHANGWeisong
摘要:矢量地理信息更新增量的傳播在客戶數(shù)據(jù)庫更新中起著至關重要的作用。本文從矢量地理信息更新增量傳播的必要條件、傳播過程、特殊性、傳播內容,以及最終客戶數(shù)據(jù)庫的更新幾個方面系統(tǒng)研究了矢量地理信息更新增量的傳播,完善了地理信息更新增量傳播理論;歸納了客戶數(shù)據(jù)庫更新的4種情況,并給出了解決方案。
關鍵詞:矢量地理信息;更新增量;傳播;主數(shù)據(jù)庫;客戶數(shù)據(jù)庫
中圖分類號:P208
收稿日期:2014-02-13
基金項目:國家科技支撐計劃(2011BAK07B02-03);地理空間信息工程國家測繪地理信息局重點實驗室開放基金(201135)
作者簡介:張保鋼(1965—),男,博士,教授級高級工程師,主要從事地理信息系統(tǒng)方面的理論研究與開發(fā)。E-mail:bg_zhang65@163.com
一、引言
隨著地理數(shù)據(jù)“原始積累”的逐步完成和共享應用,數(shù)據(jù)更新已成為廣大用戶關注的熱點問題[1]。更新方式包括版本式更新和增量式更新。由于客戶數(shù)據(jù)庫在主數(shù)據(jù)庫基礎上新加了專題屬性,主數(shù)據(jù)庫的新版數(shù)據(jù)與用戶數(shù)據(jù)庫在數(shù)據(jù)規(guī)格上存在差異。版本式更新客戶數(shù)據(jù)庫將為用戶后續(xù)的使用帶來相當大的工作量及數(shù)據(jù)冗余;而增量式更新可以避免這些不足,還可以對歷史地理信息進行回溯[2-3]。文獻[4—6]對地理信息變化的描述、種類、建模進行了研究;文獻[7]采用目標差、被差和交的三元組對目標快照進行了分類,給出了正差、負差的計算及其在增量采集與變化信息發(fā)布中的應用方法;文獻[8]提出了基于快照—增量的時空索引機制;文獻[9]從拓撲更新的角度,提出了5種更新操作;文獻[10—12]分析了空間數(shù)據(jù)庫增量更新的實施方法、信息提取與集成及增量更新制圖。矢量地理信息更新增量的傳播[13]在客戶數(shù)據(jù)庫更新中起著至關重要的作用。文獻[13]分析了模式匹配、變化提取、實體識別、更新集成4種更新傳播的操作。本文從矢量地理信息更新增量傳播的必要條件、傳播過程及其特殊性、最終客戶數(shù)據(jù)庫的更新幾個方面系統(tǒng)研究了矢量地理信息更新增量的傳播。
二、矢量地理信息更新增量傳播的必要條件
傳播的基本要素包括傳者、受者、信息[14]。傳者是傳播之源;受者是傳播的目的地;信息是從傳者當中挖掘出來、受者需要但沒有的內容,是傳播的對象。另外,傳播介質是信息從傳者到受者間連接的通路或橋梁。矢量地理信息更新增量傳播是從主數(shù)據(jù)庫傳播到客戶數(shù)據(jù)庫,傳者是主數(shù)據(jù)庫,受者是客戶數(shù)據(jù)庫,傳播的內容即信息是矢量地理信息增量文件,傳播的介質是各種網(wǎng)絡或移動設備、光盤、磁盤等數(shù)據(jù)存儲介質。主、客戶數(shù)據(jù)庫間的關系一般應滿足下列條件。
1. 主、客戶數(shù)據(jù)庫覆蓋的空間范圍
主數(shù)據(jù)庫覆蓋的空間范圍{(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)}(i≥2)應包含客戶數(shù)據(jù)庫的空間范圍{(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)}(j≥2)的全部或一部分,即:{(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)}∩{(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)} ≠ Φ。其中,(x主1,y主1),(x主2,y主2),…,(x主i,y主i),…,(x主1,y主1)和(x客1,y客1),(x客2,y客2),…,(x主j,y主j),…,(x客1,y客1)分別是主、客戶數(shù)據(jù)庫空間覆蓋范圍邊界坐標串,Φ表示空集。
2. 主、客戶數(shù)據(jù)庫的數(shù)據(jù)集語義分類
主數(shù)據(jù)庫的數(shù)據(jù)語義分類集合為{Class主1,Class主2,…,Class主i,…,Class主n}(n≥i≥2)。
首先主數(shù)據(jù)庫的數(shù)據(jù)集語義分類S主={Class主1,Class主2,…,Class主n}(n≥2)中的某些元素NClass主1、NClass主2、…、NClass主i與客戶數(shù)據(jù)庫的數(shù)據(jù)集語義分類S客={Class客1,Class客2,…,Class客m}(m≥2)中的某些元素NClass客1、NClass客2、…、NClass客j存在對應關系。
其次,客戶數(shù)據(jù)庫的語義分類的類級不低于主數(shù)據(jù)庫或通過組合某些主數(shù)據(jù)庫分類得到。如果客戶數(shù)據(jù)庫的語義分類高于主數(shù)據(jù)庫分類,可以通過合并或組合主數(shù)據(jù)庫信息的方法更新客戶數(shù)據(jù)庫;然而如果客戶數(shù)據(jù)庫的語義分類低于主數(shù)據(jù)庫分類,則無法通過主數(shù)據(jù)庫更新客戶數(shù)據(jù)庫。如以教育人口空間數(shù)據(jù)庫(主數(shù)據(jù)庫)更新人口空間數(shù)據(jù)庫(客戶數(shù)據(jù)庫)時,前者存儲了研究生以上文化程度、大學文化程度、中學文化程度、小學文化程度和文盲空間分布數(shù)據(jù),后者存儲的是該地區(qū)人口空間分布數(shù)據(jù)。若前者的現(xiàn)勢性高于后者,可以采用組合前者的5類較低級別語義數(shù)據(jù)的方法更新后者1類較高級別語義數(shù)據(jù);但無法通過較高級別的人口數(shù)據(jù)更新較低級別的按教育程度劃分的人口數(shù)據(jù)。
3. 主、客戶數(shù)據(jù)庫的現(xiàn)勢性
主數(shù)據(jù)庫的現(xiàn)勢性應比客戶數(shù)據(jù)庫的現(xiàn)勢性強。客戶獲取地理信息更新增量的目的是進行客戶數(shù)據(jù)庫更新,如果主數(shù)據(jù)庫與客戶數(shù)據(jù)庫相比沒有更高的現(xiàn)勢性,那么從時間或時態(tài)的角度來說,主數(shù)據(jù)庫就失去了客戶的應用價值。
三、矢量地理信息更新增量的傳播過程
傳播過程的一般特征是:誰—說了什么—通過什么渠道—對誰—取得了什么效果[14]。由此矢量地理信息更新增量的傳播過程可描述為:主數(shù)據(jù)庫—矢量地理信息更新增量文件—各種網(wǎng)絡或移動設備、光盤、磁盤等數(shù)據(jù)存儲介質—客戶數(shù)據(jù)庫—實現(xiàn)矢量地理信息的更新。傳播過程的數(shù)據(jù)流程如圖1所示。
圖1 矢量地理信息更新增量的傳播過程
與其他形式信息的傳播相比,矢量地理信息更新增量傳播的特殊性是:①傳播的數(shù)據(jù)量小,只傳播發(fā)生變化的地理信息;②信息構成復雜,除了傳統(tǒng)意義的文字信息外,還包括空間、圖形等信息,其中最顯著的特征是空間信息可定位;③信息傳播過程復雜,信息的解譯需要專門的地理信息系統(tǒng)軟件;④傳播介質特殊,必須是網(wǎng)絡或其他存儲數(shù)字信息的媒介;⑤信息的表現(xiàn)形式直觀活潑,表現(xiàn)為各種地物實體的空間圖形信息;⑥信息的使用需借助客戶數(shù)據(jù)庫,由于更新增量是一個差值,因此只有在用其更新客戶數(shù)據(jù)庫后才更有使用價值。表1是矢量地理信息更新增量與傳統(tǒng)信息、軟件更新增量傳播的對比。
表1 矢量地理信息更新增量與傳統(tǒng)的信息、軟件更新增量傳播的對比
根據(jù)文獻[8],矢量地理信息更新增量包括線目標差、面目標差,以及點目標差。點目標差應包括目標正差和目標負差;線目標差包括目標正差、目標負差、偏離正負差、延長正差、縮短負差、延長縮短差;面目標差包括目標正差、目標負差、偏離正負差、擴張正差、收縮負差、擴張收縮差。矢量地理信息更新增量信息的提取實質上就是給定時間區(qū)間,從主數(shù)據(jù)庫中得到時間區(qū)間兩個端點的時間快照,建立快照差分類描述的目標差、被差和交的三元組,從主數(shù)據(jù)庫的各層空間數(shù)據(jù)層中提取時間快照的點目標差、線目標差和面目標差。這3類目標差集合即用戶所需的增量信息。
四、傳播內容
矢量地理信息更新增量傳播的內容是其增量本身。地理信息更新增量又稱地理信息變化量,描述某個時間段內指定空間區(qū)域地理信息的變化情況,也就是地理目標增、刪、改的情況。如果把修改看成是對同一地理目標先刪除后增加,那么地理信息的變化可只歸類為地理目標的增加和刪除。為便于增量信息與客戶數(shù)據(jù)庫數(shù)據(jù)的集成或融合,地理信息的增量文件還應包括主數(shù)據(jù)庫地理信息增量的元數(shù)據(jù)信息。地理信息增量的內容可歸納如下:
1) 主數(shù)據(jù)庫地理信息元數(shù)據(jù)信息:如地理信息的坐標單位、坐標系、投影類型、比例尺、空間覆蓋范圍、有效數(shù)據(jù)時間(增量時間區(qū)間)等參數(shù)。
2) 刪除的地理目標文件:與主數(shù)據(jù)庫結構一致,且在增量時間區(qū)間內被刪除的地理目標。
3) 增加的地理目標文件:與主數(shù)據(jù)庫結構一致,且在增量時間區(qū)間內增加的地理目標。
五、最終客戶數(shù)據(jù)庫的更新
最終客戶數(shù)據(jù)庫的更新如圖2所示。首先對增量文件進行幾何糾正,使增量數(shù)據(jù)的數(shù)學基礎與客戶數(shù)據(jù)庫數(shù)學基礎相一致;然后依據(jù)增量數(shù)據(jù)與客戶數(shù)據(jù)庫數(shù)據(jù)圖層之間的對應關系,在客戶數(shù)據(jù)庫中提取并刪除增量文件中刪除的地理目標,增加增量文件中新增的地理目標,并使其屬性信息完善,實現(xiàn)客戶數(shù)據(jù)庫的更新。
1. 增量文件幾何糾正
1) 人工選取增量文件中刪除目標的特征點及客戶數(shù)據(jù)庫中對應目標特征點。
2) 依據(jù)精度需要,確定增量文件到客戶數(shù)據(jù)庫空間坐標變換多項式,用最小二乘法解算多項式系數(shù)。
3) 對原增量文件進行整體仿射變換,得到客戶數(shù)據(jù)庫數(shù)學基礎下的增量文件。
2. 增量文件的圖層與結構重組
通過幾何更新,增量文件與客戶數(shù)據(jù)庫的數(shù)學基礎達到了一致。為保證主客戶數(shù)據(jù)庫的數(shù)據(jù)一致性,首先按客戶數(shù)據(jù)庫的數(shù)據(jù)分層方法,將增量文件的刪除部分和增加部分重新進行數(shù)據(jù)分層組織,使增量文件的數(shù)據(jù)分層、數(shù)據(jù)結構與客戶數(shù)據(jù)庫的數(shù)據(jù)分層及數(shù)據(jù)結構相一致。
圖2 最終客戶數(shù)據(jù)庫的更新
3. 對客戶數(shù)據(jù)庫中應刪除地理目標的提取與刪除
逐層提取增量文件中需刪除的目標,以客戶數(shù)據(jù)庫的精度為緩沖區(qū)半徑,建立需刪除目標的緩沖區(qū),客戶數(shù)據(jù)庫對應圖層與上述緩沖區(qū)作疊加分析,完全落在緩沖區(qū)內的目標為客戶數(shù)據(jù)庫該層應刪除目標,刪除這些目標;與緩沖區(qū)有交叉的目標需通過人機交互和借助其他資料判斷其是否需要刪除,完成對增量文件中刪除部分的操作。
4. 對客戶數(shù)據(jù)庫中應增加地理目標的插入
逐層提取增量文件中待插入目標,在客戶數(shù)據(jù)庫相應圖層中插入這些目標,根據(jù)相關補充資料,完善插入目標的屬性。
5. 對客戶數(shù)據(jù)庫中發(fā)生變化圖層拓撲關系的維護
逐層處理客戶數(shù)據(jù)庫中有過增刪操作的地理信息圖層,重建拓撲關系,如由于地理目標的增刪而引起的合并、分割等。
六、試驗與結論
基于上述思想,本文開發(fā)了矢量地理信息更新增量傳播程序。圖3是以房屋圖層為例的一個程序運行試驗。主、客戶數(shù)據(jù)庫間具有相同的數(shù)學基礎和語義分類。試驗表明,程序可在一定程度上實現(xiàn)矢量地理信息更新增量傳播和客戶數(shù)據(jù)庫更新。
圖3 矢量地理信息更新增量傳播
客戶數(shù)據(jù)庫的更新可分為下述4種情況:①當主、客戶數(shù)據(jù)庫的數(shù)學基礎、語義分類、數(shù)據(jù)結構等完全一致時,直接使用更新增量對客戶數(shù)據(jù)庫進行相應的目標刪除、增加和拓撲關系維護等操作;②當主、客戶數(shù)據(jù)庫之間除數(shù)據(jù)結構外,其他屬性相同時,首先修改增量文件結構,使增量文件的數(shù)據(jù)結構與客戶數(shù)據(jù)庫完全一致,然后執(zhí)行步驟①的操作;③當主、客戶數(shù)據(jù)庫之間只有數(shù)學基礎相同時,按客戶數(shù)據(jù)庫的數(shù)據(jù)分層方法,將增量文件的刪除部分和增加部分重新進行數(shù)據(jù)分層組織,使增量文件與客戶數(shù)據(jù)庫的數(shù)據(jù)分層相一致,然后執(zhí)行步驟②的操作;④當主、客戶數(shù)據(jù)庫之間數(shù)學基礎不同時,應對增量文件首先進行幾何糾正,使增量文件與客戶數(shù)據(jù)庫的數(shù)學基礎一致,然后執(zhí)行步驟③的操作。實際工作中前3種情況較多,第4種情況操作復雜,不建議使用;但當更新資料匱乏時,步驟④也可選擇使用。
本試驗是在主、客戶數(shù)據(jù)庫間具有相同的數(shù)學基礎和語義分類條件下展開的,未涉及主、客戶數(shù)據(jù)庫間數(shù)學基礎、語義分類、數(shù)據(jù)結構均不一致時增量更新的情況。今后的研究包括客戶數(shù)據(jù)庫快速增量更新算子、增量文件的語義轉換及與客戶數(shù)據(jù)庫實體的匹配等。
參考文獻:
[1]蔣捷,陳軍.基礎地理信息數(shù)據(jù)庫更新的若干思考[J].測繪通報,2000(5):1-3.
[2]張豐,劉南,劉仁義,等.面向對象的地籍時空過程表達與數(shù)據(jù)更新模型研究[J].測繪學報,2010,39(3):303-309.
[3]劉勖,蔡先華. 數(shù)據(jù)增量探測技術在電子地圖更新中的應用[J]. 測繪通報,2007(11):50-53.
[4]林艷,劉萬增,王育紅. 一種基于更新過程的空間變化信息描述方法[J]. 地理與地理信息科學,2011, 27 (4):24-27.
[5]朱華吉,吳華瑞.基于地理事件和更新操作的地理要素增量變化分類[J].遼寧工程技術大學學報:自然科學版,2010,29(3):444-458.
[6]朱華吉.地形數(shù)據(jù)庫增量信息數(shù)據(jù)建模及其RDF描述[J].吉林大學學報:地球科學版,2007,37(1):195-199,203.
[7]陳軍,林艷,劉萬增,等.面向更新的空間目標快照差分類與形式化描述[J].測繪學報,2012,41(1):108-114.
[8]尹章才,李霖. 基于快照-增量的時空索引機制研究[J].測繪學報,2005, 34 (3):257-261,282.
[9]陳軍,周曉光.基于拓撲聯(lián)動的增量更新方法研究——以地籍數(shù)據(jù)庫為例[J].測繪學報,2008,37(3):322-329.
[10]王育紅, 牛亞輝,林艷.顧及語義差異的基礎地理信息客戶數(shù)據(jù)庫更新實施模型[J].地理信息與科學,2011,27(1):1-6.
[11]王育紅.面向更新信息提取與集成的空間實體匹配方法[J].測繪科學,2011,36(1):128-130.
[12]胡振龍, 李霖,朱海紅. 地理數(shù)據(jù)庫驅動的增量更新制圖研究[J]. 武漢大學學報:信息科學版,2010, 35 (12):1478-1481.
[13]王育紅,陳軍. 基礎地理數(shù)據(jù)庫更新信息傳播實施方法研究[J]. 武漢大學學報:信息科學版,2010, 35 (9):1116-1120.
[14]郭慶光.傳播學教程[M]. 北京:中國人民大學出版社,1999.