藍(lán)振家,郭慶勝,劉紀(jì)平,王 勇
(1.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;2.中國測繪科學(xué)研究院,北京 100830)
多尺度面實(shí)體的匹配方法研究
藍(lán)振家1,郭慶勝1,劉紀(jì)平2,王 勇2
(1.武漢大學(xué) 資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079;2.中國測繪科學(xué)研究院,北京 100830)
從多尺度面實(shí)體匹配的需要出發(fā),分析地圖綜合所引起的一對多、多對多匹配關(guān)系,以及不同地圖綜合算子給同名實(shí)體所造成的差異,將一對一匹配關(guān)系的幾何相似性度量模型和非一對一匹配關(guān)系的基于重疊度的面實(shí)體匹配方法相結(jié)合,采用指標(biāo)閾值自動確定方法,建立一種新的適用多尺度變化的面實(shí)體匹配方法。最后以多個比例尺的居民地為實(shí)驗(yàn)對象,驗(yàn)證本方法的可行性和有效性。
面實(shí)體;多尺度;匹配;幾何相似性;地圖綜合
同名實(shí)體匹配已經(jīng)成為空間數(shù)據(jù)集成、空間數(shù)據(jù)自動更新、位置服務(wù)等空間數(shù)據(jù)處理的關(guān)鍵技術(shù),是目前國內(nèi)外學(xué)者研究的一個熱點(diǎn)問題,例如,居民地、湖泊等面狀地物的匹配[1-3]。已有的面實(shí)體匹配方法主要適用于相近比例尺的一對一關(guān)系匹配,大致有3類方法:①從單個面實(shí)體的幾何特征出發(fā),通過計算位置、形狀、大小、方向等多特征的幾何相似性來確定匹配實(shí)體[2,4-6];②利用降維技術(shù),通過提取二維面實(shí)體骨架線,將二維面匹配問題轉(zhuǎn)化為一維線匹配問題[7-8];③通過提取面實(shí)體空白區(qū)域骨架線,將面實(shí)體的匹配轉(zhuǎn)換為空白區(qū)域骨架線網(wǎng)眼匹配[9]。在多尺度空間目標(biāo)匹配方面,郭黎研究了基于面狀拓?fù)湟仃P(guān)系的數(shù)據(jù)匹配技術(shù)[10],翟仁建研究了基于全局一致性評價的多尺度矢量空間數(shù)據(jù)匹配方法[1]。然而,當(dāng)數(shù)據(jù)源的比例尺差異較大時,地圖面狀目標(biāo)匹配受地圖綜合的影響比較大,同名實(shí)體以一對多、多對多匹配關(guān)系為主,并且有少量其它的匹配關(guān)系。因此,本文從多尺度面實(shí)體匹配的需要出發(fā),分析了不同地圖綜合算子給同名實(shí)體所造成的差異,將幾何相似性度量模型和基于重疊度的面實(shí)體匹配方法相結(jié)合,建立了一種顧及地圖綜合因素的能適應(yīng)多尺度面實(shí)體匹配的新方法。
不同地圖空間的同名實(shí)體之間有差異原因:地圖綜合、實(shí)際變化以及數(shù)據(jù)誤差[11],其中,地圖綜合是不同比例尺地圖空間的同名實(shí)體有差異的主要原因[1]。地圖綜合算子在地理空間數(shù)據(jù)的綜合包括目標(biāo)選取、目標(biāo)簡化、多目標(biāo)的合并、移位、夸大以及典型化[12-14,15]。不同地圖綜合算子造成的同名實(shí)體差異也會不同,簡化、夸大算子會造成同名實(shí)體在形狀、大小等方面的差異;選取算子會造成實(shí)體的刪除;移位算子會產(chǎn)生空間位置的差異;合并算子和典型化算子會造成同名實(shí)體多方面的差異。多尺度地圖空間中面實(shí)體之間的匹配可細(xì)分為一對零(即1∶0或0∶1)、一對一(即1∶1)、一對多(即1∶N或M∶1,N>1,M>1)和多對多四種不同的匹配關(guān)系[1,11]。不同地圖綜合算子造成的同名實(shí)體的差異以及對應(yīng)的匹配關(guān)系如表1所示。
表1 不同地圖綜合算子造成同名實(shí)體的差異以及對應(yīng)的匹配關(guān)系
2.1 幾何相似度模型原理
面實(shí)體幾何相似度模型是以單個面實(shí)體的形狀、大小和位置三個幾何特征量作為匹配的依據(jù),將形狀、大小和位置的相似度進(jìn)行加權(quán)求和,綜合性相似度最大的兩個實(shí)體可以匹配。假設(shè):待匹配實(shí)體為A和B,其綜合性相似度指標(biāo)由向量[a1,a2,a3]T和[b1,b2,b3]T組成,其中的分量代表大小、位置、形狀;g(A,B)表示A與B之間的差異度;sim(A,B)表示A與B之間的相似度,見式(1)。若采用加權(quán)的歐氏距離度量g(A,B),式(1)可以轉(zhuǎn)化為式(2)。
(1)
(2)
(3)
式中:AreaA,AreaB分別為面實(shí)體A,B的面積;Max(AreaA,AreaB)為面實(shí)體A和B面積的最大值。
(4)
式中:(XA,YA)和(XB,YB)分別為面實(shí)體A和B的中心點(diǎn);dmax(A,B)為面實(shí)體A邊界上任意一個點(diǎn)與面實(shí)體B任意邊界上任意一個點(diǎn)之間的最大距離。
2.2 匹配的過程
設(shè)有2個面實(shí)體集合,大比例尺面實(shí)體集合A={a0,a1,…,am},小比例尺面實(shí)體集合B={b0,b1,…,bn},這兩個集合的面實(shí)體匹配步驟:
1)采用文獻(xiàn)[4]的方法確定匹配參數(shù)閾值。從兩個集合中人工選取認(rèn)為可以匹配的若干實(shí)體目標(biāo)對,作為樣本,計算樣本中每一個實(shí)體對的距離差異度、形狀差異度和大小差異度三個分量,并對每一個分量的標(biāo)準(zhǔn)差進(jìn)行倒數(shù)歸一化,得到各個分量的權(quán)重w1,w2和w3。根據(jù)分量權(quán)重和每個實(shí)體對的各個分量,求取實(shí)體對的綜合性相似度。然后,根據(jù)綜合性相似度均值S以及標(biāo)準(zhǔn)差δ,計算出綜合性相似度閾值:S-3δ。
2)對A和B建立固定格網(wǎng)空間索引,計算A和B中每個面實(shí)體所經(jīng)過的格網(wǎng)和每個格網(wǎng)所包含的面實(shí)體。
3)讀取A中實(shí)體ai(i=1,2,…,m)在空間索引中的格網(wǎng)位置,以一個格網(wǎng)為距離單位,找到這些格網(wǎng)的BUFFER區(qū)域,隨后以這個區(qū)域內(nèi)的格網(wǎng)為范圍,檢索出B中的面實(shí)體子集合,作為ai候選匹配集。
4)在實(shí)體ai和與候選匹配集中每個實(shí)體之間計算位置差異度、大小差異度和形狀差異度3個分量。計算實(shí)體ai與候選匹配集中每個實(shí)體之間的綜合性相似度,若綜合性相似度最大并且大于閾值,那么實(shí)體ai在候選匹配集中有匹配實(shí)體。
5)若A中實(shí)體都已經(jīng)被匹配,則結(jié)束;否則回到第(3)步。
設(shè)大比例尺面實(shí)體集合A={a0,a1,…,am},小比例尺面實(shí)體集合B={b0,b1,…,bn},具體的匹配過程如下:
1)依據(jù)前文所提到的閾值計算方法,人工選取一定數(shù)量的正例樣本,確定重疊度閾值(Mlimit),而現(xiàn)有的方法需要人工設(shè)置重疊度閾值。設(shè)dmin為最小可分辨距離,并按照地圖比例尺轉(zhuǎn)換為數(shù)據(jù)庫的長度單位。
2)遍歷集合A中的m個面實(shí)體元素ai,針對每個元素(面實(shí)體),檢索出與其最短距離小于dmin的所有實(shí)體,設(shè)這些面實(shí)體組成一個集合ACi,對于集合A而言,形成了一個由m個集合組成的集合群AC。
3)遍歷集合B中的n個面實(shí)體元素bj,針對每個元素(面實(shí)體),在集合A中檢索出與其相交的所有面實(shí)體,設(shè)這些面實(shí)體組成一個集合BCi,對于集合B而言,就形成了一個由n個集合組成的集合群BC。
4)集合ACi和集合BCj中的元素都是來源于集合A,也可能為空,因?yàn)榭赡茉诩螦中沒有檢索到符合條件的面實(shí)體。若BCj的元素個數(shù)大于1,則計算BCj中每一個面實(shí)體ai與BCj對應(yīng)的面實(shí)體bj的重疊度M。把M>Mlimit的面實(shí)體組成一個集合Qj,就從BCj得到一個與bj有匹配關(guān)系的面實(shí)體集合,其元素都是來源于集合A。
(5)
其中,sc為ai與bj的重疊面積;sai代表ai的面積;sbj為bj的面積。
5)從集合Qj中遍歷所有的元素(面實(shí)體ai),若ai對應(yīng)的集合ACi中的元素(面實(shí)體ak)也是集合BCj中的元素,則面實(shí)體ak也加入集合Qj中,形成一個新的集合群Q。
6)從集合Qj中分析面實(shí)體的匹配關(guān)系:若Qj的元素個數(shù)大于1,并且Qj中的某個面實(shí)體(ai)在整個集合群Q中具有唯一性,則匹配關(guān)系為一對多(bj與Qj中的面實(shí)體之間的匹配關(guān)系),否則相關(guān)的面實(shí)體(包含元素ai的集合Qj中的所有面實(shí)體和bj)之間的匹配關(guān)系為多對多。
4.1 數(shù)據(jù)匹配總體流程
設(shè)有2個數(shù)據(jù)集,大比例尺面實(shí)體集合A,小比例尺面實(shí)體集合B,依據(jù)前文所設(shè)計的算法,面實(shí)體匹配的主要流程如下:
1)坐標(biāo)變換。兩種數(shù)據(jù)源之間坐標(biāo)變換有兩個目的[10]:一是統(tǒng)一兩幅圖的投影系統(tǒng)和坐標(biāo)系統(tǒng);二是消除兩幅圖之間可能存在的系統(tǒng)偏差。
2)建立面實(shí)體空間格網(wǎng)索引。索引的建立有2個好處:一是在匹配過程中,減少了不必要的搜索時間,提高了算法的效率;二是在確定匹配候選集時,縮小了匹配候選對象的范圍。
3)匹配過程。若比例尺相近(倍數(shù)小于2.5),則采用幾何相似度模型進(jìn)行匹配;否則采用改進(jìn)的非一對一匹配方法。
4)輸出匹配關(guān)系。若比例尺相近,則輸出的匹配關(guān)系有一對零和一對一;否則輸出的匹配關(guān)系包括一對零,一對一,一對多和多對多。
4.2 匹配實(shí)驗(yàn)
實(shí)驗(yàn)1采用武漢周邊某區(qū)域1∶1萬和1∶2.5萬的居民地數(shù)據(jù),如圖1所示,淺灰色為1∶1萬居民地,有270個面,黑色為1∶2.5萬的居民地,有84個面。
圖1 1∶1萬與1∶2.5萬居民地重疊圖
匹配開始之前,人工隨機(jī)選擇6對已經(jīng)確定匹配的正例樣本(盡量選擇位置誤差較大的實(shí)體對),計算樣本對中面實(shí)體幾何特征的各個分量的差異度,見表2。
對距離差異度、形狀差異度和大小差異度等分別計算標(biāo)準(zhǔn)差,然后對標(biāo)準(zhǔn)差進(jìn)行倒數(shù)歸一化,則距離權(quán)重是0.101 1,形狀權(quán)重是0.690 7,大小權(quán)重是0.208 2;根據(jù)權(quán)重值求得各對樣本的綜合性相似度,相似度的均值是0.972 4,標(biāo)準(zhǔn)差是0.01,則綜合性相似度閾值為0.942 3,同理可得重疊度均值0.847 4和標(biāo)準(zhǔn)差0.096 6,則重疊度閾值為0.557 4。設(shè)居民地面實(shí)體間的圖上最小可分辨距離為0.5 mm[18],匹配結(jié)果的統(tǒng)計如表3所示。
實(shí)驗(yàn)2采用同一區(qū)域的1∶1萬和1∶5萬比例尺的居民地數(shù)據(jù),如圖2所示,淺灰色為1∶1萬居民地,有270個面,黑色為1∶2.5萬的居民地,有11個面。匹配結(jié)果的統(tǒng)計如表4所示。
表2 樣本特征分量、總相似度以及重疊度
表3 1∶1萬與1∶2.5萬居民地匹配實(shí)驗(yàn)統(tǒng)計結(jié)果
圖2 1∶1萬與1∶5萬居民地重疊圖
表4 1∶1萬與1∶5萬居民地匹配實(shí)驗(yàn)統(tǒng)計結(jié)果
本文將面實(shí)體的形狀、位置和大小三個幾何特征量作為構(gòu)建幾何相似度模型的因素,匹配方法中指標(biāo)閾值能自動確定,由表3和表4可知,多個比例尺的匹配實(shí)驗(yàn)都得到了正確的匹配結(jié)果,證明了該方法適應(yīng)于多尺度面實(shí)體的匹配,相對于文獻(xiàn)[10]的方法,本方法更加科學(xué)。
[1] 翟仁健. 基于全局一致性評價的多尺度矢量空間數(shù)據(jù)匹配方法研究[D]. 鄭州:信息工程大學(xué), 2011.
[2] 郝燕玲, 唐文靜, 趙玉新,等. 基于空間相似性的面實(shí)體匹配算法研究[J]. 測繪學(xué)報, 2008, 37(4):501-506.
[3] 張橋平, 李德仁, 龔健雅. 城市地圖數(shù)據(jù)庫面實(shí)體匹配技術(shù)[J]. 遙感學(xué)報, 2004, 8(2):107-112.
[4] 安曉亞, 孫群, 肖強(qiáng),等. 一種形狀多級描述方法及在多尺度空間數(shù)據(jù)幾何相似性度量中的應(yīng)用[J]. 測繪學(xué)報, 2011(4):495-501.
[5] 付仲良,逯躍鋒.利用彎曲度半徑復(fù)函數(shù)構(gòu)建綜合面實(shí)體相似度模型[J].測繪學(xué)報,2013,42(1):145-151.
[6] 郭黎, 崔鐵軍, 鄭海鷹,等. 基于空間方向相似性的面狀矢量空間數(shù)據(jù)匹配算法[J]. 測繪科學(xué)技術(shù)學(xué)報, 2008, 25(5):380-382.
[7] 黃智深, 錢海忠, 郭敏,等. 面狀居民地匹配骨架線傅里葉變化方法[J]. 測繪學(xué)報, 2013, 42(6):913-921.
[8] 黃智深, 錢海忠, 王驍,等. 基于降維技術(shù)的面狀居民地匹配方法[J]. 測繪科學(xué)技術(shù)學(xué)報, 2012, 29(1):75-78.
[9] 王驍, 錢海忠, 何海威,等. 利用空白區(qū)域骨架線網(wǎng)眼匹配多源面狀居民地[J]. 測繪學(xué)報, 2015, 44(8):927-935.
[10] 郭黎, 崔鐵軍, 王豪,等. 基于面狀要素拓?fù)潢P(guān)系的數(shù)據(jù)匹配技術(shù)研究[J]. 測繪科學(xué), 2010, 35(1):130-132.
[11] 趙彬彬.多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D].長沙:中南大學(xué),2011.
[12] 郭慶勝.地圖自動綜合理論與方法[M].北京:測繪出版社,2002.
[13] 楊杰, 楊敏華. 基于信息熵的面狀要素在地圖綜合中的量測方法分析[J]. 測繪工程, 2012, 21(2):54-56.
[14] 武芳, 王家耀. 地圖自動綜合概念框架分析與研究[J]. 測繪工程, 2002, 11(2):18-20.
[15] 張清林,林泉,周偉.基于多尺度公開版地圖數(shù)據(jù)庫的制圖綜合指標(biāo)與模型的建立研究[J].測繪與空間地理信息,2016,39(4):102-104,109.
[16] 王斌, 舒華忠, 施朝健,等. 一種基于輪廓線的形狀描述與匹配方法[J]. 電子與信息學(xué)報, 2008, 30(4):949-952.
[17] 藍(lán)秋萍.地圖數(shù)據(jù)多尺度級聯(lián)更新方法研究[D].武漢: 武漢大學(xué),2010.
[18] LI Z L, YAN H, AI T, et al. Automated Building Generalization Based on Urban Morphology and Gestalt Theory[J]. International Journal of Geographical Information Science, 2004, 18(5):513-534.
[責(zé)任編輯:李銘娜]
Research on the method of multi-scale areal feature matching
LAN Zhenjia1, GUO Qingsheng1, LIU Jiping2, WANG Yong2
(1.School of Resource and Environment Science,Wuhan University,Wuhan 430079,China; 2. Chinese Academy of Surveying and Mapping, Beijing 100830,China)
The existing methods of areal feature matching mainly focus on the similar scale. According to the need of multi-scale areal feature matching, the reasons of causing 1∶M and M∶N matching relationships in map generalization and the differences between same entities caused by different map generalization operators are analyzed in this paper. Combining geometrical similarity model for 1∶1 matching relationship of areal features with the matching method based on overlap which is suitable for not 1∶1 matching relationship, the thresholds of indices can be determined automatically. A new adaptive method is proposed for multi-scale areal features matching. At last, the multi-scale residential data are taken as the experimental object to verify the feasibility and effectiveness of this method.
areal feature;multi-scale;matching;geometrical similarity;map generalization
著錄:藍(lán)振家,郭慶勝,劉紀(jì)平,等.多尺度面實(shí)體的匹配方法研究[J].測繪工程,2017,26(11):28-31.
10.19349/j.cnki.issn1006-7949.2017.11.006
2016-08-17
國家自然科學(xué)基金資助項(xiàng)目(41471384);公益性科研專項(xiàng)基金資助項(xiàng)目(201512032)
藍(lán)振家(1991-),男,碩士研究生.
TP75
A
1006-7949(2017)11-0028-04