王 驍,錢海忠,何海威,陳競(jìng)男,胡慧明
信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450052
Matching Method for Road Networks Considering the Similarity of the
Neighborhood Habitation Cluster
WANG Xiao,QIAN Haizhong,HE Haiwei,CHEN Jingnan,HU Huiming
Institute of Geospatial Information, Information Engineering University, Zhengzhou 450052, China
?
顧及鄰域居民地群組相似性的道路網(wǎng)匹配方法
王驍,錢海忠,何海威,陳競(jìng)男,胡慧明
信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450052
Foundation support: The National Natural Science Foundation of China (Nos. 41171305;41171354;40701157); Master’s Degree Dissertation Innovation Fundation of Geospatial Information Institute, Information Engineering University(No.S201403)
摘要:現(xiàn)有多源同比例尺道路網(wǎng)匹配方法中,大多只利用道路自身特征進(jìn)行匹配,而較少顧及道路周邊要素對(duì)匹配過(guò)程的影響和約束,從而影響了道路網(wǎng)匹配效果的進(jìn)一步提高,特別是對(duì)系統(tǒng)誤差改正后仍存在一定位置或旋轉(zhuǎn)偏差的道路數(shù)據(jù)進(jìn)行匹配時(shí),這種影響尤為明顯。本文借鑒人類對(duì)陌生環(huán)境的空間認(rèn)知特點(diǎn),提出了一種顧及鄰域居民地群組相似性的道路網(wǎng)匹配方法。該方法通過(guò)構(gòu)建城市骨架線網(wǎng)確定與道路相鄰的居民地群組,進(jìn)而計(jì)算居民地群組空間關(guān)系和幾何特征相似度來(lái)獲得對(duì)應(yīng)道路的匹配結(jié)果。其特點(diǎn)在于:對(duì)存在位置或旋轉(zhuǎn)偏差的道路數(shù)據(jù)匹配,以其鄰域空間內(nèi)居民地群組的整體相似性指標(biāo)來(lái)帶動(dòng)道路自身匹配,實(shí)際上是增加了周邊居民地群組對(duì)道路匹配過(guò)程的約束,更具魯棒性。試驗(yàn)及對(duì)比分析表明,本方法能夠較好地解決系統(tǒng)誤差改正后仍存在較大位置和旋轉(zhuǎn)偏差的道路數(shù)據(jù)間的匹配問(wèn)題,提高匹配的正確率。
關(guān)鍵詞:多源道路網(wǎng)匹配;城市骨架線網(wǎng);鄰域環(huán)境;居民地群組;面群相似性計(jì)算
城市化進(jìn)程的加速使得道路變化周期越來(lái)越短,如何對(duì)道路數(shù)據(jù)進(jìn)行準(zhǔn)確、及時(shí)的更新以滿足地理空間數(shù)據(jù)現(xiàn)勢(shì)性的要求成為當(dāng)前測(cè)繪工作者面臨的重點(diǎn)和難點(diǎn)。與此同時(shí),不同部門對(duì)相同區(qū)域重復(fù)采集生產(chǎn)了大量道路數(shù)據(jù),如何將這些多源道路數(shù)據(jù)進(jìn)行有效集成與融合以達(dá)到數(shù)據(jù)共享與優(yōu)勢(shì)互補(bǔ)的目的則是當(dāng)前GIS工作者面臨的另一項(xiàng)難題。無(wú)論是道路數(shù)據(jù)更新還是多源道路數(shù)據(jù)集成與融合均建立在同名實(shí)體匹配的基礎(chǔ)上。同名實(shí)體是指在兩個(gè)或兩個(gè)以上不同數(shù)據(jù)源中反映現(xiàn)實(shí)世界同一地物或地物集的空間實(shí)體。受制圖誤差、不同應(yīng)用目的以及制圖綜合等因素的影響,不同數(shù)據(jù)源中的同名實(shí)體通常都存在著差異。同名實(shí)體匹配就是通過(guò)分析空間實(shí)體的差異和相似性識(shí)別出不同數(shù)據(jù)來(lái)源中表達(dá)現(xiàn)實(shí)世界同一地物或地物集的過(guò)程[1]。同名實(shí)體間匹配關(guān)系準(zhǔn)確、快速的識(shí)別與建立是后續(xù)道路數(shù)據(jù)更新以及集成與融合的基礎(chǔ),具有重要意義[2]。
國(guó)內(nèi)外學(xué)者對(duì)道路網(wǎng)匹配進(jìn)行了廣泛的研究,如文獻(xiàn)[3]利用“緩沖區(qū)增長(zhǎng)法”確定待匹配線的候選匹配集;文獻(xiàn)[4]提出了非對(duì)稱性緩沖區(qū)增長(zhǎng)法,在匹配過(guò)程中可動(dòng)態(tài)調(diào)整緩沖區(qū)半徑;文獻(xiàn)[5]在基于概率理論匹配模型的基礎(chǔ)上,綜合運(yùn)用多個(gè)匹配指標(biāo),通過(guò)計(jì)算實(shí)體匹配概率大小來(lái)確定匹配實(shí)體;文獻(xiàn)[6]將道路目標(biāo)分為3個(gè)匹配層次,利用緩沖區(qū)分析和拓?fù)潢P(guān)系開發(fā)了系列算法完成匹配;文獻(xiàn)[7]改局部尋優(yōu)為全局尋優(yōu),綜合利用道路節(jié)點(diǎn)與弧段的特征信息,通過(guò)概率松弛法獲得匹配關(guān)系;文獻(xiàn)[8]提出一種基于結(jié)構(gòu)模式的道路網(wǎng)節(jié)點(diǎn)匹配方法;文獻(xiàn)[9]利用概率松弛法對(duì)道路網(wǎng)進(jìn)行自動(dòng)匹配;對(duì)于多尺度道路網(wǎng)的匹配問(wèn)題,文獻(xiàn)[10]利用距離指標(biāo)對(duì)道路間是否匹配進(jìn)行衡量。
上述研究極大推動(dòng)了道路匹配技術(shù)的發(fā)展,為解決道路數(shù)據(jù)的集成與更新提供了有力支持??偨Y(jié)分析上述方法可得:多數(shù)多源同比例尺道路匹配方法通常利用道路自身的幾何、拓?fù)?、語(yǔ)義等特征進(jìn)行匹配,而相對(duì)較少顧及道路鄰域環(huán)境中其他要素對(duì)匹配過(guò)程的影響與約束,從而可能影響匹配效果的進(jìn)一步提高;同時(shí),在大多數(shù)匹配方法中,道路空間位置的鄰近程度始終是確定匹配關(guān)系的重要依據(jù),而一旦匹配數(shù)據(jù)間存在位置偏差以及更為復(fù)雜的旋轉(zhuǎn)偏差時(shí),匹配結(jié)果可能會(huì)受到更大的影響。由于不同來(lái)源的道路數(shù)據(jù)的獲取方式和精度可能不相同,使得同名實(shí)體間產(chǎn)生了較大位置偏差,雖然在實(shí)際操作的數(shù)據(jù)預(yù)處理過(guò)程中,通過(guò)系統(tǒng)改正方法能夠?qū)@種偏差進(jìn)行糾正,但是待匹配雙方數(shù)據(jù)之間可能存在著非均勻的位置偏差,并且從目前實(shí)際作業(yè)情況看,許多數(shù)據(jù)來(lái)源渠道多樣,投影不同,投影類型未知,也給統(tǒng)一修正偏差帶來(lái)了較大難度,如果盲目修改偏差,則可能會(huì)導(dǎo)致數(shù)據(jù)質(zhì)量下降。因此即使通過(guò)整體性的坐標(biāo)系統(tǒng)糾正,待匹配數(shù)據(jù)雙方中的要素也可能無(wú)法實(shí)現(xiàn)完全的精確配準(zhǔn),數(shù)據(jù)間仍可能存在一定的偏差[11],從而影響后續(xù)匹配過(guò)程,所以需要對(duì)這種情況單獨(dú)進(jìn)行討論。
實(shí)際上,任何空間要素都不是孤立存在的,與其鄰域要素之間必然存在一定的聯(lián)系[12]。對(duì)道路而言,無(wú)論在現(xiàn)實(shí)世界還是在地圖中,居民地都是與其聯(lián)系最為密切的要素。例如,人們?cè)谑煜ひ粭l陌生街道的過(guò)程中,通常會(huì)參照該街道周圍建筑物的分布狀況,形成“心象地圖”,當(dāng)需要再次尋找該街道時(shí),將該道路周邊的建筑物作為重要的定位依據(jù)??臻g數(shù)據(jù)匹配中的相似性度量過(guò)程與人類的這種空間認(rèn)知過(guò)程十分相似,因此本文借鑒上述人類空間認(rèn)知特點(diǎn),將道路鄰域居民地群組的相似性作為判斷匹配的衡量指標(biāo),提出一種顧及鄰域居民地群組相似性的道路網(wǎng)匹配方法。
1顧及鄰域要素相似性的匹配思路
地理要素自身具有一定的空間特征,同時(shí)也與其鄰域要素之間存在著較多的空間聯(lián)系。對(duì)于空間數(shù)據(jù)中互相匹配的同名實(shí)體而言,除了其自身空間幾何特征應(yīng)具有高度相似性外,其鄰域環(huán)境也應(yīng)非常相似,有時(shí)只考慮實(shí)體自身的特征進(jìn)行匹配不足以得到正確的匹配結(jié)果,例如,可能出現(xiàn)兩個(gè)或多個(gè)對(duì)象之間雖然具有較高的位置、形狀相似度,但它們之間并不匹配的情況[13]。所以在匹配過(guò)程中顧及同名實(shí)體鄰域環(huán)境的相似性,能夠增強(qiáng)匹配過(guò)程中辨別同名實(shí)體的能力。這種相似性主要體現(xiàn)在鄰域環(huán)境自身的空間關(guān)系(拓?fù)潢P(guān)系、方向關(guān)系、度量關(guān)系等)以及幾何特征(形狀、大小、分布等)應(yīng)具有相似性,故匹配過(guò)程應(yīng)主要從這兩方面衡量鄰域環(huán)境的相似性。由于匹配數(shù)據(jù)雙方語(yǔ)義信息可能存在較多的缺失和較大的差異,所以本文方法均不考慮鄰域環(huán)境中要素的語(yǔ)義相似性。
2利用城市骨架線網(wǎng)確定道路鄰域居民地群組
在大比例尺城市地圖中,相比植被、水系、地貌,道路和居民地是最為重要的兩類要素,是城市地圖重點(diǎn)表達(dá)的主體,所以本文只將居民地作為道路的鄰域?qū)ο筮M(jìn)行研究。如圖1所示,大比例尺城市地圖中居民地要素一般散列地分布在道路兩側(cè),所以道路鄰域范圍內(nèi)的居民地呈現(xiàn)出面狀群組的形式。確定道路鄰域居民地群組最直觀的方法是根據(jù)居民地距道路的距離進(jìn)行判斷,如果距離滿足閾值則將其視為與道路相鄰的居民地。由于不同來(lái)源的數(shù)據(jù)間存在一定程度的差異,因此設(shè)置合適的閾值較為困難。一旦閾值設(shè)置不當(dāng),則可能造成同名道路的鄰域居民地群組之間存在差異,從而影響居民地群組相似性計(jì)算,進(jìn)而影響后續(xù)的匹配過(guò)程。為此本文利用城市骨架線網(wǎng)確定道路鄰域居民地群組,該方法能夠提取一致程度較高的道路鄰域居民地群組。
2.1城市骨架線網(wǎng)概述
城市骨架線網(wǎng)由道路和空白區(qū)域骨架線兩部分構(gòu)成。具體來(lái)說(shuō),地圖中存在道路的地方,直接將道路視為骨架線;地圖中道路和居民地以外的空白區(qū)域,則提取其骨架線。圖1中道路和居民地?cái)?shù)據(jù)的空白區(qū)域如圖2所示,空白區(qū)域指的是地圖幅面中除道路和居民地外剩余所有區(qū)域的總和。
圖1 道路、居民地示例Fig.1 Example of roadand habitation
圖2 空白區(qū)域示意圖Fig.2 Sketch map of blankregion
2.2空白區(qū)域骨架線提取
采用約束Delaunay三角網(wǎng)方法提取空白區(qū)域骨架線[14],具體步驟為:①數(shù)據(jù)節(jié)點(diǎn)加密,初始道路和居民地?cái)?shù)據(jù)中節(jié)點(diǎn)總數(shù)相對(duì)較少,為了構(gòu)建滿足空白區(qū)域骨架線提取要求的約束Delaunay三角網(wǎng),在構(gòu)網(wǎng)前需對(duì)道路和居民地?cái)?shù)據(jù)進(jìn)行節(jié)點(diǎn)加密處理(如圖3);②以道路和居民地外圍輪廓為約束邊,構(gòu)建約束Delaunay三角網(wǎng)(如圖4);③提取空白區(qū)域骨架線。依據(jù)三角形頂點(diǎn)在居民地和道路上的數(shù)量與位置將三角形分為5類(圖5):ⅰ類三角形,3個(gè)頂點(diǎn)均在居民地輪廓上,其中根據(jù)頂點(diǎn)位于幾個(gè)不同居民地輪廓上又分為3小類,ⅰ(1)類三角形, 3個(gè)頂點(diǎn)分別在3個(gè)不同的居民地輪廓上,ⅰ(2)類三角形,3個(gè)頂點(diǎn)在兩個(gè)不同的居民地輪廓上,ⅰ(3)類三角形,3個(gè)頂點(diǎn)在同一居民地輪廓上;ⅱ類三角形,一個(gè)頂點(diǎn)在道路上,另兩個(gè)頂點(diǎn)在兩個(gè)不同居民地輪廓上;ⅲ類三角形,一個(gè)頂點(diǎn)在道路上,另兩個(gè)頂點(diǎn)在同一居民地輪廓上;ⅳ類三角形,兩個(gè)頂點(diǎn)在道路上,另一個(gè)頂點(diǎn)在居民地輪廓上;ⅴ類三角形,3個(gè)頂點(diǎn)均在道路上。
圖3 道路和居民地加密處理Fig.3 Densification of road and habitation
圖4 構(gòu)建約束Delaunay 圖5 三角形分類 三角網(wǎng)Fig.4 Constructing constraint Fig.5 Classification Delaunay triangulation of triangle network
如圖6所示,ⅰ(1)類三角形,分別連接三角形中心和三邊的中點(diǎn)形成骨架線;ⅰ(2)類三角形,首先判斷其唯一的約束邊,然后連接兩非約束邊的中點(diǎn)形成骨架線;ⅱ類三角形,連接在道路上的唯一頂點(diǎn)與其對(duì)邊中點(diǎn)形成骨架線;ⅲ、ⅳ、ⅴ類三角形不進(jìn)行任何處理。所有三角形按照上述方法連接后即可得到空白區(qū)域的骨架線(圖7(a)),空白區(qū)域骨架線和道路一起構(gòu)成城市骨架線網(wǎng)(圖7(b))。
圖6 不同類型三角形骨架線提取方法Fig.6 Skeleton line extraction methods of differenttriangles
圖7 城市骨架線網(wǎng)提取結(jié)果Fig.7 Urban skeleton-line network
2.3骨架線網(wǎng)眼構(gòu)建
在城市骨架線網(wǎng)中,將骨架線圍成的最小閉合區(qū)域稱為“骨架線網(wǎng)眼”,圖8(a)中灰色區(qū)域即為骨架線網(wǎng)眼。骨架線網(wǎng)眼的特點(diǎn)如下:①骨架線網(wǎng)眼為面狀要素,其輪廓由城市骨架線組成;②每個(gè)骨架線網(wǎng)眼中均只包含一個(gè)居民地要素(圖8(b));③骨架線網(wǎng)眼之間均為相接拓?fù)潢P(guān)系。根據(jù)骨架線網(wǎng)眼輪廓是否包含道路這一原則對(duì)骨架線網(wǎng)眼進(jìn)行分類,如圖9所示,Ⅰ類骨架線網(wǎng)眼輪廓均由空白區(qū)域骨架線組成,Ⅱ類骨架線網(wǎng)眼輪廓由空白區(qū)域骨架線和道路共同組成。
圖8 骨架線網(wǎng)眼構(gòu)建Fig.8 Skeleton-line mesh
圖9 骨架線網(wǎng)眼分類Fig.9 Classification of skeleton-line mesh
2.4道路鄰域居民地群組確定
將一條道路參與構(gòu)成的所有Ⅱ類骨架線網(wǎng)眼中包含的居民地視為其相鄰居民地,由此可確定出道路的鄰域居民地群組。圖10中,紅色居民地即為與加粗顯示道路的相鄰居民地,所有與該道路相鄰的居民地共同構(gòu)成其鄰域居民地群組。由于本文主要針對(duì)相同比例尺的道路數(shù)據(jù)進(jìn)行匹配,數(shù)據(jù)中居民地綜合程度基本相同,所以同名道路通過(guò)該方法確定的居民地群組具有較高的相似性,因此能夠以此作為道路匹配與否的判斷指標(biāo)。通過(guò)構(gòu)建城市骨架線網(wǎng)的方法確定道路鄰域居民地群組具有較強(qiáng)的穩(wěn)定性,使得多源數(shù)據(jù)中同名道路的鄰域居民地群組具有較高的一致性。
圖10 道路鄰域居民地群組Fig.10 Neighborhood habitation cluster of road
3道路鄰域居民地群組相似度計(jì)算
利用道路鄰域居民地群組相似性進(jìn)行匹配的前提是對(duì)鄰域居民地群組(面群要素)的空間關(guān)系以及幾何特征進(jìn)行描述和計(jì)算,進(jìn)而通過(guò)比較其相似性來(lái)確定其對(duì)應(yīng)的道路之間是否匹配[15]。
3.1空間關(guān)系相似度計(jì)算
3.1.1拓?fù)湎嗨贫?/p>
通常將居民地的鄰居居民地?cái)?shù)量作為其拓?fù)淇倲?shù),由于大比例尺城市地圖中居民地之間一般為相離關(guān)系,所以直接確定居民地的鄰居居民地?cái)?shù)量較為困難。考慮到骨架線網(wǎng)眼之間均為相接拓?fù)潢P(guān)系,并且每個(gè)骨架線網(wǎng)眼中均唯一包含一個(gè)居民地,所以可通過(guò)計(jì)算骨架線網(wǎng)眼的鄰居網(wǎng)眼數(shù)量代替居民地的鄰居居民地?cái)?shù)量,從而獲得居民地的拓?fù)淇倲?shù)。骨架線網(wǎng)眼相接關(guān)系分為公共節(jié)點(diǎn)相接和公共邊相接兩種情況,本文只將具有公共邊的兩骨架線網(wǎng)眼互相視為鄰居骨架線網(wǎng)眼。一個(gè)總數(shù)為n的居民地群組A和一個(gè)總數(shù)為m的居民地群組B,二者的拓?fù)湎嗨贫扔?jì)算如下[16]
(1)
3.1.2方向相似度
3.1.2.1居民地群組整體方向計(jì)算
道路鄰域居民地群組一般沿道路分布,所以其整體呈現(xiàn)出一定的方向性,并且這種方向大多與道路延伸方向較為接近。在計(jì)算居民地群組整體方向時(shí),利用居民地的幾何中心代替居民地,即將面群轉(zhuǎn)化為點(diǎn)群計(jì)算[17]。采用文獻(xiàn)[18]中的標(biāo)準(zhǔn)差橢圓法計(jì)算點(diǎn)群的整體方向,標(biāo)準(zhǔn)差橢圓是用來(lái)描述群組目標(biāo)分布方向偏離的。對(duì)整體方向角為θ1、θ2的兩個(gè)居民地群組,其方向相似度計(jì)算公式為
(2)
3.1.2.2居民地群組中單個(gè)居民地方向計(jì)算
居民地群組整體方向描述的是面群目標(biāo)方向的“集中趨勢(shì)”,但不能有效顧及居民地群組內(nèi)單個(gè)面要素目標(biāo)之間的方向一致性,很可能出現(xiàn)居民地群組整體方向雖然一致,但是其可能并不相似的情況, 所以需要對(duì)居民地群組內(nèi)單個(gè)居民地的方向進(jìn)行計(jì)算。面要素按照其輪廓形狀劃分,可分為比較規(guī)則的面要素(如建筑物等)和不規(guī)則的面要素(如水域、植被等)。由于居民地(建筑物)外形較為規(guī)則,所以通常利用最小面積外接矩形計(jì)算其方向(圖11)。最小面積外接矩形的最長(zhǎng)邊與水平方向的夾角即為單個(gè)居民地的方向,該方向與人們的直觀認(rèn)知較為一致[19]。
圖11 最小面積外接矩形計(jì)算居民地方向Fig.11 Habitation direction calculation by minimum area bounding rectangle
將居民地群組中每個(gè)居民地的方向利用雷達(dá)圖進(jìn)行表示來(lái)計(jì)算居民地群組中單個(gè)居民地方向的整體趨勢(shì)相似度,因?yàn)槔走_(dá)圖不僅包含了居民地群組中所有單個(gè)居民地的方向信息,而且能夠?qū)ζ淙w方向特點(diǎn)進(jìn)行統(tǒng)計(jì)顯示。如圖12所示,居民地群組1和居民地群組2中單個(gè)居民地的方向較為近似,所以其對(duì)應(yīng)的雷達(dá)圖的圖形相似度較高,而與居民地群組3相比,單個(gè)居民地方向整體趨勢(shì)差異較大,所以其對(duì)應(yīng)的雷達(dá)圖的圖形相似度較低。所以通過(guò)雷達(dá)圖能夠較好反映居民地群組中單個(gè)居民地方向的全體統(tǒng)計(jì)規(guī)律,具體的相似度計(jì)算公式為
(3)
式中,Area1、Area2分別為兩居民地群組雷達(dá)圖的面積;OverlapArea為兩群組雷達(dá)圖疊加圖中重疊區(qū)域的面積。
圖12 居民地群組雷達(dá)圖Fig.12 Radar chart of habitation cluster
3.1.3距離相似度
空間距離能夠反映面群要素之間的親疏程度,空間距離越大,則分布越稀疏,空間距離越小則分布越密集。面狀要素之間的距離可分為中心距離、極小距離和極大距離,本文選取中心距離作為空間距離的度量指標(biāo)。中心距離為兩個(gè)面要素幾何中心之間的距離,所以對(duì)兩個(gè)居民地群組,設(shè)dis1、dis2為兩個(gè)居民地群組中居民地之間的平均空間距離,故其距離相似度計(jì)算公式為
(4)
3.1.4空間關(guān)系總相似度
上面分別定義了道路鄰域居民地群組空間關(guān)系的拓?fù)?、方向和距離相似度,根據(jù)Egenhofer和Mark提出的“拓?fù)潢P(guān)系起主導(dǎo)作用,其他可度量關(guān)系起提煉作用”的原則[20],突出拓?fù)潢P(guān)系在空間關(guān)系中的關(guān)鍵作用,在對(duì)居民地群組之間空間關(guān)系相似度進(jìn)行整體度量時(shí),對(duì)上述3種空間關(guān)系相似度分別賦予不同的權(quán)值。采用文獻(xiàn)[15]中對(duì)拓?fù)?、方向以及距離關(guān)系的權(quán)值設(shè)置,分別賦予上述3種相似度0.4、0.3、0.3的權(quán)值。所以,道路鄰域居民地群組空間關(guān)系總相似度的計(jì)算公式為
SIM_sr=0.4·sim_topo+0.3·(0.5·sim_dire1+
0.5·sim_dire2)+0.3·sim_dist
(5)
需要特別指出:對(duì)于存在旋轉(zhuǎn)偏差的數(shù)據(jù)匹配問(wèn)題,居民地群組間的方向相似度受到旋轉(zhuǎn)影響差異較大,所以在計(jì)算空間關(guān)系總相似度時(shí)應(yīng)不考慮方向相似度,只計(jì)算群組間的拓?fù)湎嗨贫群途嚯x相似度,仍根據(jù)上述原則設(shè)置權(quán)重值,具體計(jì)算公式為
SIM_sr=0.6·sim_topo+0.4·sim_dist
(6)
3.2幾何特征相似度計(jì)算
空間群組的幾何特征通常包括群組的個(gè)體數(shù)量、分布范圍、分布密度、分布中心、分布軸線等。由于個(gè)體數(shù)量比較簡(jiǎn)單,對(duì)其單獨(dú)進(jìn)行討論意義不大,且在空間關(guān)系中拓?fù)湎嗨贫鹊挠?jì)算過(guò)程中已經(jīng)隱含了對(duì)個(gè)體數(shù)量的描述,故不再考慮居民地的數(shù)量;同理,分布中心和分布軸線與計(jì)算方向時(shí)的方法比較類似,所以也不再進(jìn)行計(jì)算。由于道路鄰域居民地群組中居民地?cái)?shù)量一般不會(huì)過(guò)多,故討論其分布密度意義不大。所以主要討論居民地群組的分布范圍。
鄰域居民地群組的分布范圍是個(gè)不確定問(wèn)題,選取合適的包容所有居民地的多邊形作為分布范圍,必須符合人的直觀認(rèn)知。傳統(tǒng)方法中用凸殼來(lái)表達(dá)面群的分布范圍是不太準(zhǔn)確的,因?yàn)榭赡軐⒋竺娣e的沒(méi)有居民地覆蓋的凹部區(qū)域也視為面群的分布范圍[21]。通過(guò)對(duì)三角網(wǎng)進(jìn)行“剝皮”操作得到的居民地群組分布范圍較為符合人類的視覺習(xí)慣(圖13)。將3個(gè)頂點(diǎn)均在鄰域居民地群組輪廓上和道路上的三角形視為鄰域居民地范圍內(nèi)的三角形,所以道路鄰域居民地群組分布范圍的面積可表示為
Sarea=Shabitation+Striangle
(7)
圖13 鄰域居民地群組范圍確定Fig.13 Neighborhood habitation area
式中,Sarea代表鄰域居民地群組分布范圍的總面積;Shabitaion代表鄰域居民地群組中居民地的總面積;Striangle代表鄰域范圍內(nèi)三角形的總面積。對(duì)于兩個(gè)鄰域范圍面積分別為Sarea1和Sarea2的居民地群組,其分布范圍面積相似度計(jì)算公式為
(8)
只對(duì)分布范圍的面積進(jìn)行相似度計(jì)算還不足以描述其相似度,因?yàn)榭赡艹霈F(xiàn)形狀差異很大的群組分布范圍具有相同或相近的面積,所以需對(duì)分布范圍進(jìn)行形狀相似度計(jì)算。由于居民地群組分布范圍多邊形的形狀不規(guī)則并且具有較多的節(jié)點(diǎn),所以采用文獻(xiàn)[22]提出的多級(jí)弦長(zhǎng)法對(duì)其進(jìn)行形狀描述。設(shè)形狀描述函數(shù)為
f(li)=|PiOc|
(9)
以多邊形邊界上各點(diǎn)Pi到形心點(diǎn)Oc的距離|PiOc|作為形狀描述函數(shù)的值,以輪廓上的某節(jié)點(diǎn)為匹配起始點(diǎn)P0到輪廓上任一點(diǎn)Pi的弧長(zhǎng)li作為形狀描述的參數(shù),所以兩個(gè)居民地群組分布范圍的形狀相似度計(jì)算公式為
(10)
由于沒(méi)有明顯的側(cè)重,鄰域居民地群組幾何特征的總相似度為分布范圍面積相似度和形狀相似度的平均值[15],計(jì)算公式如下
SIM_geo=0.5·sim_area+0.5·sim_shape
(11)
3.3總體相似度計(jì)算
空間目標(biāo)相似性研究中,文獻(xiàn)[23]提到一個(gè)重要原則,即空間目標(biāo)之間的拓?fù)?、方向和距離關(guān)系是最為關(guān)鍵的。所以在計(jì)算兩個(gè)居民地群組總體相似度時(shí),主要突出群組的空間關(guān)系相似度,賦予鄰域居民地群組的空間關(guān)系相似度較大的權(quán)重。本文同樣參考文獻(xiàn)[15]中的經(jīng)驗(yàn)值,將空間關(guān)系相似度權(quán)重設(shè)為0.6,則幾何特征相似度權(quán)重為0.4。所以居民地群組總體相似度計(jì)算公式可表達(dá)為
SIM=0.6·SIM_sr+0.4·SIM_geo
(12)
式中,SIM為居民地群組總體相似度;SIM_sr為居民地群組空間關(guān)系相似度;SIM_geo為居民地群組幾何特征相似度。
4道路網(wǎng)匹配實(shí)例及對(duì)比分析
4.1數(shù)據(jù)來(lái)源說(shuō)明
圖14(a)為北京中關(guān)村部分區(qū)域影像,選取該區(qū)域相同比例尺不同來(lái)源的矢量數(shù)據(jù)進(jìn)行匹配試驗(yàn)。如圖14(b)、(c)、(d)所示,數(shù)據(jù)中均包含居民地和道路要素,數(shù)據(jù)來(lái)源為大比例尺城市地圖數(shù)據(jù),道路網(wǎng)在交叉口處表現(xiàn)為斷開的路段。
4.2數(shù)據(jù)系統(tǒng)誤差改正
從數(shù)據(jù)源1和數(shù)據(jù)源2、3的疊加效果(圖15(a)、(b))可得數(shù)據(jù)源間分別具有較大的位置偏差和旋轉(zhuǎn)偏差,所以需對(duì)數(shù)據(jù)源進(jìn)行系統(tǒng)誤差改正。由于不同來(lái)源的數(shù)據(jù)具有較強(qiáng)的不確定性,在經(jīng)過(guò)系統(tǒng)誤差改正后發(fā)現(xiàn):數(shù)據(jù)源1和數(shù)據(jù)源2之間的位置偏差中的橫坐標(biāo)偏差得到了較好的修正,但縱坐標(biāo)偏差修正效果不理想,仍存在一定的偏差(圖15(c));數(shù)據(jù)源1和數(shù)據(jù)源3之間的旋轉(zhuǎn)偏差雖得到了一定的削弱但仍未完全消除,仍存在一定的旋轉(zhuǎn)偏差(圖15(d))。所以在系統(tǒng)誤差改正后,仍可能需要面對(duì)數(shù)據(jù)偏差對(duì)匹配過(guò)程造成的困難與影響。
4.3不同匹配算法對(duì)比試驗(yàn)
4.3.1未顧及鄰域相似性的緩沖區(qū)增長(zhǎng)算法
選取道路網(wǎng)匹配方法中較為成熟的緩沖區(qū)增長(zhǎng)算法進(jìn)行對(duì)比匹配試驗(yàn),在該方法匹配過(guò)程中單純依靠道路落入緩沖區(qū)內(nèi)的長(zhǎng)度與總長(zhǎng)度的比值這一條件進(jìn)行判斷,而未顧及道路鄰域居民地群組的相似性。圖16(a)、(b)分別為緩沖區(qū)增長(zhǎng)算法對(duì)存在位置偏差與旋轉(zhuǎn)偏差數(shù)據(jù)的匹配結(jié)果顯示。
圖14 試驗(yàn)數(shù)據(jù)來(lái)源Fig.14 Test data of matching
圖15 數(shù)據(jù)系統(tǒng)誤差改正Fig.15 Systematic error compensation
圖16 緩沖區(qū)增長(zhǎng)算法匹配結(jié)果Fig.16 Matching results of the buffer growth method
4.3.2本文顧及鄰域居民地相似性的匹配算法
分別對(duì)上述系統(tǒng)誤差改正處理后仍存在位置和旋轉(zhuǎn)偏差的兩組道路網(wǎng)數(shù)據(jù)利用本文提出的顧及道路鄰域居民地群組相似性的方法進(jìn)行匹配試驗(yàn)。具體的匹配流程為:①對(duì)待匹配道路建立緩沖區(qū),在匹配數(shù)據(jù)源中確定候選匹配對(duì)象,由于匹配數(shù)據(jù)之間位置偏差較大,所以緩沖區(qū)半徑應(yīng)設(shè)置較大,確保候選匹配集中包含匹配對(duì)象;②對(duì)匹配雙方構(gòu)建城市骨架線網(wǎng),并確定每條道路的鄰域居民地群組;③在候選匹配集中進(jìn)行遍歷,計(jì)算其中每條道路與待匹配道路的鄰域居民地群組相似度,將相似程度最高的道路作為匹配對(duì)象。按照上述流程進(jìn)行匹配試驗(yàn),圖17(a)為存在位置偏差的道路數(shù)據(jù)的匹配結(jié)果顯示,圖17(b)為存在旋轉(zhuǎn)偏差的道路數(shù)據(jù)的匹配結(jié)果顯示,圖中短線為匹配關(guān)系標(biāo)識(shí)線。
圖17 本文方法匹配結(jié)果Fig.17 Matching results of the proposed method
4.4試驗(yàn)結(jié)果對(duì)比分析
對(duì)本文匹配算法和緩沖區(qū)增長(zhǎng)算法進(jìn)行匹配質(zhì)量評(píng)價(jià)(表1),得出本文算法的匹配正確率較高,表明本方法能夠較好解決系統(tǒng)誤差改正后仍存在位置或旋轉(zhuǎn)偏差的道路網(wǎng)數(shù)據(jù)的匹配問(wèn)題。
表1不同匹配情況下兩種方法匹配正確率比較
Tab.1Matching correctness comparison of the two methods in the different matching condition
匹配情況1匹配方法匹配正確率/(%)匹配情況2匹配方法匹配正確率/(%)位置偏差本文算法84.7緩沖區(qū)增長(zhǎng)算法50.0旋轉(zhuǎn)偏差本文算法84.0緩沖區(qū)增長(zhǎng)算法70.4
對(duì)兩種匹配算法作如下分析:由于系統(tǒng)誤差改正后仍未完全消除位置或旋轉(zhuǎn)偏差,利用位置鄰近原則的匹配方法會(huì)受到影響,造成緩沖區(qū)增長(zhǎng)算法的匹配正確率相對(duì)較低。但是數(shù)據(jù)間的位置和旋轉(zhuǎn)偏差不會(huì)影響道路鄰域居民地群組的分布狀況,即不會(huì)改變道路與居民地以及居民地群組之間的空間關(guān)系和幾何特征,因而能夠通過(guò)對(duì)道路鄰域居民地群組的相似性度量進(jìn)行匹配,這有效彌補(bǔ)了位置和旋轉(zhuǎn)偏差對(duì)匹配的影響。本方法顧及了道路鄰域環(huán)境(居民地群組)的相似性,能夠得到相對(duì)較好的匹配結(jié)果。針對(duì)系統(tǒng)誤差糾正后位置精度較高的數(shù)據(jù),試驗(yàn)結(jié)果表明本方法也能得到較為滿意的匹配結(jié)果,所以本方法具有一定的通用性。
對(duì)于本方法匹配結(jié)果中的錯(cuò)誤匹配情況,其原因是多源數(shù)據(jù)具有不確定性,本方法在確定道路的鄰域居民地群組時(shí),只能期望最大程度的保證其一致性;居民地?cái)?shù)據(jù)的不確定性導(dǎo)致即便同名道路的鄰域居民地群組,其空間特征和幾何特征相似度也可能不高,而非同名道路間的鄰域居民地群組也可能具有較高的相似度,這也可能造成錯(cuò)誤匹配??傮w而言,上述兩種情況出現(xiàn)概率不高,所以本方法能夠確保大部分道路匹配結(jié)果的正確性。
5結(jié)論
本文提出一種顧及鄰域居民地群組相似性的道路網(wǎng)匹配方法,相比只單獨(dú)利用道路自身特征進(jìn)行匹配的方法,本方法的特點(diǎn)在于:顧及了道路周邊居民地群組的相似性,將居民地群組的空間關(guān)系和幾何特征作為道路匹配的重要衡量指標(biāo),使得匹配過(guò)程不再對(duì)位置條件過(guò)于依賴,能夠有效解決存在位置或旋轉(zhuǎn)偏差的道路數(shù)據(jù)間的匹配問(wèn)題。本方法在居民地群組相似度計(jì)算過(guò)程中采用的是一般經(jīng)驗(yàn)權(quán)重值,所以在后續(xù)工作中需對(duì)居民地群組相似性的指標(biāo)權(quán)重進(jìn)行更多討論,以使其相似性的計(jì)算結(jié)果更為準(zhǔn)確可靠,以進(jìn)一步確保匹配質(zhì)量。
參考文獻(xiàn):
[1]郝燕玲, 唐文靜, 趙玉新, 等. 基于空間相似性的面實(shí)體匹配算法研究[J]. 測(cè)繪學(xué)報(bào), 2008, 37(4): 501-506.
HAO Yanling, TANG Wenjing, ZHAO Yuxin, et al. Areal Feature Matching Algorithm Based on Spatial Similarity[J]. Acta Geodaetica et Cartographica Sinica, 2008, 37(4): 501-506.
[2]QUDDUS M A, OCHIENG W Y, NOLAND R B. Map Matching Algorithms for Intelligent Transport Systems Application[C]∥Proceedings of the 13th World Congress on Intelligent Transport Systems and Services. London: TRID, 2006.
[3]WALTER V, FRITSH D. Matching Spatial Data sets: A Statical Approach[J]. International Journal of Geographical Information Science, 1999, 13(5): 445-473.
[4]ZHANG Meng, MENG Liqiu. An Iterative Road-Matching Approach for the Integration of Postal Data[J]. Computers, Environment and Urban Systems, 2007, 31(5): 597-615.
[5]童小華, 鄧愫愫, 史文中. 基于概率的地圖實(shí)體匹配方法[J]. 測(cè)繪學(xué)報(bào), 2007, 36(2): 210-217.
TONG Xiaohua, DENG Susu, SHI Wenzhong. A Probabilistic Theory-based Matching Method[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(2): 210-217.
[6]胡云崗, 陳軍, 趙仁亮, 等. 地圖數(shù)據(jù)縮編更新中道路數(shù)據(jù)匹配方法[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2010, 35(4): 451-456.
HU Yungang, CHEN Jun, ZHAO Renliang, et al. Matching of Roads under Different Scales for Updating Map Data[J]. Geomatics and Information Science of Wuhan University, 2010, 35(4): 451-456.
[7]趙東保, 盛業(yè)華. 全局尋優(yōu)的矢量道路網(wǎng)自動(dòng)匹配方法研究[J]. 測(cè)繪學(xué)報(bào), 2010, 39(4): 416-421.
ZHAO Dongbao, SHENG Yehua. Research on Automatic Matching of Vector Road Networks Based on Global Optimization[J]. Acta Geodaetica et Cartographica Sinica, 2010, 39(4): 416-421.
[8]欒學(xué)晨, 楊必勝, 李秋萍. 基于結(jié)構(gòu)模式的道路網(wǎng)節(jié)點(diǎn)匹配方法[J]. 測(cè)繪學(xué)報(bào), 2013, 42(4): 608-614.
LUAN Xuechen, YANG Bisheng, LI Qiuping. Pattern-basede Node Matching Approach for Road Network[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(4): 608-614.
[9]張?jiān)品? 楊必勝, 欒學(xué)晨. 利用概率松弛法的城市路網(wǎng)自動(dòng)匹配[J]. 測(cè)繪學(xué)報(bào), 2012, 41(6): 933-939.
ZHANG Yunfei, YANG Bisheng, LUAN Xuechen. Automated Matching Urban Road Networks Using Probabilistic Relaxation[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(6): 933-939.
[10]陳玉敏, 龔健雅, 史文中. 多尺度道路網(wǎng)的距離匹配算法研究[J]. 測(cè)繪學(xué)報(bào), 2007, 36(1): 84-90.
CHEN Yumin, GONG Jianya, SHI Wenzhong. A Distance-based Matching Algorithm for Multi-scale Road Networks[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(1): 84-90.
[11]劉志勇. 城市地圖數(shù)據(jù)庫(kù)合并中的面實(shí)體匹配方法研究[D]. 南京: 河海大學(xué), 2006.
LIU Zhiyong. Research on Areal Feature Matching Algorithm in the Conflation of Urban Geographic Databases[D]. Nanjing: Hohai University, 2006.
[12]焦洋洋, 王卉, 翟仁健. 顧及鄰域相似性的面要素匹配方法[J]. 遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 32(7): 947-952.
JIAO Yangyang, WANG Hui, ZHAI Renjian. Matching Method for Areal Feature Considering Context-dependent Similarity[J]. Journal of Liaoning Technical University: Natural Science, 2013, 32(7): 947-952.
[13]吳建華. 顧及環(huán)境相似的多特征組合實(shí)體匹配方法[J]. 地理與地理信息科學(xué), 2010, 26(4): 1-6.
WU Jianhua. Entity Matching Methods Based on Combining Multi-Similarity-Characteristics Considering Environment Similarity[J]. Geography and Geo-Information Science, 2010, 26(4): 1-6.
[14]錢海忠, 武芳, 朱鯤鵬, 等. 一種基于降維技術(shù)的街區(qū)綜合方法[J]. 測(cè)繪學(xué)報(bào), 2007, 36(1): 102-107.
QIAN Haizhong, WU Fang, ZHU Kunpeng, et al. A Generalization Method of Street Block Based on Dimension-reducing Technique[J]. Acta Geodaetica et Cartographica Sinica, 2007, 36(1): 102-107.
[15]劉濤. 空間群(組)目標(biāo)相似關(guān)系及計(jì)算模型研究[D]. 武漢: 武漢大學(xué), 2011.
LIU Tao. Similarity of Spatial Group Objects[D]. Wuhan: Wuhan University, 2011.
[16]劉濤, 閆浩文. 空間面群目標(biāo)幾何相似度計(jì)算模型[J]. 地球信息科學(xué)學(xué)報(bào), 2013, 15(5): 635-642.
LIU Tao, YAN Haowen. Geometry Similarity Assessment Model of Spatial Polygon Groups[J]. Journal of Geo-Information Science, 2013, 15(5): 635-642.
[17]江浩, 褚衍東, 閆浩文, 等. 多尺度地理空間點(diǎn)群目標(biāo)相似關(guān)系的計(jì)算研究[J]. 地理與地理信息科學(xué), 2009, 25(6): 1-4.
JIANG Hao, CHU Yandong, YAN Haowen, et al. Study on Computation of Similarity Relationships of Multi-scale Point Objects[J]. Geography and Geo-Information Science, 2009, 25(6): 1-4.
[18]劉濤, 杜清運(yùn), 閆浩文. 空間點(diǎn)群目標(biāo)相似度計(jì)算[J]. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版), 2011, 36(10): 1149-1153.
LIU Tao, DU Qingyun, YAN Haowen. Spatial Similarity Assessment of Point Clusters[J]. Geomatics and Information Science of Wuhan University, 2011, 36(10): 1149-1153.
[19]劉濤, 楊樹文, 李軼鯤, 等. 空間線群目標(biāo)方向相似度計(jì)算模型[J]. 測(cè)繪科學(xué), 2013, 38(1): 156-159.
LIU Tao, YANG Shuwen, LI Yikun, et al. Direction Similarity Calculation Model of Spatial Line Groups[J]. Science of Surveying and Mapping, 2013, 38(1): 156-159.
[20]EGENHOFER M J, MARK D M. Naive Geography[C]∥FRANK A, KUHN W. Spatial Information Theory: A Theoretical Basis for GIS, International Conference COSIT’ 95. Semmering, Austria: Springer-Verlag, 1995, 988: 1-15.
[21]艾廷華, 劉耀林. 保持空間分布特征的點(diǎn)群化簡(jiǎn)方法[J]. 測(cè)繪學(xué)報(bào), 2002, 31(2): 175-181.
AI Tinghua, LIU Yaolin. A Method of Point Cluster Simplification with Spatial Distribution Properties Preserved[J]. Acta Geodaetica et Cartographica Sinica, 2002, 31(2): 175-181.
[22]安曉亞, 孫群, 肖強(qiáng), 等. 一種形狀多級(jí)描述方法及在多尺度空間數(shù)據(jù)幾何相似性度量中的應(yīng)用[J]. 測(cè)繪學(xué)報(bào), 2011, 40(4): 495-501.
AN Xiaoya, SUN Qun, XIAO Qiang, et al. A Shape Multilevel Description Method and Application in Measuring Geometry Similarity of Multi-scale Spatial Data[J]. Acta Geodaetica et Cartographica Sinica, 2011, 40(4): 495-501.
[23]BRUNS H T, EGENHOFER M J. Similarity of Spatial Scenes[C]∥KRAAK J M, MOLENAAR M. Proceedings of the 7th International Symposium on Spatial Data Handling. Delft: Taylor & Francis, 1996: 173-184.
(責(zé)任編輯:宋啟凡)
修回日期: 2015-06-17
First author: WANG Xiao (1990—), male, postgraduate, majors in spatial data matching, spatial data updating and map automatic generalization.
E-mail: xiaowang0209@outlook.com
Corresponding author: QIAN Haizhong
E-mail: haizhongqian@163.com
Matching Method for Road Networks Considering the Similarity of the
Neighborhood Habitation Cluster
WANG Xiao,QIAN Haizhong,HE Haiwei,CHEN Jingnan,HU Huiming
Institute of Geospatial Information, Information Engineering University, Zhengzhou 450052, China
Abstract:The existing matching methods for the multi-source road data of the same scale mainly consider the characteristics of the road itself, while the effect of the neighborhood features on matching process is generally ignored, which may restrict the further improvement of the matching results. This restriction can be more obvious for the matching data in which the location or rotation differences still exist after the system error rectification. A road network matching method that takes the similarity of the roads’ neighborhood habitation cluster into consideration is proposed, which draws on the experience of the human spatial cognitive characteristics for the unfamiliar environment. Firstly, the neighborhood habitation cluster of the road is extracted by the urban skeleton line network; Then by calculating the spatial relation similarity and geometry characteristic similarity of the neighborhood habitation cluster, the matching results can be obtained. The advantage of this method is that for the road data which have obvious location or rotation differences, the similarity of their neighborhood habitation clusters can be treated as a proper matching index. Actually, roads’ neighborhood habitation cluster can be a constraint of the road matching process and enhance its robustness. The tests and comparison analysis indicate that this method can solve the matching problems of the road data which still have obvious location or rotation differences after system error rectification and improve the matching correctness.
Key words:multi-source road networks matching; urban skeleton-line network; neighborhood environment;habitation cluster; area cluster similarity calculation
通信作者:錢海忠
作者簡(jiǎn)介:第一 王驍(1990—),男,碩士生,研究方向?yàn)榭臻g數(shù)據(jù)匹配與更新,地圖自動(dòng)綜合。
收稿日期:2014-11-12
基金項(xiàng)目:國(guó)家自然科學(xué)基金(41171305;41171354;40701157);信息工程大學(xué)地理空間信息學(xué)院碩士學(xué)位論文創(chuàng)新與創(chuàng)優(yōu)基金(S201403)
中圖分類號(hào):P208
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001-1595(2016)01-0103-09
引文格式:王驍,錢海忠,何海威,等.顧及鄰域居民地群組相似性的道路網(wǎng)匹配方法[J].測(cè)繪學(xué)報(bào),2016,45(1):103-111.DOI:10.11947/j.AGCS.2016.20140588.
WANG Xiao,QIAN Haizhong,HE Haiwei,et al.Matching Method for Road Networks Considering the Similarity of the Neighborhood Habitation Cluster[J]. Acta Geodaetica et Cartographica Sinica,2016,45(1):103-111.DOI:10.11947/j.AGCS.2016.20140588.