田 原,蔡 華,鄔 倫,許 珺
基于局部相似的地籍宗地圖斑匹配方法
田 原1,蔡 華1,鄔 倫1,許 珺2*
(1.北京大學(xué)遙感與地理信息系統(tǒng)研究所,北京 100871;2.中國(guó)科學(xué)院地理科學(xué)與資源研究所,北京 100101)
地籍管理工作中,不同來源的宗地?cái)?shù)據(jù)通常存在著諸多差異,識(shí)別和匹配不同數(shù)據(jù)源中的同名宗地圖斑是提高數(shù)據(jù)更新精度與速度的關(guān)鍵,對(duì)地籍?dāng)?shù)據(jù)庫(kù)的集成與信息共享有著非常重要的意義。該文針對(duì)地籍?dāng)?shù)據(jù)中宗地圖斑的形狀及變化特點(diǎn),提出了一種基于局部相似的簡(jiǎn)單而有效的匹配方法來提高匹配率,基本原理是通過搜索兩個(gè)面實(shí)體間最優(yōu)的點(diǎn)對(duì)應(yīng)或特征對(duì)應(yīng)關(guān)系判斷兩個(gè)面實(shí)體是否匹配,采用形狀相似度作為局部相似的判斷指標(biāo)。
地籍管理;宗地圖斑;圖斑匹配;局部相似;GIS
隨著社會(huì)發(fā)展,土地類型的劃分更細(xì)致,建筑物種類越來越多,并且用途不斷發(fā)生變化,房地產(chǎn)繼承、轉(zhuǎn)讓、抵押等經(jīng)濟(jì)活動(dòng)愈加頻繁,這些都對(duì)地籍管理工作提出了更高的要求。地籍管理信息系統(tǒng)作為地籍管理的重要技術(shù)手段,必須及時(shí)對(duì)以上變化做出反應(yīng),對(duì)地籍信息進(jìn)行更新[1]。現(xiàn)階段,地圖數(shù)據(jù)庫(kù)的集成和合并已成為空間數(shù)據(jù)庫(kù)更新的主要手段[1-3]。實(shí)踐表明,地圖數(shù)據(jù)庫(kù)的集成和信息共享無(wú)法簡(jiǎn)單地通過數(shù)據(jù)格式轉(zhuǎn)換或坐標(biāo)全局變換等方式來實(shí)現(xiàn),必須要應(yīng)用地圖數(shù)據(jù)庫(kù)實(shí)體匹配與合并等技術(shù)才能解決[4]。其中地圖實(shí)體匹配是地圖數(shù)據(jù)庫(kù)合并過程的第一步,如果沒有良好的匹配效果作為基礎(chǔ),就會(huì)影響整個(gè)地圖合并與更新的結(jié)果[2]。
在多數(shù)地圖中,面狀要素往往占有較大比重,它常常是地圖表達(dá)的主要內(nèi)容,也是地圖使用者比較關(guān)注的內(nèi)容[2]。地籍管理中的地圖匹配過程通常是對(duì)面實(shí)體進(jìn)行匹配,按照判別依據(jù),既有的面實(shí)體匹配技術(shù)主要分為3類:1)語(yǔ)義匹配,即通過比較候選匹配目標(biāo)的語(yǔ)義信息作為匹配依據(jù),主要依賴于屬性數(shù)據(jù),在特定的情況下該方法是有效的,一般用于其它方法的前期數(shù)據(jù)篩選和處理[5]。2)拓?fù)淦ヅ?,屬于弱條件匹配[6],將候選同名實(shí)體的拓?fù)潢P(guān)系度量作為匹配的依據(jù)[5],如張橋平等提出的基于模糊拓?fù)潢P(guān)系分類的面狀目標(biāo)匹配方法[3];Masuyama提出的基于圖斑代表點(diǎn)包含性和重疊面積比值的匹配方法[7];章莉萍等根據(jù)制圖綜合理論提出的增量式凸殼匹配方法[8]等。3)幾何匹配,屬于強(qiáng)條件匹配[6],通過計(jì)算參照目標(biāo)與源目標(biāo)之間幾何相似度進(jìn)行目標(biāo)匹配[5],如王斌等提出的基于目標(biāo)輪廓線的形狀描述匹配方法[9];郝燕玲等提出的基于空間相似性的面狀實(shí)體匹配算法[10]等。此外,還有一些混合匹配方法,即綜合運(yùn)用幾何特征、拓?fù)潢P(guān)系和語(yǔ)義信息的匹配方法,如童小華等提出的基于概率理論的匹配模型[2]等。
以上匹配方法都將面實(shí)體當(dāng)做一個(gè)整體,通過語(yǔ)義信息、拓?fù)潢P(guān)系或幾何形狀相似性進(jìn)行匹配,導(dǎo)致其在地籍宗地圖斑匹配中的適用性不強(qiáng)。地籍管理工作中,宗地分割、合并及邊界調(diào)整等變更常常使得不同數(shù)據(jù)源中的同名圖斑不再是兩個(gè)大小與形狀相似的面實(shí)體,待匹配的圖斑可能與其同名圖斑僅部分重疊或者是同名圖斑的一部分;同時(shí),地籍圖中所有宗地是不相交、無(wú)縫隙的[1],相鄰宗地常共邊,這就進(jìn)一步使得大部分待匹配圖斑不僅與同名圖斑重疊,也常常與同名圖斑的相鄰圖斑重疊。在這種情況下,僅應(yīng)用圖斑實(shí)體之間全局相似性指標(biāo)很難準(zhǔn)確、快速地判斷其匹配關(guān)系。要提高宗地圖斑匹配的精度與效率,必須充分考慮地籍圖的總體特點(diǎn)和宗地圖斑變更的具體特性,設(shè)計(jì)出更為適用的匹配方法。
相似是指事物之間能在某些方面一一對(duì)應(yīng),如部位之間的一一對(duì)應(yīng),特征之間的一一對(duì)應(yīng)或結(jié)構(gòu)、功能之間的一一對(duì)應(yīng)等[11,12]??臻g相似關(guān)系可以定義為:設(shè)有地理空間目標(biāo)A1、A2,其特征集合分別為C1、C2,且C1、C2均非空,若C1∩C2=Cn≠Φ,稱相似特征集Cn為空間目標(biāo)A1、A2的空間相似關(guān)系[13]。兩個(gè)空間目標(biāo)之間的相似關(guān)系強(qiáng)弱可用相似度衡量[13]:
其中:sim(A1,A2)是A1與A2的相似度 函數(shù),dis(A1,A2)是對(duì)A1與A2間差異的度量,dis(A1,A2)=1和dis(A1,A2)=0是差異性度量的極值,即相異和相同,U是標(biāo)準(zhǔn)化因子,其值一般取數(shù)據(jù)集中的兩要素相應(yīng)特征間的最大距離[10]。常見的圖斑匹配方法通過比較參照目標(biāo)與源目標(biāo)之間幾何特征要素的相似度來判斷圖斑匹配關(guān)系,常用的幾何相似性度量指標(biāo)包括距離、形狀、角度和方向等[9,10]。
如前所述,在宗地圖斑匹配中,僅僅考慮待匹配圖斑間的整體相似性是不全面的。為此,筆者設(shè)計(jì)了基于局部相似性的宗地圖斑匹配算法,其基本思路為:根據(jù)待匹配圖斑與候選圖斑的位置關(guān)系確定其局部相似部位,并基于圖斑的局部邊界重構(gòu)圖斑;之后計(jì)算新圖斑之間的形狀相似度,從而確定匹配圖斑。此算法的基本原理是通過搜索兩個(gè)面實(shí)體間最優(yōu)的點(diǎn)對(duì)應(yīng)或特征對(duì)應(yīng)關(guān)系來判斷兩個(gè)面實(shí)體是否匹配??紤]到宗地圖斑變更一般不會(huì)破壞其既有邊界,形狀特征往往最能反映其相似關(guān)系,算法中采用形狀相似度作為局部相似的判斷指標(biāo)。
宗地圖斑局部相似部分的確定是算法的首要步驟。以圖1為例,圖斑a1和a2是待匹配圖斑b(陰影部分)的候選匹配圖斑。在此要確定b和哪個(gè)圖斑匹配,實(shí)際只要確定它的哪部分邊界和目標(biāo)圖斑的哪部分邊界相似即可,這樣問題就由多邊形匹配轉(zhuǎn)換成了線匹配。線目標(biāo)的匹配方法主要有Freeman編碼、函數(shù)描述法[3]、線形狀因子相似算法[14]及基于方向變化角的線實(shí)體形狀相似度計(jì)算方法等[15]。由于上述線匹配方法均比較復(fù)雜,本文提出一種根據(jù)局部邊界重構(gòu)匹配圖斑的方法,得到新的待匹配圖斑和候選圖斑,之后仍然使用面實(shí)體匹配方法尋找匹配關(guān)系。
圖1 圖斑局部匹配示例Fig.1 An example of partial parcel matching
仍以圖1為例,在b與a1局部形狀匹配過程中,其落在a1內(nèi)部的邊界特征無(wú)實(shí)際意義。為突出b與a1的局部特征,簡(jiǎn)化內(nèi)部輪廓的形狀,可以采用b的最小外切矩形c(Rotated Minimum Bounding Rectangle,RMBR)的部分邊界代替b的部分邊界,生成新圖斑b′。如圖2所示,Bi(i=1,…,12)為圖斑b的邊界結(jié)點(diǎn)即界址點(diǎn),Cj(j=1,…,4)為b的最小外切矩形c的頂點(diǎn),由于局部匹配主要判斷b和a1左側(cè)邊界的相似性,所以僅保留b的左側(cè)邊界,右側(cè)則簡(jiǎn)化為最小外切矩形的邊界。多邊形b′是由結(jié)點(diǎn)C1、B2、B3、B4、B5、B6、B7、C4、C1組成的多邊形,即圖2中右斜紋區(qū)域。此時(shí),只需以c在圖斑a1中切割出候選圖斑集合,并判斷b′與候選圖斑集合中圖斑的相似性,從中選出相似性最大的候選圖斑即可。
圖2 圖斑b與b′Fig.2 Parcel b and b′
上述候選圖斑集合用{a1i|i=1,…,n}表示,其獲取方法如下:為保證與圖斑b′進(jìn)行匹配的候選圖斑a1i的最小外切矩形與c大小相近,以b的最小外切矩形c沿著圖斑a1和a2的共同邊A1A2移動(dòng)并與圖斑a1依次相切(圖3),從而得到候選圖斑集。以圖3為例,候選圖斑a1i是當(dāng)矩形c的左側(cè)邊與A1A2相切時(shí),c與a1的重疊區(qū)域。將c沿著A1A2移動(dòng),就可以得到a1i+1,a1i+2,…,最終得到全部候選圖斑集合。a1i與a1i+1在A1A2方向上的步長(zhǎng)為:
其中:L為A1A2的長(zhǎng)度,N為A1A2上界址點(diǎn)的個(gè)數(shù)。
圖3 候選圖斑a1i示意Fig.3 Candidate parcel a1i
圖斑b′與候選圖斑a1i的相似度表示為sim(b′,a1i),此時(shí)匹配候選集中與b′最優(yōu)匹配的圖斑a1k滿足:
同理,在b與a2局部相似匹配過程中,待匹配圖斑b″是由圖2中的結(jié)點(diǎn)C2、C3、B8、B9、B10、B11、B12、B1、C2組成的多邊形,圖斑b″的匹配候選圖斑a2i是c的右側(cè)邊與A1A2依次相切時(shí)c與a2的重疊區(qū)域。此時(shí)匹配候選集中與b″最優(yōu)匹配的圖斑a2k滿足:
計(jì)算中若圖斑b的某個(gè)候選圖斑ai的面積小于b的面積,則在b與ai匹配過程中以ai的最小外切矩形作為基準(zhǔn)外切矩形,仍應(yīng)用上述算法。
地籍圖斑的局部相似度主要通過局部形狀相似性進(jìn)行度量。判斷形狀相似的基本方法是形狀描述,即通過生成量化的描述子來描述形狀,描述子應(yīng)在盡可能區(qū)別不同目標(biāo)的基礎(chǔ)上對(duì)目標(biāo)的平移、旋轉(zhuǎn)和尺度變化不敏感,常用的基于幾何特征的形狀描述子包括面積、周長(zhǎng)、長(zhǎng)軸、短軸、主軸方向、凹凸面積、緊密度、實(shí)心度和偏心率等[16]。在此基礎(chǔ)上,形狀相似性匹配通過由多個(gè)描述子組合形成的度量準(zhǔn)則來衡量形狀間的相似性[16]。根據(jù)上述實(shí)例中對(duì)圖斑b′和a1i的分析可知,b′與a1i的長(zhǎng)軸、短軸、主軸方向和偏心率相同或相近,凹凸面積相差無(wú)幾,適宜描述其形狀相似性的因子主要為面積、周長(zhǎng)和緊密度??紤]到緊密度是由面積和周長(zhǎng)綜合計(jì)算得出,反映的信息更加全面,本文選取了緊密度作為形狀匹配指標(biāo),其計(jì)算公式為[16]:
以圖1為例,根據(jù)上述定義可以求得sim(b,a1)=0.97,sim(b,a2)=0.93。由此可以判定b應(yīng)該與a1匹配,最佳匹配如圖4所示。
圖4 圖斑b與a1、a2的匹配結(jié)果Fig.4 The match result of parcel b with parcel a1 and a2
基于局部相似的地籍宗地圖斑匹配算法步驟如下:1)利用最小外包矩形是否相交篩選出每個(gè)圖斑初步的候選匹配圖斑集,再用待匹配圖斑與其候選匹配圖斑重疊面積大小進(jìn)一步篩選出每個(gè)圖斑的候選匹配圖斑集。2)采用既有的技術(shù)方法處理能直接確定匹配關(guān)系的圖斑,例如使用語(yǔ)義匹配或整體幾何匹配方法進(jìn)行匹配;將無(wú)法使用既有方法直接確定匹配關(guān)系的圖斑作為局部相似匹配候選圖斑集。3)針對(duì)上一步生成的局部相似匹配候選圖斑集中的每個(gè)圖斑:確定該圖斑與其候選匹配圖斑的局部相似部分,并依照1.2節(jié)所述方法生成新的局部候選圖斑集;參照式(6)和式(7)計(jì)算該圖斑與其候選匹配圖斑的相似度;根據(jù)相似度大小確定該圖斑的匹配圖斑。
為了驗(yàn)證上述基于局部相似性的宗地圖斑匹配算法的可行性和效率,本文選取了北京市海淀區(qū)某區(qū)域1998年和2004年兩幅地籍圖進(jìn)行實(shí)例研究。1998-2004年北京市城市建設(shè)發(fā)展迅速,該區(qū)域的宗地信息發(fā)生了較大變化,同時(shí)兩次測(cè)量采用的方法和精度也不同,進(jìn)一步加大了宗地圖斑信息的不一致性。實(shí)驗(yàn)所用數(shù)據(jù)的格式為ArcGIS shape,相關(guān)實(shí)驗(yàn)在ArcGIS平臺(tái)上開展,相關(guān)結(jié)果見表1。
表1 北京某地區(qū)不同年代地籍圖匹配結(jié)果Table 1 The match result of two areal cadastral maps in Beijing in different years
從表1可知,使用整體幾何匹配方法時(shí)圖斑匹配成功率為73.1%,使用局部相似匹配方法后圖斑匹配成功率提高到89.8%,說明局部相似匹配方法明顯提高了地籍圖中同名宗地圖斑的識(shí)別和匹配能力。
地籍圖的高效更新是國(guó)土研究中的重要問題之一。使用不同數(shù)據(jù)源更新地籍圖的過程中,同名圖斑匹配能力直接影響到更新工作的精度和效率。本文針對(duì)地籍圖圖斑及地籍圖更新工作的具體特點(diǎn),提出了一種基于局部相似的地籍宗地圖斑匹配方法,實(shí)例證明該方法能明顯提高地籍圖同名圖斑的匹配成功率。對(duì)于應(yīng)用此方法仍不能準(zhǔn)確匹配的同名圖斑,還需進(jìn)行深入研究。
[1]徐志紅,邊馥苓.地籍空間實(shí)體及其時(shí)空拓?fù)潢P(guān)系[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2002,27(5):522-527.
[2]董小華,鄧愫愫,史文中.基于概率的地圖實(shí)體匹配方法[J].測(cè)繪學(xué)報(bào),2007,36(2):210-217.
[3]張橋平,李德仁,龔健雅.城市地圖數(shù)據(jù)庫(kù)面實(shí)體匹配技術(shù)[J].遙感學(xué)報(bào),2004,8(2):107-112
[4]WALTER V,F(xiàn)RITSH D.Matching spatial data sets:A statical approach[J].International Journal of Geographical Information Systems,1999,13(5):445-473.
[5]徐楓,鄧敏,趙彬彬,等.空間目標(biāo)匹配方法的應(yīng)用分析[J].地球信息科學(xué)學(xué)報(bào),2009,11(5):658-663.
[6]LYNCH M,SAALFELD A.Conflation:Automated map compilation——a video game approach[A].Proceedings of 7th International Symposium on Computer Assisted Cartography[C].Washington,USA,1985.
[7]MASUYAMA A.Methods for detecting apparent differences between spatial tessellations at different time points[J].International Journal of Geographical Information Science,2006,20(6):633-648.
[8]章莉萍,郭慶勝,孫艷.相鄰比例尺地形圖之間居民地要素匹配方法研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2008,33(6):604-607.
[9]王斌,舒華忠,施朝健,等.一種基于輪廓的形狀描述與匹配方法[J].電子與信息學(xué)報(bào),2008,30(4):949-952.
[10]郝燕玲,唐文靜,趙玉新,等.基于空間相似性的面實(shí)體匹配算法研究[J].測(cè)繪學(xué)報(bào),2008,37(4):501-506.
[11]周立美.相似學(xué)[M].北京:中國(guó)科學(xué)技術(shù)出版社,1993.
[12]梁俊雄.相似關(guān)系的基本概念及其弱等價(jià)性質(zhì)[J].系統(tǒng)工程理論與實(shí)踐,1999,28(7):106-111.
[13]閆浩文,褚衍東.多尺度地圖空間相似關(guān)系基本問題研究[J].地理與地理信息科學(xué),2009,25(4):42-44.
[14]張永華,程耀東,閆浩文,等.多尺度空間線狀實(shí)體形狀相似關(guān)系的表達(dá)與度量[J].測(cè)繪科學(xué),2008,33(6):83-85.
[15]張橋平.地圖數(shù)據(jù)庫(kù)實(shí)體匹配與合并技術(shù)研究[D].武漢大學(xué),2002.
[16]丁險(xiǎn)峰,吳洪,張宏江,等.形狀匹配綜述[J].自動(dòng)化學(xué)報(bào),2001,27(5):678-694.
A Cadastral Parcel Matching Method Based on Partial Similarity
TIAN Yuan1,CAI Hua1,WU Lun1,XU Jun2
(1.InstituteofRSandGIS,PekingUniversity,Beijing100871;2.InstituteofGeographicScienceandNaturalResourcesResearch,CAS,Beijing100101,China)
The update of cadastral maps plays an important role in cadastre management,in which many differences exist among data sources produced at different times.Automatically matching areal cadastral parcels from different data sources is the key to improve the efficiency and accuracy of cadastral map update and thus essential for cadastral database integration and information sharing.Considering that areal parcels in different cadastral maps usually have similar shapes,a new cadastral parcel matching method based on partial geometry similarity is proposed in this paper.The principle of partial geometry similarity match is to search the best matched points or features between two parcels to judge if the two parcels match.The definition of partial geometry similarity is given and the algorithm of the new method is designed both in this paper.Moreover,a case study based on two areal cadastral maps in Beijing in different years are carried out to verify the feasibility and efficiency of the new method.It can be concluded that the new method apparently improves the success rate of areal cadastral parcel matching in the case study.This paper may also provide useful guidance on similar studies.
cadastre management;cadastral parcel;parcel matching;partial geometry similarity;GIS
P208
A
1672-0504(2011)05-0025-04
2011-05- 12;
2011-07-15
海外及港澳學(xué)者合作研究基金(40928001);“水體污染控制與治理”國(guó)家重大科技專項(xiàng)(2009ZX07528-004)
田原(1972-),男,博士,副教授,研究方向?yàn)榈乩硇畔⑾到y(tǒng)。*通訊作者E-mail:xujun@lreis.ac.cn