朱貴方
(沈陽市勘察測繪研究院,遼寧 沈陽 110000)
《物權法》中明確規(guī)定了“國家對不動產(chǎn)實行統(tǒng)一登記制度”。為此,沈陽市于2016年開始對沈陽市本級及市內(nèi)九區(qū)的不動產(chǎn)登記數(shù)據(jù)進行整理,以確保最終建立沈陽市不動產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫。面對數(shù)據(jù)量龐大的房產(chǎn)存量數(shù)據(jù),如何快速準確地完成整理工作是建立沈陽市不動產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫的關鍵環(huán)節(jié)。
沈陽房產(chǎn)存量數(shù)據(jù)根據(jù)測繪的加入分為兩個階段,前一階段沒有測繪信息,房產(chǎn)數(shù)據(jù)缺少相應的空間位置,房落地相對較難;后一階段,隨著測繪的加入和發(fā)展,房產(chǎn)測繪數(shù)據(jù)越來越準確,基本上做到了房落地,整理過程中只要進一步核實房屋位置和房形即可。針對兩個階段數(shù)據(jù)的不同情況,本文提出了利用“正”“反”兩個方向進行房產(chǎn)存量數(shù)據(jù)整理。根據(jù)整理出的部分成果可見,此整理方式在保證準確性的基礎上大大提高了效率。
沈陽市不動產(chǎn)登記房屋數(shù)據(jù)整理是以房產(chǎn)提供的房屋樓盤表數(shù)據(jù)和房產(chǎn)登記數(shù)據(jù)為基礎任務數(shù)據(jù),房屋樓盤表分為測繪樓盤表和邏輯樓盤表,總數(shù)約26萬幢,對應房產(chǎn)登記數(shù)據(jù)(戶數(shù))約574萬戶。其中測繪樓盤表是具有測繪資料的房屋數(shù)據(jù),數(shù)據(jù)量約有4.4萬幢,對應300余萬戶,該部分數(shù)據(jù)存在形狀不準確、位置精度差、坐標系統(tǒng)不一致等問題,需要進行坐標轉(zhuǎn)換、空間位置調(diào)整、逐幢核實等整理工作;邏輯樓盤表是無測繪資料的房屋數(shù)據(jù),房產(chǎn)部門日常業(yè)務中整理出空間位置房屋圖形約1萬幢,對應20余萬戶,剩余約20.6萬幢無空間位置數(shù)據(jù),對應約254萬余戶。
通過對各相關數(shù)據(jù)收集、分析、整理、抽取、轉(zhuǎn)換等技術手段進行房產(chǎn)數(shù)據(jù)提取和空間化處理,將數(shù)據(jù)分為測繪數(shù)據(jù)和邏輯數(shù)據(jù)兩大類房產(chǎn)存量數(shù)據(jù),利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術,確定與房屋相對應的邏輯幢[2]、自然幢[2]的空間位置和房形[1],并對邏輯幢賦予相應的屬性信息[2],利用圖屬關聯(lián)進行質(zhì)量檢查、拓撲檢查,無誤后提交成果數(shù)據(jù)并編碼入庫。其總體技術路線如圖1所示。
圖1 房屋數(shù)據(jù)整理技術路線圖
根據(jù)房屋數(shù)據(jù)整理技術路線,本文通過ETL數(shù)據(jù)提取、數(shù)據(jù)空間化處理[3]、內(nèi)外業(yè)“正”“反”向調(diào)繪一體化、房地圖屬關聯(lián)等方法,將沈陽市房產(chǎn)存量數(shù)據(jù)準確無誤地整理到沈陽市不動產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫[4]。
(1)ETL數(shù)據(jù)提取
ETL(Extract-Transform-Load)是用來描述將數(shù)據(jù)從來源端經(jīng)過抽取(extract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程[5]。本文采取了ETL的思想[6],通過制定提取規(guī)則從房產(chǎn)數(shù)據(jù)庫中(包括樓表、戶表、開發(fā)商表、小區(qū)表等)提取有效房屋數(shù)據(jù),利用房產(chǎn)已有測繪數(shù)據(jù)、地名地址數(shù)據(jù)和地形圖數(shù)據(jù)等參考數(shù)據(jù)對所提取數(shù)據(jù)進行清洗、轉(zhuǎn)換,最后加載到過程數(shù)據(jù)庫(自然幢、邏輯幢數(shù)據(jù)庫)中,整個數(shù)據(jù)提取流程中除了清洗轉(zhuǎn)換過程需要一定的人工干預,其他均可制訂相應的規(guī)則實現(xiàn)全自動化處理。其數(shù)據(jù)處理流程如圖2所示。
圖2 ETL數(shù)據(jù)提取流程圖
(2)數(shù)據(jù)空間化處理
根據(jù)前期對房產(chǎn)數(shù)據(jù)狀況評估,房產(chǎn)存量數(shù)據(jù)邏輯數(shù)據(jù)較多。對于缺失房屋圖形的邏輯數(shù)據(jù),利用地名地址數(shù)據(jù)和邏輯數(shù)據(jù)中的房屋地址對邏輯數(shù)據(jù)進行數(shù)據(jù)空間化處理[7]。將已有空間位置的地名地址數(shù)據(jù)與無空間位置的房屋地址進行地址匹配,匹配成功后得到房屋地址對應的空間位置,利用此位置地形圖房屋圖形加工制作房產(chǎn)房屋圖形。地址匹配分為精確匹配和模糊匹配兩個過程。
①精確匹配
精確匹配的算法是以邏輯數(shù)據(jù)的地址(FWDZ)與地名地址數(shù)據(jù)完全一致為判斷條件,形成具有準確空間位置信息的房產(chǎn)數(shù)據(jù),即“房產(chǎn)地址點”圖層。
利用具有空間位置的“房產(chǎn)地址點”和地形圖房屋數(shù)據(jù),自動提取包含“房產(chǎn)地址點”的房屋數(shù)據(jù)并賦予相應的地址屬性信息,獲得具有大致位置的空間化的房產(chǎn)數(shù)據(jù),并將其歸入測繪數(shù)據(jù),待內(nèi)外業(yè)“正”向調(diào)繪時核實房屋準確地址和房形。通過精確匹配共整理出約5.4萬幢房屋數(shù)據(jù)。
②模糊匹配
模糊匹配是將邏輯數(shù)據(jù)的地址(FWDZ)與地名地址數(shù)據(jù)利用地址的語義相似度制定地址匹配算法[10],形成準確性較差的具有大致空間位置信息的“房產(chǎn)地名地址”圖層。由于相似度越大,匹配上的數(shù)量越少,但相似度過大又會影響匹配的有效性,所以需要根據(jù)地址的不同情況,設置適當相似度值,同時在空間化處理過程中需要加入一定的人工干預。利用模糊匹配算法得到的結果準確度會相應下降,在整理房屋數(shù)據(jù)時將此類數(shù)據(jù)作標識碼后歸入測繪數(shù)據(jù),待內(nèi)外業(yè)“正”向調(diào)繪時核實房屋準確地址和房形。通過模糊匹配共整理出約1.8萬幢房屋數(shù)據(jù)。
(3)內(nèi)外業(yè)“正”“反”向調(diào)繪技術
根據(jù)對沈陽市房產(chǎn)數(shù)據(jù)的了解,其存量房屋數(shù)據(jù)分為有測繪資料的測繪數(shù)據(jù)和無測繪資料的邏輯數(shù)據(jù),前者加入了房產(chǎn)測繪的測繪資料整理較為容易,而后者無測繪數(shù)據(jù)整理較為困難。針對這兩大類數(shù)據(jù),本文提出了內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術,其流程如圖3所示。此方法可以在保證整理質(zhì)量的前提下,大幅度地縮短整理時間。
圖3 內(nèi)外業(yè)“正”“反”向調(diào)繪流程圖
內(nèi)外業(yè)“正”向調(diào)繪一體化主要用于調(diào)繪有測繪數(shù)據(jù)的存量房屋,內(nèi)業(yè)利用已有的參考數(shù)據(jù)和房產(chǎn)測繪數(shù)據(jù)進行數(shù)據(jù)分析提取,將提取有效數(shù)據(jù)展繪至調(diào)繪底圖上,外業(yè)作業(yè)員實地核實調(diào)繪底圖上房屋的地址和房形,其外業(yè)調(diào)繪圖如圖4所示。利用內(nèi)外業(yè)“正”向調(diào)繪便可方便快捷地整理出大量測繪樓盤表數(shù)據(jù)和資料相對較全的邏輯樓盤表數(shù)據(jù),其整理結果如圖5所示紅色標注房屋。
圖4 外業(yè)調(diào)繪圖
圖5 整理成果細節(jié)圖
內(nèi)外業(yè)“反”向調(diào)繪一體化用于調(diào)繪經(jīng)過外業(yè)“正”向調(diào)繪未整理出的所有房產(chǎn)存量數(shù)據(jù),通過對數(shù)據(jù)的分析可知,其主要包括兩大類:一是老舊地址房屋數(shù)據(jù),二是資料不完整的房屋數(shù)據(jù)。此類數(shù)據(jù)只有邏輯屬性,無法定位到相應的房屋。內(nèi)業(yè)利用房產(chǎn)檔案查找房屋權利人,外業(yè)通過相應房產(chǎn)權利人的配合,對房屋進行定位調(diào)繪,確定房屋地址位置和主體房形;對于查檔也無法確定位置的房屋,大部分位于實地存在而未整理的房屋上,將此類房屋整理到“備用圖層”方便外業(yè)調(diào)繪,如圖5中黑色字體標注房屋為外業(yè)調(diào)繪的非整理房屋地址。利用內(nèi)外業(yè)“反”向調(diào)繪主要是彌補房產(chǎn)資料不足造成的整理困難,調(diào)繪過程中需相應的房屋權利人的配合,相比外業(yè)“正”向調(diào)繪較慢,但可保證整理房屋數(shù)據(jù)的準確性。為了避免重復調(diào)繪,此過程應與日常權籍調(diào)繪建立互通機制。
(4)房地圖屬關聯(lián)
關聯(lián)是指利用唯一標識的屬性或空間位置將兩個或多個數(shù)據(jù)連接到一起,得到更全面更準確的屬性和空間信息,如屬性關聯(lián)、空間關聯(lián)。房地圖屬關聯(lián)是利用邏輯幢、自然幢和宗地的相應屬性,將房屋數(shù)據(jù)、宗地數(shù)據(jù)進行圖形和屬性的關聯(lián),既包括房屋數(shù)據(jù)的圖形與屬性關聯(lián),又包括房屋數(shù)據(jù)與宗地數(shù)據(jù)的空間關聯(lián)和屬性關聯(lián)。使其既可以通過圖形查詢屬性,又可以通過屬性定位圖形。
此次屬性關聯(lián)是利用具有唯一標識的房屋ID對整理完的房屋數(shù)據(jù)與房產(chǎn)Oracle數(shù)據(jù)庫中的屬性數(shù)據(jù)進行關聯(lián),統(tǒng)計和添加所整理房屋的權利人、戶數(shù)、層數(shù)、面積等必要屬性信息。
利用空間關聯(lián),將房屋與宗地進行屬性對接,通過統(tǒng)計宗地內(nèi)房屋數(shù)量、分析宗地權利人與房屋權利人是否一致、房屋與宗地空間位置關系是否正確等進一步確定房屋和宗地空間位置的準確性。
面對錯綜復雜、形態(tài)各異的房產(chǎn)存量數(shù)據(jù),根據(jù)整理過程中遇到的難點制訂了相應的解決方法,但內(nèi)外業(yè)“正”“反”向一體化技術仍有不足之處,主要難點及不足如下。
(1)測繪數(shù)據(jù)準確度較差
具有測繪數(shù)據(jù)的房屋,由于在不同時期所利用測繪手段、坐標系等不同,在進行整理過程中造成此類房屋在位置上的準確性相對較弱。
內(nèi)業(yè)利用現(xiàn)勢性較好的地形圖和影像數(shù)據(jù)與其進行對比分析,大致確定房屋位置,加上外業(yè)“正”向調(diào)繪,最終整理出準確的房屋數(shù)據(jù)。如圖6所示紅色字體標注的為整理數(shù)據(jù),藍色字體標注的為房產(chǎn)測繪數(shù)據(jù)。
圖6 測繪數(shù)據(jù)與整理數(shù)據(jù)對比圖
(2)房產(chǎn)檔案資料不完整
無測繪數(shù)據(jù)的房屋,由于存檔時間較長房產(chǎn)檔案資料相對不完整,單憑房產(chǎn)檔案和參考數(shù)據(jù)無法確認,此類房屋在外業(yè)進行調(diào)繪過程中加入房屋權利人的配合,在整理房屋數(shù)據(jù)的準確性上取得了較好效果,但由于是被動聯(lián)系房屋權利人,在調(diào)繪過程中碰到許多不配合情況,導致整理效率下降。此類房屋整理最好加入房產(chǎn)權籍調(diào)查,既可保證準確性又可保證日常登記業(yè)務。
檔案中的房屋資料不全主要包括無空間位置無房形、無空間位置有房形、有空間位置不能確定房形三種。無空間位置無房形的邏輯幢樓盤表狀態(tài)多樣,但大多為未取得預售許可、抵押和在建工程抵押狀態(tài)。無空間位置有房形分為兩種情況:一種為電子檔案中有分幅平面圖,但也只是單獨房屋;一種為電子檔案中無平面圖,但分層分戶可以確定房形。有空間位置不能確定房形的情況主要是掃描的平面圖只有一部分房子或分幅平面圖有折疊,此部分需查詢原始紙質(zhì)檔案來進行確定。
(3)房產(chǎn)數(shù)據(jù)動態(tài)變化
房屋存量數(shù)據(jù)整理的對象為房產(chǎn)系統(tǒng)內(nèi)的所有房屋,而整理過程中房產(chǎn)業(yè)務同時也在實時辦理,導致房屋檔案存在變化的情況。為了解決此類問題,會同房產(chǎn)部門,制訂了相應的整理更新流程,保證已整理數(shù)據(jù)的有效性和準確性。
(4)內(nèi)外業(yè)“正”“反”向一體化技術不足之處
利用內(nèi)外業(yè)“反”向調(diào)繪過程中仍有部分房屋無法準確整理。尤其是實地已拆遷的老舊房屋,但由于各種原因房屋權利人未進行房屋注銷登記,造成房產(chǎn)系統(tǒng)中的部分檔案信息與現(xiàn)狀不符,同時權利人配合較難,此類情況利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術無法解決。由于日常登記業(yè)務較少,暫作為待整理房屋,等到相應房屋權利人辦理業(yè)務時,進行日常權籍調(diào)查解決。
房產(chǎn)存量數(shù)據(jù)整理是一個非常復雜的問題,暫時沒有可供參考的完美方案。本文在查閱各相關文獻資料和對沈陽市房產(chǎn)存量數(shù)據(jù)分析的基礎上,針對沈陽市不動產(chǎn)房產(chǎn)存量數(shù)據(jù)的特點,提出了基于內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術的整理方案,介紹了整個不動產(chǎn)房產(chǎn)數(shù)據(jù)整理的技術路線和其他關鍵技術,總結了整理過程中的工作難點和不足,并根據(jù)整理中遇到的各種難點提出相應的解決方法。在沈陽市不動產(chǎn)房屋數(shù)據(jù)的整理工作中,利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術提高了房產(chǎn)存量數(shù)據(jù)整理的速度和準確度,在實際生產(chǎn)中具有一定的參考價值。