朱貴方
(沈陽(yáng)市勘察測(cè)繪研究院,遼寧 沈陽(yáng) 110000)
《物權(quán)法》中明確規(guī)定了“國(guó)家對(duì)不動(dòng)產(chǎn)實(shí)行統(tǒng)一登記制度”。為此,沈陽(yáng)市于2016年開始對(duì)沈陽(yáng)市本級(jí)及市內(nèi)九區(qū)的不動(dòng)產(chǎn)登記數(shù)據(jù)進(jìn)行整理,以確保最終建立沈陽(yáng)市不動(dòng)產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫(kù)。面對(duì)數(shù)據(jù)量龐大的房產(chǎn)存量數(shù)據(jù),如何快速準(zhǔn)確地完成整理工作是建立沈陽(yáng)市不動(dòng)產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫(kù)的關(guān)鍵環(huán)節(jié)。
沈陽(yáng)房產(chǎn)存量數(shù)據(jù)根據(jù)測(cè)繪的加入分為兩個(gè)階段,前一階段沒有測(cè)繪信息,房產(chǎn)數(shù)據(jù)缺少相應(yīng)的空間位置,房落地相對(duì)較難;后一階段,隨著測(cè)繪的加入和發(fā)展,房產(chǎn)測(cè)繪數(shù)據(jù)越來(lái)越準(zhǔn)確,基本上做到了房落地,整理過程中只要進(jìn)一步核實(shí)房屋位置和房形即可。針對(duì)兩個(gè)階段數(shù)據(jù)的不同情況,本文提出了利用“正”“反”兩個(gè)方向進(jìn)行房產(chǎn)存量數(shù)據(jù)整理。根據(jù)整理出的部分成果可見,此整理方式在保證準(zhǔn)確性的基礎(chǔ)上大大提高了效率。
沈陽(yáng)市不動(dòng)產(chǎn)登記房屋數(shù)據(jù)整理是以房產(chǎn)提供的房屋樓盤表數(shù)據(jù)和房產(chǎn)登記數(shù)據(jù)為基礎(chǔ)任務(wù)數(shù)據(jù),房屋樓盤表分為測(cè)繪樓盤表和邏輯樓盤表,總數(shù)約26萬(wàn)幢,對(duì)應(yīng)房產(chǎn)登記數(shù)據(jù)(戶數(shù))約574萬(wàn)戶。其中測(cè)繪樓盤表是具有測(cè)繪資料的房屋數(shù)據(jù),數(shù)據(jù)量約有4.4萬(wàn)幢,對(duì)應(yīng)300余萬(wàn)戶,該部分?jǐn)?shù)據(jù)存在形狀不準(zhǔn)確、位置精度差、坐標(biāo)系統(tǒng)不一致等問題,需要進(jìn)行坐標(biāo)轉(zhuǎn)換、空間位置調(diào)整、逐幢核實(shí)等整理工作;邏輯樓盤表是無(wú)測(cè)繪資料的房屋數(shù)據(jù),房產(chǎn)部門日常業(yè)務(wù)中整理出空間位置房屋圖形約1萬(wàn)幢,對(duì)應(yīng)20余萬(wàn)戶,剩余約20.6萬(wàn)幢無(wú)空間位置數(shù)據(jù),對(duì)應(yīng)約254萬(wàn)余戶。
通過對(duì)各相關(guān)數(shù)據(jù)收集、分析、整理、抽取、轉(zhuǎn)換等技術(shù)手段進(jìn)行房產(chǎn)數(shù)據(jù)提取和空間化處理,將數(shù)據(jù)分為測(cè)繪數(shù)據(jù)和邏輯數(shù)據(jù)兩大類房產(chǎn)存量數(shù)據(jù),利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術(shù),確定與房屋相對(duì)應(yīng)的邏輯幢[2]、自然幢[2]的空間位置和房形[1],并對(duì)邏輯幢賦予相應(yīng)的屬性信息[2],利用圖屬關(guān)聯(lián)進(jìn)行質(zhì)量檢查、拓?fù)錂z查,無(wú)誤后提交成果數(shù)據(jù)并編碼入庫(kù)。其總體技術(shù)路線如圖1所示。
圖1 房屋數(shù)據(jù)整理技術(shù)路線圖
根據(jù)房屋數(shù)據(jù)整理技術(shù)路線,本文通過ETL數(shù)據(jù)提取、數(shù)據(jù)空間化處理[3]、內(nèi)外業(yè)“正”“反”向調(diào)繪一體化、房地圖屬關(guān)聯(lián)等方法,將沈陽(yáng)市房產(chǎn)存量數(shù)據(jù)準(zhǔn)確無(wú)誤地整理到沈陽(yáng)市不動(dòng)產(chǎn)統(tǒng)一登記成果數(shù)據(jù)庫(kù)[4]。
(1)ETL數(shù)據(jù)提取
ETL(Extract-Transform-Load)是用來(lái)描述將數(shù)據(jù)從來(lái)源端經(jīng)過抽取(extract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程[5]。本文采取了ETL的思想[6],通過制定提取規(guī)則從房產(chǎn)數(shù)據(jù)庫(kù)中(包括樓表、戶表、開發(fā)商表、小區(qū)表等)提取有效房屋數(shù)據(jù),利用房產(chǎn)已有測(cè)繪數(shù)據(jù)、地名地址數(shù)據(jù)和地形圖數(shù)據(jù)等參考數(shù)據(jù)對(duì)所提取數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,最后加載到過程數(shù)據(jù)庫(kù)(自然幢、邏輯幢數(shù)據(jù)庫(kù))中,整個(gè)數(shù)據(jù)提取流程中除了清洗轉(zhuǎn)換過程需要一定的人工干預(yù),其他均可制訂相應(yīng)的規(guī)則實(shí)現(xiàn)全自動(dòng)化處理。其數(shù)據(jù)處理流程如圖2所示。
圖2 ETL數(shù)據(jù)提取流程圖
(2)數(shù)據(jù)空間化處理
根據(jù)前期對(duì)房產(chǎn)數(shù)據(jù)狀況評(píng)估,房產(chǎn)存量數(shù)據(jù)邏輯數(shù)據(jù)較多。對(duì)于缺失房屋圖形的邏輯數(shù)據(jù),利用地名地址數(shù)據(jù)和邏輯數(shù)據(jù)中的房屋地址對(duì)邏輯數(shù)據(jù)進(jìn)行數(shù)據(jù)空間化處理[7]。將已有空間位置的地名地址數(shù)據(jù)與無(wú)空間位置的房屋地址進(jìn)行地址匹配,匹配成功后得到房屋地址對(duì)應(yīng)的空間位置,利用此位置地形圖房屋圖形加工制作房產(chǎn)房屋圖形。地址匹配分為精確匹配和模糊匹配兩個(gè)過程。
①精確匹配
精確匹配的算法是以邏輯數(shù)據(jù)的地址(FWDZ)與地名地址數(shù)據(jù)完全一致為判斷條件,形成具有準(zhǔn)確空間位置信息的房產(chǎn)數(shù)據(jù),即“房產(chǎn)地址點(diǎn)”圖層。
利用具有空間位置的“房產(chǎn)地址點(diǎn)”和地形圖房屋數(shù)據(jù),自動(dòng)提取包含“房產(chǎn)地址點(diǎn)”的房屋數(shù)據(jù)并賦予相應(yīng)的地址屬性信息,獲得具有大致位置的空間化的房產(chǎn)數(shù)據(jù),并將其歸入測(cè)繪數(shù)據(jù),待內(nèi)外業(yè)“正”向調(diào)繪時(shí)核實(shí)房屋準(zhǔn)確地址和房形。通過精確匹配共整理出約5.4萬(wàn)幢房屋數(shù)據(jù)。
②模糊匹配
模糊匹配是將邏輯數(shù)據(jù)的地址(FWDZ)與地名地址數(shù)據(jù)利用地址的語(yǔ)義相似度制定地址匹配算法[10],形成準(zhǔn)確性較差的具有大致空間位置信息的“房產(chǎn)地名地址”圖層。由于相似度越大,匹配上的數(shù)量越少,但相似度過大又會(huì)影響匹配的有效性,所以需要根據(jù)地址的不同情況,設(shè)置適當(dāng)相似度值,同時(shí)在空間化處理過程中需要加入一定的人工干預(yù)。利用模糊匹配算法得到的結(jié)果準(zhǔn)確度會(huì)相應(yīng)下降,在整理房屋數(shù)據(jù)時(shí)將此類數(shù)據(jù)作標(biāo)識(shí)碼后歸入測(cè)繪數(shù)據(jù),待內(nèi)外業(yè)“正”向調(diào)繪時(shí)核實(shí)房屋準(zhǔn)確地址和房形。通過模糊匹配共整理出約1.8萬(wàn)幢房屋數(shù)據(jù)。
(3)內(nèi)外業(yè)“正”“反”向調(diào)繪技術(shù)
根據(jù)對(duì)沈陽(yáng)市房產(chǎn)數(shù)據(jù)的了解,其存量房屋數(shù)據(jù)分為有測(cè)繪資料的測(cè)繪數(shù)據(jù)和無(wú)測(cè)繪資料的邏輯數(shù)據(jù),前者加入了房產(chǎn)測(cè)繪的測(cè)繪資料整理較為容易,而后者無(wú)測(cè)繪數(shù)據(jù)整理較為困難。針對(duì)這兩大類數(shù)據(jù),本文提出了內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術(shù),其流程如圖3所示。此方法可以在保證整理質(zhì)量的前提下,大幅度地縮短整理時(shí)間。
圖3 內(nèi)外業(yè)“正”“反”向調(diào)繪流程圖
內(nèi)外業(yè)“正”向調(diào)繪一體化主要用于調(diào)繪有測(cè)繪數(shù)據(jù)的存量房屋,內(nèi)業(yè)利用已有的參考數(shù)據(jù)和房產(chǎn)測(cè)繪數(shù)據(jù)進(jìn)行數(shù)據(jù)分析提取,將提取有效數(shù)據(jù)展繪至調(diào)繪底圖上,外業(yè)作業(yè)員實(shí)地核實(shí)調(diào)繪底圖上房屋的地址和房形,其外業(yè)調(diào)繪圖如圖4所示。利用內(nèi)外業(yè)“正”向調(diào)繪便可方便快捷地整理出大量測(cè)繪樓盤表數(shù)據(jù)和資料相對(duì)較全的邏輯樓盤表數(shù)據(jù),其整理結(jié)果如圖5所示紅色標(biāo)注房屋。
圖4 外業(yè)調(diào)繪圖
圖5 整理成果細(xì)節(jié)圖
內(nèi)外業(yè)“反”向調(diào)繪一體化用于調(diào)繪經(jīng)過外業(yè)“正”向調(diào)繪未整理出的所有房產(chǎn)存量數(shù)據(jù),通過對(duì)數(shù)據(jù)的分析可知,其主要包括兩大類:一是老舊地址房屋數(shù)據(jù),二是資料不完整的房屋數(shù)據(jù)。此類數(shù)據(jù)只有邏輯屬性,無(wú)法定位到相應(yīng)的房屋。內(nèi)業(yè)利用房產(chǎn)檔案查找房屋權(quán)利人,外業(yè)通過相應(yīng)房產(chǎn)權(quán)利人的配合,對(duì)房屋進(jìn)行定位調(diào)繪,確定房屋地址位置和主體房形;對(duì)于查檔也無(wú)法確定位置的房屋,大部分位于實(shí)地存在而未整理的房屋上,將此類房屋整理到“備用圖層”方便外業(yè)調(diào)繪,如圖5中黑色字體標(biāo)注房屋為外業(yè)調(diào)繪的非整理房屋地址。利用內(nèi)外業(yè)“反”向調(diào)繪主要是彌補(bǔ)房產(chǎn)資料不足造成的整理困難,調(diào)繪過程中需相應(yīng)的房屋權(quán)利人的配合,相比外業(yè)“正”向調(diào)繪較慢,但可保證整理房屋數(shù)據(jù)的準(zhǔn)確性。為了避免重復(fù)調(diào)繪,此過程應(yīng)與日常權(quán)籍調(diào)繪建立互通機(jī)制。
(4)房地圖屬關(guān)聯(lián)
關(guān)聯(lián)是指利用唯一標(biāo)識(shí)的屬性或空間位置將兩個(gè)或多個(gè)數(shù)據(jù)連接到一起,得到更全面更準(zhǔn)確的屬性和空間信息,如屬性關(guān)聯(lián)、空間關(guān)聯(lián)。房地圖屬關(guān)聯(lián)是利用邏輯幢、自然幢和宗地的相應(yīng)屬性,將房屋數(shù)據(jù)、宗地?cái)?shù)據(jù)進(jìn)行圖形和屬性的關(guān)聯(lián),既包括房屋數(shù)據(jù)的圖形與屬性關(guān)聯(lián),又包括房屋數(shù)據(jù)與宗地?cái)?shù)據(jù)的空間關(guān)聯(lián)和屬性關(guān)聯(lián)。使其既可以通過圖形查詢屬性,又可以通過屬性定位圖形。
此次屬性關(guān)聯(lián)是利用具有唯一標(biāo)識(shí)的房屋ID對(duì)整理完的房屋數(shù)據(jù)與房產(chǎn)Oracle數(shù)據(jù)庫(kù)中的屬性數(shù)據(jù)進(jìn)行關(guān)聯(lián),統(tǒng)計(jì)和添加所整理房屋的權(quán)利人、戶數(shù)、層數(shù)、面積等必要屬性信息。
利用空間關(guān)聯(lián),將房屋與宗地進(jìn)行屬性對(duì)接,通過統(tǒng)計(jì)宗地內(nèi)房屋數(shù)量、分析宗地權(quán)利人與房屋權(quán)利人是否一致、房屋與宗地空間位置關(guān)系是否正確等進(jìn)一步確定房屋和宗地空間位置的準(zhǔn)確性。
面對(duì)錯(cuò)綜復(fù)雜、形態(tài)各異的房產(chǎn)存量數(shù)據(jù),根據(jù)整理過程中遇到的難點(diǎn)制訂了相應(yīng)的解決方法,但內(nèi)外業(yè)“正”“反”向一體化技術(shù)仍有不足之處,主要難點(diǎn)及不足如下。
(1)測(cè)繪數(shù)據(jù)準(zhǔn)確度較差
具有測(cè)繪數(shù)據(jù)的房屋,由于在不同時(shí)期所利用測(cè)繪手段、坐標(biāo)系等不同,在進(jìn)行整理過程中造成此類房屋在位置上的準(zhǔn)確性相對(duì)較弱。
內(nèi)業(yè)利用現(xiàn)勢(shì)性較好的地形圖和影像數(shù)據(jù)與其進(jìn)行對(duì)比分析,大致確定房屋位置,加上外業(yè)“正”向調(diào)繪,最終整理出準(zhǔn)確的房屋數(shù)據(jù)。如圖6所示紅色字體標(biāo)注的為整理數(shù)據(jù),藍(lán)色字體標(biāo)注的為房產(chǎn)測(cè)繪數(shù)據(jù)。
圖6 測(cè)繪數(shù)據(jù)與整理數(shù)據(jù)對(duì)比圖
(2)房產(chǎn)檔案資料不完整
無(wú)測(cè)繪數(shù)據(jù)的房屋,由于存檔時(shí)間較長(zhǎng)房產(chǎn)檔案資料相對(duì)不完整,單憑房產(chǎn)檔案和參考數(shù)據(jù)無(wú)法確認(rèn),此類房屋在外業(yè)進(jìn)行調(diào)繪過程中加入房屋權(quán)利人的配合,在整理房屋數(shù)據(jù)的準(zhǔn)確性上取得了較好效果,但由于是被動(dòng)聯(lián)系房屋權(quán)利人,在調(diào)繪過程中碰到許多不配合情況,導(dǎo)致整理效率下降。此類房屋整理最好加入房產(chǎn)權(quán)籍調(diào)查,既可保證準(zhǔn)確性又可保證日常登記業(yè)務(wù)。
檔案中的房屋資料不全主要包括無(wú)空間位置無(wú)房形、無(wú)空間位置有房形、有空間位置不能確定房形三種。無(wú)空間位置無(wú)房形的邏輯幢樓盤表狀態(tài)多樣,但大多為未取得預(yù)售許可、抵押和在建工程抵押狀態(tài)。無(wú)空間位置有房形分為兩種情況:一種為電子檔案中有分幅平面圖,但也只是單獨(dú)房屋;一種為電子檔案中無(wú)平面圖,但分層分戶可以確定房形。有空間位置不能確定房形的情況主要是掃描的平面圖只有一部分房子或分幅平面圖有折疊,此部分需查詢?cè)技堎|(zhì)檔案來(lái)進(jìn)行確定。
(3)房產(chǎn)數(shù)據(jù)動(dòng)態(tài)變化
房屋存量數(shù)據(jù)整理的對(duì)象為房產(chǎn)系統(tǒng)內(nèi)的所有房屋,而整理過程中房產(chǎn)業(yè)務(wù)同時(shí)也在實(shí)時(shí)辦理,導(dǎo)致房屋檔案存在變化的情況。為了解決此類問題,會(huì)同房產(chǎn)部門,制訂了相應(yīng)的整理更新流程,保證已整理數(shù)據(jù)的有效性和準(zhǔn)確性。
(4)內(nèi)外業(yè)“正”“反”向一體化技術(shù)不足之處
利用內(nèi)外業(yè)“反”向調(diào)繪過程中仍有部分房屋無(wú)法準(zhǔn)確整理。尤其是實(shí)地已拆遷的老舊房屋,但由于各種原因房屋權(quán)利人未進(jìn)行房屋注銷登記,造成房產(chǎn)系統(tǒng)中的部分檔案信息與現(xiàn)狀不符,同時(shí)權(quán)利人配合較難,此類情況利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術(shù)無(wú)法解決。由于日常登記業(yè)務(wù)較少,暫作為待整理房屋,等到相應(yīng)房屋權(quán)利人辦理業(yè)務(wù)時(shí),進(jìn)行日常權(quán)籍調(diào)查解決。
房產(chǎn)存量數(shù)據(jù)整理是一個(gè)非常復(fù)雜的問題,暫時(shí)沒有可供參考的完美方案。本文在查閱各相關(guān)文獻(xiàn)資料和對(duì)沈陽(yáng)市房產(chǎn)存量數(shù)據(jù)分析的基礎(chǔ)上,針對(duì)沈陽(yáng)市不動(dòng)產(chǎn)房產(chǎn)存量數(shù)據(jù)的特點(diǎn),提出了基于內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術(shù)的整理方案,介紹了整個(gè)不動(dòng)產(chǎn)房產(chǎn)數(shù)據(jù)整理的技術(shù)路線和其他關(guān)鍵技術(shù),總結(jié)了整理過程中的工作難點(diǎn)和不足,并根據(jù)整理中遇到的各種難點(diǎn)提出相應(yīng)的解決方法。在沈陽(yáng)市不動(dòng)產(chǎn)房屋數(shù)據(jù)的整理工作中,利用內(nèi)外業(yè)“正”“反”向調(diào)繪一體化技術(shù)提高了房產(chǎn)存量數(shù)據(jù)整理的速度和準(zhǔn)確度,在實(shí)際生產(chǎn)中具有一定的參考價(jià)值。