文|深圳市城市建設檔案館 劉一
隨著數字政府和智慧城市建設的不斷深入,房屋業(yè)務場景越來越趨于向跨部門、跨行業(yè)和跨領域的業(yè)務融會貫通方面發(fā)展,相關需求日益迫切[1]。由于涉房屋的業(yè)務系統眾多,且長期以來分散建設,缺乏整體規(guī)劃,存在數據冗余、割裂和孤立等現象,異構業(yè)務系統之間的集成十分困難且代價高昂等問題[2]。
本文旨在研究城市統一房屋基礎庫的設計、建設和服務方法,實現城市房屋數據的集中管理、安全規(guī)范、充分共享、全面服務,匯聚和整合多種數據來源的海量異構數據,建立房屋基礎數據體系,形成權威的房屋主數據資產,全面支撐公共住房、房地產市場、物業(yè)管理、住房保障、租賃市場、流動人口租賃管理、老舊小區(qū)改造、地下室安全管理等應用,以及從房屋規(guī)劃、建設、驗收、登記到房屋交易、運維、拆除滅失的全生命綜合協同管理。
深圳市房屋數據主要來源于規(guī)劃和自然資源部門的不動產登記系統,社會治理部門的網格管理系統,以及住房建設部門的共住房基礎信息平臺、房屋租賃管理信息系統、房地產信息平臺、產業(yè)用房租賃平臺等業(yè)務系統。不同來源的房屋數據在基本屬性,空間屬性,權屬屬性,現狀屬性等信息方面具有差異性特征。例如網格管理房屋具有數據量大,屬性采集項多的特點;不動產登記房屋數據的業(yè)務屬性強,準確性高,并具有法律效力;住建相關系統中房屋數據業(yè)務類別和數據應用場景豐富,有較強的業(yè)務聯動需要。
主數據是指具有高業(yè)務價值的,可以在組織內跨越多個業(yè)務部門被重復使用的數據,是單一、準確、權威的數據來源[3]。與傳統房屋業(yè)務型和分析型數據相比,房屋主數據具備以下幾個特征:
標識唯一性:針對不動產登記編碼、BIM 房屋分類編碼,實有房屋編碼等差異化房屋業(yè)務編碼體系,建立全市唯一的房屋編碼體系和房屋實體的唯一標識規(guī)則,支持多領域數據的關聯融合和數據的統一管理。
長期有效性:房屋主數據貫穿于房屋設計、建設、運營、管理和服務等全生命周期,房屋主數據所代表的業(yè)務對象長期存在并具有高價值特征。
業(yè)務穩(wěn)定性:房屋主數據描述房屋業(yè)務的關鍵信息,無論業(yè)務過程如何復雜和持久,除非主數據特征發(fā)生變化,否則主數據本身的屬性不會隨業(yè)務過程而被修改。
模型一致性:針對竣工驗收CAD 數據、不動產登記證照數據、室內測量三維模型數據、工程建設BIM 模型數據以及各類傳統業(yè)務關系數據等模型異構難題,設計支持幾何、語義、圖像和屬性等多種模型特征的房屋實體模型,保證主數據在不同領域關鍵特性的一致性。
房屋主數據模型描述了一組約束(規(guī)程)、方法和技術解決方案,用于保障房屋全生命周期內基礎數據和跨業(yè)務相關數據的一致性和聯動性。如圖1 所示,房屋主數據的概念模型,以房屋實體為中心,從模型語義、幾何、主題、模型等維度對于房屋進行抽象。針對房屋數據在規(guī)劃、建設和運營的過程中,在組織內或組織間會產生大量的數據內容的難點,設計支持時態(tài)化的數據格式,不同時態(tài)的模型可以聚合成全周期房屋模型和信息鏈,不同階段支撐不同的業(yè)務應用,以及跨領域數據分析。在房屋主數據模型中,核心特征包括:
房屋幾何特征:指經過竣工驗收并進行了不動產登記的法定幾何數據,該數據具備嚴格的不動產幾何定義,不以其他業(yè)務為轉移。
房屋語義特征:指經過房屋政務審批或者房屋信息登記等語義內容,例如房屋面積、結構等客觀存在的房屋物理特征。
房屋主題特征:指不同領域形成的房屋主題信息,主題信息在特定領域的房屋周期內,具體領域共性特征。例如房屋的權力人、租賃人等。
房屋模型特征:指利用實景三維或BIM 等技術建立的實體化的三維模型數據。房屋三維模型與其幾何特征在拓撲關系方面保持一致關系。
房屋拓撲特征:指房屋與房屋之間關系,例如房屋樓盤表通過表格的形式表達的房屋與房屋之間的臨近關系,三維分層分戶圖在三維空間中體現了房屋與房屋之間的拓撲關系。
圖1 房屋主數據概念模型
深圳市智慧住建項目采用“1+2+3”總體框架,包括1 個基礎平臺,2 大工程(BIM工程和數據工程),和3 大應用(智慧建造、智慧安居、智慧政務)。房屋基礎庫是智慧住建數據工程主數據庫的核心組成部分,其為住建業(yè)務板塊的各類應用提供統一的數據底板,打通了房屋業(yè)務關聯與數據聯通,建立統一的標準規(guī)范與監(jiān)管體系。
如圖2 所示,房屋基礎庫建設包括數據源層、數據匯聚層、數據治理層、基礎數據層和業(yè)務數據等5 個層次。
數據源層:存儲于各單位數據庫或其他城市公共基礎數據庫的房屋相關數據,主要來源包括不動產登記數據、網格管理房屋數據、公共住房、房屋租賃、房屋安全和房地產等相關數據。
數據匯聚層:通過數據庫連接、服務接口調用等方式匯聚跨部門和跨行業(yè)的房屋數據將市規(guī)劃和自然資源部門、社會治理部門等房屋數據進行匯聚,在城市大數據中心形成各部門的原始主題數據。
數據治理層:通過數據抽取、轉換和清洗,對匯聚數據按照數據質量管理要求進行質量稽核、一數一源梳理,形成面向通用需求和業(yè)務需求的各類數據集合。
基礎數據層:對于房屋基礎庫的房屋固有基礎信息,例如房屋編碼、房屋用途、房屋性質、樓層數據、建筑面積、房號、單元號、住宅房型等進行統一管理,形成智慧住建的統一數據底座。
圖2 房屋基礎庫總體架構
業(yè)務數據層:通過相應的業(yè)務、應用規(guī)則從基礎庫中抽取形成擴展表。與各業(yè)務系統聯通,支持業(yè)務回寫更新數據,業(yè)務數據層主要為各類業(yè)務提供業(yè)務支撐。
(1)統一編碼。房屋主數據以房屋編碼為唯一標識,在劃分房屋單元時賦碼建立。因房屋拆分、合并等導致房屋變更,產生新的房屋單元,應編制新的房屋編碼。每一棟建筑物房屋賦予統一的數字編碼,成為建筑物房屋唯一的“身份號碼”[4]。
(2)探索性數據分析。分析數據基本情況,包括各類數據的數量、數據精度、來源、空間坐標系、更新途徑、更新時間、數據標準結構、屬性值字典表等。分析不動產登記房屋數據與網格管理實有房屋數據之間關聯關系,包括兩者之間樓棟編號、樓棟名稱、層號、房屋編碼、房號等屬性的關聯關系。
(3)模型選定分析。在探索性分析的基礎上,分析基礎房數據模型,包括不動產登記數據模型、房屋調查數據模型、房屋測繪數據模型和房屋BIM 數據模型等。分析房屋模型高價值和業(yè)務穩(wěn)定的語義、幾何和屬性特征,例如房屋拆分和合并會導致房屋變更,產生新的房屋單元,應編制新的基礎房編碼。
(4)推斷分析。根據數據分析確定的基礎情況對所定模型或估計的可靠程度和精確程度作出推斷。主要包括數據重復、關鍵屬性數據為空、屬性數據存在亂碼或特殊字符、屬性數據包含空格等問題。將作業(yè)過程中發(fā)現的問題進行匯總并提出可行的解決方案。
(5)房屋數據特征分析。房屋主要特征包括面積、戶型、結構、用途、房屋性質等。房屋基礎庫不針對特定業(yè)務領域,因此可以在不同的應用場景中明確不同業(yè)務分類。若房屋經過不動產登記,則以不動產登記優(yōu)先確定主數據屬性的穩(wěn)定性,若未經過不動產登記,則通過網格管理的建筑調查或其他專項調查采集的房屋數據為主確定主數據屬性。
(6)數據預處理。在進行數據整合之前,對不動產登記中心數據和網格管理房屋數據進行梳理,包括剔除數據中存在的重復數據,并對亂碼數據、特殊字符、非法字符等進行處理,避免因數據格式而造成無法掛接。
(7)數據管理。根據兩套數據的數據分析結果,可先對同一空間位置下且滿足以下條件的房屋數據建立關聯關系:建筑名稱相同或名稱主體相同;房屋所在樓層相同;房號相同或房號主體相同;房屋所在建筑總層數相同;面積差額小于任一方數據房間的10%.
(8)外業(yè)核查。對于數據整合過程中需要外業(yè)核實處理的房屋數據,建立數據救濟和數據核查機制,進行外業(yè)核實修訂。具體包括:分幢不一致且無法通過內業(yè)建立對應關系的樓棟;房號不一致且無法通過內業(yè)建立對應關系的房間;其他需要實地考察的樓棟和房間。
房屋主數據通過協同更新系統實現跨部門協同式動態(tài)更新[5],協同更新系統核心流程包括:
(1)數據接入。通過服務接口的方式接入不動產登記房屋、網格管理房屋等數據,動態(tài)獲取增量數據,并且做相應的標準化處理。
(2)數據處理。根據本文描述的數據治理流程,形成ETL 腳本和規(guī)范性數據處理模塊,橫向處理不同來源的數據,縱向實現數據的管理融合,對于無法自動實現的數據,轉由人工判別處理,啟動救濟機制。
(3)統一賦碼。采用全市統一取碼器對于新增房屋進行統一的編碼。
(4)數據入庫。更新數據進行抽取和數據融合,融合成功后入房屋基礎庫,并標記更新,同時對數據映射關系表進行更新。
如圖3 所示,業(yè)務數據可以基于主數據進行業(yè)務擴展,滿足特定領域數據需要,房屋基礎數據庫建立與各業(yè)務系統數據流轉雙向業(yè)務服務接口,房屋基礎庫的建設可以有效支撐公共住房、房屋租賃、產業(yè)用房、房屋安全、不動產登記、房地產信息等業(yè)務系統,滿足數據變更和提供數據查詢服務。房屋主數據庫變更將直接推送到各業(yè)務庫,通知房屋擴展數據做好變更處理工作。業(yè)務數據變更將通過服務接口向主數據庫提起變更申請,對于更新審核通過的數據,將按照房屋基礎庫入庫規(guī)則同步更新至房屋基礎庫中,對于審核不通過的數據,將推送回各業(yè)務部門進行核實并反饋結果。
本文提出的基于主數據治理的房屋基礎庫建設,已在深圳市多個領域進行了應用實踐。在房屋全生命周期管理方面,實現了近千個建設項目。從數據層面可實現從立項到后期運維的全生命周期信息監(jiān)管。在危房風險影響評估和責任溯源,通過主數據實現物業(yè)小區(qū)、房屋、商事登記、產權登記等數據的快速關聯查詢,可以高效排查建筑物周邊的風險源,確定該建筑物的建設、施工、監(jiān)理和勘察設計等責任主體,對工程質量進行責任倒查。在公共住房管理方面,將“房屋主數據庫”與市場監(jiān)督部門“商事登記庫”以及“房屋租賃備案庫”建立關系,將公共住房房源與上述兩類數據進行關聯匹配,支撐智能篩選出疑似違規(guī)轉租和違規(guī)利用公共住房注冊企業(yè)等行為。
基于主數據庫的房屋基礎庫建設目前仍在起步階段,因為涉及大量跨部門、跨領域和跨行業(yè)的數據交換和整合工作,在不同領域主數據的內涵和外延仍存在一定爭議,需要在未來與相關部門圍繞主數據的高價值和穩(wěn)定性等特征,進一步優(yōu)化數據模型、架構和治理流程。
圖3 內部數據流