史進(jìn)
(云賽智聯(lián)股份有限公司,上海 201108)
公共數(shù)據(jù)是指國家機(jī)關(guān)、事業(yè)單位經(jīng)依法授權(quán)具有管理公共事務(wù)職能的組織以及供水、供電、供氣、公共交通等提供公共服務(wù)的組織(以下統(tǒng)稱公共管理和服務(wù)機(jī)構(gòu)),在履行公共管理和服務(wù)職責(zé)過程中收集和產(chǎn)生的數(shù)據(jù)。如何統(tǒng)籌規(guī)劃、合理管理公共數(shù)據(jù)資源,讓公共數(shù)據(jù)通過合法合規(guī)的途徑釋放價值成為發(fā)展大數(shù)據(jù)產(chǎn)業(yè)、驅(qū)動數(shù)字經(jīng)濟(jì)增長的關(guān)鍵所在。
隨著大數(shù)據(jù)平臺、“城市大腦”等大平臺的建設(shè)在各地開展,國內(nèi)大多省市均建立了政務(wù)數(shù)據(jù)中心統(tǒng)一管理公共數(shù)據(jù)的歸集、治理、共享和開放,如上海市大數(shù)據(jù)中心、山東省大數(shù)據(jù)局。但由于公共數(shù)據(jù)資產(chǎn)管理體系的理論研究起步較晚,政務(wù)數(shù)據(jù)中心在管理公共數(shù)據(jù)方面仍存在諸多問題,目前尚缺乏針對政務(wù)數(shù)據(jù)中心的公共數(shù)據(jù)資產(chǎn)管理體系的相關(guān)研究。
在政務(wù)數(shù)據(jù)中心建設(shè)研究方面,學(xué)者多聚焦于建設(shè)政務(wù)數(shù)據(jù)中心的技術(shù)平臺,如政務(wù)云平臺、數(shù)據(jù)共享交換平臺等,對歸集、共享等管理制度、流程的研究相對較少。如桑菁華[1]提出,政務(wù)數(shù)據(jù)中心主要建設(shè)內(nèi)容包含云計算系統(tǒng)建設(shè)、云存儲系統(tǒng)建設(shè)以及云管理平臺建設(shè)。趙睿[2]提出,政務(wù)大數(shù)據(jù)中心作為集中統(tǒng)一的政務(wù)數(shù)據(jù)存儲、管理、分析、應(yīng)用的綜合性平臺,主要分為基礎(chǔ)數(shù)據(jù)倉庫、基礎(chǔ)數(shù)據(jù)管控平臺和大數(shù)據(jù)分析應(yīng)用平臺3個層次。徐海明[3]提出,政務(wù)大數(shù)據(jù)中心總體架構(gòu)主要包括系統(tǒng)架構(gòu)、應(yīng)用架構(gòu)、管理架構(gòu)和安全架構(gòu)4個主要方面,并且使用數(shù)據(jù)融合關(guān)鍵技術(shù)、業(yè)務(wù)融合關(guān)鍵技術(shù)等解決數(shù)據(jù)處理和歸集的問題。喻健[4]提出構(gòu)建數(shù)據(jù)中心需要預(yù)備足夠備份冗余和升級空間,采用關(guān)系型數(shù)據(jù)庫結(jié)合大規(guī)模并行架構(gòu)MPP的計算集群,提供共享域內(nèi)交換節(jié)點之間的數(shù)據(jù)和文件自動交換服務(wù)的數(shù)據(jù)交換引擎。關(guān)春[5]提出,為提升電子政務(wù)數(shù)據(jù)中心數(shù)據(jù)管理能力,需要提高數(shù)據(jù)交換管理能力,建立數(shù)據(jù)入庫錯誤反饋機(jī)制,明確落實數(shù)據(jù)責(zé)任,實現(xiàn)數(shù)據(jù)共享使用審核流程化、項目運維流程規(guī)范化。
在公共數(shù)據(jù)資產(chǎn)的研究方面,學(xué)者主要聚焦于通過場景應(yīng)用發(fā)揮公共數(shù)據(jù)資產(chǎn)的價值,對基礎(chǔ)性數(shù)據(jù)資產(chǎn)的歸集及治理工作缺乏相應(yīng)研究。劉辰昀[6]提出自然人公共數(shù)據(jù)資源體系建設(shè),基于場景驅(qū)動,建成婚姻、死亡等系列專題庫,最后進(jìn)行多樣化共享服務(wù),實現(xiàn)數(shù)據(jù)屬地返還。李愛軍[7]提出大數(shù)據(jù)存在的現(xiàn)有資源利用率低、經(jīng)費來源單一、數(shù)據(jù)安全體系不完善等難點,提出了建立政府專屬機(jī)構(gòu),統(tǒng)一規(guī)劃、重點建設(shè),充分挖掘現(xiàn)有的數(shù)據(jù)資源的價值,建立健全相關(guān)安全保障體系。郭仲勇[8]提出基于區(qū)塊鏈政府?dāng)?shù)據(jù)供應(yīng)鏈的設(shè)計思路,給出聯(lián)盟鏈服務(wù)平臺、金融服務(wù)平臺、電子簽約服務(wù)平臺的建設(shè)方案。陸莉[9]提出以我國地方政府開放平臺的“公共安全”主題版塊數(shù)據(jù)集為研究對象,運用內(nèi)容分析法描述政府開放公共安全數(shù)據(jù)的現(xiàn)狀,對公共安全數(shù)據(jù)開放現(xiàn)狀進(jìn)行了梳理,提出提升我國政府公共安全數(shù)據(jù)規(guī)范管理與開放共享的對策建議。
在公共數(shù)據(jù)資產(chǎn)化方面,學(xué)者主要聚焦于利用區(qū)塊鏈或其他技術(shù)進(jìn)行數(shù)據(jù)資產(chǎn)評級、數(shù)據(jù)資產(chǎn)評估的方向。潘澤鐸[10]探究了數(shù)據(jù)資產(chǎn)管理系統(tǒng)業(yè)務(wù)流程和管理框架,從傳統(tǒng)數(shù)據(jù)資產(chǎn)管理系統(tǒng)框架出發(fā),引入了聯(lián)機(jī)分析處理技術(shù)來搭建了數(shù)據(jù)資產(chǎn)去中心化的管理模式,并梳理了數(shù)據(jù)質(zhì)量評估的流程,利用區(qū)塊鏈和智能合約技術(shù)實現(xiàn)數(shù)據(jù)資產(chǎn)的溯源性和可確權(quán)的性質(zhì)。劉辰昀[11]提出構(gòu)建公共數(shù)據(jù)資產(chǎn)評級模型,可實現(xiàn)資產(chǎn)盤點、資產(chǎn)識別、資產(chǎn)探查、資產(chǎn)標(biāo)簽、資產(chǎn)稱重的功能。南方電網(wǎng)借助大數(shù)據(jù)、區(qū)塊鏈等技術(shù),實現(xiàn)電網(wǎng)數(shù)據(jù)可信、安全傳輸,并制成了全國首張公共數(shù)據(jù)資產(chǎn)憑證(企業(yè)用電數(shù)據(jù))[12]。平慶忠[13]提出利用GPT模型解釋公共資源交易數(shù)據(jù),并形成公共投資項目決策模型、公共服務(wù)優(yōu)化模型和公共服務(wù)創(chuàng)新模型。
政務(wù)數(shù)據(jù)中心尚未形成公共數(shù)據(jù)資產(chǎn)管理體系,導(dǎo)致存在數(shù)據(jù)資源情況不明、數(shù)據(jù)質(zhì)量無法達(dá)標(biāo)、數(shù)據(jù)價值有待挖掘等問題。
由于缺乏頂層規(guī)劃設(shè)計,各部門應(yīng)用系統(tǒng)并未按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行建設(shè),導(dǎo)致政府對下屬部門的公共數(shù)據(jù)資源情況不了解,各部門出于自身考量,僅將部分?jǐn)?shù)據(jù)上報至數(shù)據(jù)中心,為后續(xù)的數(shù)據(jù)應(yīng)用以及數(shù)據(jù)共享交換帶來極大困難。
缺乏規(guī)范化的數(shù)據(jù)編目、數(shù)據(jù)質(zhì)量管理標(biāo)準(zhǔn)及流程,導(dǎo)致公共數(shù)據(jù)質(zhì)量較低,存在大量數(shù)據(jù)遺漏、數(shù)據(jù)錯誤的情況,為數(shù)據(jù)應(yīng)用帶來極大的局限性。而且數(shù)據(jù)并未進(jìn)行有效的分級分類管理,導(dǎo)致存在巨大的數(shù)據(jù)安全風(fēng)險隱患。
由于現(xiàn)階段政務(wù)數(shù)據(jù)中心的主要任務(wù)是數(shù)據(jù)歸集,缺乏對數(shù)據(jù)資產(chǎn)價值的挖掘,也無法利用數(shù)據(jù)分析降低政府部門整體的運營成本,提升數(shù)字政府的管理水平。
針對以上3個問題,設(shè)計了公共數(shù)據(jù)資產(chǎn)管理體系,包含公共數(shù)據(jù)資源盤點、公共數(shù)據(jù)資產(chǎn)化及公共數(shù)據(jù)資產(chǎn)評估三方面,如圖1所示。公共數(shù)據(jù)資源盤點包括數(shù)據(jù)模板管理和數(shù)據(jù)歸集管理。通過數(shù)據(jù)資源盤點,政府對下屬部門的數(shù)據(jù)資源的數(shù)量、種類可做到“心中有數(shù)”。公共數(shù)據(jù)資產(chǎn)化的流程為數(shù)據(jù)資源編目、數(shù)據(jù)資產(chǎn)分級分類、數(shù)據(jù)資產(chǎn)標(biāo)簽管理和數(shù)據(jù)質(zhì)量管理。數(shù)據(jù)資產(chǎn)化使數(shù)據(jù)資產(chǎn)便于被查找、共享及融合開發(fā)。公共數(shù)據(jù)資產(chǎn)評估通過構(gòu)建評估指標(biāo),通過數(shù)據(jù)資產(chǎn)價值評估,可使數(shù)據(jù)資產(chǎn)的價值被量化,以便于授權(quán)運營或數(shù)據(jù)交易,挖掘數(shù)據(jù)要素價值。
圖1 公共數(shù)據(jù)資產(chǎn)管理體系
公共數(shù)據(jù)資源盤點的核心在于管理數(shù)據(jù)模板及歸集的數(shù)據(jù)。通過數(shù)據(jù)模板管理確定公共數(shù)據(jù)的類型及不同類型數(shù)據(jù)的關(guān)聯(lián)結(jié)構(gòu),通過數(shù)據(jù)歸集管理進(jìn)行數(shù)據(jù)的一數(shù)一源管理和同類歸并。
1.數(shù)據(jù)模板管理
數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)模板管理也應(yīng)針對這兩種類型,結(jié)構(gòu)化數(shù)據(jù)包括以各類數(shù)據(jù)庫表形式保存的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)指PDF/WORD文檔、圖片、CAD圖等非結(jié)構(gòu)化形式的數(shù)據(jù)。
(1)結(jié)構(gòu)化數(shù)據(jù)管理:針對結(jié)構(gòu)化數(shù)據(jù),管理流程為梳理業(yè)務(wù)部門的需求、建立數(shù)據(jù)表的命名規(guī)則、梳理業(yè)務(wù)系統(tǒng)表、繪制關(guān)聯(lián)ER圖、確定表中字段含義。如圖2所示。
圖2 結(jié)構(gòu)化數(shù)據(jù)管理流程
(2)非結(jié)構(gòu)化數(shù)據(jù)管理:針對非結(jié)構(gòu)化數(shù)據(jù),如文檔、圖片數(shù)據(jù),需要梳理非結(jié)構(gòu)化數(shù)據(jù)存儲的關(guān)鍵信息,指定存放位置、文件編寫人、文件編寫部門、文件摘要等命名規(guī)范。
2.數(shù)據(jù)歸集管理
數(shù)據(jù)歸集管理的核心在于進(jìn)行“一數(shù)一源”管理和同義項歸并,應(yīng)遵循一套數(shù)據(jù)僅有一個來源的原則,如身份證號數(shù)據(jù)應(yīng)來自公安部門的戶籍處室。同義項歸并須對多個部門針對同一對象而名稱不同的數(shù)據(jù)做歸并處理。如在不同系統(tǒng)中,民族的填寫可能有“苗族”“苗”“miao”等多種數(shù)據(jù),可通過代碼映射的方式進(jìn)行同一項歸并。
1.數(shù)據(jù)資源編目
(1)元數(shù)據(jù)管理:元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù)。常見的元數(shù)據(jù)包括數(shù)據(jù)名稱、摘要、存儲位置、字段類型、字段長度等,見表1。元數(shù)據(jù)管理應(yīng)包括元模型設(shè)計、數(shù)據(jù)源配置管理、設(shè)置采集任務(wù)、采集元數(shù)據(jù)等步驟。
表1 元數(shù)據(jù)示例
(2)資源目錄管理:通過對公共數(shù)據(jù)進(jìn)行編目,可以清晰了解部門數(shù)據(jù)資產(chǎn)的總覽,通過統(tǒng)一的目錄視圖多維地展現(xiàn)資產(chǎn)的分布和關(guān)聯(lián)關(guān)系,對數(shù)據(jù)資產(chǎn)進(jìn)行全生命周期和規(guī)范化地管控。
資源目錄管理的流程一般為目錄編制、目錄報送、目錄審核、目錄發(fā)布和目錄維護(hù)(圖3)。目錄編制須按照《政務(wù)信息資源目錄編制指南(試行)》[17]要求,確定類、項、目、細(xì)目等類目,編制部門政務(wù)信息資源的目錄。資源目錄編制內(nèi)容模板見表2,包含目錄名稱、目錄類型、資源摘要、資產(chǎn)提供方名稱、應(yīng)用系統(tǒng)名稱、業(yè)務(wù)事項名稱、共享屬性、共享條件、發(fā)布日期、關(guān)聯(lián)數(shù)據(jù)表等核心數(shù)據(jù)。目錄報送是由數(shù)據(jù)中心對資源目錄進(jìn)行復(fù)核,審查后,向上級部門進(jìn)行報送。目錄審核是由主管部門針對報送的目錄進(jìn)行匯總審核,如發(fā)現(xiàn)不符合要求會退回對目錄進(jìn)行整改。目錄發(fā)布是指將已編制的目錄發(fā)布上傳至系統(tǒng)中,所有平臺使用方均可見相關(guān)目錄。目錄維護(hù)是指數(shù)據(jù)中心對所有資產(chǎn)目錄代碼的分配、管理、使用以及維護(hù)更新等日常工作。
表2 資產(chǎn)目錄編制內(nèi)容模板(示例)
圖3 資源目錄管理流程
2.數(shù)據(jù)資產(chǎn)分級分類
(1)資產(chǎn)分類管理:資產(chǎn)分類管理的核心在于從主體、業(yè)務(wù)活動等維度構(gòu)建分類模型,目前常用的方法為線分類法、面分類法和混合分類法。線分類法將分類對象按選定的若干個屬性或特征,逐次分為若干層級,每個層級又分為若干類別。同一分支下,同層級類別之間構(gòu)成并列關(guān)系,不同層級類別之間構(gòu)成隸屬關(guān)系。面分類法將選定的分類對象依據(jù)其本身固有的各種屬性或特征,分成相互之間沒有隸屬關(guān)系即彼此獨立的面,每個面中都包含了一組類別?;旌戏诸惙▽⒕€分類法和面分類法組合使用。不同的分類都有對應(yīng)的編碼規(guī)則。
如針對公共數(shù)據(jù)中涉及法人經(jīng)營管理的數(shù)據(jù)采用混合分類法,按照主體類型、注冊類型、屬性類型以及共享類型進(jìn)行分類,如圖4所示。
圖4 法人經(jīng)營數(shù)據(jù)資源分類示例
(2)資產(chǎn)分級管理:為滿足數(shù)據(jù)合規(guī)性及數(shù)據(jù)資產(chǎn)運營需求,需對公共數(shù)據(jù)進(jìn)行資產(chǎn)分級管理,分級管理應(yīng)遵循省市政府的需求及《中華人民共和國數(shù)據(jù)安全法》的相關(guān)內(nèi)容,以《重慶市公共數(shù)據(jù)分類分級指南2.0》為例,可分為4個等級,見表3。
表3 數(shù)據(jù)資產(chǎn)安全分級等級示例
3.數(shù)據(jù)資產(chǎn)標(biāo)簽管理
數(shù)據(jù)標(biāo)簽管理的作用是在業(yè)務(wù)層面上能夠快速查詢、展示、分析各類歸集數(shù)據(jù)。數(shù)據(jù)資產(chǎn)標(biāo)簽管理包含標(biāo)簽開發(fā)和標(biāo)簽庫管理兩大類,具體流程如圖5所示。
圖5 數(shù)據(jù)資產(chǎn)標(biāo)簽管理流程
數(shù)據(jù)質(zhì)量管理是保障高質(zhì)量數(shù)據(jù)、推動數(shù)據(jù)流通的前提。數(shù)據(jù)質(zhì)量管理一般檢核數(shù)據(jù)規(guī)范性、完整性、有效性和時效性方面的質(zhì)量。如數(shù)據(jù)規(guī)范性檢核數(shù)據(jù)的主鍵、時間戳等信息是否完整。數(shù)據(jù)完整性校驗是否包含空數(shù)據(jù)等。數(shù)據(jù)有效性校驗數(shù)據(jù)是否在業(yè)務(wù)指定的值域范圍之內(nèi),對出現(xiàn)的異常數(shù)據(jù)進(jìn)行告警,如人的年齡為300歲,身份證號為13位等。
使用數(shù)據(jù)會產(chǎn)生價值,但如何對公共數(shù)據(jù)的價值進(jìn)行評估尤為困難??蛇x取數(shù)據(jù),質(zhì)量,效益等評價指標(biāo),對數(shù)據(jù)資產(chǎn)進(jìn)行全面的分析,確定數(shù)據(jù)資產(chǎn)的等級,為公共數(shù)據(jù)流通準(zhǔn)備高質(zhì)量的數(shù)據(jù)資產(chǎn)。公共數(shù)據(jù)資產(chǎn)評估的流程如圖6所示。
圖6 數(shù)據(jù)資產(chǎn)評估流程
1.評估指標(biāo)制定
(1)觸摸法:用手摸,粗的是 N a2CO3,細(xì)的是N aH CO3(N a2CO3為白色粉末或細(xì)粒, N aH CO3為白色細(xì)小晶體);
數(shù)據(jù)資產(chǎn)評估指標(biāo)體系的設(shè)計應(yīng)該遵循三項標(biāo)準(zhǔn):一是內(nèi)在邏輯一致性,指大數(shù)據(jù)中心的數(shù)據(jù)資產(chǎn)評估指標(biāo),與公共數(shù)據(jù)評估的整體目標(biāo)、當(dāng)年任務(wù)目標(biāo)一致;二是分類設(shè)計,由于指標(biāo)體系的應(yīng)用對象以及具體服務(wù)內(nèi)容各不相同,需要針對不同的主體、服務(wù)內(nèi)容設(shè)計不同的指標(biāo)體系;三是問題導(dǎo)向,應(yīng)重點關(guān)注數(shù)據(jù)資產(chǎn)獲取成本以及產(chǎn)生的效益等方面。
如評估指標(biāo)可包括獲取成本、數(shù)據(jù)質(zhì)量、應(yīng)用效益3個方面。獲取成本可包含建設(shè)成本、運維成本和使用成本。數(shù)據(jù)質(zhì)量可包含數(shù)據(jù)的規(guī)范性、完整性、有效性、時效性。應(yīng)用效益包含數(shù)據(jù)共享數(shù)量。詳見表4。
表4 數(shù)據(jù)資產(chǎn)評估指標(biāo)
2.評分規(guī)則制定
評分規(guī)則制定包括兩個方面,分別是指標(biāo)計算方法和評分規(guī)則。
指標(biāo)計算方法按照行業(yè)標(biāo)準(zhǔn)和通用標(biāo)準(zhǔn)等制定,一般分為定量指標(biāo)和定性指標(biāo)。定性指標(biāo)一般通過明確考核內(nèi)容采集相關(guān)數(shù)據(jù);定量指標(biāo)可以準(zhǔn)確數(shù)量定義、精確衡量并能設(shè)定績效目標(biāo)的考核指標(biāo),如數(shù)據(jù)完整性=表中非空字段數(shù)÷總字段數(shù)×100%。
評分規(guī)則可以衡量該項指標(biāo)的計算結(jié)果是否符合基準(zhǔn),并通過公式進(jìn)行量化,可采用目標(biāo)值法和檔次評分規(guī)則。目標(biāo)值法是指設(shè)定某一量化值為目標(biāo)值,超過或未達(dá)目標(biāo)值則按一定的線性規(guī)律增減分。檔次規(guī)則法是指劃分多檔次,如1、2、3、4、5這五個檔次,僅可獲得1、2、3、4、5這五個分?jǐn)?shù)。采用目標(biāo)值法計算較復(fù)雜,但評分準(zhǔn)確度較高,經(jīng)常被采用。
3.確認(rèn)權(quán)重
權(quán)重的確認(rèn)一般采用Delphi法或AHP法。Delphi法又稱專家咨詢法,通過幾輪函詢征求專家意見,然后通過匯總分析得到一個綜合的結(jié)果。此種方法的優(yōu)勢在于可以簡單快速地得到多位專家對于指標(biāo)權(quán)重的綜合觀點。AHP法又稱層次分析法,通過兩兩判斷指標(biāo)的重要性量化各指標(biāo)權(quán)重。
4.評估實施
根據(jù)確定的評估指標(biāo)、評分規(guī)則以及權(quán)重對評估范圍內(nèi)的指標(biāo)進(jìn)行取值、計算、評估工作,并形成最終的評估結(jié)果報告。
構(gòu)建公共數(shù)據(jù)資產(chǎn)管理體系,可以打破部門“數(shù)據(jù)孤島”,對政府所有部門公共數(shù)據(jù)資源進(jìn)行盤點,形成公共數(shù)據(jù)資產(chǎn)地圖。建立一套切實可行的數(shù)據(jù)質(zhì)量監(jiān)控體系,發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題,打造相應(yīng)的獎懲措施,實現(xiàn)數(shù)據(jù)資源向優(yōu)質(zhì)數(shù)據(jù)資產(chǎn)的轉(zhuǎn)變。同時,可以推動將公共數(shù)據(jù)作為一種無形資產(chǎn)進(jìn)行管理,為國家提出的數(shù)據(jù)入表提供數(shù)據(jù)基礎(chǔ),提升數(shù)據(jù)要素價值,促進(jìn)數(shù)據(jù)的流通。