李烽 謝穎
近年來,中國進(jìn)入了經(jīng)濟(jì)高速發(fā)展的階段,全面深化改革取得重大突破,人民群眾的生活條件得到了極大的改善。但是,由于社會(huì)發(fā)展的不均衡,貧富差距較大等問題依然存在,老年人口增長(zhǎng)快、規(guī)模大,老齡問題愈發(fā)凸顯。當(dāng)前,民政部門主要負(fù)責(zé)人民群眾的民生保障、基層社會(huì)治理、社會(huì)福利、養(yǎng)老服務(wù)等方面工作,民政業(yè)務(wù)涉及面廣,數(shù)據(jù)資源分散在眾多業(yè)務(wù)系統(tǒng)中,民政部門手握重要的基層數(shù)據(jù)資源,但是未能有效利用和發(fā)揮數(shù)據(jù)資源的價(jià)值。因此建立民政大數(shù)據(jù)平臺(tái),通過大數(shù)據(jù)技術(shù)有效利用民政數(shù)據(jù)資源,發(fā)揮數(shù)據(jù)要素在民政部門的價(jià)值,為民政部門“十四五”信息化業(yè)務(wù)的開展提供支撐手段,是智慧民政建設(shè)的當(dāng)務(wù)之急。
(一)數(shù)據(jù)格式多樣,數(shù)據(jù)標(biāo)準(zhǔn)未統(tǒng)一
民政部門涉及基層社會(huì)治理、救助、福利、組織及養(yǎng)老機(jī)構(gòu)管理等多種關(guān)系民生的業(yè)務(wù),數(shù)據(jù)資源種類較多,數(shù)據(jù)格式未統(tǒng)一,需在省、市、縣、區(qū)、鎮(zhèn)、村縱向條線,根據(jù)國家部委的數(shù)據(jù)標(biāo)準(zhǔn),建立統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系,為民政業(yè)務(wù)的持續(xù)發(fā)展提供基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)支撐和依據(jù)。
(二)數(shù)據(jù)口徑不一,數(shù)據(jù)質(zhì)量待提高
現(xiàn)有民政業(yè)務(wù)系統(tǒng)基本屬于煙囪式建設(shè),存在數(shù)據(jù)來源不唯一、不完整、更新不及時(shí)等問題,導(dǎo)致數(shù)據(jù)質(zhì)量整體不高,缺乏整體的數(shù)據(jù)服務(wù)能力,需建立統(tǒng)一的大數(shù)據(jù)平臺(tái),打破數(shù)據(jù)孤島,加強(qiáng)數(shù)據(jù)質(zhì)量的管理和優(yōu)化,為民政大數(shù)據(jù)應(yīng)用提供高效的數(shù)據(jù)服務(wù)能力。
(三)數(shù)據(jù)聯(lián)通不暢,數(shù)據(jù)共享需加強(qiáng)
民政內(nèi)部業(yè)務(wù)系統(tǒng)較多,由各部門管理和使用,系統(tǒng)之間交互越來越頻繁;隨著民政業(yè)務(wù)的發(fā)展,與其他委辦廳局的業(yè)務(wù)交互也逐漸增多。隨著民政部門內(nèi)外部數(shù)據(jù)資源共享交換的需求越來越多,需通過大數(shù)據(jù)技術(shù),打通內(nèi)外部數(shù)據(jù)共享交換的通道,建立統(tǒng)一的數(shù)據(jù)共享交換系統(tǒng),有效拓展數(shù)據(jù)采集深度和廣度,不斷提升民政數(shù)據(jù)共享交換能力。
隨著民政業(yè)務(wù)數(shù)據(jù)規(guī)模越來越大、類型越來越多、范圍越來越廣,為滿足民政內(nèi)外部數(shù)據(jù)資源的互聯(lián)互通,實(shí)現(xiàn)數(shù)據(jù)資源的有效管理和維護(hù),需建立民政統(tǒng)一大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)民政業(yè)務(wù)數(shù)據(jù)化、數(shù)據(jù)業(yè)務(wù)化的目標(biāo)。大數(shù)據(jù)平臺(tái)的設(shè)計(jì)主要包括數(shù)據(jù)源的分布、大數(shù)據(jù)支撐平臺(tái)的建設(shè)及大數(shù)據(jù)應(yīng)用等方面。
(一)數(shù)據(jù)源
數(shù)據(jù)源主要是省、市、縣民政部門內(nèi)部業(yè)務(wù)數(shù)據(jù),以及其他委辦廳局、企業(yè)、組織等接入的外部共享數(shù)據(jù),包括社會(huì)組織信息、婚姻信息、殯葬信息、養(yǎng)老機(jī)構(gòu)信息、福利機(jī)構(gòu)信息及留守兒童信息等。
(二)大數(shù)據(jù)支撐平臺(tái)
大數(shù)據(jù)支撐平臺(tái)是整個(gè)大數(shù)據(jù)平臺(tái)的基礎(chǔ)工具,采用基于Hadoop的大數(shù)據(jù)技術(shù),包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析等關(guān)鍵技術(shù),以處理民政相關(guān)規(guī)模較大的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。民政的數(shù)據(jù)資源主要分布在各業(yè)務(wù)系統(tǒng)中,數(shù)據(jù)來源于多種類數(shù)據(jù)庫,Hadoop工具適用于將關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入到分布式文件系統(tǒng)HDFS中。對(duì)數(shù)據(jù)時(shí)效性要求不高的數(shù)據(jù),可采用Sqoop/DataX等工具,將數(shù)據(jù)采集到大數(shù)據(jù)平臺(tái)中;對(duì)于需要實(shí)時(shí)計(jì)算的數(shù)據(jù),可采用kafka消息中間件,通過消息隊(duì)列的方式采集到大數(shù)據(jù)平臺(tái)。
(三)數(shù)據(jù)共享交換平臺(tái)
數(shù)據(jù)共享交換平臺(tái)是省級(jí)民政部門橫向與其他委辦廳局,縱向與部、市、縣等民政內(nèi)部部門數(shù)據(jù)共享交換的主要通道,主要包括資源目錄管理系統(tǒng)和數(shù)據(jù)共享交換系統(tǒng)。資源目錄管理系統(tǒng)是通過對(duì)全省民政數(shù)據(jù)資源進(jìn)行梳理、編目、注冊(cè)和管理,讓數(shù)據(jù)需求方能夠通過數(shù)據(jù)資源目錄及時(shí)了解已有的數(shù)據(jù)資源,并提供相應(yīng)的數(shù)據(jù)查詢、訂閱等功能。數(shù)據(jù)共享交換系統(tǒng)是根據(jù)數(shù)據(jù)資源目錄的注冊(cè)情況,以及訂閱的數(shù)據(jù)情況,將通過審核的數(shù)據(jù)及時(shí)共享給其他部門,實(shí)現(xiàn)對(duì)內(nèi)對(duì)外數(shù)據(jù)互聯(lián)互通。
(四)數(shù)據(jù)倉庫設(shè)計(jì)
數(shù)據(jù)倉庫是將民政業(yè)務(wù)數(shù)據(jù)歸集后進(jìn)行加工處理,根據(jù)業(yè)務(wù)數(shù)據(jù)的發(fā)展規(guī)律、時(shí)間變化以及與其他相關(guān)數(shù)據(jù)之間的關(guān)聯(lián)分析等,為民政大數(shù)據(jù)應(yīng)用分析提供數(shù)據(jù)支撐。民政數(shù)據(jù)倉庫的設(shè)計(jì)主要分為ODS層、DM層和DIM層:
ODS層與民政內(nèi)部業(yè)務(wù)源數(shù)據(jù)保持一致,主要包括社會(huì)救助、基層社會(huì)治理、社會(huì)福利與慈善、養(yǎng)老機(jī)構(gòu)等數(shù)據(jù),以及公安、衛(wèi)健、人社等有關(guān)人口、社保、收入、健康等數(shù)據(jù)。
DM層是基于ODS,根據(jù)統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,對(duì)原始業(yè)務(wù)數(shù)據(jù)進(jìn)行整理加工,梳理、分類和整理成基礎(chǔ)的數(shù)據(jù)資源寬表,主要包括民政機(jī)構(gòu)、行政區(qū)劃、家庭成員、電子證照等幾大類數(shù)據(jù),為后續(xù)DIM層設(shè)計(jì)提供支撐。
DIM層是基于DM層基礎(chǔ)上進(jìn)行二次加工,根據(jù)業(yè)務(wù)主題需求進(jìn)行設(shè)計(jì)和建模,主要包括婚姻信息、死亡人口、民生保障、未成年人保護(hù)及養(yǎng)老機(jī)構(gòu)等主題。
(五)數(shù)據(jù)資源管理
數(shù)據(jù)資源管理主要是針對(duì)省級(jí)民政大數(shù)據(jù)平臺(tái)建設(shè)過程中,對(duì)大數(shù)據(jù)收集、處理、分析等數(shù)據(jù)要素全生命周期的管理,包括元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)標(biāo)準(zhǔn)管理及數(shù)據(jù)安全管理等內(nèi)容。
元數(shù)據(jù)管理貫穿整個(gè)大數(shù)據(jù)平臺(tái)建設(shè)全過程,包括技術(shù)元數(shù)據(jù)、管理元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù),制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),登記元數(shù)據(jù)的來源,并能夠支持元數(shù)據(jù)入庫、瀏覽、查詢和統(tǒng)計(jì)等功能,當(dāng)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題時(shí),能夠追溯數(shù)據(jù)的來源,并對(duì)所有數(shù)據(jù)資源建立血緣關(guān)系。
數(shù)據(jù)質(zhì)量管理主要是明確入庫的數(shù)據(jù)資源是否滿足完整性、一致性、及時(shí)性、準(zhǔn)確性等,通過及時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題、反饋數(shù)據(jù)質(zhì)量問題,并形成數(shù)據(jù)質(zhì)量報(bào)告,對(duì)有問題的數(shù)據(jù)進(jìn)行反饋和糾正,不斷提升和優(yōu)化數(shù)據(jù)質(zhì)量,為多源數(shù)據(jù)融合的分析和挖掘提供保障。
數(shù)據(jù)標(biāo)準(zhǔn)管理:統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系是建設(shè)民政大數(shù)據(jù)平臺(tái)的先行條件和基礎(chǔ),通過數(shù)據(jù)標(biāo)準(zhǔn)的管理,確定數(shù)據(jù)來源的唯一性,消除一數(shù)多義的現(xiàn)象,并逐步將數(shù)據(jù)標(biāo)準(zhǔn)納入規(guī)范的流程,持續(xù)對(duì)數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行更新、發(fā)布和使用監(jiān)督等。
數(shù)據(jù)安全管理是在數(shù)據(jù)歸集、處理和分析等全生命周期中的安全進(jìn)行事前預(yù)防、事中保護(hù)、事后響應(yīng),對(duì)數(shù)據(jù)敏感性進(jìn)行分級(jí)分類梳理,增加用戶的數(shù)據(jù)權(quán)限管理,對(duì)共享的數(shù)據(jù)進(jìn)行脫敏和隔離處理,防止數(shù)據(jù)泄露,保障數(shù)據(jù)資產(chǎn)的可控和可信。
(六)大數(shù)據(jù)應(yīng)用
大數(shù)據(jù)應(yīng)用主要包括社會(huì)救助對(duì)象用戶畫像、家庭收入分析、民生問題跟蹤分析等。社會(huì)救助對(duì)象用戶畫像是根據(jù)全省所有救助對(duì)象救助情況,對(duì)各市、縣、區(qū)、村的救助對(duì)象分布情況,對(duì)每年救助資金的額度、救助對(duì)象的變化、救助人員的家庭情況等進(jìn)行多維度的分析和統(tǒng)計(jì),為后續(xù)社會(huì)救助的補(bǔ)助力度、補(bǔ)助方式等提供有力支撐。家庭收入分析是對(duì)家庭成員之間進(jìn)行關(guān)聯(lián)分析,包括家庭主要成員、工作單位、個(gè)人收入、家庭救助情況等信息,將家庭成員的總體收入、家庭收入分布、工作穩(wěn)定、家庭救助原因、是否存在大病返貧、是否存在留守兒童和老人等進(jìn)行關(guān)聯(lián)分析,讓民政部門更有效的了解全省家庭收入情況。民生問題跟蹤分析是基于全省各地區(qū)人員、家庭、養(yǎng)老機(jī)構(gòu)、福利機(jī)構(gòu)、救助機(jī)構(gòu)等相關(guān)信息,根據(jù)微博、微信等公眾平臺(tái)相關(guān)民生熱點(diǎn)信息,針對(duì)群眾關(guān)心關(guān)切問題,通過大數(shù)據(jù)平臺(tái)進(jìn)行多維度統(tǒng)計(jì)分析,了解是否存在民生利益未得到保障、基層服務(wù)不到位及救災(zāi)物資配置失衡等現(xiàn)象,及時(shí)對(duì)民生問題進(jìn)行跟蹤分析。
省級(jí)民政大數(shù)據(jù)平臺(tái)的建設(shè)是民政部門數(shù)據(jù)資源有效利用的根基,通過建立規(guī)范的數(shù)據(jù)標(biāo)準(zhǔn)體系,不斷加強(qiáng)數(shù)據(jù)質(zhì)量的提升,確保數(shù)據(jù)資源的整體安全有效,實(shí)現(xiàn)內(nèi)外部數(shù)據(jù)資源互聯(lián)共享,為民政業(yè)務(wù)數(shù)據(jù)化提供大數(shù)據(jù)服務(wù)能力,豐富和提升民政數(shù)據(jù)資源的資產(chǎn)價(jià)值化進(jìn)程,實(shí)現(xiàn)民政業(yè)務(wù)的大數(shù)據(jù)應(yīng)用有效落地。
作者單位:湖南省郵電規(guī)劃設(shè)計(jì)院有限公司