摘要:社會保障工作中的“金保工程”不斷取得進(jìn)展,利用信息系統(tǒng)進(jìn)行決策分析的需求日益增加,為了構(gòu)建決策分析系統(tǒng)需要整合社會保障信息系統(tǒng)中的養(yǎng)老、醫(yī)保、就業(yè)、人才四本數(shù)據(jù)庫的資源。文章探討了數(shù)據(jù)整合技術(shù)在社會保障信息系統(tǒng)中的應(yīng)用。
關(guān)鍵詞:社會保障;金保工程;數(shù)據(jù)整合;決策分析
0 引言
為了全面、準(zhǔn)確、及時(shí)地收集社會保障業(yè)務(wù)信息,充分挖掘數(shù)據(jù)庫中數(shù)據(jù)的價(jià)值,需建設(shè)一個(gè)宏觀決策系統(tǒng),借助現(xiàn)代信息技術(shù),對數(shù)據(jù)進(jìn)行匯總、整理、交換和分析等加工處理,形成宏觀決策數(shù)據(jù)庫,為社會保障政策的制定提供依據(jù)和支持,對政策執(zhí)行情況進(jìn)行監(jiān)測。
為了適應(yīng)宏觀決策支持系統(tǒng)建設(shè)的需要,我們采用數(shù)據(jù)整合技術(shù),充分整合養(yǎng)老、醫(yī)保、就業(yè)、人才數(shù)據(jù)資源,并建設(shè)成統(tǒng)一的數(shù)據(jù)整合平臺。該數(shù)據(jù)整合平臺能將這四大數(shù)據(jù)資源,經(jīng)過抽取、規(guī)則轉(zhuǎn)換、清洗、加載,形成整合資源庫,為宏觀決策提供數(shù)據(jù)支持。
1 數(shù)據(jù)整合的需求
當(dāng)前,社會保障部門領(lǐng)導(dǎo)要做出一項(xiàng)決策,往往依賴于信息系統(tǒng),比如:實(shí)現(xiàn)常規(guī)統(tǒng)計(jì)分析、監(jiān)測預(yù)警、預(yù)測分析、風(fēng)險(xiǎn)分析等;進(jìn)行數(shù)據(jù)、圖表、多媒體等各種形式的查詢;對比計(jì)劃和執(zhí)行情況;對比本期和歷史情況;對比部分和總體情況;監(jiān)測社會保障政策的執(zhí)行情況;預(yù)測政策出臺效果;監(jiān)測勞動(dòng)力資源結(jié)構(gòu)、市場需求、就業(yè)趨勢、就業(yè)率變化狀況;預(yù)測就業(yè)結(jié)構(gòu)及變化趨勢;監(jiān)測基金收繳、發(fā)放、運(yùn)轉(zhuǎn)、儲備和調(diào)劑狀況;監(jiān)測勞動(dòng)保障待遇享受對象動(dòng)態(tài)變化;預(yù)測人數(shù)變化趨勢等等。
決策分析需要的數(shù)據(jù)通常都是統(tǒng)計(jì)數(shù)據(jù),但是在現(xiàn)有信息系統(tǒng)下進(jìn)行決策分析會比較復(fù)雜,原因如下:
(1)數(shù)據(jù)源利用問題,做出一個(gè)決策分析往往需要查詢多個(gè)基于各種異構(gòu)數(shù)據(jù)源的業(yè)務(wù)系統(tǒng)和外部系統(tǒng),并進(jìn)行大量數(shù)據(jù)分析,工作量大,數(shù)據(jù)利用率不高,且容易出現(xiàn)人為差錯(cuò)。
(2)數(shù)據(jù)源質(zhì)量問題?,F(xiàn)有業(yè)務(wù)信息系統(tǒng)的數(shù)據(jù)大量為業(yè)務(wù)數(shù)據(jù),從這些數(shù)據(jù)難以提煉出有用信息。并且已有的業(yè)務(wù)信息系統(tǒng)平臺及開發(fā)工具互不兼容,直接提取這些業(yè)務(wù)數(shù)據(jù)比較麻煩。
(3)數(shù)據(jù)源標(biāo)準(zhǔn)問題。各個(gè)業(yè)務(wù)系統(tǒng)沒有統(tǒng)一的數(shù)據(jù)接口,也沒有通用的數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范,各個(gè)業(yè)務(wù)數(shù)據(jù)庫無法直接集成。
(4)歷史數(shù)據(jù)問題。統(tǒng)計(jì)分析需要大量的歷史數(shù)據(jù)業(yè)務(wù)系統(tǒng)的歷史數(shù)據(jù)并不完整。
鑒于以上問題,需要建設(shè)一個(gè)數(shù)據(jù)整合平臺,按照宏觀決策的要求,利用數(shù)據(jù)整合技術(shù),將相關(guān)數(shù)據(jù)提取、分類與整理后,經(jīng)過數(shù)據(jù)計(jì)算與變換,最后形成宏觀決策所需的數(shù)據(jù)和信息,保存在數(shù)據(jù)整合資源數(shù)據(jù)庫中,為決策系統(tǒng)提供數(shù)據(jù)支持。
2 數(shù)據(jù)資源分析
數(shù)據(jù)整合資源庫的數(shù)據(jù)都是一些統(tǒng)計(jì)和分析數(shù)據(jù),如:每月各險(xiǎn)種基金繳費(fèi)統(tǒng)計(jì)、各年齡段基金繳費(fèi)統(tǒng)計(jì)等,它們來源于生產(chǎn)數(shù)據(jù),所以在數(shù)據(jù)整合之前,需對現(xiàn)有生產(chǎn)數(shù)據(jù)資源進(jìn)行歸類。現(xiàn)階段生產(chǎn)數(shù)據(jù)資源主要分為公共信息數(shù)據(jù)集、養(yǎng)老基金數(shù)據(jù)集、醫(yī)?;饠?shù)據(jù)集和就業(yè)基金數(shù)據(jù)集等。(1)公共信息數(shù)據(jù)集是實(shí)現(xiàn)各險(xiǎn)種基礎(chǔ)信息統(tǒng)一管理的基礎(chǔ)數(shù)據(jù)集。主要包括:
個(gè)人基本信息個(gè)人信息庫、IC卡信息庫等。
單位基本信息單位基本信息庫、單位所屬分支機(jī)構(gòu)信息庫、社保機(jī)構(gòu)信息庫、社保機(jī)構(gòu)經(jīng)辦人員庫、銀行信息庫等。
參?;拘畔靻挝粎⒈P畔旌蛡€(gè)人參保信息庫等。
參數(shù)信息庫職工平均工資信息庫、賬戶記賬利率信息庫、銀行利率信息庫、社會保險(xiǎn)繳費(fèi)比例信息庫、代碼庫、賬戶記賬利率信息庫、銀行利率信息庫等。
(2)養(yǎng)老基金數(shù)據(jù)集主要包括:
單位應(yīng)付信息庫單位應(yīng)付信息庫、單位實(shí)付信息庫等。
離退休人員信息庫離退休人員變更信息庫、離退休人員賬戶信息庫、離退休人員待遇信息庫等。
養(yǎng)老保險(xiǎn)待遇信息庫養(yǎng)老保險(xiǎn)待遇支付信息庫、養(yǎng)老補(bǔ)發(fā)退發(fā)信息庫、養(yǎng)老供養(yǎng)親屬基本信息庫、養(yǎng)老供養(yǎng)親屬待遇信息庫等。
(3)醫(yī)療基金數(shù)據(jù)集主要包括:
醫(yī)療參保人員信息庫醫(yī)療保險(xiǎn)參保人員基本信息庫、醫(yī)療包干人員基本信息庫、參保人員及賬戶變動(dòng)信息庫、人員就診檔案信息庫等。
醫(yī)療機(jī)構(gòu)信息庫定點(diǎn)醫(yī)療機(jī)構(gòu)結(jié)算參數(shù)庫、定點(diǎn)醫(yī)療服務(wù)機(jī)構(gòu)信息庫、定點(diǎn)醫(yī)療機(jī)構(gòu)預(yù)付費(fèi)用信息庫、定點(diǎn)醫(yī)療機(jī)構(gòu)應(yīng)付信息庫、定點(diǎn)醫(yī)療機(jī)構(gòu)年度結(jié)算信息庫、定點(diǎn)醫(yī)療機(jī)構(gòu)藥品目錄庫等。
醫(yī)療待遇信息庫費(fèi)用分類信息庫、醫(yī)療保險(xiǎn)結(jié)算費(fèi)用信息庫、醫(yī)療包干人員預(yù)付費(fèi)用庫、醫(yī)療包干人員費(fèi)用結(jié)算庫、醫(yī)療保險(xiǎn)個(gè)人賬戶返還庫、醫(yī)療費(fèi)用分段個(gè)人自付比例庫、定點(diǎn)醫(yī)療機(jī)構(gòu)預(yù)付標(biāo)準(zhǔn)庫等。
(4)就業(yè)相關(guān)數(shù)據(jù)集主要包括:
就業(yè)服務(wù)機(jī)構(gòu)信息庫社保代發(fā)機(jī)構(gòu)基本信息庫、社保代發(fā)機(jī)構(gòu)撥付記錄庫、就業(yè)機(jī)構(gòu)服務(wù)情況庫等。
參保人員機(jī)構(gòu)信息庫參保人員失業(yè)保險(xiǎn)信息庫、人員失業(yè)情況信息庫、失業(yè)人員變更信息庫、個(gè)人職業(yè)指導(dǎo)和介紹就業(yè)情況庫等。
失業(yè)待遇信息庫失業(yè)待遇信息庫、失業(yè)人員待遇支付明細(xì)庫、失業(yè)保險(xiǎn)補(bǔ)發(fā)退發(fā)信息庫、失業(yè)待遇金額標(biāo)準(zhǔn)庫、失業(yè)保險(xiǎn)金享受期限標(biāo)準(zhǔn)庫等。
人才交流信息庫人才引進(jìn)信息庫、人才派遣信息庫、人才就業(yè)信息庫、人才調(diào)動(dòng)信息庫、再就業(yè)信息庫、人事代理信息庫、畢業(yè)生落戶信息庫、企業(yè)招聘信息庫、個(gè)人應(yīng)聘信息庫等。
3 數(shù)據(jù)整合的實(shí)現(xiàn)方式
社會保障信息系統(tǒng)數(shù)據(jù)庫一般都是關(guān)系型數(shù)據(jù)庫,數(shù)據(jù)整合通??梢圆捎脭?shù)據(jù)庫開發(fā)技術(shù)和ETL技術(shù)實(shí)現(xiàn)。以下分別介紹這兩種實(shí)現(xiàn)技術(shù)。
3.1 數(shù)據(jù)庫開發(fā)技術(shù)
利用數(shù)據(jù)庫開發(fā)技術(shù)的數(shù)據(jù)整合主要指利用數(shù)據(jù)庫本身的功能,如觸發(fā)器、PL/SQL存儲過程、DBLINK等功能,完成對各個(gè)業(yè)務(wù)系統(tǒng)所需數(shù)據(jù)的抽取、查詢和關(guān)聯(lián)等。
這種數(shù)據(jù)整合技術(shù)有如下優(yōu)點(diǎn):
(1)適合于同種數(shù)據(jù)庫之間的數(shù)據(jù)集成。
(2)投資少,基本都是靠開發(fā)人員手工編程為主,只需要一些開發(fā)費(fèi)用。
但也存在一些局限性:
(1)擴(kuò)展性較差。由于都是開發(fā)人員手工編程,后期的維護(hù)成本較高,特別是在決策需求發(fā)生變化時(shí),需要開發(fā)人員修改程序源代碼。
(2)數(shù)據(jù)整合效率難以保證。由于數(shù)據(jù)庫都靠開發(fā)商編寫,在系統(tǒng)日趨龐大的情況下,在面對復(fù)雜的數(shù)據(jù)整合問題上,效率難以得到保證。
3.2 ETL技術(shù)
通過ETL技術(shù)及專業(yè)ETL軟件,對業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)經(jīng)過抽取(Extract)、轉(zhuǎn)換(Transform),最后加載(Load)到目標(biāo)數(shù)據(jù)庫,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)之間的整合。
這種數(shù)據(jù)整合技術(shù)有如下優(yōu)點(diǎn):
(1)高效率。ETL軟件的數(shù)據(jù)抽取、轉(zhuǎn)換、加載的效率非常高,特別是對于大數(shù)據(jù)量的抽取。并且支持對ORACLE9i的增量數(shù)據(jù)抽取。
(2)改進(jìn)數(shù)據(jù)質(zhì)量。能夠根據(jù)各種條件校驗(yàn)源數(shù)據(jù)和目標(biāo)數(shù)據(jù)質(zhì)量,清洗垃圾數(shù)據(jù)。
(3)強(qiáng)大管理功能。能夠通過Web管理界面對數(shù)據(jù)抽取策略執(zhí)行制定時(shí)間觸發(fā)方式,對抽取結(jié)果進(jìn)行分析等。
(4)多平臺、多數(shù)據(jù)源支持。支持各種平臺、各種數(shù)據(jù)庫系統(tǒng)(如ORACLE、SQLServer等)以及不同版本數(shù)據(jù)庫的數(shù)據(jù)抽取。
(5)具備多種數(shù)據(jù)轉(zhuǎn)換控件,能夠完成各種非常復(fù)雜的數(shù)據(jù)轉(zhuǎn)換工作。
但是該數(shù)據(jù)整合實(shí)現(xiàn)技術(shù)也存在一些局限性:投資費(fèi)用較為昂貴,實(shí)施周期通常較長。
4 數(shù)據(jù)整合的實(shí)施
數(shù)據(jù)整合實(shí)施工作大致可以分為4個(gè)階段:
(1)業(yè)務(wù)分析階段。該階段主要包括了解需要采集的數(shù)據(jù)結(jié)構(gòu)定義,和數(shù)據(jù)表之間的業(yè)務(wù)聯(lián)系,例如:需:要了解社保個(gè)人信息及賬戶、單位個(gè)人信息及賬戶、退休人員信息等業(yè)務(wù)表的數(shù)據(jù)結(jié)構(gòu)定義,表之間的相互關(guān)聯(lián)等。
(2)設(shè)計(jì)實(shí)施階段。該階段主要定義數(shù)據(jù)整合規(guī)則及策略。前者包括字段映射、合并、函數(shù)計(jì)算定義等。后者主要定義時(shí)間策略(定時(shí)策略、自動(dòng)重試、手工策略、事件觸發(fā)等)。
(3)數(shù)據(jù)校驗(yàn)階段。數(shù)據(jù)校驗(yàn)階段是數(shù)據(jù)整合最重要的解段。由于不同業(yè)務(wù)信息資源之間的語義差別,會引起各種不完整甚至錯(cuò)誤信息的產(chǎn)生,因此在系統(tǒng)正式運(yùn)行之前,必須建立嚴(yán)格的數(shù)據(jù)校驗(yàn)機(jī)制,以保證生產(chǎn)數(shù)據(jù)和整合平臺數(shù)據(jù)的一致性。建議采用如下方法:
數(shù)據(jù)的采樣每張表取出一些數(shù)據(jù)作為參照,跟轉(zhuǎn)換后數(shù)據(jù)進(jìn)行比較。
數(shù)據(jù)的計(jì)數(shù)每張表記錄原始數(shù)據(jù)的記錄總數(shù),跟轉(zhuǎn)換后數(shù)據(jù)進(jìn)行比較。
數(shù)據(jù)的重要指標(biāo)匯總各主要匯總指標(biāo),要跟轉(zhuǎn)換后進(jìn)行比較。
(4)系統(tǒng)上線階段。將設(shè)計(jì)好的數(shù)據(jù)整合流程正式發(fā)布,并可設(shè)定計(jì)劃定時(shí)執(zhí)行,系統(tǒng)管理人員可以通過監(jiān)控界面,進(jìn)行任務(wù)監(jiān)控和跟蹤。隨著數(shù)據(jù)轉(zhuǎn)換業(yè)務(wù)逐漸增加,管理人員可以根據(jù)具體的業(yè)務(wù)需求,修改計(jì)劃,合理安排數(shù)據(jù)轉(zhuǎn)換任務(wù),以在規(guī)定的時(shí)間內(nèi)完成所有的數(shù)據(jù)轉(zhuǎn)換和加載任務(wù)。
5 數(shù)據(jù)整合實(shí)施中的管理
數(shù)據(jù)整合實(shí)施的管理,應(yīng)明確指導(dǎo)思想、具體目標(biāo)和實(shí)施步驟,對數(shù)據(jù)整合軟硬件平臺建設(shè)作出統(tǒng)一要求。工作中,我們切實(shí)做到了如下幾點(diǎn):
(1)組織領(lǐng)導(dǎo)到位。成立了保險(xiǎn)業(yè)務(wù)數(shù)據(jù)整合工作領(lǐng)導(dǎo)小組,統(tǒng)一組織、實(shí)施和部署工作進(jìn)展。同時(shí),抽調(diào)業(yè)務(wù)骨干、技術(shù)人員組成工作小組,專門負(fù)責(zé)相關(guān)具體協(xié)調(diào)事項(xiàng)。
(2)開展數(shù)據(jù)整合的技術(shù)較為繁雜,涉及數(shù)據(jù)整合技術(shù)和業(yè)務(wù)知識,又是一項(xiàng)全新的任務(wù),對相關(guān)技術(shù)人員的業(yè)務(wù)素質(zhì)要求很高。因此,我們積極組織技術(shù)業(yè)務(wù)參加各種業(yè)務(wù)知識培訓(xùn),并邀請技術(shù)專家系統(tǒng)講解數(shù)據(jù)整合軟件的使用方法,從人員素質(zhì)方面為開展數(shù)據(jù)整合工作提供保證。
6 結(jié)束語
數(shù)據(jù)整合平臺能夠?qū)崿F(xiàn)多個(gè)業(yè)務(wù)應(yīng)用系統(tǒng)、多種異構(gòu)數(shù)據(jù)源信息的綜合利用,為提高社會保障決策水平提供基礎(chǔ)數(shù)據(jù)。但是,數(shù)據(jù)整合是一項(xiàng)復(fù)雜而又基礎(chǔ)性的工作,在實(shí)際整合過程中會遇到許多想象不到的問題,只有將這些問題一一化解,對數(shù)據(jù)轉(zhuǎn)換的結(jié)果認(rèn)真校驗(yàn),才能確保數(shù)據(jù)整合的準(zhǔn)確性,才能最終達(dá)到數(shù)據(jù)整合平臺建設(shè)“完整、正確、統(tǒng)一、及時(shí)、安全”的要求。